KR20220022110A - Gene Editing for Hemophilia A Using Improved Factor VIII Expression - Google Patents

Gene Editing for Hemophilia A Using Improved Factor VIII Expression Download PDF

Info

Publication number
KR20220022110A
KR20220022110A KR1020217029608A KR20217029608A KR20220022110A KR 20220022110 A KR20220022110 A KR 20220022110A KR 1020217029608 A KR1020217029608 A KR 1020217029608A KR 20217029608 A KR20217029608 A KR 20217029608A KR 20220022110 A KR20220022110 A KR 20220022110A
Authority
KR
South Korea
Prior art keywords
nucleic acid
grna
cell
dna endonuclease
sequence
Prior art date
Application number
KR1020217029608A
Other languages
Korean (ko)
Inventor
알란 리차드 브룩스
Original Assignee
크리스퍼 테라퓨틱스 아게
바이엘 헬쓰케어 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 크리스퍼 테라퓨틱스 아게, 바이엘 헬쓰케어 엘엘씨 filed Critical 크리스퍼 테라퓨틱스 아게
Priority claimed from PCT/US2020/028350 external-priority patent/WO2020168362A1/en
Publication of KR20220022110A publication Critical patent/KR20220022110A/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0075Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • C12N2310/141MicroRNAs, miRNAs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Abstract

일부 실시형태에서, 대상체에서 A형 혈우병을 생체외에서 또는 생체내에서 치료하기 위한 물질 및 방법이 본원에 제공된다. 또한, 일부 실시형태에서, B 도메인 치환물을 갖는 합성 FVIII을 인코딩하는 코딩 서열을 게놈 내로 낙-인(knock-in)시키기 위한 물질 및 방법이 본원에 제공된다.In some embodiments, provided herein are materials and methods for treating hemophilia A ex vivo or in vivo in a subject. Also provided herein, in some embodiments, are materials and methods for knock-in into a genome a coding sequence encoding a synthetic FVIII having a B domain substitution.

Description

개선된 인자 VIII 발현을 사용한, A형 혈우병을 위한 유전자 편집Gene Editing for Hemophilia A Using Improved Factor VIII Expression

본원에 제공되는 개시내용은 생체외 및 생체내 둘 모두에서 A형 혈우병을 치료하기 위한 물질 및 방법에 관한 것이다. 또한, 혈액-응고 단백질, 예컨대 인자 VIII(FVIII)의 발현, 기능 또는 활성을 조절하기 위한 유전자 편집용 물질 및 방법이 제공된다.The disclosure provided herein relates to materials and methods for treating hemophilia A, both ex vivo and in vivo. Also provided are materials and methods for gene editing for regulating the expression, function or activity of blood-clotting proteins, such as factor VIII (FVIII).

A형 혈우병(HemA)은 낮은 또는 검출 불가능한 수준의 혈중 FVIII 단백질을 초래하는 FVIII 유전자(F8)의 유전학적 결함에 의해 유발된다. 이는 조직 손상의 부위에서 비효과적인 혈전 형성을 초래하여 제어되지 않는 출혈을 야기하며, 이는 치료되지 않는 경우 치명적일 수 있다. 결손 또는 비기능성 FVIII 단백질의 대체는 HemA 대상체를 위한 효과적인 치료이며, 현재 치료 기준이다. 그러나, 단백질 대체 요법은 FVIII 단백질의 빈번한 정맥내 투여를 필요로 하며, 성인의 경우 불편하고, 소아의 경우 문제가 되며, 비용이 많이 들고($200,000 초과/년), 치료 요법을 엄밀하게 따르지 않는다면, 돌발 출혈(break through bleeding) 사건을 초래할 수 있다.Hemophilia A (HemA) is caused by a genetic defect in the FVIII gene (F8) that results in low or undetectable levels of FVIII protein in the blood. This results in ineffective thrombus formation at the site of tissue damage, resulting in uncontrolled bleeding, which can be fatal if left untreated. Replacement of defective or non-functional FVIII protein is an effective treatment for HemA subjects and is the current standard of care. However, protein replacement therapy requires frequent intravenous administration of FVIII protein, is inconvenient for adults, problematic for children, is expensive (>$200,000/year), and unless the treatment regimen is strictly followed, It can lead to break through bleeding events.

A형 혈우병에 대한 영구적인 치유가 매우 바람직하다. 아데노 연관 바이러스(AAV)를 사용하는 바이러스-기반의 유전자 요법이 전임상 동물 모델에서 그리고 인간 대상체에서 몇몇 가능성을 보여준 바 있지만, 그것은 수많은 단점을 갖는다. 예를 들어, 보고된 AAV 기반의 유전자 요법은 AAV 바이러스 캡시드(일반적으로 특히 혈청형 AAV5, AAV8 또는 AAV9 또는 AAVrh10 사용) 내측에 캡슐화된 간 특이적 프로모터에 의해 유도되는 FVIII 코딩 서열을 사용한다. 일반적으로, 유전자 요법을 위해 사용되는 AAV 바이러스는 패키징된 코딩 서열 카세트를 형질도입된 세포의 핵 내로 전달하며, 여기서, 카세트는 거의 배타적으로 에피솜으로 남아 있고, 그것은 치료적 단백질이 생기게 하는 치료적 코딩 서열의 에피솜 카피이다. AAV는 캡슐화된 DNA를 숙주 세포의 게놈 내로 통합하기 위한 메커니즘을 갖지 않는다. 치료적 코딩 서열이 에피솜으로서 유지되기 때문에, 이에 따라 이는 숙주 세포가 분열하는 경우 복제되지 않으므로, 딸 세포로부터 소실될 수 있다. AAV 에피솜을 함유하는 간 세포가 분열하도록 유도되는 경우, AAV 게놈은 복제되지 않고, 대신에 희석되는 것이 입증된 바 있다. 따라서, AAV 기반의 유전자 요법은 간이 아직 성인 크기에 도달하지 않은 소아에서 효과적인 것으로 예상되지 않는다. 현재의 요법이 부적당하기 때문에, 효과적이고 영구적이거나 오래 지속되는, 성인 및 소아를 위한 HemA에 대한 신규한 치료법이 절실하게 필요하다.A permanent cure for hemophilia A is highly desirable. Although virus-based gene therapy using adeno-associated virus (AAV) has shown some promise in preclinical animal models and in human subjects, it has numerous drawbacks. For example, the reported AAV-based gene therapy uses the FVIII coding sequence driven by a liver-specific promoter encapsulated inside the AAV virus capsid (usually especially with serotypes AAV5, AAV8 or AAV9 or AAVrh10). In general, AAV viruses used for gene therapy deliver a packaged coding sequence cassette into the nucleus of a transduced cell, where the cassette remains almost exclusively episomal, which results in a therapeutic protein It is an episomal copy of the coding sequence. AAV does not have a mechanism for integrating the encapsulated DNA into the genome of the host cell. Because the therapeutic coding sequence is maintained as an episome, it is therefore not replicated when the host cell divides and can be lost from daughter cells. It has been demonstrated that when liver cells containing AAV episomes are induced to divide, the AAV genome does not replicate, but instead is diluted. Therefore, AAV-based gene therapy is not expected to be effective in children whose liver has not yet reached adult size. Because current therapies are inadequate, there is a pressing need for new therapies for HemA in adults and children that are effective, permanent or long-lasting.

FVIII은 처음에 도메인 구조 A1-A2-B-A3-C1-C2를 갖는 단백질로서 발현된다. 단백질은 부피가 큰, 고도로 글리코실화된 B 도메인의 단백질 가수분해적 절단에 의해 활성화되어, 중쇄(A1-A2) 및 경쇄(A3-C1-C2) 이종이량체를 남긴다. FVIII 단백질의 B 도메인은 생물학적 활성을 위해 필요하지 않다. FVIII 코딩 서열로부터 큰 B 도메인을 제거하는 것은 생체내 전달을 위해 사용되는 AAV 벡터 내로의 신뢰성 있는 패키징을 가능하게 하는 데 필수적이다. 그러나, 최대 18개의 N-연결된 글리코실화 부위를 함유하는 B 도메인의 제거는 FVIII 단백질의 분비를 손상시킨다. 따라서, 효율적으로 그리고 효과적으로 발현될 수 있는 개선된 형태의 FVIII이 절실히 필요하다.FVIII is initially expressed as a protein with the domain structure A1-A2-B-A3-C1-C2. The protein is activated by proteolytic cleavage of the bulky, highly glycosylated B domain, leaving heavy (A1-A2) and light (A3-C1-C2) chain heterodimers. The B domain of the FVIII protein is not required for biological activity. Removal of the large B domain from the FVIII coding sequence is essential to enable reliable packaging into AAV vectors used for in vivo delivery. However, removal of the B domain containing up to 18 N-linked glycosylation sites impairs secretion of the FVIII protein. Therefore, there is an urgent need for an improved form of FVIII that can be efficiently and effectively expressed.

본 발명자들은 결함이 있는 F8 유전자를 보충하여, 기능적 FVIII 단백질의 발현을 초래하기 위해 사용될 수 있는 유전자 편집 조성물 및 방법을 발견하였다. 따라서, 본원에 제공되는 발명은 숙주 세포 DNA 서열을 변경하기 위한 시스템 및 조성물, 숙주 세포 게놈을 변경하기 위한 방법, 개선된 발현을 제공하는 합성 인자 VIII 코딩 서열을 삽입하기 위한 방법 및 시스템, 대상체에 투여될 수 있는 개선된 발현을 제공하는 합성 인자 VIII 코딩 서열을 갖는 세포, A형 혈우병의 치료 방법 및 상기의 것들 중 임의의 것을 구체화하는 키트를 포함한다.We have discovered gene editing compositions and methods that can be used to compensate for a defective F8 gene, resulting in expression of a functional FVIII protein. Accordingly, the invention provided herein provides systems and compositions for altering host cell DNA sequences, methods for altering host cell genomes, methods and systems for inserting synthetic Factor VIII coding sequences that provide for improved expression, into a subject cells having a synthetic factor VIII coding sequence that provides improved expression that can be administered, methods of treating hemophilia A, and kits embodying any of the foregoing.

일 양태에서, 하기를 갖는, 숙주 세포 DNA 서열을 변경하기 위한 시스템이 본원에 제공된다: DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 숙주 세포 유전자좌에 상보적인 스페이서 서열을 갖는 가이드 RNA(gRNA) 또는 gRNA를 인코딩하는 핵산; 및 합성 FVIII 단백질을 인코딩하는 핵산 서열을 갖는 공여자 주형으로서, 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 갖는 공여자 주형.In one aspect, provided herein is a system for altering a host cell DNA sequence having: a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; a guide RNA (gRNA) or a nucleic acid encoding a gRNA having a spacer sequence complementary to the host cell locus; and a donor template having a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein comprises B domain substitutions, wherein the B domain substitutions have 0 to 9 N-linked glycosylation sites and 3 to about 40 amino acids in length. A donor template with

또 다른 양태에서, 하기를 세포에 제공하는 단계를 포함하는 숙주 세포에서의 게놈의 편집 방법이 제공된다: 숙주 세포 유전자좌에 상보적인 스페이서 서열을 갖는 gRNA 또는 gRNA를 인코딩하는 핵산; DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 합성 FVIII 단백질을 인코딩하는 핵산 서열을 갖는 공여자 주형으로서, 합성 FVIII 단백질이 B 도메인 치환물을 가지며, B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 갖는 공여자 주형.In another aspect, there is provided a method of editing a genome in a host cell comprising providing to the cell a gRNA or a nucleic acid encoding the gRNA having a spacer sequence complementary to a host cell locus; a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and a donor template having a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein has B domain substitutions, wherein the B domain substitutions have 0 to 9 N-linked glycosylation sites and 3 to about 40 amino acids in length. having a donor template.

또 다른 양태에서, 세포의 게놈이 합성 FVIII 단백질을 인코딩하는 DNA를 포함하는 세포가 제공되며, 합성 FVIII 단백질은 B 도메인 치환물을 가지며, B 도메인 치환물은 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 갖는다.In another aspect, provided is a cell wherein the genome of the cell comprises DNA encoding a synthetic FVIII protein, wherein the synthetic FVIII protein has a B domain substitution, wherein the B domain substitution has 0 to 9 N-linked glycosylation sites. and 3 to about 40 amino acids in length.

또 다른 양태에서, 상기 기술된 바와 같은 합성 FVIII 단백질을 인코딩하는 DNA를 갖는 세포를 대상체에 투여하는 단계에 의한 대상체에서의 A형 혈우병의 치료 방법이 제공된다.In another aspect, there is provided a method of treating hemophilia A in a subject by administering to the subject a cell having a DNA encoding a synthetic FVIII protein as described above.

또 다른 양태에서, 하기를 대상체 내의 세포에 제공하는 단계에 의한 대상체에서의 A형 혈우병의 치료 방법이 제공된다: 숙주 세포 유전자좌에 상보적인 스페이서 서열을 갖는 gRNA 또는 gRNA를 인코딩하는 핵산; DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 합성 FVIII 단백질을 인코딩하는 핵산 서열을 갖는 공여자 주형으로서, 합성 FVIII 단백질이 B 도메인 치환물을 가지며, B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 갖는 공여자 주형.In another aspect, there is provided a method of treating hemophilia A in a subject by providing to a cell in the subject: a gRNA having a spacer sequence complementary to a host cell locus or a nucleic acid encoding the gRNA; a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and a donor template having a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein has B domain substitutions, wherein the B domain substitutions have 0 to 9 N-linked glycosylation sites and 3 to about 40 amino acids in length. having a donor template.

또 다른 양태에서, 상기 기술된 시스템의 하나 이상의 요소를 포함하며, 사용 설명서를 추가로 포함하는 키트가 본원에 제공된다.In another aspect, provided herein is a kit comprising one or more elements of the system described above, further comprising instructions for use.

또 다른 양태에서, 합성 FVIII 단백질을 인코딩하는 폴리뉴클레오티드 서열을 갖는 핵산이 본원에 제공되며, 합성 FVIII 단백질은 B 도메인 치환물을 가지며, B 도메인 치환물은 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 갖는다.In another aspect, provided herein is a nucleic acid having a polynucleotide sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein has B domain substitutions, the B domain substitutions comprising 0-9 N-linked glycosylation sites and 3 to about 40 amino acids in length.

또 다른 양태에서, 하기를 대상체 내의 세포에 제공하는 단계에 의한 대상체에서의 FVIII의 양의 증가 방법이 본원에 제공되며, 대상체는 제1 혈청 수준의 FVIII을 갖는다: 숙주 세포 유전자좌에 상보적인 스페이서 서열을 갖는 gRNA 또는 gRNA를 인코딩하는 핵산; DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 합성 FVIII 단백질을 인코딩하는 핵산 서열을 갖는 공여자 주형으로서, 합성 FVIII 단백질이 B 도메인 치환물을 가지며, B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 갖는 공여자 주형.In another aspect, provided herein is a method of increasing the amount of FVIII in a subject by providing to a cell in the subject, wherein the subject has a first serum level of FVIII: a spacer sequence complementary to a host cell locus a nucleic acid encoding gRNA or gRNA having a; a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and a donor template having a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein has B domain substitutions, wherein the B domain substitutions have 0 to 9 N-linked glycosylation sites and 3 to about 40 amino acids in length. having a donor template.

본 개시내용의 소정의 특징 및 이점의 이해는 개시내용의 원리가 이용되는 예시적인 실시형태를 제시한 하기의 발명을 실시하기 위한 구체적인 내용 및 첨부 도면을 참조하여 수득될 것이다:
도 1은 FVIII 공여자 주형을 인코딩하는 5가지 플라스미드의 유체역학적 주사에 이어서, Cas9 mRNA 및 sgRNA의 LNP 전달 후의 마우스의 혈중 FVIII 수준을 도시한 것이다.
도 2는 FVIII 공여자 주형 pCB099 및 pCB102를 캡슐화하는 AAV8 바이러스를 주사하고, 4주 후에 spCas9 mRNA 및 gRNA mALbT1을 캡슐화하는 LNP를 투여한 마우스의 혈중 FVIII 수준을 도시한 것이다. LNP를 주사한 지 10일 후에 FVIII 수준을 측정하였다.
도 3은 HDI에 의한 4가지 상이한 FVIII 공여자 플라스미드에 이어서 spCas9 및 mALbT1 gRNA를 캡슐화하는 LNP를 투여한 A형 혈우병 마우스의 혈중 FVIII 활성을 도시한 것이다.
도 4는 LNP를 투여한 지 11일 및 28일 후에 A형 혈우병 마우스의 혈중 FVIII 활성을 도시한 것이다. 마우스에게 LNP를 투여하기 4주 전에 2 x 1012 vg/kg의 AAV8 바이러스를 제공하였다.
도 5는 플라스미드 pCB1007(n=7마리 마우스), pCB1019(n=7) 및 pCB1020(n=6)을 유체역학적으로 주사하고, mALbT1 gRNA 및 Cas9 mRNA를 캡슐화하는 LNP를 안와후방으로 주사한 마우스의 혈중 FVIII 활성을 도시한 것이다. FVIII을 LNP 투여 후 제6일 및 제9일에 측정하였다.
도 6은 플라스미드 pCB1007(n=7마리 마우스), pCB1025(n=7) 및 pCB1026(n=6)을 유체역학적으로 주사하고, mALbT1 gRNA 및 Cas9 mRNA를 캡슐화하는 LNP를 안와후방으로 주사한 마우스의 혈중 FVIII 활성을 도시한 것이다. FVIII을 LNP 투여 후 제6일 및 제9일에 측정하였다.
도 7은 4명의 공여자 유래의 일차 인간 간세포에서의 가이드 RNA T4, T5, T11 및 T13(인간 알부민 인트론 1 표적화)의 절단 효율에 대한 결과를 19개 염기 대 20개 염기 표적 서열을 비교하여 도시한 것이다.
도 8은 0 내지 7개의 N-연결된 글리칸 모티프 및 상이한 코돈 최적화를 갖는 FVIII 공여자 카세트에 대한 고유 발현 효율(표적화된 통합 빈도로 나눈 FVIII 활성)을 도시한 것이다.
도 9는 B 도메인 치환물이 0, 1, 3, 5 또는 6개의 글리칸을 함유하는 FVIII 구축물을 도시한 것이다.
도 10은 LNP의 투여 후 11일에서의 A형 혈우병 마우스의 혈중 FVIII 활성을 도시한 것이다.
도 11은 LNP의 투여 후 28일에서의 A형 혈우병 마우스의 혈중 FVIII 활성을 도시한 것이다.
도 12는 0, 1, 3, 5 또는 6개의 N-연결된 글리칸 모티프를 갖는 FVIII 공여자 카세트에 대한 고유 발현 효율(표적화된 통합 빈도로 나눈 FVIII 활성)을 도시한 것이다.
An understanding of certain features and advantages of the present disclosure will be obtained by reference to the following detailed description and accompanying drawings, which set forth exemplary embodiments in which the principles of the disclosure may be employed:
1 depicts blood FVIII levels in mice following hydrodynamic injection of five plasmids encoding FVIII donor templates followed by LNP delivery of Cas9 mRNA and sgRNA.
Figure 2 depicts FVIII levels in the blood of mice injected with AAV8 virus encapsulating FVIII donor templates pCB099 and pCB102 and 4 weeks later administered LNP encapsulating spCas9 mRNA and gRNA mALbT1. FVIII levels were measured 10 days after LNP injection.
Figure 3 depicts blood FVIII activity of hemophilia A mice administered with four different FVIII donor plasmids by HDI followed by LNPs encapsulating spCas9 and mALbT1 gRNAs.
4 shows the blood FVIII activity of hemophilia A mice 11 and 28 days after LNP administration. Mice were given 2 x 10 12 vg/kg of AAV8 virus 4 weeks before LNP administration.
Figure 5 shows the hydrodynamic injection of plasmids pCB1007 (n=7 mice), pCB1019 (n=7) and pCB1020 (n=6), and retroorbitally injected LNP encapsulating mALbT1 gRNA and Cas9 mRNA. Blood FVIII activity is shown. FVIII was measured on days 6 and 9 after LNP administration.
Figure 6 shows the hydrodynamic injection of plasmids pCB1007 (n=7 mice), pCB1025 (n=7) and pCB1026 (n=6), and retroorbitally injected LNP encapsulating mALbT1 gRNA and Cas9 mRNA. Blood FVIII activity is shown. FVIII was measured on days 6 and 9 after LNP administration.
Figure 7 shows the results for the cleavage efficiency of guide RNAs T4, T5, T11 and T13 (targeting human albumin intron 1) in primary human hepatocytes from 4 donors by comparing the 19 base vs. 20 base target sequence. will be.
8 depicts intrinsic expression efficiency (FVIII activity divided by targeted integration frequency) for FVIII donor cassettes with 0-7 N-linked glycan motifs and different codon optimizations.
9 depicts FVIII constructs in which the B domain substitutions contain 0, 1, 3, 5 or 6 glycans.
10 shows blood FVIII activity of hemophilia A mice 11 days after administration of LNP.
Fig. 11 shows blood FVIII activity of mice with hemophilia A at 28 days after administration of LNP.
12 depicts intrinsic expression efficiency (FVIII activity divided by targeted integration frequency) for FVIII donor cassettes with 0, 1, 3, 5 or 6 N-linked glycan motifs.

RNA 가이드된 엔도뉴클레아제 편집은 예를 들어, 렌티바이러스 유전자 요법 방법에 비하여 이점을 제공한다. 그러나, 예를 들어, 큰 서열은 전달을 위하여 패키징하기 어려울 수 있기 때문에, 또는 짧은 서열에 비하여 제조하기 어려울 수 있기 때문에, 편집 프로토콜에서 큰 서열의 삽입은 문제가 있을 수 있다. 일부 단백질은 그들이 발현되는 세포로부터 정확하게 분비되기 위하여 N-연결된 글리코실화 부위의 존재를 필요로 한다. N-글리코실화 부위의 컨센서스 아미노 서열은 N-X-T/S이며, X는 프롤린을 제외한 임의의 잔기이다. 글리칸은 N(아스파라긴) 잔기에 첨가된다(문헌[K.F. Medzihradszky, Meth Mol Biol (2008) 446:293-316]). 본 발명자들은 이러한 단백질 내의 N-연결된 글리코실화 부위의 수를 크게 감소시키거나 심지어 제거함으로써, 전사, 번역 또는 분비에 불리하게 영향을 미치지 않고 단백질 코딩 서열의 크기를 감소시킬 수 있는 것을 발견하였다. 예를 들어, 본 발명자들은 글리코실화 부위의 수를 감소시키거나 제거하기 위한 FVIII 코딩 서열의 B 도메인의 엔지니어링이 FVIII 기능을 갖는 엔지니어링된 FVIII 단백질을 생성하는 동안, 생성되는 엔지니어링된(합성) FVIII의 전사, 번역 또는 분비에 유의미하게 영향을 미치지 않고, 유전자 편집에서 사용될 FVIII 서열의 크기를 감소시킬 수 있는 것을 발견하였다. 더욱이, B 도메인 결실된 FVIII에 첨가되는 N-글리칸 부위의 수를 최소화시키는 것은 항체 또는 T-세포에 대하여 신규한 에피토프를 생성할 위험을 최소화시킴으로써, 신규한 FVIII 단백질이 대상체에서 면역 반응을 유도할 수 있는 위험을 감소시킬 것이다. 본 개시내용은 특히 게놈 편집에 의해 세포에서 혈액-응고 단백질, 예컨대 FVIII의 발현, 기능 또는 활성을 조절하기 위한, 유전자 편집을 위한 조성물 및 방법을 제공한다. 본 개시내용은 또한, 특히 생체외 및 생체내 둘 모두에서 A형 혈우병을 갖는 대상체를 치료하기 위한 조성물 및 방법을 제공한다. 특히, 본 발명은 개선된 통합 및 개선된 발현을 제공하는 게놈 편집 방법 및 시스템, 및 A형 혈우병을 개선시킬 수 있는 합성 FVIII 코딩 서열 및 단백질을 제공한다.RNA guided endonuclease editing offers advantages over, for example, lentiviral gene therapy methods. However, insertion of large sequences in editing protocols can be problematic, for example, because large sequences can be difficult to package for delivery, or because they can be difficult to manufacture compared to short sequences. Some proteins require the presence of N-linked glycosylation sites in order to be correctly secreted from the cell in which they are expressed. The consensus amino sequence of the N-glycosylation site is NXT/S, and X is any residue except proline. Glycans are added to N (asparagine) residues (KF Medzihradszky, Meth Mol Biol (2008) 446 :293-316). The inventors have discovered that by greatly reducing or even eliminating the number of N-linked glycosylation sites in such proteins, it is possible to reduce the size of protein coding sequences without adversely affecting transcription, translation or secretion. For example, we found that engineering of the B domain of the FVIII coding sequence to reduce or eliminate the number of glycosylation sites produces an engineered FVIII protein with FVIII function, while the resulting engineered (synthetic) FVIII It has been found that it is possible to reduce the size of the FVIII sequence to be used in gene editing without significantly affecting transcription, translation or secretion. Moreover, minimizing the number of N-glycan sites added to the B domain deleted FVIII minimizes the risk of generating a novel epitope for an antibody or T-cell, whereby the novel FVIII protein induces an immune response in a subject. will reduce the possible risk. The present disclosure provides compositions and methods for gene editing, particularly for modulating the expression, function or activity of a blood-coagulation protein, such as FVIII, in a cell by genome editing. The present disclosure also provides compositions and methods for treating a subject having hemophilia A, particularly both ex vivo and in vivo. In particular, the present invention provides genome editing methods and systems that provide improved integration and improved expression, and synthetic FVIII coding sequences and proteins that can ameliorate hemophilia A.

정의Justice

달리 정의되지 않는 한, 본원에 사용되는 모든 기술 및 과학 용어는 본 청구 대상물이 속하는 분야의 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 발명을 실시하기 위한 구체적인 내용이 예시적이며 설명만을 위한 것이며, 청구된 어떠한 특허 대상도 한정하지 않는 것으로 이해하여야 한다. 본 출원에서, 단수의 사용은 특별히 달리 언급되지 않으면, 복수를 포함한다. 본 명세서에서 사용되기를, 단수형 "한(a)", "하나(an)" 및 "상기(the)"는, 문맥이 명확히 달리 지시하지 않는 한, 복수의 지시대상을 포함한다. 본 출원에서, "또는"의 사용은 달리 언급되지 않으면, "및/또는"을 의미한다. 추가로, 용어 "포함하는" 뿐만 아니라, 다른 형태, 예컨대 "포함한다", "포함하다" 및 "포함된"의 사용은 제한하는 것이 아니다.Unless defined otherwise, all technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this claimed subject matter belongs. It is to be understood that the specific details for carrying out the invention are illustrative and illustrative only, and not limiting of any claimed subject matter. In this application, the use of the singular includes the plural unless specifically stated otherwise. As used herein, the singular forms "a", "an" and "the" include plural referents unless the context clearly dictates otherwise. In this application, the use of "or" means "and/or" unless stated otherwise. Additionally, use of the term “comprising”, as well as other forms, such as “comprises,” “includes,” and “included,” is not limiting.

개시내용의 특징이 단일의 실시형태의 맥락에서 기술될 수 있지만, 특징은 또한 개별적으로 또는 임의의 적합한 조합으로 제공될 수 있다. 역으로, 개시내용이 명확성을 위하여 본원에서 개별 실시형태의 맥락으로 기술될 수 있지만, 개시내용은 또한 단일의 실시형태에서 시행될 수 있다. 본원에 인용된 임의의 공개된 특허 출원 및 임의의 다른 공개된 참고문헌, 문서, 사본 및 과학 문헌은 임의의 목적을 위하여 본원에 참조로 포함된다. 상충하는 경우에, 정의를 포함하는 본 명서세가 좌우할 것이다. 또한, 물질, 방법 및 실시예는 단지 예시적인 것일 뿐이며, 제한하려는 것이 아니다.Although features of the disclosure may be described in the context of a single embodiment, the features may also be provided individually or in any suitable combination. Conversely, although a disclosure may, for clarity, be described herein in the context of separate embodiments, the disclosure may also be practiced in a single embodiment. Any published patent application and any other published references, documents, manuscripts and scientific literature cited herein are incorporated herein by reference for any purpose. In case of conflict, the present specification, including definitions, will control. In addition, the materials, methods, and examples are illustrative only and not intended to be limiting.

본원에 사용되는 바와 같이, 범위 및 양은 "약" 특정 값 또는 범위로서 표현될 수 있다. “약”은 또한 정확한 양을 포함한다. 따라서, "약 5 μL"는 "약 5 μL" 및 또한 "5 μL"를 의미한다. 일반적으로, 용어 "약"은 실험 오차, 예컨대 ±1%, ±2%, ±3%, ±5% 또는 ± 10% 이내인 것으로 예상되는 양을 포함한다.As used herein, ranges and amounts may be expressed as “about” a particular value or range. “About” also includes the precise amount. Thus, “about 5 μL” means “about 5 μL” and also “5 μL”. In general, the term “about” includes amounts expected to be within an experimental error, such as ±1%, ±2%, ±3%, ±5%, or ±10%.

수치의 범위가 본원에 제시되는 경우, 그 범위의 하한과 상한 사이 각각의 개재하는 값, 그 범위의 상한 및 하한인 값, 및 그 범위를 가진 모든 언급된 값이 본 개시내용 내에 포괄되는 것이 고려된다. 그 범위의 하한 및 상한 내의 모든 가능한 하위-범위도 또한 본 개시내용에 의해 고려된다.When a range of numerical values is presented herein, it is contemplated that each intervening value between the lower limit and the upper limit of the range, the value being the upper and lower limit of the range, and all recited values having the range are encompassed within the present disclosure. do. All possible sub-ranges within the lower and upper limits of that range are also contemplated by the present disclosure.

용어 "폴리펩티드", "펩티드" 및 "단백질"은 펩티드 결합에 의해 서로 연결된 일련의 선형의 아미노산 잔기를 표기하기 위하여 본원에 상호 교환 가능하게 사용되며, 일련의 것은 단백질, 폴리펩티드, 올리고펩티드, 펩티드 및 그의 단편을 포함할 수 있다. 단백질은 천연 발생 아미노산 및/또는 합성(예를 들어, 변형된 또는 비-천연 발생) 아미노산으로 구성될 수 있다. 본원에 사용되는 바와 같은 용어 "아미노산" 또는 "펩티드 잔기"는 천연 발생 및 합성 아미노산 둘 모두를 나타낼 수 있다. 용어 "폴리펩티드", "펩티드" 및 "단백질"은 이종 아미노산 서열과의 융합 단백질, N-말단 메티오닌 잔기와 함께 또는 이것 없이 이종 및 동종 리더 서열과의 융합; 면역학적으로 태깅된 단백질; 검출 가능한 융합 파트너와의 융합 단백질, 예를 들어, 융합 파트너로서 형광 단백질, β-갈락토시다제, 루시퍼라제 등을 포함하는 융합 단백질을 포함하지만, 이들에 한정되지 않는 융합 단백질을 포함한다. 또한, 아미노산 서열의 시작 또는 끝의 대시 기호는 하나 이상의 아미노산 잔기의 추가의 서열로의 펩티드 결합, 또는 카복실 또는 하이드록실 말단기로의 공유 결합 중 어느 하나를 나타내는 것을 주의해야 한다. 그러나, 대시 기호의 부재는 이를 생략하는 것이 아미노산 서열의 표현에서 관례이기 때문에, 카복실 또는 하이드록실 말단기로의 이러한 펩티드 결합 또는 공유 결합이 존재하지 않는 것을 의미하는 것으로 해석되지 않아야 한다.The terms "polypeptide", "peptide" and "protein" are used interchangeably herein to denote a series of linear amino acid residues linked together by peptide bonds, the series being proteins, polypeptides, oligopeptides, peptides and may contain fragments thereof. Proteins may be composed of naturally occurring amino acids and/or synthetic (eg, modified or non-naturally occurring) amino acids. As used herein, the term “amino acid” or “peptide residue” may refer to both naturally occurring and synthetic amino acids. The terms “polypeptide”, “peptide” and “protein” refer to fusion proteins with heterologous amino acid sequences, fusions with heterologous and homologous leader sequences with or without an N-terminal methionine residue; immunologically tagged proteins; fusion proteins with a detectable fusion partner, for example, fusion proteins including, but not limited to, fluorescent proteins, β-galactosidase, luciferase, and the like as fusion partners. It should also be noted that a dash symbol at the beginning or end of an amino acid sequence indicates either a peptide bond to an additional sequence of one or more amino acid residues, or a covalent bond to a carboxyl or hydroxyl end group. However, the absence of a dash symbol should not be construed to mean that no such peptide bond or covalent bond to a carboxyl or hydroxyl end group exists, as omitting it is customary in the representation of amino acid sequences.

용어 "폴리뉴클레오티드", "올리고뉴클레오티드", "올리고머", "올리고", "코딩 서열" 및 "핵산"은 상이한 길이의 중합체 형태의 뉴클레오티드, 즉, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드를 나타낸다. 따라서, 이들 용어는, 제한 없이, 단일-, 이중- 또는 다중-가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드, 또는 퓨린 및 피리미딘 염기, 또는 다른 천연, 화학적으로 또는 생화학적으로 변형된, 비천연 또는 유도체화된 뉴클레오티드 염기를 갖는 중합체를 포함한다.The terms “polynucleotide”, “oligonucleotide”, “oligomer”, “oligo”, “coding sequence” and “nucleic acid” refer to nucleotides in the form of polymers of different lengths, i.e., ribonucleotides or deoxyribonucleotides. Accordingly, these terms include, without limitation, single-, double- or multi-stranded DNA or RNA, genomic DNA, cDNA, DNA-RNA hybrid, or purine and pyrimidine bases, or other natural, chemically or biochemically modified polymers having a modified, unnatural or derivatized nucleotide base.

용어 “기능적으로 등가물” 또는 “기능적 등가물”은 제한 없이 본원에 개시된 화합물로부터 유래된 구조 또는 서열을 가지며, 그의 구조 또는 서열이 동일한 또는 유사한 활성 및 유용성을 갖도록 또는 이러한 유사성에 기초하여 당업자에 의해 참조 화합물과 동일한 또는 유사한 활성 및 유용성을 나타내는 것으로 예상되도록 본원에 개시된 것들과 충분히 유사한 임의의 분자, 예컨대 핵산 또는 단백질을 나타낸다. 기능적 등가물, "유도체" 또는 "변이체"를 수득하기 위한 변형은 예를 들어, 핵산 또는 아미노산 잔기 중 하나 이상의 부가, 결실 및/또는 치환을 포함할 수 있다.The term “functionally equivalent” or “functionally equivalent” has, without limitation, a structure or sequence derived from a compound disclosed herein, and the structure or sequence has the same or similar activity and utility, or is referenced by those skilled in the art based on such similarity Refers to any molecule, such as a nucleic acid or protein, sufficiently similar to those disclosed herein to be expected to exhibit the same or similar activity and utility as the compound. Modifications to obtain functional equivalents, “derivatives” or “variants” may include, for example, additions, deletions and/or substitutions of one or more of nucleic acid or amino acid residues.

단백질의 기능적 등가물 또는 기능적 등가물의 단편은 하나 이상의 보존적 아미노산 치환을 가질 수 있다. 용어 "보존적 아미노산 치환"은 원래의 아미노산과 유사한 특성을 갖는 또 다른 아미노산으로의 한 아미노산의 치환, 즉, 동일한 그룹으로부터의 또 다른 아미노산으로의 한 아미노산의 치환을 나타낸다. 보존적 아미노산의 그룹은 하기와 같다:A functional equivalent of a protein or a fragment of a functional equivalent may have one or more conservative amino acid substitutions. The term “conservative amino acid substitution” refers to the substitution of one amino acid for another amino acid having properties similar to the original amino acid, ie, the substitution of one amino acid for another amino acid from the same group. The groups of conservative amino acids are:

Figure pct00001
Figure pct00001

보존적 치환은 소정의 펩티드 또는 그의 단편의 임의의 위치에 도입될 수 있다. 그러나, 비-보존적 치환, 특히 비제한적으로, 임의의 하나 이상의 위치 내의 비-보존적 치환을 도입하는 것이 또한 바람직할 수 있다. 펩티드의 기능적으로 동등한 단편의 형성을 야기하는 비-보존적 치환은 예를 들어, 그의 기능적 등가물 또는 변이체 단편의 항응고 기능을 유지하면서, 극성, 전하, 입체 크기 및/또는 다른 단백질 또는 핵산으로의 결합이 상이할 것이다.Conservative substitutions may be introduced at any position in a given peptide or fragment thereof. However, it may also be desirable to introduce non-conservative substitutions, particularly, but not limited to, non-conservative substitutions in any one or more positions. Non-conservative substitutions that result in the formation of a functionally equivalent fragment of a peptide are, for example, polarity, charge, conformational size and/or changes to another protein or nucleic acid while maintaining the anticoagulant function of the functional equivalent or variant fragment thereof. The binding will be different.

"서열 동일성의 백분율"은 2개의 최적으로 정렬된 서열을 비교창에 걸쳐 비교함으로써 결정되며, 비교창 내의 폴리뉴클레오티드 또는 폴리펩티드 서열의 부분은 2개의 서열의 최적의 정렬을 위하여 (부가 또는 결실을 갖지 않는) 참조 서열과 비교하여 부가 또는 결실(즉, 갭)을 가질 수 있다. 일부 경우에, 백분율은 동일한 핵산 염기 또는 아미노산 잔기가 두 서열 모두에 존재하는 위치의 수를 결정하여 일치되는 위치의 수를 제공하고, 일치되는 위치의 수를 비교창 내의 총 위치의 수로 나누고, 결과를 100과 곱하여 서열 동일성의 백분율을 제공함으로써 계산된다. 서열 동일성은 예를 들어, AlignX(Vectro NTI에 포함됨, ClustalW(http:// www.clustal.org/clutal2/)에 기초함)를 사용하여 표준 파라미터(예를 들어: 갭 개방 페널티 = 15; 갭 연장 페널티 = 6.6; 갭 분리 페널티 범위 = 8)를 사용해 결정될 수 있다."Percent sequence identity" is determined by comparing two optimally aligned sequences over a comparison window, wherein the portion of a polynucleotide or polypeptide sequence within the comparison window is determined for optimal alignment of the two sequences (with no additions or deletions). It may have additions or deletions (ie, gaps) compared to a reference sequence that does not). In some cases, the percentage determines the number of positions in which the same nucleic acid base or amino acid residue is present in both sequences to provide the number of positions that are matched, divide the number of positions that are matched by the total number of positions within the comparison window, and result is calculated by multiplying by 100 to give the percentage of sequence identity. Sequence identity is identified using standard parameters (eg: gap opening penalty = 15; gap extension penalty = 6.6; gap separation penalty range = 8).

2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서 용어 "동일한" 또는 "동일성" 백분율은 하기의 서열 비교 알고리즘 중 하나를 사용하여 또는 수동의 정렬 및 육안의 검사에 의해 측정하여, 비교창 또는 표기된 영역에 걸쳐 최대의 상응성을 위하여 비교되고 정렬되는 경우, 동일하거나, 특정 백분율의 동일한(예를 들어, 특정 영역, 예를 들어, 전체 폴리펩티드 서열 또는 폴리펩티드의 개별 도메인에 걸쳐 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99% 동일성) 아미노산 잔기 또는 뉴클레오티드를 갖는 2개 이상의 서열 또는 하위서열을 나타낸다. 이어서, 이러한 서열은 "실질적으로 동일하다"라고 한다. 이 정의는 또한 시험 서열의 상보물을 나타낸다.The term “identical” or “percentage of identity” in the context of two or more nucleic acid or polypeptide sequences, as measured using one of the following sequence comparison algorithms, or by manual alignment and visual inspection, spans a comparison window or marked region When compared and aligned for maximum correspondence, identical or a specified percentage of identical (eg, 60%, 65%, 70%, over a specific region, eg, the entire polypeptide sequence or individual domains of a polypeptide, 75%, 80%, 85%, 90%, 95%, 98% or 99% identity) amino acid residues or nucleotides). Such sequences are then said to be "substantially identical". This definition also refers to the complement of a test sequence.

본원에 상호 교환 가능하게 사용되는 용어 "상보적인" 또는 "실질적으로 상보적인"은 핵산(예를 들어, DNA 또는 RNA)이 서열-특이적, 역평행 방식으로 또 다른 핵산에 비-공유적으로 결합되게 하는, 즉, 왓슨-크릭 염기쌍 및/또는 G/U 염기쌍을 형성하게 하는 뉴클레오티드의 서열을 갖는 것을 의미한다(즉, 핵산은 상보적인 핵산에 특이적으로 결합한다). 당업계에 알려져 있는 바와 같이, 표준 왓슨-크릭 염기-쌍형성은 하기를 포함한다: 티미딘(T)과 염기쌍을 형성하는 아데닌(A), 우라실(U)과 염기쌍을 형성하는 아데닌(A) 및 시토신(C)과 염기쌍을 형성하는 구아닌(G).As used interchangeably herein, the terms "complementary" or "substantially complementary" means that a nucleic acid (eg, DNA or RNA) is non-covalently attached to another nucleic acid in a sequence-specific, antiparallel manner. It is meant to have a sequence of nucleotides that allows it to bind, ie to form Watson-Crick base pairing and/or G/U base pairing (ie, the nucleic acid specifically binds to a complementary nucleic acid). As is known in the art, standard Watson-Crick base-pairing includes: adenine (A) to base pair with thymidine (T), adenine (A) to base pair with uracil (U) and guanine (G), which base pairs with cytosine (C).

특정 RNA를 "인코딩하는" DNA 서열은 RNA로 전사되는 DNA 핵산 서열이다. DNA 폴리뉴클레오티드는 단백질로 번역되는 RNA(mRNA)를 인코딩할 수 있거나, 또는 DNA 폴리뉴클레오티드는 단백질로 번역되지 않는 RNA(예를 들어, tRNA, rRNA 또는 가이드 RNA; "비-코딩" RNA 또는 "ncRNA"로도 지칭됨)를 인코딩할 수 있다. 단백질 코딩 서열, 또는 특정 단백질 또는 폴리펩티드를 인코딩하는 서열은 적절한 조절 서열의 제어 하에 배치되는 경우 시험관내에서 또는 생체내에서 (DNA의 경우에) mRNA로 전사되고, (mRNA의 경우에) 폴리펩티드로 번역되는 핵산 서열이다.A DNA sequence that "encodes" a particular RNA is a DNA nucleic acid sequence that is transcribed into RNA. A DNA polynucleotide may encode an RNA (mRNA) that is translated into a protein, or a DNA polynucleotide may encode an RNA that is not translated into a protein (e.g., tRNA, rRNA, or guide RNA; “non-coding” RNA or “ncRNA”) Also referred to as "). A protein coding sequence, or a sequence encoding a particular protein or polypeptide, is transcribed into mRNA (in the case of DNA) and translated into a polypeptide (in the case of mRNA) in vitro or in vivo when placed under the control of appropriate regulatory sequences. is a nucleic acid sequence.

본원에 사용되는 바와 같이, "코돈"은 DNA 또는 RNA 분자에서 함께 유전 암호의 단위를 형성하는 3개 뉴클레오티드의 서열을 나타낸다. 본원에 사용되는 바와 같이, 용어 "코돈 축퇴성"은 인코딩된 폴리펩티드의 아미노산 서열에 영향을 미치지 않고, 뉴클레오티드 서열의 변이를 가능하게 하는 유전 암호의 성질을 나타낸다.As used herein, "codon" refers to a sequence of three nucleotides that together form a unit of the genetic code in a DNA or RNA molecule. As used herein, the term “codon degeneracy” refers to the property of the genetic code that allows for variations in the nucleotide sequence without affecting the amino acid sequence of the encoded polypeptide.

용어 "코돈-최적화된" 또는 "코돈 최적화"는 적합한 숙주의 형질전환을 위한 유전자 또는 핵산 분자의 코딩 영역을 나타내며, DNA에 의해 인코딩되는 폴리펩티드를 변경시키지 않고, 숙주 유기체의 코돈 사용을 반영하기 위한 유전자 내의 코돈 또는 핵산 분자의 코딩 영역의 변경을 나타낸다. 이러한 최적화는 적어도 하나 또는 하나 초과 또는 유의미한 수의 코돈을 해당 유기체의 유전자에서 더욱 빈번하게 사용되는 하나 이상의 코돈으로 대체하는 것을 포함한다. 코돈 사용 표는 예를 들어, www.kazusa.or.jp/codon/(방문일: 2019년 1월 30일)에서 이용 가능한 "코돈 사용 데이터베이스"에서 용이하게 입수 가능하다. 각 유기체 내의 코돈 사용 또는 코돈 선호에 대한 지식을 사용함으로써, 당업자는 빈도를 임의의 주어진 폴리펩티드 서열에 적용하고, 폴리펩티드를 인코딩하지만, 주어진 종에 최적인 코돈을 사용하는 코돈-최적화된 코딩 영역의 핵산 단편을 생성할 수 있다. 코돈-최적화된 코딩 영역은 당업자에게 알려져 있는 방법에 의해 설계된다.The term "codon-optimized" or "codon optimization" refers to the coding region of a gene or nucleic acid molecule for transformation of a suitable host, without altering the polypeptide encoded by the DNA, to reflect the codon usage of the host organism. Represents an alteration of a codon in a gene or the coding region of a nucleic acid molecule. Such optimization involves replacing at least one or more than one or a significant number of codons with one or more codons used more frequently in the genes of the organism in question. Codon usage tables are readily available, for example, in the "Codon Usage Database" available at www.kazusa.or.jp/codon/ (visited January 30, 2019). By using knowledge of codon usage or codon preference within each organism, one of ordinary skill in the art would apply the frequency to any given polypeptide sequence, encoding the polypeptide, but using codons that are optimal for the given species. You can create fragments. Codon-optimized coding regions are designed by methods known to those skilled in the art.

예를 들어, 세포, 핵산, 단백질 또는 벡터에 관하여 사용되는 경우, 용어 "재조합" 또는 "엔지니어링된"은 세포, 핵산, 단백질 또는 벡터가 실험실 방법에 의해 변형된 바 있거나, 또는 그의 결과인 것을 나타낸다. 따라서, 예를 들어, 재조합 또는 엔지니어링된 단백질은 실험실 방법에 의해 생성되는 단백질을 포함한다. 재조합 또는 엔지니어링된 단백질은 고유(비-재조합 또는 야생형) 형태의 단백질 내에서 관찰되지 않는 아미노산 잔기를 포함할 수 있거나, 변형된, 예를 들어, 표지된 아미노산 잔기를 포함할 수 있다. 상기 용어는 펩티드, 단백질 또는 핵산 서열에 대한 임의의 변형을 포함할 수 있다. 이러한 변형은 다음을 포함한다: 펩티드, 단백질 또는 핵산 서열의 임의의 화학적 변형; 펩티드 또는 단백질 내의 아미노산 중 하나 이상의 부가, 결실 및/또는 치환; 및 핵산 서열 내의 핵산 중 하나 이상의 부가, 결실 및/또는 치환.For example, when used in reference to a cell, nucleic acid, protein or vector, the term "recombinant" or "engineered" indicates that the cell, nucleic acid, protein or vector has been modified by, or is the result of, laboratory methods. . Thus, for example, recombinant or engineered proteins include proteins produced by laboratory methods. Recombinant or engineered proteins may contain amino acid residues that are not observed in the native (non-recombinant or wild-type) form of the protein, or may contain modified, eg, labeled amino acid residues. The term may include any modifications to a peptide, protein or nucleic acid sequence. Such modifications include: any chemical modification of a peptide, protein or nucleic acid sequence; additions, deletions and/or substitutions of one or more amino acids in the peptide or protein; and one or more additions, deletions and/or substitutions of nucleic acids within the nucleic acid sequence.

용어 "게놈 DNA" 또는 "게놈 서열"은 박테리아, 진균, 조류, 식물 또는 동물의 게놈의 DNA를 포함하나 이들에 한정되지 않는 유기체의 게놈의 DNA를 나타낸다.The term "genomic DNA" or "genomic sequence" refers to the DNA of the genome of an organism, including but not limited to the DNA of the genome of bacteria, fungi, algae, plants or animals.

본원에 사용되는 바와 같이, "트랜스유전자", "외인성 유전자" 및 "외인성 서열"은 세포의 게놈에 존재하지 않지만, 예를 들어, 게놈-편집에 의해 게놈 내로 인공적으로 도입되는 핵산 서열 또는 유전자를 나타낸다.As used herein, “transgene”, “exogenous gene” and “exogenous sequence” refer to a nucleic acid sequence or gene that is not present in the genome of a cell but is artificially introduced into the genome, for example, by genome-editing. indicates.

본원에 사용되는 바와 같이, "내인성 유전자" 또는 "내인성 서열"은 임의의 인공의 수단을 통해 도입되지 않고, 세포의 게놈에 천연적으로 존재하는 핵산 서열 또는 유전자를 나타낸다.As used herein, “endogenous gene” or “endogenous sequence” refers to a nucleic acid sequence or gene that is naturally present in the genome of a cell without being introduced through any artificial means.

용어 "벡터" 또는 "발현 벡터"는 또 다른 DNA 세그먼트, 예를 들어, "삽입물"이 부착되어, 세포 내에서 부착된 세그먼트의 복제를 야기할 수 있는 레플리콘, 예컨대 플라스미드, 파지, 바이러스 또는 코스미드를 의미한다.The term “vector” or “expression vector” refers to a replicon such as a plasmid, phage, virus or It means cosmid.

용어 "발현 카세트"는 프로모터에 작동 가능하게 연결된 DNA 코딩 서열을 갖는 벡터를 나타낸다. "작동 가능하게 연결된"은 그렇게 기술된 성분을 그들의 의도된 방식으로 기능하게 하는 관계 하에 그들이 존재하는 병치를 나타낸다. 예를 들어, 프로모터가 그의 전사 또는 발현에 영향을 미친다면, 프로모터는 코딩 서열에 작동 가능하게 연결된다. 용어 "재조합 발현 벡터" 및 "DNA 구축물"은 벡터 및 적어도 하나의 삽입물을 갖는 DNA 분자를 나타내기 위해 본원에서 상호 교환 가능하게 사용된다. 재조합 발현 벡터는 통상 삽입물(들)의 발현 및/또는 증량의 목적을 위해 또는 다른 재조합 뉴클레오티드 서열의 구축을 위해 생성된다. 핵산(들)은 프로모터 서열에 작동 가능하게 연결될 수 있거나, 그렇지 않을 수 있으며, DNA 조절 서열에 작동 가능하게 연결될 수 있거나, 그렇지 않을 수 있다.The term “expression cassette” refers to a vector having a DNA coding sequence operably linked to a promoter. "Operably linked" refers to the juxtaposition in which they exist under a relationship that allows the components so described to function in their intended manner. For example, a promoter is operably linked to a coding sequence if it affects its transcription or expression. The terms “recombinant expression vector” and “DNA construct” are used interchangeably herein to refer to a vector and a DNA molecule having at least one insert. Recombinant expression vectors are usually generated for the purpose of expression and/or amplification of the insert(s) or for the construction of other recombinant nucleotide sequences. The nucleic acid(s) may or may not be operably linked to a promoter sequence and may or may not be operably linked to a DNA regulatory sequence.

용어 "조절 서열"은 예를 들어, 프로모터, 인핸서 및 다른 발현 제어 요소(예를 들어, 폴리아데닐화 신호)를 포함한다. 이러한 조절 서열은 해당 분야에 공지되어 있고, 예를 들어 문헌[Goeddel; Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990)]에 기술되어 있다. 조절 서열은 다수의 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 유도하는 것들, 및 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 유도하는 것들(예를 들어, 조직-특이적 조절 서열)을 포함한다.The term “regulatory sequence” includes, for example, promoters, enhancers and other expression control elements (eg, polyadenylation signals). Such regulatory sequences are known in the art and are described, for example, in Goeddel; Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990). Regulatory sequences include those that direct constitutive expression of a nucleotide sequence in many types of host cells, and those that direct expression of a nucleotide sequence only in a particular host cell (eg, tissue-specific regulatory sequences).

세포는 이러한 DNA가 세포 내측에 도입되는 경우 외인성 DNA, 예를 들어, 재조합 발현 벡터에 의해 "유전학적으로 변형"되거나, "형질전환"되거나, "트랜스펙션"된다. 외인성 DNA의 존재는 영구적인 또는 일시적인 유전학적 변화를 초래한다. 형질전환 DNA는 세포의 게놈 내로 통합(공유적으로 연결)될 수 있거나, 그렇지 않을 수 있다. 치료적 활성을 갖는, 예를 들어, A형 혈우병을 치료하는 유전학적으로 변형된(또는 형질전환된 또는 트랜스펙션된) 세포가 사용되고, “치료적 세포”로 지칭될 수 있다.A cell is "genetically modified", "transformed", or "transfected" with exogenous DNA, eg, a recombinant expression vector, when such DNA is introduced inside the cell. The presence of exogenous DNA results in permanent or temporary genetic changes. The transforming DNA may or may not be integrated (covalently linked) into the genome of the cell. Genetically modified (or transformed or transfected) cells that have therapeutic activity, eg, to treat hemophilia A, are used and may be referred to as “therapeutic cells”.

분자, 예컨대 펩티드 단편의 맥락에서 사용되는 용어 "농도"는 주어진 부피의 용액 중 존재하는 분자의 양, 예를 들어, 분자의 몰수를 나타낸다.The term "concentration" as used in the context of a molecule, such as a peptide fragment, refers to the amount of molecule present in a given volume of solution, eg, number of moles of molecule.

용어 “급성기 단백질”은 염증에 반응하여 발현 또는 혈청 농도가 달라지는 단백질을 지칭한다. 급성기 단백질의 예는 알부민, 트랜스페린, 트랜스티레틴, 피브리노겐, 항트롬빈 등을 포함한다.The term “acute phase protein” refers to a protein whose expression or serum concentration changes in response to inflammation. Examples of acute phase proteins include albumin, transferrin, transthyretin, fibrinogen, antithrombin, and the like.

용어 "개체", "대상체", 및 "숙주"는 진단, 치료 또는 요법이 요망되는 임의의 대상체를 지칭한다. 일부 양태에서, 대상체는 포유동물이다. 일부 양태에서, 대상체는 인간이다. 일부 양태에서, 대상체는 인간 환자이다. 일부 양태에서, 대상체는 A형 혈우병을 갖거나, 이를 갖는 것으로 의심되고/거나 A형 혈우병의 하나 이상의 증상을 갖는다. 일부 양태에서, 대상체는 진단시에 또는 그 이후에 A형 혈우병의 위험이 있는 것으로 진단받은 인간이다. 일부 경우에, A형 혈우병의 위험이 있는 것으로의 진단은 내인성 FVIII 유전자 또는 FVIII 유전자의 발현에 영향을 미칠 수 있는 게놈 내의 FVIII 유전자 근처의 게놈 서열 내의 하나 이상의 돌연변이의 존재에 기초하여 결정될 수 있다.The terms “individual,” “subject,” and “host” refer to any subject for whom diagnosis, treatment, or therapy is desired. In some embodiments, the subject is a mammal. In some aspects, the subject is a human. In some embodiments, the subject is a human patient. In some embodiments, the subject has, is suspected of having, and/or has one or more symptoms of hemophilia A. In some embodiments, the subject is a human diagnosed as at risk for hemophilia A at or after diagnosis. In some cases, a diagnosis of being at risk for hemophilia A may be determined based on the presence of an endogenous FVIII gene or one or more mutations in a genomic sequence near the FVIII gene in the genome that may affect expression of the FVIII gene.

질병 또는 질환과 관련하여 사용되는 용어 "치료"는 적어도 개체가 걸린 질환과 연관된 증상의 개선이 달성되는 것을 의미하며, 개선은 넓은 의미에서 적어도 파라미터, 예를 들어, 치료 중인 질환(예를 들어, A형 혈우병)과 연관된 증상의 세기의 감소를 나타내기 위해 사용된다. 치료는 또한 병태 또는 적어도 이와 관련된 증상이 완전히 저해된, 예를 들어 발생이 예방되거나, 또는 완전히 제거되어, 숙주가 더 이상 질환 또는 적어도 질환을 특징짓는 증상을 앓지 않게 된 상황을 포함한다. 따라서, 치료는 하기를 포함한다: (i) 예방(즉, 임상적 증상이 발생하지 않도록 하는 것, 예를 들어, 질병 진행을 방지하는 것을 포함하여, 임상적 증상의 발생 위험을 감소시키는 것); 및 (ii) 저해(즉, 임상 증상의 발생 또는 추가의 발생을 저지하는 것, 예를 들어, 활동 질병을 경감시키는 또는 완전히 저해하는 것).The term "treatment" as used in connection with a disease or disorder means that at least an improvement of the symptoms associated with the disorder in which the individual suffers is achieved, and the improvement is in a broad sense at least a parameter, e.g., the condition being treated (e.g., It is used to indicate a decrease in the intensity of symptoms associated with hemophilia A). Treatment also includes situations in which the condition or at least the symptoms associated therewith are completely inhibited, eg, its occurrence has been prevented, or has been completely eliminated, such that the host is no longer afflicted with the disease or at least the symptoms characteristic of the disease. Thus, treatment includes: (i) prophylaxis (ie, preventing the clinical symptoms from developing, eg, reducing the risk of developing clinical symptoms, including preventing disease progression) ; and (ii) inhibition (ie, arresting the development or further development of clinical symptoms, eg, alleviating or completely inhibiting active disease).

용어 "유효량", "약제학적 유효량" 및 "치료적 유효량"은 특정 질환을 갖는 대상체에게 투여되는 경우, 요망되는 유용성을 제공하기에 충분한 조성물의 양을 의미한다. A형 혈우병의 생체외 치료의 문맥에서, 용어 "유효량"은 A형 혈우병의 하나 이상의 징후 또는 증상을 예방하거나 완화시키는 데 필요한 치료 세포 또는 그들의 자손의 집단의 양을 지칭하며, 요망되는 효과를 제공하기 위한 치료 세포 또는 그들의 자손을 갖는 조성물, 예를 들어, 대상체의 A형 혈우병 증상을 치료하기 위한 조성물의 충분한 양에 관한 것이다. 따라서, 용어 "치료적 유효량"은 치료를 필요로 하는 대상체, 예컨대 A형 혈우병을 갖거나, 이에 대한 위험이 있는 대상체에게 투여되는 경우 특정 효과를 촉진시키기에 충분한 치료 세포 또는 치료 세포를 포함하는 조성물의 양 또는 수를 지칭한다. 또한, 유효량은 질환의 증상의 발생을 예방 또는 지연시키거나, 질환의 증상의 과정을 변경시키거나(예를 들어, 비제한적으로 질환의 증상의 진행을 늦추거나) 또는 질환의 증상을 반전시키기에 충분한 양 또는 수를 포함한다. 대상체(예를 들어, 환자)에서의 A형 혈우병의 생체내 치료 또는 시험관내에서 배양되는 세포에서 행해지는 게놈 편집의 맥락에서, 유효량은 대상체 내의 세포 또는 시험관내에서 배양되는 세포의 게놈을 편집하는 데 필요한, 게놈 편집을 위해 사용되는 성분, 예컨대, gRNA, 공여자 주형 및/또는 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제)의 양을 나타낸다. 임의의 주어진 경우에 대하여, 적절한 "유효량"은 당업자에 의해 결정될 수 있다는 것이 이해된다.The terms “effective amount”, “pharmaceutically effective amount” and “therapeutically effective amount” refer to an amount of a composition that, when administered to a subject having a particular disease, is sufficient to provide the desired utility. In the context of ex vivo treatment of hemophilia A, the term "effective amount" refers to the amount of a population of therapeutic cells or their progeny required to prevent or ameliorate one or more signs or symptoms of hemophilia A and to provide the desired effect. A composition having therapeutic cells or their progeny to Accordingly, the term “therapeutically effective amount” refers to a therapeutic cell or composition comprising therapeutic cells sufficient to promote a particular effect when administered to a subject in need thereof, such as a subject having or at risk for hemophilia A. refers to the amount or number of Also, an effective amount is used to prevent or delay the onset of symptoms of a disease, alter the course of symptoms of a disease (eg, but not limited to slowing the progression of symptoms of a disease), or to reverse symptoms of a disease. a sufficient amount or number. In the context of in vivo treatment of hemophilia A in a subject (e.g., a patient) or genome editing performed in cells cultured in vitro, an effective amount comprises editing the genome of a cell in a subject or of a cell cultured in vitro. indicates the amount of components used for genome editing, such as gRNAs, donor templates, and/or site-directed polypeptides (eg, DNA endonuclease), required to It is understood that, for any given case, an appropriate "effective amount" can be determined by one of ordinary skill in the art.

본원에 사용되는 바와 같이, 용어 “약제학적 조성물” 및 “의약”은 (합성 FVIII 단백질을 발현하는) 본 발명의 세포 및/또는 본 발명의 시스템의 하나 이상의 성분(즉, gRNA 또는 gRNA를 인코딩하는 핵산, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및/또는 합성 인자 VIII 단백질을 인코딩하는 공여자 주형)과 조합된 약제학적으로 허용 가능한 부형제를 나타낸다.As used herein, the terms “pharmaceutical composition” and “medicament” refer to a cell of the invention (expressing a synthetic FVIII protein) and/or one or more components of a system of the invention (i.e., a gRNA or a gRNA that encodes a gRNA) nucleic acid, DNA endonuclease or a nucleic acid encoding a DNA endonuclease and/or a donor template encoding a synthetic factor VIII protein) in combination with a pharmaceutically acceptable excipient.

본원에 사용되는 바와 같이, 용어 "약제학적으로 허용 가능한 부형제"는 대상체로의 관심 화합물(들)의 투여를 위한 약제학적으로 허용 가능한 담체, 첨가제 또는 희석제를 제공하는 임의의 적합한 물질을 나타낸다. "약제학적으로 허용 가능한 부형제"는 약제학적으로 허용 가능한 희석제, 약제학적으로 허용 가능한 첨가제 및 약제학적으로 허용 가능한 담체로서 지칭되는 물질을 포함할 수 있다.As used herein, the term “pharmaceutically acceptable excipient” refers to any suitable substance that provides a pharmaceutically acceptable carrier, excipient, or diluent for administration of the compound(s) of interest to a subject. "Pharmaceutically acceptable excipient" may include substances referred to as pharmaceutically acceptable diluents, pharmaceutically acceptable excipients and pharmaceutically acceptable carriers.

용어 “합성 FVIII”은 야생형 인간 인자 VIII(GenBank: CAD97566.1; 문헌[Vehar et al., Nature (1984) 312:337-42])의 A 및 C 도메인에 대하여 상당한 서열 동일성을 갖지만, 야생형 B 도메인 대신에 B 도메인 치환물을 갖는 단백질을 나타낸다. 본 발명의 일 실시형태에서, 합성 FVIII 단백질의 A 및 C 도메인의 서열은 A 및 C 도메인의 야생형 서열과 80, 90, 95, 98 또는 99% 동일하다. 일부 실시형태에서, B 도메인 치환물은 임의의 서열의 폴리펩티드인데, 약 10개 내지 약 200개의 아미노산을 가진다. 일부 실시형태에서, B 도메인 치환물은 약 20개 내지 약 100개의 아미노산을 가진다. 일부 실시형태에서, B 도메인 치환물은 40개 미만의 아미노산(예를 들어, 3 내지 40개 아미노산의 임의의 수의 아미노산을 가짐) 및 발현되는 경우 B 도메인 치환물의 글리코실화를 제공하는 1 내지 9개의 N-연결된 글리코실화 부위를 가질 수 있다. B 도메인 치환물은 합성 FVIII 단백질이 야생형 단백질과 동일한 방식으로 중쇄 및 경쇄로 절단될 수 있도록 프로테아제 절단 부위를 추가로 포함할 수 있다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 1 내지 9개의 N-연결된 글리코실화(“글리칸”) 부위에 더하여, 야생형 B 도메인의 N- 및 C-말단으로부터의 1 내지 10개의 아미노산을 포함한다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 1 내지 6개의 글리칸 부위를 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 1 내지 5개의 글리칸 부위를 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 1 내지 4개의 글리칸 부위를 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 2 내지 4개의 글리칸 부위를 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 SEQ ID NO: 362 내지 369, 371 및 373 중 어느 하나의 서열, 또는 SEQ ID NO: 362 내지 369, 371 및 373 중 어느 하나의 서열과 적어도 80%, 90%, 95%, 98% 또는 99% 동일한 서열을 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나의 서열, 또는 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나의 서열과 적어도 80%, 90%, 95%, 98% 또는 99% 동일한 서열을 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나의 서열, 또는 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나의 서열과 적어도 80%, 90%, 95%, 98% 또는 99% 동일한 서열을 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 SEQ ID NO: 362 내지 363 중 어느 하나의 서열, 또는 SEQ ID NO: 362 내지 363 중 어느 하나의 서열과 적어도 80%, 90%, 95%, 98% 또는 99% 동일한 서열을 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 SEQ ID NO: 362 내지 369 중 어느 하나의 서열을 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 SEQ ID NO: 362 내지 366 중 어느 하나의 서열을 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 SEQ ID NO: 362 내지 364 중 어느 하나의 서열을 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 SEQ ID NO: 362 내지 363, 371 및 373 중 어느 하나의 서열을 갖는다. 일 실시형태에서, B 도메인 치환물 단백질 서열은 SEQ ID NO: 371 또는 373 중 어느 하나의 서열을 갖는다.The term “synthetic FVIII” has significant sequence identity to the A and C domains of wild-type human factor VIII (GenBank: CAD97566.1; Vehar et al., Nature (1984) 312 :337-42), but wild-type B Proteins with B domain substitutions instead of domains are indicated. In one embodiment of the invention, the sequences of the A and C domains of the synthetic FVIII protein are 80, 90, 95, 98 or 99% identical to the wild-type sequences of the A and C domains. In some embodiments, the B domain substitution is a polypeptide of any sequence, having from about 10 to about 200 amino acids. In some embodiments, the B domain substitution has from about 20 to about 100 amino acids. In some embodiments, the B domain substitution is less than 40 amino acids (eg, having any number of amino acids from 3 to 40 amino acids) and 1 to 9 that, when expressed, provide for glycosylation of the B domain substitution. may have N-linked glycosylation sites. The B domain substitution may further comprise a protease cleavage site such that the synthetic FVIII protein can be cleaved into the heavy and light chains in the same manner as the wild-type protein. In one embodiment, the B domain substitution protein sequence comprises 1 to 10 amino acids from the N- and C-terminus of the wild-type B domain, in addition to 1 to 9 N-linked glycosylation (“glycans”) sites. do. In one embodiment, the B domain substitution protein sequence has 1 to 6 glycan sites. In one embodiment, the B domain substitution protein sequence has 1 to 5 glycan sites. In one embodiment, the B domain substitution protein sequence has 1 to 4 glycan sites. In one embodiment, the B domain substitution protein sequence has 2 to 4 glycan sites. In one embodiment, the B domain substitution protein sequence is at least 80% with the sequence of any one of SEQ ID NOs: 362-369, 371 and 373, or any one of SEQ ID NOs: 362-369, 371 and 373 , 90%, 95%, 98% or 99% identical sequences. In one embodiment, the B domain substitution protein sequence is at least 80% with the sequence of any one of SEQ ID NOs: 362-366, 371 and 373, or any one of SEQ ID NOs: 362-366, 371 and 373 , 90%, 95%, 98% or 99% identical sequences. In one embodiment, the B domain substitution protein sequence is at least 80% with the sequence of any one of SEQ ID NOs: 362 to 364, 371 and 373, or any one of SEQ ID NOs: 362 to 364, 371 and 373 , 90%, 95%, 98% or 99% identical sequences. In one embodiment, the B domain substitution protein sequence is at least 80%, 90%, 95%, 98 % or 99% identical sequences. In one embodiment, the B domain substitution protein sequence has the sequence of any one of SEQ ID NOs: 362-369. In one embodiment, the B domain substitution protein sequence has the sequence of any one of SEQ ID NOs: 362-366. In one embodiment, the B domain substitution protein sequence has the sequence of any one of SEQ ID NOs: 362 to 364. In one embodiment, the B domain substitution protein sequence has the sequence of any one of SEQ ID NOs: 362 to 363, 371 and 373. In one embodiment, the B domain substitution protein sequence has the sequence of any one of SEQ ID NOs: 371 or 373.

용어 “세이프 하버 유전자좌(safe harbor locus)”는 (예를 들어, 아폽토시스, 증식 등을 야기함으로써) 세포의 대사 또는 조절을 파괴하지 않고/거나 다른 세포(비-편집된 세포) 또는 (예를 들어, 성장 인자의 과발현을 부적당하게 야기하는 등에 의해) 전체로서 숙주 유기체에 위험 또는 유해 효과를 야기하지 않고, (예를 들어, 절단함으로써 또는 공여자 서열을 삽입함으로써) 변형될 수 있는 숙주 세포 게놈 내의 유전자좌를 나타낸다. 일부 실시형태에서, 세이프 하버 유전자좌는 숙주 세포에서 발현되는 유전자좌이다. 일부 실시형태에서, 세이프 하버 유전자좌는 알부민 유전자좌, 피브리노겐 유전자좌, AAVS1 유전자좌 또는 트랜스페린 유전자좌이다.The term “safe harbor locus” refers to a cell that does not disrupt the metabolism or regulation of a cell (e.g., by causing apoptosis, proliferation, etc.) and/or other cells (non-edited cells) or (e.g., loci in the host cell genome that can be modified (e.g., by truncating or inserting donor sequences) without causing a hazard or deleterious effect to the host organism as a whole (by inappropriately causing overexpression of growth factors, etc.) indicates. In some embodiments, the safe harbor locus is a locus expressed in a host cell. In some embodiments, the safe harbor locus is the albumin locus, the fibrinogen locus, the AAVS1 locus, or the transferrin locus.

핵산nucleic acid

게놈-표적화 핵산 또는 가이드 RNAGenome-targeting nucleic acid or guide RNA

본 개시내용은 회합된 폴리펩티드(예를 들어, DNA 엔도뉴클레아제와 같은 부위-지정 폴리펩티드)의 활성을 표적 핵산 내의 특정 표적 서열로 지향시킬 수 있는 게놈-표적화 핵산을 제공한다. 일부 실시형태에서, 게놈-표적화 핵산은 RNA이다. 게놈-표적화 RNA는 본원에 "가이드 RNA" 또는 "gRNA"라 지칭된다. 가이드 RNA는 적어도 관심 표적 핵산 서열에 혼성화할 수 있는 스페이서 서열, 및 CRISPR 반복부 서열을 갖는다. II형 시스템에서, gRNA는 또한 tracrRNA 서열로 지칭되는 제2 RNA를 갖는다. II형 gRNA에서, CRISPR 반복부 서열 및 tracrRNA 서열은 서로 혼성화하여 듀플렉스를 형성한다. V형 gRNA에서, crRNA는 듀플렉스를 형성한다. 두 시스템 모두에서, 듀플렉스는 부위-지정 폴리펩티드에 결합하여, gRNA 및 부위-지정 폴리펩티드가 복합체를 형성하게 한다. 게놈-표적화 핵산은 부위-지정 폴리펩티드와의 회합으로 인하여 복합체에 표적 특이성을 제공한다. 따라서, 게놈-표적화 핵산은 부위-지정 폴리펩티드의 활성을 지향시킨다.The present disclosure provides genome-targeting nucleic acids capable of directing the activity of an associated polypeptide (eg, a site-directed polypeptide such as a DNA endonuclease) to a specific target sequence within the target nucleic acid. In some embodiments, the genome-targeting nucleic acid is RNA. Genome-targeting RNA is referred to herein as "guide RNA" or "gRNA". The guide RNA has at least a spacer sequence capable of hybridizing to a target nucleic acid sequence of interest, and a CRISPR repeat sequence. In type II systems, the gRNA has a second RNA, also referred to as a tracrRNA sequence. In type II gRNAs, the CRISPR repeat sequence and the tracrRNA sequence hybridize to each other to form a duplex. In type V gRNAs, crRNAs form a duplex. In both systems, the duplex binds the site-directed polypeptide, causing the gRNA and the site-directed polypeptide to form a complex. The genome-targeting nucleic acid provides target specificity to the complex due to association with the site-directed polypeptide. Thus, a genome-targeting nucleic acid directs the activity of a site-directed polypeptide.

일부 실시형태에서, 게놈-표적화 핵산은 이중-분자 gRNA이다. 이중-분자 gRNA는 두 가닥의 RNA를 갖는다. 제1 가닥은 5'에서 3' 방향으로, 선택적인 스페이서 연장 서열, 스페이서 서열 및 최소 CRISPR 반복부 서열을 갖는다. 제2 가닥은 최소 tracrRNA 서열(최소 CRISPR 반복부 서열에 상보적임), 3' tracrRNA 서열 및 선택적인 tracrRNA 연장 서열을 갖는다. 일부 실시형태에서, 게놈-표적화 핵산은 단일-분자 gRNA이다. II형 시스템에서 단일-분자 gRNA는 5'에서 3' 방향으로, 선택적인 스페이서 연장 서열, 스페이서 서열, 최소 CRISPR 반복부 서열, 단일-분자 가이드 링커, 최소 tracrRNA 서열, 3' tracrRNA 서열 및 선택적인 tracrRNA 연장 서열을 갖는다. 선택적인 tracrRNA 연장부는 gRNA에 추가의 기능성(예를 들어, 안정성)을 부여하는 요소를 가질 수 있다. 단일-분자 가이드 링커는 최소 CRISPR 반복부 및 최소 tracrRNA 서열을 연결하여 헤어핀 구조를 형성한다. 선택적인 tracrRNA 연장부는 하나 이상의 헤어핀을 갖는다. V형 시스템에서 sgRNA는 5'에서 3' 방향으로, 최소 CRISPR 반복부 서열 및 스페이서 서열을 갖는다.In some embodiments, the genome-targeting nucleic acid is a double-molecule gRNA. Double-molecule gRNAs have two strands of RNA. The first strand has, in 5' to 3' direction, an optional spacer extension sequence, a spacer sequence and a minimal CRISPR repeat sequence. The second strand has a minimal tracrRNA sequence (complementary to a minimal CRISPR repeat sequence), a 3' tracrRNA sequence and an optional tracrRNA extension sequence. In some embodiments, the genome-targeting nucleic acid is a single-molecule gRNA. Single-molecule gRNAs in type II systems are in the 5' to 3' direction, an optional spacer extension sequence, a spacer sequence, a minimal CRISPR repeat sequence, a single-molecule guide linker, a minimal tracrRNA sequence, a 3' tracrRNA sequence and an optional tracrRNA has an extended sequence. The optional tracrRNA extension may have elements that confer additional functionality (eg, stability) to the gRNA. A single-molecule guide linker joins a minimal CRISPR repeat and a minimal tracrRNA sequence to form a hairpin structure. The optional tracrRNA extension has one or more hairpins. In the type V system, the sgRNA has, in the 5' to 3' direction, a minimal CRISPR repeat sequence and a spacer sequence.

예시에 의해, CRISPR/Cas/Cpf1 시스템에서 사용되는 gRNA, 또는 다른 더 작은 RNA는 하기에 예시되고 해당 분야에 기술된 바와 같이, 화학적 수단에 의해 용이하게 합성될 수 있다. 화학적 합성 절차가 계속적으로 확장되지만, 절차, 예컨대 고성능 액체 크로마토그래피(HPLC, 이것은 겔, 예컨대 PAGE의 사용을 회피함)에 의한 이러한 RNA의 정제는 보다 난제가 되는 경향이 있는데, 그 이유는 폴리뉴클레오티드 길이가 백여개의 뉴클레오티드를 상당히 초과하게 증가하기 때문이다. 더 긴 길이의 RNA를 생성하기 위하여 사용되는 하나의 접근법은 함께 라이게이션되는 2개의 이상의 분자를 생성하는 것이다. 훨씬 더 긴 RNA, 예컨대 Cas9 또는 Cpf1 엔도뉴클레아제를 인코딩하는 것은 효소적으로 더욱 용이하게 생성된다. RNA 변형, 해당 분야에 기술된 바와 같은, 예를 들어, 안정성을 향상시키고/향상시키거나 선천적 면역 반응의 가능성 또는 정도를 감소시키고/감소시키거나 다른 속성을 향상시키는 변형이 RNA의 화학적 합성 및/또는 효소적 생성 동안 또는 그 후에 도입될 수 있다.By way of illustration, gRNAs, or other smaller RNAs, used in the CRISPR/Cas/Cpf1 system can be readily synthesized by chemical means, as exemplified below and described in the art. Although chemical synthesis procedures continue to expand, purification of such RNAs by procedures such as high performance liquid chromatography (HPLC, which avoids the use of gels such as PAGE) tends to be more challenging because polynucleotides This is because the length increases significantly over a hundred nucleotides. One approach used to generate longer length RNA is to create two or more molecules that are ligated together. Even longer RNAs, such as those encoding Cas9 or Cpf1 endonucleases, are more readily produced enzymatically. RNA modifications, as described in the art, for example, modifications that enhance stability and/or reduce the likelihood or extent of an innate immune response and/or enhance other properties are those of chemical synthesis and/or or during or after enzymatic production.

스페이서 연장 서열spacer extension sequence

게놈-표적화 핵산의 일부 실시형태에서, 스페이서 연장 서열은 활성을 변경시키고/변경시키거나 안정성을 제공하고/제공하거나 게놈-표적화 핵산의 변형을 위한 위치를 제공할 수 있다. 스페이서 연장 서열은 온- 또는 오프-표적 활성 또는 특이성을 변경시킬 수 있다. 일부 실시형태에서, 스페이서 연장 서열이 제공된다. 스페이서 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000 또는 7000개 이상의 뉴클레오티드의 길이를 가질 수 있다. 스페이서 연장 서열은 약 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000 또는 7000개 이상의 뉴클레오티드의 길이를 가질 수 있다. 스페이서 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000, 7000개 이하의 뉴클레오티드의 길이를 가질 수 있다. 일부 실시형태에서, 스페이서 연장 서열은 10개 미만의 뉴클레오티드 길이이다. 일부 실시형태에서, 스페이서 연장 서열은 10 내지 30개의 뉴클레오티드 길이이다. 일부 실시형태에서, 스페이서 연장 서열은 30 내지 70개의 뉴클레오티드 길이이다.In some embodiments of a genome-targeting nucleic acid, a spacer extension sequence may alter activity and/or provide stability and/or provide a site for modification of the genome-targeting nucleic acid. Spacer extension sequences may alter on- or off-target activity or specificity. In some embodiments, a spacer extension sequence is provided. The spacer extension sequence is 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000 or 7000 or more nucleotides in length. The spacer extension sequence is about 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240 , 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000 or 7000 or more nucleotides in length. The spacer extension sequence is 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400, 1000, 2000, 3000, 4000, 5000, 6000, 7000 or less nucleotides in length. In some embodiments, the spacer extension sequence is less than 10 nucleotides in length. In some embodiments, the spacer extension sequence is between 10 and 30 nucleotides in length. In some embodiments, the spacer extension sequence is between 30 and 70 nucleotides in length.

일부 실시형태에서, 스페이서 연장 서열은 또 다른 모이어티(예를 들어, 안정성 제어 서열, 엔도리보뉴클레아제 결합 서열, 리보자임)를 갖는다. 일부 실시형태에서, 모이어티는 핵산 표적화 핵산의 안정성을 감소시키거나 증가시킨다. 일부 실시형태에서, 모이어티는 전사 종결자 세그먼트(즉, 전사 종결 서열)이다. 일부 실시형태에서, 모이어티는 진핵 세포에서 기능한다. 일부 실시형태에서, 모이어티는 원핵 세포에서 기능한다. 일부 실시형태에서, 모이어티는 진핵 세포 및 원핵 세포 둘 모두에서 기능한다. 적합한 모이어티의 비제한적인 예는 5' 캡(예를 들어, 7-메틸구아닐레이트 캡(m7G)), 리보스위치 서열(예를 들어, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함), dsRNA 듀플렉스(즉, 헤어핀)를 형성하는 서열, RNA를 하위세포 위치(예를 들어, 핵, 미토콘드리아, 엽록체 등)에 표적화하는 서열, 트래킹(예를 들어, 형광 분자로의 직접적인 컨쥬게이션, 형광 검출을 용이하게 하는 모이어티로의 컨쥬게이션, 형광 검출을 허용하는 서열 등)을 제공하는 변형 또는 서열, 및/또는 단백질(예를 들어, 전사 활성자, 전사 억제자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 비롯한, DNA에서 작용하는 단백질)을 위한 결합 부위를 제공하는 변형 또는 서열을 포함한다.In some embodiments, the spacer extension sequence has another moiety (eg, a stability control sequence, an endoribonuclease binding sequence, a ribozyme). In some embodiments, the moiety reduces or increases the stability of the nucleic acid targeting nucleic acid. In some embodiments, the moiety is a transcription terminator segment (ie, a transcription termination sequence). In some embodiments, the moiety functions in a eukaryotic cell. In some embodiments, the moiety functions in a prokaryotic cell. In some embodiments, the moiety functions in both eukaryotic and prokaryotic cells. Non-limiting examples of suitable moieties include 5' caps (eg, 7-methylguanylate cap (m7G)), riboswitch sequences (eg, regulated stability and/or regulation by proteins and protein complexes). sequences that form dsRNA duplexes (i.e. hairpins), sequences that target RNA to subcellular locations (e.g., nuclear, mitochondrial, chloroplast, etc.), tracking (e.g., fluorescent molecules) Modifications or sequences that provide for direct conjugation to, conjugation to a moiety that facilitates fluorescence detection, sequences that allow fluorescence detection, etc.), and/or proteins (eg, transcriptional activators, transcriptional repressors). , DNA methyltransferases, DNA demethylases, histone acetyltransferases, histone deacetylases, and the like).

스페이서 서열spacer sequence

스페이서 서열은 관심 표적 핵산 내의 서열에 혼성화될 수 있다. 게놈-표적화 핵산의 스페이서는 혼성화(즉, 염기 쌍형성)를 통하여 서열-특이적인 방식으로 표적 핵산과 상호작용한다. 따라서, 스페이서의 뉴클레오티드 서열은 관심 표적 핵산의 서열에 따라 달라진다.The spacer sequence can hybridize to a sequence within the target nucleic acid of interest. The spacer of the genome-targeting nucleic acid interacts with the target nucleic acid in a sequence-specific manner through hybridization (ie, base pairing). Thus, the nucleotide sequence of the spacer depends on the sequence of the target nucleic acid of interest.

본원의 CRISPR/Cas 시스템에서, 스페이서 서열은 시스템에서 사용되는 Cas9 효소의 PAM의 5'에 위치된 표적 핵산에 혼성화되도록 설계된다. 스페이서는 표적 서열과 완벽하게 일치할 수 있거나, 불일치를 가질 수 있다. 각각의 Cas9 효소는 그것이 표적 DNA에서 인식하는 특정 PAM 서열을 갖는다. 예를 들어, 스트렙토코커스 피오게네스는 표적 핵산에서 서열 5'-NRG-3'(여기서 R은 A 또는 G 중 어느 하나를 가지고, N은 임의의 뉴클레오티드이고, N은 스페이서 서열에 의해 표적화된 표적 핵산 서열의 바로 3'임)을 가지는 PAM을 인식한다.In the CRISPR/Cas system herein, the spacer sequence is designed to hybridize to a target nucleic acid located 5' of the PAM of the Cas9 enzyme used in the system. The spacer may be perfectly identical to the target sequence, or may have mismatches. Each Cas9 enzyme has a specific PAM sequence that it recognizes in the target DNA. For example, Streptococcus pyogenes has the sequence 5'-NRG-3' in the target nucleic acid, wherein R has either A or G, N is any nucleotide, and N is the target targeted by the spacer sequence. It recognizes a PAM with a nucleic acid sequence immediately 3'.

일부 실시형태에서, 표적 핵산 서열은 20개의 뉴클레오티드를 가진다. 일부 실시형태에서, 표적 핵산은 20개 미만의 뉴클레오티드를 가진다. 일부 실시형태에서, 표적 핵산은 20개 초과의 뉴클레오티드를 가진다. 일부 실시형태에서, 표적 핵산은 적어도 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30개 이상의 뉴클레오티드를 가진다. 일부 실시형태에서, 표적 핵산은 최대 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30개 이상의 뉴클레오티드를 가진다. 일부 실시형태에서, 표적 핵산 서열은 PAM의 제1 뉴클레오티드의 바로 5'에 20개의 염기를 가진다. 예를 들어, 5'-NNNNNNNNNNNNNNNNNNNNNRG-3' (SEQ ID NO: 191)을 가지는 서열에서, 표적 핵산은 N에 상응하는 서열을 포함하고, 여기서 N은 임의의 뉴클레오티드이며, 밑줄 표시된 NRG 서열(R은 G 또는 A)은 스트렙토코커스 피오게네스 Cas9 PAM이다. 일부 실시형태에서, S.p. Cas9에 의해 서열로서 인식되는 본 개시의 조성물 및 방법에 사용되는 PAM 서열은 NGG이다.In some embodiments, the target nucleic acid sequence has 20 nucleotides. In some embodiments, the target nucleic acid has less than 20 nucleotides. In some embodiments, the target nucleic acid has more than 20 nucleotides. In some embodiments, the target nucleic acid has at least 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30 or more nucleotides. In some embodiments, the target nucleic acid has at most 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30 or more nucleotides. In some embodiments, the target nucleic acid sequence has 20 bases immediately 5' to the first nucleotide of the PAM. For example, in the sequence having 5'-NNNNNNNNNNNNNNNNNNNN NRG -3' (SEQ ID NO: 191), the target nucleic acid comprises a sequence corresponding to N, where N is any nucleotide, and the underlined NRG sequence (R is G or A) Streptococcus pyogenes Cas9 PAM. In some embodiments, the PAM sequence used in the compositions and methods of the present disclosure recognized as a sequence by Sp Cas9 is NGG.

일부 실시형태에서, 표적 핵산에 혼성화하는 스페이서 서열은 적어도 약 6개의 뉴클레오티드(nt)의 길이를 갖는다. 스페이서 서열은 적어도 약 6 nt, 약 10 nt, 약 15 nt, 약 18 nt, 약 19 nt, 약 20 nt, 약 25 nt, 약 30 nt, 약 35 nt 또는 약 40 nt, 약 6 nt 내지 약 80 nt, 약 6 nt 내지 약 50 nt, 약 6 nt 내지 약 45 nt, 약 6 nt 내지 약 40 nt, 약 6 nt 내지 약 35 nt, 약 6 nt 내지 약 30 nt, 약 6 nt 내지 약 25 nt, 약 6 nt 내지 약 20 nt, 약 6 nt 내지 약 19 nt, 약 10 nt 내지 약 50 nt, 약 10 nt 내지 약 45 nt, 약 10 nt 내지 약 40 nt, 약 10 nt 내지 약 35 nt, 약 10 nt 내지 약 30 nt, 약 10 nt 내지 약 25 nt, 약 10 nt 내지 약 20 nt, 약 10 nt 내지 약 19 nt, 약 19 nt 내지 약 25 nt, 약 19 nt 내지 약 30 nt, 약 19 nt 내지 약 35 nt, 약 19 nt 내지 약 40 nt, 약 19 nt 내지 약 45 nt, 약 19 nt 내지 약 50 nt, 약 19 nt 내지 약 60 nt, 약 20 nt 내지 약 25 nt, 약 20 nt 내지 약 30 nt, 약 20 nt 내지 약 35 nt, 약 20 nt 내지 약 40 nt, 약 20 nt 내지 약 45 nt, 약 20 nt 내지 약 50 nt, 또는 약 20 nt 내지 약 60 nt일 수 있다. 일부 실시형태에서, 스페이서 서열은 20개의 뉴클레오티드를 가진다. 일부 실시형태에서, 스페이서는 19개의 뉴클레오티드를 가진다. 일부 실시형태에서, 스페이서는 18개의 뉴클레오티드를 가진다. 일부 실시형태에서, 스페이서는 17개의 뉴클레오티드를 가진다. 일부 실시형태에서, 스페이서는 16개의 뉴클레오티드를 가진다. 일부 실시형태에서, 스페이서는 15개의 뉴클레오티드를 가진다.In some embodiments, the spacer sequence that hybridizes to the target nucleic acid is at least about 6 nucleotides (nt) in length. The spacer sequence may be at least about 6 nt, about 10 nt, about 15 nt, about 18 nt, about 19 nt, about 20 nt, about 25 nt, about 30 nt, about 35 nt or about 40 nt, about 6 nt to about 80 nt. nt, about 6 nt to about 50 nt, about 6 nt to about 45 nt, about 6 nt to about 40 nt, about 6 nt to about 35 nt, about 6 nt to about 30 nt, about 6 nt to about 25 nt, about 6 nt to about 20 nt, about 6 nt to about 19 nt, about 10 nt to about 50 nt, about 10 nt to about 45 nt, about 10 nt to about 40 nt, about 10 nt to about 35 nt, about 10 nt to about 30 nt, about 10 nt to about 25 nt, about 10 nt to about 20 nt, about 10 nt to about 19 nt, about 19 nt to about 25 nt, about 19 nt to about 30 nt, about 19 nt to about 35 nt, about 19 nt to about 40 nt, about 19 nt to about 45 nt, about 19 nt to about 50 nt, about 19 nt to about 60 nt, about 20 nt to about 25 nt, about 20 nt to about 30 nt, about 20 nt to about 35 nt, about 20 nt to about 40 nt, about 20 nt to about 45 nt, about 20 nt to about 50 nt, or about 20 nt to about 60 nt. In some embodiments, the spacer sequence has 20 nucleotides. In some embodiments, the spacer has 19 nucleotides. In some embodiments, the spacer has 18 nucleotides. In some embodiments, the spacer has 17 nucleotides. In some embodiments, the spacer has 16 nucleotides. In some embodiments, the spacer has 15 nucleotides.

일부 실시형태에서, 스페이서 서열과 표적 핵산 간의 상보성 백분율은 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 100%이다. 일부 실시형태에서, 스페이서 서열과 표적 핵산 간의 상보성 백분율은 최대 약 30%, 최대 약 40%, 최대 약 50%, 최대 약 60%, 최대 약 65%, 최대 약 70%, 최대 약 75%, 최대 약 80%, 최대 약 85%, 최대 약 90%, 최대 약 95%, 최대 약 97%, 최대 약 98%, 최대 약 99% 또는 100%이다. 일부 실시형태에서, 스페이서 서열과 표적 핵산 간의 상보성 백분율은 표적 핵산의 상보적인 가닥의 표적 서열의 가장 5'인 6개의 인접 뉴클레오티드에 걸쳐 100%이다. 일부 실시형태에서, 스페이서 서열과 표적 핵산 간의 상보성 백분율은 약 20개의 인접 뉴클레오티드에 걸쳐서 적어도 60%이다. 일부 실시형태에서, 스페이서 서열 및 표적 핵산의 길이는 1 내지 6개 뉴클레오티드가 상이할 수 있으며, 이는 벌지(bulge) 또는 벌지들로 생각될 수 있다.In some embodiments, the percent complementarity between the spacer sequence and the target nucleic acid is at least about 30%, at least about 40%, at least about 50%, at least about 60%, at least about 65%, at least about 70%, at least about 75%, at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 97%, at least about 98%, at least about 99% or 100%. In some embodiments, the percent complementarity between the spacer sequence and the target nucleic acid is at most about 30%, at most about 40%, at most about 50%, at most about 60%, at most about 65%, at most about 70%, at most about 75%, at most about 80%, up to about 85%, up to about 90%, up to about 95%, up to about 97%, up to about 98%, up to about 99% or 100%. In some embodiments, the percent complementarity between the spacer sequence and the target nucleic acid is 100% over the 6 contiguous nucleotides 5′ most 5′ of the target sequence of the complementary strand of the target nucleic acid. In some embodiments, the percent complementarity between the spacer sequence and the target nucleic acid is at least 60% over about 20 contiguous nucleotides. In some embodiments, the length of the spacer sequence and the target nucleic acid may differ by 1 to 6 nucleotides, which can be considered a bulge or bulges.

일부 실시형태에서, 스페이서 서열은 컴퓨터 프로그램을 사용하여 설계되거나 선택된다. 컴퓨터 프로그램은 변수, 예컨대 예측된 용융 온도, 2차 구조 형성, 예측된 어닐링 온도, 서열 동일성, 게놈 컨텍스트, 염색질 접근성, GC%, 게놈 발생(예를 들어, 동일하거나 유사하지만 불일치, 삽입 또는 결실의 결과로서 하나 이상의 스팟에서 달라지는 서열)의 빈도, 메틸화 상태, SNP의 존재 등을 사용할 수 있다.In some embodiments, the spacer sequence is designed or selected using a computer program. The computer program can determine variables such as predicted melting temperature, secondary structure formation, predicted annealing temperature, sequence identity, genomic context, chromatin accessibility, GC%, genomic occurrence (e.g., of identical or similar but mismatches, insertions or deletions). As a result, the frequency of sequences that vary in one or more spots), methylation status, presence of SNPs, etc. can be used.

최소 CRISPR 반복부 서열Minimum CRISPR repeat sequence

일부 실시형태에서, 최소 CRISPR 반복부 서열은 참조 CRISPR 반복부 서열(예를 들어, 스트렙토코커스 피오게네스로부터의 crRNA)과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 서열 동일성을 갖는 서열이다, 예를 들어, 문헌[J.J. Ferretti et al., Proc Natl Acad Sci USA (2001) 98(8):4658-63)를 참조].In some embodiments, the minimal CRISPR repeat sequence is at least about 30%, about 40%, about 50%, about 60%, about 65 %, about 70%, about 75%, about 80%, about 85%, about 90%, about 95% or 100% sequence identity, e.g., JJ Ferretti et al., Proc Natl Acad Sci USA (2001) 98 (8):4658-63).

일부 실시형태에서, 최소 CRISPR 반복부 서열은 세포 내의 최소 tracrRNA 서열에 혼성화할 수 있는 뉴클레오티드를 가진다. 최소 CRISPR 반복부 서열 및 최소 tracrRNA 서열은 듀플렉스를 형성한다. 함께, 최소 CRISPR 반복부 서열 및 최소 tracrRNA 서열은 부위-지정 폴리펩티드에 결합한다. 최소 CRISPR 반복부 서열의 적어도 일부는 최소 tracrRNA 서열에 혼성화된다. 일부 실시형태에서, 최소 CRISPR 반복부 서열의 적어도 일부는 최소 tracrRNA 서열과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 상보성을 가진다. 일부 실시형태에서, 최소 CRISPR 반복부 서열의 적어도 일부는 최소 tracrRNA 서열과 최대 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 상보성을 가진다.In some embodiments, the minimal CRISPR repeat sequence has nucleotides capable of hybridizing to the minimal tracrRNA sequence in the cell. The minimum CRISPR repeat sequence and the minimum tracrRNA sequence form a duplex. Together, the minimal CRISPR repeat sequence and the minimal tracrRNA sequence bind to the site-directed polypeptide. At least a portion of the minimal CRISPR repeat sequence is hybridized to the minimal tracrRNA sequence. In some embodiments, at least a portion of the minimum CRISPR repeat sequence is at least about 30%, about 40%, about 50%, about 60%, about 65%, about 70%, about 75%, about 80% from the minimum tracrRNA sequence. , about 85%, about 90%, about 95% or 100% complementarity. In some embodiments, at least a portion of the minimum CRISPR repeat sequence is at most about 30%, about 40%, about 50%, about 60%, about 65%, about 70%, about 75%, about 80% of the minimum tracrRNA sequence. , about 85%, about 90%, about 95% or 100% complementarity.

최소 CRISPR 반복부 서열은 약 7개의 뉴클레오티드 내지 약 100개의 뉴클레오티드 길이를 가질 수 있다. 예를 들어, 최소 CRISPR 반복부 서열의 길이는 약 7 nt 내지 약 50 nt, 약 7 nt 내지 약 40 nt, 약 7 nt 내지 약 30 nt, 약 7 nt 내지 약 25 nt, 약 7 nt 내지 약 20 nt, 약 7 nt 내지 약 15 nt, 약 8 nt 내지 약 40 nt, 약 8 nt 내지 약 30 nt, 약 8 nt 내지 약 25 nt, 약 8 nt 내지 약 20 nt, 약 8 nt 내지 약 15 nt, 약 15 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt, 또는 약 15 nt 내지 약 25 nt이다. 일부 실시형태에서, 최소 CRISPR 반복부 서열은 대략 9개 뉴클레오티드 길이이다. 일부 실시형태에서, 최소 CRISPR 반복부 서열은 대략 12개 뉴클레오티드 길이이다.The minimum CRISPR repeat sequence may be from about 7 nucleotides to about 100 nucleotides in length. For example, the minimum CRISPR repeat sequence can have a length of about 7 nt to about 50 nt, about 7 nt to about 40 nt, about 7 nt to about 30 nt, about 7 nt to about 25 nt, about 7 nt to about 20 nt. nt, about 7 nt to about 15 nt, about 8 nt to about 40 nt, about 8 nt to about 30 nt, about 8 nt to about 25 nt, about 8 nt to about 20 nt, about 8 nt to about 15 nt, about 15 nt to about 100 nt, about 15 nt to about 80 nt, about 15 nt to about 50 nt, about 15 nt to about 40 nt, about 15 nt to about 30 nt, or about 15 nt to about 25 nt. In some embodiments, the minimum CRISPR repeat sequence is approximately 9 nucleotides in length. In some embodiments, the minimum CRISPR repeat sequence is approximately 12 nucleotides in length.

일부 실시형태에서, 최소 CRISPR 반복부 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 최소 CRISPR 반복부 서열(예를 들어, 스트렙토코커스 피오게네스로부터의 야생형 crRNA(예를 들어, 상기 문헌[J.J. Ferretti et al.]을 참조))과 적어도 약 60% 동일하다. 예를 들어, 최소 CRISPR 반복부 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 최소 CRISPR 반복부 서열과 적어도 약 65% 동일하거나, 적어도 약 70% 동일하거나, 적어도 약 75% 동일하거나, 적어도 약 80% 동일하거나, 적어도 약 85% 동일하거나, 적어도 약 90% 동일하거나, 적어도 약 95% 동일하거나, 적어도 약 98% 동일하거나, 적어도 약 99% 동일하거나 또는 100% 동일하다.In some embodiments, the minimal CRISPR repeat sequence spans a stretch of at least 6, 7, or 8 contiguous nucleotides (eg, a wild-type crRNA from Streptococcus pyogenes (eg, the above at least about 60% identical to JJ Ferretti et al.)). For example, the minimal CRISPR repeat sequence is at least about 65% identical, at least about 70% identical, at least about 75% identical, or , at least about 80% identical, at least about 85% identical, at least about 90% identical, at least about 95% identical, at least about 98% identical, at least about 99% identical, or 100% identical.

최소 tracrRNA 서열Minimum tracrRNA sequence

일부 실시형태에서, 최소 tracrRNA 서열은 참조 tracrRNA 서열(예를 들어, 스트렙토코커스 피오게네스로부터의 야생형 tracrRNA(예를 들어, 상기 문헌[J.J. Ferretti et al.]을 참조))과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 서열 동일성을 갖는 서열이다.In some embodiments, the minimal tracrRNA sequence is at least about 30% from a reference tracrRNA sequence (e.g., wild-type tracrRNA from Streptococcus pyogenes (see, e.g., JJ Ferretti et al., supra)), a sequence having about 40%, about 50%, about 60%, about 65%, about 70%, about 75%, about 80%, about 85%, about 90%, about 95% or 100% sequence identity.

일부 실시형태에서, 최소 tracrRNA 서열은 세포 내의 최소 CRISPR 서열에 혼성화하는 뉴클레오티드를 가진다. 최소 tracrRNA 서열 및 최소 CRISPR 반복부 서열은 듀플렉스를 형성한다. 함께, 최소 tracrRNA 서열 및 최소 CRISPR 반복부는 부위-지정 폴리펩티드에 결합한다. 최소 tracrRNA 서열의 적어도 일부는 최소 CRISPR 반복부 서열에 혼성화할 수 있다. 일부 실시형태에서, 최소 tracrRNA 서열은 최소 CRISPR 반복부 서열과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 상보적이다.In some embodiments, the minimal tracrRNA sequence has nucleotides that hybridize to the minimal CRISPR sequence in the cell. The minimum tracrRNA sequence and the minimum CRISPR repeat sequence form a duplex. Together, minimal tracrRNA sequence and minimal CRISPR repeats bind site-directed polypeptides. At least a portion of the minimal tracrRNA sequence is capable of hybridizing to a minimal CRISPR repeat sequence. In some embodiments, the minimal tracrRNA sequence comprises at least about 30%, about 40%, about 50%, about 60%, about 65%, about 70%, about 75%, about 80%, about 85% of the minimum CRISPR repeat sequence. %, about 90%, about 95% or 100% complementary.

최소 tracrRNA 서열은 약 7개 뉴클레오티드 내지 약 100개 뉴클레오티드 길이를 가질 수 있다. 예를 들어, 최소 tracrRNA 서열의 길이는 약 7 nt 내지 약 50 nt, 약 7 nt 내지 약 40 nt, 약 7 nt 내지 약 30 nt, 약 7 nt 내지 약 25 nt, 약 7 nt 내지 약 20 nt, 약 7 nt 내지 약 15 nt, 약 8 nt 내지 약 40 nt, 약 8 nt 내지 약 30 nt, 약 8 nt 내지 약 25 nt, 약 8 nt 내지 약 20 nt, 약 8 nt 내지 약 15 nt, 약 15 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt, 또는 약 15 nt 내지 약 25 nt일 수 있다. 일부 실시형태에서, 최소 tracrRNA 서열은 대략 9개 뉴클레오티드 길이이다. 일부 실시형태에서, 최소 tracrRNA 서열은 대략 12개 뉴클레오티드이다. 일부 실시형태에서, 최소 tracrRNA는 문헌[M. Jinek et al., Science (2012) 337(6096):816-21]에 기술된 tracrRNA 뉴클레오티드 23 내지 48로 이루어진다.A minimal tracrRNA sequence may be from about 7 nucleotides to about 100 nucleotides in length. For example, the minimum length of the tracrRNA sequence is between about 7 nt and about 50 nt, between about 7 nt and about 40 nt, between about 7 nt and about 30 nt, between about 7 nt and about 25 nt, between about 7 nt and about 20 nt, about 7 nt to about 15 nt, about 8 nt to about 40 nt, about 8 nt to about 30 nt, about 8 nt to about 25 nt, about 8 nt to about 20 nt, about 8 nt to about 15 nt, about 15 nt to about 100 nt, about 15 nt to about 80 nt, about 15 nt to about 50 nt, about 15 nt to about 40 nt, about 15 nt to about 30 nt, or about 15 nt to about 25 nt. In some embodiments, the minimum tracrRNA sequence is approximately 9 nucleotides in length. In some embodiments, the minimum tracrRNA sequence is approximately 12 nucleotides. In some embodiments, the minimal tracrRNA is described in M. Jinek et al., Science (2012) 337 (6096):816-21].

일부 실시형태에서, 최소 tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 최소 tracrRNA(예를 들어, 스트렙토코커스 피오게네스로부터의 야생형 tracrRNA(예를 들어, 상기 문헌[J.J. Ferretti et al.]을 참조)) 서열과 적어도 약 60% 동일하다. 예를 들어, 최소 tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 최소 tracrRNA 서열과 적어도 약 65% 동일하거나, 약 70% 동일하거나, 약 75% 동일하거나, 약 80% 동일하거나, 약 85% 동일하거나, 약 90% 동일하거나, 약 95% 동일하거나, 약 98% 동일하거나, 약 99% 동일하거나 또는 100% 동일하다.In some embodiments, the minimal tracrRNA sequence spans a stretch of at least 6, 7, or 8 contiguous nucleotides (eg, a wild-type tracrRNA from Streptococcus pyogenes (eg, JJ Ferretti et al., supra). al.])) at least about 60% identical to the sequence. For example, the minimal tracrRNA sequence is at least about 65% identical, about 70% identical, about 75% identical, or about 80% identical to the reference minimal tracrRNA sequence over a stretch of at least 6, 7, or 8 contiguous nucleotides. , about 85% identical, about 90% identical, about 95% identical, about 98% identical, about 99% identical, or 100% identical.

일부 실시형태에서, 최소 CRISPR RNA와 최소 tracrRNA 사이의 듀플렉스는 이중 헬릭스를 가진다. 일부 실시형태에서, 최소 CRISPR RNA와 최소 tracrRNA 사이의 듀플렉스는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이상의 뉴클레오티드를 가진다. 일부 실시형태에서, 최소 CRISPR RNA와 최소 tracrRNA 사이의 듀플렉스는 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 뉴클레오티드를 가진다.In some embodiments, the duplex between the minimum CRISPR RNA and the minimum tracrRNA has a double helix. In some embodiments, the duplex between the minimum CRISPR RNA and the minimum tracrRNA has at least about 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 or more nucleotides. In some embodiments, the duplex between the minimum CRISPR RNA and the minimum tracrRNA has at most about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more nucleotides.

일부 실시형태에서, 듀플렉스는 불일치를 가진다(즉, 듀플렉스의 두 가닥은 100% 상보적이지는 않다). 일부 실시형태에서, 듀플렉스는 적어도 약 1, 2, 3, 4 또는 5개의 불일치를 가진다. 일부 실시형태에서, 듀플렉스는 최대 약 1, 2, 3, 4, 또는 5개의 불일치를 가진다. 일부 실시형태에서, 듀플렉스는 2개 이하의 불일치를 가진다.In some embodiments, the duplex has a mismatch (ie, the two strands of the duplex are not 100% complementary). In some embodiments, the duplex has at least about 1, 2, 3, 4, or 5 mismatches. In some embodiments, the duplex has at most about 1, 2, 3, 4, or 5 mismatches. In some embodiments, the duplex has no more than 2 mismatches.

벌지bulge

일부 실시형태에서, 최소 CRISPR RNA와 최소 tracrRNA 간의 듀플렉스 내에 "벌지"가 존재한다. 벌지는 듀플렉스 내의 뉴클레오티드의 쌍을 형성하지 않은 영역이다. 일부 실시형태에서, 벌지는 부위-지정 폴리펩티드로의 듀플렉스의 결합에 기여한다. 벌지는 듀플렉스의 한 측에 쌍을 형성하지 않은 5'-XXXY-3'를 가지며, 여기서 X는 임의의 퓨린이고, Y는 반대 가닥 상의 뉴클레오티드와 워블 쌍(wobble pair)을 형성할 수 있는 뉴클레오티드, 및 듀플렉스의 다른 측 상에서 쌍을 형성하지 않은 뉴클레오티드 영역을 가진다. 듀플렉스의 양 측 상의 쌍을 형성하지 않은 뉴클레오티드의 수는 상이할 수 있다.In some embodiments, there is a “bulge” within the duplex between the minimal CRISPR RNA and the minimal tracrRNA. A bulge is an unpaired region of nucleotides within a duplex. In some embodiments, the bulge contributes to binding of the duplex to the site-directed polypeptide. The bulge has unpaired 5'-XXXY-3' on one side of the duplex, where X is any purine, Y is a nucleotide capable of forming a wobble pair with a nucleotide on the opposite strand, and unpaired nucleotide regions on the other side of the duplex. The number of unpaired nucleotides on either side of the duplex may be different.

일 실시예에서, 벌지는 벌지의 최소 CRISPR 반복부 가닥 상에 쌍을 형성하지 않은 퓨린(예를 들어, 아데닌)을 가진다. 일부 실시형태에서, 벌지는 벌지의 최소 tracrRNA 서열 가닥의 쌍을 형성하지 않은 5'-AAGY-3'을 가지며, 여기서 Y는 최소 CRISPR 반복부 가닥 상의 뉴클레오티드와 워블 쌍을 형성할 수 있는 뉴클레오티드를 가진다.In one embodiment, the bulge has an unpaired purine (eg, adenine) on the minimum CRISPR repeat strand of the bulge. In some embodiments, the bulge has at least 5'-AAGY-3' unpaired tracrRNA sequence strands of the bulge, where Y has at least nucleotides capable of wobbling pairing with nucleotides on the CRISPR repeat strand .

일부 실시형태에서, 듀플렉스의 최소 CRISPR 반복부 측 상의 벌지는 적어도 1, 2, 3, 4 또는 5개 이상의 쌍을 형성하지 않은 뉴클레오티드를 가진다. 일부 실시형태에서, 듀플렉스의 최소 CRISPR 반복부 측 상의 벌지는 최대 1, 2, 3, 4 또는 5개 이상의 쌍을 형성하지 않은 뉴클레오티드를 가진다. 일부 실시형태에서, 듀플렉스의 최소 CRISPR 반복부 측 상의 벌지는 1개의 쌍을 형성하지 않은 뉴클레오티드를 가진다.In some embodiments, the bulge on the minimal CRISPR repeat side of the duplex has at least 1, 2, 3, 4, or 5 or more unpaired nucleotides. In some embodiments, the bulge on the side of the smallest CRISPR repeat of the duplex has at most 1, 2, 3, 4, or 5 or more unpaired nucleotides. In some embodiments, the bulge on the minimal CRISPR repeat side of the duplex has 1 unpaired nucleotide.

일부 실시형태에서, 듀플렉스의 최소 tracrRNA 서열 측 상의 벌지는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 쌍을 형성하지 않은 뉴클레오티드를 가진다. 일부 실시형태에서, 듀플렉스의 최소 tracrRNA 서열 측 상의 벌지는 최대 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 쌍을 형성하지 않은 뉴클레오티드를 가진다. 일부 실시형태에서, 듀플렉스의 제2 측(예를 들어, 듀플렉스의 최소 tracrRNA 서열 측) 상의 벌지는 4개의 쌍을 형성하지 않은 뉴클레오티드를 가진다.In some embodiments, the bulge on the side of the minimum tracrRNA sequence of the duplex has at least 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 or more unpaired nucleotides. In some embodiments, the bulge on the side of the minimum tracrRNA sequence of the duplex has at most 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 or more unpaired nucleotides. In some embodiments, the bulge on the second side of the duplex (eg, on the side of the smallest tracrRNA sequence of the duplex) has 4 unpaired nucleotides.

일부 실시형태에서, 벌지는 적어도 하나의 워블 쌍형성을 가진다. 일부 실시형태에서, 벌지는 최대 하나의 워블 쌍형성을 가진다. 일부 실시형태에서, 벌지는 적어도 하나의 퓨린 뉴클레오티드를 가진다. 일부 실시형태에서, 벌지는 적어도 3개의 퓨린 뉴클레오티드를 가진다. 일부 실시형태에서, 벌지 서열은 적어도 5개의 퓨린 뉴클레오티드를 가진다. 일부 실시형태에서, 벌지 서열은 적어도 하나의 구아닌 뉴클레오티드를 가진다. 일부 실시형태에서, 벌지 서열은 적어도 하나의 아데닌 뉴클레오티드를 가진다.In some embodiments, the bulge has at least one wobble pairing. In some embodiments, the bulge has at most one wobble pairing. In some embodiments, the bulge has at least one purine nucleotide. In some embodiments, the bulge has at least 3 purine nucleotides. In some embodiments, the bulge sequence has at least 5 purine nucleotides. In some embodiments, the bulge sequence has at least one guanine nucleotide. In some embodiments, the bulge sequence has at least one adenine nucleotide.

헤어핀hairclip

일부 실시형태에서, 하나 이상의 헤어핀은 3' tracrRNA 서열에서 최소 tracrRNA에 대하여 3'에 위치한다.In some embodiments, the one or more hairpins are located 3' to the minimum tracrRNA in the 3' tracrRNA sequence.

일부 실시형태에서, 헤어핀은 최소 CRISPR 반복부 및 최소 tracrRNA 서열 듀플렉스에서 마지막 쌍을 형성한 뉴클레오티드로부터 3'인 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개 이상의 뉴클레오티드에서 시작한다. 일부 실시형태에서, 헤어핀은 최소 CRISPR 반복부 및 최소 tracrRNA 서열 듀플렉스에서 마지막 쌍을 형성한 뉴클레오티드의 3'인 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 뉴클레오티드에서 출발할 수 있다.In some embodiments, the hairpin is at least about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 that is 3' from the last paired nucleotide in the minimum CRISPR repeat and the minimum tracrRNA sequence duplex. or 20 or more nucleotides. In some embodiments, the hairpin is at most about 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 or more that are at most about 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 or more 3' of the last paired nucleotide in the minimum CRISPR repeat and the minimum tracrRNA sequence duplex. It can start from nucleotides.

일부 실시형태에서, 헤어핀은 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개 이상의 연속 뉴클레오티드를 가진다. 일부 실시형태에서, 헤어핀은 최대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15개 이상의 연속 뉴클레오티드를 가진다.In some embodiments, the hairpin has at least about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, or 20 or more consecutive nucleotides. In some embodiments, the hairpin has at most about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 or more consecutive nucleotides.

일부 실시형태에서, 헤어핀은 CC 디뉴클레오티드(즉, 2개의 연속 시토신 뉴클레오티드)를 가진다.In some embodiments, the hairpin has CC dinucleotides (ie, two consecutive cytosine nucleotides).

일부 실시형태에서, 헤어핀은 듀플렉스화된 뉴클레오티드(즉, 함께 혼성화된, 헤어핀의 뉴클레오티드)를 가진다. 예를 들어, 헤어핀은 3' tracrRNA 서열의 헤어핀 듀플렉스의 GG 디뉴클레오티드에 혼성화된 CC 디뉴클레오티드를 가진다.In some embodiments, the hairpin has duplexed nucleotides (ie, the nucleotides of the hairpin that are hybridized together). For example, a hairpin has a CC dinucleotide hybridized to the GG dinucleotide of the hairpin duplex of the 3' tracrRNA sequence.

헤어핀 중 하나 이상은 부위-지정 폴리펩티드의 가이드 RNA-상호작용 영역과 상호작용할 수 있다. 일부 실시형태에서, 2개 이상의 헤어핀이 존재하고, 일부 실시형태에서 3개 이상의 헤어핀이 존재한다.One or more of the hairpins may interact with a guide RNA-interacting region of the site-directed polypeptide. In some embodiments, there are two or more hairpins, and in some embodiments there are three or more hairpins.

3' tracrRNA 서열3' tracrRNA sequence

일부 실시형태에서, 3' tracrRNA 서열은 참조 tracrRNA 서열(예를 들어, 스트렙토코커스 피오게네스로부터의 tracrRNA)과 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100% 서열 동일성을 갖는 서열을 가진다.In some embodiments, the 3' tracrRNA sequence is at least about 30%, about 40%, about 50%, about 60%, about 65%, about 70%, about 75%, about 80%, about 85%, about 90%, about 95% or 100% sequence identity.

일부 실시형태에서, 3' tracrRNA 서열은 약 6개의 뉴클레오티드 내지 약 100개의 뉴클레오티드 길이를 가진다. 예를 들어, 3' tracrRNA 서열은 약 6 nt 내지 약 50 nt, 약 6 nt 내지 약 40 nt, 약 6 nt 내지 약 30 nt, 약 6 nt 내지 약 25 nt, 약 6 nt 내지 약 20 nt, 약 6 nt 내지 약 15 nt, 약 8 nt 내지 약 40 nt, 약 8 nt 내지 약 30 nt, 약 8 nt 내지 약 25 nt, 약 8 nt 내지 약 20 nt, 약 8 nt 내지 약 15 nt, 약 15 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt, 또는 약 15 nt 내지 약 25 nt 길이를 가질 수 있다. 일부 실시형태에서, 3' tracrRNA 서열은 대략 14개의 뉴클레오티드 길이를 갖는다.In some embodiments, the 3' tracrRNA sequence is between about 6 nucleotides and about 100 nucleotides in length. For example, the 3' tracrRNA sequence may be from about 6 nt to about 50 nt, from about 6 nt to about 40 nt, from about 6 nt to about 30 nt, from about 6 nt to about 25 nt, from about 6 nt to about 20 nt, about 6 nt to about 15 nt, about 8 nt to about 40 nt, about 8 nt to about 30 nt, about 8 nt to about 25 nt, about 8 nt to about 20 nt, about 8 nt to about 15 nt, about 15 nt to about 100 nt, about 15 nt to about 80 nt, about 15 nt to about 50 nt, about 15 nt to about 40 nt, about 15 nt to about 30 nt, or about 15 nt to about 25 nt in length . In some embodiments, the 3' tracrRNA sequence is approximately 14 nucleotides in length.

일부 실시형태에서, 3' tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 3' tracrRNA 서열과 적어도 약 60% 동일하다. 예를 들어, 3' tracrRNA 서열은 적어도 6, 7 또는 8개의 인접 뉴클레오티드의 스트레치에 걸쳐서 참조 3' tracrRNA 서열과 적어도 약 60% 동일하거나, 약 65% 동일하거나, 약 70% 동일하거나, 약 75% 동일하거나, 약 80% 동일하거나, 약 85% 동일하거나, 약 90% 동일하거나, 약 95% 동일하거나, 약 98% 동일하거나, 약 99% 동일하거나 또는 100% 동일하다.In some embodiments, the 3' tracrRNA sequence is at least about 60% identical to the reference 3' tracrRNA sequence over a stretch of at least 6, 7, or 8 contiguous nucleotides. For example, a 3' tracrRNA sequence is at least about 60% identical, about 65% identical, about 70% identical, or about 75% identical to a reference 3' tracrRNA sequence over a stretch of at least 6, 7, or 8 contiguous nucleotides. identical, about 80% identical, about 85% identical, about 90% identical, about 95% identical, about 98% identical, about 99% identical, or 100% identical.

일부 실시형태에서, 3' tracrRNA 서열은 하나를 초과하는 듀플렉스화된 영역을 가진다. 일부 실시형태에서, 3' tracrRNA 서열은 2개의 듀플렉스화된 영역을 가진다.In some embodiments, the 3' tracrRNA sequence has more than one duplexed region. In some embodiments, the 3' tracrRNA sequence has two duplexed regions.

일부 실시형태에서, 3' tracrRNA 서열은 스템 루프 구조를 가진다. 일부 실시형태에서, 3' tracrRNA에서의 스템 루프 구조는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20개 이상의 뉴클레오티드를 가진다. 일부 실시형태에서, 3' tracrRNA에서의 스템 루프 구조는 최대 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 뉴클레오티드를 가진다. 일부 실시형태에서, 스템 루프 구조는 기능적 모이어티를 가진다. 예를 들어, 스템 루프 구조는 압타머, 리보자임, 단백질-상호작용 헤어핀, CRISPR 어레이, 인트론 또는 엑손을 가질 수 있다. 일부 실시형태에서, 스템 루프 구조는 적어도 약 1, 2, 3, 4 또는 5개 이상의 기능적 모이어티를 가진다. 일부 실시형태에서, 스템 루프 구조는 최대 약 1, 2, 3, 4 또는 5개 이상의 기능적 모이어티를 가진다.In some embodiments, the 3' tracrRNA sequence has a stem loop structure. In some embodiments, the stem loop structure in the 3' tracrRNA has at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, or 20 or more nucleotides. In some embodiments, the stem loop structure in the 3' tracrRNA has at most 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more nucleotides. In some embodiments, the stem loop structure has a functional moiety. For example, a stem loop structure can have an aptamer, a ribozyme, a protein-interacting hairpin, a CRISPR array, an intron or an exon. In some embodiments, the stem loop structure has at least about 1, 2, 3, 4, or 5 or more functional moieties. In some embodiments, the stem loop structure has at most about 1, 2, 3, 4, 5 or more functional moieties.

일부 실시형태에서, 3' tracrRNA 서열에서의 헤어핀은 P-도메인을 가진다. 일부 실시형태에서, P-도메인은 헤어핀에서의 이중-가닥 영역을 가진다.In some embodiments, the hairpin in the 3' tracrRNA sequence has a P-domain. In some embodiments, the P-domain has a double-stranded region in the hairpin.

tracrRNA 연장 서열tracrRNA extension sequence

일부 실시형태에서, tracrRNA 연장 서열은 tracrRNA가 단일-분자 가이드의 맥락이든 또는 이중-분자 가이드의 맥락이든 간에 제공될 수 있다. 일부 실시형태에서, tracrRNA 연장 서열은 약 1개 뉴클레오티드 내지 약 400개 뉴클레오티드 길이를 갖는다. 일부 실시형태에서, tracrRNA 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380 또는 400개 초과의 뉴클레오티드 길이를 갖는다. 일부 실시형태에서, tracrRNA 연장 서열은 약 20 내지 약 5000개 이상의 뉴클레오티드 길이를 갖는다. 일부 실시형태에서, tracrRNA 연장 서열은 1000개 초과의 뉴클레오티드 길이를 갖는다. 일부 실시형태에서, tracrRNA 연장 서열은 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 220, 240, 260, 280, 300, 320, 340, 360, 380, 400개 미만 또는 그 이상의 뉴클레오티드 길이를 갖는다. 일부 실시형태에서, tracrRNA 연장 서열은 1000개 미만의 뉴클레오티드 길이를 가질 수 있다. 일부 실시형태에서, tracrRNA 연장 서열은 10개 미만의 뉴클레오티드 길이를 가진다. 일부 실시형태에서, tracrRNA 연장 서열은 10 내지 30개의 뉴클레오티드 길이이다. 일부 실시형태에서, tracrRNA 연장 서열은 30 내지 70개의 뉴클레오티드 길이이다.In some embodiments, the tracrRNA extension sequence may be provided whether the tracrRNA is in the context of a single-molecule guide or a double-molecule guide. In some embodiments, the tracrRNA extension sequence is between about 1 nucleotide and about 400 nucleotides in length. In some embodiments, the tracrRNA extension sequence is 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200 , 220, 240, 260, 280, 300, 320, 340, 360, 380 or greater than 400 nucleotides in length. In some embodiments, the tracrRNA extension sequence is about 20 to about 5000 or more nucleotides in length. In some embodiments, the tracrRNA extension sequence is greater than 1000 nucleotides in length. In some embodiments, the tracrRNA extension sequence is 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200 , 220, 240, 260, 280, 300, 320, 340, 360, 380, 400 or more nucleotides in length. In some embodiments, the tracrRNA extension sequence may be less than 1000 nucleotides in length. In some embodiments, the tracrRNA extension sequence is less than 10 nucleotides in length. In some embodiments, the tracrRNA extension sequence is between 10 and 30 nucleotides in length. In some embodiments, the tracrRNA extension sequence is between 30 and 70 nucleotides in length.

일부 실시형태에서, tracrRNA 연장 서열은 기능적 모이어티(예를 들어, 안정성 제어 서열, 리보자임, 엔도리보뉴클레아제 결합 서열)를 가진다. 일부 실시형태에서, 기능적 모이어티는 전사 종결자 세그먼트를 가진다. 일부 실시형태에서, 기능적 모이어티는 약 10 nt 내지 약 100개 뉴클레오티드, 약 10 nt 내지 약 20 nt, 약 20 nt 내지 약 30 nt, 약 30 nt 내지 약 40 nt, 약 40 nt 내지 약 50 nt, 약 50 nt 내지 약 60 nt, 약 60 nt 내지 약 70 nt, 약 70 nt 내지 약 80 nt, 약 80 nt 내지 약 90 nt, 또는 약 90 nt 내지 약 100 nt, 약 15 nt 내지 약 80 nt, 약 15 nt 내지 약 50 nt, 약 15 nt 내지 약 40 nt, 약 15 nt 내지 약 30 nt, 또는 약 15 nt 내지 약 25 nt의 총 길이를 가진다. 일부 실시형태에서, 기능적 모이어티는 진핵 세포에서 기능한다. 일부 실시형태에서, 기능적 모이어티는 원핵물 세포에서 기능한다. 일부 실시형태에서, 기능적 모이어티는 진핵 및 원핵 세포 둘 모두에서 기능한다.In some embodiments, the tracrRNA extension sequence has a functional moiety (eg, a stability control sequence, a ribozyme, an endoribonuclease binding sequence). In some embodiments, the functional moiety has a transcription terminator segment. In some embodiments, the functional moiety is from about 10 nt to about 100 nucleotides, from about 10 nt to about 20 nt, from about 20 nt to about 30 nt, from about 30 nt to about 40 nt, from about 40 nt to about 50 nt, about 50 nt to about 60 nt, about 60 nt to about 70 nt, about 70 nt to about 80 nt, about 80 nt to about 90 nt, or about 90 nt to about 100 nt, about 15 nt to about 80 nt, about 15 nt to about 50 nt, about 15 nt to about 40 nt, about 15 nt to about 30 nt, or about 15 nt to about 25 nt. In some embodiments, the functional moiety functions in a eukaryotic cell. In some embodiments, the functional moiety functions in a prokaryotic cell. In some embodiments, the functional moiety functions in both eukaryotic and prokaryotic cells.

적합한 tracrRNA 연장 기능적 모이어티의 비제한적인 예는 3' 폴리-아데닐화된 테일, 리보스위치 서열(예를 들어, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함), dsRNA 듀플렉스를 형성하는 서열, RNA를 하위세포 위치(예를 들어, 핵, 미토콘드리아, 엽록체 등)에 표적화하는 서열, 트래킹(예를 들어, 형광 분자로의 직접적인 컨쥬게이션, 형광 검출을 용이하게 하는 모이어티로의 컨쥬게이션, 형광 검출을 허용하는 서열 등)을 제공하는 변형 또는 서열, 및/또는 단백질(예를 들어, 전사 활성자, 전사 억제자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 비롯한, DNA에서 작용하는 단백질)을 위한 결합 부위를 제공하는 변형 또는 서열을 포함한다. 일부 실시형태에서, tracrRNA 연장 서열은 프라이머 결합 부위 또는 분자 인덱스(예를 들어, 바코드 서열)를 가진다. 일부 실시형태에서, tracrRNA 연장 서열은 하나 이상의 친화성 태그를 가진다.Non-limiting examples of suitable tracrRNA extension functional moieties include a 3' poly-adenylated tail, a riboswitch sequence (e.g., to allow for regulated stability and/or regulated accessibility by proteins and protein complexes), Sequences that form dsRNA duplexes, sequences that target RNA to subcellular locations (e.g., nucleus, mitochondria, chloroplasts, etc.), tracking (e.g., direct conjugation to fluorescent molecules, moieties that facilitate fluorescence detection) Modifications or sequences that provide for conjugation of tyrosine, sequences allowing detection of fluorescence, etc.), and/or proteins (eg, transcriptional activators, transcriptional repressors, DNA methyltransferases, DNA demethylases, histone acetyls). modifications or sequences that provide binding sites for proteins that act on DNA, including transferases, histone deacetylases, and the like. In some embodiments, the tracrRNA extension sequence has a primer binding site or molecular index (eg, a barcode sequence). In some embodiments, the tracrRNA extension sequence has one or more affinity tags.

단일-분자 가이드 링커 서열single-molecule guide linker sequence

일부 실시형태에서, 단일-분자 가이드 핵산의 링커 서열은 약 3개의 뉴클레오티드 내지 약 100개의 뉴클레오티드 길이를 가진다. 예시적인 링커는 약 3개 nt 내지 약 90 nt, 약 3 nt 내지 약 80 nt, 약 3 nt 내지 약 70 nt, 약 3 nt 내지 약 60 nt, 약 3 nt 내지 약 50 nt, 약 3 nt 내지 약 40 nt, 약 3 nt 내지 약 30 nt, 약 3 nt 내지 약 20 nt, 약 3 nt 내지 약 10 nt의 길이를 가진다. 예를 들어, 링커는 약 3 nt 내지 약 5 nt, 약 5 nt 내지 약 10 nt, 약 10 nt 내지 약 15 nt, 약 15 nt 내지 약 20 nt, 약 20 nt 내지 약 25 nt, 약 25 nt 내지 약 30 nt, 약 30 nt 내지 약 35 nt, 약 35 nt 내지 약 40 nt, 약 40 nt 내지 약 50 nt, 약 50 nt 내지 약 60 nt, 약 60 nt 내지 약 70 nt, 약 70 nt 내지 약 80 nt, 약 80 nt 내지 약 90 nt 또는 약 90 nt 내지 약 100 nt의 길이를 가질 수 있다. 일부 실시형태에서, 단일-분자 가이드 핵산의 링커는 4 내지 40개의 뉴클레오티드이다. 일부 실시형태에서, 링커는 적어도 약 100, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500 또는 7000개 이상의 뉴클레오티드이다. 일부 실시형태에서, 링커는 최대 약 100, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500 또는 7000개 이상의 뉴클레오티드이다.In some embodiments, the linker sequence of the single-molecule guide nucleic acid is between about 3 nucleotides and about 100 nucleotides in length. Exemplary linkers are about 3 nt to about 90 nt, about 3 nt to about 80 nt, about 3 nt to about 70 nt, about 3 nt to about 60 nt, about 3 nt to about 50 nt, about 3 nt to about 40 nt, about 3 nt to about 30 nt, about 3 nt to about 20 nt, about 3 nt to about 10 nt. For example, the linker may be from about 3 nt to about 5 nt, from about 5 nt to about 10 nt, from about 10 nt to about 15 nt, from about 15 nt to about 20 nt, from about 20 nt to about 25 nt, from about 25 nt to about 30 nt, about 30 nt to about 35 nt, about 35 nt to about 40 nt, about 40 nt to about 50 nt, about 50 nt to about 60 nt, about 60 nt to about 70 nt, about 70 nt to about 80 nt, from about 80 nt to about 90 nt or from about 90 nt to about 100 nt. In some embodiments, the linker of a single-molecule guide nucleic acid is 4 to 40 nucleotides. In some embodiments, the linker is at least about 100, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, or 7000 or more nucleotides. In some embodiments, the linker is at most about 100, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, or 7000 or more nucleotides.

링커는 다양한 서열 중 임의의 것을 가질 수 있지만, 일부 실시형태에서 링커는 gRNA의 다른 기능적 영역을 간섭할 수 있는 분자내 결합을 유발할 수 있는 gRNA의 다른 부분과 상동성인 광범위한 영역을 갖는 서열을 가지지 않을 것이다. 상기 문헌[Jinek et al.]에서, 단순한 4 뉴클레오티드 서열 -GAAA-가 사용되지만, 더 긴 서열을 비롯한, 다수의 다른 서열이 마찬가지로 사용될 수 있다.The linker may have any of a variety of sequences, but in some embodiments the linker may not have a sequence having a broad region homologous to other parts of the gRNA that may result in intramolecular binding that may interfere with other functional regions of the gRNA. will be. supra, Jinek et al. ], the simple 4 nucleotide sequence -GAAA- is used, although many other sequences can likewise be used, including longer sequences.

일부 실시형태에서, 링커 서열은 기능적 모이어티를 가진다. 예를 들어, 링커 서열은 압타머, 리보자임, 단백질-상호작용 헤어핀, 단백질 결합 부위, CRISPR 어레이, 인트론 또는 엑손을 포함하는 하나 이상의 특징부를 가질 수 있다. 일부 실시형태에서, 링커 서열은 적어도 약 1, 2, 3, 4 또는 5개 이상의 기능적 모이어티를 가진다. 일부 실시형태에서, 링커 서열은 최대 약 1, 2, 3, 4 또는 5개 이상의 기능적 모이어티를 가진다.In some embodiments, the linker sequence has a functional moiety. For example, a linker sequence can have one or more features, including aptamers, ribozymes, protein-interacting hairpins, protein binding sites, CRISPR arrays, introns or exons. In some embodiments, the linker sequence has at least about 1, 2, 3, 4, or 5 or more functional moieties. In some embodiments, the linker sequence has at most about 1, 2, 3, 4, 5 or more functional moieties.

일부 실시형태에서, 본 개시내용에 따라 gRNA에 의해 표적화되는 게놈 위치는 게놈, 예를 들어, 인간 게놈 내의 적합한 내인성 유전자좌에, 그 내에 또는 그 근처에 존재할 수 있다. 내인성 유전자좌는 고도로 발현되는 유전자 또는 대안적으로 매우 선택적으로 발현되는 유전자(예를 들어, 특정 조직에서 또는 특정 조건 하에서만 발현되는 유전자)의 포함에 기초하여 선택될 수 있다. 간에서의 발현을 위한 예시적인 유전자좌는 예를 들어, 알부민 유전자좌, 트랜스페린 유전자좌 및 피브리노겐 유전자좌를 포함한다.In some embodiments, a genomic location targeted by a gRNA according to the present disclosure may be at, within or near a suitable endogenous locus in a genome, eg, the human genome. An endogenous locus may be selected based on the inclusion of a highly expressed gene or alternatively a highly selectively expressed gene (eg, a gene that is expressed only in a particular tissue or under particular conditions). Exemplary loci for expression in the liver include, for example, the albumin locus, the transferrin locus and the fibrinogen locus.

일부 실시형태에서, 세포 내의 내인성 트랜스페린 유전자좌 내의 또는 그 근처의 게놈 서열에 상보적인 스페이서 서열을 포함하는 gRNA가 본원에 제공된다. 일부 실시형태에서, gRNA는 세포 내의 내인성 트랜스페린 유전자의 인트론 1 내의 서열에 상보적인 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 1 내지 190 중 어느 하나로부터의 스페이서 서열 또는 SEQ ID NO: 1 내지 190 중 어느 하나에 비하여 3개 이하의 불일치를 갖는 그의 변이체를 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 96, 5, 6, 9, 8, 11, 15, 16, 12, 7, 10, 17, 18, 29, 76, 50, 54, 81, 64, 51, 1 내지 4, 13, 14, 19 내지 28, 30 내지 49, 52, 53, 55 내지 63, 65 내지 75, 77 내지 80, 82 내지 95 및 97 내지 190 중 어느 하나로부터의 스페이서 서열 또는 SEQ ID NO: 96, 5, 6, 9, 8, 11, 15, 16, 12, 7, 10, 17, 18, 29, 76, 50, 54, 81, 64, 51, 1 내지 4, 13, 14, 19 내지 28, 30 내지 49, 52, 53, 55 내지 63, 65 내지 75, 77 내지 80, 82 내지 95 및 97 내지 190 중 어느 하나에 비하여 3개 이하의 불일치를 갖는 그의 변이체를 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 5, 6, 9, 8, 11, 15, 16, 12, 7 및 10 중 어느 하나로부터의 스페이서 서열 또는 SEQ ID NO: 5, 6, 9, 8, 11, 15, 16, 12, 7 및 10 중 어느 하나에 비하여 3개 이하의 불일치를 갖는 그의 변이체를 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 17, 18, 29, 76, 50, 54, 81, 96, 64 및 51 중 어느 하나로부터의 스페이서 서열 또는 SEQ ID NO: 17, 18, 29, 76, 50, 54, 81, 96, 64 및 51 중 어느 하나에 비하여 3개 이하의 불일치를 갖는 그의 변이체를 포함한다. 일부 실시형태에서, 스페이서 서열은 19개 뉴클레오티드 길이이며, 그것이 선택되는 서열의 위치 1에서의 뉴클레오티드를 포함하지 않는다.In some embodiments, provided herein is a gRNA comprising a spacer sequence that is complementary to a genomic sequence within or near an endogenous transferrin locus in a cell. In some embodiments, the gRNA comprises a spacer sequence that is complementary to a sequence in intron 1 of an endogenous transferrin gene in the cell. In some embodiments, the gRNA comprises a spacer sequence from any one of SEQ ID NOs: 1-190 or a variant thereof having no more than 3 mismatches relative to any one of SEQ ID NOs: 1-190. In some embodiments, the gRNA is SEQ ID NO: 96, 5, 6, 9, 8, 11, 15, 16, 12, 7, 10, 17, 18, 29, 76, 50, 54, 81, 64, 51 , 1 to 4, 13, 14, 19 to 28, 30 to 49, 52, 53, 55 to 63, 65 to 75, 77 to 80, 82 to 95 and 97 to 190 or a spacer sequence from any one of SEQ ID NO: 96, 5, 6, 9, 8, 11, 15, 16, 12, 7, 10, 17, 18, 29, 76, 50, 54, 81, 64, 51, 1 to 4, 13, 14, 19-28, 30-49, 52, 53, 55-63, 65-75, 77-80, 82-95, and variants thereof having no more than 3 mismatches relative to any one of 97-190. In some embodiments, the gRNA comprises a spacer sequence from any one of SEQ ID NOs: 5, 6, 9, 8, 11, 15, 16, 12, 7 and 10 or SEQ ID NOs: 5, 6, 9, 8, and variants thereof having no more than 3 mismatches relative to any of 11, 15, 16, 12, 7 and 10. In some embodiments, the gRNA comprises a spacer sequence from any one of SEQ ID NOs: 17, 18, 29, 76, 50, 54, 81, 96, 64 and 51 or SEQ ID NOs: 17, 18, 29, 76, 50, 54, 81, 96, 64, and variants thereof having no more than 3 mismatches relative to any one of. In some embodiments, the spacer sequence is 19 nucleotides in length and does not include the nucleotide at position 1 of the sequence from which it is selected.

일부 실시형태에서, 본 개시내용에 따라 gRNA에 의해 표적화된 게놈 위치는 게놈, 예를 들어, 인간 게놈 내의 내인성 피브리노겐-알파 쇄(피브리노겐-α) 유전자좌에, 그 내에 또는 그 근처에 존재할 수 있다. 이러한 위치를 표적화하는 예시적인 가이드 RNA는 SEQ ID NO: 192 내지 270 중 어느 하나에 열거된 스페이서 서열 및 회합된 Cas9 또는 Cpf1 절단 부위를 포함한다. 해당 분야의 숙련자에 의해 이해되는 바와 같이, 각각의 가이드 RNA는 그의 게놈 표적 서열에 상보적인 스페이서 서열을 포함하도록 설계된다. 예를 들어, 나열된 SEQ ID NO: 192 내지 270 중 어느 하나에서 스페이서 서열 각각은 (상응하는 tracrRNA와 함께) 단일의 RNA 키메라 또는 crRNA에 포함될 수 있다. 상기 문헌[M. Jinek et al.], 및 문헌[E. Deltcheva et al., Nature (2011) 471:602-07]을 참조하라.In some embodiments, a genomic location targeted by a gRNA according to the present disclosure may be at, within or near an endogenous fibrinogen-alpha chain (fibrinogen-α) locus in a genome, eg, the human genome. Exemplary guide RNAs targeting these positions include a Cas9 or Cpf1 cleavage site associated with a spacer sequence listed in any one of SEQ ID NOs: 192-270. As will be appreciated by those skilled in the art, each guide RNA is designed to include a spacer sequence that is complementary to its genomic target sequence. For example, each of the spacer sequences in any one of SEQ ID NOs: 192-270 listed may be comprised in a single RNA chimera or crRNA (along with the corresponding tracrRNA). The literature [M. Jinek et al., and E. Deltcheva et al., Nature (2011) 471 :602-07].

알부민 위치를 표적화하는 예시적인 가이드 RNA는 SEQ ID NO: 271 내지 298 중 어느 하나로부터의 스페이서 서열 및 회합된 Cas9 또는 Cpf1 절단 부위를 포함한다. 예를 들어, SEQ ID NO: 271로부터의 스페이서 서열을 포함하는 gRNA는 스페이서 서열 UAAUUUUCUUUUGCGCACUA(SEQ ID NO: 299)를 포함할 수 있다. 해당 분야의 숙련자에 의해 이해되는 바와 같이, 각각의 가이드 RNA는 그의 게놈 표적 서열에 상보적인 스페이서 서열을 포함하도록 설계된다. 예를 들어, SEQ ID NO: 271 내지 298 중 어느 하나로부터의 스페이서 서열 각각은 (상응하는 tracrRNA와 함께) 단일의 RNA 키메라 또는 crRNA에 포함될 수 있다.Exemplary guide RNAs that target an albumin locus include a spacer sequence from any one of SEQ ID NOs: 271-298 and an associated Cas9 or Cpf1 cleavage site. For example, a gRNA comprising a spacer sequence from SEQ ID NO: 271 may comprise the spacer sequence UAAUUUUCUUUUGCGCACUA (SEQ ID NO: 299). As will be appreciated by those skilled in the art, each guide RNA is designed to include a spacer sequence that is complementary to its genomic target sequence. For example, each of the spacer sequences from any one of SEQ ID NOs: 271-298 may be comprised in a single RNA chimera or crRNA (along with the corresponding tracrRNA).

공여자 주형donor template

부위-지정 폴리펩티드, 예컨대 DNA 엔도뉴클레아제는 핵산, 예를 들어 게놈 DNA 내에 이중-가닥 파단 또는 단일-가닥 파단을 도입할 수 있다. 이중-가닥 파단은 세포의 내인성 DNA-수선 경로(예를 들어, 상동성-의존적 수선(HDR), 비-상동성 말단 연결 또는 대안적인 비-상동성 말단 연결(A-NHEJ), 또는 미세상동성-매개 말단 연결(MMEJ))를 자극할 수 있다. NHEJ는 상동성 주형에 대한 요구 없이 절단된 표적 핵산을 수선할 수 있다. 이것은 때때로 절단 부위에서 표적 핵산 내에 작은 결실 또는 삽입(indel)을 야기할 수 있고, 유전자 발현의 붕괴 또는 변경을 야기할 수 있다. 상동성 재조합(HR)으로도 알려진 HDR은 상동성 수선 주형 또는 공여자가 이용 가능한 경우 일어날 수 있다.Site-directed polypeptides, such as DNA endonucleases, can introduce double-stranded breaks or single-stranded breaks into nucleic acids, eg, genomic DNA. Double-strand breaks can occur in the cell's endogenous DNA-repair pathway (e.g., homology-dependent repair (HDR), non-homologous end joining or alternative non-homologous end joining (A-NHEJ), or microphase same sex-mediated terminal joining (MMEJ)). NHEJ can repair cleaved target nucleic acids without the need for homology templates. This can sometimes lead to small deletions or indels in the target nucleic acid at the cleavage site, which can lead to disruption or alteration of gene expression. HDR, also known as homologous recombination (HR), can occur when a homologous repair template or donor is available.

상동성 공여자 주형은 표적 핵산 절단 부위에 플랭킹된 서열에 상동성인 서열을 가진다. 자매 염색분체가 수선 주형으로서 세포에 의해 일반적으로 사용된다. 그러나, 게놈 편집의 목적을 위하여, 수선 주형은 흔히 외인성 핵산, 예컨대 플라스미드, 듀플렉스 올리고뉴클레오티드, 단일-가닥 올리고뉴클레오티드, 이중-가닥 올리고뉴클레오티드, 또는 바이러스 핵산으로서 공급된다. 외인성 공여자 주형을 사용하여, 상동성의 플랭킹 영역 사이에 추가 핵산 서열(예컨대 트랜스유전자) 또는 변형(예컨대 단일 또는 다수의 염기 변화 또는 결실)을 도입하여 추가 또는 변경된 핵산 서열이 또한 표적 유전자좌 내에 혼입되게 되는 것이 일반적이다. MMEJ는 작은 결실 및 삽입이 절단 부위에서 일어날 수 있다는 점에서 NHEJ와 유사한 유전 결과를 야기한다. MMEJ는 절단 부위에 플랭킹된 몇몇 염기쌍의 상동성 서열을 사용하여 선호되는 말단-연결 DNA 수선 결과를 유도한다. 일부 예에서, 뉴클레아제 표적 영역에서 잠재적인 미세상동성의 분석을 기반으로 가능한 수선 결과를 예측하는 것이 가능할 수 있다.The homologous donor template has sequences homologous to sequences flanked by the target nucleic acid cleavage site. Sister chromatids are commonly used by cells as repair templates. However, for purposes of genome editing, repair templates are often supplied as exogenous nucleic acids, such as plasmids, duplex oligonucleotides, single-stranded oligonucleotides, double-stranded oligonucleotides, or viral nucleic acids. Using an exogenous donor template, additional nucleic acid sequences (such as transgenes) or modifications (such as single or multiple base changes or deletions) are introduced between the flanking regions of homology so that the added or altered nucleic acid sequences are also incorporated within the target locus it is common to be MMEJ causes genetic consequences similar to NHEJ in that small deletions and insertions can occur at the cleavage site. MMEJ uses homologous sequences of several base pairs flanking the cleavage site to induce favorable end-joining DNA repair results. In some instances, it may be possible to predict possible repair outcomes based on analysis of potential microhomologies in nuclease target regions.

따라서, 일부 경우에, 상동성 재조합을 사용하여 표적 핵산 절단 부위 내로 외인성 폴리뉴클레오티드 서열을 삽입한다. 외인성 폴리뉴클레오티드 서열은 본원에서 공여자 주형(또는 공여자, 또는 공여자 서열, 또는 공여자 DNA 주형)로 지칭된다. 일부 실시형태에서, 공여자 주형, 공여자 주형의 부분, 공여자 주형의 카피, 또는 공여자 주형의 카피의 부분이 표적 핵산 절단 부위 내에 삽입된다. 일부 실시형태에서, 공여자 주형은 표적 핵산 절단 부위에서 천연적으로 발생하지 않는 서열이다.Thus, in some cases, homologous recombination is used to insert an exogenous polynucleotide sequence into a target nucleic acid cleavage site. The exogenous polynucleotide sequence is referred to herein as a donor template (or donor, or donor sequence, or donor DNA template). In some embodiments, a donor template, a portion of a donor template, a copy of the donor template, or a portion of a copy of the donor template is inserted within the target nucleic acid cleavage site. In some embodiments, the donor template is a sequence that does not occur naturally at the target nucleic acid cleavage site.

외인성 DNA 분자가 이중 가닥 파단이 발생하는 세포의 핵 내에 충분한 농도로 공급되는 경우, 외인성 DNA는 NHEJ 수선 과정 동안 이중 가닥 파단부에 삽입될 수 있으며, 이에 따라 게놈으로의 영구적인 부가가 된다. 공여자 주형이 선택적으로 관련 조절 서열, 예컨대 프로모터, 인핸서, 폴리A 서열 및/또는 스플라이스 수여자 서열(본원에 "공여자 카세트"로서도 지칭됨)과 함께 관심 유전자, 예컨대 FVIII 유전자에 대한 코딩 서열을 함유한다면, 코딩 서열은 게놈 내의 통합된 카피로부터 발현되어, 세포의 일생 동안의 영구적인 발현을 초래할 수 있다. 더욱이, 공여자 주형의 통합된 카피는 세포가 분열하는 경우 딸 세포로 전달될 수 있다.If the exogenous DNA molecule is supplied in sufficient concentration within the nucleus of the cell in which the double-strand break occurs, the exogenous DNA can insert into the double-strand break during the NHEJ repair process, thus becoming a permanent addition to the genome. The donor template optionally contains the coding sequence for the gene of interest, such as the FVIII gene, along with relevant regulatory sequences, such as promoter, enhancer, polyA sequence and/or splice acceptor sequence (also referred to herein as "donor cassette") If so, the coding sequence can be expressed from an integrated copy within the genome, resulting in permanent expression throughout the life of the cell. Moreover, the integrated copy of the donor template can be transferred to daughter cells when the cells divide.

이중 가닥 파단부의 어느 하나의 측에서 DNA 서열에 대하여 상동성을 갖는 측접 DNA 서열(상동성 아암으로 지칭됨)을 함유하는 충분한 농도의 공여자 주형의 존재 하에서, 공여자 주형은 HDR 경로를 통해 통합될 수 있다. 상동성 아암은 공여자 주형과, 이중 가닥 파단부의 어느 하나의 측의 서열 간의 상동성 재조합을 위한 기질로서 작용한다. 이는 공여자 주형의 오류 부재 삽입을 초래할 수 있으며, 여기서, 이중 가닥 파단부의 어느 하나의 측의 서열은 미변형 게놈에서의 것으로부터 변경되지 않는다.In the presence of a sufficient concentration of donor template containing flanking DNA sequences (referred to as homology arms) having homology to the DNA sequence on either side of the double-stranded break, the donor template can be integrated via the HDR pathway. there is. The homology arms serve as a substrate for homologous recombination between the donor template and the sequence on either side of the double-stranded break. This can result in erroneous insertion of the donor template, wherein the sequence on either side of the double-stranded break is unchanged from that in the unmodified genome.

HDR에 의한 편집을 위한 공급된 공여자는 상당히 다양하지만 일반적으로는 게놈 DNA에 대한 어닐링을 허용하도록 작거나 큰 플랭킹 상동성 아암을 갖는 의도된 서열을 함유한다. 도입된 유전자 변화에 플랭킹된 상동성 영역은 30bp 이하이거나, 또는 프로모터, cDNA 등을 함유할 수 있는 수-킬로베이스의 카세트만큼 클 수 있다. 단일-가닥 및 이중-가닥 올리고뉴클레오티드 공여자 둘 모두가 사용될 수 있다. 이들 올리고뉴클레오티드는 100 nt 미만에서 수 kb 초과의 크기 범위이지만, 더 긴 ssDNA가 또한 생성 및 사용될 수 있다. PCR 앰플리콘, 플라스미드 및 미니-서클(mini-circle)을 비롯한, 이중-가닥 공여자가 흔히 사용된다. 일반적으로, AAV 벡터가 공여자 주형의 매우 효과적인 운반 수단인 것을 발견하였지만, 개별 공여자에 대한 패키징 한계는 5kb 미만이다. 공여자의 활성 전사는 HDR을 3-배 증가시켰는데, 이는 프로모터의 포함이 전환을 증가시킬 수 있다는 것을 나타낸다. 이에 반해서, 공여자의 CpG 메틸화는 유전자 발현 및 HDR을 감소시킬 수 있다.Sourced donors for editing by HDR vary considerably, but generally contain the intended sequence with small or large flanking homology arms to allow annealing to genomic DNA. The region of homology flanking the introduced genetic change may be 30 bp or less, or as large as a several-kilobase cassette which may contain a promoter, cDNA, etc. Both single-stranded and double-stranded oligonucleotide donors can be used. These oligonucleotides range in size from less than 100 nt to more than a few kb, although longer ssDNAs can also be generated and used. Double-stranded donors are commonly used, including PCR amplicons, plasmids and mini-circles. In general, although AAV vectors have been found to be very effective vehicles of donor template, the packaging limit for individual donors is less than 5 kb. Active transcription of the donor resulted in a 3-fold increase in HDR, indicating that inclusion of the promoter may increase conversion. In contrast, CpG methylation of donors can reduce gene expression and HDR.

일부 실시형태에서, 공여자 DNA는 다양한 상이한 방법에 의해, 예를 들어, 트랜스펙션, 나노-입자, 마이크로-주사 또는 바이러스 형질도입에 의해 독립적으로 또는 뉴클레아제와 함께 공급될 수 있다. HDR을 위한 공여자의 이용 가능성을 증가시키기 위하여 다양한 테더링 옵션(tethering option)이 일부 실시형태에서 사용될 수 있다. 예는 공여자를 뉴클레아제에 부착시키는 것, 근처에 결합하는 DNA 결합 단백질에 부착시키는 것 또는 DNA 말단 결합 또는 수선에 관여되는 단백질에 부착시키는 것을 포함한다.In some embodiments, donor DNA can be supplied by a variety of different methods, eg, by transfection, nano-particle, micro-injection, or viral transduction, independently or with a nuclease. Various tethering options may be used in some embodiments to increase donor availability for HDR. Examples include attachment of a donor to a nuclease, attachment to a DNA binding protein that binds nearby, or attachment to a protein involved in DNA end binding or repair.

NHEJ 또는 HDR에 의한 게놈 편집에 더하여, NHEJ 경로 및 HR 둘 모두를 사용하는 부위-특이적 유전자 삽입이 행해질 수 있다. 아마도 인트론/엑손 경계를 비롯한, 특정 환경에서 조합 접근법이 적용 가능할 수 있다. NHEJ는 인트론에서 라이게이션을 위하여 효과적인 것으로 증명될 수 있지만, 오류-부재 HDR은 코딩 영역에서 더 적합해질 수 있다.In addition to genome editing by NHEJ or HDR, site-specific gene insertion using both the NHEJ pathway and HR can be done. Perhaps a combinatorial approach may be applicable in certain circumstances, including intron/exon boundaries. While NHEJ may prove effective for ligation in introns, error-free HDR may be more suitable in the coding domain.

실시형태들에서, 게놈 내로 삽입될 외인성 서열은 다르게는 야생형 B 도메인이 존재할 위치에 B 도메인 치환물을 갖는 합성 FVIII 단백질을 인코딩하는 합성 FVIII 코딩 서열이다. 합성 FVIII 코딩 서열은 야생형 FVIII 단백질의 실질적인 활성, 예컨대 응고유발(procoagulation) 활성을 갖는 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함할 수 있다. 합성 FVIII 단백질은 야생형 FVIII 단백질이 발현하는 활성의 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95% 또는 약 100%의 활성 정도를 가질 수 있다. 일부 실시형태에서, 합성 FVIII 단백질은 FVIII 단백질, 예를 들어, 야생형 FVIII 단백질에 대해 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 아미노산 서열 동일성을 가질 수 있다. 일부 실시형태에서, 합성 FVIII 단백질은 B 도메인을 포함하지 않는 FVIII 단백질, 예를 들어, B 도메인의 절단 이후의 야생형 FVIII 단백질에 대해 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 아미노산 서열 동일성을 가질 수 있다. 일부 실시형태에서, 당업자는 당분야에 알려진 여러 방법을 사용하여 화합물, 예를 들어 펩티드 또는 단백질의 기능성 또는 활성을 테스트할 수 있다. 합성 FVIII 단백질은 또한 야생형 FVIII 단백질의 임의의 단편 또는 전장, 야생형 FVIII 단백질 내의 아미노산 잔기 중 하나 이상에 보존적 변형을 갖는 변형된 FVIII 단백질의 단편을 포함할 수 있다. 따라서, 일부 실시형태에서, 합성 FVIII 코딩 서열은 FVIII 코딩 서열, 예를 들어, 야생형 FVIII 코딩 서열에 대해 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 핵산 서열 동일성을 가질 수 있다.In embodiments, the exogenous sequence to be inserted into the genome is a synthetic FVIII coding sequence encoding a synthetic FVIII protein having a B domain substitution at a position where the wild-type B domain would otherwise be present. The synthetic FVIII coding sequence may comprise a nucleic acid sequence encoding a synthetic FVIII protein having substantial activity, such as a procoagulation activity, of a wild-type FVIII protein. The synthetic FVIII protein has at least about 30%, about 40%, about 50%, about 60%, about 70%, about 80%, about 85%, about 90%, about 95% or about of the activity expressed by the wild-type FVIII protein. It may have a degree of activity of 100%. In some embodiments, the synthetic FVIII protein comprises at least about 30%, about 40%, about 50%, about 60%, about 70%, about 80%, about 85%, about 90%, about 95%, about 96%, about 97%, about 98% or about 99% amino acid sequence identity. In some embodiments, the synthetic FVIII protein comprises at least about 30%, about 40%, about 50%, about 60%, about 70%, about 80%, about 85%, about 90%, about 95%, about 96%, about 97%, about 98% or about 99% amino acid sequence identity. In some embodiments, one of ordinary skill in the art can test the functionality or activity of a compound, eg, a peptide or protein, using several methods known in the art. Synthetic FVIII proteins may also include any fragment of wild-type FVIII protein or fragments of a modified FVIII protein having conservative modifications at one or more of the amino acid residues in the full-length, wild-type FVIII protein. Thus, in some embodiments, the synthetic FVIII coding sequence is at least about 30%, about 40%, about 50%, about 60%, about 70%, about 80% relative to the FVIII coding sequence, e.g., a wild-type FVIII coding sequence. , about 85%, about 90%, about 95%, about 96%, about 97%, about 98% or about 99% nucleic acid sequence identity.

본 발명의 실시형태들에서, 합성 FVIII은 단백질의 항응고 특성에 불리하게 영향을 미치지 않고, 단백질의 양상을 개선시키는 하나 이상의 보존적 또는 비보존적 아미노산 치환을 함유한다. 일 실시형태에서, 위치 309에서의 페닐알라닌은 세린 또는 알라닌으로 (비보존적으로) 대체되어, 각각 F309S 및 F309A 돌연변이 단백질을 제공한다. 이들 치환은 A1 도메인 내의 샤페론 면역글로불린 결합 단백질(Bip)에 대한 잠재적인 결합 부위를 파괴함으로써, 단백질의 발현 및 분비를 개선시키는 것으로 제안된다(문헌[M. Swaroop et al., J Biol Chem (1997) 272:24121-24]).In embodiments of the invention, synthetic FVIII contains one or more conservative or non-conservative amino acid substitutions that improve the behavior of the protein without adversely affecting the anticoagulant properties of the protein. In one embodiment, the phenylalanine at position 309 is (non-conservatively) replaced with a serine or an alanine to provide the F309S and F309A mutant proteins, respectively. These substitutions are proposed to improve expression and secretion of proteins by disrupting a potential binding site for chaperone immunoglobulin binding protein (Bip) in the A1 domain (M. Swaroop et al., J Biol Chem (1997) ) 272 :24121-24]).

본 발명의 B 도메인 치환물은 프로테아제 절단 부위 및 N-연결된 글리코실화를 위한 하나 이상의 부위를 여전히 제공하면서, 야생형 FVIII의 B 도메인을 훨씬 더 작은 펩티드 쇄로 대체한다. B 도메인 치환물은 약 10개 내지 약 200개의 아미노산을 가질 수 있다. 일부 실시형태에서, B 도메인 치환물은 약 20개 내지 약 100개의 아미노산을 가진다. 일부 실시형태에서, B 도메인 치환물은 약 1개 내지 약 40개 아미노산, 약 1개 내지 약 35개 아미노산, 약 1개 내지 약 30개 아미노산, 약 1개 내지 약 25개 아미노산, 약 1개 내지 약 20개 아미노산, 약 1개 내지 약 15개 아미노산, 약 1개 내지 약 10개 아미노산, 또는 약 1개 내지 약 5개 아미노산을 가진다. 일부 실시형태에서, B 도메인 치환물은 약 5개 내지 약 40개 아미노산, 약 10개 내지 약 40개 아미노산, 약 15개 내지 약 40개 아미노산, 약 20개 내지 약 40개 아미노산, 약 25개 내지 약 40개 아미노산, 약 30개 내지 약 40개 아미노산, 또는 약 35개 내지 약 40개 아미노산을 가진다 일부 실시형태에서, B 도메인 치환물은 1개 아미노산, 2개 아미노산, 3개 아미노산, 4개 아미노산, 5개 아미노산, 6개 아미노산, 7개 아미노산, 8개 아미노산, 9개 아미노산, 10개 아미노산, 11개 아미노산, 12개 아미노산, 13개 아미노산, 14개 아미노산, 15개 아미노산, 16개 아미노산, 17개 아미노산, 18개 아미노산, 19개 아미노산, 20개 아미노산, 21개 아미노산, 22개 아미노산, 23개 아미노산, 24개 아미노산, 25개 아미노산, 26개 아미노산, 27개 아미노산, 28개 아미노산, 29개 아미노산, 30개 아미노산, 31개 아미노산, 32개 아미노산, 33개 아미노산, 34개 아미노산, 35개 아미노산, 36개 아미노산, 37개 아미노산, 38개 아미노산, 39개 아미노산, 또는 40개 아미노산을 가진다. 일부 실시형태에서, B 도메인 치환물을 인코딩하는 핵산은 코돈 최적화된다. 일부 실시형태에서, B 도메인 치환물은 프로테아제 절단 부위, 예를 들어, RHQR을 포함한다.The B domain substitutions of the present invention replace the B domain of wild-type FVIII with a much smaller peptide chain, while still providing a protease cleavage site and one or more sites for N-linked glycosylation. B domain substitutions may have from about 10 to about 200 amino acids. In some embodiments, the B domain substitution has from about 20 to about 100 amino acids. In some embodiments, the B domain substitutions are from about 1 to about 40 amino acids, from about 1 to about 35 amino acids, from about 1 to about 30 amino acids, from about 1 to about 25 amino acids, from about 1 to about 25 amino acids. about 20 amino acids, about 1 to about 15 amino acids, about 1 to about 10 amino acids, or about 1 to about 5 amino acids. In some embodiments, the B domain substitutions are from about 5 to about 40 amino acids, from about 10 to about 40 amino acids, from about 15 to about 40 amino acids, from about 20 to about 40 amino acids, from about 25 to about 40 amino acids. have about 40 amino acids, about 30 to about 40 amino acids, or about 35 to about 40 amino acids. In some embodiments, the B domain substitutions are 1 amino acid, 2 amino acids, 3 amino acids, 4 amino acids. , 5 amino acids, 6 amino acids, 7 amino acids, 8 amino acids, 9 amino acids, 10 amino acids, 11 amino acids, 12 amino acids, 13 amino acids, 14 amino acids, 15 amino acids, 16 amino acids, 17 Dog Amino Acids, 18 Amino Acids, 19 Amino Acids, 20 Amino Acids, 21 Amino Acids, 22 Amino Acids, 23 Amino Acids, 24 Amino Acids, 25 Amino Acids, 26 Amino Acids, 27 Amino Acids, 28 Amino Acids, 29 Amino Acids , 30 amino acids, 31 amino acids, 32 amino acids, 33 amino acids, 34 amino acids, 35 amino acids, 36 amino acids, 37 amino acids, 38 amino acids, 39 amino acids, or 40 amino acids. In some embodiments, the nucleic acid encoding the B domain substitution is codon optimized. In some embodiments, the B domain substitution comprises a protease cleavage site, eg, RHQR.

그의 합성 FVIII 코딩 서열의 삽입이 고려되는 일부 실시형태에서, 합성 FVIII 코딩 서열의 cDNA는 결함이 있는 FVIII 유전자 또는 그의 조절 서열을 갖는 대상체의 게놈 내로 삽입될 수 있다. 이러한 경우에, 공여자 DNA 또는 공여자 주형은 합성 FVIII을 인코딩하는 서열을 갖는 발현 카세트 또는 벡터 구축물일 수 있다. 일부 실시형태에서, 발현 벡터는 합성 FVIII을 인코딩하는 서열을 함유하며, 이는 본 명세서의 다른 곳에 기술되어 있으며, 이것이 사용될 수 있다.In some embodiments where insertion of a synthetic FVIII coding sequence thereof is contemplated, the cDNA of the synthetic FVIII coding sequence can be inserted into the genome of a subject having a defective FVIII gene or regulatory sequence thereof. In this case, the donor DNA or donor template may be an expression cassette or vector construct having a sequence encoding synthetic FVIII. In some embodiments, the expression vector contains a sequence encoding synthetic FVIII, which is described elsewhere herein and may be used.

일부 실시형태에서, 공여자 카세트를 포함하는 본원에 기술된 공여자 주형 중 어느 하나에 따라, 공여자 카세트는 한 측 또는 양 측에서 gRNA 표적 부위에 측접한다. 예를 들어, 이러한 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및/또는 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함할 수 있다. 일부 실시형태에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함한다. 일부 실시형태에서, 공여자 주형은 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함한다. 일부 실시형태에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함한다. 일부 실시형태에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함하며, 2개의 gRNA 표적 부위는 동일한 서열을 포함한다. 일부 실시형태에서, 공여자 주형은 적어도 하나의 gRNA 표적 부위를 포함하며, 공여자 주형 내의 적어도 하나의 gRNA 표적 부위는 공여자 주형의 공여자 카세트가 통합될 표적 유전자좌 내의 gRNA 표적 부위와 동일한 서열을 포함한다. 일부 실시형태에서, 공여자 주형은 적어도 하나의 gRNA 표적 부위를 포함하며, 공여자 주형 내의 적어도 하나의 gRNA 표적 부위는 공여자 주형의 공여자 카세트가 통합될 표적 유전자좌 내의 gRNA 표적 부위의 역 상보물을 포함한다. 일부 실시형태에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함하며, 공여자 주형 내의 2개의 gRNA 표적 부위는 공여자 주형의 공여자 카세트가 통합될 표적 유전자좌 내의 gRNA 표적 부위와 동일한 서열을 포함한다. 일부 실시형태에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 갖는 공여자 카세트를 포함하며, 공여자 주형 내의 2개의 gRNA 표적 부위는 공여자 주형의 공여자 카세트가 통합될 표적 유전자좌 내의 gRNA 표적 부위의 역 상보물을 포함한다.In some embodiments, according to any one of the donor templates described herein comprising a donor cassette, the donor cassette flanks the gRNA target site on one or both sides. For example, such a donor template may comprise a donor cassette having a gRNA target site 5' of the donor cassette and/or a gRNA target site 3' of the donor cassette. In some embodiments, the donor template comprises a donor cassette having a gRNA target site 5' of the donor cassette. In some embodiments, the donor template comprises a donor cassette having a gRNA target site 3' of the donor cassette. In some embodiments, the donor template comprises a donor cassette having a gRNA target site 5' of the donor cassette and a gRNA target site 3' of the donor cassette. In some embodiments, the donor template comprises a donor cassette having a gRNA target site 5' of the donor cassette and a gRNA target site 3' of the donor cassette, wherein the two gRNA target sites comprise identical sequences. In some embodiments, the donor template comprises at least one gRNA target site, and the at least one gRNA target site in the donor template comprises the same sequence as the gRNA target site in the target locus into which the donor cassette of the donor template will be integrated. In some embodiments, the donor template comprises at least one gRNA target site, and the at least one gRNA target site in the donor template comprises the reverse complement of the gRNA target site in the target locus into which the donor cassette of the donor template will be integrated. In some embodiments, the donor template comprises a donor cassette having a gRNA target site 5' of the donor cassette and a gRNA target site 3' of the donor cassette, wherein the two gRNA target sites in the donor template are the donor cassettes of the donor template. It contains the same sequence as the gRNA target site in the target locus to be integrated. In some embodiments, the donor template comprises a donor cassette having a gRNA target site 5' of the donor cassette and a gRNA target site 3' of the donor cassette, wherein the two gRNA target sites in the donor template are the donor cassettes of the donor template. and the reverse complement of the gRNA target site within the target locus to be integrated.

부위-지정 폴리펩티드 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산Nucleic Acids Encoding Site-Directed Polypeptides or DNA Endonucleases

일부 실시형태에서, 게놈 편집의 방법 및 조성물은 이에 따라 부위-지정 폴리펩티드, 예컨대 DNA 엔도뉴클레아제를 인코딩하는 핵산(또는 올리고뉴클레오티드)을 사용할 수 있다. 부위-지정 폴리펩티드를 인코딩하는 핵산 서열은 DNA 또는 RNA일 수 있다. 부위-지정 폴리펩티드를 인코딩하는 핵산 서열이 RNA이면, 그것은 gRNA 서열에 공유적으로 연결되거나 개별 서열로서 존재할 수 있다. 일부 실시형태에서, 부위-지정 폴리펩티드(예컨대 DNA 엔도뉴클레아제)는 그것을 인코딩하는 핵산 서열 대신에 직접 사용될 수 있다.In some embodiments, methods and compositions of genome editing may thus use a nucleic acid (or oligonucleotide) encoding a site-directed polypeptide, such as a DNA endonuclease. The nucleic acid sequence encoding the site-directed polypeptide may be DNA or RNA. If the nucleic acid sequence encoding the site-directed polypeptide is RNA, it may be covalently linked to the gRNA sequence or exist as a separate sequence. In some embodiments, a site-directed polypeptide (eg, a DNA endonuclease) may be used directly in place of the nucleic acid sequence encoding it.

벡터vector

또 다른 양태에서, 본 개시내용은 본 개시내용의 게놈-표적화 핵산, 본 개시내용의 부위-지정 폴리펩티드 및/또는 본 개시내용의 방법의 실시형태를 수행하는 데 필요한 임의의 핵산 또는 단백질성 분자를 인코딩하는 뉴클레오티드 서열을 가지는 핵산을 제공한다. 일부 실시형태에서, 이러한 핵산은 벡터(예를 들어, 재조합 발현 벡터)이다.In another aspect, the present disclosure provides a genome-targeting nucleic acid of the present disclosure, a site-directed polypeptide of the present disclosure, and/or any nucleic acid or proteinaceous molecule necessary to perform an embodiment of a method of the present disclosure. A nucleic acid having a nucleotide sequence encoding is provided. In some embodiments, such nucleic acids are vectors (eg, recombinant expression vectors).

고려되는 발현 벡터는 백시니아 바이러스, 폴리오바이러스, 아데노바이러스, 아데노-연관 바이러스, SV40, 단순 헤르페스 바이러스, 인간 면역결핍 바이러스, 레트로바이러스(예를 들어, 쥣과 백혈병 바이러스, 비장 괴사 바이러스, 및 레트로바이러스, 예컨대 라우스 육종 바이러스, 하비 육종 바이러스, 조류 백혈증 바이러스, 렌티바이러스, 인간 면역결핍 바이러스, 골수증식성 육종 바이러스, 및 유방 종양 바이러스로부터 유래된 벡터) 및 다른 재조합 벡터를 기반으로 하는 바이러스 벡터를 포함하지만, 이들로 제한되지 않는다. 진핵 표적 세포를 위하여 고려되는 다른 벡터는 벡터 pXT1, pSG5, pSVK3, pBPV, pMSG 및 pSVLSV40(파마시아(Pharmacia))을 포함하지만, 이들로 제한되지 않는다. 진핵 표적 세포를 위해 고려되는 추가의 벡터는 벡터 pCTx-1, pCTx-2, 및 pCTx-3를 포함하지만, 이에 제한되지 않는다. 숙주 세포와 상용성인 한, 다른 벡터가 사용될 수 있다.Contemplated expression vectors include vaccinia virus, poliovirus, adenovirus, adeno-associated virus, SV40, herpes simplex virus, human immunodeficiency virus, retroviruses (e.g., murine leukemia virus, spleen necrosis virus, and retroviruses). including viral vectors based on, e.g., Rous sarcoma virus, Harvey's sarcoma virus, avian leukemia virus, lentivirus, human immunodeficiency virus, myeloproliferative sarcoma virus, and vectors derived from breast tumor virus) and other recombinant vectors. However, it is not limited to these. Other vectors contemplated for eukaryotic target cells include, but are not limited to, the vectors pXT1, pSG5, pSVK3, pBPV, pMSG and pSVLSV40 (Pharmacia). Additional vectors contemplated for eukaryotic target cells include, but are not limited to, the vectors pCTx-1, pCTx-2, and pCTx-3. Other vectors may be used as long as they are compatible with the host cell.

일부 실시형태에서, 벡터는 하나 이상의 전사 및/또는 번역 제어 요소를 가진다. 사용되는 숙주/벡터 시스템에 따라, 구성성 프로모터 및 유도성 프로모터, 전사 인핸서 요소, 전사 종결자 등을 비롯한, 다수의 적합한 전사 및 번역 제어 요소 중 임의의 것이 발현 벡터에서 사용될 수 있다. 일부 실시형태에서, 벡터는 바이러스 서열 또는 CRISPR 기구 또는 다른 요소의 성분을 불활성화시키는 자가-불활성화 벡터이다.In some embodiments, the vector has one or more transcriptional and/or translational control elements. Depending on the host/vector system used, any of a number of suitable transcriptional and translational control elements can be used in the expression vector, including constitutive and inducible promoters, transcription enhancer elements, transcription terminators, and the like. In some embodiments, the vector is a self-inactivating vector that inactivates viral sequences or components of the CRISPR machinery or other element.

적합한 진핵생물 프로모터(즉, 진핵 세포에서 기능성인 프로모터)의 비제한적인 예는 거대세포바이러스(CMV) 급초기, 단순 헤르페스 바이러스(HSV) 티미딘 키나제, 초기 및 후기 SV40, 레트로바이러스로부터의 긴 말단 반복부(LTR), 인간 신장 인자-1 프로모터(EF1), 닭 베타-액틴 프로모터(CAG)에 융합된 거대세포바이러스(CMV) 인핸서를 가지는 하이브리드 구축물, 쥣과 줄기세포 바이러스 프로모터(MSCV), 포스포글리세레이트 키나제-1 유전자좌 프로모터(PGK) 및 마우스 메탈로티오네인-I로부터의 것을 포함한다.Non-limiting examples of suitable eukaryotic promoters (ie , promoters functional in eukaryotic cells) include cytomegalovirus (CMV) acute early, herpes simplex virus (HSV) thymidine kinase, early and late SV40, long termini from retroviruses. Hybrid construct with cytomegalovirus (CMV) enhancer fused to repeat (LTR), human elongation factor-1 promoter (EF1), chicken beta-actin promoter (CAG), murine stem cell virus promoter (MSCV), phospho phosphoglycerate kinase-1 locus promoter (PGK) and from mouse metallothionein-I.

gRNA를 비롯한 작은 RNA를 발현시키기 위하여, 프로모터, 예컨대 예를 들어 U6 및 H1을 비롯한 RNA 중합효소 III 프로모터가 유리할 수 있다. 이러한 프로모터의 사용을 향상시키는 설명 및 이의 파라미터는 해당 분야에 공지되어 있고, 추가 정보 및 접근법은 정기적으로 기술되고 있으며; 예를 들어, 문헌[H. Ma et al., Mol Ther Nuc Acids 3, e161 (2014) doi:10.1038/mtna.2014.12]을 참조한다.To express small RNAs, including gRNAs, promoters such as RNA polymerase III promoters, including for example U6 and H1, may be advantageous. Descriptions of enhancing the use of such promoters and their parameters are known in the art, and additional information and approaches are regularly described; For example, H. Ma et al., Mol Ther Nuc Acids 3 , e161 (2014) doi:10.1038/mtna.2014.12].

발현 벡터는 또한 번역 개시를 위한 리보솜 결합 부위 및 전사 종결자를 함유할 수 있다. 발현 벡터는 또한 발현을 증폭시키기 위한 적절한 서열을 포함할 수 있다. 발현 벡터는 또한 부위-지정 폴리펩티드에 융합된 비-고유 태그(예를 들어, 히스티딘 태그, 혈구응집소 태그, 녹색 형광 단백질 등)를 인코딩하는 뉴클레오티드 서열을 포함하여, 융합 단백질을 야기할 수 있다.The expression vector may also contain a ribosome binding site for translation initiation and a transcription terminator. Expression vectors may also contain appropriate sequences for amplifying expression. Expression vectors can also include nucleotide sequences encoding non-native tags (eg, histidine tags, hemagglutinin tags, green fluorescent protein, etc.) fused to site-directed polypeptides, resulting in fusion proteins.

일부 실시형태에서, 프로모터는 유도성 프로모터(예를 들어, 열 충격 프로모터, 테트라사이클린-조절 프로모터, 스테로이드-조절 프로모터, 금속-조절 프로모터, 에스트로겐 수용체-조절 프로모터 등)이다. 일부 실시형태에서, 프로모터는 구성성 프로모터(예를 들어, CMV 프로모터, UBC 프로모터)이다. 일부 실시형태에서, 프로모터는 공간적으로 제한된 및/또는 일시적으로 제한된 프로모터(예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)이다. 일부 실시형태에서, 유전자가 게놈 내로 삽입된 후에 게놈에 존재하는 내인성 프로모터 하에서 유전자가 발현될 것이면, 벡터는 숙주 세포에서 발현될 적어도 하나의 유전자를 위한 프로모터를 갖지 않는다.In some embodiments, the promoter is an inducible promoter (eg, heat shock promoter, tetracycline-regulated promoter, steroid-regulated promoter, metal-regulated promoter, estrogen receptor-regulated promoter, etc.). In some embodiments, the promoter is a constitutive promoter (eg, CMV promoter, UBC promoter). In some embodiments, the promoter is a spatially restricted and/or temporally restricted promoter (eg, tissue specific promoter, cell type specific promoter, etc.). In some embodiments, the vector does not have a promoter for at least one gene to be expressed in the host cell if the gene will be expressed under an endogenous promoter present in the genome after the gene has been inserted into the genome.

부위-지정 폴리펩티드 또는 DNA 엔도뉴클레아제site-directed polypeptide or DNA endonuclease

NHEJ 및/또는 HDR로 인한 표적 DNA의 변형은 예를 들어, 돌연변이, 결실, 변경, 통합, 유전자 교정, 유전자 대체, 유전자 태깅, 트랜스유전자 삽입, 뉴클레오티드 결실, 유전자 붕괴, 전좌 및/또는 유전자 돌연변이를 야기할 수 있다. 비-고유 핵산의 게놈 DNA 내로의 통합 과정이 게놈 편집의 예이다.Modification of target DNA due to NHEJ and/or HDR may result in, for example, mutation, deletion, alteration, integration, gene correction, gene replacement, gene tagging, transgene insertion, nucleotide deletion, gene disruption, translocation and/or gene mutation. can cause The process of integration of non-native nucleic acids into genomic DNA is an example of genome editing.

부위-지정 폴리펩티드는 DNA를 절단하기 위하여 게놈 편집에서 사용되는 뉴클레아제이다. 부위-지정 폴리펩티드는 하나 이상의 폴리펩티드 또는 폴리펩티드(들)를 인코딩하는 하나 이상의 mRNA로서 세포 또는 대상체에게 투여될 수 있다.Site-directed polypeptides are nucleases used in genome editing to cleave DNA. A site-directed polypeptide may be administered to a cell or subject as one or more mRNAs encoding one or more polypeptides or polypeptide(s).

CRISPR/Cas 또는 CRISPR/Cpf1 시스템의 맥락에서, 부위-지정 폴리펩티드는 gRNA에 결합할 수 있으며, 이는 차례로 폴리펩티드가 지향되는 표적 DNA 내의 부위를 특정한다. 본원에서 CRISPR/Cas 또는 CRISPR/Cpf1 시스템의 실시형태에서, 부위-지정 폴리펩티드는 엔도뉴클레아제, 예컨대 DNA 엔도뉴클레아제이다.In the context of the CRISPR/Cas or CRISPR/Cpf1 system, a site-directed polypeptide can bind to a gRNA, which in turn specifies a site in the target DNA to which the polypeptide is directed. In embodiments of the CRISPR/Cas or CRISPR/Cpf1 system herein, the site-directed polypeptide is an endonuclease, such as a DNA endonuclease.

일부 실시형태에서, 부위-지정 폴리펩티드는 복수의 핵산-절단(즉, 뉴클레아제) 도메인을 가진다. 2개 이상의 핵산-절단 도메인은 링커를 통해 함께 연결될 수 있다. 일부 실시형태에서, 링커는 유연성 링커이다. 링커는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40개 이상의 아미노산 길이를 가질 수 있다.In some embodiments, the site-directed polypeptide has a plurality of nucleic acid-cleaving (ie, nuclease) domains. Two or more nucleic acid-cleaving domains may be linked together via a linker. In some embodiments, the linker is a flexible linker. Linkers are 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40 or more amino acids in length.

천연-발생 야생형 Cas9 효소는 2개의 뉴클레아제 도메인, HNH 뉴클레아제 도메인 및 RuvC 도메인을 가진다. 본원에서, "Cas9"는 천연-발생 Cas9 및 재조합 Cas9 둘 모두를 지칭한다. 본원에 고려되는 Cas9 효소는 HNH 또는 HNH-유사 뉴클레아제 도메인, 및/또는 RuvC 또는 RuvC-유사 뉴클레아제 도메인을 가진다.The naturally-occurring wild-type Cas9 enzyme has two nuclease domains, an HNH nuclease domain and a RuvC domain. As used herein, “Cas9” refers to both naturally-occurring Cas9 and recombinant Cas9. Cas9 enzymes contemplated herein have an HNH or HNH-like nuclease domain, and/or a RuvC or RuvC-like nuclease domain.

HNH 및 HNH-유사 도메인은 McrA-유사 폴드를 가진다. HNH 및 HNH-유사 도메인은 2개의 역평행 β-가닥 및 α-헬릭스를 가지며, 금속 결합 부위(예를 들어, 2가 양이온 결합 부위)를 가진다. HNH 및 HNH-유사 도메인은 표적 핵산의 하나의 가닥(예를 들어, crRNA 표적화 가닥의 상보성 가닥)을 절단할 수 있다.HNH and HNH-like domains have McrA-like folds. The HNH and HNH-like domains have two antiparallel β-strands and an α-helix and have a metal binding site (eg, a divalent cation binding site). The HNH and HNH-like domains can cleave one strand of a target nucleic acid (eg, the complementary strand of a crRNA targeting strand).

RuvC 및 RuvC-유사 도메인은 RNaseH 또는 RNaseH-유사 폴드를 가진다. RuvC/RNaseH 도메인은 다양한 세트의 핵산-기반 기능에 관여하며, RNA 및 DNA 둘 모두에 작용한다. RNaseH 도메인은 복수의 α-헬릭스에 의해 둘러싸인 5개의 β-가닥을 가진다. RuvC/RNaseH 및 RuvC/RNaseH-유사 도메인은 금속 결합 부위(예를 들어, 2가 양이온 결합 부위)를 가지며, 표적 핵산의 하나의 가닥(예를 들어, 이중-가닥 표적 DNA의 비-상보성 가닥)을 절단할 수 있다.RuvC and RuvC-like domains have an RNaseH or RNaseH-like fold. The RuvC/RNaseH domain is involved in a diverse set of nucleic acid-based functions and acts on both RNA and DNA. The RNaseH domain has five β-strands surrounded by multiple α-helices. RuvC/RNaseH and RuvC/RNaseH-like domains have a metal binding site (eg, a divalent cation binding site) and one strand of a target nucleic acid (eg, a non-complementary strand of a double-stranded target DNA) can be cut.

일부 실시형태에서, 부위-지정 폴리펩티드는 예시적인 야생형 부위-지정 폴리펩티드(예를 들어, 스트렙토코커스 피오게네스, US2014/0068797호 Sequence ID No. 8 또는 문헌[R. Sapranauskas et al., Nuc Acids Res (2011) 39(21):9275-82]으로부터의 Cas9) 및 다른 부위-지정 폴리펩티드와 적어도 10%, 적어도 15%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 또는 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 가진다.In some embodiments, the site-directed polypeptide is an exemplary wild-type site-directed polypeptide (eg, Streptococcus pyogenes, US2014/0068797 Sequence ID No. 8 or R. Sapranauskas et al., Nuc Acids Res (2011) 39 (21):9275-82) and other site-directed polypeptides with at least 10%, at least 15%, at least 20%, at least 30%, at least 40%, at least 50%, at least 60%, at least 70 %, at least 75%, at least 80%, at least 85%, at least 90%, at least 95%, at least 99% or 100% amino acid sequence identity.

일부 실시형태에서, 부위-지정 폴리펩티드는 예시적인 야생형 부위-지정 폴리펩티드(예를 들어, 스트렙토코커스 피오게네스로부터의 Cas9)의 뉴클레아제 도메인과 적어도 10%, 적어도 15%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 100% 아미노산 서열 동일성을 갖는 아미노산 서열을 가진다.In some embodiments, the site-directed polypeptide comprises at least 10%, at least 15%, at least 20%, at least a nuclease domain of an exemplary wild-type site-directed polypeptide (eg, Cas9 from Streptococcus pyogenes). 30%, at least 40%, at least 50%, at least 60%, at least 70%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95%, at least 99%, or 100% amino acid sequence identity It has an amino acid sequence with

일부 실시형태에서, 부위-지정 폴리펩티드는 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드(예를 들어, 스트렙토코커스 피오게네스로부터의 Cas9)와 적어도 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 가지는 DNA 엔도뉴클레아제이다. 일부 실시형태에서, 부위-지정 폴리펩티드는 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드와 최대 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 가진다. 일부 실시형태에서, 부위-지정 폴리펩티드는 부위-지정 폴리펩티드의 HNH 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드와 적어도 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 가진다. 일부 실시형태에서, 부위-지정 폴리펩티드는 부위-지정 폴리펩티드의 HNH 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드와 최대 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 가진다. 일부 실시형태에서, 부위-지정 폴리펩티드는 부위-지정 폴리펩티드의 RuvC 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드와 적어도 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 가진다. 일부 실시형태에서, 부위-지정 폴리펩티드는 부위-지정 폴리펩티드의 RuvC 뉴클레아제 도메인 내의 10개의 인접 아미노산에 걸쳐서 야생형 부위-지정 폴리펩티드와 최대 70, 75, 80, 85, 90, 95, 97, 99 또는 100% 동일성을 가진다.In some embodiments, the site-directed polypeptide is at least 70, 75, 80, 85, 90, 95, 97 with a wild-type site-directed polypeptide (eg, Cas9 from Streptococcus pyogenes) over 10 contiguous amino acids. , a DNA endonuclease with 99 or 100% identity. In some embodiments, the site-directed polypeptide has at most 70, 75, 80, 85, 90, 95, 97, 99 or 100% identity to the wild-type site-directed polypeptide over 10 contiguous amino acids. In some embodiments, the site-directed polypeptide comprises a wild-type site-directed polypeptide and at least 70, 75, 80, 85, 90, 95, 97, 99 or have 100% identity. In some embodiments, the site-directed polypeptide comprises a wild-type site-directed polypeptide and up to 70, 75, 80, 85, 90, 95, 97, 99 or have 100% identity. In some embodiments, the site-directed polypeptide comprises a wild-type site-directed polypeptide and at least 70, 75, 80, 85, 90, 95, 97, 99 or have 100% identity. In some embodiments, the site-directed polypeptide comprises a wild-type site-directed polypeptide and up to 70, 75, 80, 85, 90, 95, 97, 99 or have 100% identity.

일부 실시형태에서, 부위-지정 폴리펩티드는 예시적인 변형된 형태의 야생형 부위-지정 폴리펩티드를 가진다. 예시적인 변형된 형태의 야생형 부위-지정 폴리펩티드는 부위-지정 폴리펩티드의 핵산-절단 활성을 감소시키는 돌연변이를 가진다. 일부 실시형태에서, 예시적인 변형된 형태의 야생형 부위-지정 폴리펩티드는 90% 미만, 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1% 미만의 예시적인 야생형 부위-지정 폴리펩티드의 핵산-절단 활성을 갖는다. 변형된 형태의 부위-지정 폴리펩티드는 실질적인 핵산-절단 활성을 갖지 않을 수 있다. 부위-지정 폴리펩티드가 실질적인 핵산-절단 활성을 갖지 않는 변형된 형태인 경우, 그것은 본원에서 "효소적으로 불활성"인 것으로 지칭된다.In some embodiments, the site-directed polypeptide has an exemplary modified form of the wild-type site-directed polypeptide. Exemplary modified forms of the wild-type site-directed polypeptide have mutations that reduce the nucleic acid-cleaving activity of the site-directed polypeptide. In some embodiments, exemplary modified forms of wild-type site-directed polypeptides are less than 90%, less than 80%, less than 70%, less than 60%, less than 50%, less than 40%, less than 30%, less than 20%, 10 %, less than 5%, or less than 1% of the exemplary wild-type site-directed polypeptide has a nucleic acid-cleaving activity. The modified form of the site-directed polypeptide may not have substantial nucleic acid-cleaving activity. When a site-directed polypeptide is in a modified form that does not have substantial nucleic acid-cleaving activity, it is referred to herein as "enzymatically inactive."

일부 실시형태에서, 변형된 형태의 부위-지정 폴리펩티드는 돌연변이를 가져서, 그것은 (예를 들어, 이중-가닥 표적 핵산의 당-포스페이트 백본 중 단지 하나를 절단함으로써) 표적 핵산 상에 단일-가닥 파단(SSB)을 유도할 수 있게 한다. 일부 실시형태에서, 돌연변이는 야생형 부위 지정 폴리펩티드(예를 들어, 스트렙토코커스 피오게네스로부터의 Cas9)의 복수의 핵산-절단 도메인 중 하나 이상에서 90% 미만, 80% 미만, 70% 미만, 60% 미만, 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1% 미만의 핵산-절단 활성을 야기한다. 일부 실시형태에서, 돌연변이는 복수의 핵산-절단 도메인 중 하나 이상이 표적 핵산의 상보적인 가닥을 절단하는 능력을 보유하지만, 표적 핵산의 비-상보적인 가닥을 절단하는 그의 능력이 감소되게 한다. 일부 실시형태에서, 돌연변이는 복수의 핵산-절단 도메인 중 하나 이상이 표적 핵산의 비-상보적인 가닥을 절단하는 능력을 보유하지만, 표적 핵산의 상보적인 가닥을 절단하는 그의 능력이 감소되게 한다. 예를 들어, 예시적인 야생형 스트렙토코커스 피오게네스 Cas9 폴리펩티드 내의 잔기, 예컨대 Asp10, His840, Asn854 및 Asn856을 돌연변이시켜, 복수의 핵산-절단 도메인(예를 들어, 뉴클레아제 도메인) 중 하나 이상을 불활성화시킨다. 일부 실시형태에서, 돌연변이될 잔기는 (예를 들어, 서열 및/또는 구조적 정렬에 의해 결정시) 예시적인 야생형 스트렙토코커스 피오게네스 Cas9 폴리펩티드 내의 잔기 Asp10, His840, Asn854 및 Asn856에 상응한다. 돌연변이의 비-제한적인 예는 D10A, H840A, N854A 및 N856A를 포함한다. 해당 분야의 숙련자는 알라닌 치환 이외의 돌연변이가 적합하다는 것을 인식할 것이다.In some embodiments, the modified form of the site-directed polypeptide has a mutation such that it results in a single-stranded break on the target nucleic acid (e.g., by cleaving only one of the sugar-phosphate backbones of the double-stranded target nucleic acid). SSB) can be induced. In some embodiments, the mutation is less than 90%, less than 80%, less than 70%, 60% in one or more of the plurality of nucleic acid-cleaving domains of a wild-type site directed polypeptide (eg, Cas9 from Streptococcus pyogenes). less than, less than 50%, less than 40%, less than 30%, less than 20%, less than 10%, less than 5% or less than 1% nucleic acid-cleaving activity. In some embodiments, the mutation results in at least one of the plurality of nucleic acid-cleaving domains retaining the ability to cleave the complementary strand of the target nucleic acid, but reducing its ability to cleave the non-complementary strand of the target nucleic acid. In some embodiments, the mutation results in at least one of the plurality of nucleic acid-cleaving domains retaining the ability to cleave the non-complementary strand of the target nucleic acid, but reduced its ability to cleave the complementary strand of the target nucleic acid. For example, by mutating residues such as Asp10, His840, Asn854, and Asn856 in an exemplary wild-type Streptococcus pyogenes Cas9 polypeptide, one or more of the plurality of nucleic acid-cleavage domains (eg, nuclease domains) is cleaved. Activate it. In some embodiments, the residues to be mutated correspond to residues Asp10, His840, Asn854 and Asn856 in an exemplary wild-type Streptococcus pyogenes Cas9 polypeptide (eg, as determined by sequence and/or structural alignment). Non-limiting examples of mutations include D10A, H840A, N854A and N856A. Those skilled in the art will recognize that mutations other than alanine substitutions are suitable.

일부 실시형태에서, D10A 돌연변이를 H840A, N854A, 또는 N856A 돌연변이 중 하나 이상과 조합하여, DNA 절단 활성이 실질적으로 결여된 부위-지정 폴리펩티드를 생성한다. 일부 실시형태에서, H840A 돌연변이를 D10A, N854A, 또는 N856A 돌연변이 중 하나 이상과 조합하여, DNA 절단 활성이 실질적으로 결여된 부위-지정 폴리펩티드를 생성한다. 일부 실시형태에서, N854A 돌연변이를 H840A, D10A, 또는 N856A 돌연변이 중 하나 이상과 조합하여, DNA 절단 활성이 실질적으로 결여된 부위-지정 폴리펩티드를 생성한다. 일부 실시형태에서, N856A 돌연변이를 H840A, N854A, 또는 D10A 돌연변이 중 하나 이상과 조합하여, DNA 절단 활성이 실질적으로 결여된 부위-지정 폴리펩티드를 생성한다. 실질적으로 비활성인 뉴클레아제 도메인을 갖는 부위-지정 폴리펩티드는 "닉카아제(nickase)"로 지칭된다.In some embodiments, the D10A mutation is combined with one or more of the H840A, N854A, or N856A mutation to produce a site-directed polypeptide substantially lacking DNA cleavage activity. In some embodiments, the H840A mutation is combined with one or more of the D10A, N854A, or N856A mutation to produce a site-directed polypeptide substantially lacking DNA cleavage activity. In some embodiments, the N854A mutation is combined with one or more of the H840A, D10A, or N856A mutations to produce a site-directed polypeptide substantially lacking DNA cleavage activity. In some embodiments, the N856A mutation is combined with one or more of the H840A, N854A, or D10A mutation to produce a site-directed polypeptide substantially lacking DNA cleavage activity. A site-directed polypeptide having a substantially inactive nuclease domain is referred to as a “nickase”.

일부 실시형태에서, RNA-가이드된 엔도뉴클레아제, 예를 들어, Cas9의 닉카아제 변이체를 사용하여 CRISPR-매개된 게놈 편집의 특이성을 증가시킬 수 있다. 야생형 Cas9는 일반적으로 표적 서열(예컨대 내인성 게놈 유전자좌) 내의 명시된 약 20개의 뉴클레오티드 서열과 혼성화하도록 설계된 단일의 가이드 RNA에 의해 가이드된다. 그러나, 몇몇의 불일치가 가이드 RNA와 표적 유전자좌 사이에서 용인되어, 표적 부위에서 필요한 상동성의 길이를 예를 들어, 13개 뉴클레오티드 만큼 적은 상동성으로 효율적으로 감소시키고, 그에 의해 표적 게놈에서 다른 곳에서 CRISPR/Cas9 복합체에 의한 이중-가닥 핵산 절단 - 오프-표적 절단이라고도 공지됨- 및 결합에 대한 가능성을 증가시킬 수 있다. Cas9의 닉카아제 변이체는 각각 단지 하나의 가닥을 절단하기 때문에, 이중-가닥 파단을 생성하기 위하여, 닉카아제의 쌍이 표적 핵산의 매우 근접한 반대편 가닥에 결합하고, 그에 의해 이중-가닥 파단의 등가물인 한 쌍의 닉(nick)을 생성하는 것이 필요하다. 이는 2개의 개별 gRNA - 각각의 닉카아제에 대하여 하나 -가 표적 핵산의 매우 근접한 반대편 가닥 상에서 결합해야 하는 것이 필요하다. 이러한 요건은 이중-가닥 파단이 발생하는 데 필요한 상동성의 최소 길이를 본질적으로 배가시키고, 그에 의해 이중-가닥 절단 사건이 게놈 내의 다른 곳에서 일어날 가능성을 감소시키며, 여기서 2가지의 gRNA 부위 - 그들이 존재하는 경우 - 는 이중-가닥 파단이 일어나게 하기에 서로 충분히 가까울 가능성이 낮다. 해당 분야에 기술된 바와 같이, 닉카아제를 또한 사용하여 NHEJ에 비해서 HDR를 촉진시킬 수 있다. HDR을 사용하여 목적하는 변화를 효과적으로 매개하는 특이적 공여자 서열의 이용을 통해 게놈 내의 표적 부위 내로 선택된 변화를 도입할 수 있다. 유전자 편집에서 사용하기 위한 CRISPR/Cas 시스템의 설명은 예를 들어, 국제 특허 출원 공개 제WO2013/176772호; 및 문헌[J.D. Sander et al., Nature Biotech (2014) 32:347-55], 및 이들에 언급된 참고문헌에서 찾아볼 수 있다.In some embodiments, RNA-guided endonucleases, such as nickase variants of Cas9, can be used to increase the specificity of CRISPR-mediated genome editing. Wild-type Cas9 is generally guided by a single guide RNA designed to hybridize to a specified about 20 nucleotide sequence within a target sequence (eg, an endogenous genomic locus). However, several discrepancies are tolerated between the guide RNA and the target locus, effectively reducing the length of homology required at the target site to as little as 13 nucleotides, for example, and thereby CRISPR elsewhere in the target genome. /Cas9 complex may increase the likelihood of double-stranded nucleic acid cleavage - also known as off-target cleavage - and binding. Because nickase variants of Cas9 each cleave only one strand, in order to create a double-stranded break, a pair of nickases binds to opposite strands in close proximity of the target nucleic acid, thereby resulting in the equivalent of a double-stranded break. It is necessary to create a pair of nicks. This requires that two separate gRNAs - one for each nickase - bind on opposite strands in close proximity of the target nucleic acid. This requirement essentially doubles the minimum length of homology required for a double-stranded break to occur, thereby reducing the likelihood that a double-stranded break event will occur elsewhere in the genome, where there are two gRNA sites - where they exist. If - is unlikely to be close enough to each other to cause a double-stranded break to occur. As described in the art, nickases can also be used to promote HDR compared to NHEJ. HDR can be used to introduce selected changes into target sites in the genome through the use of specific donor sequences that effectively mediate the desired change. Descriptions of CRISPR/Cas systems for use in gene editing are described, for example, in WO2013/176772; and JD Sander et al., Nature Biotech (2014) 32: 347-55], and the references cited therein.

일부 실시형태에서, 부위-지정 폴리펩티드(예를 들어, 변이체, 돌연변이된, 효소적으로 비활성 및/또는 조건부로 효소적으로 비활성인 부위-지정 폴리펩티드)는 핵산을 표적화한다. 일부 실시형태에서, 부위-지정 폴리펩티드는 DNA를 표적화한다. 일부 실시형태에서, 부위-지정 폴리펩티드는 RNA를 표적화한다.In some embodiments, a site-directed polypeptide (eg, a variant, mutated, enzymatically inactive and/or conditionally enzymatically inactive site-directed polypeptide) targets a nucleic acid. In some embodiments, the site-directed polypeptide targets DNA. In some embodiments, the site-directed polypeptide targets RNA.

일부 실시형태에서, 부위-지정 폴리펩티드는 하나 이상의 비-고유 서열을 가진다(예를 들어, 부위-지정 폴리펩티드는 융합 단백질이다).In some embodiments, the site-directed polypeptide has one or more non-native sequences (eg, the site-directed polypeptide is a fusion protein).

일부 실시형태에서, 부위-지정 폴리펩티드는 박테리아(예를 들어, 스트렙토코커스 피오게네스)로부터의 Cas9와 적어도 15% 아미노산 동일성을 가지는 아미노산 서열, 핵산 결합 도메인, 및 2개의 핵산 절단 도메인(예를 들어, HNH 도메인 및 RuvC 도메인)을 가진다.In some embodiments, the site-directed polypeptide comprises an amino acid sequence having at least 15% amino acid identity with Cas9 from a bacterium (eg, Streptococcus pyogenes), a nucleic acid binding domain, and two nucleic acid cleavage domains (eg, , HNH domain and RuvC domain).

일부 실시형태에서, 부위-지정 폴리펩티드는 박테리아로부터의 Cas9와 적어도 15% 아미노산 동일성을 가지는 아미노산 서열, 및 2개의 핵산 절단 도메인(즉, HNH 도메인 및 RuvC 도메인)을 가진다.In some embodiments, the site-directed polypeptide has an amino acid sequence having at least 15% amino acid identity with Cas9 from bacteria, and two nucleic acid cleavage domains (ie, a HNH domain and a RuvC domain).

일부 실시형태에서, 부위-지정 폴리펩티드는 박테리아로부터의 Cas9와 적어도 15% 아미노산 동일성을 가지는 아미노산 서열, 및 2개의 핵산 절단 도메인을 가지며, 여기서 핵산 절단 도메인 중 하나 또는 둘 모두는 박테리아로부터의 Cas9로부터의 뉴클레아제 도메인과 적어도 50% 아미노산 동일성을 가진다.In some embodiments, the site-directed polypeptide has an amino acid sequence having at least 15% amino acid identity with Cas9 from the bacterium, and two nucleic acid cleavage domains, wherein one or both nucleic acid cleavage domains are from Cas9 from the bacterium. has at least 50% amino acid identity with the nuclease domain.

일부 실시형태에서, 부위-지정 폴리펩티드는 박테리아로부터의 Cas9와 적어도 15% 아미노산 동일성을 가지는 아미노산 서열, 2개의 핵산 절단 도메인(예를 들어, HNH 도메인 및 RuvC 도메인), 및 비-고유 서열(예를 들어, 핵 국소화 신호) 또는 부위-지정 폴리펩티드를 비-고유 서열에 연결하는 링커를 가진다.In some embodiments, the site-directed polypeptide comprises an amino acid sequence having at least 15% amino acid identity with Cas9 from bacteria, two nucleic acid cleavage domains (e.g., HNH domain and RuvC domain), and a non-native sequence (e.g., for example, a nuclear localization signal) or a linker that connects the site-directed polypeptide to a non-native sequence.

일부 실시형태에서, 부위-지정 폴리펩티드는 박테리아로부터의 Cas9와 적어도 15% 아미노산 동일성을 가지는 아미노산 서열, 2개의 핵산 절단 도메인(예를 들어, HNH 도메인 및 RuvC 도메인)을 가지며, 여기서 부위-지정 폴리펩티드는 뉴클레아제 도메인의 절단 활성을 적어도 50% 감소시키는 핵산 절단 도메인 중 하나 또는 둘 모두에 돌연변이를 가진다.In some embodiments, the site-directed polypeptide has an amino acid sequence having at least 15% amino acid identity with Cas9 from a bacterium, two nucleic acid cleavage domains (eg, a HNH domain and a RuvC domain), wherein the site-directed polypeptide comprises: having a mutation in one or both of the nucleic acid cleavage domains that reduces the cleavage activity of the nuclease domain by at least 50%.

일부 실시형태에서, 부위-지정 폴리펩티드는 박테리아로부터의 Cas9와 적어도 15% 아미노산 동일성을 가지는 아미노산 서열, 및 2개의 핵산 절단 도메인(예를 들어, HNH 도메인 및 RuvC 도메인)을 가지며, 여기서 뉴클레아제 도메인 중 하나는 아스파르트산 10의 돌연변이를 가지고/가지거나, 뉴클레아제 도메인 중 하나는 히스티딘 840의 돌연변이를 가지고, 돌연변이는 뉴클레아제 도메인(들)의 절단 활성을 적어도 50% 감소시킨다.In some embodiments, the site-directed polypeptide has an amino acid sequence having at least 15% amino acid identity with Cas9 from a bacterium, and two nucleic acid cleavage domains (eg, a HNH domain and a RuvC domain), wherein the nuclease domain one of the nuclease domains has a mutation of aspartic acid 10 and/or one of the nuclease domains has a mutation of histidine 840, wherein the mutation reduces the cleavage activity of the nuclease domain(s) by at least 50%.

일부 실시형태에서, 하나 이상의 부위-지정 폴리펩티드, 예를 들어 DNA 엔도뉴클레아제는 게놈 내의 특정 유전자좌에서 하나의 이중-가닥 파단을 함께 야기하는 2개의 닉카아제, 또는 게놈 내의 특정 유전자좌에서 2개의 이중-가닥 파단을 함께 야기하는 4개의 닉카아제를 포함한다. 대안적으로, 하나의 부위-지정 폴리펩티드는 게놈 내의 특정 유전자좌에 하나의 이중-가닥 파단을 야기한다.In some embodiments, the one or more site-directed polypeptides, e.g., DNA endonucleases, are two nickases that together cause one double-strand break at a particular locus in the genome, or two nickases at a particular locus in the genome. It contains four nickases that together cause double-strand breaks. Alternatively, one site-directed polypeptide causes one double-stranded break at a particular locus in the genome.

일부 실시형태에서, 부위-지정 폴리펩티드를 인코딩하는 폴리뉴클레오티드는 게놈 편집에 사용될 수 있다. 그러한 실시형태 중 일부에서, 부위-지정 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 관심 표적 DNA를 함유하는 세포에서의 발현을 위하여 해당 분야의 알려진 방법에 따라 코돈-최적화한다. 예를 들어, 의도된 표적 핵산이 인간 세포에 존재하는 경우, Cas9를 인코딩하는 인간 코돈-최적화된 폴리뉴클레오티드가 Cas9 폴리펩티드의 생성에 사용될 수 있다.In some embodiments, polynucleotides encoding site-directed polypeptides can be used for genome editing. In some of such embodiments, the polynucleotide encoding the site-directed polypeptide is codon-optimized according to methods known in the art for expression in cells containing the target DNA of interest. For example, when the intended target nucleic acid is present in a human cell, a human codon-optimized polynucleotide encoding Cas9 can be used for the production of a Cas9 polypeptide.

하기는 본 개시내용의 실시형태에서 사용될 수 있는 부위-지정 폴리펩티드의 몇몇의 예를 제공한다.The following provides some examples of site-directed polypeptides that may be used in embodiments of the present disclosure.

CRISPR 엔도뉴클레아제 시스템CRISPR endonuclease system

CRISPR(클러스터링된 규칙적 간격의 짧은 회문 반복부) 게놈 유전자좌가 다수의 원핵생물(예를 들어, 박테리아 및 고세균)의 게놈에서 발견될 수 있다. 원핵생물에서, CRISPR 유전자좌는 면역계의 유형으로서 기능하여 외래 침입자, 예컨대 바이러스 및 파지에 대하여 원핵생물을 방어하는 것을 돕는 생성물을 인코딩한다. CRISPR 유전자좌 기능의 3 단계가 존재한다: CRISPR 유전자좌 내로의 새로운 서열의 통합, CRISPR RNA(crRNA)의 발현, 및 외래 침입자 핵산의 침묵화(silencing). 5가지 유형의 CRISPR 시스템(예를 들어, I형, II형, III형, U형 및 V형)이 확인된 바 있다.CRISPR (clustered regularly spaced short palindromic repeats) genomic loci can be found in the genomes of many prokaryotes (eg, bacteria and archaea). In prokaryotes, the CRISPR locus encodes a product that functions as a type of immune system and helps defend the prokaryotes against foreign invaders such as viruses and phages. There are three stages of CRISPR locus function: integration of new sequences into the CRISPR locus, expression of CRISPR RNA (crRNA), and silencing of foreign invader nucleic acids. Five types of CRISPR systems have been identified (eg, types I, II, III, U and V).

CRISPR 유전자좌는 "반복부"라 지칭되는 다수의 짧은 반복부 서열을 포함한다. 반복부는 발현되는 경우, 이차 헤어핀 구조(예를 들어, 헤어핀)를 형성할 수 있고/있거나 비구조화된 단일-가닥 서열을 가질 수 있다. 반복부는 통상적으로 클러스터로 발생하고, 빈번하게는 종들 사이에서 분기된다. 반복부는 "스페이서"라고 지칭되는 독특한 개재 서열이 규칙적으로 산재되어, 반복부-스페이서-반복부 유전자좌 구조를 야기한다. 스페이서는 공지된 외래 침입자 서열과 동일하거나 또는 이와 높은 상동성을 갖는다. 스페이서-반복부 단위는 crRNA를 인코딩하는데, 이것은 스페이서-반복부 단위의 성숙 형태로 가공된다. crRNA는 표적 핵산(원핵생물에서의 자연 발생 형태에서, 스페이서 서열은 외래 침입자 핵산을 표적화함)을 표적화하는 데 관여되는 "씨드" 또는 스페이서 서열을 가진다. 스페이서 서열은 crRNA의 5' 또는 3' 말단에 위치된다.The CRISPR locus contains a number of short repeat sequences referred to as “repeats”. Repeats, when expressed, may form secondary hairpin structures (eg, hairpins) and/or may have unstructured single-stranded sequences. Repeats usually occur in clusters, frequently diverging between species. Repeats are regularly interspersed with unique intervening sequences referred to as “spacers”, resulting in a repeat-spacer-repeat locus structure. The spacer is identical to or highly homologous to a known foreign invader sequence. The spacer-repeat unit encodes a crRNA, which is processed into the mature form of the spacer-repeat unit. A crRNA has a "seed" or spacer sequence that is involved in targeting a target nucleic acid (in its naturally occurring form in prokaryotes, the spacer sequence targets a foreign invader nucleic acid). A spacer sequence is located at the 5' or 3' end of the crRNA.

CRISPR 유전자좌는 또한 CRISPR 연관(Cas) 유전자를 인코딩하는 폴리뉴클레오티드 서열을 가진다. Cas 유전자는 원핵생물에서 생물발생 및 crRNA 기능의 간섭 단계에 관여되는 엔도뉴클레아제를 인코딩한다. 일부 Cas 유전자는 상동성 2차 및/또는 3차 구조를 가진다.The CRISPR locus also has a polynucleotide sequence encoding a CRISPR associated (Cas) gene. The Cas gene encodes an endonuclease involved in the interfering steps of biogenesis and crRNA function in prokaryotes. Some Cas genes have homologous secondary and/or tertiary structures.

II형 CRISPR 시스템Type II CRISPR System

자연에서 II형 CRISPR 시스템에서의 crRNA 생물발생은 트랜스-활성화 CRISPR RNA(tracrRNA)를 요구한다. tracrRNA는 내인성 RNaseIII에 의해 변형되고, 이어서 pre-crRNA 어레이의 crRNA 반복부로 혼성화한다. 내인성 RNaseIII은 동원되어 pre-crRNA를 절단한다. 절단된 crRNA는 엑소리보뉴클레아제 트리밍을 겪어 성숙 crRNA 형태(예를 들어, 5' 트리밍)를 생성한다. tracrRNA는 crRNA에 혼성화되어 유지되고, tracrRNA 및 crRNA는 부위-지정 폴리펩티드(예를 들어, Cas9)와 회합된다. crRNA-tracrRNA-Cas9 복합체의 crRNA는 복합체를 crRNA가 혼성화할 수 있는 표적 핵산으로 가이드한다. 표적 핵산으로의 crRNA의 혼성화는 표적화된 핵산 절단을 위하여 Cas9를 활성화시킨다. II형 CRISPR 시스템에서 표적 핵산은 프로토스페이서 인접 모티프(PAM)로서 지칭된다. 자연에서, PAM은 표적 핵산으로의 부위-지정 폴리펩티드(예를 들어, Cas9)의 결합을 용이하게 하는 데 필수적이다. II형 시스템(Nmeni 또는 CASS4로도 지칭됨)은 II-A(CASS4) 및 II-B(CASS4a)형으로 추가로 분류된다. 상기 문헌[M. Jinek et al.]은 CRISPR/Cas9 시스템이 RNA-프로그래밍 가능한 게놈 편집에 유용하다는 것을 보고하며, 국제 특허 출원 공개 제WO2013/176772호는 부위-특이적 유전자 편집을 위한 CRISPR/Cas 엔도뉴클레아제 시스템의 다수의 예 및 적용을 제공한다.CrRNA biogenesis in the type II CRISPR system in nature requires trans-activating CRISPR RNA (tracrRNA). The tracrRNA is modified by endogenous RNaseIII, which then hybridizes to the crRNA repeats of the pre-crRNA array. Endogenous RNase III is recruited to cleave pre-crRNA. The cleaved crRNA undergoes exoribonuclease trimming to generate a mature crRNA form (eg, 5' trimmed). The tracrRNA remains hybridized to the crRNA, and the tracrRNA and crRNA are associated with a site-directed polypeptide (eg, Cas9). The crRNA of the crRNA-tracrRNA-Cas9 complex guides the complex to a target nucleic acid to which the crRNA can hybridize. Hybridization of crRNA to a target nucleic acid activates Cas9 for targeted nucleic acid cleavage. In type II CRISPR systems the target nucleic acid is referred to as a protospacer adjacent motif (PAM). In nature, PAM is essential to facilitate binding of a site-directed polypeptide (eg, Cas9) to a target nucleic acid. Type II systems (also referred to as Nmeni or CASS4) are further classified into types II-A (CASS4) and II-B (CASS4a). The literature [M. Jinek et al.] report that the CRISPR/Cas9 system is useful for RNA-programmable genome editing, and WO2013/176772 describes the CRISPR/Cas endonuclease system for site-specific gene editing. provides numerous examples and applications of

V형 CRISPR 시스템V-Type CRISPR System

V형 CRISPR 시스템은 II형 시스템과 몇몇 중요한 차이를 갖는다. 예를 들어, Cpf1은 II형 시스템과 대조적으로, tracrRNA가 결여된 단일의 RNA-가이드된 엔도뉴클레아제이다. 사실상, Cpf1-연관 CRISPR 어레이는 추가의 트랜스-활성화 tracrRNA의 요구 없이 성숙 crRNA로 가공된다. V형 CRISPR 어레이는 42 내지 44개의 뉴클레오티드 길이의 짧은 성숙 crRNA로 가공되고, 각각의 성숙 crRNA는 19개의 뉴클레오티드의 직접 반복부로 시작하여 23 내지 25개의 뉴클레오티드의 스페이서 서열로 이어진다. 이에 반해서, II형 시스템의 성숙 crRNA는 20 내지 24개의 뉴클레오티드의 스페이서 서열로 시작하여 약 22개 뉴클레오티드의 직접 반복부로 이어진다. 또한, Cpf1은 T-풍부 프로토스페이서-인접 모티프를 사용하여 Cpf1-crRNA 복합체가 II형 시스템에 대한 표적 DNA 이후의 G-풍부 PAM과 대조적으로, 짧은 T-풍부 PAM 이후의 표적 DNA를 효율적으로 절단하게 한다. 따라서, V형 시스템은 PAM로부터 원위인 점에서 절단하는 반면, II형 시스템은 PAM에 인접한 점에서 절단한다. 또한, II형 시스템과 대조적으로, Cpf1은 4 또는 5개 뉴클레오티드의 5' 오버행을 갖는 엇갈린 DNA 이중-가닥 파단을 통해 DNA를 절단한다. II형 시스템은 블런트(blunt) 이중-가닥 파단을 통해 절단한다. II형 시스템과 유사하게, Cpf1은 예측된 RuvC-유사 엔도뉴클레아제 도메인을 함유하지만, 제2 HNH 엔도뉴클레아제 도메인이 결여되는데, 이는 II형 시스템과 대조적이다.The type V CRISPR system has several important differences from the type II system. For example, Cpf1 is a single RNA-guided endonuclease lacking tracrRNA, in contrast to the type II system. In fact, Cpf1-associated CRISPR arrays are engineered into mature crRNAs without the need for additional trans-activating tracrRNAs. Type V CRISPR arrays are engineered into short mature crRNAs of 42-44 nucleotides in length, each mature crRNA starting with a direct repeat of 19 nucleotides followed by a spacer sequence of 23-25 nucleotides. In contrast, mature crRNAs of type II systems begin with a spacer sequence of 20 to 24 nucleotides followed by a direct repeat of about 22 nucleotides. Moreover, Cpf1 uses a T-rich protospacer-adjacent motif to efficiently cleave the target DNA following the short T-rich PAM, in contrast to the G-rich PAM following the target DNA for the type II system, where the Cpf1-crRNA complexes make it Thus, type V systems cleave at points distal from the PAM, whereas type II systems cleave at points proximal to the PAM. Also, in contrast to type II systems, Cpf1 cleaves DNA through staggered DNA double-strand breaks with 5' overhangs of 4 or 5 nucleotides. Type II systems cut through blunt double-strand breaks. Similar to the type II system, Cpf1 contains the predicted RuvC-like endonuclease domain, but lacks a second HNH endonuclease domain, in contrast to the type II system.

Cas 유전자/폴리펩티드 및 프로토스페이서 인접 모티프Cas gene/polypeptide and protospacer adjacent motifs

예시적인 CRISPR/Cas 폴리펩티드는 문헌[I. Fonfara et al., Nucleic Acids Res. (2014) 42:2577-90]의 도 1에서의 Cas9 폴리펩티드를 포함한다. CRISPR/Cas 유전자 명명 시스템은 과도한 재기록을 겪었는데, 그 이유는 Cas 유전자가 발견되었기 때문이다. 상기 문헌[Fonfara]의 도 5는 상이한 종으로부터의 Cas9 폴리펩티드에 대한 PAM 서열을 제공한다.Exemplary CRISPR/Cas polypeptides are described in I. Fonfara et al., Nucleic Acids Res. (2014) 42 :2577-90]. The CRISPR/Cas gene naming system underwent excessive rewriting because the Cas gene was discovered. 5 of Fonfara, supra, provides PAM sequences for Cas9 polypeptides from different species.

게놈-표적화 핵산과 부위-지정 폴리펩티드의 복합체Complexes of genome-targeting nucleic acids and site-directed polypeptides

게놈-표적화 핵산은 부위-지정 폴리펩티드(예를 들어, 핵산-가이드된 뉴클레아제, 예컨대 Cas9)와 상호작용하고, 그에 의해 복합체를 형성한다. 게놈-표적화 핵산(예를 들어, gRNA)은 부위-지정 폴리펩티드를 표적 핵산으로 가이드한다.A genome-targeting nucleic acid interacts with, and forms a complex with, a site-directed polypeptide (eg, a nucleic acid-guided nuclease such as Cas9). A genome-targeting nucleic acid (eg, gRNA) guides a site-directed polypeptide to a target nucleic acid.

이전에 언급된 바와 같이, 일부 실시형태에서, 부위-지정 폴리펩티드 및 게놈-표적화 핵산은 각각 세포 또는 대상체로 개별적으로 투여될 수 있다. 일부 실시형태에서, 부위-지정 폴리펩티드는 하나 이상의 가이드 RNA, 또는 tracrRNA와 함께 하나 이상의 crRNA와 사전-복합체화될 수 있다. 그 다음, 사전-복합체화된 물질을 세포 또는 대상체에게 투여할 수 있다. 이러한 사전-복합체화된 물질은 리보핵단백질 입자(RNP)로 알려져 있다.As previously noted, in some embodiments, the site-directed polypeptide and the genome-targeting nucleic acid may each be administered separately to a cell or subject. In some embodiments, the site-directed polypeptide may be pre-complexed with one or more guide RNAs, or one or more crRNAs along with tracrRNAs. The pre-complexed material can then be administered to the cell or subject. These pre-complexed substances are known as ribonucleoprotein particles (RNPs).

게놈 편집을 위한 시스템Systems for genome editing

게놈 편집을 위한, 특히 합성 FVIII 코딩 서열을 세포의 게놈 내로 삽입하기 위한 시스템이 본원에 제공된다. 이들 시스템은 본원에 기술된 방법에서, 예컨대 세포의 게놈을 편집하기 위하여, 그리고 대상체, 예를 들어, A형 혈우병을 갖는 대상체를 치료하기 위하여 사용될 수 있다.Provided herein are systems for genome editing, particularly for inserting synthetic FVIII coding sequences into the genome of a cell. These systems can be used in the methods described herein, such as to edit the genome of a cell, and to treat a subject, eg, a subject with hemophilia A.

일부 실시형태에서, (a) DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; (b) 세포의 게놈 내의 알부민 유전자좌를 표적화하는 gRNA; 및 (c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형을 포함하는 시스템이 본원에 제공된다. 일부 실시형태에서, gRNA는 알부민 유전자의 인트론 1을 표적화한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 271 내지 298 중 어느 하나의 스페이서 서열을 포함한다.In some embodiments, (a) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; (b) a gRNA that targets the albumin locus in the genome of the cell; and (c) a donor template comprising a nucleic acid sequence encoding a synthetic FVIII protein. In some embodiments, the gRNA targets intron 1 of the albumin gene. In some embodiments, the gRNA comprises a spacer sequence of any one of SEQ ID NOs: 271-298.

일부 실시형태에서, (a) 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; (b) SEQ ID NO: 271 내지 298 중 어느 하나로부터의 스페이서 서열을 포함하는 가이드 RNA(gRNA); 및 (c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형을 포함하는 시스템이 본원에 제공된다. 일부 실시형태에서, gRNA는 SEQ ID NO: 274, 275, 281, 및 283중 어느 하나의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 274의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 275 의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 281 의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 283 의 스페이서 서열을 포함한다.In some embodiments, (a) a deoxyribonucleic acid (DNA) endonuclease or a nucleic acid encoding a DNA endonuclease; (b) a guide RNA (gRNA) comprising a spacer sequence from any one of SEQ ID NOs: 271-298; and (c) a donor template comprising a nucleic acid sequence encoding a synthetic FVIII protein. In some embodiments, the gRNA comprises a spacer sequence of any one of SEQ ID NOs: 274, 275, 281, and 283. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 274. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 275. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 281. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 283.

일부 실시형태에서, 본원에 기재된 시스템 중 임의의 것에 따르면, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12로도 알려짐), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 또는 Cpf1 엔도뉴클레아제, 또는 그의 기능성 등가물로 이루어진 군으로부터 선택된다. 일부 실시형태에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스(spCas9)로부터의 것이다. 일부 구현예에서, Cas9는 스타필로코커스 루주네시스(SluCas9)로부터의 것이다.In some embodiments, according to any of the systems described herein, the DNA endonuclease comprises Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb1, Csb2, Csx17, Csx14, Csb2 Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, or Cpf1 endonuclease, or a functional equivalent thereof. In some embodiments, the DNA endonuclease is Cas9. In some embodiments, the Cas9 is from Streptococcus pyogenes ( spCas9). In some embodiments, the Cas9 is from Staphylococcus lugenesis (SluCas9).

일부 실시형태에서, 본원에 기재된 시스템에 따르면, 합성 FVIII 단백질을 인코딩하는 핵산 서열은 숙주 세포에서의 발현을 위하여 코돈-최적화된다. 일부 실시형태에서, 합성 FVIII 단백질을 인코딩하는 핵산 서열은 인간 세포에서의 발현을 위하여 코돈-최적화된다.In some embodiments, in accordance with the systems described herein, the nucleic acid sequence encoding the synthetic FVIII protein is codon-optimized for expression in a host cell. In some embodiments, the nucleic acid sequence encoding the synthetic FVIII protein is codon-optimized for expression in a human cell.

일부 실시형태에서, 본원에 기술된 시스템 중 어느 하나에 따라, 시스템은 DNA 엔도뉴클레아제를 인코딩하는 핵산을 포함한다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 숙주 세포 내의 발현을 위해 코돈-최적화된다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 인간 세포 내의 발현을 위해 코돈-최적화된다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA, 예를 들어 DNA 플라스미드이다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 RNA, 예를 들어 mRNA이다.In some embodiments, according to any one of the systems described herein, the system comprises a nucleic acid encoding a DNA endonuclease. In some embodiments, the nucleic acid encoding the DNA endonuclease is codon-optimized for expression in a host cell. In some embodiments, the nucleic acid encoding the DNA endonuclease is codon-optimized for expression in a human cell. In some embodiments, the nucleic acid encoding the DNA endonuclease is DNA, eg, a DNA plasmid. In some embodiments, the nucleic acid encoding the DNA endonuclease is RNA, eg, mRNA.

일부 실시형태에서, 본원에 기술된 시스템 중 어느 하나에 따라, 공여자 주형은 AAV 벡터에 인코딩된다. 일부 실시형태에서, 공여자 주형은 합성 FVIII 코딩 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 한 측 또는 양 측에서 gRNA 표적 부위에 측접한다. 일부 실시형태에서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 측접한다. 일부 실시형태에서, gRNA 표적 부위는 시스템 내의 gRNA에 대한 표적 부위이다. 일부 실시형태에서, 공여자 주형의 gRNA 표적 부위는 시스템 내의 gRNA에 대한 세포 게놈 gRNA 표적 부위의 역 상보물이다.In some embodiments, according to any one of the systems described herein, the donor template is encoded in an AAV vector. In some embodiments, the donor template comprises a donor cassette comprising a synthetic FVIII coding sequence, the donor cassette flanked by the gRNA target site on one or both sides. In some embodiments, the donor cassette flanks the gRNA target site on both sides. In some embodiments, the gRNA target site is a target site for a gRNA in the system. In some embodiments, the gRNA target site of the donor template is the reverse complement of the cellular genomic gRNA target site to the gRNA in the system.

일부 실시형태에서, 본원에 기술된 시스템 중 어느 하나에 따라, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포좀 또는 지질 나노입자 내에 제형화된다. 일부 실시형태에서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함한다. 일부 실시형태에서, 리포좀 또는 지질 나노입자는 지질 나노입자이다. 일부 실시형태에서, 시스템은 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 포함한다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.In some embodiments, according to any one of the systems described herein, a DNA endonuclease or a nucleic acid encoding a DNA endonuclease is formulated in liposomes or lipid nanoparticles. In some embodiments, the liposome or lipid nanoparticle also comprises a gRNA. In some embodiments, the liposomes or lipid nanoparticles are lipid nanoparticles. In some embodiments, the system comprises a lipid nanoparticle comprising a nucleic acid encoding a DNA endonuclease and a gRNA. In some embodiments, the nucleic acid encoding a DNA endonuclease is an mRNA encoding a DNA endonuclease.

일부 실시형태에서, 본원에 기술된 시스템 중 어느 하나에 따라, DNA 엔도뉴클레아제는 gRNA와 복합체화되어 RNP 복합체를 형성한다.In some embodiments, according to any one of the systems described herein, the DNA endonuclease is complexed with the gRNA to form an RNP complex.

게놈 편집 방법Genome editing methods

게놈 편집, 특히 세포의 게놈 내로의 그의 합성 FVIII 단백질의 삽입 방법이 본원에 제공된다. 이 방법을 사용하여 대상체, 예를 들어, A형 혈우병을 갖는 환자를 치료할 수 있으며, 이러한 경우에, 세포는 대상체 또는 개별 공여자로부터 단리될 수 있다. 다음으로, 세포의 염색체 DNA를 본원에 기술된 물질 및 방법을 사용하여 편집한다.Provided herein are methods of genome editing, particularly insertion of its synthetic FVIII protein into the genome of a cell. This method can be used to treat a subject, eg, a patient with hemophilia A, in which case the cells can be isolated from the subject or individual donor. The chromosomal DNA of the cell is then edited using the materials and methods described herein.

합성 FVIII 코딩 서열을 게놈 내로 낙-인(knock-in)시키는 방법이 본원에 제공된다. 일 양태에서, 본 개시내용은 세포의 게놈 내로의 합성 FVIII 코딩 서열의 핵산 서열, 즉, 합성 FVIII 단백질을 인코딩하는 핵산 서열의 삽입을 제공한다. 합성 FVIII 단백질은 야생형 FVIII 단백질의 상당한 활성, 예를 들어, 야생형 FVIII 단백질이 발현하는 활성의 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 95% 또는 약 100%를 가지는 펩티드를 포함할 수 있다. 일부 실시형태에서, 당업자는 당분야에 알려진 여러 방법을 사용하여 화합물, 예를 들어 펩티드 또는 단백질의 기능성 또는 활성을 테스트할 수 있다. 일부 실시형태에서, 합성 FVIII 단백질은 또한 야생형 FVIII 단백질의 임의의 단편, 또는 전장, 야생형 FVIII 단백질 내의 아미노산 잔기 중 하나 이상에 보존적 변형을 갖는 변형된 FVIII 단백질의 단편을 포함할 수 있다. 일부 실시형태에서, 합성 FVIII 단백질은 또한 야생형 FVIII 단백질의 기능에 실질적으로 부정적으로 영향을 미치지 않는 하나 이상의 아미노산의 임의의 변형(들), 예를 들어, 결실, 삽입 및/또는 돌연변이를 포함할 수 있다. 따라서, 일부 실시형태에서, 합성 FVIII 코딩 서열의 핵산 서열은 FVIII 코딩 서열에 대해 적어도 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 85%, 약 90%, 약 95%, 약 96%, 약 97%, 약 98% 또는 약 99% 핵산 서열 동일성을 가질 수 있다.Provided herein are methods of knocking in a synthetic FVIII coding sequence into a genome. In one aspect, the disclosure provides for insertion of a nucleic acid sequence of a synthetic FVIII coding sequence, ie, a nucleic acid sequence encoding a synthetic FVIII protein, into the genome of a cell. The synthetic FVIII protein has a significant activity of the wild-type FVIII protein, e.g., at least about 30%, about 40%, about 50%, about 60%, about 70%, about 80%, about 90% of the activity expressed by the wild-type FVIII protein. %, about 95% or about 100%. In some embodiments, one of ordinary skill in the art can test the functionality or activity of a compound, eg, a peptide or protein, using several methods known in the art. In some embodiments, the synthetic FVIII protein may also include any fragment of a wild-type FVIII protein, or a fragment of a modified FVIII protein having conservative modifications in one or more of the amino acid residues in the full-length, wild-type FVIII protein. In some embodiments, the synthetic FVIII protein may also comprise any modification(s), e.g., deletions, insertions and/or mutations, of one or more amino acids that do not substantially negatively affect the function of the wild-type FVIII protein. there is. Thus, in some embodiments, the nucleic acid sequence of the synthetic FVIII coding sequence is at least about 30%, about 40%, about 50%, about 60%, about 70%, about 80%, about 85%, about 90%, about 95%, about 96%, about 97%, about 98% or about 99% nucleic acid sequence identity.

일부 실시형태에서, 합성 FVIII 코딩 서열은 세포 내의 게놈 서열 내로 삽입된다. 일부 실시형태에서, 삽입 부위는 세포의 게놈 내의 알부민 유전자좌, 트랜스페린 유전자좌 또는 피브리노겐 알파 유전자좌에 또는 그 내에 존재한다. 일부 실시형태에서, 삽입 부위는 알부민 유전자좌이다. 삽입 방법은 알부민 유전자의 제1 인트론(또는 인트론 1)을 표적화하는 하나 이상의 gRNA를 사용한다. 일부 실시형태에서, 공여자 DNA는 합성 FVIII 코딩 서열을 갖는 단일 또는 이중-가닥 DNA이다.In some embodiments, the synthetic FVIII coding sequence is inserted into a genomic sequence in a cell. In some embodiments, the insertion site is at or within the albumin locus, transferrin locus, or fibrinogen alpha locus in the genome of the cell. In some embodiments, the insertion site is an albumin locus. The insertion method uses one or more gRNAs that target the first intron (or intron 1) of the albumin gene. In some embodiments, the donor DNA is single or double-stranded DNA having a synthetic FVIII coding sequence.

일부 실시형태에서, 게놈 편집 방법은 DNA 엔도뉴클레아제, 예컨대 CRISPR/Cas 시스템을 사용하여, 합성 FVIII 코딩 서열을 유전학적으로 도입(낙-인)한다. 일부 실시형태에서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12로도 알려짐), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 또는 Cpf1 엔도뉴클레아제, 또는 그의 상동체, 천연 발생 분자의 재조합, 그의 코돈-최적화 또는 변형된 버전, 및 전술한 것들 중 임의의 조합이다. 일부 실시형태에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 스트렙토코커스 피오게네스(spCas9)로부터의 것이다. 일부 구현예에서, Cas9는 스타필로코커스 루주네시스(SluCas9)로부터의 것이다.In some embodiments, the genome editing method uses a DNA endonuclease, such as the CRISPR/Cas system, to genetically introduce (smark-in) a synthetic FVIII coding sequence. In some embodiments, the DNA endonuclease is Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx3, Csx15, Csx10, Csx16, Csx10, Csx15, Csx10 Csf1, Csf2, Csf3, Csf4, or Cpf1 endonuclease, or homologues thereof, recombination of naturally occurring molecules, codon-optimized or modified versions thereof, and combinations of any of the foregoing. In some embodiments, the DNA endonuclease is Cas9. In some embodiments, the Cas9 is from Streptococcus pyogenes ( spCas9). In some embodiments, the Cas9 is from Staphylococcus lugenesis (SluCas9).

일부 실시형태에서, 게놈-편집을 겪는 세포는 게놈 내에 하나 이상의 돌연변이(들)를 가지며, 이는 이러한 돌연변이(들)를 갖지 않는 정상에서의 발현에 비하여, 내인성 FVIII 유전자의 발현의 감소를 초래한다. 정상의 세포는 FVIII 유전자 결함을 갖지 않는 상이한 대상체로부터 기원한(또는 단리된) 건강한 또는 대조군 세포일 수 있다. 일부 실시형태에서, 게놈-편집을 겪는 세포는 FVIII 유전자 관련 질환 또는 장애, 예를 들어, A형 혈우병의 치료를 필요로 하는 대상체로부터 기원할(또는 단리될) 수 있다. 그러므로, 일부 실시형태에서, 그러한 세포 내의 내인성 FVIII 유전자의 발현은 일반 세포 내의 내인성 FVIII 유전자 발현의 발현과 비교하여 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 약 100%만큼 감소된다.In some embodiments, the cell undergoing genome-editing has one or more mutation(s) in its genome, which results in a decrease in expression of the endogenous FVIII gene as compared to expression in a normal that does not have such mutation(s). Normal cells may be healthy or control cells originating (or isolated) from different subjects without the FVIII gene defect. In some embodiments, cells undergoing genome-editing may originate (or be isolated) from a subject in need of treatment for a FVIII gene related disease or disorder, eg, hemophilia A. Thus, in some embodiments, the expression of the endogenous FVIII gene in such cells is about 10%, about 20%, about 30%, about 40%, about 50%, about 60% compared to the expression of endogenous FVIII gene expression in normal cells. %, about 70%, about 80%, about 90% or about 100%.

일부 실시형태에서, 게놈 편집 방법은 공급된 프로모터에 작동 가능하게 연결된 기능적 FVIII 코딩 서열, 예를 들어, FVIII 코딩 서열의 (게놈의 비-코딩 영역에서의) 표적화된 통합을 행하여, 생체내에서 FVIII 단백질을 안정하게 생성한다. 일부 실시형태에서, FVIII 코딩 서열의 표적화된 통합은 관심 세포 유형, 예를 들어, 간세포 또는 동모양혈관 내피 세포에서 고도로 발현되는 알부민 유전자의 인트론에서 발생한다.In some embodiments, the genome editing method results in targeted integration (in a non-coding region of the genome) of a functional FVIII coding sequence, eg, a FVIII coding sequence, operably linked to a supplied promoter, resulting in FVIII in vivo. stable protein production. In some embodiments, the targeted integration of the FVIII coding sequence occurs in an intron of an albumin gene that is highly expressed in a cell type of interest, eg, hepatocytes or allogeneic endothelial cells.

일 양태에서, 합성 FVIII 코딩 서열의 핵산 서열은 세포의 게놈 내로 삽입된다. 실시형태들에서, 삽입될 합성 FVIII 코딩 서열은 변형된 FVIII 코딩 서열이다. 일부 실시형태에서, 변형된 FVIII 코딩 서열에서, 야생형 FVIII 코딩 서열의 B-도메인은 결실되고, B 도메인 치환물로 대체된다. 일부 실시형태에서, 합성 FVIII은 그의 더 작은 크기(4371 bp 대 7053 bp) 때문에 전장 야생형 FVIII보다 뛰어나다. 따라서, 일부 실시형태에서, FVIII 신호 펩티드를 결여하고 그의 5' 말단(FVIII 코딩 서열의 N-말단)에 스플라이스 수여자 서열을 함유하는 합성 FVIII 코딩 서열은 인간을 비롯한 포유동물의 간세포 내의 유전자좌의 인트론 1 내로 특이적으로 통합된다. 일 실시형태에서, 유전자좌는 알부민 유전자좌이다. 또 다른 실시형태에서, 유전자좌는 트랜스페린 유전자좌이다. 또 다른 실시형태에서, 유전자좌는 피브리노겐 알파 유전자좌이다.In one aspect, the nucleic acid sequence of the synthetic FVIII coding sequence is inserted into the genome of a cell. In embodiments, the synthetic FVIII coding sequence to be inserted is a modified FVIII coding sequence. In some embodiments, in the modified FVIII coding sequence, the B-domain of the wild-type FVIII coding sequence is deleted and replaced with a B domain substitution. In some embodiments, synthetic FVIII outperforms full-length wild-type FVIII because of its smaller size (4371 bp versus 7053 bp). Thus, in some embodiments, the synthetic FVIII coding sequence lacking the FVIII signal peptide and containing a splice acceptor sequence at its 5' end (N-terminus of the FVIII coding sequence) is a locus of a locus in hepatocytes of mammals, including humans. It is specifically integrated into intron 1. In one embodiment, the locus is an albumin locus. In another embodiment, the locus is a transferrin locus. In another embodiment, the locus is the fibrinogen alpha locus.

트랜스페린 프로모터로부터의 합성 FVIII 코딩 서열의 전사는 트랜스페린의 엑손 1, 인트론 1의 일부 및 통합되는 합성 FVIII 코딩 서열을 함유하는 pre-mRNA를 초래할 수 있다. 이 pre-mRNA가 인트론을 제거하기 위한 천연 스플라이싱 과정을 겪을 때, 스플라이싱 기구는 트랜스페린 엑손 1의 3' 측의 스플라이스 공여자를, 삽입된 DNA 공여자의 합성 FVIII 코딩 서열의 5' 말단에서의 스플라이스 수여자가 될 차선으로 이용 가능한 스플라이스 수여자에 연결할 수 있다. 이는 합성 FVIII에 대한 성숙 코딩 서열에 융합된 트랜스페린 엑손 1을 함유하는 성숙 mRNA를 초래할 수 있다.Transcription of the synthetic FVIII coding sequence from the transferrin promoter can result in a pre-mRNA containing a portion of exon 1, intron 1 of transferrin and the synthetic FVIII coding sequence to be integrated. When this pre-mRNA undergoes the natural splicing process to remove the intron, the splicing machinery replaces the splice donor on the 3' side of transferrin exon 1 with the 5' end of the synthetic FVIII coding sequence of the inserted DNA donor. You can connect to an available splice acceptor as the next best thing to become a splice acceptor at. This can result in a mature mRNA containing transferrin exon 1 fused to the mature coding sequence for synthetic FVIII.

알부민 프로모터로부터의 이 합성 FVIII 코딩 서열의 전사는 알부민의 엑손 1, 인트론 1의 일부 및 통합되는 합성 FVIII 코딩 서열을 함유하는 pre-mRNA를 초래할 수 있다. 이 pre-mRNA가 인트론을 제거하기 위한 천연 스플라이싱 과정을 겪을 때, 스플라이싱 기구는 알부민 엑손 1의 3' 측의 스플라이스 공여자를, 삽입되는 DNA 공여자의 합성 FVIII 코딩 서열의 5' 말단에서의 스플라이스 수여자가 될 차선으로 이용 가능한 스플라이스 수여자에 연결할 수 있다. 이는 합성 FVIII에 대한 성숙 코딩 서열에 융합된 알부민 엑손 1을 함유하는 성숙 mRNA를 초래할 수 있다. 알부민의 엑손 1은 신호 펩티드에 더하여 2개의 추가의 아미노산 및 인간에서 알부민의 N-말단에서의 단백질 서열 DAH를 정상적으로 인코딩하는 코돈의 1/3을 인코딩한다. 따라서, 일부 실시형태에서, 세포로부터의 분비 동안 알부민 신호 펩티드의 예측된 절단 후에, N-말단에 부가되는 3개의 추가의 아미노산 잔기를 갖는 합성 FVIII 단백질이 생성되어, 합성 FVIII 단백질의 N-말단에 아미노산 서열 -DAHATRRYY(SEQ ID NO: 300)-를 초래할 수 있다. 이들 3개의 아미노산 중 3번째의 것(밑줄)이 부분적으로 엑손 1의 말단에 의해, 그리고 부분적으로 합성 FVIII DNA 공여자 주형에 의해 인코딩되기 때문에, 3번째의 추가의 아미노산 잔기의 아이덴티티가 Leu, Pro, His, Gln 또는 Arg 중 어느 하나이도록 선택할 수 있다. 이들 옵션 중에, Leu이 일부 실시형태에서 사용되는데, 그 이유는 Leu이 분자적 복잡성이 최소이고, 이에 따라 새로운 T-세포 에피토프를 형성할 가능성이 가장 낮기 때문이며, 이는 합성 FVIII 단백질의 N-말단에 아미노산 서열 -DALATRRYY-를 초래한다. 대안적으로, DNA 공여자 주형은 제3 잔기를 결실시켜, 합성 FVIII 단백질의 N-말단에 아미노산 서열 DALTRRYY를 초래하도록 설계될 수 있다. 일부 경우에, 고유 단백질의 서열에 추가의 아미노산을 부가하는 것은 면역원성 위험을 증가시킬 수 있다. 따라서, 합성 FVIII의 N-말단에 대한 2가지 가능한 옵션의 잠재적인 면역원성을 예측하기 위한 인 실리코 분석에 의해, 1개의 잔기의 결실(DALTRRYY)이 더 낮은 면역원성 점수를 갖는 것이 입증된 일부 실시형태에서, 이것은 적어도 일부 실시형태에서의 설계일 수 있다.Transcription of this synthetic FVIII coding sequence from the albumin promoter can result in a pre-mRNA containing a portion of exon 1, intron 1 of albumin and the synthetic FVIII coding sequence to be integrated. When this pre-mRNA undergoes the natural splicing process to remove the intron, the splicing machinery replaces the splice donor on the 3' side of albumin exon 1 with the 5' end of the synthetic FVIII coding sequence of the inserted DNA donor. You can connect to an available splice acceptor as the next best thing to become a splice acceptor at. This can result in a mature mRNA containing albumin exon 1 fused to the mature coding sequence for synthetic FVIII. Exon 1 of albumin encodes a signal peptide plus two additional amino acids and one third of the codon that normally encodes the protein sequence DAH at the N-terminus of albumin in humans. Thus, in some embodiments, following predicted cleavage of the albumin signal peptide during secretion from the cell, a synthetic FVIII protein is generated with three additional amino acid residues added at the N-terminus, resulting in the N-terminus of the synthetic FVIII protein. amino acid sequence -DA H ATRRYY (SEQ ID NO: 300)-. Since the third of these three amino acids (underlined) is encoded in part by the terminus of exon 1 and in part by the synthetic FVIII DNA donor template, the identity of the third additional amino acid residue is Leu, Pro, It can be selected to be any one of His, Gin, or Arg. Of these options, Leu is used in some embodiments because Leu has minimal molecular complexity and is therefore least likely to form new T-cell epitopes, which are located at the N-terminus of the synthetic FVIII protein. resulting in the amino acid sequence - DAL ATRRYY-. Alternatively, the DNA donor template can be designed to delete the third residue, resulting in the amino acid sequence DAL TRRYY at the N-terminus of the synthetic FVIII protein. In some cases, adding additional amino acids to the sequence of a native protein may increase the risk of immunogenicity. Thus, by in silico analysis to predict the potential immunogenicity of two possible options for the N-terminus of synthetic FVIII, some demonstrated that deletion of one residue ( DAL TRRYY) had a lower immunogenicity score. In embodiments, this may be a design in at least some embodiments.

일부 실시형태에서, 코돈 사용이 최적화된 합성 FVIII을 인코딩하는 DNA 서열을 사용하여, 포유동물 세포에서 발현을 개선시킬 수 있다(소위 코돈 최적화). 코돈 최적화를 수행하기 위한 상이한 컴퓨터 알고리즘은 또한 당업계에서 이용 가능하며, 이들은 별개의 DNA 서열을 생성한다(문헌[V.P. Mauro et al., Trends Mol Med (2014) 20:604-13]). 상업적으로 이용 가능한 코돈 최적화 알고리즘의 예는 ATUM 및 GeneArt 회사(써모 피셔 사이언티픽(Thermo Fisher Scientific)의 일부)에 의해 사용되는 것들이다. FVIII 코딩 서열의 코돈 최적화는 마우스로의 유전자 기반의 전달 후에 FVIII의 발현을 유의미하게 개선시키는 것이 입증되었다(문헌[A.C. Nathwani et al., Blood (2006) 107(7):2653-61.]; 문헌[N.J. Ward et al., Blood (2011) 117(3):798-807]; 문헌[P.A. Radcliffe et al., Gene Ther. (2008) 15(4):289-97]). 코돈 최적화는 관심 코딩 서열의 발현을 개선시키기 위한 확립된 접근법이며, 주로 인코딩된 아미노산 서열의 변경 없이, 덜 빈번하게 사용되는 코돈을 더욱 빈번하게 사용되는 코돈으로 치환하는 것에 기초한다. 코돈 편향이 단백질 발현에 영향을 미칠 수 있다는 초기의 인식 이래로, 코돈 최적화 방법이 발달되어 왔으며, DNA 합성 회사, 예컨대 GeneArt 및 ATUM에 의해 제공되는 것들을 포함하는 알고리즘이 상업적으로 이용 가능하다. 이들 상업적으로 이용 가능한 알고리즘은 DNA 합성 서비스의 일부로서 사용자가 무료로 이용 가능하며, 또한 잠재(cryptic) 스플라이싱 신호를 제거하고, 코딩 서열에 걸쳐 G/C 함량을 균등하게 나누도록 설계된다. 생체내에서 세포로의 외인성 핵산의 전달은 적어도 부분적으로 톨(Toll) 수용체 시스템에 의한 CG 디뉴클레오티드(CpG 서열로도 지칭됨)의 인식에 의해 유도되는 선천 면역 반응을 유도할 수 있으며, CG 디뉴클레오티드 함량의 감소는 특히 플라스미드 DNA가 전달 벡터인 경우, 이들 핵산에 대한 선천 면역 반응을 감소시키기 위한 방법으로서 제안된다. 또한, 문헌[P. Colella et al., Mol Ther Methods Clin Dev (2018) 8:87-104]을 참조한다. 유전자에 대한 자연 발생(고유) 코딩 서열이 포유동물 종에서의 발현을 위해 최적화된 경우, CG 디뉴클레오티드의 수는 일반적으로 증가되는데, 이는 더욱 빈번하게 사용되는 코돈이 코돈의 제3(워블(wobble)) 위치에서 더 높은 빈도의 G 및 C 뉴클레오티드를 함유하기 때문이다. 따라서, 코딩 서열 내의 G 및 C 뉴클레오티드의 전체 함량의 증가는 더 높은 함량의 GC 디뉴클레오티드를 초래할 것이다.In some embodiments, a DNA sequence encoding a synthetic FVIII with optimized codon usage can be used to improve expression in mammalian cells (so-called codon optimization). Different computer algorithms for performing codon optimization are also available in the art, which generate distinct DNA sequences (VP Mauro et al., Trends Mol Med (2014) 20 :604-13). Examples of commercially available codon optimization algorithms are those used by ATUM and the GeneArt company (part of Thermo Fisher Scientific). Codon optimization of the FVIII coding sequence has been demonstrated to significantly improve expression of FVIII following gene-based delivery to mice (AC Nathwani et al., Blood (2006) 107(7) :2653-61.); NJ Ward et al., Blood (2011) 117 (3):798-807; PA Radcliffe et al., Gene Ther . (2008) 15 (4):289-97). Codon optimization is an established approach for improving the expression of a coding sequence of interest and is primarily based on substituting less frequently used codons with more frequently used codons without altering the encoded amino acid sequence. Since the initial recognition that codon bias can affect protein expression, codon optimization methods have been developed and algorithms are commercially available, including those provided by DNA synthesis companies such as GeneArt and ATUM. These commercially available algorithms are available free of charge to users as part of a DNA synthesis service, and are also designed to eliminate cryptic splicing signals and divide the G/C content evenly across the coding sequence. Delivery of an exogenous nucleic acid to a cell in vivo can induce an innate immune response induced, at least in part, by recognition of a CG dinucleotide (also referred to as a CpG sequence) by the Toll receptor system, wherein the CG dinucleotide Reduction of the nucleotide content is proposed as a method for reducing the innate immune response to these nucleic acids, especially when plasmid DNA is a transfer vector. Also, the literature [P. Colella et al., Mol Ther Methods Clin Dev (2018) 8 :87-104]. When the naturally occurring (native) coding sequence for a gene is optimized for expression in a mammalian species, the number of CG dinucleotides is generally increased, which means that the more frequently used codon is a third (wobble) of the codon. )) because it contains a higher frequency of G and C nucleotides at the position. Thus, an increase in the total content of G and C nucleotides in the coding sequence will result in a higher content of GC dinucleotides.

일부 실시형태에서, 상이한 알고리즘들로 코돈 최적화된 합성 FVIII 코딩 서열과 고유 FVIII 서열(인간 게놈에 나타난 대로)과의 서열 상동성 또는 동일성은 약 30%, 약 40%, 약 50%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90%, 약 95% 또는 100%의 범위일 수 있다. 일부 실시형태에서, 코돈-최적화된 합성 FVIII 코딩 서열은 고유 FVIII 서열에 대하여 약 75% 내지 약 79%의 서열 상동성 또는 동일성을 갖는다. 일부 실시형태에서, 코돈-최적화된 합성 FVIII 코딩 서열은 고유 FVIII 서열에 대하여 약 70%, 약 71%, 약 72%, 약 73%, 약 74%, 약 75%, 약 76%, 약 77%, 약 78%, 약 79% 또는 약 80%의 서열 상동성 또는 동일성을 갖는다.In some embodiments, the sequence homology or identity between a synthetic FVIII coding sequence that has been codon optimized with different algorithms and a native FVIII sequence (as seen in the human genome) is about 30%, about 40%, about 50%, about 60% , about 65%, about 70%, about 75%, about 80%, about 85%, about 90%, about 95%, or 100%. In some embodiments, the codon-optimized synthetic FVIII coding sequence has from about 75% to about 79% sequence homology or identity to the native FVIII sequence. In some embodiments, the codon-optimized synthetic FVIII coding sequence is about 70%, about 71%, about 72%, about 73%, about 74%, about 75%, about 76%, about 77% relative to the native FVIII sequence. , about 78%, about 79%, or about 80% sequence homology or identity.

일부 실시형태에서, 공여자 주형 또는 공여자 구축물은 합성 FVIII을 인코딩하는 DNA 서열을 함유하도록 제조된다. 일부 실시형태에서, DNA 공여자 주형은 코돈 최적화된 인간 합성 FVIII 코딩 서열을 함유하도록 설계된다. 일부 실시형태에서, 코돈-최적화는 FVIII의 신호 펩티드를 인코딩하는 5' 말단의 서열이 결실되고, 스플라이스 수여자 서열로 대체되며, 또한 폴리아데닐화 신호가 FVIII 정지 코돈 이후 3' 말단에 부가되는 방식으로 행해진다(MAB8A - SEQ ID NO: 301). 스플라이스 수여자 서열은 알려져 있는 유전자로부터의 알려져 있는 스플라이스 수여자 서열 중에서 선택될 수 있거나, 또는 당업계에 알려져 있는 많은 스플라이스 수여자 서열의 정렬로부터 유래되는 컨센서스 스플라이스 수여자 서열이 사용될 수 있다. 일부 실시형태에서, 고도로 발현되는 유전자로부터의 스플라이스 수여자 서열이 사용되는데, 그 이유는 이러한 서열이 최적의 스플라이싱 효율을 제공하는 것으로 생각되기 때문이다. 일부 실시형태에서, 컨센서스 스플라이싱 수여자 서열은 컨센서스 서열 T/CNC/TT/CA/GAC/T(SEQ ID NO: 302)에 이어서 20 bp 내에 10 내지 12개 염기의 폴리피리미딘 트랙트(C 또는 T)에 이어서 AG>G/A를 갖는 분지 부위로 구성되며, 여기서, >는 인트론/엑손 경계의 위치이다. 일 실시형태에서, 합성 스플라이스 수여자 서열(ctgacctcttctcttcctcccacag - SEQ ID NO: 303)이 사용된다. 또 다른 실시형태에서, 인간(TTAACAATCCTTTTTTTTCTTCCCTTGCCCAG - SEQ ID NO: 304) 또는 마우스(ttaaatatgttgtgtggtttttctctccctgtttccacag - SEQ ID NO: 305)의 알부민 유전자 인트론 1/엑손 2 경계로부터의 고유 스플라이스 수여자 서열이 사용된다.In some embodiments, a donor template or donor construct is prepared to contain a DNA sequence encoding synthetic FVIII. In some embodiments, the DNA donor template is designed to contain a codon optimized human synthetic FVIII coding sequence. In some embodiments, codon-optimization is such that the sequence at the 5' end encoding the signal peptide of FVIII is deleted and replaced with a splice acceptor sequence, and a polyadenylation signal is added at the 3' end after the FVIII stop codon. (MAB8A - SEQ ID NO: 301). The splice acceptor sequence may be selected from among known splice acceptor sequences from known genes, or a consensus splice acceptor sequence derived from an alignment of many splice acceptor sequences known in the art may be used. there is. In some embodiments, splice acceptor sequences from highly expressed genes are used, as such sequences are believed to provide optimal splicing efficiency. In some embodiments, the consensus splicing acceptor sequence is a consensus sequence T/CNC/TT/CA/GAC/T (SEQ ID NO: 302) followed by a polypyrimidine tract of 10-12 bases within 20 bp (C or T) followed by a branching site with AG>G/A, where > is the location of the intron/exon boundary. In one embodiment, a synthetic splice acceptor sequence (ctgac ctcttctcttcctccc acag—SEQ ID NO: 303) is used. In another embodiment, a native splice acceptor sequence from the albumin gene intron 1/exon 2 boundary of a human ( TTAAC AAT CCTTTTTTTTCTTCCCTT GCC CAG - SEQ ID NO: 304) or mouse (ttaaatatgttgtgtgg tttttctctccctgttt ccacag - SEQ ID NO: 305) this is used

폴리아데닐화 서열은 세포 내의 mRNA의 안정성에 필수적인 폴리A 테일을 부가하는 신호를 세포에 제공한다. DNA-공여자 주형이 AAV 입자 내로 패키징될 일부 실시형태에서, 본 발명의 실시형태는 패키징되는 DNA의 크기를 약 5 Kb 미만 또는 약 4.7 Kb 이하일 수 있는 AAV에 대한 패키징 한계 내로 유지한다. 따라서, 일부 실시형태에서, 가능한 한 짧은 폴리A 서열, 예를 들어, 약 10-mer, 약 20-mer, 약 30-mer, 약 40-mer, 약 50-mer 또는 약 60-mer 또는 상기의 임의의 사이에 있는 수의 뉴클레오티드가 사용된다. 컨센서스 합성 폴리 A 신호 서열은 서열 AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGGTTTTTTGTGTG(SEQ ID NO: 306)와 함께 문헌(N. Levitt et al., Genes Dev (1989) 3(7):1019-25)에 기술된 바 있으며, 수많은 발현 벡터에서 통상적으로 사용된다.The polyadenylation sequence provides the cell with a signal to add the polyA tail, which is essential for the stability of mRNA in the cell. In some embodiments where the DNA-donor template will be packaged into AAV particles, embodiments of the invention maintain the size of the DNA being packaged within packaging limits for AAV, which may be less than about 5 Kb or less than or equal to about 4.7 Kb. Thus, in some embodiments, a polyA sequence as short as possible, e.g., about 10-mer, about 20-mer, about 30-mer, about 40-mer, about 50-mer or about 60-mer or the above Any intervening number of nucleotides is used. A consensus synthetic poly A signal sequence has been described in N. Levitt et al., Genes Dev (1989) 3 (7):1019-25, along with the sequence AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGGTTTTTTTGTGG (SEQ ID NO: 306), and numerous expression vectors is commonly used in

일부 실시형태에서, 추가의 서열 요소를 DNA 공여자 주형에 부가하여, 통합 빈도를 개선시킬 수 있다. 이러한 하나의 요소는 상동성 아암이다. 이중 가닥 파단부의 좌측으로부터의 서열(LHA)을 DNA 공여자 주형의 5'(FVIII 코딩 서열에 대하여 N-말단) 말단에 첨부하고, 이중 가닥 파단부의 우측으로부터의 서열(RHA)을 DNA 공여자 주형, 예를 들어, MAB8B(SEQ ID NO: 308)의 3'(FVIII 코딩 서열의 C-말단) 말단에 첨부한다.In some embodiments, additional sequence elements may be added to the DNA donor template to improve the frequency of integration. One such element is the homology arm. The sequence (LHA) from the left of the double-strand break is appended to the 5' (N-terminal to the FVIII coding sequence) end of the DNA donor template, and the sequence (RHA) from the right of the double-stranded break is added to the DNA donor template, e.g. For example, it is appended to the 3' (C-terminus of the FVIII coding sequence) terminus of MAB8B (SEQ ID NO: 308).

일부 실시형태에서 제공되는 대안적인 DNA 공여자 주형 설계는 게놈 부위를 절단하기 위해 사용될 sgRNA에 대한 인식 서열과 상보적인 서열을 갖는다. MAB8C(SEQ ID NO: 309)는 이 유형의 DNA 공여자 주형의 일 예를 나타낸다. sgRNA 인식 부위를 포함시킴으로써, DNA 공여자 주형은 DNA 공여자 주형 및 sgRNA/Cas9가 전달되는 세포의 핵 내측에서 sgRNA/Cas9 복합체에 의해 절단될 것이다. 선형 단편으로의 공여자 주형의 절단은 이중 가닥 파단부에서 비-상동성 말단 연결 메커니즘에 의한 또는 HDR 메커니즘에 의한 통합 빈도를 증가시킬 수 있다. 이는 AAV에 패키징된 공여자 주형의 전달의 경우에 특히 유리할 수 있는데, 그 이유는 핵으로의 전달 후에, AAV 게놈이 연쇄체화되어, 더 큰 원형 이중 가닥 DNA 분자를 형성하는 것으로 알려져 있기 때문이다(문헌[H. Nakai et al., J Virol (2001) 75:6969-76]). 따라서, 일부 경우에, 원형 연쇄체는 특히 NHEJ 메커니즘에 의한 이중 가닥 파단부에서의 통합을 위한 덜 효율적인 공여자일 수 있다. 원형 플라스미드 DNA 공여자 주형을 이용한 표적화된 통합의 효율은 플라스미드 내에 아연 핑거 뉴클레아제 절단 부위를 포함시는 것에 의해 증가될 수 있다는 것이 이전에 보고된 바 있다(문헌[S. Cristea et al., Biotechnol. Bioeng. (2013) 110:871-80]). 더욱 최근에, 또한, 이 접근법을 CRISPR/Cas9 뉴클레아제를 사용하여 적용하였다(문헌[K. Suzuki et al., Nature (2017) 540:144-49]). sgRNA 인식 서열은 이중 가닥 DNA 공여자 주형의 어느 하나의 가닥에 존재하는 경우에 활성인 한편, 게놈에 존재하는 sgRNA 인식 서열의 역 상보물의 이용은 안정한 통합에 유리한 것으로 예측되는데, 그 이유는 역 배향의 통합이 sgRNA 인식 서열을 재생성하며, 이는 재절단됨으로써 삽입된 공여자 주형을 방출할 수 있기 때문이다. NHEJ에 의한 정방향 배향으로의 게놈 내의 이러한 공여자 주형의 통합은 sgRNA 인식 서열을 재생성하지 않아서, 통합된 공여자 주형이 게놈으로부터 절제될 수 없게 하는 것으로 예측된다. FVIII 공여자 주형의 통합의 효율에 대한, 상동성 아암을 갖는 또는 이것이 없는 공여자 내에 sgRNA 인식 서열을 포함하는 것의 이익은, 예를 들어, 공여자의 전달을 위해 AAV를 사용하고, CRISPR-Cas9 성분의 전달을 위해 LNP(지질 나노입자)를 사용하여 마우스에서 시험되고 결정될 수 있다.An alternative DNA donor template design provided in some embodiments has a sequence complementary to the recognition sequence for the sgRNA to be used to cleave the genomic site. MAB8C (SEQ ID NO: 309) represents an example of this type of DNA donor template. By including the sgRNA recognition site, the DNA donor template will be cleaved by the sgRNA/Cas9 complex inside the nucleus of the cell to which the DNA donor template and sgRNA/Cas9 are delivered. Cleavage of the donor template into linear fragments may increase the frequency of integration at the double strand breaks by non-homologous end joining mechanisms or by HDR mechanisms. This can be particularly advantageous in the case of delivery of a donor template packaged in AAV, since it is known that after delivery to the nucleus, the AAV genome concatenates to form larger circular double-stranded DNA molecules. [H. Nakai et al., J Virol (2001) 75: 6969-76]). Thus, in some cases, circular concatemers may be less efficient donors for integration, particularly at double-strand breaks by the NHEJ mechanism. It has been previously reported that the efficiency of targeted integration using a circular plasmid DNA donor template can be increased by including a zinc finger nuclease cleavage site in the plasmid (S. Cristea et al., Biotechnol ). Bioeng . (2013) 110 :871-80]). More recently, this approach was also applied using the CRISPR/Cas9 nuclease (K. Suzuki et al., Nature (2017)). 540 :144-49]). While the sgRNA recognition sequence is active when present on either strand of the double-stranded DNA donor template, the use of the reverse complement of the sgRNA recognition sequence present in the genome is predicted to favor stable integration, since reverse orientation Incorporation of the sgRNA regenerates the recognition sequence, as it can be re-cleaved to release the inserted donor template. It is predicted that integration of this donor template within the genome in the forward orientation by NHEJ does not regenerate the sgRNA recognition sequence, rendering the integrated donor template unable to be excised from the genome. The benefits of including a sgRNA recognition sequence in a donor with or without homology arms for the efficiency of integration of the FVIII donor template include, for example, using AAV for delivery of donors and delivery of the CRISPR-Cas9 component. can be tested and determined in mice using LNPs (lipid nanoparticles) for

일부 실시형태에서, 공여자 주형은 한 측 또는 양 측에서 gRNA 표적 부위에 측접한 본원에 기술된 실시형태 중 어느 하나에 따른 공여자 카세트 내의 합성 FVIII 코딩 서열을 포함한다. 일부 실시형태에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및/또는 공여자 카세트의 3'에 gRNA 표적 부위를 포함한다. 일부 실시형태에서, 공여자 주형은 2개의 측접 gRNA 표적 부위를 포함하며, 2개의 gRNA 표적 부위는 동일한 서열을 포함한다. 일부 실시형태에서, 공여자 주형은 적어도 하나의 gRNA 표적 부위를 포함하며, 공여자 주형 내의 적어도 하나의 gRNA 표적 부위는 알부민 유전자의 제1 인트론을 표적화하는 하나 이상의 gRNA 중 적어도 하나에 대한 표적 부위이다. 일부 실시형태에서, 공여자 주형은 적어도 하나의 gRNA 표적 부위를 포함하며, 공여자 주형 내의 적어도 하나의 gRNA 표적 부위는 알부민 유전자의 제1 인트론 내의 하나 이상의 gRNA 중 적어도 하나에 대한 표적 부위의 역 상보물이다. 일부 실시형태에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 포함하며, 공여자 주형 내의 2개의 gRNA 표적 부위는 알부민 유전자의 제1 인트론을 표적화하는 하나 이상의 gRNA에 의해 표적화된다. 일부 실시형태에서, 공여자 주형은 공여자 카세트의 5'에 gRNA 표적 부위 및 공여자 카세트의 3'에 gRNA 표적 부위를 포함하며, 공여자 주형 내의 2개의 gRNA 표적 부위는 알부민 유전자의 제1 인트론 내의 하나 이상의 gRNA 중 적어도 하나에 대한 표적 부위의 역 상보물이다.In some embodiments, the donor template comprises a synthetic FVIII coding sequence in a donor cassette according to any one of the embodiments described herein flanked by a gRNA target site on one or both sides. In some embodiments, the donor template comprises a gRNA target site 5' of the donor cassette and/or a gRNA target site 3' of the donor cassette. In some embodiments, the donor template comprises two flanking gRNA target sites, wherein the two gRNA target sites comprise identical sequences. In some embodiments, the donor template comprises at least one gRNA target site, and the at least one gRNA target site in the donor template is a target site for at least one of the one or more gRNAs targeting the first intron of the albumin gene. In some embodiments, the donor template comprises at least one gRNA target site, wherein the at least one gRNA target site in the donor template is the reverse complement of the target site to at least one of the one or more gRNAs in the first intron of the albumin gene . In some embodiments, the donor template comprises a gRNA target site 5' of the donor cassette and a gRNA target site 3' of the donor cassette, wherein the two gRNA target sites in the donor template are one targeting the first intron of the albumin gene. targeted by more than one gRNA. In some embodiments, the donor template comprises a gRNA target site 5' of the donor cassette and a gRNA target site 3' of the donor cassette, wherein the two gRNA target sites in the donor template are at least one gRNA in the first intron of the albumin gene. is the inverse complement of the target site to at least one of

표적 부위, 즉, FVIII 코딩 서열이 삽입되는 게놈 위치 내로의 FVIII 코딩 서열의 삽입은 내인성 알부민 유전자 좌 또는 그의 이웃 서열에서 이루어질 수 있다. 일부 실시형태에서, FVIII 코딩 서열은 삽입된 코딩 서열의 발현이 알부민 유전자의 내인성 프로모터에 의해 제어되는 방식으로 삽입된다. 일부 실시형태에서, FVIII 코딩 서열은 알부민 유전자의 인트론 중 하나에 삽입된다. 일부 실시형태에서, FVIII 코딩 서열은 알부민 유전자의 엑손 중 하나에 삽입된다. 일부 실시형태에서, FVIII 코딩 서열은 인트론:엑손(또는 그의 역)의 연접부에 삽입된다. 일부 실시형태에서, FVIII 코딩 서열의 삽입은 알부민 유전자좌의 제1 인트론(또는 인트론 1) 내에서 이루어진다. 일부 실시형태에서, FVIII 코딩 서열의 삽입은 알부민 유전자의 발현에 유의미하게 영향을 미치지 않으며, 예를 들어, 상향조절하거나 하향조절하지 않는다.Insertion of the FVIII coding sequence into the target site, ie, a genomic location into which the FVIII coding sequence is inserted, may be at the endogenous albumin locus or a neighboring sequence thereof. In some embodiments, the FVIII coding sequence is inserted in such a way that expression of the inserted coding sequence is controlled by the endogenous promoter of the albumin gene. In some embodiments, the FVIII coding sequence is inserted into one of the introns of the albumin gene. In some embodiments, the FVIII coding sequence is inserted into one of the exons of the albumin gene. In some embodiments, the FVIII coding sequence is inserted at the junction of an intron:exon (or vice versa). In some embodiments, the insertion of the FVIII coding sequence is within the first intron (or intron 1) of the albumin locus. In some embodiments, insertion of the FVIII coding sequence does not significantly affect the expression of the albumin gene, eg, does not upregulate or downregulate.

실시형태들에서, FVIII 코딩 서열의 삽입을 위한 표적 부위는 내인성 알부민 유전자에, 그 내에 또는 그 근처에 존재한다. 일부 실시형태에서, 표적 부위는 게놈 내의 알부민 유전자 좌의 프로모터의 상류인 유전자간 영역에 존재한다. 일부 실시형태에서, 표적 부위는 알부민 유전자 좌 내에 존재한다. 일부 실시형태에서, 표적 부위는 알부민 유전자 좌의 인트론 중 하나에 존재한다. 일부 실시형태에서, 표적 부위는 알부민 유전자 좌의 엑손 중 하나에 존재한다. 일부 실시형태에서, 표적 부위는 알부민 유전자 좌의 인트론과 엑손(또는 그의 역) 사이의 연접부 중 하나에 존재한다. 일부 실시형태에서, 표적 부위는 알부민 유전자 좌의 제1 인트론(또는 인트론 1)에 존재한다. 특정 실시형태에서, 표적 부위는 알부민 유전자의 제1 엑손의(즉, 제1 엑손의 마지막 핵산으로부터) 적어도, 약 또는 최대 0, 1, 5, 10, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450 또는 500 또는 550 또는 600 또는 650 bp 하류이다. 일부 실시형태에서, 표적 부위는 알부민 유전자의 제1 인트론의 적어도, 약 또는 최대 0.1 kb, 약 0.2 kb, 약 0.3 kb, 약 0.4 kb, 약 0.5 kb, 약 1 kb, 약 1.5 kb, 약 2 kb, 약 2.5 kb, 약 3 kb, 약 3.5 kb, 약 4 kb, 약 4.5 kb 또는 약 5 kb 상류이다. 일부 실시형태에서, 표적 부위는 알부민 유전자의 제2 엑손의 약 0 bp 내지 약 100 bp 상류, 약 101 bp 내지 약 200 bp 상류, 약 201 bp 내지 약 300 bp 상류, 약 301 bp 내지 약 400 bp 상류, 약 401 bp 내지 약 500 bp 상류, 약 501 bp 내지 약 600 bp 상류, 약 601 bp 내지 약 700 bp 상류, 약 701 bp 내지 약 800 bp 상류, 약 801 bp 내지 약 900 bp 상류, 약 901 bp 내지 약 1000 bp 상류, 약 1001 bp 내지 약 1500 bp 상류, 약 1501 bp 내지 약 2000 bp 상류, 약 2001 bp 내지 약 2500 bp 상류, 약 2501 bp 내지 약 3000 bp 상류, 약 3001 bp 내지 약 3500 bp 상류, 약 3501 bp 내지 약 4000 bp 상류, 약 4001 bp 내지 약 4500 bp 상류 또는 약 4501 bp 내지 약 5000 bp 상류 내의 임의의 곳이다. 일부 실시형태에서, 표적 부위는 게놈 내의 인간 알부민 유전자의 제1 엑손의 말단(즉, 3' 말단)의 적어도 37 bp 하류이다. 일부 실시형태에서, 표적 부위는 게놈 내의 인간 알부민 유전자의 제2 엑손의 시작부(즉, 5' 시작부)의 적어도 330 bp 상류이다.In embodiments, the target site for insertion of the FVIII coding sequence is in, within or near the endogenous albumin gene. In some embodiments, the target site is in an intergenic region upstream of the promoter of the albumin locus in the genome. In some embodiments, the target site is within the albumin locus. In some embodiments, the target site is in one of the introns of the albumin locus. In some embodiments, the target site is in one of the exons of the albumin locus. In some embodiments, the target site is at one of the junctions between an intron and an exon (or vice versa) of the albumin locus. In some embodiments, the target site is in the first intron (or intron 1) of the albumin locus. In certain embodiments, the target site is at least, about or at most 0, 1, 5, 10, 20, 30, 40, 50, 100, 150 of the first exon of the albumin gene (ie, from the last nucleic acid of the first exon). , 200, 250, 300, 350, 400, 450 or 500 or 550 or 600 or 650 bp downstream. In some embodiments, the target site is at least about, or at most about 0.1 kb, about 0.2 kb, about 0.3 kb, about 0.4 kb, about 0.5 kb, about 1 kb, about 1.5 kb, about 2 kb of the first intron of the albumin gene. , about 2.5 kb, about 3 kb, about 3.5 kb, about 4 kb, about 4.5 kb, or about 5 kb upstream. In some embodiments, the target site is about 0 bp to about 100 bp upstream, about 101 bp to about 200 bp upstream, about 201 bp to about 300 bp upstream, about 301 bp to about 400 bp upstream of the second exon of the albumin gene , about 401 bp to about 500 bp upstream, about 501 bp to about 600 bp upstream, about 601 bp to about 700 bp upstream, about 701 bp to about 800 bp upstream, about 801 bp to about 900 bp upstream, about 901 bp to about 1000 bp upstream, about 1001 bp to about 1500 bp upstream, about 1501 bp to about 2000 bp upstream, about 2001 bp to about 2500 bp upstream, about 2501 bp to about 3000 bp upstream, about 3001 bp to about 3500 bp upstream, anywhere from about 3501 bp to about 4000 bp upstream, from about 4001 bp to about 4500 bp upstream, or from about 4501 bp to about 5000 bp upstream. In some embodiments, the target site is at least 37 bp downstream of the terminus (ie, the 3′ end) of the first exon of the human albumin gene in the genome. In some embodiments, the target site is at least 330 bp upstream of the start (ie, 5′ start) of the second exon of the human albumin gene in the genome.

일부 실시형태에서, 세포 내의 게놈의 편집 방법이 본원에 제공되며, 상기 방법은 하기를 세포에 제공하는 단계를 포함한다: (a) 세포 게놈 내의 알부민 유전자좌를 표적화하는 가이드 RNA(gRNA); (b) DNA 엔도뉴클레아제 또는 상기 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형. 일부 실시형태에서, gRNA는 알부민 유전자의 인트론 1을 표적화한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 271 내지 298 중 어느 하나의 스페이서 서열을 포함한다.In some embodiments, provided herein is a method of editing a genome in a cell, the method comprising providing to the cell: (a) a guide RNA (gRNA) that targets an albumin locus in the genome of the cell; (b) a DNA endonuclease or a nucleic acid encoding said DNA endonuclease; and (c) a donor template comprising a nucleic acid sequence encoding a synthetic FVIII protein. In some embodiments, the gRNA targets intron 1 of the albumin gene. In some embodiments, the gRNA comprises a spacer sequence of any one of SEQ ID NOs: 271-298.

일부 실시형태에서, 세포 내의 게놈의 편집 방법이 본원에 제공되며, 상기 방법은 하기를 세포에 제공하는 단계를 포함한다: (a) SEQ ID NO: 271 내지 298 중 어느 하나로부터의 스페이서 서열을 포함하는 gRNA; (b) DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형. 일부 실시형태에서, gRNA는 SEQ ID NO: 274, 275, 281, 및 283중 어느 하나의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 274의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 275 의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 281 의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 283 의 스페이서 서열을 포함한다. 일부 실시형태에서, 세포는 인간 세포(예를 들어, 인간 간세포)이다.In some embodiments, provided herein is a method of editing a genome in a cell, the method comprising providing to the cell: (a) comprising a spacer sequence from any one of SEQ ID NOs: 271-298 gRNA; (b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and (c) a donor template comprising a nucleic acid sequence encoding a synthetic FVIII protein. In some embodiments, the gRNA comprises a spacer sequence of any one of SEQ ID NOs: 274, 275, 281, and 283. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 274. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 275. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 281. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 283. In some embodiments, the cell is a human cell (eg, a human hepatocyte).

일부 실시형태에서, 본원에 기재된 세포 내의 게놈 편집 방법에 따르면, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12로도 알려짐), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 또는 Cpf1 엔도뉴클레아제, 또는 그의 기능성 등가물로 이루어진 군으로부터 선택된다. 일부 실시형태에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 spCas9이다. 일부 구현예에서, Cas9는 SluCas9이다.In some embodiments, according to a method for editing a genome in a cell described herein, the DNA endonuclease is Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas100 , Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csx10, Csb3, Csb2, Csx14, Csb2, Csb3 , Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, or Cpf1 endonuclease, or a functional equivalent thereof. In some embodiments, the DNA endonuclease is Cas9. In some embodiments, Cas9 is spCas9. In some embodiments, Cas9 is SluCas9.

일부 실시형태에서, 본원에 기재된 세포 내의 게놈 편집 방법에 따르면, 합성 FVIII 단백질을 인코딩하는 핵산 서열은 세포에서의 발현을 위하여 코돈-최적화된다. 일부 실시형태에서, 세포는 인간 세포이다.In some embodiments, according to the methods of genome editing in a cell described herein, the nucleic acid sequence encoding the synthetic FVIII protein is codon-optimized for expression in the cell. In some embodiments, the cell is a human cell.

일부 실시형태에서, 본원에 기재된 세포 내의 게놈 편집 방법에 따르면, 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산을 채용한다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포 내의 발현을 위해 코돈-최적화된다. 일부 실시형태에서, 세포는 인간 세포(예를 들어, 인간 간세포)이다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA, 예를 들어 DNA 플라스미드이다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 RNA, 예를 들어 mRNA이다.In some embodiments, according to a method for editing a genome in a cell described herein, the method employs a nucleic acid encoding a DNA endonuclease. In some embodiments, the nucleic acid encoding the DNA endonuclease is codon-optimized for expression in a cell. In some embodiments, the cell is a human cell (eg, a human hepatocyte). In some embodiments, the nucleic acid encoding the DNA endonuclease is DNA, eg, a DNA plasmid. In some embodiments, the nucleic acid encoding the DNA endonuclease is RNA, eg, mRNA.

일부 실시형태에서, 본원에 기술된 세포 내의 게놈을 편집하는 방법 중 어느 하나에 따라, 공여자 주형은 AAV 벡터에 인코딩된다. 일부 실시형태에서, 공여자 주형은 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 한 측 또는 양 측에서 gRNA 표적 부위에 측접한다. 일부 실시형태에서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 측접한다. 일부 실시형태에서, gRNA 표적 부위는 투여되는 gRNA에 대한 표적 부위이다. 일부 실시형태에서, 공여자 주형의 gRNA 표적 부위는 gRNA에 대한 세포 게놈 gRNA 표적 부위의 역 상보물이다.In some embodiments, according to any one of the methods of editing a genome in a cell described herein, the donor template is encoded in an AAV vector. In some embodiments, the donor template comprises a donor cassette comprising a nucleic acid sequence encoding a synthetic FVIII protein, the donor cassette flanked by a gRNA target site on one or both sides. In some embodiments, the donor cassette flanks the gRNA target site on both sides. In some embodiments, the gRNA target site is the target site for the administered gRNA. In some embodiments, the gRNA target site of the donor template is the reverse complement of the cellular genomic gRNA target site to the gRNA.

일부 실시형태에서, 본원에 기술된 세포 내의 게놈을 편집하는 방법 중 어느 하나에 따라, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포좀 또는 지질 나노입자 내에 제형화된다. 일부 실시형태에서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함한다. 일부 실시형태에서, 리포좀 또는 지질 나노입자는 지질 나노입자이다. 일부 실시형태에서, 당해 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 사용한다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.In some embodiments, according to any one of the methods of editing a genome in a cell described herein, a DNA endonuclease or a nucleic acid encoding a DNA endonuclease is formulated in liposomes or lipid nanoparticles. In some embodiments, the liposome or lipid nanoparticle also comprises a gRNA. In some embodiments, the liposomes or lipid nanoparticles are lipid nanoparticles. In some embodiments, the method uses lipid nanoparticles comprising a nucleic acid encoding a DNA endonuclease and a gRNA. In some embodiments, the nucleic acid encoding a DNA endonuclease is an mRNA encoding a DNA endonuclease.

일부 실시형태에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 어느 하나에 따라, DNA 엔도뉴클레아제는 gRNA와 사전복합체화되어 RNP 복합체를 형성한다.In some embodiments, according to any one of the methods of editing a genome in a cell described herein, the DNA endonuclease is precomplexed with the gRNA to form an RNP complex.

일부 실시형태에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 어느 하나에 따라, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 공여자 주형을 세포에 제공한 후에 세포에 제공된다. 일부 실시형태에서, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 공여자 주형을 세포에 제공한 지 4일보다 긴 시간 후에 세포에 제공된다. 일부 실시형태에서, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 공여자 주형을 세포에 제공한 지 적어도 14일 후에 세포에 제공된다. 일부 실시형태에서, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 공여자 주형을 세포에 제공한 지 적어도 17일 후에 세포에 제공된다. 일부 실시형태에서, (a) 및 (b)는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자로서 세포에 제공된다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다. 일부 실시형태에서, (c)는 공여자 주형을 인코딩하는 AAV 벡터로서 세포에게 제공된다.In some embodiments, according to any one of the methods of editing a genome in a cell described herein, gRNA and a DNA endonuclease or nucleic acid encoding a DNA endonuclease are provided to the cell after providing the donor template to the cell do. In some embodiments, the gRNA and DNA endonuclease or nucleic acid encoding the DNA endonuclease is provided to the cell after a time greater than 4 days after the donor template is provided to the cell. In some embodiments, the gRNA and DNA endonuclease or nucleic acid encoding the DNA endonuclease is provided to the cell at least 14 days after providing the donor template to the cell. In some embodiments, the gRNA and DNA endonuclease or nucleic acid encoding the DNA endonuclease is provided to the cell at least 17 days after providing the donor template to the cell. In some embodiments, (a) and (b) are provided to the cell as lipid nanoparticles comprising a nucleic acid encoding a DNA endonuclease and a gRNA. In some embodiments, the nucleic acid encoding a DNA endonuclease is an mRNA encoding a DNA endonuclease. In some embodiments, (c) is provided to the cell as an AAV vector encoding a donor template.

일부 실시형태에서, 본원에 기술된 세포 내의 게놈의 편집 방법 중 어느 하나에 따라, 하나 이상의 추가의 용량의 gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공된다. 일부 실시형태에서, 하나 이상의 추가의 용량의 gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 표적화된 통합 및/또는 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 발현이 달성될 때까지 세포에 제공된다.In some embodiments, according to any one of the methods of editing a genome in a cell described herein, one or more additional doses of gRNA and a DNA endonuclease or a nucleic acid encoding a DNA endonuclease comprise a first dose of gRNA and a DNA endonuclease or a nucleic acid encoding the DNA endonuclease, followed by the cell. In some embodiments, one or more additional doses of gRNA and DNA endonuclease or nucleic acid encoding DNA endonuclease comprises a first dose of gRNA and DNA endonuclease or nucleic acid encoding DNA endonuclease It is then provided to the cell until targeted integration of the target level of the nucleic acid sequence encoding the synthetic FVIII protein and/or expression of the target level of the nucleic acid sequence encoding the synthetic FVIII protein is achieved.

일부 실시형태에서, 본원에 기재된 세포 내의 게놈 편집 방법에 따르면, 합성 FVIII 단백질을 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다.In some embodiments, according to a method of genome editing in a cell described herein, a nucleic acid sequence encoding a synthetic FVIII protein is expressed under the control of an endogenous albumin promoter.

일부 실시형태에서, (a) Cas DNA 엔도뉴클레아제(예를 들어, Cas9) 또는 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산, (b) gRNA 또는 gRNA를 인코딩하는 핵산으로서, gRNA는 Cas DNA 엔도뉴클레아제가 알부민 유전자좌 내의 표적 폴리뉴클레오티드 서열을 절단하도록 가이드할 수 있는 gRNA 또는 gRNA를 인코딩하는 핵산, 및 (c) 합성 FVIII 코딩 서열을 포함하는 본원에 기술된 실시형태 중 어느 하나에 따른 공여자 주형을 세포 내로 도입하는 단계를 포함하는 세포 게놈의 알부민 유전자좌 내로의 합성 FVIII 코딩 서열의 삽입 방법이 본원에 제공된다. 일부 실시형태에서, 당해 방법은 Cas DNA 엔도뉴클레아제를 인코딩하는 mRNA를 세포 내로 도입하는 단계를 포함한다. 일부 실시형태에서, 당해 방법은 i) Cas DNA 엔도뉴클레아제를 인코딩하는 mRNA 및 ii) gRNA를 포함하는 본원에 기술된 실시형태 중 어느 하나에 따른 LNP를 세포 내로 도입하는 단계를 포함한다. 일부 실시형태에서, 공여자 주형은 AAV 공여자 주형이다. 일부 실시형태에서, 공여자 주형은 합성 FVIII 코딩 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 한 측 또는 양 측에서 gRNA의 표적 부위에 측접한다. 일부 실시형태에서, 공여자 카세트에 측접한 gRNA 표적 부위는 알부민 유전자좌 내의 gRNA 표적 부위의 역 상보물이다. 일부 실시형태에서, Cas DNA 엔도뉴클레아제 또는 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA 또는 gRNA를 인코딩하는 핵산은 세포 내로의 공여자 주형의 도입 후에 세포 내로 도입된다. 일부 실시형태에서, Cas DNA 엔도뉴클레아제 또는 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA 또는 gRNA를 인코딩하는 핵산은 공여자 주형을 세포 내로 도입한 후 공여자 주형이 세포 핵에 유입되게 하기에 충분한 시간 후에 세포 내로 도입된다. 일부 실시형태에서, Cas DNA 엔도뉴클레아제 또는 Cas DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA 또는 gRNA를 인코딩하는 핵산은 공여자 주형을 세포 내로 도입한 후 공여자 주형이 세포 핵 내에서 단일 가닥 AAV 게놈으로부터 이중 가닥 DNA 분자로 전환되게 하기에 충분한 시간 후에 세포 내로 도입된다. 일부 실시형태에서, Cas DNA 엔도뉴클레아제는 Cas9이다.In some embodiments, (a) a Cas DNA endonuclease (eg, Cas9) or a nucleic acid encoding a Cas DNA endonuclease, (b) a gRNA or a nucleic acid encoding a gRNA, wherein the gRNA is a Cas DNA endonuclease A donor template according to any one of the embodiments described herein comprising a gRNA or a nucleic acid encoding a gRNA capable of directing a nuclease to cleave a target polynucleotide sequence within the albumin locus, and (c) a synthetic FVIII coding sequence. Provided herein is a method of inserting a synthetic FVIII coding sequence into an albumin locus of a cell genome comprising introducing into the cell. In some embodiments, the method comprises introducing an mRNA encoding a Cas DNA endonuclease into the cell. In some embodiments, the method comprises introducing into a cell an LNP according to any one of the embodiments described herein comprising i) an mRNA encoding a Cas DNA endonuclease and ii) a gRNA. In some embodiments, the donor template is an AAV donor template. In some embodiments, the donor template comprises a donor cassette comprising a synthetic FVIII coding sequence, the donor cassette flanked on one or both sides by the target site of the gRNA. In some embodiments, the gRNA target site flanking the donor cassette is the reverse complement of the gRNA target site within the albumin locus. In some embodiments, a Cas DNA endonuclease or a nucleic acid encoding a Cas DNA endonuclease and a gRNA or a nucleic acid encoding a gRNA are introduced into the cell after introduction of the donor template into the cell. In some embodiments, the Cas DNA endonuclease or nucleic acid encoding the Cas DNA endonuclease and the gRNA or nucleic acid encoding the gRNA are sufficient to allow the donor template to enter the cell nucleus after introduction of the donor template into the cell. introduced into the cell after an hour. In some embodiments, a Cas DNA endonuclease or a nucleic acid encoding a Cas DNA endonuclease and a gRNA or a nucleic acid encoding the gRNA comprise a single stranded AAV genome within the cell nucleus after introduction of the donor template into the cell. It is introduced into the cell after a time sufficient to allow it to be converted into a double-stranded DNA molecule from In some embodiments, the Cas DNA endonuclease is Cas9.

일부 실시형태에서, 본원에 기술된 세포 게놈의 알부민 유전자좌 내로의 합성 FVIII 코딩 서열의 삽입 방법 중 어느 하나에 따라, 표적 폴리뉴클레오티드 서열은 알부민 유전자의 인트론 1 내에 존재한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 271 내지 298 중 어느 하나의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 274, 275, 281, 및 283중 어느 하나의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 274의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 275 의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 281 의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 283 의 스페이서 서열을 포함한다.In some embodiments, according to any one of the methods of insertion of a synthetic FVIII coding sequence into an albumin locus of a cell genome described herein, the target polynucleotide sequence is within intron 1 of the albumin gene. In some embodiments, the gRNA comprises a spacer sequence of any one of SEQ ID NOs: 271-298. In some embodiments, the gRNA comprises a spacer sequence of any one of SEQ ID NOs: 274, 275, 281, and 283. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 274. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 275. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 281. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 283.

일부 실시형태에서, (a) i) Cas9 DNA 엔도뉴클레아제를 인코딩하는 mRNA 및 ii) gRNA로서, gRNA는 Cas9 DNA 엔도뉴클레아제가 알부민 유전자좌 내의 표적 폴리뉴클레오티드 서열을 절단하도록 가이드할 수 있는 gRNA를 포함하는 본원에 기술된 실시형태 중 어느 하나에 따른 LNP, 및 (b) 합성 FVIII 코딩 서열을 포함하는 본원에 기술된 실시형태 중 어느 하나에 따른 AAV 공여자 주형을 세포 내로 도입하는 단계를 포함하는 세포 게놈의 알부민 유전자좌 내로의 합성 FVIII 코딩 서열의 삽입 방법이 본원에 제공된다. 일부 실시형태에서, 공여자 주형은 합성 FVIII 코딩 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 한 측 또는 양 측에서 gRNA의 표적 부위에 측접한다. 일부 실시형태에서, 공여자 카세트에 측접한 gRNA 표적 부위는 알부민 유전자좌 내의 gRNA 표적 부위의 역 상보물이다. 일부 실시형태에서, LNP는 세포 내로의 AAV 공여자 주형의 도입 후에 세포 내로 도입된다. 일부 실시형태에서, LNP는 AAV 공여자 주형을 세포 내로 도입한 후 공여자 주형이 세포 핵에 유입되게 하기에 충분한 시간 후에 세포 내로 도입된다. 일부 실시형태에서, LNP는 AAV 공여자 주형을 세포 내로 도입한 후 공여자 주형이 세포 핵 내에서 단일 가닥 AAV 게놈으로부터 이중 가닥 DNA 분자로 전환되게 하기에 충분한 시간 후에 세포 내로 도입된다. 일부 실시형태에서, 세포 내로의 LNP의 처음의 도입 후 세포 내로의 LNP의 1회 이상(예컨대 2, 3, 4, 5회 이상)의 추가의 도입이 수행된다. 일부 실시형태에서, gRNA는 SEQ ID NO: 271 내지 298 중 어느 하나의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 274, 275, 281, 및 283중 어느 하나의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 274의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 275 의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 281 의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 283 의 스페이서 서열을 포함한다.In some embodiments, (a) i) an mRNA encoding a Cas9 DNA endonuclease and ii) a gRNA, wherein the gRNA is capable of guiding the Cas9 DNA endonuclease to cleave a target polynucleotide sequence within the albumin locus. A cell comprising the step of introducing into the cell an LNP according to any one of the embodiments described herein comprising, and (b) an AAV donor template according to any one of the embodiments described herein comprising (b) a synthetic FVIII coding sequence. Provided herein are methods of inserting a synthetic FVIII coding sequence into an albumin locus of a genome. In some embodiments, the donor template comprises a donor cassette comprising a synthetic FVIII coding sequence, the donor cassette flanked on one or both sides by the target site of the gRNA. In some embodiments, the gRNA target site flanking the donor cassette is the reverse complement of the gRNA target site within the albumin locus. In some embodiments, the LNP is introduced into the cell following introduction of the AAV donor template into the cell. In some embodiments, the LNP is introduced into the cell after a time sufficient to allow the donor template to enter the cell nucleus following introduction of the AAV donor template into the cell. In some embodiments, the LNP is introduced into the cell after a sufficient time after introduction of the AAV donor template into the cell to allow the donor template to convert from the single stranded AAV genome to a double stranded DNA molecule in the cell nucleus. In some embodiments, after the initial introduction of LNP into the cell, one or more additional introductions of LNP into the cell (eg, 2, 3, 4, 5 or more) are performed. In some embodiments, the gRNA comprises a spacer sequence of any one of SEQ ID NOs: 271-298. In some embodiments, the gRNA comprises a spacer sequence of any one of SEQ ID NOs: 274, 275, 281, and 283. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 274. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 275. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 281. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 283.

표적 부위 내로의 FVIII 코딩 서열의 삽입은 내인성 피브리노겐-α 유전자 좌 또는 그의 이웃 서열에서 이루어질 수 있다. 일부 실시형태에서, FVIII 코딩 서열은 삽입된 코딩 서열의 발현이 피브리노겐-α 유전자의 내인성 프로모터에 의해 제어되는 방식으로 삽입된다. 일부 실시형태에서, FVIII 코딩 서열은 피브리노겐-α 유전자의 인트론 중 하나에 삽입된다. 일부 실시형태에서, FVIII 코딩 서열은 피브리노겐-α 유전자의 엑손 중 하나에 삽입된다. 일부 실시형태에서, FVIII 코딩 서열은 인트론:엑손(또는 그의 역)의 연접부에 삽입된다. 일부 실시형태에서, FVIII 코딩 서열의 삽입은 피브리노겐-α 유전자좌의 제1 인트론(또는 인트론 1) 내에서 이루어진다. 일부 실시형태에서, FVIII 코딩 서열의 삽입은 피브리노겐-α 유전자의 발현에 유의미하게 영향을 미치지 않으며, 예를 들어, 상향조절하거나 하향조절하지 않는다.Insertion of the FVIII coding sequence into the target site may be at the endogenous fibrinogen-α locus or its neighboring sequence. In some embodiments, the FVIII coding sequence is inserted in such a way that expression of the inserted coding sequence is controlled by the endogenous promoter of the fibrinogen-α gene. In some embodiments, the FVIII coding sequence is inserted into one of the introns of the fibrinogen-α gene. In some embodiments, the FVIII coding sequence is inserted into one of the exons of the fibrinogen-α gene. In some embodiments, the FVIII coding sequence is inserted at the junction of an intron:exon (or vice versa). In some embodiments, the insertion of the FVIII coding sequence is within the first intron (or intron 1) of the fibrinogen-α locus. In some embodiments, insertion of the FVIII coding sequence does not significantly affect the expression of the fibrinogen-α gene, eg, does not upregulate or downregulate it.

특정 실시형태에서, 표적 부위는 피브리노겐-α 유전자의 제1 엑손의(즉, 제1 엑손의 마지막 염기쌍 또는 3’ 말단으로부터) 적어도, 약 또는 최대 0, 1, 5, 10, 20, 30, 40, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1071 bp 또는 임의의 사이에 있는 길이의 핵산 하류이다. 일부 실시형태에서, 표적 부위는 피브리노겐-α 유전자의 제2 엑손의(즉, 제2 엑손의 제1 핵산 또는 5’ 말단으로부터) 적어도, 약 또는 최대 0.1 kb, 약 0.2 kb, 약 0.3 kb, 약 0.4 kb, 약 0.5 kb, 약 1 kb 또는 임의의 사이에 있는 길이의 핵산 상류이다. 일부 실시형태에서, 표적 부위는 피브리노겐-α 유전자의 제2 엑손의(즉, 제2 엑손의 제1 핵산 또는 5’ 말단으로부터) 약 0 bp 내지 약 100 bp, 약 101 bp 내지 약 200 bp, 약 201 bp 내지 약 300 bp, 약 301 bp 내지 약 400 bp, 약 401 bp 내지 약 500 bp, 약 501 bp 내지 약 600 bp, 약 601 bp 내지 약 700 bp, 약 701 bp 내지 약 800 bp, 약 801 bp 내지 약 900 bp, 약 901 bp 내지 약 1000 bp, 약 1001 bp 내지 약 1071 bp 상류 내의 임의의 곳이다.In certain embodiments, the target site is at least, about, or at most 0, 1, 5, 10, 20, 30, 40 of the first exon of the fibrinogen-α gene (ie, from the last base pair or 3′ end of the first exon). , 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1071 bp or any in-between is the length of the nucleic acid downstream. In some embodiments, the target site is at least, about, or at most 0.1 kb, about 0.2 kb, about 0.3 kb, about upstream of a nucleic acid of length 0.4 kb, about 0.5 kb, about 1 kb, or any in between. In some embodiments, the target site is about 0 bp to about 100 bp, about 101 bp to about 200 bp, about 201 bp to about 300 bp, about 301 bp to about 400 bp, about 401 bp to about 500 bp, about 501 bp to about 600 bp, about 601 bp to about 700 bp, about 701 bp to about 800 bp, about 801 bp to about 900 bp, from about 901 bp to about 1000 bp, from about 1001 bp to about 1071 bp upstream.

일부 실시형태에서, FVIII 코딩 서열의 삽입을 위한 표적 부위는 게놈 내의 인간 피브리노겐-α 유전자의 제1 엑손의 말단의 적어도 40 bp 하류이며, 게놈 내의 인간 피브리노겐-α 유전자의 제2 엑손의 시작의 적어도 60 bp 상류이다.In some embodiments, the target site for insertion of the FVIII coding sequence is at least 40 bp downstream of the end of the first exon of the human fibrinogen-a gene in the genome and at least of the start of the second exon of the human fibrinogen-a gene in the genome 60 bp upstream.

일부 실시형태에서, FVIII 코딩 서열의 삽입을 위한 표적 부위는 게놈 내의 인간 피브리노겐-α 유전자의 제1 엑손의 말단의 적어도 42 bp 하류, 및 게놈 내의 인간 피브리노겐-α 유전자의 제2 엑손의 시작부의 적어도 65 bp 상류이다.In some embodiments, the target site for insertion of the FVIII coding sequence is at least 42 bp downstream of the terminus of the first exon of the human fibrinogen-α gene in the genome, and at least of the beginning of the second exon of the human fibrinogen-α gene in the genome. 65 bp upstream.

일부 실시형태에서, 삽입은 게놈 내의 인간 피브리노겐-α 유전자의 제1 엑손의 말단의 적어도 12 bp 하류, 및 게놈 내의 인간 피브리노겐-α 유전자의 제2 엑손의 시작부의 적어도 52 bp 상류에서 이루어진다.In some embodiments, the insertion is at least 12 bp downstream of the end of the first exon of the human fibrinogen-α gene in the genome, and at least 52 bp upstream of the start of the second exon of the human fibrinogen-α gene in the genome.

일부 실시형태에서, 삽입은 게놈 내의 인간 피브리노겐-α 유전자의 제1 엑손의 말단의 적어도 94 bp 하류, 및 게놈 내의 인간 피브리노겐-α 유전자의 제2 엑손의 시작부의 적어도 86 bp 상류에서 이루어진다.In some embodiments, the insertion is at least 94 bp downstream of the end of the first exon of the human fibrinogen-a gene in the genome, and at least 86 bp upstream of the start of the second exon of the human fibrinogen-a gene in the genome.

일부 실시형태에서, 본원에 기술된 시스템 중 어느 하나에 따라, 공여자 주형은 트랜스페린 유전자의 인트론 1 내로의 표적화된 통합을 위한 합성 FVIII을 인코딩하는 핵산 서열을 포함하며, 공여자 주형은 5’에서 3’으로, i) 제1 gRNA 표적 부위; ii) 스플라이스 수여자; iii) 합성 FVIII을 인코딩하는 뉴클레오티드 서열; 및 iv) 폴리아데닐화 신호를 포함한다. 일부 실시형태에서, 공여자 주형은 iv) 폴리아데닐화 신호의 하류에 제2 gRNA 표적 부위를 추가로 포함한다. 일부 실시형태에서, 제1 gRNA 표적 부위 및 제2 gRNA 표적 부위는 동일하다. 일부 실시형태에서, 공여자 주형은 ii) 스플라이스 수여자와 iii) 합성 FVIII 단백질을 인코딩하는 뉴클레오티드 서열 사이에 내인성 서열의 활성의 적어도 일부를 보유하는 트랜스페린 유전자의 엑손 2에 인코딩된 트랜스페린 신호 펩티드의 말단 부분을 인코딩하는 서열 또는 그의 변이체를 추가로 포함한다. 일부 실시형태에서, 공여자 주형은 i) 제1 gRNA 표적 부위와 ii) 스플라이스 수여자 사이에 폴리뉴클레오티드 스페이서를 추가로 포함한다. 일부 실시형태에서, 폴리뉴클레오티드 스페이서는 18개 뉴클레오티드 길이이다. 일부 실시형태에서, 공여자 주형은 한 측에서 제1 AAV ITR(역위 말단 반복부)에 측접하고/거나 다른 측에서 제2 AAV ITR에 측접한다. 일부 실시형태에서, 제1 AAV ITR은 AAV2 ITR이고/거나 제2 AAV ITR은 AAV2 ITR이다. 일부 실시형태에서, iii) 3, 4, 5 또는 6개의 N-연결된 글리코실화 부위를 포함하는 B 도메인 치환물을 갖는 합성 FVIII을 인코딩하는 뉴클레오티드 서열. 공여자 주형 성분에 대한 예시적인 서열은 SEQ ID NO: 310 및/또는 311의 공여자 주형 서열에서 찾을 수 있다.In some embodiments, according to any one of the systems described herein, the donor template comprises a nucleic acid sequence encoding a synthetic FVIII for targeted integration into intron 1 of the transferrin gene, wherein the donor template comprises 5' to 3' , i) a first gRNA target site; ii) a splice grantee; iii) a nucleotide sequence encoding synthetic FVIII; and iv) a polyadenylation signal. In some embodiments, the donor template further comprises iv) a second gRNA target site downstream of the polyadenylation signal. In some embodiments, the first gRNA target site and the second gRNA target site are the same. In some embodiments, the donor template comprises the terminus of the transferrin signal peptide encoded in exon 2 of the transferrin gene that retains at least a portion of the activity of the endogenous sequence between ii) the splice acceptor and iii) the nucleotide sequence encoding the synthetic FVIII protein. and a sequence encoding the portion or a variant thereof. In some embodiments, the donor template further comprises a polynucleotide spacer between i) the first gRNA target site and ii) the splice acceptor. In some embodiments, the polynucleotide spacer is 18 nucleotides in length. In some embodiments, the donor template flanks a first AAV ITR (inverted terminal repeat) on one side and/or flanks a second AAV ITR on the other side. In some embodiments, the first AAV ITR is an AAV2 ITR and/or the second AAV ITR is an AAV2 ITR. In some embodiments, iii) a nucleotide sequence encoding a synthetic FVIII having a B domain substitution comprising 3, 4, 5 or 6 N-linked glycosylation sites. Exemplary sequences for donor template components can be found in the donor template sequences of SEQ ID NOs: 310 and/or 311.

표적 서열 선택Target sequence selection

일부 실시형태에서, 특정 참조 유전자좌에 관한 5' 경계 및/또는 3' 경계의 위치의 이동(shift)을 사용하여 유전자 편집의 특정 적용을 용이하게 하거나 향상시키는데, 이는 본원에 추가로 기술되고 예시된 바와 같이, 편집을 위하여 선택된 엔도뉴클레아제 시스템에 부분적으로 좌우된다.In some embodiments, shifts in the position of the 5' border and/or the 3' border with respect to a particular reference locus are used to facilitate or enhance certain applications of gene editing, which are further described and exemplified herein. As such, it depends in part on the endonuclease system chosen for editing.

이러한 표적 서열 선택의 제1 비제한적인 양태에서, 다수의 엔도뉴클레아제 시스템은 절단을 위한 잠재적인 표적 부위의 초기 선택을 가이드하는 규칙 또는 기준, 예컨대 CRISPR II형 또는 V형 엔도뉴클레아제의 경우에 DNA 절단 부위에 인접한 특정 위치 내의 PAM 서열 모티프의 요건을 갖는다.In a first non-limiting aspect of this target sequence selection, a number of endonuclease systems provide rules or criteria that guide the initial selection of potential target sites for cleavage, such as those of CRISPR type II or V endonucleases. In some cases, it has the requirement of a PAM sequence motif within a specific position adjacent to the DNA cleavage site.

표적 서열 선택 또는 최적화의 또 다른 비제한적인 양태에서, 표적 서열 및 DNA 엔도뉴클레아제의 특정 조합에 대한 오프-표적 활성의 빈도(즉, 선택된 표적 서열이 아닌 부위에서 일어나는 이중 나선 파단 의 빈도)는 온-표적 활성의 빈도에 대하여 평가된다. 일부 경우에, 목적하는 유전자좌에서 정확하게 편집된 세포는 다른 세포에 비하여 선택 유리성을 가질 수 있다. 선택 유리성의 예시적인 비제한적인 예는 속성, 예컨대 향상된 복제율, 지속성, 특정 조건에 대한 내성, 대상체 내로의 도입 후에 생체 내에서의 향상된 성공적인 이식률 또는 지속성, 및 이러한 세포의 유지 또는 증가된 수 또는 생존력과 연관된 다른 속성의 획득을 포함한다. 다른 경우에, 목적하는 유전좌에서 정확하게 편집된 세포는 정확하게 편집된 세포를 식별, 분류 또는 달리 선택하기 위하여 사용되는 하나 이상의 스크리닝 방법에 의해 양성으로 선택될 수 있다. 선택 유리성 및 유도된 선택 방법 둘 모두는 교정과 연관된 표현형을 이용할 수 있다. 일부 실시형태에서, 세포는 세포의 의도된 집단을 선택 또는 정제하기 위하여 사용되는 새로운 표현형을 생성하는 제2 변형을 생성하기 위하여 2회 이상 편집될 수 있다. 이러한 제2 변형은 선택 가능하거나 또는 스크리닝 가능한 마커를 위하여 제2 gRNA를 부가함으로써 생성될 수 있다. 일부 경우에, 세포는 cDNA 및 또한 선택 가능한 마커를 함유하는 DNA 단편을 사용하여 요망되는 유전자좌에서 정확하게 편집될 수 있다.In another non-limiting aspect of target sequence selection or optimization, the frequency of off-target activity for a particular combination of target sequence and DNA endonuclease (i.e., the frequency of double helix breaks occurring at sites other than the selected target sequence) is assessed for the frequency of on-target activity. In some cases, cells edited correctly at the locus of interest may have a selection advantage over other cells. Illustrative, non-limiting examples of selection advantages include attributes such as improved replication rate, persistence, resistance to certain conditions, improved successful transplantation rate or persistence in vivo after introduction into a subject, and maintenance or increased number of such cells or Includes acquisition of other attributes related to survivability. In other cases, cells that have been correctly edited at the locus of interest can be selected positively by one or more screening methods used to identify, sort, or otherwise select the correctly edited cells. Both selection favours and induced selection methods can take advantage of phenotypes associated with correction. In some embodiments, cells may be edited two or more times to create a second modification that creates a new phenotype that is used to select or purify an intended population of cells. This second modification can be created by adding a second gRNA for a selectable or screenable marker. In some cases, cells can be edited precisely at the desired locus using cDNA and also DNA fragments containing a selectable marker.

실시형태에서, 임의의 선택 유리성이 적용 가능하든 또는 임의의 유도되는 선택이 특정 경우에 적용될 것이든 간에, 표적 서열 선택은 또한 적용 효과를 향상시키고/향상시키거나 목적하는 표적 이외의 부위에서 요망되지 않는 변경에 대한 가능성을 감소시키기 위하여 오프-표적 빈도를 고려하여 가이드된다. 본원 및 해당 분야에서 추가로 기술 및 예시된 바와 같이, 오프-표적 활성의 발생은 표적 부위와 오프-표적 부위 간의 유사성 및 비유사성, 뿐만 아니라 사용된 특정 엔도뉴클레아제를 비롯한 다수의 인자에 의해 영향을 받는다. 오프-표적 활성의 예측을 보조하는 생물정보학 도구가 이용 가능하며, 빈번하게는 이러한 도구를 또한 사용하여 오프-표적 활성의 가장 가능한 부위를 식별할 수 있고, 이어서 이를 실험 환경에서 평가하여 오프-표적 대 온-표적 활성의 상대적인 빈도를 평가하고, 이에 의해 더 높은 상대적인 온-표적 활성을 갖는 서열의 선택이 가능할 수 있다. 이러한 기법의 예가 본원에 제공되며, 다른 것은 해당 분야에 공지되어 있다.In an embodiment, whether any selection advantage is applicable or any induced selection will be applied in a particular case, target sequence selection also enhances the application effect and/or is desired at sites other than the desired target. It is guided by considering the off-target frequency to reduce the likelihood of undesirable changes. As further described and exemplified herein and in the art, the generation of off-target activity is driven by a number of factors, including the similarities and dissimilarities between the target and off-target sites, as well as the particular endonuclease used. get affected. Bioinformatics tools are available that aid in the prediction of off-target activity, and frequently these tools can also be used to identify the most probable sites of off-target activity, which can then be evaluated in an experimental setting to evaluate the off-target activity. Assessing the relative frequency of on-target activity versus on-target activity, thereby allowing selection of sequences with higher relative on-target activity. Examples of such techniques are provided herein, others known in the art.

표적 서열 선택의 또 다른 양태는 상동성 재조합 사건에 관한 것이다. 상동성의 서열 공유 영역은 개재 서열의 결실을 야기하는 상동성 재조합 사건을 위한 중심점으로서 기능할 수 있다. 이러한 재조합 사건은 염색체 및 다른 DNA 서열의 정상 복제 과정 동안 일어나고, 또한 DNA 서열이 합성될 때, 예컨대 이중-가닥 파단(DSB)의 수선의 경우에 일어난다. DSB는 정상 세포 복제 사이클 동안 정기적으로 일어나지만, 예컨대 UV광 및 DNA 파단의 다른 유도자 등의 요인에 의해, 또는 작용제(예컨대 화학적 유도자)의 존재에 의해 또한 향상될 수 있다. 다수의 이러한 유도자는 DSB가 게놈에서 비차별적으로 발생하게 하고, DSB는 정상 세포에서 정기적으로 유도되고 수선된다. 수선 동안, 원래 서열은 완전한 정확도로 재구축될 수 있지만, 일부 경우에서, 작은 indel이 DSB 부위에 도입된다.Another aspect of target sequence selection relates to homologous recombination events. Sequence sharing regions of homology can serve as pivot points for homologous recombination events that result in deletion of intervening sequences. These recombination events occur during the normal course of replication of chromosomes and other DNA sequences, and also occur when DNA sequences are synthesized, such as in the case of repair of double-strand breaks (DSBs). DSB occurs regularly during the normal cell replication cycle, but can also be enhanced by factors such as UV light and other inducers of DNA breakage, or by the presence of agents (such as chemical inducers). Many of these inducers cause DSBs to develop non-discriminately in the genome, which are regularly induced and repaired in normal cells. During repair, the original sequence can be reconstructed with complete accuracy, but in some cases small indels are introduced at the DSB site.

DSB는 또한 선택된 염색체 위치에서 유도되는 또는 우선적인 유전자 변형 사건을 유발하는 데 사용될 수 있는, 본원에 기술된 엔도뉴클레아제 시스템의 경우에서와 같이, 특정 위치에서 특이적으로 유도될 수 있다. DNA 수선(뿐만 아니라 복제)과 관련하여 상동성 서열이 재조합을 겪을 경향은 다수의 환경에서 이용될 수 있고, 유전자 편집 시스템, 예컨대 CRISPR의 한 응용을 위한 기반인데, 여기서 상동성 유도 수선을 사용하여 관심 서열을 삽입하되, "공여자" 주형의 사용을 통하여 요망되는 염색체 위치 내로 삽입한다.DSBs can also be induced specifically at a particular location, as in the case of the endonuclease system described herein, which can be induced at a selected chromosomal location or used to trigger a preferential genetic modification event. The propensity of homologous sequences to undergo recombination with respect to DNA repair (as well as replication) can be exploited in a number of settings and is the basis for one application of gene editing systems, such as CRISPR, where homology-guided repair is used to The sequence of interest is inserted into the desired chromosomal location through the use of a "donor" template.

10개 또는 그보다 적은 염기쌍을 가질 수 있는 "미세상동성"의 작은 영역일 수 있는, 특정 서열 간의 상동성 영역을 또한 사용하여 요망되는 결실을 야기할 수 있다. 예를 들어, 단일의 DSB는 근처 서열과 미세상동성을 나타내는 부위에 도입된다. 이러한 DSB의 정상 수선 과정 동안, 높은 빈도로 일어나는 결과는 DSB 및 동시의 세포 수선 과정에 의하여 용이해지는 재조합의 결과로서의 개재 서열의 결실이다.Regions of homology between particular sequences, which may be small regions of “microhomology” that may have 10 or fewer base pairs, may also be used to cause the desired deletion. For example, a single DSB is introduced at a site exhibiting microhomology with a nearby sequence. During the normal repair process of these DSBs, a high frequency result is the deletion of intervening sequences as a result of recombination facilitated by the DSB and the simultaneous cell repair process.

그러나, 일부 환경에서, 상동성의 영역 내에서 표적 서열을 선택하는 것은 또한 유전자 융합(결실이 코딩 영역에 존재하는 경우)을 포함하여 훨씬 더 큰 결실을 생성시킬 수 있고, 이는 특정 환경을 고려하여 바람직하거나 바람직하지 않을 수 있다.However, in some circumstances, selecting a target sequence within a region of homology can also result in even larger deletions, including gene fusions (where the deletion is in the coding region), which is desirable given the particular circumstances. or may not be desirable.

본원에 제공된 예는 FVIII 코딩 서열을 삽입하도록 설계된 DSB의 생성뿐만 아니라 온-표적 사건에 비하여 오프-표적 사건을 최소화하도록 설계된 이러한 영역 내의 특정 표적 서열의 선택을 위한 표적 영역의 선택을 추가로 예시한다.The examples provided herein further illustrate the selection of target regions for generation of DSBs designed to insert FVIII coding sequences, as well as selection of specific target sequences within those regions designed to minimize off-target events compared to on-target events. .

표적화된 통합targeted integration

일부 실시형태에서, 본원에 제공되는 방법은 간세포의 게놈 내의 특정 위치에 합성 FVIII 코딩 서열을 통합하는 것이며, 이는 "표적화된 통합"으로 지칭된다. 일부 실시형태에서, 표적화된 통합은 서열-특이적인 뉴클레아제를 사용하여, 게놈 DNA 내의 이중 가닥 파단부를 생성함으로써 가능하게 된다.In some embodiments, the methods provided herein integrate a synthetic FVIII coding sequence at a specific location within the genome of a hepatocyte, which is referred to as “targeted integration”. In some embodiments, targeted integration is enabled by using sequence-specific nucleases to create double-stranded breaks in genomic DNA.

일부 실시형태에서 사용되는 CRISPR/CAS 시스템은 다수의 게놈 표적을 신속하게 스크리닝하여, 최적의 CRISPR/CAS 설계를 확인할 수 있는 이점을 갖는다. 게놈의 임의의 영역을 표적화하는 sgRNA 분자는 모든 PAM 모티프에 인접하게 20 bp 서열을 위치시킴으로써 인 실리코 설계될 수 있다. PAM 모티프는 진핵생물의 게놈 내에 평균 15 bp마다 존재한다. 그러나, 인 실리코 방법에 의해 설계되는 sgRNA는 세포에서 상이한 효율로 이중 가닥 파단부를 생성할 것이며, 인 실리코 방법을 사용하여 일련의 sgRNA 분자의 절단 효율을 예측하는 것은 현재 가능하지 않다. sgRNA가 시험관내에서 신속하게 합성될 수 있기 때문에, 이는 가장 효율적인 절단을 초래하는 sgRNA를 확인하기 위하여 주어진 게놈 영역에서 모든 가능한 sgRNA 서열을 신속하게 스크리닝할 수 있게 한다. 일반적으로, 주어진 게놈 영역 내의 일련의 sgRNA를 세포에서 시험하는 경우, 0 내지 90%의 절단 효율의 범위가 관찰된다. 또한, 인 실리코 알고리즘 및 실험실 검사를 사용하여, 임의의 주어진 sgRNA의 오프-표적 가능성을 결정할 수 있다. sgRNA의 20 bp 인식 서열에 대한 완벽한 일치가 대부분의 진핵 게놈에서 주로 오직 1회만 존재할 것이지만, sgRNA에 대하여 1개 이상의 염기쌍 불일치를 갖는 게놈 내의 다수의 추가의 부위가 존재할 것이다. 이들 부위는 가변적인 빈도로 절단될 수 있으며, 이는 불일치의 수 또는 위치에 기초하여 종종 예측 가능하지 않다. 인 실리코 분석에 의해 확인되지 않은 추가의 오프-표적 부위에서의 절단이 또한 발생할 수 있다. 따라서, 관련 세포 유형에서 다수의 sgRNA를 스크리닝하여 가장 바람직한 오프-표적 프로파일을 갖는 sgRNA를 확인하는 것은 치료적 이용을 위하여 최적의 sgRNA를 선택하는 것의 결정적인 요소이다. 바람직한 오프 표적 프로파일은 실제 오프-표적 부위의 수와 이들 부위에서의 절단의 빈도뿐 아니라, 게놈 내의 이들 부위의 위치를 고려할 것이다. 예를 들어, 기능적으로 중요한 유전자, 특히 종양유전자 또는 항-종양유전자 근처의 또는 그 내의 오프-표적 부위는 기능이 알려져 있지 않은 유전자간 영역 내의 부위보다 덜 바람직한 것으로 고려된다. 따라서, 최적의 sgRNA의 확인은 간단히 유기체의 게놈 서열의 인 실리코 분석에 의해 예측될 수 없고, 실험적 검사를 필요로 한다. 인 실리코 분석이 검사하기 위한 가이드의 수를 좁히는 데 도움이 될 수 있지만, 그것은 높은 온-표적 절단을 갖는 가이드를 예측하거나 낮은 바람직한 오프-표적 절단을 갖는 가이드를 예측할 수 없다. 실험적 데이터에 의해, 각각 관심 영역(예컨대 알부민 인트론 1) 내의 게놈과 완벽한 일치를 갖는 sgRNA의 절단 효율이 절단 부재로부터 90% 초과의 절단까지 달라지며, 임의의 알려져 있는 알고리즘에 의해 예측 가능하지 않음이 나타난다. Cas 효소에 의한 절단을 촉진하기 위한 주어진 sgRNA의 능력은 상기 영역 내의 염색질 구조에 의해 결정될 수 있는 게놈 DNA 내의 특정 부위의 접근 가능성과 관련될 수 있다. 분화된 휴지기 세포, 예컨대 간세포에서 대다수의 게놈 DNA가 고도로 응축된 이질염색질에 존재하지만, 활성적으로 전사되는 영역은 거대 분자, 예컨대 Cas 단백질과 같은 단백질에 더욱 접근 가능한 것으로 알려져 있는 더욱 개방된 염색질 상태로 존재한다. 심지어 활성적으로 전사되는 유전자 내에서, DNA의 일부 특정 영역은 결합된 전사 인자 또는 다른 조절 단백질의 존재 또는 부재로 인하여 다른 것들보다 더욱 접근 가능하다. 게놈 내의 또는 특정 게놈 유전자좌 또는 게놈 유전자좌의 영역, 예컨대 인트론 및 예컨대 알부민 인트론 1 내에서 부위를 예측하는 것은 가능하지 않으며, 이에 따라 관련 세포 유형에서 실험적으로 결정할 필요가 있을 것이다. 일단 일부 부위가 삽입에 가능한 부위로서 선택되면, 예를 들어, 실험적 검사와 함께 또는 이것 없이, 선택된 부위로부터 소수의 뉴클레오티드를 상류 또는 하류로 이동시킴으로써 일부 변이를 이러한 부위에 부가하는 것이 가능할 수 있다.The CRISPR/CAS system used in some embodiments has the advantage of being able to rapidly screen multiple genomic targets to identify optimal CRISPR/CAS designs. sgRNA molecules targeting any region of the genome can be designed in silico by placing a 20 bp sequence adjacent to all PAM motifs. PAM motifs are present on average every 15 bp in the genome of eukaryotes. However, sgRNAs designed by the in silico method will produce double-strand breaks with different efficiencies in cells, and it is currently not possible to predict the cleavage efficiency of a series of sgRNA molecules using the in silico method. Because sgRNAs can be rapidly synthesized in vitro, this allows for rapid screening of all possible sgRNA sequences in a given genomic region to identify the sgRNA that results in the most efficient cleavage. In general, when a series of sgRNAs within a given genomic region are tested in cells, a range of cleavage efficiencies from 0 to 90% is observed. In silico algorithms and laboratory tests can also be used to determine the off-target potential of any given sgRNA. While a perfect match to the 20 bp recognition sequence of an sgRNA will occur predominantly only once in most eukaryotic genomes, there will be many additional sites in the genome with one or more base pair mismatches to the sgRNA. These sites can be cleaved with variable frequency, which is often not predictable based on the number or location of mismatches. Cleavage at additional off-target sites not identified by in silico analysis may also occur. Therefore, screening of multiple sgRNAs in relevant cell types to identify sgRNAs with the most desirable off-target profile is a decisive factor in selecting optimal sgRNAs for therapeutic use. A preferred off-target profile will take into account the actual number of off-target sites and the frequency of cleavage at these sites, as well as the location of these sites in the genome. For example, an off-target site near or within a functionally important gene, particularly an oncogene or anti-oncogene, is considered less desirable than a site within an intergenic region of unknown function. Therefore, the identification of optimal sgRNA cannot simply be predicted by in silico analysis of the genome sequence of an organism and requires experimental testing. Although in silico analysis can help narrow the number of guides to examine, it cannot predict guides with high on-target cleavage or guides with low desirable off-target cleavage. Experimental data show that the cleavage efficiency of sgRNAs each with a perfect match to the genome within the region of interest (eg albumin intron 1) varies from no cleavage to greater than 90% cleavage, and is not predictable by any known algorithm. appear. The ability of a given sgRNA to facilitate cleavage by the Cas enzyme may be related to the accessibility of a particular site in genomic DNA, which may be determined by the chromatin structure within that region. In differentiated resting cells, such as hepatocytes, the majority of genomic DNA resides in highly condensed heterochromatin, but a more open chromatin state in which regions that are actively transcribed are known to be more accessible to macromolecules such as proteins such as the Cas protein. exists as Even within actively transcribed genes, some specific regions of DNA are more accessible than others due to the presence or absence of associated transcription factors or other regulatory proteins. It is not possible to predict sites within the genome or within a particular genomic locus or region of a genomic locus, such as introns and such as albumin intron 1, and will therefore need to be determined empirically in the cell type concerned. Once some sites have been selected as possible sites for insertion, it may be possible to add some variations to these sites, for example by moving a few nucleotides upstream or downstream from the selected site, with or without experimental testing.

일부 실시형태에서, 본원에 개시된 방법에서 사용될 수 있는 gRNA는 SEQ ID NO: 271 내지 298, 또는 SEQ ID NO: 271 내지 298의 것들과 적어도 약 85% 뉴클레오티드 서열 동일성을 갖는 그의 임의의 기능적 등가물 중 하나 이상이다.In some embodiments, the gRNA that can be used in the methods disclosed herein is one of SEQ ID NOs: 271-298, or any functional equivalents thereof having at least about 85% nucleotide sequence identity to those of SEQ ID NOs: 271-298 More than that.

핵산 변형Nucleic Acid Modifications

일부 실시형태에서, 세포 내로 도입된 폴리뉴클레오티드는 본원에 추가로 기술되고, 해당 분야에 공지된 바와 같이, 예를 들어, 활성, 안정성 또는 특이성을 향상시키거나, 운반을 변경하거나, 숙주 세포에서 선천적 면역 반응을 감소시키거나 또는 다른 향상을 위하여 개별적으로 또는 조합하여 사용될 수 있는 하나 이상의 변형을 가진다.In some embodiments, a polynucleotide introduced into a cell is further described herein and known in the art, for example, to enhance activity, stability or specificity, to alter transport, or to be native to the host cell. having one or more modifications that can be used individually or in combination to reduce or otherwise enhance an immune response.

특정 실시형태에서, 변형된 폴리뉴클레오티드는 CRISPR/Cas9/Cpf1 시스템에서 사용되며, 이 경우 가이드 RNA(단일-분자 가이드 또는 이중-분자 가이드) 및/또는 세포 내로 도입된 Cas 또는 Cpf1 엔도뉴클레아제를 인코딩하는 DNA 또는 RNA가 하기에 기술되고 예시된 바와 같이 변형될 수 있다. 이러한 변형된 폴리뉴클레오티드를 CRISPR/Cas9/Cpf1 시스템에서 사용하여 임의의 하나 이상의 게놈 유전자좌를 편집할 수 있다.In certain embodiments, the modified polynucleotide is used in the CRISPR/Cas9/Cpf1 system, in which case guide RNA (single-molecule guide or double-molecule guide) and/or Cas or Cpf1 endonuclease introduced into the cell. The encoding DNA or RNA can be modified as described and exemplified below. Such modified polynucleotides can be used in the CRISPR/Cas9/Cpf1 system to edit any one or more genomic loci.

이러한 사용의 비제한적인 예시의 목적을 위하여 CRISPR/Cas9/Cpf1 시스템을 사용하여, 가이드 RNA의 변형을 사용하여 단일-분자 가이드 또는 이중-분자일 수 있는 gRNA, 및 Cas 또는 Cpf1 엔도뉴클레아제를 가지는 CRISPR/Cas9/Cpf1 게놈 편집 복합체의 형성 또는 안정성을 향상시킬 수 있다. gRNA의 변형을 또한 또는 대안적으로 사용하여 게놈 편집 복합체와 게놈 내의 표적 서열 간의 상호작용의 개시, 안정성 또는 속도론을 향상시킬 수 있는데, 이를 사용하여 예를 들어 온-표적 활성을 향상시킬 수 있다. 가이드 RNA의 변형을 또한 또는 대안적으로 사용하여 특이성, 예를 들어 다른(오프-표적) 부위에서의 효과에 비하여 온-표적 부위에서 게놈 편집의 상대적인 속도를 향상시킬 수 있다.For the purposes of non-limiting examples of this use, the CRISPR/Cas9/Cpf1 system is used to generate gRNAs, which can be single-molecule guides or double-molecules, and Cas or Cpf1 endonucleases using modifications of guide RNAs. Eggplant may enhance the formation or stability of the CRISPR/Cas9/Cpf1 genome editing complex. Modifications of gRNAs can also or alternatively be used to improve the initiation, stability or kinetics of interactions between the genome editing complex and a target sequence in the genome, which can be used, for example, to enhance on-target activity. Modifications of guide RNAs can also or alternatively be used to improve specificity, eg, the relative speed of genome editing at on-target sites compared to effects at other (off-target) sites.

변형을 또한 또는 대안적으로 사용하여 예를 들어, 세포에 존재하는 리보뉴클레아제(RNase)에 의한 분해에 대한 그의 내성을 증가시키고, 그에 의해 세포에서 그의 반감기가 증가되게 함으로써, 가이드 RNA의 안정성을 증가시킬 수 있다. 가이드 RNA 반감기를 향상시키는 변형은 특히 엔도뉴클레아제를 생성하기 위하여 번역될 필요가 있는 RNA를 통해 편집될 세포 내로 Cas 또는 Cpf1 엔도뉴클레아제가 도입되는 실시형태에서 유용할 수 있는데, 그 이유는 엔도뉴클레아제를 인코딩하는 RNA와 동시에 도입된 가이드 RNA의 반감기의 증가를 사용하여 가이드 RNA 및 인코딩된 Cas 또는 Cpf1 엔도뉴클레아제가 세포에서 함께 존재하는 시간을 증가시킬 수 있기 때문이다.The modification may also or alternatively be used to increase the stability of the guide RNA, for example by increasing its resistance to degradation by ribonucleases (RNases) present in the cell, thereby increasing its half-life in the cell. can increase Modifications that enhance guide RNA half-life may be particularly useful in embodiments in which a Cas or Cpf1 endonuclease is introduced into the cell to be edited via the RNA that needs to be translated to produce the endonuclease, because the endonuclease This is because an increase in the half-life of the guide RNA that is introduced simultaneously with the RNA encoding the nuclease can be used to increase the time the guide RNA and the encoded Cas or Cpf1 endonuclease reside together in the cell.

변형을 또한 또는 대안적으로 사용하여 세포 내로 도입된 RNA가 선천적 면역 반응을 유발할 가능성 또는 정도를 감소시킬 수 있다. 하기 및 해당 분야에 기술된 바와 같이, 작은-간섭 RNA(siRNA)를 포함하는 RNA 간섭(RNAi)과 관련하여 널리 특성화된, 이러한 반응은 RNA의 감소된 반감기 및/또는 사이토카인 또는 면역 반응과 연관된 다른 인자의 유발과 연관되는 경향이 있다.Modifications may also or alternatively be used to reduce the likelihood or extent to which RNA introduced into a cell will elicit an innate immune response. As described below and in the art, well-characterized in the context of RNA interference (RNAi), including small-interfering RNA (siRNA), such responses are associated with reduced half-life of RNA and/or cytokines or immune responses. It tends to be associated with the triggering of other factors.

RNA의 안정성을 향상시키는 변형(예컨대 세포에 존재하는 RNAse에 의한 그의 분해를 증가시킴으로써), 생성된 생성물(즉 엔도뉴클레아제)의 번역을 향상시키는 변형, 및/또는 세포 내로 도입된 RNA가 선천적 면역 반응을 유발할 가능성 또는 정도를 감소시키는 변형을 포함하지만 이들로 제한되지 않는 하나 이상의 유형의 변형이 또한, 세포 내로 도입되는 엔도뉴클레아제를 인코딩하는 RNA에 대하여 이루어질 수 있다.Modifications that enhance the stability of RNA (eg, by increasing its degradation by RNAse present in the cell), modifications that enhance translation of the resulting product (ie endonuclease), and/or that the RNA introduced into the cell is innate One or more types of modifications may also be made to the RNA encoding the endonuclease to be introduced into the cell, including, but not limited to, modifications that reduce the likelihood or extent of eliciting an immune response.

변형, 예컨대 상기 및 다른 것들의 조합이 마찬가지로 사용될 수 있다. CRISPR/Cas9/Cpf1의 경우에, 예를 들어, 하나 이상의 유형의 변형이 가이드 RNA에 대하여 이루어질 수 있고/있거나(상기에 예시된 것들 포함) 하나 이상의 유형의 변형이 Cas 엔도뉴클레아제를 인코딩하는 RNA에 대하여 이루어질 수 있다(상기에 예시된 것들 포함).Variations, such as combinations of the above and others, may likewise be used. In the case of CRISPR/Cas9/Cpf1, for example, one or more types of modifications can be made to the guide RNA (including those exemplified above) and/or one or more types of modifications encode a Cas endonuclease. RNA (including those exemplified above).

예시에 의해, CRISPR/Cas9/Cpf1 시스템에서 사용되는 가이드 RNA 또는 다른 더 작은 RNA는 화학적 수단에 의해 용이하게 합성될 수 있으며, 이는 하기에 예시되고, 해당 분야에 기술된 바와 같이, 다수의 변형이 용이하게 혼입되게 한다. 화학적 합성 절차는 계속적으로 확장되지만, 고성능 액체 크로마토그래피(HPLC, 이것은 겔, 예컨대 PAGE의 사용을 회피함)와 같은 절차에 의한 이러한 RNA의 정제는 보다 난제가 되는 경향이 있는데, 그 이유는 폴리뉴클레오티드 길이가 수백개를 초과하는 뉴클레오티드로 상당히 증가하기 때문이다. 더 큰 길이의 화학적으로-변형된 RNA를 생성하기 위하여 사용되는 한 접근법은 함께 라이게이션되는 2개 이상의 분자를 생성하는 것이다. 훨씬 더 긴 RNA, 예컨대 Cas9 엔도뉴클레아제를 인코딩하는 것들이 효소적으로 보다 용이하게 생성된다. 더 적은 유형의 변형이 일반적으로 효소적으로 생성된 RNA에서 사용하기 위하여 이용 가능하지만, 하기에 및 해당 분야에 추가로 기술된 바와 같이, 예를 들어, 안정성을 향상시키고/향상시키거나, 선천적 면역 반응의 가능성 또는 정도를 감소시키고/감소시키거나 다른 속성을 향상시키는 데 사용될 수 있는 변형이 여전히 존재하고; 새로운 유형의 변형이 정기적으로 개발되고 있다.By way of illustration, guide RNAs or other smaller RNAs used in the CRISPR/Cas9/Cpf1 system can be readily synthesized by chemical means, which, as exemplified below and described in the art, have numerous modifications. to be easily incorporated. Although chemical synthesis procedures continue to expand, purification of these RNAs by procedures such as high performance liquid chromatography (HPLC, which avoids the use of gels such as PAGE) tends to be more challenging because polynucleotides This is because the length increases significantly with more than several hundred nucleotides. One approach used to generate chemically-modified RNA of greater length is to generate two or more molecules that are ligated together. Much longer RNAs, such as those encoding Cas9 endonuclease, are more readily produced enzymatically. Fewer types of modifications are generally available for use in enzymatically produced RNA, but as described below and further in the art, for example, to improve stability and/or enhance innate immunity There are still modifications that can be used to reduce the likelihood or extent of a response and/or enhance other properties; New types of variants are being developed regularly.

변형의 유형, 특히 더 작은 화학적으로 합성된 RNA와 함께 빈번하게 사용되는 것들의 예시의 방식으로, 변형은 당의 2' 위치에서 변형된 하나 이상의 뉴클레오티드, 일부 실시형태에서, 2'-O-알킬, 2'-O-알킬-O-알킬 또는 2'-플루오로-변형된 뉴클레오티드를 가질 수 있다. 일부 실시형태에서, RNA 변형은 RNA의 3' 말단에서 피리미딘, 무염기 잔기 또는 역위 염기의 리보스 상에 2'-플루오로, 2'-아미노 또는 2' O-메틸 변형을 포함한다. 이러한 변형은 올리고뉴클레오티드 내로 혼입되며, 이들 올리고뉴클레오티드는 주어진 표적에 대한 2'-데옥시올리고뉴클레오티드보다 더 높은 Tm(즉, 더 높은 표적 결합 친화성)을 갖는 것으로 보고되었다.By way of illustration of the types of modifications, particularly those frequently used with smaller chemically synthesized RNA, the modifications include one or more nucleotides modified at the 2' position of the sugar, in some embodiments 2'-0-alkyl, 2′-O-alkyl-O-alkyl or 2′-fluoro-modified nucleotides. In some embodiments, the RNA modification comprises a 2′-fluoro, 2′-amino or 2′ O-methyl modification on the ribose of a pyrimidine, free base residue or inverted base at the 3′ end of the RNA. These modifications are incorporated into oligonucleotides, which are reported to have a higher T m (ie, higher target binding affinity) than 2'-deoxyoligonucleotides for a given target.

다수의 뉴클레오티드 및 뉴클레오시드 변형은 그들이 혼입된 올리고뉴클레오티드를 고유 올리고뉴클레오티드보다 뉴클레아제 분해에 대하여 더욱 내성이 되게 하는 것으로 보고되었고; 이들 변형된 올리고는 미변형된 올리고뉴클레오티드보다 더 긴 시간 동안 온전하게 살아 남는다. 변형된 올리고뉴클레오티드의 구체적인 예는 변형된 백본, 예를 들어, 포스포로티오에이트, 포스포트리에스테르, 메틸 포스포네이트, 단쇄 알킬 또는 사이클로알킬 당간(intersugar) 결합 또는 단쇄 헤테로원자 또는 헤테로사이클릭 당간 결합을 포함하는 것들을 포함한다. 일부 올리고뉴클레오티드는 포스포로티오에이트 백본을 갖는 올리고뉴클레오티드 및 헤테로원자 백본, 특히 CH2-NH-O-CH2, CH,~N(CH3)~O~CH2(메틸렌(메틸이미노) 또는 MMI 백본으로 알려져 있음), CH2--O--N(CH3)-CH2, CH2-N(CH3)-N(CH3)-CH2 및 O-N(CH3)-CH2-CH2 백본을 갖는 것들이며, 고유 포스포디에스테르 백본은 O- P-- O- CH,); 아미드 백본(문헌[A. De Mesmaeker et al., Ace Chem Res (1995) 28:366-374] 참조); 모르폴리노 백본 구조(문헌[Summerton 및 Weller, 미국 특허 제5,034,506)] 참조); 및 펩티드 핵산(PNA) 백본(아래에 기재)으로 표기된다. 인-함유 결합은 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'알킬렌 포스포네이트 및 키랄 포스포네이트를 가지는 메틸 및 기타 알킬 포스포네이트, 포스피네이트, 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트를 가지는 포스포르아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르 및 정상 3'-5' 결합을 갖는 보라노포스페이트, 이들의 2'-5' 결합된 유사체 및 역위된 극성을 갖는 것들을 포함하나 이들에 제한되지 않으며, 뉴클레오시드 단위의 인접 쌍은 3'-5'에서 5'-3' 또는 2'-5'에서 5'-2' 연결되며; 미국 특허 제3,687,808호; 제4,469,863호; 제4,476,301호; 제5,023,243호; 제5,177,196호; 제5,188,897호; 제5,264,423호; 제5,276,019호; 제5,278,302호; 제5,286,717호; 제5,321,131호; 제5,399,676호; 제5,405,939호; 제5,453,496호; 제5,455,233호; 제5,466,677호; 제5,476,925호; 제5,519,126호; 제5,536,821호; 제5,541,306호; 제5,550,111호; 제5,563,253호; 5,571,799호; 제5,587,361호; 및 제5,625,050호를 참조한다.It has been reported that a number of nucleotide and nucleoside modifications make the oligonucleotides into which they are incorporated more resistant to nuclease degradation than native oligonucleotides; These modified oligonucleotides remain intact for a longer period of time than unmodified oligonucleotides. Specific examples of modified oligonucleotides include modified backbones such as phosphorothioates, phosphotriesters, methyl phosphonates, short chain alkyl or cycloalkyl intersugar linkages or short chain heteroatom or heterocyclic intersugar linkages. include those containing Some oligonucleotides have oligonucleotides with phosphorothioate backbones and heteroatom backbones, especially CH 2 -NH-O-CH 2 , CH,~N(CH 3 )~O~CH 2 (methylene(methylimino) or known as MMI backbone), CH 2 --O--N(CH 3 )-CH 2 , CH 2 -N(CH 3 )-N(CH 3 )-CH 2 and ON(CH 3 )-CH 2 - those with a CH 2 backbone, the native phosphodiester backbone being O-P--O-CH,); amide backbones (see A. De Mesmaeker et al., Ace Chem Res (1995) 28 :366-374); morpholino backbone structures (see Summerton and Weller, US Pat. No. 5,034,506); and a peptide nucleic acid (PNA) backbone (described below). Phosphorus-containing linkages are methyl and other alkyl with phosphorothioates, chiral phosphorothioates, phosphorodithioates, phosphotriesters, aminoalkylphosphotriesters, 3′alkylene phosphonates and chiral phosphonates. Phosphoramidates with phosphonates, phosphinates, 3'-amino phosphoramidates and aminoalkylphosphoramidates, thionophosphoramidates, thionoalkylphosphonates, thionoalkylphosphotriesters and boranophosphates with normal 3'-5' linkages, their 2'-5' linked analogs and those with inverted polarity, wherein adjacent pairs of nucleoside units are 3'- 5' to 5'-3' or 2'-5' to 5'-2'linked; US Pat. No. 3,687,808; 4,469,863; 4,476,301; 5,023,243; 5,177,196; 5,188,897; 5,264,423; 5,276,019; 5,278,302; 5,286,717; 5,321,131; 5,399,676; 5,405,939; 5,453,496; 5,455,233; 5,466,677; 5,476,925; 5,519,126; 5,536,821; 5,541,306; 5,550,111; 5,563,253; 5,571,799; 5,587,361; and 5,625,050.

모르폴리노계 올리고머 화합물은 문헌[D.A. Braasch et al., Biochem (2002) 41(14):4503-10]; 문헌[S.C. Ekker et al., Genesis (2001) 30(3):89-93 (및 해당 간행물에 있는 다른 논문들)]; 문헌[J. Heasman, Dev Biol (2002) 243:209-14]; 문헌[A. Nasevicius et al., Nat Genet (2000) 26:216-20]; 문헌[G. Lacerra et al., Proc Natl Acad Sci USA (2000) 97:9591-96]; 및 미국특허 제5,034,506호에 기재되어 있다.Morpholino-based oligomeric compounds are described in DA Braasch et al., Biochem (2002) 41 (14):4503-10; SC Ekker et al., Genesis (2001) 30 (3):89-93 (and other articles in that publication); Literature [J. Heasman, Dev Biol (2002) 243 :209-14]; Literature [A. Nasevicius et al., Nat Genet (2000) 26 :216-20]; Literature [G. Lacerra et al., Proc Natl Acad Sci USA (2000) 97 :9591-96]; and US Pat. No. 5,034,506.

사이클로헥세닐 핵산 올리고뉴클레오티드 모방체는 문헌[J. Wang et al., J Am Chem. Soc (2000) 122:8595-602]에 기술되어 있다.Cyclohexenyl nucleic acid oligonucleotide mimetics are described in J. Wang et al., J Am Chem. Soc (2000) 122 :8595-602].

내부에 인 원자를 포함하지 않는 변형된 올리고뉴클레오티드 백본은 단쇄 알킬 또는 사이클로알킬 뉴클레오시드간 결합, 혼합된 헤테로원자 및 알킬 또는 사이클로알킬 뉴클레오시드간 결합 또는 하나 이상의 단쇄 헤테로원자 또는 헤테로사이클릭 뉴클레오시드간 결합에 의해 형성된 백본을 갖는다. 이들은 (뉴클레오시드의 당 부분으로부터 부분적으로 형성된) 모르폴리노 결합; 실록산 백본; 술피드, 술폭시드 및 술폰 백본; 포름아세틸 및 티오포름아세틸 백본; 메틸렌 포름아세틸 및 티오포름아세틸 백본; 알켄 함유 백본; 술파메이트 백본; 메틸렌이미노 및 메틸렌하이드라지노 백본; 술포네이트 및 술폰아미드 백본; 아미드 백본; 및 혼합된 N, O, S 및 CH2 성분 부분을 갖는 다른 것을 갖는 것들을 포함하며; 미국 특허 제5,034,506호; 제5,166,315호; 제5,185,444호; 제5,214,134호; 제5,216,141호; 제5,235,033호; 제5,264,562호; 제5,264,564호; 제5,405,938호; 제5,434,257호; 제5,466,677호; 제5,470,967호; 제5,489,677호; 제5,541,307호; 제5,561,225호; 제5,596,086호; 제5,602,240호; 제5,610,289호; 제5,602,240호; 제5,608,046호; 제5,610,289호; 제5,618,704호; 제5,623,070호; 제5,663,312호; 제5,633,360호; 제5,677,437호; 및 제5,677,439호를 참조하며, 이의 각각은 본원에 참조로 포함된다.A modified oligonucleotide backbone that does not contain a phosphorus atom therein may contain short chain alkyl or cycloalkyl internucleoside linkages, mixed heteroatoms and alkyl or cycloalkyl internucleoside linkages or one or more short chain heteroatoms or heterocyclic nucleosides. It has a backbone formed by intercleoside bonds. These include morpholino linkages (formed in part from the sugar moiety of the nucleoside); siloxane backbone; sulfide, sulfoxide and sulfone backbones; formacetyl and thioformacetyl backbones; methylene formacetyl and thioformacetyl backbones; alkene-containing backbone; sulfamate backbone; methyleneimino and methylenehydrazino backbones; sulfonate and sulfonamide backbones; amide backbone; and others having mixed N, O, S and CH 2 component moieties; US Pat. No. 5,034,506; 5,166,315; 5,185,444; 5,214,134; 5,216,141; 5,235,033; 5,264,562; 5,264,564; 5,405,938; 5,434,257; 5,466,677; 5,470,967; 5,489,677; 5,541,307; 5,561,225; 5,596,086; 5,602,240; 5,610,289; 5,602,240; 5,608,046; 5,610,289; 5,618,704; 5,623,070; 5,663,312; 5,633,360; 5,677,437; and 5,677,439, each of which is incorporated herein by reference.

하나 이상의 치환된 당 모이어티, 예를 들어, 하기 중 하나가 2' 위치에 포함될 수 있다: OH, SH, SCH3, F, OCN, OCH3OCH3, OCH3O(CH2)nCH3, O(CH2)nNH2, 또는 O(CH2)nCH3(여기서 n은 1 내지 약 10임); C1 내지 C10 저급 알킬, 알콕시알콕시, 치환된 저급 알킬, 알크아릴 또는 아르알킬; Cl; Br; CN; CF3; OCF3; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; SOCH3; SO2CH3; ONO2; NO2; N3; NH2; 헤테로사이클로알킬; 헤테로사이클로알크아릴; 아미노알킬아미노; 폴리알킬아미노; 치환된 실릴; RNA 절단 기; 리포터 기; 인터칼레이터; 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기; 또는 올리고뉴클레오티드의 약력학적 특성을 개선시키기 위한 기 및 유사한 특성을 갖는 다른 치환기. 일부 실시형태에서, 변형은 2'-메톡시에톡시(2'-O-CH2CH2OCH3, 2'-O-(2-메톡시에틸)로도 공지되어 있음)를 포함한다(문헌[P. Martin et al., Helv Chim Acta (1995) 78:486]). 다른 변형은 2’-메톡시(2’-O-CH3), 2’-프로폭시(2’-OCH2CH2CH3) 및 2’-플루오로(2’-F)를 포함한다. 유사한 변형이 또한 올리고뉴클레오티드 상의 다른 위치, 특히 3' 말단 뉴클레오티드 상의 당의 3' 위치 및 5' 말단 뉴클레오티드의 5' 위치 상에서 이루어질 수 있다. 올리고뉴클레오티드는 또한 펜토푸라노실기 대신에 당 모방체, 예컨대 사이클로부틸을 가질 수 있다.One or more substituted sugar moieties may be included in the 2' position, for example one of the following: OH, SH, SCH 3 , F, OCN, OCH 3 OCH 3 , OCH 3 O(CH 2 ) n CH 3 , O(CH 2 ) n NH 2 , or O(CH 2 ) n CH 3 , wherein n is from 1 to about 10; C1 to C10 lower alkyl, alkoxyalkoxy, substituted lower alkyl, alkaryl or aralkyl; Cl; Br; CN; CF 3 ; OCF 3 ; O-, S-, or N-alkyl; O-, S-, or N-alkenyl; SOCH 3 ; SO 2 CH 3 ; ONO 2 ; NO 2 ; N 3 ; NH 2 ; heterocycloalkyl; heterocycloalkaryl; aminoalkylamino; polyalkylamino; substituted silyl; RNA cleaving group; reporter group; intercalator; groups for improving the pharmacokinetic properties of oligonucleotides; or groups for improving the pharmacodynamic properties of oligonucleotides and other substituents having similar properties. In some embodiments, the modification includes 2'-methoxyethoxy (also known as 2'-O-CH 2 CH 2 OCH 3 , 2'-O-(2-methoxyethyl)) (see [ P. Martin et al., Helv Chim Acta (1995) 78 :486]). Other variations include 2'-methoxy (2'-O-CH 3 ), 2'-propoxy (2'-OCH 2 CH 2 CH 3 ) and 2'-fluoro(2'-F). Similar modifications can also be made at other positions on the oligonucleotide, particularly on the 3' position of the sugar on the 3' terminal nucleotide and on the 5' position of the 5' terminal nucleotide. Oligonucleotides may also have a sugar mimic, such as cyclobutyl, in place of a pentofuranosyl group.

일부 실시형태에서, 뉴클레오티드 단위의 당 및 뉴클레오시드간 결합, 즉, 백본은 신규한 기로 대체된다. 염기 단위는 적절한 핵산 표적 화합물과의 혼성화를 위하여 유지된다. 뛰어난 혼성화 특성을 갖는 것으로 보고된 이러한 하나의 올리고머 화합물인 올리고뉴클레오티드 모방체는 펩티드 핵산(PNA)으로 지칭된다. PNA 화합물에서, 올리고뉴클레오티드의 당-백본은 아미드 함유 백본, 예를 들어 아미노에틸글리신 백본으로 대체된다. 핵염기는 유지되며, 백본의 아미드 부분의 아자 질소 원자에 직접적으로 또는 간접적으로 결합된다. PNA 화합물의 제조를 교시하는 대표적인 미국 특허는 미국 특허 제5,539,082호; 제5,714,331호; 및 제5,719,262호를 포함하나 이들에 제한되지 않는다. PNA 화합물의 추가의 교시는 문헌[P.E. Nielsen et al., Science (1991) 254:1497-500]에서 찾을 수 있다.In some embodiments, the sugar and internucleoside linkages of the nucleotide units, ie, the backbone, are replaced with novel groups. Base units are maintained for hybridization with the appropriate nucleic acid target compound. One such oligomeric compound, an oligonucleotide mimetic, reported to have excellent hybridization properties is referred to as a peptide nucleic acid (PNA). In PNA compounds, the sugar-backbone of the oligonucleotide is replaced with an amide containing backbone, for example an aminoethylglycine backbone. The nucleobase is retained and is bonded directly or indirectly to the aza nitrogen atom of the amide portion of the backbone. Representative US patents that teach the preparation of PNA compounds include US Pat. Nos. 5,539,082; 5,714,331; and 5,719,262. Additional teachings of PNA compounds can be found in PE Nielsen et al., Science (1991) 254 :1497-500.

일부 실시형태에서, 가이드 RNA는 또한 추가로 또는 대안적으로, 핵염기(흔히 해당 분야에서 단순히 "염기"로 지칭함) 변형 또는 치환을 포함할 수 있다. 본원에 사용되는 바와 같이, "미변형된" 또는 "천연" 핵염기는 아데닌(A), 구아닌(G), 티민(T), 시토신(C), 및 우라실(U)을 포함한다. 변형된 핵염기는 천연 핵산에서 단지 드물게 또는 일시적으로 발견되는 핵염기, 예를 들어, 하이포잔틴, 6-메틸아데닌, 5-Me 피리미딘, 특히 5-메틸시토신(5-메틸-2' 데옥시시토신으로도 지칭되고, 해당 분야에 흔히 5-Me-C로 지칭됨), 5-하이드록시메틸시토신(HMC), 글리코실 HMC 및 젠토비오실 HMC, 뿐만 아니라 합성 핵염기, 예를 들어, 2-아미노아데닌, 2-(메틸아미노)아데닌, 2-(이미다졸릴알킬)아데닌, 2-(아미노알킬아미노)아데닌 또는 다른 헤테로치환된 알킬아데닌, 2-티오우라실, 2-티오티민, 5-브로모우라실, 5-하이드록시메틸우라실, 8-아자구아닌, 7-데아자구아닌, N6 (6-아미노헥실)아데닌, 및 2,6-디아미노퓨린을 포함한다(문헌[G. Gebeyehu et al., Nucl Acids Res (1997) 15:4513]). 해당 분야에 공지된 "보편적" 염기, 예를 들어, 이노신이 또한 포함될 수 있다. 5-Me-C 치환은 핵산 듀플렉스 안정성을 0.6 내지 1.2℃ 증가시키는 것으로 보고되었고(문헌[Y.S. Sanghvi et al., “Antisense Research and Applications”, CRC Press, Boca Raton, 1993, pp. 276-278]), 염기 치환의 실시형태이다.In some embodiments, the guide RNA may also additionally or alternatively include nucleobase (often referred to in the art simply as “base”) modifications or substitutions. As used herein, “unmodified” or “native” nucleobases include adenine (A), guanine (G), thymine (T), cytosine (C), and uracil (U). Modified nucleobases are nucleobases found only sparingly or transiently in natural nucleic acids, for example, hypoxanthine, 6-methyladenine, 5-Me pyrimidine, especially 5-methylcytosine (5-methyl-2' deoxy Also referred to as cytosine and commonly referred to in the art as 5-Me-C), 5-hydroxymethylcytosine (HMC), glycosyl HMC and gentobiosyl HMC, as well as synthetic nucleobases, e.g., 2 -Aminoadenine, 2-(methylamino)adenine, 2-(imidazolylalkyl)adenine, 2-(aminoalkylamino)adenine or other heterosubstituted alkyladenine, 2-thiouracil, 2-thiothymine, 5- bromouracil, 5-hydroxymethyluracil, 8-azaguanine, 7-deazaguanine, N6 (6-aminohexyl) adenine, and 2,6-diaminopurine (G. Gebeyehu et al. ., Nucl Acids Res (1997) 15 :4513]). "Universal" bases known in the art, such as inosine, may also be included. 5-Me-C substitution has been reported to increase nucleic acid duplex stability by 0.6 to 1.2° C. (YS Sanghvi et al., “Antisense Research and Applications”, CRC Press, Boca Raton, 1993, pp. 276-278). ), an embodiment of base substitution.

일부 실시형태에서, 변형된 핵염기는 다른 합성 및 천연 핵염기, 예컨대 5-메틸시토신(5-me-C), 5-하이드록시메틸 시토신, 잔틴, 하이포잔틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 기타 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 기타 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 우라실 및 시토신, 6-아조 우라실, 시토신 및 티민, 5-우라실(슈도-우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-하이드록실 및 기타 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 기타 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함한다.In some embodiments, the modified nucleobases include other synthetic and natural nucleobases, such as 5-methylcytosine (5-me-C), 5-hydroxymethyl cytosine, xanthine, hypoxanthine, 2-aminoadenine, adenine and guanine. 6-methyl and other alkyl derivatives of, 2-propyl and other alkyl derivatives of adenine and guanine, 2-thiouracil, 2-thiothymine and 2-thiocytosine, 5-halouracil and cytosine, 5-propynyl uracil and cytosine , 6-azouracil, cytosine and thymine, 5-uracil (pseudo-uracil), 4-thiouracil, 8-halo, 8-amino, 8-thiol, 8-thioalkyl, 8-hydroxyl and other 8-substituted adenine and guanine, 5-halo, especially 5-bromo, 5-trifluoromethyl and other 5-substituted uracil and cytosine, 7-methylguanine and 7-methyladenine, 8-azaguanine and 8-azaadenine , 7-deazaguanine and 7-deazaadenine and 3-deazaguanine and 3-deazaadenine.

또한, 핵염기는 미국 특허 제3,687,808호에 개시된 것들, 문헌[The Concise Encyclopedia of Polymer Science And Engineering', pages 858-859], 문헌[Kroschwitz, J.I., ed. John Wiley & Sons, 1990]에 의해 개시된 것들, 문헌[Englisch et al., Ange. Chemie, Int’l Ed, (1991) 30:613]에 의해 개시된 것들 및 문헌[Y.S. Sanghvi, Chapter 15, “Antisense Research and Applications”, pp 289-302], 문헌[Crooke, S.T. and Lebleu, B. ed., CRC Press, 1993]에 의해 개시된 것들을 포함한다. 이들 특정 핵염기는 본 개시내용의 올리고머 화합물의 결합 친화성을 증가시키는 데 특히 유용하다. 이들은 5-치환된 피리미딘, 6-아자피리미딘 및 N-2, N-6 및 0-6 치환된 퓨린, 예컨대 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신을 포함한다. 5-메틸시토신 치환은 핵산 듀플렉스 안정성을 0.6 내지 1.2℃ 증가시키는 것으로 보고되었으며(문헌[Y.S. Sanghvi, supra, pp. 276-78]), 더욱 특히 2'-O-메톡시에틸 당 변형과 조합되는 경우 염기 치환의 실시형태이다. 변형된 핵염기는 미국 특허 제3,687,808호 및 제4,845,205호; 제5,130,302호; 제5,134,066호; 제5,175,273호; 제5,367,066호; 제5,432,272호; 제5,457,187호; 제5,459,255호; 제5,484,908호; 제5,502,177호; 제5,525,711호; 제5,552,540호; 제5,587,469호; 제5,596,091호; 제5,614,617호; 제5,681,941호; 제5,750,692호; 제5,763,588호; 제5,830,653호; 제6,005,096호; 및 미국 특허 출원 공개 제2003/0158403호에 기술되어 있다.Nucleobases are also described in US Pat. No. 3,687,808, The Concise Encyclopedia of Polymer Science And Engineering', pages 858-859, Kroschwitz, JI, ed. John Wiley & Sons, 1990; Englisch et al., Ange. Chemie, Int'l Ed , (1991) 30 :613 and YS Sanghvi, Chapter 15, “Antisense Research and Applications”, pp 289-302, Crooke, ST and Lebleu, B. ed., CRC Press, 1993]. These specific nucleobases are particularly useful for increasing the binding affinity of the oligomeric compounds of the present disclosure. These include 5-substituted pyrimidines, 6-azapyrimidines and N-2, N-6 and 0-6 substituted purines such as 2-aminopropyladenine, 5-propynyluracil and 5-propynylcytosine . 5-methylcytosine substitution has been reported to increase nucleic acid duplex stability by 0.6-1.2° C. (YS Sanghvi, supra , pp. 276-78), more particularly in combination with 2'-O-methoxyethyl sugar modifications. case is an embodiment of base substitution. Modified nucleobases are described in US Pat. Nos. 3,687,808 and 4,845,205; 5,130,302; 5,134,066; 5,175,273; 5,367,066; 5,432,272; 5,457,187; 5,459,255; 5,484,908; 5,502,177; 5,525,711; 5,552,540; 5,587,469; 5,596,091; 5,614,617; 5,681,941; 5,750,692; 5,763,588; 5,830,653; 6,005,096; and US Patent Application Publication No. 2003/0158403.

일부 실시형태에서, 가이드 RNA 및/또는 엔도뉴클레아제를 인코딩하는 mRNA(또는 DNA)는 올리고뉴클레오티드의 활성, 세포 분포 또는 세포 흡수를 향상시키는 하나 이상의 모이어티 또는 컨쥬게이트에 화학적으로 연결된다. 이러한 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티(문헌[Letsinger et al., Proc Natl Acad Sci USA, (1989) 86:6553-56]); 콜산(문헌[Manoharan et al., Bioorg Med Chem Let (1994) 4:1053-60]); 티오에테르, 예를 들어, 헥실-S-트리틸티올(문헌[Manoharan et al., Ann N Y Acad Sci (1992) 660:306-09] 및 문헌[Manoharan et al., Bioorg Med Chem Let, (1993) 3:2765-70]); 티오콜레스테롤(문헌[Oberhauser et al., Nucl Acids Res (1992) 20:533-538]); 지방족 쇄, 예를 들어, 도데칸디올 또는 운데실 잔기(문헌[Kabanov et al., FEBS Lett. (1990) 259:327-330] 및 문헌[Svinarchuk et al., Biochimie (1993) 75:49-54]); 인지질, 예를 들어, 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트(문헌[Manoharan et al., Tetrahedron Lett (1995) 36:3651-54] 및 문헌[Shea et al., Nucl Acids Res (1990) 18:3777-83]); 폴리아민 또는 폴리에틸렌 글리콜 쇄(문헌[Mancharan et al., Nucleosides & Nucleotides (1995) 14:969-73]); 아다만탄 아세트산(문헌[Manoharan et al., Tetrahedron Lett (1995) 36:3651-54]); 팔미틸 모이어티(문헌[Mishra et al., Biochim Biophys Acta (1995) 1264:229-37]); 또는 옥타데실아민 또는 헥실아미노-카보닐-t 옥시콜레스테롤 모이어티(문헌[Crooke et al., J Pharmacol Exp Ther (1996) 277:923-37])를 포함하지만, 이들에 제한되지 않는다. 미국 특허 제4,828,979호; 제4,948,882호; 제5,218,105호; 제5,525,465호; 제5,541,313호; 제5,545,730호; 제5,552,538호; 제5,578,717,호 제5,580,731호; 제5,580,731호; 제5,591,584호; 제5,109,124호; 제5,118,802호; 제5,138,045호; 제5,414,077호; 제5,486,603호; 제5,512,439호; 제5,578,718호; 제5,608,046호; 제4,587,044호; 제4,605,735호; 제4,667,025호; 제4,762,779호; 제4,789,737호; 제4,824,941호; 제4,835,263호; 제4,876,335호; 제4,904,582호; 제4,958,013호; 제5,082,830호; 제5,112,963호; 제5,214,136호; 제5,082,830호; 제5,112,963호; 제5,214,136호; 제5,245,022호; 제5,254,469호; 제5,258,506호; 제5,262,536호; 제5,272,250호; 제5,292,873호; 제5,317,098호; 제5,371,241,호 제5,391,723호; 제5,416,203,호 제5,451,463호; 제5,510,475호; 제5,512,667호; 제5,514,785호; 제5,565,552호; 제5,567,810호; 제5,574,142호; 제5,585,481호; 제5,587,371호; 제5,595,726호; 제5,597,696호; 제5,599,923호; 제5,599,호 928 및 제5,688,941호를 또한 참조한다.In some embodiments, the guide RNA and/or mRNA (or DNA) encoding the endonuclease is chemically linked to one or more moieties or conjugates that enhance the activity, cellular distribution or cellular uptake of the oligonucleotide. Such moieties include lipid moieties such as cholesterol moieties (Letsinger et al . , Proc Natl Acad Sci USA , (1989) 86 :6553-56); cholic acid (Manohran et al., Bioorg Med Chem Let (1994) 4 :1053-60); Thioethers, such as hexyl-S-tritylthiol (Manoharan et al., Ann NY Acad Sci (1992) 660 :306-09) and Manoharan et al., Bioorg Med Chem Let , (1993) ) 3 :2765-70]); thiocholesterol (Oberhauser et al., Nucl Acids Res (1992) 20 :533-538); Aliphatic chains such as dodecanediol or undecyl residues (Kabanov et al., FEBS Lett . (1990) 259 :327-330) and Svinarchuk et al., Biochimie (1993) 75 :49- 54]); Phospholipids such as di-hexadecyl-rac-glycerol or triethylammonium 1,2-di-O-hexadecyl-rac-glycero-3-H-phosphonate (Manohran et al., Tetrahedron Lett (1995) 36 :3651-54 and Shea et al., Nucl Acids Res (1990) 18 :3777-83); polyamine or polyethylene glycol chains (Mancharan et al., Nucleosides & Nucleotides (1995) 14 :969-73); adamantane acetic acid (Manohran et al., Tetrahedron Lett (1995) 36 :3651-54); palmityl moieties (Mishra et al ., Biochim Biophys Acta (1995) 1264 :229-37); or an octadecylamine or hexylamino-carbonyl-t oxycholesterol moiety (Crooke et al., J Pharmacol Exp Ther (1996) 277 :923-37). US Pat. No. 4,828,979; 4,948,882; 5,218,105; 5,525,465; 5,541,313; 5,545,730; 5,552,538; 5,578,717, 5,580,731; 5,580,731; 5,591,584; 5,109,124; 5,118,802; 5,138,045; 5,414,077; 5,486,603; 5,512,439; 5,578,718; 5,608,046; 4,587,044; 4,605,735; 4,667,025; 4,762,779; 4,789,737; 4,824,941; 4,835,263; 4,876,335; 4,904,582; 4,958,013; 5,082,830; 5,112,963; 5,214,136; 5,082,830; 5,112,963; 5,214,136; 5,245,022; 5,254,469; 5,258,506; 5,262,536; 5,272,250; 5,292,873; 5,317,098; 5,371,241, 5,391,723; 5,416,203, 5,451,463; 5,510,475; 5,512,667; 5,514,785; 5,565,552; 5,567,810; 5,574,142; 5,585,481; 5,587,371; 5,595,726; 5,597,696; 5,599,923; See also 5,599, 928 and 5,688,941.

일부 실시형태에서, 당 및 기타 모이어티를 사용하여 뉴클레오티드를 가지는 단백질 및 복합체, 예컨대 양이온성 폴리솜 및 리포좀을 특정 부위에 표적화할 수 있다. 예를 들어, 간세포 유도 전달은 아시알로당단백질 수용체(ASGPR)를 통해 매개될 수 있으며; 예를 들어, 문헌[Hu et al., Protein Pept Lett (2014) 21(10):1025-30]을 참조한다. 해당 분야에 알려져 있는 다른 시스템을 사용하여, 본 경우에 사용되는 생체분자 및/또는 그의 복합체를 특히 관심 표적 세포에 표적화할 수 있다.In some embodiments, sugars and other moieties can be used to target proteins and complexes having nucleotides, such as cationic polysomes and liposomes, to specific sites. For example, hepatocyte-induced transduction may be mediated through the asialoglycoprotein receptor (ASGPR); See, eg, Hu et al., Protein Pept Lett (2014) 21 (10):1025-30. Other systems known in the art can be used to target the biomolecules and/or complexes thereof used in this case, particularly to target cells of interest.

일부 실시형태에서, 이들 표적화 모이어티 또는 컨쥬게이트는 작용기, 예컨대 일차 또는 이차 하이드록실기에 공유적으로 결합되는 컨쥬게이트 기를 포함할 수 있다. 본 개시내용의 컨쥬게이트 기는 인터칼레이터, 리포터 분자, 폴리아민, 폴리아미드, 폴리에틸렌 글리콜, 폴리에테르, 올리고머의 약력학적 특성을 향상시키는 기 및 올리고머의 약동학적 특성을 향상시키는 기를 포함한다. 예시적인 컨쥬게이트 기는 콜레스테롤, 지질, 인지질, 비오틴, 페나진, 엽산염, 펜안트리딘, 안트라퀴논, 아크리딘, 플루오레세인, 로다민, 쿠마린 및 염료를 포함한다. 본 개시내용의 맥락에서 약력학적 특성을 향상시키는 기는 흡수를 개선시키고/개선시키거나 분해에 대한 내성을 향상시키고/향상시키거나 표적 핵산과의 서열-특이적인 혼성화를 강화시키는 기를 포함한다. 본 개시내용의 맥락에서 약동학적 특성을 향상시키는 기는 본 개시내용의 화합물의 흡수, 분포, 대사 또는 배출을 개선시키는 기를 포함한다. 대표적인 컨쥬게이트 기는 1992년 10월 23일자 출원된 국제 특허 출원 제PCT/US92/09196호 및 미국 특허 제6,287,860호에 개시되어 있으며, 이들은 본원에 참조로 포함된다. 컨쥬게이트 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티, 콜산, 티오에테르, 예를 들어, 헥실-5-트리틸티올, 티오콜레스테롤, 지방족 쇄, 예를 들어, 도데칸디올 또는 운데실 잔기, 인지질, 예를 들어, 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트, 폴리아민 또는 폴리에틸렌 글리콜 쇄, 또는 아다만탄 아세트산, 팔미틸 모이어티, 또는 옥타데실아민 또는 헥실아미노-카보닐-옥시 콜레스테롤 모이어티를 포함하지만, 이들에 제한되지 않는다. 예를 들어, 미국 특허 제4,828,979호; 제4,948,882호; 제5,218,105호; 제5,525,465호; 제5,541,313호; 제5,545,730호; 제5,552,538호; 제5,578,717호, 제5,580,731호; 제5,580,731호; 제5,591,584호; 제5,109,124호; 제5,118,802호; 제5,138,045호; 제5,414,077호; 제5,486,603호; 제5,512,439호; 제5,578,718호; 제5,608,046호; 제4,587,044호; 제4,605,735호; 제4,667,025호; 제4,762,779호; 제4,789,737호; 제4,824,941호; 제4,835,263호; 제4,876,335호; 제4,904,582호; 제4,958,013호; 제5,082,830호; 제5,112,963호; 제5,214,136호; 제5,082,830호; 제5,112,963호; 제5,214,136호; 제5,245,022호; 제5,254,469호; 제5,258,506호; 제5,262,536호; 제5,272,250호; 제5,292,873호; 제5,317,098호; 제5,371,241호, 제5,391,723호; 제5,416,203호, 제5,451,463호; 제5,510,475호; 제5,512,667호; 제5,514,785호; 제5,565,552호; 제5,567,810호; 제5,574,142호; 제5,585,481호; 제5,587,371호; 제5,595,726호; 제5,597,696호; 제5,599,923호; 제5,599,928호 및 제5,688,941호를 참조한다.In some embodiments, these targeting moieties or conjugates may include a conjugate group that is covalently bound to a functional group, such as a primary or secondary hydroxyl group. Conjugate groups of the present disclosure include intercalators, reporter molecules, polyamines, polyamides, polyethylene glycols, polyethers, groups that enhance the pharmacodynamic properties of oligomers and groups that enhance the pharmacokinetic properties of oligomers. Exemplary conjugate groups include cholesterol, lipids, phospholipids, biotin, phenazine, folate, phenanthridine, anthraquinone, acridine, fluorescein, rhodamine, coumarin, and dyes. Groups that enhance pharmacodynamic properties in the context of the present disclosure include groups that improve uptake and/or improve resistance to degradation and/or enhance sequence-specific hybridization with a target nucleic acid. Groups that improve pharmacokinetic properties in the context of the present disclosure include groups that improve absorption, distribution, metabolism or excretion of a compound of the present disclosure. Representative conjugate groups are disclosed in International Patent Application Serial No. PCT/US92/09196 and U.S. Patent No. 6,287,860, filed October 23, 1992, which are incorporated herein by reference. The conjugate moiety may be a lipid moiety such as a cholesterol moiety, cholic acid, a thioether such as hexyl-5-tritylthiol, thiocholesterol, an aliphatic chain such as dodecanediol or an undecyl residue, a phospholipid , for example di-hexadecyl-rac-glycerol or triethylammonium 1,2-di-O-hexadecyl-rac-glycero-3-H-phosphonate, polyamine or polyethylene glycol chains, or adamane tan acetic acid, a palmityl moiety, or an octadecylamine or hexylamino-carbonyl-oxy cholesterol moiety. See, for example, U.S. Patent Nos. 4,828,979; 4,948,882; 5,218,105; 5,525,465; 5,541,313; 5,545,730; 5,552,538; 5,578,717; 5,580,731; 5,580,731; 5,591,584; 5,109,124; 5,118,802; 5,138,045; 5,414,077; 5,486,603; 5,512,439; 5,578,718; 5,608,046; 4,587,044; 4,605,735; 4,667,025; 4,762,779; 4,789,737; 4,824,941; 4,835,263; No. 4,876,335; 4,904,582; 4,958,013; 5,082,830; 5,112,963; 5,214,136; 5,082,830; 5,112,963; 5,214,136; 5,245,022; 5,254,469; 5,258,506; 5,262,536; 5,272,250; 5,292,873; 5,317,098; 5,371,241; 5,391,723; 5,416,203; 5,451,463; 5,510,475; 5,512,667; 5,514,785; 5,565,552; 5,567,810; 5,574,142; 5,585,481; 5,587,371; 5,595,726; 5,597,696; 5,599,923; See Nos. 5,599,928 and 5,688,941.

화학적 합성에 덜 적합하고, 일반적으로 효소적 합성에 의해 생성되는 더 긴 폴리뉴클레오티드가 또한 변형될 수 있다. 이러한 변형은 예를 들어, 특정 뉴클레오티드 유사체의 도입, 분자의 5' 또는 3' 말단에 특정 서열 또는 다른 모이어티의 혼입 및 다른 변형을 포함할 수 있다. 예시의 방식으로, Cas9를 인코딩하는 mRNA는 대략 4kb 길이이고, 시험관내 전사에 의해 합성될 수 있다. mRNA에 대한 변형이 적용되어 예를 들어, 그의 번역 또는 안정성을 증가시키거나(예컨대 세포 내의 분해에 대한 그의 내성을 증가시킴으로써) 또는 외인성 RNA, 특히 예컨대 Cas9를 인코딩하는 더 긴 RNA의 도입 이후에 세포에서 흔히 관찰되는 선천적 면역 반응을 유발하는 RNA의 경향을 감소시킬 수 있다.Longer polynucleotides less suitable for chemical synthesis and generally produced by enzymatic synthesis may also be modified. Such modifications may include, for example, introduction of specific nucleotide analogs, incorporation of specific sequences or other moieties at the 5' or 3' end of the molecule, and other modifications. By way of example, the mRNA encoding Cas9 is approximately 4 kb in length and can be synthesized by in vitro transcription. Modifications to the mRNA may be applied, for example, to increase its translation or stability (eg by increasing its resistance to degradation within the cell) or after introduction of an exogenous RNA, in particular a longer RNA encoding such as Cas9 into the cell It can reduce the tendency of RNA to trigger an innate immune response commonly observed in

다수의 이러한 변형, 예컨대 폴리A 테일, 5' 캡 유사체(예를 들어, 항 역전사 캡 유사체(Anti Reverse Cap Analog; ARCA) 또는 m7G(5')ppp(5')G(mCAP)), 변형된 5' 또는 3' 비번역 영역(UTR), 변형된 염기(예컨대 슈도-UTP, 2-티오-UTP, 5-메틸시티딘-5'-트리포스페이트(5-메틸-CTP) 또는 N6-메틸-ATP)의 사용 또는 5' 말단 포스페이트를 제거하기 위한 포스파타제로의 처리는 해당 분야에 기술되어 있다. 이들 변형 및 다른 변형이 해당 분야에 공지되어 있고, RNA의 새로운 변형은 정기적으로 개발되고 있다.Many of these modifications, such as polyA tails, 5' cap analogs (eg, Anti Reverse Cap Analog (ARCA) or m7G(5')ppp(5')G(mCAP)), modified 5' or 3' untranslated region (UTR), modified base (eg pseudo-UTP, 2-thio-UTP, 5-methylcytidine-5'-triphosphate (5-methyl-CTP) or N6-methyl- ATP) or treatment with phosphatase to remove the 5' terminal phosphate has been described in the art. These and other modifications are known in the art, and new modifications of RNA are being developed regularly.

생체 내에 운반된 화학적으로 변형된 mRNA를 사용하여 개선된 치료적 효과를 달성할 수 있음이 보고되었으며; 예를 들어, 문헌[Kormann et al., Nature Biotechnol (2011) 29:154-57]을 참조한다. 이러한 변형을 사용하여 예를 들어, RNA 분자의 안정성을 증가시키고/증가시키거나 그의 면역원성을 감소시킬 수 있다. 화학적 변형, 예컨대 슈도-U, N6-메틸-A, 2-티오-U 및 5-메틸-C를 사용하여, 유리딘 잔기 및 시티딘 잔기의 단지 1/4을 각각 2-티오-U 및 5-메틸-C로 치환하여, 마우스에서 mRNA의 톨-유사 수용체(TLR) 매개된 인식의 상당한 감소를 야기하였음이 관찰되었다. 선천적 면역계의 활성화를 감소시킴으로써, 이들 변형을 사용하여 생체내에서 mRNA의 안정성 및 지속성을 효율적으로 증가시킬 수 있으며; 예를 들어, 상기 문헌[Kormann et al.]을 참조한다.It has been reported that improved therapeutic effects can be achieved using chemically modified mRNA delivered in vivo; See, eg, Kormann et al., Nature Biotechnol (2011) 29: 154-57. Such modifications can be used, for example, to increase the stability of an RNA molecule and/or to decrease its immunogenicity. Using chemical modifications such as pseudo-U, N6-methyl-A, 2-thio-U and 5-methyl-C, only a quarter of the uridine and cytidine residues were replaced with 2-thio-U and 5, respectively. It was observed that substitution with -methyl-C resulted in a significant reduction in the toll-like receptor (TLR) mediated recognition of mRNA in mice. By reducing the activation of the innate immune system, these modifications can be used to efficiently increase the stability and persistence of mRNA in vivo; See, eg, Kormann et al. ].

또한, 선천적인 항-바이러스 반응을 우회하도록 설계된 변형을 혼입시킨 합성 메신저 RNA의 반복된 투여는 분화된 인간 세포를 만능성으로 리프로그래밍할 수 있는 것으로 보고되었다. 예를 들어, 문헌[Warren et al., Cell Stem Cell (2010) 7(5):618-30]을 참조한다. 주요 리프로그래밍 단백질로서 작용하는 이러한 변형된 mRNA는 다수의 인간 세포 유형을 리프로그래밍하는 효율적인 수단일 수 있다. 이러한 세포는 유도된 만능성 줄기 세포(iPSC)로 지칭되며, 5-메틸-CTP, 슈도-UTP 및 항 역전사 캡 유사체(ARCA)를 혼입시킨 효소적으로 합성된 RNA를 사용하여 세포의 항바이러스 반응을 효율적으로 회피할 수 있는 것이 관찰되었으며; 예를 들어, 상기 문헌[Warren et al.]을 참조한다.In addition, it has been reported that repeated administration of synthetic messenger RNA incorporating modifications designed to bypass the innate anti-viral response can reprogram differentiated human cells to pluripotency. See, eg, Warren et al., Cell Stem Cell (2010) 7 (5):618-30. These modified mRNAs, which act as key reprogramming proteins, can be an efficient means of reprogramming many human cell types. These cells are referred to as induced pluripotent stem cells (iPSCs) and use enzymatically synthesized RNA incorporating 5-methyl-CTP, pseudo-UTP and an anti-reverse transcription cap analog (ARCA) for the antiviral response of the cells. was observed to be able to avoid efficiently; See, eg, Warren et al ., supra.

해당 분야에 기술된 폴리뉴클레오티드의 다른 변형은 예를 들어, 폴리A 테일의 이용, 5' 캡 유사체(예컨대 m7G(5')ppp(5')G (mCAP))의 부가, 5' 또는 3' 비번역 영역(UTR)의 변형, 및 5' 말단 포스페이트를 제거하기 위한 포스파타제로의 처리를 포함한다.Other modifications of polynucleotides described in the art include, for example, use of a polyA tail, addition of a 5' cap analog (eg m7G(5')ppp(5')G (mCAP)), 5' or 3' modification of the untranslated region (UTR), and treatment with phosphatase to remove the 5' terminal phosphate.

본원에 사용하기 위한 변형된 RNA의 생성에 적용 가능한 수많은 조성물 및 기법이 siRNA를 포함하는 RNAi의 변형과 관련하여 개발된 바 있다. siRNA는 mRNA 간섭을 통한 유전자 침묵화에서의 그들의 효과가 일반적으로 일시적이며, 이는 반복 투여를 필요로 할 수 있기 때문에, 시험관 내에서 특정 난제를 제시한다. 또한, siRNA는 이중-가닥 RNA(dsRNA)이며, 포유동물 면역 반응은 종종 바이러스 감염의 부산물인 dsRNA를 검출하고 이를 중화시키기 위해 발달된다. 따라서, 포유동물 효소, 예컨대 PKR(dsRNA-반응성 키나제), 및 dsRNA에 대한 세포 반응을 매개할 수 있는 잠재적 레티노산-유도성 유전자 I(RIG-I), 및 이러한 분자에 반응하여 사이토카인의 유도를 촉발시킬 수 있는 톨-유사 수용체(예컨대 TLR3, TLR7 및 TLR8)가 존재하며; 예를 들어, 문헌[Angart et al., Pharmaceuticals (Basel) (2013) 6(4):440-68]; 문헌[Kanasty et al., Mol Ther (2012) 20(3):513-24]; 문헌[Burnett et al., Biotechnol J (2011) 6(9):1130-46]; 문헌[Judge and MacLachlan, Hum Gene Ther (2008) 19(2):111-24]에 의한 검토 및 상기 문헌에 인용된 참고문헌을 참조한다.Numerous compositions and techniques applicable to the production of modified RNAs for use herein have been developed in connection with the modification of RNAi, including siRNAs. siRNAs present certain challenges in vitro, as their effects in gene silencing via mRNA interference are usually transient, which may require repeated administration. In addition, siRNA is double-stranded RNA (dsRNA), and mammalian immune responses are often developed to detect and neutralize dsRNA, which is a by-product of viral infection. Thus, mammalian enzymes such as PKR (dsRNA-reactive kinase), and potential retinoic acid-inducible gene I (RIG-I) that can mediate cellular responses to dsRNA, and induction of cytokines in response to these molecules There are Toll-like receptors (such as TLR3, TLR7 and TLR8) that can trigger See, eg, Angart et al., Pharmaceuticals (Basel) (2013) 6 (4):440-68; Kanasty et al., Mol Ther (2012) 20 (3):513-24; Burnett et al., Biotechnol J (2011) 6 (9): 1130-46; See the review by Judge and MacLachlan, Hum Gene Ther (2008) 19 (2):111-24 and the references cited therein.

RNA 안정성을 향상시키고/향상시키거나 선천적 면역 반응을 감소시키고/감소시키거나 폴리뉴클레오티드를 인간 세포 내로 도입하는 것과 관련하여 유용할 수 있는 다른 이점을 달성하기 위하여 매우 다양한 변형이 개발되고 적용된 바 있으며; 예를 들어, 문헌[Ann Rev Chem Biomol Eng (2011) 2:77-96]; 문헌[Gaglione and Messere, Mini Rev Med Chem (2010) 10(7):578-95]; 문헌[Chernolovskaya et al., Curr Opin Mol Ther (2010) 12(2):158-67]; 문헌[Deleavey et al., Curr Protoc Nuc Acid Chem, Chapter 16:Unit 16.3 (2009)]; 문헌[Behlke, Oligonucleotides (2008) 18(4):305-19]; 문헌[Fucini et al., Nucleic Acid Ther (2012) 22(3): 205-210]; 문헌[Bremsen et al., Front Genet (2012) 3:154]의 검토를 참조한다.A wide variety of modifications have been developed and applied to improve RNA stability and/or to reduce the innate immune response and/or to achieve other advantages that may be useful in connection with the introduction of polynucleotides into human cells; See, eg, Ann Rev Chem Biomol Eng (2011) 2 :77-96; Gaglione and Messere, Mini Rev Med Chem (2010) 10 (7):578-95; Chernolovskaya et al., Curr Opin Mol Ther (2010) 12 (2):158-67; Deleavey et al., Curr Protoc Nuc Acid Chem, Chapter 16:Unit 16.3 (2009); Behlke, Oligonucleotides (2008) 18 (4):305-19; Fucini et al., Nucleic Acid Ther (2012) 22 (3): 205-210; See review of Bremsen et al., Front Genet (2012) 3 :154.

변형된 RNA의 다수의 상업적인 공급처가 존재하며, 이들 중 다수는 siRNA의 효율성을 개선시키도록 설계된 변형에서 특수화되었다. 다양한 접근법이 문헌에 보고된 발견에 기초하여 제공된다. 예를 들어, Dharmacon은 비-브릿징 산소의 황(포스포로티오에이트, PS)으로의 대체를 광범위하게 사용하여 문헌[Kole, Nature Rev Drug Disc (2012) 11:125-40]에 의해 보고된 바와 같이, siRNA의 뉴클레아제 내성을 개선시켰다는 것을 주목한다. 리보스 2'-위치의 변형은 듀플렉스 안정성(Tm)을 증가시키면서 뉴클레오티드간 포스페이트 결합의 뉴클레아제 내성을 개선시킨다고 보고되어 있는데, 이것은 또한 면역 활성화로부터의 보호를 제공한다는 것을 보고하였다. 중등의 PS 백본 변형과 작은, 널리-용인되는 2'-치환(2'-O-메틸, 2'-플루오로, 2'-하이드로)의 조합은 문헌[Soutschek et al., Nature (2004) 432:173-78]에 의해 보고된 바와 같이, 생체 내에 적용하기 위하여 고도로 안정한 siRNA와 회합된 바 있고; 2'-O-메틸 변형은 문헌[Volkov, Oligonucleotides (2009) 19:191-202]에 보고된 바와 같이 안정성을 개선시키는 데 효율적인 것으로 보고되어 있다. 선천적 면역 반응의 유도를 감소시키는 것과 관련하여, 특정 서열을 2'-O-메틸, 2'-플루오로, 2'-하이드로로 변형시키는 것은 일반적으로 침묵화 활성을 유지하면서, TLR7/TLR8 상호작용을 감소시키는 것으로 보고되어 있으며; 예를 들어, 문헌[Judge et al., Mol Ther (2006) 13:494-505]; 및 문헌[Cekaite et al., J Mol Biol (2007) 365:90-108]을 참조한다. 추가 변형, 예컨대 2-티오우라실, 슈도우라실, 5-메틸시토신, 5-메틸우라실, 및 N6-메틸아데노신은 또한 TLR3, TLR7 및 TLR8에 의해 매개된 면역 효과를 최소화하는 것으로 보고되었으며; 예를 들어, 문헌[K. Kariko et al., Immunity (2005) 23:165-75]을 참조한다.A number of commercial sources of modified RNA exist, many of which have specialized in modifications designed to improve the efficiency of siRNA. Various approaches are provided based on findings reported in the literature. For example, Dharmacon has extensively used the replacement of non-bridging oxygen with sulfur (phosphorothioate, PS) as reported by Kole, Nature Rev Drug Disc (2012) 11 :125-40 As shown, it is noted that the nuclease resistance of the siRNA was improved. It has been reported that modification of the ribose 2'-position improves nuclease resistance of internucleotide phosphate bonds while increasing duplex stability (Tm), which also provides protection from immune activation. The combination of moderate PS backbone modifications with small, widely-accepted 2'-substitutions (2'-O-methyl, 2'-fluoro, 2'-hydro) is described in Soutschek et al., Nature (2004) 432 :173-78, has been associated with highly stable siRNAs for in vivo applications; 2'-O-methyl modification is reported to be effective in improving stability as reported in Volkov, Oligonucleotides (2009) 19 :191-202]. With respect to reducing the induction of the innate immune response, modification of specific sequences to 2'-O-methyl, 2'-fluoro, 2'-hydro generally retains silencing activity, while the TLR7/TLR8 interaction has been reported to reduce; See, eg, Judge et al., Mol Ther (2006) 13 :494-505; and Cekaite et al., J Mol Biol (2007) 365 :90-108. Additional modifications such as 2-thiouracil, pseudouracil, 5-methylcytosine, 5-methyluracil, and N6-methyladenosine have also been reported to minimize immune effects mediated by TLR3, TLR7 and TLR8; See, for example, K. Kariko et al., Immunity (2005) 23 :165-75].

또한 해당 분야에 공지된 바와 같이, 그리고 상업적으로 입수 가능한 바와 같이, 세포에 의한 그들의 운반 및/또는 흡수를 향상시킬 수 있는 본원에 사용하기 위한, 폴리뉴클레오티드, 예컨대 RNA에 예를 들어, 콜레스테롤, 토코페롤 및 엽산, 지질, 펩티드, 중합체, 링커 및 압타머를 비롯한, 다수의 컨쥬게이트를 적용할 수 있으며; 예를 들어, 문헌[Winkler, Ther. Deliv. (2013) 4:791-809], 및 여기에 인용된 참고문헌을 참조한다.Also known in the art and commercially available, polynucleotides, such as RNA, for use herein that can enhance their transport and/or uptake by cells, for example, cholesterol, tocopherol and folic acid, lipids, peptides, polymers, linkers and aptamers; See, eg, Winkler, Ther. Deliv . (2013) 4 :791-809], and the references cited therein.

운반carrying

일부 실시형태에서, 본원에 제공된 방법에 사용되는 임의의 핵산 분자, 예를 들어, 본 개시내용의 게놈-표적화 핵산 및/또는 부위-지정 폴리펩티드를 인코딩하는 핵산은 세포로의 운반을 위하여 운반 비히클의 표면 내에 또는 표면 상에 패키징된다. 운반 비히클은 나노구체, 리포좀, 양자점, 나노입자, 폴리에틸렌 글리콜 입자, 하이드로겔 및 미셀(micelle)을 포함하지만, 이들로 제한되지 않는다. 해당 분야에 기술된 바와 같이, 다양한 표적화 모이어티를 사용하여 이러한 비히클과 목적하는 세포 유형 또는 위치의 우선적인 상호작용을 향상시킬 수 있다.In some embodiments, any nucleic acid molecule used in the methods provided herein, e.g., a nucleic acid encoding a genome-targeting nucleic acid and/or site-directed polypeptide of the present disclosure, can be used in a delivery vehicle for delivery into a cell. packaged in or on the surface. Delivery vehicles include, but are not limited to, nanospheres, liposomes, quantum dots, nanoparticles, polyethylene glycol particles, hydrogels, and micelles. As described in the art, a variety of targeting moieties can be used to enhance preferential interaction of such vehicles with a desired cell type or location.

본 개시내용의 복합체, 폴리펩티드 및 핵산을 바이러스 또는 박테리오파지 감염, 트랜스펙션, 컨쥬게이션, 원형질체 융합, 리포펙션, 전기천공법, 뉴클레오펙션, 인산칼슘 침전, 폴리에틸렌이민(PEI)-매개의 트랜스펙션, DEAE-덱스트란 매개 트랜스펙션, 리포좀-매개 트랜스펙션, 입자 총 기술, 인산칼슘 침전, 직접 미세-주사, 나노입자-매개의 핵산 운반 등에 의해 세포 내로 도입할 수 있다.Complexes, polypeptides and nucleic acids of the present disclosure can be subjected to viral or bacteriophage infection, transfection, conjugation, protoplast fusion, lipofection, electroporation, nucleofection, calcium phosphate precipitation, polyethyleneimine (PEI)-mediated transfection. cell injection, DEAE-dextran mediated transfection, liposome-mediated transfection, particle gun technique, calcium phosphate precipitation, direct micro-injection, nanoparticle-mediated transport of nucleic acids, and the like.

실시형태에서, 가이드 RNA 폴리뉴클레오티드(RNA 또는 DNA) 및/또는 엔도뉴클레아제 폴리뉴클레오티드(들)(RNA 또는 DNA)는 해당 분야에 공지된 바이러스 또는 비-바이러스 운반 비히클에 의해 운반될 수 있다. 대안적으로, 부위-지정 폴리펩티드(들)는 해당 분야에 공지된 바이러스 또는 비-바이러스 운반 비히클, 예컨대 전기천공법 또는 지질 나노입자에 의해 운반될 수 있다. 일부 실시형태에서, DNA 엔도뉴클레아제는 단독으로, 또는 하나 이상의 gRNA 또는 tracrRNA와 함께 하나 이상의 crRNA와 사전-복합체화되어, 하나 이상의 폴리펩티드로서 운반될 수 있다.In an embodiment, the guide RNA polynucleotide (RNA or DNA) and/or endonuclease polynucleotide(s) (RNA or DNA) may be delivered by viral or non-viral delivery vehicles known in the art. Alternatively, the site-directed polypeptide(s) can be delivered by viral or non-viral delivery vehicles known in the art, such as electroporation or lipid nanoparticles. In some embodiments, the DNA endonuclease may be delivered as one or more polypeptides, either alone or pre-complexed with one or more crRNAs in combination with one or more gRNAs or tracrRNAs.

실시형태에서, 폴리뉴클레오티드는 나노입자, 리포좀, 리보핵단백질, 양으로 하전된 펩티드, 소분자 RNA-컨쥬게이트, 압타머-RNA 키메라, 및 RNA-융합 단백질 복합체를 포함하지만 이들로 제한되지 않는 비-바이러스 운반 비히클에 의해 운반된다. 일부 예시적인 비-바이러스 운반 비히클은 문헌[Peer and Lieberman, Gene Ther (2011) 18:1127-33](이것은 다른 폴리뉴클레오티드의 운반에 또한 유용한 siRNA를 위한 비-바이러스 운반 비히클에 초점을 두고 있음)에 기술되어 있다.In an embodiment, polynucleotides are non-, including, but not limited to, nanoparticles, liposomes, ribonucleoproteins, positively charged peptides, small molecule RNA-conjugates, aptamer-RNA chimeras, and RNA-fusion protein complexes. delivered by a virus delivery vehicle. Some exemplary non-viral delivery vehicles are described in Peer and Lieberman, Gene Ther (2011) 18 :1127-33 (which focuses on non-viral delivery vehicles for siRNAs that are also useful for delivery of other polynucleotides) is described in

실시형태에서, 폴리뉴클레오티드, 예컨대 가이드 RNA, sgRNA 및 엔도뉴클레아제를 인코딩하는 mRNA는 지질 나노입자(LNP)에 의해 세포 또는 대상체에 운반될 수 있다.In an embodiment, polynucleotides, such as guide RNAs, sgRNAs and mRNA encoding endonucleases, can be delivered to cells or subjects by lipid nanoparticles (LNPs).

핵산을 위한 몇몇의 비-바이러스 전달 방법이 동물 모델 및 인간 둘 모두에서 시험된 바 있지만, 가장 잘 개발된 시스템은 지질 나노입자이다. LNP는 일반적으로 이온화 가능한 양이온성 지질 및 3가지 이상의 추가의 성분, 일반적으로 콜레스테롤, DOPE 및 폴리에틸렌 글리콜(PEG) 함유 지질로 구성된다(예를 들어, 실시예 1 참조). 양이온성 지질은 양으로 하전된 핵산에 결합하여 핵산을 분해로부터 보호하는 밀집한 복합체를 형성할 수 있다. 마이크로유체 시스템을 통과하는 동안, 성분은 자가-조립하여, 50 내지 150 nM의 크기 범위의 입자를 형성하며, 여기서, 핵산은 양이온성 지질과 복합체화되고 지질 이중층 유사 구조에 의해 둘러싸진 코어 내에 캡슐화된다. 대상체의 순환계 내로의 주사 후에, 이들 입자는 아포지질단백질 E(apoE)에 결합할 수 있다. ApoE는 LDL 수용체에 대한 리간드이며, 수용체 매개의 내포작용을 통해 간의 간세포 내로의 흡수를 매개한다. 이 유형의 LNP는 mRNA 및 siRNA를 설치류, 영장류 및 인간의 간의 간세포로 효율적으로 전달하는 것으로 보고된 바 있다. 내포작용 후에, LNP는 엔도솜에 존재한다. 캡슐화된 핵산은 양이온성 지질의 이온화 가능한 성질에 의해 매개되는 엔도솜 회피의 과정을 겪는다. 이는 핵산을 세포질 내로 전달하며, 여기서, mRNA는 인코딩된 단백질로 번역될 수 있다. 따라서, 일부 실시형태에서, LNP 내로의 gRNA 및 Cas9를 인코딩하는 mRNA의 캡슐화를 사용하여, 정맥내 주사 후에 두 성분 모두를 간세포에 효율적으로 전달한다. 엔도솜 회피 후에, Cas9 mRNA는 Cas9 단백질로 번역되며, gRNA와 복합체를 형성한다. 일부 실시형태에서, Cas9 단백질 서열 내에 핵 국소화 신호를 포함시키면, 핵으로의 Cas9 단백질/gRNA 복합체의 전좌가 촉진된다. 대안적으로, 작은 gRNA는 핵 포어 복합체를 가로질러, 핵 내의 Cas9 단백질과 복합체를 형성한다. 일단 gRNA/Cas9 복합체가 핵 내에 존재하면, 이는 상동성 표적 부위에 대하여 게놈을 스캐닝하여, 게놈 내의 요망되는 표적 부위에서 우선적으로 이중 가닥 파단부를 생성한다. 생체내에서 RNA 분자의 반감기는 대략 수시간 내지 수일로 짧다. 유사하게, 단백질의 반감기는 대략 수시간 내지 수일로 짧은 경향이 있다. 따라서, 일부 실시형태에서, LNP를 사용한 gRNA 및 Cas9 mRNA의 전달은 gRNA/Cas9 복합체의 오직 일시적인 발현 및 활성만을 초래할 수 있다. 이는 오프-표적 절단의 빈도를 감소시키는 이점을 제공할 수 있으며, 이에 따라 일부 실시형태에서 유전독성의 위험을 최소화시킨다. LNP는 일반적으로 바이러스 입자보다 면역원성이 더 낮다. 많은 인간은 AAV에 대한 선재성 면역성을 갖지만, LNP에 대한 선재성 면역성은 존재하지 않는다. LNP에 대한 추가의 및 적응 면역 반응은 발생할 가능성이 적으며, 이는 LNP의 반복 투여를 가능하게 한다.Although several non-viral delivery methods for nucleic acids have been tested in both animal models and humans, the best developed system is lipid nanoparticles. LNPs are generally composed of ionizable cationic lipids and at least three additional components, usually cholesterol, DOPE and polyethylene glycol (PEG) containing lipids (see, eg, Example 1). Cationic lipids can bind positively charged nucleic acids to form dense complexes that protect the nucleic acids from degradation. During passage through the microfluidic system, the components self-assemble to form particles ranging in size from 50 to 150 nM, wherein the nucleic acids are complexed with cationic lipids and encapsulated within a core surrounded by a lipid bilayer-like structure. do. After injection into the circulatory system of a subject, these particles can bind to apolipoprotein E (apoE). ApoE is a ligand for the LDL receptor and mediates uptake into hepatocytes of the liver through receptor-mediated endocytosis. This type of LNP has been reported to efficiently deliver mRNA and siRNA to hepatocytes of rodent, primate and human livers. After endocytosis, LNP is present in the endosome. Encapsulated nucleic acids undergo a process of endosomal evasion mediated by the ionizable nature of cationic lipids. It delivers the nucleic acid into the cytoplasm, where the mRNA can be translated into the encoded protein. Thus, in some embodiments, encapsulation of gRNA and Cas9 encoding mRNA into LNPs is used to efficiently deliver both components to hepatocytes after intravenous injection. After endosomal evasion, Cas9 mRNA is translated into Cas9 protein and forms a complex with gRNA. In some embodiments, inclusion of a nuclear localization signal within the Cas9 protein sequence promotes translocation of the Cas9 protein/gRNA complex to the nucleus. Alternatively, the small gRNA traverses the nuclear pore complex, forming a complex with the Cas9 protein in the nucleus. Once the gRNA/Cas9 complex is present in the nucleus, it scans the genome for homologous target sites, preferentially creating double-stranded breaks at the desired target site in the genome. The half-life of RNA molecules in vivo is short, on the order of several hours to several days. Similarly, the half-life of proteins tends to be short, on the order of hours to days. Thus, in some embodiments, delivery of gRNA and Cas9 mRNA using LNPs may result in only transient expression and activity of the gRNA/Cas9 complex. This may provide the advantage of reducing the frequency of off-target cleavage, thus minimizing the risk of genotoxicity in some embodiments. LNPs are generally less immunogenic than viral particles. Many humans have pre-existing immunity to AAV, but no pre-existing immunity to LNP. Additional and adaptive immune responses to LNP are less likely to occur, allowing repeated administration of LNP.

치료적 코딩 서열이 숙주 게놈 유전자좌, 예컨대 세이프 하버 유전자좌 내로 통합되는 유전자 편집 기반의 유전자 요법을 대상체에게 투여하는 경우, 대상체에게 최적의 치료적 이익을 제공하는 유전자 발현의 수준을 달성하는 것이 유리할 것이다. 예를 들어, A형 혈우병에서, 혈중 FVIII 단백질의 가장 바람직한 수준은 정상 수준의 20% 내지 100%, 30% 내지 100%, 40% 내지 100% 또는 50% 내지 100%의 범위일 것이다. AAV 게놈의 에피솜 카피로부터 치료적 코딩 서열의 발현을 유도하기 위하여 강력한 프로모터를 사용하는 표준 AAV 기반의 유전자 요법은 달성되는 발현의 수준의 조절을 가능하게 하지 않는데, 그 이유는 AAV 바이러스가 오직 1회만 투여될 수 있으며, 달성되는 발현의 수준은 대상체 간에 유의미하게 달라지기 때문이다(문헌[S. Rangarajan et al., N Engl J Med (2017) 377:2519-30]). 대상체에 AAV 바이러스를 투여한 후에, 그들에는 바이러스 캡시드 단백질에 대하여 높은 역가의 항체가 발생하며, 이는 전임상 모델에 기초하여 바이러스의 효과적인 재-투여를 막을 것으로 예상된다(문헌[H. Petry et al., Gene Ther (2008) 15:54-60]). AAV 바이러스에 의해 전달되는 치료적 유전자가 세이프 하버 유전자좌, 예컨대 알부민 인트론 1에서 게놈 내로 통합되며, 이 표적화된 통합이 게놈 내의 이중 가닥 파단부의 생성을 통해 발생하는 하나의 접근법은 표적화된 통합의 수준 및 이에 따라 치료적 코딩 서열 생성물의 수준을 조절하는 기회를 제공한다. 합성 FVIII을 인코딩하는 공여자 DNA 카세트를 함유하는 AAV 게놈을 캡슐화하는 AAV에 의해 간이 형질도입된 후에, AAV 게놈은 형질도입된 세포의 핵 내에 에피솜으로 유지된다. 이들 에피솜 AAV 게놈은 시간이 지남에 따라 상대적으로 안정하며, 이에 따라 CRISPR/Cas9에 의해 생성되는 이중 가닥 파단부에서의 표적화된 통합을 위한 공여자 주형의 풀을 제공한다.When a subject is administered gene editing based gene therapy in which a therapeutic coding sequence is integrated into a host genomic locus, such as a safe harbor locus, it would be advantageous to achieve a level of gene expression that provides an optimal therapeutic benefit to the subject. For example, in hemophilia A, the most desirable level of FVIII protein in the blood will range from 20% to 100%, 30% to 100%, 40% to 100% or 50% to 100% of normal levels. Standard AAV-based gene therapy, which uses a strong promoter to drive expression of a therapeutic coding sequence from an episomal copy of the AAV genome, does not allow for the regulation of the level of expression achieved, since the AAV virus has only 1 It can be administered only once and the level of expression achieved varies significantly between subjects (S. Rangarajan et al., N Engl J Med (2017) 377 :2519-30). After administration of the AAV virus to subjects, they develop high titers of antibodies to the viral capsid protein, which is expected to prevent effective re-administration of the virus based on preclinical models (H. Petry et al. , Gene Ther (2008) 15 :54-60]). One approach in which a therapeutic gene delivered by an AAV virus is integrated into the genome at a safe harbor locus, such as albumin intron 1, where this targeted integration occurs through the creation of double-stranded breaks in the genome, is the level of targeted integration and This provides an opportunity to modulate the level of therapeutic coding sequence products. After liver transduction with an AAV encapsulating an AAV genome containing a donor DNA cassette encoding synthetic FVIII, the AAV genome is maintained episomal in the nucleus of the transduced cell. These episomal AAV genomes are relatively stable over time, thus providing a pool of donor templates for targeted integration at the double-strand breaks generated by CRISPR/Cas9.

몇몇의 상이한 이온화 가능한 양이온성 지질이 LNP에 사용하기 위하여 개발된 바 있다. 이들은 다른 것들 중 특히 C12-200(문헌[K.T. Love et al., Proc Natl Acad Sci USA (2010) 107:1864-69]), MC3(문헌[M. Jayaraman et al., Angew Chem Int Ed Engl (2012) 51:8529-33]), LN16 및 MD1(Fougerolles 등, 미국 특허 제8754062호)을 포함한다. C12-200은 1,1’-((2-(4-(2-((2-(비스(2-하이드록시도데실)아미노)에틸) (2-하이드록시도데실)아미노)에틸)피페라진-1-일)에틸)아잔디일)비스(도데칸-2-올)이다. 한 유형의 LNP에서, GalNac 모이어티가 LNP의 외측에 부착되며, 아시알로당단백질 수용체를 통하여 간 내로 흡수되기 위한 리간드로서 작용한다. 이들 양이온성 지질 중 어느 하나를 사용하여 간으로의 gRNA 및 Cas9 mRNA의 전달을 위한 LNP를 제형화한다.Several different ionizable cationic lipids have been developed for use in LNPs. These are among others C12-200 (KT Love et al., Proc Natl Acad Sci USA (2010) 107 :1864-69), MC3 (M. Jayaraman et al., Angew Chem Int Ed Engl ( 2012) 51 :8529-33), LN16 and MD1 (Fougerolles et al., US Pat. No. 8754062). C12-200 is 1,1'-((2-(4-(2-((2-(bis(2-hydroxydodecyl)amino)ethyl) (2-hydroxydodecyl)amino)ethyl)pipe Razin-1-yl)ethyl)azanediyl)bis(dodecan-2-ol). In one type of LNP, a GalNac moiety is attached to the outside of the LNP and acts as a ligand for uptake into the liver via the asialoglycoprotein receptor. Either of these cationic lipids is used to formulate LNPs for delivery of gRNA and Cas9 mRNA to the liver.

일부 실시형태에서, LNP는 약 1000 ㎚, 500 ㎚, 250 ㎚, 200 ㎚, 150 ㎚, 100 ㎚, 75 ㎚, 50 ㎚ 또는 25 ㎚ 미만의 직경을 가진다. 대안적으로, 나노입자는 약 1 내지 1000 ㎚, 1 내지 500 ㎚, 1 내지 250 ㎚, 25 내지 200 ㎚, 25 내지 100 ㎚, 35 내지 75 ㎚ 또는 25 내지 60 ㎚ 크기 범위일 수 있다.In some embodiments, the LNPs have a diameter of less than about 1000 nm, 500 nm, 250 nm, 200 nm, 150 nm, 100 nm, 75 nm, 50 nm, or 25 nm. Alternatively, the nanoparticles can range in size from about 1-1000 nm, 1-500 nm, 1-250 nm, 25-200 nm, 25-100 nm, 35-75 nm, or 25-60 nm.

LNP는 양이온성, 음이온성 또는 중성 지질로부터 제조될 수 있다. 중성 지질, 예컨대 융합생성 인지질 DOPE 또는 막 성분 콜레스테롤을 '헬퍼 지질'로서 LNP에 포함시켜 트랜스펙션 활성 및 나노입자 안정성을 향상시킬 수 있다. 양이온성 지질의 한계는 불량한 안정성 및 신속한 제거, 뿐만 아니라 염증 또는 항-염증 반응의 생성으로 인한 낮은 효능을 포함할 수 있다. LNP는 또한 소수성 지질, 친수성 지질 또는 소수성 지질 및 친수성 지질 둘 모두를 가질 수 있다.LNPs can be prepared from cationic, anionic or neutral lipids. Neutral lipids such as fusogenic phospholipid DOPE or membrane component cholesterol can be included in LNPs as 'helper lipids' to enhance transfection activity and nanoparticle stability. Limitations of cationic lipids may include poor stability and rapid clearance, as well as low potency due to generation of an inflammatory or anti-inflammatory response. LNPs may also have hydrophobic lipids, hydrophilic lipids, or both hydrophobic and hydrophilic lipids.

해당 분야에 공지된 임의의 지질 또는 지질의 조합을 사용하여 LNP를 생성할 수 있다. LNP를 생성하는 데 사용되는 지질의 예는 DOTMA, DOSPA, DOTAP, DMRIE, DC-콜레스테롤, DOTAP-콜레스테롤, GAP-DMORIE-DPyPE 및 GL67A-DOPE-DMPE-폴리에틸렌 글리콜(PEG)을 포함한다. 양이온성 지질의 예는 98N12-5, C12-200, DLin-KC2-DMA(KC2), DLin-MC3-DMA(MC3), XTC, MD1 및 7C1을 포함한다. 중성 지질의 예는 DPSC, DPPC, POPC, DOPE 및 SM을 포함한다. PEG-변형된 지질의 예는 PEG-DMG, PEG-CerC14 및 PEG-CerC20을 포함한다.Any lipid or combination of lipids known in the art can be used to generate LNPs. Examples of lipids used to produce LNPs include DOTMA, DOSPA, DOTAP, DMRIE, DC-cholesterol, DOTAP-cholesterol, GAP-DMORIE-DPyPE and GL67A-DOPE-DMPE-polyethylene glycol (PEG). Examples of cationic lipids include 98N12-5, C12-200, DLin-KC2-DMA (KC2), DLin-MC3-DMA (MC3), XTC, MD1 and 7C1. Examples of neutral lipids include DPSC, DPPC, POPC, DOPE and SM. Examples of PEG-modified lipids include PEG-DMG, PEG-CerC14 and PEG-CerC20.

실시형태에서, 지질을 임의의 수의 몰비로 조합하여 LNP를 생성할 수 있다. 또한, 폴리뉴클레오티드(들)를 다양한 범위의 몰비로 지질(들)과 조합하여 LNP를 생성할 수 있다.In embodiments, lipids may be combined in any number of molar ratios to produce LNPs. In addition, polynucleotide(s) can be combined with lipid(s) in a wide range of molar ratios to produce LNPs.

실시형태에서, 부위-지정 폴리펩티드 및 게놈-표적화 핵산은 각각 세포 또는 대상체로 개별적으로 투여될 수 있다. 부위-지정 폴리펩티드는 하나 이상의 가이드 RNA, 또는 tracrRNA와 함께 하나 이상의 crRNA와 사전-복합체화될 수 있다. 그 다음, 사전-복합체화된 물질을 세포 또는 대상체에게 투여할 수 있다. 이러한 사전-복합체화된 물질은 리보핵단백질 입자(RNP)로 알려져 있다.In an embodiment, the site-directed polypeptide and the genome-targeting nucleic acid may each be administered separately to a cell or subject. The site-directed polypeptide may be pre-complexed with one or more guide RNAs, or one or more crRNAs along with tracrRNAs. The pre-complexed material can then be administered to the cell or subject. These pre-complexed substances are known as ribonucleoprotein particles (RNPs).

RNA는 RNA 또는 DNA와 특이적 상호작용을 형성할 수 있다. 이의 특성은 많은 생물학적 과정에서 활용되지만, 그것은 또한 핵산-풍부 세포 환경에서 무차별적인 상호작용의 위험이 따른다. 이러한 문제에 대한 하나의 해결책은 리보핵단백질 입자(RNP)를 형성하는 것인데, 여기서 RNA는 엔도뉴클레아제와 사전-복합체화된다. RNP의 또 다른 이익은 RNA가 분해로부터 보호된다는 것이다.RNA can form specific interactions with RNA or DNA. Although its properties are exploited in many biological processes, it also carries the risk of indiscriminate interactions in the nucleic acid-rich cellular environment. One solution to this problem is to form ribonucleoprotein particles (RNPs), where the RNA is pre-complexed with an endonuclease. Another benefit of RNPs is that RNA is protected from degradation.

일부 실시형태에서, RNP 내의 엔도뉴클레아제는 변형되거나 또는 미변형된다. 마찬가지로, gRNA, crRNA, tracrRNA 또는 sgRNA는 변형되거나 또는 미변형될 수 있다. 다수의 변형이 해당 분야에 공지되어 있고, 사용될 수 있다.In some embodiments, the endonuclease in the RNP is modified or unmodified. Likewise, gRNA, crRNA, tracrRNA or sgRNA may be modified or unmodified. Numerous variations are known in the art and can be used.

엔도뉴클레아제 및 sgRNA는 일반적으로 약 1:1 몰비로 조합된다. 대안적으로, 엔도뉴클레아제, crRNA 및 tracrRNA는 약 1:1:1 몰비로 조합될 수 있다. 그러나 매우 다양한 몰비를 사용하여 RNP를 생성할 수 있다.Endonucleases and sgRNAs are generally combined in a molar ratio of about 1:1. Alternatively, the endonuclease, crRNA and tracrRNA may be combined in a molar ratio of about 1:1:1. However, a wide variety of molar ratios can be used to generate RNPs.

일부 실시형태에서, 재조합 AAV 벡터는 전달을 위해 사용된다. 전달될 폴리뉴클레오티드, rep 및 cap 유전자, 및 헬퍼 바이러스 기능을 포함하는 패키징될 AAV 게놈이 세포에 제공되는 rAAV 입자를 생성하기 위한 기법은 해당 분야에서 표준이다. rAAV의 생성은 하기 성분이 단일 세포(본원에서 패키징 세포로 지칭됨) 내에 존재하는 것을 필요로 한다: rAAV 게놈, rAAV 게놈으로부터 분리된(즉, 그 내에 존재하지 않는) AAV rep 및 cap 유전자 및 헬퍼 바이러스 기능. AAV rep 및 cap 유전자는 재조합 바이러스가 유래될 수 있는 임의의 AAV 혈청형으로부터 유래할 수 있고, AAV 혈청형 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9, AAV-10, AAV-11, AAV-12, AAV-13 및 AAV rh.74를 포함하지만 이들로 제한되지 않는, rAAV 게놈 ITR과 상이한 AAV 혈청형으로부터 유래할 수 있다. 위형 rAAV의 생성은 예를 들어, 국제 특허 출원 제WO 01/83692호에 개시되어 있다. 표 1을 참조한다.In some embodiments, recombinant AAV vectors are used for delivery. Techniques for generating rAAV particles in which cells are provided with an AAV genome to be packaged comprising polynucleotides to be delivered, rep and cap genes, and helper virus functions are standard in the art. Production of rAAV requires that the following components are present in a single cell (referred to herein as packaging cell): the rAAV genome, the AAV rep and cap genes isolated from (i.e. not present within) the rAAV genome, and helpers. virus function. The AAV rep and cap genes can be derived from any AAV serotype from which the recombinant virus can be derived, and the AAV serotypes AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6 AAV serotypes different from the rAAV genomic ITR, including but not limited to, AAV-7, AAV-8, AAV-9, AAV-10, AAV-11, AAV-12, AAV-13 and AAV rh.74 can be derived from The generation of pseudotyped rAAV is disclosed, for example, in International Patent Application WO 01/83692. See Table 1.

[표 1] AAV 혈청형 및 선택된 AAV의 Genbank 수탁 번호.Table 1 AAV serotypes and Genbank accession numbers of selected AAVs.

Figure pct00002
Figure pct00002

일부 실시형태에서, 패키징 세포를 생성하는 방법은 AAV 입자 생성을 위한 필수 성분 모두를 안정하게 발현하는 세포주를 생성하는 것을 포함한다. 예를 들어, AAV rep 및 cap 유전자가 결여된 rAAV 게놈, rAAV 게놈으로부터 분리된 AAV rep 및 cap 유전자, 및 선택 가능한 마커, 예컨대 네오마이신 내성 유전자를 포함하는 플라스미드(또는 다수의 플라스미드)가 세포의 게놈 내에 통합된다. AAV 게놈을 GC 테일링(tailing)(문헌[R.J. Samulski et al., Proc Natl Acad Sci USA (1982) 79:2077-81]), 제한 엔도뉴클레아제 절단 부위를 함유하는 합성 링커의 부가(문헌[C.A. Laughlin et al., Gene (1983) 23:65-73]) 또는 직접 블런트-말단 라이게이션(문헌[P. Senapathy et al., J Biol Chem (1984) 259:4661-66])과 같은 절차에 의해 박테리아 플라스미드 내로 도입시킨 바 있다. 이어서, 패키징 세포주를 헬퍼 바이러스, 예컨대 아데노바이러스로 감염시킨다. 이러한 방법의 이점은 세포가 선택 가능하고, rAAV의 대규모 생성에 적합하는 것이다. 적합한 다른 방법은 플라스미드가 아니라 아데노바이러스 또는 배큘로바이러스를 사용하여 패키징 세포 내로 rAAV 게놈 및/또는 rep 및 cap 유전자를 도입한다.In some embodiments, a method of generating a packaging cell comprises generating a cell line stably expressing all of the essential components for AAV particle production. For example, a plasmid (or multiple plasmids) comprising a rAAV genome lacking the AAV rep and cap genes, AAV rep and cap genes isolated from the rAAV genome, and a selectable marker, such as a neomycin resistance gene, can be generated in the genome of a cell. integrated within GC tailing the AAV genome (RJ Samulski et al., Proc Natl Acad Sci USA (1982) 79:2077-81), addition of a synthetic linker containing a restriction endonuclease cleavage site (Reference [RJ Samulski et al., Proc Natl Acad Sci USA (1982) 79 :2077-81]) CA Laughlin et al., Gene (1983) 23 :65-73) or direct blunt-end ligation (P. Senapathy et al., J Biol Chem (1984) 259 :4661-66). has been introduced into a bacterial plasmid by The packaging cell line is then infected with a helper virus, such as an adenovirus. The advantage of this method is that the cells are selectable and suitable for large-scale production of rAAV. Another suitable method is to introduce the rAAV genome and/or rep and cap genes into packaging cells using adenoviruses or baculoviruses rather than plasmids.

rAAV 생성의 일반적인 원리는 예를 들어, 문헌[B.J. Carter, Cur Op Biotechnol (1992) 3(5):533-39]; 및 문헌[N. Muzyczka, Curr Topics Microbiol Immunol (1992) 158:97-129]에 검토되어 있다. 일부 접근법이 문헌[J.D. Tratschin et al., Mol Cell Biol (1984) 4:2072-81]; [P.L. Hermonat et al., Proc Natl Acad Sci USA (1984) 81:6466-70]; [J.D. Tratschin et al., Mol Cell Biol (1985) 5:3251-60]; [S.K. McLaughlin et al., J Virol (1988) 62:1963-73]; [J.S. Lebkowski et al., Mol Cell Biol (1988) 8:3988-96]; [R.J. Samulski et al., J Virol (1989) 63:3822-28)]; 미국 특허 제5,173,414호; 국제 특허 제WO95/13365호 및 상응하는 미국 특허 제5,658.776호; 국제 특허 제WO95/13392호; 국제 특허 제WO96/17947제; 국제 특허 제PCT/US98/18600호; 국제 특허 제WO97/09441호(PCT/US96/14423); 국제 특허 제WO97/08298호(PCT/US96/13872); 국제 특허 제WO97/21825호(PCT/US96/20777); 국제 특허 제WO97/06243호(PCT/FR96/01064); 국제 특허 제WO99/11764호; 문헌[P. Perrin et al., Vaccine (1995) 13:1244-50]; [R.W. Paul et al., Human Gene Ther (1993) 4:609-15]; [Clark et al., Gene Ther (1996) 3:1124-32]; 미국 특허 제5,786,211호; 미국 특허 제5,871,982호; 및 미국 특허 제6,258,595호에 기술되어 있다.The general principles of rAAV production are described, for example, in BJ Carter, Cur Op Biotechnol (1992) 3 (5):533-39; and [N. Muzyczka, Curr Topics Microbiol Immunol (1992) 158 :97-129]. Some approaches are described in JD Tratschin et al., Mol Cell Biol (1984) 4 :2072-81; [PL Hermonat et al., Proc Natl Acad Sci USA (1984) 81 :6466-70]; [JD Tratschin et al., Mol Cell Biol (1985) 5 :3251-60]; [SK McLaughlin et al., J Virol (1988) 62 :1963-73]; [JS Lebkowski et al., Mol Cell Biol (1988) 8 :3988-96]; [RJ Samulski et al., J Virol (1989) 63 :3822-28); US Pat. No. 5,173,414; International Patent No. WO95/13365 and corresponding U.S. Patent No. 5,658.776; International Patent No. WO95/13392; International Patent No. WO96/17947; International Patent No. PCT/US98/18600; International Patent No. WO97/09441 (PCT/US96/14423); International Patent No. WO97/08298 (PCT/US96/13872); International Patent No. WO97/21825 (PCT/US96/20777); International Patent No. WO97/06243 (PCT/FR96/01064); International Patent No. WO99/11764; Literature [P. Perrin et al., Vaccine (1995) 13 :1244-50]; [RW Paul et al., Human Gene Ther (1993) 4 :609-15]; [Clark et al., Gene Ther (1996) 3 :1124-32]; US Pat. No. 5,786,211; US Pat. No. 5,871,982; and US Pat. No. 6,258,595.

AAV 벡터 혈청형은 표적 세포 유형에 일치될 수 있다. 예를 들어, 하기 예시적인 세포 유형은 특히 표기된 AAV 혈청형에 의해 형질도입될 수 있다. 예를 들어, 간 조직/세포 유형에 적합한 AAV 벡터의 혈청형은 비제한적으로 AAV3, AAV5, AAV8 및 AAV9를 포함한다.The AAV vector serotype can be matched to the target cell type. For example, the following exemplary cell types can be transduced with the specifically indicated AAV serotypes. For example, serotypes of AAV vectors suitable for liver tissue/cell types include, but are not limited to, AAV3, AAV5, AAV8 and AAV9.

아데노-연관 바이러스 벡터에 더하여, 다른 바이러스 벡터가 사용될 수 있다. 이러한 바이러스 벡터는 렌티바이러스, 알파바이러스, 엔테로바이러스, 페스티바이러스, 배큘로바이러스, 헤르페스바이러스, 엡스타인 바 바이러스, 파포바바이러스, 폭스바이러스, 백시니아 바이러스 및 단순 헤르페스 바이러스를 포함하지만, 이에 제한되지 않는다.In addition to adeno-associated viral vectors, other viral vectors may be used. Such viral vectors include, but are not limited to, lentivirus, alphavirus, enterovirus, pestivirus, baculovirus, herpesvirus, Epstein Barr virus, papovavirus, poxvirus, vaccinia virus and herpes simplex virus.

일부 실시형태에서, Cas9 mRNA, 알부민 유전자 내의 1 또는 2개의 유전자좌를 표적화하는 sgRNA 및 공여자 DNA는 각각 개별적으로 지질 나노입자 내로 제형화되거나, 모두 하나의 지질 나노입자 내로 동시-제형화되거나, 2개 이상의 지질 나노입자 내로 동시-제형화된다.In some embodiments, the Cas9 mRNA, sgRNA targeting one or two loci in the albumin gene, and donor DNA are each individually formulated into a lipid nanoparticle, all co-formulated into one lipid nanoparticle, or two co-formulated into more than one lipid nanoparticle.

일부 실시형태에서, Cas9 mRNA는 지질 나노입자 내에 제형화되는 한편, sgRNA 및 공여자 DNA는 AAV 벡터에서 운반된다. 일부 실시형태에서, Cas9 mRNA 및 sgRNA는 지질 나노입자에서 동시-제형화되는 한편, 공여자 DNA는 AAV 벡터에서 운반된다.In some embodiments, Cas9 mRNA is formulated in lipid nanoparticles, while sgRNA and donor DNA are delivered in an AAV vector. In some embodiments, Cas9 mRNA and sgRNA are co-formulated in lipid nanoparticles, while donor DNA is delivered in an AAV vector.

Cas9 뉴클레아제를 DNA 플라스미드로서, mRNA로서, 또는 단백질로서 운반하기 위한 옵션이 이용 가능하다. 가이드 RNA는 동일한 DNA로부터 발현될 수 있거나, RNA로서 운반될 수도 있다. RNA를 화학적으로 변형시켜, 그의 반감기를 변경시키거나 개선시키거나, 면역 반응의 가능성 또는 정도를 감소시킬 수 있다. 엔도뉴클레아제 단백질을 운반 이전에 gRNA와 복합체화시킬 수 있다. 바이러스 벡터는 효율적인 운반을 가능하게 하며; 분할 버전의 Cas9 및 더 작은 Cas9의 오솔로그(ortholog)는 HDR을 위하여 공여자와 같이, AAV에 패키징될 수 있다. 이들 성분의 각각을 운반할 수 있는 다양한 비-바이러스 운반 방법도 또한 존재하거나, 비-바이러스 및 바이러스 방법이 동시에 사용될 수 있다. 예를 들어, 나노입자를 사용하여, 단백질 및 가이드 RNA를 운반할 수 있는 한편, AAV를 사용하여, 공여자 DNA를 운반할 수 있다.Options are available to deliver the Cas9 nuclease as a DNA plasmid, as mRNA, or as a protein. The guide RNA may be expressed from the same DNA, or may be carried as RNA. RNA can be chemically modified to alter or improve its half-life, or to reduce the likelihood or extent of an immune response. The endonuclease protein can be complexed with the gRNA prior to delivery. Viral vectors allow for efficient delivery; A split version of Cas9 and an ortholog of the smaller Cas9 can be packaged in an AAV, such as a donor for HDR. Various non-viral delivery methods that can deliver each of these components also exist, or non-viral and viral methods can be used simultaneously. For example, nanoparticles can be used to deliver proteins and guide RNAs, while AAVs can be used to deliver donor DNA.

치료적 처치를 위한 게놈-편집 성분의 전달과 관련된 일부 실시형태에서, 적어도 2가지 성분: 서열 특이적 뉴클레아제 및 DNA 공여자 주형이, 형질전환될 세포, 예를 들어, 간세포의 핵 내로 전달된다. 일부 실시형태에서, 공여자 주형은 간에 대한 향성을 갖는 AAV 내로 패키징된다. 일부 실시형태에서, AAV는 혈청형 AAV8, AAV9, AAVrh10, AAV5, AAV6 또는 AAV-DJ로부터 선택된다. 일부 실시형태에서, AAV 패키징된 DNA 공여자 주형이 대상체에게, 예를 들어, 먼저 말초 정맥내 주사에 의해 대상체에게 투여된 후, 서열 특이적 뉴클레아제가 투여된다. AAV 패키징된 공여자 주형을 먼저 전달하는 이점은 전달된 공여자 주형이 형질도입된 간세포의 핵에서 안정적으로 유지될 것인 점이며, 이는 서열 특이적 뉴클레아제의 이후의 투여를 가능하게 한다. 이는 게놈 내에 이중-가닥 파단을 생성하며, HDR 또는 NHEJ에 의한 공여자 주형의 이후의 통합을 갖는다. 일부 실시형태에서, 서열 특이적 뉴클레아제가 표적 세포에서 트랜스유전자의 표적화된 통합을 촉진시키는 데 필요한 시간 동안만 요망되는 치료적 효과에 충분한 수준으로 활성으로 남아 있는 것이 바람직하다. 서열 특이적 뉴클레아제가 연장된 기간 동안 세포에서 활성으로 남아 있다면, 이는 오프-표적 부위에서 증가된 빈도의 이중 가닥 파단을 초래할 것이다. 구체적으로, 오프-표적 절단의 빈도는 오프-표적 절단 효율을 뉴클레아제가 활성인 시간과 곱한 함수이다. mRNA의 형태의 서열 특이적 뉴클레아제의 전달은 수시간 내지 수일 범위의 짧은 뉴클레아제 활성 기간을 초래하는데, 그 이유는 mRNA 및 번역된 단백질이 세포에서 수명이 짧기 때문이다. 따라서, 공여자 주형을 이미 함유하는 세포 내로의 서열 특이적 뉴클레아제의 전달은 오프-표적 통합에 비하여 더 나은 비의 표적화된 통합을 초래할 것으로 예상된다. 또한, 말초 정맥내 주사 후에 간세포의 핵으로의 공여자 주형의 AAV 매개된 전달은, 바이러스가 세포를 감염시키고 엔도솜을 회피하고, 핵으로 수송되는 데 필요한 시간, 및 숙주 성분에 의한 단일 가닥 AAV 게놈에서 이중 가닥 DNA 분자로의 전환으로 인하여, 일반적으로 대략 1 내지 14일의 시간이 걸린다. 따라서, 일부 실시형태에서, 핵으로의 공여자 주형의 전달은 CRISPR/Cas9 성분을 공급하기 전에 완료되는데, 그 이유는 이들 뉴클레아제 성분이 약 1 내지 3일 동안 활성이기 때문이다.In some embodiments relating to delivery of a genome-editing component for a therapeutic treatment, at least two components: a sequence specific nuclease and a DNA donor template are delivered into the nucleus of the cell to be transformed, e.g., a hepatocyte . In some embodiments, the donor template is packaged into an AAV having tropism for the liver. In some embodiments, the AAV is selected from serotypes AAV8, AAV9, AAVrh10, AAV5, AAV6 or AAV-DJ. In some embodiments, the AAV packaged DNA donor template is administered to the subject, eg, first by peripheral intravenous injection, followed by the sequence specific nuclease. An advantage of first delivering the AAV packaged donor template is that the delivered donor template will remain stable in the nucleus of the transduced hepatocytes, allowing for subsequent administration of sequence-specific nucleases. This creates a double-stranded break in the genome, with subsequent integration of the donor template by HDR or NHEJ. In some embodiments, it is preferred that the sequence specific nuclease remain active at a level sufficient for the desired therapeutic effect only for a period of time necessary to promote targeted integration of the transgene in the target cell. If the sequence-specific nuclease remains active in the cell for an extended period of time, it will result in an increased frequency of double-strand breaks at the off-target site. Specifically, the frequency of off-target cleavage is a function of the off-target cleavage efficiency multiplied by the time the nuclease is active. Delivery of sequence-specific nucleases in the form of mRNAs results in short durations of nuclease activity ranging from hours to days, because mRNAs and translated proteins are short-lived in cells. Thus, delivery of sequence specific nucleases into cells already containing the donor template is expected to result in a better ratio of targeted integration compared to off-target integration. In addition, AAV-mediated delivery of the donor template to the nucleus of hepatocytes following peripheral intravenous injection, the time required for the virus to infect the cells, evade endosomes, and transport to the nucleus, and the single-stranded AAV genome by host components Due to the conversion of α to double-stranded DNA molecules, it generally takes about 1 to 14 days. Thus, in some embodiments, delivery of the donor template to the nucleus is complete prior to supplying the CRISPR/Cas9 components, since these nuclease components are active for about 1-3 days.

일부 실시형태에서, DNA 엔도뉴클레아제는 CRISPR/Cas9이며, 이는 Cas9 뉴클레아제와 함께 알부민 유전자의 인트론 1 내의 DNA 서열에 대하여 유도된 sgRNA로 구성된다. 일부 실시형태에서, Cas9 엔도뉴클레아제는 하나 이상의 핵 국소화 신호(NLS)에 작동 가능하게 융합된 Cas9 단백질을 인코딩하는 mRNA로서 전달된다. 일부 실시형태에서, sgRNA 및 Cas9 mRNA는 지질 나노입자에 패키징되어 간세포로 전달된다. 일부 실시형태에서, 지질 나노입자는 지질 C12-200(문헌[K.T. Love et al., Proc Natl Acad Sci USA (2010) 107:1864-69])을 함유한다. 일부 실시형태에서, LNP에 패키징되는 sgRNA 대 Cas9 mRNA의 비는 1:1(질량비)이며, 이는 마우스 생체내에서 최대 DNA 절단을 초래한다. 대안적인 실시형태에서, LNP에 패키징되는 상이한 질량비, 예를 들어, 10:1, 9:1, 8:1, 7:1, 6:1, 5:1, 4:1, 3:1 또는 2:1 또는 그의 역의 비의 sgRNA 대 Cas9 mRNA가 사용될 수 있다. 일부 실시형태에서, Cas9 mRNA 및 sgRNA는 개별 LNP 제형 내로 패키징되며, Cas9 mRNA 함유 LNP는 sgRNA를 함유하는 LNP 이전 약 1 내지 약 8시간에 대상체에 전달되어, sgRNA의 전달 이전에 Cas9 mRNA가 번역되기 위한 최적의 시간을 가능하게 한다.In some embodiments, the DNA endonuclease is CRISPR/Cas9, which together with a Cas9 nuclease consists of a sgRNA directed against a DNA sequence in intron 1 of the albumin gene. In some embodiments, the Cas9 endonuclease is delivered as an mRNA encoding a Cas9 protein operably fused to one or more nuclear localization signals (NLS). In some embodiments, the sgRNA and Cas9 mRNA are packaged in lipid nanoparticles and delivered to hepatocytes. In some embodiments, the lipid nanoparticles contain lipid C12-200 (KT Love et al., Proc Natl Acad Sci USA (2010) 107: 1864-69). In some embodiments, the ratio of sgRNA to Cas9 mRNA packaged in the LNP is 1:1 (mass ratio), which results in maximal DNA cleavage in mice in vivo. In alternative embodiments, different mass ratios packaged in LNPs, for example 10:1, 9:1, 8:1, 7:1, 6:1, 5:1, 4:1, 3:1 or 2 A ratio of sgRNA to Cas9 mRNA of :1 or inverse can be used. In some embodiments, the Cas9 mRNA and sgRNA are packaged into separate LNP formulations, wherein the LNP containing Cas9 mRNA is delivered to the subject about 1 to about 8 hours prior to the LNP containing the sgRNA so that the Cas9 mRNA is translated prior to delivery of the sgRNA. Optimal time for

일부 실시형태에서, gRNA 및 Cas9 mRNA를 캡슐화하는 LNP 제형("LNP-뉴클레아제 제형")은 대상체, 예를 들어, AAV 내로 패키징된 DNA 공여자 주형을 이전에 투여하였던 대상체에게 투여된다. 일부 실시형태에서, LNP-뉴클레아제 제형은 AAV 공여자 주형의 투여 후 1일 내지 28일 이내 또는 7일 내지 28일 이내 또는 7일 내지 14일 이내에 대상체에게 투여된다. AAV-공여자 주형에 비한 LNP-뉴클레아제 제형의 최적의 전달 시기는 당업계에 알려져 있는 기법, 예를 들어, 마우스 및 원숭이를 포함하는 동물 모델에서 행해지는 연구를 사용하여 결정될 수 있다.In some embodiments, an LNP formulation that encapsulates gRNA and Cas9 mRNA (“LNP-nuclease formulation”) is administered to a subject, eg, to a subject who has previously administered a DNA donor template packaged into an AAV. In some embodiments, the LNP-nuclease formulation is administered to the subject within 1 to 28 days or within 7 to 28 days or within 7 to 14 days after administration of the AAV donor template. The optimal timing of delivery of the LNP-nuclease formulation relative to the AAV-donor template can be determined using techniques known in the art, for example, studies conducted in animal models including mice and monkeys.

일부 실시형태에서, DNA-공여자 주형은 비-바이러스 전달 방법을 사용하여 대상체의 간세포, 예를 들어, 대상체에 전달된다. 일부 대상체(일반적으로 30%)가 AAV에 의한 효율적인 유전자 전달을 방지하는, 가장 흔히 사용되는 AAV 혈청형에 대해 유도된 선재성 중화 항체를 갖지만, 모든 대상체는 비-바이러스 전달 방법으로 치료 가능하다. 몇몇의 비-바이러스 전달 방법은 당업계에 알려져 있다. 특히, LNP는 동물 및 인간에서 정맥내 주사 후에 그들의 캡슐화된 카고(cargo)를 간세포의 세포질로 효율적으로 전달하는 것으로 알려져 있다. 이들 LNP는 수용체 매개된 내포작용의 과정을 통해 간에 의해 능동적으로 흡수되어, 간 내로의 우선적인 흡수를 초래한다.In some embodiments, the DNA-donor template is delivered to hepatocytes of a subject, eg, to a subject using a non-viral delivery method. Although some subjects (typically 30%) have pre-existing neutralizing antibodies directed against the most commonly used AAV serotypes that prevent efficient gene transfer by AAV, all subjects are treatable with non-viral delivery methods. Several methods of non-viral delivery are known in the art. In particular, LNPs are known to efficiently deliver their encapsulated cargo into the cytoplasm of hepatocytes after intravenous injection in animals and humans. These LNPs are actively taken up by the liver through the process of receptor mediated endocytosis, resulting in preferential uptake into the liver.

일부 실시형태에서, 공여자 주형의 핵 국소화를 촉진시키기 위하여, 플라스미드의 핵 국소화를 촉진시킬 수 있는 DNA 서열, 예를 들어, 유인원 바이러스 40(SV40) 복제 원점 및 조기 프로모터의 366 bp 영역을 공여자 주형에 부가할 수 있다. 세포 단백질에 결합하는 다른 DNA 서열도 또한 사용하여, DNA의 핵 유입을 개선시킬 수 있다.In some embodiments, to promote nuclear localization of the donor template, DNA sequences capable of promoting nuclear localization of the plasmid, e.g., the simian virus 40 (SV40) origin of replication and the 366 bp region of the early promoter, are transferred to the donor template. can be added Other DNA sequences that bind cellular proteins can also be used to improve nuclear import of DNA.

일부 실시형태에서, 도입된 FVIII의 발현 또는 활성의 수준은 예를 들어, AAV 공여자 주형 이후에, gRNA 및 Cas9 뉴클레아제 또는 Cas9 뉴클레아제를 인코딩하는 mRNA를 함유하는 LNP-뉴클레아제 제형의 처음의 투여 후에, 대상체, 예를 들어, 대상체의 혈중에서 측정된다. FVIII 수준이 질병을 치료하기에 충분하지 않으면, 예를 들어, 정상 수준의 5%의 수준이면, 제2 또는 제3의 LNP-뉴클레아제 제형의 투여를 제공하여 게놈 세이프 하버 유전자좌 내로의 추가의 표적화된 통합을 촉진시킬 수 있다. 원하는 FVIII의 치료적 수준을 수득하기 위하여 다중의 용량의 LNP-뉴클레아제 제형을 사용하는 것의 실행 가능성은 당업계에 알려져 있는 기법, 예를 들어, 마우스 및 원숭이를 포함하는 동물 모델을 사용하는 검사를 사용하여 시험되고 최적화될 수 있다.In some embodiments, the level of expression or activity of the introduced FVIII is, for example, after an AAV donor template, of a LNP-nuclease formulation containing gRNA and a Cas9 nuclease or mRNA encoding a Cas9 nuclease. After the first administration, it is measured in a subject, eg, the subject's blood. If the FVIII level is not sufficient to treat the disease, e.g., at a level of 5% of the normal level, administration of a second or third LNP-nuclease formulation may be provided for further treatment into the genome safe harbor locus. It can promote targeted integration. The feasibility of using multiple doses of LNP-nuclease formulations to obtain the desired therapeutic level of FVIII has been tested using techniques known in the art, for example, animal models including mice and monkeys. can be tested and optimized using

일부 실시형태에서, 대상체로의 i) 공여자 카세트를 포함하는 AAV 공여자 주형 및 ii) LNP-뉴클레아제 제형의 투여를 포함하는 본원에 기술된 방법 중 어느 하나에 따라, 초기 용량의 LNP-뉴클레아제 제형은 대상체로의 AAV 공여자 주형의 투여 후 약 1일 내지 약 28일 이내에 대상체에게 투여된다. 일부 실시형태에서, 초기 용량의 LNP-뉴클레아제 제형은 표적 세포의 핵으로의 공여자 주형의 전달을 가능하게 하기에 충분한 시간 후에 대상체에게 투여된다. 일부 실시형태에서, 초기 용량의 LNP-뉴클레아제 제형은 표적 세포의 핵에서 이중 가닥 DNA 분자로의 단일 가닥 AAV 게놈의 전환을 가능하게 하기에 충분한 시간 후에 대상체에게 투여된다. 일부 실시형태에서, 초기 용량의 투여 후에 1회 이상(예컨대 2, 3, 4, 5회 이상)의 추가의 용량의 LNP-뉴클레아제 제형이 대상체에게 투여된다. 일부 실시형태에서, 1회 이상의 용량의 LNP-뉴클레아제 제형은 표적 수준의 공여자 카세트의 표적화된 통합 및/또는 표적 수준의 공여자 카세트의 발현이 달성될 때까지 대상체에게 투여된다. 일부 실시형태에서, 당해 방법은 LNP-뉴클레아제 제형의 각각의 투여 후에 공여자 카세트의 표적화된 통합의 수준 및/또는 공여자 카세트의 발현의 수준을 측정하는 단계 및 표적 수준의 공여자 카세트의 표적화된 통합 및/또는 표적 수준의 공여자 카세트의 발현이 달성되지 않는다면 추가의 용량의 LNP-뉴클레아제 제형을 투여하는 단계를 추가로 포함한다. 일부 실시형태에서, 추가의 용량의 LNP-뉴클레아제 제형 중 적어도 하나의 양은 초기 용량과 동일하다. 일부 실시형태에서, 추가의 용량의 LNP-뉴클레아제 제형 중 적어도 하나의 양은 초기 용량보다 더 적다. 일부 실시형태에서, 추가의 용량의 LNP-뉴클레아제 제형 중 적어도 하나의 양은 초기 용량보다 더 크다.In some embodiments, an initial dose of LNP-nuclease according to any one of the methods described herein comprising administration to the subject i) an AAV donor template comprising a donor cassette and ii) a LNP-nuclease formulation The formulation is administered to the subject within about 1 to about 28 days after administration of the AAV donor template to the subject. In some embodiments, the initial dose of the LNP-nuclease formulation is administered to the subject after a time sufficient to permit delivery of the donor template to the nucleus of the target cell. In some embodiments, the initial dose of the LNP-nuclease formulation is administered to the subject after a time sufficient to permit conversion of the single-stranded AAV genome into a double-stranded DNA molecule in the nucleus of the target cell. In some embodiments, one or more (eg, 2, 3, 4, 5 or more) additional doses of the LNP-nuclease formulation are administered to the subject after administration of the initial dose. In some embodiments, one or more doses of the LNP-nuclease formulation are administered to the subject until targeted integration of the target level of donor cassette and/or expression of the target level of the donor cassette is achieved. In some embodiments, the method comprises determining the level of targeted integration of the donor cassette and/or the level of expression of the donor cassette after each administration of the LNP-nuclease formulation and targeted integration of the target level of the donor cassette and/or administering an additional dose of the LNP-nuclease formulation if the target level of expression of the donor cassette is not achieved. In some embodiments, the amount of at least one of the additional doses of the LNP-nuclease formulation is the same as the initial dose. In some embodiments, the amount of at least one of the additional doses of the LNP-nuclease formulation is less than the initial dose. In some embodiments, the amount of at least one of the additional doses of the LNP-nuclease formulation is greater than the initial dose.

유전자 변형 세포 및 세포 집단Genetically Modified Cells and Cell Populations

일 양태에서, 본 개시내용은 세포 내의 게놈을 편집함으로써, 유전학적으로 변형된 세포를 생성하는 방법을 제공한다. 일부 양태에서, 유전학적으로 변형된 세포의 집단이 제공된다. "유전자 변형 세포"는 따라서 게놈 편집에 의해(예를 들어, CRISPR/Cas9/Cpf1 시스템을 사용하여) 도입된 적어도 하나의 유전자 변형을 가지는 세포를 지칭한다. 일부 실시형태에서, 유전학적으로 변형된 세포는 유전학적으로 변형된 간세포이다. 외인성 게놈-표적화 핵산 및/또는 게놈-표적화 핵산을 인코딩하는 외인성 핵산을 가지는 유전자 변형 세포가 본원에 고려된다.In one aspect, the present disclosure provides a method of generating a genetically modified cell by editing the genome within the cell. In some aspects, a population of genetically modified cells is provided. A “genetically modified cell” thus refers to a cell having at least one genetic modification introduced by genome editing (eg, using the CRISPR/Cas9/Cpf1 system). In some embodiments, the genetically modified cell is a genetically modified hepatocyte. Genetically modified cells having an exogenous genome-targeting nucleic acid and/or an exogenous nucleic acid encoding the genome-targeting nucleic acid are contemplated herein.

일부 실시형태에서, 합성 FVIII 코딩 서열의 핵산 서열을 세포의 게놈 서열 내로 삽입함으로써 세포의 게놈은 편집될 수 있다. 일부 실시형태에서, 게놈-편집을 겪는 세포는 게놈 내에 하나 이상의 돌연변이(들)를 가지며, 이는 이러한 돌연변이(들)를 갖지 않는 정상에서의 발현에 비하여, 내인성 FVIII 유전자의 발현의 감소를 초래한다. 정상 세포는 FVIII 유전자 결함을 갖지 않는 상이한 대상체로부터 기원한(또는 단리된) 건강한 또는 대조군 세포일 수 있다. 일부 실시형태에서, 게놈-편집을 겪는 세포는 FVIII 유전자-관련 질환 또는 장애의 치료를 필요로 하는 대상체로부터 기원할(또는 단리될) 수 있다. 그러므로, 일부 실시형태에서, 그러한 세포 내의 내인성 FVIII 유전자의 발현은 일반 세포 내의 내인성 FVIII 유전자 발현의 발현과 비교하여 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 또는 약 100%만큼 감소된다.In some embodiments, the genome of a cell can be edited by inserting the nucleic acid sequence of the synthetic FVIII coding sequence into the genomic sequence of the cell. In some embodiments, the cell undergoing genome-editing has one or more mutation(s) in its genome, which results in a decrease in expression of the endogenous FVIII gene as compared to expression in a normal that does not have such mutation(s). Normal cells may be healthy or control cells originating (or isolated) from different subjects that do not have the FVIII gene defect. In some embodiments, cells undergoing genome-editing may originate (or be isolated) from a subject in need of treatment for a FVIII gene-related disease or disorder. Thus, in some embodiments, the expression of the endogenous FVIII gene in such cells is about 10%, about 20%, about 30%, about 40%, about 50%, about 60% compared to the expression of endogenous FVIII gene expression in normal cells. %, about 70%, about 80%, about 90% or about 100%.

전이유전자, 예를 들어, 합성 FVIII 코딩 서열을 인코딩하는 핵산을 성공적으로 삽입한 이후, 세포 내에 도입된 합성 FVIII 코딩 서열의 발현은, 세포의 내인성 FVIII 유전자의 발현과 비교하여 적어도 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 100%, 약 200%, 약 300%, 약 400%, 약 500%, 약 600%, 약 700%, 약 800%, 약 900%, 약 1,000%, 약 2,000%, 약 3,000%, 약 5,000%, 약 10,000%, 또는 그 이상일 수 있다. 일부 실시형태에서, 게놈-편집 세포 내의 합성 FVIII 코딩 서열을 포함하는, 도입된 FVIII 코딩 서열 생성물의 활성은, 세포의 내인성 FVIII 유전자의 발현과 비교하여 적어도 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90%, 약 100%, 약 200%, 약 300%, 약 400%, 약 500%, 약 600%, 약 700%, 약 800%, 약 900%, 약 1,000%, 약 2,000%, 약 3,000%, 약 5,000%, 약 10,000%, 또는 그 이상일 수 있다. 일부 실시형태에서, 세포 내에 도입된 FVIII 코딩 서열의 발현은, 세포의 내인성 FVIII 유전자의 발현과 비교하여 적어도 약 2배, 약 3배, 약 4배, 약 5배, 약 6배, 약 7배, 약 8배, 약 9배, 약 10배, 약 15배, 약 20배, 약 30배, 약 50배, 약 100배, 약 1000배, 또는 그 이상일 수 있다. 또한, 일부 실시형태에서, 게놈-편집된 세포에서의 도입된 합성 FVIII 코딩 서열의 활성은 정상의 건강한 세포에서의 FVIII 유전자 생성물의 활성과 유사하거나 그보다 더 클 수 있다.After successful insertion of a nucleic acid encoding a transgene, e.g., a synthetic FVIII coding sequence, the expression of the synthetic FVIII coding sequence introduced into the cell is at least about 10%, about 20%, about 30%, about 40%, about 50%, about 60%, about 70%, about 80%, about 90%, about 100%, about 200%, about 300%, about 400%, about 500% , about 600%, about 700%, about 800%, about 900%, about 1,000%, about 2,000%, about 3,000%, about 5,000%, about 10,000%, or more. In some embodiments, the activity of the introduced FVIII coding sequence product, comprising the synthetic FVIII coding sequence in the genome-edited cell, is at least about 10%, about 20%, about 30% compared to the expression of an endogenous FVIII gene in the cell. , about 40%, about 50%, about 60%, about 70%, about 80%, about 90%, about 100%, about 200%, about 300%, about 400%, about 500%, about 600%, about 700%, about 800%, about 900%, about 1,000%, about 2,000%, about 3,000%, about 5,000%, about 10,000%, or more. In some embodiments, the expression of the FVIII coding sequence introduced into the cell is at least about 2-fold, about 3-fold, about 4-fold, about 5-fold, about 6-fold, about 7-fold compared to the expression of an endogenous FVIII gene in the cell. , about 8 times, about 9 times, about 10 times, about 15 times, about 20 times, about 30 times, about 50 times, about 100 times, about 1000 times, or more. Further, in some embodiments, the activity of the introduced synthetic FVIII coding sequence in genome-edited cells may be similar to or greater than the activity of the FVIII gene product in normal healthy cells.

A형 혈우병의 치료 또는 개선을 위한 실시형태들에서, 유전자 편집을 위한 주요 표적은 인간 세포이다. 일부 실시형태에서, 생체외 방법 및 생체내 방법에서, 인간 세포는 간세포이다. 일부 실시형태에서, 그를 필요로 하는 대상체로부터 유래되며, 이에 따라 상기 환자와 이미 완전하게 면역학적으로 일치되는 자가 세포에서 유전자 편집을 수행함으로써, 환자 내로 안전하게 재도입될 수 있으며, 환자의 질환과 연관된 하나 이상의 임상적 병증의 개선에 효율적인 세포의 집단을 효율적으로 야기하는 세포를 생성할 수 있다. 이러한 치료를 위한 일부 실시형태에서, 간세포는 당업계에 알려져 있는 임의의 방법에 따라 단리되고, 유전학적으로 변형된, 치료적으로 유효한 세포를 생성하기 위하여 사용될 수 있다. 일 실시형태에서, 간 줄기 세포는 생체 외에서 유전학적으로 변형된 다음, 대상체 내로 재도입되며, 여기서, 그들은 삽입된 FVIII 코딩 서열을 발현하는 유전학적으로 변형된 간세포 또는 동모양혈관 내피 세포를 야기한다.In embodiments for the treatment or amelioration of hemophilia A, the primary target for gene editing is a human cell. In some embodiments, in the ex vivo method and in the in vivo method, the human cell is a hepatocyte. In some embodiments, by performing gene editing in autologous cells derived from a subject in need thereof and thus already fully immunologically consistent with the patient, they can be safely reintroduced into the patient and associated with the patient's disease. Cells can be generated that efficiently result in a population of cells that are effective for amelioration of one or more clinical conditions. In some embodiments for such treatment, hepatocytes can be isolated, genetically modified, and used to generate therapeutically effective cells according to any method known in the art. In one embodiment, the liver stem cells are genetically modified ex vivo and then reintroduced into a subject, wherein they give rise to genetically modified hepatocytes or allogeneic endothelial cells expressing the inserted FVIII coding sequence. .

치료적 접근법therapeutic approach

혈우병은 “경증”(0.40 내지 0.05 IU/mL의 FVIII 단백질 혈청 농도), “중등”(0.05 내지 0.01 IU/mL) 또는 “중증”(< 0.01 IU/mL, 정상의 1% 미만)으로 분류된다(문헌[G.C. White et al., Thromb Haemost (2001) 85(3):560-75]). FVIII 대체 단백질 요법을 받는 A형 혈우병 환자의 분석에 의해, 정상의 3%, 5%, 10%, 15% 및 20%의 예측된 FVIII 저점 수준에서, 출혈이 발생하지 않는 빈도가 각각 71%, 79%, 91%, 97% 및 100%인 것이 보고되었다(문헌[G. Spotts et al., Blood (2014) 124:689]). 이는 FVIII 수준이 15 내지 20%의 최소 수준을 초과하여 유지되는 경우, 출혈 사건의 비가 0에 근접하게 감소되는 것을 시사한다. A형 혈우병을 치유하는 데 필요한 정밀한 FVIII 수준이 정의된 바 없고, 대상체들 간에 달라질 것 같지만, 약 5% 내지 약 30%의 수준이 출혈 사건의 유의미한 감소를 제공하는 것으로 예상된다.Hemophilia is classified as “mild” (FVIII protein serum concentration of 0.40 to 0.05 IU/mL), “moderate” (0.05 to 0.01 IU/mL), or “severe” (< 0.01 IU/mL, less than 1% of normal). (GC White et al., Thromb Haemost (2001) 85 (3):560-75). By analysis of patients with hemophilia A receiving FVIII replacement protein therapy, at the predicted FVIII trough levels of 3%, 5%, 10%, 15% and 20% of normal, the frequency of no bleeding was 71%, respectively; 79%, 91%, 97% and 100% have been reported (G. Spotts et al., Blood (2014) 124 :689). This suggests that when the FVIII level is maintained above the minimum level of 15-20%, the ratio of bleeding events is reduced close to zero. Although the precise FVIII level required to cure hemophilia A has not been defined and is likely to vary between subjects, levels of about 5% to about 30% are expected to provide a significant reduction in bleeding events.

일 양태에서, 대상체의 게놈을 편집함으로써 대상체에서 A형 혈우병을 치료하기 위한 유전자 요법 접근법이 본원에 제공된다. 일부 실시형태에서, 유전자 요법 치료법은 대상체에서 관련 세포 유형의 게놈 내로 기능적 합성 FVIII 코딩 서열을 통합시키며, 이는 A형 혈우병에 대한 영구적인 치유를 제공한다. 일부 실시형태에서, 합성 FVIII 코딩 서열은 간세포 내로 통합되는데, 그 이유는 이들 세포가 많은 단백질을 효율적으로 발현하고 혈중에 분비하기 때문이다. 또한, 간세포를 사용한 이 통합 접근법은 간이 완전히 성장하지 않은 소아 대상체를 위하여 고려될 수 있는데, 그 이유는 간세포가 분열하는 경우 통합된 코딩 서열이 딸 세포로 전달되기 때문이다.In one aspect, provided herein is a gene therapy approach for treating hemophilia A in a subject by editing the subject's genome. In some embodiments, the gene therapy therapy incorporates a functional synthetic FVIII coding sequence into the genome of the relevant cell type in the subject, which provides a permanent cure for hemophilia A. In some embodiments, the synthetic FVIII coding sequence is integrated into hepatocytes because these cells efficiently express and secrete many proteins into the blood. In addition, this integration approach using hepatocytes can be considered for pediatric subjects whose livers have not fully grown, because when the hepatocytes divide, the integrated coding sequences are passed on to daughter cells.

또 다른 양태에서, 합성 FVIII 코딩 서열을 유전자 좌 내로 낙-인시키고, FVIII 단백질 활성을 복구함으로써 게놈에 영구적인 변화를 생성하기 위하여 게놈 엔지니어링 툴을 사용하기 위한 세포적 생체외 및 생체내 방법이 본원에 제공된다. 이러한 방법은 엔도뉴클레아제, 예컨대 CRISPR-연관(CRISPR/Cas9, Cpf1 등) 뉴클레아제를 사용하여 게놈으로부터 임의의 서열을 영구적으로 결실시키거나, 삽입하건거나, 편집하거나, 교정하거나, 대체하거나, 외인성 서열, 예를 들어, 합성 FVIII 코딩 서열을 게놈 유전자좌 내에 삽입한다. 이러한 방식으로, 본 개시내용에 기술된 예는 (대상체의 수명을 위하여 잠재적인 치료법을 전달하기 보다는) 단일의 처리를 사용하여 FVIII 유전자의 활성을 복구한다.In another aspect, provided herein are cellular ex vivo and in vivo methods for using genome engineering tools to create permanent changes in the genome by branding a synthetic FVIII coding sequence into a locus and restoring FVIII protein activity. is provided on Such methods use an endonuclease, such as a CRISPR-associated (CRISPR/Cas9, Cpf1, etc.) nuclease, to permanently delete, insert, edit, correct, replace, or replace any sequence from the genome. , inserts an exogenous sequence, eg, a synthetic FVIII coding sequence, into the genomic locus. In this way, the examples described in this disclosure restore the activity of the FVIII gene using a single treatment (rather than delivering a potential therapy for the life of the subject).

일부 실시형태에서, 생체외 세포-기반의 치료법은 대상체로부터 단리된 간세포를 사용한다. 이들 세포의 염색체 DNA를 본원에 기술된 물질 및 방법을 사용하여 편집한다. 마지막으로, 편집된 세포 및/또는 그들의 자손을 대상체 내에 투여하거나 이식한다.In some embodiments, ex vivo cell-based therapy uses hepatocytes isolated from a subject. The chromosomal DNA of these cells is edited using the materials and methods described herein. Finally, the edited cells and/or their progeny are administered or transplanted into the subject.

생체 외 세포 치료 접근법의 하나의 이점은 투여 이전에 치료제의 종합적인 분석을 행하는 능력이다. 뉴클레아제-기반의 치료제는 일정 수준의 오프-표적 효과를 갖는다. 생체 외에서 유전자 교정을 수행하는 것은 투여 이전에 교정된 세포 집단을 특성화하게 한다. 본 개시내용의 양태는 교정된 세포의 게놈을 시퀀싱하여, 대상체에 대한 최소의 위험과 연관된 게놈 위치에 임의의 오프-표적 절단이 있는 것을 보장한다. 또한, 클론 집단을 포함하는 특정 세포의 집단을 투여 또는 이식 이전에 스크리닝 또는 단리할 수 있다.One advantage of the ex vivo cell therapy approach is the ability to perform a comprehensive analysis of the therapeutic agent prior to administration. Nuclease-based therapeutics have some level of off-target effect. Performing gene editing in vitro allows characterization of the corrected cell population prior to administration. Aspects of the present disclosure sequence the genome of the corrected cell to ensure that there are any off-target cleavages at genomic locations associated with minimal risk to the subject. In addition, specific populations of cells, including clonal populations, may be screened or isolated prior to administration or transplantation.

또 다른 실시형태는 생체내 기반의 치료법이다. 이러한 방법에서, 대상체 내의 세포의 염색체 DNA는 본원에 기술된 물질 및 방법을 사용하여 교정된다. 일부 실시형태에서, 세포는 간세포이다.Another embodiment is an in vivo based therapy. In such methods, the chromosomal DNA of cells in the subject is corrected using the materials and methods described herein. In some embodiments, the cell is a hepatocyte.

생체내 유전자 요법의 이점은 치료적 생성 및 투여의 용이성에 있다. 동일한 치료적 접근법 및 치료법을 사용하여 1명 초과의 대상체, 예를 들어, 동일한 또는 유사한 유전형 또는 대립형질을 공유하는 다수의 대상체를 치료할 수 있다. 대조적으로, 생체외 세포 요법은 일반적으로 대상체 자신의 세포를 사용하는데, 이는 단리되고, 조작되고, 동일한 대상체로 복귀된다.The advantage of in vivo gene therapy lies in the ease of therapeutic production and administration. The same therapeutic approaches and therapies can be used to treat more than one subject, eg, multiple subjects sharing the same or similar genotypes or alleles. In contrast, ex vivo cell therapy generally uses the subject's own cells, which are isolated, engineered, and returned to the same subject.

일부 실시형태에서, 대상체는 A형 혈우병의 증상을 갖는다. 일부 실시형태에서, 대상체는 A형 혈우병을 갖는 것으로 의심되는 인간이다. 대안적으로, 대상체는 A형 혈우병의 위험이 있는 것으로 진단받은 인간이다. 일부 실시형태에서, 치료를 필요로 하는 대상체는 내인성 FVIII 유전자 또는 그의 조절 서열 내에 하나 이상의 유전 결함(예를 들어, 결실, 삽입 및/또는 돌연변이)을 가져, FVIII 단백질의 활성(발현 수준 또는 기능 포함)이 건강한 정상의 대상체에 비하여 실질적으로 감소되게 한다.In some embodiments, the subject has symptoms of hemophilia A. In some embodiments, the subject is a human suspected of having hemophilia A. Alternatively, the subject is a human diagnosed as at risk for hemophilia A. In some embodiments, the subject in need of treatment has one or more genetic defects (eg, deletions, insertions, and/or mutations) in an endogenous FVIII gene or regulatory sequence thereof, such that the activity (including expression level or function) of the FVIII protein ) is substantially reduced compared to a healthy normal subject.

일부 실시형태에서, 대상체에서의 A형 혈우병의 치료 방법이 본원에 제공되며, 상기 방법은 하기를 대상체 내의 세포에 제공하는 단계를 포함한다: (a) 세포 게놈 내의 알부민 유전자좌를 표적화하는 gRNA; (b) DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형. 일부 실시형태에서, gRNA는 알부민 유전자의 인트론 1을 표적화한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 271 내지 298 중 어느 하나의 스페이서 서열을 포함한다.In some embodiments, provided herein is a method of treating hemophilia A in a subject, the method comprising providing to a cell in the subject: (a) a gRNA that targets an albumin locus in the genome of the cell; (b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and (c) a donor template comprising a nucleic acid sequence encoding a synthetic FVIII protein. In some embodiments, the gRNA targets intron 1 of the albumin gene. In some embodiments, the gRNA comprises a spacer sequence of any one of SEQ ID NOs: 271-298.

일부 실시형태에서, 대상체에서의 A형 혈우병의 치료 방법이 본원에 제공되며, 상기 방법은 하기를 대상체 내의 세포에 제공하는 단계를 포함한다: (a) SEQ ID NO: 271 내지 298 중 어느 하나로부터의 스페이서 서열을 포함하는 gRNA; (b) DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형. 일부 실시형태에서, gRNA는 SEQ ID NO: 274, 275, 281, 및 283중 어느 하나의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 274의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 275 의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 281 의 스페이서 서열을 포함한다. 일부 실시형태에서, gRNA는 SEQ ID NO: 283 의 스페이서 서열을 포함한다. 일부 실시형태에서, 세포는 인간 세포(예를 들어, 인간 간세포)이다. 일부 실시형태에서, 대상체는 A형 혈우병을 갖거나, 이를 갖는 것으로 의심되는 대상체이다. 일부 실시형태에서, 대상체는 A형 혈우병의 위험이 있는 것으로 진단받는다.In some embodiments, provided herein is a method of treating hemophilia A in a subject, the method comprising providing a cell in the subject: (a) from any one of SEQ ID NOs: 271-298 gRNA comprising a spacer sequence of; (b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and (c) a donor template comprising a nucleic acid sequence encoding a synthetic FVIII protein. In some embodiments, the gRNA comprises a spacer sequence of any one of SEQ ID NOs: 274, 275, 281, and 283. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 274. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 275. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 281. In some embodiments, the gRNA comprises the spacer sequence of SEQ ID NO: 283. In some embodiments, the cell is a human cell (eg, a human hepatocyte). In some embodiments, the subject has or is suspected of having hemophilia A. In some embodiments, the subject is diagnosed as at risk for hemophilia A.

일부 실시형태에서, 본원에 기재된 A형 혈우병 치료 방법중 임의의 것에 따르면, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12로도 알려짐), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 및 Cpf1 엔도뉴클레아제, 및 그의 기능성 등가물로 이루어진 군으로부터 선택된다. 일부 실시형태에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 구현예에서, Cas9는 spCas9이다. 일부 구현예에서, Cas9는 SluCas9이다.In some embodiments, according to any of the methods of treating hemophilia A described herein, the DNA endonuclease is Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12). ), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb2, Cmr6, Csb2 Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, and Cpf1 endonucleases, and functional equivalents thereof. In some embodiments, the DNA endonuclease is Cas9. In some embodiments, Cas9 is spCas9. In some embodiments, Cas9 is SluCas9.

일부 실시형태에서, 본원에 기재된 A형 혈우병 치료 방법에 따르면, 합성 FVIII 코딩 서열을 인코딩하는 핵산 서열은 세포에서의 발현을 위하여 코돈-최적화된다. 일부 실시형태에서, 세포는 인간 세포이다.In some embodiments, according to a method of treating hemophilia A described herein, a nucleic acid sequence encoding a synthetic FVIII coding sequence is codon-optimized for expression in a cell. In some embodiments, the cell is a human cell.

일부 실시형태에서, 본원에 기술된 A형 혈우병의 치료 방법 중 어느 하나에 따라, 당해 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산을 사용한다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포 내의 발현을 위해 코돈-최적화된다. 일부 실시형태에서, 세포는 인간 세포(예를 들어, 인간 간세포)이다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA, 예를 들어 DNA 플라스미드이다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 RNA, 예를 들어 mRNA이다.In some embodiments, according to any one of the methods of treating hemophilia A described herein, the method uses a nucleic acid encoding a DNA endonuclease. In some embodiments, the nucleic acid encoding the DNA endonuclease is codon-optimized for expression in a cell. In some embodiments, the cell is a human cell (eg, a human hepatocyte). In some embodiments, the nucleic acid encoding the DNA endonuclease is DNA, eg, a DNA plasmid. In some embodiments, the nucleic acid encoding the DNA endonuclease is RNA, eg, mRNA.

일부 실시형태에서, 본원에 기술된 A형 혈우병의 치료 방법 중 어느 하나에 따라, 공여자 주형은 AAV 벡터에 인코딩된다. 일부 실시형태에서, 공여자 주형은 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트는 한 측 또는 양 측에서 gRNA 표적 부위에 측접한다. 일부 실시형태에서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 측접한다. 일부 실시형태에서, gRNA 표적 부위는 투여되는 gRNA에 대한 표적 부위이다. 일부 실시형태에서, 공여자 주형의 gRNA 표적 부위는 투여되는 gRNA에 대한 세포 게놈 gRNA 표적 부위의 역 상보물이다. 일부 실시형태에서, 공여자 주형을 세포에 제공하는 단계는 공여자 주형을 대상체에 투여하는 것을 포함한다. 일부 실시형태에서, 투여는 정맥내이다.In some embodiments, according to any one of the methods of treating hemophilia A described herein, the donor template is encoded in an AAV vector. In some embodiments, the donor template comprises a donor cassette comprising a nucleic acid sequence encoding a synthetic FVIII protein, the donor cassette flanked by a gRNA target site on one or both sides. In some embodiments, the donor cassette flanks the gRNA target site on both sides. In some embodiments, the gRNA target site is the target site for the administered gRNA. In some embodiments, the gRNA target site of the donor template is the reverse complement of the cellular genomic gRNA target site to the administered gRNA. In some embodiments, providing the donor template to the cell comprises administering the donor template to the subject. In some embodiments, administration is intravenous.

일부 실시형태에서, 본원에 기술된 A형 혈우병의 치료 방법 중 어느 하나에 따라, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 리포좀 또는 LNP 내에 제형화된다. 일부 실시형태에서, 리포좀 또는 LNP는 또한 gRNA를 포함한다. 일부 실시형태에서, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계는 리포좀 또는 LNP를 대상체에게 투여하는 것을 포함한다. 일부 실시형태에서, 투여는 정맥내이다. 일부 실시형태에서, 리포좀 또는 LNP는 LNP이다. 일부 실시형태에서, 당해 방법은 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 LNP를 사용한다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.In some embodiments, according to any one of the methods of treating hemophilia A described herein, a DNA endonuclease or a nucleic acid encoding a DNA endonuclease is formulated in a liposome or LNP. In some embodiments, the liposome or LNP also comprises a gRNA. In some embodiments, providing the gRNA and the DNA endonuclease or nucleic acid encoding the DNA endonuclease to the cell comprises administering the liposome or LNP to the subject. In some embodiments, administration is intravenous. In some embodiments, the liposome or LNP is LNP. In some embodiments, the method uses a LNP comprising a gRNA and a nucleic acid encoding a DNA endonuclease. In some embodiments, the nucleic acid encoding a DNA endonuclease is an mRNA encoding a DNA endonuclease.

일부 실시형태에서, 본원에 기술된 A형 혈우병의 치료 방법 중 어느 하나에 따라, DNA 엔도뉴클레아제는 gRNA와 사전-복합체화되어 RNP 복합체를 형성한다.In some embodiments, according to any one of the methods of treating hemophilia A described herein, the DNA endonuclease is pre-complexed with the gRNA to form an RNP complex.

AAV가 간의 세포를 포함한 세포를 감염시키는 과정은 엔도솜으로부터의 회피, 바이러스 탈코팅(uncoating) 및 핵으로의 AAV 게놈의 수송을 포함한다. 단일 가닥 게놈이 바이러스에 패키징되는 이들 연구에 사용되는 AAV의 경우에, 단일 가닥 게놈은 제2 가닥 DNA 합성의 과정을 겪어, 이중 가닥 DNA 게놈을 형성한다. 단일 가닥 게놈에서 이중 가닥 게놈으로의 완전한 전환에 필요한 시간은 널리 확립되지 않지만, 이것이 속도 제한 단계인 것으로 고려된다(문헌[Ferrari et al., J Virol (1996) 70:3227-34]). 그 다음, 이중 가닥 선형 게놈은 헤드 투 테일(head to tail)로, 그리고 테일 투 헤드(tail to head)로 연결되는 단량체로 구성된 다량체 원형 형태로 연쇄체화된다(문헌[Sun et al., Human Gene Ther. (2010) 21:750-62]).The process by which AAV infects cells, including liver cells, involves evasion from endosomes, viral uncoating and transport of the AAV genome to the nucleus. In the case of AAV used in these studies where the single-stranded genome is packaged into a virus, the single-stranded genome undergoes the process of second-stranded DNA synthesis, forming a double-stranded DNA genome. The time required for complete conversion from single-stranded to double-stranded genomes is not widely established, but is considered to be a rate limiting step (Ferrari et al., J Virol (1996) 70 :3227-34). The double-stranded linear genome is then concatenated into a multimeric prototype composed of monomers linked head-to-tail and tail-to-head (Sun et al., Human Gene Ther. (2010) 21 :750-62]).

일부 실시형태에서, 본원에 기술된 A형 혈우병의 치료 방법 중 어느 하나에 따라, 투여되는 gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 공여자 주형을 세포에 제공한 후에 세포에 제공된다. 일부 실시형태에서, 투여되는 gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 공여자 주형을 세포에 제공한 지 4일보다 긴 시간 후에 세포에 제공된다. 일부 실시형태에서, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 공여자 주형을 세포에 제공한 지 적어도 14일 후에 세포에 제공된다. 일부 실시형태에서, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 공여자 주형을 세포에 제공한 지 적어도 17일 후에 세포에 제공된다. 일부 실시형태에서, gRNA 및 DNA 엔도뉴클레아제를 세포에 제공하는 단계는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 LNP를 (예컨대 정맥내 경로에 의해) 대상체에 투여하는 것을 포함한다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다. 일부 실시형태에서, 공여자 주형을 세포에 제공하는 단계는 AAV 벡터에 인코딩된 공여자 주형을 (예컨대 정맥내 경로에 의해) 대상체에 투여하는 것을 포함한다.In some embodiments, according to any one of the methods of treating hemophilia A described herein, the gRNA and DNA endonuclease or nucleic acid encoding the DNA endonuclease administered are administered to the cell after providing the donor template to the cell. is provided on In some embodiments, the administered gRNA and the DNA endonuclease or nucleic acid encoding the DNA endonuclease are provided to the cell for a time greater than 4 days after the donor template is provided to the cell. In some embodiments, the gRNA and DNA endonuclease or nucleic acid encoding the DNA endonuclease is provided to the cell at least 14 days after providing the donor template to the cell. In some embodiments, the gRNA and DNA endonuclease or nucleic acid encoding the DNA endonuclease is provided to the cell at least 17 days after providing the donor template to the cell. In some embodiments, providing the gRNA and the DNA endonuclease to the cell comprises administering to the subject (eg, by an intravenous route) an LNP comprising a nucleic acid encoding the DNA endonuclease and the gRNA. . In some embodiments, the nucleic acid encoding a DNA endonuclease is an mRNA encoding a DNA endonuclease. In some embodiments, providing the donor template to the cell comprises administering to the subject (eg, by an intravenous route) a donor template encoded in an AAV vector.

일부 실시형태에서, 본원에 기술된 A형 혈우병의 치료 방법 중 어느 하나에 따라, 하나 이상의 추가의 용량의 gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 후에 세포에 제공된다. 일부 실시형태에서, 하나 이상의 추가의 용량의 gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 표적화된 통합 및/또는 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 발현이 달성될 때까지 세포에 제공된다. 일부 실시형태에서, gRNA 및 DNA 엔도뉴클레아제를 세포에 제공하는 단계는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 (예컨대 정맥내 경로에 의해) 대상체에 투여하는 것을 포함한다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 엔도뉴클레아제를 인코딩하는 mRNA이다.In some embodiments, according to any one of the methods of treating hemophilia A described herein, one or more additional doses of gRNA and a DNA endonuclease or a nucleic acid encoding a DNA endonuclease comprise a first dose of gRNA and a DNA endonuclease or a nucleic acid encoding the DNA endonuclease, followed by providing to the cell. In some embodiments, one or more additional doses of gRNA and DNA endonuclease or nucleic acid encoding DNA endonuclease comprises a first dose of gRNA and DNA endonuclease or nucleic acid encoding DNA endonuclease It is then provided to the cell until targeted integration of the target level of the nucleic acid sequence encoding the synthetic FVIII protein and/or expression of the target level of the nucleic acid sequence encoding the synthetic FVIII protein is achieved. In some embodiments, providing the gRNA and the DNA endonuclease to the cell comprises administering to the subject (eg, by an intravenous route) lipid nanoparticles comprising a nucleic acid encoding the DNA endonuclease and the gRNA. include In some embodiments, the nucleic acid encoding a DNA endonuclease is an mRNA encoding a DNA endonuclease.

일부 실시형태에서, 본원에 기술된 A형 혈우병의 치료 방법 중 어느 하나에 따라, 합성 FVIII 단백질을 인코딩하는 핵산 서열은 내인성 알부민 프로모터의 제어 하에 발현된다. 일부 실시형태에서, 합성 FVIII 단백질을 인코딩하는 핵산 서열은 내인성 트랜스페린 프로모터의 제어 하에 발현된다. 일부 실시형태에서, 합성 FVIII 단백질을 인코딩하는 핵산 서열은 내인성 피브리노겐-알파 쇄 프로모터의 제어 하에 발현된다.In some embodiments, according to any one of the methods of treating hemophilia A described herein, the nucleic acid sequence encoding the synthetic FVIII protein is expressed under the control of an endogenous albumin promoter. In some embodiments, the nucleic acid sequence encoding the synthetic FVIII protein is expressed under the control of an endogenous transferrin promoter. In some embodiments, the nucleic acid sequence encoding the synthetic FVIII protein is expressed under the control of an endogenous fibrinogen-alpha chain promoter.

일부 실시형태에서, 본원에 기재된 A형 혈우병 치료 방법에 따르면, 합성 FVIII 단백질을 인코딩하는 핵산 서열은 대상체의 간 내에서 발현된다.In some embodiments, according to the methods of treating hemophilia A described herein, the nucleic acid sequence encoding the synthetic FVIII protein is expressed in the liver of the subject.

대상체로의 세포의 전달delivery of cells to a subject

일부 실시형태에서, 본 개시내용의 생체외 방법은 게놈-편집된 세포를 이러한 방법을 필요로 하는 대상체 내로 투여하는 단계를 포함한다. 이는 해당 분야에 공지된 임의의 비경구 투여 방법을 사용하여 달성될 수 있다. 예를 들어, 유전자 변형 세포를 대상체의 혈액에 직접 주사하거나, 간(이식됨) 내부에 직접 또는 간 근처에 주사하거나, 다르게는 환자에게 투여할 수 있다.In some embodiments, an ex vivo method of the present disclosure comprises administering a genome-edited cell into a subject in need thereof. This can be accomplished using any method of parenteral administration known in the art. For example, the genetically modified cells can be injected directly into the blood of a subject, directly into or near the liver (transplanted), or otherwise administered to a patient.

일부 실시형태에서, 본원에 개시된 방법은 요망되는 효과(들)가 생성되도록 요망되는 부위에서 도입된 세포의 적어도 부분적인 국소화를 초래하는 방법 또는 경로에 의해 유전학적으로-변형된 치료적 세포를 대상체 내로 이식하거나 “삽입하는” 단계를 포함한다. 치료 세포 또는 그들의 분화된 자손은 대상체 내의 목적하는 위치로의 운반을 야기하는 임의의 적절한 경로에 의해 도입될 수 있고, 여기서 이식된 세포 또는 세포의 성분의 적어도 일부는 생존 가능하게 유지된다. 대상체로의 투여 후 세포의 생존 기간은 수시간, 예를 들어 24시간만큼 짧을 수 있거나 수일까지, 수년, 또는 심지어는 대상체의 일생만큼 길 수 있고, 즉 장기간 생착이다.In some embodiments, the methods disclosed herein administer to the subject a therapeutic cell genetically-modified by a method or pathway that results in at least partial localization of the introduced cells at the site desired to produce the desired effect(s). implanting or “inserting” into The therapeutic cells or their differentiated progeny may be introduced by any suitable route that results in transport to a desired location in a subject, wherein at least a portion of the transplanted cell or component of the cell remains viable. The duration of survival of cells following administration to a subject can be as short as several hours, eg, 24 hours, or can be up to several days, years, or even as long as the lifetime of the subject, ie, long-term engraftment.

예방적으로 제공되는 경우, 본원에 기술된 치료적 세포는 A형 혈우병의 임의의 증상에 앞서 대상체에 투여된다. 따라서, 일부 실시형태에서, 유전학적으로 변형된 간세포 집단의 예방적 투여는 A형 혈우병 증상의 발생을 예방하기 위해 제공된다.When provided prophylactically, the therapeutic cells described herein are administered to a subject prior to any symptoms of hemophilia A. Accordingly, in some embodiments, prophylactic administration of a genetically modified hepatocyte population is provided to prevent the development of hemophilia A symptoms.

일부 실시형태에서 치료적으로 제공되는 경우, 유전자 조작된 간세포는 A형 혈우병의 증상 또는 적응증의 발병 시에(또는 그 후에), 예를 들어, 질환의 발병 시에 제공된다.In some embodiments, when provided therapeutically, the genetically engineered hepatocytes are provided at the onset of (or after) the symptoms or indications of hemophilia A, eg, at the onset of the disease.

일부 실시형태에서, 본원에 기술된 방법에 따라 투여 중인 치료 간세포 집단은 하나 이상의 공여자로부터 수득되는 동종이계 치료 간세포를 가진다. "동종이계"는 동일한 종의 하나 이상의 상이한 공여자로부터 수득되는 간세포를 가지는 생물학적 시료 또는 간세포를 지칭하며, 하나 이상의 유전자좌에서 유전자는 동일하지 않다. 예를 들어, 대상체에게 투여 중인 간세포 집단은 하나 이상의 비관련 공여자 대상체로부터 또는 하나 이상의 비-동일한 형제로부터 유래될 수 있다. 일부 실시형태에서, 동계 간세포 집단, 예컨대 유전학적으로 동일한 동물(또는 동일한 쌍둥이)로부터 수득되는 것들이 사용될 수 있다. 다른 실시형태에서, 간세포는 자가 세포이며; 즉, 세포는 대상체로부터 수득되거나 단리되며, 동일한 대상체에게 투여되며, 즉, 공여자 및 수여자가 동일하다.In some embodiments, the therapeutic hepatocyte population being administered according to the methods described herein has allogeneic therapeutic hepatocytes obtained from one or more donors. “Allogeneic” refers to a biological sample or hepatocytes having hepatocytes obtained from one or more different donors of the same species, wherein the genes at one or more loci are not identical. For example, the hepatocyte population being administered to a subject may be derived from one or more unrelated donor subjects or from one or more non-identical siblings. In some embodiments, a syngeneic hepatocyte population may be used, such as those obtained from genetically identical animals (or identical twins). In other embodiments, the hepatocytes are autologous; That is, cells are obtained or isolated from a subject and administered to the same subject, ie, the donor and recipient are the same.

일 실시형태에서, 용어 "유효량"은 A형 혈우병의 하나 이상의 징후 또는 증상을 예방하거나 완화시키는 데 필요한 치료 세포의 집단의 양을 지칭하며, 요망되는 효과를 제공하기 위한, 예를 들어, A형 혈우병을 갖는 대상체를 치료하기 위한 조성물의 충분한 양에 관한 것이다. 일 실시형태에서, 따라서 용어 "치료적 유효량"은 대상체, 예컨대 A형 혈우병을 갖거나, 이에 대한 위험이 있는 대상체에게 투여되는 경우 특정 효과를 촉진시키기에 충분한 치료 세포 또는 치료 세포를 포함하는 조성물의 양을 지칭한다. 또한, 유효량은 질환의 증상의 발생을 예방 또는 지연시키거나, 질환의 증상의 과정을 변경시키거나(예를 들어, 비제한적으로 질환의 증상의 진행을 늦추거나) 또는 질환의 증상을 반전시키기에 충분한 양을 포함한다. 임의의 주어진 경우에 대하여, 적절한 "유효량"은 일상적인 실험을 사용하여 해당 분야의 숙련자에 의해 결정될 수 있는 것이 이해된다.In one embodiment, the term "effective amount" refers to the amount of a population of therapeutic cells required to prevent or ameliorate one or more signs or symptoms of hemophilia A, to provide a desired effect, e.g., type A A sufficient amount of the composition for treating a subject having hemophilia. In one embodiment, thus, the term “therapeutically effective amount” refers to a therapeutic cell or composition comprising therapeutic cells sufficient to promote a particular effect when administered to a subject, such as a subject having or at risk for hemophilia A. refers to the quantity. Also, an effective amount is used to prevent or delay the onset of symptoms of a disease, alter the course of symptoms of a disease (eg, but not limited to slowing the progression of symptoms of a disease), or to reverse symptoms of a disease. contain a sufficient amount. It is understood that, for any given case, an appropriate "effective amount" can be determined by one of ordinary skill in the art using routine experimentation.

본원에 기술된 실시형태에 사용하기 위하여, 유효량의 치료 세포, 예를 들어, 유전자 편집된 간세포는 적어도 약 102개의 세포, 적어도 약 5 X 102개의 세포, 적어도 약 103개의 세포, 적어도 약 5 X 103개의 세포, 적어도 약 104개의 세포, 적어도 약 5 X 104개의 세포, 적어도 약 105개의 세포, 적어도 약 2 X 105개의 세포, 적어도 약 3 X 105개의 세포, 적어도 약 4 X 105개의 세포, 적어도 약 5 X 105개의 세포, 적어도 약 6 X 105개의 세포, 적어도 약 7 X 105개의 세포, 적어도 약 8 X 105개의 세포, 적어도 약 9 X 105개의 세포, 적어도 약 1 X 106개의 세포, 적어도 약 2 X 106개의 세포, 적어도 약 3 X 106개의 세포, 적어도 약 4 X 106개의 세포, 적어도 약 5 X 106개의 세포, 적어도 약 6 X 106개의 세포, 적어도 약 7 X 106개의 세포, 적어도 약 8 X 106개의 세포, 적어도 약 9 X 106개의 세포, 또는 그의 배수를 포함한다. 치료 세포는 하나 이상의 공여자로부터 유래되거나, 자가 공급원으로부터 수득된다. 본원에 기술된 일부 실시형태에서, 치료 세포는 그를 필요로 하는 대상체로의 투여 이전에 배양에서 증량된다.For use in the embodiments described herein, an effective amount of a therapeutic cell, e.g., a gene edited hepatocyte, is at least about 10 2 cells, at least about 5 X 10 2 cells, at least about 10 3 cells, at least about 5 X 10 3 cells, at least about 10 4 cells, at least about 5 X 10 4 cells, at least about 10 5 cells, at least about 2 X 10 5 cells, at least about 3 X 10 5 cells, at least about 4 X 10 5 cells, at least about 5 X 10 5 cells, at least about 6 X 10 5 cells, at least about 7 X 10 5 cells, at least about 8 X 10 5 cells, at least about 9 X 10 5 cells cells, at least about 1 X 10 6 cells, at least about 2 X 10 6 cells, at least about 3 X 10 6 cells, at least about 4 X 10 6 cells, at least about 5 X 10 6 cells, at least about 6 X 10 6 cells, at least about 7 X 10 6 cells, at least about 8 X 10 6 cells, at least about 9 X 10 6 cells, or a multiple thereof. Therapeutic cells are derived from one or more donors or are obtained from autologous sources. In some embodiments described herein, the therapeutic cells are expanded in culture prior to administration to a subject in need thereof.

일부 실시형태에서, A형 혈우병을 갖는 대상체의 세포에서 발현되는 기능적 FVIII의 수준의 보통의 및 증분식 증가는 질환의 하나 이상의 증상을 개선시키기 위하여, 장기간 생존을 증가시키기 위하여 그리고/또는 다른 치료와 연관된 부작용을 감소시키기 위하여 유리할 수 있다. 인간 대상체로의 이러한 세포의 투여 시에, 증가된 수준의 기능적 FVIII을 생성하고 있는 치료 세포의 존재가 유리하다. 일부 실시형태에서, 대상체의 효과적인 치료는 치료된 대상체 내의 총 FVIII에 비하여 적어도 약 1%, 3%, 5% 또는 7%의 기능적 FVIII을 발생시킨다. 일부 실시형태에서, 기능적 FVIII은 총 FVIII의 적어도 약 10%일 것이다. 일부 실시형태에서, 기능적 FVIII은 총 FVIII의 적어도, 약 또는 최대 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 100%이다. 유사하게, 상당히 증가된 수준의 기능적 FVIII을 갖는 세포의 비교적 더 제한된 하위집단의 도입이 대상체에서 이로운데, 그 이유는 일부 상황에서 정상 세포는 이환 세포에 비해서 선택 유리성을 가지기 때문이다. 그러나, 심지어 상승된 수준의 기능적 FVIII을 갖는 중등의 수준의 치료적 세포가 대상체에서 A형 혈우병의 하나 이상의 양태를 개선시키는 데 유리하다. 일부 실시형태에서, 이러한 세포가 투여되는 대상체에서 치료제의 약 10%, 약 20%, 약 30%, 약 40%, 약 50%, 약 60%, 약 70%, 약 80%, 약 90% 이상은 증가된 수준의 기능적 FVIII을 생성한다.In some embodiments, moderate and incremental increases in the level of functional FVIII expressed in cells of a subject with hemophilia A are combined with other treatments to ameliorate one or more symptoms of the disease, increase long-term survival, and/or It may be beneficial to reduce the associated side effects. Upon administration of such cells to a human subject, the presence of therapeutic cells that are producing increased levels of functional FVIII is advantageous. In some embodiments, effective treatment of a subject results in at least about 1%, 3%, 5% or 7% of functional FVIII as compared to the total FVIII in the treated subject. In some embodiments, the functional FVIII will be at least about 10% of the total FVIII. In some embodiments, the functional FVIII is at least, about or up to 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% or 100% of the total FVIII. Similarly, the introduction of a relatively more limited subpopulation of cells with significantly increased levels of functional FVIII is beneficial in a subject, since in some circumstances normal cells have a selection advantage over diseased cells. However, even moderate levels of therapeutic cells with elevated levels of functional FVIII are beneficial in ameliorating one or more aspects of hemophilia A in a subject. In some embodiments, about 10%, about 20%, about 30%, about 40%, about 50%, about 60%, about 70%, about 80%, about 90% or more of the therapeutic agent in the subject to which such cells are administered produces increased levels of functional FVIII.

실시형태에서, "투여된"은 목적하는 부위에서 세포 조성물의 적어도 부분적인 국소화를 야기하는 방법 또는 경로에 의한 대상체로의 치료 세포 조성물의 운반을 지칭한다. 세포 조성물은 대상체에서 효과적인 치료를 야기하는 임의의 적절한 경로에 의해 투여될 수 있고, 즉, 투여는 대상체에서 목적하는 위치로의 운반을 야기하고, 여기서 운반되는 조성물의 적어도 일부, 즉 적어도 약 1 x 104개의 세포가 소정의 기간 동안 목적하는 부위에 운반된다. 투여 방식은 주사, 주입, 점안(instillation) 또는 섭취를 포함한다. "주사"는 비제한적으로 정맥내, 근육내, 동맥내, 척추강내, 뇌실내, 낭내, 안와내, 심장내, 피내, 복강내, 기관경유(transtracheal), 피하, 표피하, 관절내, 피막하, 지주막하(subarachnoid), 척수내, 뇌척수내 및 흉골내 주사 및 주입을 포함한다. 일부 실시형태에서, 경로는 정맥내이다. 세포의 운반을 위하여, 주사 또는 주입에 의한 투여가 이루어질 수 있다.In an embodiment, “administered” refers to delivery of a therapeutic cell composition to a subject by a method or route that results in at least partial localization of the cell composition at a desired site. The cell composition can be administered by any suitable route that results in effective treatment in a subject, i.e., administration results in delivery to a desired location in the subject, wherein at least a portion of the delivered composition, i.e., at least about 1 x 10 4 cells are transported to the desired site for a predetermined period of time. Modes of administration include injection, infusion, instillation or ingestion. “Injection” includes, but is not limited to, intravenous, intramuscular, intraarterial, intrathecal, intraventricular, intracystic, intraorbital, intracardiac, intradermal, intraperitoneal, transtracheal, subcutaneous, subepidermal, intraarticular, capsular subarachnoid, intrathecal, intracerebrospinal and intrasternal injections and infusions. In some embodiments, the route is intravenous. For delivery of cells, administration by injection or infusion may be performed.

일 실시형태에서, 세포는 전신 투여되는데, 다시말해 치료 세포 집단이 표적 부위, 조직 또는 기관에 직접 투여되는 것이 아니라, 그것이 대신에 대상체의 순환계로 유입되고, 이에 따라, 대사 및 다른 유사 과정을 겪도록 투여된다.In one embodiment, the cells are administered systemically, ie, the therapeutic cell population is not administered directly to the target site, tissue or organ, but instead enters the subject's circulation and thus undergoes metabolism and other similar processes. is administered to

A형 혈우병의 치료를 위한 조성물을 갖는 치료의 효능은 숙련자에 의해 결정될 수 있다. 그러나, 치료는 질환의 징후 또는 증상 중 임의의 하나 또는 그이상의 것, 단지 하나의 예로서, 기능적 FVIII의 수준이 유리한 방식으로 변경되거나(예를 들어, 적어도 10% 증가되거나), 또는 질환의 다른 임상적으로 허용되는 증상 또는 마커가 개선 또는 완화되면, 치료는 "유효한 치료"로 간주된다. 효능은 또한 의학적 개입을 위한 필요성 또는 입원에 의해 평가되는 경우 개체의 악화 실패에 의해 측정될 수 있다(예를 들어, 질환의 진행은 중단되거나 적어도 둔화된다). 이들 지표의 측정 방법은 해당 분야의 숙련자에 공지되고/공지되거나 본원에 기술된다. 치료는 개체 또는 동물(일부 비-제한적인 예는 인간, 또는 포유동물을 포함함)에서의 질환의 임의의 치료를 포함하고, 하기를 포함한다: (1) 질환의 저해, 예를 들어, 증상의 진행의 저지, 또는 둔화; 또는 (2) 질환의 완화, 예를 들면, 증상의 퇴행 야기; 및 (3) 증상의 발생의 예방 또는 가능성 감소.The efficacy of treatment with a composition for the treatment of hemophilia A can be determined by the skilled artisan. However, treatment may be such that any one or more of the signs or symptoms of the disease, by way of example only, the level of functional FVIII is altered in a favorable manner (eg, increased by at least 10%), or other of the disease A treatment is considered "effective treatment" if clinically acceptable symptoms or markers are ameliorated or alleviated. Efficacy can also be measured by the individual's failure to exacerbate when assessed by the need for medical intervention or hospitalization (eg, disease progression is stopped or at least slowed). Methods for measuring these indicators are known to those skilled in the art and/or described herein. Treatment includes any treatment of a disease in an individual or animal (some non-limiting examples include humans, or mammals), and includes: (1) inhibition of the disease, e.g., a symptom arrest, or slowing of its progression; or (2) alleviation of the disease, eg, causing regression of symptoms; and (3) preventing or reducing the likelihood of occurrence of symptoms.

조성물composition

일 양태에서, 본 개시내용은 본원에 개시된 방법을 수행하기 위한 조성물을 제공한다. 조성물은 하기 중 하나 이상을 포함할 수 있다: 게놈-표적화 핵산(예를 들어, gRNA); 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제) 또는 부위-지정 폴리펩티드를 인코딩하는 뉴클레오티드 서열; 및 본원에 개시된 방법의 요망되는 유전학적 변형을 시행하기 위한 삽입될 폴리뉴클레오티드(예를 들어, 공여자 주형).In one aspect, the present disclosure provides a composition for performing the methods disclosed herein. The composition may comprise one or more of the following: a genome-targeting nucleic acid (eg, gRNA); a nucleotide sequence encoding a site-directed polypeptide (eg, a DNA endonuclease) or a site-directed polypeptide; and a polynucleotide to be inserted (eg, a donor template) for effecting the desired genetic modification of the methods disclosed herein.

일부 실시형태에서, 조성물은 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오티드 서열을 갖는다.In some embodiments, the composition has a nucleotide sequence encoding a genome-targeting nucleic acid (eg, gRNA).

일부 실시형태에서, 조성물은 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제)를 갖는다. 일부 실시형태에서, 조성물은 부위-지정 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 갖는다.In some embodiments, the composition has a site-directed polypeptide (eg, a DNA endonuclease). In some embodiments, the composition has a nucleotide sequence encoding a site-directed polypeptide.

일부 실시형태에서, 조성물은 게놈 내로 삽입될 폴리뉴클레오티드(예를 들어, 공여자 주형)를 갖는다.In some embodiments, the composition has a polynucleotide (eg, a donor template) to be inserted into the genome.

일부 실시형태에서, 조성물은 (i) 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오티드 서열 및 (ii) 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제) 또는 부위-지정 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 갖는다.In some embodiments, the composition comprises (i) a nucleotide sequence encoding a genome-targeting nucleic acid (eg, gRNA) and (ii) a site-directed polypeptide (eg, DNA endonuclease) or site-directed polypeptide has a nucleotide sequence encoding

일부 실시형태에서, 조성물은 (i) 게놈-표적화 핵산(예를 들어, gRNA)을 인코딩하는 뉴클레오티드 서열 및 (ii) 게놈 내로 삽입될 폴리뉴클레오티드(예를 들어, 공여자 주형)를 갖는다.In some embodiments, the composition has (i) a nucleotide sequence encoding a genome-targeting nucleic acid (eg, gRNA) and (ii) a polynucleotide (eg, a donor template) to be inserted into the genome.

일부 실시형태에서, 조성물은 (i) 부위-지정 폴리펩티드(예를 들어, DNA 엔도뉴클레아제) 또는 부위-지정 폴리펩티드를 인코딩하는 뉴클레오티드 서열 및 (ii) 게놈 내로 삽입될 폴리뉴클레오티드(예를 들어, 공여자 주형)를 갖는다.In some embodiments, the composition comprises (i) a nucleotide sequence encoding a site-directed polypeptide (eg, a DNA endonuclease) or a site-directed polypeptide and (ii) a polynucleotide to be inserted into the genome (eg, donor template).

일부 실시형태에서, 조성물은 (i) 게놈-표적화 핵산을 인코딩하는 뉴클레오티드 서열, (ii) 부위-지정 폴리펩티드 또는 부위-지정 폴리펩티드를 인코딩하는 뉴클레오티드 서열 및 (iii) 게놈 내로 삽입될 폴리뉴클레오티드(예를 들어, 공여자 주형)를 갖는다.In some embodiments, the composition comprises (i) a nucleotide sequence encoding a genome-targeting nucleic acid, (ii) a nucleotide sequence encoding a site-directed polypeptide or a site-directed polypeptide, and (iii) a polynucleotide to be inserted into the genome (e.g., For example, donor template).

상기 조성물 중 임의의 것의 일부 실시형태에서, 조성물은 단일-분자 가이드 게놈-표적화 핵산을 가진다. 상기 조성물 중 임의의 것의 일부 실시형태에서, 조성물은 이중-분자 게놈-표적화 핵산을 가진다. 상기 조성물 중 임의의 것의 일부 실시형태에서, 조성물은 2개 이상의 이중-분자 가이드 또는 단일-분자 가이드를 가진다. 일부 실시형태에서, 조성물은 핵산 표적화 핵산을 인코딩하는 벡터를 가진다. 일부 실시형태에서, 게놈-표적화 핵산은 DNA 엔도뉴클레아제, 특히 Cas9이다.In some embodiments of any of the above compositions, the composition has a single-molecule guide genome-targeting nucleic acid. In some embodiments of any of the above compositions, the composition has a dual-molecule genome-targeting nucleic acid. In some embodiments of any of the above compositions, the composition has two or more double-molecule guides or single-molecule guides. In some embodiments, the composition has a vector encoding a nucleic acid targeting nucleic acid. In some embodiments, the genome-targeting nucleic acid is a DNA endonuclease, particularly Cas9.

일부 실시형태에서, 조성물은 게놈-편집, 특히 세포의 게놈 내로의 합성 FVIII 코딩 서열의 삽입에 적합한 하나 이상의 gRNA를 함유한다. 조성물을 위한 gRNA는 내인성 알부민 유전자의, 그 내의 또는 그 근처의 게놈 부위를 표적화할 수 있다. 일부 실시형태에서, gRNA는 알부민 유전자의, 그 내의 또는 그 근처의 게놈 서열에 상보적인 스페이서 서열을 갖는다.In some embodiments, the composition contains one or more gRNAs suitable for genome-editing, particularly insertion of a synthetic FVIII coding sequence into the genome of a cell. The gRNA for the composition may target a genomic region within or near an endogenous albumin gene. In some embodiments, the gRNA has a spacer sequence that is complementary to a genomic sequence of, within or near the albumin gene.

일부 실시형태에서, 조성물을 위한 gRNA는 SEQ ID NO: 271 내지 298 중 어느 하나로부터 선택되는 서열 및 SEQ ID NO: 271 내지 298 중 어느 하나에 대하여 적어도 약 50%, 약 55%, 약 60%, 약 65%, 약 70%, 약 75%, 약 80%, 약 85%, 약 90% 또는 약 95% 동일성 또는 상동성을 갖는 그의 변이체이다. 일부 실시형태에서, gRNA의 변이체는 SEQ ID NO: 271 내지 298 중 어느 하나에 대하여 적어도 약 85% 상동성을 갖는다.In some embodiments, the gRNA for the composition contains at least about 50%, about 55%, about 60%, about 65%, about 70%, about 75%, about 80%, about 85%, about 90% or about 95% identity or homology thereof. In some embodiments, the variant of the gRNA has at least about 85% homology to any one of SEQ ID NOs: 271-298.

일부 실시형태에서, 조성물을 위한 gRNA는 게놈 내의 표적 부위에 상보적인 스페이서 서열을 갖는다. 일부 실시형태에서, 스페이서 서열은 15개 염기 내지 20개 염기 길이이다. 일부 실시형태에서, 스페이서 서열과 게놈 서열 간의 상보성은 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 또는 약 100%이다.In some embodiments, the gRNA for the composition has a spacer sequence that is complementary to a target site in the genome. In some embodiments, the spacer sequence is between 15 and 20 bases in length. In some embodiments, the complementarity between the spacer sequence and the genomic sequence is at least about 80%, at least about 85%, at least about 90%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or about 100%.

일부 실시형태에서, 조성물은 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및/또는 합성 FVIII 코딩 서열의 핵산 서열을 갖는 공여자 주형을 가진다. 일부 실시형태에서, DNA 엔도뉴클레아제는 Cas9이다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA 또는 RNA이다.In some embodiments, the composition has a donor template having a DNA endonuclease or a nucleic acid encoding the DNA endonuclease and/or a nucleic acid sequence of a synthetic FVIII coding sequence. In some embodiments, the DNA endonuclease is Cas9. In some embodiments, the nucleic acid encoding the DNA endonuclease is DNA or RNA.

일부 실시형태에서, 임의의 올리고뉴클레오티드 또는 핵산 서열 중 하나 이상은 AAV 벡터에 인코딩된다. 따라서, 일부 실시형태에서, gRNA는 AAV 벡터에 인코딩된다. 일부 실시형태에서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 AAV 벡터에 인코딩된다. 일부 실시형태에서, 공여자 주형은 AAV 벡터에 인코딩된다. 일부 실시형태에서, 둘 이상의 올리고뉴클레오티드 또는 핵산 서열은 단일의 AAV 벡터에 인코딩된다. 따라서, 일부 실시형태에서, gRNA 서열 및 DNA 엔도뉴클레아제-인코딩 핵산은 단일의 AAV 벡터에 인코딩된다.In some embodiments, one or more of any oligonucleotide or nucleic acid sequence is encoded in an AAV vector. Thus, in some embodiments, the gRNA is encoded in an AAV vector. In some embodiments, the nucleic acid encoding the DNA endonuclease is encoded in an AAV vector. In some embodiments, the donor template is encoded in an AAV vector. In some embodiments, two or more oligonucleotide or nucleic acid sequences are encoded in a single AAV vector. Thus, in some embodiments, the gRNA sequence and the DNA endonuclease-encoding nucleic acid are encoded in a single AAV vector.

일부 실시형태에서, 조성물은 리포좀 또는 지질 나노입자를 갖는다. 따라서, 일부 실시형태에서, 조성물의 임의의 화합물(예를 들어, DNA 엔도뉴클레아제 또는 그의 인코딩 핵산, gRNA 및 공여자 주형)은 리포좀 또는 LNP에 제형화될 수 있다. 일부 실시형태에서, 하나 이상의 이러한 화합물은 공유 결합 또는 비-공유 결합을 통해 리포좀 또는 LNP와 회합된다. 일부 실시형태에서, 화합물 중 어느 하나는 리포좀 또는 LNP 내에 개별적으로 또는 함께 함유된다. 따라서, 일부 실시형태에서, DNA 엔도뉴클레아제 또는 그의 인코딩 핵산, gRNA 및 공여자 주형의 각각은 리포좀 또는 LNP 내에 개별적으로 제형화된다. 일부 실시형태에서, DNA 엔도뉴클레아제는 gRNA와 함께 리포좀 또는 LNP 내에 제형화된다. 일부 실시형태에서, DNA 엔도뉴클레아제 또는 그의 인코딩 핵산, gRNA 및 공여자 주형은 리포좀 또는 LNP 내에 함께 제형화된다.In some embodiments, the composition has liposomes or lipid nanoparticles. Thus, in some embodiments, any compound of the composition (eg, a DNA endonuclease or its encoding nucleic acid, gRNA and donor template) can be formulated in liposomes or LNPs. In some embodiments, one or more such compounds are associated with the liposome or LNP via a covalent or non-covalent bond. In some embodiments, any one of the compounds is contained individually or together in a liposome or LNP. Thus, in some embodiments, each of the DNA endonuclease or its encoding nucleic acid, gRNA and donor template is individually formulated in a liposome or LNP. In some embodiments, the DNA endonuclease is formulated in liposomes or LNPs with the gRNA. In some embodiments, the DNA endonuclease or its encoding nucleic acid, gRNA and donor template are formulated together in a liposome or LNP.

일부 실시형태에서, 상기에 기술된 임의의 키트는 하나 이상의 추가의 시약을 추가로 포함하며, 여기서 이러한 추가의 시약은 완충제, 폴리펩티드 또는 폴리뉴클레오티드를 세포에 도입하기 위한 완충제, 세척 완충제, 대조군 시약, 대조군 벡터, 대조군 RNA 폴리뉴클레오티드, DNA로부터 폴리펩티드를 시험관 내에서 생성하기 위한 시약, 시퀀싱을 위한 어댑터 등으로부터 선택된다. 완충제는 안정화 완충제, 재구성 완충제, 희석 완충제 등일 수 있다. 일부 실시형태에서, 조성물은 온-표적 결합 또는 엔도뉴클레아제에 의한 DNA의 절단을 용이하게 하거나 또는 향상시키거나, 또는 표적화의 특이성을 개선시키기 위하여 사용될 수 있는 하나 이상의 성분도 또한 포함한다.In some embodiments, any kit described above further comprises one or more additional reagents, wherein such additional reagents include a buffer, a buffer for introducing the polypeptide or polynucleotide into the cell, a wash buffer, a control reagent, control vectors, control RNA polynucleotides, reagents for generating polypeptides in vitro from DNA, adapters for sequencing, and the like. The buffer may be a stabilization buffer, a reconstitution buffer, a dilution buffer, and the like. In some embodiments, the composition also includes one or more components that can be used to facilitate or enhance on-target binding or cleavage of DNA by an endonuclease, or to improve the specificity of targeting.

일부 실시형태에서, 조성물 중 임의의 성분은 특정 투여 방식 및 투여형에 따라, 약제학적으로 허용 가능한 부형제, 예컨대 담체, 용매, 안정화제, 애쥬번트, 희석제 등과 함께 제형화된다. 실시형태에서, 가이드 RNA 조성물은 일반적으로 생리학적으로 상용성인 pH 및 제형 및 투여 경로에 따라, 약 3의 pH 내지 약 11의 pH, 약 pH 3 내지 약 pH 7 범위를 달성하도록 제형화된다. 일부 실시형태에서, pH는 약 pH 5.0 내지 약 pH 8.0 범위로 조정된다. 일부 실시형태에서, 조성물은 하나 이상의 약제학적으로 허용 가능한 부형제와 함께, 본원에 기술된 바와 같은 치료적 유효량의 적어도 하나의 화합물을 가진다. 선택적으로, 조성물은 본원에 기술된 화합물의 조합을 포함할 수 있거나 또는 박테리아 성장의 치료 또는 예방에 유용한 제2 활성 성분(예를 들어, 비제한적으로 항-박테리아제 또는 항-미생물제)을 포함할 수 있거나 또는 본 개시내용의 시약의 조합을 포함할 수 있다. 일부 실시형태에서, gRNA는 하나 이상의 다른 올리고뉴클레오티드, 예를 들어, DNA 엔도뉴클레아제를 인코딩하는 핵산 및/또는 공여자 주형과 함께 제형화된다. 대안적으로, DNA 엔도뉴클레아제를 인코딩하는 핵산 및 공여자 주형은 개별적으로 또는 다른 올리고뉴클레오티드와 조합하여 gRNA 제형에 대하여 상기 기술된 방법을 사용하여 제형화된다.In some embodiments, any component of the composition is formulated with pharmaceutically acceptable excipients such as carriers, solvents, stabilizers, adjuvants, diluents, and the like, depending on the particular mode of administration and dosage form. In an embodiment, the guide RNA composition is formulated to achieve a pH ranging from about 3 to about 11, from about pH 3 to about pH 7, depending on a generally physiologically compatible pH and formulation and route of administration. In some embodiments, the pH is adjusted to range from about pH 5.0 to about pH 8.0. In some embodiments, the composition has a therapeutically effective amount of at least one compound as described herein in association with one or more pharmaceutically acceptable excipients. Optionally, the composition may comprise a combination of compounds described herein or will comprise a second active ingredient useful for the treatment or prevention of bacterial growth (eg, but not limited to, an anti-bacterial or anti-microbial agent). or may include a combination of reagents of the present disclosure. In some embodiments, the gRNA is formulated with one or more other oligonucleotides, eg, nucleic acids encoding a DNA endonuclease, and/or a donor template. Alternatively, the nucleic acid encoding the DNA endonuclease and the donor template are formulated using the methods described above for gRNA formulation, either individually or in combination with other oligonucleotides.

적합한 부형제는 예를 들어, 서서히 대사되는 큰 거대분자, 예컨대 단백질, 다당류, 폴리락트산, 폴리글리콜산, 중합체 아미노산, 아미노산 공중합체, 및 불활성 바이러스 입자를 포함하는 담체 분자를 포함한다. 다른 예시적인 부형제는 항산화제(예를 들어 비제한적으로, 아스코르브산), 킬레이트화제(예를 들어 비제한적으로, EDTA), 탄수화물(예를 들어 비제한적으로, 덱스트린, 하이드록시알킬셀룰로스 및 하이드록시알킬메틸셀룰로스), 스테아르산, 액체(예를 들어 비제한적으로 오일, 물, 염수, 글리세롤 및 에탄올), 습윤제 또는 유화제, pH 완충 물질 등을 포함한다.Suitable excipients include, for example, slowly metabolized large macromolecules such as proteins, polysaccharides, polylactic acid, polyglycolic acid, polymeric amino acids, amino acid copolymers, and carrier molecules including inactive viral particles. Other exemplary excipients include antioxidants (eg, but not limited to, ascorbic acid), chelating agents (eg, but not limited to, EDTA), carbohydrates (eg, but not limited to, dextrins, hydroxyalkylcelluloses and hydroxy alkylmethylcellulose), stearic acid, liquids (such as but not limited to oils, water, saline, glycerol and ethanol), wetting or emulsifying agents, pH buffering substances, and the like.

일부 실시형태에서, 조성물의 임의의 화합물(예를 들어, DNA 엔도뉴클레아제 또는 그의 인코딩 핵산, gRNA 및 공여자 주형)은 트랜스펙션, 예컨대 전기천공법을 통해 전달된다. 일부 예시적인 실시형태에서, DNA 엔도뉴클레아제는 세포로의 제공 이전에, gRNA와 사전복합체화되어, RNP 복합체를 형성하며, RNP 복합체는 전기천공될 수 있다. 이러한 실시형태에서, 공여자 주형은 전기천공법을 통해 전달될 수 있다.In some embodiments, any compound of the composition (eg, a DNA endonuclease or its encoding nucleic acid, gRNA and donor template) is delivered via transfection, such as electroporation. In some exemplary embodiments, the DNA endonuclease is precomplexed with the gRNA to form an RNP complex prior to presentation to the cell, and the RNP complex can be electroporated. In such embodiments, the donor template may be delivered via electroporation.

일부 실시형태에서, “조성물”은 생체외 치료 방법에서 사용되는 치료적 세포를 갖는 치료적 조성물을 나타낸다.In some embodiments, “composition” refers to a therapeutic composition having therapeutic cells for use in an ex vivo method of treatment.

실시형태에서, 치료적 조성물은 세포 조성물 및 선택적으로 활성 성분으로서 그 내에 용해 또는 분산된 본원에 기술된 바와 같은 적어도 하나의 추가의 생물활성제와 함께 생리학적으로 용인되는 담체를 함유한다. 일부 실시형태에서, 치료적 조성물은 치료적 목적을 위하여 포유동물 또는 인간 대상체에게 투여될 때 실질적으로 면역원성이 아니다.In an embodiment, the therapeutic composition contains a physiologically acceptable carrier together with a cell composition and optionally at least one additional bioactive agent as described herein dissolved or dispersed therein as an active ingredient. In some embodiments, the therapeutic composition is not substantially immunogenic when administered to a mammalian or human subject for therapeutic purposes.

일반적으로, 본원에 기술된 유전자 변형된 치료 세포는 약제학적으로 허용 가능한 담체와 함께 현탁물로서 투여된다. 해당 분야의 숙련자는 세포 조성물 중에서 사용될 약제학적으로 허용 가능한 담체가 완충제, 화합물, 저온보존제, 보존제 또는 다른 작용제를 대상체에 운반될 세포의 생존력을 실질적으로 방해하는 양으로 포함하지 않을 것이라는 것을 인식할 것이다. 세포를 포함하는 제형은 예를 들어, 세포막 온전성이 유지되게 하는 삼투성 완충제, 및 선택적으로 투여 시 세포 생존력을 유지시키거나 생착을 향상시키기 위한 영양제를 포함할 수 있다. 이러한 제형 및 현탁물은 해당 분야의 숙련자에게 공지되어 있고/있거나, 본원에 기술된 바와 같이, 세포와 함께 사용하기 위하여 조정될 수 있다.Generally, the genetically modified therapeutic cells described herein are administered as a suspension in association with a pharmaceutically acceptable carrier. Those skilled in the art will recognize that a pharmaceutically acceptable carrier to be used in a cell composition will not contain buffers, compounds, cryopreservatives, preservatives or other agents in amounts that would materially interfere with the viability of cells to be delivered to a subject. . Formulations comprising cells may include, for example, an osmotic buffer to maintain cell membrane integrity, and optionally nutrients to maintain cell viability or enhance engraftment upon administration. Such formulations and suspensions are known to those skilled in the art and/or can be adapted for use with cells as described herein.

일부 실시형태에서, 세포 조성물은 또한 리포좀 조성물로서 유화 또는 존재할 수 있되, 단 유화 절차는 세포 생존력에 악영향을 주지 않아야 한다. 세포 및 임의의 다른 활성 성분을 약제학적으로 허용 가능하고, 활성 성분과 상용성인 부형제와, 본원에 기술된 치료 방법에서 사용하기에 적합한 양으로 혼합할 수 있다.In some embodiments, the cell composition may also be emulsified or present as a liposomal composition, provided that the emulsification procedure does not adversely affect cell viability. The cells and any other active ingredient may be admixed with excipients that are pharmaceutically acceptable and compatible with the active ingredient, in amounts suitable for use in the methods of treatment described herein.

세포 조성물 중에 포함되는 추가의 작용제는 그 중에 성분의 약제학적으로 허용 가능한 염을 포함할 수 있다. 약제학적으로 허용 가능한 염은 무기산, 예컨대, 예를 들어 염화수소산 또는 인산 또는 아세트산, 타르타르산, 만델산 등과 같은 유기산을 사용하여 형성되는 산 부가염(폴리펩티드의 유리 아미노기를 사용하여 형성됨)을 포함한다. 유리 카복실기를 사용하여 형성된 염은 또한 무기 염기, 예컨대, 예를 들어, 나트륨, 칼륨, 암모늄, 칼슘 또는 제2철 수산화물 및 아이소프로필아민, 트리메틸아민, 2-에틸아미노 에탄올, 히스티딘, 프로카인 등과 같은 유기 염기로부터 유래될 수 있다.Additional agents included in the cell composition may include therein pharmaceutically acceptable salts of ingredients. Pharmaceutically acceptable salts include acid addition salts (formed using the free amino group of the polypeptide) formed with inorganic acids such as, for example, hydrochloric or phosphoric or organic acids such as acetic, tartaric, mandelic, and the like. Salts formed using free carboxyl groups also include inorganic bases such as, for example, sodium, potassium, ammonium, calcium or ferric hydroxide and isopropylamine, trimethylamine, 2-ethylamino ethanol, histidine, procaine, and the like. It may be derived from an organic base.

생리학적으로 용인되는 담체는 해당 분야에 널리 공지되어 있다. 예시적인 액체 담체는 활성 성분 및 물에 더하여 물질을 함유하지 않거나 또는 완충제, 예컨대 생리학적 pH 값의 인산나트륨, 생리 식염수 또는 둘 모두, 예컨대 인산염-완충 염수를 함유하는 멸균 수성 용액이다. 더 추가로, 수성 담체는 1가지 초과의 완충제 염, 뿐만 아니라 염, 예컨대 염화나트륨 및 염화칼륨, 덱스트로스, 폴리에틸렌 글리콜, 및 다른 용질을 함유할 수 있다. 액체 조성물은 또한 물에 더하여 그리고 물을 배제하고 액체 상을 또한 함유할 수 있다. 이러한 추가 액체 상의 예는 글리세린, 식물유, 예컨대 면실유, 및 수-유 에멀전이다. 특정 장애 또는 병증의 치료에 효과적인 세포 조성물에서 사용되는 활성 화합물의 양은 장애 또는 병증의 성질에 좌우될 것이고, 표준 임상 기법에 의해 결정될 수 있다.Physiologically acceptable carriers are well known in the art. Exemplary liquid carriers are sterile aqueous solutions containing, in addition to the active ingredient and water, substances free or buffers such as sodium phosphate at physiological pH values, physiological saline, or both, such as phosphate-buffered saline. Still further, the aqueous carrier may contain more than one buffer salt, as well as salts such as sodium and potassium chloride, dextrose, polyethylene glycol, and other solutes. The liquid composition may also contain a liquid phase in addition to and excluding water. Examples of such additional liquid phases are glycerin, vegetable oils such as cottonseed oil, and water-oil emulsions. The amount of active compound employed in a cell composition effective for the treatment of a particular disorder or condition will depend on the nature of the disorder or condition and can be determined by standard clinical techniques.

키트kit

일부 실시형태는 상기 기술된 조성물, 예를 들어, 게놈 편집을 위한 조성물 또는 치료적 세포 조성물 중 어느 하나 및 하나 이상의 추가의 성분을 함유하는 키트를 제공한다.Some embodiments provide a kit containing any one of the compositions described above, eg, a composition for genome editing or a therapeutic cell composition, and one or more additional components.

일부 실시형태에서, 키트는 요망되는 목적, 예를 들어, 게놈 편집 또는 세포 요법을 위해 조성물과 동시에 또는 그와 연속하여 투여될 수 있는 하나 이상의 추가의 치료적 제제를 가질 수 있다.In some embodiments, the kit may have one or more additional therapeutic agents that may be administered concurrently or sequentially with the composition for a desired purpose, such as genome editing or cell therapy.

일부 실시형태에서, 키트는 방법을 실시하기 위하여 키트의 성분을 사용하기 위한 설명서를 추가로 포함할 수 있다. 방법을 실시하기 위한 설명서는 일반적으로 적합한 기록 매체 상에 기록된다. 예를 들어, 설명서는 기재, 예컨대 종이 또는 플라스틱 등 상에 인쇄될 수 있다. 설명서는 패키지 삽입물로서, 키트 또는 그의 성분의 용기의 표지(즉, 패키징 또는 하위패키징과 연관됨) 등에 키트 내에 존재할 수 있다. 설명서는 적합한 컴퓨터 판독 가능한 저장 매체, 예를 들어, CD-ROM, 디스켓, 플래시 드라이브 등 상에 존재하는 전자 저장 데이터 파일로서 존재할 수 있다. 일부 예에서, 실제 설명서는 키트 내에 존재하지 않지만, 원격 공급원으로부터(예를 들어, 인터넷을 통해서) 설명서를 입수하기 위한 수단이 제공된다. 이러한 실시형태의 예는 설명서를 볼 수 있는 웹 주소 및/또는 설명서를 다운로드할 수 있는 웹 주소를 포함하는 키트이다. 설명서와 관련하여, 설명서를 입수하기 위한 이러한 방법은 적합한 기재 상에 기록될 수 있다.In some embodiments, the kit may further comprise instructions for using the components of the kit to practice the method. Instructions for carrying out the method are generally recorded on a suitable recording medium. For example, the instructions may be printed on a substrate, such as paper or plastic, or the like. Instructions may be present within the kit as package inserts, such as on the label (ie, associated with packaging or subpackaging) of the container of the kit or components thereof. The instructions may exist as an electronic storage data file residing on a suitable computer-readable storage medium, for example, a CD-ROM, diskette, flash drive, or the like. In some instances, the actual instructions are not present in the kit, but a means is provided for obtaining instructions from a remote source (eg, via the Internet). An example of such an embodiment is a kit comprising a web address where the instructions can be viewed and/or a web address where the instructions can be downloaded. With respect to the instructions, this method for obtaining the instructions may be recorded on a suitable substrate.

추가적인 치료적 접근법Additional therapeutic approaches

유전자 편집은 특정 서열을 표적화하도록 엔지니어링된 부위-지정 폴리펩티드를 사용하여 행해질 수 있다. 현재까지, 4가지 주요 유형의 그러한 뉴클레아제가 존재한다: 메가뉴클레아제 및 그들의 기능적 등가물, 아연 핑거 뉴클레아제(ZFN), 전사 활성자 유사 이펙터 뉴클레아제(TALEN) 및 CRISPR/CAS 뉴클레아제 시스템. 특히 ZFN 및 TALEN의 특이성이 단백질-DNA 상호작용을 통해 이루어지는 한편, RNA-DNA 상호작용은 주로 Cas 단백질을 가이드하기 때문에, 뉴클레아제 플랫폼은 설계의 어려움, 표적화 밀도 및 작용 방식이 달라진다. Cas9 절단은 또한 상이한 CRISPR 시스템 간에 상이한, 인접 모티프, PAM을 필요로 한다. 스트렙토코커스 피오게네스로부터의 Cas9는 NRG PAM을 이용하여 절단하고, 나이세리아 메닌지티디스(Neisseria meningitidis)로부터의 CRISPR은 NNNNGATT(SEQ ID NO: 312), NNNNNGTTT(SEQ ID NO: 313) 및 NNNNGCTT(SEQ ID NO: 314)를 포함하는 PAM를 가진 부위에서 절단할 수 있다. 수많은 다른 Cas9 오솔로그는 대안적인 PAM에 인접한 프로토스페이서를 표적화한다.Gene editing can be done using site-directed polypeptides engineered to target specific sequences. To date, there are four main types of such nucleases: meganucleases and their functional equivalents, zinc finger nucleases (ZFNs), transcriptional activator-like effector nucleases (TALENs) and CRISPR/CAS nucleases. my system. In particular, since the specificity of ZFNs and TALENs is achieved through protein-DNA interactions, while RNA-DNA interactions mainly guide Cas proteins, nuclease platforms differ in design difficulty, targeting density and mode of action. Cas9 cleavage also requires a contiguous motif, PAM, that differs between different CRISPR systems. Cas9 from Streptococcus pyogenes is cleaved using NRG PAM, and CRISPR from Neisseria meningitidis is NNNNGATT (SEQ ID NO: 312), NNNNNGTTT (SEQ ID NO: 313) and NNNNGCTT ( It can be cleaved at a site with a PAM comprising SEQ ID NO: 314). Numerous other Cas9 orthologs target protospacers adjacent to alternative PAMs.

본 개시내용의 방법의 실시형태에서, CRISPR 엔도뉴클레아제, 예컨대 Cas9가 사용될 수 있다. 나아가, 본원에 기술된 교시, 예컨대 치료적 표적 부위는 다른 형태의 엔도뉴클레아제, 예컨대 ZFN, TALEN, HE, 또는 MegaTAL에, 또는 뉴클레아제의 조합을 이용하여 적용될 수 있다. 그러나, 상기 엔도뉴클레아제에 본 개시내용의 교시를 적용하기 위해, 다른 것들 중에서, 특정 표적 부위에 대해 유도된 단백질을 엔지니어링하는 것이 필요할 것이다.In embodiments of the methods of the present disclosure, a CRISPR endonuclease such as Cas9 may be used. Furthermore, the teachings described herein, such as therapeutic target sites, can be applied to other types of endonucleases, such as ZFN, TALEN, HE, or MegaTAL, or using combinations of nucleases. However, to apply the teachings of the present disclosure to such endonucleases, it will be necessary, among other things, to engineer proteins directed against specific target sites.

추가의 결합 도메인은 특이성을 증가시키기 위해 Cas9 단백질에 융합될 수 있다. 이들 구축물의 표적 부위는 확인된 gRNA 특이적 부위에 대하여 맵핑되지만, 예컨대 아연 핑거 도메인에 있어서, 추가의 결합 모티프가 필요하다. Mega-TAL의 경우에서, 메가뉴클레아제는 TALE DNA-결합 도메인에 융합될 수 있다. 메가뉴클레아제 도메인은 특이성을 증가시킬 수 있고 절단을 제공할 수 있다. 유사하게, 불활성화된 또는 데드(dead) Cas9(dCas9)는 절단 도메인에 융합될 수 있고 융합된 DNA-결합 도메인에 대한 sgRNA/Cas9 표적 부위 및 인접 결합 부위를 필요로 할 수 있다. 이것은 아마도 촉매적 불활성화에 더하여, 추가의 결합 부위 없이 결합을 감소시키기 위해, dCas9의 일부 단백질 엔지니어링을 필요로 할 것이다.Additional binding domains may be fused to the Cas9 protein to increase specificity. The target sites of these constructs map to the identified gRNA specific sites, but additional binding motifs are required, such as for zinc finger domains. In the case of Mega-TAL, the meganuclease can be fused to the TALE DNA-binding domain. A meganuclease domain can increase specificity and provide cleavage. Similarly, inactivated or dead Cas9 (dCas9) may be fused to a cleavage domain and may require an sgRNA/Cas9 target site and a contiguous binding site for the fused DNA-binding domain. This would probably require some protein engineering of dCas9, in addition to catalytic inactivation, to reduce binding without additional binding sites.

일부 실시형태에서, 본 개시내용에 따른 게놈 편집(예를 들어, 알부민 유전자좌 내로의 FVIII 코딩 서열의 삽입) 조성물 및 방법은 하기의 접근법 중 어느 하나를 사용한다.In some embodiments, genome editing (eg, insertion of a FVIII coding sequence into an albumin locus) compositions and methods according to the present disclosure use any one of the following approaches.

아연 핑거 뉴클레아제zinc finger nuclease

아연 핑거 뉴클레아제(ZFN)는 II형 엔도뉴클레아제 FokI의 촉매적 도메인에 연결된 엔지니어링된 아연 핑거 DNA 결합 도메인을 가진 모듈형 단백질이다. FokI은 이량체로서만 기능하기 때문에, 한 쌍의 ZFN은 반대 DNA 가닥 상의 동족 표적 "절반-부위" 서열에 결합하고, 촉매적으로 활성인 FokI 이량체가 형성될 수 있도록 그들 사이에 정확한 간격을 갖도록 엔지니어링되어야 한다. 그 자체가 서열 특이성을 갖지 않는 FokI 도메인의 이량체화 시, DNA 이중-가닥 파단은 게놈 편집에서 개시 단계로서 ZFN 절반-부위 사이에 생성된다.Zinc finger nucleases (ZFNs) are modular proteins with an engineered zinc finger DNA binding domain linked to the catalytic domain of the type II endonuclease FokI. Because FokI functions only as a dimer, a pair of ZFNs must bind to a cognate target "half-site" sequence on opposite DNA strands and have the correct spacing between them so that a catalytically active FokI dimer can be formed. must be engineered. Upon dimerization of the FokI domain, which itself does not have sequence specificity, a DNA double-strand break is generated between the ZFN half-sites as an initiating step in genome editing.

각각의 ZFN의 DNA 결합 도메인은 일반적으로 풍부한 Cys2-His2 구조의 3 내지 6개의 아연 핑거를 가지고, 각각의 핑거는 주로 표적 DNA 서열의 하나의 가닥 상에서 3중의 뉴클레오티드를 인식하지만, 제4 뉴클레오티드와의 교차-가닥 상호작용이 또한 중요할 수 있다. DNA와 중요하게 접촉하는 위치에서 핑거의 아미노산의 변경은 주어진 핑거의 서열 특이성을 변경시킨다. 따라서, 4-핑거 아연 핑거 단백질은 12bp의 표적 서열을 선택적으로 인식할 것이고, 여기서 표적 서열은 각각의 핑거에 의해 기여된 3중의 선호의 복합물이지만, 3중의 선호는 이웃하는 핑거에 의해 다양한 정도로 영향을 받을 수 있다. ZFN의 중요한 양태는 그들이 개별 핑거를 단순히 변형시킴으로써 거의 임의의 게놈 주소로 용이하게 재-표적화될 수 있다는 것이지만, 이를 잘 수행하기 위하여는 상당한 전문지식이 필요하다. ZFN의 대부분의 적용에서, 4 내지 6개의 핑거의 단백질이 사용되어, 각각 12 내지 18 bp를 인식한다. 따라서, 한 쌍의 ZFN는 일반적으로 절반-부위 사이에 5 내지 7 bp의 스페이서를 포함하지 않는, 24 내지 36 bp의 조합된 표적 서열을 인식할 것이다. 결합 부위는 15 내지 17 bp를 포함하여 더 큰 스페이서로 추가로 분리될 수 있다. 반복부 서열 또는 유전자 상동체가 설계 과정 동안 배제되는 것을 가정하여, 이러한 길이의 표적 서열은 인간 게놈에서 독특할 것이다. 그럼에도 불구하고, ZFN 단백질-DNA 상호작용은 그들의 특이성이 절대적이지 않아서, 오프-표적 결합 및 절단 사건이 2개의 ZFN 사이의 이종이량체로서 또는 ZFN 중 하나 또는 다른 것의 동종이량체로서 일어난다. 후자 가능성은 FokI 도메인의 이량체화 계면을 엔지니어링하여 절대적(obligate) 이종이량체 변이체(이것은 자체적으로는 이량체화될 수 없고 단지 서로와 이량체화할 수 있음)로서도 공지된 "플러스" 및 "마이너스" 변이체를 생성함으로써 효과적으로 제거되었다. 절대적 이종이량체를 강요하는 것은 동종이량체의 형성을 예방한다. 이것은 ZFN, 뿐만 아니라 이들 FokI 변이체를 채택하는 임의의 다른 뉴클레아제의 크게 향상된 특이성을 갖는다.The DNA binding domain of each ZFN usually has 3 to 6 zinc fingers of the abundant Cys2-His2 structure, each finger recognizing a triple nucleotide mainly on one strand of the target DNA sequence, but with a fourth nucleotide Cross-strand interactions may also be important. Altering the amino acid of a finger at a position of critical contact with DNA alters the sequence specificity of a given finger. Thus, a four-finger zinc finger protein will selectively recognize a target sequence of 12 bp, where the target sequence is a complex of triple preferences contributed by each finger, but the triple preference is affected to varying degrees by neighboring fingers. can receive An important aspect of ZFNs is that they can be readily re-targeted to virtually any genomic address by simply modifying individual fingers, but it requires considerable expertise to do so well. In most applications of ZFNs, proteins from 4 to 6 fingers are used, each recognizing 12 to 18 bp. Thus, a pair of ZFNs will generally recognize a combined target sequence of 24-36 bp, which does not include a spacer of 5-7 bp between the half-sites. The binding site may be further separated by larger spacers, including 15 to 17 bp. A target sequence of this length will be unique in the human genome, assuming that repeat sequences or genetic homologues are excluded during the design process. Nevertheless, ZFN protein-DNA interactions are not absolute in their specificity, so that off-target binding and cleavage events occur either as a heterodimer between two ZFNs or as a homodimer of one or the other of the ZFNs. The latter possibility is to engineer the dimerization interface of the FokI domain to allow "plus" and "minus" variants, also known as obligate heterodimer variants (which cannot dimerize by themselves and only dimer with each other). was effectively removed by creating Enforcing absolute heterodimers prevents the formation of homodimers. It has greatly improved specificity of ZFNs, as well as any other nucleases that adopt these FokI variants.

다양한 ZFN-기반 시스템은 해당 분야에 기술되어 있고, 그의 변형은 정식으로 보고되어 있으며, 다수의 참고문헌은 ZFN의 설계를 가이드하는 데 사용되는 규칙 및 파라미터를 기술하며; 예를 들어, 문헌[Segal et al., Proc Natl Acad Sci USA (1999) 96(6):2758-63]; 문헌[B. Dreier et al., J Mol Biol. (2000) 303(4):489-502]; 문헌[Q. Liu et al., J Biol Chem. (2002) 277(6):3850-6]; 문헌[Dreier et al., J Biol Chem (2005) 280(42):35588-97]; 및 문헌[Dreier et al., J Biol Chem. (2001) 276(31):29466-78]을 참조한다.Various ZFN-based systems have been described in the art, variations thereof have been duly reported, and numerous references describe the rules and parameters used to guide the design of ZFNs; See, for example, Segal et al . , Proc Natl Acad Sci USA (1999) 96 (6):2758-63]; Literature [B. Dreier et al . , J Mol Biol. (2000) 303 (4):489-502]; Literature [Q. Liu et al . , J Biol Chem. (2002) 277 (6):3850-6]; See Dreier et al . , J Biol Chem (2005) 280 (42):35588-97]; and Dreier et al . , J Biol Chem. (2001) 276 (31):29466-78].

전사 활성자-유사 이펙터 뉴클레아제(TALEN)Transcriptional activator-like effector nucleases (TALENs)

TALEN은 모듈형 뉴클레아제의 또 다른 포맷을 나타내며, 그에 의해 ZFN에서와 같이, 엔지니어링된 DNA 결합 도메인이 FokI 뉴클레아제 도메인에 연결되고, 한쌍의 TALEN이 탠덤으로 작동하여 표적화된 DNA 절단을 달성한다. ZFN과의 주요 차이점은 DNA 결합 도메인의 성질 및 관련된 표적 DNA 서열 인식 특성이다. TALEN DNA 결합 도메인은 TALE 단백질로부터 유래하는데, 이것은 원래 식물 박테리아 병원균 잔토모나스 종(Xanthomonas sp)에서 기술되었다. TALE는 33 내지 35개의 아미노산 반복부의 탠덤 어레이를 가지며, 각각의 반복부는 일반적으로 최대 20 bp 길이인 표적 DNA 서열에서 단일 염기쌍을 인식하여, 최대 40 bp의 총 표적 서열 길이를 제공한다. 각각의 반복부의 뉴클레오티드 특이성은 반복 가변 이중잔기(repeat variable di-residue: RVD)에 의해 결정되는데, 이것은 위치 12 및 13에서 단지 2개의 아미노산을 포함한다. 염기 구아닌, 아데닌, 시토신 및 티민은 대개 4개의 RVD: 각각 Asn-Asn, Asn-Ile, His-Asp 및 Asn-Gly에 의해 인식된다. 이것은 아연 핑거에 대하여가 아니라 훨씬 더 단순한 인식 코드를 구성하고, 따라서 뉴클레아제 설계에 있어 후자보다 이점을 나타낸다. 그럼에도 불구하고, ZFN에서와 같이, TALEN의 단백질-DNA 상호작용은 그들의 특이성이 절대적이지 않고, TALEN은 또한 FokI 도메인의 절대적 이종이량체 변이체의 사용으로부터 이익을 얻어 오프-표적 활성을 감소시킨다.TALENs represent another format of modular nucleases whereby, as in ZFNs, an engineered DNA binding domain is linked to a FokI nuclease domain and a pair of TALENs work in tandem to achieve targeted DNA cleavage. do. The main difference from ZFNs is the nature of the DNA binding domain and the associated target DNA sequence recognition properties. The TALEN DNA binding domain is derived from the TALE protein, which was originally described in the plant bacterial pathogen Xanthomonas sp . TALEs have a tandem array of 33 to 35 amino acid repeats, each repeat recognizing a single base pair in a target DNA sequence that is typically up to 20 bp in length, providing a total target sequence length of up to 40 bp. The nucleotide specificity of each repeat is determined by a repeat variable di-residue (RVD), which contains only two amino acids at positions 12 and 13. The bases guanine, adenine, cytosine and thymine are usually recognized by four RVDs: Asn-Asn, Asn-Ile, His-Asp and Asn-Gly, respectively. This constitutes a much simpler recognition code, but not for zinc fingers, and thus represents an advantage over the latter in nuclease design. Nevertheless, as with ZFNs, the protein-DNA interactions of TALENs are not absolute in their specificity, and TALENs also benefit from the use of absolute heterodimeric variants of the FokI domain to reduce off-target activity.

촉매적 기능이 불활성화된 FokI 도메인의 추가의 변이체가 생성된 바 있다. TALEN 또는 ZFN 쌍 중 어느 하나의 하나의 절반부가 불활성 FokI 도메인을 함유하는 경우, 단지 단일-가닥 DNA 절단(닉킹)이 DSB보다는 표적 부위에서 일어날 것이다. 그 결과는 Cas9 절단 도메인 중 하나가 불활성화된 CRISPR/Cas9/Cpf1 "닉카아제" 돌연변이체의 사용과 유사하다. DNA 닉을 사용하여 DSB에서보다 더 낮은 효율로 HDR에 의해 게놈 편집을 유도할 수 있다. 주요 이점은 오프-표적 닉이 NHEJ-매개 수선-오류가 일어나기 쉬운 DSB와 달리 신속하고 정확하게 수선된다는 것이다.Additional variants of the FokI domain with inactivated catalytic functions have been generated. If one half of either a TALEN or ZFN pair contains an inactive FokI domain, only single-stranded DNA cleavage (nicking) will occur at the target site rather than at the DSB. The results are similar to the use of a CRISPR/Cas9/Cpf1 "nickase" mutant in which one of the Cas9 cleavage domains is inactivated. DNA nicks can be used to induce genome editing by HDR with lower efficiencies than in DSB. The main advantage is that off-target nicks are repaired quickly and accurately, unlike NHEJ-mediated repair-error-prone DSBs.

다양한 TALEN-기반 시스템은 해당 분야에 기술되어 있고, 그의 변형은 정식으로 보고되어 있으며; 예를 들어, 문헌[Boch, Science (2009) 326(5959):1509-12]; 문헌[Mak et al., Science (2012) 335(6069):716-9]; 및 문헌[Moscou et al., Science (2009) 326(5959):1501]을 참조한다. "골든 게이트(Golden Gate)" 플랫폼 또는 클로닝 계획에 기초한 TALEN의 사용이 다수의 그룹에 의해 기술되어 있으며; 예를 들어, 문헌[T. Cermak et al., Nucleic Acids Res. (2011) 39(12):e82]; 문헌[Li et al., Nucleic Acids Res. (2011) 39(14):6315-25]; 문헌[Weber et al., PLoS One (2011) 6(2):e16765]; 문헌[Wang et al., J Genet Genomics (2014) 41(6):339-47, Epub 2014 Can 17]; 및 문헌[T. Cermak et al., Methods Mol Biol. (2015) 1239:133-59]을 참조한다.Various TALEN-based systems have been described in the art, and variations thereof have been duly reported; See, eg, Boch, Science (2009) 326 (5959):1509-12]; Mak et al., Science (2012) 335 (6069):716-9]; and Moscou et al., Science (2009) 326 (5959):1501]. The use of TALENs based on the “Golden Gate” platform or cloning scheme has been described by a number of groups; For example, in T. Cermak et al . , Nucleic Acids Res. (2011) 39 (12):e82]; Li et al., Nucleic Acids Res. (2011) 39 (14):6315-25]; Weber et al., PLoS One (2011) 6 (2):e16765]; See Wang et al . , J Genet Genomics (2014) 41 (6):339-47, Epub 2014 Can 17]; and [T. Cermak et al . , Methods Mol Biol. (2015) 1239 :133-59].

호밍 엔도뉴클레아제Homing Endonuclease

호밍 엔도뉴클레아제(HE)는 긴 인식 서열(14 내지 44개의 염기쌍)을 갖고, 높은 특이성으로 DNA를 절단하는(흔히 게놈에서 독특한 부위에서) 부위-특이적 엔도뉴클레아제이다. 진핵생물, 원생생물, 박테리아, 고세균, 시아노박테리아 및 파지를 비롯한, 광범위한 숙주로부터 유래된 LAGLIDADG(SEQ ID NO: 6), GIY-YIG, His-Cis 박스, H-N-H, PD-(D/E)xK, 및 Vsr-유사를 비롯하여, 그들의 구조에 의해 분류되는 바와 같은 HE의 적어도 6개의 공지된 과가 존재한다. ZFN 및 TALEN에서와 같이 HE를 사용하여 게놈 편집에서 초기 단계로서 표적 유전자좌에서 DSB를 생성할 수 있다. 또한, 일부 천연 HE 및 엔지니어링된 HE는 DNA의 단일 가닥 만을 절단하고, 그에 의해 부위-특이적 닉카아제로서 기능한다. HE의 큰 표적 서열 및 그들이 제공하는 특이성은 그들을 부위-특이적 DSB를 생성하기 위한 매력적인 후보로 만들었다.Homing endonucleases (HEs) are site-specific endonucleases that have long recognition sequences (14 to 44 base pairs) and cleave DNA with high specificity (often at unique sites in the genome). LAGLIDADG (SEQ ID NO: 6), GIY-YIG, His-Cis box, HNH, PD-(D/E) derived from a wide range of hosts, including eukaryotes, protists, bacteria, archaea, cyanobacteria and phage There are at least six known families of HE as classified by their structure, including xK, and Vsr-like. As with ZFNs and TALENs, HE can be used to generate DSBs at target loci as an early step in genome editing. In addition, some native HE and engineered HE cleave only a single strand of DNA, thereby functioning as a site-specific nickase. The large target sequences of HE and the specificity they provide make them attractive candidates for generating site-specific DSBs.

다양한 HE-기반의 시스템이 해당 분야에 기술되어 있고, 그의 변형은 정기적으로 보고되어 있으며; 예를 들어, 문헌[Steentoft et al., Glycobiology (2014) 24(8):663-80]; 문헌[Belfort and Bonocora, Methods Mol Biol. (2014) 1123:1-26]; 문헌[Hafez and Hausner, Genome (2012) 55(8):553-69]; 및 그것들에 인용된 참고문헌의 검토를 참조한다.Various HE-based systems have been described in the art, and modifications thereof are regularly reported; See, eg, Steentoft et al . , Glycobiology (2014) 24 (8):663-80]; See Belfort and Bonocora, Methods Mol Biol. (2014) 1123 :1-26]; Hafez and Hausner, Genome (2012) 55 (8):553-69]; and a review of the references cited therein.

MegaTAL / Tev-mTALEN / MegaTevMegaTAL / Tev-mTALEN / MegaTev

하이브리드 뉴클레아제의 추가의 예로서, MegaTAL 플랫폼 및 Tev-mTALEN 플랫폼은 TALE DNA 결합 도메인 및 촉매적으로 활성인 HE의 융합을 사용하여, 조정 가능한 DNA 결합 및 TALE의 특이성 둘 모두, 뿐만 아니라 HE의 절단 서열 특이성을 이용하며; 예를 들어, 문헌[Boissel et al., Nuc. Acids Res. (2014) 42: 2591-601]; [Kleinstiver et al., G3 (2014) 4:1155-65]; 및 문헌[Boissel and Scharenberg, Methods Mol. Biol. (2015) 1239:171-96]을 참조한다.As further examples of hybrid nucleases, the MegaTAL platform and the Tev-mTALEN platform use a fusion of a TALE DNA binding domain and a catalytically active HE, allowing both tunable DNA binding and specificity of TALE, as well as that of HE. using cleavage sequence specificity; See, eg, Boissel et al., Nuc. Acids Res. (2014) 42 :2591-601]; [Kleinstiver et al., G3 (2014) 4 :1155-65]; and Boissel and Scharenberg, Methods Mol. Biol. (2015) 1239 :171-96].

추가의 변이에서, MegaTev 구조는 메가뉴클레아제(Mega)와 GIY-YIG 호밍 엔도뉴클레아제 I-TevI(Tev)로부터 유래된 뉴클레아제 도메인의 융합이다. 2개의 활성 부위는 DNA 기질 상에서 약 30 bp 이격되어 위치하며, 비-상용성 응집 말단을 갖는 2개의 DSB를 생성하며; 예를 들어, 문헌[Wolfs et al., Nuc. Acids Res. (2014) 42:8816-29]을 참조한다. 존재하는 뉴클레아제-기반 접근법의 다른 조합이 발전될 것이고, 본원에 기술된 표적화된 게놈 변형을 달성하는 데 유용할 것이라는 것이 예상된다.In a further variation, the MegaTev structure is a fusion of a nuclease domain derived from a meganuclease (Mega) and the GIY-YIG homing endonuclease I-TevI (Tev). The two active sites are located about 30 bp apart on the DNA substrate, resulting in two DSBs with non-compatible aggregation ends; See, eg, Wolfs et al., Nuc. Acids Res. (2014) 42: 8816-29]. It is anticipated that other combinations of existing nuclease-based approaches will be developed and will be useful in achieving the targeted genomic modifications described herein.

dCas9-FokI 또는 dCpf1-Fok1 및 다른 뉴클레아제dCas9-FokI or dCpf1-Fok1 and other nucleases

상기 기술된 뉴클레아제 플랫폼의 구조적 및 기능적 특성의 조합은 내재하는 결핍 중 일부를 잠재적으로 극복할 수 있는 게놈 편집에 대한 추가 접근법을 제공한다. 예로서, CRISPR 게놈 편집 시스템은 일반적으로 단일 Cas9 엔도뉴클레아제를 사용하여 DSB를 생성한다. 표적화의 특이성은 표적 DNA와의 왓슨-크릭 염기-쌍형성(또한 스트렙토코커스 피오게네스로부터의 Cas9의 경우에 인접 NAG 또는 NGG PAM 서열에서 추가 2개의 염기)을 겪은 가이드 RNA에서 20 또는 22개의 뉴클레오티드 서열에 의해 유도된다. 이러한 서열은 인간 게놈에서 독특하기에 충분히 길지만, RNA/DNA 상호작용의 특이성은 절대적이지 않고, 특히 표적 서열의 5' 절반부에서 상당한 난잡성이 때때로 용인되어, 특이성을 유도하는 염기의 수를 효과적으로 감소시킨다. 이에 대한 하나의 해결책은 Cas9 또는 Cpf1 촉매적 기능을 완전히 불활성화시켰고 - RNA-가이드된 DNA 결합 기능 만을 보유함 - 대신에 불활성화된 Cas9에 FokI 도메인을 융합시키며; 예를 들어, 문헌[Tsai et al., Nature Biotech (2014) 32:569-76]; 및 문헌[Guilinger et al., Nature Biotech. (2014) 32:577-82]을 참조한다. FokI은 촉매적으로 활성이 되기 위하여 이량체화되어야 하기 때문에, 근접하게 2개의 FokI 융합부를 테더링하여 이량체를 형성하고, DNA를 절단하기 위하여 2가지의 가이드 RNA가 필요하다. 이는 조합된 표적 부위에서 염기의 수를 본질적으로 배가시키고, 그에 의해 CRISPR-기반 시스템에 의한 표적화의 엄격성을 증가시킨다.The combination of structural and functional properties of the nuclease platforms described above provides additional approaches to genome editing that can potentially overcome some of the inherent deficiencies. As an example, CRISPR genome editing systems typically use a single Cas9 endonuclease to generate DSBs. The specificity of targeting is a 20 or 22 nucleotide sequence in the guide RNA that has undergone Watson-Crick base-pairing with the target DNA (also two additional bases in the adjacent NAG or NGG PAM sequence in the case of Cas9 from Streptococcus pyogenes). is induced by Although these sequences are long enough to be unique in the human genome, the specificity of the RNA/DNA interaction is not absolute, and significant promiscuity is sometimes tolerated, particularly in the 5' half of the target sequence, effectively reducing the number of bases that drive specificity. Reduce. One solution to this is to completely inactivate the Cas9 or Cpf1 catalytic function - retaining only RNA-guided DNA binding function - instead fusing the FokI domain to the inactivated Cas9; See, eg, Tsai et al., Nature Biotech (2014) 32 :569-76; and Guilinger et al., Nature Biotech. (2014) 32 :577-82]. Since FokI must dimerize to become catalytically active, two guide RNAs are required to tether two FokI fusions in close proximity to form a dimer and cleave DNA. This essentially doubles the number of bases at the combined target site, thereby increasing the stringency of targeting by CRISPR-based systems.

추가의 예로서, 촉매적으로 활성인 HE, 예컨대 I-TevI로의 TALE DNA 결합 도메인의 융합은 조정 가능한 DNA 결합 및 TALE의 특이성 둘 모두, 뿐만 아니라 I-TevI의 절단 서열 특이성을 이용하고, 오프-표적 절단이 추가로 감소될 수 있다고 예상된다.As a further example, fusion of a TALE DNA binding domain to a catalytically active HE, such as I-TevI, takes advantage of both the tunable DNA binding and specificity of TALE, as well as the cleavage sequence specificity of I-TevI, and uses off- It is expected that target cleavage may be further reduced.

본 개시내용의 하나 이상의 실시형태의 상세내용은 하기 첨부된 설명에 제시되어 있다. 본 개시의 다른 특징, 목적 및 이점이 발명의 설명에 의해 명백해질 것이다. 설명에서, 단수 형태는 또한, 문맥에서 명확히 달리 기술하지 않는 한, 복수를 포함한다. 달리 정의되지 않는 한, 본원에 사용되는 기술 및 과학 용어는 본 개시가 속하는 분야의 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 상충하는 경우에, 본 설명이 좌우할 것이다.The details of one or more embodiments of the present disclosure are set forth in the accompanying description below. Other features, objects and advantages of the present disclosure will become apparent from the description of the invention. In the description, the singular forms also include the plural unless the context clearly dictates otherwise. Unless defined otherwise, technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this disclosure belongs. In case of conflict, the present description will control.

본원에 기술된 실시예 및 실시형태가 예시적인 목적을 위한 것일 뿐이며, 그의 견지에서 변형 또는 변경이 당업자에게 제안될 것이며, 본 출원의 목적 및 범위 및 첨부된 첨구범위의 범주 내에 포함될 것이 이해된다. 본원에 언급된 모든 간행물, 특허, 및 본원에 인용된 특허 출원은 그들 전문이 모든 목적을 위해 참조로 포함된다.It is understood that the examples and embodiments described herein are for illustrative purposes only, and that modifications or variations in light thereof will be suggested to those skilled in the art, and will be included within the object and scope of the present application and the scope of the appended appendices. All publications, patents, and patent applications cited herein are incorporated by reference in their entirety for all purposes.

본원에 제공되는 개시내용의 일부 실시형태는 하기의 비-제한적인 실시예에 의해 추가로 예시된다.Some embodiments of the disclosure provided herein are further illustrated by the following non-limiting examples.

예시적인 실시형태Exemplary embodiment

실시형태 1. 데옥시리보핵산(DNA) 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 숙주 세포 유전자좌에 상보적인 스페이서 서열을 포함하는 가이드 RNA(gRNA) 또는 gRNA를 인코딩하는 핵산; 및 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형으로서, 상기 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, 상기 B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 공여자 주형을 포함하는 시스템.Embodiment 1. A deoxyribonucleic acid (DNA) endonuclease or a nucleic acid encoding a DNA endonuclease; a guide RNA (gRNA) comprising a spacer sequence complementary to a host cell locus or a nucleic acid encoding the gRNA; and a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein comprises B domain substitutions, wherein the B domain substitutions have 0 to 9 N-linked glycosylation sites and 3 to about 40 A system comprising a donor template comprising amino acids in length.

실시형태 2. 실시형태 1에 있어서, B 도메인 치환물이 0 내지 6개의 N-연결된 글리코실화 부위를 포함하는 시스템.Embodiment 2. The system of embodiment 1, wherein the B domain substitution comprises 0-6 N-linked glycosylation sites.

실시형태 3. 실시형태 2에 있어서, B 도메인 치환물이 0 내지 3개의 N-연결된 글리코실화 부위를 포함하는 시스템.Embodiment 3. The system of embodiment 2, wherein the B domain substitution comprises 0-3 N-linked glycosylation sites.

실시형태 4. 실시형태 1에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 369, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 시스템.Embodiment 4. The system of embodiment 1, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362 to 369, 371 and 373.

실시형태 5. 실시형태 4에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나의 아미노산 서열 또는 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나에 대하여 적어도 80% 동일성을 갖는 그의 변이체를 포함하는 시스템.Embodiment 5. The method according to embodiment 4, wherein the B domain substitution is at least for the amino acid sequence of any one of SEQ ID NOs: 362 to 366, 371 and 373 or any one of SEQ ID NOs: 362 to 366, 371 and 373 A system comprising a variant thereof with 80% identity.

실시형태 6. 실시형태 5에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 시스템.Embodiment 6. The system of embodiment 5, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362 to 364, 371 and 373.

실시형태 7. 실시형태 1 내지 6 중 어느 한 실시형태에 있어서, 숙주 세포 유전자좌가 간에서 발현되는 유전자의 유전자좌인 시스템.Embodiment 7. The system according to any one of embodiments 1 to 6, wherein the host cell locus is a locus of a gene expressed in the liver.

실시형태 8. 실시형태 1 내지 7 중 어느 한 실시형태에 있어서, 숙주 세포 유전자좌가 급성기 단백질을 인코딩하는 유전자의 유전자좌인 시스템.Embodiment 8 The system according to any one of embodiments 1 to 7, wherein the host cell locus is the locus of a gene encoding an acute phase protein.

실시형태 9. 실시형태 8에 있어서, 급성기 단백질이 알부민, 트랜스페린 또는 피브리노겐인 시스템.Embodiment 9 The system according to embodiment 8, wherein the acute phase protein is albumin, transferrin or fibrinogen.

실시형태 10. 실시형태 1 내지 7 중 어느 한 실시형태에 있어서, 숙주 세포 유전자좌가 세이프 하버 유전자좌인 시스템.Embodiment 10 The system of any one of embodiments 1-7, wherein the host cell locus is a Safe Harbor locus.

실시형태 11. DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12로도 알려짐), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 또는 Cpf1 엔도뉴클레아제, 및 그의 기능적 유도체로 이루어진 군으로부터 선택되는, 실시형태 1 내지 10 중 어느 한 실시형태의 시스템.Embodiment 11. DNA endonuclease is Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1 , Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx3, Csx10, Csf1, Csx15, Csx1 The system of any one of embodiments 1 to 10, wherein the system is selected from the group consisting of , Csf2, Csf3, Csf4, or Cpf1 endonuclease, and functional derivatives thereof.

실시형태 12. 실시형태 11에 있어서, DNA 엔도뉴클레아제가 Cas9인 시스템.Embodiment 12 The system of embodiment 11, wherein the DNA endonuclease is Cas9.

실시형태 13. DNA 엔도뉴클레아제를 인코딩하는 핵산은 숙주 세포 내의 발현을 위해 코돈-최적화되는, 실시형태 1 내지 11 중 어느 한 실시형태의 시스템.Embodiment 13 The system of any one of embodiments 1 to 11, wherein the nucleic acid encoding the DNA endonuclease is codon-optimized for expression in a host cell.

실시형태 14. 실시형태 1 내지 13 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산이 데옥시리보핵산(DNA)인 시스템.Embodiment 14 The system of any one of embodiments 1-13, wherein the nucleic acid encoding the DNA endonuclease is deoxyribonucleic acid (DNA).

실시형태 15. 실시형태 1 내지 13 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 시스템.Embodiment 15 The system of any one of embodiments 1-13, wherein the nucleic acid encoding the DNA endonuclease is ribonucleic acid (RNA).

실시형태 16. 실시형태 15에 있어서, DNA 엔도뉴클레아제를 인코딩하는 RNA가 mRNA인 시스템.Embodiment 16 The system according to embodiment 15, wherein the RNA encoding the DNA endonuclease is mRNA.

실시형태 17. 실시형태 1 내지 16 중 어느 한 실시형태에 있어서, 공여자 주형 핵산 서열이 숙주 세포에서의 발현을 위해 코돈 최적화된 시스템.Embodiment 17 The system of any one of embodiments 1 to 16, wherein the donor template nucleic acid sequence is codon optimized for expression in a host cell.

실시형태 18. 실시형태 1 내지 17 중 어느 한 실시형태에 있어서, 공여자 주형 핵산 서열이 FVIII 단백질을 인코딩하는 야생형 핵산 서열에 비하여 감소된 함량의 CpG 디-뉴클레오티드를 포함하는 시스템.Embodiment 18 The system of any one of embodiments 1-17, wherein the donor template nucleic acid sequence comprises a reduced content of CpG di-nucleotides compared to a wild-type nucleic acid sequence encoding the FVIII protein.

실시형태 19. 실시형태 18에 있어서, 공여자 주형 핵산 서열이 CpG 디-뉴클레오티드를 포함하지 않는 시스템.Embodiment 19 The system of embodiment 18, wherein the donor template nucleic acid sequence does not comprise a CpG di-nucleotide.

실시형태 20. 실시형태 1 내지 19 중 어느 한 실시형태에 있어서, 공여자 주형은 AAV 벡터에 인코딩되는 시스템.Embodiment 20 The system of any one of embodiments 1-19, wherein the donor template is encoded in an AAV vector.

실시형태 21. 실시형태 1 내지 20 중 어느 한 실시형태에 있어서, 공여자 주형이 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트가 한 측 또는 양 측에서 gRNA 표적 부위에 측접한 시스템.Embodiment 21 The donor template according to any one of embodiments 1 to 20, wherein the donor template comprises a donor cassette comprising a nucleic acid sequence encoding a synthetic FVIII protein, and wherein the donor cassette is located on one or both sides at the gRNA target site. flanking system.

실시형태 22. 실시형태 21에 있어서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 측접한 시스템.Embodiment 22 The system of embodiment 21, wherein the donor cassette is flanked on both sides by the gRNA target site.

실시형태 23. 실시형태 21에 있어서, 공여자 카세트가 그의 5’ 측에서 gRNA 표적 부위에 측접한 시스템.Embodiment 23 The system of embodiment 21, wherein the donor cassette flanks the gRNA target site on its 5' side.

실시형태 24. 실시형태 21 내지 23 중 어느 한 실시형태에 있어서, gRNA 표적 부위는 시스템 내의 gRNA에 대한 표적 부위인 시스템.Embodiment 24 The system of any one of embodiments 21-23, wherein the gRNA target site is a target site for a gRNA in the system.

실시형태 25. 실시형태 24에 있어서, 공여자 주형의 gRNA 표적 부위가 시스템 내의 gRNA에 대한 게놈 gRNA 표적 부위의 역 상보물인 시스템.Embodiment 25 The system of embodiment 24, wherein the gRNA target site of the donor template is the reverse complement of the genomic gRNA target site to the gRNA in the system.

실시형태 26. 실시형태 1 내지 25 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자에 함유되는 시스템.Embodiment 26 The system according to any one of embodiments 1 to 25, wherein the DNA endonuclease or nucleic acid encoding the DNA endonuclease is contained in the liposome or lipid nanoparticle.

실시형태 27. 실시형태 26에 있어서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함하는 시스템.Embodiment 27 The system of embodiment 26, wherein the liposome or lipid nanoparticle also comprises a gRNA.

실시형태 28. 실시형태 1 내지 27 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제가 gRNA와 복합체화됨으로써 리보핵단백질(RNP) 복합체를 제공하는 시스템.Embodiment 28 The system of any one of embodiments 1-27, wherein the DNA endonuclease is complexed with the gRNA to provide a ribonucleoprotein (RNP) complex.

실시형태 29. (a) 숙주 세포 유전자좌에 상보적인 스페이서 서열을 포함하는 gRNA 또는 gRNA를 인코딩하는 핵산; (b) DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형으로서, 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 공여자 주형을 세포에 제공하는 단계를 포함하는 숙주 세포에서의 게놈의 편집 방법.Embodiment 29. (a) a gRNA comprising a spacer sequence complementary to a host cell locus or a nucleic acid encoding the gRNA; (b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and (c) a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein comprises B domain substitutions, wherein the B domain substitutions have 0 to 9 N-linked glycosylation sites and 3 to about A method for editing a genome in a host cell comprising providing to the cell a donor template comprising 40 amino acids in length.

실시형태 30. 실시형태 29에 있어서, B 도메인 치환물이 0 내지 6개의 N-연결된 글리코실화 부위를 포함하는 방법.Embodiment 30 The method of embodiment 29, wherein the B domain substitution comprises 0-6 N-linked glycosylation sites.

실시형태 31. 실시형태 30에 있어서, B 도메인 치환물이 0 내지 3개의 N-연결된 글리코실화 부위를 포함하는 방법.Embodiment 31 The method of embodiment 30, wherein the B domain substitution comprises 0-3 N-linked glycosylation sites.

실시형태 32. 실시형태 29에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 369, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 방법.Embodiment 32 The method of embodiment 29, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362-369, 371 and 373.

실시형태 33. 실시형태 32에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나의 아미노산 서열 또는 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나에 대하여 적어도 80% 동일성을 갖는 그의 변이체를 포함하는 방법.Embodiment 33. The method according to embodiment 32, wherein the B domain substitution is at least for the amino acid sequence of any one of SEQ ID NOs: 362 to 366, 371 and 373 or any one of SEQ ID NOs: 362 to 366, 371 and 373 A method comprising a variant thereof having 80% identity.

실시형태 34. 실시형태 33에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 방법.Embodiment 34 The method of embodiment 33, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362 to 364, 371 and 373.

실시형태 35. 실시형태 29 내지 34 중 어느 한 실시형태에 있어서, 숙주 세포 내인성 유전자좌가 간에서 발현되는 유전자의 유전자좌인 방법.Embodiment 35 The method of any one of embodiments 29 to 34, wherein the host cell endogenous locus is a locus of a gene expressed in the liver.

실시형태 36. 실시형태 29 내지 35 중 어느 한 실시형태에 있어서, 숙주 세포 내인성 유전자좌가 급성기 단백질을 인코딩하는 유전자의 유전자좌인 방법.Embodiment 36 The method of any one of embodiments 29 to 35, wherein the host cell endogenous locus is the locus of a gene encoding an acute phase protein.

실시형태 37. 실시형태 36에 있어서, 급성기 단백질이 알부민, 트랜스페린 또는 피브리노겐인 방법.Embodiment 37 The method of embodiment 36, wherein the acute phase protein is albumin, transferrin or fibrinogen.

실시형태 38. 실시형태 29 내지 34 중 어느 한 실시형태에 있어서, 숙주 세포 내인성 유전자좌가 세이프 하버 유전자좌인 방법.Embodiment 38 The method of any one of embodiments 29 to 34, wherein the host cell endogenous locus is a Safe Harbor locus.

실시형태 39. DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12로도 알려짐), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 또는 Cpf1 엔도뉴클레아제, 또는 그의 기능적 유도체로 이루어진 군으로부터 선택되는, 실시형태 29 내지 38 중 어느 한 실시형태의 방법.Embodiment 39. DNA endonuclease is Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1 , Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx3, Csx10, Csf1, Csx15, Csx1 The method of any one of embodiments 29 to 38, wherein the method is selected from the group consisting of , Csf2, Csf3, Csf4, or Cpf1 endonuclease, or a functional derivative thereof.

실시형태 40. 실시형태 39에 있어서, DNA 엔도뉴클레아제가 Cas9인 방법.Embodiment 40 The method of embodiment 39, wherein the DNA endonuclease is Cas9.

실시형태 41. DNA 엔도뉴클레아제를 인코딩하는 핵산은 숙주 세포 내의 발현을 위해 코돈-최적화되는, 실시형태 29 내지 40 중 어느 한 실시형태의 방법.Embodiment 41 The method of any one of embodiments 29-40, wherein the nucleic acid encoding the DNA endonuclease is codon-optimized for expression in a host cell.

실시형태 42. 실시형태 29 내지 41 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산이 데옥시리보핵산(DNA)인 방법.Embodiment 42 The method of any one of embodiments 29-41, wherein the nucleic acid encoding the DNA endonuclease is deoxyribonucleic acid (DNA).

실시형태 43. 실시형태 29 내지 41 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 방법.Embodiment 43 The method of any one of embodiments 29-41, wherein the nucleic acid encoding the DNA endonuclease is ribonucleic acid (RNA).

실시형태 44. 실시형태 43에 있어서, DNA 엔도뉴클레아제를 인코딩하는 RNA는 mRNA인, 방법.Embodiment 44 The method of embodiment 43, wherein the RNA encoding the DNA endonuclease is mRNA.

실시형태 45. 실시형태 29에 있어서, 공여자 주형은 AAV 벡터에 인코딩되는 방법.Embodiment 45 The method of embodiment 29, wherein the donor template is encoded in an AAV vector.

실시형태 46. 실시형태 29 내지 45 중 어느 한 실시형태에 있어서, 공여자 주형 핵산 서열이 숙주 세포에서의 발현을 위해 코돈 최적화된 방법.Embodiment 46 The method of any one of embodiments 29 to 45, wherein the donor template nucleic acid sequence is codon optimized for expression in a host cell.

실시형태 47. 실시형태 29 내지 46 중 어느 한 실시형태에 있어서, 공여자 주형 핵산 서열이 FVIII를 인코딩하는 야생형 핵산 서열에 비하여 감소된 함량의 CpG 디-뉴클레오티드를 포함하는 방법.Embodiment 47 The method of any one of embodiments 29 to 46, wherein the donor template nucleic acid sequence comprises a reduced content of CpG di-nucleotides compared to the wild-type nucleic acid sequence encoding FVIII.

실시형태 48. 실시형태 47에 있어서, 공여자 주형 핵산 서열이 CpG 디-뉴클레오티드를 포함하지 않는 방법.Embodiment 48 The method of embodiment 47, wherein the donor template nucleic acid sequence does not comprise a CpG di-nucleotide.

실시형태 49. 실시형태 29 내지 48 중 어느 한 실시형태에 있어서, 공여자 주형이 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트가 한 측 또는 양 측에서 gRNA 표적 부위에 측접한 방법.Embodiment 49. The method according to any one of embodiments 29 to 48, wherein the donor template comprises a donor cassette comprising a nucleic acid sequence encoding a synthetic FVIII protein, wherein the donor cassette is at the gRNA target site on one or both sides. sideways way.

실시형태 50. 실시형태 49에 있어서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 측접한 방법.Embodiment 50 The method of embodiment 49, wherein the donor cassette is flanked on both sides by the gRNA target site.

실시형태 51. 실시형태 49에 있어서, 공여자 카세트가 그의 5’ 측에서 gRNA 표적 부위에 측접한 방법.Embodiment 51 The method of embodiment 49, wherein the donor cassette flanks the gRNA target site on its 5' side.

실시형태 52. 실시형태 49 내지 51 중 어느 한 실시형태에 있어서, gRNA 표적 부위가 투여되는 gRNA에 대한 표적 부위인 방법.Embodiment 52 The method of any one of embodiments 49-51, wherein the gRNA target site is a target site for the gRNA to be administered.

실시형태 53. 실시형태 52에 있어서, 공여자 주형의 gRNA 표적 부위가 투여되는 gRNA에 대한 세포 게놈 내의 gRNA 표적 부위의 역 상보물인 방법.Embodiment 53 The method of embodiment 52, wherein the gRNA target site of the donor template is the reverse complement of the gRNA target site in the cell genome to the administered gRNA.

실시형태 54. 실시형태 29 내지 53 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자에 제형화되는 방법.Embodiment 54 The method of any one of embodiments 29-53, wherein the DNA endonuclease or nucleic acid encoding the DNA endonuclease is formulated in a liposome or lipid nanoparticle.

실시형태 55. 실시형태 54에 있어서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함하는 방법.Embodiment 55 The method of embodiment 54, wherein the liposome or lipid nanoparticle also comprises a gRNA.

실시형태 56. 실시형태 29 내지 55 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제 및 gRNA가 gRNA와 사전복합체화된 DNA 엔도뉴클레아제를 포함하는 리보핵단백질(RNP) 복합체로서 숙주 세포에 제공되는 방법.Embodiment 56. The method of any one of embodiments 29 to 55, wherein the DNA endonuclease and the gRNA are administered to the host cell as a ribonucleoprotein (RNP) complex comprising the DNA endonuclease pre-complexed with the gRNA. how it is provided.

실시형태 57. 실시형태 29 내지 56 중 어느 한 실시형태에 있어서, gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 공여자 주형을 세포에 제공한 지 4일보다 긴 시간 후에 세포에 제공되는 방법.Embodiment 57. The method of any one of embodiments 29 to 56, wherein the gRNA or nucleic acid encoding the gRNA and the DNA endonuclease or the nucleic acid encoding the DNA endonuclease provide a donor template to the cell. A method provided to cells after a period of time greater than one day.

실시형태 58. 실시형태 29 내지 57 중 어느 한 실시형태에 있어서, gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 공여자 주형을 세포에 제공한 지 적어도 14일 후에 세포에 제공되는 방법.Embodiment 58. The method according to any one of embodiments 29 to 57, wherein the gRNA or nucleic acid encoding the gRNA and the DNA endonuclease or the nucleic acid encoding the DNA endonuclease provide a donor template to the cell at least A method provided to cells after 14 days.

실시형태 59. 실시형태 57 또는 58에 있어서, 하나 이상의 추가의 용량의 gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 제1 용량의 gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공되는 방법.Embodiment 59. The method of embodiment 57 or 58, wherein one or more additional doses of the gRNA or nucleic acid encoding the gRNA and the DNA endonuclease or nucleic acid encoding the DNA endonuclease comprise the first dose of the gRNA or gRNA. A method of providing a cell after a nucleic acid encoding and a DNA endonuclease or a nucleic acid encoding a DNA endonuclease.

실시형태 60. 실시형태 59에 있어서, 하나 이상의 추가의 용량의 gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에, 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 표적화된 통합이 달성되거나 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 발현이 달성될 때까지 세포에 제공되는 방법.Embodiment 60. The method of embodiment 59, wherein at least one additional dose of the gRNA or nucleic acid encoding the gRNA and the DNA endonuclease or nucleic acid encoding the DNA endonuclease comprises a first dose of the gRNA or gRNA. After the nucleic acid and the DNA endonuclease or the nucleic acid encoding the DNA endonuclease, a targeted integration of the target level of the nucleic acid sequence encoding the synthetic FVIII protein is achieved or the target level of the nucleic acid sequence encoding the synthetic FVIII protein. provided to the cell until expression is achieved.

실시형태 61. 실시형태 29 내지 60 중 어느 한 실시형태에 있어서, 세포가 간 세포인 방법.Embodiment 61 The method of any one of embodiments 29 to 60, wherein the cell is a liver cell.

실시형태 62. 실시형태 61에 있어서, 세포가 인간 간세포 또는 인간 동모양혈관 상피 세포인 방법.Embodiment 62 The method of embodiment 61, wherein the cell is a human hepatocyte or a human sinusoidal epithelial cell.

실시형태 63. 세포로서, 상기 세포의 게놈이 합성 FVIII 단백질을 인코딩하는 DNA를 포함하며, 상기 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, 상기 B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 세포.Embodiment 63. A cell, wherein the genome of said cell comprises DNA encoding a synthetic FVIII protein, wherein said synthetic FVIII protein comprises a B domain substitution, wherein said B domain substitution comprises 0 to 9 N-linked glycosides. A cell comprising a sylation site and 3 to about 40 amino acids in length.

실시형태 64. 실시형태 63에 있어서, 합성 FVIII 단백질이 내인성 알부민 프로모터, 내인성 트랜스페린 프로모터 또는 내인성 피브리노겐 알파 프로모터에 작동 가능하게 연결되는 세포.Embodiment 64 The cell of embodiment 63, wherein the synthetic FVIII protein is operably linked to an endogenous albumin promoter, an endogenous transferrin promoter or an endogenous fibrinogen alpha promoter.

실시형태 65. 실시형태 63에 있어서, 합성 FVIII 단백질을 인코딩하는 핵산 서열이 세포에서의 발현을 위해 코돈-최적화된 세포.Embodiment 65 The cell of embodiment 63, wherein the nucleic acid sequence encoding the synthetic FVIII protein is codon-optimized for expression in the cell.

실시형태 66. 실시형태 63에 있어서, 세포가 인간 간 세포인 세포.Embodiment 66 The cell according to embodiment 63, wherein the cell is a human liver cell.

실시형태 67. 실시형태 66에 있어서, 세포가 인간 간세포 또는 인간 동모양혈관 상피 세포인 세포.Embodiment 67 The cell of embodiment 66, wherein the cell is a human hepatocyte or a human allogeneic epithelial cell.

실시형태 68. 실시형태 67에 있어서, 세포가 실시형태 29 내지 62 중 어느 한 실시형태의 방법에 의해 제조되는 세포.Embodiment 68 The cell of embodiment 67, wherein the cell is produced by the method of any one of embodiments 29-62.

실시형태 69. (a) 숙주 세포 유전자좌에 상보적인 스페이서 서열을 포함하는 gRNA 또는 gRNA를 인코딩하는 핵산; (b) DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형으로서, 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 공여자 주형을 대상체의 세포에 제공하는 단계를 포함하는 대상체의 A형 혈우병을 치료하는 방법.Embodiment 69. (a) a gRNA comprising a spacer sequence complementary to a host cell locus or a nucleic acid encoding the gRNA; (b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and (c) a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein comprises B domain substitutions, wherein the B domain substitutions have 0 to 9 N-linked glycosylation sites and 3 to about A method of treating hemophilia A in a subject comprising providing to cells of the subject a donor template comprising a length of 40 amino acids.

실시형태 70. 실시형태 69에 있어서, B 도메인 치환물이 0 내지 6개의 N-연결된 글리코실화 부위를 포함하는 방법.Embodiment 70 The method of embodiment 69, wherein the B domain substitution comprises 0-6 N-linked glycosylation sites.

실시형태 71. 실시형태 70에 있어서, B 도메인 치환물이 0 내지 3개의 N-연결된 글리코실화 부위를 포함하는 방법.Embodiment 71 The method of embodiment 70, wherein the B domain substitution comprises 0-3 N-linked glycosylation sites.

실시형태 72. 실시형태 29에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 369, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 방법.Embodiment 72 The method of embodiment 29, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362-369, 371 and 373.

실시형태 73. 실시형태 72에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나의 아미노산 서열 또는 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나에 대하여 적어도 80% 동일성을 갖는 그의 변이체를 포함하는 방법.Embodiment 73. The method according to embodiment 72, wherein the B domain substitution is at least for the amino acid sequence of any one of SEQ ID NOs: 362 to 366, 371 and 373 or any one of SEQ ID NOs: 362 to 366, 371 and 373 A method comprising a variant thereof having 80% identity.

실시형태 74. 실시형태 73에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 방법.Embodiment 74 The method of embodiment 73, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362 to 364, 371 and 373.

실시형태 75. 실시형태 69 내지 74 중 어느 한 실시형태에 있어서, 숙주 세포 유전자좌가 간에서 발현되는 유전자의 유전자좌인 방법.Embodiment 75 The method of any one of embodiments 69 to 74, wherein the host cell locus is a locus of a gene expressed in the liver.

실시형태 76. 실시형태 69 내지 75 중 어느 한 실시형태에 있어서, 숙주 세포 유전자좌가 급성기 단백질을 인코딩하는 유전자의 유전자좌인 방법.Embodiment 76 The method of any one of embodiments 69 to 75, wherein the host cell locus is the locus of a gene encoding an acute phase protein.

실시형태 77. 실시형태 76에 있어서, 급성기 단백질이 알부민, 트랜스페린 또는 피브리노겐인 방법.Embodiment 77 The method of embodiment 76, wherein the acute phase protein is albumin, transferrin or fibrinogen.

실시형태 78. 실시형태 69 내지 74 중 어느 한 실시형태에 있어서, 숙주 세포 유전자좌가 세이프 하버 유전자좌인 방법.Embodiment 78 The method of any one of embodiments 69 to 74, wherein the host cell locus is a Safe Harbor locus.

실시형태 79. DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csn1 및 Csx12로도 알려짐), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 또는 Cpf1 엔도뉴클레아제, 및 그의 기능적 유도체로 이루어진 군으로부터 선택되는, 실시형태 69 내지 78 중 어느 한 실시형태의 방법.Embodiment 79. DNA endonuclease is Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1 , Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx3, Csx10, Csf1, Csx15, Csx1 The method of any one of embodiments 69 to 78, wherein the method is selected from the group consisting of , Csf2, Csf3, Csf4, or Cpf1 endonuclease, and functional derivatives thereof.

실시형태 80. 실시형태 79에 있어서, DNA 엔도뉴클레아제가 Cas9인 방법.Embodiment 80 The method of embodiment 79, wherein the DNA endonuclease is Cas9.

실시형태 81. 실시형태 80에 있어서, Cas9가 spCas9 또는 SluCas9인 방법.Embodiment 81 The method of embodiment 80, wherein Cas9 is spCas9 or SluCas9.

실시형태 82. DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포 내의 발현을 위해 코돈-최적화되는, 실시형태 69 내지 81 중 어느 한 실시형태의 방법.Embodiment 82 The method of any one of embodiments 69 to 81, wherein the nucleic acid encoding the DNA endonuclease is codon-optimized for expression in a cell.

실시형태 83. 실시형태 69 내지 82 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산이 데옥시리보핵산(DNA)인 방법.Embodiment 83 The method of any one of embodiments 69 to 82, wherein the nucleic acid encoding the DNA endonuclease is deoxyribonucleic acid (DNA).

실시형태 84. 실시형태 69 내지 82 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 방법.Embodiment 84 The method of any one of embodiments 69 to 82, wherein the nucleic acid encoding the DNA endonuclease is ribonucleic acid (RNA).

실시형태 85. 실시형태 84에 있어서, DNA 엔도뉴클레아제를 인코딩하는 RNA는 mRNA인, 방법.Embodiment 85 The method of embodiment 84, wherein the RNA encoding the DNA endonuclease is mRNA.

실시형태 86. 실시형태 69 내지 85 중 어느 한 실시형태에 있어서, gRNA 또는 gRNA를 인코딩하는 핵산, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 공여자 주형 중 하나 이상이 리포좀 또는 지질 나노입자에 제형화되는 방법.Embodiment 86. The method according to any one of embodiments 69 to 85, wherein at least one of a gRNA or a nucleic acid encoding a gRNA, a DNA endonuclease or a nucleic acid encoding a DNA endonuclease and a donor template is a liposome or a lipid A method of being formulated into nanoparticles.

실시형태 87. 실시형태 69 내지 86 중 어느 한 실시형태에 있어서, 공여자 주형은 AAV 벡터에 인코딩되는 방법.Embodiment 87 The method of any one of embodiments 69 to 86, wherein the donor template is encoded in an AAV vector.

실시형태 88. 실시형태 69 내지 87 중 어느 한 실시형태에 있어서, 공여자 주형 핵산 서열이 숙주 세포에서의 발현을 위해 코돈 최적화된 방법.Embodiment 88 The method of any one of embodiments 69 to 87, wherein the donor template nucleic acid sequence is codon optimized for expression in a host cell.

실시형태 89. 실시형태 69 내지 88 중 어느 한 실시형태에 있어서, 공여자 주형 핵산 서열이 FVIII를 인코딩하는 야생형 핵산 서열에 비하여 감소된 함량의 CpG 디-뉴클레오티드를 포함하는 방법.Embodiment 89 The method of any one of embodiments 69 to 88, wherein the donor template nucleic acid sequence comprises a reduced content of CpG di-nucleotides compared to a wild-type nucleic acid sequence encoding FVIII.

실시형태 90. 실시형태 89에 있어서, 공여자 주형 핵산 서열이 CpG 디-뉴클레오티드를 포함하지 않는 방법.Embodiment 90 The method of embodiment 89, wherein the donor template nucleic acid sequence does not comprise a CpG di-nucleotide.

실시형태 91. 실시형태 69 내지 90 중 어느 한 실시형태에 있어서, 공여자 주형이 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트가 한 측 또는 양 측에서 gRNA 표적 부위에 측접한 방법.Embodiment 91 The donor template according to any one of embodiments 69 to 90, wherein the donor template comprises a donor cassette comprising a nucleic acid sequence encoding a synthetic FVIII protein, wherein the donor cassette is at the gRNA target site on one or both sides. sideways way.

실시형태 92. 실시형태 91에 있어서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 측접한 방법.Embodiment 92 The method of embodiment 91, wherein the donor cassette is flanked on both sides by the gRNA target site.

실시형태 93. 실시형태 91에 있어서, 공여자 카세트가 그의 5’ 측에서 gRNA 표적 부위에 측접한 방법.Embodiment 93 The method of embodiment 91, wherein the donor cassette flanks the gRNA target site on its 5' side.

실시형태 94. 실시형태 91 내지 93 중 어느 한 실시형태에 있어서, gRNA 표적 부위가 gRNA에 대한 표적 부위인 방법.Embodiment 94 The method of any one of embodiments 91 to 93, wherein the gRNA target site is a target site for a gRNA.

실시형태 95. 실시형태 94에 있어서, 공여자 주형의 gRNA 표적 부위가 gRNA에 대한 세포 게놈 내의 gRNA 표적 부위의 역 상보물인 방법.Embodiment 95 The method of embodiment 94, wherein the gRNA target site of the donor template is the reverse complement of the gRNA target site in the genome of the cell to the gRNA.

실시형태 96. 실시형태 69 내지 95 중 어느 한 실시형태에 있어서, 공여자 주형을 세포에 제공하는 단계는 공여자 주형을 대상체에 정맥내 투여하는 것을 포함하는 방법.Embodiment 96 The method of any one of embodiments 69-95, wherein providing the donor template to the cells comprises administering the donor template intravenously to the subject.

실시형태 97. 실시형태 69 내지 96 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자에 제형화되는 방법.Embodiment 97 The method of any one of embodiments 69 to 96, wherein the DNA endonuclease or nucleic acid encoding the DNA endonuclease is formulated in a liposome or lipid nanoparticle.

실시형태 98. 실시형태 97에 있어서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함하는 방법.Embodiment 98 The method of embodiment 97, wherein the liposome or lipid nanoparticle also comprises a gRNA.

실시형태 99. 실시형태 98에 있어서, gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계가 리포좀 또는 지질 나노입자를 대상체에 정맥내로 투여하는 것을 포함하는 방법.Embodiment 99. The method of embodiment 98, wherein the step of providing to the cell a gRNA or a nucleic acid encoding the gRNA and a DNA endonuclease or a nucleic acid encoding a DNA endonuclease comprises administering the liposomes or lipid nanoparticles to the subject intravenously. A method comprising administering.

실시형태 100. 실시형태 69 내지 99 중 어느 한 실시형태에 있어서, DNA 엔도뉴클레아제 및 gRNA가 리보핵단백질(RNP) 복합체로서 숙주 세포에 제공되며, RNP 복합체가 gRNA와 복합체화된 DNA 엔도뉴클레아제를 포함하는 방법.Embodiment 100 The DNA endonuclease of any one of embodiments 69 to 99, wherein the DNA endonuclease and the gRNA are provided to the host cell as a ribonucleoprotein (RNP) complex, and wherein the RNP complex is complexed with the gRNA. A method comprising a clease.

실시형태 101. 실시형태 69 내지 100 중 어느 한 실시형태에 있어서, gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 공여자 주형을 세포에 제공한 지 4일보다 긴 시간 후에 세포에 제공되는 방법.Embodiment 101. The method of any one of embodiments 69-100, wherein the gRNA or nucleic acid encoding the gRNA and the DNA endonuclease or nucleic acid encoding the DNA endonuclease provide a donor template to the cell. A method provided to cells after a period of time greater than one day.

실시형태 102. 실시형태 69 내지 101 중 어느 한 실시형태에 있어서, gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 공여자 주형을 세포에 제공한 지 적어도 14일 후에 세포에 제공되는 방법.Embodiment 102. The method of any one of embodiments 69 to 101, wherein the gRNA or nucleic acid encoding the gRNA and the DNA endonuclease or the nucleic acid encoding the DNA endonuclease provide a donor template to the cell at least A method provided to cells after 14 days.

실시형태 103. 실시형태 101 또는 102에 있어서, 하나 이상의 추가의 용량의 gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 제1 용량의 gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 세포에 제공되는 방법.Embodiment 103 The first dose of the gRNA or gRNA of embodiment 101 or 102, wherein the one or more additional doses of the gRNA or nucleic acid encoding the gRNA and the DNA endonuclease or nucleic acid encoding the DNA endonuclease A method of providing a cell after a nucleic acid encoding and a DNA endonuclease or a nucleic acid encoding a DNA endonuclease.

실시형태 104. 실시형태 103에 있어서, 하나 이상의 추가의 용량의 gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 표적화된 통합 및/또는 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 발현이 달성될 때까지 세포에 제공되는 방법.Embodiment 104. The method of embodiment 103, wherein the one or more additional doses of the gRNA or nucleic acid encoding the gRNA and the DNA endonuclease or nucleic acid encoding the DNA endonuclease encode the first dose of the gRNA or gRNA. Targeted integration of a nucleic acid and a DNA endonuclease or a nucleic acid encoding a DNA endonuclease followed by a target level of a nucleic acid sequence encoding a synthetic FVIII protein and/or expression of a target level of a nucleic acid sequence encoding a synthetic FVIII protein provided to the cells until this is achieved.

실시형태 105. 실시형태 101 내지 104 중 어느 한 실시형태에 있어서, gRNA 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계가 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 대상체에 투여하는 것을 포함하는 방법.Embodiment 105 The nucleic acid encoding a DNA endonuclease according to any one of embodiments 101 to 104, wherein the step of providing to the cell a gRNA and a DNA endonuclease or a nucleic acid encoding a DNA endonuclease and administering to the subject lipid nanoparticles comprising gRNA.

실시형태 106. 실시형태 101 내지 105 중 어느 한 실시형태에 있어서, 공여자 주형을 세포에 제공하는 단계는 AAV 벡터에 인코딩된 공여자 주형을 대상체에 투여하는 것을 포함하는 방법.Embodiment 106 The method of any one of embodiments 101-105, wherein providing the donor template to the cell comprises administering to the subject a donor template encoded in an AAV vector.

실시형태 107. 세포는 간세포인, 실시형태 69 내지 106 중 어느 한 실시형태의 방법.Embodiment 107 The method of any one of embodiments 69 to 106, wherein the cell is a hepatocyte.

실시형태 108. 실시형태 69 내지 107 중 어느 한 실시형태에 있어서, 합성 FVIII 단백질을 인코딩하는 핵산 서열은 대상체의 간 내에서 발현되는 방법.Embodiment 108 The method of any one of embodiments 69 to 107, wherein the nucleic acid sequence encoding the synthetic FVIII protein is expressed in the liver of the subject.

실시형태 109. 실시형태 63 내지 68 중 어느 한 실시형태의 세포를 대상체에 투여하는 단계를 포함하는 대상체에서의 A형 혈우병의 치료 방법.Embodiment 109. A method of treating hemophilia A in a subject comprising administering to the subject the cell of any one of embodiments 63-68.

실시형태 110. 실시형태 109에 있어서, 세포가 대상체에 대하여 자가인 방법.Embodiment 110 The method of embodiment 109, wherein the cell is autologous to the subject.

실시형태 111. 실시형태 110에 있어서, 대상체로부터 생물학적 시료를 수득하는 단계를 추가로 포함하며, 생물학적 시료가 간 세포를 포함하며, 세포가 간 세포로부터 제조되는 방법.Embodiment 111 The method of embodiment 110, further comprising obtaining a biological sample from the subject, wherein the biological sample comprises liver cells, wherein the cells are prepared from the liver cells.

실시형태 112. 사용 설명서를 추가로 포함하는, 실시형태 1 내지 28 중 어느 한 실시형태의 시스템의 하나 이상의 요소를 포함하는 키트.Embodiment 112 A kit comprising one or more elements of the system of any one of Embodiments 1-28, further comprising instructions for use.

실시형태 113. 합성 FVIII 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산으로서, 상기 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, 상기 B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 핵산.Embodiment 113 A nucleic acid comprising a polynucleotide sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein comprises a B domain substitution, wherein the B domain substitution comprises 0 to 9 N-linked glycosylation sites and 3 A nucleic acid comprising from to about 40 amino acids in length.

실시형태 114. 실시형태 113에 있어서, B 도메인 치환물이 0 내지 6개의 N-연결된 글리코실화 부위를 포함하는 핵산.Embodiment 114 The nucleic acid of embodiment 113, wherein the B domain substitution comprises 0-6 N-linked glycosylation sites.

실시형태 115. 실시형태 113에 있어서, B 도메인 치환물이 0 내지 3개의 N-연결된 글리코실화 부위를 포함하는 핵산.Embodiment 115 The nucleic acid of embodiment 113, wherein the B domain substitution comprises 0-3 N-linked glycosylation sites.

실시형태 116. 실시형태 113에 있어서, 상기 B 도메인 치환물이 SEQ ID NO: 362 내지 369, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 핵산.Embodiment 116 The nucleic acid of embodiment 113, wherein said B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362-369, 371 and 373.

실시형태 117. 실시형태 116에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나의 아미노산 서열 또는 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나에 대하여 적어도 80% 동일성을 갖는 그의 변이체를 포함하는 핵산.Embodiment 117. The method according to embodiment 116, wherein the B domain substitution is at least for the amino acid sequence of any one of SEQ ID NOs: 362 to 364, 371 and 373 or any one of SEQ ID NOs: 362 to 364, 371 and 373 A nucleic acid comprising a variant thereof having 80% identity.

실시형태 118. 실시형태 116에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 363, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 핵산.Embodiment 118 The nucleic acid of embodiment 116, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362 to 363, 371 and 373.

실시형태 119. 실시형태 113 내지 118 중 어느 한 실시형태에 있어서, 합성 FVIII 단백질을 인코딩하는 폴리뉴클레오티드 서열이 숙주 세포에서의 발현을 위해 코돈 최적화된 핵산.Embodiment 119 The nucleic acid according to any one of embodiments 113 to 118, wherein the polynucleotide sequence encoding the synthetic FVIII protein is codon optimized for expression in a host cell.

실시형태 120. 실시형태 113 내지 119 중 어느 한 실시형태에 있어서, 합성 FVIII 단백질을 인코딩하는 폴리뉴클레오티드 서열이 FVIII를 인코딩하는 야생형 핵산 서열에 비하여 감소된 함량의 CpG 디-뉴클레오티드를 포함하는 핵산.Embodiment 120 The nucleic acid according to any one of embodiments 113 to 119, wherein the polynucleotide sequence encoding the synthetic FVIII protein comprises a reduced content of CpG di-nucleotides compared to a wild-type nucleic acid sequence encoding FVIII.

실시형태 121. 실시형태 120에 있어서, 합성 FVIII 단백질을 인코딩하는 폴리뉴클레오티드 서열이 CpG 디-뉴클레오티드를 포함하지 않는 핵산.Embodiment 121 The nucleic acid according to embodiment 120, wherein the polynucleotide sequence encoding the synthetic FVIII protein does not comprise a CpG di-nucleotide.

실시형태 122. 실시형태 113 내지 121 중 어느 한 실시형태에 있어서, 핵산이 바이러스 벡터인 핵산.Embodiment 122 The nucleic acid according to any one of embodiments 113 to 121, wherein the nucleic acid is a viral vector.

실시형태 123. 실시형태 122에 있어서, 바이러스 벡터가 AAV 벡터인 핵산.Embodiment 123 The nucleic acid according to embodiment 122, wherein the viral vector is an AAV vector.

실시형태 124. 대상체 내의 FVIII의 양을 증가시키는 방법으로서, 방법은 (a) 숙주 세포 유전자좌에 상보적인 스페이서 서열을 포함하는 gRNA 또는 gRNA를 인코딩하는 핵산; (b) DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및 (c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형으로서, 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 공여자 주형을 대상체의 세포에 제공하는 단계를 포함하며, 대상체는 제1 혈청 수준의 FVIII를 갖는, 방법.Embodiment 124 A method of increasing the amount of FVIII in a subject, the method comprising: (a) a gRNA comprising a spacer sequence complementary to a host cell locus or a nucleic acid encoding the gRNA; (b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and (c) a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein comprises B domain substitutions, wherein the B domain substitutions have 0 to 9 N-linked glycosylation sites and 3 to about A method comprising providing a donor template comprising a length of 40 amino acids to a cell of a subject, wherein the subject has a first serum level of FVIII.

실시형태 125. 실시형태 124에 있어서, FVIII의 제1 혈청 수준이 약 0.40 IU/mL 미만인 방법.Embodiment 125 The method of embodiment 124, wherein the first serum level of FVIII is less than about 0.40 IU/mL.

실시형태 126. 실시형태 125에 있어서, FVIII의 제1 혈청 수준이 약 0.05 IU/mL 미만인 방법.Embodiment 126 The method of embodiment 125, wherein the first serum level of FVIII is less than about 0.05 IU/mL.

실시형태 127. 실시형태 125에 있어서, FVIII의 제1 혈청 수준이 약 0.01 IU/mL 미만인 방법.Embodiment 127 The method of embodiment 125, wherein the first serum level of FVIII is less than about 0.01 IU/mL.

실시형태 128. A형 혈우병의 치료를 위한 실시형태 1 내지 28 중 어느 한 실시형태의 시스템의 용도.Embodiment 128 Use of the system of any one of embodiments 1-28 for the treatment of hemophilia A.

실시형태 129. A형 혈우병의 치료용 의약의 제조를 위한 실시형태 1 내지 28 중 어느 한 실시형태의 시스템의 용도.Embodiment 129 Use of the system of any one of embodiments 1-28 for the manufacture of a medicament for the treatment of hemophilia A.

실시형태 130. A형 혈우병의 치료를 위한 실시형태 63 내지 68 중 어느 한 실시형태의 세포의 용도.Embodiment 130. Use of the cell of any one of embodiments 63 to 68 for the treatment of hemophilia A.

실시형태 131. A형 혈우병의 치료용 의약의 제조를 위한 실시형태 63 내지 68 중 어느 한 실시형태의 세포의 용도.Embodiment 131 Use of the cell of any one of embodiments 63 to 68 for the manufacture of a medicament for the treatment of hemophilia A.

실시형태 132. A형 혈우병의 치료를 위한 실시형태 112의 키트의 용도.Embodiment 132 Use of the kit of embodiment 112 for the treatment of hemophilia A.

실시형태 133. A형 혈우병의 치료용 의약의 제조를 위한 실시형태 112의 키트의 용도.Embodiment 133 Use of the kit of embodiment 112 for the manufacture of a medicament for the treatment of hemophilia A.

실시형태 134. A형 혈우병의 치료를 위한 실시형태 113 내지 123 중 어느 한 실시형태의 핵산의 용도.Embodiment 134 Use of the nucleic acid of any one of embodiments 113 to 123 for the treatment of hemophilia A.

실시형태 135. A형 혈우병의 치료용 의약의 제조를 위한 실시형태 113 내지 123 중 어느 한 실시형태의 핵산의 용도.Embodiment 135 Use of the nucleic acid of any one of embodiments 113 to 123 for the manufacture of a medicament for the treatment of hemophilia A.

실시형태 136. 합성 FVIII 단백질로서, 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위를 포함하며, 약 40개 이하의 아미노산 길이인 합성 FVIII 단백질.Embodiment 136. A synthetic FVIII protein, wherein the synthetic FVIII protein comprises a B domain substitution, wherein the B domain substitution comprises 0 to 9 N-linked glycosylation sites and is no more than about 40 amino acids in length. protein.

실시예Example

실시예 1Example 1 : N-글리코실화 모티프를 함유하는 아미노산 서열은 CRISPR/Cas9 절단에 의해 매개되는 마우스 알부민 인트론 1 내로의 표적화된 통합 후에 FVIII의 발현을 개선시킨다: Amino acid sequence containing N-glycosylation motif improves expression of FVIII after targeted integration into mouse albumin intron 1 mediated by CRISPR/Cas9 cleavage

구축물 설계building design

FVIII 인코딩 핵산 서열을 게놈 내로 삽입하기 위한 난제는 천연 FVIII 코딩 서열이 7053 bp이어서, 그것이 다른 것들 중 특히 아데노 연관 바이러스에 패키징되기 어렵게 만든다는 것이다(AAV는 서열-특이적 뉴클레아제, 예컨대 Cas9에 의해 생성되는 이중-가닥 파단부에서의 통합을 위한 주형으로서 생체내 전달을 위하여 4800 내지 5000 bp 범위의 패키징 한계를 갖는다). 문제를 해결하기 위하여, 본 발명자들은 변경된 B 도메인을 갖는 FVIII 코딩 서열의 세트를 설계하였다. FVIII의 B 도메인은 기능에 필요하지 않지만, 그것은 FVIII의 분비를 개선시킨다. 이들 FVIII 코딩 서열을 짧은 B 도메인(치환 B 도메인)을 갖는 합성 FVIII을 발현하도록 설계하였다. 치환 B 도메인을 갖는 합성 FVIII 코딩 서열을 게놈 내로의 통합 후에 FVIII 단백질을 제조하고 분비하는 그들의 능력에 대하여 평가하기 위하여, 구축물을 마우스 알부민 유전자의 인트론 1 내로의 FVIII 코딩 서열의 통합을 표적화하도록 설계하였다. 알부민 유전자좌는 간 세포에서 활성인 강력한 프로모터를 제공하여, 알부민 프로모터에 작동 가능하게 연결되는 경우 이 유전자좌에 삽입된 적합한 FVIII 코딩 서열이 발현될 수 있도록 한다.A challenge for inserting the FVIII encoding nucleic acid sequence into the genome is that the native FVIII coding sequence is 7053 bp, making it difficult, among other things, to be packaged into adeno-associated viruses (AAV is mediated by sequence-specific nucleases such as Cas9). has a packaging limit in the range of 4800 to 5000 bp for in vivo delivery as a template for integration at the resulting double-stranded break). To solve the problem, we designed a set of FVIII coding sequences with altered B domains. The B domain of FVIII is not required for function, but it improves secretion of FVIII. These FVIII coding sequences were designed to express synthetic FVIII with a short B domain (substituted B domain). To evaluate the synthetic FVIII coding sequence with a substitutional B domain for their ability to make and secrete FVIII protein after integration into the genome, the construct was designed to target the integration of the FVIII coding sequence into intron 1 of the mouse albumin gene. . The albumin locus provides a strong promoter active in liver cells to allow expression of the appropriate FVIII coding sequence inserted at this locus when operably linked to the albumin promoter.

본원에 pCB076(SEQ ID NO: 316), pCB100(SEQ ID NO: 320), pCB1003(SEQ ID NO: 324), pCB085(SEQ ID NO: 3319) 또는 pCB080(SEQ ID NO: 318)으로서 지칭되는 일련의 플라스미드를 알려져 있는 분자 생물학 기법을 사용하여 구축하였다. 동일한 pUC19-기반의 박테리아 플라스미드 백본(박테리아 복제 원점 및 카나마이신 내성 유전자 함유)을 모든 5가지 플라스미드를 위해 사용하였다. 플라스미드를 (순서대로) 하기의 요소를 사용하여 구축하였다: gRNA 표적 부위(gRNA mAlbT1에 대하여, SEQ ID NO: 338, 마우스 알부민 유전자의 엑손 1 표적화) | 18 bp 스페이서 | 스플라이스 수여자 부위(“SA”) | FVIII 코딩 서열 | 폴리아데닐화 신호(“sPA”). 플라스미드는 인간 FVIII 코딩 서열의 코돈 최적화, 및 B 도메인 치환물을 인코딩하는 서열의 존재(pCB076) 또는 부재(pCB100, pCB1003, pCB085 및 pCB080) 만이 상이하였다. 이 실시예에서 사용되는 B 도메인 치환물은 인간 FVIII B 도메인의 N-말단으로부터 처음 6개의 N-글리코실화 모티프로 이루어졌다.A series referred to herein as pCB076 (SEQ ID NO: 316), pCB100 (SEQ ID NO: 320), pCB1003 (SEQ ID NO: 324), pCB085 (SEQ ID NO: 3319) or pCB080 (SEQ ID NO: 318) plasmids were constructed using known molecular biology techniques. The same pUC19-based bacterial plasmid backbone (containing the bacterial origin of replication and kanamycin resistance gene) was used for all five plasmids. Plasmids were constructed (in order) using the following elements: gRNA target site (for gRNA mAlbT1, SEQ ID NO: 338, targeting exon 1 of the mouse albumin gene) | 18 bp spacer | Splice Recipient Site (“SA”) | FVIII coding sequence | Polyadenylation signal (“sPA”). The plasmids differed only in codon optimization of the human FVIII coding sequence and in the presence (pCB076) or absence (pCB100, pCB1003, pCB085 and pCB080) of the sequence encoding the B domain substitution. The B domain substitutions used in this example consisted of the first 6 N-glycosylation motifs from the N-terminus of the human FVIII B domain.

플라스미드 pCB100, pCB1003, pCB085 및 pCB080은 모두 B 도메인이 “SQ 링커”(아미노산 SFSQNPPVLKRHQR, SEQ ID NO: 337을 인코딩함)로 대체된 B 도메인 결실된 인간 FVIII에 대한 코딩 서열을 함유한다. SQ 링커는 프로테아제 절단 부위(RHQR)를 포함하지만, N-연결된 글리코실화 부위를 결여한다. 플라스미드 pCB076(SEQ ID NO: 316)은 pCB100과 동일한 코돈-최적화된 B 도메인 결실된 인간 FVIII 코딩 서열(“co1”, 하기 실시예 4 참조) 및 B 도메인 대신에 SQ 링커 내로 삽입된 인간 FVIII B 도메인의 N-말단으로부터 처음 6개의 N-글리코실화 모티프에 상응하는 17개 아미노산을 인코딩하는(이에 따라 B 도메인 치환물을 형성하는) 추가의 DNA 서열을 함유한다. 다른 플라스미드는 하기의 코돈 최적화를 갖는다: pCB100 - co1(SEQ ID NO: 320), pCB1003 - co2(SEQ ID NO: 324), pCB085 - co3(SEQ ID NO: 319) 및 pCB080 - co4(SEQ ID NO: 318)(하기 실시예 4 참조). 플라스미드를 gRNA mALbT1(tgccagttcccgatcgttac, SEQ ID 338)을 이용하는 CRISPR/Cas9 시스템을 사용하여 마우스 알부민 유전자의 인트론 1에 생성된 이중-가닥 파단부 내로의 표적화된 통합을 위한 공여자이도록 설계하였다. 간은 이 표적화된 통합을 위한 표적 기관, 구체적으로 간세포이다. 생체내에서 간세포는 대부분 휴지기이며, 비-분열 세포 내의 DNA에서 이중-가닥 파단부를 복구하는 우세적인 세포 메커니즘이 비-상동성 말단 연결(NHEJ)인 것이 알려져 있다(문헌[Z. Mao et al., Cell Cycle (2008) 7:2902-06]). 선형 이중-가닥 DNA 분자(공여자) 및 게놈 내의 이중-가닥 파단부의 존재 하에, 공여자 DNA는 NHEJ 기구에 의해 이중-가닥 파단부에 삽입될 수 있다.Plasmids pCB100, pCB1003, pCB085 and pCB080 all contain the coding sequence for human FVIII with a B domain deleted B domain replaced by an “SQ linker” (encoding amino acid SFSQNPPVLKRHQR, SEQ ID NO: 337). The SQ linker contains a protease cleavage site (RHQR), but lacks an N-linked glycosylation site. Plasmid pCB076 (SEQ ID NO: 316) had the same codon-optimized B domain deleted human FVIII coding sequence as pCB100 (“co1”, see Example 4 below) and a human FVIII B domain inserted into the SQ linker instead of the B domain. contains an additional DNA sequence encoding 17 amino acids corresponding to the first 6 N-glycosylation motifs from the N-terminus of (thus forming B domain substitutions). Other plasmids have the following codon optimizations: pCB100-co1 (SEQ ID NO: 320), pCB1003-co2 (SEQ ID NO: 324), pCB085-co3 (SEQ ID NO: 319) and pCB080-co4 (SEQ ID NO: : 318) (see Example 4 below). The plasmid was designed to be a donor for targeted integration into the double-stranded break generated in intron 1 of the mouse albumin gene using the CRISPR/Cas9 system using the gRNA mALbT1 (tgccagttcccgatcgttac, SEQ ID 338). The liver is the target organ for this targeted integration, specifically hepatocytes. In vivo, hepatocytes are mostly quiescent, and it is known that the predominant cellular mechanism for repairing double-strand breaks in DNA in non-dividing cells is non-homologous end joining (NHEJ) (Z. Mao et al. , Cell Cycle (2008) 7 :2902-06]). In the presence of a linear double-stranded DNA molecule (donor) and a double-stranded break in the genome, the donor DNA can be inserted into the double-stranded break by the NHEJ machinery.

대안적으로, 게놈 내의 이중-가닥 파단부의 말단은 동일한 NHEJ 기구, 일반적으로 공여자 주형의 삽입보다 더욱 빈번한 사건에 의해 서로 재연결될 수 있다. NHEJ에 의한 복구는 오류-유발 과정이며, 이는 이중-가닥 파단부의 부위에서 삽입 또는 결실의 도입을 야기한다. 세포의 게놈 내의 이중-가닥 파단부에 플라스미드로서 전달되는 공여자 주형의 표적화된 통합은 공여자 플라스미드 내에 뉴클레아제를 위한 절단 부위를 포함시킴으로써 향상될 수 있다. 플라스미드가 원형 분자이기 때문에, 그들은 이중-가닥 파단부에서의 통합을 위한 주형이 아니다. 플라스미드 내에 단일의 가이드 RNA 절단 부위를 포함하는 것은 Cas9/gRNA 복합체의 존재 하에 플라스미드의 선형화를 초래한다. 따라서, mALbT1 가이드에 대한 단일의 가이드 RNA 절단 부위를 마우스 게놈에 존재하는 서열의 역 상보물로 FVIII 카세트의 5’ 말단에 삽입하였다.Alternatively, the ends of double-strand breaks in the genome can be religated with each other by an event that is more frequent than insertion of the same NHEJ machinery, usually a donor template. Repair by NHEJ is an error-prone process, which results in the introduction of insertions or deletions at the site of double-strand breaks. Targeted integration of the donor template delivered as a plasmid to a double-stranded break in the genome of the cell can be enhanced by including a cleavage site for the nuclease in the donor plasmid. Because plasmids are circular molecules, they are not templates for integration at double-strand breaks. Inclusion of a single guide RNA cleavage site in the plasmid results in linearization of the plasmid in the presence of the Cas9/gRNA complex. Therefore, a single guide RNA cleavage site for the mALbT1 guide was inserted at the 5' end of the FVIII cassette as the reverse complement of the sequence present in the mouse genome.

게놈 내의 가이드 서열의 역 상보물의 이용은 이론적으로 카세트에 측접한 2개의 가이드 부위를 사용하는 경우 정방향 배향으로의 통합에 유리하다. 그러나, 이 이점은 오직 하나의 가이드 절단 부위가 사용되는 경우에는 유지될 가능성이 낮다. 코딩 서열에 측접한 가이드 절단 부위의 포함은 코딩 서열 카세트 및 (항생제 내성 유전자 및 복제 원점을 인코딩하는) 박테리아 플라스미드 백본으로 구성된 2개의 선형 단편을 생성하며, 이 경우에, 박테리아 백본 단편은 게놈 내의 이중-가닥 파단부에서의 통합을 위하여 경쟁한다. 이 이유로, 본 발명자들은 단일의 가이드 절단 부위가 사용되도록 플라스미드를 설계하였다. 합성 FVIII 코딩 서열 카세트는 5’ 말단에서 시작하여, 하기의 요소로 순서대로 구성되었다; mAlbT1 gRNA 표적 부위, 18 bp 스페이서 서열, 스플라이스 수여자 서열(ACTAAAGAATTATTCTTTTACATTTCAG, SEQ ID NO: 307), 신호 펩티드가 디뉴클레오티드 TG로 대체된 B 도메인-결실된 인간 FVIII 코딩 서열 및 폴리아데닐화 신호(aataaaagatctttattttcattagatctgtgtgttggttttttgtgtg, SEQ ID NO: 306).The use of the reverse complement of the guide sequence in the genome theoretically favors integration in the forward orientation when using two guide sites flanked by a cassette. However, this advantage is unlikely to be maintained if only one guide cutting site is used. Inclusion of a guide cleavage site flanking the coding sequence results in two linear fragments consisting of a coding sequence cassette and a bacterial plasmid backbone (encoding an antibiotic resistance gene and origin of replication), in which case the bacterial backbone fragment is a double in the genome. - Compete for unity at strand breaks. For this reason, we designed the plasmid such that a single guide cleavage site was used. The synthetic FVIII coding sequence cassette consisted of the following elements in order, starting at the 5' end; mAlbT1 gRNA target site, 18 bp spacer sequence, splice acceptor sequence (ACTAAAGAATTATTCTTTTACATTTCAG, SEQ ID NO: 307), B domain-deleted human FVIII coding sequence with signal peptide replaced by dinucleotide TG, and polyadenylation signal (aataaaagatcttgttgtgtttcattagatttgttttt , SEQ ID NO: 306).

알부민의 인트론 1 내로의 통합 후에, 알부민의 엑손 1, 알부민의 인트론 1의 부분 및 FVIII 코딩 서열 카세트를 함유하는 하이브리드 pre-mRNA가 생성되도록 구축물을 설계하였다. 알부민 인트론 1 내로의 통합 후에, 어느 정도의 빈도로, 세포의 스플라이싱 기구가 인트론 1을 스플라이싱함으로써, 알부민 엑손 1이 성숙 FVIII에 대한 코딩 서열에 프레임내 융합된 성숙 mRNA를 생성하는 것으로 예상된다. 번역 리딩 프레임을 유지하도록 TG 디뉴클레오티드를 구축물에 포함시켰다. 이 mRNA의 번역은 신호 펩티드 및 알부민의 프로-펩티드가 FVIII의 성숙 코딩 서열에 융합된 단백질을 생성하는 것으로 예상되었다. 세포의 분비 기구를 통한 통과시에, 신호 펩티드 및 프로-펩티드는 절단되어, 성숙 FVIII의 천연 N-말단에 부가되는 3개의 아미노산(Glu-Ala-Leu)을 남기는 것으로 예측되었다. 이 방법을 사용하여 생성되는 FVIII 단백질은 이들 추가의 3개의 아미노산의 존재에도 불구하고 마우스에서 활성이었다.The construct was designed such that, after integration of albumin into intron 1, a hybrid pre-mRNA containing exon 1 of albumin, a portion of intron 1 of albumin and the FVIII coding sequence cassette was generated. After integration into albumin intron 1, it has been shown that, with some frequency, the cell's splicing machinery splices intron 1, resulting in mature mRNA in which albumin exon 1 is fused in-frame to the coding sequence for mature FVIII. It is expected. A TG dinucleotide was included in the construct to maintain the translational reading frame. Translation of this mRNA was expected to produce a protein in which a signal peptide and a pro-peptide of albumin were fused to the mature coding sequence of FVIII. Upon passage through the secretory machinery of the cell, the signal peptide and pro-peptide were predicted to be cleaved, leaving three amino acids (Glu-Ala-Leu) added to the native N-terminus of mature FVIII. The FVIII protein produced using this method was active in mice despite the presence of these additional three amino acids.

gRNAgRNA

이들 실험에서 사용되는 gRNA를 뉴클레아제에 대한 저항성을 개선시키기 위하여 화학적으로 변형된 뉴클레오티드를 혼입시켜, 화학적으로 합성하였다. 일 예에서, gRNA는 하기의 구조로 구성된다: 5’ usgscsCAGUUCCCGAUCGUUACGUUUUAGAgcuaGAAAuagcAAGUUAAAAUAAGGCUAGUCCGUUAUCaacuuGAAAaaguggcaccgagucggugcusususU-3’(SEQ ID NO: 339), 여기서, “A, G, U, C”는 고유 RNA 뉴클레오티드이며, “a, g, u, c”는 2’-O-메틸 뉴클레오티드이며, “s”는 포스포로티오에이트 백본을 나타냄. gRNA의 마우스 알부민 표적화 서열은 밑줄 표시되어 있으며, gRNA 서열의 나머지는 공통 스캐폴드 서열이다.The gRNA used in these experiments was chemically synthesized by incorporating chemically modified nucleotides to improve resistance to nucleases. In one embodiment, the gRNA consists of the structure: 5' usgscsCAGUUCCCGAUCGUUAC GUUUUAGAgcuaGAAAuagcAAGUUAAAAUAAGGCUAGUCCGUUAUCaacuuGAAAaaguggcaccgagucggugcusususU-3' (SEQ ID NO: 339), wherein "a, C," is a native RNA nucleotide, "a, g, G, U u, c" is a 2'-O-methyl nucleotide, and "s" is a phosphorothioate backbone. The mouse albumin targeting sequence of the gRNA is underlined, the rest of the gRNA sequence is the consensus scaffold sequence.

mRNAmRNA

mRNA는 당업계에 알려져 있는 방법에 의해 생성될 수 있다. 본원에 사용되는 이러한 하나의 방법은 T7 중합효소를 사용하는 시험관내 전사이며, 여기서, mRNA의 서열은 T7 중합효소 프로모터를 함유하는 플라스미드에 인코딩된다. 약술하면, T7 중합효소 및 리보뉴클레오티드를 함유하는 적절한 완충제 중에서의 플라스미드의 인큐베이션 시에, 요망되는 단백질의 아미노산 서열을 인코딩하는 RNA 분자가 생성되었다. 반응 혼합물에서 천연 리보뉴클레오티드 또는 화학적으로 변형된 리보뉴클레오티드를 사용하여 고유 mRNA의 천연의 화학 구조를 갖거나, 변형된 화학 구조를 갖는 mRNA 분자를 생성할 수 있다. 본원에 기술된 연구에서, 천연(미변형) 리보뉴클레오티드를 사용하였다. 또한, 캡핑 성분을 전사 반응에 포함시켜, mRNA의 5’ 말단이 캡핑되게 하였다.mRNA can be produced by methods known in the art. One such method as used herein is in vitro transcription using T7 polymerase, wherein the sequence of mRNA is encoded in a plasmid containing the T7 polymerase promoter. Briefly, incubation of the plasmid in an appropriate buffer containing T7 polymerase and ribonucleotides resulted in RNA molecules encoding the amino acid sequence of the desired protein. Natural ribonucleotides or chemically modified ribonucleotides can be used in the reaction mixture to produce mRNA molecules having the native chemical structure of native mRNA or having a modified chemical structure. In the studies described herein, native (unmodified) ribonucleotides were used. In addition, a capping component was included in the transcription reaction, allowing the 5' end of the mRNA to be capped.

게놈 DNA의 절단이 발생할 수 있는 핵 구획 내로 spCas9 단백질을 수송하는 데 필요한 핵 국소화 도메인(NLS)에 융합된 spCas9 단백질을 인코딩하도록 spCas9 mRNA를 설계하였다. Cas9 mRNA의 추가의 성분은 리보솜 결합을 촉진시키기 위한 제1 코돈 이전의 5' 말단의 KOZAK 서열 및 일련의 A 잔기로 구성된 3' 말단의 폴리A 테일이다. NLS 서열을 갖는 spCas9 mRNA의 일 예는 SEQ ID NO: 340에 제시되어 있다. 또한, spCas9 코딩 서열의 서열을 각 아미노산에 대하여 가장 빈번하게 사용되는 코돈을 사용함으로써 코돈 사용에 대해 최적화시켰다. 또한, mRNA에서 spCas9 단백질로의 효율적인 번역을 촉진시키기 위하여, 코딩 서열을 최적화시켜, 잠재(cryptic) 리보솜 결합 부위 및 상류 오픈 리딩 프레임을 제거하였다.spCas9 mRNA was designed to encode an spCas9 protein fused to a nuclear localization domain (NLS) required to transport the spCas9 protein into a nuclear compartment where cleavage of genomic DNA can occur. An additional component of Cas9 mRNA is a polyA tail at the 3' end consisting of a series of A residues and a KOZAK sequence at the 5' end before the first codon to promote ribosome binding. An example of an spCas9 mRNA having an NLS sequence is set forth in SEQ ID NO: 340. In addition, the sequence of the spCas9 coding sequence was optimized for codon usage by using the most frequently used codon for each amino acid. In addition, to facilitate efficient translation of mRNA to spCas9 protein, the coding sequence was optimized to remove the cryptic ribosome binding site and the upstream open reading frame.

LNPLNP

이들 연구에 사용되는 LNP의 주요 성분은 지질 C12-200이다(상기 문헌[Love et al., 2010]). C12-200은 음으로 하전된 RNA 분자와 복합체를 형성한다. 일반적으로, C12-200을 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE), DMPE-mPEG2000 및 콜레스테롤과 조합하였다. 예를 들어, NanoAssemblr® 디바이스(벤쿠버 BC주 소재의 프리시젼 나노시스템즈(Precision NanoSystems))에서 제어된 조건 하에서 핵산, 예컨대 gRNA 및 mRNA와 혼합되는 경우, LNP의 자가-어셈블리가 발생하였으며, 핵산은 LNP 내측에 캡슐화되었다. gRNA 및 Cas9 mRNA를 LNP 내에 어셈블시키기 위하여, 에탄올 및 지질 원액을 적절한 경우 유리 바이얼 내로 피펫팅하였다. 예시적인 비는 50:10:38.5:1.5의 몰비의 C12-200, DOPE, 콜레스테롤 및 mPEG2000-DMG로 구성되었다. gRNA 및 mRNA를 RNase 부재 튜브에서 100 mM 시트르산나트륨(pH 3.0) 및 300 mM NaCl 중에 희석하였다. NanoAssemblr® 카트리지(프리시젼 나노시스템즈)를 지질 측은 에탄올로, 그리고 RNA 측은 물로 세척하였다. 지질의 작업 원액을 주사기 내로 뽑아내고, 주사기로부터 공기를 제거하고, 주사기를 카트리지에 삽입하였다. 동일한 절차를 주사기에 gRNA 및 Cas9 mRNA의 혼합물을 로딩하기 위해 사용하였다. 그 다음, Nanoassemblr® 시행을 제조업체의 권고된 조건 하에서 수행하였다. LNP 현탁액을 10 K 분자량 컷-오프(MWCO) 투석 카트리지를 사용하여 4 리터의 PBS 중에서 4시간 동안 투석한 다음, 원심분리 동안 PBS 중 3회의 세척을 포함하여, 100 K MWCO 스핀 카트리지(아미콘(Amicon))를 통한 원심분리에 의해 농축하였다. 마지막으로, LNP 현탁액을 0.2 μm 시린지 필터(syringe filter)를 통해 멸균 여과하였다. 상용의 내독소 키트(리물루스 변형세포 용해물(LAL) 검정)를 사용하여 내독소 수준을 결정하였으며, 입자 크기 분포를 동적 광 산란에 의해 결정하였다.The major component of LNP used in these studies is the lipid C12-200 (Love et al., 2010, supra). C12-200 forms a complex with negatively charged RNA molecules. In general, C12-200 was combined with 1,2-dioleoyl-sn-glycero-3-phosphoethanolamine (DOPE), DMPE-mPEG2000 and cholesterol. For example, when mixed with nucleic acids, such as gRNA and mRNA, under controlled conditions in a NanoAssemblr® device (Precision NanoSystems, Vancouver BC), self-assembly of the LNP occurred, and the nucleic acid was inside the LNP. encapsulated in To assemble gRNA and Cas9 mRNA into LNPs, ethanol and lipid stock solutions were pipetted into glass vials as appropriate. An exemplary ratio consisted of C12-200, DOPE, cholesterol and mPEG2000-DMG in a molar ratio of 50:10:38.5:1.5. gRNA and mRNA were diluted in 100 mM sodium citrate (pH 3.0) and 300 mM NaCl in RNase-free tubes. The NanoAssemblr® cartridge (Precision Nanosystems) was washed with ethanol on the lipid side and water on the RNA side. A working stock of lipids was drawn into the syringe, the air was evacuated from the syringe, and the syringe was inserted into the cartridge. The same procedure was used to load the mixture of gRNA and Cas9 mRNA into the syringe. The Nanoassemblr® run was then performed under the conditions recommended by the manufacturer. The LNP suspension was dialyzed for 4 h in 4 liters of PBS using a 10 K molecular weight cut-off (MWCO) dialysis cartridge, followed by 3 washes in PBS during centrifugation, using a 100 K MWCO spin cartridge (Amicon ( Amicon)) by centrifugation. Finally, the LNP suspension was sterile filtered through a 0.2 μm syringe filter. Endotoxin levels were determined using a commercial endotoxin kit (Limulus transformed cell lysate (LAL) assay) and particle size distribution was determined by dynamic light scattering.

캡슐화된 RNA의 농도를 리보그린(RiboGreen)® 검정(써모 피셔)을 사용하여 결정하였다. 대안적으로, gRNA 및 Cas9 mRNA를 개별적으로 LNP 내로 제형화한 다음, 함께 혼합한 다음, 배양 중 세포를 처리하거나, 동물 내로 주사하였다. 개별적으로 제형화된 gRNA 및 Cas9 mRNA를 사용하여, 특정 비의 gRNA 및 Cas9 mRNA가 시험되게 하였다.The concentration of encapsulated RNA was determined using the RiboGreen® assay (Thermo Fisher). Alternatively, gRNA and Cas9 mRNA were separately formulated into LNPs and then mixed together and then treated with cells in culture or injected into animals. Separately formulated gRNA and Cas9 mRNA were used to allow specific ratios of gRNA and Cas9 mRNA to be tested.

대안적인 양이온성 지질 분자를 사용한 대안적인 LNP 제형을 또한 gRNA 및 Cas9 mRNA의 생체내 전달을 위해 사용한다.Alternative LNP formulations using alternative cationic lipid molecules are also used for in vivo delivery of gRNA and Cas9 mRNA.

구축물의 생체내 시험In vivo testing of constructs

쥣과 모델을 사용하여 설계된 구축물이 FVIII을 생성하는 능력을 시험하였다. A형 혈우병의 마우스 모델은 당업계에 알려져 있다(예를 들어, 문헌[L. Bi et al., Nat Genet. (1995) 10:119-21, doi: 10.1038/ng0595-119]). 플라스미드 pCB076, pCB100, pCB1003, pCB085 및 pCB080을 퀴아젠 엔도프리(EndoFree)® 플라스미드 맥시(maxi) 프렙 키트(카탈로그 번호 12362)를 사용하여 정제한 다음, 0.9% 염수 중에 15 μg/mL의 최종 농도로 희석하였다. A형 혈우병 마우스(스트레인 B6; 129S-F8tm1Kaz/J), 마우스 FVIII 단백질을 결여한 마우스의 스트레인을 더 잭슨 래보러터리(The Jackson Laboratory)(미국 메인주 바하버 소재)로부터 수득하였다. A형 혈우병 마우스의 코호트를 유체역학적 주사(“HDI”)에 의해 5 내지 6초의 기간에 걸쳐 마우스당 2 mL의 희석된 플라스미드 DNA를 꼬리 정맥을 통해 주사하였다. HDI 과정은 간세포를 포함하는 간 세포의 핵 내로의 플라스미드 DNA의 전달을 초래하는 것으로 보고되었다(예를 들어, 문헌[F. Niola et al., Meth Mol Biol (2019) 1961:329-41] 참조). 주사 1일 후에, spCas9 mRNA 및 가이드 RNA mAlbT1을 캡슐화하는 LNP 제형의 안와후방(“RO”) 주사를 마우스에 제공하였다. 마우스에 투여되는 LNP의 용량은 1 mg/kg(체중)의 spCas9 mRNA + 체중 kg당 1 mg/kg의 gRNA였다.A murine model was used to test the ability of the designed constructs to generate FVIII. Mouse models of hemophilia A are known in the art (eg L. Bi et al., Nat Genet . (1995) 10 :119-21, doi: 10.1038/ng0595-119). Plasmids pCB076, pCB100, pCB1003, pCB085 and pCB080 were purified using Qiagen EndoFree® plasmid maxi prep kit (Cat. No. 12362), then to a final concentration of 15 μg/mL in 0.9% saline. diluted. Hemophilia A mice (strain B6; 129S-F8 tm1Kaz /J), strains of mice lacking the mouse FVIII protein were obtained from The Jackson Laboratory (Bar Harbor, Maine, USA). Cohorts of hemophilia A mice were injected via tail vein with 2 mL of diluted plasmid DNA per mouse by hydrodynamic injection (“HDI”) over a period of 5 to 6 seconds. The HDI process has been reported to result in the transfer of plasmid DNA into the nucleus of hepatocytes, including hepatocytes (see, e.g., F. Niola et al., Meth Mol Biol (2019) 1961 :329-41). ). One day after injection, mice were given a retroorbital (“RO”) injection of an LNP formulation encapsulating spCas9 mRNA and guide RNA mAlbT1. The dose of LNP administered to mice was 1 mg/kg (body weight) of spCas9 mRNA + 1 mg/kg of gRNA/kg body weight.

LNP만을 투여한 마우스의 군을 3일 후에 희생시키고, DNA를 전체 간으로부터 추출하고, mAlbT1 gRNA에 대한 예상되는 절단 부위에서의 삽입 및 결실에 대하여 TIDE 분석(문헌[E.K. Brinkman et al., Nuc Acid Res (2014) 42:e168])을 사용하여 검정하였다. TIDE 분석에서, 예상되는 CRISPR/Cas9 절단 부위의 게놈 영역을 처리된 세포의 게놈 DNA로부터 PCR에 의해 증폭시킨 다음, 생거(Sanger) 서열분석으로 처리한다. 서열분석 크로마토그램을 예상되는 절단 부위 근처의 영역에서 삽입 및 결실의 빈도를 결정하는 TIDE 소프트웨어 프로그램을 사용하여 분석한다.Groups of mice administered only LNP were sacrificed after 3 days, DNA was extracted from whole liver, and TIDE analysis for insertions and deletions at the expected cleavage site for mAlbT1 gRNA (EK Brinkman et al., Nuc Acid Res (2014) 42 :e168]). In the TIDE analysis, the genomic region of the predicted CRISPR/Cas9 cleavage site is amplified by PCR from the genomic DNA of the treated cells and then subjected to Sanger sequencing. The sequencing chromatograms are analyzed using the TIDE software program to determine the frequency of insertions and deletions in regions near the expected cleavage site.

이들 실험에서, 온-표적 부위에서의 삽입 및 결실의 빈도는 25.4%인 것으로 결정되었다. 플라스미드를 주사한 마우스에 LNP를 투여한 지 6일 후에, 혈액 시료를 RO 채혈에 의해 시트르산나트륨 중에 취하고(1:9 비의 시트르산나트륨 대 혈액), 혈장을 원심분리에 의해 수집하였다. 혈장 중 FVIII 활성을 FVIII 활성 검정(디아파마(Diapharma), 크로모제닉스 코아테스트(Chromogenix Coatest)® SP 인자 FVIII, 카탈로그 번호 K824086)을 사용하여 측정하였다. 코게나트(Kogenate)®(바이엘(Bayer)), 즉, 재조합 인간 FVIII을 표준물질을 위해 사용하였으며, mL당 혈중 FVIII 활성의 유닛을 정상 활성의 백분율로 전환시켰다(1 U/mL = 100%). 결과를 도 1에 요약한다. B 도메인 대신에 6개의 N-글리칸 B 도메인 치환물 서열을 함유하는 플라스미드 pCB076을 주사한 마우스는 정상 인간 FVIII 수준의 20%와 동등한 평균 합성 FVIII 수준을 가졌다. 대조적으로, 6개의 N-글리칸 B 도메인 치환물 서열의 부재를 제외하고, pCB076과 동일한 pCB100 플라스미드를 주사한 마우스는 그들의 혈중에 검출 가능한 FVIII 수준을 갖지 않았다. 6개의 N-글리칸 B 도메인 치환물 서열을 결여한 상이하게 코돈-최적화된 B 도메인 결실된 FVIII 코딩 서열을 함유하는 플라스미드 pCB1003, pCB085 또는 pCB080을 주사한 마우스는 비-유전자 편집된(나이브(naive)) A형 혈우병 마우스와 비교하는 경우 그들의 혈중에 낮은 또는 측정 가능하지 않은 FVIII 활성을 가졌다. pCB1003 및 pCB080을 주사한 마우스의 일부는 그들의 혈중에 정상의 1 내지 3%의 범위의 검출 가능한 FVIII을 가졌으며, 이는 코돈 최적화 co2(pCB1003) 및 co4(pCB080)가 코돈 최적화 co1(pCB100) 및 co3(pCB085)보다 더 활성일 수 있는 것을 나타낸다.In these experiments, the frequency of insertions and deletions at on-target sites was determined to be 25.4%. Six days after LNP administration to mice injected with the plasmid, blood samples were taken in sodium citrate by RO bleed (1:9 ratio sodium citrate to blood), and plasma was collected by centrifugation. FVIII activity in plasma was determined using the FVIII activity assay (Diapharma, Chromogenix Coatest® SP Factor FVIII, catalog number K824086). Kogenate® (Bayer), ie recombinant human FVIII, was used for the standard, and units of FVIII activity in blood per mL were converted to percentage of normal activity (1 U/mL = 100%) . The results are summarized in FIG. 1 . Mice injected with plasmid pCB076 containing six N-glycan B domain substitution sequences instead of the B domain had mean synthetic FVIII levels equivalent to 20% of normal human FVIII levels. In contrast, mice injected with the pCB100 plasmid identical to pCB076, except for the absence of the six N-glycan B domain substitution sequences, had no detectable FVIII levels in their blood. Mice injected with plasmids pCB1003, pCB085 or pCB080 containing a differentially codon-optimized B domain deleted FVIII coding sequence lacking six N-glycan B domain substitution sequences were treated with non-genetically edited (naive) )) had low or no measurable FVIII activity in their blood when compared to hemophilia A mice. Some of the mice injected with pCB1003 and pCB080 had detectable FVIII in their blood in the range of 1 to 3% of normal, indicating that codon-optimized co2 (pCB1003) and co4 (pCB080) were codon-optimized co1 (pCB100) and co3 (pCB085).

이 연구에서 마우스의 혈중에 생성되는 FVIII의 수준은 알부민 인트론 1 내로의 정방향 배향(FVIII 단백질을 생성할 수 있는 배향)으로의 표적화된 통합의 빈도 및 FVIII 코딩 서열의 고유 발현 효율 둘 모두에 의해 좌우되었다. FVIII 코딩 서열의 고유 발현 효율은 전사 효율, 번역 효율(사용되는 코돈 최적화의 유형에 의해 달라짐) 및 분비 과정의 효율의 함수이다. FVIII 단백질의 경우에, 단백질의 분비가 속도 제한 단계일 수 있으며, FVIII가 세포에서 높은 수준으로 발현되는 경우에 유도될 수 있는 비폴딩된 단백질 반응과 관련이 있는 것이 보고되었다. (문헌[M. Swaroop et al., J Biol Chem (1997) 272:24121-24]; 문헌[R.J. Kaufman, Blood (2009) 114:SCI-19]).The level of FVIII produced in the blood of mice in this study was governed by both the frequency of targeted integration into albumin intron 1 (an orientation capable of producing FVIII protein) and the efficiency of intrinsic expression of the FVIII coding sequence. became The intrinsic expression efficiency of the FVIII coding sequence is a function of transcription efficiency, translation efficiency (depending on the type of codon optimization used) and the efficiency of the secretion process. In the case of FVIII protein, it has been reported that secretion of the protein may be a rate limiting step and is associated with an unfolded protein response that may be induced when FVIII is expressed at high levels in cells. (M. Swaroop et al., J Biol Chem (1997) 272 :24121-24; RJ Kaufman, Blood (2009) 114 :SCI-19).

HDI에 의한 공여자의 전달의 효율의 가변성 또는 다른 인자로 인하여 마우스 간에 달라질 수 있는 표적화된 통합 빈도와, 합성 FVIII 코딩 서열의 고유 발현 효율을 구별하기 위하여, 표적화된 통합 빈도를 드롭렛 디지털 PCR(DD-PCR)을 사용하여 정량화하였다. DD-PCR은 시료 내의 핵산 서열의 절대 카피수의 정량화 방법이다. 알부민 인트론 1 내로 삽입되는 합성 FVIII 코딩 서열 카세트의 정방향 배향을 정량화하기 위하여, PCR 프라이머의 쌍을 설계하였으며, 정방향 프라이머는 gRNA mALbT1 절단 부위의 5’ 부위에서 알부민 인트론 1에 위치하며, 역방향 프라이머는 FVIII 코딩 서열의 5’ 말단에 위치한다. 2개의 프라이머 사이의 서열에 상보적인 형광 프로브를 설계하였다. mALbT1 gRNA 부위로부터 원위의 부위에서 고유 마우스 알부민 유전자 서열에 대하여 참조 프라이머/프로브 세트를 설계하였다. 참조 프라이머 프로브를 사용하여, 각 검정에서 투입 마우스 게놈 DNA의 양에 대하여 정규화시켰다.To distinguish the intrinsic expression efficiency of the synthetic FVIII coding sequence from the targeted integration frequency, which may vary between mice due to variability in the efficiency of delivery of donors by HDI or other factors, the targeted integration frequency was calculated using droplet digital PCR (DD). -PCR) was used for quantification. DD-PCR is a method for quantifying the absolute copy number of a nucleic acid sequence in a sample. To quantify the forward orientation of the synthetic FVIII coding sequence cassette inserted into albumin intron 1, a pair of PCR primers was designed, the forward primer was located in albumin intron 1 at the 5' site of the gRNA mALbT1 cleavage site, and the reverse primer was FVIII It is located at the 5' end of the coding sequence. A fluorescent probe complementary to the sequence between the two primers was designed. A reference primer/probe set was designed against the native mouse albumin gene sequence at a site distal from the mALbT1 gRNA site. Reference primer probes were used to normalize to the amount of input mouse genomic DNA in each assay.

이 분석을 수행하기 위하여, 상기 기술된 실험으로부터의 마우스를 마우스에 LNP를 투여한 지 8일 후에 희생시켰다. 전체 간을 균질화시키고, 전체 게놈 DNA를 퀴아젠 DNeasy® 조직 키트를 사용하여 정제하였다. 그 다음, 동일한 질량의 게놈 DNA를 상기 기술된 DD-PCR 검정을 사용하여 표적화된 통합 빈도에 대하여 검정하였다. 각각의 마우스에 대한 결과는 표 2에 요약되어 있다. 정방향 배향의 표적화된 통합 빈도는 0.09 % 내지 0.95% 범위였다(100개의 반수체 게놈당 0.09 내지 0.95 카피). 혈중 피크 FVIII 수준은 통합 빈도와 양의 상관관계가 있었으며, 이는 FVIII의 수준이 알부민 인트론 1 내로 통합된 FVIII 카세트의 카피의 수에 좌우되었음을 나타낸다. pCB100을 주사한 마우스에서의 0.28 ±0.15에 비하여, pCB076을 주사한 마우스에서의 평균 표적화된 통합 빈도는 0.47 ±0.26이었으며, 이는 이 차이가 통계적으로 유의미하지 않았지만, SQ 링커 대신에 B 도메인 치환물을 함유하는 pCB076을 주사한 마우스에서 더 높은 통합 빈도의 경향을 나타낸다.To perform this assay, mice from the experiments described above were sacrificed 8 days after administration of LNP to the mice. Whole livers were homogenized and whole genomic DNA was purified using the Qiagen DNeasy® tissue kit. Genomic DNA of equal mass was then assayed for targeted integration frequencies using the DD-PCR assay described above. Results for each mouse are summarized in Table 2. Targeted integration frequencies of forward orientation ranged from 0.09% to 0.95% (0.09 to 0.95 copies per 100 haploid genomes). Peak FVIII levels in blood correlated positively with integration frequency, indicating that the levels of FVIII depended on the number of copies of the FVIII cassette integrated into albumin intron 1. The mean targeted integration frequency in mice injected with pCB076 was 0.47 ± 0.26, compared to 0.28 ± 0.15 in mice injected with pCB100, which was not statistically significant, although B domain substitutions were used instead of the SQ linker. showing a trend for higher integration frequency in mice injected with pCB076 containing

[표 2] 혈중 피크 FVIII 수준에 비하여 마우스의 간에서의 표적화된 통합 빈도Table 2 Targeted integration frequency in the liver of mice compared to peak FVIII levels in blood

Figure pct00003
Figure pct00003

통합 빈도에 대한 각 마우스의 혈중 FVIII 수준의 정규화는 FVIII 코딩 서열의 고유 발현 효율의 척도를 제공한다. 표적화된 통합 빈도로 나눈 FVIII 수준의 비의 평균은 pCB076에 대하여 42 및 pCB100에 대하여 5.3이었으며, 이 차이는 양측 스튜던츠 T-검정(two-tailed Student’s T-test)을 사용하여 결정하여 통계적으로 유의미하였다(p=0.0004). 이들 결과는 pCB076 내의 합성 FVIII 코딩 서열의 고유 발현 효율이 pCB100 내의 코딩 서열의 것보다 약 8배 더 큰 것을 보여준다. 이는 SQ 링커 대신에 B 도메인 치환물을 인코딩하는 서열을 포함하는 것이 이 코돈-최적화된 FVIII 코딩 서열의 고유 발현 효율을 약 8배 개선시킨 것을 보여준다. 이 개선의 세기는 FVIII 코딩 서열이 비-통합 AAV 바이러스에서 전달되고, FVIII 코딩 서열이 강력한 간 특이적 프로모터에 의해 유도되는 경우, 동일한 6개의 글리칸 모티프 서열에 대하여 보고된 2배의 개선보다 유의미하게 더 크다(문헌[J. McIntosh et al., Blood (2013) 121:3335-44]).Normalization of each mouse's blood FVIII level to the integration frequency provides a measure of the efficiency of intrinsic expression of the FVIII coding sequence. The mean of the ratio of FVIII levels divided by the targeted integration frequency was 42 for pCB076 and 5.3 for pCB100, and this difference was statistically significant as determined using a two-tailed Student's T-test. (p=0.0004). These results show that the intrinsic expression efficiency of the synthetic FVIII coding sequence in pCB076 is about 8-fold greater than that of the coding sequence in pCB100. This shows that inclusion of the sequence encoding the B domain substitution instead of the SQ linker improved the native expression efficiency of this codon-optimized FVIII coding sequence by about 8-fold. The magnitude of this improvement is more significant than the 2-fold improvement reported for the same six glycan motif sequences when the FVIII coding sequence is delivered in a non-integrating AAV virus and the FVIII coding sequence is driven by a strong liver-specific promoter. significantly larger (J. McIntosh et al., Blood (2013) 121 :3335-44).

실시예 2Example 2 : B 도메인 치환물을 사용한 SQ 링커의 대체는 AAV에 의해 전달되고 알부민의 인트론 1 내로 통합되는 FVIII 공여자 카세트로부터 FVIII 발현을 증가시킨다: Replacement of the SQ linker with a B domain substitution increases FVIII expression from the FVIII donor cassette delivered by AAV and integrated into intron 1 of albumin.

합성 FVIII 코딩 서열을 AAV를 사용하여 마우스의 간으로 전달하는 경우 B 도메인 치환 펩티드의 동일한 유리한 효과가 발생하는지 여부를 결정하기 위하여, 플라스미드 pCB099(SEQ ID NO: 311) 및 pCB102(SEQ ID NO: 341)를 구축하고 AAV8(미국 펜실베니아주 맬번 소재의 벡터 바이오랩스(Vector Biolabs) 또는 미국 펜실베니아주 필라델피아 소재의 샙테크(SabTech))에 패키징하였다. 플라스미드를 (순서대로) 하기의 요소를 사용하여 구축하였다: ITR | (mAlbT1에 대한) gRNA 표적 부위 | 18 bp 스페이서 | 스플라이스 수여자 부위(“SA”) | FVIII 코딩 서열 | 폴리아데닐화 신호(“sPA”) | gRNA 표적 부위 | ITR. pCB099 및 pCB102에 대한 FVIII 코딩 서열은 각각 pCB076(B 도메인 치환물을 가짐) 및 pCB100(SQ 링커만을 가짐)에 대한 FVIII 코딩 서열과 동일하였다. 이들 FVIII 카세트는 프로모터를 결여하며, 그래서 비-통합된 AAV 에피솜 게놈으로서 FVIII을 발현할 수 없다. 적절한 프로모터에 인접한 통합은 이들 AAV 바이러스에 의해 전달되는 FVIII의 발현에 필요하다.To determine whether the same beneficial effect of the B domain-substituted peptide occurs when the synthetic FVIII coding sequence is transferred to the liver of mice using AAV, plasmids pCB099 (SEQ ID NO: 311) and pCB102 (SEQ ID NO: 341) ) and packaged in AAV8 (Vector Biolabs, Malvern, PA or SabTech, Philadelphia, PA). Plasmids were constructed (in order) using the following elements: ITR | gRNA target site (for mAlbT1) | 18 bp spacer | Splice Recipient Site (“SA”) | FVIII coding sequence | polyadenylation signal (“sPA”) | gRNA target site | ITR. The FVIII coding sequences for pCB099 and pCB102 were identical to the FVIII coding sequences for pCB076 (with B domain substitution) and pCB100 (with SQ linker only), respectively. These FVIII cassettes lack a promoter and thus cannot express FVIII as a non-integrated AAV episomal genome. Integration adjacent to the appropriate promoter is required for expression of FVIII delivered by these AAV viruses.

이들 실험에서, A형 혈우병 마우스에 체중 킬로그램당 2 x 1012 벡터 게놈(“vg”)의 AAV8-pCB099 또는 AAV8-pCB102를 정맥내 주사하였다. 4주 후에, 2개의 LNP의 1:1 혼합물을 마우스에 정맥내 주사하였으며, 하나의 LNP는 mAlbT1 gRNA를 캡슐화하고, 다른 LNP는 spCas9 mRNA를 캡슐화한다. LNP를 실시예 1에 기술된 바와 같이 제조하였으며, 총 용량은 체중 kg당 2 mg의 RNA였다. FVIII 활성을 실시예 1에 제시된 방법을 사용하여 LNP를 투여한 지 10일 후에 마우스의 혈중에서 측정하였다. LNP의 투여를 투여한 지 10일 후에 마우스의 혈중 FVIII 수준(도 2)은 AAV9-pCB099를 제공한 마우스에 대하여 정상 인간 FVIII 수준의 평균 20%였지만, AAV8-pCB102(B 도메인 치환물 결여)를 제공한 마우스에서는 백그라운드 수준이었다.In these experiments, hemophilia A mice were injected intravenously with 2×10 12 vector genomes (“vg”) of AAV8-pCB099 or AAV8-pCB102 per kilogram of body weight. After 4 weeks, mice were injected intravenously with a 1:1 mixture of two LNPs, one LNP encapsulating mAlbT1 gRNA and the other LNP encapsulating spCas9 mRNA. LNPs were prepared as described in Example 1, and the total dose was 2 mg of RNA per kg body weight. FVIII activity was measured in the blood of mice 10 days after LNP administration using the method presented in Example 1. Blood FVIII levels of mice 10 days after administration of LNP ( FIG. 2 ) were on average 20% of normal human FVIII levels relative to mice receiving AAV9-pCB099, whereas AAV8-pCB102 (lack of B domain substitution) In the provided mouse, it was background level.

LNP를 투여한 지 24일 후에, 마우스를 희생시키고, 전체 간을 균질화시키고, 총 게놈 DNA를 간 용해물의 일부로부터 추출하였다. 정방향 배향으로의 알부민 인트론 1 내로의 표적화된 통합의 빈도를 실시예 1에 기술된 DD-PCR 검정을 사용하여 정량화하였다. 각각의 마우스에 대한 결과는 표 3에 요약되어 있다.Twenty-four days after LNP administration, mice were sacrificed, whole livers were homogenized, and total genomic DNA was extracted from a portion of liver lysates. The frequency of targeted integration into albumin intron 1 in forward orientation was quantified using the DD-PCR assay described in Example 1. Results for each mouse are summarized in Table 3.

결과는 AAV8-pCB099를 주사한 마우스에서의 평균 표적화된 통합 빈도(반수체 게놈당 %)가 1.86(±0.25)인 한편, AAV8-pCB102를 주사한 마우스에 있어서, 평균 표적화된 통합 빈도가 0.46(±0.2)이었음을 보여준다. 이 차이는 양측 스튜던츠 T-검정을 사용하여 통계적으로 유의미하였다(p<0.01). 이들 결과는 B 도메인 치환물의 포함이 4배 더 큰 표적화된 통합의 빈도를 초래한 것을 보여주며, 이는 FVIII의 B 도메인 대신에 글리칸의 이전의 포함이 FVIII의 발현 수준을 개선시키는 것으로 나타나게 될 뿐인 것을 고려하여, 예측되지 않은 결과이다. AAV8-pCB099를 주사한 마우스의 혈중 평균 FVIII 수준은 정상의 18.6(± 2.2)%였던 한편, AAV8-pCB102를 주사한 마우스에 있어서, 평균 FVIII 수준은 정상의 1.7(±1.1)%였다. 이 11배 차이는 양측 스튜던츠 T-검정을 사용하여 통계적으로 유의미하였다(p<0.01). FVIII 수준을 개별 마우스에서의 표적화된 통합 빈도로 나누어, FVIII 수준을 표적화된 통합 빈도에 대해 정규화시켰다(표 3). 표적화된 통합 빈도로 나눈 FVIII 활성의 비의 평균은 AAV8-pCB099 주사된 마우스에 대하여 10.2(±1.7)였으며, AAV8-pCB102 주사된 마우스에 대하여 3.1(± 1.7)이었다. 이 차이는 양측 스튜던츠 T-검정을 사용하여 통계적으로 유의미하였다(p<0.01).The results show that the mean targeted integration frequency (% per haploid genome) in mice injected with AAV8-pCB099 was 1.86 (±0.25), while in mice injected with AAV8-pCB102, the average targeted integration frequency was 0.46 (±0.25). 0.2) was shown. This difference was statistically significant using two-tailed Student's T-test (p<0.01). These results show that inclusion of the B domain substitution resulted in a 4-fold greater frequency of targeted integration, which would only result in the previous inclusion of a glycan in place of the B domain of FVIII to appear to improve the expression level of FVIII. Considering that, this is an unexpected result. The mean FVIII level in the blood of mice injected with AAV8-pCB099 was 18.6 (± 2.2)% of normal, whereas in mice injected with AAV8-pCB102, the mean FVIII level was 1.7 (± 1.1)% of normal. This 11-fold difference was statistically significant (p<0.01) using a two-tailed Student's T-test. FVIII levels were divided by the targeted integration frequency in individual mice, and FVIII levels were normalized to the targeted integration frequency (Table 3). The mean of the ratio of FVIII activity divided by the targeted integration frequency was 10.2 (±1.7) for AAV8-pCB099 injected mice and 3.1 (± 1.7) for AAV8-pCB102 injected mice. This difference was statistically significant using two-tailed Student's T-test (p<0.01).

이들 데이터는 AAV8-pCB099 내의 FVIII 코딩 서열의 고유 발현 효율이 AAV8-pCB102의 것보다 3배 더 높은 것을 보여준다. AAV8-pCB099가 N-글리칸 모티프 함유 서열의 존재만이 AAV8-pCB102와 상이하기 때문에, 이들 데이터는 AAV8-pCB099 내의 N-글리칸 모티프가 고유 발현 효율의 3배 개선을 부여하는 것을 보여준다. 따라서, 마우스의 혈중 FVIII 수준의 전체 11배 개선은 4배 더 높은 표적화된 통합과, 통합된 FVIII 코딩 서열의 3배 개선된 발현 효율의 조합에 의한 것이다.These data show that the intrinsic expression efficiency of the FVIII coding sequence in AAV8-pCB099 is 3-fold higher than that of AAV8-pCB102. Because AAV8-pCB099 differs from AAV8-pCB102 only in the presence of an N-glycan motif containing sequence, these data show that the N-glycan motif in AAV8-pCB099 confers a 3-fold improvement in intrinsic expression efficiency. Thus, an overall 11-fold improvement in blood FVIII levels in mice is due to the combination of a 4-fold higher targeted integration with a 3-fold improved expression efficiency of the integrated FVIII coding sequence.

[표 3] AAV8 바이러스에 이어서 Cas9 mRNA 및 mALbT1 gRNA를 캡슐화하는 LNP를 주사한 마우스에 대한 혈중 피크 FVIII 수준에 비하여 마우스의 간에서의 표적화된 통합 빈도Table 3 Targeted integration frequency in the liver of mice compared to peak FVIII levels in blood for mice injected with AAV8 virus followed by LNP encapsulating Cas9 mRNA and mALbT1 gRNA

Figure pct00004
Figure pct00004

실시예 3Example 3 : B 도메인 치환물 내의 N-글리칸의 수의 최적화: Optimization of the number of N-glycans in B domain substitutions

실시예 1 및 2로부터의 데이터는 6개의 N-연결된 글리칸 모티프를 함유하는 B 도메인 치환물의 삽입이 FVIII의 발현 및 표적화된 통합의 빈도를 개선시켰음을 보여준다. 그러나, B 도메인 치환물 내의 N-글리칸 서열의 수에 대한 이 개선의 의존성은 알려져 있지 않았다. 따라서, 본 발명자들은 FVIII 발현의 이 양태를 조사하기 위한 실험을 설계하였다. 특히, FVIII 발현의 개선에 필요한 최소의 N-연결된 글리칸 모티프의 수를 결정하는 것이 바람직하였다.Data from Examples 1 and 2 show that insertion of a B domain substitution containing six N-linked glycan motifs improved the expression of FVIII and the frequency of targeted integration. However, the dependence of this improvement on the number of N-glycan sequences in the B domain substitution was not known. Therefore, we designed experiments to examine this aspect of FVIII expression. In particular, it was desirable to determine the minimum number of N-linked glycan motifs required for improvement of FVIII expression.

플라스미드 구축물Plasmid constructs

발현에 대한 상이한 수의 N-글리칸 모티프의 효과를 탐색하기 위하여, 1개 내지 9개의 N-글리칸 모티프를 함유하는 일련의 공여자 플라스미드를 구축하였다. 이들은 표 4에 요약되어 있다. 모든 플라스미드는 5’에서 3’의 순서로 하기의 서열 요소로 구성되었다: mAlbT1 gRNA에 대한 표적 서열 | 18 bp 스페이서 | 스플라이스 수여자 | 신호 펩티드가 TG 디뉴클레오티드로 대체된 B 도메인 결실된 FVIII 코딩 서열 | 폴리아데닐화 신호 서열. 각각의 이들 플라스미드에서, FVIII 코딩 서열은 pCB076에서 사용되는 코돈 최적화된 서열에 기초하였으며(실시예 1 참조), 신호 펩티드가 TG 디뉴클레오티드로 대체되지만, B 도메인 치환물 내에 1 내지 9개의 N-연결된 글리코실화 부위를 갖는다. 모든 플라스미드는 동일한 pUC19-기반의 박테리아 플라스미드 백본(박테리아 복제 원점 및 카나마이신 내성 유전자 함유)을 함유하였다.To explore the effect of different numbers of N-glycan motifs on expression, a series of donor plasmids containing 1 to 9 N-glycan motifs were constructed. These are summarized in Table 4. All plasmids consisted of the following sequence elements in 5' to 3' order: target sequence for mAlbT1 gRNA | 18 bp spacer | Splice Grants | B domain deleted FVIII coding sequence with signal peptide replaced by TG dinucleotide | Polyadenylation signal sequence. In each of these plasmids, the FVIII coding sequence was based on the codon optimized sequence used in pCB076 (see Example 1), in which the signal peptide was replaced by a TG dinucleotide, but 1 to 9 N-linked in the B domain substitution. It has a glycosylation site. All plasmids contained the same pUC19-based bacterial plasmid backbone (containing the bacterial origin of replication and the kanamycin resistance gene).

[표 4] B 도메인 치환물 내에 상이한 수의 N-글리코실화 부위 트리플렛을 함유하는 FVIII 공여자 플라스미드Table 4 FVIII donor plasmids containing different numbers of N-glycosylation site triplets in B domain substitutions

Figure pct00005
Figure pct00005

구축물의 생체내 시험: 5, 6 및 7개의 글리칸In vivo testing of constructs: 5, 6 and 7 glycans

A형 혈우병 마우스에 실시예 1의 방법을 사용하여 유체역학적 주사에 의해 마우스당 30 μg의 플라스미드 pCB077, pCB1006, pCB1007 또는 pCB1008를 투여하였다. 1일 후에, 동일한 마우스에 spCas9 mRNA 및 mALbT1 gRNA를 캡슐화하는 LNP의 1:1 혼합물을 2 mg/kg(체중)의 전체 RNA 용량으로 안와후방으로 주사하였다. LNP를 실시예 1에 기술된 바와 같이 제조하였다. FVIII 활성을 실시예 1에 제시된 방법을 사용하여 6일 후에 마우스의 혈중에서 측정하였다. 결과는 도 3에 요약되어 있으며, 4개의 플라스미드 공여자에 의해 생성되는 FVIII의 수준이 유사하였음을 보여주었다.Hemophilia A mice were administered with 30 μg of plasmids pCB077, pCB1006, pCB1007 or pCB1008 per mouse by hydrodynamic injection using the method of Example 1. One day later, the same mice were injected retroorbitally with a 1:1 mixture of LNP encapsulating spCas9 mRNA and mALbT1 gRNA at a total RNA dose of 2 mg/kg body weight. LNPs were prepared as described in Example 1. FVIII activity was measured in the blood of mice after 6 days using the method presented in Example 1. The results are summarized in Figure 3 and showed that the levels of FVIII produced by the four plasmid donors were similar.

본 연구에서 마우스의 혈액에서 생성된 FVIII의 수준은 정방향 배향(FVIII 단백질을 생성할 수 있는 배향)의 알부민 인트론 1 내로의 표적화된 통합의 빈도 및 FVIII 코딩 서열의 고유 발현 효율 둘 모두에 좌우된다. FVIII 코딩 서열의 고유 발현 효율은 전사 속도, 번역 효율(사용되는 코돈 최적화의 유형에 의해 영향을 받음) 및 분비 과정의 효율의 함수이다. FVIII 단백질의 경우에, 단백질의 분비가 속도 제한 단계(상기 문헌[M. Swaroop et al.])일 수 있으며, FVIII이 세포에서 높은 수준으로 발현되는 경우에 발생하는 비폴딩된 단백질 반응과 연관이 있는 것이 제시되었다(상기 문헌[R.J. Kaufman]). 개별 마우스 간에 달라질 것으로 예상되는 표적화된 통합 빈도와, 표적화된 합성 FVIII 코딩 서열의 고유 발현 효율을 구별하기 위하여, 표적화된 통합 빈도를 실시예 1에 기술된 바와 같은 드롭렛 디지털 PCR(DD-PCR)을 사용하여 정량화하였다.The level of FVIII produced in the blood of mice in this study is dependent on both the frequency of targeted integration into albumin intron 1 in the forward orientation (an orientation capable of producing FVIII protein) and the intrinsic expression efficiency of the FVIII coding sequence. The intrinsic expression efficiency of the FVIII coding sequence is a function of transcription rate, translation efficiency (affected by the type of codon optimization used) and the efficiency of the secretion process. In the case of the FVIII protein, secretion of the protein may be a rate limiting step (M. Swaroop et al. supra) and is associated with the unfolded protein response that occurs when FVIII is expressed at high levels in cells. has been suggested (RJ Kaufman, supra). To differentiate between the targeted integration frequency, which is expected to vary between individual mice, and the intrinsic expression efficiency of the targeted synthetic FVIII coding sequence, the targeted integration frequency was subjected to droplet digital PCR (DD-PCR) as described in Example 1 . was used for quantification.

마우스에 LNP를 투여한 지 8일 후에, 마우스를 희생시키고, 전체 간을 균질화시키고, 전체 게놈 DNA를 퀴아젠 DNeasy® 조직 키트를 사용하여 정제하였다. 그 다음, 동일한 질량의 게놈 DNA를 DD-PCR을 사용하여 표적화된 통합 빈도에 대하여 검정하였다. 각각의 마우스에 대한 결과는 표 5에 요약되어 있다. 정방향 배향의 표적화된 통합 빈도는 개별 마우스에서 0.17% 내지 0.70%의 범위였지만, 4개의 플라스미드에 대하여 각각의 마우스의 군 내의 평균은 각각 pCB077, pCB1006, pCB1007 및 pCB1008에 대하여 0.49%, 0.47%, 0.52% 및 0.38%로 유사하였다. pCB077, pCB1006, pCB1007 및 pCB1008을 주사한 마우스에 대한 FVIII 활성 대 TI의 비의 평균은 각각 51.33, 48.54, 48.9 및 38.9였으며, 플라스미드 간의 차이는 통계적으로 유의미하지 않았다. 이들 결과는 5개의 N-글리칸 부위(pCB1007) 또는 7개의 글리칸 부위(pCB1008)를 함유하거나, 글리칸 트리펩티드 모티프 중 하나가 NDS에서 NDT로 변경된(pCB1006) 합성 FVIII 코딩 서열이 6개의 N-글리칸 부위를 인코딩하는 합성 FVIII 코딩 서열(pCB077)에 비하여 유사한 고유 발현 효율을 갖는 것을 보여준다.Eight days after LNP administration to mice, mice were sacrificed, whole livers were homogenized, and whole genomic DNA was purified using Qiagen DNeasy® tissue kit. Genomic DNA of equal mass was then assayed for targeted integration frequency using DD-PCR. Results for each mouse are summarized in Table 5. The frequency of targeted integration of the forward orientation ranged from 0.17% to 0.70% in individual mice, but the mean within groups of each mouse for the four plasmids was 0.49%, 0.47%, 0.52 for pCB077, pCB1006, pCB1007 and pCB1008, respectively. % and 0.38%. The mean ratios of FVIII activity to TI for mice injected with pCB077, pCB1006, pCB1007 and pCB1008 were 51.33, 48.54, 48.9 and 38.9, respectively, and the differences between the plasmids were not statistically significant. These results show that the synthetic FVIII coding sequence contains either 5 N-glycan sites (pCB1007) or 7 glycan sites (pCB1008), or one of the glycan tripeptide motifs is changed from NDS to NDT (pCB1006) is 6 N - Shows that it has a similar intrinsic expression efficiency compared to the synthetic FVIII coding sequence encoding the glycan region (pCB077).

동일한 마우스 연구를 N-글리칸 모티프의 수가 각각 8개 및 9개로 변경된 플라스미드 pCB1015(SEQ ID NO: 328) 및 pCB1016(SEQ ID NO: 329)을 사용하여 수행하였다. 또한, 오직 1개 또는 2개의 N-글리칸 모티프를 갖는 것을 제외하고 pCB077과 동일한 플라스미드를 구축하였으며, LNP에서 전달되는 동일한 gRNA 및 spCas9 mRNA를 사용한 마우스 알부민 인트론 1 내로의 표적화된 통합 후에 그들이 FVIII을 발현하는 능력에 대하여 시험하였다.The same mouse study was performed using plasmids pCB1015 (SEQ ID NO: 328) and pCB1016 (SEQ ID NO: 329) in which the number of N-glycan motifs was changed to 8 and 9, respectively. In addition, a plasmid identical to pCB077 was constructed except that it had only one or two N-glycan motifs, and after targeted integration into mouse albumin intron 1 using the same gRNA and spCas9 mRNA delivered from the LNP, they released FVIII. The ability to express was tested.

[표 5] 혈중 피크 FVIII 수준에 비한 마우스의 간에서의 표적화된 통합 빈도TABLE 5 Targeted Integration Frequency in the Liver of Mice Compared to Peak FVIII Levels in Blood

Figure pct00006
Figure pct00006

구축물의 생체내 시험: 3, 4 및 5개의 글리칸In vivo testing of constructs: 3, 4 and 5 glycans

플라스미드 pCB1007, pCB1017 및 pCB1018을 상기 기술된 바와 같이 정제하고, A형 혈우병 마우스에 투여하였다. 1일 후에, 마우스에 spCas9 mRNA(1 mg/kg) 및 가이드 RNA(gRNA) mAlbT1(1 mg/kg)을 캡슐화하는 C12-200 기반의 LNP의 안와후방(“RO”) 주사를 제공하였다. LNP 투여 후 5일 및 7일에 혈액 시료를 RO 채혈에 의해 시트르산나트륨 중에 취하고(1:9 비의 시트르산나트륨 대 혈액), 혈장을 원심분리에 의해 수집하였다. 혈장 중 FVIII 활성을 실시예 1에 제시된 방법을 사용하여 측정하였다.Plasmids pCB1007, pCB1017 and pCB1018 were purified as described above and administered to hemophilia A mice. One day later, mice received retroorbital (“RO”) injections of C12-200-based LNPs encapsulating spCas9 mRNA (1 mg/kg) and guide RNA (gRNA) mAlbT1 (1 mg/kg). On days 5 and 7 post LNP administration, blood samples were taken in sodium citrate by RO bleed (sodium citrate to blood in a 1:9 ratio) and plasma was collected by centrifugation. FVIII activity in plasma was measured using the method set forth in Example 1.

제5일의 혈중 FVIII 활성은 pCB1007, pCB1018 및 pCB1018을 주사한 마우스에서 각각 평균이 8.1%, 5.0% 및 23.5%였다. 제7일에, FVIII 활성은 pCB1007, pCB1018 및 pCB1018을 주사한 마우스에서 각각 평균이 7.9 %, 3.0% 및 13.5%였다. 따라서, 4개의 N-글리칸 모티프(pCB1017) 또는 3개의 N-글리칸 모티프(pCB1018)를 갖는 플라스미드를 주사한 마우스에서의 FVIII 활성은 B 도메인 치환물 내에 5개의 N-글리칸 모티프를 함유하는 플라스미드(pCB1007)를 제공한 마우스의 것과 유사하였다.The mean blood FVIII activity on day 5 was 8.1%, 5.0% and 23.5% in mice injected with pCB1007, pCB1018 and pCB1018, respectively. At day 7, FVIII activity averaged 7.9%, 3.0% and 13.5% in mice injected with pCB1007, pCB1018 and pCB1018, respectively. Thus, FVIII activity in mice injected with plasmids carrying either four N-glycan motifs (pCB1017) or three N-glycan motifs (pCB1018) was determined by containing five N-glycan motifs in the B domain substitution. It was similar to that of the mouse that received the plasmid (pCB1007).

LNP 투여 후 제7일에 혈액 시료를 취한 후에, 마우스를 희생시키고, 전체 간을 제거하고, RNAlater™ 완충제(퀴아젠) 중에 보관하였다. 전체 간을 비드-기반의 균질화기를 사용하여 균질화시키고, DNA를 퀴아젠 DNA/RNA 미니 키트(카탈로그 번호 80204)를 사용하여 균질물의 분취액으로부터 정제하였다. 간 게놈 DNA를 실시예 1에 기술된 바와 같이 DD-PCR에 의해 정방향 배향으로의 FVIII 공여자 카세트의 통합의 빈도에 대하여 분석하였다. 평균 표적화된 통합 빈도는 pCB1007, pCB1017 및 pCB1018을 주사한 마우스에 대하여 각각 0.27%, 0.27% 및 0.55%였으며, 이들 값은 통계적으로 상이하지 않았다(양측 스튜던츠 T-검정).After taking blood samples on day 7 post LNP administration, mice were sacrificed, whole livers removed, and stored in RNAlater™ buffer (Qiagen). Whole livers were homogenized using a bead-based homogenizer and DNA was purified from an aliquot of the homogenate using a Qiagen DNA/RNA mini kit (Cat. No. 80204). Liver genomic DNA was analyzed for frequency of integration of the FVIII donor cassette in forward orientation by DD-PCR as described in Example 1. The mean targeted integration frequencies were 0.27%, 0.27% and 0.55% for mice injected with pCB1007, pCB1017 and pCB1018, respectively, and these values were not statistically different (two-tailed Student's T-test).

통합 빈도에 대한 각 마우스의 혈중 FVIII 수준의 정규화는 FVIII 코딩 서열의 고유 발현 효율의 척도를 제공한다. 표적화된 통합 빈도로 나눈 FVIII 수준의 비의 평균은 pCB1007(5개의 N-글리칸) 주사된 마우스에 대하여 23.6, pCB1017(4개의 N-글리칸) 주사된 마우스에 대하여 11.6, 및 pCB1018(3개의 N-글리칸) 주사된 마우스에 대하여 23.3이었다. pCB1017 및 pCB1018 주사된 마우스에 대한 표적화된 통합 비로 나눈 FVIII은 pCB1007 주사된 마우스의 것과 통계적으로 상이하지 않았다.Normalization of each mouse's blood FVIII level to the integration frequency provides a measure of the efficiency of intrinsic expression of the FVIII coding sequence. The mean of the ratio of FVIII levels divided by the targeted integration frequency was 23.6 for pCB1007 (5 N-glycans) injected mice, 11.6 for pCB1017 (4 N-glycans) injected mice, and pCB1018 (3 N-glycans). N-glycan) was 23.3 for injected mice. FVIII divided by the targeted integration ratio for pCB1017 and pCB1018 injected mice was not statistically different from that of pCB1007 injected mice.

이들 데이터는 4개의 N-글리칸 모티프 또는 3개의 N-글리칸 모티프 중 어느 하나를 갖는 B 도메인 치환물을 함유하는 합성 FVIII 코딩 서열의 이용이 알부민 인트론 1 내로 통합되는 경우에 5개의 N-글리칸 모티프를 함유하는 FVIII 코딩 서열과 유사한 발현을 초래하는 것을 보여준다. 따라서, 3개의 N-글리칸 모티프를 갖는 B 도메인 치환물을 갖는 합성 FVIII 구축물은 5개의 N-글리칸 모티프를 갖는 B 도메인 치환물에 의해 제공되는 것과 동등한 개선된 FVIII 발현을 제공한다. 추론하여, 5개의 N-글리칸 모티프 함유 B 도메인 치환물이 6개의 N-글리칸 모티프 함유 B 도메인 치환물과 동등하기 때문에, 본 발명자들은 3개의 N-글리칸 모티프가 6개의 N-글리칸 모티프와 동등하게 강력하다고 추론한다.These data show that when the use of a synthetic FVIII coding sequence containing a B domain substitution with either four N-glycan motifs or three N-glycan motifs is integrated into albumin intron 1, 5 N-glycan It is shown to result in expression similar to the FVIII coding sequence containing the Can motif. Thus, a synthetic FVIII construct with a B domain substitution with three N-glycan motifs provides improved FVIII expression equivalent to that provided by a B domain substitution with five N-glycan motifs. Inferred, since a B domain substitution containing 5 N-glycan motifs is equivalent to a B domain substitution containing 6 N-glycan motifs, the inventors found that 3 N-glycan motifs are equivalent to 6 N-glycans Infer that it is equally powerful as the motif.

구축물의 생체내 시험: 1 및 2개의 글리칸In vivo testing of constructs: 1 and 2 glycans

플라스미드 pCB1018(3개의 N-글리칸 모티프를 갖는 B 도메인 치환물을 갖는 FVIII 공여자 포함), pCB1029(2개의 N-글리칸 모티프를 갖는 B 도메인 치환물을 갖는 FVIII 공여자 포함) 및 pCB1030(1개의 N-글리칸 모티프를 갖는 B 도메인 치환물을 갖는 FVIII 공여자 포함)을 상기 기술된 바와 같이 정제하고, 유체역학적 주사에 의해 A형 혈우병 마우스에 투여하였다. 1일 후에, 마우스에 spCas9 mRNA(1 mg/kg) 및 gRNA mAlbT1(1 mg/kg)을 캡슐화하는 C12-200 기반의 LNP의 안와후방(“RO”) 주사를 제공하였다. LNP 투여 후 5일 및 8일에 혈액 시료를 RO 채혈에 의해 시트르산나트륨 중에 취하고(1:9의 시트르산나트륨 대 혈액), 혈장을 원심분리에 의해 수집하였다. 혈장 중 FVIII 활성을 상기 기술된 바와 같이 측정하였으며, 정상 활성의 백분율로서 표현하였다(1 U/mL = 100%).Plasmids pCB1018 (including FVIII donors with B domain substitutions with three N-glycan motifs), pCB1029 (including FVIII donors with B domain substitutions with two N-glycan motifs) and pCB1030 (one N -including FVIII donors with B domain substitutions with glycan motifs) were purified as described above and administered to hemophilia A mice by hydrodynamic injection. One day later, mice received retroorbital (“RO”) injections of C12-200-based LNPs encapsulating spCas9 mRNA (1 mg/kg) and gRNA mAlbT1 (1 mg/kg). On days 5 and 8 post LNP administration, blood samples were taken in sodium citrate by RO bleed (sodium citrate to blood 1:9) and plasma was collected by centrifugation. FVIII activity in plasma was measured as described above and expressed as a percentage of normal activity (1 U/mL = 100%).

제5일의 혈중 FVIII 활성은 pCB1018, pCB1029 및 pCB1030을 주사한 마우스에서 각각 평균이 12.8%, 15.8% 및 13.4%였다. 제8일에, FVIII 활성은 pCB1018, pCB1029 및 pCB1030을 주사한 마우스에서 평균이 각각 13.8 %, 14.5% 및 16.0%였다. 따라서, 3개의 N-글리칸 모티프(pCB1018), 2개의 N-글리칸 모티프(pCB1029) 또는 1개의 N-글리칸 모티프(pCB1030)를 갖는 B 도메인 치환물을 함유하는 플라스미드를 주사한 마우스에서의 FVIII 발현은 서로 유사하였다.The mean blood FVIII activity on day 5 was 12.8%, 15.8% and 13.4% in mice injected with pCB1018, pCB1029 and pCB1030, respectively. At day 8, FVIII activity averaged 13.8%, 14.5% and 16.0% in mice injected with pCB1018, pCB1029 and pCB1030, respectively. Thus, in mice injected with a plasmid containing a B domain substitution with three N-glycan motifs (pCB1018), two N-glycan motifs (pCB1029) or one N-glycan motif (pCB1030) FVIII expression was similar to each other.

혈액 시료를 LNP 투여 후 제7일에 취한 후에, 마우스를 희생시키고, 전체 간을 제거하고, RNAlater™ 완충제(퀴아젠) 중에 보관하였다. 전체 간을 균질화시키고, 간 게놈 DNA를 실시예 1에 기술된 바와 같이 정방향 배향의 FVIII 공여자 카세트의 통합의 빈도에 대하여 DD-PCR에 의해 분석하였다. 평균 표적화된 통합 빈도는 pCB1018, pCB1029 및 pCB1030을 주사한 마우스에 대하여 각각 0.29%, 0.47% 및 0.36%였으며: 이들 값은 통계적으로 상이하지 않았다(양측 스튜던츠 T-검정).After blood samples were taken on day 7 post LNP administration, mice were sacrificed, whole livers removed, and stored in RNAlater™ buffer (Qiagen). Whole livers were homogenized and liver genomic DNA was analyzed by DD-PCR for frequency of integration of the FVIII donor cassette in forward orientation as described in Example 1. The mean targeted integration frequencies were 0.29%, 0.47% and 0.36%, respectively, for mice injected with pCB1018, pCB1029 and pCB1030: these values were not statistically different (two-tailed Student's T-test).

통합 빈도에 대한 각 마우스의 혈중 FVIII 수준의 정규화는 FVIII 코딩 서열의 고유 발현 효율의 척도를 제공한다. 표적화된 통합 빈도로 나눈 FVIII 수준의 비의 평균은 pCB1018(3개의 N-글리칸) 주사된 마우스에 대하여 41.9, pCB1029(2개의 N-글리칸) 주사된 마우스에 대하여 31.4, 및 pCB1030(1개의 N-글리칸) 주사된 마우스에 대하여 40.2였다. pCB1029(3개의 N-글리칸) 및 pCB1030(2개의 N-글리칸) 주사된 마우스에 대한 고유 발현 효율은 pCB1018(3개의 N-글리칸) 주사된 마우스의 것과 통계적으로 상이하지 않았다. 이들 데이터는 2개의 N-글리칸 모티프(아미노산 서열 NATNVS) 또는 1개의 N-글리칸 모티프(아미노산 서열 NAT)를 함유하는 B 도메인 치환물을 포함하는 FVIII 공여자 카세트가 3개의 N-글리칸 모티프를 갖는 B 도메인 치환물을 함유하는 FVIII 공여자 카세트와 동일한 효율로 발현되는 것을 보여준다.Normalization of each mouse's blood FVIII level to the integration frequency provides a measure of the efficiency of intrinsic expression of the FVIII coding sequence. The mean of the ratio of FVIII levels divided by the targeted integration frequency was 41.9 for pCB1018 (3 N-glycans) injected mice, 31.4 for pCB1029 (2 N-glycans) injected mice, and pCB1030 (1 N-glycan). N-glycan) was 40.2 for injected mice. The intrinsic expression efficiencies for pCB1029 (3 N-glycans) and pCB1030 (2 N-glycans) injected mice were not statistically different from those of pCB1018 (3 N-glycans) injected mice. These data show that the FVIII donor cassette containing a B domain substitution containing either two N-glycan motifs (amino acid sequence NATNVS) or one N-glycan motif (amino acid sequence NAT) contains three N-glycan motifs. It is shown to be expressed with the same efficiency as the FVIII donor cassette containing the B domain substitution with

[표 6] FVIII 공여자 pCB1018, pCB1029 및 pCB1030을 주사한 마우스에서의 FVIII 활성, 표적화된 통합 빈도 및 통합 빈도에 대하여 정규화된 FVIII 활성Table 6 FVIII activity in mice injected with FVIII donors pCB1018, pCB1029 and pCB1030, targeted integration frequency and FVIII activity normalized to integration frequency

Figure pct00007
Figure pct00007

0, 1, 2, 3, 4, 5, 6 또는 7개의 N-연결된 글리칸 모티프를 함유하는 B 도메인 치환물을 함유하는 FVIII 공여자 카세트에 대한 생체내 FVIII 발현 결과의 비교Comparison of in vivo FVIII expression results for FVIII donor cassettes containing B domain substitutions containing 0, 1, 2, 3, 4, 5, 6 or 7 N-linked glycan motifs

상기 시험된 상이한 FVIII 카세트의 고유 발현 효율을 비교하였다. 동일한 스트레인의 마우스(A형 혈우병 마우스) 및 동일한 실험 프로토콜을 사용하여, 총 5가지 연구에서, 실시예 3에 기술된 데이터 세트를 생성하였다. FVIII 활성을 제5일 또는 제6일에, 그리고 다시 제8일 또는 제9일에 측정하였다. 표적화된 통합 빈도를 마지막 FVIII 활성 측정일(제8일 또는 제9일)에 희생시킨 마우스의 전체 간으로부터 추출된 DNA에서 측정하였다. 고유 발현 효율의 모음은 도 8에 나타나 있다. 상이한 코돈 최적화를 갖는 FVIII 카세트가 이 비교에 포함된다. 정규화된 FVIII 발현에 대한 상이한 수의 글리칸의 영향의 비교를 도 8에서 처음 9개의 막대인 “co1”로 지칭되는 코돈 최적화를 갖는 공여자에 대하여 수행할 수 있다. 이들 공여자는 B 도메인 치환물 내의 N-글리칸 모티프의 수만이 상이한 FVIII 카세트를 함유한다. 고유 발현 효율은 1개 내지 7개의 N-글리칸 모티프를 함유하는 글리칸 변이체에 대하여 유의미하게 상이하지 않았다. 2개의 N-글리칸 모티프(“co1-2”)를 갖는 공여자가 정규화된 FVIII 활성을 낮추는 경향을 보이지만(5, 6 또는 7개의 N-글리칸을 갖는 변이체에 대한 약 45의 값에 비하여, 30의 값), 이 차이는 통계적으로 유의미하지 않았다. B 도메인 대신에 N-글리칸 모티프를 갖지 않는 공여자(“co1-0”)는 유의미하게 더 낮은 정규화된 FVIII 활성(글리칸 및 동일한 코돈 최적화를 갖는 변이체에 대한 40 내지 50에 비하여 7.4의 값)을 나타내었다. 5개의 글리칸 및 코돈 최적화 co2를 갖는 FVIII 공여자는 5개의 N-글리칸 모티프를 갖는 co1과 동등하였던 한편, 5개의 N-글리칸을 갖는 co3는 5개의 N-글리칸을 갖는 co1의 효율의 약 50%로 발현되었다. 이들 데이터는 단일의 N-글리칸 모티프를 포함하는 B 도메인 치환물을 함유하는 FVIII 코딩 서열이 2 내지 7개의 N-글리칸 모티프를 포함하는 B 도메인 치환물로 달성되는 것과 동등한 FVIII 발현 수준을 부여하기에 충분하였음을 보여준다. 단일의 N-글리칸 모티프를 포함하는 B 도메인 치환물을 함유하는 FVIII 코딩 서열(도 8에서 “co1-1” / pCB1030)은 B 도메인 치환물을 결여한 동일한 FVIII 코딩 서열(“co1-0” / pCB100)보다 약 5.4배 더 효율적으로(40.1/7.4) 발현되었다. 따라서, 6개 미만의 N-글리칸, 예를 들어, 5개의 N-글리칸, 4개의 N-글리칸, 3개의 N-글리칸, 2개의 N-글리칸 또는 1개의 N-글리칸을 갖는 B 도메인 치환물을 함유하는 FVIIII 코딩 서열은 FVIIII 단백질에 부가되는 비-고유 아미노산의 수의 감소 및 DNA 공여자의 크기의 감소로 인하여, 유전자 편집 접근법에서 사용하는 데 이점을 갖는다.The intrinsic expression efficiencies of the different FVIII cassettes tested above were compared. Using the same strain of mice (hemophilia A mice) and the same experimental protocol, the data set described in Example 3 was generated for a total of 5 studies. FVIII activity was measured on day 5 or 6, and again on day 8 or 9. Targeted integration frequencies were determined in DNA extracted from whole livers of mice sacrificed on the day of the last FVIII activity measurement (day 8 or 9). A collection of intrinsic expression efficiencies is shown in FIG. 8 . FVIII cassettes with different codon optimizations are included in this comparison. A comparison of the effect of different numbers of glycans on normalized FVIII expression can be performed for donors with codon optimization referred to as “co1”, the first nine bars in FIG. 8 . These donors contain FVIII cassettes that differ only in the number of N-glycan motifs in the B domain substitutions. Intrinsic expression efficiencies were not significantly different for glycan variants containing 1 to 7 N-glycan motifs. Although donors with two N-glycan motifs (“co1-2”) tended to lower normalized FVIII activity (compared to a value of about 45 for variants with 5, 6 or 7 N-glycans), value of 30), this difference was not statistically significant. Donors without an N-glycan motif in place of the B domain (“co1-0”) had significantly lower normalized FVIII activity (a value of 7.4 compared to 40-50 for glycans and variants with the same codon optimization) was shown. The FVIII donor with 5 glycans and codon-optimized co2 was equivalent to co1 with 5 N-glycan motifs, while co3 with 5 N-glycans showed an increase in the efficiency of co1 with 5 N-glycans. expressed in about 50%. These data confer FVIII expression levels equivalent to that achieved with B domain substitutions comprising 2-7 N-glycan motifs in which a FVIII coding sequence containing a B domain substitution comprising a single N-glycan motif would show that it is sufficient to The FVIII coding sequence containing a B domain substitution comprising a single N-glycan motif (“co1-1” / pCB1030 in FIG. 8) is the same FVIII coding sequence lacking the B domain substitution (“co1-0”) / pCB100) about 5.4 times more efficiently (40.1/7.4) than the expression. Thus, less than 6 N-glycans, for example 5 N-glycans, 4 N-glycans, 3 N-glycans, 2 N-glycans or 1 N-glycan The FVIIII coding sequence containing the B domain substitution with

실시예 4Example 4 : 마우스에서 세이프 하버 유전자좌(예를 들어, 알부민 유전자좌) 내로의 표적화된 통합 후의 발현을 위한 FVIII 코딩 서열의 최적의 코돈 최적화의 확인: Identification of optimal codon optimization of the FVIII coding sequence for expression following targeted integration into a safe harbor locus (eg, albumin locus) in mice

플라스미드 구축물Plasmid constructs

실험을 수행하여 합성 FVIII의 발현에 대한 상이한 형태의 코돈 최적화의 영향을 결정하였다. B 도메인 대신에 14개 아미노산 SQ 링커를 함유하는 성숙(신호 펩티드 결여) B 도메인 결실된 인간 FVIII 코딩 서열(1438개 아미노산의 총 코딩 서열)을 GeneArt(co3)에서 이용 가능한 상업적으로 이용 가능한 알고리즘을 적용함으로써 코돈 최적화시켰으며, 이는 CG 디뉴클레오티드의 수를 고유 서열에 존재하는 54개에서 198개까지 증가시켰다. 공개된 호모 사피엔스(H. sapiens) 코돈 사용 표에 따라 다음으로 가장 빈번한 코돈 또는 더욱 빈번하게 사용되는 코돈인 대안적인 코돈을 선택하여, 모든 198개 CG 디뉴클레오티드를 수동으로 제거함으로써 B 도메인 결실된 FVIII의 co3 형태의 변이체(“co4”)를 생성하였다(문헌[H.C. Brown et al., Mol Ther Meth & Clin Dev (2018) 9:57-69 (doi: 10.1016/j.omtm.2018.01.004)]). B 도메인 결실된 FVIII(“FVIII-BDD”) 코딩 서열을 간에서 고도로 발현되는 유전자의 코돈 편향에 기초한 알고리즘을 사용하여 코돈 최적화시켜(상기 문헌[H.C. Brown et al.]), 176개 CG 디뉴클레오티드를 함유하는 FVIII-BDD co2를 생성하였다. 모든 CG 디뉴클레오티드를 제거하도록 추가로 변형된, 본원에서 FVIII-BDD co5로 지칭되는 이 구축물을 또한 합성하였다. 문헌[J. McIntosh et al., Blood (2013) 121(17):3335-44] 및 제US 9,393,323호(상기 문헌에서 SEQ ID NO: 1)의 코돈 최적화된 FVIII-BDD 코딩 서열을 또한 구축하였으며, 본원에서 “co1”로 지칭된다. 245개의 CG 디뉴클레오티드를 함유하는 WO2011/005968호(상기 문헌에서 SEQ ID NO: 5)에 공개된 B 도메인 결실된 FVIII 코딩 서열의 추가의 코돈 최적화된 변이체를 합성하였다(본원에서 “FVIII-BDD co6”). 플라스미드를 하기와 같이 구축하였으며, 여기서, 공여자 서열 코돈 최적화는 co2(pCB1002, SEQ ID NO: 323), co3(pCB1001, SEQ ID NO: 322), co4(pCB1000, SEQ ID NO: 321) 또는 co5(pCB103, SEQ ID NO: 336)였다: pUC19 플라스미드 백본 | ITR | gRNA mALbT1에 대한 표적 부위 | 18 bp 스페이서 | 스플라이스 수여자(SA) | TG 디뉴클레오티드 | B 도메인 결실된 FVIII 서열 | 폴리A(sPA) | gRNA mALbT1에 대한 표적 부위 | ITR.Experiments were performed to determine the effect of different types of codon optimization on the expression of synthetic FVIII. The mature (lacking signal peptide) B domain deleted human FVIII coding sequence (total coding sequence of 1438 amino acids) containing a 14 amino acid SQ linker in place of the B domain was subjected to a commercially available algorithm available from GeneArt (co3). codon optimization, which increased the number of CG dinucleotides from 54 to 198 present in the native sequence. B domain deleted FVIII by manually removing all 198 CG dinucleotides by selecting the next most frequent or more frequently used alternative codons according to the published H. sapiens codon usage table of the co3 form (“co4”) was generated (HC Brown et al., Mol Ther Meth & Clin Dev (2018) 9 :57-69 (doi: 10.1016/j.omtm.2018.01.004)) ). The B domain deleted FVIII (“FVIII-BDD”) coding sequence was codon optimized using an algorithm based on the codon bias of genes highly expressed in the liver (HC Brown et al., supra), resulting in 176 CG dinucleotides. FVIII-BDD co2 containing This construct, referred to herein as FVIII-BDD co5, was also synthesized, further modified to remove all CG dinucleotides. Literature [J. McIntosh et al., Blood (2013) 121 (17):3335-44] and US 9,393,323 (SEQ ID NO: 1 supra) also constructed a codon-optimized FVIII-BDD coding sequence, herein “ co1”. An additional codon optimized variant of the B domain deleted FVIII coding sequence disclosed in WO2011/005968 (SEQ ID NO: 5 supra) containing 245 CG dinucleotides was synthesized (herein “FVIII-BDD co6”). ”). Plasmids were constructed as follows, wherein the donor sequence codon optimization was co2 (pCB1002, SEQ ID NO: 323), co3 (pCB1001, SEQ ID NO: 322), co4 (pCB1000, SEQ ID NO: 321) or co5 ( pCB103, SEQ ID NO: 336): pUC19 plasmid backbone | ITR | Target site for gRNA mALbT1 | 18 bp spacer | Splice Grants (SA) | TG dinucleotide | B domain deleted FVIII sequence | poly A (sPA) | Target site for gRNA mALbT1 | ITR.

각 플라스미드 내의 FVIII 공여자 카세트는 AAV2 ITR에 측접하였으며, 이를 사용하여 카세트를 HEK293-기반의 패키징 시스템을 사용하여 AAV8 내로 패키징하고, 염화세슘 밀도 원심분리를 사용하여 정제하였다. 생성된 AAV8 바이러스(AAV8-pCB103, AAV8-pCB1002, AAV8-pCB1001 및 AAV8-pCB1000으로 표기됨)를 FVIII 유전자에 대한 코딩 서열 내에 위치한 프라이머/프로브 세트와 함께 Q-PCR 또는 DD-PCR을 사용하여 적정하였다. 이들 FVIII 공여자 카세트를 알부민 인트론 1 내로의 표적화된 통합 후에만 FVIII을 발현하도록 설계한다. 공여자 카세트는 프로모터를 결여하며, 이에 따라 비-통합된 에피솜 바이러스 게놈으로부터 mRNA로 전사될 수 없다. 또한, 모든 FVIII 공여자 카세트는 FVIII 코딩 서열의 N-말단에 신호 펩티드 서열을 결여하며, 이에 따라, 비-통합된 에피솜 바이러스 카피로부터 발현될 수 있는 임의의 단백질은 순환계로 분비될 수 없다. 알부민 인트론 1 내로의 통합 후에, 게놈 내의 알부민 프로모터로부터의 전사는 마우스 알부민 엑손 1, 인트론 1의 부분 및 합성 FVIII 코딩 서열을 포함하는 하이브리드 pre-mRNA를 생성하며, FVIII 공여자 카세트의 5’ 말단에 포함되는 폴리아데닐화 신호에서 종결된다. 알부민 엑손 1의 스플라이스 공여자와 FVIII 공여자 카세트의 5’ 말단에 포함된 스플라이스 수여자 사이의 이 pre-mRNA의 스플라이싱에 의해, 알부민의 엑손 1이 신호 펩티드 및 성숙 FVIII 코딩 서열에 프레임-내 융합되는 pre-프로-펩티드를 인코딩하는 mRNA를 생성한다. 이 하이브리드 mRNA에 의해 인코딩된 단백질은 세포의 분비 기구를 통해 처리되며, 그 동안 신호 펩티드 및 알부민의 pre-프로 펩티드가 절단되어, FVIII에 보통 존재하지 않는 3개의 아미노산이 중쇄의 N-말단에 포함되는 예측된 2 쇄 FVIII 분자를 초래할 것이다.The FVIII donor cassette in each plasmid was flanked by the AAV2 ITR, which was used to package the cassette into AAV8 using a HEK293-based packaging system and purified using cesium chloride density centrifugation. The resulting AAV8 virus (designated AAV8-pCB103, AAV8-pCB1002, AAV8-pCB1001 and AAV8-pCB1000) was titrated using Q-PCR or DD-PCR with a primer/probe set located within the coding sequence for the FVIII gene. did. These FVIII donor cassettes are designed to express FVIII only after targeted integration into albumin intron 1. The donor cassette lacks a promoter and thus cannot be transcribed into mRNA from the non-integrated episomal viral genome. In addition, all FVIII donor cassettes lack a signal peptide sequence at the N-terminus of the FVIII coding sequence, so that any protein that can be expressed from a non-integrated episomal viral copy cannot be secreted into the circulation. Following integration into albumin intron 1, transcription from the albumin promoter in the genome produces a hybrid pre-mRNA comprising mouse albumin exon 1, a portion of intron 1 and the synthetic FVIII coding sequence, included at the 5' end of the FVIII donor cassette. The polyadenylation signal is terminated. By splicing this pre-mRNA between the splice donor of albumin exon 1 and the splice acceptor contained at the 5' end of the FVIII donor cassette, exon 1 of albumin is frame- to generate mRNA encoding the pre-pro-peptide to be fused within. The protein encoded by this hybrid mRNA is processed through the cell's secretory machinery, during which the signal peptide and albumin's pre-propeptide are cleaved, leaving three amino acids not normally present in FVIII at the N-terminus of the heavy chain. would result in the predicted two-stranded FVIII molecule being

구축물의 생체내 시험In vivo testing of constructs

이들 제형을 시험하기 위하여, 4 또는 5마리의 A형 혈우병 마우스의 코호트에 AAV8 바이러스(AAV8-pCB103, AAV8-pCB1002, AAV8-pCB1001 및 AAV8-pCB1000)의 각각을 2 x 1012 vg/kg의 용량으로 꼬리 정맥을 통해 주사하였다. 4주 후에, 모든 마우스에 mAlbT1 gRNA 및 spCas9 mRNA를 캡슐화하는 LNP의 1:1 혼합물을 2 mg/kg의 전체 RNA 용량으로 정맥내로 주사하였다. LNP를 실시예 1에 기술된 방법에 따라 제형화하였다. 혈중 FVIII 활성을 실시예 1에 제시된 방법을 사용하여 측정하였다. 결과를 도 4에 요약한다.To test these formulations, each of the AAV8 viruses (AAV8-pCB103, AAV8-pCB1002, AAV8-pCB1001 and AAV8-pCB1000) was administered at a dose of 2×10 12 vg/kg to cohorts of 4 or 5 hemophilia A mice. was injected through the tail vein. After 4 weeks, all mice were injected intravenously with a 1:1 mixture of mAlbT1 gRNA and LNP encapsulating spCas9 mRNA at a total RNA dose of 2 mg/kg. LNPs were formulated according to the method described in Example 1. Blood FVIII activity was measured using the method set forth in Example 1. The results are summarized in FIG. 4 .

이들 실험에서, AAV8-pCB103 및 AAV8-pCB1002(각각 코돈 최적화 co5 및 co2를 갖는 FVIII-BDD 함유)를 제공한 마우스는 그들의 혈중에 검출 가능한 FVIII 활성을 갖지 않았다. 바이러스 pCB1001(코돈 최적화 co3)을 제공한 마우스는 LNP 투여 후 제11일에 평균 8% FVIII 활성 및 제28일에 20% FVIII 활성을 가졌다. 바이러스 AAV8-pCB1000(코돈 최적화 co4)을 제공한 5마리의 마우스 중 3마리는 정상의 1% 내지 3%의 FVIII 활성 수준을 가졌다. 이들 데이터는 GeneArt 알고리즘을 사용하여 코돈 최적화시킨 FVIII-BDD DNA 서열(AAV8-pCB1001, co3)이, 간에서 고도로 발현되는 유전자의 가장 빈번한 코돈에 기초하여 코돈 최적화된 FVIII-BDD(AAV8-pCB103 및 AAV8-pCB1002)보다 더 높은 수준의 FVIII 발현을 초래하는 것을 보여준다. CG 디뉴클레오티드를 제거하기 위한 GeneArt 코돈-최적화된 FVIII-BDD 서열의 변형(AAV8-pCB1000, co4)은, FVIII-BDD가 GeneArt 알고리즘을 사용하여 코돈 최적화되고, CG 디뉴클레오티드를 보유하는 동일한 카세트와 비교하여 FVIII 발현의 감소를 초래하였다. co4 코돈 최적화를 갖는 FVIII-BDD는 co2 및 co5 코돈 최적화와 달리, 측정 가능한 FVIII 활성을 생성할 수 있었다. AAV8-pCB102(co1 코돈 최적화된 FVIII-BDD DNA 서열, 실시예 2 참조)를 제공한 마우스는, 동일한 2 x 1012 vg/kg의 용량으로 AAV8에서 전달되고, 동일한 용량의 LNP를 사용하는 경우(실시예 2, 도 2, AAV8-pCB102) A형 혈우병 마우스에서 FVIII 활성을 생성하지 않았다. 이는 co1이 마우스에서 알부민 인트론 1 내로의 표적화된 통합 후에 FVIII의 발현에 있어서 co3 및 co4 코돈 최적화된 FVIII-BDD 서열보다 열등하였음을 보여준다.In these experiments, mice given AAV8-pCB103 and AAV8-pCB1002 (containing FVIII-BDD with codon optimized co5 and co2, respectively) had no detectable FVIII activity in their blood. Mice given the viral pCB1001 (codon optimized co3) had an average of 8% FVIII activity on day 11 and 20% FVIII activity on day 28 after LNP administration. 3 of 5 mice given the virus AAV8-pCB1000 (codon optimized co4) had FVIII activity levels between 1% and 3% of normal. These data showed that the FVIII-BDD DNA sequence (AAV8-pCB1001, co3), which was codon-optimized using the GeneArt algorithm, was codon-optimized based on the most frequent codons of genes highly expressed in the liver (AAV8-pCB103 and AAV8). -pCB1002), resulting in higher levels of FVIII expression. Modification of the GeneArt codon-optimized FVIII-BDD sequence to remove CG dinucleotides (AAV8-pCB1000, co4) compared to the same cassette in which FVIII-BDD was codon-optimized using the GeneArt algorithm and retaining CG dinucleotides. This resulted in a decrease in FVIII expression. FVIII-BDD with co4 codon optimization could produce measurable FVIII activity, in contrast to co2 and co5 codon optimization. Mice that received AAV8-pCB102 (co1 codon optimized FVIII-BDD DNA sequence, see Example 2) were delivered in AAV8 at the same dose of 2 x 10 12 vg/kg, using the same dose of LNP ( Example 2, FIG. 2 , AAV8-pCB102) did not produce FVIII activity in hemophilia A mice. This shows that co1 was inferior to the co3 and co4 codon optimized FVIII-BDD sequences in the expression of FVIII after targeted integration into albumin intron 1 in mice.

실시예 5Example 5 : 5개의 N-글리칸 및 대안적인 코돈 최적화 co4 및 co5를 갖는 합성 FVIII을 인코딩하는 공여자 주형의 알부민 인트론 1 내로의 표적화된 통합 후의 마우스에서의 FVIII의 발현: Expression of FVIII in mice after targeted integration into albumin intron 1 of a donor template encoding synthetic FVIII with 5 N-glycans and alternative codon optimized co4 and co5

B 도메인 치환물을 갖는 합성 FVIII을 사용하여 상이한 코돈 최적화의 영향을 시험하기 위하여, 신호 펩티드를 결여한 FVIII-BDD 코딩 서열을 co1, co4 및 co5로 표기된 3개의 코돈 최적화된 DNA 서열을 사용하여 구축하였으며, 추가로 B 도메인 대신에 B 도메인 치환물을 함유하였다. B 도메인 치환물은 5개의 N-글리칸 모티프(서열: ATNVSNNSNTSNDS, SEQ ID NO: 343)를 함유하였다. 이들 코딩 서열은 5’ 측 상에서 mALbT1 gRNA에 대한 표적 부위, 18 bp 스페이서, 스플라이스 수여자 및 2개의 뉴클레오티드(TG)에 측접한다. TG 디뉴클레오티드는 마우스 알부민 엑손 1로의 스플라이싱 후에 정확한 리딩 프레임을 유지한다. 짧은 폴리아데닐화 신호(sPA)를 코딩 서열의 3’ 말단에 포함시켰다. 이들 3개의 플라스미드 내의 합성 FVIII 코딩 서열은 동일한 아미노산 서열을 갖는 FVIII 단백질을 인코딩하지만, 코딩 서열은 상이한 코돈 최적화로 인하여 상이한 DNA 서열에 의해 인코딩된다. pCB1007(co1, SEQ ID NO: 326), pCB1019(co4, SEQ ID NO: 332) 및 pCB1020(co5, SEQ ID NO: 333)으로 표기된 이들 플라스미드를 mALbT1 gRNA에 대한 표적 부위에서 CRISPR/Cas9 절단에 의해 매개되는 알부민 인트론 1 내로의 표적화된 통합 후에 활성 FVIII 단백질을 발현하는 그들의 능력에 대하여 A형 혈우병 마우스에서 시험하였다.To test the effect of different codon optimizations using synthetic FVIII with B domain substitutions, the FVIII-BDD coding sequence lacking the signal peptide was constructed using three codon-optimized DNA sequences denoted co1, co4 and co5. and additionally contained a B domain substitution instead of the B domain. The B domain substitution contained five N-glycan motifs (SEQ ID NO: 343). These coding sequences are flanked on the 5' side by a target site for mALbT1 gRNA, an 18 bp spacer, a splice acceptor and two nucleotides (TG). The TG dinucleotide maintains the correct reading frame after splicing into mouse albumin exon 1. A short polyadenylation signal (sPA) was included at the 3' end of the coding sequence. The synthetic FVIII coding sequences in these three plasmids encode FVIII proteins with identical amino acid sequences, but the coding sequences are encoded by different DNA sequences due to different codon optimizations. These plasmids, designated pCB1007 (co1, SEQ ID NO: 326), pCB1019 (co4, SEQ ID NO: 332) and pCB1020 (co5, SEQ ID NO: 333), were digested by CRISPR/Cas9 cleavage at the target site for mALbT1 gRNA. Their ability to express active FVIII protein after targeted integration into albumin intron 1 mediated was tested in hemophilia A mice.

실험 프로토콜은 실시예 1의 것과 동일하였다. 플라스미드 pCB1007, pCB1019 및 pCB1029의 플라스미드 DNA를 퀴아젠 엔도프리® 맥시프렙 키트(카탈로그 번호 12362)를 사용하여 정제한 다음, 0.9% 염수 중에 15 μg/mL의 최종 농도로 희석하였다. A형 혈우병 마우스의 코호트에 마우스당 2 mL의 희석된 플라스미드 DNA를 HDI에 의해 주사하였다. 1일 후에, 마우스에 spCas9 mRNA(1 mg/kg(체중)) 및 gRNA mAlbT1(1 mg/kg(체중))을 캡슐화하는 C12-200 기반의 LNP의 안와후방 주사를 제공하였다. spCas9 mRNA 및 mALbT1 gRNA를 캡슐화하는 LNP만을 주사한 5마리의 A형 혈우병 마우스의 코호트를 투여 3일 후에 희생시키고, 전체 간으로부터 추출된 게놈 DNA를 알부민 인트론 1 내의 온-표적 부위에서 삽입 및 결실에 대하여 분석하였다. 평균 삽입 및 결실 빈도는 52.9%였으며, 이는 간 내의 온-표적 부위에서의 효율적인 절단을 나타낸다.The experimental protocol was the same as that of Example 1. Plasmid DNAs of plasmids pCB1007, pCB1019 and pCB1029 were purified using the Qiagen Endopre® Maxiprep Kit (Cat. No. 12362) and then diluted in 0.9% saline to a final concentration of 15 μg/mL. Cohorts of hemophilia A mice were injected with 2 mL of diluted plasmid DNA per mouse by HDI. One day later, mice received retroorbital injection of C12-200-based LNPs encapsulating spCas9 mRNA (1 mg/kg body weight) and gRNA mAlbT1 (1 mg/kg body weight). A cohort of 5 hemophilia A mice injected only with LNP encapsulating spCas9 mRNA and mALbT1 gRNA were sacrificed 3 days after administration, and genomic DNA extracted from whole liver was subjected to insertions and deletions at on-target sites within albumin intron 1. was analyzed. The average frequency of insertions and deletions was 52.9%, indicating efficient cleavage at on-target sites in the liver.

플라스미드를 주사한 마우스에 LNP를 투여한 지 6일 및 9일 후에, 혈액 시료를 RO 채혈에 의해 시트르산나트륨 중에 취하고(1:9 비의 시트르산나트륨 대 혈액), 혈장을 원심분리에 의해 수집하였다. 혈장 중 FVIII 활성을 실시예 1에 제시된 방법을 사용하여 측정하였다. 결과를 도 5에 요약한다.6 and 9 days after LNP administration to mice injected with the plasmid, blood samples were taken in sodium citrate by RO bleed (1:9 ratio sodium citrate to blood), and plasma was collected by centrifugation. FVIII activity in plasma was measured using the method set forth in Example 1. The results are summarized in FIG. 5 .

플라스미드 pCB1007, pCB1019 또는 pCB1020을 제공한 마우스에서의 평균 FVIII 활성은 LNP 투여 후 제6일에 정상의 22.3%, 17.6% 및 17.8%였다. 플라스미드 pCB1007, pCB1019 또는 pCB1020을 제공한 마우스에서의 평균 FVIII 활성은 LNP 투여 후 제9일에 정상의 19.7, 14.1 및 14.9%였다. 3가지 플라스미드를 투여한 마우스에서의 FVIII 수준은 등분산적(2개 표본 등분산) 양측 T-검정을 사용하여 평가되는 경우 제6일 또는 제9일에 통계적으로 유의미하게 상이하지 않았다(p 값은 모두 >0.28).Mean FVIII activity in mice receiving plasmids pCB1007, pCB1019 or pCB1020 was 22.3%, 17.6% and 17.8% of normal on day 6 after LNP administration. Mean FVIII activity in mice receiving plasmids pCB1007, pCB1019 or pCB1020 was 19.7, 14.1 and 14.9% of normal on day 9 after LNP administration. FVIII levels in mice administered the three plasmids were not statistically significantly different at day 6 or day 9 when assessed using a two-sided T-test of equal variance (two-sample equal variance) (p values were all >0.28).

이들 결과는 B 도메인 대신에 5개의 N-글리칸 모티프를 함유하는 B 도메인 치환물을 갖는 합성 FVIII을 인코딩하는 공여자 주형의 상황에서, 코돈 최적화 co1, co4 및 co5(이의 전부는 CG 디뉴클레오티드를 결여함)가 알부민 인트론 1 내로의 표적화된 통합 후에 유사한 수준의 FVIII을 생성하였음을 보여준다. 따라서, 특정 코돈 최적화에 대하여 명백한 이점이 없으며, 임의의 CpG-부재의 코돈 최적화(예를 들어, co1, co4 및 co5)는 표적화된 통합 후에 유사한 수준의 합성 FVIII 단백질을 제공한다.These results show that in the context of a donor template encoding synthetic FVIII with a B domain substitution containing five N-glycan motifs instead of the B domain, codon-optimized co1, co4 and co5 (all of which lack CG dinucleotides) ) produced similar levels of FVIII after targeted integration into albumin intron 1. Thus, there is no obvious advantage for specific codon optimization, and any CpG-free codon optimization (eg, co1, co4 and co5) provides similar levels of synthetic FVIII protein after targeted integration.

실시예 6Example 6 : B 도메인 치환물 및 F309에서 S 또는 A로의 돌연변이의 조합: Combination of B domain substitution and F309 to S or A mutation

A1 도메인 내의 샤페론 면역글로불린 결합 단백질(BiP)에 대한 잠재적인 결합 부위 내의 점 돌연변이(F309S)가 배양 중 세포에서 B 도메인 결실된 FVIII의 분비를 약 3배 개선시킨 것이 보고된 바 있다(문헌[M. Swaroop et al., J Biol Chem (1997) 272:24121-24]). FVIII의 F309A 돌연변이 단백질은 유사하게 분비가 개선되었다. F309S 및 B 도메인의 226개 아미노산 N-말단 부분의 조합이 마우스에서 생체내에서 FVIII 수준을 B 도메인 결실된 FVIII에 비하여 20 내지 30배 개선시키는 한편, B 도메인의 226개 아미노산 N-말단의 부가가 FVIII 수준을 오직 5배만 개선시킨 것이 보고되었다(문헌[H.Z. Miao et al., Blood (2004) 103(9):3412-19]).It has been reported that a point mutation (F309S) in a potential binding site for a chaperone immunoglobulin binding protein (BiP) in the A1 domain improved the secretion of B domain-deleted FVIII in cells in culture approximately 3-fold (M (Swaroop et al., J Biol Chem (1997) 272 :24121-24]). The F309A mutant protein of FVIII had similarly improved secretion. The combination of F309S and the 226 amino acid N-terminal portion of the B domain improved FVIII levels in vivo in mice 20-30 fold compared to B domain deleted FVIII, while the addition of the 226 amino acid N-terminal portion of the B domain Only a 5-fold improvement in FVIII levels has been reported (HZ Miao et al., Blood (2004) 103 (9):3412-19).

세린 또는 알라닌을 사용한 309의 페닐알라닌 잔기의 치환을 갖는 B 도메인 치환물의 조합이 표적화된 통합 후에 FVIII 발현의 추가의 개선을 초래하는 지를 평가하기 위하여, 플라스미드 pCB1025(SEQ ID NO: 334) 및 pCB1026(SEQ ID NO: 335)을 구축하였다. 둘 모두의 플라스미드는 5개의 N-연결된 글리코실화 부위를 함유하는 B 도메인 치환물을 갖는 co4 코돈 최적화된 FVIII DNA 서열을 함유하였다. 플라스미드는 하기의 요소를 가졌다: pUC19 플라스미드 백본 | gRNA mALbT1에 대한 표적 부위 | 18 bp 스페이서 | 스플라이스 수여자(SA) | TG 디뉴클레오티드 | 5개의 부위 B 도메인 치환물을 갖는 FVIII 서열(co4) | 폴리A(sPA). 플라스미드 pCB1007은 pCB1025가 위치 309에서 Phe 대신에 Ala을 갖고, pCB1026이 위치 309에서 Phe 대신에 Ser을 가졌던 것을 제외하고, pCB1025 및 pCB1026과 동일하였다. 플라스미드 pCB1007을 연구에서 비교자로서 사용하였다.To evaluate whether the combination of B domain substitutions with substitution of the phenylalanine residue of 309 with serine or alanine results in further improvement of FVIII expression after targeted integration, plasmids pCB1025 (SEQ ID NO: 334) and pCB1026 (SEQ ID NO: 334) ID NO: 335) was constructed. Both plasmids contained a co4 codon optimized FVIII DNA sequence with a B domain substitution containing five N-linked glycosylation sites. The plasmid had the following elements: pUC19 plasmid backbone | Target site for gRNA mALbT1 | 18 bp spacer | Splice Grants (SA) | TG dinucleotide | FVIII sequence with 5 site B domain substitutions (co4) | Poly A (sPA). Plasmid pCB1007 was identical to pCB1025 and pCB1026, except that pCB1025 had Ala instead of Phe at position 309 and pCB1026 had Ser instead of Phe at position 309. Plasmid pCB1007 was used as comparator in the study.

실험 프로토콜은 실시예 1의 것과 동일하였다. 플라스미드 pCB1007, pCB1025 및 pCB1026을 퀴아젠 엔도프리® 맥시프렙 키트(카탈로그 번호 12362)를 사용하여 정제한 다음, 0.9% 염수 중에 15 μg/mL의 최종 농도로 희석하였다. A형 혈우병 마우스의 코호트에 마우스당 2 mL의 희석된 플라스미드 DNA를 HDI에 의해 주사하였다. 1일 후에, 마우스에 spCas9 mRNA(1 mg/kg) 및 gRNA mAlbT1(1 mg/kg)을 캡슐화하는 C12-200 기반의 LNP의 RO 주사를 제공하였다. LNP 투여 5일 후(pCB1025, pCB1026) 또는 LNP 투여 6일 후(pCB1019)에, 혈액 시료를 RO 채혈에 의해 시트르산나트륨 중에 취하고(1:9 비의 시트르산나트륨 대 혈액), 혈장을 원심분리에 의해 수집하였다. 혈장 중 FVIII 활성을 실시예 1에 제시된 방법을 사용하여 측정하였다. FVIII 활성은 pCB1019, pCB1025 또는 pCB1026을 주사한 마우스의 3개의 군에서 유사하였으며, 평균 FVIII 활성은 각각 17.6%, 27.2% 및 24.5%였다.The experimental protocol was the same as that of Example 1. Plasmids pCB1007, pCB1025 and pCB1026 were purified using the Qiagen Endopre® Maxiprep Kit (Cat. No. 12362) and then diluted in 0.9% saline to a final concentration of 15 μg/mL. Cohorts of hemophilia A mice were injected with 2 mL of diluted plasmid DNA per mouse by HDI. One day later, mice received RO injections of C12-200-based LNPs encapsulating spCas9 mRNA (1 mg/kg) and gRNA mAlbT1 (1 mg/kg). After 5 days of LNP administration (pCB1025, pCB1026) or 6 days after LNP administration (pCB1019), blood samples were taken in sodium citrate by RO bleed (1:9 ratio sodium citrate to blood), and plasma was centrifuged collected. FVIII activity in plasma was measured using the method set forth in Example 1. FVIII activity was similar in the three groups of mice injected with pCB1019, pCB1025 or pCB1026, and the mean FVIII activity was 17.6%, 27.2% and 24.5%, respectively.

동일한 A형 혈우병 마우스의 혈중 FVIII 활성을 또한 LNP 후 제9일(pCB1019 주사된 마우스) 또는 LNP 후 제7일(pCB1025 및 pCB1026 주사된 마우스)에 검정하였다. 그 다음, 마우스를 희생시키고, 전체 간을 준비하고, 상기 실시예 1에 기술된 바와 같이 통합 빈도에 대하여 분석하였다. 표적화된 통합 빈도는 3개의 군들 간에 유사하였으며, pCB1019 주사된 마우스에 대하여 0.42, pCB1025 주사된 마우스에 대하여 0.47 및 pCB1026 주사된 마우스에 대하여 0.36의 평균 빈도를 가졌다.Blood FVIII activity of the same hemophilia A mice was also assayed on day 9 post LNP (pCB1019 injected mice) or 7 days post LNP (pCB1025 and pCB1026 injected mice). Mice were then sacrificed, whole livers prepared and analyzed for integration frequency as described in Example 1 above. Targeted integration frequencies were similar between the three groups, with mean frequencies of 0.42 for pCB1019 injected mice, 0.47 for pCB1025 injected mice and 0.36 for pCB1026 injected mice.

통합 빈도에 대한 각 마우스의 혈중 FVIII 수준의 정규화는 FVIII 코딩 서열의 고유 발현 효율의 척도를 제공한다. 표적화된 통합 빈도로 나눈 FVIII 수준의 비의 평균은 pCB1019 주사된 마우스에 대하여 37.4, pCB1025 주사된 마우스에 대하여 41.5 및 pCB1026 주사된 마우스에 대하여 49.9였다. pCB1019 주사된 마우스에 비하여 pCB1025 및 pCB1026 주사된 마우스에 있어서 표적화된 통합에 대해 정규화된 FVIII 활성의 차이는 통계적으로 유의미하지 않았으며(양측 스튜던츠 T-검정), 이는 (B 도메인 대신에 5개의 N-글리칸 모티프를 함유하는 FVIII-BDD 카세트의 상황에서) 아미노산 F309에서 세린 또는 알라닌으로의 변경이 FVIII 발현을 개선시키지 않았음을 보여준다. 따라서, FVIII 단백질에 대하여 이루어진 모든 아미노산 변경은 알부민 인트론 1 내로의 표적화된 통합 후에 FVIII 발현에 영향을 갖지 않는다.Normalization of each mouse's blood FVIII level to the integration frequency provides a measure of the efficiency of intrinsic expression of the FVIII coding sequence. The mean of the ratio of FVIII levels divided by the targeted integration frequency was 37.4 for pCB1019 injected mice, 41.5 for pCB1025 injected mice and 49.9 for pCB1026 injected mice. The difference in FVIII activity normalized to targeted integration in pCB1025 and pCB1026 injected mice compared to pCB1019 injected mice was not statistically significant (two-tailed Student's T-test), indicating that (5 N instead of B domain) -in the context of the FVIII-BDD cassette containing a glycan motif) shows that the change from amino acid F309 to serine or alanine did not improve FVIII expression. Thus, any amino acid changes made to the FVIII protein have no effect on FVIII expression after targeted integration into albumin intron 1.

실시예 7Example 7 : CRISPR/Cas 뉴클레아제에 의한 트랜스페린 인트론 1 내로의 합성 FVIII의 표적화된 통합은 치료적 수준의 인간 FVIII의 발현을 초래한다: Targeted Integration of Synthetic FVIII into Transferrin Intron 1 by CRISPR/Cas Nucleases Results in Therapeutic Levels of Expression of Human FVIII

DNA 구축물DNA construct

트랜스페린 유전자좌 내로의 통합 및 그로부터의 발현을 시험하기 위하여, 알부민 유전자좌에 대한 대안으로서, 인간 FVIII 공여자 카세트(SEQ ID NO: 224)를 5’에서 3’의 순서로 하기와 같은 서열 요소를 사용하여 구축하였다: AAV2의 역위 말단 반복부(ITR) | gRNA mTF-T2에 대한 표적 부위 | 18 bp 스페이서 | 스플라이스 수여자 | 마우스 트랜스페린의 신호 펩티드의 마지막 4개의 아미노산을 인코딩하는 서열(ggctgtgtctggct, SEQ ID NO: 225) | 합성 FVIII 코딩 서열 | 폴리아데닐화 신호(spA) | gRNA mTF-T2에 대한 표적 부위 | AAV2의 역위 말단 반복부(ITR). gRNA mTF-T2에 대한 표적 부위의 서열은 마우스 게놈 내의 표적 서열의 역 상보물이었으며, 이는 정방향 배향으로의 통합에 유리할 수 있다. 폴리아데닐화 신호는 폴리아데닐화를 효율적으로 유도하는 것으로 보고된 짧은 49 bp 서열이다(문헌[N. Levitt et al., Genes Dev (1989) 3:1019-25]). 합성 FVIII 코딩 서열은 B 도메인 대신에 아미노산 서열 SFSQNATNVSNNSNTSNDSNVSPPVLKRHQR(SEQ ID NO: 226)을 함유하는 B 도메인 치환물을 인코딩하였으며, B 도메인을 대체하는 이종 31개 아미노산 서열을 포함하였다. 이 서열은 N-연결된 글리코실화 부위에 상응하는 6개의 트리펩티드를 함유하며(볼드체로 표시), FVIII의 발현을 개선시키는 것으로 나타나 있다(문헌[J. McIntosh et al., Blood (2013) 121:3335-44]).To test integration into and expression from the transferrin locus, as an alternative to the albumin locus, the human FVIII donor cassette (SEQ ID NO: 224) was constructed using the following sequence elements in 5' to 3' order: were: inverted terminal repeat (ITR) of AAV2 | Target site for gRNA mTF-T2 | 18 bp spacer | Splice Grants | sequence encoding the last 4 amino acids of the signal peptide of mouse transferrin (ggctgtgtctggct, SEQ ID NO: 225) | Synthetic FVIII Coding Sequence | polyadenylation signal (spA) | Target site for gRNA mTF-T2 | Inverted terminal repeat (ITR) of AAV2. The sequence of the target site for the gRNA mTF-T2 was the reverse complement of the target sequence in the mouse genome, which may favor integration in the forward orientation. The polyadenylation signal is a short 49 bp sequence that has been reported to induce polyadenylation efficiently (N. Levitt et al., Genes Dev (1989) 3 :1019-25). The synthetic FVIII coding sequence encoded a B domain substitution containing the amino acid sequence SFSQN ATNVSNNSNTSNDSNVS PPVLKRHQR (SEQ ID NO: 226) in place of the B domain and comprised a heterologous 31 amino acid sequence replacing the B domain. This sequence contains 6 tripeptides corresponding to N-linked glycosylation sites (in bold) and has been shown to improve expression of FVIII (J. McIntosh et al., Blood (2013) 121 : 3335-44]).

AAV8 내로의 pCB1009 FVIII 공여자 DNA의 패키징을 3가지 플라스미드로 트랜스펙션시킨 HEK293 세포에서 확립된 바이러스 패키징 방법을 사용하여 달성하였으며, 한 플라스미드는 AAV 패키징 단백질을 인코딩하며, 제2 플라스미드는 아데노바이러스 헬퍼 단백질을 인코딩하며, 제3 플라스미드는 AAV ITR 서열에 측접한 FVIII 공여자 DNA 서열을 함유하였다. 트랜스펙션된 세포는 제1 플라스미드 상에 인코딩된 AAV 캡시드 단백질의 조성에 의해 특정된 혈청형의 AAV 입자를 야기한다. 이들 AAV 입자를 세포 상청액 또는 상청액 및 용해된 세포로부터 수집하고, CsCl 기울기에 걸쳐 정제하였다. 디지털 드롭렛 PCR(DD-PCR)에 의해 공여자 DNA의 게놈 카피의 수를 측정함으로써 정제된 바이러스 입자를 정량화하였다.Packaging of pCB1009 FVIII donor DNA into AAV8 was achieved using established viral packaging methods in HEK293 cells transfected with three plasmids, one plasmid encoding the AAV packaging protein and the second plasmid encoding an adenovirus helper protein. , and the third plasmid contained the FVIII donor DNA sequence flanked by the AAV ITR sequence. The transfected cells give rise to AAV particles of a serotype specified by the composition of the AAV capsid protein encoded on the first plasmid. These AAV particles were collected from cell supernatant or supernatant and lysed cells and purified over a CsCl gradient. Purified viral particles were quantified by determining the number of genomic copies of donor DNA by digital droplet PCR (DD-PCR).

구축물의 생체내 시험In vivo testing of constructs

5마리의 A형 혈우병 마우스의 코호트에 AAV8-pCB1009를 2 x 1012 vg/kg(체중)의 용량으로 꼬리 정맥 내로 정맥내(i.v.) 주사하였다. AAV8 바이러스는 우선적으로 간세포를 형질도입시킨다. 4주 후에, 동일한 마우스에 2개의 LNP의 1:1(RNA의 질량 기준) 혼합물을 2 mg/kg(체중)의 전체 RNA 용량으로 정맥내 주사하였으며, 하나는 spCas9 mRNA를 캡슐화하고, 하나는 가이드 RNA mTF-T2를 캡슐화한다. LNP는 주로 간세포에 의해 흡수된다. LNP를 투여한 지 10일 후에, 혈액 시료를 상기 기술된 바와 같이 수득하고 검정하였다. FVIII 활성은 평균이 정상 인간 FVIII 수준의 954%(± 251%)였으며(도 6), 이는 9.54 IU/mL와 동등하거나, 혈우병이 없는 인간에서의 평균 수준보다 9.5배 더 큰 것이다. 나이브 A형 혈우병 마우스는 검출 불가능한 FVIII 활성을 가졌다(정상의 0.5 % 미만).A cohort of 5 hemophilia A mice was injected intravenously (iv) into the tail vein with AAV8-pCB1009 at a dose of 2 x 10 12 vg/kg body weight. AAV8 virus preferentially transduces hepatocytes. After 4 weeks, the same mice were injected intravenously with a 1:1 (by mass of RNA) mixture of two LNPs at a total RNA dose of 2 mg/kg body weight, one encapsulating spCas9 mRNA and one guide Encapsulates RNA mTF-T2. LNP is mainly taken up by hepatocytes. Ten days after LNP administration, blood samples were obtained and assayed as described above. FVIII activity averaged 954% (± 251%) of normal human FVIII levels ( FIG. 6 ), which is equivalent to 9.54 IU/mL or 9.5-fold greater than the mean level in humans without hemophilia. Naïve hemophilia A mice had undetectable FVIII activity (less than 0.5% of normal).

이들 데이터는 트랜스페린의 인트론 1 내로의 FVIII 코딩 서열의 통합의 표적화가 높은 수준의 FVIII 발현 및 활성을 초래할 수 있는 것을 보여주며, 이는 결함이 있는 FVIII을 갖는 질환, 예컨대 A형 혈우병을 치료하기 위한 이 방법의 유용성을 보여준다.These data show that the targeting of integration of the FVIII coding sequence into intron 1 of transferrin can result in high levels of FVIII expression and activity, which can be used to treat diseases with defective FVIII, such as hemophilia A. demonstrates the usefulness of the method.

실시예 8Example 8 : 추가의 전달 방식: Additional delivery method

또 다른 예에서, 공여자 주형은 생체내에서 비-바이러스 LNP 전달 시스템을 사용하여 전달된다. DNA 분자는 상기 기술된 것들과 유사한 LNP 입자 내로 캡슐화되고, 정맥내 주사에 의해 간으로 전달된다. 엔도솜에서 세포질로의 DNA 회피가 상대적으로 효율적으로 발생하지만, 하전된 거대 DNA 분자의 핵 내로의 전좌는 효율적이지 않다. 하나의 경우에, 핵으로의 DNA의 전달은 AAV ITR 서열을 공여자 주형 내로 혼입시킴으로써 AAV 게놈을 모방하여 개선된다. 이 경우에, ITR 서열은 DNA를 안정화시키거나 다르게는 핵 전좌를 개선시킨다. 공여자 주형 서열로부터의 CG 디뉴클레오티드(CpG 서열)의 제거는 또한 핵 전달을 개선시킨다. CG 디뉴클레오티드를 함유하는 DNA는 선천 면역계에 의해 인식되고 제거된다. 인공 DNA 서열에 존재하는 CpG 서열의 제거에 의해, 비-바이러스 및 바이러스 벡터에 의해 전달되는 DNA의 지속성이 개선된다. 코돈 최적화 과정은 일반적으로 CG 디뉴클레오티드의 함량을 증가시키는데, 그 이유는 많은 경우에 가장 빈번한 코돈이 3번째 위치에 C 잔기를 가지며, 이는 다음 코돈이 G로 시작하는 경우에 CG를 생성하는 기회를 증가시키기 때문이다. 공여자 주형의 LNP 전달에 이어서 1시간 내지 5일 후에 gRNA 및 Cas9 mRNA를 함유하는 LNP의 조합을 A형 혈우병 마우스에서 평가한다.In another example, the donor template is delivered in vivo using a non-viral LNP delivery system. DNA molecules are encapsulated into LNP particles similar to those described above and delivered to the liver by intravenous injection. Although endosome to cytoplasmic DNA evasion occurs relatively efficiently, translocation of large charged DNA molecules into the nucleus is not. In one case, delivery of DNA to the nucleus is improved by mimicking the AAV genome by incorporating an AAV ITR sequence into a donor template. In this case, the ITR sequence stabilizes the DNA or otherwise improves nuclear translocation. Removal of CG dinucleotides (CpG sequences) from the donor template sequence also improves nuclear delivery. DNA containing CG dinucleotides is recognized and cleared by the innate immune system. By removal of the CpG sequence present in the artificial DNA sequence, the persistence of DNA delivered by non-viral and viral vectors is improved. The codon optimization process generally increases the content of CG dinucleotides, since in many cases the most frequent codons have a C residue in position 3, which reduces the chance of generating a CG if the next codon starts with a G. because it increases The combination of LNP containing gRNA and Cas9 mRNA is evaluated in hemophilia A mice 1 hour to 5 days following LNP delivery of the donor template.

gRNA 및 Cas9 mRNA의 생체내 전달은 알려져 있는 방법에 의해 달성될 수 있다. 하나의 방법에서, gRNA 및 Cas9 단백질은 AAV 바이러스 벡터로부터 발현된다. 이 경우에, gRNA의 전사는 U6 프로모터에 의해 유도되며, Cas9 mRNA 전사는 편재성 프로모터, 예를 들어, EF1-알파 또는 간 특이적인 프로모터/인핸서, 예컨대 트랜스티레틴 프로모터/인핸서에 의해 유도된다. spCas9 코딩 서열의 크기(4.4 Kb)는 단일의 AAV 내의 spCas9 및 gRNA 카세트의 포함을 불가능하게 하며, 그에 의해, gRNA 및 spCas9를 전달하기 위하여 개별 AAV가 필요하다. 제2의 경우에, 바이러스 게놈의 자가-불활성화를 촉진시키는 서열 요소를 갖는 AAV 벡터가 사용된다. 이 경우에, 벡터 DNA 내에 gRNA에 대한 절단 부위를 포함시켜, 생체내에서 벡터 DNA의 절단을 초래한다. 절단되는 경우 Cas9의 발현을 차단하는 위치에 절단 부위를 포함시킴으로써 Cas9 발현은 더 짧은 기간으로 제한된다. 제3의 경우에, 생체내에서 gRNA 및 Cas9를 세포로 전달하기 위한 대안적인 접근법인 비-바이러스 전달 방법이 사용된다. 일 예에서, LNP가 비-바이러스 전달 방법으로서 사용된다. LNP에 사용하기 위하여 몇몇의 상이한 이온화 가능한 양이온성 지질이 이용 가능하다. 이들은 다른 것들 중 특히 C12-200, MC3, LN16 및 MD1을 포함한다. 한 유형의 LNP에서, GalNac 모이어티가 LNP의 외측에 부착되며, 아시알로당단백질 수용체를 통하여 간 내로 흡수되기 위한 리간드로서 작용한다. 이들 양이온성 지질 중 어느 하나를 사용하여 간으로의 gRNA 및 Cas9 mRNA의 전달을 위한 LNP를 제형화한다.Delivery of gRNA and Cas9 mRNA in vivo can be accomplished by known methods. In one method, the gRNA and Cas9 protein are expressed from an AAV viral vector. In this case, transcription of the gRNA is driven by the U6 promoter and Cas9 mRNA transcription is driven by a ubiquitous promoter such as EF1-alpha or a liver specific promoter/enhancer such as the transthyretin promoter/enhancer. The size of the spCas9 coding sequence (4.4 Kb) precludes inclusion of spCas9 and gRNA cassettes within a single AAV, thereby requiring separate AAVs to deliver gRNA and spCas9. In the second case, AAV vectors with sequence elements that promote self-inactivation of the viral genome are used. In this case, the inclusion of a cleavage site for the gRNA in the vector DNA results in cleavage of the vector DNA in vivo. Cas9 expression is restricted to a shorter period by including a cleavage site in a position that blocks expression of Cas9 when cleaved. In a third case, a non-viral delivery method, an alternative approach for delivering gRNA and Cas9 to cells in vivo, is used. In one example, LNP is used as a non-viral delivery method. Several different ionizable cationic lipids are available for use in LNPs. These include, among others, C12-200, MC3, LN16 and MD1. In one type of LNP, a GalNac moiety is attached to the outside of the LNP and acts as a ligand for uptake into the liver via the asialoglycoprotein receptor. Either of these cationic lipids is used to formulate LNPs for delivery of gRNA and Cas9 mRNA to the liver.

실시예 9Example 9 : 마우스 피브리노겐 알파 인트론 1에서의 치료적 코딩 서열의 표적화된 통합: Targeted Integration of Therapeutic Coding Sequences in Mouse Fibrinogen Alpha Intron 1

피브리노겐 알파 유전자좌 내로의 통합 및 그로부터의 발현을 시험하기 위하여, 알부민 또는 트랜스페린 유전자좌에 대한 대안으로서, 하기의 요소를 갖는 카세트를 갖는 AAV8 바이러스(AAV8-pCB1010, SEQ ID NO: 361)를 구축하였다: gRNA mFGA-T6에 대한 표적 부위, 18 bp 스페이서, FIX 스플라이스 수여자, B 도메인이 6개의 N-글리칸 모티프로 대체된 성숙 인간 FVIII 코딩 서열(내인성 FGA 엑손 1에 대한 스플라이싱 후에 FGA 신호 펩티드를 완성하도록 변형된 N-말단을 가짐), 폴리아데닐화 서열 및 gRNA mFGA-T6에 대한 표적 부위.To test integration into and expression from the fibrinogen alpha locus, as an alternative to the albumin or transferrin loci, an AAV8 virus (AAV8-pCB1010, SEQ ID NO: 361) was constructed with a cassette with the following elements: gRNA Target site for mFGA-T6, 18 bp spacer, FIX splice acceptor, mature human FVIII coding sequence in which the B domain is replaced by 6 N-glycan motifs (FGA signal peptide after splicing to endogenous FGA exon 1) (with the N-terminus modified to complete

A형 혈우병 마우스에 AAV8-pCB1010을 주사한 후, 28일 후에 T6 gRNA(마우스 피브리노겐 알파 인트론 1 표적화) 및 Cas9 mRNA를 캡슐화하는 LNP를 주사하였다. LNP의 투여 10일 후에, 혈액 시료를 안와후방 채혈에 의해 시트르산나트륨을 함유하는 모세관 내로 취하고(1:9 비의 시트르산나트륨 대 혈액), 혈장을 원심분리에 의해 수집하였다. 그 다음, 혈장 시료를 상기 기술된 바와 같이 FVIII에 대하여 검정하였다. 검정 결과를 정상 인간 FVIII 활성의 백분율로서 기록하였다(정상은 1 IU/mL로 정의됨). FVIII 활성은 평균이 정상 인간 FVIII 수준의 1124%(± 527%)였으며, 이는 11.24 IU/mL와 동등하거나, 혈우병이 없는 인간에서의 평균 수준보다 11배 더 큰 것이다. 나이브 A형 혈우병 마우스는 검출 불가능한 FVIII 활성을 가졌다(정상의 0.5 % 미만). AAV8-pCB1010 바이러스가 FVIII 카세트를 함유하며, 여기서 코딩 서열이 신호 펩티드를 결여하고, 프로모터도 또한 결여하기 때문에, 단독의 이 바이러스는 분비된 FVIII 단백질을 야기할 수 없다.Hemophilia A mice were injected with AAV8-pCB1010, followed by injection of LNP encapsulating T6 gRNA (targeting mouse fibrinogen alpha intron 1) and Cas9 mRNA 28 days later. Ten days after administration of LNP, blood samples were taken into capillaries containing sodium citrate by retroorbital bleed (sodium citrate to blood in a 1:9 ratio), and plasma was collected by centrifugation. Plasma samples were then assayed for FVIII as described above. Assay results were reported as a percentage of normal human FVIII activity (normal is defined as 1 IU/mL). FVIII activity averaged 1124% (± 527%) of normal human FVIII levels, which is equivalent to 11.24 IU/mL or 11-fold greater than the mean level in humans without hemophilia. Naïve hemophilia A mice had undetectable FVIII activity (less than 0.5% of normal). Since the AAV8-pCB1010 virus contains the FVIII cassette, in which the coding sequence lacks a signal peptide and also lacks a promoter, this virus alone cannot give rise to a secreted FVIII protein.

이들 데이터는 코딩 서열의 삽입을 위한 부위로서 피브리노겐의 적합성을 보여준다. 추가로, 그들은 B 도메인 치환된 FVIII 서열을 사용하여, 유용한 양의 FVIII을 발현할 수 있는 것을 보여준다. 따라서, 이러한 구축물 및 방법은 결함이 있는 FVIII과 연관된 장애를 치료하기 위해 사용될 수 있다.These data show the suitability of fibrinogen as a site for insertion of a coding sequence. Additionally, they show that using the B domain substituted FVIII sequence, useful amounts of FVIII can be expressed. Accordingly, such constructs and methods can be used to treat disorders associated with defective FVIII.

실시예 10Example 10 : 배양 중 일차 인간 간세포 내 인간 알부민 인트론 1에서 효율적으로 절단하는 가이드 RNA의 확인 및 선택: Identification and Selection of Guide RNAs that Efficiently Cleave Human Albumin Intron 1 in Primary Human Hepatocytes in Culture

인간 간세포에서 본 발명의 시스템의 작동을 입증하기 위하여, 일차 인간 간세포에서 절단 효율의 평가를 위해 인간과 비-인간 영장류 간에 완벽한 동일성을 갖는 것과, HuH7 및 HepG2 세포에서의 절단 효율에 대한 스크리닝에 기초하여, 4가지 gRNA(T4 - SEQ ID NO: 357, T5 - SEQ ID NO: 358, T11 - SEQ ID NO: 359 및 T13 - SEQ ID NO: 360)를 제조하였다. (BioIVT로부터 수득되는) 일차 인간 간세포를 해동시키고, 동결보호된 간세포 회복 배지(CHRM)(집코(Gibco))로 옮기고, 저속으로 펠렛화시킨 다음, 콜라겐 IV(코닝(Corning))가 사전-코팅된 24-웰 플레이트에서, InVitroGRO™ CP 배지(BioIVT) + Torpedo™ 항생제 믹스(BioIVT) 중에 0.7x106개 세포/mL의 밀도로 플레이팅하였다. 플레이트를 37℃에서 5% CO2에서 인큐베이션시켰다. 세포가 부착된 후에(플레이팅 3 내지 4시간 후에), 플레이트에 부착되지 않은 사멸 세포를 신선한 가온 완전 배지를 사용하여 세척하고, 추가 배지를 첨가하고, 세포를 37℃에서 5% CO2에서 인큐베이션시켰다. 세포를 트랜스펙션시키기 위하여, Cas9 mRNA(Trilink) 및 가이드 RNA를 얼음 위에서 해동시킨 다음, 웰당 0.6 μg의 mRNA 및 0.2 μg의 가이드 RNA로, 30 μL의 Opti-Mem™ 배지(집코)에 첨가하였다. 총 핵산 중량에 대하여 2:1 부피로 Opti-Mem™ 30 μL 중에 희석된 MessengerMax™(써모피셔)를 실온에서 20분 동안 Cas9 mRNA/gRNA Opti-Mem™ 용액과 인큐베이션시켰다. 이 혼합물을 24-웰 플레이트 내의 배양된 간세포 웰당 500 μL의 간세포 플레이팅 배지에 적가하고, 세포를 37℃에서 5% CO2에서 인큐베이션시켰다. 다음날 아침에 세포를 세척하고, 다시 피딩(re-fed)하였다. 200 μL의 가온 0.25% 트립신-EDTA(집코)를 각 웰에 첨가하고 37℃에서 5 내지 10분 인큐베이션시킴으로써 세포를 게놈 DNA 추출을 위하여 트랜스펙션 48시간 후에 수집하였다. 일단 세포가 제거되면, 200 μL의 FBS(집코)를 첨가하여, 트립신을 불활성화시켰다. 1 mL의 PBS(집코)를 첨가한 후에, 세포를 1200 rpm에서 3분 동안 펠렛화시킨 다음, 50 μL의 PBS 중에 재현탁화시켰다. 게놈 DNA를 키트 설명서에 따라 MagMAX™ DNA Multi-Sample Ultra 2.0 키트(어플라이드 바이오시스템즈(Applied Biosytems))를 사용하여 추출하였다. 게놈 DNA 품질 및 농도를 분광광도계를 사용하여 분석하였다. TIDE 분석을 위하여, 게놈 DNA를 35 사이클의 PCR 및 55℃의 어닐링 시간을 사용하여 플래티늄(Platinum) ® PCR 슈퍼믹스 하이 피델리티(SuperMix High Fidelity)(인비트로겐™) 및 예측된 온-표적 절단 부위에 측접한 프라이머(AlbF: CCCTCCGTTTGTCCTAGCTTTTC, SEQ ID NO: 353 및 AlbR: CCAGATACAGAATATCTTCCTCAACGCAGA, SEQ ID NO: 354)를 사용해 PCR 증폭시켰다. PCR 생성물을 아가로스 겔 전기영동에 의해 분석하여, 올바른 크기의 생성물(1053bp)이 생성된 것을 확인한 다음, 정제하고, 프라이머(정방향: CCTTTGGCACAATGAAGTGG, SEQ ID NO: 355; 역방향: GAATCTGAACCCTGATGACAAG, SEQ ID NO: 356)를 사용하여 서열분석하였다. 서열 데이터를 Tsunami로 지칭되는 변형된 버전의 TIDES 알고리즘(문헌[E.K. Brinkman et al., Nuc Acids Res (2014) 42(22):e168])을 사용하여 분석하였으며, 이에 의해, gRNA/Cas9 복합체에 대한 예측된 절단 부위에 존재하는 삽입 및 결실의 빈도가 결정된다.To demonstrate the operation of the system of the present invention in human hepatocytes, based on screening for cleavage efficiency in HuH7 and HepG2 cells, with perfect identity between humans and non-human primates for evaluation of cleavage efficiency in primary human hepatocytes. Thus, four gRNAs (T4 - SEQ ID NO: 357, T5 - SEQ ID NO: 358, T11 - SEQ ID NO: 359 and T13 - SEQ ID NO: 360) were prepared. Primary human hepatocytes (obtained from BioIVT) were thawed, transferred to cryoprotected hepatocyte recovery medium (CHRM) (Gibco), pelleted at low speed, and then pre-coated with collagen IV (Corning). In 24-well plates, plated at a density of 0.7x10 6 cells/mL in InVitro GRO™ CP medium (BioIVT) + Torpedo ™ antibiotic mix (BioIVT). Plates were incubated at 37° C. in 5% CO 2 . After the cells adhered (3 to 4 hours after plating), the apoptotic cells that did not adhere to the plate are washed with fresh warm complete medium, additional medium is added, and the cells are incubated at 37° C. in 5% CO 2 . made it To transfect cells, Cas9 mRNA (Trilink) and guide RNA were thawed on ice and then added to 30 μL of Opti-Mem™ medium (Zipco) at 0.6 μg mRNA and 0.2 μg guide RNA per well. . MessengerMax™ (Thermo Fisher) diluted in 30 μL of Opti-Mem™ at a volume of 2:1 relative to total nucleic acid weight was incubated with the Cas9 mRNA/gRNA Opti-Mem™ solution for 20 minutes at room temperature. This mixture was added dropwise to 500 μL of hepatocyte plating medium per well of cultured hepatocytes in a 24-well plate, and the cells were incubated at 37° C. in 5% CO 2 . The next morning the cells were washed and re-fed. Cells were collected 48 hours post-transfection for genomic DNA extraction by adding 200 μL of warm 0.25% trypsin-EDTA (Zipco) to each well and incubating at 37° C. for 5-10 minutes. Once cells were removed, trypsin was inactivated by adding 200 μL of FBS (Zipco). After addition of 1 mL of PBS (Zipco), cells were pelleted at 1200 rpm for 3 min and then resuspended in 50 μL of PBS. Genomic DNA was extracted using the MagMAX™ DNA Multi-Sample Ultra 2.0 kit (Applied Biosytems) according to the kit instructions. Genomic DNA quality and concentration was analyzed using a spectrophotometer. For TIDE analysis, genomic DNA was subjected to Platinum ® PCR SuperMix High Fidelity (Invitrogen™) and predicted on-target cleavage sites using 35 cycles of PCR and an annealing time of 55°C. PCR amplification was performed using flanking primers (AlbF: CCCTCCGTTTGTCCTAGCTTTTC, SEQ ID NO: 353 and AlbR: CCAGATACAGAATATCTTCCTCAACGCAGA, SEQ ID NO: 354). The PCR product was analyzed by agarose gel electrophoresis to confirm that a product of the correct size (1053 bp) was produced, then purified and primers (forward: CCTTTGGCACAATGAAGTGG, SEQ ID NO: 355; reverse: GAATCTGAACCCTGATGACAAG, SEQ ID NO: 356) was used for sequencing. Sequence data were analyzed using a modified version of the TIDES algorithm referred to as Tsunami (EK Brinkman et al., Nuc Acids Res (2014) 42 (22):e168), whereby the gRNA/Cas9 complex The frequency of insertions and deletions present at the predicted cleavage site for the cleavage is determined.

T4(SEQ ID NO: 357), T5(SEQ ID NO: 358), T11(SEQ ID NO: 359) 및 T13(SEQ ID NO: 360) 가이드의 20개 뉴클레오티드 표적 서열 또는 (5' 말단에서 1 bp 더 짧은) 19개 뉴클레오티드 표적 서열 중 어느 하나를 함유하는 가이드 RNA를 시험하였다. 19개 뉴클레오티드 gRNA는 더욱 서열 특이적일 수 있지만, 더 짧은 가이드는 더 낮은 효력을 가질 수 있다(삽입 및 결실로서 측정되는 이중-가닥 절단의 효율). 인간 보체 인자 및 인간 AAVS1 유전자좌를 표적화하는 대조군 가이드를 공여자 간의 비교를 위하여 포함시켰다. 알부민 인트론 1 내의 표적 부위에서의 삽입 및 결실 빈도를 TIDES 방법을 사용하여 트랜스펙션한 지 48시간 후에 측정하였다. 도 7에는 4명의 상이한 인간 공여자 유래의 일차 간세포의 트랜스펙션으로부터의 결과가 요약되어 있다.20 nucleotide target sequence of T4 (SEQ ID NO: 357), T5 (SEQ ID NO: 358), T11 (SEQ ID NO: 359) and T13 (SEQ ID NO: 360) guides or (1 bp at the 5' end) Guide RNAs containing any of the shorter) 19 nucleotide target sequences were tested. A 19 nucleotide gRNA may be more sequence specific, but shorter guides may have lower potency (efficiency of double-stranded cleavage measured as insertions and deletions). Control guides targeting human complement factor and human AAVS1 locus were included for comparison between donors. The frequency of insertions and deletions at target sites in albumin intron 1 was determined 48 hours after transfection using the TIDES method. 7 summarizes the results from transfection of primary hepatocytes from four different human donors.

결과에 의해, 상이한 가이드에 대하여 20% 내지 80% 범위인 절단 효율이 입증된다. 20개 뉴클레오티드 버전의 각각의 알부민 gRNA는 19개 뉴클레오티드 변이체보다 지속적으로 더욱 강력하였다. 20개 뉴클레오티드 gRNA의 뛰어난 효력은 19개 뉴클레오티드 gRNA가 더 낮은 오프-표적 절단에 관하여 가질 수 있는 임의의 가능한 이익을 상쇄시킬 수 있다. 가이드 RNA T4는 4명의 세포 공여자 간에 가장 지속적인 절단을 나타내었으며, 삽입 및 결실 빈도는 약 60%였다.The results demonstrate cutting efficiencies ranging from 20% to 80% for different guides. The 20 nucleotide version of each albumin gRNA was consistently more potent than the 19 nucleotide variant. The superior potency of a 20 nucleotide gRNA could counteract any possible benefit that a 19 nucleotide gRNA might have with respect to lower off-target cleavage. Guide RNA T4 exhibited the most persistent cleavage among the four cell donors, with insertion and deletion frequencies of approximately 60%.

실시예 11Example 11 : 상이한 수의 N-글리칸으로 구성된 B-도메인 치환물을 갖는 코돈 최적화된 FVIII 코딩 서열(CpG 부재)을 캡슐화하는 AAV8 바이러스에 이어서 트랜스페린 유전자좌를 표적화하는 gRNA를 갖는 단일의 LNP 용량으로부터의 FVIII 발현의 평가: FVIII expression from a single LNP dose with an AAV8 virus encapsulating a codon-optimized FVIII coding sequence (without CpG) with B-domain substitutions composed of a different number of N-glycans followed by a gRNA targeting the transferrin locus evaluation of

이 연구는 B-도메인 치환물이 0, 1, 3, 5 또는 6개의 글리칸을 함유한 FVIII을 인코딩하는 AAV8 바이러스로부터의 FVIII 발현을 평가하였다. FVIII 코딩 서열을 코돈 최적화시킨 다음, CpG를 수동으로 제거하였다. 이 연구에서 사용되는 구축물은 도 9에 나타나 있다.This study evaluated FVIII expression from AAV8 virus encoding FVIII in which the B-domain substitutions contained 0, 1, 3, 5 or 6 glycans. The FVIII coding sequence was codon optimized and then CpG was removed manually. The construct used in this study is shown in FIG. 9 .

제0일에, A형 혈우병 마우스(8 내지 10주령)에 각각의 바이러스를 꼬리 정맥 주사에 의해 투여하였다. 제28일에, A형 혈우병 마우스에, Cas9 mRNA(411 μg/ml) 및 가이드 RNA mTF-T2(379 μg/ml)를 캡슐화하는 지질 나노-입자(LNP)를 안와후방으로 주사하였다. 연구 군 및 투여량은 표 7에 나타나 있다.On day 0, mice with hemophilia A (8-10 weeks old) were administered each virus by tail vein injection. On day 28, hemophilia A mice were retroorbitally injected with lipid nanoparticles (LNPs) encapsulating Cas9 mRNA (411 μg/ml) and guide RNA mTF-T2 (379 μg/ml). Study groups and doses are shown in Table 7.

[표 7] 연구 군 및 투여량[Table 7] Study group and dose

Figure pct00008
Figure pct00008

LNP를 투여한 지 11일 후에, 혈액 시료를 상기 기술된 바와 같이 수득하고 검정하였다. 그 다음, LNP를 투여한 지 18일 후에, 혈액 시료를 최종 심장 채혈을 통해 수득하고, 상기 기술된 바와 같이 검정하였다.After 11 days of LNP administration, blood samples were obtained and assayed as described above. Then, 18 days after LNP dosing, blood samples were obtained via a final cardiac draw and assayed as described above.

제11일에 측정된 FVIII 활성 수준은 도 10에 나타나 있다. 제18일에 측정된 FVIII 활성 수준은 도 11에 나타나 있다. FVIII 활성 수준은 표 8 및 표 9에 제공되어 있다.FVIII activity levels measured on day 11 are shown in FIG. 10 . FVIII activity levels measured on day 18 are shown in FIG. 11 . FVIII activity levels are provided in Tables 8 and 9.

[표 8] 제11일의 FVIII 활성 수준Table 8: FVIII activity level at day 11

Figure pct00009
Figure pct00009

[표 9] 제18일의 FVIII 활성 수준Table 9 FVIII activity level at day 18

Figure pct00010
Figure pct00010

마우스를 희생시킨 후에, 전체 간을 균질화시키고, 전체 게놈 DNA를 간 용해물의 일부로부터 추출하였다. 정방향 배향으로의 알부민 인트론 1 내로의 표적화된 통합의 빈도를 실시예 1에 기술된 DD-PCR 검정을 사용하여 정량화하였다. 결과는 도 12 및 표 10에 나타나 있다.After sacrificing the mice, whole livers were homogenized and whole genomic DNA was extracted from a portion of liver lysates. The frequency of targeted integration into albumin intron 1 in forward orientation was quantified using the DD-PCR assay described in Example 1. The results are shown in Figure 12 and Table 10.

[표 10] FVIII 표적화된 통합 빈도Table 10: FVIII Targeted Integration Frequency

Figure pct00011
Figure pct00011

이들 데이터는 0, 1, 3, 5 또는 6개의 글리칸을 함유하는 FVIII 코딩 서열이 높은 수준의 FVIII 발현 및 활성을 초래할 수 있는 것을 보여주며, 이는 결함이 있는 FVIII을 갖는 질환, 예컨대 A형 혈우병을 치료하기 위한 이 방법의 유용성을 보여준다.These data show that FVIII coding sequences containing 0, 1, 3, 5 or 6 glycans can result in high levels of FVIII expression and activity, which is a disease with defective FVIII, such as hemophilia A shows the usefulness of this method for treating

본 개시내용은 몇몇의 기술된 실시형태와 관련하여 일부 길이로, 다소 자세하게 기술되었지만, 임의의 이러한 특정 사항 또는 실시형태 또는 임의의 특정 실시형태로 제한되어야 하는 것으로 의도된 것은 아니고, 선행 기술의 관점에서 이러한 청구범위의 가장 광범위한 가능한 해석을 제공하고, 따라서 본 개시내용의 의도된 범위를 효과적으로 포함하도록 첨부된 청구범위를 참조하여 해석되어야 한다.Although the present disclosure has been described in some length and with some detail in connection with several described embodiments, it is not intended to be limited to any such specific point or embodiment or to any particular embodiment, and is, in view of the prior art, provides the broadest possible interpretation of these claims, and therefore should be construed with reference to the appended claims so as to effectively encompass the intended scope of the present disclosure.

서열 목록sequence list

본 개시내용에서 다른 곳에 개시된 서열에 더하여, 하기의 서열은 그들이 본 개시내용의 예시적인 실시형태에 언급되거나 사용되는 바와 같이 제공되며, 이는 예시의 목적을 위해 제공된다.In addition to sequences disclosed elsewhere in this disclosure, the following sequences are provided as they are referred to or used in exemplary embodiments of the present disclosure, and are provided for purposes of illustration.

Figure pct00012
Figure pct00012

Figure pct00013
Figure pct00013

Figure pct00014
Figure pct00014

Figure pct00015
Figure pct00015

Figure pct00016
Figure pct00016

Figure pct00017
Figure pct00017

Figure pct00018
Figure pct00018

Figure pct00019
Figure pct00019

Figure pct00020
Figure pct00020

Figure pct00021
Figure pct00021

Figure pct00022
Figure pct00022

Figure pct00023
Figure pct00023

Figure pct00024
Figure pct00024

Figure pct00025
Figure pct00025

Figure pct00026
Figure pct00026

Figure pct00027
Figure pct00027

Figure pct00028
Figure pct00028

Figure pct00029
Figure pct00029

Figure pct00030
Figure pct00030

Figure pct00031
Figure pct00031

Figure pct00032
Figure pct00032

Figure pct00033
Figure pct00033

Figure pct00034
Figure pct00034

Figure pct00035
Figure pct00035

Figure pct00036
Figure pct00036

Figure pct00037
Figure pct00037

Figure pct00038
Figure pct00038

Figure pct00039
Figure pct00039

Figure pct00040
Figure pct00040

Figure pct00041
Figure pct00041

Figure pct00042
Figure pct00042

Figure pct00043
Figure pct00043

Figure pct00044
Figure pct00044

Figure pct00045
Figure pct00045

Figure pct00046
Figure pct00046

Figure pct00047
Figure pct00047

Figure pct00048
Figure pct00048

Figure pct00049
Figure pct00049

Figure pct00050
Figure pct00050

Figure pct00051
Figure pct00051

Figure pct00052
Figure pct00052

Figure pct00053
Figure pct00053

Figure pct00054
Figure pct00054

Figure pct00055
Figure pct00055

Figure pct00056
Figure pct00056

Figure pct00057
Figure pct00057

Figure pct00058
Figure pct00058

Figure pct00059
Figure pct00059

Figure pct00060
Figure pct00060

Figure pct00061
Figure pct00061

Figure pct00062
Figure pct00062

Figure pct00063
Figure pct00063

Figure pct00064
Figure pct00064

Figure pct00065
Figure pct00065

Figure pct00066
Figure pct00066

Figure pct00067
Figure pct00067

Figure pct00068
Figure pct00068

Figure pct00069
Figure pct00069

Figure pct00070
Figure pct00070

Figure pct00071
Figure pct00071

Figure pct00072
Figure pct00072

Figure pct00073
Figure pct00073

Figure pct00074
Figure pct00074

SEQUENCE LISTING <110> CRISPR THERAPEUTICS AG BAYER HEALTHCARE LLC <120> GENE EDITING FOR HEMOPHILIA A WITH IMPROVED FACTOR VIII EXPRESSION <130> 105965-655734-021US1 <140> 16/849,796 <141> 2020-04-15 <150> 62/806,702 <151> 2019-02-15 <150> 62/857,782 <151> 2019-06-05 <160> 373 <170> PatentIn version 3.5 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T12 gRNA spacer <400> 1 aaggaagcgg tgccatcgag 20 <210> 2 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T168 gRNA spacer <400> 2 aacttctgcc tgccattcat 20 <210> 3 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T73 gRNA spacer <400> 3 agcaaagggt tttgataacc 20 <210> 4 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T99 gRNA spacer <400> 4 ttgcctggga gggtcaaatg 20 <210> 5 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T26 gRNA spacer <400> 5 ggcttggcca acgacaagca 20 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T111 gRNA spacer <400> 6 ccttgtgggc caccacagca 20 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T76 gRNA spacer <400> 7 gggcccactc cctatgctga 20 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T128 gRNA spacer <400> 8 tctgagtctg agccaataga 20 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T188 gRNA spacer <400> 9 cctgcctcca gagttcccat 20 <210> 10 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T151 gRNA spacer <400> 10 acagctctcc aggatgcatg 20 <210> 11 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T67 gRNA spacer <400> 11 ggcccatggg aaatcctagg 20 <210> 12 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T138 gRNA spacer <400> 12 agggtggtca gtaggaaact 20 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T115 gRNA spacer <400> 13 ccttgctgtg gtggcccaca 20 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T45 gRNA spacer <400> 14 ggtagcaagc caatgtgttg 20 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T180 gRNA spacer <400> 15 gcagattgtc atctccagct 20 <210> 16 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T148 gRNA spacer <400> 16 ccacagcaag gctgactcac 20 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T100 gRNA spacer <400> 17 actgaggctt atgttccatg 20 <210> 18 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T66 gRNA spacer <400> 18 gggcaaaagc tcatgtgata 20 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T162 gRNA spacer <400> 19 atactgaggc ttatgttcca 20 <210> 20 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T175 gRNA spacer <400> 20 ccagtgagtc agccttgctg 20 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T172 gRNA spacer <400> 21 ggatttccca tgggccaaga 20 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T104 gRNA spacer <400> 22 gggtcaaatg agggtcagcg 20 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T19 gRNA spacer <400> 23 tcaactatgg aaaaccagcg 20 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T77 gRNA spacer <400> 24 cataagcctc agtatgcaca 20 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T62 gRNA spacer <400> 25 tatgttccat ggggggccag 20 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T106 gRNA spacer <400> 26 agggcccact ccctatgctg 20 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T163 gRNA spacer <400> 27 gctgtgggcc tcctctccac 20 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T134 gRNA spacer <400> 28 acaaatgccc catgaatggc 20 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T167 gRNA spacer <400> 29 gtggctgtca aggcctttct 20 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T61 gRNA spacer <400> 30 tcctgtccat gaacactaca 20 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T6 gRNA spacer <400> 31 agacagcatc gcccctagaa 20 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T44 gRNA spacer <400> 32 ccttcttggc cagtagttga 20 <210> 33 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T3 gRNA spacer <400> 33 aaggtcaccc tgcttgtcgt 20 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T68 gRNA spacer <400> 34 gagggaaaat gggggtcgct 20 <210> 35 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T103 gRNA spacer <400> 35 taggaggcaa cataagcctg 20 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T81 gRNA spacer <400> 36 aaaacgccct gtgcatactg 20 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T146 gRNA spacer <400> 37 gtgagtcagc cttgctgtgg 20 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T63 gRNA spacer <400> 38 ggctgtcaag gcctttctag 20 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T87 gRNA spacer <400> 39 aggtagcaag ccaatgtgtt 20 <210> 40 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T184 gRNA spacer <400> 40 gattgtcatc tccagctggg 20 <210> 41 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T116 gRNA spacer <400> 41 tcctggccgg ctcctcacca 20 <210> 42 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T24 gRNA spacer <400> 42 attctcgcct atgggaactc 20 <210> 43 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T21 gRNA spacer <400> 43 tggcttggcc aacgacaagc 20 <210> 44 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T41 gRNA spacer <400> 44 ttggcttgct acctcaacta 20 <210> 45 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T55 gRNA spacer <400> 45 gaggtagcaa gccaatgtgt 20 <210> 46 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T90 gRNA spacer <400> 46 aggagacaag gcggatacag 20 <210> 47 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T101 gRNA spacer <400> 47 gactctgggt ctgctactca 20 <210> 48 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T39 gRNA spacer <400> 48 ccgctggttt tccatagttg 20 <210> 49 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T150 gRNA spacer <400> 49 cctcaactat ggaaaaccag 20 <210> 50 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T156 gRNA spacer <400> 50 tggattttaa tagttaccca 20 <210> 51 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T40 gRNA spacer <400> 51 ggggataaag gcaagtaacg 20 <210> 52 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T8 gRNA spacer <400> 52 ccgggttgca gggaacgcgc 20 <210> 53 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T53 gRNA spacer <400> 53 cgcgcgggcc agcgactctg 20 <210> 54 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T117 gRNA spacer <400> 54 ctgaggctta tgttccatgg 20 <210> 55 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T49 gRNA spacer <400> 55 cggagtgcat gcaggctgcg 20 <210> 56 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T83 gRNA spacer <400> 56 acaggcttat gttgcctcct 20 <210> 57 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T64 gRNA spacer <400> 57 gggcatttgt cacactgttg 20 <210> 58 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T120 gRNA spacer <400> 58 tggcccctcc tcatgcatcc 20 <210> 59 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T161 gRNA spacer <400> 59 aaaatggagg gatagttcag 20 <210> 60 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T183 gRNA spacer <400> 60 tgtgacaaat gccccatgaa 20 <210> 61 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T182 gRNA spacer <400> 61 gtggtcagta ggaaactggg 20 <210> 62 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T119 gRNA spacer <400> 62 tgaggcttat gttccatggg 20 <210> 63 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T18 gRNA spacer <400> 63 gggataaagg caagtaacgt 20 <210> 64 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T107 gRNA spacer <400> 64 agggcaaaag ctcatgtgat 20 <210> 65 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T20 gRNA spacer <400> 65 gccatcgagc ggtcagagca 20 <210> 66 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T80 gRNA spacer <400> 66 ccctcaacta ctggccaaga 20 <210> 67 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T133 gRNA spacer <400> 67 cctcaactac tggccaagaa 20 <210> 68 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T84 gRNA spacer <400> 68 gagggtggtc agtaggaaac 20 <210> 69 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T85 gRNA spacer <400> 69 gtcgctgggg tggccatccc 20 <210> 70 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T143 gRNA spacer <400> 70 tggggagaga aaactaaacg 20 <210> 71 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T15 gRNA spacer <400> 71 cctgagcgcg gagtgcatgc 20 <210> 72 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T96 gRNA spacer <400> 72 gcgaccccca ttttccctct 20 <210> 73 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T118 gRNA spacer <400> 73 ctcaactatg gaaaaccagc 20 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T152 gRNA spacer <400> 74 gatccacaaa gcctgtggag 20 <210> 75 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T38 gRNA spacer <400> 75 ccccgcacag agcacttcac 20 <210> 76 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T132 gRNA spacer <400> 76 tgcaaggtaa tgctccactg 20 <210> 77 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T149 gRNA spacer <400> 77 aggggacgtc agcctctgaa 20 <210> 78 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T171 gRNA spacer <400> 78 agggaaaatg ggggtcgctg 20 <210> 79 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T30 gRNA spacer <400> 79 tgaggacaca ttctcgccta 20 <210> 80 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T71 gRNA spacer <400> 80 tgcctcctag gatttcccat 20 <210> 81 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T158 gRNA spacer <400> 81 cttggcccat gggaaatcct 20 <210> 82 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T36 gRNA spacer <400> 82 aggagttcgg acttgacaag 20 <210> 83 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T27 gRNA spacer <400> 83 acataagcct cagtatgcac 20 <210> 84 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T130 gRNA spacer <400> 84 caggacatct acagctccca 20 <210> 85 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T124 gRNA spacer <400> 85 gggccccacc tcaggaggtc 20 <210> 86 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T185 gRNA spacer <400> 86 aacgacaagc agggtgacct 20 <210> 87 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T79 gRNA spacer <400> 87 gcaggacatc tacagctccc 20 <210> 88 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T72 gRNA spacer <400> 88 cctgtgaagt gctctgtgcg 20 <210> 89 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T179 gRNA spacer <400> 89 tgcctgggag ggtcaaatga 20 <210> 90 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T170 gRNA spacer <400> 90 tggccatgcc tgcacccctc 20 <210> 91 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T181 gRNA spacer <400> 91 gccagcagag ggtggtcagt 20 <210> 92 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T42 gRNA spacer <400> 92 ctcctgtcca tgaacactac 20 <210> 93 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T114 gRNA spacer <400> 93 ggagtgggcc cttccacctc 20 <210> 94 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T23 gRNA spacer <400> 94 caactatgga aaaccagcgg 20 <210> 95 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T144 gRNA spacer <400> 95 tactgaggct tatgttccat 20 <210> 96 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T1 gRNA spacer <400> 96 cccatgctct gaccgctcga 20 <210> 97 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T186 gRNA spacer <400> 97 ctccccgacc tcctgaggtg 20 <210> 98 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T58 gRNA spacer <400> 98 ggggaatggt cagacccggg 20 <210> 99 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T113 gRNA spacer <400> 99 cttgtgccct gtagtgttca 20 <210> 100 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T29 gRNA spacer <400> 100 cccgcgcgtt ccctgcaacc 20 <210> 101 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T2 gRNA spacer <400> 101 ccatcgagcg gtcagagcat 20 <210> 102 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T48 gRNA spacer <400> 102 gccctgtagt gttcatggac 20 <210> 103 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T17 gRNA spacer <400> 103 aaatcagagc acgtctaacc 20 <210> 104 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T153 gRNA spacer <400> 104 gcctgtgaag tgctctgtgc 20 <210> 105 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T60 gRNA spacer <400> 105 ctcgcctatg ggaactctgg 20 <210> 106 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T164 gRNA spacer <400> 106 ggccccacct caggaggtcg 20 <210> 107 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T47 gRNA spacer <400> 107 ccgcgcgttc cctgcaaccc 20 <210> 108 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T110 gRNA spacer <400> 108 tggctgtcaa ggcctttcta 20 <210> 109 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T177 gRNA spacer <400> 109 tggcagatgc tgagtaccag 20 <210> 110 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T13 gRNA spacer <400> 110 gttaatttac cctcaactac 20 <210> 111 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T7 gRNA spacer <400> 111 cctgcatgca ctccgcgctc 20 <210> 112 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T89 gRNA spacer <400> 112 gaccctcatt tgaccctccc 20 <210> 113 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T16 gRNA spacer <400> 113 ccattagggc aaccttctat 20 <210> 114 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T155 gRNA spacer <400> 114 atgcatgagg aggggccacc 20 <210> 115 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T108 gRNA spacer <400> 115 gtcagccact gccccatagc 20 <210> 116 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T160 gRNA spacer <400> 116 cctatgggaa ctctggaggc 20 <210> 117 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T139 gRNA spacer <400> 117 acttctgcct gccattcatg 20 <210> 118 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T11 gRNA spacer <400> 118 cggtggccgc ccgggttgca 20 <210> 119 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T169 gRNA spacer <400> 119 ggggacgtca gcctctgaaa 20 <210> 120 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T5 gRNA spacer <400> 120 gaggacacat tctcgcctat 20 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T131 gRNA spacer <400> 121 gcatggcatt caaggcctcc 20 <210> 122 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T22 gRNA spacer <400> 122 catcgagcgg tcagagcatg 20 <210> 123 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T126 gRNA spacer <400> 123 ctcaactact ggccaagaag 20 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T145 gRNA spacer <400> 124 ctgtggtggc ccacaaggag 20 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T187 gRNA spacer <400> 125 tctgctggcc agaggggtgc 20 <210> 126 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T112 gRNA spacer <400> 126 aggcgagaat gtgtcctcag 20 <210> 127 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T14 gRNA spacer <400> 127 gctcgatggc accgcttcct 20 <210> 128 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T70 gRNA spacer <400> 128 gtcctggccg gctcctcacc 20 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T57 gRNA spacer <400> 129 tttcagctac cccaacacat 20 <210> 130 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T4 gRNA spacer <400> 130 gggtagcacc gcagagtcgc 20 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T92 gRNA spacer <400> 131 cccttcttgg ccagtagttg 20 <210> 132 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T102 gRNA spacer <400> 132 aaaggggaat ggtcagaccc 20 <210> 133 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T159 gRNA spacer <400> 133 agctagcaat tccttgagag 20 <210> 134 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T10 gRNA spacer <400> 134 catgcactcc gcgctcaggc 20 <210> 135 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T157 gRNA spacer <400> 135 ttgcctccta ggatttccca 20 <210> 136 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T173 gRNA spacer <400> 136 catcacagca cttgcctggg 20 <210> 137 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T121 gRNA spacer <400> 137 tgatgacccc ctccctggtg 20 <210> 138 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T137 gRNA spacer <400> 138 agcagattgt catctccagc 20 <210> 139 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T98 gRNA spacer <400> 139 tcaaatgagg gtcagcgagg 20 <210> 140 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T141 gRNA spacer <400> 140 tggccggctc ctcaccaggg 20 <210> 141 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T50 gRNA spacer <400> 141 gatggcaatt cctcccccgc 20 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T94 gRNA spacer <400> 142 caaggaattg ctagcttatg 20 <210> 143 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T86 gRNA spacer <400> 143 taacgtgggg tcctctctca 20 <210> 144 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T35 gRNA spacer <400> 144 agtgctctgt gcggggataa 20 <210> 145 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T174 gRNA spacer <400> 145 cattttccct cttggcccat 20 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T97 gRNA spacer <400> 146 ttcactgctg caagatttac 20 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T127 gRNA spacer <400> 147 gtgaggagcc ggccaggact 20 <210> 148 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T56 gRNA spacer <400> 148 atgttgcaca catcctgcta 20 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T65 gRNA spacer <400> 149 tcaaggaatt gctagcttat 20 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T123 gRNA spacer <400> 150 tcttggatcc aagtcctggc 20 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T59 gRNA spacer <400> 151 ttctgagtta caccccttct 20 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T129 gRNA spacer <400> 152 ttcagaggct gacgtcccct 20 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T9 gRNA spacer <400> 153 ccaatagaag gttgccctaa 20 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T122 gRNA spacer <400> 154 cactccccga cctcctgagg 20 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T31 gRNA spacer <400> 155 cgcgttccct gcaacccggg 20 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T28 gRNA spacer <400> 156 gatggcaccg cttccttggc 20 <210> 157 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T43 gRNA spacer <400> 157 tatgaagggg gccccacctc 20 <210> 158 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T125 gRNA spacer <400> 158 tgctgtgatg accccctccc 20 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T165 gRNA spacer <400> 159 cacatcctgc tatggggcag 20 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T82 gRNA spacer <400> 160 aggctgcgcg gtggccgccc 20 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T109 gRNA spacer <400> 161 tggggcattt gtcacactgt 20 <210> 162 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T52 gRNA spacer <400> 162 ctcaaggaat tgctagctta 20 <210> 163 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T34 gRNA spacer <400> 163 ctatggaaaa ccagcggggg 20 <210> 164 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T88 gRNA spacer <400> 164 tgttgcacac atcctgctat 20 <210> 165 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T51 gRNA spacer <400> 165 agagggaaaa tgggggtcgc 20 <210> 166 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T46 gRNA spacer <400> 166 cttatgttcc atggggggcc 20 <210> 167 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T178 gRNA spacer <400> 167 tctgaccatt cccctttcag 20 <210> 168 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T74 gRNA spacer <400> 168 ggggcatttg tcacactgtt 20 <210> 169 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T176 gRNA spacer <400> 169 ccgcgctcag gctggaagcc 20 <210> 170 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T54 gRNA spacer <400> 170 gcggtggccg cccgggttgc 20 <210> 171 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T32 gRNA spacer <400> 171 tgcttgtcgt tggccaagcc 20 <210> 172 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T136 gRNA spacer <400> 172 tccctggtga ggagccggcc 20 <210> 173 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T78 gRNA spacer <400> 173 ttatgttcca tggggggcca 20 <210> 174 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T154 gRNA spacer <400> 174 ttttaatagt tacccatggc 20 <210> 175 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T140 gRNA spacer <400> 175 ccaggcttcc agcctgagcg 20 <210> 176 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T93 gRNA spacer <400> 176 caggctgcgc ggtggccgcc 20 <210> 177 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T95 gRNA spacer <400> 177 atgtgtgcaa catctgccac 20 <210> 178 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T37 gRNA spacer <400> 178 agtgcatgca ggctgcgcgg 20 <210> 179 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T91 gRNA spacer <400> 179 actccccgac ctcctgaggt 20 <210> 180 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T166 gRNA spacer <400> 180 gaaaggggaa tggtcagacc 20 <210> 181 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T105 gRNA spacer <400> 181 cgcgctcagg ctggaagcct 20 <210> 182 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T142 gRNA spacer <400> 182 gtgtctagaa gcccaagcaa 20 <210> 183 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T25 gRNA spacer <400> 183 cccgggttgc agggaacgcg 20 <210> 184 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T135 gRNA spacer <400> 184 tttcagaggc tgacgtcccc 20 <210> 185 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T69 gRNA spacer <400> 185 gagctgtaga tgtcctgcca 20 <210> 186 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T147 gRNA spacer <400> 186 gggtcatcac agcacttgcc 20 <210> 187 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T33 gRNA spacer <400> 187 ggataaaggc aagtaacgtg 20 <210> 188 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T75 gRNA spacer <400> 188 tctccctcag catagggagt 20 <210> 189 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> mTF-T1 gRNA spacer <400> 189 taacaagcaa gacccgtcgc 20 <210> 190 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> mTF-T2 gRNA spacer <400> 190 gagaacgcac cactttacga 20 <210> 191 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> n is a, t, c, or g <220> <221> misc_feature <223> r is g or a <220> <221> misc_feature <223> Example target seq. with S. pyogenes Cas9 PAM <220> <221> misc_feature <222> (1)..(21) <223> n is a, c, g, or t <400> 191 nnnnnnnnnn nnnnnnnnnn nrg 23 <210> 192 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T61 gRNA spacer <400> 192 gattaaggag agcagacaca 20 <210> 193 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T30 gRNA spacer <400> 193 gagagtgtac aaactcacaa 20 <210> 194 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T57 gRNA spacer <400> 194 tatcttcaaa tggaaatcct 20 <210> 195 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T11 gRNA spacer <400> 195 accaaggctt tataggtaca 20 <210> 196 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T26 gRNA spacer <400> 196 ggcctgggag gaaatttcct 20 <210> 197 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T33 gRNA spacer <400> 197 ttattccaca aagagcctgg 20 <210> 198 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T20 gRNA spacer <400> 198 cttgacacct caagaataca 20 <210> 199 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T24 gRNA spacer <400> 199 atctcttcct ggggacttgt 20 <210> 200 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T27 gRNA spacer <400> 200 cacccaggaa atttcctccc 20 <210> 201 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T48 gRNA spacer <400> 201 aggcctggga ggaaatttcc 20 <210> 202 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T8 gRNA spacer <400> 202 actagcatta taatgcacca 20 <210> 203 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T56 gRNA spacer <400> 203 tacaagtccc caggaagaga 20 <210> 204 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T19 gRNA spacer <400> 204 tggcactctc acagagatta 20 <210> 205 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T67 gRNA spacer <400> 205 ttagccagaa gaggagacag 20 <210> 206 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T41 gRNA spacer <400> 206 gagagtgcca tctcttcctg 20 <210> 207 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T18 gRNA spacer <400> 207 gtgagagtgc catctcttcc 20 <210> 208 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T45 gRNA spacer <400> 208 agattaagga gagcagacac 20 <210> 209 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T66 gRNA spacer <400> 209 ggagttgtta tgagaattaa 20 <210> 210 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T4 gRNA spacer <400> 210 tggcatgcct acaagtcccc 20 <210> 211 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T5 gRNA spacer <400> 211 ttgaggtgtc aagcccaccc 20 <210> 212 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T69 gRNA spacer <400> 212 tatgagaatt aaaggagaca 20 <210> 213 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T54 gRNA spacer <400> 213 ggagagcaga cacagggctt 20 <210> 214 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T42 gRNA spacer <400> 214 tctgacctcc aggctctttg 20 <210> 215 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T23 gRNA spacer <400> 215 gcaggtagac tctgacctcc 20 <210> 216 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T29 gRNA spacer <400> 216 accaagagga agatcttaga 20 <210> 217 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T13 gRNA spacer <400> 217 tctactgaag cagcaattac 20 <210> 218 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T25 gRNA spacer <400> 218 tgagagtgcc atctcttcct 20 <210> 219 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T16 gRNA spacer <400> 219 tcagaagaga ttagttagta 20 <210> 220 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T22 gRNA spacer <400> 220 agtgtgtcag gacatagagc 20 <210> 221 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T44 gRNA spacer <400> 221 acagcaatgt tagccagaag 20 <210> 222 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T14 gRNA spacer <400> 222 aggctttata ggtacaagga 20 <210> 223 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T28 gRNA spacer <400> 223 cagggtaata tgacaccaag 20 <210> 224 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T7 gRNA spacer <400> 224 ataatgcacc aaggctttat 20 <210> 225 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T40 gRNA spacer <400> 225 tccatctaag atcttcctct 20 <210> 226 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T36 gRNA spacer <400> 226 aaatcctagg acccatttta 20 <210> 227 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T15 gRNA spacer <400> 227 acattcagtt aagatagtct 20 <210> 228 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T58 gRNA spacer <400> 228 catgccactg tctcctcttc 20 <210> 229 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T63 gRNA spacer <400> 229 tcataacaac tccataaaat 20 <210> 230 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T55 gRNA spacer <400> 230 ttctatgtaa cctttagaga 20 <210> 231 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T50 gRNA spacer <400> 231 ttaaaagaat accattactg 20 <210> 232 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T21 gRNA spacer <400> 232 catattaccc tgtattcttg 20 <210> 233 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T2 gRNA spacer <400> 233 gcttgacacc tcaagaatac 20 <210> 234 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T60 gRNA spacer <400> 234 aaggttacat agaaacttga 20 <210> 235 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T77 gRNA spacer <400> 235 gcaagaagaa aaaatgaaaa 20 <210> 236 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T10 gRNA spacer <400> 236 actcttagct ttatgacccc 20 <210> 237 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T64 gRNA spacer <400> 237 ctcataacaa ctccataaaa 20 <210> 238 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T3 gRNA spacer <400> 238 aatacgcttt tccgcagtaa 20 <210> 239 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T49 gRNA spacer <400> 239 gaaatttcct cccaggcctg 20 <210> 240 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T46 gRNA spacer <400> 240 ctgggaggaa atttcctggg 20 <210> 241 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T1 gRNA spacer <400> 241 acagggcttc ggcaagcttc 20 <210> 242 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T6 gRNA spacer <400> 242 tccttgtacc tataaagcct 20 <210> 243 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T37 gRNA spacer <400> 243 tgggaggaaa tttcctgggt 20 <210> 244 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T52 gRNA spacer <400> 244 actaaaagtt ctgcttatta 20 <210> 245 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T71 gRNA spacer <400> 245 ataagcattt gataaatatt 20 <210> 246 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T12 gRNA spacer <400> 246 aactccataa aatgggtcct 20 <210> 247 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T47 gRNA spacer <400> 247 aattatgaat ccatctctaa 20 <210> 248 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T43 gRNA spacer <400> 248 gttagtacag ttttgctgaa 20 <210> 249 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T39 gRNA spacer <400> 249 tgagagtgta caaactcaca 20 <210> 250 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T76 gRNA spacer <400> 250 aaacaaaaca aaacaaaatg 20 <210> 251 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T17 gRNA spacer <400> 251 tagctttatg accccaggcc 20 <210> 252 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T38 gRNA spacer <400> 252 tttatgaccc caggcctggg 20 <210> 253 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T51 gRNA spacer <400> 253 aaaagcaaac gaattatctt 20 <210> 254 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T9 gRNA spacer <400> 254 cataaagcta agagtgtgtc 20 <210> 255 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T62 gRNA spacer <400> 255 catagaaact tgaaggagag 20 <210> 256 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T74 gRNA spacer <400> 256 attcaaataa ttttcctttt 20 <210> 257 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T34 gRNA spacer <400> 257 tgcattataa tgctagttaa 20 <210> 258 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T70 gRNA spacer <400> 258 agtcattagt aaaaatgaaa 20 <210> 259 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T31 gRNA spacer <400> 259 tgtttattcc acaaagagcc 20 <210> 260 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T59 gRNA spacer <400> 260 tttaaagaat ccatcctaaa 20 <210> 261 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T72 gRNA spacer <400> 261 taatggaata aaacatttta 20 <210> 262 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T65 gRNA spacer <400> 262 aaataatttt ccttttagga 20 <210> 263 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T79 gRNA spacer <400> 263 gttttgtttt gttttaaaaa 20 <210> 264 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T32 gRNA spacer <400> 264 agctttatga ccccaggcct 20 <210> 265 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T68 gRNA spacer <400> 265 tcaggtttct tatcttcaaa 20 <210> 266 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T75 gRNA spacer <400> 266 agcaagaaga aaaaatgaaa 20 <210> 267 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T78 gRNA spacer <400> 267 tgttttgttt tgttttaaaa 20 <210> 268 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T35 gRNA spacer <400> 268 ggaaatttcc tcccaggcct 20 <210> 269 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T53 gRNA spacer <400> 269 aggaaatttc ctcccaggcc 20 <210> 270 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T73 gRNA spacer <400> 270 ttttcttctt gctttctctc 20 <210> 271 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T1 <400> 271 taattttctt ttgcgcacta agg 23 <210> 272 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T2 <400> 272 tagtgcaatg gataggtctt tgg 23 <210> 273 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T3 <400> 273 agtgcaatgg ataggtcttt ggg 23 <210> 274 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T4 <400> 274 taaagcatag tgcaatggat agg 23 <210> 275 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T5 <400> 275 atttatgaga tcaacagcac agg 23 <210> 276 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T6 <400> 276 tgattcctac agaaaaactc agg 23 <210> 277 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T7 <400> 277 tgtatttgtg aagtcttaca agg 23 <210> 278 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T8 <400> 278 gactgaaact tcacagaata ggg 23 <210> 279 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T9 <400> 279 aatgcataat ctaagtcaaa tgg 23 <210> 280 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T10 <400> 280 tgactgaaac ttcacagaat agg 23 <210> 281 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T11 <400> 281 ttaaataaag catagtgcaa tgg 23 <210> 282 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T12 <400> 282 gatcaacagc acaggttttg tgg 23 <210> 283 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T13 <400> 283 taataaaatt caaacatcct agg 23 <210> 284 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T14 <400> 284 ttcattttag tctgtcttct tgg 23 <210> 285 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T15 <400> 285 attatctaag tttgaatata agg 23 <210> 286 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T16 <400> 286 atcatcctga gtttttctgt agg 23 <210> 287 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T17 <400> 287 gcatctttaa agaattattt tgg 23 <210> 288 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T18 <400> 288 tactaaaact ttattttact ggg 23 <210> 289 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T19 <400> 289 tgaattattc ttctgtttaa agg 23 <210> 290 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T20 <400> 290 aatttttaaa atagtattct tgg 23 <210> 291 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T21 <400> 291 atgcatttgt ttcaaaatat tgg 23 <210> 292 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T22 <400> 292 tttggcattt atttctaaaa tgg 23 <210> 293 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T23 <400> 293 aaagttgaac aatagaaaaa tgg 23 <210> 294 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T24 <400> 294 ttactaaaac tttattttac tgg 23 <210> 295 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T26 <400> 295 tgcatttgtt tcaaaatatt ggg 23 <210> 296 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T27 <400> 296 tgggcaaggg aagaaaaaaa agg 23 <210> 297 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T28 <400> 297 tcctaggtaa aaaaaaaaaa agg 23 <210> 298 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T25 <400> 298 accttttttt ttttttacct agg 23 <210> 299 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Exemplary gRNA spacer <400> 299 uaauuuucuu uugcgcacua 20 <210> 300 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> N-terminal sequence <400> 300 Asp Ala His Ala Thr Arg Arg Tyr Tyr 1 5 <210> 301 <211> 4402 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8A <400> 301 aattgctgac ctcttctctt cctcccacag tggccaccag aagatactac ctcggagccg 60 tcgaattgag ctgggattac atgcaatccg acctgggaga actgcccgtg gatgccaggt 120 ttcctcctcg ggtccccaag tccttcccgt tcaacacctc agtcgtctac aagaaaaccc 180 tcttcgtgga gttcaccgac catctgttca acatcgccaa gccaagaccc ccgtggatgg 240 gactcctcgg tccgaccatc caagccgaag tgtacgacac tgtggtcatt accctgaaga 300 acatggcctc ccatcctgtg tccctgcatg cagtgggcgt gtcctactgg aaggcttccg 360 aaggggccga gtacgacgat caaaccagcc agcgggaaaa ggaggatgac aaagtgttcc 420 cgggtggttc gcacacctac gtgtggcaag tgctcaagga gaacggtcct atggcctctg 480 atcccctgtg tctgacctac tcctacctgt cccatgtcga cctcgtgaag gatctgaaca 540 gcgggctgat tggcgccctg ctcgtgtgcc gggaaggctc cctggccaag gaaaagaccc 600 agacactgca caagttcatc ttgctgttcg ccgtgtttga tgagggaaag tcctggcata 660 gcgagactaa gaactccctt atgcaagacc gggatgctgc ctccgctagg gcttggccta 720 agatgcatac tgtgaacgga tacgtgaaca gatccctgcc tggccttatc ggttgccacc 780 ggaagtccgt gtattggcat gtgatcggca tgggaaccac tccagaggtg cactccattt 840 tcttggaggg gcataccttc ttggtgcgca accacagaca ggcctccctg gaaatttctc 900 cgatcacttt cctgactgcc cagaccctcc ttatggacct gggtcagttc ctgctgttct 960 gccacatttc gtcccaccaa cacgatggca tggaagccta cgtgaaagtg gactcgtgcc 1020 cggaagaacc acagctgcgg atgaagaaca acgaagaggc agaggactac gatgatgatc 1080 ttaccgattc ggaaatggat gtggtccgat tcgacgacga taatagccca tccttcatcc 1140 aaattaggag cgtggccaag aagcacccca aaacttgggt gcattacatt gcggccgagg 1200 aagaggattg ggactacgca cccctcgtgc ttgcacccga tgatcggtcc tacaagtccc 1260 aatacctgaa caacggcccg cagaggatcg gtcggaagta taagaaagtg cgcttcatgg 1320 cctacaccga cgagactttc aagaccagag aggccattca gcacgaaagc ggcattctgg 1380 ggccgctgtt gtacggggag gtcggagata cactgctcat cattttcaag aaccaggcgt 1440 ccagacccta caacatctac ccgcacggaa tcactgacgt ccgccccctg tactcccgga 1500 gactcccgaa gggagtcaag cacttgaaag acttccccat cctgcctggg gaaatcttca 1560 agtacaagtg gaccgtgacc gtcgaggatg ggccgaccaa gtccgatcca agatgcctca 1620 ctagatacta ctcatccttc gtcaacatgg aacgggacct ggcctcagga ctgattggcc 1680 ccctgctcat ctgctacaag gagtccgtgg atcagcgcgg aaaccagatc atgtcggaca 1740 aacgcaacgt catcctcttc tccgtctttg acgagaaccg ctcatggtac cttacggaga 1800 acatccagcg gttcctcccc aaccctgccg gagtgcagct cgaggacccg gaattccagg 1860 catcaaacat tatgcactcc atcaacggtt acgtgttcga cagcctccag cttagcgtgt 1920 gcctccatga agtcgcatat tggtacatcc tgtccattgg agcacaaacc gactttctct 1980 ccgtgttctt ctccggatat accttcaagc acaagatggt gtacgaggat accctgaccc 2040 tcttcccctt ctccggagag actgtgttta tgtcgatgga aaacccaggc ctgtggattt 2100 tggggtgcca caactcggat ttccgaaacc ggggcatgac tgccttgctc aaggtgtcct 2160 cctgtgacaa gaacacggga gactactacg aggactccta cgaggatatt tccgcctacc 2220 tcctgtccaa gaacaacgcc atcgaaccca ggtccttcag ccagaaccct cctgtcctca 2280 agcgccatca gagagaaatc acccgcacga ccctgcagtc cgaccaggaa gagatcgatt 2340 acgacgacac tatctccgtc gaaatgaaga aggaggactt tgacatctac gacgaagatg 2400 aaaatcagtc ccctcgctcg ttccaaaaga aaacgagaca ctacttcatc gctgctgtgg 2460 agcggctctg ggactacggc atgtcctcat cgccccacgt gcttaggaac cgggctcaat 2520 ccgggagcgt ccctcagttc aagaaagtgg tgtttcaaga attcaccgat ggaagcttca 2580 cgcagccgtt gtacaggggc gaactgaacg agcaccttgg cctgctggga ccttacatca 2640 gagcagaggt cgaggacaac atcatggtga ccttccggaa ccaagcctcc cggccatatt 2700 cattctactc gagccttatc tcatacgagg aggatcagag acagggggct gaacctcgga 2760 agaacttcgt caagccgaac gagacaaaga cctacttttg gaaggtgcag caccacatgg 2820 ccccgaccaa ggatgagttc gactgcaagg cctgggcgta cttctccgac gtggatctcg 2880 aaaaggacgt gcattccggg ctgatcggac cgctgctcgt ctgccacact aacaccctca 2940 atcctgctca cggcagacaa gtgaccgtgc aggagttcgc cctgttcttc accatcttcg 3000 acgaaactaa gtcatggtac tttaccgaga acatggagcg gaattgtcgg gccccatgta 3060 acatccagat ggaggacccg acattcaagg agaactaccg gttccacgcc attaacggat 3120 acattatgga cactcttccg ggactcgtga tggcacagga ccaacgcatc agatggtatc 3180 ttctgtcgat ggggagcaac gaaaacatcc attcgatcca ctttagcggt cacgtgttca 3240 cagtgcgcaa gaaggaagag tacaagatgg cgctgtacaa cctgtaccct ggggtgttcg 3300 agactgtgga aatgctgccg tccaaggccg gaatttggcg cgtggaatgt ctgatcggtg 3360 aacatctgca tgccggaatg tccaccctgt tcctggtgta ctccaacaag tgccaaaccc 3420 cactgggaat ggcatcagga cacattagag acttccagat taccgcgagc ggacagtacg 3480 gacaatgggc ccccaagttg gccaggctgc actactctgg aagcattaac gcctggagca 3540 ccaaggagcc gttcagctgg atcaaggtgg accttctggc gccaatgatc atccacggaa 3600 ttaagactca gggagcccgc cagaagttct catcgctcta catctcccag tttatcatca 3660 tgtactcact ggatgggaag aagtggcaga cttaccgggg aaattccacc ggtactctga 3720 tggtgttctt cggaaacgtg gacagctccg gcatcaagca caatatcttt aacccgccta 3780 tcatcgcccg atacatccgg ctccacccga ctcactactc catccggtcg actctgcgga 3840 tggaactcat gggttgcgac ctcaactcct gctcaatgcc actgggcatg gagtccaagg 3900 ctatctcgga cgctcagatt actgcatcgt cgtactttac caacatgttc gctacctggt 3960 ccccgtccaa agcccggctg catctccaag gcagatcaaa cgcgtggagg cctcaggtca 4020 acaacccgaa ggaatggctt caggtcgact tccaaaagac catgaaagtc accggagtga 4080 ccacccaggg cgtgaaatcg ctgctgacct ctatgtacgt gaaggaattc ctgatctcat 4140 caagccagga cggccaccag tggacactgt tcttccaaaa tggaaaggtc aaggtctttc 4200 agggaaatca agactccttc acccccgtgg tgaactccct ggacccccct ctgcttaccc 4260 gctacttgcg cattcatccg caatcctggg tgcaccagat cgccctgcga atggaagtgc 4320 tgggctgtga agcgcaggac ctgtactaaa ataaaagatc tttattttca ttagatctgt 4380 gtgttggttt tttgtgtgcc gc 4402 <210> 302 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> n = a, t, c, or g <220> <221> misc_feature <223> y = t or c <220> <221> misc_feature <223> r = a or g <220> <221> misc_feature <223> Branch site consensus sequence <220> <221> misc_feature <222> (2)..(2) <223> n is a, c, g, or t <400> 302 ynyyray 7 <210> 303 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> synthetic splice acceptor <400> 303 ctgacctctt ctcttcctcc cacag 25 <210> 304 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> native albumin intron 1/exon 2 splice acceptor, human <400> 304 ttaacaatcc ttttttttct tcccttgccc ag 32 <210> 305 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> native albumin intron 1/exon 2 splice acceptor, mouse <400> 305 ttaaatatgt tgtgtggttt ttctctccct gtttccacag 40 <210> 306 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> consensus synthetic poly A signal <400> 306 aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtg 49 <210> 307 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Native splice acceptor sequence from human Factor IX gene intron 1/exon 2 boundary <400> 307 actaaagaat tattctttta catttcag 28 <210> 308 <211> 4502 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8B <400> 308 aattgaactt tgagtgtagc agagaggaac cattgccacc ttcagatttt aatgtctgac 60 ctcttctctt cctcccacag tggccaccag aagatactac ctcggagccg tcgaattgag 120 ctgggattac atgcaatccg acctgggaga actgcccgtg gatgccaggt ttcctcctcg 180 ggtccccaag tccttcccgt tcaacacctc agtcgtctac aagaaaaccc tcttcgtgga 240 gttcaccgac catctgttca acatcgccaa gccaagaccc ccgtggatgg gactcctcgg 300 tccgaccatc caagccgaag tgtacgacac tgtggtcatt accctgaaga acatggcctc 360 ccatcctgtg tccctgcatg cagtgggcgt gtcctactgg aaggcttccg aaggggccga 420 gtacgacgat caaaccagcc agcgggaaaa ggaggatgac aaagtgttcc cgggtggttc 480 gcacacctac gtgtggcaag tgctcaagga gaacggtcct atggcctctg atcccctgtg 540 tctgacctac tcctacctgt cccatgtcga cctcgtgaag gatctgaaca gcgggctgat 600 tggcgccctg ctcgtgtgcc gggaaggctc cctggccaag gaaaagaccc agacactgca 660 caagttcatc ttgctgttcg ccgtgtttga tgagggaaag tcctggcata gcgagactaa 720 gaactccctt atgcaagacc gggatgctgc ctccgctagg gcttggccta agatgcatac 780 tgtgaacgga tacgtgaaca gatccctgcc tggccttatc ggttgccacc ggaagtccgt 840 gtattggcat gtgatcggca tgggaaccac tccagaggtg cactccattt tcttggaggg 900 gcataccttc ttggtgcgca accacagaca ggcctccctg gaaatttctc cgatcacttt 960 cctgactgcc cagaccctcc ttatggacct gggtcagttc ctgctgttct gccacatttc 1020 gtcccaccaa cacgatggca tggaagccta cgtgaaagtg gactcgtgcc cggaagaacc 1080 acagctgcgg atgaagaaca acgaagaggc agaggactac gatgatgatc ttaccgattc 1140 ggaaatggat gtggtccgat tcgacgacga taatagccca tccttcatcc aaattaggag 1200 cgtggccaag aagcacccca aaacttgggt gcattacatt gcggccgagg aagaggattg 1260 ggactacgca cccctcgtgc ttgcacccga tgatcggtcc tacaagtccc aatacctgaa 1320 caacggcccg cagaggatcg gtcggaagta taagaaagtg cgcttcatgg cctacaccga 1380 cgagactttc aagaccagag aggccattca gcacgaaagc ggcattctgg ggccgctgtt 1440 gtacggggag gtcggagata cactgctcat cattttcaag aaccaggcgt ccagacccta 1500 caacatctac ccgcacggaa tcactgacgt ccgccccctg tactcccgga gactcccgaa 1560 gggagtcaag cacttgaaag acttccccat cctgcctggg gaaatcttca agtacaagtg 1620 gaccgtgacc gtcgaggatg ggccgaccaa gtccgatcca agatgcctca ctagatacta 1680 ctcatccttc gtcaacatgg aacgggacct ggcctcagga ctgattggcc ccctgctcat 1740 ctgctacaag gagtccgtgg atcagcgcgg aaaccagatc atgtcggaca aacgcaacgt 1800 catcctcttc tccgtctttg acgagaaccg ctcatggtac cttacggaga acatccagcg 1860 gttcctcccc aaccctgccg gagtgcagct cgaggacccg gaattccagg catcaaacat 1920 tatgcactcc atcaacggtt acgtgttcga cagcctccag cttagcgtgt gcctccatga 1980 agtcgcatat tggtacatcc tgtccattgg agcacaaacc gactttctct ccgtgttctt 2040 ctccggatat accttcaagc acaagatggt gtacgaggat accctgaccc tcttcccctt 2100 ctccggagag actgtgttta tgtcgatgga aaacccaggc ctgtggattt tggggtgcca 2160 caactcggat ttccgaaacc ggggcatgac tgccttgctc aaggtgtcct cctgtgacaa 2220 gaacacggga gactactacg aggactccta cgaggatatt tccgcctacc tcctgtccaa 2280 gaacaacgcc atcgaaccca ggtccttcag ccagaaccct cctgtcctca agcgccatca 2340 gagagaaatc acccgcacga ccctgcagtc cgaccaggaa gagatcgatt acgacgacac 2400 tatctccgtc gaaatgaaga aggaggactt tgacatctac gacgaagatg aaaatcagtc 2460 ccctcgctcg ttccaaaaga aaacgagaca ctacttcatc gctgctgtgg agcggctctg 2520 ggactacggc atgtcctcat cgccccacgt gcttaggaac cgggctcaat ccgggagcgt 2580 ccctcagttc aagaaagtgg tgtttcaaga attcaccgat ggaagcttca cgcagccgtt 2640 gtacaggggc gaactgaacg agcaccttgg cctgctggga ccttacatca gagcagaggt 2700 cgaggacaac atcatggtga ccttccggaa ccaagcctcc cggccatatt cattctactc 2760 gagccttatc tcatacgagg aggatcagag acagggggct gaacctcgga agaacttcgt 2820 caagccgaac gagacaaaga cctacttttg gaaggtgcag caccacatgg ccccgaccaa 2880 ggatgagttc gactgcaagg cctgggcgta cttctccgac gtggatctcg aaaaggacgt 2940 gcattccggg ctgatcggac cgctgctcgt ctgccacact aacaccctca atcctgctca 3000 cggcagacaa gtgaccgtgc aggagttcgc cctgttcttc accatcttcg acgaaactaa 3060 gtcatggtac tttaccgaga acatggagcg gaattgtcgg gccccatgta acatccagat 3120 ggaggacccg acattcaagg agaactaccg gttccacgcc attaacggat acattatgga 3180 cactcttccg ggactcgtga tggcacagga ccaacgcatc agatggtatc ttctgtcgat 3240 ggggagcaac gaaaacatcc attcgatcca ctttagcggt cacgtgttca cagtgcgcaa 3300 gaaggaagag tacaagatgg cgctgtacaa cctgtaccct ggggtgttcg agactgtgga 3360 aatgctgccg tccaaggccg gaatttggcg cgtggaatgt ctgatcggtg aacatctgca 3420 tgccggaatg tccaccctgt tcctggtgta ctccaacaag tgccaaaccc cactgggaat 3480 ggcatcagga cacattagag acttccagat taccgcgagc ggacagtacg gacaatgggc 3540 ccccaagttg gccaggctgc actactctgg aagcattaac gcctggagca ccaaggagcc 3600 gttcagctgg atcaaggtgg accttctggc gccaatgatc atccacggaa ttaagactca 3660 gggagcccgc cagaagttct catcgctcta catctcccag tttatcatca tgtactcact 3720 ggatgggaag aagtggcaga cttaccgggg aaattccacc ggtactctga tggtgttctt 3780 cggaaacgtg gacagctccg gcatcaagca caatatcttt aacccgccta tcatcgcccg 3840 atacatccgg ctccacccga ctcactactc catccggtcg actctgcgga tggaactcat 3900 gggttgcgac ctcaactcct gctcaatgcc actgggcatg gagtccaagg ctatctcgga 3960 cgctcagatt actgcatcgt cgtactttac caacatgttc gctacctggt ccccgtccaa 4020 agcccggctg catctccaag gcagatcaaa cgcgtggagg cctcaggtca acaacccgaa 4080 ggaatggctt caggtcgact tccaaaagac catgaaagtc accggagtga ccacccaggg 4140 cgtgaaatcg ctgctgacct ctatgtacgt gaaggaattc ctgatctcat caagccagga 4200 cggccaccag tggacactgt tcttccaaaa tggaaaggtc aaggtctttc agggaaatca 4260 agactccttc acccccgtgg tgaactccct ggacccccct ctgcttaccc gctacttgcg 4320 cattcatccg caatcctggg tgcaccagat cgccctgcga atggaagtgc tgggctgtga 4380 agcgcaggac ctgtactaaa ataaaagatc tttattttca ttagatctgt gtgttggttt 4440 tttgtgtgcg atcgggaact ggcatcttca gggagtagct taggtcagtg aagagaagcc 4500 gc 4502 <210> 309 <211> 4567 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8C <400> 309 gcggcctaag gcaattgtgc cagttcccga tcgttacagg aactttgagt gtagcagaga 60 ggaaccattg ccaccttcag attttaatgt ctgacctctt ctcttcctcc cacagtggcc 120 accagaagat actacctcgg agccgtcgaa ttgagctggg attacatgca atccgacctg 180 ggagaactgc ccgtggatgc caggtttcct cctcgggtcc ccaagtcctt cccgttcaac 240 acctcagtcg tctacaagaa aaccctcttc gtggagttca ccgaccatct gttcaacatc 300 gccaagccaa gacccccgtg gatgggactc ctcggtccga ccatccaagc cgaagtgtac 360 gacactgtgg tcattaccct gaagaacatg gcctcccatc ctgtgtccct gcatgcagtg 420 ggcgtgtcct actggaaggc ttccgaaggg gccgagtacg acgatcaaac cagccagcgg 480 gaaaaggagg atgacaaagt gttcccgggt ggttcgcaca cctacgtgtg gcaagtgctc 540 aaggagaacg gtcctatggc ctctgatccc ctgtgtctga cctactccta cctgtcccat 600 gtcgacctcg tgaaggatct gaacagcggg ctgattggcg ccctgctcgt gtgccgggaa 660 ggctccctgg ccaaggaaaa gacccagaca ctgcacaagt tcatcttgct gttcgccgtg 720 tttgatgagg gaaagtcctg gcatagcgag actaagaact cccttatgca agaccgggat 780 gctgcctccg ctagggcttg gcctaagatg catactgtga acggatacgt gaacagatcc 840 ctgcctggcc ttatcggttg ccaccggaag tccgtgtatt ggcatgtgat cggcatggga 900 accactccag aggtgcactc cattttcttg gaggggcata ccttcttggt gcgcaaccac 960 agacaggcct ccctggaaat ttctccgatc actttcctga ctgcccagac cctccttatg 1020 gacctgggtc agttcctgct gttctgccac atttcgtccc accaacacga tggcatggaa 1080 gcctacgtga aagtggactc gtgcccggaa gaaccacagc tgcggatgaa gaacaacgaa 1140 gaggcagagg actacgatga tgatcttacc gattcggaaa tggatgtggt ccgattcgac 1200 gacgataata gcccatcctt catccaaatt aggagcgtgg ccaagaagca ccccaaaact 1260 tgggtgcatt acattgcggc cgaggaagag gattgggact acgcacccct cgtgcttgca 1320 cccgatgatc ggtcctacaa gtcccaatac ctgaacaacg gcccgcagag gatcggtcgg 1380 aagtataaga aagtgcgctt catggcctac accgacgaga ctttcaagac cagagaggcc 1440 attcagcacg aaagcggcat tctggggccg ctgttgtacg gggaggtcgg agatacactg 1500 ctcatcattt tcaagaacca ggcgtccaga ccctacaaca tctacccgca cggaatcact 1560 gacgtccgcc ccctgtactc ccggagactc ccgaagggag tcaagcactt gaaagacttc 1620 cccatcctgc ctggggaaat cttcaagtac aagtggaccg tgaccgtcga ggatgggccg 1680 accaagtccg atccaagatg cctcactaga tactactcat ccttcgtcaa catggaacgg 1740 gacctggcct caggactgat tggccccctg ctcatctgct acaaggagtc cgtggatcag 1800 cgcggaaacc agatcatgtc ggacaaacgc aacgtcatcc tcttctccgt ctttgacgag 1860 aaccgctcat ggtaccttac ggagaacatc cagcggttcc tccccaaccc tgccggagtg 1920 cagctcgagg acccggaatt ccaggcatca aacattatgc actccatcaa cggttacgtg 1980 ttcgacagcc tccagcttag cgtgtgcctc catgaagtcg catattggta catcctgtcc 2040 attggagcac aaaccgactt tctctccgtg ttcttctccg gatatacctt caagcacaag 2100 atggtgtacg aggataccct gaccctcttc cccttctccg gagagactgt gtttatgtcg 2160 atggaaaacc caggcctgtg gattttgggg tgccacaact cggatttccg aaaccggggc 2220 atgactgcct tgctcaaggt gtcctcctgt gacaagaaca cgggagacta ctacgaggac 2280 tcctacgagg atatttccgc ctacctcctg tccaagaaca acgccatcga acccaggtcc 2340 ttcagccaga accctcctgt cctcaagcgc catcagagag aaatcacccg cacgaccctg 2400 cagtccgacc aggaagagat cgattacgac gacactatct ccgtcgaaat gaagaaggag 2460 gactttgaca tctacgacga agatgaaaat cagtcccctc gctcgttcca aaagaaaacg 2520 agacactact tcatcgctgc tgtggagcgg ctctgggact acggcatgtc ctcatcgccc 2580 cacgtgctta ggaaccgggc tcaatccggg agcgtccctc agttcaagaa agtggtgttt 2640 caagaattca ccgatggaag cttcacgcag ccgttgtaca ggggcgaact gaacgagcac 2700 cttggcctgc tgggacctta catcagagca gaggtcgagg acaacatcat ggtgaccttc 2760 cggaaccaag cctcccggcc atattcattc tactcgagcc ttatctcata cgaggaggat 2820 cagagacagg gggctgaacc tcggaagaac ttcgtcaagc cgaacgagac aaagacctac 2880 ttttggaagg tgcagcacca catggccccg accaaggatg agttcgactg caaggcctgg 2940 gcgtacttct ccgacgtgga tctcgaaaag gacgtgcatt ccgggctgat cggaccgctg 3000 ctcgtctgcc acactaacac cctcaatcct gctcacggca gacaagtgac cgtgcaggag 3060 ttcgccctgt tcttcaccat cttcgacgaa actaagtcat ggtactttac cgagaacatg 3120 gagcggaatt gtcgggcccc atgtaacatc cagatggagg acccgacatt caaggagaac 3180 taccggttcc acgccattaa cggatacatt atggacactc ttccgggact cgtgatggca 3240 caggaccaac gcatcagatg gtatcttctg tcgatgggga gcaacgaaaa catccattcg 3300 atccacttta gcggtcacgt gttcacagtg cgcaagaagg aagagtacaa gatggcgctg 3360 tacaacctgt accctggggt gttcgagact gtggaaatgc tgccgtccaa ggccggaatt 3420 tggcgcgtgg aatgtctgat cggtgaacat ctgcatgccg gaatgtccac cctgttcctg 3480 gtgtactcca acaagtgcca aaccccactg ggaatggcat caggacacat tagagacttc 3540 cagattaccg cgagcggaca gtacggacaa tgggccccca agttggccag gctgcactac 3600 tctggaagca ttaacgcctg gagcaccaag gagccgttca gctggatcaa ggtggacctt 3660 ctggcgccaa tgatcatcca cggaattaag actcagggag cccgccagaa gttctcatcg 3720 ctctacatct cccagtttat catcatgtac tcactggatg ggaagaagtg gcagacttac 3780 cggggaaatt ccaccggtac tctgatggtg ttcttcggaa acgtggacag ctccggcatc 3840 aagcacaata tctttaaccc gcctatcatc gcccgataca tccggctcca cccgactcac 3900 tactccatcc ggtcgactct gcggatggaa ctcatgggtt gcgacctcaa ctcctgctca 3960 atgccactgg gcatggagtc caaggctatc tcggacgctc agattactgc atcgtcgtac 4020 tttaccaaca tgttcgctac ctggtccccg tccaaagccc ggctgcatct ccaaggcaga 4080 tcaaacgcgt ggaggcctca ggtcaacaac ccgaaggaat ggcttcaggt cgacttccaa 4140 aagaccatga aagtcaccgg agtgaccacc cagggcgtga aatcgctgct gacctctatg 4200 tacgtgaagg aattcctgat ctcatcaagc caggacggcc accagtggac actgttcttc 4260 caaaatggaa aggtcaaggt ctttcaggga aatcaagact ccttcacccc cgtggtgaac 4320 tccctggacc cccctctgct tacccgctac ttgcgcattc atccgcaatc ctgggtgcac 4380 cagatcgccc tgcgaatgga agtgctgggc tgtgaagcgc aggacctgta ctaaaataaa 4440 agatctttat tttcattaga tctgtgtgtt ggttttttgt gtgcgatcgg gaactggcat 4500 cttcagggag tagcttaggt cagtgaagag aagtgccagt tcccgatcgt tacaggccgc 4560 gggccgc 4567 <210> 310 <211> 4838 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1009 (FVIII donor for integration intro Transferrin intron 1) <400> 310 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggcccgc gggagaacgc accactttac gaaggcggta 180 ctcctcaaag cgtactaaag aattattctt ttacatttca gggctgtgtc tggctgccac 240 caggagatac tacctggggg ctgtggagct gagctgggac tacatgcagt ctgacctggg 300 ggagctgcct gtggatgcca ggttcccccc cagagtgccc aagagcttcc ccttcaacac 360 ctctgtggtg tacaagaaga ccctgtttgt ggagttcact gaccacctgt tcaacattgc 420 caagcccagg cccccctgga tgggcctgct gggccccacc atccaggctg aggtgtatga 480 cactgtggtg atcaccctga agaacatggc cagccaccct gtgagcctgc atgctgtggg 540 ggtgagctac tggaaggcct ctgagggggc tgagtatgat gaccagacca gccagaggga 600 gaaggaggat gacaaggtgt tccctggggg cagccacacc tatgtgtggc aggtgctgaa 660 ggagaatggc cccatggcct ctgaccccct gtgcctgacc tacagctacc tgagccatgt 720 ggacctggtg aaggacctga actctggcct gattggggcc ctgctggtgt gcagggaggg 780 cagcctggcc aaggagaaga cccagaccct gcacaagttc atcctgctgt ttgctgtgtt 840 tgatgagggc aagagctggc actctgaaac caagaacagc ctgatgcagg acagggatgc 900 tgcctctgcc agggcctggc ccaagatgca cactgtgaat ggctatgtga acaggagcct 960 gcctggcctg attggctgcc acaggaagtc tgtgtactgg catgtgattg gcatgggcac 1020 cacccctgag gtgcacagca tcttcctgga gggccacacc ttcctggtca ggaaccacag 1080 gcaggccagc ctggagatca gccccatcac cttcctgact gcccagaccc tgctgatgga 1140 cctgggccag ttcctgctgt tctgccacat cagcagccac cagcatgatg gcatggaggc 1200 ctatgtgaag gtggacagct gccctgagga gccccagctg aggatgaaga acaatgagga 1260 ggctgaggac tatgatgatg acctgactga ctctgagatg gatgtggtga ggtttgatga 1320 tgacaacagc cccagcttca tccagatcag gtctgtggcc aagaagcacc ccaagacctg 1380 ggtgcactac attgctgctg aggaggagga ctgggactat gcccccctgg tgctggcccc 1440 tgatgacagg agctacaaga gccagtacct gaacaatggc ccccagagga ttggcaggaa 1500 gtacaagaag gtcaggttca tggcctacac tgatgaaacc ttcaagacca gggaggccat 1560 ccagcatgag tctggcatcc tgggccccct gctgtatggg gaggtggggg acaccctgct 1620 gatcatcttc aagaaccagg ccagcaggcc ctacaacatc tacccccatg gcatcactga 1680 tgtgaggccc ctgtacagca ggaggctgcc caagggggtg aagcacctga aggacttccc 1740 catcctgcct ggggagatct tcaagtacaa gtggactgtg actgtggagg atggccccac 1800 caagtctgac cccaggtgcc tgaccagata ctacagcagc tttgtgaaca tggagaggga 1860 cctggcctct ggcctgattg gccccctgct gatctgctac aaggagtctg tggaccagag 1920 gggcaaccag atcatgtctg acaagaggaa tgtgatcctg ttctctgtgt ttgatgagaa 1980 caggagctgg tacctgactg agaacatcca gaggttcctg cccaaccctg ctggggtgca 2040 gctggaggac cctgagttcc aggccagcaa catcatgcac agcatcaatg gctatgtgtt 2100 tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc tactggtaca tcctgagcat 2160 tggggcccag actgacttcc tgtctgtgtt cttctctggc tacaccttca agcacaagat 2220 ggtgtatgag gacaccctga ccctgttccc cttctctggg gagactgtgt tcatgagcat 2280 ggagaaccct ggcctgtgga ttctgggctg ccacaactct gacttcagga acaggggcat 2340 gactgccctg ctgaaagtct ccagctgtga caagaacact ggggactact atgaggacag 2400 ctatgaggac atctctgcct acctgctgag caagaacaat gccattgagc ccaggagctt 2460 cagccagaat gccactaatg tgtctaacaa cagcaacacc agcaatgaca gcaatgtgtc 2520 tcccccagtg ctgaagaggc accagaggga gatcaccagg accaccctgc agtctgacca 2580 ggaggagatt gactatgatg acaccatctc tgtggagatg aagaaggagg actttgacat 2640 ctacgacgag gacgagaacc agagccccag gagcttccag aagaagacca ggcactactt 2700 cattgctgct gtggagaggc tgtgggacta tggcatgagc agcagccccc atgtgctgag 2760 gaacagggcc cagtctggct ctgtgcccca gttcaagaag gtggtgttcc aggagttcac 2820 tgatggcagc ttcacccagc ccctgtacag aggggagctg aatgagcacc tgggcctgct 2880 gggcccctac atcagggctg aggtggagga caacatcatg gtgaccttca ggaaccaggc 2940 cagcaggccc tacagcttct acagcagcct gatcagctat gaggaggacc agaggcaggg 3000 ggctgagccc aggaagaact ttgtgaagcc caatgaaacc aagacctact tctggaaggt 3060 gcagcaccac atggccccca ccaaggatga gtttgactgc aaggcctggg cctacttctc 3120 tgatgtggac ctggagaagg atgtgcactc tggcctgatt ggccccctgc tggtgtgcca 3180 caccaacacc ctgaaccctg cccatggcag gcaggtgact gtgcaggagt ttgccctgtt 3240 cttcaccatc tttgatgaaa ccaagagctg gtacttcact gagaacatgg agaggaactg 3300 cagggccccc tgcaacatcc agatggagga ccccaccttc aaggagaact acaggttcca 3360 tgccatcaat ggctacatca tggacaccct gcctggcctg gtgatggccc aggaccagag 3420 gatcaggtgg tacctgctga gcatgggcag caatgagaac atccacagca tccacttctc 3480 tggccatgtg ttcactgtga ggaagaagga ggagtacaag atggccctgt acaacctgta 3540 ccctggggtg tttgagactg tggagatgct gcccagcaag gctggcatct ggagggtgga 3600 gtgcctgatt ggggagcacc tgcatgctgg catgagcacc ctgttcctgg tgtacagcaa 3660 caagtgccag acccccctgg gcatggcctc tggccacatc agggacttcc agatcactgc 3720 ctctggccag tatggccagt gggcccccaa gctggccagg ctgcactact ctggcagcat 3780 caatgcctgg agcaccaagg agcccttcag ctggatcaag gtggacctgc tggcccccat 3840 gatcatccat ggcatcaaga cccagggggc caggcagaag ttcagcagcc tgtacatcag 3900 ccagttcatc atcatgtaca gcctggatgg caagaagtgg cagacctaca ggggcaacag 3960 cactggcacc ctgatggtgt tctttggcaa tgtggacagc tctggcatca agcacaacat 4020 cttcaacccc cccatcattg ccagatacat caggctgcac cccacccact acagcatcag 4080 gagcaccctg aggatggagc tgatgggctg tgacctgaac agctgcagca tgcccctggg 4140 catggagagc aaggccatct ctgatgccca gatcactgcc agcagctact tcaccaacat 4200 gtttgccacc tggagcccca gcaaggccag gctgcacctg cagggcagga gcaatgcctg 4260 gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg gacttccaga agaccatgaa 4320 ggtgactggg gtgaccaccc agggggtgaa gagcctgctg accagcatgt atgtgaagga 4380 gttcctgatc agcagcagcc aggatggcca ccagtggacc ctgttcttcc agaatggcaa 4440 ggtgaaggtg ttccagggca accaggacag cttcacccct gtggtgaaca gcctggaccc 4500 ccccctgctg accagatacc tgaggattca cccccagagc tgggtgcacc agattgccct 4560 gaggatggag gtgctgggct gtgaggccca ggacctgtac tgatcgcgaa taaaagatct 4620 ttattttcat tagatctgtg tgttggtttt ttgtgtggag aacgcaccac tttacgaagg 4680 caattgcctt aggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc 4740 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 4800 ggcctcagtg agcgagcgag cgcgcagctg cctgcagg 4838 <210> 311 <211> 4830 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB099 (FVIII donor for integration into albumin intron 1) <400> 311 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggcctaa ggcaattgcc tgtaacgatc gggaactggc 180 agatccacac aaaaaaccaa cacacagatc taatgaaaat aaagatcttt tattcgcgat 240 cagtacaggt cctgggcctc acagcccagc acctccatcc tcagggcaat ctggtgcacc 300 cagctctggg ggtgaatcct caggtatctg gtcagcaggg gggggtccag gctgttcacc 360 acaggggtga agctgtcctg gttgccctgg aacaccttca ccttgccatt ctggaagaac 420 agggtccact ggtggccatc ctggctgctg ctgatcagga actccttcac atacatgctg 480 gtcagcaggc tcttcacccc ctgggtggtc accccagtca ccttcatggt cttctggaag 540 tccacctgca gccactcctt ggggttgttg acctggggcc tccaggcatt gctcctgccc 600 tgcaggtgca gcctggcctt gctggggctc caggtggcaa acatgttggt gaagtagctg 660 ctggcagtga tctgggcatc agagatggcc ttgctctcca tgcccagggg catgctgcag 720 ctgttcaggt cacagcccat cagctccatc ctcagggtgc tcctgatgct gtagtgggtg 780 gggtgcagcc tgatgtatct ggcaatgatg ggggggttga agatgttgtg cttgatgcca 840 gagctgtcca cattgccaaa gaacaccatc agggtgccag tgctgttgcc cctgtaggtc 900 tgccacttct tgccatccag gctgtacatg atgatgaact ggctgatgta caggctgctg 960 aacttctgcc tggccccctg ggtcttgatg ccatggatga tcatgggggc cagcaggtcc 1020 accttgatcc agctgaaggg ctccttggtg ctccaggcat tgatgctgcc agagtagtgc 1080 agcctggcca gcttgggggc ccactggcca tactggccag aggcagtgat ctggaagtcc 1140 ctgatgtggc cagaggccat gcccaggggg gtctggcact tgttgctgta caccaggaac 1200 agggtgctca tgccagcatg caggtgctcc ccaatcaggc actccaccct ccagatgcca 1260 gccttgctgg gcagcatctc cacagtctca aacaccccag ggtacaggtt gtacagggcc 1320 atcttgtact cctccttctt cctcacagtg aacacatggc cagagaagtg gatgctgtgg 1380 atgttctcat tgctgcccat gctcagcagg taccacctga tcctctggtc ctgggccatc 1440 accaggccag gcagggtgtc catgatgtag ccattgatgg catggaacct gtagttctcc 1500 ttgaaggtgg ggtcctccat ctggatgttg cagggggccc tgcagttcct ctccatgttc 1560 tcagtgaagt accagctctt ggtttcatca aagatggtga agaacagggc aaactcctgc 1620 acagtcacct gcctgccatg ggcagggttc agggtgttgg tgtggcacac cagcaggggg 1680 ccaatcaggc cagagtgcac atccttctcc aggtccacat cagagaagta ggcccaggcc 1740 ttgcagtcaa actcatcctt ggtgggggcc atgtggtgct gcaccttcca gaagtaggtc 1800 ttggtttcat tgggcttcac aaagttcttc ctgggctcag ccccctgcct ctggtcctcc 1860 tcatagctga tcaggctgct gtagaagctg tagggcctgc tggcctggtt cctgaaggtc 1920 accatgatgt tgtcctccac ctcagccctg atgtaggggc ccagcaggcc caggtgctca 1980 ttcagctccc ctctgtacag gggctgggtg aagctgccat cagtgaactc ctggaacacc 2040 accttcttga actggggcac agagccagac tgggccctgt tcctcagcac atgggggctg 2100 ctgctcatgc catagtccca cagcctctcc acagcagcaa tgaagtagtg cctggtcttc 2160 ttctggaagc tcctggggct ctggttctcg tcctcgtcgt agatgtcaaa gtcctccttc 2220 ttcatctcca cagagatggt gtcatcatag tcaatctcct cctggtcaga ctgcagggtg 2280 gtcctggtga tctccctctg gtgcctcttc agcactgggg gagacacatt gctgtcattg 2340 ctggtgttgc tgttgttaga cacattagtg gcattctggc tgaagctcct gggctcaatg 2400 gcattgttct tgctcagcag gtaggcagag atgtcctcat agctgtcctc atagtagtcc 2460 ccagtgttct tgtcacagct ggagactttc agcagggcag tcatgcccct gttcctgaag 2520 tcagagttgt ggcagcccag aatccacagg ccagggttct ccatgctcat gaacacagtc 2580 tccccagaga aggggaacag ggtcagggtg tcctcataca ccatcttgtg cttgaaggtg 2640 tagccagaga agaacacaga caggaagtca gtctgggccc caatgctcag gatgtaccag 2700 taggccacct catgcaggca cacagacagc tgcaggctgt caaacacata gccattgatg 2760 ctgtgcatga tgttgctggc ctggaactca gggtcctcca gctgcacccc agcagggttg 2820 ggcaggaacc tctggatgtt ctcagtcagg taccagctcc tgttctcatc aaacacagag 2880 aacaggatca cattcctctt gtcagacatg atctggttgc ccctctggtc cacagactcc 2940 ttgtagcaga tcagcagggg gccaatcagg ccagaggcca ggtccctctc catgttcaca 3000 aagctgctgt agtatctggt caggcacctg gggtcagact tggtggggcc atcctccaca 3060 gtcacagtcc acttgtactt gaagatctcc ccaggcagga tggggaagtc cttcaggtgc 3120 ttcaccccct tgggcagcct cctgctgtac aggggcctca catcagtgat gccatggggg 3180 tagatgttgt agggcctgct ggcctggttc ttgaagatga tcagcagggt gtcccccacc 3240 tccccataca gcagggggcc caggatgcca gactcatgct ggatggcctc cctggtcttg 3300 aaggtttcat cagtgtaggc catgaacctg accttcttgt acttcctgcc aatcctctgg 3360 gggccattgt tcaggtactg gctcttgtag ctcctgtcat caggggccag caccaggggg 3420 gcatagtccc agtcctcctc ctcagcagca atgtagtgca cccaggtctt ggggtgcttc 3480 ttggccacag acctgatctg gatgaagctg gggctgttgt catcatcaaa cctcaccaca 3540 tccatctcag agtcagtcag gtcatcatca tagtcctcag cctcctcatt gttcttcatc 3600 ctcagctggg gctcctcagg gcagctgtcc accttcacat aggcctccat gccatcatgc 3660 tggtggctgc tgatgtggca gaacagcagg aactggccca ggtccatcag cagggtctgg 3720 gcagtcagga aggtgatggg gctgatctcc aggctggcct gcctgtggtt cctgaccagg 3780 aaggtgtggc cctccaggaa gatgctgtgc acctcagggg tggtgcccat gccaatcaca 3840 tgccagtaca cagacttcct gtggcagcca atcaggccag gcaggctcct gttcacatag 3900 ccattcacag tgtgcatctt gggccaggcc ctggcagagg cagcatccct gtcctgcatc 3960 aggctgttct tggtttcaga gtgccagctc ttgccctcat caaacacagc aaacagcagg 4020 atgaacttgt gcagggtctg ggtcttctcc ttggccaggc tgccctccct gcacaccagc 4080 agggccccaa tcaggccaga gttcaggtcc ttcaccaggt ccacatggct caggtagctg 4140 taggtcaggc acagggggtc agaggccatg gggccattct ccttcagcac ctgccacaca 4200 taggtgtggc tgcccccagg gaacaccttg tcatcctcct tctccctctg gctggtctgg 4260 tcatcatact cagccccctc agaggccttc cagtagctca cccccacagc atgcaggctc 4320 acagggtggc tggccatgtt cttcagggtg atcaccacag tgtcatacac ctcagcctgg 4380 atggtggggc ccagcaggcc catccagggg ggcctgggct tggcaatgtt gaacaggtgg 4440 tcagtgaact ccacaaacag ggtcttcttg tacaccacag aggtgttgaa ggggaagctc 4500 ttgggcactc tgggggggaa cctggcatcc acaggcagct cccccaggtc agactgcatg 4560 tagtcccagc tcagctccac agcccccagg tagtatctcc tggtggccac tgaaatgtaa 4620 aagaataatt ctttagtacg ctttgaggag taccgcctgt aacgatcggg aactggcacc 4680 gcgggccgca ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 4740 tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag 4800 tgagcgagcg agcgcgcagc tgcctgcagg 4830 <210> 312 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> n = a, t, c, or g <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(4) <223> n is a, c, g, or t <400> 312 nnnngatt 8 <210> 313 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> n = a, t, c, or g <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(5) <223> n is a, c, g, or t <400> 313 nnnnngttt 9 <210> 314 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> n = a, t, c, or g <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(4) <223> n is a, c, g, or t <400> 314 nnnngctt 8 <210> 315 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> Structural classification for homing endonuclease (HE) <400> 315 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 316 <211> 4488 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB076 <400> 316 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagcaa tgtgtctccc ccagtgctga agaggcacca gagggagatc accaggacca 2400 ccctgcagtc tgaccaggag gagattgact atgatgacac catctctgtg gagatgaaga 2460 aggaggactt tgacatctac gacgaggacg agaaccagag ccccaggagc ttccagaaga 2520 agaccaggca ctacttcatt gctgctgtgg agaggctgtg ggactatggc atgagcagca 2580 gcccccatgt gctgaggaac agggcccagt ctggctctgt gccccagttc aagaaggtgg 2640 tgttccagga gttcactgat ggcagcttca cccagcccct gtacagaggg gagctgaatg 2700 agcacctggg cctgctgggc ccctacatca gggctgaggt ggaggacaac atcatggtga 2760 ccttcaggaa ccaggccagc aggccctaca gcttctacag cagcctgatc agctatgagg 2820 aggaccagag gcagggggct gagcccagga agaactttgt gaagcccaat gaaaccaaga 2880 cctacttctg gaaggtgcag caccacatgg cccccaccaa ggatgagttt gactgcaagg 2940 cctgggccta cttctctgat gtggacctgg agaaggatgt gcactctggc ctgattggcc 3000 ccctgctggt gtgccacacc aacaccctga accctgccca tggcaggcag gtgactgtgc 3060 aggagtttgc cctgttcttc accatctttg atgaaaccaa gagctggtac ttcactgaga 3120 acatggagag gaactgcagg gccccctgca acatccagat ggaggacccc accttcaagg 3180 agaactacag gttccatgcc atcaatggct acatcatgga caccctgcct ggcctggtga 3240 tggcccagga ccagaggatc aggtggtacc tgctgagcat gggcagcaat gagaacatcc 3300 acagcatcca cttctctggc catgtgttca ctgtgaggaa gaaggaggag tacaagatgg 3360 ccctgtacaa cctgtaccct ggggtgtttg agactgtgga gatgctgccc agcaaggctg 3420 gcatctggag ggtggagtgc ctgattgggg agcacctgca tgctggcatg agcaccctgt 3480 tcctggtgta cagcaacaag tgccagaccc ccctgggcat ggcctctggc cacatcaggg 3540 acttccagat cactgcctct ggccagtatg gccagtgggc ccccaagctg gccaggctgc 3600 actactctgg cagcatcaat gcctggagca ccaaggagcc cttcagctgg atcaaggtgg 3660 acctgctggc ccccatgatc atccatggca tcaagaccca gggggccagg cagaagttca 3720 gcagcctgta catcagccag ttcatcatca tgtacagcct ggatggcaag aagtggcaga 3780 cctacagggg caacagcact ggcaccctga tggtgttctt tggcaatgtg gacagctctg 3840 gcatcaagca caacatcttc aaccccccca tcattgccag atacatcagg ctgcacccca 3900 cccactacag catcaggagc accctgagga tggagctgat gggctgtgac ctgaacagct 3960 gcagcatgcc cctgggcatg gagagcaagg ccatctctga tgcccagatc actgccagca 4020 gctacttcac caacatgttt gccacctgga gccccagcaa ggccaggctg cacctgcagg 4080 gcaggagcaa tgcctggagg ccccaggtca acaaccccaa ggagtggctg caggtggact 4140 tccagaagac catgaaggtg actggggtga ccacccaggg ggtgaagagc ctgctgacca 4200 gcatgtatgt gaaggagttc ctgatcagca gcagccagga tggccaccag tggaccctgt 4260 tcttccagaa tggcaaggtg aaggtgttcc agggcaacca ggacagcttc acccctgtgg 4320 tgaacagcct ggaccccccc ctgctgacca gatacctgag gattcacccc cagagctggg 4380 tgcaccagat tgccctgagg atggaggtgc tgggctgtga ggcccaggac ctgtactgaa 4440 ataaaagatc tttattttca ttagatctgt gtgttggttt tttgtgtg 4488 <210> 317 <211> 4493 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB077 <400> 317 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagcaa tgtgtctccc ccagtgctga agaggcacca gagggagatc accaggacca 2400 ccctgcagtc tgaccaggag gagattgact atgatgacac catctctgtg gagatgaaga 2460 aggaggactt tgacatctac gacgaggacg agaaccagag ccccaggagc ttccagaaga 2520 agaccaggca ctacttcatt gctgctgtgg agaggctgtg ggactatggc atgagcagca 2580 gcccccatgt gctgaggaac agggcccagt ctggctctgt gccccagttc aagaaggtgg 2640 tgttccagga gttcactgat ggcagcttca cccagcccct gtacagaggg gagctgaatg 2700 agcacctggg cctgctgggc ccctacatca gggctgaggt ggaggacaac atcatggtga 2760 ccttcaggaa ccaggccagc aggccctaca gcttctacag cagcctgatc agctatgagg 2820 aggaccagag gcagggggct gagcccagga agaactttgt gaagcccaat gaaaccaaga 2880 cctacttctg gaaggtgcag caccacatgg cccccaccaa ggatgagttt gactgcaagg 2940 cctgggccta cttctctgat gtggacctgg agaaggatgt gcactctggc ctgattggcc 3000 ccctgctggt gtgccacacc aacaccctga accctgccca tggcaggcag gtgactgtgc 3060 aggagtttgc cctgttcttc accatctttg atgaaaccaa gagctggtac ttcactgaga 3120 acatggagag gaactgcagg gccccctgca acatccagat ggaggacccc accttcaagg 3180 agaactacag gttccatgcc atcaatggct acatcatgga caccctgcct ggcctggtga 3240 tggcccagga ccagaggatc aggtggtacc tgctgagcat gggcagcaat gagaacatcc 3300 acagcatcca cttctctggc catgtgttca ctgtgaggaa gaaggaggag tacaagatgg 3360 ccctgtacaa cctgtaccct ggggtgtttg agactgtgga gatgctgccc agcaaggctg 3420 gcatctggag ggtggagtgc ctgattgggg agcacctgca tgctggcatg agcaccctgt 3480 tcctggtgta cagcaacaag tgccagaccc ccctgggcat ggcctctggc cacatcaggg 3540 acttccagat cactgcctct ggccagtatg gccagtgggc ccccaagctg gccaggctgc 3600 actactctgg cagcatcaat gcctggagca ccaaggagcc cttcagctgg atcaaggtgg 3660 acctgctggc ccccatgatc atccatggca tcaagaccca gggggccagg cagaagttca 3720 gcagcctgta catcagccag ttcatcatca tgtacagcct ggatggcaag aagtggcaga 3780 cctacagggg caacagcact ggcaccctga tggtgttctt tggcaatgtg gacagctctg 3840 gcatcaagca caacatcttc aaccccccca tcattgccag atacatcagg ctgcacccca 3900 cccactacag catcaggagc accctgagga tggagctgat gggctgtgac ctgaacagct 3960 gcagcatgcc cctgggcatg gagagcaagg ccatctctga tgcccagatc actgccagca 4020 gctacttcac caacatgttt gccacctgga gccccagcaa ggccaggctg cacctgcagg 4080 gcaggagcaa tgcctggagg ccccaggtca acaaccccaa ggagtggctg caggtggact 4140 tccagaagac catgaaggtg actggggtga ccacccaggg ggtgaagagc ctgctgacca 4200 gcatgtatgt gaaggagttc ctgatcagca gcagccagga tggccaccag tggaccctgt 4260 tcttccagaa tggcaaggtg aaggtgttcc agggcaacca ggacagcttc acccctgtgg 4320 tgaacagcct ggaccccccc ctgctgacca gatacctgag gattcacccc cagagctggg 4380 tgcaccagat tgccctgagg atggaggtgc tgggctgtga ggcccaggac ctgtactgat 4440 cgcgaataaa agatctttat tttcattaga tctgtgtgtt ggttttttgt gtg 4493 <210> 318 <211> 4437 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB080 <400> 318 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccaga aggtactacc tgggagctgt ggaactgagc tgggactaca 120 tgcagtctga cctgggagag ctgcctgtgg atgctagatt tcctccaaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaaaaccct gtttgtggaa ttcacagacc 240 acctgttcaa tattgccaag cctagacctc cttggatggg cctgctgggc cctacaattc 300 aggctgaggt gtatgacaca gtggtcatca ccctgaagaa catggccagc catcctgtgt 360 ctctgcatgc tgtgggagtg tcttactgga aggcttctga gggggctgag tatgatgacc 420 agacaagcca gagagagaaa gaggatgaca aggttttccc tgggggcagc cacacctatg 480 tctggcaggt cctgaaagaa aatggcccta tggcctctga tcctctgtgc ctgacataca 540 gctacctgag ccatgtggac ctggtcaagg acctgaactc tggcctgatt ggggctctgc 600 tggtgtgtag agaaggcagc ctggccaaag aaaagaccca gacactgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgagacaaag aacagcctga 720 tgcaggacag agatgctgcc tctgctagag cttggcccaa gatgcacaca gtgaatggct 780 atgtgaacag aagcctgcct ggactgattg gatgccacag aaagtctgtg tactggcatg 840 tgattggcat gggcaccaca cctgaggtgc acagcatctt tctggaagga cacaccttcc 900 tggtgaggaa ccacagacag gccagcctgg aaatcagccc tatcaccttc ctgacagctc 960 agaccctgct gatggatctg ggccagtttc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaagcctat gtgaaggtgg acagctgccc tgaagaaccc cagctgagaa 1080 tgaagaacaa tgaggaagct gaggactatg atgatgacct gacagactct gagatggatg 1140 tggtcagatt tgatgatgat aacagcccca gcttcatcca gatcagatct gtggccaaga 1200 agcaccccaa gacctgggtg cactatattg ctgctgagga agaggactgg gattatgctc 1260 ctctggtgct ggcccctgat gacagaagct acaagagcca gtacctgaac aatggccctc 1320 agagaattgg caggaagtat aagaaagtga ggttcatggc ctacacagat gagacattca 1380 agaccagaga ggctatccag catgagtctg gcattctggg acctctgctg tatggggaag 1440 tgggggacac actgctgatc atcttcaaga accaggccag cagaccctac aacatctacc 1500 ctcatggcat cacagatgtg aggcctctgt actctagaag gctgcccaag ggggtgaagc 1560 acctgaagga cttccctatc ctgcctgggg agatcttcaa gtacaagtgg acagtgacag 1620 tggaggatgg ccctaccaag tctgatccta gatgcctgac aaggtactac agcagctttg 1680 tgaacatgga aagggacctg gcctctggcc tgattggtcc tctgctgatc tgctacaaag 1740 aatctgtgga ccagaggggc aaccagatca tgagtgacaa gagaaatgtg atcctgttct 1800 ctgtctttga tgagaacagg tcctggtatc tgacagagaa catccagagg tttctgccca 1860 atcctgctgg ggtgcagctg gaagatcctg agttccaggc ctccaacatc atgcactcca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgaa gtggcctact 1980 ggtacatcct gtctattggg gcccagacag acttcctgtc tgtgttcttt tctggctaca 2040 ccttcaagca caagatggtg tatgaggata ccctgacact gttcccattc tctggggaga 2100 cagtgttcat gagcatggaa aaccctggcc tgtggatcct gggctgtcac aacagtgact 2160 tcagaaacag aggcatgaca gccctgctga aggtgtccag ctgtgacaag aacactgggg 2220 actactatga ggactcttat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcctag gagcttctct cagaaccctc ctgtgctgaa gagacaccag agggagatca 2340 ccagaaccac actgcagtct gaccaagagg aaattgatta tgatgacacc atctctgtgg 2400 agatgaagaa agaagatttt gacatctatg atgaggatga gaatcagagc cccagatctt 2460 tccagaagaa aacaaggcac tacttcattg ctgctgtgga aagactgtgg gactatggca 2520 tgagcagcag cccccatgtg ctgagaaaca gggcccagtc tggaagtgtg ccccagttca 2580 agaaagtggt gttccaagag ttcacagatg gcagcttcac ccagcctctg tatagagggg 2640 agctgaatga gcacctggga ctgctgggac cttacatcag agctgaggtg gaggataaca 2700 tcatggtcac ctttagaaac caggcctcta ggccctactc cttctacagc tccctgatca 2760 gctatgaaga ggaccagaga cagggggctg agcccagaaa gaactttgtg aagcccaatg 2820 agactaagac ctacttttgg aaggtgcagc accacatggc ccctacaaag gatgagtttg 2880 actgcaaggc ctgggcctac ttctctgatg tggacctgga gaaggatgtg cactctggac 2940 tcattggacc cctgcttgtg tgccacacca acacactgaa tcctgctcat ggcaggcaag 3000 tgacagtgca agagtttgcc ctgttcttca ccatctttga tgagacaaag tcctggtact 3060 tcacagaaaa catggaaaga aactgcaggg ccccttgcaa catccagatg gaagatccca 3120 ccttcaaaga gaactacagg ttccatgcca tcaatggcta catcatggac actctgcctg 3180 gcctggttat ggcacaggat cagaggatca gatggtatct gctgtccatg ggctccaatg 3240 agaatatcca cagcatccac ttctctggcc atgtgttcac agtgaggaaa aaagaagagt 3300 acaagatggc cctgtacaat ctgtaccctg gggtgtttga gactgtggaa atgctgccta 3360 gcaaggctgg aatctggagg gtggaatgtc tgattggaga gcatctgcat gctggaatgt 3420 ctaccctgtt cctggtgtac agcaacaagt gtcagacccc tctgggcatg gcctctggac 3480 acatcagaga cttccagatc acagcctctg gccagtatgg acagtgggct cctaaactgg 3540 ctagactgca ctactctggc agcatcaatg cctggtccac caaagagccc ttcagctgga 3600 tcaaggtgga cctgctggct cccatgatca tccatggaat caagacccag ggggccagac 3660 agaagttcag cagcctgtac atcagccagt tcatcatcat gtacagcctg gatggcaaga 3720 agtggcagac ctacagaggc aacagcacag gcacactcat ggtgttcttt ggcaatgtgg 3780 actcttctgg cattaagcac aacatcttca accctccaat cattgccagg tacatcaggc 3840 tgcaccccac acactacagc atcagatcta ccctgaggat ggaactgatg ggctgtgacc 3900 tgaacagctg ctctatgccc ctgggaatgg aaagcaaggc catctctgat gcccagatca 3960 cagccagcag ctacttcacc aacatgtttg ccacatggtc cccatctaag gccaggctgc 4020 atctgcaggg cagatctaat gcttggaggc cccaagtgaa caaccccaaa gagtggctgc 4080 aggtggactt tcagaaaacc atgaaagtga caggagtgac cacacagggg gtcaagtctc 4140 tgctgacctc tatgtatgtg aaagagttcc tgatctccag cagccaggat ggccaccagt 4200 ggaccctgtt tttccagaat ggcaaagtca aggtgttcca gggaaaccag gacagcttca 4260 cacctgtggt caactccctg gatcctccac tgctgaccag atacctgaga attcaccctc 4320 agtcttgggt gcaccagatt gctctgagaa tggaagtgct gggatgtgaa gctcaggacc 4380 tctactaaaa taaaagatct ttattttcat tagatctgtg tgttggtttt ttgtgtg 4437 <210> 319 <211> 4437 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB085 <400> 319 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccaga aggtactacc taggagccgt ggaactgagc tgggactaca 120 tgcagtctga cctgggagag ctgcccgtgg acgctagatt tcctccaaga gtgcccaaga 180 gcttcccctt caacacctcc gtggtgtaca agaaaaccct gttcgtggaa ttcaccgacc 240 acctgttcaa tatcgccaag cctagacctc cttggatggg cctgctgggc cctacaattc 300 aggccgaggt gtacgacacc gtggtcatca ccctgaagaa catggccagc catcctgtgt 360 ctctgcacgc cgtgggagtg tcttactgga aggcttctga gggcgccgag tacgacgacc 420 agacaagcca gagagagaaa gaggacgaca aggttttccc tggcggcagc cacacctatg 480 tctggcaggt cctgaaagaa aacggcccta tggcctccga tcctctgtgc ctgacataca 540 gctacctgag ccatgtggac ctggtcaagg acctgaactc tggcctgatc ggcgctctgc 600 tcgtgtgtag agaaggcagc ctggccaaag aaaagaccca gacactgcac aagttcatcc 660 tgctgttcgc cgtgttcgac gagggcaaga gctggcacag cgagacaaag aacagcctga 720 tgcaggacag agatgccgcc tctgctagag cttggcccaa gatgcacacc gtgaacggct 780 acgtgaacag aagcctgcct ggactgatcg gatgccacag aaagtccgtg tactggcatg 840 tgatcggcat gggcaccaca cctgaggtgc acagcatctt tctggaagga cacaccttcc 900 tcgtgcggaa ccacagacag gccagcctgg aaatcagccc tatcaccttc ctgaccgctc 960 agaccctgct gatggatctg ggccagtttc tgctgttctg ccacatcagc agccaccagc 1020 acgatggcat ggaagcctac gtgaaggtgg acagctgccc cgaagaaccc cagctgagaa 1080 tgaagaacaa cgaggaagcc gaggactacg acgacgacct gaccgactct gagatggacg 1140 tcgtcagatt cgacgacgat aacagcccca gcttcatcca gatcagaagc gtggccaaga 1200 agcaccccaa gacctgggtg cactatatcg ccgccgagga agaggactgg gattacgctc 1260 ctctggtgct ggcccctgac gacagaagct acaagagcca gtacctgaac aacggccctc 1320 agagaatcgg ccggaagtat aagaaagtgc ggttcatggc ctacaccgac gagacattca 1380 agaccagaga ggctatccag cacgagagcg gcattctggg acctctgctg tatggcgaag 1440 tgggcgacac actgctgatc atcttcaaga accaggccag cagaccctac aacatctacc 1500 ctcacggcat caccgatgtg cggcctctgt actctagaag gctgcccaag ggcgtgaagc 1560 acctgaagga cttccctatc ctgcctggcg agatcttcaa gtacaagtgg accgtgaccg 1620 tcgaggacgg ccctaccaag agcgatccta gatgcctgac acggtactac agcagcttcg 1680 tgaacatgga acgcgacctg gccagcggcc tgattggtcc tctgctgatc tgctacaaag 1740 aaagcgtgga ccagaggggc aaccagatca tgagcgacaa gagaaacgtg atcctgttct 1800 ccgtctttga cgagaacagg tcctggtatc tgaccgagaa catccagcgg tttctgccca 1860 atcctgctgg cgtgcagctg gaagatcctg agttccaggc ctccaacatc atgcactcca 1920 tcaacggcta tgtgttcgac agcctgcagc tgagcgtgtg cctgcacgaa gtggcctact 1980 ggtacatcct gtctatcggc gcccagaccg acttcctgtc cgtgttcttt agcggctaca 2040 ccttcaagca caagatggtg tacgaggata ccctgacact gttcccattc agcggcgaga 2100 cagtgttcat gagcatggaa aaccccggcc tgtggatcct gggctgtcac aacagcgact 2160 tcagaaacag aggcatgaca gccctgctga aggtgtccag ctgcgacaag aacaccggcg 2220 actactacga ggactcttac gaggacatca gcgcctacct gctgagcaag aacaatgcca 2280 tcgagcctcg gagcttctct cagaaccctc ctgtgctgaa gagacaccag cgcgagatca 2340 ccagaaccac actgcagagc gaccaagagg aaatcgatta cgacgacacc atcagcgtcg 2400 agatgaagaa agaagatttc gacatctacg acgaggacga gaatcagagc cccagatctt 2460 tccagaagaa aacgcggcac tacttcattg ccgccgtgga aagactgtgg gactacggca 2520 tgagcagcag cccacatgtg ctgagaaaca gggcccagag cggaagcgtg ccccagttca 2580 agaaagtggt gttccaagag ttcaccgacg gcagcttcac ccagcctctg tatagaggcg 2640 agctgaacga gcacctggga ctgctgggac cttacatcag agctgaggtc gaggataaca 2700 tcatggtcac ctttagaaac caggcctcta ggccctactc cttctacagc tccctgatca 2760 gctacgaaga ggaccagaga cagggcgctg agcccagaaa gaacttcgtg aagcccaacg 2820 agactaagac ctacttttgg aaggtgcagc accacatggc ccctacaaag gacgagttcg 2880 actgcaaggc ctgggcctac ttctctgacg tggacctcga gaaggatgtg cacagcggac 2940 tcatcggacc cctgcttgtg tgccacacca acacactgaa tcccgctcac ggcaggcaag 3000 tgaccgtgca agagttcgcc ctgttcttca ccatcttcga tgagacaaag tcctggtact 3060 tcaccgaaaa catggaaaga aactgcaggg ccccttgcaa catccagatg gaagatccca 3120 ccttcaaaga gaactaccgg ttccacgcca tcaatggcta catcatggac actctgcccg 3180 gcctggttat ggcacaggat cagaggatca gatggtatct gctgtccatg ggctccaacg 3240 agaatatcca cagcatccac ttcagcggcc atgtgttcac cgtgcggaaa aaagaagagt 3300 acaagatggc cctgtacaat ctgtaccccg gcgtgttcga gactgtggaa atgctgccta 3360 gcaaggccgg aatctggcgc gtggaatgtc tgatcggaga gcatctgcat gccggaatgt 3420 ctaccctgtt cctggtgtac agcaacaagt gtcagacccc tctcggcatg gcctctggac 3480 acatcagaga cttccagatc accgcctctg gccagtacgg acagtgggct cctaaactgg 3540 ctagactgca ctacagcggc agcatcaacg cctggtccac caaagagccc ttcagctgga 3600 tcaaggtgga cctgctggct cccatgatca tccacggaat caagacccag ggcgccagac 3660 agaagttcag cagcctgtac atcagccagt tcatcatcat gtacagcctg gacggcaaga 3720 agtggcagac ctacagaggc aacagcaccg gcacactcat ggtgttcttc ggcaacgtgg 3780 actccagcgg cattaagcac aacatcttca accctccaat cattgcccgg tacatccggc 3840 tgcaccccac acactacagc atcagatcta ccctgaggat ggaactgatg ggctgcgacc 3900 tgaacagctg ctctatgccc ctcggaatgg aaagcaaggc catcagcgac gcccagatca 3960 cagccagcag ctacttcacc aacatgttcg ccacatggtc cccatctaag gcccggctgc 4020 atctgcaggg cagatctaac gcttggaggc cccaagtgaa caaccccaaa gagtggctgc 4080 aggtcgactt tcagaaaacc atgaaagtga ccggcgtgac cacacagggc gtcaagtctc 4140 tgctgacctc tatgtacgtg aaagagttcc tgatctccag cagccaggac ggccaccagt 4200 ggaccctgtt tttccagaac ggcaaagtca aggtgttcca gggaaaccag gacagcttca 4260 cacccgtggt caactccctg gatcctccac tgctgaccag atacctgaga attcaccctc 4320 agtcttgggt gcaccagatc gctctgagaa tggaagtgct gggatgtgaa gctcaggacc 4380 tctactaaaa taaaagatct ttattttcat tagatctgtg tgttggtttt ttgtgtg 4437 <210> 320 <211> 4437 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB100 <400> 320 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatcccc cagtgctgaa gaggcaccag agggagatca 2340 ccaggaccac cctgcagtct gaccaggagg agattgacta tgatgacacc atctctgtgg 2400 agatgaagaa ggaggacttt gacatctacg acgaggacga gaaccagagc cccaggagct 2460 tccagaagaa gaccaggcac tacttcattg ctgctgtgga gaggctgtgg gactatggca 2520 tgagcagcag cccccatgtg ctgaggaaca gggcccagtc tggctctgtg ccccagttca 2580 agaaggtggt gttccaggag ttcactgatg gcagcttcac ccagcccctg tacagagggg 2640 agctgaatga gcacctgggc ctgctgggcc cctacatcag ggctgaggtg gaggacaaca 2700 tcatggtgac cttcaggaac caggccagca ggccctacag cttctacagc agcctgatca 2760 gctatgagga ggaccagagg cagggggctg agcccaggaa gaactttgtg aagcccaatg 2820 aaaccaagac ctacttctgg aaggtgcagc accacatggc ccccaccaag gatgagtttg 2880 actgcaaggc ctgggcctac ttctctgatg tggacctgga gaaggatgtg cactctggcc 2940 tgattggccc cctgctggtg tgccacacca acaccctgaa ccctgcccat ggcaggcagg 3000 tgactgtgca ggagtttgcc ctgttcttca ccatctttga tgaaaccaag agctggtact 3060 tcactgagaa catggagagg aactgcaggg ccccctgcaa catccagatg gaggacccca 3120 ccttcaagga gaactacagg ttccatgcca tcaatggcta catcatggac accctgcctg 3180 gcctggtgat ggcccaggac cagaggatca ggtggtacct gctgagcatg ggcagcaatg 3240 agaacatcca cagcatccac ttctctggcc atgtgttcac tgtgaggaag aaggaggagt 3300 acaagatggc cctgtacaac ctgtaccctg gggtgtttga gactgtggag atgctgccca 3360 gcaaggctgg catctggagg gtggagtgcc tgattgggga gcacctgcat gctggcatga 3420 gcaccctgtt cctggtgtac agcaacaagt gccagacccc cctgggcatg gcctctggcc 3480 acatcaggga cttccagatc actgcctctg gccagtatgg ccagtgggcc cccaagctgg 3540 ccaggctgca ctactctggc agcatcaatg cctggagcac caaggagccc ttcagctgga 3600 tcaaggtgga cctgctggcc cccatgatca tccatggcat caagacccag ggggccaggc 3660 agaagttcag cagcctgtac atcagccagt tcatcatcat gtacagcctg gatggcaaga 3720 agtggcagac ctacaggggc aacagcactg gcaccctgat ggtgttcttt ggcaatgtgg 3780 acagctctgg catcaagcac aacatcttca acccccccat cattgccaga tacatcaggc 3840 tgcaccccac ccactacagc atcaggagca ccctgaggat ggagctgatg ggctgtgacc 3900 tgaacagctg cagcatgccc ctgggcatgg agagcaaggc catctctgat gcccagatca 3960 ctgccagcag ctacttcacc aacatgtttg ccacctggag ccccagcaag gccaggctgc 4020 acctgcaggg caggagcaat gcctggaggc cccaggtcaa caaccccaag gagtggctgc 4080 aggtggactt ccagaagacc atgaaggtga ctggggtgac cacccagggg gtgaagagcc 4140 tgctgaccag catgtatgtg aaggagttcc tgatcagcag cagccaggat ggccaccagt 4200 ggaccctgtt cttccagaat ggcaaggtga aggtgttcca gggcaaccag gacagcttca 4260 cccctgtggt gaacagcctg gacccccccc tgctgaccag atacctgagg attcaccccc 4320 agagctgggt gcaccagatt gccctgagga tggaggtgct gggctgtgag gcccaggacc 4380 tgtactgaaa taaaagatct ttattttcat tagatctgtg tgttggtttt ttgtgtg 4437 <210> 321 <211> 4775 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1000 <400> 321 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggcctaa ggcaattgtg ccagttcccg atcgttacag 180 gcggtactcc tcaaagcgta ctaaagaatt attcttttac atttcagtgg ccaccagaag 240 gtactacctg ggagctgtgg aactgagctg ggactacatg cagtctgacc tgggagagct 300 gcctgtggat gctagatttc ctccaagagt gcccaagagc ttccccttca acacctctgt 360 ggtgtacaag aaaaccctgt ttgtggaatt cacagaccac ctgttcaata ttgccaagcc 420 tagacctcct tggatgggcc tgctgggccc tacaattcag gctgaggtgt atgacacagt 480 ggtcatcacc ctgaagaaca tggccagcca tcctgtgtct ctgcatgctg tgggagtgtc 540 ttactggaag gcttctgagg gggctgagta tgatgaccag acaagccaga gagagaaaga 600 ggatgacaag gttttccctg ggggcagcca cacctatgtc tggcaggtcc tgaaagaaaa 660 tggccctatg gcctctgatc ctctgtgcct gacatacagc tacctgagcc atgtggacct 720 ggtcaaggac ctgaactctg gcctgattgg ggctctgctg gtgtgtagag aaggcagcct 780 ggccaaagaa aagacccaga cactgcacaa gttcatcctg ctgtttgctg tgtttgatga 840 gggcaagagc tggcactctg agacaaagaa cagcctgatg caggacagag atgctgcctc 900 tgctagagct tggcccaaga tgcacacagt gaatggctat gtgaacagaa gcctgcctgg 960 actgattgga tgccacagaa agtctgtgta ctggcatgtg attggcatgg gcaccacacc 1020 tgaggtgcac agcatctttc tggaaggaca caccttcctg gtgaggaacc acagacaggc 1080 cagcctggaa atcagcccta tcaccttcct gacagctcag accctgctga tggatctggg 1140 ccagtttctg ctgttctgcc acatcagcag ccaccagcat gatggcatgg aagcctatgt 1200 gaaggtggac agctgccctg aagaacccca gctgagaatg aagaacaatg aggaagctga 1260 ggactatgat gatgacctga cagactctga gatggatgtg gtcagatttg atgatgataa 1320 cagccccagc ttcatccaga tcagatctgt ggccaagaag caccccaaga cctgggtgca 1380 ctatattgct gctgaggaag aggactggga ttatgctcct ctggtgctgg cccctgatga 1440 cagaagctac aagagccagt acctgaacaa tggccctcag agaattggca ggaagtataa 1500 gaaagtgagg ttcatggcct acacagatga gacattcaag accagagagg ctatccagca 1560 tgagtctggc attctgggac ctctgctgta tggggaagtg ggggacacac tgctgatcat 1620 cttcaagaac caggccagca gaccctacaa catctaccct catggcatca cagatgtgag 1680 gcctctgtac tctagaaggc tgcccaaggg ggtgaagcac ctgaaggact tccctatcct 1740 gcctggggag atcttcaagt acaagtggac agtgacagtg gaggatggcc ctaccaagtc 1800 tgatcctaga tgcctgacaa ggtactacag cagctttgtg aacatggaaa gggacctggc 1860 ctctggcctg attggtcctc tgctgatctg ctacaaagaa tctgtggacc agaggggcaa 1920 ccagatcatg agtgacaaga gaaatgtgat cctgttctct gtctttgatg agaacaggtc 1980 ctggtatctg acagagaaca tccagaggtt tctgcccaat cctgctgggg tgcagctgga 2040 agatcctgag ttccaggcct ccaacatcat gcactccatc aatggctatg tgtttgacag 2100 cctgcagctg tctgtgtgcc tgcatgaagt ggcctactgg tacatcctgt ctattggggc 2160 ccagacagac ttcctgtctg tgttcttttc tggctacacc ttcaagcaca agatggtgta 2220 tgaggatacc ctgacactgt tcccattctc tggggagaca gtgttcatga gcatggaaaa 2280 ccctggcctg tggatcctgg gctgtcacaa cagtgacttc agaaacagag gcatgacagc 2340 cctgctgaag gtgtccagct gtgacaagaa cactggggac tactatgagg actcttatga 2400 ggacatctct gcctacctgc tgagcaagaa caatgccatt gagcctagga gcttctctca 2460 gaaccctcct gtgctgaaga gacaccagag ggagatcacc agaaccacac tgcagtctga 2520 ccaagaggaa attgattatg atgacaccat ctctgtggag atgaagaaag aagattttga 2580 catctatgat gaggatgaga atcagagccc cagatctttc cagaagaaaa caaggcacta 2640 cttcattgct gctgtggaaa gactgtggga ctatggcatg agcagcagcc cccatgtgct 2700 gagaaacagg gcccagtctg gaagtgtgcc ccagttcaag aaagtggtgt tccaagagtt 2760 cacagatggc agcttcaccc agcctctgta tagaggggag ctgaatgagc acctgggact 2820 gctgggacct tacatcagag ctgaggtgga ggataacatc atggtcacct ttagaaacca 2880 ggcctctagg ccctactcct tctacagctc cctgatcagc tatgaagagg accagagaca 2940 gggggctgag cccagaaaga actttgtgaa gcccaatgag actaagacct acttttggaa 3000 ggtgcagcac cacatggccc ctacaaagga tgagtttgac tgcaaggcct gggcctactt 3060 ctctgatgtg gacctggaga aggatgtgca ctctggactc attggacccc tgcttgtgtg 3120 ccacaccaac acactgaatc ctgctcatgg caggcaagtg acagtgcaag agtttgccct 3180 gttcttcacc atctttgatg agacaaagtc ctggtacttc acagaaaaca tggaaagaaa 3240 ctgcagggcc ccttgcaaca tccagatgga agatcccacc ttcaaagaga actacaggtt 3300 ccatgccatc aatggctaca tcatggacac tctgcctggc ctggttatgg cacaggatca 3360 gaggatcaga tggtatctgc tgtccatggg ctccaatgag aatatccaca gcatccactt 3420 ctctggccat gtgttcacag tgaggaaaaa agaagagtac aagatggccc tgtacaatct 3480 gtaccctggg gtgtttgaga ctgtggaaat gctgcctagc aaggctggaa tctggagggt 3540 ggaatgtctg attggagagc atctgcatgc tggaatgtct accctgttcc tggtgtacag 3600 caacaagtgt cagacccctc tgggcatggc ctctggacac atcagagact tccagatcac 3660 agcctctggc cagtatggac agtgggctcc taaactggct agactgcact actctggcag 3720 catcaatgcc tggtccacca aagagccctt cagctggatc aaggtggacc tgctggctcc 3780 catgatcatc catggaatca agacccaggg ggccagacag aagttcagca gcctgtacat 3840 cagccagttc atcatcatgt acagcctgga tggcaagaag tggcagacct acagaggcaa 3900 cagcacaggc acactcatgg tgttctttgg caatgtggac tcttctggca ttaagcacaa 3960 catcttcaac cctccaatca ttgccaggta catcaggctg caccccacac actacagcat 4020 cagatctacc ctgaggatgg aactgatggg ctgtgacctg aacagctgct ctatgcccct 4080 gggaatggaa agcaaggcca tctctgatgc ccagatcaca gccagcagct acttcaccaa 4140 catgtttgcc acatggtccc catctaaggc caggctgcat ctgcagggca gatctaatgc 4200 ttggaggccc caagtgaaca accccaaaga gtggctgcag gtggactttc agaaaaccat 4260 gaaagtgaca ggagtgacca cacagggggt caagtctctg ctgacctcta tgtatgtgaa 4320 agagttcctg atctccagca gccaggatgg ccaccagtgg accctgtttt tccagaatgg 4380 caaagtcaag gtgttccagg gaaaccagga cagcttcaca cctgtggtca actccctgga 4440 tcctccactg ctgaccagat acctgagaat tcaccctcag tcttgggtgc accagattgc 4500 tctgagaatg gaagtgctgg gatgtgaagc tcaggacctc tactgatcgc gaataaaaga 4560 tctttatttt cattagatct gtgtgttggt tttttgtgtg tgccagttcc cgatcgttac 4620 aggccgcggg ccgcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4680 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4740 ctcagtgagc gagcgagcgc gcagctgcct gcagg 4775 <210> 322 <211> 4775 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1001 <400> 322 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggcctaa ggcaattgtg ccagttcccg atcgttacag 180 gcggtactcc tcaaagcgta ctaaagaatt attcttttac atttcagtgg ccaccagaag 240 gtactaccta ggagccgtgg aactgagctg ggactacatg cagtctgacc tgggagagct 300 gcccgtggac gctagatttc ctccaagagt gcccaagagc ttccccttca acacctccgt 360 ggtgtacaag aaaaccctgt tcgtggaatt caccgaccac ctgttcaata tcgccaagcc 420 tagacctcct tggatgggcc tgctgggccc tacaattcag gccgaggtgt acgacaccgt 480 ggtcatcacc ctgaagaaca tggccagcca tcctgtgtct ctgcacgccg tgggagtgtc 540 ttactggaag gcttctgagg gcgccgagta cgacgaccag acaagccaga gagagaaaga 600 ggacgacaag gttttccctg gcggcagcca cacctatgtc tggcaggtcc tgaaagaaaa 660 cggccctatg gcctccgatc ctctgtgcct gacatacagc tacctgagcc atgtggacct 720 ggtcaaggac ctgaactctg gcctgatcgg cgctctgctc gtgtgtagag aaggcagcct 780 ggccaaagaa aagacccaga cactgcacaa gttcatcctg ctgttcgccg tgttcgacga 840 gggcaagagc tggcacagcg agacaaagaa cagcctgatg caggacagag atgccgcctc 900 tgctagagct tggcccaaga tgcacaccgt gaacggctac gtgaacagaa gcctgcctgg 960 actgatcgga tgccacagaa agtccgtgta ctggcatgtg atcggcatgg gcaccacacc 1020 tgaggtgcac agcatctttc tggaaggaca caccttcctc gtgcggaacc acagacaggc 1080 cagcctggaa atcagcccta tcaccttcct gaccgctcag accctgctga tggatctggg 1140 ccagtttctg ctgttctgcc acatcagcag ccaccagcac gatggcatgg aagcctacgt 1200 gaaggtggac agctgccccg aagaacccca gctgagaatg aagaacaacg aggaagccga 1260 ggactacgac gacgacctga ccgactctga gatggacgtc gtcagattcg acgacgataa 1320 cagccccagc ttcatccaga tcagaagcgt ggccaagaag caccccaaga cctgggtgca 1380 ctatatcgcc gccgaggaag aggactggga ttacgctcct ctggtgctgg cccctgacga 1440 cagaagctac aagagccagt acctgaacaa cggccctcag agaatcggcc ggaagtataa 1500 gaaagtgcgg ttcatggcct acaccgacga gacattcaag accagagagg ctatccagca 1560 cgagagcggc attctgggac ctctgctgta tggcgaagtg ggcgacacac tgctgatcat 1620 cttcaagaac caggccagca gaccctacaa catctaccct cacggcatca ccgatgtgcg 1680 gcctctgtac tctagaaggc tgcccaaggg cgtgaagcac ctgaaggact tccctatcct 1740 gcctggcgag atcttcaagt acaagtggac cgtgaccgtc gaggacggcc ctaccaagag 1800 cgatcctaga tgcctgacac ggtactacag cagcttcgtg aacatggaac gcgacctggc 1860 cagcggcctg attggtcctc tgctgatctg ctacaaagaa agcgtggacc agaggggcaa 1920 ccagatcatg agcgacaaga gaaacgtgat cctgttctcc gtctttgacg agaacaggtc 1980 ctggtatctg accgagaaca tccagcggtt tctgcccaat cctgctggcg tgcagctgga 2040 agatcctgag ttccaggcct ccaacatcat gcactccatc aacggctatg tgttcgacag 2100 cctgcagctg agcgtgtgcc tgcacgaagt ggcctactgg tacatcctgt ctatcggcgc 2160 ccagaccgac ttcctgtccg tgttctttag cggctacacc ttcaagcaca agatggtgta 2220 cgaggatacc ctgacactgt tcccattcag cggcgagaca gtgttcatga gcatggaaaa 2280 ccccggcctg tggatcctgg gctgtcacaa cagcgacttc agaaacagag gcatgacagc 2340 cctgctgaag gtgtccagct gcgacaagaa caccggcgac tactacgagg actcttacga 2400 ggacatcagc gcctacctgc tgagcaagaa caatgccatc gagcctcgga gcttctctca 2460 gaaccctcct gtgctgaaga gacaccagcg cgagatcacc agaaccacac tgcagagcga 2520 ccaagaggaa atcgattacg acgacaccat cagcgtcgag atgaagaaag aagatttcga 2580 catctacgac gaggacgaga atcagagccc cagatctttc cagaagaaaa cgcggcacta 2640 cttcattgcc gccgtggaaa gactgtggga ctacggcatg agcagcagcc cacatgtgct 2700 gagaaacagg gcccagagcg gaagcgtgcc ccagttcaag aaagtggtgt tccaagagtt 2760 caccgacggc agcttcaccc agcctctgta tagaggcgag ctgaacgagc acctgggact 2820 gctgggacct tacatcagag ctgaggtcga ggataacatc atggtcacct ttagaaacca 2880 ggcctctagg ccctactcct tctacagctc cctgatcagc tacgaagagg accagagaca 2940 gggcgctgag cccagaaaga acttcgtgaa gcccaacgag actaagacct acttttggaa 3000 ggtgcagcac cacatggccc ctacaaagga cgagttcgac tgcaaggcct gggcctactt 3060 ctctgacgtg gacctcgaga aggatgtgca cagcggactc atcggacccc tgcttgtgtg 3120 ccacaccaac acactgaatc ccgctcacgg caggcaagtg accgtgcaag agttcgccct 3180 gttcttcacc atcttcgatg agacaaagtc ctggtacttc accgaaaaca tggaaagaaa 3240 ctgcagggcc ccttgcaaca tccagatgga agatcccacc ttcaaagaga actaccggtt 3300 ccacgccatc aatggctaca tcatggacac tctgcccggc ctggttatgg cacaggatca 3360 gaggatcaga tggtatctgc tgtccatggg ctccaacgag aatatccaca gcatccactt 3420 cagcggccat gtgttcaccg tgcggaaaaa agaagagtac aagatggccc tgtacaatct 3480 gtaccccggc gtgttcgaga ctgtggaaat gctgcctagc aaggccggaa tctggcgcgt 3540 ggaatgtctg atcggagagc atctgcatgc cggaatgtct accctgttcc tggtgtacag 3600 caacaagtgt cagacccctc tcggcatggc ctctggacac atcagagact tccagatcac 3660 cgcctctggc cagtacggac agtgggctcc taaactggct agactgcact acagcggcag 3720 catcaacgcc tggtccacca aagagccctt cagctggatc aaggtggacc tgctggctcc 3780 catgatcatc cacggaatca agacccaggg cgccagacag aagttcagca gcctgtacat 3840 cagccagttc atcatcatgt acagcctgga cggcaagaag tggcagacct acagaggcaa 3900 cagcaccggc acactcatgg tgttcttcgg caacgtggac tccagcggca ttaagcacaa 3960 catcttcaac cctccaatca ttgcccggta catccggctg caccccacac actacagcat 4020 cagatctacc ctgaggatgg aactgatggg ctgcgacctg aacagctgct ctatgcccct 4080 cggaatggaa agcaaggcca tcagcgacgc ccagatcaca gccagcagct acttcaccaa 4140 catgttcgcc acatggtccc catctaaggc ccggctgcat ctgcagggca gatctaacgc 4200 ttggaggccc caagtgaaca accccaaaga gtggctgcag gtcgactttc agaaaaccat 4260 gaaagtgacc ggcgtgacca cacagggcgt caagtctctg ctgacctcta tgtacgtgaa 4320 agagttcctg atctccagca gccaggacgg ccaccagtgg accctgtttt tccagaacgg 4380 caaagtcaag gtgttccagg gaaaccagga cagcttcaca cccgtggtca actccctgga 4440 tcctccactg ctgaccagat acctgagaat tcaccctcag tcttgggtgc accagatcgc 4500 tctgagaatg gaagtgctgg gatgtgaagc tcaggacctc tactgatcgc gaataaaaga 4560 tctttatttt cattagatct gtgtgttggt tttttgtgtg tgccagttcc cgatcgttac 4620 aggccgcggg ccgcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4680 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4740 ctcagtgagc gagcgagcgc gcagctgcct gcagg 4775 <210> 323 <211> 4780 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1002 <400> 323 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccctc gagtgccagt tcccgatcgt tacaggcggt 180 actcctcaaa gcgtactaaa gaattattct tttacatttc agtggctacc agaagatact 240 acctgggagc cgtcgaactg agctgggatt acatgcagtc tgacctggga gagctgcccg 300 tggacgctag attcccacct agagtcccta agtccttccc cttcaacacc agcgtggtct 360 acaagaaaac cctgttcgtg gagtttaccg accacctgtt caacatcgct aagcctagac 420 caccatggat gggactgctg ggaccaacca tccaggccga ggtgtacgac accgtggtca 480 tcaccctgaa aaacatggct tctcaccccg tgtccctgca tgctgtgggc gtctcctact 540 ggaaggccag cgaaggggct gagtatgacg atcagaccag ccagcgggaa aaagaggacg 600 ataaggtgtt ccctggcggg tcccatacct acgtgtggca ggtcctgaag gagaatggac 660 caatggcttc cgaccctctg tgcctgacct actcttatct gtcccacgtg gacctggtca 720 aggatctgaa cagcggcctg atcggggctc tgctggtgtg tcgcgaaggg tccctggcca 780 aggagaaaac ccagaccctg cataagttca tcctgctgtt cgccgtgttt gacgaaggaa 840 aaagctggca ctctgagacc aagaactctc tgatgcagga cagggatgcc gcttccgcca 900 gagcttggcc caagatgcac accgtgaacg gctacgtcaa taggagcctg cctggactga 960 tcggctgcca cagaaagtcc gtgtattggc atgtcatcgg aatgggcacc acccctgaag 1020 tgcacagcat cttcctggag gggcatacct ttctggtccg caaccaccgg caggctagcc 1080 tggagatctc tccaatcacc ttcctgaccg cccagaccct gctgatggac ctgggacagt 1140 tcctgctgtt ttgccacatc tccagccacc agcatgatgg catggaggct tacgtgaaag 1200 tcgactcctg tcccgaggaa cctcagctga ggatgaagaa caatgaggaa gccgaagact 1260 atgacgatga cctgaccgac agcgagatgg atgtggtccg cttcgatgac gataactctc 1320 cctcctttat ccagatccgg tccgtggcca agaaacaccc taagacctgg gtccattaca 1380 tcgccgctga ggaagaggac tgggattatg ctccactggt gctggccccc gacgatagat 1440 cctacaaaag ccagtatctg aacaatggac cccagaggat cggcagaaag tacaagaaag 1500 tgaggttcat ggcttatacc gatgagacct ttaagaccag agaagccatc cagcacgagt 1560 ccgggatcct gggacctctg ctgtacggcg aagtggggga caccctgctg atcatcttca 1620 agaaccaggc cagcaggcct tacaatatct atccacatgg catcaccgat gtgagacctc 1680 tgtactcccg ccggctgcca aagggcgtga aacacctgaa ggacttccca atcctgcccg 1740 gggaaatctt taagtataaa tggaccgtca ccgtcgagga tgggcccacc aagagcgacc 1800 ctaggtgcct gaccagatac tattcttcct tcgtgaatat ggagagagac ctggcttccg 1860 gactgatcgg acccctgctg atctgttaca aagagagcgt ggatcagcgc ggcaaccaga 1920 tcatgtctga caagcggaat gtgatcctgt tcagcgtctt tgacgaaaac cgctcttggt 1980 acctgaccga gaacatccag cggttcctgc ctaatccagc tggagtgcag ctggaagatc 2040 ccgagttcca ggcctctaac atcatgcatt ccatcaatgg ctacgtgttc gactccctgc 2100 agctgagcgt gtgcctgcac gaggtcgctt actggtatat cctgagcatc ggagcccaga 2160 ccgatttcct gtctgtgttc ttttccggct acacctttaa gcataaaatg gtgtatgagg 2220 acaccctgac cctgttccca ttttccggcg aaaccgtgtt catgagcatg gagaatcccg 2280 ggctgtggat cctgggatgc cacaactccg atttcaggaa tagagggatg accgccctgc 2340 tgaaagtgag ctcttgtgac aagaacaccg gagactacta tgaagatagc tacgaggaca 2400 tctctgctta tctgctgtcc aaaaacaatg ccatcgagcc caggagcttc tctcagaacc 2460 ctccagtgct gaagcgccac cagcgggaga tcaccagaac caccctgcag agcgatcagg 2520 aagagatcga ctacgacgat accatctccg tggaaatgaa gaaagaggac ttcgatatct 2580 atgacgaaga tgagaaccag tctcccaggt ccttccagaa gaaaaccaga cattacttta 2640 tcgccgctgt ggagcggctg tgggactatg gcatgtccag ctctcctcac gtgctgagaa 2700 atagagctca gtccggaagc gtcccacagt tcaagaaagt ggtcttccag gagtttaccg 2760 acggaagctt tacccagcca ctgtaccgcg gcgaactgaa cgagcacctg gggctgctgg 2820 gaccctatat ccgggctgaa gtggaggata acatcatggt caccttcagg aatcaggcca 2880 gcagacccta ctctttttat tccagcctga tctcctacga agaggaccag agacagggag 2940 ctgaaccaag aaaaaacttc gtgaagccta atgagaccaa aacctacttt tggaaggtgc 3000 agcaccatat ggcccctacc aaagacgagt tcgattgcaa ggcctgggct tattttagcg 3060 acgtggatct ggagaaggac gtccactccg gcctgatcgg gccactgctg gtgtgtcata 3120 ccaacaccct gaatccagct cacggaaggc aggtgaccgt ccaggaattc gccctgttct 3180 ttaccatctt tgatgagacc aagagctggt acttcaccga aaacatggag aggaattgca 3240 gagccccatg taacatccag atggaagacc ccaccttcaa ggagaactac agatttcatg 3300 ctatcaatgg gtatatcatg gataccctgc caggactggt catggctcag gaccagagga 3360 tcagatggta cctgctgagc atggggtcta acgagaatat ccactccatc catttcagcg 3420 gacacgtgtt taccgtccgc aagaaagaag agtacaagat ggccctgtac aacctgtatc 3480 ccggcgtgtt cgaaaccgtc gagatgctgc cttccaaggc tgggatctgg cgggtggaat 3540 gcctgatcgg ggagcacctg catgccggaa tgtctaccct gttcctggtg tactccaata 3600 agtgtcagac ccccctgggg atggctagcg gacatatccg cgacttccag atcaccgctt 3660 ccggacagta cggacagtgg gctcctaagc tggctagact gcactattct ggctccatca 3720 acgcttggtc taccaaagag cctttctcct ggatcaaggt ggacctgctg gctccaatga 3780 tcatccatgg catcaaaacc cagggggcca ggcagaagtt ctcttccctg tacatcagcc 3840 agtttatcat catgtattct ctggatggga agaaatggca gacctacaga ggcaattcca 3900 ccgggaccct gatggtgttc tttggcaacg tcgacagctc tgggatcaag cacaacatct 3960 tcaatccccc tatcatcgcc cgctacatcc ggctgcaccc aacccattat tccatccgca 4020 gcaccctgcg gatggagctg atggggtgcg atctgaacag ctgttctatg cccctgggaa 4080 tggagtctaa ggccatctcc gacgctcaga tcaccgcctc cagctacttc accaatatgt 4140 ttgctacctg gtccccaagc aaggctagac tgcatctgca gggaagaagc aacgcttgga 4200 gaccacaggt gaacaatccc aaggagtggc tgcaggtcga cttccagaaa accatgaagg 4260 tgaccggagt caccacccag ggcgtgaaaa gcctgctgac ctctatgtac gtcaaggagt 4320 tcctgatctc ttccagccag gacgggcacc agtggaccct gttctttcag aacggaaagg 4380 tgaaagtctt ccagggcaat caggattcct ttacccctgt ggtcaacagc ctggacccac 4440 ccctgctgac caggtacctg agaatccacc cacagtcctg ggtgcatcag atcgctctga 4500 ggatggaagt cctgggctgc gaggcccagg acctgtattg atcgcgaata aaagatcttt 4560 attttcatta gatctgtgtg ttggtttttt gtgtggatct gccagttccc gatcgttaca 4620 ggcaattgcc ttaggccgca ggaaccccta gtgatggagt tggccactcc ctctctgcgc 4680 gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 4740 gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 4780 <210> 324 <211> 4442 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1003 <400> 324 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggctaccaga agatactacc tgggagccgt cgaactgagc tgggattaca 120 tgcagtctga cctgggagag ctgcccgtgg acgctagatt cccacctaga gtccctaagt 180 ccttcccctt caacaccagc gtggtctaca agaaaaccct gttcgtggag tttaccgacc 240 acctgttcaa catcgctaag cctagaccac catggatggg actgctggga ccaaccatcc 300 aggccgaggt gtacgacacc gtggtcatca ccctgaaaaa catggcttct caccccgtgt 360 ccctgcatgc tgtgggcgtc tcctactgga aggccagcga aggggctgag tatgacgatc 420 agaccagcca gcgggaaaaa gaggacgata aggtgttccc tggcgggtcc catacctacg 480 tgtggcaggt cctgaaggag aatggaccaa tggcttccga ccctctgtgc ctgacctact 540 cttatctgtc ccacgtggac ctggtcaagg atctgaacag cggcctgatc ggggctctgc 600 tggtgtgtcg cgaagggtcc ctggccaagg agaaaaccca gaccctgcat aagttcatcc 660 tgctgttcgc cgtgtttgac gaaggaaaaa gctggcactc tgagaccaag aactctctga 720 tgcaggacag ggatgccgct tccgccagag cttggcccaa gatgcacacc gtgaacggct 780 acgtcaatag gagcctgcct ggactgatcg gctgccacag aaagtccgtg tattggcatg 840 tcatcggaat gggcaccacc cctgaagtgc acagcatctt cctggagggg catacctttc 900 tggtccgcaa ccaccggcag gctagcctgg agatctctcc aatcaccttc ctgaccgccc 960 agaccctgct gatggacctg ggacagttcc tgctgttttg ccacatctcc agccaccagc 1020 atgatggcat ggaggcttac gtgaaagtcg actcctgtcc cgaggaacct cagctgagga 1080 tgaagaacaa tgaggaagcc gaagactatg acgatgacct gaccgacagc gagatggatg 1140 tggtccgctt cgatgacgat aactctccct cctttatcca gatccggtcc gtggccaaga 1200 aacaccctaa gacctgggtc cattacatcg ccgctgagga agaggactgg gattatgctc 1260 cactggtgct ggcccccgac gatagatcct acaaaagcca gtatctgaac aatggacccc 1320 agaggatcgg cagaaagtac aagaaagtga ggttcatggc ttataccgat gagaccttta 1380 agaccagaga agccatccag cacgagtccg ggatcctggg acctctgctg tacggcgaag 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccttac aatatctatc 1500 cacatggcat caccgatgtg agacctctgt actcccgccg gctgccaaag ggcgtgaaac 1560 acctgaagga cttcccaatc ctgcccgggg aaatctttaa gtataaatgg accgtcaccg 1620 tcgaggatgg gcccaccaag agcgacccta ggtgcctgac cagatactat tcttccttcg 1680 tgaatatgga gagagacctg gcttccggac tgatcggacc cctgctgatc tgttacaaag 1740 agagcgtgga tcagcgcggc aaccagatca tgtctgacaa gcggaatgtg atcctgttca 1800 gcgtctttga cgaaaaccgc tcttggtacc tgaccgagaa catccagcgg ttcctgccta 1860 atccagctgg agtgcagctg gaagatcccg agttccaggc ctctaacatc atgcattcca 1920 tcaatggcta cgtgttcgac tccctgcagc tgagcgtgtg cctgcacgag gtcgcttact 1980 ggtatatcct gagcatcgga gcccagaccg atttcctgtc tgtgttcttt tccggctaca 2040 cctttaagca taaaatggtg tatgaggaca ccctgaccct gttcccattt tccggcgaaa 2100 ccgtgttcat gagcatggag aatcccgggc tgtggatcct gggatgccac aactccgatt 2160 tcaggaatag agggatgacc gccctgctga aagtgagctc ttgtgacaag aacaccggag 2220 actactatga agatagctac gaggacatct ctgcttatct gctgtccaaa aacaatgcca 2280 tcgagcccag gagcttctct cagaaccctc cagtgctgaa gcgccaccag cgggagatca 2340 ccagaaccac cctgcagagc gatcaggaag agatcgacta cgacgatacc atctccgtgg 2400 aaatgaagaa agaggacttc gatatctatg acgaagatga gaaccagtct cccaggtcct 2460 tccagaagaa aaccagacat tactttatcg ccgctgtgga gcggctgtgg gactatggca 2520 tgtccagctc tcctcacgtg ctgagaaata gagctcagtc cggaagcgtc ccacagttca 2580 agaaagtggt cttccaggag tttaccgacg gaagctttac ccagccactg taccgcggcg 2640 aactgaacga gcacctgggg ctgctgggac cctatatccg ggctgaagtg gaggataaca 2700 tcatggtcac cttcaggaat caggccagca gaccctactc tttttattcc agcctgatct 2760 cctacgaaga ggaccagaga cagggagctg aaccaagaaa aaacttcgtg aagcctaatg 2820 agaccaaaac ctacttttgg aaggtgcagc accatatggc ccctaccaaa gacgagttcg 2880 attgcaaggc ctgggcttat tttagcgacg tggatctgga gaaggacgtc cactccggcc 2940 tgatcgggcc actgctggtg tgtcatacca acaccctgaa tccagctcac ggaaggcagg 3000 tgaccgtcca ggaattcgcc ctgttcttta ccatctttga tgagaccaag agctggtact 3060 tcaccgaaaa catggagagg aattgcagag ccccatgtaa catccagatg gaagacccca 3120 ccttcaagga gaactacaga tttcatgcta tcaatgggta tatcatggat accctgccag 3180 gactggtcat ggctcaggac cagaggatca gatggtacct gctgagcatg gggtctaacg 3240 agaatatcca ctccatccat ttcagcggac acgtgtttac cgtccgcaag aaagaagagt 3300 acaagatggc cctgtacaac ctgtatcccg gcgtgttcga aaccgtcgag atgctgcctt 3360 ccaaggctgg gatctggcgg gtggaatgcc tgatcgggga gcacctgcat gccggaatgt 3420 ctaccctgtt cctggtgtac tccaataagt gtcagacccc cctggggatg gctagcggac 3480 atatccgcga cttccagatc accgcttccg gacagtacgg acagtgggct cctaagctgg 3540 ctagactgca ctattctggc tccatcaacg cttggtctac caaagagcct ttctcctgga 3600 tcaaggtgga cctgctggct ccaatgatca tccatggcat caaaacccag ggggccaggc 3660 agaagttctc ttccctgtac atcagccagt ttatcatcat gtattctctg gatgggaaga 3720 aatggcagac ctacagaggc aattccaccg ggaccctgat ggtgttcttt ggcaacgtcg 3780 acagctctgg gatcaagcac aacatcttca atccccctat catcgcccgc tacatccggc 3840 tgcacccaac ccattattcc atccgcagca ccctgcggat ggagctgatg gggtgcgatc 3900 tgaacagctg ttctatgccc ctgggaatgg agtctaaggc catctccgac gctcagatca 3960 ccgcctccag ctacttcacc aatatgtttg ctacctggtc cccaagcaag gctagactgc 4020 atctgcaggg aagaagcaac gcttggagac cacaggtgaa caatcccaag gagtggctgc 4080 aggtcgactt ccagaaaacc atgaaggtga ccggagtcac cacccagggc gtgaaaagcc 4140 tgctgacctc tatgtacgtc aaggagttcc tgatctcttc cagccaggac gggcaccagt 4200 ggaccctgtt ctttcagaac ggaaaggtga aagtcttcca gggcaatcag gattccttta 4260 cccctgtggt caacagcctg gacccacccc tgctgaccag gtacctgaga atccacccac 4320 agtcctgggt gcatcagatc gctctgagga tggaagtcct gggctgcgag gcccaggacc 4380 tgtattgatc gcgaataaaa gatctttatt ttcattagat ctgtgtgttg gttttttgtg 4440 tg 4442 <210> 325 <211> 4493 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1006 <400> 325 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacaccaa tgtgtctccc ccagtgctga agaggcacca gagggagatc accaggacca 2400 ccctgcagtc tgaccaggag gagattgact atgatgacac catctctgtg gagatgaaga 2460 aggaggactt tgacatctac gacgaggacg agaaccagag ccccaggagc ttccagaaga 2520 agaccaggca ctacttcatt gctgctgtgg agaggctgtg ggactatggc atgagcagca 2580 gcccccatgt gctgaggaac agggcccagt ctggctctgt gccccagttc aagaaggtgg 2640 tgttccagga gttcactgat ggcagcttca cccagcccct gtacagaggg gagctgaatg 2700 agcacctggg cctgctgggc ccctacatca gggctgaggt ggaggacaac atcatggtga 2760 ccttcaggaa ccaggccagc aggccctaca gcttctacag cagcctgatc agctatgagg 2820 aggaccagag gcagggggct gagcccagga agaactttgt gaagcccaat gaaaccaaga 2880 cctacttctg gaaggtgcag caccacatgg cccccaccaa ggatgagttt gactgcaagg 2940 cctgggccta cttctctgat gtggacctgg agaaggatgt gcactctggc ctgattggcc 3000 ccctgctggt gtgccacacc aacaccctga accctgccca tggcaggcag gtgactgtgc 3060 aggagtttgc cctgttcttc accatctttg atgaaaccaa gagctggtac ttcactgaga 3120 acatggagag gaactgcagg gccccctgca acatccagat ggaggacccc accttcaagg 3180 agaactacag gttccatgcc atcaatggct acatcatgga caccctgcct ggcctggtga 3240 tggcccagga ccagaggatc aggtggtacc tgctgagcat gggcagcaat gagaacatcc 3300 acagcatcca cttctctggc catgtgttca ctgtgaggaa gaaggaggag tacaagatgg 3360 ccctgtacaa cctgtaccct ggggtgtttg agactgtgga gatgctgccc agcaaggctg 3420 gcatctggag ggtggagtgc ctgattgggg agcacctgca tgctggcatg agcaccctgt 3480 tcctggtgta cagcaacaag tgccagaccc ccctgggcat ggcctctggc cacatcaggg 3540 acttccagat cactgcctct ggccagtatg gccagtgggc ccccaagctg gccaggctgc 3600 actactctgg cagcatcaat gcctggagca ccaaggagcc cttcagctgg atcaaggtgg 3660 acctgctggc ccccatgatc atccatggca tcaagaccca gggggccagg cagaagttca 3720 gcagcctgta catcagccag ttcatcatca tgtacagcct ggatggcaag aagtggcaga 3780 cctacagggg caacagcact ggcaccctga tggtgttctt tggcaatgtg gacagctctg 3840 gcatcaagca caacatcttc aaccccccca tcattgccag atacatcagg ctgcacccca 3900 cccactacag catcaggagc accctgagga tggagctgat gggctgtgac ctgaacagct 3960 gcagcatgcc cctgggcatg gagagcaagg ccatctctga tgcccagatc actgccagca 4020 gctacttcac caacatgttt gccacctgga gccccagcaa ggccaggctg cacctgcagg 4080 gcaggagcaa tgcctggagg ccccaggtca acaaccccaa ggagtggctg caggtggact 4140 tccagaagac catgaaggtg actggggtga ccacccaggg ggtgaagagc ctgctgacca 4200 gcatgtatgt gaaggagttc ctgatcagca gcagccagga tggccaccag tggaccctgt 4260 tcttccagaa tggcaaggtg aaggtgttcc agggcaacca ggacagcttc acccctgtgg 4320 tgaacagcct ggaccccccc ctgctgacca gatacctgag gattcacccc cagagctggg 4380 tgcaccagat tgccctgagg atggaggtgc tgggctgtga ggcccaggac ctgtactgat 4440 cgcgaataaa agatctttat tttcattaga tctgtgtgtt ggttttttgt gtg 4493 <210> 326 <211> 4484 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1007 <400> 326 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagccc cccagtgctg aagaggcacc agagggagat caccaggacc accctgcagt 2400 ctgaccagga ggagattgac tatgatgaca ccatctctgt ggagatgaag aaggaggact 2460 ttgacatcta cgacgaggac gagaaccaga gccccaggag cttccagaag aagaccaggc 2520 actacttcat tgctgctgtg gagaggctgt gggactatgg catgagcagc agcccccatg 2580 tgctgaggaa cagggcccag tctggctctg tgccccagtt caagaaggtg gtgttccagg 2640 agttcactga tggcagcttc acccagcccc tgtacagagg ggagctgaat gagcacctgg 2700 gcctgctggg cccctacatc agggctgagg tggaggacaa catcatggtg accttcagga 2760 accaggccag caggccctac agcttctaca gcagcctgat cagctatgag gaggaccaga 2820 ggcagggggc tgagcccagg aagaactttg tgaagcccaa tgaaaccaag acctacttct 2880 ggaaggtgca gcaccacatg gcccccacca aggatgagtt tgactgcaag gcctgggcct 2940 acttctctga tgtggacctg gagaaggatg tgcactctgg cctgattggc cccctgctgg 3000 tgtgccacac caacaccctg aaccctgccc atggcaggca ggtgactgtg caggagtttg 3060 ccctgttctt caccatcttt gatgaaacca agagctggta cttcactgag aacatggaga 3120 ggaactgcag ggccccctgc aacatccaga tggaggaccc caccttcaag gagaactaca 3180 ggttccatgc catcaatggc tacatcatgg acaccctgcc tggcctggtg atggcccagg 3240 accagaggat caggtggtac ctgctgagca tgggcagcaa tgagaacatc cacagcatcc 3300 acttctctgg ccatgtgttc actgtgagga agaaggagga gtacaagatg gccctgtaca 3360 acctgtaccc tggggtgttt gagactgtgg agatgctgcc cagcaaggct ggcatctgga 3420 gggtggagtg cctgattggg gagcacctgc atgctggcat gagcaccctg ttcctggtgt 3480 acagcaacaa gtgccagacc cccctgggca tggcctctgg ccacatcagg gacttccaga 3540 tcactgcctc tggccagtat ggccagtggg cccccaagct ggccaggctg cactactctg 3600 gcagcatcaa tgcctggagc accaaggagc ccttcagctg gatcaaggtg gacctgctgg 3660 cccccatgat catccatggc atcaagaccc agggggccag gcagaagttc agcagcctgt 3720 acatcagcca gttcatcatc atgtacagcc tggatggcaa gaagtggcag acctacaggg 3780 gcaacagcac tggcaccctg atggtgttct ttggcaatgt ggacagctct ggcatcaagc 3840 acaacatctt caaccccccc atcattgcca gatacatcag gctgcacccc acccactaca 3900 gcatcaggag caccctgagg atggagctga tgggctgtga cctgaacagc tgcagcatgc 3960 ccctgggcat ggagagcaag gccatctctg atgcccagat cactgccagc agctacttca 4020 ccaacatgtt tgccacctgg agccccagca aggccaggct gcacctgcag ggcaggagca 4080 atgcctggag gccccaggtc aacaacccca aggagtggct gcaggtggac ttccagaaga 4140 ccatgaaggt gactggggtg accacccagg gggtgaagag cctgctgacc agcatgtatg 4200 tgaaggagtt cctgatcagc agcagccagg atggccacca gtggaccctg ttcttccaga 4260 atggcaaggt gaaggtgttc cagggcaacc aggacagctt cacccctgtg gtgaacagcc 4320 tggacccccc cctgctgacc agatacctga ggattcaccc ccagagctgg gtgcaccaga 4380 ttgccctgag gatggaggtg ctgggctgtg aggcccagga cctgtactga tcgcgaataa 4440 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtg 4484 <210> 327 <211> 4502 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1008 <400> 327 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagcaa tgtgtctaac aagactcccc cagtgctgaa gaggcaccag agggagatca 2400 ccaggaccac cctgcagtct gaccaggagg agattgacta tgatgacacc atctctgtgg 2460 agatgaagaa ggaggacttt gacatctacg acgaggacga gaaccagagc cccaggagct 2520 tccagaagaa gaccaggcac tacttcattg ctgctgtgga gaggctgtgg gactatggca 2580 tgagcagcag cccccatgtg ctgaggaaca gggcccagtc tggctctgtg ccccagttca 2640 agaaggtggt gttccaggag ttcactgatg gcagcttcac ccagcccctg tacagagggg 2700 agctgaatga gcacctgggc ctgctgggcc cctacatcag ggctgaggtg gaggacaaca 2760 tcatggtgac cttcaggaac caggccagca ggccctacag cttctacagc agcctgatca 2820 gctatgagga ggaccagagg cagggggctg agcccaggaa gaactttgtg aagcccaatg 2880 aaaccaagac ctacttctgg aaggtgcagc accacatggc ccccaccaag gatgagtttg 2940 actgcaaggc ctgggcctac ttctctgatg tggacctgga gaaggatgtg cactctggcc 3000 tgattggccc cctgctggtg tgccacacca acaccctgaa ccctgcccat ggcaggcagg 3060 tgactgtgca ggagtttgcc ctgttcttca ccatctttga tgaaaccaag agctggtact 3120 tcactgagaa catggagagg aactgcaggg ccccctgcaa catccagatg gaggacccca 3180 ccttcaagga gaactacagg ttccatgcca tcaatggcta catcatggac accctgcctg 3240 gcctggtgat ggcccaggac cagaggatca ggtggtacct gctgagcatg ggcagcaatg 3300 agaacatcca cagcatccac ttctctggcc atgtgttcac tgtgaggaag aaggaggagt 3360 acaagatggc cctgtacaac ctgtaccctg gggtgtttga gactgtggag atgctgccca 3420 gcaaggctgg catctggagg gtggagtgcc tgattgggga gcacctgcat gctggcatga 3480 gcaccctgtt cctggtgtac agcaacaagt gccagacccc cctgggcatg gcctctggcc 3540 acatcaggga cttccagatc actgcctctg gccagtatgg ccagtgggcc cccaagctgg 3600 ccaggctgca ctactctggc agcatcaatg cctggagcac caaggagccc ttcagctgga 3660 tcaaggtgga cctgctggcc cccatgatca tccatggcat caagacccag ggggccaggc 3720 agaagttcag cagcctgtac atcagccagt tcatcatcat gtacagcctg gatggcaaga 3780 agtggcagac ctacaggggc aacagcactg gcaccctgat ggtgttcttt ggcaatgtgg 3840 acagctctgg catcaagcac aacatcttca acccccccat cattgccaga tacatcaggc 3900 tgcaccccac ccactacagc atcaggagca ccctgaggat ggagctgatg ggctgtgacc 3960 tgaacagctg cagcatgccc ctgggcatgg agagcaaggc catctctgat gcccagatca 4020 ctgccagcag ctacttcacc aacatgtttg ccacctggag ccccagcaag gccaggctgc 4080 acctgcaggg caggagcaat gcctggaggc cccaggtcaa caaccccaag gagtggctgc 4140 aggtggactt ccagaagacc atgaaggtga ctggggtgac cacccagggg gtgaagagcc 4200 tgctgaccag catgtatgtg aaggagttcc tgatcagcag cagccaggat ggccaccagt 4260 ggaccctgtt cttccagaat ggcaaggtga aggtgttcca gggcaaccag gacagcttca 4320 cccctgtggt gaacagcctg gacccccccc tgctgaccag atacctgagg attcaccccc 4380 agagctgggt gcaccagatt gccctgagga tggaggtgct gggctgtgag gcccaggacc 4440 tgtactgatc gcgaataaaa gatctttatt ttcattagat ctgtgtgttg gttttttgtg 4500 tg 4502 <210> 328 <211> 4511 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1015 <400> 328 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagcaa tgtgtctaac aagactaaca atagcccccc agtgctgaag aggcaccaga 2400 gggagatcac caggaccacc ctgcagtctg accaggagga gattgactat gatgacacca 2460 tctctgtgga gatgaagaag gaggactttg acatctacga cgaggacgag aaccagagcc 2520 ccaggagctt ccagaagaag accaggcact acttcattgc tgctgtggag aggctgtggg 2580 actatggcat gagcagcagc ccccatgtgc tgaggaacag ggcccagtct ggctctgtgc 2640 cccagttcaa gaaggtggtg ttccaggagt tcactgatgg cagcttcacc cagcccctgt 2700 acagagggga gctgaatgag cacctgggcc tgctgggccc ctacatcagg gctgaggtgg 2760 aggacaacat catggtgacc ttcaggaacc aggccagcag gccctacagc ttctacagca 2820 gcctgatcag ctatgaggag gaccagaggc agggggctga gcccaggaag aactttgtga 2880 agcccaatga aaccaagacc tacttctgga aggtgcagca ccacatggcc cccaccaagg 2940 atgagtttga ctgcaaggcc tgggcctact tctctgatgt ggacctggag aaggatgtgc 3000 actctggcct gattggcccc ctgctggtgt gccacaccaa caccctgaac cctgcccatg 3060 gcaggcaggt gactgtgcag gagtttgccc tgttcttcac catctttgat gaaaccaaga 3120 gctggtactt cactgagaac atggagagga actgcagggc cccctgcaac atccagatgg 3180 aggaccccac cttcaaggag aactacaggt tccatgccat caatggctac atcatggaca 3240 ccctgcctgg cctggtgatg gcccaggacc agaggatcag gtggtacctg ctgagcatgg 3300 gcagcaatga gaacatccac agcatccact tctctggcca tgtgttcact gtgaggaaga 3360 aggaggagta caagatggcc ctgtacaacc tgtaccctgg ggtgtttgag actgtggaga 3420 tgctgcccag caaggctggc atctggaggg tggagtgcct gattggggag cacctgcatg 3480 ctggcatgag caccctgttc ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg 3540 cctctggcca catcagggac ttccagatca ctgcctctgg ccagtatggc cagtgggccc 3600 ccaagctggc caggctgcac tactctggca gcatcaatgc ctggagcacc aaggagccct 3660 tcagctggat caaggtggac ctgctggccc ccatgatcat ccatggcatc aagacccagg 3720 gggccaggca gaagttcagc agcctgtaca tcagccagtt catcatcatg tacagcctgg 3780 atggcaagaa gtggcagacc tacaggggca acagcactgg caccctgatg gtgttctttg 3840 gcaatgtgga cagctctggc atcaagcaca acatcttcaa cccccccatc attgccagat 3900 acatcaggct gcaccccacc cactacagca tcaggagcac cctgaggatg gagctgatgg 3960 gctgtgacct gaacagctgc agcatgcccc tgggcatgga gagcaaggcc atctctgatg 4020 cccagatcac tgccagcagc tacttcacca acatgtttgc cacctggagc cccagcaagg 4080 ccaggctgca cctgcagggc aggagcaatg cctggaggcc ccaggtcaac aaccccaagg 4140 agtggctgca ggtggacttc cagaagacca tgaaggtgac tggggtgacc acccaggggg 4200 tgaagagcct gctgaccagc atgtatgtga aggagttcct gatcagcagc agccaggatg 4260 gccaccagtg gaccctgttc ttccagaatg gcaaggtgaa ggtgttccag ggcaaccagg 4320 acagcttcac ccctgtggtg aacagcctgg acccccccct gctgaccaga tacctgagga 4380 ttcaccccca gagctgggtg caccagattg ccctgaggat ggaggtgctg ggctgtgagg 4440 cccaggacct gtactgatcg cgaataaaag atctttattt tcattagatc tgtgtgttgg 4500 ttttttgtgt g 4511 <210> 329 <211> 4520 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1016 <400> 329 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagcaa tgtgtctaac aagactaaca atagcaatgc caccccccca gtgctgaaga 2400 ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag attgactatg 2460 atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac gaggacgaga 2520 accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct gctgtggaga 2580 ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg gcccagtctg 2640 gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc agcttcaccc 2700 agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc tacatcaggg 2760 ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg ccctacagct 2820 tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag cccaggaaga 2880 actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac cacatggccc 2940 ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg gacctggaga 3000 aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac accctgaacc 3060 ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc atctttgatg 3120 aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc ccctgcaaca 3180 tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc aatggctaca 3240 tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg tggtacctgc 3300 tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat gtgttcactg 3360 tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg gtgtttgaga 3420 ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg attggggagc 3480 acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc cagacccccc 3540 tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc cagtatggcc 3600 agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc tggagcacca 3660 aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc catggcatca 3720 agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc atcatcatgt 3780 acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc accctgatgg 3840 tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac ccccccatca 3900 ttgccagata catcaggctg caccccaccc actacagcat caggagcacc ctgaggatgg 3960 agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag agcaaggcca 4020 tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc acctggagcc 4080 ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc caggtcaaca 4140 accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact ggggtgacca 4200 cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg atcagcagca 4260 gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag gtgttccagg 4320 gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg ctgaccagat 4380 acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg gaggtgctgg 4440 gctgtgaggc ccaggacctg tactgatcgc gaataaaaga tctttatttt cattagatct 4500 gtgtgttggt tttttgtgtg 4520 <210> 330 <211> 4475 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1017 <400> 330 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagcc 2340 ccccagtgct gaagaggcac cagagggaga tcaccaggac caccctgcag tctgaccagg 2400 aggagattga ctatgatgac accatctctg tggagatgaa gaaggaggac tttgacatct 2460 acgacgagga cgagaaccag agccccagga gcttccagaa gaagaccagg cactacttca 2520 ttgctgctgt ggagaggctg tgggactatg gcatgagcag cagcccccat gtgctgagga 2580 acagggccca gtctggctct gtgccccagt tcaagaaggt ggtgttccag gagttcactg 2640 atggcagctt cacccagccc ctgtacagag gggagctgaa tgagcacctg ggcctgctgg 2700 gcccctacat cagggctgag gtggaggaca acatcatggt gaccttcagg aaccaggcca 2760 gcaggcccta cagcttctac agcagcctga tcagctatga ggaggaccag aggcaggggg 2820 ctgagcccag gaagaacttt gtgaagccca atgaaaccaa gacctacttc tggaaggtgc 2880 agcaccacat ggcccccacc aaggatgagt ttgactgcaa ggcctgggcc tacttctctg 2940 atgtggacct ggagaaggat gtgcactctg gcctgattgg ccccctgctg gtgtgccaca 3000 ccaacaccct gaaccctgcc catggcaggc aggtgactgt gcaggagttt gccctgttct 3060 tcaccatctt tgatgaaacc aagagctggt acttcactga gaacatggag aggaactgca 3120 gggccccctg caacatccag atggaggacc ccaccttcaa ggagaactac aggttccatg 3180 ccatcaatgg ctacatcatg gacaccctgc ctggcctggt gatggcccag gaccagagga 3240 tcaggtggta cctgctgagc atgggcagca atgagaacat ccacagcatc cacttctctg 3300 gccatgtgtt cactgtgagg aagaaggagg agtacaagat ggccctgtac aacctgtacc 3360 ctggggtgtt tgagactgtg gagatgctgc ccagcaaggc tggcatctgg agggtggagt 3420 gcctgattgg ggagcacctg catgctggca tgagcaccct gttcctggtg tacagcaaca 3480 agtgccagac ccccctgggc atggcctctg gccacatcag ggacttccag atcactgcct 3540 ctggccagta tggccagtgg gcccccaagc tggccaggct gcactactct ggcagcatca 3600 atgcctggag caccaaggag cccttcagct ggatcaaggt ggacctgctg gcccccatga 3660 tcatccatgg catcaagacc cagggggcca ggcagaagtt cagcagcctg tacatcagcc 3720 agttcatcat catgtacagc ctggatggca agaagtggca gacctacagg ggcaacagca 3780 ctggcaccct gatggtgttc tttggcaatg tggacagctc tggcatcaag cacaacatct 3840 tcaacccccc catcattgcc agatacatca ggctgcaccc cacccactac agcatcagga 3900 gcaccctgag gatggagctg atgggctgtg acctgaacag ctgcagcatg cccctgggca 3960 tggagagcaa ggccatctct gatgcccaga tcactgccag cagctacttc accaacatgt 4020 ttgccacctg gagccccagc aaggccaggc tgcacctgca gggcaggagc aatgcctgga 4080 ggccccaggt caacaacccc aaggagtggc tgcaggtgga cttccagaag accatgaagg 4140 tgactggggt gaccacccag ggggtgaaga gcctgctgac cagcatgtat gtgaaggagt 4200 tcctgatcag cagcagccag gatggccacc agtggaccct gttcttccag aatggcaagg 4260 tgaaggtgtt ccagggcaac caggacagct tcacccctgt ggtgaacagc ctggaccccc 4320 ccctgctgac cagatacctg aggattcacc cccagagctg ggtgcaccag attgccctga 4380 ggatggaggt gctgggctgt gaggcccagg acctgtactg atcgcgaata aaagatcttt 4440 attttcatta gatctgtgtg ttggtttttt gtgtg 4475 <210> 331 <211> 4466 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1018 <400> 331 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc cccccagtgc 2340 tgaagaggca ccagagggag atcaccagga ccaccctgca gtctgaccag gaggagattg 2400 actatgatga caccatctct gtggagatga agaaggagga ctttgacatc tacgacgagg 2460 acgagaacca gagccccagg agcttccaga agaagaccag gcactacttc attgctgctg 2520 tggagaggct gtgggactat ggcatgagca gcagccccca tgtgctgagg aacagggccc 2580 agtctggctc tgtgccccag ttcaagaagg tggtgttcca ggagttcact gatggcagct 2640 tcacccagcc cctgtacaga ggggagctga atgagcacct gggcctgctg ggcccctaca 2700 tcagggctga ggtggaggac aacatcatgg tgaccttcag gaaccaggcc agcaggccct 2760 acagcttcta cagcagcctg atcagctatg aggaggacca gaggcagggg gctgagccca 2820 ggaagaactt tgtgaagccc aatgaaacca agacctactt ctggaaggtg cagcaccaca 2880 tggcccccac caaggatgag tttgactgca aggcctgggc ctacttctct gatgtggacc 2940 tggagaagga tgtgcactct ggcctgattg gccccctgct ggtgtgccac accaacaccc 3000 tgaaccctgc ccatggcagg caggtgactg tgcaggagtt tgccctgttc ttcaccatct 3060 ttgatgaaac caagagctgg tacttcactg agaacatgga gaggaactgc agggccccct 3120 gcaacatcca gatggaggac cccaccttca aggagaacta caggttccat gccatcaatg 3180 gctacatcat ggacaccctg cctggcctgg tgatggccca ggaccagagg atcaggtggt 3240 acctgctgag catgggcagc aatgagaaca tccacagcat ccacttctct ggccatgtgt 3300 tcactgtgag gaagaaggag gagtacaaga tggccctgta caacctgtac cctggggtgt 3360 ttgagactgt ggagatgctg cccagcaagg ctggcatctg gagggtggag tgcctgattg 3420 gggagcacct gcatgctggc atgagcaccc tgttcctggt gtacagcaac aagtgccaga 3480 cccccctggg catggcctct ggccacatca gggacttcca gatcactgcc tctggccagt 3540 atggccagtg ggcccccaag ctggccaggc tgcactactc tggcagcatc aatgcctgga 3600 gcaccaagga gcccttcagc tggatcaagg tggacctgct ggcccccatg atcatccatg 3660 gcatcaagac ccagggggcc aggcagaagt tcagcagcct gtacatcagc cagttcatca 3720 tcatgtacag cctggatggc aagaagtggc agacctacag gggcaacagc actggcaccc 3780 tgatggtgtt ctttggcaat gtggacagct ctggcatcaa gcacaacatc ttcaaccccc 3840 ccatcattgc cagatacatc aggctgcacc ccacccacta cagcatcagg agcaccctga 3900 ggatggagct gatgggctgt gacctgaaca gctgcagcat gcccctgggc atggagagca 3960 aggccatctc tgatgcccag atcactgcca gcagctactt caccaacatg tttgccacct 4020 ggagccccag caaggccagg ctgcacctgc agggcaggag caatgcctgg aggccccagg 4080 tcaacaaccc caaggagtgg ctgcaggtgg acttccagaa gaccatgaag gtgactgggg 4140 tgaccaccca gggggtgaag agcctgctga ccagcatgta tgtgaaggag ttcctgatca 4200 gcagcagcca ggatggccac cagtggaccc tgttcttcca gaatggcaag gtgaaggtgt 4260 tccagggcaa ccaggacagc ttcacccctg tggtgaacag cctggacccc cccctgctga 4320 ccagatacct gaggattcac ccccagagct gggtgcacca gattgccctg aggatggagg 4380 tgctgggctg tgaggcccag gacctgtact gatcgcgaat aaaagatctt tattttcatt 4440 agatctgtgt gttggttttt tgtgtg 4466 <210> 332 <211> 4484 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1019 <400> 332 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccaga aggtactacc tgggagctgt ggaactgagc tgggactaca 120 tgcagtctga cctgggagag ctgcctgtgg atgctagatt tcctccaaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaaaaccct gtttgtggaa ttcacagacc 240 acctgttcaa tattgccaag cctagacctc cttggatggg cctgctgggc cctacaattc 300 aggctgaggt gtatgacaca gtggtcatca ccctgaagaa catggccagc catcctgtgt 360 ctctgcatgc tgtgggagtg tcttactgga aggcttctga gggggctgag tatgatgacc 420 agacaagcca gagagagaaa gaggatgaca aggttttccc tgggggcagc cacacctatg 480 tctggcaggt cctgaaagaa aatggcccta tggcctctga tcctctgtgc ctgacataca 540 gctacctgag ccatgtggac ctggtcaagg acctgaactc tggcctgatt ggggctctgc 600 tggtgtgtag agaaggcagc ctggccaaag aaaagaccca gacactgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgagacaaag aacagcctga 720 tgcaggacag agatgctgcc tctgctagag cttggcccaa gatgcacaca gtgaatggct 780 atgtgaacag aagcctgcct ggactgattg gatgccacag aaagtctgtg tactggcatg 840 tgattggcat gggcaccaca cctgaggtgc acagcatctt tctggaagga cacaccttcc 900 tggtgaggaa ccacagacag gccagcctgg aaatcagccc tatcaccttc ctgacagctc 960 agaccctgct gatggatctg ggccagtttc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaagcctat gtgaaggtgg acagctgccc tgaagaaccc cagctgagaa 1080 tgaagaacaa tgaggaagct gaggactatg atgatgacct gacagactct gagatggatg 1140 tggtcagatt tgatgatgat aacagcccca gcttcatcca gatcagatct gtggccaaga 1200 agcaccccaa gacctgggtg cactatattg ctgctgagga agaggactgg gattatgctc 1260 ctctggtgct ggcccctgat gacagaagct acaagagcca gtacctgaac aatggccctc 1320 agagaattgg caggaagtat aagaaagtga ggttcatggc ctacacagat gagacattca 1380 agaccagaga ggctatccag catgagtctg gcattctggg acctctgctg tatggggaag 1440 tgggggacac actgctgatc atcttcaaga accaggccag cagaccctac aacatctacc 1500 ctcatggcat cacagatgtg aggcctctgt actctagaag gctgcccaag ggggtgaagc 1560 acctgaagga cttccctatc ctgcctgggg agatcttcaa gtacaagtgg acagtgacag 1620 tggaggatgg ccctaccaag tctgatccta gatgcctgac aaggtactac agcagctttg 1680 tgaacatgga aagggacctg gcctctggcc tgattggtcc tctgctgatc tgctacaaag 1740 aatctgtgga ccagaggggc aaccagatca tgagtgacaa gagaaatgtg atcctgttct 1800 ctgtctttga tgagaacagg tcctggtatc tgacagagaa catccagagg tttctgccca 1860 atcctgctgg ggtgcagctg gaagatcctg agttccaggc ctccaacatc atgcactcca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgaa gtggcctact 1980 ggtacatcct gtctattggg gcccagacag acttcctgtc tgtgttcttt tctggctaca 2040 ccttcaagca caagatggtg tatgaggata ccctgacact gttcccattc tctggggaga 2100 cagtgttcat gagcatggaa aaccctggcc tgtggatcct gggctgtcac aacagtgact 2160 tcagaaacag aggcatgaca gccctgctga aggtgtccag ctgtgacaag aacactgggg 2220 actactatga ggactcttat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcctag gagcttctct cagaacgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagccc tcctgtgctg aagagacacc agagggagat caccagaacc acactgcagt 2400 ctgaccaaga ggaaattgat tatgatgaca ccatctctgt ggagatgaag aaagaagatt 2460 ttgacatcta tgatgaggat gagaatcaga gccccagatc tttccagaag aaaacaaggc 2520 actacttcat tgctgctgtg gaaagactgt gggactatgg catgagcagc agcccccatg 2580 tgctgagaaa cagggcccag tctggaagtg tgccccagtt caagaaagtg gtgttccaag 2640 agttcacaga tggcagcttc acccagcctc tgtatagagg ggagctgaat gagcacctgg 2700 gactgctggg accttacatc agagctgagg tggaggataa catcatggtc acctttagaa 2760 accaggcctc taggccctac tccttctaca gctccctgat cagctatgaa gaggaccaga 2820 gacagggggc tgagcccaga aagaactttg tgaagcccaa tgagactaag acctactttt 2880 ggaaggtgca gcaccacatg gcccctacaa aggatgagtt tgactgcaag gcctgggcct 2940 acttctctga tgtggacctg gagaaggatg tgcactctgg actcattgga cccctgcttg 3000 tgtgccacac caacacactg aatcctgctc atggcaggca agtgacagtg caagagtttg 3060 ccctgttctt caccatcttt gatgagacaa agtcctggta cttcacagaa aacatggaaa 3120 gaaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa gagaactaca 3180 ggttccatgc catcaatggc tacatcatgg acactctgcc tggcctggtt atggcacagg 3240 atcagaggat cagatggtat ctgctgtcca tgggctccaa tgagaatatc cacagcatcc 3300 acttctctgg ccatgtgttc acagtgagga aaaaagaaga gtacaagatg gccctgtaca 3360 atctgtaccc tggggtgttt gagactgtgg aaatgctgcc tagcaaggct ggaatctgga 3420 gggtggaatg tctgattgga gagcatctgc atgctggaat gtctaccctg ttcctggtgt 3480 acagcaacaa gtgtcagacc cctctgggca tggcctctgg acacatcaga gacttccaga 3540 tcacagcctc tggccagtat ggacagtggg ctcctaaact ggctagactg cactactctg 3600 gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg gacctgctgg 3660 ctcccatgat catccatgga atcaagaccc agggggccag acagaagttc agcagcctgt 3720 acatcagcca gttcatcatc atgtacagcc tggatggcaa gaagtggcag acctacagag 3780 gcaacagcac aggcacactc atggtgttct ttggcaatgt ggactcttct ggcattaagc 3840 acaacatctt caaccctcca atcattgcca ggtacatcag gctgcacccc acacactaca 3900 gcatcagatc taccctgagg atggaactga tgggctgtga cctgaacagc tgctctatgc 3960 ccctgggaat ggaaagcaag gccatctctg atgcccagat cacagccagc agctacttca 4020 ccaacatgtt tgccacatgg tccccatcta aggccaggct gcatctgcag ggcagatcta 4080 atgcttggag gccccaagtg aacaacccca aagagtggct gcaggtggac tttcagaaaa 4140 ccatgaaagt gacaggagtg accacacagg gggtcaagtc tctgctgacc tctatgtatg 4200 tgaaagagtt cctgatctcc agcagccagg atggccacca gtggaccctg tttttccaga 4260 atggcaaagt caaggtgttc cagggaaacc aggacagctt cacacctgtg gtcaactccc 4320 tggatcctcc actgctgacc agatacctga gaattcaccc tcagtcttgg gtgcaccaga 4380 ttgctctgag aatggaagtg ctgggatgtg aagctcagga cctctactaa tcgcgaataa 4440 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtg 4484 <210> 333 <211> 4484 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1020 <400> 333 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggctaccaga agatactacc tgggagctgt ggaactgagc tgggattaca 120 tgcagtctga cctgggagag ctgcctgtgg atgctagatt cccacctaga gtccctaagt 180 ccttcccctt caacacctct gtggtctaca agaaaaccct gtttgtggag tttacagacc 240 acctgttcaa cattgctaag cctagaccac catggatggg actgctggga ccaaccatcc 300 aggcagaggt gtatgacaca gtggtcatca ccctgaaaaa catggcttct caccctgtgt 360 ccctgcatgc tgtgggagtc tcctactgga aggcctctga aggggctgag tatgatgatc 420 agaccagcca gagggaaaaa gaggatgata aggtgttccc tggagggtcc catacctatg 480 tgtggcaggt cctgaaggag aatggaccaa tggcttctga ccctctgtgc ctgacctact 540 cttatctgtc ccatgtggac ctggtcaagg atctgaactc tggcctgatt ggggctctgc 600 tggtgtgtag ggaagggtcc ctggccaagg agaaaaccca gaccctgcat aagttcatcc 660 tgctgtttgc tgtgtttgat gaaggaaaaa gctggcactc tgagaccaag aactctctga 720 tgcaggacag ggatgctgct tctgccagag cttggcccaa gatgcacaca gtgaatggct 780 atgtcaatag gagcctgcct ggactgattg gctgccacag aaagtctgtg tattggcatg 840 tcattggaat gggcaccacc cctgaagtgc acagcatctt cctggagggg catacctttc 900 tggtcaggaa ccacaggcag gctagcctgg agatctctcc aatcaccttc ctgacagccc 960 agaccctgct gatggacctg ggacagttcc tgctgttttg ccacatctcc agccaccagc 1020 atgatggcat ggaggcttat gtgaaagtgg actcctgtcc tgaggaacct cagctgagga 1080 tgaagaacaa tgaggaagct gaagactatg atgatgacct gacagactct gagatggatg 1140 tggtcaggtt tgatgatgat aactctccct cctttatcca gatcaggtct gtggccaaga 1200 aacaccctaa gacctgggtc cattacattg ctgctgagga agaggactgg gattatgctc 1260 cactggtgct ggcccctgat gatagatcct acaaaagcca gtatctgaac aatggacccc 1320 agaggattgg cagaaagtac aagaaagtga ggttcatggc ttatacagat gagaccttta 1380 agaccagaga agccatccag catgagtctg ggatcctggg acctctgctg tatggggaag 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccttac aatatctatc 1500 cacatggcat cacagatgtg agacctctgt actccaggag gctgccaaag ggggtgaaac 1560 acctgaagga cttcccaatc ctgcctgggg aaatctttaa gtataaatgg acagtcacag 1620 tggaggatgg gcccaccaag tctgacccta ggtgcctgac cagatactat tcttcctttg 1680 tgaatatgga gagagacctg gcttctggac tgattggacc cctgctgatc tgttacaaag 1740 agtctgtgga tcagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtctttga tgaaaacagg tcttggtacc tgacagagaa catccagagg ttcctgccta 1860 atccagctgg agtgcagctg gaagatcctg agttccaggc ctctaacatc atgcattcca 1920 tcaatggcta tgtgtttgac tccctgcagc tgtctgtgtg cctgcatgag gtggcttact 1980 ggtatatcct gagcattgga gcccagacag atttcctgtc tgtgttcttt tctggctaca 2040 cctttaagca taaaatggtg tatgaggaca ccctgaccct gttcccattt tctggagaaa 2100 ctgtgttcat gagcatggag aatcctgggc tgtggatcct gggatgccac aactctgatt 2160 tcaggaatag agggatgaca gccctgctga aagtgagctc ttgtgacaag aacacaggag 2220 actactatga agatagctat gaggacatct ctgcttatct gctgtccaaa aacaatgcca 2280 ttgagcccag gagcttctct cagaacgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagccc tccagtgctg aagaggcacc agagggagat caccagaacc accctgcagt 2400 ctgatcagga agagattgac tatgatgata ccatctctgt ggaaatgaag aaagaggact 2460 ttgatatcta tgatgaagat gagaaccagt ctcccaggtc cttccagaag aaaaccagac 2520 attactttat tgctgctgtg gagaggctgt gggactatgg catgtccagc tctcctcatg 2580 tgctgagaaa tagagctcag tctggatctg tcccacagtt caagaaagtg gtcttccagg 2640 agtttacaga tggaagcttt acccagccac tgtacagggg agaactgaat gagcacctgg 2700 ggctgctggg accctatatc agggctgaag tggaggataa catcatggtc accttcagga 2760 atcaggccag cagaccctac tctttttatt ccagcctgat ctcctatgaa gaggaccaga 2820 gacagggagc tgaaccaaga aaaaactttg tgaagcctaa tgagaccaaa acctactttt 2880 ggaaggtgca gcaccatatg gcccctacca aagatgagtt tgattgcaag gcctgggctt 2940 atttttctga tgtggatctg gagaaggatg tccactctgg cctgattggg ccactgctgg 3000 tgtgtcatac caacaccctg aatccagctc atggaaggca ggtgacagtc caggaatttg 3060 ccctgttctt taccatcttt gatgagacca agagctggta cttcacagaa aacatggaga 3120 ggaattgcag agccccatgt aacatccaga tggaagaccc caccttcaag gagaactaca 3180 gatttcatgc tatcaatggg tatatcatgg ataccctgcc aggactggtc atggctcagg 3240 accagaggat cagatggtac ctgctgagca tggggtctaa tgagaatatc cactccatcc 3300 atttctctgg acatgtgttt acagtaagga agaaagaaga gtacaagatg gccctgtaca 3360 acctgtatcc tggggtgttt gaaacagtgg agatgctgcc ttccaaggct gggatctgga 3420 gggtggaatg cctgattggg gagcacctgc atgctggaat gtctaccctg ttcctggtgt 3480 actccaataa gtgtcagacc cccctgggga tggcttctgg acatatcagg gacttccaga 3540 tcacagcttc tggacagtat ggacagtggg ctcctaagct ggctagactg cactattctg 3600 gctccatcaa tgcttggtct accaaagagc ctttctcctg gatcaaggtg gacctgctgg 3660 ctccaatgat catccatggc atcaaaaccc agggggccag gcagaagttc tcttccctgt 3720 acatcagcca gtttatcatc atgtattctc tggatgggaa gaaatggcag acctacagag 3780 gcaattccac agggaccctg atggtgttct ttggcaatgt ggacagctct gggatcaagc 3840 acaacatctt caatccccct atcattgcca ggtacatcag actgcaccca acccattatt 3900 ccatcaggag caccctgaga atggagctga tggggtgtga tctgaacagc tgttctatgc 3960 ccctgggaat ggagtctaag gccatctctg atgctcagat cacagcctcc agctacttca 4020 ccaatatgtt tgctacctgg tccccaagca aggctagact gcatctgcag ggaagaagca 4080 atgcttggag accacaggtg aacaatccca aggagtggct gcaggtggac ttccagaaaa 4140 ccatgaaggt gacaggagtc accacccagg gagtgaaaag cctgctgacc tctatgtatg 4200 tcaaggagtt cctgatctct tccagccagg atgggcacca gtggaccctg ttctttcaga 4260 atggaaaggt gaaagtcttc cagggcaatc aggattcctt tacccctgtg gtcaacagcc 4320 tggacccacc cctgctgacc aggtacctga gaatccaccc acagtcctgg gtgcatcaga 4380 ttgctctgag gatggaagtc ctgggctgtg aggcccagga cctgtattga tcgcgaataa 4440 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtg 4484 <210> 334 <211> 4484 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1025 <400> 334 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccaga aggtactacc tgggagctgt ggaactgagc tgggactaca 120 tgcagtctga cctgggagag ctgcctgtgg atgctagatt tcctccaaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaaaaccct gtttgtggaa ttcacagacc 240 acctgttcaa tattgccaag cctagacctc cttggatggg cctgctgggc cctacaattc 300 aggctgaggt gtatgacaca gtggtcatca ccctgaagaa catggccagc catcctgtgt 360 ctctgcatgc tgtgggagtg tcttactgga aggcttctga gggggctgag tatgatgacc 420 agacaagcca gagagagaaa gaggatgaca aggttttccc tgggggcagc cacacctatg 480 tctggcaggt cctgaaagaa aatggcccta tggcctctga tcctctgtgc ctgacataca 540 gctacctgag ccatgtggac ctggtcaagg acctgaactc tggcctgatt ggggctctgc 600 tggtgtgtag agaaggcagc ctggccaaag aaaagaccca gacactgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgagacaaag aacagcctga 720 tgcaggacag agatgctgcc tctgctagag cttggcccaa gatgcacaca gtgaatggct 780 atgtgaacag aagcctgcct ggactgattg gatgccacag aaagtctgtg tactggcatg 840 tgattggcat gggcaccaca cctgaggtgc acagcatctt tctggaagga cacaccttcc 900 tggtgaggaa ccacagacag gccagcctgg aaatcagccc tatcaccttc ctgacagctc 960 agaccctgct gatggatctg ggccagtttc tgctggcctg ccacatcagc agccaccagc 1020 atgatggcat ggaagcctat gtgaaggtgg acagctgccc tgaagaaccc cagctgagaa 1080 tgaagaacaa tgaggaagct gaggactatg atgatgacct gacagactct gagatggatg 1140 tggtcagatt tgatgatgat aacagcccca gcttcatcca gatcagatct gtggccaaga 1200 agcaccccaa gacctgggtg cactatattg ctgctgagga agaggactgg gattatgctc 1260 ctctggtgct ggcccctgat gacagaagct acaagagcca gtacctgaac aatggccctc 1320 agagaattgg caggaagtat aagaaagtga ggttcatggc ctacacagat gagacattca 1380 agaccagaga ggctatccag catgagtctg gcattctggg acctctgctg tatggggaag 1440 tgggggacac actgctgatc atcttcaaga accaggccag cagaccctac aacatctacc 1500 ctcatggcat cacagatgtg aggcctctgt actctagaag gctgcccaag ggggtgaagc 1560 acctgaagga cttccctatc ctgcctgggg agatcttcaa gtacaagtgg acagtgacag 1620 tggaggatgg ccctaccaag tctgatccta gatgcctgac aaggtactac agcagctttg 1680 tgaacatgga aagggacctg gcctctggcc tgattggtcc tctgctgatc tgctacaaag 1740 aatctgtgga ccagaggggc aaccagatca tgagtgacaa gagaaatgtg atcctgttct 1800 ctgtctttga tgagaacagg tcctggtatc tgacagagaa catccagagg tttctgccca 1860 atcctgctgg ggtgcagctg gaagatcctg agttccaggc ctccaacatc atgcactcca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgaa gtggcctact 1980 ggtacatcct gtctattggg gcccagacag acttcctgtc tgtgttcttt tctggctaca 2040 ccttcaagca caagatggtg tatgaggata ccctgacact gttcccattc tctggggaga 2100 cagtgttcat gagcatggaa aaccctggcc tgtggatcct gggctgtcac aacagtgact 2160 tcagaaacag aggcatgaca gccctgctga aggtgtccag ctgtgacaag aacactgggg 2220 actactatga ggactcttat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcctag gagcttctct cagaacgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagccc tcctgtgctg aagagacacc agagggagat caccagaacc acactgcagt 2400 ctgaccaaga ggaaattgat tatgatgaca ccatctctgt ggagatgaag aaagaagatt 2460 ttgacatcta tgatgaggat gagaatcaga gccccagatc tttccagaag aaaacaaggc 2520 actacttcat tgctgctgtg gaaagactgt gggactatgg catgagcagc agcccccatg 2580 tgctgagaaa cagggcccag tctggaagtg tgccccagtt caagaaagtg gtgttccaag 2640 agttcacaga tggcagcttc acccagcctc tgtatagagg ggagctgaat gagcacctgg 2700 gactgctggg accttacatc agagctgagg tggaggataa catcatggtc acctttagaa 2760 accaggcctc taggccctac tccttctaca gctccctgat cagctatgaa gaggaccaga 2820 gacagggggc tgagcccaga aagaactttg tgaagcccaa tgagactaag acctactttt 2880 ggaaggtgca gcaccacatg gcccctacaa aggatgagtt tgactgcaag gcctgggcct 2940 acttctctga tgtggacctg gagaaggatg tgcactctgg actcattgga cccctgcttg 3000 tgtgccacac caacacactg aatcctgctc atggcaggca agtgacagtg caagagtttg 3060 ccctgttctt caccatcttt gatgagacaa agtcctggta cttcacagaa aacatggaaa 3120 gaaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa gagaactaca 3180 ggttccatgc catcaatggc tacatcatgg acactctgcc tggcctggtt atggcacagg 3240 atcagaggat cagatggtat ctgctgtcca tgggctccaa tgagaatatc cacagcatcc 3300 acttctctgg ccatgtgttc acagtgagga aaaaagaaga gtacaagatg gccctgtaca 3360 atctgtaccc tggggtgttt gagactgtgg aaatgctgcc tagcaaggct ggaatctgga 3420 gggtggaatg tctgattgga gagcatctgc atgctggaat gtctaccctg ttcctggtgt 3480 acagcaacaa gtgtcagacc cctctgggca tggcctctgg acacatcaga gacttccaga 3540 tcacagcctc tggccagtat ggacagtggg ctcctaaact ggctagactg cactactctg 3600 gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg gacctgctgg 3660 ctcccatgat catccatgga atcaagaccc agggggccag acagaagttc agcagcctgt 3720 acatcagcca gttcatcatc atgtacagcc tggatggcaa gaagtggcag acctacagag 3780 gcaacagcac aggcacactc atggtgttct ttggcaatgt ggactcttct ggcattaagc 3840 acaacatctt caaccctcca atcattgcca ggtacatcag gctgcacccc acacactaca 3900 gcatcagatc taccctgagg atggaactga tgggctgtga cctgaacagc tgctctatgc 3960 ccctgggaat ggaaagcaag gccatctctg atgcccagat cacagccagc agctacttca 4020 ccaacatgtt tgccacatgg tccccatcta aggccaggct gcatctgcag ggcagatcta 4080 atgcttggag gccccaagtg aacaacccca aagagtggct gcaggtggac tttcagaaaa 4140 ccatgaaagt gacaggagtg accacacagg gggtcaagtc tctgctgacc tctatgtatg 4200 tgaaagagtt cctgatctcc agcagccagg atggccacca gtggaccctg tttttccaga 4260 atggcaaagt caaggtgttc cagggaaacc aggacagctt cacacctgtg gtcaactccc 4320 tggatcctcc actgctgacc agatacctga gaattcaccc tcagtcttgg gtgcaccaga 4380 ttgctctgag aatggaagtg ctgggatgtg aagctcagga cctctactaa tcgcgaataa 4440 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtg 4484 <210> 335 <211> 4484 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1026 <400> 335 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccaga aggtactacc tgggagctgt ggaactgagc tgggactaca 120 tgcagtctga cctgggagag ctgcctgtgg atgctagatt tcctccaaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaaaaccct gtttgtggaa ttcacagacc 240 acctgttcaa tattgccaag cctagacctc cttggatggg cctgctgggc cctacaattc 300 aggctgaggt gtatgacaca gtggtcatca ccctgaagaa catggccagc catcctgtgt 360 ctctgcatgc tgtgggagtg tcttactgga aggcttctga gggggctgag tatgatgacc 420 agacaagcca gagagagaaa gaggatgaca aggttttccc tgggggcagc cacacctatg 480 tctggcaggt cctgaaagaa aatggcccta tggcctctga tcctctgtgc ctgacataca 540 gctacctgag ccatgtggac ctggtcaagg acctgaactc tggcctgatt ggggctctgc 600 tggtgtgtag agaaggcagc ctggccaaag aaaagaccca gacactgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgagacaaag aacagcctga 720 tgcaggacag agatgctgcc tctgctagag cttggcccaa gatgcacaca gtgaatggct 780 atgtgaacag aagcctgcct ggactgattg gatgccacag aaagtctgtg tactggcatg 840 tgattggcat gggcaccaca cctgaggtgc acagcatctt tctggaagga cacaccttcc 900 tggtgaggaa ccacagacag gccagcctgg aaatcagccc tatcaccttc ctgacagctc 960 agaccctgct gatggatctg ggccagtttc tgctgagctg ccacatcagc agccaccagc 1020 atgatggcat ggaagcctat gtgaaggtgg acagctgccc tgaagaaccc cagctgagaa 1080 tgaagaacaa tgaggaagct gaggactatg atgatgacct gacagactct gagatggatg 1140 tggtcagatt tgatgatgat aacagcccca gcttcatcca gatcagatct gtggccaaga 1200 agcaccccaa gacctgggtg cactatattg ctgctgagga agaggactgg gattatgctc 1260 ctctggtgct ggcccctgat gacagaagct acaagagcca gtacctgaac aatggccctc 1320 agagaattgg caggaagtat aagaaagtga ggttcatggc ctacacagat gagacattca 1380 agaccagaga ggctatccag catgagtctg gcattctggg acctctgctg tatggggaag 1440 tgggggacac actgctgatc atcttcaaga accaggccag cagaccctac aacatctacc 1500 ctcatggcat cacagatgtg aggcctctgt actctagaag gctgcccaag ggggtgaagc 1560 acctgaagga cttccctatc ctgcctgggg agatcttcaa gtacaagtgg acagtgacag 1620 tggaggatgg ccctaccaag tctgatccta gatgcctgac aaggtactac agcagctttg 1680 tgaacatgga aagggacctg gcctctggcc tgattggtcc tctgctgatc tgctacaaag 1740 aatctgtgga ccagaggggc aaccagatca tgagtgacaa gagaaatgtg atcctgttct 1800 ctgtctttga tgagaacagg tcctggtatc tgacagagaa catccagagg tttctgccca 1860 atcctgctgg ggtgcagctg gaagatcctg agttccaggc ctccaacatc atgcactcca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgaa gtggcctact 1980 ggtacatcct gtctattggg gcccagacag acttcctgtc tgtgttcttt tctggctaca 2040 ccttcaagca caagatggtg tatgaggata ccctgacact gttcccattc tctggggaga 2100 cagtgttcat gagcatggaa aaccctggcc tgtggatcct gggctgtcac aacagtgact 2160 tcagaaacag aggcatgaca gccctgctga aggtgtccag ctgtgacaag aacactgggg 2220 actactatga ggactcttat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcctag gagcttctct cagaacgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagccc tcctgtgctg aagagacacc agagggagat caccagaacc acactgcagt 2400 ctgaccaaga ggaaattgat tatgatgaca ccatctctgt ggagatgaag aaagaagatt 2460 ttgacatcta tgatgaggat gagaatcaga gccccagatc tttccagaag aaaacaaggc 2520 actacttcat tgctgctgtg gaaagactgt gggactatgg catgagcagc agcccccatg 2580 tgctgagaaa cagggcccag tctggaagtg tgccccagtt caagaaagtg gtgttccaag 2640 agttcacaga tggcagcttc acccagcctc tgtatagagg ggagctgaat gagcacctgg 2700 gactgctggg accttacatc agagctgagg tggaggataa catcatggtc acctttagaa 2760 accaggcctc taggccctac tccttctaca gctccctgat cagctatgaa gaggaccaga 2820 gacagggggc tgagcccaga aagaactttg tgaagcccaa tgagactaag acctactttt 2880 ggaaggtgca gcaccacatg gcccctacaa aggatgagtt tgactgcaag gcctgggcct 2940 acttctctga tgtggacctg gagaaggatg tgcactctgg actcattgga cccctgcttg 3000 tgtgccacac caacacactg aatcctgctc atggcaggca agtgacagtg caagagtttg 3060 ccctgttctt caccatcttt gatgagacaa agtcctggta cttcacagaa aacatggaaa 3120 gaaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa gagaactaca 3180 ggttccatgc catcaatggc tacatcatgg acactctgcc tggcctggtt atggcacagg 3240 atcagaggat cagatggtat ctgctgtcca tgggctccaa tgagaatatc cacagcatcc 3300 acttctctgg ccatgtgttc acagtgagga aaaaagaaga gtacaagatg gccctgtaca 3360 atctgtaccc tggggtgttt gagactgtgg aaatgctgcc tagcaaggct ggaatctgga 3420 gggtggaatg tctgattgga gagcatctgc atgctggaat gtctaccctg ttcctggtgt 3480 acagcaacaa gtgtcagacc cctctgggca tggcctctgg acacatcaga gacttccaga 3540 tcacagcctc tggccagtat ggacagtggg ctcctaaact ggctagactg cactactctg 3600 gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg gacctgctgg 3660 ctcccatgat catccatgga atcaagaccc agggggccag acagaagttc agcagcctgt 3720 acatcagcca gttcatcatc atgtacagcc tggatggcaa gaagtggcag acctacagag 3780 gcaacagcac aggcacactc atggtgttct ttggcaatgt ggactcttct ggcattaagc 3840 acaacatctt caaccctcca atcattgcca ggtacatcag gctgcacccc acacactaca 3900 gcatcagatc taccctgagg atggaactga tgggctgtga cctgaacagc tgctctatgc 3960 ccctgggaat ggaaagcaag gccatctctg atgcccagat cacagccagc agctacttca 4020 ccaacatgtt tgccacatgg tccccatcta aggccaggct gcatctgcag ggcagatcta 4080 atgcttggag gccccaagtg aacaacccca aagagtggct gcaggtggac tttcagaaaa 4140 ccatgaaagt gacaggagtg accacacagg gggtcaagtc tctgctgacc tctatgtatg 4200 tgaaagagtt cctgatctcc agcagccagg atggccacca gtggaccctg tttttccaga 4260 atggcaaagt caaggtgttc cagggaaacc aggacagctt cacacctgtg gtcaactccc 4320 tggatcctcc actgctgacc agatacctga gaattcaccc tcagtcttgg gtgcaccaga 4380 ttgctctgag aatggaagtg ctgggatgtg aagctcagga cctctactaa tcgcgaataa 4440 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtg 4484 <210> 336 <211> 4775 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB103 <400> 336 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggcccgc ggtgccagtt cccgatcgtt acaggcggta 180 ctcctcaaag cgtactaaag aattattctt ttacatttca gtggctacca gaagatacta 240 cctgggagct gtggaactga gctgggatta catgcagtct gacctgggag agctgcctgt 300 ggatgctaga ttcccaccta gagtccctaa gtccttcccc ttcaacacct ctgtggtcta 360 caagaaaacc ctgtttgtgg agtttacaga ccacctgttc aacattgcta agcctagacc 420 accatggatg ggactgctgg gaccaaccat ccaggcagag gtgtatgaca cagtggtcat 480 caccctgaaa aacatggctt ctcaccctgt gtccctgcat gctgtgggag tctcctactg 540 gaaggcctct gaaggggctg agtatgatga tcagaccagc cagagggaaa aagaggatga 600 taaggtgttc cctggagggt cccataccta tgtgtggcag gtcctgaagg agaatggacc 660 aatggcttct gaccctctgt gcctgaccta ctcttatctg tcccatgtgg acctggtcaa 720 ggatctgaac tctggcctga ttggggctct gctggtgtgt agggaagggt ccctggccaa 780 ggagaaaacc cagaccctgc ataagttcat cctgctgttt gctgtgtttg atgaaggaaa 840 aagctggcac tctgagacca agaactctct gatgcaggac agggatgctg cttctgccag 900 agcttggccc aagatgcaca cagtgaatgg ctatgtcaat aggagcctgc ctggactgat 960 tggctgccac agaaagtctg tgtattggca tgtcattgga atgggcacca cccctgaagt 1020 gcacagcatc ttcctggagg ggcatacctt tctggtcagg aaccacaggc aggctagcct 1080 ggagatctct ccaatcacct tcctgacagc ccagaccctg ctgatggacc tgggacagtt 1140 cctgctgttt tgccacatct ccagccacca gcatgatggc atggaggctt atgtgaaagt 1200 ggactcctgt cctgaggaac ctcagctgag gatgaagaac aatgaggaag ctgaagacta 1260 tgatgatgac ctgacagact ctgagatgga tgtggtcagg tttgatgatg ataactctcc 1320 ctcctttatc cagatcaggt ctgtggccaa gaaacaccct aagacctggg tccattacat 1380 tgctgctgag gaagaggact gggattatgc tccactggtg ctggcccctg atgatagatc 1440 ctacaaaagc cagtatctga acaatggacc ccagaggatt ggcagaaagt acaagaaagt 1500 gaggttcatg gcttatacag atgagacctt taagaccaga gaagccatcc agcatgagtc 1560 tgggatcctg ggacctctgc tgtatgggga agtgggggac accctgctga tcatcttcaa 1620 gaaccaggcc agcaggcctt acaatatcta tccacatggc atcacagatg tgagacctct 1680 gtactccagg aggctgccaa agggggtgaa acacctgaag gacttcccaa tcctgcctgg 1740 ggaaatcttt aagtataaat ggacagtcac agtggaggat gggcccacca agtctgaccc 1800 taggtgcctg accagatact attcttcctt tgtgaatatg gagagagacc tggcttctgg 1860 actgattgga cccctgctga tctgttacaa agagtctgtg gatcagaggg gcaaccagat 1920 catgtctgac aagaggaatg tgatcctgtt ctctgtcttt gatgaaaaca ggtcttggta 1980 cctgacagag aacatccaga ggttcctgcc taatccagct ggagtgcagc tggaagatcc 2040 tgagttccag gcctctaaca tcatgcattc catcaatggc tatgtgtttg actccctgca 2100 gctgtctgtg tgcctgcatg aggtggctta ctggtatatc ctgagcattg gagcccagac 2160 agatttcctg tctgtgttct tttctggcta cacctttaag cataaaatgg tgtatgagga 2220 caccctgacc ctgttcccat tttctggaga aactgtgttc atgagcatgg agaatcctgg 2280 gctgtggatc ctgggatgcc acaactctga tttcaggaat agagggatga cagccctgct 2340 gaaagtgagc tcttgtgaca agaacacagg agactactat gaagatagct atgaggacat 2400 ctctgcttat ctgctgtcca aaaacaatgc cattgagccc aggagcttct ctcagaaccc 2460 tccagtgctg aagaggcacc agagggagat caccagaacc accctgcagt ctgatcagga 2520 agagattgac tatgatgata ccatctctgt ggaaatgaag aaagaggact ttgatatcta 2580 tgatgaagat gagaaccagt ctcccaggtc cttccagaag aaaaccagac attactttat 2640 tgctgctgtg gagaggctgt gggactatgg catgtccagc tctcctcatg tgctgagaaa 2700 tagagctcag tctggatctg tcccacagtt caagaaagtg gtcttccagg agtttacaga 2760 tggaagcttt acccagccac tgtacagggg agaactgaat gagcacctgg ggctgctggg 2820 accctatatc agggctgaag tggaggataa catcatggtc accttcagga atcaggccag 2880 cagaccctac tctttttatt ccagcctgat ctcctatgaa gaggaccaga gacagggagc 2940 tgaaccaaga aaaaactttg tgaagcctaa tgagaccaaa acctactttt ggaaggtgca 3000 gcaccatatg gcccctacca aagatgagtt tgattgcaag gcctgggctt atttttctga 3060 tgtggatctg gagaaggatg tccactctgg cctgattggg ccactgctgg tgtgtcatac 3120 caacaccctg aatccagctc atggaaggca ggtgacagtc caggaatttg ccctgttctt 3180 taccatcttt gatgagacca agagctggta cttcacagaa aacatggaga ggaattgcag 3240 agccccatgt aacatccaga tggaagaccc caccttcaag gagaactaca gatttcatgc 3300 tatcaatggg tatatcatgg ataccctgcc aggactggtc atggctcagg accagaggat 3360 cagatggtac ctgctgagca tggggtctaa tgagaatatc cactccatcc atttctctgg 3420 acatgtgttt acagtaagga agaaagaaga gtacaagatg gccctgtaca acctgtatcc 3480 tggggtgttt gaaacagtgg agatgctgcc ttccaaggct gggatctgga gggtggaatg 3540 cctgattggg gagcacctgc atgctggaat gtctaccctg ttcctggtgt actccaataa 3600 gtgtcagacc cccctgggga tggcttctgg acatatcagg gacttccaga tcacagcttc 3660 tggacagtat ggacagtggg ctcctaagct ggctagactg cactattctg gctccatcaa 3720 tgcttggtct accaaagagc ctttctcctg gatcaaggtg gacctgctgg ctccaatgat 3780 catccatggc atcaaaaccc agggggccag gcagaagttc tcttccctgt acatcagcca 3840 gtttatcatc atgtattctc tggatgggaa gaaatggcag acctacagag gcaattccac 3900 agggaccctg atggtgttct ttggcaatgt ggacagctct gggatcaagc acaacatctt 3960 caatccccct atcattgcca ggtacatcag actgcaccca acccattatt ccatcaggag 4020 caccctgaga atggagctga tggggtgtga tctgaacagc tgttctatgc ccctgggaat 4080 ggagtctaag gccatctctg atgctcagat cacagcctcc agctacttca ccaatatgtt 4140 tgctacctgg tccccaagca aggctagact gcatctgcag ggaagaagca atgcttggag 4200 accacaggtg aacaatccca aggagtggct gcaggtggac ttccagaaaa ccatgaaggt 4260 gacaggagtc accacccagg gagtgaaaag cctgctgacc tctatgtatg tcaaggagtt 4320 cctgatctct tccagccagg atgggcacca gtggaccctg ttctttcaga atggaaaggt 4380 gaaagtcttc cagggcaatc aggattcctt tacccctgtg gtcaacagcc tggacccacc 4440 cctgctgacc aggtacctga gaatccaccc acagtcctgg gtgcatcaga ttgctctgag 4500 gatggaagtc ctgggctgtg aggcccagga cctgtattga tcgcgaataa aagatcttta 4560 ttttcattag atctgtgtgt tggttttttg tgtgtgccag ttcccgatcg ttacaggcaa 4620 ttgccttagg ccgcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4680 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4740 ctcagtgagc gagcgagcgc gcagctgcct gcagg 4775 <210> 337 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> "SQ linker" <400> 337 Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg 1 5 10 <210> 338 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> gRNA mALbT1 <400> 338 tgccagttcc cgatcgttac 20 <210> 339 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> gRNA <220> <221> misc_feature <222> (1)..(2) <223> phosphorothioate backbone <220> <221> misc_feature <222> (1)..(3) <223> 2'-O-methyl nucleotides <220> <221> misc_feature <222> (2)..(3) <223> phosphorothioate backbone <220> <221> misc_feature <222> (3)..(4) <223> phosphorothioate backbone <220> <221> misc_feature <222> (29)..(32) <223> 2'-O-methyl nucleotides <220> <221> misc_feature <222> (37)..(40) <223> 2'-O-methyl nucleotides <220> <221> misc_feature <222> (68)..(72) <223> 2'-O-methyl nucleotides <220> <221> misc_feature <222> (77)..(99) <223> 2'-O-methyl nucleotides <220> <221> misc_feature <222> (97)..(98) <223> phosphorothioate backbone <220> <221> misc_feature <222> (98)..(99) <223> phosphorothioate backbone <220> <221> misc_feature <222> (99)..(100) <223> phosphorothioate backbone <400> 339 ugccaguucc cgaucguuac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 340 <211> 4438 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> spCas9 mRNA with NLS sequences <400> 340 ggaaataaga gagaaaagaa gagtaagaag aaatataaga gccaccatgg ccccaaagaa 60 gaagcggaag gtcggtatcc acggagtccc agcagccgac aagaagtaca gcatcggcct 120 ggacatcggc accaactctg tgggctgggc cgtgatcacc gacgagtaca aggtgcccag 180 caagaaattc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga acctgatcgg 240 agccctgctg ttcgacagcg gcgaaacagc cgaggccacc cggctgaaga gaaccgccag 300 aagaagatac accagacgga agaaccggat ctgctatctg caagagatct tcagcaacga 360 gatggccaag gtggacgaca gcttcttcca cagactggaa gagtccttcc tggtggaaga 420 ggacaagaag cacgagagac accccatctt cggcaacatc gtggacgagg tggcctacca 480 cgagaagtac cccaccatct accacctgag aaagaaactg gtggacagca ccgacaaggc 540 cgacctgaga ctgatctacc tggccctggc ccacatgatc aagttcagag gccacttcct 600 gatcgagggc gacctgaacc ccgacaacag cgacgtggac aagctgttca tccagctggt 660 gcagacctac aaccagctgt tcgaggaaaa ccccatcaac gccagcggcg tggacgccaa 720 ggctatcctg tctgccagac tgagcaagag cagaaggctg gaaaatctga tcgcccagct 780 gcccggcgag aagaagaacg gcctgttcgg caacctgatt gccctgagcc tgggcctgac 840 ccccaacttc aagagcaact tcgacctggc cgaggatgcc aaactgcagc tgagcaagga 900 cacctacgac gacgacctgg acaacctgct ggcccagatc ggcgaccagt acgccgacct 960 gttcctggcc gccaagaacc tgtctgacgc catcctgctg agcgacatcc tgagagtgaa 1020 caccgagatc accaaggccc ccctgagcgc ctctatgatc aagagatacg acgagcacca 1080 ccaggacctg accctgctga aagctctcgt gcggcagcag ctgcctgaga agtacaaaga 1140 aatcttcttc gaccagagca agaacggcta cgccggctac atcgatggcg gcgctagcca 1200 ggaagagttc tacaagttca tcaagcccat cctggaaaag atggacggca ccgaggaact 1260 gctcgtgaag ctgaacagag aggacctgct gagaaagcag agaaccttcg acaacggcag 1320 catcccccac cagatccacc tgggagagct gcacgctatc ctgagaaggc aggaagattt 1380 ttacccattc ctgaaggaca accgggaaaa gatcgagaag atcctgacct tcaggatccc 1440 ctactacgtg ggccccctgg ccagaggcaa cagcagattc gcctggatga ccagaaagag 1500 cgaggaaacc atcaccccct ggaacttcga ggaagtggtg gacaagggcg ccagcgccca 1560 gagcttcatc gagagaatga caaacttcga taagaacctg cccaacgaga aggtgctgcc 1620 caagcacagc ctgctgtacg agtacttcac cgtgtacaac gagctgacca aagtgaaata 1680 cgtgaccgag ggaatgagaa agcccgcctt cctgagcggc gagcagaaaa aggccatcgt 1740 ggacctgctg ttcaagacca acagaaaagt gaccgtgaag cagctgaaag aggactactt 1800 caagaaaatc gagtgcttcg actccgtgga aatctccggc gtggaagata gattcaacgc 1860 ctccctgggc acataccacg atctgctgaa aattatcaag gacaaggact tcctggataa 1920 cgaagagaac gaggacattc tggaagatat cgtgctgacc ctgacactgt ttgaggaccg 1980 cgagatgatc gaggaaaggc tgaaaaccta cgctcacctg ttcgacgaca aagtgatgaa 2040 gcagctgaag agaaggcggt acaccggctg gggcaggctg agcagaaagc tgatcaacgg 2100 catcagagac aagcagagcg gcaagacaat cctggatttc ctgaagtccg acggcttcgc 2160 caaccggaac ttcatgcagc tgatccacga cgacagcctg acattcaaag aggacatcca 2220 gaaagcccag gtgtccggcc agggcgactc tctgcacgag catatcgcta acctggccgg 2280 cagccccgct atcaagaagg gcatcctgca gacagtgaag gtggtggacg agctcgtgaa 2340 agtgatgggc agacacaagc ccgagaacat cgtgatcgag atggctagag agaaccagac 2400 cacccagaag ggacagaaga actcccgcga gaggatgaag agaatcgaag agggcatcaa 2460 agagctgggc agccagatcc tgaaagaaca ccccgtggaa aacacccagc tgcagaacga 2520 gaagctgtac ctgtactacc tgcagaatgg ccgggatatg tacgtggacc aggaactgga 2580 catcaacaga ctgtccgact acgatgtgga ccatatcgtg cctcagagct ttctgaagga 2640 cgactccatc gataacaaag tgctgactcg gagcgacaag aacagaggca agagcgacaa 2700 cgtgccctcc gaagaggtcg tgaagaagat gaagaactac tggcgacagc tgctgaacgc 2760 caagctgatt acccagagga agttcgataa cctgaccaag gccgagagag gcggcctgag 2820 cgagctggat aaggccggct tcatcaagag gcagctggtg gaaaccagac agatcacaaa 2880 gcacgtggca cagatcctgg actcccggat gaacactaag tacgacgaaa acgataagct 2940 gatccgggaa gtgaaagtga tcaccctgaa gtccaagctg gtgtccgatt tccggaagga 3000 tttccagttt tacaaagtgc gcgagatcaa caactaccac cacgcccacg acgcctacct 3060 gaacgccgtc gtgggaaccg ccctgatcaa aaagtaccct aagctggaaa gcgagttcgt 3120 gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc gccaagagcg agcaggaaat 3180 cggcaaggct accgccaagt acttcttcta cagcaacatc atgaactttt tcaagaccga 3240 aatcaccctg gccaacggcg agatcagaaa gcgccctctg atcgagacaa acggcgaaac 3300 cggggagatc gtgtgggata agggcagaga cttcgccaca gtgcgaaagg tgctgagcat 3360 gccccaagtg aatatcgtga aaaagaccga ggtgcagaca ggcggcttca gcaaagagtc 3420 tatcctgccc aagaggaaca gcgacaagct gatcgccaga aagaaggact gggaccccaa 3480 gaagtacggc ggcttcgaca gccctaccgt ggcctactct gtgctggtgg tggctaaggt 3540 ggaaaagggc aagtccaaga aactgaagag tgtgaaagag ctgctgggga tcaccatcat 3600 ggaaagaagc agctttgaga agaaccctat cgactttctg gaagccaagg gctacaaaga 3660 agtgaaaaag gacctgatca tcaagctgcc taagtactcc ctgttcgagc tggaaaacgg 3720 cagaaagaga atgctggcct ctgccggcga actgcagaag ggaaacgagc tggccctgcc 3780 tagcaaatat gtgaacttcc tgtacctggc ctcccactat gagaagctga agggcagccc 3840 tgaggacaac gaacagaaac agctgtttgt ggaacagcat aagcactacc tggacgagat 3900 catcgagcag atcagcgagt tctccaagag agtgatcctg gccgacgcca atctggacaa 3960 ggtgctgtct gcctacaaca agcacaggga caagcctatc agagagcagg ccgagaatat 4020 catccacctg ttcaccctga caaacctggg cgctcctgcc gccttcaagt actttgacac 4080 caccatcgac cggaagaggt acaccagcac caaagaggtg ctggacgcca ccctgatcca 4140 ccagagcatc accggcctgt acgagacaag aatcgacctg tctcagctgg gaggcgacaa 4200 gagacctgcc gccactaaga aggccggaca ggccaaaaag aagaagtgag cggccgctta 4260 attaagctgc cttctgcggg gcttgccttc tggccatgcc cttcttctct cccttgcacc 4320 tgtacctctt ggtctttgaa taaagcctga gtaggaagaa aaaaaaaaaa aaaaaaaaaa 4380 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 4438 <210> 341 <211> 4779 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB102 <400> 341 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggcccgc ggtgccagtt cccgatcgtt acaggcggta 180 ctcctcaaag cgtactaaag aattattctt ttacatttca gtggccacca ggagatacta 240 cctgggggct gtggagctga gctgggacta catgcagtct gacctggggg agctgcctgt 300 ggatgccagg ttccccccca gagtgcccaa gagcttcccc ttcaacacct ctgtggtgta 360 caagaagacc ctgtttgtgg agttcactga ccacctgttc aacattgcca agcccaggcc 420 cccctggatg ggcctgctgg gccccaccat ccaggctgag gtgtatgaca ctgtggtgat 480 caccctgaag aacatggcca gccaccctgt gagcctgcat gctgtggggg tgagctactg 540 gaaggcctct gagggggctg agtatgatga ccagaccagc cagagggaga aggaggatga 600 caaggtgttc cctgggggca gccacaccta tgtgtggcag gtgctgaagg agaatggccc 660 catggcctct gaccccctgt gcctgaccta cagctacctg agccatgtgg acctggtgaa 720 ggacctgaac tctggcctga ttggggccct gctggtgtgc agggagggca gcctggccaa 780 ggagaagacc cagaccctgc acaagttcat cctgctgttt gctgtgtttg atgagggcaa 840 gagctggcac tctgaaacca agaacagcct gatgcaggac agggatgctg cctctgccag 900 ggcctggccc aagatgcaca ctgtgaatgg ctatgtgaac aggagcctgc ctggcctgat 960 tggctgccac aggaagtctg tgtactggca tgtgattggc atgggcacca cccctgaggt 1020 gcacagcatc ttcctggagg gccacacctt cctggtcagg aaccacaggc aggccagcct 1080 ggagatcagc cccatcacct tcctgactgc ccagaccctg ctgatggacc tgggccagtt 1140 cctgctgttc tgccacatca gcagccacca gcatgatggc atggaggcct atgtgaaggt 1200 ggacagctgc cctgaggagc cccagctgag gatgaagaac aatgaggagg ctgaggacta 1260 tgatgatgac ctgactgact ctgagatgga tgtggtgagg tttgatgatg acaacagccc 1320 cagcttcatc cagatcaggt ctgtggccaa gaagcacccc aagacctggg tgcactacat 1380 tgctgctgag gaggaggact gggactatgc ccccctggtg ctggcccctg atgacaggag 1440 ctacaagagc cagtacctga acaatggccc ccagaggatt ggcaggaagt acaagaaggt 1500 caggttcatg gcctacactg atgaaacctt caagaccagg gaggccatcc agcatgagtc 1560 tggcatcctg ggccccctgc tgtatgggga ggtgggggac accctgctga tcatcttcaa 1620 gaaccaggcc agcaggccct acaacatcta cccccatggc atcactgatg tgaggcccct 1680 gtacagcagg aggctgccca agggggtgaa gcacctgaag gacttcccca tcctgcctgg 1740 ggagatcttc aagtacaagt ggactgtgac tgtggaggat ggccccacca agtctgaccc 1800 caggtgcctg accagatact acagcagctt tgtgaacatg gagagggacc tggcctctgg 1860 cctgattggc cccctgctga tctgctacaa ggagtctgtg gaccagaggg gcaaccagat 1920 catgtctgac aagaggaatg tgatcctgtt ctctgtgttt gatgagaaca ggagctggta 1980 cctgactgag aacatccaga ggttcctgcc caaccctgct ggggtgcagc tggaggaccc 2040 tgagttccag gccagcaaca tcatgcacag catcaatggc tatgtgtttg acagcctgca 2100 gctgtctgtg tgcctgcatg aggtggccta ctggtacatc ctgagcattg gggcccagac 2160 tgacttcctg tctgtgttct tctctggcta caccttcaag cacaagatgg tgtatgagga 2220 caccctgacc ctgttcccct tctctgggga gactgtgttc atgagcatgg agaaccctgg 2280 cctgtggatt ctgggctgcc acaactctga cttcaggaac aggggcatga ctgccctgct 2340 gaaagtctcc agctgtgaca agaacactgg ggactactat gaggacagct atgaggacat 2400 ctctgcctac ctgctgagca agaacaatgc cattgagccc aggagcttca gccagaatcc 2460 cccagtgctg aagaggcacc agagggagat caccaggacc accctgcagt ctgaccagga 2520 ggagattgac tatgatgaca ccatctctgt ggagatgaag aaggaggact ttgacatcta 2580 cgacgaggac gagaaccaga gccccaggag cttccagaag aagaccaggc actacttcat 2640 tgctgctgtg gagaggctgt gggactatgg catgagcagc agcccccatg tgctgaggaa 2700 cagggcccag tctggctctg tgccccagtt caagaaggtg gtgttccagg agttcactga 2760 tggcagcttc acccagcccc tgtacagagg ggagctgaat gagcacctgg gcctgctggg 2820 cccctacatc agggctgagg tggaggacaa catcatggtg accttcagga accaggccag 2880 caggccctac agcttctaca gcagcctgat cagctatgag gaggaccaga ggcagggggc 2940 tgagcccagg aagaactttg tgaagcccaa tgaaaccaag acctacttct ggaaggtgca 3000 gcaccacatg gcccccacca aggatgagtt tgactgcaag gcctgggcct acttctctga 3060 tgtggacctg gagaaggatg tgcactctgg cctgattggc cccctgctgg tgtgccacac 3120 caacaccctg aaccctgccc atggcaggca ggtgactgtg caggagtttg ccctgttctt 3180 caccatcttt gatgaaacca agagctggta cttcactgag aacatggaga ggaactgcag 3240 ggccccctgc aacatccaga tggaggaccc caccttcaag gagaactaca ggttccatgc 3300 catcaatggc tacatcatgg acaccctgcc tggcctggtg atggcccagg accagaggat 3360 caggtggtac ctgctgagca tgggcagcaa tgagaacatc cacagcatcc acttctctgg 3420 ccatgtgttc actgtgagga agaaggagga gtacaagatg gccctgtaca acctgtaccc 3480 tggggtgttt gagactgtgg agatgctgcc cagcaaggct ggcatctgga gggtggagtg 3540 cctgattggg gagcacctgc atgctggcat gagcaccctg ttcctggtgt acagcaacaa 3600 gtgccagacc cccctgggca tggcctctgg ccacatcagg gacttccaga tcactgcctc 3660 tggccagtat ggccagtggg cccccaagct ggccaggctg cactactctg gcagcatcaa 3720 tgcctggagc accaaggagc ccttcagctg gatcaaggtg gacctgctgg cccccatgat 3780 catccatggc atcaagaccc agggggccag gcagaagttc agcagcctgt acatcagcca 3840 gttcatcatc atgtacagcc tggatggcaa gaagtggcag acctacaggg gcaacagcac 3900 tggcaccctg atggtgttct ttggcaatgt ggacagctct ggcatcaagc acaacatctt 3960 caaccccccc atcattgcca gatacatcag gctgcacccc acccactaca gcatcaggag 4020 caccctgagg atggagctga tgggctgtga cctgaacagc tgcagcatgc ccctgggcat 4080 ggagagcaag gccatctctg atgcccagat cactgccagc agctacttca ccaacatgtt 4140 tgccacctgg agccccagca aggccaggct gcacctgcag ggcaggagca atgcctggag 4200 gccccaggtc aacaacccca aggagtggct gcaggtggac ttccagaaga ccatgaaggt 4260 gactggggtg accacccagg gggtgaagag cctgctgacc agcatgtatg tgaaggagtt 4320 cctgatcagc agcagccagg atggccacca gtggaccctg ttcttccaga atggcaaggt 4380 gaaggtgttc cagggcaacc aggacagctt cacccctgtg gtgaacagcc tggacccccc 4440 cctgctgacc agatacctga ggattcaccc ccagagctgg gtgcaccaga ttgccctgag 4500 gatggaggtg ctgggctgtg aggcccagga cctgtactga tcgcgaataa aagatcttta 4560 ttttcattag atctgtgtgt tggttttttg tgtggatctg ccagttcccg atcgttacag 4620 gcaattgcct taggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg 4680 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 4740 cggcctcagt gagcgagcga gcgcgcagct gcctgcagg 4779 <210> 342 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> modified B domain linker <400> 342 Phe Asn Ala Thr Thr Ile Gln Asn Val Ser Ser Asn Asn Ser Leu Ser 1 5 10 15 Asp Asn Thr Ser Ser Asn Asp Ser Lys Asn Val Ser Ser Pro 20 25 30 <210> 343 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> B domain substitute <400> 343 Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser Asn Asp Ser 1 5 10 <210> 344 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Terminal portion of sequence encoding signal peptide from Transferrin Exon 2 <400> 344 ggctgtgtct ggct 14 <210> 345 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> Variant FVIII B domain <400> 345 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Ser Pro Pro Val Leu Lys Arg His Gln Arg 20 25 30 <210> 346 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA2(DD) forward primer, mouse FGA intron <400> 346 ctggagtttc tgacacattc t 21 <210> 347 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> RSA56.R reverse primer <400> 347 gtgaactcca caaacagggt 20 <210> 348 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> TFR1(DD) reverse primer <400> 348 agtgaactcc acaaacaggg 20 <210> 349 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGAP2(DD) donor probe <400> 349 ccacagcccc caggtagtat 20 <210> 350 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGARefF2 (DD) forward primer <400> 350 gttgctgggg attgatccag 20 <210> 351 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGARefR2 (DD) reverse primer <400> 351 gttctcaacc tgtgggtcac 20 <210> 352 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGARefP2 (DD) probe <400> 352 tgttgtgatg acccgcaact 20 <210> 353 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> AlbF forward primer <400> 353 ccctccgttt gtcctagctt ttc 23 <210> 354 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> AlbR reverse primer <400> 354 ccagatacag aatatcttcc tcaacgcaga 30 <210> 355 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> forward primer <400> 355 cctttggcac aatgaagtgg 20 <210> 356 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> reverse primer <400> 356 gaatctgaac cctgatgaca ag 22 <210> 357 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> T4 <400> 357 taaagcatag tgcaatggat agg 23 <210> 358 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> T5 <400> 358 atttatgaga tcaacagcac agg 23 <210> 359 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> T11 <400> 359 ttaaataaag catagtgcaa tgg 23 <210> 360 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> T13 <400> 360 taataaaatt caaacatcct agg 23 <210> 361 <211> 4827 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> AAV8-pCB1010 <400> 361 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggcccgc ggcctgggta actaattagg atgtccggta 180 ctcctcaaag cgtactaaag aattattctt ttacatttca gaccgccacc aggagatact 240 acctgggggc tgtggagctg agctgggact acatgcagtc tgacctgggg gagctgcctg 300 tggatgccag gttccccccc agagtgccca agagcttccc cttcaacacc tctgtggtgt 360 acaagaagac cctgtttgtg gagttcactg accacctgtt caacattgcc aagcccaggc 420 ccccctggat gggcctgctg ggccccacca tccaggctga ggtgtatgac actgtggtga 480 tcaccctgaa gaacatggcc agccaccctg tgagcctgca tgctgtgggg gtgagctact 540 ggaaggcctc tgagggggct gagtatgatg accagaccag ccagagggag aaggaggatg 600 acaaggtgtt ccctgggggc agccacacct atgtgtggca ggtgctgaag gagaatggcc 660 ccatggcctc tgaccccctg tgcctgacct acagctacct gagccatgtg gacctggtga 720 aggacctgaa ctctggcctg attggggccc tgctggtgtg cagggagggc agcctggcca 780 aggagaagac ccagaccctg cacaagttca tcctgctgtt tgctgtgttt gatgagggca 840 agagctggca ctctgaaacc aagaacagcc tgatgcagga cagggatgct gcctctgcca 900 gggcctggcc caagatgcac actgtgaatg gctatgtgaa caggagcctg cctggcctga 960 ttggctgcca caggaagtct gtgtactggc atgtgattgg catgggcacc acccctgagg 1020 tgcacagcat cttcctggag ggccacacct tcctggtcag gaaccacagg caggccagcc 1080 tggagatcag ccccatcacc ttcctgactg cccagaccct gctgatggac ctgggccagt 1140 tcctgctgtt ctgccacatc agcagccacc agcatgatgg catggaggcc tatgtgaagg 1200 tggacagctg ccctgaggag ccccagctga ggatgaagaa caatgaggag gctgaggact 1260 atgatgatga cctgactgac tctgagatgg atgtggtgag gtttgatgat gacaacagcc 1320 ccagcttcat ccagatcagg tctgtggcca agaagcaccc caagacctgg gtgcactaca 1380 ttgctgctga ggaggaggac tgggactatg cccccctggt gctggcccct gatgacagga 1440 gctacaagag ccagtacctg aacaatggcc cccagaggat tggcaggaag tacaagaagg 1500 tcaggttcat ggcctacact gatgaaacct tcaagaccag ggaggccatc cagcatgagt 1560 ctggcatcct gggccccctg ctgtatgggg aggtggggga caccctgctg atcatcttca 1620 agaaccaggc cagcaggccc tacaacatct acccccatgg catcactgat gtgaggcccc 1680 tgtacagcag gaggctgccc aagggggtga agcacctgaa ggacttcccc atcctgcctg 1740 gggagatctt caagtacaag tggactgtga ctgtggagga tggccccacc aagtctgacc 1800 ccaggtgcct gaccagatac tacagcagct ttgtgaacat ggagagggac ctggcctctg 1860 gcctgattgg ccccctgctg atctgctaca aggagtctgt ggaccagagg ggcaaccaga 1920 tcatgtctga caagaggaat gtgatcctgt tctctgtgtt tgatgagaac aggagctggt 1980 acctgactga gaacatccag aggttcctgc ccaaccctgc tggggtgcag ctggaggacc 2040 ctgagttcca ggccagcaac atcatgcaca gcatcaatgg ctatgtgttt gacagcctgc 2100 agctgtctgt gtgcctgcat gaggtggcct actggtacat cctgagcatt ggggcccaga 2160 ctgacttcct gtctgtgttc ttctctggct acaccttcaa gcacaagatg gtgtatgagg 2220 acaccctgac cctgttcccc ttctctgggg agactgtgtt catgagcatg gagaaccctg 2280 gcctgtggat tctgggctgc cacaactctg acttcaggaa caggggcatg actgccctgc 2340 tgaaagtctc cagctgtgac aagaacactg gggactacta tgaggacagc tatgaggaca 2400 tctctgccta cctgctgagc aagaacaatg ccattgagcc caggagcttc agccagaatg 2460 ccactaatgt gtctaacaac agcaacacca gcaatgacag caatgtgtct cccccagtgc 2520 tgaagaggca ccagagggag atcaccagga ccaccctgca gtctgaccag gaggagattg 2580 actatgatga caccatctct gtggagatga agaaggagga ctttgacatc tacgacgagg 2640 acgagaacca gagccccagg agcttccaga agaagaccag gcactacttc attgctgctg 2700 tggagaggct gtgggactat ggcatgagca gcagccccca tgtgctgagg aacagggccc 2760 agtctggctc tgtgccccag ttcaagaagg tggtgttcca ggagttcact gatggcagct 2820 tcacccagcc cctgtacaga ggggagctga atgagcacct gggcctgctg ggcccctaca 2880 tcagggctga ggtggaggac aacatcatgg tgaccttcag gaaccaggcc agcaggccct 2940 acagcttcta cagcagcctg atcagctatg aggaggacca gaggcagggg gctgagccca 3000 ggaagaactt tgtgaagccc aatgaaacca agacctactt ctggaaggtg cagcaccaca 3060 tggcccccac caaggatgag tttgactgca aggcctgggc ctacttctct gatgtggacc 3120 tggagaagga tgtgcactct ggcctgattg gccccctgct ggtgtgccac accaacaccc 3180 tgaaccctgc ccatggcagg caggtgactg tgcaggagtt tgccctgttc ttcaccatct 3240 ttgatgaaac caagagctgg tacttcactg agaacatgga gaggaactgc agggccccct 3300 gcaacatcca gatggaggac cccaccttca aggagaacta caggttccat gccatcaatg 3360 gctacatcat ggacaccctg cctggcctgg tgatggccca ggaccagagg atcaggtggt 3420 acctgctgag catgggcagc aatgagaaca tccacagcat ccacttctct ggccatgtgt 3480 tcactgtgag gaagaaggag gagtacaaga tggccctgta caacctgtac cctggggtgt 3540 ttgagactgt ggagatgctg cccagcaagg ctggcatctg gagggtggag tgcctgattg 3600 gggagcacct gcatgctggc atgagcaccc tgttcctggt gtacagcaac aagtgccaga 3660 cccccctggg catggcctct ggccacatca gggacttcca gatcactgcc tctggccagt 3720 atggccagtg ggcccccaag ctggccaggc tgcactactc tggcagcatc aatgcctgga 3780 gcaccaagga gcccttcagc tggatcaagg tggacctgct ggcccccatg atcatccatg 3840 gcatcaagac ccagggggcc aggcagaagt tcagcagcct gtacatcagc cagttcatca 3900 tcatgtacag cctggatggc aagaagtggc agacctacag gggcaacagc actggcaccc 3960 tgatggtgtt ctttggcaat gtggacagct ctggcatcaa gcacaacatc ttcaaccccc 4020 ccatcattgc cagatacatc aggctgcacc ccacccacta cagcatcagg agcaccctga 4080 ggatggagct gatgggctgt gacctgaaca gctgcagcat gcccctgggc atggagagca 4140 aggccatctc tgatgcccag atcactgcca gcagctactt caccaacatg tttgccacct 4200 ggagccccag caaggccagg ctgcacctgc agggcaggag caatgcctgg aggccccagg 4260 tcaacaaccc caaggagtgg ctgcaggtgg acttccagaa gaccatgaag gtgactgggg 4320 tgaccaccca gggggtgaag agcctgctga ccagcatgta tgtgaaggag ttcctgatca 4380 gcagcagcca ggatggccac cagtggaccc tgttcttcca gaatggcaag gtgaaggtgt 4440 tccagggcaa ccaggacagc ttcacccctg tggtgaacag cctggacccc cccctgctga 4500 ccagatacct gaggattcac ccccagagct gggtgcacca gattgccctg aggatggagg 4560 tgctgggctg tgaggcccag gacctgtact gatcgcgaat aaaagatctt tattttcatt 4620 agatctgtgt gttggttttt tgtgtgcctg ggtaactaat taggatgtcc aattgcctta 4680 ggccgcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4740 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4800 gcgagcgagc gcgcagctgc ctgcagg 4827 <210> 362 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 3 glycan B domain substitute <400> 362 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Pro Pro Val 1 5 10 15 Leu Lys Arg His Gln Arg 20 <210> 363 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 4 glycan B domain substitute <400> 363 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Pro Pro Val Leu Lys Arg His Gln Arg 20 25 <210> 364 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 5 glycan B domain substitute <400> 364 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Pro Pro Val Leu Lys Arg His Gln Arg 20 25 <210> 365 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 6 glycan B domain substitute <400> 365 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Ser Pro Pro Val Leu Lys Arg His Gln Arg 20 25 30 <210> 366 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 6 glycan B domain substitute (S->T) <400> 366 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Thr Pro Pro Val Leu Lys Arg His Gln Arg 20 25 30 <210> 367 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 7 glycan B domain substitute <400> 367 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Ser Asn Lys Thr Pro Pro Val Leu Lys Arg His 20 25 30 Gln Arg <210> 368 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 8 glycan B domain substitute <400> 368 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Ser Asn Lys Thr Asn Asn Ser Pro Pro Val Leu 20 25 30 Lys Arg His Gln Arg 35 <210> 369 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 9 glycan B domain substitute <400> 369 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Ser Asn Lys Thr Asn Asn Ser Asn Ala Thr Pro 20 25 30 Pro Val Leu Lys Arg His Gln Arg 35 40 <210> 370 <211> 4448 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1030 <400> 370 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctcccccagt gctgaagagg caccagaggg 2340 agatcaccag gaccaccctg cagtctgacc aggaggagat tgactatgat gacaccatct 2400 ctgtggagat gaagaaggag gactttgaca tctacgacga ggacgagaac cagagcccca 2460 ggagcttcca gaagaagacc aggcactact tcattgctgc tgtggagagg ctgtgggact 2520 atggcatgag cagcagcccc catgtgctga ggaacagggc ccagtctggc tctgtgcccc 2580 agttcaagaa ggtggtgttc caggagttca ctgatggcag cttcacccag cccctgtaca 2640 gaggggagct gaatgagcac ctgggcctgc tgggccccta catcagggct gaggtggagg 2700 acaacatcat ggtgaccttc aggaaccagg ccagcaggcc ctacagcttc tacagcagcc 2760 tgatcagcta tgaggaggac cagaggcagg gggctgagcc caggaagaac tttgtgaagc 2820 ccaatgaaac caagacctac ttctggaagg tgcagcacca catggccccc accaaggatg 2880 agtttgactg caaggcctgg gcctacttct ctgatgtgga cctggagaag gatgtgcact 2940 ctggcctgat tggccccctg ctggtgtgcc acaccaacac cctgaaccct gcccatggca 3000 ggcaggtgac tgtgcaggag tttgccctgt tcttcaccat ctttgatgaa accaagagct 3060 ggtacttcac tgagaacatg gagaggaact gcagggcccc ctgcaacatc cagatggagg 3120 accccacctt caaggagaac tacaggttcc atgccatcaa tggctacatc atggacaccc 3180 tgcctggcct ggtgatggcc caggaccaga ggatcaggtg gtacctgctg agcatgggca 3240 gcaatgagaa catccacagc atccacttct ctggccatgt gttcactgtg aggaagaagg 3300 aggagtacaa gatggccctg tacaacctgt accctggggt gtttgagact gtggagatgc 3360 tgcccagcaa ggctggcatc tggagggtgg agtgcctgat tggggagcac ctgcatgctg 3420 gcatgagcac cctgttcctg gtgtacagca acaagtgcca gacccccctg ggcatggcct 3480 ctggccacat cagggacttc cagatcactg cctctggcca gtatggccag tgggccccca 3540 agctggccag gctgcactac tctggcagca tcaatgcctg gagcaccaag gagcccttca 3600 gctggatcaa ggtggacctg ctggccccca tgatcatcca tggcatcaag acccaggggg 3660 ccaggcagaa gttcagcagc ctgtacatca gccagttcat catcatgtac agcctggatg 3720 gcaagaagtg gcagacctac aggggcaaca gcactggcac cctgatggtg ttctttggca 3780 atgtggacag ctctggcatc aagcacaaca tcttcaaccc ccccatcatt gccagataca 3840 tcaggctgca ccccacccac tacagcatca ggagcaccct gaggatggag ctgatgggct 3900 gtgacctgaa cagctgcagc atgcccctgg gcatggagag caaggccatc tctgatgccc 3960 agatcactgc cagcagctac ttcaccaaca tgtttgccac ctggagcccc agcaaggcca 4020 ggctgcacct gcagggcagg agcaatgcct ggaggcccca ggtcaacaac cccaaggagt 4080 ggctgcaggt ggacttccag aagaccatga aggtgactgg ggtgaccacc cagggggtga 4140 agagcctgct gaccagcatg tatgtgaagg agttcctgat cagcagcagc caggatggcc 4200 accagtggac cctgttcttc cagaatggca aggtgaaggt gttccagggc aaccaggaca 4260 gcttcacccc tgtggtgaac agcctggacc cccccctgct gaccagatac ctgaggattc 4320 acccccagag ctgggtgcac cagattgccc tgaggatgga ggtgctgggc tgtgaggccc 4380 aggacctgta ctgatcgcga ataaaagatc tttattttca ttagatctgt gtgttggttt 4440 tttgtgtg 4448 <210> 371 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 1-glycan B domain substitute <400> 371 Ser Phe Ser Gln Asn Ala Thr Pro Pro Val Leu Lys Arg His Gln Arg 1 5 10 15 <210> 372 <211> 4457 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1029 <400> 372 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc tcccccagtg ctgaagaggc 2340 accagaggga gatcaccagg accaccctgc agtctgacca ggaggagatt gactatgatg 2400 acaccatctc tgtggagatg aagaaggagg actttgacat ctacgacgag gacgagaacc 2460 agagccccag gagcttccag aagaagacca ggcactactt cattgctgct gtggagaggc 2520 tgtgggacta tggcatgagc agcagccccc atgtgctgag gaacagggcc cagtctggct 2580 ctgtgcccca gttcaagaag gtggtgttcc aggagttcac tgatggcagc ttcacccagc 2640 ccctgtacag aggggagctg aatgagcacc tgggcctgct gggcccctac atcagggctg 2700 aggtggagga caacatcatg gtgaccttca ggaaccaggc cagcaggccc tacagcttct 2760 acagcagcct gatcagctat gaggaggacc agaggcaggg ggctgagccc aggaagaact 2820 ttgtgaagcc caatgaaacc aagacctact tctggaaggt gcagcaccac atggccccca 2880 ccaaggatga gtttgactgc aaggcctggg cctacttctc tgatgtggac ctggagaagg 2940 atgtgcactc tggcctgatt ggccccctgc tggtgtgcca caccaacacc ctgaaccctg 3000 cccatggcag gcaggtgact gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa 3060 ccaagagctg gtacttcact gagaacatgg agaggaactg cagggccccc tgcaacatcc 3120 agatggagga ccccaccttc aaggagaact acaggttcca tgccatcaat ggctacatca 3180 tggacaccct gcctggcctg gtgatggccc aggaccagag gatcaggtgg tacctgctga 3240 gcatgggcag caatgagaac atccacagca tccacttctc tggccatgtg ttcactgtga 3300 ggaagaagga ggagtacaag atggccctgt acaacctgta ccctggggtg tttgagactg 3360 tggagatgct gcccagcaag gctggcatct ggagggtgga gtgcctgatt ggggagcacc 3420 tgcatgctgg catgagcacc ctgttcctgg tgtacagcaa caagtgccag acccccctgg 3480 gcatggcctc tggccacatc agggacttcc agatcactgc ctctggccag tatggccagt 3540 gggcccccaa gctggccagg ctgcactact ctggcagcat caatgcctgg agcaccaagg 3600 agcccttcag ctggatcaag gtggacctgc tggcccccat gatcatccat ggcatcaaga 3660 cccagggggc caggcagaag ttcagcagcc tgtacatcag ccagttcatc atcatgtaca 3720 gcctggatgg caagaagtgg cagacctaca ggggcaacag cactggcacc ctgatggtgt 3780 tctttggcaa tgtggacagc tctggcatca agcacaacat cttcaacccc cccatcattg 3840 ccagatacat caggctgcac cccacccact acagcatcag gagcaccctg aggatggagc 3900 tgatgggctg tgacctgaac agctgcagca tgcccctggg catggagagc aaggccatct 3960 ctgatgccca gatcactgcc agcagctact tcaccaacat gtttgccacc tggagcccca 4020 gcaaggccag gctgcacctg cagggcagga gcaatgcctg gaggccccag gtcaacaacc 4080 ccaaggagtg gctgcaggtg gacttccaga agaccatgaa ggtgactggg gtgaccaccc 4140 agggggtgaa gagcctgctg accagcatgt atgtgaagga gttcctgatc agcagcagcc 4200 aggatggcca ccagtggacc ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca 4260 accaggacag cttcacccct gtggtgaaca gcctggaccc ccccctgctg accagatacc 4320 tgaggattca cccccagagc tgggtgcacc agattgccct gaggatggag gtgctgggct 4380 gtgaggccca ggacctgtac tgatcgcgaa taaaagatct ttattttcat tagatctgtg 4440 tgttggtttt ttgtgtg 4457 <210> 373 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 2-glycan B domain substitute <400> 373 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Pro Pro Val Leu Lys Arg 1 5 10 15 His Gln Arg SEQUENCE LISTING <110> CRISPR THERAPEUTICS AG BAYER HEALTHCARE LLC <120> GENE EDITING FOR HEMOPHILIA A WITH IMPROVED FACTOR VIII EXPRESSION <130> 105965-655734-021US1 <140> 16/849,796 <141> 2020-04-15 <150> 62/806,702 <151> 2019-02-15 <150> 62/857,782 <151> 2019-06-05 <160> 373 <170> PatentIn version 3.5 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T12 gRNA spacer <400> 1 aaggaagcgg tgccatcgag 20 <210> 2 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T168 gRNA spacer <400> 2 aacttctgcc tgccattcat 20 <210> 3 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T73 gRNA spacer <400> 3 agcaaagggt tttgataacc 20 <210> 4 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T99 gRNA spacer <400> 4 ttgcctggga gggtcaaatg 20 <210> 5 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T26 gRNA spacer <400> 5 ggcttggcca acgacaagca 20 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T111 gRNA spacer <400> 6 ccttgtgggc caccacagca 20 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T76 gRNA spacer <400> 7 gggcccactc cctatgctga 20 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T128 gRNA spacer <400> 8 tctgagtctg agccaataga 20 <210> 9 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T188 gRNA spacer <400> 9 cctgcctcca gagttcccat 20 <210> 10 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T151 gRNA spacer <400> 10 acagctctcc aggatgcatg 20 <210> 11 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T67 gRNA spacer <400> 11 ggcccatggg aaatcctagg 20 <210> 12 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T138 gRNA spacer <400> 12 agggtggtca gtaggaaact 20 <210> 13 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T115 gRNA spacer <400> 13 ccttgctgtg gtggcccaca 20 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T45 gRNA spacer <400> 14 ggtagcaagc caatgtgttg 20 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T180 gRNA spacer <400> 15 gcagattgtc atctccagct 20 <210> 16 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T148 gRNA spacer <400> 16 ccacagcaag gctgactcac 20 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T100 gRNA spacer <400> 17 actgaggctt atgttccat 20 <210> 18 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T66 gRNA spacer <400> 18 gggcaaaagc tcatgtgata 20 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T162 gRNA spacer <400> 19 atactgaggc ttatgttcca 20 <210> 20 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T175 gRNA spacer <400> 20 ccagtgagtc agccttgctg 20 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T172 gRNA spacer <400> 21 ggatttccca tgggccaaga 20 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T104 gRNA spacer <400> 22 gggtcaaatg agggtcagcg 20 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T19 gRNA spacer <400> 23 tcaactatgg aaaaccagcg 20 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T77 gRNA spacer <400> 24 cataagcctc agtatgcaca 20 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T62 gRNA spacer <400> 25 tatgttccat ggggggccag 20 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T106 gRNA spacer <400> 26 agggcccact ccctatgctg 20 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T163 gRNA spacer <400> 27 gctgtgggcc tcctctccac 20 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T134 gRNA spacer <400> 28 acaaatgccc catgaatggc 20 <210> 29 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T167 gRNA spacer <400> 29 gtggctgtca aggcctttct 20 <210> 30 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T61 gRNA spacer <400> 30 tcctgtccat gaacactaca 20 <210> 31 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T6 gRNA spacer <400> 31 agacagcatc gcccctagaa 20 <210> 32 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T44 gRNA spacer <400> 32 ccttcttggc cagtagttga 20 <210> 33 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T3 gRNA spacer <400> 33 aaggtcaccc tgcttgtcgt 20 <210> 34 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T68 gRNA spacer <400> 34 gagggaaaat gggggtcgct 20 <210> 35 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T103 gRNA spacer <400> 35 taggaggcaa cataagcctg 20 <210> 36 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T81 gRNA spacer <400> 36 aaaacgccct gtgcatactg 20 <210> 37 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T146 gRNA spacer <400> 37 gtgagtcagc cttgctgtgg 20 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T63 gRNA spacer <400> 38 ggctgtcaag gcctttctag 20 <210> 39 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T87 gRNA spacer <400> 39 aggtagcaag ccaatgtgtt 20 <210> 40 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T184 gRNA spacer <400> 40 gattgtcatc tccagctggg 20 <210> 41 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T116 gRNA spacer <400> 41 tcctggccgg ctcctcacca 20 <210> 42 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T24 gRNA spacer <400> 42 attctcgcct atgggaactc 20 <210> 43 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T21 gRNA spacer <400> 43 tggcttggcc aacgacaagc 20 <210> 44 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T41 gRNA spacer <400> 44 ttggcttgct acctcaacta 20 <210> 45 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T55 gRNA spacer <400> 45 gaggtagcaa gccaatgtgt 20 <210> 46 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T90 gRNA spacer <400> 46 aggagacaag gcggatacag 20 <210> 47 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T101 gRNA spacer <400> 47 gactctgggt ctgctactca 20 <210> 48 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T39 gRNA spacer <400> 48 ccgctggttt tccatagttg 20 <210> 49 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T150 gRNA spacer <400> 49 cctcaactat ggaaaaccag 20 <210> 50 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T156 gRNA spacer <400> 50 tggattttaa tagttaccca 20 <210> 51 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T40 gRNA spacer <400> 51 ggggataaag gcaagtaacg 20 <210> 52 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T8 gRNA spacer <400> 52 ccgggttgca gggaacgcgc 20 <210> 53 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T53 gRNA spacer <400> 53 cgcgcgggcc agcgactctg 20 <210> 54 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T117 gRNA spacer <400> 54 ctgaggctta tgttccatgg 20 <210> 55 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T49 gRNA spacer <400> 55 cggagtgcat gcaggctgcg 20 <210> 56 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T83 gRNA spacer <400> 56 acaggcttat gttgcctcct 20 <210> 57 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T64 gRNA spacer <400> 57 gggcatttgt cacactgttg 20 <210> 58 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T120 gRNA spacer <400> 58 tggcccctcc tcatgcatcc 20 <210> 59 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T161 gRNA spacer <400> 59 aaaatggagg gatagttcag 20 <210> 60 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T183 gRNA spacer <400> 60 tgtgacaaat gccccatgaa 20 <210> 61 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T182 gRNA spacer <400> 61 gtggtcagta ggaaactggg 20 <210> 62 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T119 gRNA spacer <400> 62 tgaggcttat gttccatggg 20 <210> 63 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T18 gRNA spacer <400> 63 gggataaagg caagtaacgt 20 <210> 64 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T107 gRNA spacer <400> 64 agggcaaaag ctcatgtgat 20 <210> 65 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T20 gRNA spacer <400> 65 gccatcgagc ggtcagagca 20 <210> 66 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T80 gRNA spacer <400> 66 ccctcaacta ctggccaaga 20 <210> 67 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T133 gRNA spacer <400> 67 cctcaactac tggccaagaa 20 <210> 68 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T84 gRNA spacer <400> 68 gagggtggtc agtaggaaac 20 <210> 69 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T85 gRNA spacer <400> 69 gtcgctgggg tggccatccc 20 <210> 70 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T143 gRNA spacer <400> 70 tggggagaga aaactaaacg 20 <210> 71 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T15 gRNA spacer <400> 71 cctgagcgcg gagtgcatgc 20 <210> 72 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T96 gRNA spacer <400> 72 gcgaccccca ttttccctct 20 <210> 73 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T118 gRNA spacer <400> 73 ctcaactatg gaaaaccagc 20 <210> 74 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T152 gRNA spacer <400> 74 gatccacaaa gcctgtggag 20 <210> 75 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T38 gRNA spacer <400> 75 ccccgcacag agcacttcac 20 <210> 76 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T132 gRNA spacer <400> 76 tgcaaggtaa tgctccactg 20 <210> 77 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T149 gRNA spacer <400> 77 aggggacgtc agcctctgaa 20 <210> 78 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T171 gRNA spacer <400> 78 agggaaaatg ggggtcgctg 20 <210> 79 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T30 gRNA spacer <400> 79 tgaggacaca ttctcgccta 20 <210> 80 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T71 gRNA spacer <400> 80 tgcctcctag gatttcccat 20 <210> 81 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T158 gRNA spacer <400> 81 cttggcccat gggaaatcct 20 <210> 82 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T36 gRNA spacer <400> 82 aggagttcgg acttgacaag 20 <210> 83 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T27 gRNA spacer <400> 83 acataagcct cagtatgcac 20 <210> 84 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T130 gRNA spacer <400> 84 caggacatct acagctccca 20 <210> 85 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T124 gRNA spacer <400> 85 gggccccacc tcaggaggtc 20 <210> 86 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T185 gRNA spacer <400> 86 aacgacaagc agggtgacct 20 <210> 87 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T79 gRNA spacer <400> 87 gcaggacatc tacagctccc 20 <210> 88 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T72 gRNA spacer <400> 88 cctgtgaagt gctctgtgcg 20 <210> 89 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T179 gRNA spacer <400> 89 tgcctgggag ggtcaaatga 20 <210> 90 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T170 gRNA spacer <400> 90 tggccatgcc tgcacccctc 20 <210> 91 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T181 gRNA spacer <400> 91 gccagcagag ggtggtcagt 20 <210> 92 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T42 gRNA spacer <400> 92 ctcctgtcca tgaacactac 20 <210> 93 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T114 gRNA spacer <400> 93 ggagtgggcc cttccacctc 20 <210> 94 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T23 gRNA spacer <400> 94 caactatgga aaaccagcgg 20 <210> 95 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T144 gRNA spacer <400> 95 tactgaggct tatgttccat 20 <210> 96 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T1 gRNA spacer <400> 96 cccatgctct gaccgctcga 20 <210> 97 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T186 gRNA spacer <400> 97 ctccccgacc tcctgaggtg 20 <210> 98 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T58 gRNA spacer <400> 98 ggggaatggt cagaccgggg 20 <210> 99 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T113 gRNA spacer <400> 99 cttgtgccct gtagtgttca 20 <210> 100 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T29 gRNA spacer <400> 100 cccgcgcgtt ccctgcaacc 20 <210> 101 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T2 gRNA spacer <400> 101 ccatcgagcg gtcagagcat 20 <210> 102 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T48 gRNA spacer <400> 102 gccctgtagt gttcatggac 20 <210> 103 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T17 gRNA spacer <400> 103 aaatcagagc acgtctaacc 20 <210> 104 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T153 gRNA spacer <400> 104 gcctgtgaag tgctctgtgc 20 <210> 105 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T60 gRNA spacer <400> 105 ctcgcctatg ggaactctgg 20 <210> 106 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T164 gRNA spacer <400> 106 ggccccacct caggaggtcg 20 <210> 107 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T47 gRNA spacer <400> 107 ccgcgcgttc cctgcaaccc 20 <210> 108 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T110 gRNA spacer <400> 108 tggctgtcaa ggcctttcta 20 <210> 109 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T177 gRNA spacer <400> 109 tggcagatgc tgagtaccag 20 <210> 110 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T13 gRNA spacer <400> 110 gttaatttac cctcaactac 20 <210> 111 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T7 gRNA spacer <400> 111 cctgcatgca ctccgcgctc 20 <210> 112 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T89 gRNA spacer <400> 112 gaccctcatt tgaccctccc 20 <210> 113 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T16 gRNA spacer <400> 113 ccattagggc aaccttctat 20 <210> 114 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T155 gRNA spacer <400> 114 atgcatgagg aggggccacc 20 <210> 115 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T108 gRNA spacer <400> 115 gtcagccact gccccatagc 20 <210> 116 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T160 gRNA spacer <400> 116 cctatgggaa ctctggaggc 20 <210> 117 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T139 gRNA spacer <400> 117 acttctgcct gccattcatg 20 <210> 118 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T11 gRNA spacer <400> 118 cggtggccgc ccgggttgca 20 <210> 119 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T169 gRNA spacer <400> 119 ggggacgtca gcctctgaaa 20 <210> 120 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T5 gRNA spacer <400> 120 gaggacacat tctcgcctat 20 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T131 gRNA spacer <400> 121 gcatggcatt caaggcctcc 20 <210> 122 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T22 gRNA spacer <400> 122 catcgagcgg tcagagcatg 20 <210> 123 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T126 gRNA spacer <400> 123 ctcaactact ggccaagaag 20 <210> 124 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T145 gRNA spacer <400> 124 ctgtggtggc ccacaaggag 20 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T187 gRNA spacer <400> 125 tctgctggcc agaggggtgc 20 <210> 126 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T112 gRNA spacer <400> 126 aggcgagaat gtgtcctcag 20 <210> 127 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T14 gRNA spacer <400> 127 gctcgatggc accgcttcct 20 <210> 128 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T70 gRNA spacer <400> 128 gtcctggccg gctcctcacc 20 <210> 129 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T57 gRNA spacer <400> 129 tttcagctac cccaacacat 20 <210> 130 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T4 gRNA spacer <400> 130 gggtagcacc gcagagtcgc 20 <210> 131 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T92 gRNA spacer <400> 131 cccttcttgg ccagtagttg 20 <210> 132 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T102 gRNA spacer <400> 132 aaaggggaat ggtcagaccc 20 <210> 133 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T159 gRNA spacer <400> 133 agctagcaat tccttgagag 20 <210> 134 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T10 gRNA spacer <400> 134 catgcactcc gcgctcaggc 20 <210> 135 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T157 gRNA spacer <400> 135 ttgcctccta ggatttccca 20 <210> 136 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T173 gRNA spacer <400> 136 catcacagca cttgcctggg 20 <210> 137 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T121 gRNA spacer <400> 137 tgatgacccc ctccctggtg 20 <210> 138 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T137 gRNA spacer <400> 138 agcagattgt catctccagc 20 <210> 139 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T98 gRNA spacer <400> 139 tcaaatgagg gtcagcgagg 20 <210> 140 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T141 gRNA spacer <400> 140 tggccggctc ctcaccaggg 20 <210> 141 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T50 gRNA spacer <400> 141 gatggcaatt cctccccccgc 20 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T94 gRNA spacer <400> 142 caaggaattg ctagcttatg 20 <210> 143 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T86 gRNA spacer <400> 143 taacgtgggg tcctctctca 20 <210> 144 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T35 gRNA spacer <400> 144 agtgctctgt gcggggataa 20 <210> 145 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T174 gRNA spacer <400> 145 cattttccct cttggcccat 20 <210> 146 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T97 gRNA spacer <400> 146 ttcactgctg caagattac 20 <210> 147 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T127 gRNA spacer <400> 147 gtgaggagcc ggccaggact 20 <210> 148 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T56 gRNA spacer <400> 148 atgttgcaca catcctgcta 20 <210> 149 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T65 gRNA spacer <400> 149 tcaaggaatt gctagcttat 20 <210> 150 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T123 gRNA spacer <400> 150 tcttggatcc aagtcctggc 20 <210> 151 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T59 gRNA spacer <400> 151 ttctgagtta caccccttct 20 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T129 gRNA spacer <400> 152 ttcagaggct gacgtcccct 20 <210> 153 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T9 gRNA spacer <400> 153 ccaatagaag gttgccctaa 20 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T122 gRNA spacer <400> 154 cactccccga cctcctgagg 20 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T31 gRNA spacer <400> 155 cgcgttccct gcaacccggg 20 <210> 156 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T28 gRNA spacer <400> 156 gatggcaccg cttccttggc 20 <210> 157 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T43 gRNA spacer <400> 157 tatgaagggg gccccacctc 20 <210> 158 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T125 gRNA spacer <400> 158 tgctgtgatg accccctccc 20 <210> 159 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T165 gRNA spacer <400> 159 cacatcctgc tatggggcag 20 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T82 gRNA spacer <400> 160 aggctgcgcg gtggccgccc 20 <210> 161 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T109 gRNA spacer <400> 161 tggggcattt gtcacactgt 20 <210> 162 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T52 gRNA spacer <400> 162 ctcaaggaat tgctagctta 20 <210> 163 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T34 gRNA spacer <400> 163 ctatggaaaa ccagcggggg 20 <210> 164 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T88 gRNA spacer <400> 164 tgttgcacac atcctgctat 20 <210> 165 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T51 gRNA spacer <400> 165 agagggaaaa tgggggtcgc 20 <210> 166 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T46 gRNA spacer <400> 166 cttatgttcc atggggggcc 20 <210> 167 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T178 gRNA spacer <400> 167 tctgaccatt cccctttcag 20 <210> 168 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T74 gRNA spacer <400> 168 ggggcatttg tcacactgtt 20 <210> 169 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T176 gRNA spacer <400> 169 ccgcgctcag gctggaagcc 20 <210> 170 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T54 gRNA spacer <400> 170 gcggtggccg cccgggttgc 20 <210> 171 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T32 gRNA spacer <400> 171 tgcttgtcgt tggccaagcc 20 <210> 172 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T136 gRNA spacer <400> 172 tccctggtga ggagccggcc 20 <210> 173 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T78 gRNA spacer <400> 173 ttatgttcca tggggggcca 20 <210> 174 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T154 gRNA spacer <400> 174 ttttaatagt tacccatggc 20 <210> 175 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T140 gRNA spacer <400> 175 ccaggcttcc agcctgagcg 20 <210> 176 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T93 gRNA spacer <400> 176 caggctgcgc ggtggccgcc 20 <210> 177 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T95 gRNA spacer <400> 177 atgtgtgcaa catctgccac 20 <210> 178 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T37 gRNA spacer <400> 178 agtgcatgca ggctgcgcgg 20 <210> 179 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T91 gRNA spacer <400> 179 actccccgac ctcctgaggt 20 <210> 180 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T166 gRNA spacer <400> 180 gaaaggggaa tggtcagacc 20 <210> 181 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T105 gRNA spacer <400> 181 cgcgctcagg ctggaagcct 20 <210> 182 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T142 gRNA spacer <400> 182 gtgtctagaa gcccaagcaa 20 <210> 183 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T25 gRNA spacer <400> 183 cccgggttgc agggaacgcg 20 <210> 184 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T135 gRNA spacer <400> 184 tttcagaggc tgacgtcccc 20 <210> 185 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T69 gRNA spacer <400> 185 gagctgtaga tgtcctgcca 20 <210> 186 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T147 gRNA spacer <400> 186 gggtcatcac agcacttgcc 20 <210> 187 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T33 gRNA spacer <400> 187 ggataaaggc aagtaacgtg 20 <210> 188 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Transferrin_T75 gRNA spacer <400> 188 tctccctcag catagggagt 20 <210> 189 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> mTF-T1 gRNA spacer <400> 189 taacaagcaa gacccgtcgc 20 <210> 190 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> mTF-T2 gRNA spacer <400> 190 gagaacgcac cactttacga 20 <210> 191 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> n is a, t, c, or g <220> <221> misc_feature <223> r is g or a <220> <221> misc_feature <223> Example target seq. with S. pyogenes Cas9 PAM <220> <221> misc_feature <222> (1)..(21) <223> n is a, c, g, or t <400> 191 nnnnnnnnnn nnnnnnnnnn nrg 23 <210> 192 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T61 gRNA spacer <400> 192 gattaaggag agcagacaca 20 <210> 193 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T30 gRNA spacer <400> 193 gagagtgtac aaactcacaa 20 <210> 194 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T57 gRNA spacer <400> 194 tatcttcaaa tggaaatcct 20 <210> 195 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T11 gRNA spacer <400> 195 accaaggctt tataggtaca 20 <210> 196 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T26 gRNA spacer <400> 196 ggcctgggag gaaatttcct 20 <210> 197 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T33 gRNA spacer <400> 197 ttattccaca aagagcctgg 20 <210> 198 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T20 gRNA spacer <400> 198 cttgacacct caagaataca 20 <210> 199 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T24 gRNA spacer <400> 199 atctcttcct ggggacttgt 20 <210> 200 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T27 gRNA spacer <400> 200 cacccaggaa atttcctccc 20 <210> 201 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T48 gRNA spacer <400> 201 aggcctggga ggaaatttcc 20 <210> 202 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T8 gRNA spacer <400> 202 actagcatta taatgcacca 20 <210> 203 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T56 gRNA spacer <400> 203 tacaagtccc caggaagaga 20 <210> 204 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T19 gRNA spacer <400> 204 tggcactctc acagagatta 20 <210> 205 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T67 gRNA spacer <400> 205 ttagccagaa gaggagacag 20 <210> 206 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T41 gRNA spacer <400> 206 gagagtgcca tctcttcctg 20 <210> 207 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T18 gRNA spacer <400> 207 gtgagagtgc catctcttcc 20 <210> 208 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T45 gRNA spacer <400> 208 agattaagga gagcagacac 20 <210> 209 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T66 gRNA spacer <400> 209 ggagttgtta tgagaattaa 20 <210> 210 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T4 gRNA spacer <400> 210 tggcatgcct acaagtcccc 20 <210> 211 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T5 gRNA spacer <400> 211 ttgaggtgtc aagcccaccc 20 <210> 212 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T69 gRNA spacer <400> 212 tatgagaatt aaaggagaca 20 <210> 213 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T54 gRNA spacer <400> 213 ggagagcaga cacagggctt 20 <210> 214 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T42 gRNA spacer <400> 214 tctgacctcc aggctctttg 20 <210> 215 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T23 gRNA spacer <400> 215 gcaggtagac tctgacctcc 20 <210> 216 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T29 gRNA spacer <400> 216 accaagagga agatcttaga 20 <210> 217 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T13 gRNA spacer <400> 217 tctactgaag cagcaattac 20 <210> 218 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T25 gRNA spacer <400> 218 tgagagtgcc atctcttcct 20 <210> 219 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T16 gRNA spacer <400> 219 tcagaagaga ttagttagta 20 <210> 220 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T22 gRNA spacer <400> 220 agtgtgtcag gacatagagc 20 <210> 221 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T44 gRNA spacer <400> 221 acagcaatgt tagccagaag 20 <210> 222 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T14 gRNA spacer <400> 222 aggctttata aggtacaagga 20 <210> 223 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T28 gRNA spacer <400> 223 cagggtaata tgacaccaag 20 <210> 224 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T7 gRNA spacer <400> 224 ataatgcacc aaggctttat 20 <210> 225 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T40 gRNA spacer <400> 225 tccatctaag atcttcctct 20 <210> 226 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T36 gRNA spacer <400> 226 aaatcctagg acccatttta 20 <210> 227 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T15 gRNA spacer <400> 227 acatcagtt aagatagtct 20 <210> 228 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T58 gRNA spacer <400> 228 catgccactg tctcctcttc 20 <210> 229 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T63 gRNA spacer <400> 229 tcataacaac tccataaaat 20 <210> 230 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T55 gRNA spacer <400> 230 ttctatgtaa cctttagaga 20 <210> 231 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T50 gRNA spacer <400> 231 ttaaaagaat accattactg 20 <210> 232 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T21 gRNA spacer <400> 232 catattaccc tgtattcttg 20 <210> 233 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T2 gRNA spacer <400> 233 gcttgacacc tcaagaatac 20 <210> 234 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T60 gRNA spacer <400> 234 aaggttacat agaaacttga 20 <210> 235 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T77 gRNA spacer <400> 235 gcaagaagaa aaaatgaaaa 20 <210> 236 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T10 gRNA spacer <400> 236 actcttagct ttatgacccc 20 <210> 237 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T64 gRNA spacer <400> 237 ctcataacaa ctccataaaa 20 <210> 238 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T3 gRNA spacer <400> 238 aatacgcttt tccgcagtaa 20 <210> 239 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T49 gRNA spacer <400> 239 gaaatttcct cccaggcctg 20 <210> 240 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T46 gRNA spacer <400> 240 ctgggaggaa atttcctggg 20 <210> 241 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T1 gRNA spacer <400> 241 acagggcttc ggcaagcttc 20 <210> 242 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T6 gRNA spacer <400> 242 tccttgtacc tataaagcct 20 <210> 243 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T37 gRNA spacer <400> 243 tgggaggaaa tttcctgggt 20 <210> 244 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T52 gRNA spacer <400> 244 actaaaagtt ctgcttatta 20 <210> 245 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T71 gRNA spacer <400> 245 ataagcattt gataaatatt 20 <210> 246 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T12 gRNA spacer <400> 246 aactccataa aatgggtcct 20 <210> 247 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T47 gRNA spacer <400> 247 aattatgaat ccatctctaa 20 <210> 248 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T43 gRNA spacer <400> 248 gttagtacag ttttgctgaa 20 <210> 249 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T39 gRNA spacer <400> 249 tgagagtgta caaactcaca 20 <210> 250 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T76 gRNA spacer <400> 250 aaacaaaaca aaacaaaatg 20 <210> 251 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T17 gRNA spacer <400> 251 tagctttatg accccaggcc 20 <210> 252 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T38 gRNA spacer <400> 252 tttatgaccc caggcctggg 20 <210> 253 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T51 gRNA spacer <400> 253 aaaagcaaac gaattatctt 20 <210> 254 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T9 gRNA spacer <400> 254 cataaagcta agagtgtgtc 20 <210> 255 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T62 gRNA spacer <400> 255 catagaaact tgaaggagag 20 <210> 256 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T74 gRNA spacer <400> 256 attcaaataa ttttcctttt 20 <210> 257 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T34 gRNA spacer <400> 257 tgcattataa tgctagttaa 20 <210> 258 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T70 gRNA spacer <400> 258 agtcattagt aaaaatgaaa 20 <210> 259 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T31 gRNA spacer <400> 259 tgtttattcc acaaagagcc 20 <210> 260 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T59 gRNA spacer <400> 260 tttaaagaat ccatcctaaa 20 <210> 261 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T72 gRNA spacer <400> 261 taatggaata aaacatttta 20 <210> 262 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T65 gRNA spacer <400> 262 aaataatttt ccttttagga 20 <210> 263 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T79 gRNA spacer <400> 263 gttttgtttt gttttaaaaa 20 <210> 264 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T32 gRNA spacer <400> 264 agctttatga ccccaggcct 20 <210> 265 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T68 gRNA spacer <400> 265 tcaggtttct tatcttcaaa 20 <210> 266 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T75 gRNA spacer <400> 266 agcaagaaga aaaaatgaaa 20 <210> 267 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T78 gRNA spacer <400> 267 tgttttgttt tgttttaaaa 20 <210> 268 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T35 gRNA spacer <400> 268 ggaaatttcc tcccaggcct 20 <210> 269 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T53 gRNA spacer <400> 269 aggaaatttc ctcccaggcc 20 <210> 270 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA Intron 1_T73 gRNA spacer <400> 270 ttttcttctt gctttctctc 20 <210> 271 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T1 <400> 271 taattttctt ttgcgcacta agg 23 <210> 272 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T2 <400> 272 tagtgcaatg gataggtctt tgg 23 <210> 273 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T3 <400> 273 agtgcaatgg ataggtcttt ggg 23 <210> 274 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T4 <400> 274 taaagcatag tgcaatggat agg 23 <210> 275 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T5 <400> 275 atttatgaga tcaacagcac agg 23 <210> 276 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T6 <400> 276 tgattcctac agaaaaactc agg 23 <210> 277 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T7 <400> 277 tgtatttgtg aagtcttaca agg 23 <210> 278 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T8 <400> 278 gactgaaact tcacagaata ggg 23 <210> 279 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T9 <400> 279 aatgcataat ctaagtcaaa tgg 23 <210> 280 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T10 <400> 280 tgactgaaac ttcacagaat agg 23 <210> 281 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T11 <400> 281 ttaaataaag catagtgcaa tgg 23 <210> 282 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T12 <400> 282 gatcaacagc acaggttttg tgg 23 <210> 283 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T13 <400> 283 taataaaatt caaacatcct agg 23 <210> 284 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T14 <400> 284 ttcattttag tctgtcttct tgg 23 <210> 285 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T15 <400> 285 attatctaag tttgaatata agg 23 <210> 286 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T16 <400> 286 atcatcctga gtttttctgt agg 23 <210> 287 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T17 <400> 287 gcatctttaa agaattattt tgg 23 <210> 288 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T18 <400> 288 tactaaaact ttattttact ggg 23 <210> 289 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T19 <400> 289 tgaattattc ttctgtttaa agg 23 <210> 290 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T20 <400> 290 aatttttaaa atagtattct tgg 23 <210> 291 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T21 <400> 291 atgcatttgt ttcaaaatat tgg 23 <210> 292 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T22 <400> 292 tttggcattt atttctaaaa tgg 23 <210> 293 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T23 <400> 293 aaagttgaac aatagaaaaa tgg 23 <210> 294 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T24 <400> 294 ttactaaaac tttattttac tgg 23 <210> 295 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T26 <400> 295 tgcatttgtt tcaaaatatt ggg 23 <210> 296 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T27 <400> 296 tgggcaaggg aagaaaaaaa agg 23 <210> 297 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T28 <400> 297 tcctaggtaa aaaaaaaaaa agg 23 <210> 298 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Human Albumin Intron-1_T25 <400> 298 accttttttt ttttttacct agg 23 <210> 299 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Exemplary gRNA spacer <400> 299 uaauuuucuu uugcgcacua 20 <210> 300 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> N-terminal sequence <400> 300 Asp Ala His Ala Thr Arg Arg Tyr Tyr 1 5 <210> 301 <211> 4402 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8A <400> 301 aattgctgac ctcttctctt cctcccacag tggccaccag aagatactac ctcggagccg 60 tcgaattgag ctgggattac atgcaatccg acctgggaga actgcccgtg gatgccaggt 120 ttcctcctcg ggtccccaag tccttcccgt tcaacacctc agtcgtctac aagaaaaccc 180 tcttcgtgga gttcaccgac catctgttca acatcgccaa gccaagaccc ccgtggatgg 240 gactcctcgg tccgaccatc caagccgaag tgtacgacac tgtggtcatt accctgaaga 300 acatggcctc ccatcctgtg tccctgcatg cagtgggcgt gtcctactgg aaggcttccg 360 aaggggccga gtacgacgat caaaccagcc agcgggaaaa ggaggatgac aaagtgttcc 420 cgggtggttc gcacacctac gtgtggcaag tgctcaagga gaacggtcct atggcctctg 480 atcccctgtg tctgacctac tcctacctgt cccatgtcga cctcgtgaag gatctgaaca 540 gcgggctgat tggcgccctg ctcgtgtgcc gggaaggctc cctggccaag gaaaagaccc 600 agacactgca caagttcatc ttgctgttcg ccgtgtttga tgagggaaag tcctggcata 660 gcgagactaa gaactccctt atgcaagacc gggatgctgc ctccgctagg gcttggccta 720 agatgcatac tgtgaacgga tacgtgaaca gatccctgcc tggccttatc ggttgccacc 780 ggaagtccgt gtattggcat gtgatcggca tgggaaccac tccagaggtg cactccattt 840 tcttggaggg gcataccttc ttggtgcgca accacagaca ggcctccctg gaaatttctc 900 cgatcacttt cctgactgcc cagaccctcc ttatggacct gggtcagttc ctgctgttct 960 gccacatttc gtccccaccaa cacgatggca tggaagccta cgtgaaagtg gactcgtgcc 1020 cggaagaacc acagctgcgg atgaagaaca acgaagaggc agaggactac gatgatgatc 1080 ttaccgattc ggaaatggat gtggtccgat tcgacgacga taatagccca tccttcatcc 1140 aaattaggag cgtggccaag aagcacccca aaacttgggt gcattacatt gcggccgagg 1200 aagaggattg ggactacgca cccctcgtgc ttgcacccga tgatcggtcc tacaagtccc 1260 aatacctgaa caacggcccg cagaggatcg gtcggaagta taagaaagtg cgcttcatgg 1320 cctacaccga cgagactttc aagaccagag aggccattca gcacgaaagc ggcattctgg 1380 ggccgctgtt gtacggggag gtcggagata cactgctcat cattttcaag aaccaggcgt 1440 ccagacccta caacatctac ccgcacggaa tcactgacgt ccgccccctg tactcccgga 1500 gactcccgaa gggagtcaag cacttgaaag acttccccat cctgcctggg gaaatcttca 1560 agtacaagtg gaccgtgacc gtcgaggatg ggccgaccaa gtccgatcca agatgcctca 1620 ctagatacta ctcatccttc gtcaacatgg aacgggacct ggcctcagga ctgattggcc 1680 ccctgctcat ctgctacaag gagtccgtgg atcagcgcgg aaaccagatc atgtcggaca 1740 aacgcaacgt catcctcttc tccgtctttg acgagaaccg ctcatggtac cttacggaga 1800 acatccagcg gttcctcccc aaccctgccg gagtgcagct cgaggacccg gaattccagg 1860 catcaaacat tatgcactcc atcaacggtt acgtgttcga cagcctccag cttagcgtgt 1920 gcctccatga agtcgcatat tggtacatcc tgtccattgg agcacaaacc gactttctct 1980 ccgtgttctt ctccggatat accttcaagc acaagatggt gtacgaggat accctgaccc 2040 tcttcccctt ctccggagag actgtgttta tgtcgatgga aaacccaggc ctgtggattt 2100 tggggtgcca caactcggat ttccgaaacc ggggcatgac tgccttgctc aaggtgtcct 2160 cctgtgacaa gaacacggga gactactacg aggactccta cgaggatatt tccgcctacc 2220 tcctgtccaa gaacaacgcc atcgaaccca ggtccttcag ccagaaccct cctgtcctca 2280 agcgccatca gagagaaatc acccgcacga ccctgcagtc cgaccaggaa gagatcgatt 2340 acgacgacac tatctccgtc gaaatgaaga aggaggactt tgacatctac gacgaagatg 2400 aaaatcagtc ccctcgctcg ttccaaaaga aaacgagaca ctacttcatc gctgctgtgg 2460 agcggctctg ggactacggc atgtcctcat cgccccacgt gcttaggaac cgggctcaat 2520 ccgggagcgt ccctcagttc aagaaagtgg tgtttcaaga attcaccgat ggaagcttca 2580 cgcagccgtt gtacaggggc gaactgaacg agcaccttgg cctgctggga ccttacatca 2640 gagcagaggt cgaggacaac atcatggtga ccttccggaa ccaagcctcc cggccatatt 2700 cattctactc gagccttatc tcatacgagg aggatcagag acagggggct gaacctcgga 2760 agaacttcgt caagccgaac gagacaaaga cctacttttg gaaggtgcag caccacatgg 2820 ccccgaccaa ggatgagttc gactgcaagg cctgggcgta cttctccgac gtggatctcg 2880 aaaaggacgt gcattccggg ctgatcggac cgctgctcgt ctgccacact aacaccctca 2940 atcctgctca cggcagacaa gtgaccgtgc aggagttcgc cctgttcttc accatcttcg 3000 acgaaactaa gtcatggtac tttaccgaga acatggagcg gaattgtcgg gccccatgta 3060 acatccagat ggaggacccg acattcaagg agaactaccg gttccacgcc attaacggat 3120 acattatgga cactcttccg ggactcgtga tggcacagga ccaacgcatc agatggtatc 3180 ttctgtcgat ggggagcaac gaaaacatcc attcgatcca ctttagcggt cacgtgttca 3240 cagtgcgcaa gaaggaagag tacaagatgg cgctgtacaa cctgtaccct ggggtgttcg 3300 agactgtgga aatgctgccg tccaaggccg gaatttggcg cgtggaatgt ctgatcggtg 3360 aacatctgca tgccggaatg tccaccctgt tcctggtgta ctccaacaag tgccaaaccc 3420 cactgggaat ggcatcagga cacattagag acttccagat taccgcgagc ggacagtacg 3480 gacaatgggc ccccaagttg gccaggctgc actactctgg aagcattaac gcctggagca 3540 ccaaggagcc gttcagctgg atcaaggtgg accttctggc gccaatgatc atccacggaa 3600 ttaagactca gggagcccgc cagaagttct catcgctcta catctcccag tttatcatca 3660 tgtactcact ggatgggaag aagtggcaga cttaccgggg aaattccacc ggtactctga 3720 tggtgttctt cggaaacgtg gacagctccg gcatcaagca caatatcttt aacccgccta 3780 tcatcgcccg atacatccgg ctccacccga ctcactactc catccggtcg actctgcgga 3840 tggaactcat gggttgcgac ctcaactcct gctcaatgcc actgggcatg gagtccaagg 3900 ctatctcgga cgctcagatt actgcatcgt cgtactttac caacatgttc gctacctggt 3960 ccccgtccaa agcccggctg catctccaag gcagatcaaa cgcgtggagg cctcaggtca 4020 acaacccgaa ggaatggctt caggtcgact tccaaaagac catgaaagtc accggagtga 4080 ccacccaggg cgtgaaatcg ctgctgacct ctatgtacgt gaaggaattc ctgatctcat 4140 caagccagga cggccaccag tggacactgt tcttccaaaa tggaaaggtc aaggtctttc 4200 agggaaatca agactccttc acccccgtgg tgaactccct ggacccccct ctgcttaccc 4260 gctacttgcg cattcatccg caatcctggg tgcaccagat cgccctgcga atggaagtgc 4320 tgggctgtga agcgcaggac ctgtactaaa ataaaagatc tttattttca tagatctgt 4380 gtgttggttt tttgtgtgcc gc 4402 <210> 302 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> n = a, t, c, or g <220> <221> misc_feature <223> y = t or c <220> <221> misc_feature <223> r = a or g <220> <221> misc_feature <223> Branch site consensus sequence <220> <221> misc_feature <222> (2)..(2) <223> n is a, c, g, or t <400> 302 ynyyray 7 <210> 303 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> synthetic splice acceptor <400> 303 ctgacctctt ctcttcctcc cacag 25 <210> 304 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> native albumin intron 1/exon 2 splice acceptor, human <400> 304 ttaacaatcc ttttttttct tcccttgccc ag 32 <210> 305 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> native albumin intron 1/exon 2 splice acceptor, mouse <400> 305 ttaaatatgt tgtgtggttt ttctctccct gtttccacag 40 <210> 306 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> consensus synthetic poly A signal <400> 306 aataaaagat ctttattttc attagatctg tgtgttggtt ttttgtgtg 49 <210> 307 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Native splice acceptor sequence from human Factor IX gene intron 1/exon 2 boundary <400> 307 actaaagaat tattctttta catttcag 28 <210> 308 <211> 4502 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8B <400> 308 aattgaactt tgagtgtagc agagaggaac cattgccacc ttcagatttt aatgtctgac 60 ctcttctctt cctcccacag tggccaccag aagatactac ctcggagccg tcgaattgag 120 ctgggattac atgcaatccg acctgggaga actgcccgtg gatgccaggt ttcctcctcg 180 ggtccccaag tccttcccgt tcaacacctc agtcgtctac aagaaaaccc tcttcgtgga 240 gttcaccgac catctgttca acatcgccaa gccaagaccc ccgtggatgg gactcctcgg 300 tccgaccatc caagccgaag tgtacgacac tgtggtcatt accctgaaga acatggcctc 360 ccatcctgtg tccctgcatg cagtgggcgt gtcctactgg aaggcttccg aaggggccga 420 gtacgacgat caaaccagcc agcgggaaaa ggaggatgac aaagtgttcc cgggtggttc 480 gcacacctac gtgtggcaag tgctcaagga gaacggtcct atggcctctg atcccctgtg 540 tctgacctac tcctacctgt cccatgtcga cctcgtgaag gatctgaaca gcgggctgat 600 tggcgccctg ctcgtgtgcc gggaaggctc cctggccaag gaaaagaccc agacactgca 660 caagttcatc ttgctgttcg ccgtgtttga tgagggaaag tcctggcata gcgagactaa 720 gaactccctt atgcaagacc gggatgctgc ctccgctagg gcttggccta agatgcatac 780 tgtgaacgga tacgtgaaca gatccctgcc tggccttatc ggttgccacc ggaagtccgt 840 gtattggcat gtgatcggca tgggaaccac tccagaggtg cactccattt tcttggaggg 900 gcataccttc ttggtgcgca accacagaca ggcctccctg gaaatttctc cgatcacttt 960 cctgactgcc cagaccctcc ttatggacct gggtcagttc ctgctgttct gccacatttc 1020 gtcccaccaa cacgatggca tggaagccta cgtgaaagtg gactcgtgcc cggaagaacc 1080 acagctgcgg atgaagaaca acgaagaggc agaggactac gatgatgatc ttaccgattc 1140 ggaaatggat gtggtccgat tcgacgacga taatagccca tccttcatcc aaattaggag 1200 cgtggccaag aagcacccca aaacttgggt gcattacatt gcggccgagg aagaggattg 1260 ggactacgca cccctcgtgc ttgcacccga tgatcggtcc tacaagtccc aatacctgaa 1320 caacggcccg cagaggatcg gtcggaagta taagaaagtg cgcttcatgg cctacaccga 1380 cgagactttc aagaccagag aggccattca gcacgaaagc ggcattctgg ggccgctgtt 1440 gtacggggag gtcggagata cactgctcat cattttcaag aaccaggcgt ccagacccta 1500 caacatctac ccgcacggaa tcactgacgt ccgccccctg tactcccgga gactcccgaa 1560 gggagtcaag cacttgaaag acttccccat cctgcctggg gaaatcttca agtacaagtg 1620 gaccgtgacc gtcgaggatg ggccgaccaa gtccgatcca agatgcctca ctagatacta 1680 ctcatccttc gtcaacatgg aacgggacct ggcctcagga ctgattggcc ccctgctcat 1740 ctgctacaag gagtccgtgg atcagcgcgg aaaccagatc atgtcggaca aacgcaacgt 1800 catcctcttc tccgtctttg acgagaaccg ctcatggtac cttacggaga acatccagcg 1860 gttcctcccc aaccctgccg gagtgcagct cgaggacccg gaattccagg catcaaacat 1920 tatgcactcc atcaacggtt acgtgttcga cagcctccag cttagcgtgt gcctccatga 1980 agtcgcatat tggtacatcc tgtccattgg agcacaaacc gactttctct ccgtgttctt 2040 ctccggatat accttcaagc acaagatggt gtacgaggat accctgaccc tcttcccctt 2100 ctccggagag actgtgttta tgtcgatgga aaacccaggc ctgtggattt tggggtgcca 2160 caactcggat ttccgaaacc ggggcatgac tgccttgctc aaggtgtcct cctgtgacaa 2220 gaacacggga gactactacg aggactccta cgaggatatt tccgcctacc tcctgtccaa 2280 gaacaacgcc atcgaaccca ggtccttcag ccagaaccct cctgtcctca agcgccatca 2340 gagagaaatc acccgcacga ccctgcagtc cgaccaggaa gagatcgatt acgacgacac 2400 tatctccgtc gaaatgaaga aggaggactt tgacatctac gacgaagatg aaaatcagtc 2460 ccctcgctcg ttccaaaaga aaacgagaca ctacttcatc gctgctgtgg agcggctctg 2520 ggactacggc atgtcctcat cgccccacgt gcttaggaac cgggctcaat ccgggagcgt 2580 ccctcagttc aagaaagtgg tgtttcaaga attcaccgat ggaagcttca cgcagccgtt 2640 gtacaggggc gaactgaacg agcaccttgg cctgctggga ccttacatca gagcagaggt 2700 cgaggacaac atcatggtga ccttccggaa ccaagcctcc cggccatatt cattctactc 2760 gagccttatc tcatacgagg aggatcagag acagggggct gaacctcgga agaacttcgt 2820 caagccgaac gagacaaaga cctacttttg gaaggtgcag caccacatgg ccccgaccaa 2880 ggatgagttc gactgcaagg cctgggcgta cttctccgac gtggatctcg aaaaggacgt 2940 gcattccggg ctgatcggac cgctgctcgt ctgccacact aacaccctca atcctgctca 3000 cggcagacaa gtgaccgtgc aggagttcgc cctgttcttc accatcttcg acgaaactaa 3060 gtcatggtac tttaccgaga acatggagcg gaattgtcgg gccccatgta acatccagat 3120 ggaggacccg acatcaagg agaactaccg gttccacgcc attaacggat acattatgga 3180 cactcttccg ggactcgtga tggcacagga ccaacgcatc agatggtatc ttctgtcgat 3240 ggggagcaac gaaaacatcc attcgatcca ctttagcggt cacgtgttca cagtgcgcaa 3300 gaaggaagag tacaagatgg cgctgtacaa cctgtaccct ggggtgttcg agactgtgga 3360 aatgctgccg tccaaggccg gaatttggcg cgtggaatgt ctgatcggtg aacatctgca 3420 tgccggaatg tccaccctgt tcctggtgta ctccaacaag tgccaaaccc cactgggaat 3480 ggcatcagga cacattagag acttccagat taccgcgagc ggacagtacg gacaatgggc 3540 ccccaagttg gccaggctgc actactctgg aagcattaac gcctggagca ccaaggagcc 3600 gttcagctgg atcaaggtgg accttctggc gccaatgatc atccacggaa ttaagactca 3660 gggagcccgc cagaagttct catcgctcta catctcccag tttatcatca tgtactcact 3720 ggatgggaag aagtggcaga cttaccgggg aaattccacc ggtactctga tggtgttctt 3780 cggaaacgtg gacagctccg gcatcaagca caatatcttt aacccgccta tcatcgcccg 3840 atacatccgg ctccacccga ctcactactc catccggtcg actctgcgga tggaactcat 3900 gggttgcgac ctcaactcct gctcaatgcc actgggcatg gagtccaagg ctatctcgga 3960 cgctcagatt actgcatcgt cgtactttac caacatgttc gctacctggt ccccgtccaa 4020 agcccggctg catctccaag gcagatcaaa cgcgtggagg cctcaggtca acaacccgaa 4080 ggaatggctt caggtcgact tccaaaagac catgaaagtc accggagtga ccacccaggg 4140 cgtgaaatcg ctgctgacct ctatgtacgt gaaggaattc ctgatctcat caagccagga 4200 cggccaccag tggacactgt tcttccaaaa tggaaaggtc aaggtctttc agggaaatca 4260 agactccttc acccccgtgg tgaactccct ggacccccct ctgcttaccc gctacttgcg 4320 cattcatccg caatcctggg tgcaccagat cgccctgcga atggaagtgc tgggctgtga 4380 agcgcaggac ctgtactaaa ataaaagatc tttattttca tagatctgt gtgttggttt 4440 tttgtgtgcg atcgggaact ggcatcttca gggagtagct taggtcagtg aagagaagcc 4500 gc 4502 <210> 309 <211> 4567 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> MAB8C <400> 309 gcggcctaag gcaattgtgc cagttcccga tcgttacagg aactttgagt gtagcagaga 60 ggaaccattg ccaccttcag attttaatgt ctgacctctt ctcttcctcc cacagtggcc 120 accagaagat actacctcgg agccgtcgaa ttgagctggg attacatgca atccgacctg 180 ggagaactgc ccgtggatgc caggtttcct cctcgggtcc ccaagtcctt cccgttcaac 240 acctcagtcg tctacaagaa aaccctcttc gtggagttca ccgaccatct gttcaacatc 300 gccaagccaa gacccccgtg gatgggactc ctcggtccga ccatccaagc cgaagtgtac 360 gacactgtgg tcattaccct gaagaacatg gcctcccatc ctgtgtccct gcatgcagtg 420 ggcgtgtcct actggaaggc ttccgaaggg gccgagtacg acgatcaaac cagccagcgg 480 gaaaaggagg atgacaaagt gttcccgggt ggttcgcaca cctacgtgtg gcaagtgctc 540 aaggagaacg gtcctatggc ctctgatccc ctgtgtctga cctactccta cctgtcccat 600 gtcgacctcg tgaaggatct gaacagcggg ctgattggcg ccctgctcgt gtgccgggaa 660 ggctccctgg ccaaggaaaa gacccagaca ctgcacaagt tcatcttgct gttcgccgtg 720 tttgatgagg gaaagtcctg gcatagcgag actaagaact cccttatgca agaccgggat 780 gctgcctccg ctagggcttg gcctaagatg catactgtga acggatacgt gaacagatcc 840 ctgcctggcc ttatcggttg ccaccggaag tccgtgtatt ggcatgtgat cggcatggga 900 accactccag aggtgcactc cattttcttg gaggggcata ccttcttggt gcgcaaccac 960 agacaggcct ccctggaaat ttctccgatc actttcctga ctgcccagac cctccttatg 1020 gacctgggtc agttcctgct gttctgccac atttcgtccc accaacacga tggcatggaa 1080 gcctacgtga aagtggactc gtgcccggaa gaaccacagc tgcggatgaa gaacaacgaa 1140 gaggcagagg actacgatga tgatcttacc gattcggaaa tggatgtggt ccgattcgac 1200 gacgataata gcccatcctt catccaaatt aggagcgtgg ccaagaagca ccccaaaact 1260 tgggtgcatt acatgcggc cgaggaagag gattgggact acgcacccct cgtgcttgca 1320 cccgatgatc ggtcctacaa gtcccaatac ctgaacaacg gcccgcagag gatcggtcgg 1380 aagtataaga aagtgcgctt catggcctac accgacgaga ctttcaagac cagagaggcc 1440 attcagcacg aaagcggcat tctggggccg ctgttgtacg gggaggtcgg agatacactg 1500 ctcatcattt tcaagaacca ggcgtccaga ccctacaaca tctacccgca cggaatcact 1560 gacgtccgcc ccctgtactc ccggagactc ccgaagggag tcaagcactt gaaagacttc 1620 cccatcctgc ctggggaaat cttcaagtac aagtggaccg tgaccgtcga ggatgggccg 1680 accaagtccg atccaagatg cctcactaga tactactcat ccttcgtcaa catggaacgg 1740 gacctggcct caggactgat tggccccctg ctcatctgct acaaggagtc cgtggatcag 1800 cgcggaaacc agatcatgtc ggacaaacgc aacgtcatcc tcttctccgt ctttgacgag 1860 aaccgctcat ggtaccttac ggagaacatc cagcggttcc tccccaaccc tgccggagtg 1920 cagctcgagg acccggaatt ccaggcatca aacattatgc actccatcaa cggttacgtg 1980 ttcgacagcc tccagcttag cgtgtgcctc catgaagtcg catattggta catcctgtcc 2040 attggagcac aaaccgactt tctctccgtg ttcttctccg gatatacctt caagcacaag 2100 atggtgtacg aggataccct gaccctcttc cccttctccg gagagactgt gtttatgtcg 2160 atggaaaacc caggcctgtg gattttgggg tgccacaact cggatttccg aaaccggggc 2220 atgactgcct tgctcaaggt gtcctcctgt gacaagaaca cgggagacta ctacgaggac 2280 tcctacgagg atatttccgc ctacctcctg tccaagaaca acgccatcga acccaggtcc 2340 ttcagccaga accctcctgt cctcaagcgc catcagagag aaatcacccg cacgaccctg 2400 cagtccgacc aggaagagat cgattacgac gacactatct ccgtcgaaat gaagaaggag 2460 gactttgaca tctacgacga agatgaaaat cagtcccctc gctcgttcca aaagaaaacg 2520 agacactact tcatcgctgc tgtggagcgg ctctgggact acggcatgtc ctcatcgccc 2580 cacgtgctta ggaaccgggc tcaatccggg agcgtccctc agttcaagaa agtggtgttt 2640 caagaattca ccgatggaag cttcaggcag ccgttgtaca ggggcgaact gaacgagcac 2700 cttggcctgc tgggacctta catcagagca gaggtcgagg acaacatcat ggtgaccttc 2760 cggaaccaag cctcccggcc atattcattc tactcgagcc ttatctcata cgaggaggat 2820 cagagacagg gggctgaacc tcggaagaac ttcgtcaagc cgaacgagac aaagacctac 2880 ttttggaagg tgcagcacca catggccccg accaaggatg agttcgactg caaggcctgg 2940 gcgtacttct ccgacgtgga tctcgaaaag gacgtgcatt ccgggctgat cggaccgctg 3000 ctcgtctgcc acactaacac cctcaatcct gctcacggca gacaagtgac cgtgcaggag 3060 ttcgccctgt tcttcaccat cttcgacgaa actaagtcat ggtactttac cgagaacatg 3120 gagcggaatt gtcgggcccc atgtaacatc cagatggagg acccgacatt caaggagaac 3180 taccggttcc acgccattaa cggatacatt atggacactc ttccgggact cgtgatggca 3240 caggaccaac gcatcagatg gtatcttctg tcgatgggga gcaacgaaaa catccattcg 3300 atccacttta gcggtcacgt gttcacagtg cgcaagaagg aagagtacaa gatggcgctg 3360 tacaacctgt accctggggt gttcgagact gtggaaatgc tgccgtccaa ggccggaatt 3420 tggcgcgtgg aatgtctgat cggtgaacat ctgcatgccg gaatgtccac cctgttcctg 3480 gtgtactcca acaagtgcca aaccccactg ggaatggcat caggacacat tagagacttc 3540 cagattaccg cgagcggaca gtacggacaa tgggccccca agttggccag gctgcactac 3600 tctggaagca ttaacgcctg gagcaccaag gagccgttca gctggatcaa ggtggacctt 3660 ctggcgccaa tgatcatcca cggaattaag actcagggag cccgccagaa gttctcatcg 3720 ctctacatct cccagtttat catcatgtac tcactggatg ggaagaagtg gcagacttac 3780 cggggaaatt ccaccggtac tctgatggtg ttcttcggaa acgtggacag ctccggcatc 3840 aagcacaata tctttaaccc gcctatcatc gcccgataca tccggctcca cccgactcac 3900 tactccatcc ggtcgactct gcggatggaa ctcatgggtt gcgacctcaa ctcctgctca 3960 atgccactgg gcatggagtc caaggctatc tcggacgctc agattactgc atcgtcgtac 4020 tttaccaaca tgttcgctac ctggtccccg tccaaagccc ggctgcatct ccaaggcaga 4080 tcaaacgcgt ggaggcctca ggtcaacaac ccgaaggaat ggcttcaggt cgacttccaa 4140 aagaccatga aagtcaccgg agtgaccacc cagggcgtga aatcgctgct gacctctatg 4200 tacgtgaagg aattcctgat ctcatcaagc caggacggcc accagtggac actgttcttc 4260 caaaatggaa aggtcaaggt ctttcaggga aatcaagact ccttcacccc cgtggtgaac 4320 tccctggacc cccctctgct tacccgctac ttgcgcattc atccgcaatc ctgggtgcac 4380 cagatcgccc tgcgaatgga agtgctgggc tgtgaagcgc aggacctgta ctaaaataaa 4440 agatctttat tttcattaga tctgtgtgtt ggttttttgt gtgcgatcgg gaactggcat 4500 cttcagggag tagcttaggt cagtgaagag aagtgccagt tcccgatcgt tacaggccgc 4560 gggccgc 4567 <210> 310 <211> 4838 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1009 (FVIII donor for integration intro Transferrin intron 1) <400> 310 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag gggatggcca 120 actccatcac taggggttcc tgcggcccgc gggagaacgc accactttac gaaggcggta 180 ctcctcaaag cgtactaaag aattattctt ttacatttca gggctgtgtc tggctgccac 240 caggagatac tacctggggg ctgtggagct gagctgggac tacatgcagt ctgacctggg 300 ggagctgcct gtggatgcca ggttcccccc cagagtgccc aagagcttcc ccttcaacac 360 ctctgtggtg tacaagaaga ccctgtttgt ggagttcact gaccacctgt tcaacattgc 420 caagcccagg cccccctgga tgggcctgct gggccccacc atccaggctg aggtgtatga 480 cactgtggtg atcaccctga agaacatggc cagccaccct gtgagcctgc atgctgtggg 540 ggtgagctac tggaaggcct ctgagggggc tgagtatgat gaccagacca gccagaggga 600 gaaggaggat gacaaggtgt tccctggggg cagccacacc tatgtgtggc aggtgctgaa 660 ggagaatggc cccatggcct ctgaccccct gtgcctgacc tacagctacc tgagccatgt 720 ggacctggtg aaggacctga actctggcct gattggggcc ctgctggtgt gcagggaggg 780 cagcctggcc aaggagaaga cccagaccct gcacaagttc atcctgctgt ttgctgtgtt 840 tgatgagggc aagagctggc actctgaaac caagaacagc ctgatgcagg acagggatgc 900 tgcctctgcc agggcctggc ccaagatgca cactgtgaat ggctatgtga acaggagcct 960 gcctggcctg attggctgcc acaggaagtc tgtgtactgg catgtgattg gcatgggcac 1020 cacccctgag gtgcacagca tcttcctgga gggccacacc ttcctggtca ggaaccacag 1080 gcaggccagc ctggagatca gcccccatcac cttcctgact gcccagaccc tgctgatgga 1140 cctgggccag ttcctgctgt tctgccacat cagcagccac cagcatgatg gcatggaggc 1200 ctatgtgaag gtggacagct gccctgagga gccccagctg aggatgaaga acaatgagga 1260 ggctgaggac tatgatgatg acctgactga ctctgagatg gatgtggtga ggtttgatga 1320 tgacaacagc cccagcttca tccagatcag gtctgtggcc aagaagcacc ccaagacctg 1380 ggtgcactac attgctgctg aggaggagga ctgggactat gcccccctgg tgctggcccc 1440 tgatgacagg agctacaaga gccagtacct gaacaatggc ccccagagga ttggcaggaa 1500 gtacaagaag gtcaggttca tggcctacac tgatgaaacc ttcaagacca gggaggccat 1560 ccagcatgag tctggcatcc tgggccccct gctgtatggg gaggtggggg acaccctgct 1620 gatcatcttc aagaaccagg ccagcaggcc ctacaacatc tacccccatg gcatcactga 1680 tgtgaggccc ctgtacagca ggaggctgcc caagggggtg aagcacctga aggacttccc 1740 catcctgcct ggggagatct tcaagtacaa gtggactgtg actgtggagg atggccccac 1800 caagtctgac cccaggtgcc tgaccagata ctacagcagc tttgtgaaca tggagaggga 1860 cctggcctct ggcctgattg gccccctgct gatctgctac aaggagtctg tggaccagag 1920 gggcaaccag atcatgtctg acaagaggaa tgtgatcctg ttctctgtgt ttgatgagaa 1980 caggagctgg tacctgactg agaacatcca gaggttcctg cccaaccctg ctggggtgca 2040 gctggaggac cctgagttcc aggccagcaa catcatgcac agcatcaatg gctatgtgtt 2100 tgacagcctg cagctgtctg tgtgcctgca tgaggtggcc tactggtaca tcctgagcat 2160 tggggcccag actgacttcc tgtctgtgtt cttctctggc tacaccttca agcacaagat 2220 ggtgtatgag gacaccctga ccctgttccc cttctctggg gagactgtgt tcatgagcat 2280 ggagaaccct ggcctgtgga ttctgggctg ccacaactct gacttcagga acaggggcat 2340 gactgccctg ctgaaagtct ccagctgtga caagaacact ggggactact atgaggacag 2400 ctatgaggac atctctgcct acctgctgag caagaacaat gccattgagc ccaggagctt 2460 cagccagaat gccactaatg tgtctaacaa cagcaacacc agcaatgaca gcaatgtgtc 2520 tcccccagtg ctgaagaggc accagaggga gatcaccagg accaccctgc agtctgacca 2580 ggaggagatt gactatgatg acaccatctc tgtggagatg aagaaggagg actttgacat 2640 ctacgacgag gacgagaacc agagccccag gagcttccag aagaagacca ggcactactt 2700 cattgctgct gtggagaggc tgtgggacta tggcatgagc agcagccccc atgtgctgag 2760 gaacagggcc cagtctggct ctgtgcccca gttcaagaag gtggtgttcc aggagttcac 2820 tgatggcagc ttcacccagc ccctgtacag aggggagctg aatgagcacc tgggcctgct 2880 gggcccctac atcagggctg aggtggagga caacatcatg gtgaccttca ggaaccaggc 2940 cagcaggccc tacagcttct acagcagcct gatcagctat gaggaggacc agaggcaggg 3000 ggctgagccc aggaagaact ttgtgaagcc caatgaaacc aagacctact tctggaaggt 3060 gcagcaccac atggccccca ccaaggatga gtttgactgc aaggcctggg cctacttctc 3120 tgatgtggac ctggagaagg atgtgcactc tggcctgatt ggccccctgc tggtgtgcca 3180 caccaacacc ctgaaccctg cccatggcag gcaggtgact gtgcaggagt ttgccctgtt 3240 cttcaccatc tttgatgaaa ccaagagctg gtacttcact gagaacatgg agaggaactg 3300 cagggccccc tgcaacatcc agatggagga ccccaccttc aaggagaact acaggttcca 3360 tgccatcaat ggctacatca tggacaccct gcctggcctg gtgatggccc aggaccagag 3420 gatcaggtgg tacctgctga gcatgggcag caatgagaac atccacagca tccacttctc 3480 tggccatgtg ttcactgtga ggaagaagga ggagtacaag atggccctgt acaacctgta 3540 ccctggggtg tttgagactg tggagatgct gcccagcaag gctggcatct ggagggtgga 3600 gtgcctgatt ggggagcacc tgcatgctgg catgagcacc ctgttcctgg tgtacagcaa 3660 caagtgccag acccccctgg gcatggcctc tggccacatc agggacttcc agatcactgc 3720 ctctggccag tatggccagt gggcccccaa gctggccagg ctgcactact ctggcagcat 3780 caatgcctgg agcaccaagg agcccttcag ctggatcaag gtggacctgc tggcccccat 3840 gatcatccat ggcatcaaga cccagggggc caggcagaag ttcagcagcc tgtacatcag 3900 ccagttcatc atcatgtaca gcctggatgg caagaagtgg cagacctaca ggggcaacag 3960 cactggcacc ctgatggtgt tctttggcaa tgtggacagc tctggcatca agcacaacat 4020 cttcaacccc cccatcattg ccagatacat caggctgcac cccacccact acagcatcag 4080 gagcaccctg aggatggagc tgatgggctg tgacctgaac agctgcagca tgcccctggg 4140 catggagagc aaggccatct ctgatgccca gatcactgcc agcagctact tcaccaacat 4200 gtttgccacc tggagcccca gcaaggccag gctgcacctg cagggcagga gcaatgcctg 4260 gaggccccag gtcaacaacc ccaaggagtg gctgcaggtg gacttccaga agaccatgaa 4320 ggtgactggg gtgaccaccc agggggtgaa gagcctgctg accagcatgt atgtgaagga 4380 gttcctgatc agcagcagcc aggatggcca ccagtggacc ctgttcttcc agaatggcaa 4440 ggtgaaggtg ttccagggca accaggacag cttcacccct gtggtgaaca gcctggaccc 4500 ccccctgctg accagatacc tgaggattca cccccagagc tgggtgcacc agattgccct 4560 gaggatggag gtgctgggct gtgaggccca ggacctgtac tgatcgcgaa taaaagatct 4620 ttattttcat tagatctgtg tgttggtttt ttgtgtggag aacgcaccac tttacgaagg 4680 caattgcctt aggccgcagg aacccctagt gatggagttg gccactccct ctctgcgcgc 4740 tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga cgcccgggct ttgcccgggc 4800 ggcctcagtg agcgagcgag cgcgcagctg cctgcagg 4838 <210> 311 <211> 4830 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB099 (FVIII donor for integration into albumin intron 1) <400> 311 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag gggatggcca 120 actccatcac taggggttcc tgcggcctaa ggcaattgcc tgtaacgatc gggaactggc 180 agatccacac aaaaaaccaa cacacagatc taatgaaaat aaagatcttt tattcgcgat 240 cagtacaggt cctgggcctc acagcccagc acctccatcc tcagggcaat ctggtgcacc 300 cagctctggg ggtgaatcct caggtatctg gtcagcaggg gggggtccag gctgttcacc 360 acaggggtga agctgtcctg gttgccctgg aacaccttca ccttgccatt ctggaagaac 420 agggtccact ggtggccatc ctggctgctg ctgatcagga actccttcac atacatgctg 480 gtcagcaggc tcttcacccc ctgggtggtc accccagtca ccttcatggt cttctggaag 540 tccacctgca gccactcctt ggggttgttg acctggggcc tccaggcatt gctcctgccc 600 tgcaggtgca gcctggcctt gctggggctc caggtggcaa acatgttggt gaagtagctg 660 ctggcagtga tctgggcatc agagatggcc ttgctctcca tgcccagggg catgctgcag 720 ctgttcaggt cacagcccat cagctccatc ctcagggtgc tcctgatgct gtagtgggtg 780 gggtgcagcc tgatgtatct ggcaatgatg ggggggttga agatgttgtg cttgatgcca 840 gagctgtcca cattgccaaa gaacaccatc agggtgccag tgctgttgcc cctgtaggtc 900 tgccacttct tgccatccag gctgtacatg atgatgaact ggctgatgta caggctgctg 960 aacttctgcc tggccccctg ggtcttgatg ccatggatga tcatgggggc cagcaggtcc 1020 accttgatcc agctgaaggg ctccttggtg ctccaggcat tgatgctgcc agagtagtgc 1080 agcctggcca gcttgggggc ccactggcca tactggccag aggcagtgat ctggaagtcc 1140 ctgatgtggc cagaggccat gcccaggggg gtctggcact tgttgctgta caccaggaac 1200 agggtgctca tgccagcatg caggtgctcc ccaatcaggc actccaccct ccagatgcca 1260 gccttgctgg gcagcatctc cacagtctca aacaccccag ggtacaggtt gtacagggcc 1320 atcttgtact cctccttctt cctcacagtg aacacatggc cagagaagtg gatgctgtgg 1380 atgttctcat tgctgcccat gctcagcagg taccacctga tcctctggtc ctgggccatc 1440 accaggccag gcagggtgtc catgatgtag ccattgatgg catggaacct gtagttctcc 1500 ttgaaggtgg ggtcctccat ctggatgttg cagggggccc tgcagttcct ctccatgttc 1560 tcagtgaagt accagctctt ggtttcatca aagatggtga agaacagggc aaactcctgc 1620 acagtcacct gcctgccatg ggcagggttc agggtgttgg tgtggcacac cagcaggggg 1680 ccaatcaggc cagagtgcac atccttctcc aggtccacat cagagaagta ggcccaggcc 1740 ttgcagtcaa actcatcctt ggtgggggcc atgtggtgct gcaccttcca gaagtaggtc 1800 ttggtttcat tgggcttcac aaagttcttc ctgggctcag ccccctgcct ctggtcctcc 1860 tcatagctga tcaggctgct gtagaagctg tagggcctgc tggcctggtt cctgaaggtc 1920 accatgatgt tgtcctccac ctcagccctg atgtaggggc ccagcaggcc caggtgctca 1980 ttcagctccc ctctgtacag gggctgggtg aagctgccat cagtgaactc ctggaacacc 2040 accttcttga actggggcac agagccagac tgggccctgt tcctcagcac atgggggctg 2100 ctgctcatgc catagtccca cagcctctcc acagcagcaa tgaagtagtg cctggtcttc 2160 ttctggaagc tcctggggct ctggttctcg tcctcgtcgt agatgtcaaa gtcctccttc 2220 ttcatctcca cagagatggt gtcatcatag tcaatctcct cctggtcaga ctgcagggtg 2280 gtcctggtga tctccctctg gtgcctcttc agcactgggg gagacacatt gctgtcattg 2340 ctggtgttgc tgttgttaga cacattagtg gcattctggc tgaagctcct gggctcaatg 2400 gcattgttct tgctcagcag gtaggcagag atgtcctcat agctgtcctc atagtagtcc 2460 ccagtgttct tgtcacagct ggagactttc agcagggcag tcatgcccct gttcctgaag 2520 tcagagttgt ggcagcccag aatccacagg ccagggttct ccatgctcat gaacacagtc 2580 tccccagaga aggggaacag ggtcagggtg tcctcataca ccatcttgtg cttgaaggtg 2640 tagccagaga agaacacaga caggaagtca gtctgggccc caatgctcag gatgtaccag 2700 taggccacct catgcaggca cacagacagc tgcaggctgt caaacacata gccattgatg 2760 ctgtgcatga tgttgctggc ctggaactca gggtcctcca gctgcacccc agcagggttg 2820 ggcaggaacc tctggatgtt ctcagtcagg taccagctcc tgttctcatc aaacacagag 2880 aacaggatca cattcctctt gtcagacatg atctggttgc ccctctggtc cacagactcc 2940 ttgtagcaga tcagcagggg gccaatcagg ccagaggcca ggtccctctc catgttcaca 3000 aagctgctgt agtatctggt caggcacctg gggtcagact tggtggggcc atcctccaca 3060 gtcacagtcc acttgtactt gaagatctcc ccaggcagga tggggaagtc cttcaggtgc 3120 ttcaccccct tgggcagcct cctgctgtac aggggcctca catcagtgat gccatggggg 3180 tagatgttgt agggcctgct ggcctggttc ttgaagatga tcagcagggt gtccccccacc 3240 tccccataca gcagggggcc caggatgcca gactcatgct ggatggcctc cctggtcttg 3300 aaggtttcat cagtgtaggc catgaacctg accttcttgt acttcctgcc aatcctctgg 3360 gggccattgt tcaggtactg gctcttgtag ctcctgtcat caggggccag caccaggggg 3420 gcatagtccc agtcctcctc ctcagcagca atgtagtgca cccaggtctt ggggtgcttc 3480 ttggccacag acctgatctg gatgaagctg gggctgttgt catcatcaaa cctcaccaca 3540 tccatctcag agtcagtcag gtcatcatca tagtcctcag cctcctcatt gttcttcatc 3600 ctcagctggg gctcctcagg gcagctgtcc accttcacat aggcctccat gccatcatgc 3660 tggtggctgc tgatgtggca gaacagcagg aactggccca ggtccatcag cagggtctgg 3720 gcagtcagga aggtgatggg gctgatctcc aggctggcct gcctgtggtt cctgaccagg 3780 aaggtgtggc cctccaggaa gatgctgtgc acctcagggg tggtgcccat gccaatcaca 3840 tgccagtaca cagacttcct gtggcagcca atcaggccag gcaggctcct gttcacatag 3900 ccattcacag tgtgcatctt gggccaggcc ctggcagagg cagcatccct gtcctgcatc 3960 aggctgttct tggtttcaga gtgccagctc ttgccctcat caaacacagc aaacagcagg 4020 atgaacttgt gcagggtctg ggtcttctcc ttggccaggc tgccctccct gcacaccagc 4080 agggccccaa tcaggccaga gttcaggtcc ttcaccaggt ccacatggct caggtagctg 4140 taggtcaggc acagggggtc agaggccatg gggccattct ccttcagcac ctgccacaca 4200 taggtgtggc tgcccccagg gaacaccttg tcatcctcct tctccctctg gctggtctgg 4260 tcatcatact cagccccctc agaggccttc cagtagctca cccccacagc atgcaggctc 4320 acagggtggc tggccatgtt cttcagggtg atcaccacag tgtcatacac ctcagcctgg 4380 atggtggggc ccagcaggcc catccagggg ggcctgggct tggcaatgtt gaacaggtgg 4440 tcagtgaact ccacaaacag ggtcttcttg tacaccacag aggtgttgaa ggggaagctc 4500 ttgggcactc tgggggggaa cctggcatcc acaggcagct cccccaggtc agactgcatg 4560 tagtcccagc tcagctccac agcccccagg tagtatctcc tggtggccac tgaaatgtaa 4620 aagaataatt ctttagtacg ctttgaggag taccgcctgt aacgatcggg aactggcacc 4680 gcgggccgca ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 4740 tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg gcggcctcag 4800 tgagcgagcg agcgcgcagc tgcctgcagg 4830 <210> 312 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> n = a, t, c, or g <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(4) <223> n is a, c, g, or t <400> 312 nnnngatt 8 <210> 313 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> n = a, t, c, or g <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(5) <223> n is a, c, g, or t <400> 313 nnnnngttt 9 <210> 314 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> n = a, t, c, or g <220> <221> misc_feature <223> Neisseria meningitidis PAM <220> <221> misc_feature <222> (1)..(4) <223> n is a, c, g, or t <400> 314 nnnnngctt 8 <210> 315 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> Structural classification for homing endonuclease (HE) <400> 315 Leu Ala Gly Leu Ile Asp Ala Asp Gly 1 5 <210> 316 <211> 4488 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB076 <400> 316 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagcaa tgtgtctccc ccagtgctga agaggcacca gagggagatc accaggacca 2400 ccctgcagtc tgaccaggag gagattgact atgatgacac catctctgtg gagatgaaga 2460 aggaggactt tgacatctac gacgaggacg agaaccagag ccccaggagc ttccagaaga 2520 agaccaggca ctacttcatt gctgctgtgg agaggctgtg ggactatggc atgagcagca 2580 gcccccatgt gctgaggaac agggcccagt ctggctctgt gccccagttc aagaaggtgg 2640 tgttccagga gttcactgat ggcagcttca cccagcccct gtacagaggg gagctgaatg 2700 agcacctggg cctgctgggc ccctacatca gggctgaggt ggaggacaac atcatggtga 2760 ccttcaggaa ccaggccagc aggccctaca gcttctacag cagcctgatc agctatgagg 2820 aggaccagag gcagggggct gagcccagga agaactttgt gaagcccaat gaaaccaaga 2880 cctacttctg gaaggtgcag caccacatgg cccccaccaa ggatgagttt gactgcaagg 2940 cctgggccta cttctctgat gtggacctgg agaaggatgt gcactctggc ctgattggcc 3000 ccctgctggt gtgccacacc aacaccctga accctgccca tggcaggcag gtgactgtgc 3060 aggagtttgc cctgttcttc accatctttg atgaaaccaa gagctggtac ttcactgaga 3120 acatggagag gaactgcagg gccccctgca acatccagat ggaggacccc accttcaagg 3180 agaactacag gttccatgcc atcaatggct acatcatgga caccctgcct ggcctggtga 3240 tggcccagga ccagaggatc aggtggtacc tgctgagcat gggcagcaat gagaacatcc 3300 acagcatcca cttctctggc catgtgttca ctgtgaggaa gaaggaggag tacaagatgg 3360 ccctgtacaa cctgtaccct ggggtgtttg agactgtgga gatgctgccc agcaaggctg 3420 gcatctggag ggtggagtgc ctgattgggg agcacctgca tgctggcatg agcaccctgt 3480 tcctggtgta cagcaacaag tgccagaccc ccctgggcat ggcctctggc cacatcaggg 3540 acttccagat cactgcctct ggccagtatg gccagtgggc ccccaagctg gccaggctgc 3600 actactctgg cagcatcaat gcctggagca ccaaggagcc cttcagctgg atcaaggtgg 3660 acctgctggc ccccatgatc atccatggca tcaagaccca gggggccagg cagaagttca 3720 gcagcctgta catcagccag ttcatcatca tgtacagcct ggatggcaag aagtggcaga 3780 cctacagggg caacagcact ggcaccctga tggtgttctt tggcaatgtg gacagctctg 3840 gcatcaagca caacatcttc aaccccccca tcattgccag atacatcagg ctgcacccca 3900 cccactacag catcaggagc accctgagga tggagctgat gggctgtgac ctgaacagct 3960 gcagcatgcc cctgggcatg gagagcaagg ccatctctga tgcccagatc actgccagca 4020 gctacttcac caacatgttt gccacctgga gccccagcaa ggccaggctg cacctgcagg 4080 gcaggagcaa tgcctggagg ccccaggtca acaaccccaa ggagtggctg caggtggact 4140 tccagaagac catgaaggtg actggggtga ccacccaggg ggtgaagagc ctgctgacca 4200 gcatgtatgt gaaggagttc ctgatcagca gcagccagga tggccaccag tggaccctgt 4260 tcttccagaa tggcaaggtg aaggtgttcc agggcaacca ggacagcttc acccctgtgg 4320 tgaacagcct ggaccccccc ctgctgacca gatacctgag gattcacccc cagagctggg 4380 tgcaccagat tgccctgagg atggaggtgc tgggctgtga ggcccaggac ctgtactgaa 4440 ataaaagatc tttattttca tagatctgt gtgttggttt tttgtgtg 4488 <210> 317 <211> 4493 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB077 <400> 317 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagcaa tgtgtctccc ccagtgctga agaggcacca gagggagatc accaggacca 2400 ccctgcagtc tgaccaggag gagattgact atgatgacac catctctgtg gagatgaaga 2460 aggaggactt tgacatctac gacgaggacg agaaccagag ccccaggagc ttccagaaga 2520 agaccaggca ctacttcatt gctgctgtgg agaggctgtg ggactatggc atgagcagca 2580 gcccccatgt gctgaggaac agggcccagt ctggctctgt gccccagttc aagaaggtgg 2640 tgttccagga gttcactgat ggcagcttca cccagcccct gtacagaggg gagctgaatg 2700 agcacctggg cctgctgggc ccctacatca gggctgaggt ggaggacaac atcatggtga 2760 ccttcaggaa ccaggccagc aggccctaca gcttctacag cagcctgatc agctatgagg 2820 aggaccagag gcagggggct gagcccagga agaactttgt gaagcccaat gaaaccaaga 2880 cctacttctg gaaggtgcag caccacatgg cccccaccaa ggatgagttt gactgcaagg 2940 cctgggccta cttctctgat gtggacctgg agaaggatgt gcactctggc ctgattggcc 3000 ccctgctggt gtgccacacc aacaccctga accctgccca tggcaggcag gtgactgtgc 3060 aggagtttgc cctgttcttc accatctttg atgaaaccaa gagctggtac ttcactgaga 3120 acatggagag gaactgcagg gccccctgca acatccagat ggaggacccc accttcaagg 3180 agaactacag gttccatgcc atcaatggct acatcatgga caccctgcct ggcctggtga 3240 tggcccagga ccagaggatc aggtggtacc tgctgagcat gggcagcaat gagaacatcc 3300 acagcatcca cttctctggc catgtgttca ctgtgaggaa gaaggaggag tacaagatgg 3360 ccctgtacaa cctgtaccct ggggtgtttg agactgtgga gatgctgccc agcaaggctg 3420 gcatctggag ggtggagtgc ctgattgggg agcacctgca tgctggcatg agcaccctgt 3480 tcctggtgta cagcaacaag tgccagaccc ccctgggcat ggcctctggc cacatcaggg 3540 acttccagat cactgcctct ggccagtatg gccagtgggc ccccaagctg gccaggctgc 3600 actactctgg cagcatcaat gcctggagca ccaaggagcc cttcagctgg atcaaggtgg 3660 acctgctggc ccccatgatc atccatggca tcaagaccca gggggccagg cagaagttca 3720 gcagcctgta catcagccag ttcatcatca tgtacagcct ggatggcaag aagtggcaga 3780 cctacagggg caacagcact ggcaccctga tggtgttctt tggcaatgtg gacagctctg 3840 gcatcaagca caacatcttc aaccccccca tcattgccag atacatcagg ctgcacccca 3900 cccactacag catcaggagc accctgagga tggagctgat gggctgtgac ctgaacagct 3960 gcagcatgcc cctgggcatg gagagcaagg ccatctctga tgcccagatc actgccagca 4020 gctacttcac caacatgttt gccacctgga gccccagcaa ggccaggctg cacctgcagg 4080 gcaggagcaa tgcctggagg ccccaggtca acaaccccaa ggagtggctg caggtggact 4140 tccagaagac catgaaggtg actggggtga ccacccaggg ggtgaagagc ctgctgacca 4200 gcatgtatgt gaaggagttc ctgatcagca gcagccagga tggccaccag tggaccctgt 4260 tcttccagaa tggcaaggtg aaggtgttcc agggcaacca ggacagcttc acccctgtgg 4320 tgaacagcct ggaccccccc ctgctgacca gatacctgag gattcacccc cagagctggg 4380 tgcaccagat tgccctgagg atggaggtgc tgggctgtga ggcccaggac ctgtactgat 4440 cgcgaataaa agatctttat tttcattaga tctgtgtgtt ggttttttgt gtg 4493 <210> 318 <211> 4437 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB080 <400> 318 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccaga aggtactacc tgggagctgt ggaactgagc tgggactaca 120 tgcagtctga cctgggagag ctgcctgtgg atgctagatt tcctccaaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaaaaccct gtttgtggaa ttcacagacc 240 acctgttcaa tattgccaag cctagacctc cttggatggg cctgctgggc cctacaattc 300 aggctgaggt gtatgacaca gtggtcatca ccctgaagaa catggccagc catcctgtgt 360 ctctgcatgc tgtgggagtg tcttactgga aggcttctga gggggctgag tatgatgacc 420 agacaagcca gagagagaaa gaggatgaca aggttttccc tgggggcagc cacacctatg 480 tctggcaggt cctgaaagaa aatggcccta tggcctctga tcctctgtgc ctgacataca 540 gctacctgag ccatgtggac ctggtcaagg acctgaactc tggcctgatt ggggctctgc 600 tggtgtgtag agaaggcagc ctggccaaag aaaagaccca gacactgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgagacaaag aacagcctga 720 tgcaggacag agatgctgcc tctgctagag cttggcccaa gatgcacaca gtgaatggct 780 atgtgaacag aagcctgcct ggactgattg gatgccacag aaagtctgtg tactggcatg 840 tgattggcat gggcaccaca cctgaggtgc acagcatctt tctggaagga cacaccttcc 900 tggtgaggaa ccacagacag gccagcctgg aaatcagccc tatcaccttc ctgacagctc 960 agaccctgct gatggatctg ggccagtttc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaagcctat gtgaaggtgg acagctgccc tgaagaaccc cagctgagaa 1080 tgaagaacaa tgaggaagct gaggactatg atgatgacct gacagactct gagatggatg 1140 tggtcagatt tgatgatgat aacagcccca gcttcatcca gatcagatct gtggccaaga 1200 agcaccccaa gacctgggtg cactatattg ctgctgagga agaggactgg gattatgctc 1260 ctctggtgct ggcccctgat gacagaagct acaagagcca gtacctgaac aatggccctc 1320 agagaattgg caggaagtat aagaaagtga ggttcatggc ctacacagat gagacattca 1380 agaccagaga ggctatccag catgagtctg gcattctggg acctctgctg tatggggaag 1440 tgggggacac actgctgatc atcttcaaga accaggccag cagaccctac aacatctacc 1500 ctcatggcat cacagatgtg aggcctctgt actctagaag gctgcccaag ggggtgaagc 1560 acctgaagga cttccctatc ctgcctgggg agatcttcaa gtacaagtgg acagtgacag 1620 tggaggatgg ccctaccaag tctgatccta gatgcctgac aaggtactac agcagctttg 1680 tgaacatgga aagggacctg gcctctggcc tgattggtcc tctgctgatc tgctacaaag 1740 aatctgtgga ccagaggggc aaccagatca tgagtgacaa gagaaatgtg atcctgttct 1800 ctgtctttga tgagaacagg tcctggtatc tgacagagaa catccagagg tttctgccca 1860 atcctgctgg ggtgcagctg gaagatcctg agttccaggc ctccaacatc atgcactcca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgaa gtggcctact 1980 ggtacatcct gtctattggg gcccagacag acttcctgtc tgtgttcttt tctggctaca 2040 ccttcaagca caagatggtg tatgaggata ccctgacact gttcccattc tctggggaga 2100 cagtgttcat gagcatggaa aaccctggcc tgtggatcct gggctgtcac aacagtgact 2160 tcagaaacag aggcatgaca gccctgctga aggtgtccag ctgtgacaag aacactgggg 2220 actactatga ggactcttat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcctag gagcttctct cagaaccctc ctgtgctgaa gagacaccag agggagatca 2340 ccagaaccac actgcagtct gaccaagagg aaattgatta tgatgacacc atctctgtgg 2400 agatgaagaa agaagatttt gacatctatg atgaggatga gaatcagagc cccagatctt 2460 tccagaagaa aacaaggcac tacttcattg ctgctgtgga aagactgtgg gactatggca 2520 tgagcagcag cccccatgtg ctgagaaaca gggcccagtc tggaagtgtg ccccagttca 2580 agaaagtggt gttccaagag ttcacagatg gcagcttcac ccagcctctg tatagagggg 2640 agctgaatga gcacctggga ctgctgggac cttacatcag agctgaggtg gaggataaca 2700 tcatggtcac ctttagaaac caggcctcta ggccctactc cttctacagc tccctgatca 2760 gctatgaaga ggaccagaga cagggggctg agcccagaaa gaactttgtg aagcccaatg 2820 agactaagac ctacttttgg aaggtgcagc accacatggc ccctacaaag gatgagtttg 2880 actgcaaggc ctgggcctac ttctctgatg tggacctgga gaaggatgtg cactctggac 2940 tcattggacc cctgcttgtg tgccacacca acacactgaa tcctgctcat ggcaggcaag 3000 tgacagtgca agagtttgcc ctgttcttca ccatctttga tgagacaaag tcctggtact 3060 tcacaaaaa catggaaaga aactgcaggg ccccttgcaa catccagatg gaagatccca 3120 ccttcaaaga gaactacagg ttccatgcca tcaatggcta catcatggac actctgcctg 3180 gcctggttat ggcacaggat cagaggatca gatggtatct gctgtccatg ggctccaatg 3240 agaatatcca cagcatccac ttctctggcc atgtgttcac agtgaggaaa aaagaagagt 3300 acaagatggc cctgtacaat ctgtaccctg gggtgtttga gactgtggaa atgctgccta 3360 gcaaggctgg aatctggagg gtggaatgtc tgattggaga gcatctgcat gctggaatgt 3420 ctaccctgtt cctggtgtac agcaacaagt gtcagacccc tctgggcatg gcctctggac 3480 acatcagaga cttccagatc acagcctctg gccagtatgg acagtgggct cctaaactgg 3540 ctagactgca ctactctggc agcatcaatg cctggtccac caaagagccc ttcagctgga 3600 tcaaggtgga cctgctggct cccatgatca tccatggaat caagacccag ggggccagac 3660 agaagttcag cagcctgtac atcagccagt tcatcatcat gtacagcctg gatggcaaga 3720 agtggcagac ctacagaggc aacagcacag gcacactcat ggtgttcttt ggcaatgtgg 3780 actcttctgg cattaagcac aacatcttca accctccaat cattgccagg tacatcaggc 3840 tgcaccccac acactacagc atcagatcta ccctgaggat ggaactgatg ggctgtgacc 3900 tgaacagctg ctctatgccc ctgggaatgg aaagcaaggc catctctgat gcccagatca 3960 cagccagcag ctacttcacc aacatgtttg ccacatggtc cccatctaag gccaggctgc 4020 atctgcaggg cagatctaat gcttggaggc cccaagtgaa caaccccaaa gagtggctgc 4080 aggtggactt tcagaaaacc atgaaagtga caggagtgac cacacagggg gtcaagtctc 4140 tgctgacctc tatgtatgtg aaagagttcc tgatctccag cagccaggat ggccaccagt 4200 ggaccctgtt tttccagaat ggcaaagtca aggtgttcca gggaaaccag gacagcttca 4260 cacctgtggt caactccctg gatcctccac tgctgaccag atacctgaga attcaccctc 4320 agtcttgggt gcaccagatt gctctgagaa tggaagtgct gggatgtgaa gctcaggacc 4380 tctactaaaa taaaagatct ttattttcat tagatctgtg tgttggtttt ttgtgtg 4437 <210> 319 <211> 4437 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB085 <400> 319 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccaga aggtactacc taggagccgt ggaactgagc tgggactaca 120 tgcagtctga cctgggagag ctgcccgtgg acgctagatt tcctccaaga gtgcccaaga 180 gcttcccctt caacacctcc gtggtgtaca agaaaaccct gttcgtggaa ttcaccgacc 240 acctgttcaa tatcgccaag cctagacctc cttggatggg cctgctgggc cctacaattc 300 aggccgaggt gtacgacacc gtggtcatca ccctgaagaa catggccagc catcctgtgt 360 ctctgcacgc cgtgggagtg tcttactgga aggcttctga gggcgccgag tacgacgacc 420 agacaagcca gagagagaaa gaggacgaca aggttttccc tggcggcagc cacacctatg 480 tctggcaggt cctgaaagaa aacggcccta tggcctccga tcctctgtgc ctgacataca 540 gctacctgag ccatgtggac ctggtcaagg acctgaactc tggcctgatc ggcgctctgc 600 tcgtgtgtag agaaggcagc ctggccaaag aaaagaccca gacactgcac aagttcatcc 660 tgctgttcgc cgtgttcgac gagggcaaga gctggcacag cgagacaaag aacagcctga 720 tgcaggacag agatgccgcc tctgctagag cttggcccaa gatgcacacc gtgaacggct 780 acgtgaacag aagcctgcct ggactgatcg gatgccacag aaagtccgtg tactggcatg 840 tgatcggcat gggcaccaca cctgaggtgc acagcatctt tctggaagga cacaccttcc 900 tcgtgcggaa ccacagacag gccagcctgg aaatcagccc tatcaccttc ctgaccgctc 960 agaccctgct gatggatctg ggccagtttc tgctgttctg ccacatcagc agccaccagc 1020 acgatggcat ggaagcctac gtgaaggtgg acagctgccc cgaagaaccc cagctgagaa 1080 tgaagaacaa cgaggaagcc gaggactacg acgacgacct gaccgactct gagatggacg 1140 tcgtcagatt cgacgacgat aacagcccca gcttcatcca gatcagaagc gtggccaaga 1200 agcaccccaa gacctgggtg cactatatcg ccgccgagga agaggactgg gattacgctc 1260 ctctggtgct ggcccctgac gacagaagct acaagagcca gtacctgaac aacggccctc 1320 agagaatcgg ccggaagtat aagaaagtgc ggttcatggc ctacaccgac gagacattca 1380 agaccagaga ggctatccag cacgagagcg gcattctggg acctctgctg tatggcgaag 1440 tgggcgacac actgctgatc atcttcaaga accaggccag cagaccctac aacatctacc 1500 ctcacggcat caccgatgtg cggcctctgt actctagaag gctgcccaag ggcgtgaagc 1560 acctgaagga cttccctatc ctgcctggcg agatcttcaa gtacaagtgg accgtgaccg 1620 tcgaggacgg ccctaccaag agcgatccta gatgcctgac acggtactac agcagcttcg 1680 tgaacatgga acgcgacctg gccagcggcc tgattggtcc tctgctgatc tgctacaaag 1740 aaagcgtgga ccagaggggc aaccagatca tgagcgacaa gagaaacgtg atcctgttct 1800 ccgtctttga cgagaacagg tcctggtatc tgaccgagaa catccagcgg tttctgccca 1860 atcctgctgg cgtgcagctg gaagatcctg agttccaggc ctccaacatc atgcactcca 1920 tcaacggcta tgtgttcgac agcctgcagc tgagcgtgtg cctgcacgaa gtggcctact 1980 ggtacatcct gtctatcggc gcccagaccg acttcctgtc cgtgttcttt agcggctaca 2040 ccttcaagca caagatggtg tacgaggata ccctgacact gttcccattc agcggcgaga 2100 cagtgttcat gagcatggaa aaccccggcc tgtggatcct gggctgtcac aacagcgact 2160 tcagaaacag aggcatgaca gccctgctga aggtgtccag ctgcgacaag aacaccggcg 2220 actactacga ggactcttac gaggacatca gcgcctacct gctgagcaag aacaatgcca 2280 tcgagcctcg gagcttctct cagaaccctc ctgtgctgaa gagacaccag cgcgagatca 2340 ccagaaccac actgcagagc gaccaagagg aaatcgatta cgacgacacc atcagcgtcg 2400 agatgaagaa agaagatttc gacatctacg acgaggacga gaatcagagc cccagatctt 2460 tccagaagaa aacgcggcac tacttcattg ccgccgtgga aagactgtgg gactacggca 2520 tgagcagcag cccacatgtg ctgagaaaca gggcccagag cggaagcgtg ccccagttca 2580 agaaagtggt gttccaagag ttcaccgacg gcagcttcac ccagcctctg tatagaggcg 2640 agctgaacga gcacctggga ctgctgggac cttacatcag agctgaggtc gaggataaca 2700 tcatggtcac ctttagaaac caggcctcta ggccctactc cttctacagc tccctgatca 2760 gctacgaaga ggaccagaga cagggcgctg agcccagaaa gaacttcgtg aagcccaacg 2820 agactaagac ctacttttgg aaggtgcagc accacatggc ccctacaaag gacgagttcg 2880 actgcaaggc ctgggcctac ttctctgacg tggacctcga gaaggatgtg cacagcggac 2940 tcatcggacc cctgcttgtg tgccacacca acacactgaa tcccgctcac ggcaggcaag 3000 tgaccgtgca agagttcgcc ctgttcttca ccatcttcga tgagacaaag tcctggtact 3060 tcaccgaaaa catggaaaga aactgcaggg ccccttgcaa catccagatg gaagatccca 3120 ccttcaaaga gaactaccgg ttccacgcca tcaatggcta catcatggac actctgcccg 3180 gcctggttat ggcacaggat cagaggatca gatggtatct gctgtccatg ggctccaacg 3240 agaatatcca cagcatccac ttcagcggcc atgtgttcac cgtgcggaaa aaagaagagt 3300 acaagatggc cctgtacaat ctgtaccccg gcgtgttcga gactgtggaa atgctgccta 3360 gcaaggccgg aatctggcgc gtggaatgtc tgatcggaga gcatctgcat gccggaatgt 3420 ctaccctgtt cctggtgtac agcaacaagt gtcagacccc tctcggcatg gcctctggac 3480 acatcagaga cttccagatc accgcctctg gccagtacgg acagtgggct cctaaactgg 3540 ctagactgca ctacagcggc agcatcaacg cctggtccac caaagagccc ttcagctgga 3600 tcaaggtgga cctgctggct cccatgatca tccacggaat caagacccag ggcgccagac 3660 agaagttcag cagcctgtac atcagccagt tcatcatcat gtacagcctg gacggcaaga 3720 agtggcagac ctacagaggc aacagcaccg gcacactcat ggtgttcttc ggcaacgtgg 3780 actccagcgg cattaagcac aacatcttca accctccaat cattgcccgg tacatccggc 3840 tgcaccccac acactacagc atcagatcta ccctgaggat ggaactgatg ggctgcgacc 3900 tgaacagctg ctctatgccc ctcggaatgg aaagcaaggc catcagcgac gcccagatca 3960 cagccagcag ctacttcacc aacatgttcg ccacatggtc cccatctaag gcccggctgc 4020 atctgcaggg cagatctaac gcttggaggc cccaagtgaa caaccccaaa gagtggctgc 4080 aggtcgactt tcagaaaacc atgaaagtga ccggcgtgac cacacagggc gtcaagtctc 4140 tgctgacctc tatgtacgtg aaagagttcc tgatctccag cagccaggac ggccaccagt 4200 ggaccctgtt tttccagaac ggcaaagtca aggtgttcca gggaaaccag gacagcttca 4260 cacccgtggt caactccctg gatcctccac tgctgaccag atacctgaga attcaccctc 4320 agtcttgggt gcaccagatc gctctgagaa tggaagtgct gggatgtgaa gctcaggacc 4380 tctactaaaa taaaagatct ttattttcat tagatctgtg tgttggtttt ttgtgtg 4437 <210> 320 <211> 4437 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB100 <400> 320 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatcccc cagtgctgaa gaggcaccag agggagatca 2340 ccaggaccac cctgcagtct gaccaggagg agattgacta tgatgacacc atctctgtgg 2400 agatgaagaa ggaggacttt gacatctacg acgaggacga gaaccagagc cccaggagct 2460 tccagaagaa gaccaggcac tacttcattg ctgctgtgga gaggctgtgg gactatggca 2520 tgagcagcag cccccatgtg ctgaggaaca gggcccagtc tggctctgtg ccccagttca 2580 agaaggtggt gttccaggag ttcactgatg gcagcttcac ccagcccctg tacagagggg 2640 agctgaatga gcacctgggc ctgctgggcc cctacatcag ggctgaggtg gaggacaaca 2700 tcatggtgac cttcaggaac caggccagca ggccctacag cttctacagc agcctgatca 2760 gctatgagga ggaccagagg cagggggctg agcccaggaa gaactttgtg aagcccaatg 2820 aaaccaagac ctacttctgg aaggtgcagc accacatggc ccccaccaag gatgagtttg 2880 actgcaaggc ctgggcctac ttctctgatg tggacctgga gaaggatgtg cactctggcc 2940 tgattggccc cctgctggtg tgccacacca acaccctgaa ccctgcccat ggcaggcagg 3000 tgactgtgca ggagtttgcc ctgttcttca ccatctttga tgaaaccaag agctggtact 3060 tcactgagaa catggagagg aactgcaggg ccccctgcaa catccagatg gaggacccca 3120 ccttcaagga gaactacagg ttccatgcca tcaatggcta catcatggac accctgcctg 3180 gcctggtgat ggcccaggac cagaggatca ggtggtacct gctgagcatg ggcagcaatg 3240 agaacatcca cagcatccac ttctctggcc atgtgttcac tgtgaggaag aaggaggagt 3300 acaagatggc cctgtacaac ctgtaccctg gggtgtttga gactgtggag atgctgccca 3360 gcaaggctgg catctggagg gtggagtgcc tgattgggga gcacctgcat gctggcatga 3420 gcaccctgtt cctggtgtac agcaacaagt gccagacccc cctgggcatg gcctctggcc 3480 acatcaggga cttccagatc actgcctctg gccagtatgg ccagtgggcc cccaagctgg 3540 ccaggctgca ctactctggc agcatcaatg cctggagcac caaggagccc ttcagctgga 3600 tcaaggtgga cctgctggcc cccatgatca tccatggcat caagacccag ggggccaggc 3660 agaagttcag cagcctgtac atcagccagt tcatcatcat gtacagcctg gatggcaaga 3720 agtggcagac ctacaggggc aacagcactg gcaccctgat ggtgttcttt ggcaatgtgg 3780 acagctctgg catcaagcac aacatcttca acccccccat cattgccaga tacatcaggc 3840 tgcaccccac ccactacagc atcaggagca ccctgaggat ggagctgatg ggctgtgacc 3900 tgaacagctg cagcatgccc ctgggcatgg agagcaaggc catctctgat gcccagatca 3960 ctgccagcag ctacttcacc aacatgtttg ccacctggag ccccagcaag gccaggctgc 4020 acctgcaggg caggagcaat gcctggaggc cccaggtcaa caaccccaag gagtggctgc 4080 aggtggactt ccagaagacc atgaaggtga ctggggtgac cacccagggg gtgaagagcc 4140 tgctgaccag catgtatgtg aaggagttcc tgatcagcag cagccaggat ggccaccagt 4200 ggaccctgtt cttccagaat ggcaaggtga aggtgttcca gggcaaccag gacagcttca 4260 cccctgtggt gaacagcctg gacccccccc tgctgaccag atacctgagg attcaccccc 4320 agagctgggt gcaccagatt gccctgagga tggaggtgct gggctgtgag gcccaggacc 4380 tgtactgaaa taaaagatct ttattttcat tagatctgtg tgttggtttt ttgtgtg 4437 <210> 321 <211> 4775 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1000 <400> 321 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag gggatggcca 120 actccatcac taggggttcc tgcggcctaa ggcaattgtg ccagttcccg atcgttacag 180 gcggtactcc tcaaagcgta ctaaagaatt attcttttac atttcagtgg ccaccagaag 240 gtactacctg ggagctgtgg aactgagctg ggactacatg cagtctgacc tgggagagct 300 gcctgtggat gctagatttc ctccaagagt gcccaagagc ttccccttca acacctctgt 360 ggtgtacaag aaaaccctgt ttgtggaatt cacagaccac ctgttcaata ttgccaagcc 420 tagacctcct tggatgggcc tgctgggccc tacaattcag gctgaggtgt atgacacagt 480 ggtcatcacc ctgaagaaca tggccagcca tcctgtgtct ctgcatgctg tgggagtgtc 540 ttactggaag gcttctgagg gggctgagta tgatgaccag acaagccaga gagagaaaga 600 ggatgacaag gttttccctg ggggcagcca cacctatgtc tggcaggtcc tgaaagaaaa 660 tggccctatg gcctctgatc ctctgtgcct gacatacagc tacctgagcc atgtggacct 720 ggtcaaggac ctgaactctg gcctgattgg ggctctgctg gtgtgtagag aaggcagcct 780 ggccaaagaa aagacccaga cactgcacaa gttcatcctg ctgtttgctg tgtttgatga 840 gggcaagagc tggcactctg agacaaagaa cagcctgatg caggacagag atgctgcctc 900 tgctagagct tggcccaaga tgcacacagt gaatggctat gtgaacagaa gcctgcctgg 960 actgattgga tgccacagaa agtctgtgta ctggcatgtg attggcatgg gcaccacacc 1020 tgaggtgcac agcatctttc tggaaggaca caccttcctg gtgaggaacc acagacaggc 1080 cagcctggaa atcagcccta tcaccttcct gacagctcag accctgctga tggatctggg 1140 ccagtttctg ctgttctgcc acatcagcag ccaccagcat gatggcatgg aagcctatgt 1200 gaaggtggac agctgccctg aagaacccca gctgagaatg aagaacaatg aggaagctga 1260 ggactatgat gatgacctga cagactctga gatggatgtg gtcagatttg atgatgataa 1320 cagccccagc ttcatccaga tcagatctgt ggccaagaag caccccaaga cctgggtgca 1380 ctatattgct gctgaggaag aggactggga ttatgctcct ctggtgctgg cccctgatga 1440 cagaagctac aagagccagt acctgaacaa tggccctcag agaattggca ggaagtataa 1500 gaaagtgagg ttcatggcct acacagatga gacattcaag accagagagg ctatccagca 1560 tgagtctggc attctgggac ctctgctgta tggggaagtg ggggacacac tgctgatcat 1620 cttcaagaac caggccagca gaccctacaa catctaccct catggcatca cagatgtgag 1680 gcctctgtac tctagaaggc tgcccaaggg ggtgaagcac ctgaaggact tccctatcct 1740 gcctggggag atcttcaagt acaagtggac agtgacagtg gaggatggcc ctaccaagtc 1800 tgatcctaga tgcctgacaa ggtactacag cagctttgtg aacatggaaa gggacctggc 1860 ctctggcctg attggtcctc tgctgatctg ctacaaagaa tctgtggacc agaggggcaa 1920 ccagatcatg agtgacaaga gaaatgtgat cctgttctct gtctttgatg agaacaggtc 1980 ctggtatctg acagagaaca tccagaggtt tctgcccaat cctgctgggg tgcagctgga 2040 agatcctgag ttccaggcct ccaacatcat gcactccatc aatggctatg tgtttgacag 2100 cctgcagctg tctgtgtgcc tgcatgaagt ggcctactgg tacatcctgt ctattggggc 2160 ccagacagac ttcctgtctg tgttcttttc tggctacacc ttcaagcaca agatggtgta 2220 tgaggatacc ctgacactgt tcccattctc tggggagaca gtgttcatga gcatggaaaa 2280 ccctggcctg tggatcctgg gctgtcacaa cagtgacttc agaaacagag gcatgacagc 2340 cctgctgaag gtgtccagct gtgacaagaa cactggggac tactatgagg actcttatga 2400 ggacatctct gcctacctgc tgagcaagaa caatgccatt gagcctagga gcttctctca 2460 gaaccctcct gtgctgaaga gacaccagag ggagatcacc agaaccacac tgcagtctga 2520 ccaagaggaa attgattatg atgacaccat ctctgtggag atgaagaaag aagattttga 2580 catctatgat gaggatgaga atcagagccc cagatctttc cagaagaaaa caaggcacta 2640 cttcattgct gctgtggaaa gactgtggga ctatggcatg agcagcagcc cccatgtgct 2700 gagaaacagg gcccagtctg gaagtgtgcc ccagttcaag aaagtggtgt tccaagagtt 2760 cacagatggc agcttcaccc agcctctgta tagaggggag ctgaatgagc acctgggact 2820 gctgggacct tacatcagag ctgaggtgga ggataacatc atggtcacct ttagaaacca 2880 ggcctctagg ccctactcct tctacagctc cctgatcagc tatgaagagg accagagaca 2940 gggggctgag cccagaaaga actttgtgaa gcccaatgag actaagacct acttttggaa 3000 ggtgcagcac cacatggccc ctacaaagga tgagtttgac tgcaaggcct gggcctactt 3060 ctctgatgtg gacctggaga aggatgtgca ctctggactc attggacccc tgcttgtgtg 3120 ccacaccaac acactgaatc ctgctcatgg caggcaagtg acagtgcaag agtttgccct 3180 gttcttcacc atctttgatg agacaaagtc ctggtacttc acagaaaaca tggaaagaaa 3240 ctgcagggcc ccttgcaaca tccagatgga agatcccacc ttcaaagaga actacaggtt 3300 ccatgccatc aatggctaca tcatggacac tctgcctggc ctggttatgg cacaggatca 3360 gaggatcaga tggtatctgc tgtccatggg ctccaatgag aatatccaca gcatccactt 3420 ctctggccat gtgttcacag tgaggaaaaa agaagagtac aagatggccc tgtacaatct 3480 gtaccctggg gtgtttgaga ctgtggaaat gctgcctagc aaggctggaa tctggagggt 3540 ggaatgtctg attggagagc atctgcatgc tggaatgtct accctgttcc tggtgtacag 3600 caacaagtgt cagacccctc tgggcatggc ctctggacac atcagagact tccagatcac 3660 agcctctggc cagtatggac agtgggctcc taaactggct agactgcact actctggcag 3720 catcaatgcc tggtccacca aagagccctt cagctggatc aaggtggacc tgctggctcc 3780 catgatcatc catggaatca agacccaggg ggccagacag aagttcagca gcctgtacat 3840 cagccagttc atcatcatgt acagcctgga tggcaagaag tggcagacct acagaggcaa 3900 cagcacaggc acactcatgg tgttctttgg caatgtggac tcttctggca ttaagcacaa 3960 catcttcaac cctccaatca ttgccaggta catcaggctg caccccacac actacagcat 4020 cagatctacc ctgaggatgg aactgatggg ctgtgacctg aacagctgct ctatgcccct 4080 gggaatggaa agcaaggcca tctctgatgc ccagatcaca gccagcagct acttcaccaa 4140 catgtttgcc acatggtccc catctaaggc caggctgcat ctgcagggca gatctaatgc 4200 ttggaggccc caagtgaaca accccaaaga gtggctgcag gtggactttc agaaaaccat 4260 gaaagtgaca ggagtgacca cacagggggt caagtctctg ctgacctcta tgtatgtgaa 4320 agagttcctg atctccagca gccaggatgg ccaccagtgg accctgtttt tccagaatgg 4380 caaagtcaag gtgttccagg gaaaccagga cagcttcaca cctgtggtca actccctgga 4440 tcctccactg ctgaccagat acctgagaat tcaccctcag tcttgggtgc accagattgc 4500 tctgagaatg gaagtgctgg gatgtgaagc tcaggacctc tactgatcgc gaataaaaga 4560 tctttatttt cattagatct gtgtgttggt tttttgtgtg tgccagttcc cgatcgttac 4620 aggccgcggg ccgcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4680 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4740 ctcagtgagc gagcgagcgc gcagctgcct gcagg 4775 <210> 322 <211> 4775 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1001 <400> 322 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag gggatggcca 120 actccatcac taggggttcc tgcggcctaa ggcaattgtg ccagttcccg atcgttacag 180 gcggtactcc tcaaagcgta ctaaagaatt attcttttac atttcagtgg ccaccagaag 240 gtactaccta ggagccgtgg aactgagctg ggactacatg cagtctgacc tgggagagct 300 gcccgtggac gctagatttc ctccaagagt gcccaagagc ttccccttca acacctccgt 360 ggtgtacaag aaaaccctgt tcgtggaatt caccgaccac ctgttcaata tcgccaagcc 420 tagacctcct tggatgggcc tgctgggccc tacaattcag gccgaggtgt acgacaccgt 480 ggtcatcacc ctgaagaaca tggccagcca tcctgtgtct ctgcacgccg tgggagtgtc 540 ttactggaag gcttctgagg gcgccgagta cgacgaccag acaagccaga gagagaaaga 600 ggacgacaag gttttccctg gcggcagcca cacctatgtc tggcaggtcc tgaaagaaaa 660 cggccctatg gcctccgatc ctctgtgcct gacatacagc tacctgagcc atgtggacct 720 ggtcaaggac ctgaactctg gcctgatcgg cgctctgctc gtgtgtagag aaggcagcct 780 ggccaaagaa aagacccaga cactgcacaa gttcatcctg ctgttcgccg tgttcgacga 840 gggcaagagc tggcacagcg agacaaagaa cagcctgatg caggacagag atgccgcctc 900 tgctagagct tggcccaaga tgcacaccgt gaacggctac gtgaacagaa gcctgcctgg 960 actgatcgga tgccacagaa agtccgtgta ctggcatgtg atcggcatgg gcaccacacc 1020 tgaggtgcac agcatctttc tggaaggaca caccttcctc gtgcggaacc acagacaggc 1080 cagcctggaa atcagcccta tcaccttcct gaccgctcag accctgctga tggatctggg 1140 ccagtttctg ctgttctgcc acatcagcag ccaccagcac gatggcatgg aagcctacgt 1200 gaaggtggac agctgccccg aagaacccca gctgagaatg aagaacaacg aggaagccga 1260 ggactacgac gacgacctga ccgactctga gatggacgtc gtcagattcg acgacgataa 1320 cagccccagc ttcatccaga tcagaagcgt ggccaagaag caccccaaga cctgggtgca 1380 ctatatcgcc gccgaggaag aggactggga tacgctcct ctggtgctgg cccctgacga 1440 cagaagctac aagagccagt acctgaacaa cggccctcag agaatcggcc ggaagtataa 1500 gaaagtgcgg ttcatggcct acaccgacga gacattcaag accagagagg ctatccagca 1560 cgagagcggc attctgggac ctctgctgta tggcgaagtg ggcgacacac tgctgatcat 1620 cttcaagaac caggccagca gaccctacaa catctaccct cacggcatca ccgatgtgcg 1680 gcctctgtac tctagaaggc tgcccaaggg cgtgaagcac ctgaaggact tccctatcct 1740 gcctggcgag atcttcaagt acaagtggac cgtgaccgtc gaggacggcc ctaccaagag 1800 cgatcctaga tgcctgacac ggtactacag cagcttcgtg aacatggaac gcgacctggc 1860 cagcggcctg attggtcctc tgctgatctg ctacaaagaa agcgtggacc agaggggcaa 1920 ccagatcatg agcgacaaga gaaacgtgat cctgttctcc gtctttgacg agaacaggtc 1980 ctggtatctg accgagaaca tccagcggtt tctgcccaat cctgctggcg tgcagctgga 2040 agatcctgag ttccaggcct ccaacatcat gcactccatc aacggctatg tgttcgacag 2100 cctgcagctg agcgtgtgcc tgcacgaagt ggcctactgg tacatcctgt ctatcggcgc 2160 ccagaccgac ttcctgtccg tgttctttag cggctacacc ttcaagcaca agatggtgta 2220 cgaggatacc ctgacactgt tcccattcag cggcgagaca gtgttcatga gcatggaaaa 2280 ccccggcctg tggatcctgg gctgtcacaa cagcgacttc agaaacagag gcatgacagc 2340 cctgctgaag gtgtccagct gcgacaagaa caccggcgac tactacgagg actcttacga 2400 ggacatcagc gcctacctgc tgagcaagaa caatgccatc gagcctcgga gcttctctca 2460 gaaccctcct gtgctgaaga gacaccagcg cgagatcacc agaaccacac tgcagagcga 2520 ccaagaggaa atcgattacg acgacaccat cagcgtcgag atgaagaaag aagatttcga 2580 catctacgac gaggacgaga atcagagccc cagatctttc cagaagaaaa cgcggcacta 2640 cttcattgcc gccgtggaaa gactgtggga ctacggcatg agcagcagcc cacatgtgct 2700 gagaaacagg gcccagagcg gaagcgtgcc ccagttcaag aaagtggtgt tccaagagtt 2760 caccgacggc agcttcaccc agcctctgta tagaggcgag ctgaacgagc acctgggact 2820 gctgggacct tacatcagag ctgaggtcga ggataacatc atggtcacct ttagaaacca 2880 ggcctctagg ccctactcct tctacagctc cctgatcagc tacgaagagg accagagaca 2940 gggcgctgag cccagaaaga acttcgtgaa gcccaacgag actaagacct acttttggaa 3000 ggtgcagcac cacatggccc ctacaaagga cgagttcgac tgcaaggcct gggcctactt 3060 ctctgacgtg gacctcgaga aggatgtgca cagcggactc atcggacccc tgcttgtgtg 3120 ccacaccaac acactgaatc ccgctcacgg caggcaagtg accgtgcaag agttcgccct 3180 gttcttcacc atcttcgatg agacaaagtc ctggtacttc accgaaaaca tggaaagaaa 3240 ctgcagggcc ccttgcaaca tccagatgga agatcccacc ttcaaagaga actaccggtt 3300 ccacgccatc aatggctaca tcatggacac tctgcccggc ctggttatgg cacaggatca 3360 gaggatcaga tggtatctgc tgtccatggg ctccaacgag aatatccaca gcatccactt 3420 cagcggccat gtgttcaccg tgcggaaaaa agaagagtac aagatggccc tgtacaatct 3480 gtaccccggc gtgttcgaga ctgtggaaat gctgcctagc aaggccggaa tctggcgcgt 3540 ggaatgtctg atcggagagc atctgcatgc cggaatgtct accctgttcc tggtgtacag 3600 caacaagtgt cagacccctc tcggcatggc ctctggacac atcagagact tccagatcac 3660 cgcctctggc cagtacggac agtgggctcc taaactggct agactgcact acagcggcag 3720 catcaacgcc tggtccacca aagagccctt cagctggatc aaggtggacc tgctggctcc 3780 catgatcatc cacggaatca agacccaggg cgccagacag aagttcagca gcctgtacat 3840 cagccagttc atcatcatgt acagcctgga cggcaagaag tggcagacct acagaggcaa 3900 cagcaccggc acactcatgg tgttcttcgg caacgtggac tccagcggca ttaagcacaa 3960 catcttcaac cctccaatca ttgcccggta catccggctg caccccacac actacagcat 4020 cagatctacc ctgaggatgg aactgatggg ctgcgacctg aacagctgct ctatgcccct 4080 cggaatggaa agcaaggcca tcagcgacgc ccagatcaca gccagcagct acttcaccaa 4140 catgttcgcc acatggtccc catctaaggc ccggctgcat ctgcagggca gatctaacgc 4200 ttggaggccc caagtgaaca accccaaaga gtggctgcag gtcgactttc agaaaaccat 4260 gaaagtgacc ggcgtgacca cacagggcgt caagtctctg ctgacctcta tgtacgtgaa 4320 agagttcctg atctccagca gccaggacgg ccaccagtgg accctgtttt tccagaacgg 4380 caaagtcaag gtgttccagg gaaaccagga cagcttcaca cccgtggtca actccctgga 4440 tcctccactg ctgaccagat acctgagaat tcaccctcag tcttgggtgc accagatcgc 4500 tctgagaatg gaagtgctgg gatgtgaagc tcaggacctc tactgatcgc gaataaaaga 4560 tctttatttt cattagatct gtgtgttggt tttttgtgtg tgccagttcc cgatcgttac 4620 aggccgcggg ccgcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4680 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4740 ctcagtgagc gagcgagcgc gcagctgcct gcagg 4775 <210> 323 <211> 4780 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1002 <400> 323 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag gggatggcca 120 actccatcac taggggttcc tgcggccctc gagtgccagt tcccgatcgt tacaggcggt 180 actcctcaaa gcgtactaaa gaattattct tttacatttc agtggctacc agaagatact 240 acctgggagc cgtcgaactg agctgggatt acatgcagtc tgacctggga gagctgcccg 300 tggacgctag attcccacct agagtcccta agtccttccc cttcaacacc agcgtggtct 360 acaagaaaac cctgttcgtg gagtttaccg accacctgtt caacatcgct aagcctagac 420 caccatggat gggactgctg ggaccaacca tccaggccga ggtgtacgac accgtggtca 480 tcaccctgaa aaacatggct tctcaccccg tgtccctgca tgctgtgggc gtctcctact 540 ggaaggccag cgaaggggct gagtatgacg atcagaccag ccagcgggaa aaagaggacg 600 ataaggtgtt ccctggcggg tcccatacct acgtgtggca ggtcctgaag gagaatggac 660 caatggcttc cgaccctctg tgcctgacct actcttatct gtcccacgtg gacctggtca 720 aggatctgaa cagcggcctg atcggggctc tgctggtgtg tcgcgaaggg tccctggcca 780 aggagaaaac ccagaccctg cataagttca tcctgctgtt cgccgtgttt gacgaaggaa 840 aaagctggca ctctgagacc aagaactctc tgatgcagga cagggatgcc gcttccgcca 900 gagcttggcc caagatgcac accgtgaacg gctacgtcaa taggagcctg cctggactga 960 tcggctgcca cagaaagtcc gtgtattggc atgtcatcgg aatgggcacc acccctgaag 1020 tgcacagcat cttcctggag gggcatacct ttctggtccg caaccaccgg caggctagcc 1080 tggagatctc tccaatcacc ttcctgaccg cccagaccct gctgatggac ctgggacagt 1140 tcctgctgtt ttgccacatc tccagccacc agcatgatgg catggaggct tacgtgaaag 1200 tcgactcctg tcccgaggaa cctcagctga ggatgaagaa caatgaggaa gccgaagact 1260 atgacgatga cctgaccgac agcgagatgg atgtggtccg cttcgatgac gataactctc 1320 cctcctttat ccagatccgg tccgtggcca agaaacaccc taagacctgg gtccattaca 1380 tcgccgctga ggaagaggac tgggattatg ctccactggt gctggccccc gacgatagat 1440 cctacaaaag ccagtatctg aacaatggac cccagaggat cggcagaaag tacaagaaag 1500 tgaggttcat ggcttatacc gatgagacct ttaagaccag agaagccatc cagcacgagt 1560 ccgggatcct gggacctctg ctgtacggcg aagtggggga caccctgctg atcatcttca 1620 agaaccaggc cagcaggcct tacaatatct atccacatgg catcaccgat gtgagacctc 1680 tgtactcccg ccggctgcca aagggcgtga aacacctgaa ggacttccca atcctgcccg 1740 gggaaatctt taagtataaa tggaccgtca ccgtcgagga tgggcccacc aagagcgacc 1800 ctaggtgcct gaccagatac tattcttcct tcgtgaatat ggagagagac ctggcttccg 1860 gactgatcgg acccctgctg atctgttaca aagagagcgt ggatcagcgc ggcaaccaga 1920 tcatgtctga caagcggaat gtgatcctgt tcagcgtctt tgacgaaaac cgctcttggt 1980 acctgaccga gaacatccag cggttcctgc ctaatccagc tggagtgcag ctggaagatc 2040 ccgagttcca ggcctctaac atcatgcatt ccatcaatgg ctacgtgttc gactccctgc 2100 agctgagcgt gtgcctgcac gaggtcgctt actggtatat cctgagcatc ggagcccaga 2160 ccgatttcct gtctgtgttc ttttccggct acacctttaa gcataaaatg gtgtatgagg 2220 acaccctgac cctgttccca ttttccggcg aaaccgtgtt catgagcatg gagaatcccg 2280 ggctgtggat cctgggatgc cacaactccg atttcaggaa tagagggatg accgccctgc 2340 tgaaagtgag ctcttgtgac aagaacaccg gagactacta tgaagatagc tacgaggaca 2400 tctctgctta tctgctgtcc aaaaacaatg ccatcgagcc caggagcttc tctcagaacc 2460 ctccagtgct gaagcgccac cagcgggaga tcaccagaac caccctgcag agcgatcagg 2520 aagagatcga ctacgacgat accatctccg tggaaatgaa gaaagaggac ttcgatatct 2580 atgacgaaga tgagaaccag tctcccaggt ccttccagaa gaaaaccaga cattacttta 2640 tcgccgctgt ggagcggctg tgggactatg gcatgtccag ctctcctcac gtgctgagaa 2700 atagagctca gtccggaagc gtcccacagt tcaagaaagt ggtcttccag gagtttaccg 2760 acggaagctt tacccagcca ctgtaccgcg gcgaactgaa cgagcacctg gggctgctgg 2820 gaccctatat ccgggctgaa gtggaggata acatcatggt caccttcagg aatcaggcca 2880 gcagacccta ctctttttat tccagcctga tctcctacga agaggaccag agacagggag 2940 ctgaaccaag aaaaaacttc gtgaagccta atgagaccaa aacctacttt tggaaggtgc 3000 agcaccatat ggcccctacc aaagacgagt tcgattgcaa ggcctgggct tattttagcg 3060 acgtggatct ggagaaggac gtccactccg gcctgatcgg gccactgctg gtgtgtcata 3120 ccaacaccct gaatccagct cacggaaggc aggtgaccgt ccaggaattc gccctgttct 3180 ttaccatctt tgatgagacc aagagctggt acttcaccga aaacatggag aggaattgca 3240 gagccccatg taacatccag atggaagacc ccaccttcaa ggagaactac agatttcatg 3300 ctatcaatgg gtatatcatg gataccctgc caggactggt catggctcag gaccagagga 3360 tcagatggta cctgctgagc atggggtcta acgagaatat ccactccatc catttcagcg 3420 gacacgtgtt taccgtccgc aagaaagaag agtacaagat ggccctgtac aacctgtatc 3480 ccggcgtgtt cgaaaccgtc gagatgctgc cttccaaggc tgggatctgg cgggtggaat 3540 gcctgatcgg ggagcacctg catgccggaa tgtctaccct gttcctggtg tactccaata 3600 agtgtcagac ccccctgggg atggctagcg gacatatccg cgacttccag atcaccgctt 3660 ccggacagta cggacagtgg gctcctaagc tggctagact gcactattct ggctccatca 3720 acgcttggtc taccaaagag cctttctcct ggatcaaggt ggacctgctg gctccaatga 3780 tcatccatgg catcaaaacc cagggggcca ggcagaagtt ctcttccctg tacatcagcc 3840 agtttatcat catgtattct ctggatggga agaaatggca gacctacaga ggcaattcca 3900 ccgggaccct gatggtgttc tttggcaacg tcgacagctc tgggatcaag cacaacatct 3960 tcaatccccc tatcatcgcc cgctacatcc ggctgcaccc aacccattat tccatccgca 4020 gcaccctgcg gatggagctg atggggtgcg atctgaacag ctgttctatg cccctgggaa 4080 tggagtctaa ggccatctcc gacgctcaga tcaccgcctc cagctacttc accaatatgt 4140 ttgctacctg gtccccaagc aaggctagac tgcatctgca gggaagaagc aacgcttgga 4200 gaccacaggt gaacaatccc aaggagtggc tgcaggtcga cttccagaaa accatgaagg 4260 tgaccggagt caccacccag ggcgtgaaaa gcctgctgac ctctatgtac gtcaaggagt 4320 tcctgatctc ttccagccag gacgggcacc agtggaccct gttctttcag aacggaaagg 4380 tgaaagtctt ccagggcaat caggattcct ttacccctgt ggtcaacagc ctggacccac 4440 ccctgctgac caggtacctg agaatccacc cacagtcctg ggtgcatcag atcgctctga 4500 ggatggaagt cctgggctgc gaggcccagg acctgtattg atcgcgaata aaagatcttt 4560 attttcatta gatctgtgtg ttggtttttt gtgtggatct gccagttccc gatcgttaca 4620 ggcaattgcc ttaggccgca ggaaccccta gtgatggagt tggccactcc ctctctgcgc 4680 gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 4740 gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 4780 <210> 324 <211> 4442 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1003 <400> 324 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acattcagt ggctaccaga agatactacc tgggagccgt cgaactgagc tgggattaca 120 tgcagtctga cctgggagag ctgcccgtgg acgctagatt cccacctaga gtccctaagt 180 ccttcccctt caacaccagc gtggtctaca agaaaaccct gttcgtggag tttaccgacc 240 acctgttcaa catcgctaag cctagaccac catggatggg actgctggga ccaaccatcc 300 aggccgaggt gtacgacacc gtggtcatca ccctgaaaaa catggcttct caccccgtgt 360 ccctgcatgc tgtgggcgtc tcctactgga aggccagcga aggggctgag tatgacgatc 420 agaccagcca gcgggaaaaa gaggacgata aggtgttccc tggcgggtcc catacctacg 480 tgtggcaggt cctgaaggag aatggaccaa tggcttccga ccctctgtgc ctgacctact 540 cttatctgtc ccacgtggac ctggtcaagg atctgaacag cggcctgatc ggggctctgc 600 tggtgtgtcg cgaagggtcc ctggccaagg agaaaaccca gaccctgcat aagttcatcc 660 tgctgttcgc cgtgtttgac gaaggaaaaa gctggcactc tgagaccaag aactctctga 720 tgcaggacag ggatgccgct tccgccagag cttggcccaa gatgcacacc gtgaacggct 780 acgtcaatag gagcctgcct ggactgatcg gctgccacag aaagtccgtg tattggcatg 840 tcatcggaat gggcaccacc cctgaagtgc acagcatctt cctggagggg catacctttc 900 tggtccgcaa ccaccggcag gctagcctgg agatctctcc aatcaccttc ctgaccgccc 960 agaccctgct gatggacctg ggacagttcc tgctgttttg ccacatctcc agccaccagc 1020 atgatggcat ggaggcttac gtgaaagtcg actcctgtcc cgaggaacct cagctgagga 1080 tgaagaacaa tgaggaagcc gaagactatg acgatgacct gaccgacagc gagatggatg 1140 tggtccgctt cgatgacgat aactctccct cctttatcca gatccggtcc gtggccaaga 1200 aacaccctaa gacctgggtc cattacatcg ccgctgagga agaggactgg gattatgctc 1260 cactggtgct ggcccccgac gatagatcct acaaaagcca gtatctgaac aatggacccc 1320 agaggatcgg cagaaagtac aagaaagtga ggttcatggc ttataccgat gagaccttta 1380 agaccagaga agccatccag cacgagtccg ggatcctggg acctctgctg tacggcgaag 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccttac aatatctatc 1500 cacatggcat caccgatgtg agacctctgt actcccgccg gctgccaaag ggcgtgaaac 1560 acctgaagga cttcccaatc ctgcccgggg aaatctttaa gtataaatgg accgtcaccg 1620 tcgaggatgg gcccaccaag agcgacccta ggtgcctgac cagatactat tcttccttcg 1680 tgaatatgga gagagacctg gcttccggac tgatcggacc cctgctgatc tgttacaaag 1740 agagcgtgga tcagcgcggc aaccagatca tgtctgacaa gcggaatgtg atcctgttca 1800 gcgtctttga cgaaaaccgc tcttggtacc tgaccgagaa catccagcgg ttcctgccta 1860 atccagctgg agtgcagctg gaagatcccg agttccaggc ctctaacatc atgcattcca 1920 tcaatggcta cgtgttcgac tccctgcagc tgagcgtgtg cctgcacgag gtcgcttact 1980 ggtatatcct gagcatcgga gcccagaccg atttcctgtc tgtgttcttt tccggctaca 2040 cctttaagca taaaatggtg tatgaggaca ccctgaccct gttcccattt tccggcgaaa 2100 ccgtgttcat gagcatggag aatcccgggc tgtggatcct gggatgccac aactccgatt 2160 tcaggaatag agggatgacc gccctgctga aagtgagctc ttgtgacaag aacaccggag 2220 actactatga agatagctac gaggacatct ctgcttatct gctgtccaaa aacaatgcca 2280 tcgagcccag gagcttctct cagaaccctc cagtgctgaa gcgccaccag cgggagatca 2340 ccagaaccac cctgcagagc gatcaggaag agatcgacta cgacgatacc atctccgtgg 2400 aaatgaagaa agaggacttc gatatctatg acgaagatga gaaccagtct cccaggtcct 2460 tccagaagaa aaccagacat tactttatcg ccgctgtgga gcggctgtgg gactatggca 2520 tgtccagctc tcctcacgtg ctgagaaata gagctcagtc cggaagcgtc ccacagttca 2580 agaaagtggt cttccaggag tttaccgacg gaagctttac ccagccactg taccgcggcg 2640 aactgaacga gcacctgggg ctgctgggac cctatatccg ggctgaagtg gaggataaca 2700 tcatggtcac cttcaggaat caggccagca gaccctactc tttttattcc agcctgatct 2760 cctacgaaga ggaccagaga cagggagctg aaccaagaaa aaacttcgtg aagcctaatg 2820 agaccaaaac ctacttttgg aaggtgcagc accatatggc ccctaccaaa gacgagttcg 2880 attgcaaggc ctgggcttat tttagcgacg tggatctgga gaaggacgtc cactccggcc 2940 tgatcgggcc actgctggtg tgtcatacca acaccctgaa tccagctcac ggaaggcagg 3000 tgaccgtcca ggaattcgcc ctgttcttta ccatctttga tgagaccaag agctggtact 3060 tcaccgaaaa catggagagg aattgcagag ccccatgtaa catccagatg gaagacccca 3120 ccttcaagga gaactacaga tttcatgcta tcaatgggta tatcatggat accctgccag 3180 gactggtcat ggctcaggac cagaggatca gatggtacct gctgagcatg gggtctaacg 3240 agaatatcca ctccatccat ttcagcggac acgtgtttac cgtccgcaag aaagaagagt 3300 acaagatggc cctgtacaac ctgtatcccg gcgtgttcga aaccgtcgag atgctgcctt 3360 ccaaggctgg gatctggcgg gtggaatgcc tgatcgggga gcacctgcat gccggaatgt 3420 ctaccctgtt cctggtgtac tccaataagt gtcagacccc cctggggatg gctagcggac 3480 atatccgcga cttccagatc accgcttccg gacagtacgg acagtgggct cctaagctgg 3540 ctagactgca ctattctggc tccatcaacg cttggtctac caaagagcct ttctcctgga 3600 tcaaggtgga cctgctggct ccaatgatca tccatggcat caaaacccag ggggccaggc 3660 agaagttctc ttccctgtac atcagccagt ttatcatcat gtattctctg gatgggaaga 3720 aatggcagac ctacagaggc aattccaccg ggaccctgat ggtgttcttt ggcaacgtcg 3780 acagctctgg gatcaagcac aacatcttca atccccctat catcgcccgc tacatccggc 3840 tgcacccaac ccattattcc atccgcagca ccctgcggat ggagctgatg gggtgcgatc 3900 tgaacagctg ttctatgccc ctgggaatgg agtctaaggc catctccgac gctcagatca 3960 ccgcctccag ctacttcacc aatatgtttg ctacctggtc cccaagcaag gctagactgc 4020 atctgcaggg aagaagcaac gcttggagac cacaggtgaa caatcccaag gagtggctgc 4080 aggtcgactt ccagaaaacc atgaaggtga ccggagtcac cacccagggc gtgaaaagcc 4140 tgctgacctc tatgtacgtc aaggagttcc tgatctcttc cagccaggac gggcaccagt 4200 ggaccctgtt ctttcagaac ggaaaggtga aagtcttcca gggcaatcag gattccttta 4260 cccctgtggt caacagcctg gacccacccc tgctgaccag gtacctgaga atccacccac 4320 agtcctgggt gcatcagatc gctctgagga tggaagtcct gggctgcgag gcccaggacc 4380 tgtattgatc gcgaataaaa gatctttatt ttcattagat ctgtgtgttg gttttttgtg 4440 tg 4442 <210> 325 <211> 4493 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1006 <400> 325 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacaccaa tgtgtctccc ccagtgctga agaggcacca gagggagatc accaggacca 2400 ccctgcagtc tgaccaggag gagattgact atgatgacac catctctgtg gagatgaaga 2460 aggaggactt tgacatctac gacgaggacg agaaccagag ccccaggagc ttccagaaga 2520 agaccaggca ctacttcatt gctgctgtgg agaggctgtg ggactatggc atgagcagca 2580 gcccccatgt gctgaggaac agggcccagt ctggctctgt gccccagttc aagaaggtgg 2640 tgttccagga gttcactgat ggcagcttca cccagcccct gtacagaggg gagctgaatg 2700 agcacctggg cctgctgggc ccctacatca gggctgaggt ggaggacaac atcatggtga 2760 ccttcaggaa ccaggccagc aggccctaca gcttctacag cagcctgatc agctatgagg 2820 aggaccagag gcagggggct gagcccagga agaactttgt gaagcccaat gaaaccaaga 2880 cctacttctg gaaggtgcag caccacatgg cccccaccaa ggatgagttt gactgcaagg 2940 cctgggccta cttctctgat gtggacctgg agaaggatgt gcactctggc ctgattggcc 3000 ccctgctggt gtgccacacc aacaccctga accctgccca tggcaggcag gtgactgtgc 3060 aggagtttgc cctgttcttc accatctttg atgaaaccaa gagctggtac ttcactgaga 3120 acatggagag gaactgcagg gccccctgca acatccagat ggaggacccc accttcaagg 3180 agaactacag gttccatgcc atcaatggct acatcatgga caccctgcct ggcctggtga 3240 tggcccagga ccagaggatc aggtggtacc tgctgagcat gggcagcaat gagaacatcc 3300 acagcatcca cttctctggc catgtgttca ctgtgaggaa gaaggaggag tacaagatgg 3360 ccctgtacaa cctgtaccct ggggtgtttg agactgtgga gatgctgccc agcaaggctg 3420 gcatctggag ggtggagtgc ctgattgggg agcacctgca tgctggcatg agcaccctgt 3480 tcctggtgta cagcaacaag tgccagaccc ccctgggcat ggcctctggc cacatcaggg 3540 acttccagat cactgcctct ggccagtatg gccagtgggc ccccaagctg gccaggctgc 3600 actactctgg cagcatcaat gcctggagca ccaaggagcc cttcagctgg atcaaggtgg 3660 acctgctggc ccccatgatc atccatggca tcaagaccca gggggccagg cagaagttca 3720 gcagcctgta catcagccag ttcatcatca tgtacagcct ggatggcaag aagtggcaga 3780 cctacagggg caacagcact ggcaccctga tggtgttctt tggcaatgtg gacagctctg 3840 gcatcaagca caacatcttc aaccccccca tcattgccag atacatcagg ctgcacccca 3900 cccactacag catcaggagc accctgagga tggagctgat gggctgtgac ctgaacagct 3960 gcagcatgcc cctgggcatg gagagcaagg ccatctctga tgcccagatc actgccagca 4020 gctacttcac caacatgttt gccacctgga gccccagcaa ggccaggctg cacctgcagg 4080 gcaggagcaa tgcctggagg ccccaggtca acaaccccaa ggagtggctg caggtggact 4140 tccagaagac catgaaggtg actggggtga ccacccaggg ggtgaagagc ctgctgacca 4200 gcatgtatgt gaaggagttc ctgatcagca gcagccagga tggccaccag tggaccctgt 4260 tcttccagaa tggcaaggtg aaggtgttcc agggcaacca ggacagcttc acccctgtgg 4320 tgaacagcct ggaccccccc ctgctgacca gatacctgag gattcacccc cagagctggg 4380 tgcaccagat tgccctgagg atggaggtgc tgggctgtga ggcccaggac ctgtactgat 4440 cgcgaataaa agatctttat tttcattaga tctgtgtgtt ggttttttgt gtg 4493 <210> 326 <211> 4484 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1007 <400> 326 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagccc cccagtgctg aagaggcacc agagggagat caccaggacc accctgcagt 2400 ctgaccagga ggagattgac tatgatgaca ccatctctgt ggagatgaag aaggaggact 2460 ttgacatcta cgacgaggac gagaaccaga gccccaggag cttccagaag aagaccaggc 2520 actacttcat tgctgctgtg gagaggctgt gggactatgg catgagcagc agcccccatg 2580 tgctgaggaa cagggcccag tctggctctg tgccccagtt caagaaggtg gtgttccagg 2640 agttcactga tggcagcttc acccagcccc tgtacagagg ggagctgaat gagcacctgg 2700 gcctgctggg cccctacat agggctgagg tggaggacaa catcatggtg accttcagga 2760 accaggccag caggccctac agcttctaca gcagcctgat cagctatgag gaggaccaga 2820 ggcagggggc tgagcccagg aagaactttg tgaagcccaa tgaaaccaag acctacttct 2880 ggaaggtgca gcaccacatg gccccccacca aggatgagtt tgactgcaag gcctgggcct 2940 acttctctga tgtggacctg gagaaggatg tgcactctgg cctgattggc cccctgctgg 3000 tgtgccacac caacaccctg aaccctgccc atggcaggca ggtgactgtg caggagtttg 3060 ccctgttctt caccatcttt gatgaaacca agagctggta cttcactgag aacatggaga 3120 ggaactgcag ggccccctgc aacatccaga tggaggaccc caccttcaag gagaactaca 3180 ggttccatgc catcaatggc tacatcatgg acaccctgcc tggcctggtg atggcccagg 3240 accagaggat caggtggtac ctgctgagca tgggcagcaa tgagaacatc cacagcatcc 3300 acttctctgg ccatgtgttc actgtgagga agaaggagga gtacaagatg gccctgtaca 3360 acctgtaccc tggggtgttt gagactgtgg agatgctgcc cagcaaggct ggcatctgga 3420 gggtggagtg cctgattggg gagcacctgc atgctggcat gagcaccctg ttcctggtgt 3480 acagcaacaa gtgccagacc cccctgggca tggcctctgg ccacatcagg gacttccaga 3540 tcactgcctc tggccagtat ggccagtggg cccccaagct ggccaggctg cactactctg 3600 gcagcatcaa tgcctggagc accaaggagc ccttcagctg gatcaaggtg gacctgctgg 3660 cccccatgat catccatggc atcaagaccc agggggccag gcagaagttc agcagcctgt 3720 acatcagcca gttcatcatc atgtacagcc tggatggcaa gaagtggcag acctacaggg 3780 gcaacagcac tggcaccctg atggtgttct ttggcaatgt ggacagctct ggcatcaagc 3840 acaacatctt caaccccccc atcattgcca gatacatcag gctgcacccc acccactaca 3900 gcatcaggag caccctgagg atggagctga tgggctgtga cctgaacagc tgcagcatgc 3960 ccctgggcat ggagagcaag gccatctctg atgcccagat cactgccagc agctacttca 4020 ccaacatgtt tgccacctgg agccccagca aggccaggct gcacctgcag ggcaggagca 4080 atgcctggag gccccaggtc aacaacccca aggagtggct gcaggtggac ttccagaaga 4140 ccatgaaggt gactggggtg accacccagg gggtgaagag cctgctgacc agcatgtatg 4200 tgaaggagtt cctgatcagc agcagccagg atggccacca gtggaccctg ttcttccaga 4260 atggcaaggt gaaggtgttc cagggcaacc aggacagctt cacccctgtg gtgaacagcc 4320 tggacccccc cctgctgacc agatacctga ggattcaccc ccagagctgg gtgcaccaga 4380 ttgccctgag gatggaggtg ctgggctgtg aggcccagga cctgtactga tcgcgaataa 4440 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtg 4484 <210> 327 <211> 4502 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1008 <400> 327 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagcaa tgtgtctaac aagactcccc cagtgctgaa gaggcaccag agggagatca 2400 ccaggaccac cctgcagtct gaccaggagg agattgacta tgatgacacc atctctgtgg 2460 agatgaagaa ggaggacttt gacatctacg acgaggacga gaaccagagc cccaggagct 2520 tccagaagaa gaccaggcac tacttcattg ctgctgtgga gaggctgtgg gactatggca 2580 tgagcagcag cccccatgtg ctgaggaaca gggcccagtc tggctctgtg ccccagttca 2640 agaaggtggt gttccaggag ttcactgatg gcagcttcac ccagcccctg tacagagggg 2700 agctgaatga gcacctgggc ctgctgggcc cctacatcag ggctgaggtg gaggacaaca 2760 tcatggtgac cttcaggaac caggccagca ggccctacag cttctacagc agcctgatca 2820 gctatgagga ggaccagagg cagggggctg agcccaggaa gaactttgtg aagcccaatg 2880 aaaccaagac ctacttctgg aaggtgcagc accacatggc ccccaccaag gatgagtttg 2940 actgcaaggc ctgggcctac ttctctgatg tggacctgga gaaggatgtg cactctggcc 3000 tgattggccc cctgctggtg tgccacacca acaccctgaa ccctgcccat ggcaggcagg 3060 tgactgtgca ggagtttgcc ctgttcttca ccatctttga tgaaaccaag agctggtact 3120 tcactgagaa catggagagg aactgcaggg ccccctgcaa catccagatg gaggacccca 3180 ccttcaagga gaactacagg ttccatgcca tcaatggcta catcatggac accctgcctg 3240 gcctggtgat ggcccaggac cagaggatca ggtggtacct gctgagcatg ggcagcaatg 3300 agaacatcca cagcatccac ttctctggcc atgtgttcac tgtgaggaag aaggaggagt 3360 acaagatggc cctgtacaac ctgtaccctg gggtgtttga gactgtggag atgctgccca 3420 gcaaggctgg catctggagg gtggagtgcc tgattgggga gcacctgcat gctggcatga 3480 gcaccctgtt cctggtgtac agcaacaagt gccagacccc cctgggcatg gcctctggcc 3540 acatcaggga cttccagatc actgcctctg gccagtatgg ccagtgggcc cccaagctgg 3600 ccaggctgca ctactctggc agcatcaatg cctggagcac caaggagccc ttcagctgga 3660 tcaaggtgga cctgctggcc cccatgatca tccatggcat caagacccag ggggccaggc 3720 agaagttcag cagcctgtac atcagccagt tcatcatcat gtacagcctg gatggcaaga 3780 agtggcagac ctacaggggc aacagcactg gcaccctgat ggtgttcttt ggcaatgtgg 3840 acagctctgg catcaagcac aacatcttca acccccccat cattgccaga tacatcaggc 3900 tgcaccccac ccactacagc atcaggagca ccctgaggat ggagctgatg ggctgtgacc 3960 tgaacagctg cagcatgccc ctgggcatgg agagcaaggc catctctgat gcccagatca 4020 ctgccagcag ctacttcacc aacatgtttg ccacctggag ccccagcaag gccaggctgc 4080 acctgcaggg caggagcaat gcctggaggc cccaggtcaa caaccccaag gagtggctgc 4140 aggtggactt ccagaagacc atgaaggtga ctggggtgac cacccagggg gtgaagagcc 4200 tgctgaccag catgtatgtg aaggagttcc tgatcagcag cagccaggat ggccaccagt 4260 ggaccctgtt cttccagaat ggcaaggtga aggtgttcca gggcaaccag gacagcttca 4320 cccctgtggt gaacagcctg gacccccccc tgctgaccag atacctgagg attcaccccc 4380 agagctgggt gcaccagatt gccctgagga tggaggtgct gggctgtgag gcccaggacc 4440 tgtactgatc gcgaataaaa gatctttatt ttcattagat ctgtgtgttg gttttttgtg 4500 tg 4502 <210> 328 <211> 4511 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1015 <400> 328 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagcaa tgtgtctaac aagactaaca atagcccccc agtgctgaag aggcaccaga 2400 gggagatcac caggaccacc ctgcagtctg accaggagga gattgactat gatgacacca 2460 tctctgtgga gatgaagaag gaggactttg acatctacga cgaggacgag aaccagagcc 2520 ccaggagctt ccagaagaag accaggcact acttcattgc tgctgtggag aggctgtggg 2580 actatggcat gagcagcagc ccccatgtgc tgaggaacag ggcccagtct ggctctgtgc 2640 cccagttcaa gaaggtggtg ttccaggagt tcactgatgg cagcttcacc cagcccctgt 2700 acagagggga gctgaatgag cacctgggcc tgctgggccc ctacatcagg gctgaggtgg 2760 aggacaacat catggtgacc ttcaggaacc aggccagcag gccctacagc ttctacagca 2820 gcctgatcag ctatgaggag gaccagaggc agggggctga gcccaggaag aactttgtga 2880 agcccaatga aaccaagacc tacttctgga aggtgcagca ccacatggcc cccaccaagg 2940 atgagtttga ctgcaaggcc tgggcctact tctctgatgt ggacctggag aaggatgtgc 3000 actctggcct gattggcccc ctgctggtgt gccacaccaa caccctgaac cctgcccatg 3060 gcaggcaggt gactgtgcag gagtttgccc tgttcttcac catctttgat gaaaccaaga 3120 gctggtactt cactgagaac atggagagga actgcagggc cccctgcaac atccagatgg 3180 aggaccccac cttcaaggag aactacaggt tccatgccat caatggctac atcatggaca 3240 ccctgcctgg cctggtgatg gcccaggacc agaggatcag gtggtacctg ctgagcatgg 3300 gcagcaatga gaacatccac agcatccact tctctggcca tgtgttcact gtgaggaaga 3360 aggaggagta caagatggcc ctgtacaacc tgtaccctgg ggtgtttgag actgtggaga 3420 tgctgcccag caaggctggc atctggaggg tggagtgcct gattggggag cacctgcatg 3480 ctggcatgag caccctgttc ctggtgtaca gcaacaagtg ccagaccccc ctgggcatgg 3540 cctctggcca catcagggac ttccagatca ctgcctctgg ccagtatggc cagtgggccc 3600 ccaagctggc caggctgcac tactctggca gcatcaatgc ctggagcacc aaggagccct 3660 tcagctggat caaggtggac ctgctggccc ccatgatcat ccatggcatc aagacccagg 3720 gggccaggca gaagttcagc agcctgtaca tcagccagtt catcatcatg tacagcctgg 3780 atggcaagaa gtggcagacc tacaggggca acagcactgg caccctgatg gtgttctttg 3840 gcaatgtgga cagctctggc atcaagcaca acatcttcaa cccccccatc attgccagat 3900 acatcaggct gcaccccacc cactacagca tcaggagcac cctgaggatg gagctgatgg 3960 gctgtgacct gaacagctgc agcatgcccc tgggcatgga gagcaaggcc atctctgatg 4020 cccagatcac tgccagcagc tacttcacca acatgtttgc cacctggagc cccagcaagg 4080 ccaggctgca cctgcagggc aggagcaatg cctggaggcc ccaggtcaac aaccccaagg 4140 agtggctgca ggtggacttc cagaagacca tgaaggtgac tggggtgacc acccaggggg 4200 tgaagagcct gctgaccagc atgtatgtga aggagttcct gatcagcagc agccaggatg 4260 gccaccagtg gaccctgttc ttccagaatg gcaaggtgaa ggtgttccag ggcaaccagg 4320 acagcttcac ccctgtggtg aacagcctgg acccccccct gctgaccaga tacctgagga 4380 ttcaccccca gagctgggtg caccagattg ccctgaggat ggaggtgctg ggctgtgagg 4440 cccaggacct gtactgatcg cgaataaaag atctttattt tcattagatc tgtgtgttgg 4500 ttttttgtgt g 4511 <210> 329 <211> 4520 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1016 <400> 329 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagcaa tgtgtctaac aagactaaca atagcaatgc caccccccca gtgctgaaga 2400 ggcaccagag ggagatcacc aggaccaccc tgcagtctga ccaggaggag attgactatg 2460 atgacaccat ctctgtggag atgaagaagg aggactttga catctacgac gaggacgaga 2520 accagagccc caggagcttc cagaagaaga ccaggcacta cttcattgct gctgtggaga 2580 ggctgtggga ctatggcatg agcagcagcc cccatgtgct gaggaacagg gcccagtctg 2640 gctctgtgcc ccagttcaag aaggtggtgt tccaggagtt cactgatggc agcttcaccc 2700 agcccctgta cagaggggag ctgaatgagc acctgggcct gctgggcccc tacatcaggg 2760 ctgaggtgga ggacaacatc atggtgacct tcaggaacca ggccagcagg ccctacagct 2820 tctacagcag cctgatcagc tatgaggagg accagaggca gggggctgag cccaggaaga 2880 actttgtgaa gcccaatgaa accaagacct acttctggaa ggtgcagcac cacatggccc 2940 ccaccaagga tgagtttgac tgcaaggcct gggcctactt ctctgatgtg gacctggaga 3000 aggatgtgca ctctggcctg attggccccc tgctggtgtg ccacaccaac accctgaacc 3060 ctgcccatgg caggcaggtg actgtgcagg agtttgccct gttcttcacc atctttgatg 3120 aaaccaagag ctggtacttc actgagaaca tggagaggaa ctgcagggcc ccctgcaaca 3180 tccagatgga ggaccccacc ttcaaggaga actacaggtt ccatgccatc aatggctaca 3240 tcatggacac cctgcctggc ctggtgatgg cccaggacca gaggatcagg tggtacctgc 3300 tgagcatggg cagcaatgag aacatccaca gcatccactt ctctggccat gtgttcactg 3360 tgaggaagaa ggaggagtac aagatggccc tgtacaacct gtaccctggg gtgtttgaga 3420 ctgtggagat gctgcccagc aaggctggca tctggagggt ggagtgcctg attggggagc 3480 acctgcatgc tggcatgagc accctgttcc tggtgtacag caacaagtgc cagacccccc 3540 tgggcatggc ctctggccac atcagggact tccagatcac tgcctctggc cagtatggcc 3600 agtgggcccc caagctggcc aggctgcact actctggcag catcaatgcc tggagcacca 3660 aggagccctt cagctggatc aaggtggacc tgctggcccc catgatcatc catggcatca 3720 agacccaggg ggccaggcag aagttcagca gcctgtacat cagccagttc atcatcatgt 3780 acagcctgga tggcaagaag tggcagacct acaggggcaa cagcactggc accctgatgg 3840 tgttctttgg caatgtggac agctctggca tcaagcacaa catcttcaac ccccccatca 3900 ttgccagata catcaggctg caccccaccc actacagcat caggagcacc ctgaggatgg 3960 agctgatggg ctgtgacctg aacagctgca gcatgcccct gggcatggag agcaaggcca 4020 tctctgatgc ccagatcact gccagcagct acttcaccaa catgtttgcc acctggagcc 4080 ccagcaaggc caggctgcac ctgcagggca ggagcaatgc ctggaggccc caggtcaaca 4140 accccaagga gtggctgcag gtggacttcc agaagaccat gaaggtgact ggggtgacca 4200 cccagggggt gaagagcctg ctgaccagca tgtatgtgaa ggagttcctg atcagcagca 4260 gccaggatgg ccaccagtgg accctgttct tccagaatgg caaggtgaag gtgttccagg 4320 gcaaccagga cagcttcacc cctgtggtga acagcctgga cccccccctg ctgaccagat 4380 acctgaggat tcacccccag agctgggtgc accagattgc cctgaggatg gaggtgctgg 4440 gctgtgaggc ccaggacctg tactgatcgc gaataaaaga tctttatttt cattagatct 4500 gtgtgttggt tttttgtgtg 4520 <210> 330 <211> 4475 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1017 <400> 330 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc aacaccagcc 2340 ccccagtgct gaagaggcac cagagggaga tcaccaggac caccctgcag tctgaccagg 2400 aggagattga ctatgatgac accatctctg tggagatgaa gaaggaggac tttgacatct 2460 acgacgagga cgagaaccag agccccagga gcttccagaa gaagaccagg cactacttca 2520 ttgctgctgt ggagaggctg tgggactatg gcatgagcag cagcccccat gtgctgagga 2580 acagggccca gtctggctct gtgccccagt tcaagaaggt ggtgttccag gagttcactg 2640 atggcagctt cacccagccc ctgtacagag gggagctgaa tgagcacctg ggcctgctgg 2700 gcccctacat cagggctgag gtggaggaca acatcatggt gaccttcagg aaccaggcca 2760 gcaggcccta cagcttctac agcagcctga tcagctatga ggaggaccag aggcaggggg 2820 ctgagcccag gaagaacttt gtgaagccca atgaaaccaa gacctacttc tggaaggtgc 2880 agcaccacat ggcccccacc aaggatgagt ttgactgcaa ggcctgggcc tacttctctg 2940 atgtggacct ggagaaggat gtgcactctg gcctgattgg ccccctgctg gtgtgccaca 3000 ccaacaccct gaaccctgcc catggcaggc aggtgactgt gcaggagttt gccctgttct 3060 tcaccatctt tgatgaaacc aagagctggt acttcactga gaacatggag aggaactgca 3120 gggccccctg caacatccag atggaggacc ccaccttcaa ggagaactac aggttccatg 3180 ccatcaatgg ctacatcatg gacaccctgc ctggcctggt gatggcccag gaccagagga 3240 tcaggtggta cctgctgagc atgggcagca atgagaacat ccacagcatc cacttctctg 3300 gccatgtgtt cactgtgagg aagaaggagg agtacaagat ggccctgtac aacctgtacc 3360 ctggggtgtt tgagactgtg gagatgctgc ccagcaaggc tggcatctgg agggtggagt 3420 gcctgattgg ggagcacctg catgctggca tgagcaccct gttcctggtg tacagcaaca 3480 agtgccagac ccccctgggc atggcctctg gccacatcag ggacttccag atcactgcct 3540 ctggccagta tggccagtgg gcccccaagc tggccaggct gcactactct ggcagcatca 3600 atgcctggag caccaaggag cccttcagct ggatcaaggt ggacctgctg gcccccatga 3660 tcatccatgg catcaagacc cagggggcca ggcagaagtt cagcagcctg tacatcagcc 3720 agttcatcat catgtacagc ctggatggca agaagtggca gacctacagg ggcaacagca 3780 ctggcaccct gatggtgttc tttggcaatg tggacagctc tggcatcaag cacaacatct 3840 tcaacccccc catcattgcc agatacatca ggctgcaccc cacccactac agcatcagga 3900 gcaccctgag gatggagctg atgggctgtg acctgaacag ctgcagcatg cccctgggca 3960 tggagagcaa ggccatctct gatgcccaga tcactgccag cagctacttc accaacatgt 4020 ttgccacctg gagccccagc aaggccaggc tgcacctgca gggcaggagc aatgcctgga 4080 ggccccaggt caacaacccc aaggagtggc tgcaggtgga cttccagaag accatgaagg 4140 tgactggggt gaccacccag ggggtgaaga gcctgctgac cagcatgtat gtgaaggagt 4200 tcctgatcag cagcagccag gatggccacc agtggaccct gttcttccag aatggcaagg 4260 tgaaggtgtt ccagggcaac caggacagct tcacccctgt ggtgaacagc ctggaccccc 4320 ccctgctgac cagatacctg aggattcacc cccagagctg ggtgcaccag attgccctga 4380 ggatggaggt gctgggctgt gaggcccagg acctgtactg atcgcgaata aaagatcttt 4440 attttcatta gatctgtgtg ttggtttttt gtgtg 4475 <210> 331 <211> 4466 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1018 <400> 331 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc taacaacagc cccccagtgc 2340 tgaagaggca ccagagggag atcaccagga ccaccctgca gtctgaccag gaggagattg 2400 actatgatga caccatctct gtggagatga agaaggagga ctttgacatc tacgacgagg 2460 acgagaacca gagccccagg agcttccaga agaagaccag gcactacttc attgctgctg 2520 tggagaggct gtgggactat ggcatgagca gcagccccca tgtgctgagg aacagggccc 2580 agtctggctc tgtgccccag ttcaagaagg tggtgttcca ggagttcact gatggcagct 2640 tcacccagcc cctgtacaga ggggagctga atgagcacct gggcctgctg ggcccctaca 2700 tcagggctga ggtggaggac aacatcatgg tgaccttcag gaaccaggcc agcaggccct 2760 acagcttcta cagcagcctg atcagctatg aggaggacca gaggcagggg gctgagccca 2820 ggaagaactt tgtgaagccc aatgaaacca agacctactt ctggaaggtg cagcaccaca 2880 tggccccccac caaggatgag tttgactgca aggcctgggc ctacttctct gatgtggacc 2940 tggagaagga tgtgcactct ggcctgattg gccccctgct ggtgtgccac accaacaccc 3000 tgaaccctgc ccatggcagg caggtgactg tgcaggagtt tgccctgttc ttcaccatct 3060 ttgatgaaac caagagctgg tacttcactg agaacatgga gaggaactgc agggccccct 3120 gcaacatcca gatggaggac cccaccttca aggagaacta caggttccat gccatcaatg 3180 gctacatcat ggacaccctg cctggcctgg tgatggccca ggaccagagg atcaggtggt 3240 acctgctgag catgggcagc aatgagaaca tccacagcat ccacttctct ggccatgtgt 3300 tcactgtgag gaagaaggag gagtacaaga tggccctgta caacctgtac cctggggtgt 3360 ttgagactgt ggagatgctg cccagcaagg ctggcatctg gagggtggag tgcctgattg 3420 gggagcacct gcatgctggc atgagcaccc tgttcctggt gtacagcaac aagtgccaga 3480 cccccctggg catggcctct ggccacatca gggacttcca gatcactgcc tctggccagt 3540 atggccagtg ggcccccaag ctggccaggc tgcactactc tggcagcatc aatgcctgga 3600 gcaccaagga gcccttcagc tggatcaagg tggacctgct ggcccccatg atcatccatg 3660 gcatcaagac ccagggggcc aggcagaagt tcagcagcct gtacatcagc cagttcatca 3720 tcatgtacag cctggatggc aagaagtggc agacctacag gggcaacagc actggcaccc 3780 tgatggtgtt ctttggcaat gtggacagct ctggcatcaa gcacaacatc ttcaaccccc 3840 ccatcattgc cagatacatc aggctgcacc ccacccacta cagcatcagg agcaccctga 3900 ggatggagct gatgggctgt gacctgaaca gctgcagcat gcccctgggc atggagagca 3960 aggccatctc tgatgcccag atcactgcca gcagctactt caccaacatg tttgccacct 4020 ggagccccag caaggccagg ctgcacctgc agggcaggag caatgcctgg aggccccagg 4080 tcaacaaccc caaggagtgg ctgcaggtgg acttccagaa gaccatgaag gtgactgggg 4140 tgaccaccca gggggtgaag agcctgctga ccagcatgta tgtgaaggag ttcctgatca 4200 gcagcagcca ggatggccac cagtggaccc tgttcttcca gaatggcaag gtgaaggtgt 4260 tccagggcaa ccaggacagc ttcacccctg tggtgaacag cctggacccc cccctgctga 4320 ccagatacct gaggattcac ccccagagct gggtgcacca gattgccctg aggatggagg 4380 tgctgggctg tgaggcccag gacctgtact gatcgcgaat aaaagatctt tattttcatt 4440 agatctgtgt gttggttttt tgtgtg 4466 <210> 332 <211> 4484 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1019 <400> 332 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccaga aggtactacc tgggagctgt ggaactgagc tgggactaca 120 tgcagtctga cctgggagag ctgcctgtgg atgctagatt tcctccaaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaaaaccct gtttgtggaa ttcacagacc 240 acctgttcaa tattgccaag cctagacctc cttggatggg cctgctgggc cctacaattc 300 aggctgaggt gtatgacaca gtggtcatca ccctgaagaa catggccagc catcctgtgt 360 ctctgcatgc tgtgggagtg tcttactgga aggcttctga gggggctgag tatgatgacc 420 agacaagcca gagagagaaa gaggatgaca aggttttccc tgggggcagc cacacctatg 480 tctggcaggt cctgaaagaa aatggcccta tggcctctga tcctctgtgc ctgacataca 540 gctacctgag ccatgtggac ctggtcaagg acctgaactc tggcctgatt ggggctctgc 600 tggtgtgtag agaaggcagc ctggccaaag aaaagaccca gacactgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgagacaaag aacagcctga 720 tgcaggacag agatgctgcc tctgctagag cttggcccaa gatgcacaca gtgaatggct 780 atgtgaacag aagcctgcct ggactgattg gatgccacag aaagtctgtg tactggcatg 840 tgattggcat gggcaccaca cctgaggtgc acagcatctt tctggaagga cacaccttcc 900 tggtgaggaa ccacagacag gccagcctgg aaatcagccc tatcaccttc ctgacagctc 960 agaccctgct gatggatctg ggccagtttc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaagcctat gtgaaggtgg acagctgccc tgaagaaccc cagctgagaa 1080 tgaagaacaa tgaggaagct gaggactatg atgatgacct gacagactct gagatggatg 1140 tggtcagatt tgatgatgat aacagcccca gcttcatcca gatcagatct gtggccaaga 1200 agcaccccaa gacctgggtg cactatattg ctgctgagga agaggactgg gattatgctc 1260 ctctggtgct ggcccctgat gacagaagct acaagagcca gtacctgaac aatggccctc 1320 agagaattgg caggaagtat aagaaagtga ggttcatggc ctacacagat gagacattca 1380 agaccagaga ggctatccag catgagtctg gcattctggg acctctgctg tatggggaag 1440 tgggggacac actgctgatc atcttcaaga accaggccag cagaccctac aacatctacc 1500 ctcatggcat cacagatgtg aggcctctgt actctagaag gctgcccaag ggggtgaagc 1560 acctgaagga cttccctatc ctgcctgggg agatcttcaa gtacaagtgg acagtgacag 1620 tggaggatgg ccctaccaag tctgatccta gatgcctgac aaggtactac agcagctttg 1680 tgaacatgga aagggacctg gcctctggcc tgattggtcc tctgctgatc tgctacaaag 1740 aatctgtgga ccagaggggc aaccagatca tgagtgacaa gagaaatgtg atcctgttct 1800 ctgtctttga tgagaacagg tcctggtatc tgacagagaa catccagagg tttctgccca 1860 atcctgctgg ggtgcagctg gaagatcctg agttccaggc ctccaacatc atgcactcca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgaa gtggcctact 1980 ggtacatcct gtctattggg gcccagacag acttcctgtc tgtgttcttt tctggctaca 2040 ccttcaagca caagatggtg tatgaggata ccctgacact gttcccattc tctggggaga 2100 cagtgttcat gagcatggaa aaccctggcc tgtggatcct gggctgtcac aacagtgact 2160 tcagaaacag aggcatgaca gccctgctga aggtgtccag ctgtgacaag aacactgggg 2220 actactatga ggactcttat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcctag gagcttctct cagaacgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagccc tcctgtgctg aagagacacc agagggagat caccagaacc acactgcagt 2400 ctgaccaaga ggaaattgat tatgatgaca ccatctctgt ggagatgaag aaagaagatt 2460 ttgacatcta tgatgaggat gagaatcaga gccccagatc tttccagaag aaaacaaggc 2520 actacttcat tgctgctgtg gaaagactgt gggactatgg catgagcagc agcccccatg 2580 tgctgagaaa cagggcccag tctggaagtg tgccccagtt caagaaagtg gtgttccaag 2640 agttcacaga tggcagcttc acccagcctc tgtatagagg ggagctgaat gagcacctgg 2700 gactgctggg accttacatc agagctgagg tggaggataa catcatggtc acctttagaa 2760 accaggcctc taggccctac tccttctaca gctccctgat cagctatgaa gaggaccaga 2820 gacagggggc tgagcccaga aagaactttg tgaagcccaa tgagactaag acctactttt 2880 ggaaggtgca gcaccacatg gcccctacaa aggatgagtt tgactgcaag gcctgggcct 2940 acttctctga tgtggacctg gagaaggatg tgcactctgg actcattgga cccctgcttg 3000 tgtgccacac caacacactg aatcctgctc atggcaggca agtgacagtg caagagtttg 3060 ccctgttctt caccatcttt gatgagacaa agtcctggta cttcacagaa aacatggaaa 3120 gaaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa gagaactaca 3180 ggttccatgc catcaatggc tacatcatgg acactctgcc tggcctggtt atggcacagg 3240 atcagaggat cagatggtat ctgctgtcca tgggctccaa tgagaatatc cacagcatcc 3300 acttctctgg ccatgtgttc acagtgagga aaaaagaaga gtacaagatg gccctgtaca 3360 atctgtaccc tggggtgttt gagactgtgg aaatgctgcc tagcaaggct ggaatctgga 3420 gggtggaatg tctgattgga gagcatctgc atgctggaat gtctaccctg ttcctggtgt 3480 acagcaacaa gtgtcagacc cctctgggca tggcctctgg acacatcaga gacttccaga 3540 tcacagcctc tggccagtat ggacagtggg ctcctaaact ggctagactg cactactctg 3600 gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg gacctgctgg 3660 ctcccatgat catccatgga atcaagaccc agggggccag acagaagttc agcagcctgt 3720 acatcagcca gttcatcatc atgtacagcc tggatggcaa gaagtggcag acctacagag 3780 gcaacagcac aggcacactc atggtgttct ttggcaatgt ggactcttct ggcattaagc 3840 acaacatctt caaccctcca atcattgcca ggtacatcag gctgcacccc acacactaca 3900 gcatcagatc taccctgagg atggaactga tgggctgtga cctgaacagc tgctctatgc 3960 ccctgggaat ggaaagcaag gccatctctg atgcccagat cacagccagc agctacttca 4020 ccaacatgtt tgccacatgg tccccatcta aggccaggct gcatctgcag ggcagatcta 4080 atgcttggag gccccaagtg aacaacccca aagagtggct gcaggtggac tttcagaaaa 4140 ccatgaaagt gacaggagtg accacacagg gggtcaagtc tctgctgacc tctatgtatg 4200 tgaaagagtt cctgatctcc agcagccagg atggccacca gtggaccctg tttttccaga 4260 atggcaaagt caaggtgttc cagggaaacc aggacagctt cacacctgtg gtcaactccc 4320 tggatcctcc actgctgacc agatacctga gaattcaccc tcagtcttgg gtgcaccaga 4380 ttgctctgag aatggaagtg ctgggatgtg aagctcagga cctctactaa tcgcgaataa 4440 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtg 4484 <210> 333 <211> 4484 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1020 <400> 333 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggctaccaga agatactacc tgggagctgt ggaactgagc tgggattaca 120 tgcagtctga cctgggagag ctgcctgtgg atgctagatt cccacctaga gtccctaagt 180 ccttcccctt caacacctct gtggtctaca agaaaaccct gtttgtggag tttacagacc 240 acctgttcaa cattgctaag cctagaccac catggatggg actgctggga ccaaccatcc 300 aggcagaggt gtatgacaca gtggtcatca ccctgaaaaa catggcttct caccctgtgt 360 ccctgcatgc tgtgggagtc tcctactgga aggcctctga aggggctgag tatgatgatc 420 agaccagcca gagggaaaaa gaggatgata aggtgttccc tggagggtcc catacctatg 480 tgtggcaggt cctgaaggag aatggaccaa tggcttctga ccctctgtgc ctgacctact 540 cttatctgtc ccatgtggac ctggtcaagg atctgaactc tggcctgatt ggggctctgc 600 tggtgtgtag ggaagggtcc ctggccaagg agaaaaccca gaccctgcat aagttcatcc 660 tgctgtttgc tgtgtttgat gaaggaaaaa gctggcactc tgagaccaag aactctctga 720 tgcaggacag ggatgctgct tctgccagag cttggcccaa gatgcacaca gtgaatggct 780 atgtcaatag gagcctgcct ggactgattg gctgccacag aaagtctgtg tattggcatg 840 tcattggaat gggcaccacc cctgaagtgc acagcatctt cctggagggg catacctttc 900 tggtcaggaa ccacaggcag gctagcctgg agatctctcc aatcaccttc ctgacagccc 960 agaccctgct gatggacctg ggacagttcc tgctgttttg ccacatctcc agccaccagc 1020 atgatggcat ggaggcttat gtgaaagtgg actcctgtcc tgaggaacct cagctgagga 1080 tgaagaacaa tgaggaagct gaagactatg atgatgacct gacagactct gagatggatg 1140 tggtcaggtt tgatgatgat aactctccct cctttatcca gatcaggtct gtggccaaga 1200 aacaccctaa gacctgggtc cattacattg ctgctgagga agaggactgg gattatgctc 1260 cactggtgct ggcccctgat gatagatcct acaaaagcca gtatctgaac aatggacccc 1320 agaggattgg cagaaagtac aagaaagtga ggttcatggc ttatacagat gagaccttta 1380 agaccagaga agccatccag catgagtctg ggatcctggg acctctgctg tatggggaag 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccttac aatatctatc 1500 cacatggcat cacagatgtg agacctctgt actccaggag gctgccaaag ggggtgaaac 1560 acctgaagga cttcccaatc ctgcctgggg aaatctttaa gtataaatgg acagtcacag 1620 tggaggatgg gcccaccaag tctgacccta ggtgcctgac cagatactat tcttcctttg 1680 tgaatatgga gagagacctg gcttctggac tgattggacc cctgctgatc tgttacaaag 1740 agtctgtgga tcagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtctttga tgaaaacagg tcttggtacc tgacagagaa catccagagg ttcctgccta 1860 atccagctgg agtgcagctg gaagatcctg agttccaggc ctctaacatc atgcattcca 1920 tcaatggcta tgtgtttgac tccctgcagc tgtctgtgtg cctgcatgag gtggcttact 1980 ggtatatcct gagcattgga gcccagacag atttcctgtc tgtgttcttt tctggctaca 2040 cctttaagca taaaatggtg tatgaggaca ccctgaccct gttcccattt tctggagaaa 2100 ctgtgttcat gagcatggag aatcctgggc tgtggatcct gggatgccac aactctgatt 2160 tcaggaatag agggatgaca gccctgctga aagtgagctc ttgtgacaag aacacaggag 2220 actactatga agatagctat gaggacatct ctgcttatct gctgtccaaa aacaatgcca 2280 ttgagcccag gagcttctct cagaacgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagccc tccagtgctg aagaggcacc agagggagat caccagaacc accctgcagt 2400 ctgatcagga agagattgac tatgatgata ccatctctgt ggaaatgaag aaagaggact 2460 ttgatatcta tgatgaagat gagaaccagt ctcccaggtc cttccagaag aaaaccagac 2520 attactttat tgctgctgtg gagaggctgt gggactatgg catgtccagc tctcctcatg 2580 tgctgagaaa tagagctcag tctggatctg tcccacagtt caagaaagtg gtcttccagg 2640 agtttacaga tggaagcttt acccagccac tgtacagggg agaactgaat gagcacctgg 2700 ggctgctggg accctatatc agggctgaag tggaggataa catcatggtc accttcagga 2760 atcaggccag cagaccctac tctttttatt ccagcctgat ctcctatgaa gaggaccaga 2820 gacagggagc tgaaccaaga aaaaactttg tgaagcctaa tgagaccaaa acctactttt 2880 ggaaggtgca gcaccatatg gcccctacca aagatgagtt tgattgcaag gcctgggctt 2940 atttttctga tgtggatctg gagaaggatg tccactctgg cctgattggg ccactgctgg 3000 tgtgtcatac caacaccctg aatccagctc atggaaggca ggtgacagtc caggaatttg 3060 ccctgttctt taccatcttt gatgagacca agagctggta cttcacagaa aacatggaga 3120 ggaattgcag agccccatgt aacatccaga tggaagaccc caccttcaag gagaactaca 3180 gatttcatgc tatcaatggg tatatcatgg ataccctgcc aggactggtc atggctcagg 3240 accagaggat cagatggtac ctgctgagca tggggtctaa tgagaatatc cactccatcc 3300 atttctctgg acatgtgttt acagtaagga agaaagaaga gtacaagatg gccctgtaca 3360 acctgtatcc tggggtgttt gaaacagtgg agatgctgcc ttccaaggct gggatctgga 3420 gggtggaatg cctgattggg gagcacctgc atgctggaat gtctaccctg ttcctggtgt 3480 actccaataa gtgtcagacc cccctgggga tggcttctgg acatatcagg gacttccaga 3540 tcacagcttc tggacagtat ggacagtggg ctcctaagct ggctagactg cactattctg 3600 gctccatcaa tgcttggtct accaaagagc ctttctcctg gatcaaggtg gacctgctgg 3660 ctccaatgat catccatggc atcaaaaccc agggggccag gcagaagttc tcttccctgt 3720 acatcagcca gtttatcatc atgtattctc tggatgggaa gaaatggcag acctacagag 3780 gcaattccac agggaccctg atggtgttct ttggcaatgt ggacagctct gggatcaagc 3840 acaacatctt caatccccct atcattgcca ggtacatcag actgcaccca acccattatt 3900 ccatcaggag caccctgaga atggagctga tggggtgtga tctgaacagc tgttctatgc 3960 ccctgggaat ggagtctaag gccatctctg atgctcagat cacagcctcc agctacttca 4020 ccaatatgtt tgctacctgg tccccaagca aggctagact gcatctgcag ggaagaagca 4080 atgcttggag accacaggtg aacaatccca aggagtggct gcaggtggac ttccagaaaa 4140 ccatgaaggt gacaggagtc accacccagg gagtgaaaag cctgctgacc tctatgtatg 4200 tcaaggagtt cctgatctct tccagccagg atgggcacca gtggaccctg ttctttcaga 4260 atggaaaggt gaaagtcttc cagggcaatc aggattcctt tacccctgtg gtcaacagcc 4320 tggacccacc cctgctgacc aggtacctga gaatccaccc acagtcctgg gtgcatcaga 4380 ttgctctgag gatggaagtc ctgggctgtg aggcccagga cctgtattga tcgcgaataa 4440 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtg 4484 <210> 334 <211> 4484 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1025 <400> 334 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccaga aggtactacc tgggagctgt ggaactgagc tgggactaca 120 tgcagtctga cctgggagag ctgcctgtgg atgctagatt tcctccaaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaaaaccct gtttgtggaa ttcacagacc 240 acctgttcaa tattgccaag cctagacctc cttggatggg cctgctgggc cctacaattc 300 aggctgaggt gtatgacaca gtggtcatca ccctgaagaa catggccagc catcctgtgt 360 ctctgcatgc tgtgggagtg tcttactgga aggcttctga gggggctgag tatgatgacc 420 agacaagcca gagagagaaa gaggatgaca aggttttccc tgggggcagc cacacctatg 480 tctggcaggt cctgaaagaa aatggcccta tggcctctga tcctctgtgc ctgacataca 540 gctacctgag ccatgtggac ctggtcaagg acctgaactc tggcctgatt ggggctctgc 600 tggtgtgtag agaaggcagc ctggccaaag aaaagaccca gacactgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgagacaaag aacagcctga 720 tgcaggacag agatgctgcc tctgctagag cttggcccaa gatgcacaca gtgaatggct 780 atgtgaacag aagcctgcct ggactgattg gatgccacag aaagtctgtg tactggcatg 840 tgattggcat gggcaccaca cctgaggtgc acagcatctt tctggaagga cacaccttcc 900 tggtgaggaa ccacagacag gccagcctgg aaatcagccc tatcaccttc ctgacagctc 960 agaccctgct gatggatctg ggccagtttc tgctggcctg ccacatcagc agccaccagc 1020 atgatggcat ggaagcctat gtgaaggtgg acagctgccc tgaagaaccc cagctgagaa 1080 tgaagaacaa tgaggaagct gaggactatg atgatgacct gacagactct gagatggatg 1140 tggtcagatt tgatgatgat aacagcccca gcttcatcca gatcagatct gtggccaaga 1200 agcaccccaa gacctgggtg cactatattg ctgctgagga agaggactgg gattatgctc 1260 ctctggtgct ggcccctgat gacagaagct acaagagcca gtacctgaac aatggccctc 1320 agagaattgg caggaagtat aagaaagtga ggttcatggc ctacacagat gagacattca 1380 agaccagaga ggctatccag catgagtctg gcattctggg acctctgctg tatggggaag 1440 tgggggacac actgctgatc atcttcaaga accaggccag cagaccctac aacatctacc 1500 ctcatggcat cacagatgtg aggcctctgt actctagaag gctgcccaag ggggtgaagc 1560 acctgaagga cttccctatc ctgcctgggg agatcttcaa gtacaagtgg acagtgacag 1620 tggaggatgg ccctaccaag tctgatccta gatgcctgac aaggtactac agcagctttg 1680 tgaacatgga aagggacctg gcctctggcc tgattggtcc tctgctgatc tgctacaaag 1740 aatctgtgga ccagaggggc aaccagatca tgagtgacaa gagaaatgtg atcctgttct 1800 ctgtctttga tgagaacagg tcctggtatc tgacagagaa catccagagg tttctgccca 1860 atcctgctgg ggtgcagctg gaagatcctg agttccaggc ctccaacatc atgcactcca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgaa gtggcctact 1980 ggtacatcct gtctattggg gcccagacag acttcctgtc tgtgttcttt tctggctaca 2040 ccttcaagca caagatggtg tatgaggata ccctgacact gttcccattc tctggggaga 2100 cagtgttcat gagcatggaa aaccctggcc tgtggatcct gggctgtcac aacagtgact 2160 tcagaaacag aggcatgaca gccctgctga aggtgtccag ctgtgacaag aacactgggg 2220 actactatga ggactcttat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcctag gagcttctct cagaacgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagccc tcctgtgctg aagagacacc agagggagat caccagaacc acactgcagt 2400 ctgaccaaga ggaaattgat tatgatgaca ccatctctgt ggagatgaag aaagaagatt 2460 ttgacatcta tgatgaggat gagaatcaga gccccagatc tttccagaag aaaacaaggc 2520 actacttcat tgctgctgtg gaaagactgt gggactatgg catgagcagc agcccccatg 2580 tgctgagaaa cagggcccag tctggaagtg tgccccagtt caagaaagtg gtgttccaag 2640 agttcacaga tggcagcttc acccagcctc tgtatagagg ggagctgaat gagcacctgg 2700 gactgctggg accttacatc agagctgagg tggaggataa catcatggtc acctttagaa 2760 accaggcctc taggccctac tccttctaca gctccctgat cagctatgaa gaggaccaga 2820 gacagggggc tgagcccaga aagaactttg tgaagcccaa tgagactaag acctactttt 2880 ggaaggtgca gcaccacatg gcccctacaa aggatgagtt tgactgcaag gcctgggcct 2940 acttctctga tgtggacctg gagaaggatg tgcactctgg actcattgga cccctgcttg 3000 tgtgccacac caacacactg aatcctgctc atggcaggca agtgacagtg caagagtttg 3060 ccctgttctt caccatcttt gatgagacaa agtcctggta cttcacagaa aacatggaaa 3120 gaaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa gagaactaca 3180 ggttccatgc catcaatggc tacatcatgg acactctgcc tggcctggtt atggcacagg 3240 atcagaggat cagatggtat ctgctgtcca tgggctccaa tgagaatatc cacagcatcc 3300 acttctctgg ccatgtgttc acagtgagga aaaaagaaga gtacaagatg gccctgtaca 3360 atctgtaccc tggggtgttt gagactgtgg aaatgctgcc tagcaaggct ggaatctgga 3420 gggtggaatg tctgattgga gagcatctgc atgctggaat gtctaccctg ttcctggtgt 3480 acagcaacaa gtgtcagacc cctctgggca tggcctctgg acacatcaga gacttccaga 3540 tcacagcctc tggccagtat ggacagtggg ctcctaaact ggctagactg cactactctg 3600 gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg gacctgctgg 3660 ctcccatgat catccatgga atcaagaccc agggggccag acagaagttc agcagcctgt 3720 acatcagcca gttcatcatc atgtacagcc tggatggcaa gaagtggcag acctacagag 3780 gcaacagcac aggcacactc atggtgttct ttggcaatgt ggactcttct ggcattaagc 3840 acaacatctt caaccctcca atcattgcca ggtacatcag gctgcacccc acacactaca 3900 gcatcagatc taccctgagg atggaactga tgggctgtga cctgaacagc tgctctatgc 3960 ccctgggaat ggaaagcaag gccatctctg atgcccagat cacagccagc agctacttca 4020 ccaacatgtt tgccacatgg tccccatcta aggccaggct gcatctgcag ggcagatcta 4080 atgcttggag gccccaagtg aacaacccca aagagtggct gcaggtggac tttcagaaaa 4140 ccatgaaagt gacaggagtg accacacagg gggtcaagtc tctgctgacc tctatgtatg 4200 tgaaagagtt cctgatctcc agcagccagg atggccacca gtggaccctg tttttccaga 4260 atggcaaagt caaggtgttc cagggaaacc aggacagctt cacacctgtg gtcaactccc 4320 tggatcctcc actgctgacc agatacctga gaattcaccc tcagtcttgg gtgcaccaga 4380 ttgctctgag aatggaagtg ctgggatgtg aagctcagga cctctactaa tcgcgaataa 4440 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtg 4484 <210> 335 <211> 4484 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1026 <400> 335 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccaga aggtactacc tgggagctgt ggaactgagc tgggactaca 120 tgcagtctga cctgggagag ctgcctgtgg atgctagatt tcctccaaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaaaaccct gtttgtggaa ttcacagacc 240 acctgttcaa tattgccaag cctagacctc cttggatggg cctgctgggc cctacaattc 300 aggctgaggt gtatgacaca gtggtcatca ccctgaagaa catggccagc catcctgtgt 360 ctctgcatgc tgtgggagtg tcttactgga aggcttctga gggggctgag tatgatgacc 420 agacaagcca gagagagaaa gaggatgaca aggttttccc tgggggcagc cacacctatg 480 tctggcaggt cctgaaagaa aatggcccta tggcctctga tcctctgtgc ctgacataca 540 gctacctgag ccatgtggac ctggtcaagg acctgaactc tggcctgatt ggggctctgc 600 tggtgtgtag agaaggcagc ctggccaaag aaaagaccca gacactgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgagacaaag aacagcctga 720 tgcaggacag agatgctgcc tctgctagag cttggcccaa gatgcacaca gtgaatggct 780 atgtgaacag aagcctgcct ggactgattg gatgccacag aaagtctgtg tactggcatg 840 tgattggcat gggcaccaca cctgaggtgc acagcatctt tctggaagga cacaccttcc 900 tggtgaggaa ccacagacag gccagcctgg aaatcagccc tatcaccttc ctgacagctc 960 agaccctgct gatggatctg ggccagtttc tgctgagctg ccacatcagc agccaccagc 1020 atgatggcat ggaagcctat gtgaaggtgg acagctgccc tgaagaaccc cagctgagaa 1080 tgaagaacaa tgaggaagct gaggactatg atgatgacct gacagactct gagatggatg 1140 tggtcagatt tgatgatgat aacagcccca gcttcatcca gatcagatct gtggccaaga 1200 agcaccccaa gacctgggtg cactatattg ctgctgagga agaggactgg gattatgctc 1260 ctctggtgct ggcccctgat gacagaagct acaagagcca gtacctgaac aatggccctc 1320 agagaattgg caggaagtat aagaaagtga ggttcatggc ctacacagat gagacattca 1380 agaccagaga ggctatccag catgagtctg gcattctggg acctctgctg tatggggaag 1440 tgggggacac actgctgatc atcttcaaga accaggccag cagaccctac aacatctacc 1500 ctcatggcat cacagatgtg aggcctctgt actctagaag gctgcccaag ggggtgaagc 1560 acctgaagga cttccctatc ctgcctgggg agatcttcaa gtacaagtgg acagtgacag 1620 tggaggatgg ccctaccaag tctgatccta gatgcctgac aaggtactac agcagctttg 1680 tgaacatgga aagggacctg gcctctggcc tgattggtcc tctgctgatc tgctacaaag 1740 aatctgtgga ccagaggggc aaccagatca tgagtgacaa gagaaatgtg atcctgttct 1800 ctgtctttga tgagaacagg tcctggtatc tgacagagaa catccagagg tttctgccca 1860 atcctgctgg ggtgcagctg gaagatcctg agttccaggc ctccaacatc atgcactcca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgaa gtggcctact 1980 ggtacatcct gtctattggg gcccagacag acttcctgtc tgtgttcttt tctggctaca 2040 ccttcaagca caagatggtg tatgaggata ccctgacact gttcccattc tctggggaga 2100 cagtgttcat gagcatggaa aaccctggcc tgtggatcct gggctgtcac aacagtgact 2160 tcagaaacag aggcatgaca gccctgctga aggtgtccag ctgtgacaag aacactgggg 2220 actactatga ggactcttat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcctag gagcttctct cagaacgcca ctaatgtgtc taacaacagc aacaccagca 2340 atgacagccc tcctgtgctg aagagacacc agagggagat caccagaacc acactgcagt 2400 ctgaccaaga ggaaattgat tatgatgaca ccatctctgt ggagatgaag aaagaagatt 2460 ttgacatcta tgatgaggat gagaatcaga gccccagatc tttccagaag aaaacaaggc 2520 actacttcat tgctgctgtg gaaagactgt gggactatgg catgagcagc agcccccatg 2580 tgctgagaaa cagggcccag tctggaagtg tgccccagtt caagaaagtg gtgttccaag 2640 agttcacaga tggcagcttc acccagcctc tgtatagagg ggagctgaat gagcacctgg 2700 gactgctggg accttacatc agagctgagg tggaggataa catcatggtc acctttagaa 2760 accaggcctc taggccctac tccttctaca gctccctgat cagctatgaa gaggaccaga 2820 gacagggggc tgagcccaga aagaactttg tgaagcccaa tgagactaag acctactttt 2880 ggaaggtgca gcaccacatg gcccctacaa aggatgagtt tgactgcaag gcctgggcct 2940 acttctctga tgtggacctg gagaaggatg tgcactctgg actcattgga cccctgcttg 3000 tgtgccacac caacacactg aatcctgctc atggcaggca agtgacagtg caagagtttg 3060 ccctgttctt caccatcttt gatgagacaa agtcctggta cttcacagaa aacatggaaa 3120 gaaactgcag ggccccttgc aacatccaga tggaagatcc caccttcaaa gagaactaca 3180 ggttccatgc catcaatggc tacatcatgg acactctgcc tggcctggtt atggcacagg 3240 atcagaggat cagatggtat ctgctgtcca tgggctccaa tgagaatatc cacagcatcc 3300 acttctctgg ccatgtgttc acagtgagga aaaaagaaga gtacaagatg gccctgtaca 3360 atctgtaccc tggggtgttt gagactgtgg aaatgctgcc tagcaaggct ggaatctgga 3420 gggtggaatg tctgattgga gagcatctgc atgctggaat gtctaccctg ttcctggtgt 3480 acagcaacaa gtgtcagacc cctctgggca tggcctctgg acacatcaga gacttccaga 3540 tcacagcctc tggccagtat ggacagtggg ctcctaaact ggctagactg cactactctg 3600 gcagcatcaa tgcctggtcc accaaagagc ccttcagctg gatcaaggtg gacctgctgg 3660 ctcccatgat catccatgga atcaagaccc agggggccag acagaagttc agcagcctgt 3720 acatcagcca gttcatcatc atgtacagcc tggatggcaa gaagtggcag acctacagag 3780 gcaacagcac aggcacactc atggtgttct ttggcaatgt ggactcttct ggcattaagc 3840 acaacatctt caaccctcca atcattgcca ggtacatcag gctgcacccc acacactaca 3900 gcatcagatc taccctgagg atggaactga tgggctgtga cctgaacagc tgctctatgc 3960 ccctgggaat ggaaagcaag gccatctctg atgcccagat cacagccagc agctacttca 4020 ccaacatgtt tgccacatgg tccccatcta aggccaggct gcatctgcag ggcagatcta 4080 atgcttggag gccccaagtg aacaacccca aagagtggct gcaggtggac tttcagaaaa 4140 ccatgaaagt gacaggagtg accacacagg gggtcaagtc tctgctgacc tctatgtatg 4200 tgaaagagtt cctgatctcc agcagccagg atggccacca gtggaccctg tttttccaga 4260 atggcaaagt caaggtgttc cagggaaacc aggacagctt cacacctgtg gtcaactccc 4320 tggatcctcc actgctgacc agatacctga gaattcaccc tcagtcttgg gtgcaccaga 4380 ttgctctgag aatggaagtg ctgggatgtg aagctcagga cctctactaa tcgcgaataa 4440 aagatcttta ttttcattag atctgtgtgt tggttttttg tgtg 4484 <210> 336 <211> 4775 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB103 <400> 336 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag gggatggcca 120 actccatcac taggggttcc tgcggcccgc ggtgccagtt cccgatcgtt acaggcggta 180 ctcctcaaag cgtactaaag aattattctt ttacatttca gtggctacca gaagatacta 240 cctgggagct gtggaactga gctgggatta catgcagtct gacctgggag agctgcctgt 300 ggatgctaga ttcccaccta gagtccctaa gtccttcccc ttcaacacct ctgtggtcta 360 caagaaaacc ctgtttgtgg agtttacaga ccacctgttc aacattgcta agcctagacc 420 accatggatg ggactgctgg gaccaaccat ccaggcagag gtgtatgaca cagtggtcat 480 caccctgaaa aacatggctt ctcaccctgt gtccctgcat gctgtgggag tctcctactg 540 gaaggcctct gaaggggctg agtatgatga tcagaccagc cagagggaaa aagaggatga 600 taaggtgttc cctggagggt cccataccta tgtgtggcag gtcctgaagg agaatggacc 660 aatggcttct gaccctctgt gcctgaccta ctcttatctg tcccatgtgg acctggtcaa 720 ggatctgaac tctggcctga ttggggctct gctggtgtgt agggaagggt ccctggccaa 780 ggagaaaacc cagaccctgc ataagttcat cctgctgttt gctgtgtttg atgaaggaaa 840 aagctggcac tctgagacca agaactctct gatgcaggac agggatgctg cttctgccag 900 agcttggccc aagatgcaca cagtgaatgg ctatgtcaat aggagcctgc ctggactgat 960 tggctgccac agaaagtctg tgtattggca tgtcattgga atgggcacca cccctgaagt 1020 gcacagcatc ttcctggagg ggcatacctt tctggtcagg aaccacaggc aggctagcct 1080 ggagatctct ccaatcacct tcctgacagc ccagaccctg ctgatggacc tgggacagtt 1140 cctgctgttt tgccacatct ccagccacca gcatgatggc atggaggctt atgtgaaagt 1200 ggactcctgt cctgaggaac ctcagctgag gatgaagaac aatgaggaag ctgaagacta 1260 tgatgatgac ctgacagact ctgagatgga tgtggtcagg tttgatgatg ataactctcc 1320 ctcctttatc cagatcaggt ctgtggccaa gaaacaccct aagacctggg tccattacat 1380 tgctgctgag gaagaggact gggattatgc tccactggtg ctggcccctg atgatagatc 1440 ctacaaaagc cagtatctga acaatggacc ccagaggatt ggcagaaagt acaagaaagt 1500 gaggttcatg gcttatacag atgagacctt taagaccaga gaagccatcc agcatgagtc 1560 tgggatcctg ggacctctgc tgtatgggga agtgggggac accctgctga tcatcttcaa 1620 gaaccaggcc agcaggcctt acaatatcta tccacatggc atcacagatg tgagacctct 1680 gtactccagg aggctgccaa agggggtgaa acacctgaag gacttcccaa tcctgcctgg 1740 ggaaatcttt aagtataaat ggacagtcac agtggaggat gggcccacca agtctgaccc 1800 taggtgcctg accagatact attcttcctt tgtgaatatg gagagagacc tggcttctgg 1860 actgattgga cccctgctga tctgttacaa agagtctgtg gatcagaggg gcaaccagat 1920 catgtctgac aagaggaatg tgatcctgtt ctctgtcttt gatgaaaaca ggtcttggta 1980 cctgacagag aacatccaga ggttcctgcc taatccagct ggagtgcagc tggaagatcc 2040 tgagttccag gcctctaaca tcatgcattc catcaatggc tatgtgtttg actccctgca 2100 gctgtctgtg tgcctgcatg aggtggctta ctggtatatc ctgagcattg gagcccagac 2160 agatttcctg tctgtgttct tttctggcta cacctttaag cataaaatgg tgtatgagga 2220 caccctgacc ctgttcccat tttctggaga aactgtgttc atgagcatgg agaatcctgg 2280 gctgtggatc ctgggatgcc acaactctga tttcaggaat agagggatga cagccctgct 2340 gaaagtgagc tcttgtgaca agaacacagg agactactat gaagatagct atgaggacat 2400 ctctgcttat ctgctgtcca aaaacaatgc cattgagccc aggagcttct ctcagaaccc 2460 tccagtgctg aagaggcacc agagggagat caccagaacc accctgcagt ctgatcagga 2520 agagattgac tatgatgata ccatctctgt ggaaatgaag aaagaggact ttgatatcta 2580 tgatgaagat gagaaccagt ctcccaggtc cttccagaag aaaaccagac attactttat 2640 tgctgctgtg gagaggctgt gggactatgg catgtccagc tctcctcatg tgctgagaaa 2700 tagagctcag tctggatctg tcccacagtt caagaaagtg gtcttccagg agtttacaga 2760 tggaagcttt acccagccac tgtacagggg agaactgaat gagcacctgg ggctgctggg 2820 accctatatc agggctgaag tggaggataa catcatggtc accttcagga atcaggccag 2880 cagaccctac tctttttatt ccagcctgat ctcctatgaa gaggaccaga gacagggagc 2940 tgaaccaaga aaaaactttg tgaagcctaa tgagaccaaa acctactttt ggaaggtgca 3000 gcaccatatg gcccctacca aagatgagtt tgattgcaag gcctgggctt atttttctga 3060 tgtggatctg gagaaggatg tccactctgg cctgattggg ccactgctgg tgtgtcatac 3120 caacaccctg aatccagctc atggaaggca ggtgacagtc caggaatttg ccctgttctt 3180 taccatcttt gatgagacca agagctggta cttcacagaa aacatggaga ggaattgcag 3240 agccccatgt aacatccaga tggaagaccc caccttcaag gagaactaca gatttcatgc 3300 tatcaatggg tatatcatgg ataccctgcc aggactggtc atggctcagg accagaggat 3360 cagatggtac ctgctgagca tggggtctaa tgagaatatc cactccatcc atttctctgg 3420 acatgtgttt acagtaagga agaaagaaga gtacaagatg gccctgtaca acctgtatcc 3480 tggggtgttt gaaacagtgg agatgctgcc ttccaaggct gggatctgga gggtggaatg 3540 cctgattggg gagcacctgc atgctggaat gtctaccctg ttcctggtgt actccaataa 3600 gtgtcagacc cccctgggga tggcttctgg acatatcagg gacttccaga tcacagcttc 3660 tggacagtat ggacagtggg ctcctaagct ggctagactg cactattctg gctccatcaa 3720 tgcttggtct accaaagagc ctttctcctg gatcaaggtg gacctgctgg ctccaatgat 3780 catccatggc atcaaaaccc agggggccag gcagaagttc tcttccctgt acatcagcca 3840 gtttatcatc atgtattctc tggatgggaa gaaatggcag acctacagag gcaattccac 3900 agggaccctg atggtgttct ttggcaatgt ggacagctct gggatcaagc acaacatctt 3960 caatccccct atcattgcca ggtacatcag actgcaccca acccattatt ccatcaggag 4020 caccctgaga atggagctga tggggtgtga tctgaacagc tgttctatgc ccctgggaat 4080 ggagtctaag gccatctctg atgctcagat cacagcctcc agctacttca ccaatatgtt 4140 tgctacctgg tccccaagca aggctagact gcatctgcag ggaagaagca atgcttggag 4200 accacaggtg aacaatccca aggagtggct gcaggtggac ttccagaaaa ccatgaaggt 4260 gacaggagtc accacccagg gagtgaaaag cctgctgacc tctatgtatg tcaaggagtt 4320 cctgatctct tccagccagg atgggcacca gtggaccctg ttctttcaga atggaaaggt 4380 gaaagtcttc cagggcaatc aggattcctt tacccctgtg gtcaacagcc tggacccacc 4440 cctgctgacc aggtacctga gaatccaccc acagtcctgg gtgcatcaga ttgctctgag 4500 gatggaagtc ctgggctgtg aggcccagga cctgtattga tcgcgaataa aagatcttta 4560 ttttcattag atctgtgtgt tggttttttg tgtgtgccag ttcccgatcg ttacaggcaa 4620 ttgccttagg ccgcaggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg 4680 ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc 4740 ctcagtgagc gagcgagcgc gcagctgcct gcagg 4775 <210> 337 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> "SQ linker" <400> 337 Ser Phe Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg 1 5 10 <210> 338 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> gRNA mALbT1 <400> 338 tgccagttcc cgatcgttac 20 <210> 339 <211> 100 <212> RNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> gRNA <220> <221> misc_feature <222> (1)..(2) <223> phosphorothioate backbone <220> <221> misc_feature <222> (1)..(3) <223> 2'-O-methyl nucleotides <220> <221> misc_feature <222> (2)..(3) <223> phosphorothioate backbone <220> <221> misc_feature <222> (3)..(4) <223> phosphorothioate backbone <220> <221> misc_feature <222> (29)..(32) <223> 2'-O-methyl nucleotides <220> <221> misc_feature <222> (37)..(40) <223> 2'-O-methyl nucleotides <220> <221> misc_feature <222> (68)..(72) <223> 2'-O-methyl nucleotides <220> <221> misc_feature <222> (77)..(99) <223> 2'-O-methyl nucleotides <220> <221> misc_feature <222> (97)..(98) <223> phosphorothioate backbone <220> <221> misc_feature <222> (98)..(99) <223> phosphorothioate backbone <220> <221> misc_feature <222> (99)..(100) <223> phosphorothioate backbone <400> 339 ugccaguucc cgaucguuac guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 340 <211> 4438 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> spCas9 mRNA with NLS sequences <400> 340 ggaaataaga gagaaaagaa gagtaagaag aaatataaga gccaccatgg ccccaaagaa 60 gaagcggaag gtcggtatcc acggagtccc agcagccgac aagaagtaca gcatcggcct 120 ggacatcggc accaactctg tgggctgggc cgtgatcacc gacgagtaca aggtgcccag 180 caagaaattc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga acctgatcgg 240 agccctgctg ttcgacagcg gcgaaacagc cgaggccacc cggctgaaga gaaccgccag 300 aagaagatac accagacgga agaaccggat ctgctatctg caagagatct tcagcaacga 360 gatggccaag gtggacgaca gcttcttcca cagactggaa gagtccttcc tggtggaaga 420 ggacaagaag cacgagagac accccatctt cggcaacatc gtggacgagg tggcctacca 480 cgagaagtac cccaccatct accacctgag aaagaaactg gtggacagca ccgacaaggc 540 cgacctgaga ctgatctacc tggccctggc ccacatgatc aagttcagag gccacttcct 600 gatcgagggc gacctgaacc ccgacaacag cgacgtggac aagctgttca tccagctggt 660 gcagacctac aaccagctgt tcgaggaaaa ccccatcaac gccagcggcg tggacgccaa 720 ggctatcctg tctgccagac tgagcaagag cagaaggctg gaaaatctga tcgcccagct 780 gcccggcgag aagaagaacg gcctgttcgg caacctgatt gccctgagcc tgggcctgac 840 ccccaacttc aagagcaact tcgacctggc cgaggatgcc aaactgcagc tgagcaagga 900 cacctacgac gacgacctgg acaacctgct ggcccagatc ggcgaccagt acgccgacct 960 gttcctggcc gccaagaacc tgtctgacgc catcctgctg agcgacatcc tgagagtgaa 1020 caccgagatc accaaggccc ccctgagcgc ctctatgatc aagagatacg acgagcacca 1080 ccaggacctg accctgctga aagctctcgt gcggcagcag ctgcctgaga agtacaaaga 1140 aatcttcttc gaccagagca agaacggcta cgccggctac atcgatggcg gcgctagcca 1200 ggaagagttc tacaagttca tcaagcccat cctggaaaag atggacggca ccgaggaact 1260 gctcgtgaag ctgaacagag aggacctgct gagaaagcag agaaccttcg acaacggcag 1320 catccccccac cagatccacc tgggagagct gcacgctatc ctgagaaggc aggaagattt 1380 ttacccattc ctgaaggaca accgggaaaa gatcgagaag atcctgacct tcaggatccc 1440 ctactacgtg ggccccctgg ccagaggcaa cagcagattc gcctggatga ccagaaagag 1500 cgaggaaacc atcaccccct ggaacttcga ggaagtggtg gacaagggcg ccagcgccca 1560 gagcttcatc gagagaatga caaacttcga taagaacctg cccaacgaga aggtgctgcc 1620 caagcacagc ctgctgtacg agtacttcac cgtgtacaac gagctgacca aagtgaaata 1680 cgtgaccgag ggaatgagaa agcccgcctt cctgagcggc gagcagaaaa aggccatcgt 1740 ggacctgctg ttcaagacca acagaaaagt gaccgtgaag cagctgaaag aggactactt 1800 caagaaaatc gagtgcttcg actccgtgga aatctccggc gtggaagata gattcaacgc 1860 ctccctgggc acataccacg atctgctgaa aattatcaag gacaaggact tcctggataa 1920 cgaagagaac gaggacattc tggaagatat cgtgctgacc ctgacactgt ttgaggaccg 1980 cgagatgatc gaggaaaggc tgaaaaccta cgctcacctg ttcgacgaca aagtgatgaa 2040 gcagctgaag agaaggcggt acaccggctg gggcaggctg agcagaaagc tgatcaacgg 2100 catcagagac aagcagagcg gcaagacaat cctggatttc ctgaagtccg acggcttcgc 2160 caaccggaac ttcatgcagc tgatccacga cgacagcctg acattcaaag aggacatcca 2220 gaaagcccag gtgtccggcc agggcgactc tctgcacgag catatcgcta acctggccgg 2280 cagccccgct atcaagaagg gcatcctgca gacagtgaag gtggtggacg agctcgtgaa 2340 agtgatgggc agacacaagc ccgagaacat cgtgatcgag atggctagag agaaccagac 2400 cacccagaag ggacagaaga actcccgcga gaggatgaag agaatcgaag agggcatcaa 2460 agagctgggc agccagatcc tgaaagaaca ccccgtggaa aacacccagc tgcagaacga 2520 gaagctgtac ctgtactacc tgcagaatgg ccgggatatg tacgtggacc aggaactgga 2580 catcaacaga ctgtccgact acgatgtgga ccatatcgtg cctcagagct ttctgaagga 2640 cgactccatc gataacaaag tgctgactcg gagcgacaag aacagaggca agagcgacaa 2700 cgtgccctcc gaagaggtcg tgaagaagat gaagaactac tggcgacagc tgctgaacgc 2760 caagctgatt acccagagga agttcgataa cctgaccaag gccgagagag gcggcctgag 2820 cgagctggat aaggccggct tcatcaagag gcagctggtg gaaaccagac agatcacaaa 2880 gcacgtggca cagatcctgg actcccggat gaacactaag tacgacgaaa acgataagct 2940 gatccgggaa gtgaaagtga tcaccctgaa gtccaagctg gtgtccgatt tccggaagga 3000 tttccagttt tacaaagtgc gcgagatcaa caactaccac cacgcccacg acgcctacct 3060 gaacgccgtc gtgggaaccg ccctgatcaa aaagtaccct aagctggaaa gcgagttcgt 3120 gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc gccaagagcg agcaggaaat 3180 cggcaaggct accgccaagt acttcttcta cagcaacatc atgaactttt tcaagaccga 3240 aatcaccctg gccaacggcg agatcagaaa gcgccctctg atcgagacaa acggcgaaac 3300 cggggagatc gtgtgggata agggcagaga cttcgccaca gtgcgaaagg tgctgagcat 3360 gccccaagtg aatatcgtga aaaagaccga ggtgcagaca ggcggcttca gcaaagagtc 3420 tatcctgccc aagaggaaca gcgacaagct gatcgccaga aagaaggact gggaccccaa 3480 gaagtacggc ggcttcgaca gccctaccgt ggcctactct gtgctggtgg tggctaaggt 3540 ggaaaagggc aagtccaaga aactgaagag tgtgaaagag ctgctgggga tcaccatcat 3600 ggaaagaagc agctttgaga agaaccctat cgactttctg gaagccaagg gctacaaaga 3660 agtgaaaaag gacctgatca tcaagctgcc taagtactcc ctgttcgagc tggaaaacgg 3720 cagaaagaga atgctggcct ctgccggcga actgcagaag ggaaacgagc tggccctgcc 3780 tagcaaatat gtgaacttcc tgtacctggc ctcccactat gagaagctga agggcagccc 3840 tgaggacaac gaacagaaac agctgtttgt ggaacagcat aagcactacc tggacgagat 3900 catcgagcag atcagcgagt tctccaagag agtgatcctg gccgacgcca atctggacaa 3960 ggtgctgtct gcctacaaca agcacaggga caagcctatc agagagcagg ccgagaatat 4020 catccacctg ttcaccctga caaacctggg cgctcctgcc gccttcaagt actttgacac 4080 caccatcgac cggaagaggt acaccagcac caaagaggtg ctggacgcca ccctgatcca 4140 ccagagcatc accggcctgt acgagacaag aatcgacctg tctcagctgg gaggcgacaa 4200 gagacctgcc gccactaaga aggccggaca ggccaaaaag aagaagtgag cggccgctta 4260 attaagctgc cttctgcggg gcttgccttc tggccatgcc cttcttctct cccttgcacc 4320 tgtacctctt ggtctttgaa taaagcctga gtaggaagaa aaaaaaaaaa aaaaaaaaaa 4380 aaaaaaaaaa aaaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 4438 <210> 341 <211> 4779 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB102 <400> 341 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag gggatggcca 120 actccatcac taggggttcc tgcggcccgc ggtgccagtt cccgatcgtt acaggcggta 180 ctcctcaaag cgtactaaag aattattctt ttacatttca gtggccacca ggagatacta 240 cctgggggct gtggagctga gctgggacta catgcagtct gacctggggg agctgcctgt 300 ggatgccagg ttccccccca gagtgcccaa gagcttcccc ttcaacacct ctgtggtgta 360 caagaagacc ctgtttgtgg agttcactga ccacctgttc aacattgcca agcccaggcc 420 cccctggatg ggcctgctgg gccccaccat ccaggctgag gtgtatgaca ctgtggtgat 480 caccctgaag aacatggcca gccaccctgt gagcctgcat gctgtggggg tgagctactg 540 gaaggcctct gagggggctg agtatgatga ccagaccagc cagagggaga aggaggatga 600 caaggtgttc cctgggggca gccacaccta tgtgtggcag gtgctgaagg agaatggccc 660 catggcctct gaccccctgt gcctgaccta cagctacctg agccatgtgg acctggtgaa 720 ggacctgaac tctggcctga ttggggccct gctggtgtgc agggagggca gcctggccaa 780 ggagaagacc cagaccctgc acaagttcat cctgctgttt gctgtgtttg atgagggcaa 840 gagctggcac tctgaaacca agaacagcct gatgcaggac agggatgctg cctctgccag 900 ggcctggccc aagatgcaca ctgtgaatgg ctatgtgaac aggagcctgc ctggcctgat 960 tggctgccac aggaagtctg tgtactggca tgtgattggc atgggcacca cccctgaggt 1020 gcacagcatc ttcctggagg gccacacctt cctggtcagg aaccacaggc aggccagcct 1080 ggagatcagc cccatcacct tcctgactgc ccagaccctg ctgatggacc tgggccagtt 1140 cctgctgttc tgccacatca gcagccacca gcatgatggc atggaggcct atgtgaaggt 1200 ggacagctgc cctgaggagc cccagctgag gatgaagaac aatgaggagg ctgaggacta 1260 tgatgatgac ctgactgact ctgagatgga tgtggtgagg tttgatgatg acaacagccc 1320 cagcttcatc cagatcaggt ctgtggccaa gaagcacccc aagacctggg tgcactacat 1380 tgctgctgag gaggaggact gggactatgc ccccctggtg ctggcccctg atgacaggag 1440 ctacaagagc cagtacctga acaatggccc ccagaggatt ggcaggaagt acaagaaggt 1500 caggttcatg gcctacactg atgaaacctt caagccagg gaggccatcc agcatgagtc 1560 tggcatcctg ggccccctgc tgtatgggga ggtgggggac accctgctga tcatcttcaa 1620 gaaccaggcc agcaggccct acaacatcta cccccatggc atcactgatg tgaggcccct 1680 gtacagcagg aggctgccca agggggtgaa gcacctgaag gacttcccca tcctgcctgg 1740 ggagatcttc aagtacaagt ggactgtgac tgtggaggat ggccccacca agtctgaccc 1800 caggtgcctg accagatact acagcagctt tgtgaacatg gagagggacc tggcctctgg 1860 cctgattggc cccctgctga tctgctacaa ggagtctgtg gaccagaggg gcaaccagat 1920 catgtctgac aagaggaatg tgatcctgtt ctctgtgttt gatgagaaca ggagctggta 1980 cctgactgag aacatccaga ggttcctgcc caaccctgct ggggtgcagc tggaggaccc 2040 tgagttccag gccagcaaca tcatgcacag catcaatggc tatgtgtttg acagcctgca 2100 gctgtctgtg tgcctgcatg aggtggccta ctggtacatc ctgagcattg gggcccagac 2160 tgacttcctg tctgtgttct tctctggcta caccttcaag cacaagatgg tgtatgagga 2220 caccctgacc ctgttcccct tctctgggga gactgtgttc atgagcatgg agaaccctgg 2280 cctgtggatt ctgggctgcc acaactctga cttcaggaac aggggcatga ctgccctgct 2340 gaaagtctcc agctgtgaca agaacactgg ggactactat gaggacagct atgaggacat 2400 ctctgcctac ctgctgagca agaacaatgc cattgagccc aggagcttca gccagaatcc 2460 cccagtgctg aagaggcacc agagggagat caccaggacc accctgcagt ctgaccagga 2520 ggagattgac tatgatgaca ccatctctgt ggagatgaag aaggaggact ttgacatcta 2580 cgacgaggac gagaaccaga gccccaggag cttccagaag aagaccaggc actacttcat 2640 tgctgctgtg gagaggctgt gggactatgg catgagcagc agcccccatg tgctgaggaa 2700 cagggcccag tctggctctg tgccccagtt caagaaggtg gtgttccagg agttcactga 2760 tggcagcttc acccagcccc tgtacagagg ggagctgaat gagcacctgg gcctgctggg 2820 cccctacatc agggctgagg tggaggacaa catcatggtg accttcagga accaggccag 2880 caggccctac agcttctaca gcagcctgat cagctatgag gaggaccaga ggcagggggc 2940 tgagcccagg aagaactttg tgaagcccaa tgaaaccaag acctacttct ggaaggtgca 3000 gcaccacatg gccccccacca aggatgagtt tgactgcaag gcctgggcct acttctctga 3060 tgtggacctg gagaaggatg tgcactctgg cctgattggc cccctgctgg tgtgccacac 3120 caacaccctg aaccctgccc atggcaggca ggtgactgtg caggagtttg ccctgttctt 3180 caccatcttt gatgaaacca agagctggta cttcactgag aacatggaga ggaactgcag 3240 ggccccctgc aacatccaga tggaggaccc caccttcaag gagaactaca ggttccatgc 3300 catcaatggc tacatcatgg acaccctgcc tggcctggtg atggcccagg accagaggat 3360 caggtggtac ctgctgagca tgggcagcaa tgagaacatc cacagcatcc acttctctgg 3420 ccatgtgttc actgtgagga agaaggagga gtacaagatg gccctgtaca acctgtaccc 3480 tggggtgttt gagactgtgg agatgctgcc cagcaaggct ggcatctgga gggtggagtg 3540 cctgattggg gagcacctgc atgctggcat gagcaccctg ttcctggtgt acagcaacaa 3600 gtgccagacc cccctgggca tggcctctgg ccacatcagg gacttccaga tcactgcctc 3660 tggccagtat ggccagtggg cccccaagct ggccaggctg cactactctg gcagcatcaa 3720 tgcctggagc accaaggagc ccttcagctg gatcaaggtg gacctgctgg cccccatgat 3780 catccatggc atcaagaccc aggggggccag gcagaagttc agcagcctgt acatcagcca 3840 gttcatcatc atgtacagcc tggatggcaa gaagtggcag acctacaggg gcaacagcac 3900 tggcaccctg atggtgttct ttggcaatgt ggacagctct ggcatcaagc acaacatctt 3960 caaccccccc atcattgcca gatacatcag gctgcacccc acccactaca gcatcaggag 4020 caccctgagg atggagctga tgggctgtga cctgaacagc tgcagcatgc ccctgggcat 4080 ggagagcaag gccatctctg atgcccagat cactgccagc agctacttca ccaacatgtt 4140 tgccacctgg agccccagca aggccaggct gcacctgcag ggcaggagca atgcctggag 4200 gccccaggtc aacaacccca aggagtggct gcaggtggac ttccagaaga ccatgaaggt 4260 gactggggtg accacccagg gggtgaagag cctgctgacc agcatgtatg tgaaggagtt 4320 cctgatcagc agcagccagg atggccacca gtggaccctg ttcttccaga atggcaaggt 4380 gaaggtgttc cagggcaacc aggacagctt cacccctgtg gtgaacagcc tggacccccc 4440 cctgctgacc agatacctga ggattcaccc ccagagctgg gtgcaccaga ttgccctgag 4500 gatggaggtg ctgggctgtg aggcccagga cctgtactga tcgcgaataa aagatcttta 4560 ttttcattag atctgtgtgt tggttttttg tgtggatctg ccagttcccg atcgttacag 4620 gcaattgcct taggccgcag gaacccctag tgatggagtt ggccactccc tctctgcgcg 4680 ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg acgcccgggc tttgcccggg 4740 cggcctcagt gagcgagcga gcgcgcagct gcctgcagg 4779 <210> 342 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> modified B domain linker <400> 342 Phe Asn Ala Thr Thr Ile Gln Asn Val Ser Ser Asn Asn Ser Leu Ser 1 5 10 15 Asp Asn Thr Ser Ser Asn Asp Ser Lys Asn Val Ser Ser Pro 20 25 30 <210> 343 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> B domain substitute <400> 343 Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser Asn Asp Ser 1 5 10 <210> 344 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> Terminal portion of sequence encoding signal peptide from Transferrin Exon 2 <400> 344 ggctgtgtct ggct 14 <210> 345 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> Variant FVIII B domain <400> 345 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Ser Pro Val Leu Lys Arg His Gln Arg 20 25 30 <210> 346 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGA2(DD) forward primer, mouse FGA intron <400> 346 ctggagtttc tgacacattc t 21 <210> 347 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> RSA56.R reverse primer <400> 347 gtgaactcca caaacagggt 20 <210> 348 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> TFR1(DD) reverse primer <400> 348 agtgaactcc acaaacaggg 20 <210> 349 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGAP2(DD) donor probe <400> 349 ccacagcccc caggtagtat 20 <210> 350 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGARefF2 (DD) forward primer <400> 350 gttgctgggg attgatccag 20 <210> 351 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGARefR2 (DD) reverse primer <400> 351 gttctcaacc tgtgggtcac 20 <210> 352 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> FGARefP2 (DD) probe <400> 352 tgttgtgatg acccgcaact 20 <210> 353 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> AlbF forward primer <400> 353 ccctccgttt gtcctagctt ttc 23 <210> 354 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> AlbR reverse primer <400> 354 ccagatacag aatatcttcc tcaacgcaga 30 <210> 355 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> forward primer <400> 355 cctttggcac aatgaagtgg 20 <210> 356 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> reverse primer <400> 356 gaatctgaac cctgatgaca ag 22 <210> 357 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> T4 <400> 357 taaagcatag tgcaatggat agg 23 <210> 358 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> T5 <400> 358 atttatgaga tcaacagcac agg 23 <210> 359 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> T11 <400> 359 ttaaataaag catagtgcaa tgg 23 <210> 360 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> T13 <400> 360 taataaaatt caaacatcct agg 23 <210> 361 <211> 4827 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> AAV8-pCB1010 <400> 361 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag gggatggcca 120 actccatcac taggggttcc tgcggcccgc ggcctgggta actaattagg atgtccggta 180 ctcctcaaag cgtactaaag aattattctt ttacatttca gaccgccacc aggagatact 240 acctgggggc tgtggagctg agctgggact acatgcagtc tgacctgggg gagctgcctg 300 tggatgccag gttccccccc agagtgccca agagcttccc cttcaacacc tctgtggtgt 360 acaagaagac cctgtttgtg gagttcactg accacctgtt caacattgcc aagcccaggc 420 ccccctggat gggcctgctg ggccccacca tccaggctga ggtgtatgac actgtggtga 480 tcaccctgaa gaacatggcc agccaccctg tgagcctgca tgctgtgggg gtgagctact 540 ggaaggcctc tgagggggct gagtatgatg accagaccag ccagagggag aaggaggatg 600 acaaggtgtt ccctgggggc agccacacct atgtgtggca ggtgctgaag gagaatggcc 660 ccatggcctc tgaccccctg tgcctgacct acagctacct gagccatgtg gacctggtga 720 aggacctgaa ctctggcctg attggggccc tgctggtgtg cagggagggc agcctggcca 780 aggagaagac ccagaccctg cacaagttca tcctgctgtt tgctgtgttt gatgagggca 840 agagctggca ctctgaaacc aagaacagcc tgatgcagga cagggatgct gcctctgcca 900 gggcctggcc caagatgcac actgtgaatg gctatgtgaa caggagcctg cctggcctga 960 ttggctgcca caggaagtct gtgtactggc atgtgattgg catgggcacc acccctgagg 1020 tgcacagcat cttcctggag ggccacacct tcctggtcag gaaccacagg caggccagcc 1080 tggagatcag ccccatcacc ttcctgactg cccagaccct gctgatggac ctgggccagt 1140 tcctgctgtt ctgccacatc agcagccacc agcatgatgg catggaggcc tatgtgaagg 1200 tggacagctg ccctgaggag ccccagctga ggatgaagaa caatgaggag gctgaggact 1260 atgatgatga cctgactgac tctgagatgg atgtggtgag gtttgatgat gacaacagcc 1320 ccagcttcat ccagatcagg tctgtggcca agaagcaccc caagacctgg gtgcactaca 1380 ttgctgctga ggaggaggac tgggactatg cccccctggt gctggcccct gatgacagga 1440 gctacaagag ccagtacctg aacaatggcc cccagaggat tggcaggaag tacaagaagg 1500 tcaggttcat ggcctacact gatgaaacct tcaagaccag ggaggccatc cagcatgagt 1560 ctggcatcct gggccccctg ctgtatgggg aggtggggga caccctgctg atcatcttca 1620 agaaccaggc cagcaggccc tacaacatct acccccatgg catcactgat gtgaggcccc 1680 tgtacagcag gaggctgccc aagggggtga agcacctgaa ggacttcccc atcctgcctg 1740 gggagatctt caagtacaag tggactgtga ctgtggagga tggccccacc aagtctgacc 1800 ccaggtgcct gaccagatac tacagcagct ttgtgaacat ggagagggac ctggcctctg 1860 gcctgattgg ccccctgctg atctgctaca aggagtctgt ggaccagagg ggcaaccaga 1920 tcatgtctga caagaggaat gtgatcctgt tctctgtgtt tgatgagaac aggagctggt 1980 acctgactga gaacatccag aggttcctgc ccaaccctgc tggggtgcag ctggaggacc 2040 ctgagttcca ggccagcaac atcatgcaca gcatcaatgg ctatgtgttt gacagcctgc 2100 agctgtctgt gtgcctgcat gaggtggcct actggtacat cctgagcatt ggggcccaga 2160 ctgacttcct gtctgtgttc ttctctggct acaccttcaa gcacaagatg gtgtatgagg 2220 acaccctgac cctgttcccc ttctctgggg agactgtgtt catgagcatg gagaaccctg 2280 gcctgtggat tctgggctgc cacaactctg acttcaggaa caggggcatg actgccctgc 2340 tgaaagtctc cagctgtgac aagaacactg gggactacta tgaggacagc tatgaggaca 2400 tctctgccta cctgctgagc aagaacaatg ccattgagcc caggagcttc agccagaatg 2460 ccactaatgt gtctaacaac agcaacacca gcaatgacag caatgtgtct cccccagtgc 2520 tgaagaggca ccagagggag atcaccagga ccaccctgca gtctgaccag gaggagattg 2580 actatgatga caccatctct gtggagatga agaaggagga ctttgacatc tacgacgagg 2640 acgagaacca gagccccagg agcttccaga agaagaccag gcactacttc attgctgctg 2700 tggagaggct gtgggactat ggcatgagca gcagccccca tgtgctgagg aacagggccc 2760 agtctggctc tgtgccccag ttcaagaagg tggtgttcca ggagttcact gatggcagct 2820 tcacccagcc cctgtacaga ggggagctga atgagcacct gggcctgctg ggcccctaca 2880 tcagggctga ggtggaggac aacatcatgg tgaccttcag gaaccaggcc agcaggccct 2940 acagcttcta cagcagcctg atcagctatg aggaggacca gaggcagggg gctgagccca 3000 ggaagaactt tgtgaagccc aatgaaacca agacctactt ctggaaggtg cagcaccaca 3060 tggccccccac caaggatgag tttgactgca aggcctgggc ctacttctct gatgtggacc 3120 tggagaagga tgtgcactct ggcctgattg gccccctgct ggtgtgccac accaacaccc 3180 tgaaccctgc ccatggcagg caggtgactg tgcaggagtt tgccctgttc ttcaccatct 3240 ttgatgaaac caagagctgg tacttcactg agaacatgga gaggaactgc agggccccct 3300 gcaacatcca gatggaggac cccaccttca aggagaacta caggttccat gccatcaatg 3360 gctacatcat ggacaccctg cctggcctgg tgatggccca ggaccagagg atcaggtggt 3420 acctgctgag catgggcagc aatgagaaca tccacagcat ccacttctct ggccatgtgt 3480 tcactgtgag gaagaaggag gagtacaaga tggccctgta caacctgtac cctggggtgt 3540 ttgagactgt ggagatgctg cccagcaagg ctggcatctg gagggtggag tgcctgattg 3600 gggagcacct gcatgctggc atgagcaccc tgttcctggt gtacagcaac aagtgccaga 3660 cccccctggg catggcctct ggccacatca gggacttcca gatcactgcc tctggccagt 3720 atggccagtg ggcccccaag ctggccaggc tgcactactc tggcagcatc aatgcctgga 3780 gcaccaagga gcccttcagc tggatcaagg tggacctgct ggcccccatg atcatccatg 3840 gcatcaagac ccagggggcc aggcagaagt tcagcagcct gtacatcagc cagttcatca 3900 tcatgtacag cctggatggc aagaagtggc agacctacag gggcaacagc actggcaccc 3960 tgatggtgtt ctttggcaat gtggacagct ctggcatcaa gcacaacatc ttcaaccccc 4020 ccatcattgc cagatacatc aggctgcacc ccacccacta cagcatcagg agcaccctga 4080 ggatggagct gatgggctgt gacctgaaca gctgcagcat gcccctgggc atggagagca 4140 aggccatctc tgatgcccag atcactgcca gcagctactt caccaacatg tttgccacct 4200 ggagccccag caaggccagg ctgcacctgc agggcaggag caatgcctgg aggccccagg 4260 tcaacaaccc caaggagtgg ctgcaggtgg acttccagaa gaccatgaag gtgactgggg 4320 tgaccaccca gggggtgaag agcctgctga ccagcatgta tgtgaaggag ttcctgatca 4380 gcagcagcca ggatggccac cagtggaccc tgttcttcca gaatggcaag gtgaaggtgt 4440 tccagggcaa ccaggacagc ttcacccctg tggtgaacag cctggacccc cccctgctga 4500 ccagatacct gaggattcac ccccagagct gggtgcacca gattgccctg aggatggagg 4560 tgctgggctg tgaggcccag gacctgtact gatcgcgaat aaaagatctt tattttcatt 4620 agatctgtgt gttggttttt tgtgtgcctg ggtaactaat taggatgtcc aattgcctta 4680 ggccgcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4740 ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4800 gcgagcgagc gcgcagctgc ctgcagg 4827 <210> 362 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 3 glycan B domain substitute <400> 362 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Pro Pro Val 1 5 10 15 Leu Lys Arg His Gln Arg 20 <210> 363 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 4 glycan B domain substitute <400> 363 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Pro Pro Val Leu Lys Arg His Gln Arg 20 25 <210> 364 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 5 glycan B domain substitute <400> 364 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Pro Val Leu Lys Arg His Gln Arg 20 25 <210> 365 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 6 glycan B domain substitute <400> 365 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Ser Pro Val Leu Lys Arg His Gln Arg 20 25 30 <210> 366 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 6 glycan B domain substitute (S->T) <400> 366 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Thr Pro Val Leu Lys Arg His Gln Arg 20 25 30 <210> 367 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 7 glycan B domain substitute <400> 367 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Ser Asn Lys Thr Pro Pro Val Leu Lys Arg His 20 25 30 Gln Arg <210> 368 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 8 glycan B domain substitute <400> 368 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Ser Asn Lys Thr Asn Asn Ser Pro Val Leu 20 25 30 Lys Arg His Gln Arg 35 <210> 369 <211> 40 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 9 glycan B domain substitute <400> 369 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Asn Asn Ser Asn Thr Ser 1 5 10 15 Asn Asp Ser Asn Val Ser Asn Lys Thr Asn Asn Ser Asn Ala Thr Pro 20 25 30 Pro Val Leu Lys Arg His Gln Arg 35 40 <210> 370 <211> 4448 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1030 <400> 370 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctcccccagt gctgaagagg caccagaggg 2340 agatcaccag gaccaccctg cagtctgacc aggaggagat tgactatgat gacaccatct 2400 ctgtggagat gaagaaggag gactttgaca tctacgacga ggacgagaac cagagcccca 2460 ggagcttcca gaagaagacc aggcactact tcattgctgc tgtggagagg ctgtgggact 2520 atggcatgag cagcagcccc catgtgctga ggaacagggc ccagtctggc tctgtgcccc 2580 agttcaagaa ggtggtgttc caggagttca ctgatggcag cttcacccag cccctgtaca 2640 gaggggagct gaatgagcac ctgggcctgc tgggccccta catcagggct gaggtggagg 2700 acaacatcat ggtgaccttc aggaaccagg ccagcaggcc ctacagcttc tacagcagcc 2760 tgatcagcta tgaggaggac cagaggcagg gggctgagcc caggaagaac tttgtgaagc 2820 ccaatgaaac caagacctac ttctggaagg tgcagcacca catggccccc accaaggatg 2880 agtttgactg caaggcctgg gcctacttct ctgatgtgga cctggagaag gatgtgcact 2940 ctggcctgat tggccccctg ctggtgtgcc acaccaacac cctgaaccct gcccatggca 3000 ggcaggtgac tgtgcaggag tttgccctgt tcttcaccat ctttgatgaa accaagagct 3060 ggtacttcac tgagaacatg gagaggaact gcagggcccc ctgcaacatc cagatggagg 3120 accccacctt caaggagaac tacaggttcc atgccatcaa tggctacatc atggacaccc 3180 tgcctggcct ggtgatggcc caggaccaga ggatcaggtg gtacctgctg agcatgggca 3240 gcaatgagaa catccacagc atccacttct ctggccatgt gttcactgtg aggaagaagg 3300 aggagtacaa gatggccctg tacaacctgt accctggggt gtttgagact gtggagatgc 3360 tgcccagcaa ggctggcatc tggagggtgg agtgcctgat tggggagcac ctgcatgctg 3420 gcatgagcac cctgttcctg gtgtacagca acaagtgcca gacccccctg ggcatggcct 3480 ctggccacat cagggacttc cagatcactg cctctggcca gtatggccag tgggccccca 3540 agctggccag gctgcactac tctggcagca tcaatgcctg gagcaccaag gagcccttca 3600 gctggatcaa ggtggacctg ctggccccca tgatcatcca tggcatcaag acccaggggg 3660 ccaggcagaa gttcagcagc ctgtacatca gccagttcat catcatgtac agcctggatg 3720 gcaagaagtg gcagacctac aggggcaaca gcactggcac cctgatggtg ttctttggca 3780 atgtggacag ctctggcatc aagcacaaca tcttcaaccc ccccatcatt gccagataca 3840 tcaggctgca ccccacccac tacagcatca ggagcaccct gaggatggag ctgatgggct 3900 gtgacctgaa cagctgcagc atgcccctgg gcatggagag caaggccatc tctgatgccc 3960 agatcactgc cagcagctac ttcaccaaca tgtttgccac ctggagcccc agcaaggcca 4020 ggctgcacct gcagggcagg agcaatgcct ggaggcccca ggtcaacaac cccaaggagt 4080 ggctgcaggt ggacttccag aagaccatga aggtgactgg ggtgaccacc cagggggtga 4140 agagcctgct gaccagcatg tatgtgaagg agttcctgat cagcagcagc caggatggcc 4200 accagtggac cctgttcttc cagaatggca aggtgaaggt gttccagggc aaccaggaca 4260 gcttcacccc tgtggtgaac agcctggacc cccccctgct gaccagatac ctgaggattc 4320 acccccagag ctgggtgcac cagattgccc tgaggatgga ggtgctgggc tgtgaggccc 4380 aggacctgta ctgatcgcga ataaaagatc tttattttca tagatctgt gtgttggttt 4440 tttgtgtg 4448 <210> 371 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 1-glycan B domain substitute <400> 371 Ser Phe Ser Gln Asn Ala Thr Pro Pro Val Leu Lys Arg His Gln Arg 1 5 10 15 <210> 372 <211> 4457 <212> DNA <213> Artificial Sequence <220> <223> Synthetic polynucleotide <220> <221> misc_feature <223> pCB1029 <400> 372 tgccagttcc cgatcgttac aggcggtact cctcaaagcg tactaaagaa ttattctttt 60 acatttcagt ggccaccagg agatactacc tgggggctgt ggagctgagc tgggactaca 120 tgcagtctga cctgggggag ctgcctgtgg atgccaggtt cccccccaga gtgcccaaga 180 gcttcccctt caacacctct gtggtgtaca agaagaccct gtttgtggag ttcactgacc 240 acctgttcaa cattgccaag cccaggcccc cctggatggg cctgctgggc cccaccatcc 300 aggctgaggt gtatgacact gtggtgatca ccctgaagaa catggccagc caccctgtga 360 gcctgcatgc tgtgggggtg agctactgga aggcctctga gggggctgag tatgatgacc 420 agaccagcca gagggagaag gaggatgaca aggtgttccc tgggggcagc cacacctatg 480 tgtggcaggt gctgaaggag aatggcccca tggcctctga ccccctgtgc ctgacctaca 540 gctacctgag ccatgtggac ctggtgaagg acctgaactc tggcctgatt ggggccctgc 600 tggtgtgcag ggagggcagc ctggccaagg agaagaccca gaccctgcac aagttcatcc 660 tgctgtttgc tgtgtttgat gagggcaaga gctggcactc tgaaaccaag aacagcctga 720 tgcaggacag ggatgctgcc tctgccaggg cctggcccaa gatgcacact gtgaatggct 780 atgtgaacag gagcctgcct ggcctgattg gctgccacag gaagtctgtg tactggcatg 840 tgattggcat gggcaccacc cctgaggtgc acagcatctt cctggagggc cacaccttcc 900 tggtcaggaa ccacaggcag gccagcctgg agatcagccc catcaccttc ctgactgccc 960 agaccctgct gatggacctg ggccagttcc tgctgttctg ccacatcagc agccaccagc 1020 atgatggcat ggaggcctat gtgaaggtgg acagctgccc tgaggagccc cagctgagga 1080 tgaagaacaa tgaggaggct gaggactatg atgatgacct gactgactct gagatggatg 1140 tggtgaggtt tgatgatgac aacagcccca gcttcatcca gatcaggtct gtggccaaga 1200 agcaccccaa gacctgggtg cactacattg ctgctgagga ggaggactgg gactatgccc 1260 ccctggtgct ggcccctgat gacaggagct acaagagcca gtacctgaac aatggccccc 1320 agaggattgg caggaagtac aagaaggtca ggttcatggc ctacactgat gaaaccttca 1380 agaccaggga ggccatccag catgagtctg gcatcctggg ccccctgctg tatggggagg 1440 tgggggacac cctgctgatc atcttcaaga accaggccag caggccctac aacatctacc 1500 cccatggcat cactgatgtg aggcccctgt acagcaggag gctgcccaag ggggtgaagc 1560 acctgaagga cttccccatc ctgcctgggg agatcttcaa gtacaagtgg actgtgactg 1620 tggaggatgg ccccaccaag tctgacccca ggtgcctgac cagatactac agcagctttg 1680 tgaacatgga gagggacctg gcctctggcc tgattggccc cctgctgatc tgctacaagg 1740 agtctgtgga ccagaggggc aaccagatca tgtctgacaa gaggaatgtg atcctgttct 1800 ctgtgtttga tgagaacagg agctggtacc tgactgagaa catccagagg ttcctgccca 1860 accctgctgg ggtgcagctg gaggaccctg agttccaggc cagcaacatc atgcacagca 1920 tcaatggcta tgtgtttgac agcctgcagc tgtctgtgtg cctgcatgag gtggcctact 1980 ggtacatcct gagcattggg gcccagactg acttcctgtc tgtgttcttc tctggctaca 2040 ccttcaagca caagatggtg tatgaggaca ccctgaccct gttccccttc tctggggaga 2100 ctgtgttcat gagcatggag aaccctggcc tgtggattct gggctgccac aactctgact 2160 tcaggaacag gggcatgact gccctgctga aagtctccag ctgtgacaag aacactgggg 2220 actactatga ggacagctat gaggacatct ctgcctacct gctgagcaag aacaatgcca 2280 ttgagcccag gagcttcagc cagaatgcca ctaatgtgtc tcccccagtg ctgaagaggc 2340 accagaggga gatcaccagg accaccctgc agtctgacca ggaggagatt gactatgatg 2400 acaccatctc tgtggagatg aagaaggagg actttgacat ctacgacgag gacgagaacc 2460 agagccccag gagcttccag aagaagacca ggcactactt cattgctgct gtggagaggc 2520 tgtgggacta tggcatgagc agcagccccc atgtgctgag gaacagggcc cagtctggct 2580 ctgtgcccca gttcaagaag gtggtgttcc aggagttcac tgatggcagc ttcacccagc 2640 ccctgtacag aggggagctg aatgagcacc tgggcctgct gggcccctac atcagggctg 2700 aggtggagga caacatcatg gtgaccttca ggaaccaggc cagcaggccc tacagcttct 2760 acagcagcct gatcagctat gaggaggacc agaggcaggg ggctgagccc aggaagaact 2820 ttgtgaagcc caatgaaacc aagacctact tctggaaggt gcagcaccac atggccccca 2880 ccaaggatga gtttgactgc aaggcctggg cctacttctc tgatgtggac ctggagaagg 2940 atgtgcactc tggcctgatt ggccccctgc tggtgtgcca caccaacacc ctgaaccctg 3000 cccatggcag gcaggtgact gtgcaggagt ttgccctgtt cttcaccatc tttgatgaaa 3060 ccaagagctg gtacttcact gagaacatgg agaggaactg cagggccccc tgcaacatcc 3120 agatggagga ccccaccttc aaggagaact acaggttcca tgccatcaat ggctacatca 3180 tggacaccct gcctggcctg gtgatggccc aggaccagag gatcaggtgg tacctgctga 3240 gcatgggcag caatgagaac atccacagca tccacttctc tggccatgtg ttcactgtga 3300 ggaagaagga ggagtacaag atggccctgt acaacctgta ccctggggtg tttgagactg 3360 tggagatgct gcccagcaag gctggcatct ggagggtgga gtgcctgatt ggggagcacc 3420 tgcatgctgg catgagcacc ctgttcctgg tgtacagcaa caagtgccag acccccctgg 3480 gcatggcctc tggccacatc agggacttcc agatcactgc ctctggccag tatggccagt 3540 gggcccccaa gctggccagg ctgcactact ctggcagcat caatgcctgg agcaccaagg 3600 agcccttcag ctggatcaag gtggacctgc tggcccccat gatcatccat ggcatcaaga 3660 cccagggggc caggcagaag ttcagcagcc tgtacatcag ccagttcatc atcatgtaca 3720 gcctggatgg caagaagtgg cagacctaca ggggcaacag cactggcacc ctgatggtgt 3780 tctttggcaa tgtggacagc tctggcatca agcacaacat cttcaacccc cccatcattg 3840 ccagatacat caggctgcac cccacccact acagcatcag gagcaccctg aggatggagc 3900 tgatgggctg tgacctgaac agctgcagca tgcccctggg catggagagc aaggccatct 3960 ctgatgccca gatcactgcc agcagctact tcaccaacat gtttgccacc tggagcccca 4020 gcaaggccag gctgcacctg cagggcagga gcaatgcctg gaggccccag gtcaacaacc 4080 ccaaggagtg gctgcaggtg gacttccaga agaccatgaa ggtgactggg gtgaccaccc 4140 agggggtgaa gagcctgctg accagcatgt atgtgaagga gttcctgatc agcagcagcc 4200 aggatggcca ccagtggacc ctgttcttcc agaatggcaa ggtgaaggtg ttccagggca 4260 accaggacag cttcacccct gtggtgaaca gcctggaccc ccccctgctg accagatacc 4320 tgaggattca cccccagagc tgggtgcacc agattgccct gaggatggag gtgctgggct 4380 gtgaggccca ggacctgtac tgatcgcgaa taaaagatct ttattttcat tagatctgtg 4440 tgttggtttt ttgtgtg 4457 <210> 373 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Synthetic polypeptide <220> <221> MISC_FEATURE <223> 2-glycan B domain substitute <400> 373 Ser Phe Ser Gln Asn Ala Thr Asn Val Ser Pro Val Leu Lys Arg 1 5 10 15 His Gln Arg

Claims (136)

하기를 포함하는 숙주 세포 DNA 서열을 변경시키기 위한 시스템:
데옥시리보핵산(DNA) 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산;
숙주 세포 유전자좌에 상보적인 스페이서 서열을 포함하는 가이드 RNA(gRNA) 또는 gRNA를 인코딩하는 핵산; 및
합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형으로서, 상기 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, 상기 B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 공여자 주형.
A system for altering a host cell DNA sequence comprising:
a deoxyribonucleic acid (DNA) endonuclease or a nucleic acid encoding a DNA endonuclease;
a guide RNA (gRNA) comprising a spacer sequence complementary to a host cell locus or a nucleic acid encoding the gRNA; and
A donor template comprising a nucleic acid sequence encoding a synthetic FVIII protein, said synthetic FVIII protein comprising a B domain substitution, said B domain substitution having 0 to 9 N-linked glycosylation sites and 3 to about 40 A donor template comprising an amino acid length.
제1항에 있어서, B 도메인 치환물이 0 내지 6개의 N-연결된 글리코실화 부위를 포함하는 시스템.The system of claim 1 , wherein the B domain substitution comprises 0 to 6 N-linked glycosylation sites. 제2항에 있어서, B 도메인 치환물이 0 내지 3개의 N-연결된 글리코실화 부위를 포함하는 시스템.3. The system of claim 2, wherein the B domain substitution comprises 0 to 3 N-linked glycosylation sites. 제1항에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 369, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 시스템.The system of claim 1 , wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362-369, 371 and 373. 제4항에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나의 아미노산 서열 또는 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나에 대하여 적어도 80% 동일성을 갖는 그의 변이체를 포함하는 시스템.5. The method of claim 4, wherein the B domain substitution has at least 80% identity to the amino acid sequence of any one of SEQ ID NOs: 362-366, 371 and 373 or any one of SEQ ID NOs: 362-366, 371 and 373. systems comprising variants thereof with 제5항에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 시스템.6. The system of claim 5, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362 to 364, 371 and 373. 제1항 내지 제6항 중 어느 한 항에 있어서, 숙주 세포 유전자좌가 간에서 발현되는 유전자의 유전자좌인 시스템.7. The system according to any one of claims 1 to 6, wherein the host cell locus is a locus of a gene expressed in the liver. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 숙주 세포 유전자좌가 급성기 단백질을 인코딩하는 유전자의 유전자좌인 시스템.8. The system according to any one of claims 1 to 7, wherein the host cell locus is the locus of a gene encoding an acute phase protein. 제8항에 있어서, 급성기 단백질이 알부민, 트랜스페린 또는 피브리노겐인 시스템.9. The system of claim 8, wherein the acute phase protein is albumin, transferrin or fibrinogen. 제1항 내지 제7항 중 어느 한 항에 있어서, 숙주 세포 유전자좌가 세이프 하버 유전자좌인 시스템.8. The system according to any one of claims 1 to 7, wherein the host cell locus is a safe harbor locus. 제1항 내지 제10항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 또는 Cpf1 엔도뉴클레아제, 및 그의 기능적 유도체로 이루어진 군으로부터 선택되는, 시스템.11. The method of any one of claims 1-10, wherein the DNA endonuclease is Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx17, Csx14, Csx17, Csx14, Csx A system selected from the group consisting of Csx15, Csf1, Csf2, Csf3, Csf4, or Cpf1 endonuclease, and functional derivatives thereof. 제11항에 있어서, DNA 엔도뉴클레아제가 Cas9인 시스템.The system of claim 11 , wherein the DNA endonuclease is Cas9. 제1항 내지 제11항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 숙주 세포 내의 발현을 위해 코돈-최적화되는, 시스템.12. The system of any one of claims 1-11, wherein the nucleic acid encoding the DNA endonuclease is codon-optimized for expression in a host cell. 제1항 내지 제13항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산이 데옥시리보핵산(DNA)인 시스템.14. The system of any one of claims 1-13, wherein the nucleic acid encoding the DNA endonuclease is deoxyribonucleic acid (DNA). 제1항 내지 제13항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 시스템.14. The system of any one of claims 1-13, wherein the nucleic acid encoding the DNA endonuclease is a ribonucleic acid (RNA). 제15항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 RNA가 mRNA인 시스템.16. The system of claim 15, wherein the RNA encoding the DNA endonuclease is mRNA. 제1항 내지 제16항 중 어느 한 항에 있어서, 공여자 주형 핵산 서열이 숙주 세포에서의 발현을 위해 코돈 최적화된 시스템.17. The system of any one of claims 1 to 16, wherein the donor template nucleic acid sequence is codon optimized for expression in a host cell. 제1항 내지 제17항 중 어느 한 항에 있어서, 공여자 주형 핵산 서열이 FVIII 단백질을 인코딩하는 야생형 핵산 서열에 비하여 감소된 함량의 CpG 디-뉴클레오티드를 포함하는 시스템.18. The system of any one of claims 1-17, wherein the donor template nucleic acid sequence comprises a reduced content of CpG di-nucleotides compared to a wild-type nucleic acid sequence encoding the FVIII protein. 제18항에 있어서, 공여자 주형 핵산 서열이 CpG 디-뉴클레오티드를 포함하지 않는 시스템.19. The system of claim 18, wherein the donor template nucleic acid sequence does not comprise a CpG di-nucleotide. 제1항 내지 제19항 중 어느 한 항에 있어서, 상기 공여자 주형이 아데노 연관 바이러스(AAV) 벡터에 인코딩된 시스템.20. The system of any one of claims 1-19, wherein the donor template is encoded in an adeno-associated virus (AAV) vector. 제1항 내지 제20항 중 어느 한 항에 있어서, 공여자 주형이 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트가 한 측 또는 양 측에서 gRNA 표적 부위에 측접한 시스템.21. The system of any one of claims 1-20, wherein the donor template comprises a donor cassette comprising a nucleic acid sequence encoding a synthetic FVIII protein, the donor cassette flanked on one or both sides by the gRNA target site. . 제21항에 있어서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 측접한 시스템.22. The system of claim 21, wherein the donor cassette is flanked on both sides by the gRNA target site. 제21항에 있어서, 공여자 카세트가 그의 5’ 측에서 gRNA 표적 부위에 측접한 시스템.22. The system of claim 21, wherein the donor cassette flanks the gRNA target site on its 5' side. 제21항 내지 제23항 중 어느 한 항에 있어서, gRNA 표적 부위는 시스템 내의 gRNA에 대한 표적 부위인 시스템.24. The system of any one of claims 21-23, wherein the gRNA target site is a target site for a gRNA in the system. 제24항에 있어서, 공여자 주형의 gRNA 표적 부위가 시스템 내의 gRNA에 대한 게놈 gRNA 표적 부위의 역 상보물인 시스템.25. The system of claim 24, wherein the gRNA target site of the donor template is the reverse complement of the genomic gRNA target site to the gRNA in the system. 제1항 내지 제25항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자에 함유되는 시스템.26. The system according to any one of claims 1 to 25, wherein the DNA endonuclease or nucleic acid encoding the DNA endonuclease is contained in liposomes or lipid nanoparticles. 제26항에 있어서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함하는 시스템.27. The system of claim 26, wherein the liposome or lipid nanoparticle also comprises a gRNA. 제1항 내지 제27항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제가 gRNA와 복합체화됨으로써 리보핵단백질(RNP) 복합체를 제공하는 시스템.28. The system of any one of claims 1-27, wherein the DNA endonuclease is complexed with the gRNA to provide a ribonucleoprotein (RNP) complex. 하기를 세포에 제공하는 단계를 포함하는, 숙주 세포에서의 게놈의 편집 방법:
(a) 숙주 세포 유전자좌에 상보적인 스페이서 서열을 포함하는 gRNA 또는 gRNA를 인코딩하는 핵산;
(b) DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및
(c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형으로서, 상기 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, 상기 B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 공여자 주형.
A method of editing a genome in a host cell comprising providing to the cell:
(a) a gRNA comprising a spacer sequence complementary to a host cell locus or a nucleic acid encoding the gRNA;
(b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and
(c) a donor template comprising a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein comprises a B domain substitution, wherein the B domain substitution has 0 to 9 N-linked glycosylation sites and 3 to A donor template comprising about 40 amino acids in length.
제29항에 있어서, B 도메인 치환물이 0 내지 6개의 N-연결된 글리코실화 부위를 포함하는 방법.30. The method of claim 29, wherein the B domain substitution comprises 0 to 6 N-linked glycosylation sites. 제30항에 있어서, B 도메인 치환물이 0 내지 3개의 N-연결된 글리코실화 부위를 포함하는 방법.31. The method of claim 30, wherein the B domain substitution comprises 0 to 3 N-linked glycosylation sites. 제29항에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 369, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 방법.30. The method of claim 29, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362-369, 371 and 373. 제32항에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나의 아미노산 서열 또는 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나에 대하여 적어도 80% 동일성을 갖는 그의 변이체를 포함하는 방법.33. The method of claim 32, wherein the B domain substitution has at least 80% identity to the amino acid sequence of any one of SEQ ID NOs: 362-366, 371 and 373 or any one of SEQ ID NOs: 362-366, 371 and 373. A method comprising a variant thereof having 제33항에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 방법.34. The method of claim 33, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362 to 364, 371 and 373. 제29항 내지 제34항 중 어느 한 항에 있어서, 숙주 세포 내인성 유전자좌가 간에서 발현되는 유전자의 유전자좌인 방법.35. The method of any one of claims 29-34, wherein the host cell endogenous locus is a locus of a gene expressed in the liver. 제29항 내지 제35항 중 어느 한 항에 있어서, 숙주 세포 내인성 유전자좌가 급성기 단백질을 인코딩하는 유전자의 유전자좌인 방법.36. The method of any one of claims 29-35, wherein the host cell endogenous locus is the locus of a gene encoding an acute phase protein. 제36항에 있어서, 급성기 단백질이 알부민, 트랜스페린 또는 피브리노겐인 방법.37. The method of claim 36, wherein the acute phase protein is albumin, transferrin or fibrinogen. 제29항 내지 제34항 중 어느 한 항에 있어서, 숙주 세포 내인성 유전자좌가 세이프 하버 유전자좌인 방법.35. The method of any one of claims 29-34, wherein the host cell endogenous locus is a Safe Harbor locus. 제29항 내지 제38항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 및 Cpf1 엔도뉴클레아제, 및 그의 기능적 유도체로 이루어진 군으로부터 선택되는, 방법.39. The method of any one of claims 29-38, wherein the DNA endonuclease is Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx17, Csx14, Csx17, Csx14, Csx Csx15, Csf1, Csf2, Csf3, Csf4, and Cpf1 endonucleases, and functional derivatives thereof. 제39항에 있어서, DNA 엔도뉴클레아제는 Cas9인 방법.40. The method of claim 39, wherein the DNA endonuclease is Cas9. 제29항 내지 제40항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 숙주 세포 내의 발현을 위해 코돈-최적화되는, 방법.41. The method of any one of claims 29-40, wherein the nucleic acid encoding the DNA endonuclease is codon-optimized for expression in a host cell. 제29항 내지 제41항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA인, 방법.42. The method of any one of claims 29-41, wherein the nucleic acid encoding the DNA endonuclease is DNA. 제29항 내지 제41항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산이 리보핵산(RNA)인 방법.42. The method of any one of claims 29-41, wherein the nucleic acid encoding the DNA endonuclease is ribonucleic acid (RNA). 제43항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 RNA는 mRNA인, 방법.44. The method of claim 43, wherein the RNA encoding the DNA endonuclease is mRNA. 제29항에 있어서, 공여자 주형은 AAV 벡터에 인코딩되는 방법.30. The method of claim 29, wherein the donor template is encoded in an AAV vector. 제29항 내지 제45항 중 어느 한 항에 있어서, 공여자 주형 핵산 서열이 숙주 세포에서의 발현을 위해 코돈 최적화된 방법.46. The method of any one of claims 29-45, wherein the donor template nucleic acid sequence is codon optimized for expression in a host cell. 제29항 내지 제46항 중 어느 한 항에 있어서, 공여자 주형 핵산 서열이 FVIII를 인코딩하는 야생형 핵산 서열에 비하여 감소된 함량의 CpG 디-뉴클레오티드를 포함하는 방법.47. The method of any one of claims 29-46, wherein the donor template nucleic acid sequence comprises a reduced content of CpG di-nucleotides compared to a wild-type nucleic acid sequence encoding FVIII. 제47항에 있어서, 공여자 주형 핵산 서열이 CpG 디-뉴클레오티드를 포함하지 않는 방법.48. The method of claim 47, wherein the donor template nucleic acid sequence does not comprise a CpG di-nucleotide. 제29항 내지 제48항 중 어느 한 항에 있어서, 공여자 주형이 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트가 한 측 또는 양 측에서 gRNA 표적 부위에 측접한 방법.49. The method of any one of claims 29-48, wherein the donor template comprises a donor cassette comprising a nucleic acid sequence encoding a synthetic FVIII protein, wherein the donor cassette is flanked on one or both sides by the gRNA target site. . 제49항에 있어서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 측접한 방법.50. The method of claim 49, wherein the donor cassette is flanked on both sides by the gRNA target site. 제49항에 있어서, 공여자 카세트가 그의 5’ 측에서 gRNA 표적 부위에 측접한 방법.50. The method of claim 49, wherein the donor cassette flanks the gRNA target site on its 5' side. 제49항 내지 제51항 중 어느 한 항에 있어서, 상기 gRNA 표적 부위가 (a)의 gRNA에 대한 표적 부위인 방법.52. The method of any one of claims 49-51, wherein the gRNA target site is a target site for the gRNA of (a). 제52항에 있어서, 공여자 주형의 gRNA 표적 부위가 (a)의 gRNA에 대한 세포 게놈 내의 gRNA 표적 부위의 역 상보물인 방법.53. The method of claim 52, wherein the gRNA target site of the donor template is the reverse complement of the gRNA target site in the genome of the cell to the gRNA of (a). 제29항 내지 제53항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 지질 나노입자에 제형화되는 방법.54. The method of any one of claims 29-53, wherein the DNA endonuclease or nucleic acid encoding the DNA endonuclease is formulated in liposomes or lipid nanoparticles. 제54항에 있어서, 리포좀 또는 지질 나노입자는 또한 gRNA를 포함하는 방법.55. The method of claim 54, wherein the liposome or lipid nanoparticle also comprises a gRNA. 제29항 내지 제55항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제 및 gRNA가 gRNA와 사전복합체화된 DNA 엔도뉴클레아제를 포함하는 RNP 복합체로서 숙주 세포에 제공되는 방법.56. The method of any one of claims 29-55, wherein the DNA endonuclease and the gRNA are provided to the host cell as an RNP complex comprising the DNA endonuclease pre-complexed with the gRNA. 제29항 내지 제56항 중 어느 한 항에 있어서, (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 (c)의 공여자 주형을 세포에 제공한 지 4일보다 긴 시간 후에 세포에 제공되는 방법.57. The method according to any one of claims 29 to 56, wherein the gRNA or nucleic acid encoding the gRNA of (a) and the DNA endonuclease or the nucleic acid encoding the DNA endonuclease of (c) are A method in which the donor template is provided to the cells for a time greater than 4 days after the donor template is provided to the cells. 제29항 내지 제57항 중 어느 한 항에 있어서, (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 (c)의 공여자 주형을 세포에 제공한 지 적어도 14일 후에 세포에 제공되는 방법.58. The method according to any one of claims 29 to 57, wherein the gRNA or nucleic acid encoding the gRNA of (a) and the DNA endonuclease or the nucleic acid encoding the DNA endonuclease of (c) are A method wherein the donor template is provided to the cells at least 14 days after providing the cells. 제57항 또는 제58항에 있어서, 하나 이상의 추가의 용량의 (a)의 gRNA 또는 gRNA를 인코딩하는 핵산, 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 제1 용량의 (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 후에 세포에 제공되는 방법.59. The method of claim 57 or 58, wherein the one or more additional doses of the gRNA or nucleic acid encoding the gRNA of (a), and the DNA endonuclease or the nucleic acid encoding the DNA endonuclease of (b) are second A method provided to a cell after one dose of (a) a gRNA or nucleic acid encoding a gRNA and (b) a DNA endonuclease or nucleic acid encoding a DNA endonuclease. 제59항에 있어서, 하나 이상의 추가의 용량의 (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에, 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 표적화된 통합이 달성되거나 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 발현이 달성될 때까지 세포에 제공되는 방법.60. The method of claim 59, wherein at least one additional dose of (a) a gRNA or nucleic acid encoding a gRNA and (b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease comprises a first dose of (a) After the gRNA or nucleic acid encoding the gRNA of ) and the nucleic acid encoding the DNA endonuclease or DNA endonuclease of (b), the target level of targeted integration of the nucleic acid sequence encoding the synthetic FVIII protein is achieved or A method of providing a cell until a target level of expression of a nucleic acid sequence encoding a synthetic FVIII protein is achieved. 제29항 내지 제60항 중 어느 한 항에 있어서, 세포는 간세포인, 방법.61. The method of any one of claims 29-60, wherein the cell is a hepatocyte. 제61항에 있어서, 세포가 인간 간세포 또는 인간 동모양혈관 상피 세포인 방법.62. The method of claim 61, wherein the cell is a human hepatocyte or a human allogeneic epithelial cell. 세포로서, 상기 세포의 게놈이 합성 FVIII 단백질을 인코딩하는 DNA를 포함하며, 상기 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, 상기 B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 세포.A cell, wherein the genome of said cell comprises DNA encoding a synthetic FVIII protein, said synthetic FVIII protein comprising B domain substitutions, said B domain substitutions comprising 0 to 9 N-linked glycosylation sites and 3 to about 40 amino acids in length. 제63항에 있어서, 합성 FVIII 단백질이 내인성 알부민 프로모터, 내인성 트랜스페린 프로모터 또는 내인성 피브리노겐 알파 프로모터에 작동 가능하게 연결되는 세포.64. The cell of claim 63, wherein the synthetic FVIII protein is operably linked to an endogenous albumin promoter, an endogenous transferrin promoter or an endogenous fibrinogen alpha promoter. 제63항에 있어서, 합성 FVIII 단백질을 인코딩하는 핵산 서열이 세포에서의 발현을 위해 코돈-최적화된 세포.64. The cell of claim 63, wherein the nucleic acid sequence encoding the synthetic FVIII protein is codon-optimized for expression in the cell. 제63항에 있어서, 세포가 인간 간 세포인 세포.64. The cell of claim 63, wherein the cell is a human liver cell. 제66항에 있어서, 세포가 인간 간세포 또는 인간 동모양혈관 상피 세포인 세포.67. The cell of claim 66, wherein the cell is a human hepatocyte or a human allogeneic epithelial cell. 제67항에 있어서, 세포가 제29항 내지 제62항 중 어느 한 항의 방법에 의해 제조되거나, 제29항 내지 제62항 중 어느 한 항의 방법에 의해 제조되는 세포의 자손인 세포.68. The cell of claim 67, wherein the cell is produced by the method of any one of claims 29-62, or is a progeny of a cell produced by the method of any one of claims 29-62. 대상체에서의 A형 혈우병의 치료 방법으로서, 상기 방법이
하기를 대상체의 세포에 제공하는 단계를 포함하는 방법:
(a) 숙주 세포 유전자좌에 상보적인 스페이서 서열을 포함하는 gRNA 또는 gRNA를 인코딩하는 핵산;
(b) DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및
(c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형으로서, 상기 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, 상기 B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 공여자 주형.
A method of treating hemophilia A in a subject, said method comprising:
A method comprising providing to a cell of a subject:
(a) a gRNA comprising a spacer sequence complementary to a host cell locus or a nucleic acid encoding the gRNA;
(b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and
(c) a donor template comprising a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein comprises a B domain substitution, wherein the B domain substitution has 0 to 9 N-linked glycosylation sites and 3 to A donor template comprising about 40 amino acids in length.
제69항에 있어서, B 도메인 치환물이 0 내지 6개의 N-연결된 글리코실화 부위를 포함하는 방법.70. The method of claim 69, wherein the B domain substitution comprises 0 to 6 N-linked glycosylation sites. 제70항에 있어서, B 도메인 치환물이 0 내지 3개의 N-연결된 글리코실화 부위를 포함하는 방법.71. The method of claim 70, wherein the B domain substitution comprises 0 to 3 N-linked glycosylation sites. 제69항에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 369, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 방법.70. The method of claim 69, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362-369, 371 and 373. 제72항에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나의 아미노산 서열 또는 SEQ ID NO: 362 내지 366, 371 및 373 중 어느 하나에 대하여 적어도 80% 동일성을 갖는 그의 변이체를 포함하는 방법.73. The method of claim 72, wherein the B domain substitution has at least 80% identity to the amino acid sequence of any one of SEQ ID NOs: 362-366, 371 and 373 or any one of SEQ ID NOs: 362-366, 371 and 373. A method comprising a variant thereof having 제73항에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 방법.74. The method of claim 73, wherein the B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362 to 364, 371 and 373. 제69항 내지 제74항 중 어느 한 항에 있어서, 숙주 세포 유전자좌가 간에서 발현되는 유전자의 유전자좌인 방법.75. The method of any one of claims 69-74, wherein the host cell locus is a locus of a gene expressed in the liver. 제69항 내지 제75항 중 어느 한 항에 있어서, 숙주 세포 유전자좌가 급성기 단백질을 인코딩하는 유전자의 유전자좌인 방법.76. The method of any one of claims 69-75, wherein the host cell locus is the locus of a gene encoding an acute phase protein. 제76항에 있어서, 급성기 단백질이 알부민, 트랜스페린 또는 피브리노겐인 방법.77. The method of claim 76, wherein the acute phase protein is albumin, transferrin or fibrinogen. 제69항 내지 제74항 중 어느 한 항에 있어서, 숙주 세포 유전자좌가 세이프 하버 유전자좌인 방법.75. The method of any one of claims 69-74, wherein the host cell locus is a Safe Harbor locus. 제69항 내지 제78항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 및 Cpf1 엔도뉴클레아제, 및 그의 기능적 유도체로 이루어진 군으로부터 선택되는, 방법.79. The method of any one of claims 69-78, wherein the DNA endonuclease is Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas100, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx17, Csx14, Csx17, Csx14, Csx Csx15, Csf1, Csf2, Csf3, Csf4, and Cpf1 endonucleases, and functional derivatives thereof. 제79항에 있어서, DNA 엔도뉴클레아제는 Cas9인 방법.80. The method of claim 79, wherein the DNA endonuclease is Cas9. 제80항에 있어서, Cas9는 spCas9 또는 SluCas9인, 방법.81. The method of claim 80, wherein the Cas9 is spCas9 or SluCas9. 제69항 내지 제81항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 세포 내의 발현을 위해 코돈-최적화되는, 방법.82. The method of any one of claims 69-81, wherein the nucleic acid encoding the DNA endonuclease is codon-optimized for expression in a cell. 제69항 내지 제82항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 DNA인, 방법.83. The method of any one of claims 69-82, wherein the nucleic acid encoding the DNA endonuclease is DNA. 제69항 내지 제82항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 핵산은 RNA인, 방법.83. The method of any one of claims 69-82, wherein the nucleic acid encoding the DNA endonuclease is RNA. 제84항에 있어서, DNA 엔도뉴클레아제를 인코딩하는 RNA는 mRNA인, 방법.85. The method of claim 84, wherein the RNA encoding the DNA endonuclease is mRNA. 제69항 내지 제85항 중 어느 한 항에 있어서, (a)의 gRNA 또는 gRNA를 인코딩하는 핵산, (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 (c)의 공여자 주형 중 하나 이상이 리포좀 또는 LNP에서 제형화되는 방법.86. The method according to any one of claims 69 to 85, comprising (a) a gRNA or a nucleic acid encoding a gRNA, (b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease, and (c) A method wherein one or more of the donor templates are formulated in liposomes or LNPs. 제69항 내지 제86항 중 어느 한 항에 있어서, 공여자 주형은 AAV 벡터에 인코딩되는 방법.87. The method of any one of claims 69-86, wherein the donor template is encoded in an AAV vector. 제69항 내지 제87항 중 어느 한 항에 있어서, 공여자 주형 핵산 서열이 숙주 세포에서의 발현을 위해 코돈 최적화된 방법.88. The method of any one of claims 69-87, wherein the donor template nucleic acid sequence is codon optimized for expression in a host cell. 제69항 내지 제88항 중 어느 한 항에 있어서, 공여자 주형 핵산 서열이 FVIII를 인코딩하는 야생형 핵산 서열에 비하여 감소된 함량의 CpG 디-뉴클레오티드를 포함하는 방법.89. The method of any one of claims 69-88, wherein the donor template nucleic acid sequence comprises a reduced content of CpG di-nucleotides compared to a wild-type nucleic acid sequence encoding FVIII. 제89항에 있어서, 공여자 주형 핵산 서열이 CpG 디-뉴클레오티드를 포함하지 않는 방법.91. The method of claim 89, wherein the donor template nucleic acid sequence does not comprise a CpG di-nucleotide. 제69항 내지 제90항 중 어느 한 항에 있어서, 공여자 주형이 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 카세트를 포함하며, 공여자 카세트가 한 측 또는 양 측에서 gRNA 표적 부위에 측접한 방법.91. The method of any one of claims 69-90, wherein the donor template comprises a donor cassette comprising a nucleic acid sequence encoding a synthetic FVIII protein, wherein the donor cassette is flanked on one or both sides by the gRNA target site. . 제91항에 있어서, 공여자 카세트는 양 측에서 gRNA 표적 부위에 측접한 방법.92. The method of claim 91, wherein the donor cassette is flanked on both sides by the gRNA target site. 제91항에 있어서, 공여자 카세트가 그의 5’ 측에서 gRNA 표적 부위에 측접한 방법.92. The method of claim 91, wherein the donor cassette flanks the gRNA target site on its 5' side. 제91항 내지 제93항 중 어느 한 항에 있어서, gRNA 표적 부위가 gRNA에 대한 표적 부위인 방법.94. The method of any one of claims 91-93, wherein the gRNA target site is a target site for a gRNA. 제94항에 있어서, 공여자 주형의 gRNA 표적 부위가 (a)의 gRNA에 대한 세포 게놈 내의 gRNA 표적 부위의 역 상보물인 방법.95. The method of claim 94, wherein the gRNA target site of the donor template is the reverse complement of the gRNA target site in the genome of the cell to the gRNA of (a). 제69항 내지 제95항 중 어느 한 항에 있어서, 공여자 주형을 세포에 제공하는 단계는 공여자 주형을 대상체에 정맥내 투여하는 것을 포함하는 방법.96. The method of any one of claims 69-95, wherein providing the donor template to the cells comprises administering the donor template intravenously to the subject. 제69항 내지 제96항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 리포좀 또는 LNP에 제형화되는 방법.97. The method of any one of claims 69-96, wherein the DNA endonuclease or nucleic acid encoding the DNA endonuclease is formulated in a liposome or LNP. 제97항에 있어서, 리포좀 또는 LNP가 또한 gRNA를 포함하는 방법.98. The method of claim 97, wherein the liposome or LNP also comprises a gRNA. 제98항에 있어서, gRNA 또는 gRNA를 인코딩하는 핵산 및 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계가 리포좀 또는 지질 나노입자를 대상체에 정맥내로 투여하는 것을 포함하는 방법.99. The method of claim 98, wherein providing the gRNA or nucleic acid encoding the gRNA and the DNA endonuclease or nucleic acid encoding the DNA endonuclease to the cell comprises intravenously administering the liposome or lipid nanoparticle to the subject. How to. 제69항 내지 제99항 중 어느 한 항에 있어서, DNA 엔도뉴클레아제 및 gRNA가 리보핵단백질(RNP) 복합체로서 숙주 세포에 제공되며, RNP 복합체가 gRNA와 복합체화된 DNA 엔도뉴클레아제를 포함하는 방법.101. The method of any one of claims 69-99, wherein the DNA endonuclease and the gRNA are provided to the host cell as a ribonucleoprotein (RNP) complex, and the RNP complex produces a DNA endonuclease complexed with the gRNA. How to include. 제69항 내지 제100항 중 어느 한 항에 있어서, (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 (c)의 공여자 주형을 세포에 제공한 지 4일보다 긴 시간 후에 세포에 제공되는 방법.101. The method according to any one of claims 69 to 100, wherein the gRNA or nucleic acid encoding the gRNA of (a) and the DNA endonuclease or the nucleic acid encoding the DNA endonuclease of (c) are A method in which the donor template is provided to the cells for a time greater than 4 days after the donor template is provided to the cells. 제69항 내지 제101항 중 어느 한 항에 있어서, (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 (c)의 공여자 주형을 세포에 제공한 지 적어도 14일 후에 세포에 제공되는 방법.102. The method of any one of claims 69-101, wherein the gRNA or nucleic acid encoding the gRNA of (a) and the DNA endonuclease or the nucleic acid encoding the DNA endonuclease of (c) are A method wherein the donor template is provided to the cells at least 14 days after providing the cells. 제101항 또는 제102항에 있어서, 하나 이상의 추가의 용량의 (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산이 제1 용량의 (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 후에 세포에 제공되는 방법.103. The method of claim 101 or 102, wherein at least one additional dose of the gRNA or nucleic acid encoding the gRNA of (a) and the DNA endonuclease or the nucleic acid encoding the DNA endonuclease of (b) the first A method provided to the cell after a dose of (a) the gRNA or nucleic acid encoding the gRNA and (b) the DNA endonuclease or nucleic acid encoding the DNA endonuclease. 제103항에 있어서, 하나 이상의 추가의 용량의 (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산은 제1 용량의 (a)의 gRNA 또는 gRNA를 인코딩하는 핵산 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산 이후에, 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 표적화된 통합 및/또는 합성 FVIII 단백질을 인코딩하는 핵산 서열의 표적 수준의 발현이 달성될 때까지 세포에 제공되는 방법.104. The method of claim 103, wherein at least one additional dose of (a) a gRNA or nucleic acid encoding a gRNA and (b) a DNA endonuclease or nucleic acid encoding a DNA endonuclease comprises a first dose of (a) ) after the gRNA or nucleic acid encoding the gRNA and the nucleic acid encoding the DNA endonuclease or DNA endonuclease of (b) followed by targeted integration of the nucleic acid sequence encoding the synthetic FVIII protein and/or A method of providing a cell until a target level of expression of a nucleic acid sequence encoding a synthetic FVIII protein is achieved. 제101항 내지 제104항 중 어느 한 항에 있어서, (a)의 gRNA 및 (b)의 DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산을 세포에 제공하는 단계가 DNA 엔도뉴클레아제를 인코딩하는 핵산 및 gRNA를 포함하는 지질 나노입자를 대상체에 투여하는 것을 포함하는 방법.105. The method of any one of claims 101-104, wherein the step of providing the gRNA of (a) and the DNA endonuclease of (b) or a nucleic acid encoding the DNA endonuclease to the cell comprises a DNA endonuclease. A method comprising administering to a subject a lipid nanoparticle comprising a nucleic acid encoding the agent and a gRNA. 제101항 내지 제105항 중 어느 한 항에 있어서, (c)의 공여자 주형을 세포에 제공하는 단계는 AAV 벡터에 인코딩된 공여자 주형을 대상체에 투여하는 것을 포함하는 방법.106. The method of any one of claims 101-105, wherein providing the donor template of (c) to the cell comprises administering to the subject a donor template encoded in an AAV vector. 제69항 내지 제106항 중 어느 한 항에 있어서, 세포는 간세포인, 방법.107. The method of any one of claims 69-106, wherein the cell is a hepatocyte. 제69항 내지 제107항 중 어느 한 항에 있어서, 합성 FVIII 단백질을 인코딩하는 핵산 서열은 대상체의 간 내에서 발현되는 방법.108. The method of any one of claims 69-107, wherein the nucleic acid sequence encoding the synthetic FVIII protein is expressed in the liver of the subject. 제63항 내지 제68항 중 어느 한 항의 세포를 대상체에 투여하는 단계를 포함하는 대상체에서의 A형 혈우병의 치료 방법.69. A method of treating hemophilia A in a subject comprising administering to the subject the cell of any one of claims 63-68. 제109항에 있어서, 세포가 대상체에 대하여 자가인 방법.110. The method of claim 109, wherein the cell is autologous to the subject. 제110항에 있어서, 대상체로부터 생물학적 시료를 수득하는 단계를 추가로 포함하며, 생물학적 시료가 간 세포를 포함하며, 세포가 간 세포로부터 제조되는 방법.112. The method of claim 110, further comprising obtaining a biological sample from the subject, wherein the biological sample comprises liver cells, wherein the cells are prepared from liver cells. 제1항 내지 제28항 중 어느 한 항의 시스템의 하나 이상의 요소를 포함하는 키트로서, 사용 설명서를 추가로 포함하는 키트.29. A kit comprising one or more elements of the system of any one of claims 1-28, further comprising instructions for use. 합성 FVIII 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 핵산으로서, 상기 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, 상기 B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 핵산.A nucleic acid comprising a polynucleotide sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein comprises a B domain substitution, wherein the B domain substitution has 0 to 9 N-linked glycosylation sites and 3 to about 40 A nucleic acid comprising an amino acid length. 제113항에 있어서, B 도메인 치환물이 0 내지 6개의 N-연결된 글리코실화 부위를 포함하는 핵산.114. The nucleic acid of claim 113, wherein the B domain substitution comprises 0 to 6 N-linked glycosylation sites. 제113항에 있어서, B 도메인 치환물이 0 내지 3개의 N-연결된 글리코실화 부위를 포함하는 핵산.114. The nucleic acid of claim 113, wherein the B domain substitution comprises 0-3 N-linked glycosylation sites. 제113항에 있어서, 상기 B 도메인 치환물이 SEQ ID NO: 362 내지 369, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 핵산.114. The nucleic acid of claim 113, wherein said B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362-369, 371 and 373. 제116항에 있어서, B 도메인 치환물이 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나의 아미노산 서열 또는 SEQ ID NO: 362 내지 364, 371 및 373 중 어느 하나에 대하여 적어도 80% 동일성을 갖는 그의 변이체를 포함하는 핵산.117. The method of claim 116, wherein the B domain substitution has at least 80% identity to the amino acid sequence of any one of SEQ ID NOs: 362 to 364, 371 and 373 or any one of SEQ ID NOs: 362 to 364, 371 and 373. A nucleic acid comprising a variant thereof with 제116항에 있어서, 상기 B 도메인 치환물이 SEQ ID NO: 362 내지 363, 371 및 373 중 어느 하나의 아미노산 서열을 포함하는 핵산.117. The nucleic acid of claim 116, wherein said B domain substitution comprises the amino acid sequence of any one of SEQ ID NOs: 362-363, 371 and 373. 제113항 내지 제118항 중 어느 한 항에 있어서, 상기 합성 FVIII 단백질을 인코딩하는 폴리뉴클레오티드 서열이 숙주 세포에서의 발현을 위해 코돈 최적화된 핵산.119. The nucleic acid of any one of claims 113-118, wherein the polynucleotide sequence encoding the synthetic FVIII protein is codon optimized for expression in a host cell. 제113항 내지 제119항 중 어느 한 항에 있어서, 합성 FVIII 단백질을 인코딩하는 폴리뉴클레오티드 서열이 FVIII를 인코딩하는 야생형 핵산 서열에 비하여 감소된 함량의 CpG 디-뉴클레오티드를 포함하는 핵산.120. The nucleic acid of any one of claims 113-119, wherein the polynucleotide sequence encoding the synthetic FVIII protein comprises a reduced content of CpG di-nucleotides compared to a wild-type nucleic acid sequence encoding FVIII. 제120항에 있어서, 상기 합성 FVIII 단백질을 인코딩하는 폴리뉴클레오티드 서열이 CpG 디뉴클레오티드를 포함하지 않는 핵산.121. The nucleic acid of claim 120, wherein the polynucleotide sequence encoding the synthetic FVIII protein does not comprise a CpG dinucleotide. 제113항 내지 제121항 중 어느 한 항에 있어서, 상기 핵산이 바이러스 벡터인 핵산.122. The nucleic acid according to any one of claims 113 to 121, wherein said nucleic acid is a viral vector. 제122항에 있어서, 상기 바이러스 벡터가 AAV 벡터인 핵산.123. The nucleic acid of claim 122, wherein said viral vector is an AAV vector. 대상체에서 FVIII의 양을 증가시키는 방법으로서, 상기 방법이
하기를 대상체 내의 세포에 제공하는 단계를 포함하며, 상기 대상체가 제1 혈청 수준의 FVIII을 갖는 방법:
(a) 숙주 세포 유전자좌에 상보적인 스페이서 서열을 포함하는 gRNA 또는 gRNA를 인코딩하는 핵산;
(b) DNA 엔도뉴클레아제 또는 DNA 엔도뉴클레아제를 인코딩하는 핵산; 및
(c) 합성 FVIII 단백질을 인코딩하는 핵산 서열을 포함하는 공여자 주형으로서, 상기 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, 상기 B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 공여자 주형.
A method of increasing the amount of FVIII in a subject, said method comprising:
A method comprising providing a cell in a subject, wherein the subject has a first serum level of FVIII:
(a) a gRNA comprising a spacer sequence complementary to a host cell locus or a nucleic acid encoding the gRNA;
(b) a DNA endonuclease or a nucleic acid encoding a DNA endonuclease; and
(c) a donor template comprising a nucleic acid sequence encoding a synthetic FVIII protein, wherein the synthetic FVIII protein comprises a B domain substitution, wherein the B domain substitution has 0 to 9 N-linked glycosylation sites and 3 to A donor template comprising about 40 amino acids in length.
제124항에 있어서, FVIII의 제1 혈청 수준이 약 0.40 IU/mL 미만인 방법.125. The method of claim 124, wherein the first serum level of FVIII is less than about 0.40 IU/mL. 제125항에 있어서, FVIII의 제1 혈청 수준이 약 0.05 IU/mL 미만인 방법.126. The method of claim 125, wherein the first serum level of FVIII is less than about 0.05 IU/mL. 제125항에 있어서, FVIII의 제1 혈청 수준이 약 0.01 IU/mL 미만인 방법.126. The method of claim 125, wherein the first serum level of FVIII is less than about 0.01 IU/mL. A형 혈우병의 치료를 위한 제1항 내지 제28항 중 어느 한 항의 시스템의 용도.29. Use of the system of any one of claims 1-28 for the treatment of hemophilia A. A형 혈우병의 치료용 의약의 제조를 위한 제1항 내지 제28항 중 어느 한 항의 시스템의 용도.29. Use of the system of any one of claims 1-28 for the manufacture of a medicament for the treatment of hemophilia A. A형 혈우병의 치료를 위한 제63항 내지 제68항 중 어느 한 항의 세포의 용도.69. Use of a cell according to any one of claims 63 to 68 for the treatment of hemophilia A. A형 혈우병의 치료용 의약의 제조를 위한 제63항 내지 제68항 중 어느 한 항의 세포의 용도.69. Use of a cell according to any one of claims 63 to 68 for the manufacture of a medicament for the treatment of hemophilia A. A형 혈우병의 치료를 위한 제112항의 키트의 용도.112. Use of the kit of claim 112 for the treatment of hemophilia A. A형 혈우병의 치료용 의약의 제조를 위한 제112항의 키트의 용도.112. Use of the kit of claim 112 for the manufacture of a medicament for the treatment of hemophilia A. A형 혈우병의 치료를 위한 제113항 내지 제123항 중 어느 한 항의 핵산의 용도.124. Use of a nucleic acid according to any one of claims 113 to 123 for the treatment of hemophilia A. A형 혈우병의 치료용 의약의 제조를 위한 제113항 내지 제123항 중 어느 한 항의 핵산의 용도.124. Use of a nucleic acid according to any one of claims 113 to 123 for the manufacture of a medicament for the treatment of hemophilia A. 합성 FVIII 단백질로서, 상기 합성 FVIII 단백질이 B 도메인 치환물을 포함하며, 상기 B 도메인 치환물이 0 내지 9개의 N-연결된 글리코실화 부위 및 3 내지 약 40개의 아미노산 길이를 포함하는 합성 FVIII 단백질.A synthetic FVIII protein, wherein the synthetic FVIII protein comprises a B domain substitution, wherein the B domain substitution comprises 0 to 9 N-linked glycosylation sites and 3 to about 40 amino acids in length.
KR1020217029608A 2019-06-05 2020-04-15 Gene Editing for Hemophilia A Using Improved Factor VIII Expression KR20220022110A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962857782P 2019-06-05 2019-06-05
US62/857,782 2019-06-05
PCT/US2020/028350 WO2020168362A1 (en) 2019-02-15 2020-04-15 Gene editing for hemophilia a with improved factor viii expression

Publications (1)

Publication Number Publication Date
KR20220022110A true KR20220022110A (en) 2022-02-24

Family

ID=73650918

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217029608A KR20220022110A (en) 2019-06-05 2020-04-15 Gene Editing for Hemophilia A Using Improved Factor VIII Expression

Country Status (5)

Country Link
JP (1) JP2023520262A (en)
KR (1) KR20220022110A (en)
CN (1) CN113710284A (en)
BR (1) BR112021015776A2 (en)
MX (1) MX2021009814A (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201210357D0 (en) * 2012-06-12 2012-07-25 Ucl Business Plc Factor VIII sequences
WO2017112895A1 (en) * 2015-12-23 2017-06-29 Haplomics, Inc. F8 gene repair
SG11202003464VA (en) * 2017-10-17 2020-05-28 Crispr Therapeutics Ag Compositions and methods for gene editing for hemophilia a
EP3752616A1 (en) * 2018-02-16 2020-12-23 CRISPR Therapeutics AG Compositions and methods for gene editing by targeting fibrinogen-alpha

Also Published As

Publication number Publication date
MX2021009814A (en) 2022-10-27
CN113710284A (en) 2021-11-26
JP2023520262A (en) 2023-05-17
BR112021015776A2 (en) 2021-11-09

Similar Documents

Publication Publication Date Title
US20240117352A1 (en) Expression of foxp3 in edited cd34+ cells
US20230242899A1 (en) Methods and compositions for modulating a genome
US20240076698A1 (en) Methods and compositions for modulating a genome
KR20200067190A (en) Composition and method for gene editing for hemophilia A
KR20180031671A (en) CRISPR / CAS-related methods and compositions for improving transplantation
KR20210075086A (en) universal donor cells
CA2985615A1 (en) Crispr/cas-related methods and compositions for treating hiv infection and aids
AU2012358384A1 (en) Methods of increasing the viability or longevity of an organ or organ explant
AU2015218576A1 (en) Methods and compositions for nuclease-mediated targeted integration
KR20210096088A (en) Composition and method for transgene delivery
US20230285597A1 (en) Gene editing for hemophilia a with improved factor viii expression
AU2019260687B2 (en) Rapamycin resistant cells
KR20220097414A (en) CRISPR and AAV Strategies for X-Linked Combustion Retinal Delaminization Therapy
US20210254057A1 (en) Compositions and methods for gene editing by targeting transferrin
KR20230036059A (en) Compositions and methods for modifying target nucleic acids
KR20220022110A (en) Gene Editing for Hemophilia A Using Improved Factor VIII Expression
RU2792187C2 (en) Compositions of cart-irines and their use methods
CN114395585A (en) Compositions for base editing
KR20230131178A (en) Gene editing using modified endonucleases
KR20230066453A (en) Non-viral DNA vectors and their use for expressing FVIII therapeutics