KR20200012786A - 항응고 인자들의 유전자 에디팅 - Google Patents

항응고 인자들의 유전자 에디팅 Download PDF

Info

Publication number
KR20200012786A
KR20200012786A KR1020190090599A KR20190090599A KR20200012786A KR 20200012786 A KR20200012786 A KR 20200012786A KR 1020190090599 A KR1020190090599 A KR 1020190090599A KR 20190090599 A KR20190090599 A KR 20190090599A KR 20200012786 A KR20200012786 A KR 20200012786A
Authority
KR
South Korea
Prior art keywords
seq
sequence
nucleic acid
guide
domain
Prior art date
Application number
KR1020190090599A
Other languages
English (en)
Inventor
송동우
이정민
이규준
김운기
Original Assignee
주식회사 툴젠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 툴젠 filed Critical 주식회사 툴젠
Publication of KR20200012786A publication Critical patent/KR20200012786A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/81Protease inhibitors
    • C07K14/8107Endopeptidase (E.C. 3.4.21-99) inhibitors
    • C07K14/811Serine protease (E.C. 3.4.21) inhibitors
    • C07K14/8121Serpins
    • C07K14/8128Antithrombin III
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/81Protease inhibitors
    • C07K14/8107Endopeptidase (E.C. 3.4.21-99) inhibitors
    • C07K14/811Serine protease (E.C. 3.4.21) inhibitors
    • C07K14/8114Kunitz type inhibitors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Hematology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Diabetes (AREA)
  • Mycology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Cell Biology (AREA)
  • Dermatology (AREA)
  • Virology (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Toxicology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 혈액 응고 시스템을 조절하기 위해 세포의 게놈 내 존재하는 혈액 응고 저해 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물에 관한 것이다. 보다 구체적으로, 혈액 응고 저해 유전자를 표적화할 수 있는 가이드핵산 및 에디터 단백질을 포함하는 유전자 조작용 조성물에 관한 것이다. 또한 혈액 응고 저해 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 이용하여 혈액 응고 장애를 치료 또는 개선하는 방법에 관한 것이다.

Description

항응고 인자들의 유전자 에디팅{A gene editing of anticoagulant factors}
본 발명은 정상적인 혈액 응고 시스템을 위한 혈액 응고 저해 유전자의 인위적 조작 또는 변형에 관한 것이다. 보다 구체적으로, 비정상적인 혈액 응고 시스템, 즉, 불활성화된 혈액 응고 시스템을 활성화시키기 위한 혈액 응고 저해 유전자를 인위적으로 조작할 수 있는 조성물을 포함하는, 인위적으로 혈액 응고를 조절할 수 있는 시스템에 관한 것이다.
혈우병은 혈액 응고 인자 결핍으로 인한 출혈성 질환이다. 혈액 내 응고 인자들은 I ~XIII 인자들로 구성되어 있으며, 혈우병은 해당 인자의 유전자 결함으로 발생된다. 혈우병 A는 VIII인자 결핍이 원인이며, 출생 남아 5,000명당 1명 정도에서 발생하는 것으로 알려져 있다. 혈우병 B는 IX인자 결핍이 원인이며, 출생 남아 20,000명당 1명 정도에서 발생하는 것으로 알려져 있다. 전 세계적으로 약 70만명 이상의 혈우병 환자가 있을 것으로 추산되고 있다.
현재까지 알려진 치료제로는 결핍된 인자를 지속적으로 투여하는 것이 대부분일 뿐, 근본적인 치료 방법을 없는 실정이다.
따라서, 유전자 교정을 이용해 혈액 응고 시스템을 불활성화 시키는 단백질의 발현을 근본적으로 녹아웃시킬 수 있는, 한 번의 치료로 장기적인 효과를 기대할 수 있는 치료제의 개발이 필요하다.
본 발명의 일 구체예로서 혈액 응고 장애를 치료하는 방법을 제공하고자 한다.
본 발명의 일 구체예로서 유전자 조작용 조성물을 제공하고자 한다.
본 발명의 일 구체예로서 혈액 응고 저해 유전자를 표적할 수 있는 가이드핵산을 제공하고자 한다.
상기 과제를 해결하기 위하여, 본 발명은 혈액 응고 시스템을 조절하기 위해 세포의 게놈 내 존재하는 혈액 응고 저해 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물에 관한 것이다. 보다 구체적으로, 혈액 응고 저해 유전자를 표적화할 수 있는 가이드핵산 및 에디터 단백질을 포함하는 유전자 조작용 조성물에 관한 것이다. 또한 혈액 응고 저해 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 이용하여 혈액 응고 장애를 치료 또는 개선하는 방법에 관한 것이다.
본 발명은 혈우병을 치료하기 위해 치료 대상에 유전자 조작용 조성물을 투여(도입)하는 단계를 포함하는, 혈우병을 치료하는 방법을 제공한다.
일 구현예에서, 혈우병을 치료하는 방법은 유전자 조작용 조성물을 치료 대상에 도입(투여)하는 단계를 포함할 수 있다.
상기 유전자 조작용 조성물은
혈액 응고 저해 유전자 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및
에디터단백질 또는 이를 암호화하는 핵산 서열
을 포함할 수 있다.
상기 혈액 응고 저해 유전자는 AT(antithrombin) 유전자 또는 TFPI(tissue factor pathway inhibitor) 유전자일 수 있다.
상기 가이드 서열은 SEQ ID NO: 425 내지 SEQ ID NO: 830의 가이드 서열들 중 선택된 하나 이상의 가이드 서열일 수 있다.
상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합일 수 있다.
일 구체예에서, 상기 가이드 서열은 SEQ ID NO: 427, 428, 436, 437, 443, 444, 447, 448, 449, 454, 458, 460, 461, 463, 464, 466, 467, 469, 473, 474, 622, 623, 624, 625, 626, 627, 628, 630, 632, 634, 635, 638, 639, 641, 642, 659, 660, 661, 662, 663, 664, 665, 666, 667, 668, 669, 670, 671, 672, 673, 674, 675, 676, 677, 678, 679, 680, 681, 682, 683, 684, 686, 687 및 688 중 선택된 하나 이상의 서열일 수 있다.
일 구체예에서, 상기 가이드 서열은 SEQ ID NO: 692, 694, 705, 709, 710, 721, 726, 731, 733, 735, 740, 741, 742, 748, 781, 783, 786, 788, 791, 792, 794, 795, 796, 797, 798, 800, 802, 803, 804, 809, 810, 811, 813, 814, 815, 816, 817, 818, 819, 820, 821, 822, 823, 824, 825, 826, 827, 828, 829 및 830 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 AT 유전자의 exon 1, exon 2, exon 3, exon 4, exon 5, exon 6 또는 exon 7에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 가이드 서열은 TFPI 유전자의 exon 2, exon 3, exon 5, exon 6 또는 exon 7에 위치하는 표적 서열과 상보적인 결합을 결합을 형성할 수 있다.
상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질일 수 있다.
상기 유전자 조작용 조성물은 가이드핵산과 에디터단백질이 결합한 가이드핵산-에디터단백질 복합체 형태일 수 있다.
이때, 상기 가이드핵산은 guide RNA(gRNA)일 수 있다.
상기 유전자 조작용 조성물은 가이드핵산 및 에디터단백질이 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.
이때, 상기 벡터는 플라스미드 또는 바이러스벡터일 수 있다.
이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상인 것일 수 있다.
상기 유전자 조작용 조성물은 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.
이때, 상기 삽입을 원하는 핵산서열은 혈액 응고 저해 유전자의 일부 핵산 서열일 수 있다.
이때, 상기 삽입을 원하는 핵산서열은 혈액 응고에 관여하는 단백질을 암호화하는 유전자 전체 또는 일부 핵산 서열일 수 있다.
예를 들어, 상기 혈액 응고에 관여하는 단백질은 XII 인자(factor XII), XIIa 인자(factor XIIa), XI 인자(factor XI), XIa 인자(factor XIa), IX 인자(factor IX), IXa 인자(factor IXa), X 인자(factor X), Xa 인자(factor Xa), VIII 인자(factor VIII), VIIIa 인자(factor VIIIa), VII 인자(factor VII), VIIa 인자(factor VIIa), V 인자(factor V), Va 인자(factor Va), 프로트롬빈(prothrombin), 트롬빈(thrombin), XIII 인자(factor XIII), XIIIa 인자(factor XIIIa), 피브리노겐(fibrinogen), 피브린(fibrin) 및 Tissue factor로 구성된 군에서 선택된 하나 이상인 것일 수 있다.
상기 유전자 조작용 조성물은 가이드핵산, 에디터단백질 및 도너가 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.
이때, 상기 벡터는 플라스미드 또는 바이러스벡터일 수 있다.
이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상인 것일 수 있다.
상기 도입(투여)은 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)으로 수행될 수 있다.
상기 도입(투여)은 간내(intrahepatic), 피하(subcutaneous), 피내(intradermal), 안구내(intraocular), 유리체내(intravitreal) 종양내(intratumoral), 절내(intranodal), 골수내(intramedullary), 근육내(intramuscular), 정맥내(intravenous), 림프액내(intralymphatic) 및 복막내(intraperitoneal) 중에서 선택된 투여 경로로 수행될 수 있다.
상기 혈우병은 혈우병 A, 혈우병 B 또는 혈우병 C일 수 있다.
상기 치료 대상은 인간, 원숭이, 마우스, 래트를 포함하는 포유동물일 수 있다.
또한, 본 발명은 특정 목적을 위해 유전자 조작용 조성물을 제공한다.
구현예에서, 상기 유전자 조작용 조성물은
혈액 응고 저해 유전자 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및
에디터단백질 또는 이를 암호화하는 핵산 서열
을 포함할 수 있다.
상기 혈액 응고 저해 유전자는 AT(antithrombin) 유전자 또는 TFPI(tissue factor pathway inhibitor) 유전자일 수 있다.
상기 가이드 서열은 SEQ ID NO: 425 내지 SEQ ID NO: 830의 가이드 서열들 중 선택된 하나 이상의 가이드 서열일 수 있다.
상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합일 수 있다.
상기 표적 서열은 SEQ ID NO: 19 내지 SEQ ID NO: 424 중 선택된 하나 이상의 서열일 수 있다.
일 구체예에서, 상기 표적 서열은 SEQ ID NO: 21, 22, 30, 31, 37, 38, 41, 42, 43, 48, 52, 54, 55, 57, 58, 60, 61, 63, 67, 68, 216, 217, 218, 219, 220, 221, 222, 224, 226, 228, 229, 232, 233, 235, 236, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 280, 281 및 282 중 선택된 하나 이상의 서열일 수 있다.
일 구체예에서, 상기 표적 서열은 SEQ ID NO: 286, 288, 299, 303, 304, 315, 320, 325, 327, 329, 334, 335, 336, 342, 375, 377, 380, 382, 385, 386, 388, 389, 390, 391, 392, 394, 396, 397, 398, 403, 404, 405, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423 및 424 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 SEQ ID NO: 427, 428, 436, 437, 443, 444, 447, 448, 449, 454, 458, 460, 461, 463, 464, 466, 467, 469, 473, 474, 622, 623, 624, 625, 626, 627, 628, 630, 632, 634, 635, 638, 639, 641, 642, 659, 660, 661, 662, 663, 664, 665, 666, 667, 668, 669, 670, 671, 672, 673, 674, 675, 676, 677, 678, 679, 680, 681, 682, 683, 684, 686, 687 및 688 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 SEQ ID NO: 692, 694, 705, 709, 710, 721, 726, 731, 733, 735, 740, 741, 742, 748, 781, 783, 786, 788, 791, 792, 794, 795, 796, 797, 798, 800, 802, 803, 804, 809, 810, 811, 813, 814, 815, 816, 817, 818, 819, 820, 821, 822, 823, 824, 825, 826, 827, 828, 829 및 830 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 AT 유전자의 exon 1, exon 2, exon 3, exon 4, exon 5, exon 6 또는 exon 7에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 가이드 서열은 TFPI 유전자의 exon 2, exon 3, exon 5, exon 6 또는 exon 7에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 가이드핵산은 가이드 도메인은 포함할 수 있다.
이때, 상기 가이드 서열은 상기 가이드 도메인에 포함될 수 있다.
상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함할 수 있다.
상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질일 수 있다.
상기 유전자 조작용 조성물은 가이드핵산과 에디터단백질이 결합한 가이드핵산-에디터단백질 복합체 형태일 수 있다.
이때, 상기 가이드핵산은 guide RNA(gRNA)일 수 있다.
상기 유전자 조작용 조성물은 가이드핵산 및 에디터단백질이 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.
이때, 상기 벡터는 플라스미드 또는 바이러스벡터일 수 있다.
이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상인 것일 수 있다.
상기 유전자 조작용 조성물은 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.
이때, 상기 삽입을 원하는 핵산서열은 혈액 응고 저해 유전자의 일부 핵산 서열일 수 있다.
이때, 상기 삽입을 원하는 핵산서열은 혈액 응고에 관여하는 단백질을 암호화하는 유전자 전체 또는 일부 핵산 서열일 수 있다.
예를 들어, 상기 혈액 응고에 관여하는 단백질은 XII 인자(factor XII), XIIa 인자(factor XIIa), XI 인자(factor XI), XIa 인자(factor XIa), IX 인자(factor IX), IXa 인자(factor IXa), X 인자(factor X), Xa 인자(factor Xa), VIII 인자(factor VIII), VIIIa 인자(factor VIIIa), VII 인자(factor VII), VIIa 인자(factor VIIa), V 인자(factor V), Va 인자(factor Va), 프로트롬빈(prothrombin), 트롬빈(thrombin), XIII 인자(factor XIII), XIIIa 인자(factor XIIIa), 피브리노겐(fibrinogen), 피브린(fibrin) 및 Tissue factor로 구성된 군에서 선택된 하나 이상인 것일 수 있다.
상기 유전자 조작용 조성물은 가이드핵산, 에디터단백질 및 도너가 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.
이때, 상기 벡터는 플라스미드 또는 바이러스벡터일 수 있다.
이때, 상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상인 것일 수 있다.
본 발명은 특정 목적을 위해 면역 참여 유전자를 표적할 수 있는 가이드핵산을 제공한다.
일 구현예에서, 상기 가이드핵산은 혈액 응고 저해 유전자 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함할 수 있다.
상기 혈액 응고 저해 유전자는 AT(antithrombin) 유전자 또는 TFPI(tissue factor pathway inhibitor) 유전자일 수 있다.
상기 가이드 서열은 SEQ ID NO: 425 내지 SEQ ID NO: 830의 가이드 서열들 중 선택된 하나 이상의 가이드 서열일 수 있다.
상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합일 수 있다.
상기 가이드핵산은 에디터단백질과 복합체를 형성할 수 있다.
일 구체예에서, 상기 가이드 서열은 SEQ ID NO: 427, 428, 436, 437, 443, 444, 447, 448, 449, 454, 458, 460, 461, 463, 464, 466, 467, 469, 473, 474, 622, 623, 624, 625, 626, 627, 628, 630, 632, 634, 635, 638, 639, 641, 642, 659, 660, 661, 662, 663, 664, 665, 666, 667, 668, 669, 670, 671, 672, 673, 674, 675, 676, 677, 678, 679, 680, 681, 682, 683, 684, 686, 687 및 688 중 선택된 하나 이상의 서열일 수 있다.
일 구체예에서, 상기 가이드 서열은 SEQ ID NO: 692, 694, 705, 709, 710, 721, 726, 731, 733, 735, 740, 741, 742, 748, 781, 783, 786, 788, 791, 792, 794, 795, 796, 797, 798, 800, 802, 803, 804, 809, 810, 811, 813, 814, 815, 816, 817, 818, 819, 820, 821, 822, 823, 824, 825, 826, 827, 828, 829 및 830 중 선택된 하나 이상의 서열일 수 있다.
상기 가이드 서열은 AT 유전자의 exon 1, exon 2, exon 3, exon 4, exon 5, exon 6 또는 exon 7에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 가이드 서열은 TFPI 유전자의 exon 2, exon 3, exon 5, exon 6 또는 exon 7에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 가이드핵산은 가이드 도메인은 포함할 수 있다.
이때, 상기 가이드 서열은 상기 가이드 도메인에 포함될 수 있다.
상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함할 수 있다.
본 발명은 유전자 조작용 조성물을 통해 혈액 응고 시스템을 조절할 수 있다. 보다 구체적으로, 혈액 응고 저해 유전자를 표적화하는 가이드핵산 및 에디터단백질을 포함하는 유전자 조작용 조성물을 이용해 혈액 응고 저해 유전자를 인위적으로 조작 및/또는 변형하여 혈액 응고 저해 유전자의 기능 및/또는 발현을 조절하여 혈액 응고 시스템을 조절할 수 있도록 한다. 또한, 혈액 응고 저해 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물을 이용하여 혈액 응고 장애를 개선 또는 치료할 수 있다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있다. 본 명세서에서 언급된 모든 간행물, 특허 출원, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다.
본 명세서에 의해 개시되는 내용의 일 태양은 가이드핵산에 관한 것이다.
“가이드핵산”은 표적 핵산, 유전자 또는 염색체를 인지하고, 및 에디터단백질과 상호작용할 수 있는 뉴클레오타이드서열을 의미한다. 이때, 상기 가이드핵산은 표적 핵산, 유전자 또는 염색체 내의 일부 뉴클레오타이드서열과 상보적인 결합할 수 있다. 또한 상기 가이드핵산의 일부 뉴클레오타이드서열은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성할 수 있다.
상기 가이드핵산은 가이드핵산-에디터단백질 복합체가 표적 핵산, 유전자 또는 염색체의 표적 영역에 위치할 수 있도록 유도하는 기능을 수행할 수 있다.
상기 가이드핵산은 DNA, RNA 또는 DNA/RNA 혼합의 형태일 수 있고, 5 내지 150개의 핵산서열을 가질 수 있다.
상기 가이드핵산은 하나의 연속된 핵산서열일 수 있다.
예를 들어, 하나의 연속된 핵산 서열은 (N)m 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m은 1 내지 150의 정수를 의미한다.
상기 가이드핵산은 연속된 핵산서열이 두 개 이상일 수 있다.
예를 들어, 두 개 이상의 연속된 핵산서열은 (N)m과 (N)o 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m 및 o는 1 내지 150의 정수를 의미하며, m과 o는 서로 같거나 다를 수 있다.
상기 가이드핵산은 하나 이상의 도메인을 포함할 수 있다.
상기 도메인은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리도메인 등의 기능적 도메인일 수 있으며, 이에 제한되지 않는다.
이때, 하나의 가이드핵산은 2 이상의 기능적 도메인을 가질 수 있다. 이때, 상기 2 이상의 기능적 도메인은 서로 상이할 수 있다. 또는 하나의 가이드핵산에 포함된 2 이상의 기능적 도메인은 서로 동일할 수도 있다. 예를 들어, 하나의 가이드핵산은 2 이상의 근위 도메인을 가질 수 있고, 다른 예를 들어, 하나의 가이드핵산은 2 이상의 꼬리도메인을 가질 수 있다. 다만, 하나의 가이드핵산에 포함되어 있는 기능적 도메인이 서로 동일한 도메인이라는 말은 두 기능적 도메인의 시퀀스가 동일하다는 의미는 아니며, 시퀀스가 상이하여도 기능적으로 동일한 기능을 수행하고 있으면 동일한 도메인이라고 할 수 있다.
기능적 도메인에 대해서 이하에서 구체적으로 설명한다.
i) 가이드 도메인
"가이드 도메인"은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 결합을 할 수 있는 도메인으로, 표적 유전자 또는 핵산과의 특이적인 상호작용을 위해 역할한다. 예를 들어, 가이드 도메인은 표적 유전자 또는 핵산의 특정 뉴클레오타이드서열을 가지는 위치로 가이드핵산-에디터단백질 복합체를 유도하는 기능을 수행할 수 있다.
상기 가이드 도메인은 10 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 가이드 도메인은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
다른 일 예로, 상기 가이드 도메인은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
상기 가이드 도메인은 가이드 서열을 포함할 수 있다.
“가이드 서열”은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드서열이며, 이때 상기 가이드 서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드서열일 수 있다.
상기 가이드 서열은 10 내지 25개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 가이드 서열은 10 내지 25개의 뉴클레오타이드서열, 15 내지 25개의 뉴클레오타이드서열 또는 20 내지 25개의 뉴클레오타이드서열일 수 있다.
다른 일 예로, 상기 가이드 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열 또는 20 내지 25개의 뉴클레오타이드서열일 수 있다.
또한, 상기 가이드 도메인은 추가 뉴클레오타이드서열을 더 포함할 수 있다.
상기 추가 뉴클레오타이드서열은 가이드 도메인의 기능 향상 또는 저하를 위한 것일 수 있다.
상기 추가 뉴클레오타이드서열은 가이드 서열의 기능 향상 또는 저하를 위한 것일 수 있다.
상기 추가 뉴클레오타이드서열은 1 내지 10개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 추가 뉴클레오타이드서열은 2내지 10개의 뉴클레오타이드서열, 4 내지 10개의 뉴클레오타이드서열, 6 내지 10개의 뉴클레오타이드서열 또는 8 내지 10개의 뉴클레오타이드서열일 수 있다.
다른 일 예로, 상기 추가 뉴클레오타이드서열은 1 내지 3개의 뉴클레오타이드서열, 3 내지 6개의 뉴클레오타이드서열 또는 7 내지 10개의 뉴클레오타이드서열일 수 있다.
일 구체예로서, 상기 추가 뉴클레오타이드서열은 1개의 뉴클레오타이드서열, 2개의 뉴클레오타이드서열, 3개의 뉴클레오타이드서열, 4개의 뉴클레오타이드서열, 5개의 뉴클레오타이드서열, 6개의 뉴클레오타이드서열, 7개의 뉴클레오타이드서열, 8개의 뉴클레오타이드서열, 9개의 뉴클레오타이드서열 또는 10개의 뉴클레오타이드서열일 수 있다.
예를 들어, 상기 추가 뉴클레오타이드서열은 1개의 뉴클레오타이드서열 G(구아닌)일 수 있으며, 또는 2개의 뉴클레오타이드서열 GG일 수 있다.
상기 추가 뉴클레오타이드서열은 상기 가이드 서열의 5' 말단에 위치할 수 있다.
상기 추가 뉴클레오타이드서열은 상기 가이드 서열의 3' 말단에 위치할 수 있다.
ii) 제 1 상보적 도메인
"제 1 상보적 도메인"은 이하에서 설명하는 제 2 상보적 도메인에 대해 상보적 뉴클레오타이드서열을 포함하는 도메인으로, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 예를 들어, 제 1 상보적 도메인은 제 2 상보적 도메인에 대해 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드서열일 수 있다.
상기 제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 결합을 통해 이중가닥을 형성할 수 있다. 이때, 상기 형성된 이중가닥은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성하는 역할을 할 수 있다.
상기 제 1 상보적 도메인은 5 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 제 1 상보적 도메인은 5 내지 35개의 뉴클레오타이드서열, 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
다른 일 예로서, 상기 제 1 상보적 도메인은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
iii) 연결 도메인
"연결 도메인"은 두 개 이상의 도메인을 연결하는 뉴클레오타이드서열로, 연결 도메인은 동일한 또는 서로 다른 두 개 이상의 도메인을 연결한다. 연결 도메인은 두 개 이상의 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 두 개 이상의 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 1 내지 30개의 뉴클레오타이드서열일 수 있다.
일 예로서, 상기 연결 도메인은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열 또는 25 내지 30개의 뉴클레오타이드서열일 수 있다.
다른 일 예로서, 상기 연결 도메인은 1 내지 30개의 뉴클레오타이드서열, 5 내지 30개의 뉴클레오타이드서열, 10 내지 30개의 뉴클레오타이드서열, 15 내지 30개의 뉴클레오타이드서열, 20 내지 30개의 뉴클레오타이드서열 또는 25 내지 30개의 뉴클레오타이드서열일 수 있다.
iv) 제 2 상보적 도메인
"제 2 상보적 도메인"은 전술한 제 1 상보적 도메인과 상보적 핵산서열을 포함하는 뉴클레오타이드서열을 포함하는 도메인으로, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 예를 들어, 제 2 상보적 도메인은 제 1 상보적 도메인에 대해 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드서열일 수 있다.
상기 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 결합을 통해 이중가닥을 형성할 수 있다. 이때, 상기 형성된 이중가닥은 에디터단백질의 일부 아미노산과 상호작용하여 가이드핵산-에디터단백질 복합체를 형성하는 역할을 할 수 있다.
제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 뉴클레오타이드서열 및 제 1 상보적 도메인과의 상보성이 없는 뉴클레오타이드서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 뉴클레오타이드서열을 포함할 수 있으며, 제 1 상보적 도메인보다 뉴클레오타이드서열의 길이가 길 수 있다.
상기 제 2 상보적 도메인은 5 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 제 2 상보적 도메인은 1 내지 35개의 뉴클레오타이드서열, 5 내지 35개의 뉴클레오타이드서열, 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35 뉴클레오타이드서열일 수 있다.
다른 일 예로, 상기 제 2 상보적 도메인은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
v) 근위 도메인(proximal domain)
"근위 도메인"은 제 2 상보적 도메인에 근접하게 위치하는 뉴클레오타이드서열이다.
근위 도메인은 근위 도메인 내의 상보적인 뉴클레오타이드서열을 포함할 수 있으며, 상보적인 뉴클레오타이드서열에 의해 이중가닥을 형성할 수 있다.
상기 근위 도메인은 1 내지 20개의 뉴클레오타이드서열일 수 있다.
일 예로서, 상기 근위 도메인은 1 내지 20개의 뉴클레오타이드서열, 5 내지 20개의 뉴클레오타이드서열, 10 내지 20개의 뉴클레오타이드서열 또는 15 내지 20개의 뉴클레오타이드서열일 수 있다.
다른 일 예로서, 상기 근위 도메인은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 10 내지 15개의 뉴클레오타이드서열 또는 15 내지 20개의 뉴클레오타이드서열일 수 있다.
vi) 꼬리 도메인
"꼬리 도메인"은 가이드핵산의 양 말단 중 어느 하나 이상의 말단에 위치하는 뉴클레오타이드서열이다.
꼬리 도메인은 꼬리 도메인 내의 상보적인 뉴클레오타이드서열을 포함할 수 있으며, 상보적인 뉴클레오타이드서열에 의해 이중가닥을 형성할 수 있다.
상기 꼬리 도메인은 1 내지 50개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 꼬리 도메인은 5 내지 50개의 뉴클레오타이드서열, 10 내지 50개의 뉴클레오타이드서열, 15 내지 50개의 뉴클레오타이드서열, 20 내지 50개의 뉴클레오타이드서열, 25 내지 50개의 뉴클레오타이드서열, 30 내지 50개의 뉴클레오타이드서열, 35 내지 50개의 뉴클레오타이드서열, 40 내지 50개의 뉴클레오타이드서열 또는 45 내지 50개의 뉴클레오타이드서열일 수 있다.
다른 일 예로, 상기 꼬리 도메인은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열, 30 내지 35개의 뉴클레오타이드서열, 35 내지 40개의 뉴클레오타이드서열, 40 내지 45개의 뉴클레오타이드서열 또는 45 내지 50개의 뉴클레오타이드서열일 수 있다.
한편, 상기 도메인들, 즉, 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인이 포함하는 핵산 서열의 일부 또는 전부는 선택적 또는 추가적으로 화학적 변형을 포함할 수 있다.
상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
가이드핵산은 하나 이상의 도메인을 포함한다.
상기 가이드핵산은 가이드 도메인을 포함할 수 있다.
상기 가이드핵산은 제 1 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 연결 도메인을 포함할 수 있다.
상기 가이드핵산은 제 2 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 근위 도메인을 포함할 수 있다.
상기 가이드핵산은 꼬리 도메인을 포함할 수 있다.
*이때, 상기 도메인의 개수는 1, 2, 3, 4, 5, 6 또는 그 이상일 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 가이드 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 1 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 연결 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 2 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 근위 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 꼬리 도메인을 포함할 수 있다.
이때, 상기 가이드핵산은 하나의 도메인이 중복되어 포함될 수 있다.
상기 가이드핵산은 여러 도메인을 중복 또는 중복시키지 않고 포함할 수 있다.
상기 가이드핵산은 같은 종류의 도메인을 포함할 수 있으며, 이때, 같은 종류의 도메인은 동일한 핵산서열을 가지거나 또는 서로 다른 핵산서열을 가질 수 있다.
상기 가이드핵산은 두 종류의 도메인을 포함할 수 있으며, 이때, 다른 두 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 세 종류의 도메인을 포함할 수 있으며, 이때, 다른 세 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 네 종류의 도메인을 포함할 수 있으며, 이때, 다른 네 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 다섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 다섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 여섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 여섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
예를 들면, 가이드핵산은 [가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[연결 도메인]-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]으로 구성될 수 있으며, 이때, 두 개의 가이드 도메인은 서로 다른 또는 동일한 표적을 위한 가이드 서열을 포함할 수 있으며, 상기 두 개의 제 1 상보적 도메인과 두 개의 제 2 상보적 도메인 동일한 핵산서열을 가지거나 다른 핵산서열을 가질 수 있다. 가이드 도메인이 서로 다른 표적을 위한 가이드 서열을 포함하는 경우, 상기 가이드핵산은 두 개의 표적에 특이적으로 결합할 수 있으며, 이때, 특이적 결합을 동시에 일어나거나 순차적으로 일어날 수 있다. 또한, 상기 연결 도메인은 특정 효소에 의해 절단될 수 있으며, 특정 효소의 존재 하에서 상기 가이드핵산은 두 부분 또는 세 부분으로 나누어질 수 있다.
본 명세서에 의해 개시되는 내용의 일 구체예로서, 가이드핵산은 gRNA일 수 있다.
gRNA
“gRNA”는 표적 유전자 또는 핵산에 대한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 특이적으로 표적시킬 수 있는 RNA를 지칭한다. 또한, 상기 gRNA는 표적 유전자 또는 핵산 특이적 RNA를 의미하며, CRISPR 효소과 결합하여 CRISPR 효소를 표적 유전자 또는 핵산으로 인도할 수 있다.
상기 gRNA는 다수의 도메인을 포함할 수 있다. 각각의 도메인에 의해 3차원 행태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.
gRNA는 단일가닥 gRNA(단일 RNA 분자; single gRNA; sgRNA); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.
일 구체예에서, 단일가닥 gRNA는 5'으로부터 3' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 연결 도메인; 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인; 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함할 수 있다.
다른 일 구체예로서, 이중 gRNA는 5'으로부터 3' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인 및 제 1 상보적 도메인을 포함하는 제 1가닥; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인, 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함하는 제 2 가닥을 포함할 수 있다.
이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다. 상기 crRNA는 가이드 도메인과 제 1 상보적 도메인을 포함할 수 있으며, 상기 tracrRNA는 제 2 상보적 도메인, 근위 도메인 및 선택적으로 꼬리 도메인을 포함할 수 있다.
또 다른 일 구체예로서, 단일가닥 gRNA는 3'으로부터 5' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인을 포함할 수 있다.
이때, 상기 제 1 상보적 도메인은 자연유래의 제 1 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 1 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 1 상보적 도메인은 자연에 존재하는 종에 따라 제 1 상보적 도메인의 뉴클레오타이드서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 1 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 1 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)일 수 있고, 또는 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5'-GUUUUAGAGCUA(X)n-3'(SEQ ID NO: 1), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다.
또 다른 예를 들어, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5'-GUUUUAGUCCCUUUUUAAAUUUCUU(X)n-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU(X)n-3'(SEQ ID NO: 3), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다.
다른 일 구체예로서, 상기 제 1 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp. (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp. (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-UUUGUAGAU-3'(SEQ ID NO: 4) 일 수 있고, 또는 5'-UUUGUAGAU-3'(SEQ ID NO: 4)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5'-(X)nUUUGUAGAU-3'(SEQ ID NO: 4), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 1 내지 5의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다.
이때, 상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하는 역할을 하는 뉴클레오타이드서열일 수 있다.
상기 연결 도메인은 제 1 상보적 도메인 및 제 2 상보적 도메인과 각각 공유결합 또는 비공유결합을 할 수 있다.
상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 단일가닥 gRNA 분자에 사용하기에 적합하며, 이중 gRNA의 제 1 가닥 및 제 2 가닥과 공유결합 또는 비공유결합 하거나, 또는 제 1 가닥 및 제 2 가닥을 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA을 생성에 사용될 수 있다.
상기 연결 도메인은 이중 gRNA의 crRNA 및 tracrRNA과 공유결합 또는 비공유결합 하거나, 또는 crRNA 및 tracrRNA를 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA를 생성에 사용될 수 있다.
이때, 상기 제 2 상보적 도메인은 자연유래의 제 2 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 2 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 2 상보적 도메인은 자연에 존재하는 종에 따라 제 2 상보적 도메인의 뉴클레오타이드서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 2 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 2 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5'-(X)n UAGCAAGUUAAAAU(X)m-3'(SEQ ID NO: 5), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 뉴클레오타이드서열의 개수로, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다. 또한 (X)m은 동일한 뉴클레오타이드서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드서열일 수 있다.
또 다른 예를 들어, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5'-(X)n AAGAAAUUUAAAAAGGGACUAAAAU(X)m-3'(SEQ ID NO: 6) 또는 5'-(X)n AAGGGACUAAAAU(X)m-3'(SEQ ID NO: 7), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다. 또한 (X)m은 동일한 뉴클레오타이드서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드서열일 수 있다.
다른 일 구체예로서, 상기 제 2 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp. (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp. (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-AAAUUUCUACU-3'(SEQ ID NO: 8) 일 수 있고, 또는 5'-AAAUUUCUACU-3'(SEQ ID NO: 8)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 뉴클레오타이드서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5'-(X)nAAAUUUCUACU (X)m-3'(SEQ ID NO: 8), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 뉴클레오타이드서열의 개수로, 상기 n은 1 내지 10의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다. 또한 (X)m은 동일한 뉴클레오타이드서열의 정수 m개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 m개의 뉴클레오타이드서열일 수 있다.
이때, 상기 제 1 상보적 도메인과 상기 제 2 상보적 도메인은 상보적 결합을 할 수 있다.
상기 제 1 상보적 도메인과 상기 제 2 상보적 도메인은 상기 상보적 결합을 통해 이중가닥을 형성할 수 있다.
상기 형성된 이중가닥은 CRISPR 효소와 상호작용할 수 있다.
선택적으로, 상기 제 1 상보적 도메인은 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 하지않는 추가 뉴클레오타이드서열을 포함할 수 있다.
이때, 상기 추가 뉴클레오타이드서열은 1 내지 15개의 뉴클레오타이드서열일 수 있다. 예를 들어, 상기 추가 뉴클레오타이드서열은 1 내지 5개의 뉴클레오타이드서열, 5 내지 10개의 뉴클레오타이드서열, 또는 10 내지 15개의 뉴클레오타이드서열일 수 있다.
이때, 상기 근위 도메인은 제 2 상보적 도메인의 3' 방향에 위치하는 도메인일 수 있다.
상기 근위 도메인은 자연유래의 근위 도메인과 상동성을 가지거나, 또는 자연유래의 근위 도메인으로부터 유래될 수 있다. 또한, 상기 근위 도메인은 자연에 존재하는 종에 따라 근위 도메인의 뉴클레오타이드서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 근위 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 근위 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 근위 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 근위 도메인 또는 유래된 근위 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인인 경우, 상기 근위 도메인은 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)일 수 있고, 또는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)n을 포함, 즉, 5'-AAGGCUAGUCCG(X)n-3'(SEQ ID NO: 9), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다.
또 다른 예를 들어, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인인 경우, 상기 근위 도메인은 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)일 수 있고, 또는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)n을 포함, 즉, 5'-AAAGAGUUUGC(X)n-3'(SEQ ID NO: 10), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 1 내지 40의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다.
이때, 상기 꼬리 도메인은 단일가닥 gRNA 또는 이중 gRNA의 제 1 가닥 또는 제 2 가닥의 3' 말단에 선택적으로 추가될 수 있다.
상기 꼬리 도메인은 자연유래의 꼬리 도메인과 상동성을 가지거나, 또는 자연유래의 꼬리 도메인으로부터 유래될 수 있다. 또한, 상기 꼬리 도메인은 자연에 존재하는 종에 따라 꼬리 도메인의 뉴클레오타이드서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 꼬리 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 꼬리 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 꼬리 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스타필로코커스 아우레우스(Staphylococcus aureus) 또는 네이세리아 메닝기티디스(Neisseria meningitidis)의 꼬리 도메인 또는 유래된 꼬리 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)n을 포함, 즉, 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)n-3'(SEQ ID NO: 11), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다.
또 다른 예를 들어, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)와 일부, 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)n을 포함, 즉, 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(X)n-3'(SEQ ID NO: 12), 할 수 있다. 상기 X는 뉴클레오타이드 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 뉴클레오타이드서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 뉴클레오타이드서열의 정수 n개만큼의 반복일 수 있고, 또는 뉴클레오타이드 A, T, U 및 G가 혼합된 정수 n개의 뉴클레오타이드서열일 수 있다.
다른 일 구체예에서, 상기 꼬리 도메인은 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 뉴클레오타이드서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 뉴클레오타이드서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 뉴클레오타이드거나 또는 대안 될 수 있는 뉴클레오타이드를 포함할 수 있다.
gRNA는 상기에 기재된 바와 같이 다수의 도메인을 포함할 수 있어, gRNA가 포함하는 도메인의 종류 및 개수에 따라 핵산 서열의 길이를 조절할 수 있으며, 각각의 도메인에 의해 3차원 형태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.
gRNA는 단일가닥 gRNA(단일 RNA 분자); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.
이중 gRNA
이중 gRNA는 제 1 가닥 및 제 2 가닥으로 구성된다.
이때, 상기 제 1 가닥은
5'-[가이드 도메인]-[제 1 상보적 도메인]-3'으로 구성될 수 있고,
상기 제 2 가닥은
5'-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는
5'-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.
이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다.
이때, 상기 제 1가닥 및 제 2가닥은 선택적으로 추가적인 뉴클레오타이드서열을 포함할 수 있다.
일 구체예로서, 상기 제 1 가닥은
5'-(Ntarget)-(Q)m-3'; 또는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 뉴클레오타이드서열 부위이다.
이때, 상기 (Q)m은 제 1 상보적 도메인을 포함하는 뉴클레오타이드서열로, 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 뉴클레오타이드서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 뉴클레오타이드서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)일 수 있고, 또는 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또 다른 예로, 상기 제 1 상보적 도메인이 스트렙토코커스 써모필러스의 제 1 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO: 13)일 수 있고, 또는 5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO: 13)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또한, 상기 (X)a, (X)b 및 (X)c는 선택적으로 추가할 수 있는 뉴클레오타이드서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b 및 c는 뉴클레오타이드서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
일 구체예로서, 상기 제 2 가닥은
5'-(Z)h-(P)k-3'; 또는
5'-(X)d-(Z)h-(X)e-(P)k-(X)f-3' 일 수 있다.
다른 일 구체예로서, 상기 제 2 가닥은
5'-(Z)h-(P)k-(F)i-3'; 또는
5'-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3' 일 수 있다.
이때, 상기 (Z)h는 제 2 상보적 도메인을 포함하는 뉴클레오타이드서열로, 제 1 가닥의 제 1 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 뉴클레오타이드서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 뉴클레오타이드서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
다른 예로, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또 다른 예로, 상기 제 2 상보적 도메인이 스트렙토코커스 써모필러스의 제 2 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO: 14)일 수 있고, 또는 5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO: 14)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
상기 (P)k는 근위 도메인을 포함하는 뉴클레오타이드서열로, 자연에 존재하는 종의 근위 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 근위 도메인의 뉴클레오타이드서열은 변경될 수 있다. 상기 P는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 k은 뉴클레오타이드서열의 개수로, 1 내지 20의 정수일 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)일 수 있고, 또는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
다른 예로, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)일 수 있고, 또는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또 다른 예로, 상기 근위 도메인이 스트렙토코커스 써모필러스의 근위 도메인 또는 스트렙토코커스 써모필러스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUUAGUCCG-3'(SEQ ID NO: 15)일 수 있고, 또는 5'-AAGGCUUAGUCCG-3'(SEQ ID NO: 15)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
상기 (F)i는 꼬리 도메인을 포함하는 뉴클레오타이드서열로, 자연에 존재하는 종의 꼬리 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 꼬리 도메인의 뉴클레오타이드서열은 변경될 수 있다. 상기 F는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 i은 뉴클레오타이드서열의 개수로, 1 내지 50의 정수일 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
다른 예로, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또 다른 예로, 상기 꼬리 도메인이 스트렙토코커스 써모필러스의 꼬리 도메인 또는 스트렙토코커스 써모필러스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO: 16)일 수 있고, 또는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO: 16)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또한, 상기 (F)i는 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 뉴클레오타이드서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 뉴클레오타이드서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 뉴클레오타이드거나 또는 대안될 수 있는 뉴클레오타이드를 포함할 수 있다.
또한, 상기 (X)d, (X)e 및 (X)f는 선택적으로 추가할 수 있는 뉴클레오타이드서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 d, e 및 f는 뉴클레오타이드서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
단일가닥 gRNA
단일가닥 gRNA는 제 1 단일가닥 gRNA 및 제 2 단일가닥 gRNA로 나뉠 수 있다.
제 1 단일가닥 gRNA
제 1 단일가닥 gRNA는 상기 이중 gRNA의 제 1 가닥과 제 2 가닥을 연결 도메인으로 연결한 단일가닥 gRNA이다.
구체적으로, 상기 단일가닥 gRNA는
5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-3',
5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는
5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.
상기 제 1 단일가닥 gRNA는 선택적으로 추가적인 뉴클레오타이드서열을 포함할 수 있다.
일 구체예로서, 상기 제 1 단일가닥 gRNA는
5'-(Ntarget)-(Q)m-(L)j-(Z)h-3';
5'-(Ntarget)-(Q)m-(L)j-(Z)h-(P)k-3'; 또는
5'-(Ntarget)-(Q)m-(L)j-(Z)h-(P)k-(F)i-3'일 수 있다.
다른 일 구체예로서, 상기 단일가닥 gRNA는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-3';
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-3'; 또는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 뉴클레오타이드서열 부위이다.
상기 (Q)m은 제 1 상보적 도메인을 포함하는 뉴클레오타이드서열로, 제 2 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 뉴클레오타이드서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 뉴클레오타이드서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)일 수 있고, 또는 5'-GUUUUAGAGCUA-3'(SEQ ID NO: 1)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3) 일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'(SEQ ID NO: 2) 또는 5'-GUUUUAGUCCCUU-3'(SEQ ID NO: 3)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또 다른 예로, 상기 제 1 상보적 도메인이 스트렙토코커스 써모필러스의 제 1 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO: 13)일 수 있고, 또는 5'-GUUUUAGAGCUGUGUUGUUUCG-3'(SEQ ID NO: 13)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또한, 상기 (L)j는 연결 도메인을 포함하는 뉴클레오타이드서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 뉴클레오타이드서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 뉴클레오타이드서열의 개수로, 1 내지 30의 정수일 수 있다.
상기 (Z)h는 제 2 상보적 도메인을 포함하는 뉴클레오타이드서열로, 제 1 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 뉴클레오타이드서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 뉴클레오타이드서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'(SEQ ID NO: 5)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
다른 예로, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'(SEQ ID NO: 6) 또는 5'-AAGGGACUAAAAU-3'(SEQ ID NO: 7)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또 다른 예로, 상기 제 2 상보적 도메인이 스트렙토코커스 써모필러스의 제 2 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO: 14)일 수 있고, 또는 5'-CGAAACAACACAGCGAGUUAAAAU-3'(SEQ ID NO: 14)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
상기 (P)k는 근위 도메인을 포함하는 뉴클레오타이드서열로, 자연에 존재하는 종의 근위 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 근위 도메인의 뉴클레오타이드서열은 변경될 수 있다. 상기 P는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 k은 뉴클레오타이드서열의 개수로, 1 내지 20의 정수일 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)일 수 있고, 또는 5'-AAGGCUAGUCCG-3'(SEQ ID NO: 9)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
다른 예로, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)일 수 있고, 또는 5'-AAAGAGUUUGC-3'(SEQ ID NO: 10)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또 다른 예로, 상기 근위 도메인이 스트렙토코커스 써모필러스의 근위 도메인 또는 스트렙토코커스 써모필러스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUUAGUCCG-3'(SEQ ID NO: 15)일 수 있고, 또는 5'-AAGGCUUAGUCCG-3'(SEQ ID NO: 15)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
상기 (F)i는 꼬리 도메인을 포함하는 뉴클레오타이드서열로, 자연에 존재하는 종의 꼬리 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 꼬리 도메인의 뉴클레오타이드서열은 변경될 수 있다. 상기 F는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 i은 뉴클레오타이드서열의 개수로, 1 내지 50의 정수일 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'(SEQ ID NO: 11)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
다른 예로, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'(SEQ ID NO: 12)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또 다른 예로, 상기 꼬리 도메인이 스트렙토코커스 써모필러스의 꼬리 도메인 또는 스트렙토코커스 써모필러스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO: 16)일 수 있고, 또는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'(SEQ ID NO: 16)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또한, 상기 (F)i는 시험관내 또는 생체내 전사 방법과 관련된 3' 말단에 1 내지 10개의 뉴클레오타이드서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 뉴클레오타이드서열일 수 있다. 또한, U6 프로모터가 생체내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 뉴클레오타이드거나 또는 대안될 수 있는 뉴클레오타이드를 포함할 수 있다.
또한, 상기 (X)a, (X)b, (X)c, (X)d, (X)e 및 (X)f는 선택적으로 추가할 수 있는 뉴클레오타이드서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b, c, d, e 및 f는 뉴클레오타이드서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
제 2 단일가닥 gRNA
제 2 단일가닥 gRNA는 가이드 도메인, 제 1 상보적 도메인 및 제 2 상보적 도메인으로 구성되는 단일가닥 gRNA일 수 있다.
이때, 상기 제 2 단일가닥 gRNA는
5'-[제 2 상보적 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'; 또는
5'-[제 2 상보적 도메인]-[연결 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'으로 구성될 수 있다.
상기 제 2 단일가닥 gRNA는 선택적으로 추가적인 뉴클레오타이드서열을 포함할 수 있다.
일 구체예로서, 상기 제 2 단일가닥 gRNA는
5'-(Z)h-(Q)m-(Ntarget)-3'; 또는
5'-(X)a-(Z)h-(X)b-(Q)m-(X)c-(Ntarget)-3'일 수 있다.
다른 일 구체예로서, 상기 단일가닥 gRNA는
5'-(Z)h-(L)j-(Q)m-(Ntarget)-3'; 또는
5'-(X)a-(Z)h-(L)j-(Q)m-(X)c-(Ntarget)-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 뉴클레오타이드서열 부위이다.
상기 (Q)m은 제 1 상보적 도메인을 포함하는 뉴클레오타이드서열로, 제 2 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 뉴클레오타이드서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 뉴클레오타이드서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-UUUGUAGAU-3'(SEQ ID NO: 4)일 수 있고, 또는 5'-UUUGUAGAU-3'(SEQ ID NO: 4)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
상기 (Z)h는 제 2 상보적 도메인을 포함하는 뉴클레오타이드서열로, 제 1 상보적 도메인과 상보적 결합을 할 수 있는 뉴클레오타이드서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 뉴클레오타이드서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 뉴클레오타이드서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAAUUUCUACU-3'(SEQ ID NO: 8)일 수 있고, 또는 5'-AAAUUUCUACU-3'(SEQ ID NO: 8)와 적어도 50% 이상의 상동성을 가지는 뉴클레오타이드서열일 수 있다.
또한, 상기 (L)j는 연결 도메인을 포함하는 뉴클레오타이드서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하는 뉴클레오타이드서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 뉴클레오타이드서열의 개수로, 1 내지 30의 정수일 수 있다.
또한, 상기 (X)a, (X)b 및 (X)c는 선택적으로 추가할 수 있는 뉴클레오타이드서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b 및 c는 뉴클레오타이드서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
본 명세서에 의해 개시되는 내용의 일 태양으로서, 가이드핵산은 혈액 응고 저해 유전자의 표적 서열에 상보적으로 결합할 수 있는 gRNA일 수 있다.
“혈액 응고 저해 유전자(Blood coagulation inhibitory gene)”는 혈액 응고 또는 혈액 응고의 형성을 저해하거나 혈액 응고 시스템을 불활성화시키데 직접적으로 참여하거나 또는 간접적으로 영향을 미치는 모든 유전자를 의미한다. 이때, 상기 혈액 응고 저해 유전자는 혈액 응고 저해 유전자 자체 또는 혈액 응고 저해 유전자에 의해 발현되는 단백질로 인해 혈액 응고 시스템에 관여하는 다양한 유전자 또는 다양한 단백질의 활성을 저해하거나 억제하는 기능 및 직접적으로 혈액 응고를 저해하는 기능을 수행할 수 있다. 상기 “혈액 응고 시스템(Blood coagulation system)”은 생체 내에서 발생하는 혈액이 응고되는 전반적인 과정을 의미하며, 이때, 상기 혈액 응고 시스템은 정상적인 혈액 응고 시스템 및 혈액 응고가 지연되는 비정상적인 혈액 응고 시스템을 모두 포함한다. 상기 혈액 응고 저해 유전자에 의해 발현되는 단백질은 “혈액 응고 저해 인자(Blood coagulation inhibitory factor)” 또는 “항응고 인자(Anticoagulant factor)”라는 용어와 혼용하여 사용할 수 있다.
상기 혈액 응고 저해 유전자는 혈액 응고를 저해하거나 억제할 수 있다.
상기 혈액 응고 저해 유전자는 혈액 응고에 관여하는 단백질(Blood coagulation associated protein)의 발현을 저해하거나 억제할 수 있다.
상기 혈액 응고 저해 유전자는 혈액 응고에 관여하는 단백질의 활성을 저해하거나 억제할 수 있다.
이때, 상기 혈액 응고에 관여하는 단백질은 XII 인자(factor XII), XIIa 인자(factor XIIa), XI 인자(factor XI), XIa 인자(factor XIa), IX 인자(factor IX), IXa 인자(factor IXa), X 인자(factor X), Xa 인자(factor Xa), VIII 인자(factor VIII), VIIIa 인자(factor VIIIa), VII 인자(factor VII), VIIa 인자(factor VIIa), V 인자(factor V), Va 인자(factor Va), 프로트롬빈(prothrombin), 트롬빈(thrombin), XIII 인자(factor XIII), XIIIa 인자(factor XIIIa), 피브리노겐(fibrinogen), 피브린(fibrin) 또는 Tissue factor일 수 있다.
상기 혈액 응고 저해 유전자는 항트롬빈(antithrombin; AT) 유전자일 수 있다.
AT 유전자는 혈액 응고 시스템의 여러 효소를 불활성시킬 수 있는 432개의 아미노산 서열로 구성된 단백질을 암호화하는 유전자를 의미하며, SERPINC1 유전자로도 칭해진다. 일 예에서, AT 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 AT (e.g., NCBI Accession No. NP_000479 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_000488 등으로 표현되는 AT 유전자.
상기 혈액 응고 저해 유전자는 조직 인자 경로 억제제(tissue factor pathway inhibitor; TFPI) 유전자일 수 있다.
TFPI 유전자는 가역적으로 Xa 인자를 억제할 수 있는 단백질을 암호화하는 (전장 DNA, cDNA 또는 mRNA)를 의미하고, 인간의 경우, 염색체 2q31-q32.1에 위치하며, 9개의 엑손을 가진다. 일 예에서, TFPI 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 TFPI (e.g., NCBI Accession No. NP_001027452, NP_001305870, NP_001316168, NP_001316169, NP_001316170 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001032281, NM_006287, NM_001318941, NM_001329239, NM_001329240 등으로 표현되는 TFPI 유전자.
상기 혈액 응고 저해 유전자는 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등을 포함하는 포유류로부터 유래하는 것일 수 있다.
유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다.
본 명세서에 의해 개시되는 내용의 일 구현예에서, 가이드핵산은 AT 유전자 및/또는 TFPI 유전자의 표적 서열을 표적화하는 gRNA일 수 있다.
“표적 서열”은 표적 유전자 또는 핵산 내에 존재하는 뉴클레오타이드 서열로, 구체적으로는 표적 유전자 또는 핵산 내에 표적 영역의 일부 뉴클레오타이드 서열이며, 이때 “표적 영역”은 표적 유전자 또는 핵산 내에 가이드핵산-에디터단백질에 의해 변형될 수 있는 부위이다.
이하에서, 표적 서열이라 함은 두 가지의 뉴클레오타이드서열 정보 모두를 의미하는 용어로 사용될 수 있다. 예를 들어, 표적 유전자의 경우, 표적 서열은 표적 유전자 DNA의 transcribed strand의 서열 정보를 의미하는 것일 수도 있고, 또는 non-transcribed strand의 뉴클레오타이드서열 정보를 의미하는 것일 수도 있다.
예를 들어, 표적 서열은 표적 유전자 A의 표적 영역 중 일부 뉴클레오타이드서열(transcribed strand)인 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)을 의미할 수도 있으며, 이에 상보적인 뉴클레오타이드 서열(non-transcribed strand)인 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)을 의미할 수도 있다.
표적 서열은 5 내지 50개의 뉴클레오타이드서열일 수 있다.
일 구체예로서 상기 표적 서열은 16개의 뉴클레오타이드서열, 17개의 뉴클레오타이드서열, 18개의 뉴클레오타이드서열, 19개의 뉴클레오타이드서열, 20개의 뉴클레오타이드서열, 21개의 뉴클레오타이드서열, 22개의 뉴클레오타이드서열, 23개의 뉴클레오타이드서열, 24개의 뉴클레오타이드서열 또는 25개의 뉴클레오타이드서열일 수 있다.
표적 서열은 가이드핵산 결합 서열 혹은 가이드핵산 비결합 서열을 포함한다.
“가이드핵산 결합 서열(guide nucleic acid-binding sequence)”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 일부 또는 완전한 상보성을 가지는 뉴클레오타이드서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 있다. 표적 서열 및 가이드핵산 결합 서열은 표적 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 교정하고자 하는 대상에 따라 달라질 수 있는 뉴클레오타이드서열로, 표적 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.
“가이드핵산 비결합 서열(guide nucleic acid-non-binding sequence)”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 일부 또는 완전한 상동성을 가지는 뉴클레오타이드서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 없다. 또한, 가이드핵산 비결합 서열은 가이드핵산 결합 서열과 상보성을 가지는 뉴클레오타이드서열로, 가이드핵산 결합 서열과 상보적인 결합을 할 수 있다.
가이드핵산 결합 서열은 표적 서열 중 일부 뉴클레오타이드서열로, 표적 서열의 두 가지 서로 다른 서열순서를 가지는 뉴클레오타이드서열, 즉, 서로 상보적인 결합을 할 수 있는 두 가지의 뉴클레오타이드서열 중 한 가지 뉴클레오타이드서열일 수 있다. 이때, 가이드핵산 비결합 서열은 표적 서열 중 가이드핵산 결합 서열을 제외한 나머지 뉴클레오타이드서열일 수 있다.
예를 들면, 표적 유전자 A의 표적 영역 중 일부 뉴클레오타이드서열인 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)과 이에 상보적인 뉴클레오타이드서열인 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)을 표적 서열로 할 때, 가이드핵산 결합 서열은 두 개의 표적 서열 중 하나, 즉, 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17) 또는 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)일 수 있다. 이때, 가이드핵산 비결합 서열은, 가이드핵산 결합 서열이 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)인 경우, 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)일 수 있고, 또는 가이드핵산 결합 서열이 5'-CGAACTAGTCTGCCAATGAT-3'(SEQ ID NO: 18)인 경우 가이드핵산 비결합 서열은 5'-ATCATTGGCAGACTAGTTCG-3'(SEQ ID NO: 17)일 수 있다.
가이드핵산 결합 서열은 표적 서열, 즉, transcribed strand와 동일한 뉴클레오타이드서열 및 non-transcribed strand와 동일한 뉴클레오타이드서열 중 선택된 하나의 뉴클레오타이드서열일 수 있다. 이때, 가이드핵산 비결합 서열은 표적 서열 중 가이드핵산 결합 서열, 즉, transcribed strand와 동일한 뉴클레오타이드서열 및 non-transcribed strand와 동일한 뉴클레오타이드서열 중 선택된 하나의 뉴클레오타이드서열을 제외한 나머지 뉴클레오타이드서열일 수 있다.
가이드핵산 결합 서열은 표적 서열의 길이와 동일할 수 있다.
가이드핵산 비결합 서열은 표적 서열 또는 가이드핵산 결합 서열의 길이와 동일할 수 있다.
가이드핵산 결합 서열은 5 내지 50개의 뉴클레오타이드서열일 수 있다.
일 구체예로서 상기 가이드핵산 결합 서열은 16개의 뉴클레오타이드서열, 17개의 뉴클레오타이드서열, 18개의 뉴클레오타이드서열, 19개의 뉴클레오타이드서열, 20개의 뉴클레오타이드서열, 21개의 뉴클레오타이드서열, 22개의 뉴클레오타이드서열, 23개의 뉴클레오타이드서열, 24개의 뉴클레오타이드서열 또는 25개의 뉴클레오타이드서열일 수 있다.
가이드핵산 비결합 서열은 5 내지 50개의 뉴클레오타이드서열일 수 있다.
일 구체예로서 상기 가이드핵산 비결합 서열은 16개의 뉴클레오타이드서열, 17개의 뉴클레오타이드서열, 18개의 뉴클레오타이드서열, 19개의 뉴클레오타이드서열, 20개의 뉴클레오타이드서열, 21개의 뉴클레오타이드서열, 22개의 뉴클레오타이드서열, 23개의 뉴클레오타이드서열, 24개의 뉴클레오타이드서열 또는 25개의 뉴클레오타이드서열일 수 있다.
가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열과 일부 또는 완전한상보적인 결합을 할 수 있으며, 상기 가이드핵산 결합 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.
상기 가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적인 뉴클레오타이드서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드서열일 수 있다.
일 예로, 상기 가이드핵산 결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적이지 않은 1 내지 8개의 뉴클레오타이드서열을 가지거나 또는 포함할 수 있다.
가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열과 일부 또는 완전한 상동성을 가질 수 있으며, 상기 가이드핵산 비결합 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.
상기 가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상동성을 가진 뉴클레오타이드서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성이거나 또는 완전하게 상동성인 뉴클레오타이드서열일 수 있다.
일 예로, 상기 가이드핵산 비결합 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상동적이 않은 1 내지 8개의 뉴클레오타이드서열을 가지거나 포함할 수 있다.
가이드핵산 비결합 서열은 가이드핵산 결합 서열과 상보적 결합을 할 수 있으며, 상기 가이드핵산 비결합 서열은 가이드핵산 결합 서열의 길이와 동일할 수 있다.
상기 가이드핵산 비결합 서열은 가이드핵산 결합서열에 상보적인 뉴클레오타이드서열일 수 있으며, 예를 들어 최소한 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드서열일 수 있다.
일 예로, 상기 가이드핵산 비결합 서열은 가이드핵산 결합 서열에 상보적이지 않은 1 내지 2개의 뉴클레오타이드서열을 가지거나 포함할 수 있다.
또한, 상기 가이드핵산 결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드서열에 근접한 위치에 위치한 뉴클레오타이드서열일 수 있다.
일 예로, 상기 가이드핵산 결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 뉴클레오타이드서열일 수 있다.
또한, 상기 가이드핵산 비결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드서열에 근접한 위치에 뉴클레오타이드서열일 수 있다.
일 예로, 상기 가이드핵산 비결합 서열은 에디터단백질이 인식할 수 있는 뉴클레오타이드서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 뉴클레오타이드서열일 수 있다.
“표적화(targeting)”는 표적 유전자 또는 핵산 내에 존재하는 표적 서열 중 가이드핵산 결합 서열과 상보적 결합을 하는 것을 의미한다. 이때, 상기 상보적 결합은 100%의 완전한 상보적 결합일 수 있고, 또는 70% 이상 100% 미만의 불완전한 상보적 결합일 수 있다. 따라서, “표적화하는 gRNA”는 표적 유전자 또는 핵산 내에 존재하는 표적 서열 중 가이드핵산 결합 서열과 상보적 결합을 하는 gRNA를 의미한다.
본 명세서에 의해 개시되는 표적 유전자는 혈액 응고 저해 유전자일 수 있다.
본 명세서에 의해 개시되는 표적 유전자는 AT 유전자 및/또는 TFPI 유전자일 수 있다.
구현예에서,
본 명세서에 의해 개시되는 표적 서열은 혈액 응고 저해 유전자의 프로모터 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 표적 서열은 AT 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 TFPI 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 혈액 응고 저해 유전자의 인트론 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 표적 서열은 AT 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 TFPI 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 혈액 응고 저해 유전자의 엑손 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 표적 서열은 AT 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 TFPI 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 혈액 응고 저해 유전자의 인핸서 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 표적 서열은 AT 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 TFPI 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 혈액 응고 저해 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 표적 서열은 AT 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 TFPI 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 혈액 응고 저해 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 표적 서열은 AT 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 TFPI 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 혈액 응고 저해 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 표적 서열은 AT 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 TFPI 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 혈액 응고 저해 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 표적 서열은 AT 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 예로, 상기 표적 서열은 TFPI 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 서열은 혈액 응고 저해 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열일 수 있다.
“PAM(proto-spacer-adjacent Motif) 서열”은 에디터단백질이 인식할 수 있는 뉴클레오타이드서열이다. 이때, PAM 서열은 에디터단백질의 종류 및 유래된 종에 따라 뉴클레오타이드서열에 차이가 있을 수 있다.
이때, 상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).
NGG(N은 A, T, C 또는 G임);
NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);
NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및
TTN(N은 A, T, C 또는 G임).
이때, 상기 표적 서열은 10 내지 35개의 뉴클레오타이드서열, 15 내지 35개의 뉴클레오타이드서열, 20 내지 35개의 뉴클레오타이드서열, 25 내지 35개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
또는 상기 표적 서열은 10 내지 15개의 뉴클레오타이드서열, 15 내지 20개의 뉴클레오타이드서열, 20 내지 25개의 뉴클레오타이드서열, 25 내지 30개의 뉴클레오타이드서열 또는 30 내지 35개의 뉴클레오타이드서열일 수 있다.
일 예로, 상기 표적 서열은 AT 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AT 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AT 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AT 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AT 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AT 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AT 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 AT 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
다른 예로, 상기 표적 서열은 TFPI 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 TFPI 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 TFPI 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 TFPI 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 TFPI 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 TFPI 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 TFPI 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 표적 서열은 TFPI 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드서열일 수 있다.
이하, 본 발명의 일 구체예에서 사용할 수 있는 표적 서열들의 일 예들은 표 1 및 표 2에 정리하였으며, 표 1 및 표 2에 기재된 표적 서열은 가이드핵산 비결합 서열로, 기재한 서열을 통해 상보적인 서열, 즉, 가이드핵산 결합 서열은 예측될 수 있다. 또한, 표 1 및 표 2에 기재된 표적 이름(target name)은 에디터단백질에 따라 SpCas9의 경우 Sp를 기재하였고, SaCas9의 경우 Sa를 기재하였으며, 또한 CjCas9의 경우 Cj를 기재하여 구분하였다.
SERPINC1 유전자(AT 유전자)의 표적 서열(Target sequences of SERPINC1 gene(AT gene))
Target name Loci. Target(w/o PAM) GC Contents (%) SEQ ID NO
hSerpinc1-Sp-1 Exon 01(E01) TCCTATCACATTGGAATACA 35 SEQ ID NO: 19
hSerpinc1-Sp-2 E01 GGTTACAGTTCCTATCACAT 40 SEQ ID NO: 20
hSerpinc1-Sp-3 E01 GCCATGTATTCCAATGTGAT 40 SEQ ID NO: 21
hSerpinc1-Sp-4 E01 GTGATAGGAACTGTAACCTC 45 SEQ ID NO: 22
hSerpinc1-Sp-5 E01 CCCCTCTTACCTTTTTCCAG 50 SEQ ID NO: 23
hSerpinc1-Sp-6 E01 GAACTGTAACCTCTGGAAAA 40 SEQ ID NO: 24
hSerpinc1-Sp-7 E02 CCAGAAGCCAATGAGCAGCA 55 SEQ ID NO: 25
hSerpinc1-Sp-8 E02 CTTTTGTCCTTGCTGCTCAT 45 SEQ ID NO: 26
hSerpinc1-Sp-9 E02 CCTTGCTGCTCATTGGCTTC 55 SEQ ID NO: 27
hSerpinc1-Sp-10 E02 CTTGCTGCTCATTGGCTTCT 50 SEQ ID NO: 28
hSerpinc1-Sp-11 E02 TGGGACTGCGTGACCTGTCA 60 SEQ ID NO: 29
hSerpinc1-Sp-12 E02 GGGACTGCGTGACCTGTCAC 65 SEQ ID NO: 30
hSerpinc1-Sp-13 E02 GTCCACAGGGCTCCCGTGAC 70 SEQ ID NO: 31
hSerpinc1-Sp-14 E02 GACCTGTCACGGGAGCCCTG 70 SEQ ID NO: 32
hSerpinc1-Sp-15 E02 TGGCTGTGCAGATGTCCACA 55 SEQ ID NO: 33
hSerpinc1-Sp-16 E02 TTGGCTGTGCAGATGTCCAC 55 SEQ ID NO: 34
hSerpinc1-Sp-17 E02 ACATCTGCACAGCCAAGCCG 60 SEQ ID NO: 35
hSerpinc1-Sp-18 E02 CATCTGCACAGCCAAGCCGC 65 SEQ ID NO: 36
hSerpinc1-Sp-19 E02 CATGGGAATGTCCCGCGGCT 65 SEQ ID NO: 37
hSerpinc1-Sp-20 E02 GGATTCATGGGAATGTCCCG 55 SEQ ID NO: 38
hSerpinc1-Sp-21 E02 TAAATGCACATGGGATTCAT 35 SEQ ID NO: 39
hSerpinc1-Sp-22 E02 GTAAATGCACATGGGATTCA 40 SEQ ID NO: 40
hSerpinc1-Sp-23 E02 GGGGAGCGGTAAATGCACAT 55 SEQ ID NO: 41
hSerpinc1-Sp-24 E02 CGGGGAGCGGTAAATGCACA 60 SEQ ID NO: 42
hSerpinc1-Sp-25 E02 CATGTGCATTTACCGCTCCC 55 SEQ ID NO: 43
hSerpinc1-Sp-26 E02 TTGCCTTCTTCTCCGGGGAG 60 SEQ ID NO: 44
hSerpinc1-Sp-27 E02 CTCAGTTGCCTTCTTCTCCG 55 SEQ ID NO: 45
hSerpinc1-Sp-28 E02 CCTCAGTTGCCTTCTTCTCC 55 SEQ ID NO: 46
hSerpinc1-Sp-29 E02 TCCTCAGTTGCCTTCTTCTC 50 SEQ ID NO: 47
hSerpinc1-Sp-30 E02 TTACCGCTCCCCGGAGAAGA 60 SEQ ID NO: 48
hSerpinc1-Sp-31 E02 CCCGGAGAAGAAGGCAACTG 60 SEQ ID NO: 49
hSerpinc1-Sp-32 E02 GAAGAAGGCAACTGAGGATG 50 SEQ ID NO: 50
hSerpinc1-Sp-33 E02 AAGAAGGCAACTGAGGATGA 45 SEQ ID NO: 51
hSerpinc1-Sp-34 E02 GGGCTCAGAACAGAAGATCC 55 SEQ ID NO: 52
hSerpinc1-Sp-35 E02 CTCAGAACAGAAGATCCCGG 55 SEQ ID NO: 53
hSerpinc1-Sp-36 E02 CACGCCGGTTGGTGGCCTCC 75 SEQ ID NO: 54
hSerpinc1-Sp-37 E02 ACACGCCGGTTGGTGGCCTC 70 SEQ ID NO: 55
hSerpinc1-Sp-38 E02 AGATCCCGGAGGCCACCAAC 65 SEQ ID NO: 56
hSerpinc1-Sp-39 E02 TTCCCAGACACGCCGGTTGG 65 SEQ ID NO: 57
hSerpinc1-Sp-40 E02 CAGTTCCCAGACACGCCGGT 65 SEQ ID NO: 58
hSerpinc1-Sp-41 E02 TGGACAGTTCCCAGACACGC 60 SEQ ID NO: 59
hSerpinc1-Sp-42 E02 AGGCCACCAACCGGCGTGTC 70 SEQ ID NO: 60
hSerpinc1-Sp-43 E02 GGCCACCAACCGGCGTGTCT 70 SEQ ID NO: 61
hSerpinc1-Sp-44 E02 GCGTGTCTGGGAACTGTCCA 60 SEQ ID NO: 62
hSerpinc1-Sp-45 E02 AGCAAAGCGGGAATTGGCCT 55 SEQ ID NO: 63
hSerpinc1-Sp-46 E02 AGTGGTAGCAAAGCGGGAAT 50 SEQ ID NO: 64
hSerpinc1-Sp-47 E02 ATAGAAAGTGGTAGCAAAGC 40 SEQ ID NO: 65
hSerpinc1-Sp-48 E02 GATAGAAAGTGGTAGCAAAG 40 SEQ ID NO: 66
hSerpinc1-Sp-49 E02 TGCCAGGTGCTGATAGAAAG 50 SEQ ID NO: 67
hSerpinc1-Sp-50 E02 TACCACTTTCTATCAGCACC 45 SEQ ID NO: 68
hSerpinc1-Sp-51 E02 TGTCATTCTTGGAATCTGCC 45 SEQ ID NO: 69
hSerpinc1-Sp-52 E02 AATGTTATCATTGTCATTCT 25 SEQ ID NO: 70
hSerpinc1-Sp-53 E02 TGGAGATACTCAGGGGTGAC 55 SEQ ID NO: 71
hSerpinc1-Sp-54 E02 AAAGCCGTGGAGATACTCAG 50 SEQ ID NO: 72
hSerpinc1-Sp-55 E02 AAAAGCCGTGGAGATACTCA 45 SEQ ID NO: 73
hSerpinc1-Sp-56 E02 CAAAAGCCGTGGAGATACTC 50 SEQ ID NO: 74
hSerpinc1-Sp-57 E02 GTCACCCCTGAGTATCTCCA 55 SEQ ID NO: 75
hSerpinc1-Sp-58 E02 CTTGGTCATAGCAAAAGCCG 50 SEQ ID NO: 76
hSerpinc1-Sp-59 E02 GGCTTTTGCTATGACCAAGC 50 SEQ ID NO: 77
hSerpinc1-Sp-60 E02 GCTTTTGCTATGACCAAGCT 45 SEQ ID NO: 78
hSerpinc1-Sp-61 E02 GTCATTACAGGCACCCAGCT 55 SEQ ID NO: 79
hSerpinc1-Sp-62 E02 TTGCTGGAGGGTGTCATTAC 50 SEQ ID NO: 80
hSerpinc1-Sp-63 E02 TACCTCCATCAGTTGCTGGA 50 SEQ ID NO: 81
hSerpinc1-Sp-64 E02 GTACCTCCATCAGTTGCTGG 55 SEQ ID NO: 82
hSerpinc1-Sp-65 E02 GTCGTACCTCCATCAGTTGC 55 SEQ ID NO: 83
hSerpinc1-Sp-66 E02 TGACACCCTCCAGCAACTGA 55 SEQ ID NO: 84
hSerpinc1-Sp-67 E02 CACCCTCCAGCAACTGATGG 60 SEQ ID NO: 85
hSerpinc1-Sp-68 E03 ATCAGATGTTTTCTCAGATA 30 SEQ ID NO: 86
hSerpinc1-Sp-69 E03 TCAGTTTGGCAAAGAAGAAG 40 SEQ ID NO: 87
hSerpinc1-Sp-70 E03 ATAGAGTCGGCAGTTCAGTT 45 SEQ ID NO: 88
hSerpinc1-Sp-71 E03 TGTTGGCTTTTCGATAGAGT 40 SEQ ID NO: 89
hSerpinc1-Sp-72 E03 TACTAACTTGGAGGATTTGT 35 SEQ ID NO: 90
hSerpinc1-Sp-73 E03 ATTGGCTGATACTAACTTGG 40 SEQ ID NO: 91
hSerpinc1-Sp-74 E03 GCGATTGGCTGATACTAACT 45 SEQ ID NO: 92
hSerpinc1-Sp-75 E03 TTTGTCTCCAAAAAGGCGAT 40 SEQ ID NO: 93
hSerpinc1-Sp-76 E03 GTATCAGCCAATCGCCTTTT 45 SEQ ID NO: 94
hSerpinc1-Sp-77 E03 TAAGGGATTTGTCTCCAAAA 35 SEQ ID NO: 95
hSerpinc1-Sp-78 E03 GTAGGTCTCATTGAAGGTAA 40 SEQ ID NO: 96
hSerpinc1-Sp-79 E03 GGTAGGTCTCATTGAAGGTA 45 SEQ ID NO: 97
hSerpinc1-Sp-80 E03 GTCCTGGTAGGTCTCATTGA 50 SEQ ID NO: 98
hSerpinc1-Sp-81 E03 TACCTTCAATGAGACCTACC 45 SEQ ID NO: 99
hSerpinc1-Sp-82 E03 CAACTCACTGATGTCCTGGT 50 SEQ ID NO: 100
hSerpinc1-Sp-83 E03 ATACCAACTCACTGATGTCC 45 SEQ ID NO: 101
hSerpinc1-Sp-84 E03 CTACCAGGACATCAGTGAGT 50 SEQ ID NO: 102
hSerpinc1-Sp-85 E03 GACATCAGTGAGTTGGTATA 40 SEQ ID NO: 103
hSerpinc1-Sp-86 E03 GAAGTCCAGGGGCTGGAGCT 65 SEQ ID NO: 104
hSerpinc1-Sp-87 E03 TGGAGCCAAGCTCCAGCCCC 70 SEQ ID NO: 105
hSerpinc1-Sp-88 E03 TCACCTTGAAGTCCAGGGGC 60 SEQ ID NO: 106
hSerpinc1-Sp-89 E03 CAACTCACCTTGAAGTCCAG 50 SEQ ID NO: 107
hSerpinc1-Sp-90 E03 GCAACTCACCTTGAAGTCCA 50 SEQ ID NO: 108
hSerpinc1-Sp-91 E03 TGCAACTCACCTTGAAGTCC 50 SEQ ID NO: 109
hSerpinc1-Sp-92 E03 GCTCCAGCCCCTGGACTTCA 65 SEQ ID NO: 110
hSerpinc1-Sp-93 E04 GATTGCTCTGCATTTTCCTG 45 SEQ ID NO: 111
hSerpinc1-Sp-94 E04 AAATGCAGAGCAATCCAGAG 45 SEQ ID NO: 112
hSerpinc1-Sp-95 E04 CCATTTGTTGATGGCCGCTC 55 SEQ ID NO: 113
hSerpinc1-Sp-96 E04 ATTGGACACCCATTTGTTGA 40 SEQ ID NO: 114
hSerpinc1-Sp-97 E04 CCAGAGCGGCCATCAACAAA 55 SEQ ID NO: 115
hSerpinc1-Sp-98 E04 CAGAGCGGCCATCAACAAAT 50 SEQ ID NO: 116
hSerpinc1-Sp-99 E04 GATTCGGCCTTCGGTCTTAT 50 SEQ ID NO: 117
hSerpinc1-Sp-100 E04 TGGGTGTCCAATAAGACCGA 50 SEQ ID NO: 118
hSerpinc1-Sp-101 E04 GACATCGGTGATTCGGCCTT 55 SEQ ID NO: 119
hSerpinc1-Sp-102 E04 AGGGAATGACATCGGTGATT 45 SEQ ID NO: 120
hSerpinc1-Sp-103 E04 GGCTTCCGAGGGAATGACAT 55 SEQ ID NO: 121
hSerpinc1-Sp-104 E04 AATCACCGATGTCATTCCCT 45 SEQ ID NO: 122
hSerpinc1-Sp-105 E04 AGCTCATTGATGGCTTCCGA 50 SEQ ID NO: 123
hSerpinc1-Sp-106 E04 GAGCTCATTGATGGCTTCCG 55 SEQ ID NO: 124
hSerpinc1-Sp-107 E04 CAGAACAGTGAGCTCATTGA 45 SEQ ID NO: 125
hSerpinc1-Sp-108 E04 CATCAATGAGCTCACTGTTC 45 SEQ ID NO: 126
hSerpinc1-Sp-109 E04 TGAGCTCACTGTTCTGGTGC 55 SEQ ID NO: 127
hSerpinc1-Sp-110 E04 TCTGAGTACCTTGAAGTAAA 35 SEQ ID NO: 128
hSerpinc1-Sp-111 E04 GGTTAACACCATTTACTTCA 35 SEQ ID NO: 129
hSerpinc1-Sp-112 E05 ACTTTGACTTCCACAGGCCC 55 SEQ ID NO: 130
hSerpinc1-Sp-113 E05 TGATTCTCTTCCAGGGCCTG 55 SEQ ID NO: 131
hSerpinc1-Sp-114 E05 GGCTGAACTTTGACTTCCAC 50 SEQ ID NO: 132
hSerpinc1-Sp-115 E05 GTTCCTTCCTTGTGTTCTCA 45 SEQ ID NO: 133
hSerpinc1-Sp-116 E05 AGTTCCTTCCTTGTGTTCTC 45 SEQ ID NO: 134
hSerpinc1-Sp-117 E05 AGTTCAGCCCTGAGAACACA 50 SEQ ID NO: 135
hSerpinc1-Sp-118 E05 CAGCCCTGAGAACACAAGGA 55 SEQ ID NO: 136
hSerpinc1-Sp-119 E05 AAGGAAGGAACTGTTCTACA 40 SEQ ID NO: 137
hSerpinc1-Sp-120 E05 GAACTGTTCTACAAGGCTGA 45 SEQ ID NO: 138
hSerpinc1-Sp-121 E05 TTCAGCATCTATGATGTACC 40 SEQ ID NO: 139
hSerpinc1-Sp-122 E05 GCATCTATGATGTACCAGGA 45 SEQ ID NO: 140
hSerpinc1-Sp-123 E05 GATAACGGAACTTGCCTTCC 50 SEQ ID NO: 141
hSerpinc1-Sp-124 E05 AGGAAGGCAAGTTCCGTTAT 45 SEQ ID NO: 142
hSerpinc1-Sp-125 E05 CTTCAGCCACGCGCCGATAA 60 SEQ ID NO: 143
hSerpinc1-Sp-126 E05 CAAGTTCCGTTATCGGCGCG 60 SEQ ID NO: 144
hSerpinc1-Sp-127 E05 CGTTATCGGCGCGTGGCTGA 65 SEQ ID NO: 145
hSerpinc1-Sp-128 E05 GCGCGTGGCTGAAGGCACCC 75 SEQ ID NO: 146
hSerpinc1-Sp-129 E05 GAAGGGCAACTCAAGCACCT 55 SEQ ID NO: 147
hSerpinc1-Sp-130 E05 TGAAGGGCAACTCAAGCACC 55 SEQ ID NO: 148
hSerpinc1-Sp-131 E05 GTGCTTGAGTTGCCCTTCAA 50 SEQ ID NO: 149
hSerpinc1-Sp-132 E05 GTGATGTCATCACCTTTGAA 40 SEQ ID NO: 150
hSerpinc1-Sp-133 E05 GGTGATGTCATCACCTTTGA 45 SEQ ID NO: 151
hSerpinc1-Sp-134 E05 CAAAGGTGATGACATCACCA 45 SEQ ID NO: 152
hSerpinc1-Sp-135 E05 CTTGGGCAAGATGAGGACCA 55 SEQ ID NO: 153
hSerpinc1-Sp-136 E05 TCTCAGGCTTGGGCAAGATG 55 SEQ ID NO: 154
hSerpinc1-Sp-137 E05 GCCAGGCTCTTCTCAGGCTT 60 SEQ ID NO: 155
hSerpinc1-Sp-138 E05 GGCCAGGCTCTTCTCAGGCT 65 SEQ ID NO: 156
hSerpinc1-Sp-139 E05 ACCTTGGCCAGGCTCTTCTC 60 SEQ ID NO: 157
hSerpinc1-Sp-140 E05 GCCCAAGCCTGAGAAGAGCC 65 SEQ ID NO: 158
hSerpinc1-Sp-141 E05 GCCTGAGAAGAGCCTGGCCA 65 SEQ ID NO: 159
hSerpinc1-Sp-142 E05 GTTCCTTCTCTACCTTGGCC 55 SEQ ID NO: 160
hSerpinc1-Sp-143 E05 GGTGAGTTCCTTCTCTACCT 50 SEQ ID NO: 161
hSerpinc1-Sp-144 E05 GAGCCTGGCCAAGGTAGAGA 60 SEQ ID NO: 162
hSerpinc1-Sp-145 E05 AGAGAAGGAACTCACCCCAG 55 SEQ ID NO: 163
hSerpinc1-Sp-146 E05 CCACTCTTGCAGCACCTCTG 60 SEQ ID NO: 164
hSerpinc1-Sp-147 E05 GCCACTCTTGCAGCACCTCT 60 SEQ ID NO: 165
hSerpinc1-Sp-148 E05 AGCCACTCTTGCAGCACCTC 60 SEQ ID NO: 166
hSerpinc1-Sp-149 E05 CCCCAGAGGTGCTGCAAGAG 65 SEQ ID NO: 167
hSerpinc1-Sp-150 E05 AGAGGTGCTGCAAGAGTGGC 60 SEQ ID NO: 168
hSerpinc1-Sp-151 E05 GCAAGAGTGGCTGGATGAAT 50 SEQ ID NO: 169
hSerpinc1-Sp-152 E05 AGAGTGGCTGGATGAATTGG 50 SEQ ID NO: 170
hSerpinc1-Sp-153 E05 TGAATTGGAGGAGATGATGC 45 SEQ ID NO: 171
hSerpinc1-Sp-154 E05 ATTGGAGGAGATGATGCTGG 50 SEQ ID NO: 172
hSerpinc1-Sp-155 E05 CAATGCGGAAGCGGGGCATG 65 SEQ ID NO: 173
hSerpinc1-Sp-156 E05 CCGTCCTCAATGCGGAAGCG 65 SEQ ID NO: 174
hSerpinc1-Sp-157 E05 GCCGTCCTCAATGCGGAAGC 65 SEQ ID NO: 175
hSerpinc1-Sp-158 E05 AGCCGTCCTCAATGCGGAAG 60 SEQ ID NO: 176
hSerpinc1-Sp-159 E05 CATGCCCCGCTTCCGCATTG 65 SEQ ID NO: 177
hSerpinc1-Sp-160 E05 AACTGAAGCCGTCCTCAATG 50 SEQ ID NO: 178
hSerpinc1-Sp-161 E05 CCCCGCTTCCGCATTGAGGA 65 SEQ ID NO: 179
hSerpinc1-Sp-162 E05 TGAGGACGGCTTCAGTTTGA 50 SEQ ID NO: 180
hSerpinc1-Sp-163 E05 GAAGGAGCAGCTGCAAGACA 55 SEQ ID NO: 181
hSerpinc1-Sp-164 E05 AAGGAGCAGCTGCAAGACAT 50 SEQ ID NO: 182
hSerpinc1-Sp-165 E05 CAGGGCTGAACAGATCGACA 55 SEQ ID NO: 183
hSerpinc1-Sp-166 E05 CTGGGAGTTTGGACTTTTCA 45 SEQ ID NO: 184
hSerpinc1-Sp-167 E05 CCTGGGAGTTTGGACTTTTC 50 SEQ ID NO: 185
hSerpinc1-Sp-168 E05 CCTAGACAAACCTGGGAGTT 50 SEQ ID NO: 186
hSerpinc1-Sp-169 E05 CCTGAAAAGTCCAAACTCCC 50 SEQ ID NO: 187
hSerpinc1-Sp-170 E06 CGGCCTTCTGCAACAATACC 55 SEQ ID NO: 188
hSerpinc1-Sp-171 E06 CTTCCAGGTATTGTTGCAGA 45 SEQ ID NO: 189
hSerpinc1-Sp-172 E06 CTGAGACATAGAGGTCATCT 45 SEQ ID NO: 190
hSerpinc1-Sp-173 E06 GGAATGCATCTGAGACATAG 45 SEQ ID NO: 191
hSerpinc1-Sp-174 E06 TGTCTCAGATGCATTCCATA 40 SEQ ID NO: 192
hSerpinc1-Sp-175 E06 TCACCTCAAGAAATGCCTTA 40 SEQ ID NO: 193
hSerpinc1-Sp-176 E06 ATTCCATAAGGCATTTCTTG 35 SEQ ID NO: 194
hSerpinc1-Sp-177 E07 GACCTGCAGGTAAATGAAGA 45 SEQ ID NO: 195
hSerpinc1-Sp-178 E07 ACGGCCAGCAATCACAACAG 55 SEQ ID NO: 196
hSerpinc1-Sp-179 E07 AGTACCGCTGTTGTGATTGC 50 SEQ ID NO: 197
hSerpinc1-Sp-180 E07 CCCTGTTGGGGTTTAGCGAA 55 SEQ ID NO: 198
hSerpinc1-Sp-181 E07 GCCGTTCGCTAAACCCCAAC 60 SEQ ID NO: 199
hSerpinc1-Sp-182 E07 CCGTTCGCTAAACCCCAACA 55 SEQ ID NO: 200
hSerpinc1-Sp-183 E07 CCTTGAAAGTCACCCTGTTG 50 SEQ ID NO: 201
hSerpinc1-Sp-184 E07 GCCTTGAAAGTCACCCTGTT 50 SEQ ID NO: 202
hSerpinc1-Sp-185 E07 GGCCTTGAAAGTCACCCTGT 55 SEQ ID NO: 203
hSerpinc1-Sp-186 E07 CCCCAACAGGGTGACTTTCA 55 SEQ ID NO: 204
hSerpinc1-Sp-187 E07 GGGTGACTTTCAAGGCCAAC 55 SEQ ID NO: 205
hSerpinc1-Sp-188 E07 AAAAACCAGGAAAGGCCTGT 45 SEQ ID NO: 206
hSerpinc1-Sp-189 E07 CAAGGCCAACAGGCCTTTCC 60 SEQ ID NO: 207
hSerpinc1-Sp-190 E07 TCTCTTATAAAAACCAGGAA 30 SEQ ID NO: 208
hSerpinc1-Sp-191 E07 GAACTTCTCTTATAAAAACC 30 SEQ ID NO: 209
hSerpinc1-Sp-192 E07 ATGAAGATAATAGTGTTCAG 30 SEQ ID NO: 210
hSerpinc1-Sp-193 E07 TCTGAACACTATTATCTTCA 30 SEQ ID NO: 211
hSerpinc1-Sp-194 E07 CTGAACACTATTATCTTCAT 30 SEQ ID NO: 212
hSerpinc1-Sp-195 E07 ATTTTACTTAACACAAGGGT 30 SEQ ID NO: 213
hSerpinc1-Sp-196 E07 GAACATTTTACTTAACACAA 25 SEQ ID NO: 214
hSerpinc1-Sp-197 E07 AGAACATTTTACTTAACACA 25 SEQ ID NO: 215
hSerpinc1-Sa-1 E01 GGTTACAGTTCCTATCACAT 40 SEQ ID NO: 216
hSerpinc1-Sa-2 E02 CCAAGCCGCGGGACATTCCC 70 SEQ ID NO: 217
hSerpinc1-Sa-3 E02 TAAATGCACATGGGATTCAT 35 SEQ ID NO: 218
hSerpinc1-Sa-4 E02 CGGGGAGCGGTAAATGCACA 60 SEQ ID NO: 219
hSerpinc1-Sa-5 E02 CCCCGGAGAAGAAGGCAACT 60 SEQ ID NO: 220
hSerpinc1-Sa-6 E02 ACACGCCGGTTGGTGGCCTC 70 SEQ ID NO: 221
hSerpinc1-Sa-7 E02 ATAGAAAGTGGTAGCAAAGC 40 SEQ ID NO: 222
hSerpinc1-Sa-8 E02 ATCAGCACCTGGCAGATTCC 55 SEQ ID NO: 223
hSerpinc1-Sa-9 E02 AATGTTATCATTGTCATTCT 25 SEQ ID NO: 224
hSerpinc1-Sa-10 E02 ATAACATTTTCCTGTCACCC 40 SEQ ID NO: 225
hSerpinc1-Sa-11 E02 CAAAAGCCGTGGAGATACTC 50 SEQ ID NO: 226
hSerpinc1-Sa-12 E02 CGGCTTTTGCTATGACCAAG 50 SEQ ID NO: 227
hSerpinc1-Sa-13 E02 CGTACCTCCATCAGTTGCTG 55 SEQ ID NO: 228
hSerpinc1-Sa-14 E03 TTCAGTTTGGCAAAGAAGAA 35 SEQ ID NO: 229
hSerpinc1-Sa-15 E03 AGGATTTGTTGGCTTTTCGA 40 SEQ ID NO: 230
hSerpinc1-Sa-16 E03 GATTGGCTGATACTAACTTG 40 SEQ ID NO: 231
hSerpinc1-Sa-17 E03 GGTAGGTCTCATTGAAGGTA 45 SEQ ID NO: 232
hSerpinc1-Sa-18 E03 TGAGACCTACCAGGACATCA 50 SEQ ID NO: 233
hSerpinc1-Sa-19 E03 TCCAGCCCCTGGACTTCAAG 60 SEQ ID NO: 234
hSerpinc1-Sa-20 E04 CCCATTTGTTGATGGCCGCT 55 SEQ ID NO: 235
hSerpinc1-Sa-21 E04 TCCAGAGCGGCCATCAACAA 55 SEQ ID NO: 236
hSerpinc1-Sa-22 E04 GTGTCCAATAAGACCGAAGG 50 SEQ ID NO: 237
hSerpinc1-Sa-23 E04 AGCTCATTGATGGCTTCCGA 50 SEQ ID NO: 238
hSerpinc1-Sa-24 E05 ACTGTTCTACAAGGCTGATG 45 SEQ ID NO: 239
hSerpinc1-Sa-25 E05 GGCTGAAGGCACCCAGGTGC 70 SEQ ID NO: 240
hSerpinc1-Sa-26 E05 TTGAAGGGCAACTCAAGCAC 50 SEQ ID NO: 241
hSerpinc1-Sa-27 E05 ACTCTTGCAGCACCTCTGGG 60 SEQ ID NO: 242
hSerpinc1-Sa-28 E05 AGCCACTCTTGCAGCACCTC 60 SEQ ID NO: 243
hSerpinc1-Sa-29 E05 ACTCACCCCAGAGGTGCTGC 65 SEQ ID NO: 244
hSerpinc1-Sa-30 E05 CAGAGGTGCTGCAAGAGTGG 60 SEQ ID NO: 245
hSerpinc1-Sa-31 E05 GGTGCTGCAAGAGTGGCTGG 65 SEQ ID NO: 246
hSerpinc1-Sa-32 E06 TCACCTCAAGAAATGCCTTA 40 SEQ ID NO: 247
hSerpinc1-Sa-33 E06 TCCATAAGGCATTTCTTGAG 40 SEQ ID NO: 248
hSerpinc1-Sa-34 E07 GGCCGTTCGCTAAACCCCAA 60 SEQ ID NO: 249
hSerpinc1-Sa-35 E07 GGCCTTGAAAGTCACCCTGT 55 SEQ ID NO: 250
hSerpinc1-Sa-36 E07 AACACTATTATCTTCATGGG 35 SEQ ID NO: 251
hSerpinc1-Sa-37 E07 AAGAACATTTTACTTAACAC 25 SEQ ID NO: 252
hSerpinc1-Cj-1 E01 GAGGTTACAGTTCCTATCACAT 41 SEQ ID NO: 253
hSerpinc1-Cj-2 E02 CTGTCACGGGAGCCCTGTGGAC 68 SEQ ID NO: 254
hSerpinc1-Cj-3 E02 GCCTTCTTCTCCGGGGAGCGGT 68 SEQ ID NO: 255
hSerpinc1-Cj-4 E02 GGGAATTGGCCTTGGACAGTTC 55 SEQ ID NO: 256
hSerpinc1-Cj-5 E02 TCCCGCTTTGCTACCACTTTCT 50 SEQ ID NO: 257
hSerpinc1-Cj-6 E02 GCTTGGTCATAGCAAAAGCCGT 50 SEQ ID NO: 258
hSerpinc1-Cj-7 E02 TATGACCAAGCTGGGTGCCTGT 55 SEQ ID NO: 259
hSerpinc1-Cj-8 E02 TCAGTTGCTGGAGGGTGTCATT 50 SEQ ID NO: 260
hSerpinc1-Cj-9 E02 ATGACACCCTCCAGCAACTGAT 50 SEQ ID NO: 261
hSerpinc1-Cj-10 E03 TTGACTTCTATAGGTATTTAAG 27 SEQ ID NO: 262
hSerpinc1-Cj-11 E03 TTTCTCAGATATGGTGTCAAAC 36 SEQ ID NO: 263
hSerpinc1-Cj-12 E03 TTTGTCTCCAAAAAGGCGATTG 41 SEQ ID NO: 264
hSerpinc1-Cj-13 E03 GTCCAGGGGCTGGAGCTTGGCT 68 SEQ ID NO: 265
hSerpinc1-Cj-14 E04 GGTGATTCGGCCTTCGGTCTTA 55 SEQ ID NO: 266
hSerpinc1-Cj-15 E04 TGAGCTCACTGTTCTGGTGCTG 55 SEQ ID NO: 267
hSerpinc1-Cj-16 E04 TACCTTGAAGTAAATGGTGTTA 32 SEQ ID NO: 268
hSerpinc1-Cj-17 E04 TGCTGGTTAACACCATTTACTT 36 SEQ ID NO: 269
hSerpinc1-Cj-18 E05 GTGGAAGTCAAAGTTCAGCCCT 50 SEQ ID NO: 270
hSerpinc1-Cj-19 E05 GGAGAGTCGTGTTCAGCATCTA 50 SEQ ID NO: 271
hSerpinc1-Cj-20 E05 CCTTCCTGGTACATCATAGATG 45 SEQ ID NO: 272
hSerpinc1-Cj-21 E05 CGCCGATAACGGAACTTGCCTT 55 SEQ ID NO: 273
hSerpinc1-Cj-22 E05 GTTCCGTTATCGGCGCGTGGCT 64 SEQ ID NO: 274
hSerpinc1-Cj-23 E05 GTCATCACCTTTGAAGGGCAAC 50 SEQ ID NO: 275
hSerpinc1-Cj-24 E05 CTCCAATTCATCCAGCCACTCT 50 SEQ ID NO: 276
hSerpinc1-Cj-25 E06 AGAGGTCATCTCGGCCTTCTGC 59 SEQ ID NO: 277
hSerpinc1-Cj-26 E06 ATTCCATAAGGCATTTCTTGAG 36 SEQ ID NO: 278
hSerpinc1-Cj-27 E07 TGAAGAAGGCAGTGAAGCAGCT 50 SEQ ID NO: 279
hSerpinc1-Cj-28 E07 GCGAACGGCCAGCAATCACAAC 59 SEQ ID NO: 280
hSerpinc1-Cj-29 E07 GGTTTTTATAAGAGAAGTTCCT 32 SEQ ID NO: 281
hSerpinc1-Cj-30 E07 TGCAAAGAATAAGAACATTTTA 23 SEQ ID NO: 282
TFPI 유전자의 표적 서열(Target sequences of TFPI gene)
Target name Loci. Target(w/o PAM) GC Contents (%) SEQ ID NO
hTfpi-Sp-1 E02 TGAAGAAAGTACATGCACTT 35 SEQ ID NO: 283
hTfpi-Sp-2 E02 GAAGAAAGTACATGCACTTT 35 SEQ ID NO: 284
hTfpi-Sp-3 E02 CAGGGGCAAGATTAAGCAGC 55 SEQ ID NO: 285
hTfpi-Sp-4 E02 ATCAGCATTAAGAGGGGCAG 50 SEQ ID NO: 286
hTfpi-Sp-5 E02 AATCAGCATTAAGAGGGGCA 45 SEQ ID NO: 287
hTfpi-Sp-6 E02 GAATCAGCATTAAGAGGGGC 50 SEQ ID NO: 288
hTfpi-Sp-7 E02 CTCAGAATCAGCATTAAGAG 40 SEQ ID NO: 289
hTfpi-Sp-8 E02 CCTCAGAATCAGCATTAAGA 40 SEQ ID NO: 290
hTfpi-Sp-9 E02 TCCTCAGAATCAGCATTAAG 40 SEQ ID NO: 291
hTfpi-Sp-10 E02 CCCTCTTAATGCTGATTCTG 45 SEQ ID NO: 292
hTfpi-Sp-11 E02 GAAGAACACACAATTATCAC 35 SEQ ID NO: 293
hTfpi-Sp-12 E03 TTATTTTTACTTTATAGATA 10 SEQ ID NO: 294
hTfpi-Sp-13 E03 GAATGCATAAGTTTCAGTGG 40 SEQ ID NO: 295
hTfpi-Sp-14 E03 AATGAATGCATAAGTTTCAG 30 SEQ ID NO: 296
hTfpi-Sp-15 E03 GCATTCATTTTGTGCATTCA 35 SEQ ID NO: 297
hTfpi-Sp-16 E03 TTCATTTTGTGCATTCAAGG 35 SEQ ID NO: 298
hTfpi-Sp-17 E03 TGTGCATTCAAGGCGGATGA 50 SEQ ID NO: 299
hTfpi-Sp-18 E03 TTTTCATGATTGCTTTACAT 25 SEQ ID NO: 300
hTfpi-Sp-19 E03 CTTTTCATGATTGCTTTACA 30 SEQ ID NO: 301
hTfpi-Sp-20 E03 CAGTGCGAAGAATTTATATA 30 SEQ ID NO: 302
hTfpi-Sp-21 E03 AGTGCGAAGAATTTATATAT 25 SEQ ID NO: 303
hTfpi-Sp-22 E03 GTGCGAAGAATTTATATATG 30 SEQ ID NO: 304
hTfpi-Sp-23 E03 TGCGAAGAATTTATATATGG 30 SEQ ID NO: 305
hTfpi-Sp-24 E03 TTTATATATGGGGGATGTGA 35 SEQ ID NO: 306
hTfpi-Sp-25 E03 TCAGAATCGATTTGAAAGTC 35 SEQ ID NO: 307
hTfpi-Sp-26 E03 TGCAAAAAAATGTGTACAAG 30 SEQ ID NO: 308
hTfpi-Sp-27 E03 AAAAAATGTGTACAAGAGGT 30 SEQ ID NO: 309
hTfpi-Sp-28 E04 TGATTACAGATAATGCAAAC 30 SEQ ID NO: 310
hTfpi-Sp-29 E04 ATAAAGACAACATTGCAACA 30 SEQ ID NO: 311
hTfpi-Sp-30 E05 TCTTCCAAAAAGCAGAAATC 35 SEQ ID NO: 312
hTfpi-Sp-31 E05 AAAGCCAGATTTCTGCTTTT 35 SEQ ID NO: 313
hTfpi-Sp-32 E05 TGCTTTTTGGAAGAAGATCC 40 SEQ ID NO: 314
hTfpi-Sp-33 E05 ATATAACCTCGACATATTCC 35 SEQ ID NO: 315
hTfpi-Sp-34 E05 GAAGATCCTGGAATATGTCG 45 SEQ ID NO: 316
hTfpi-Sp-35 E05 TATGTCGAGGTTATATTACC 35 SEQ ID NO: 317
hTfpi-Sp-36 E05 CTGATTGTTATAAAAATACC 25 SEQ ID NO: 318
hTfpi-Sp-37 E05 CAGTGTGAACGTTTCAAGTA 40 SEQ ID NO: 319
hTfpi-Sp-38 E05 TGTGAACGTTTCAAGTATGG 40 SEQ ID NO: 320
hTfpi-Sp-39 E05 TTTCAAGTATGGTGGATGCC 45 SEQ ID NO: 321
hTfpi-Sp-40 E05 TTCAAGTATGGTGGATGCCT 45 SEQ ID NO: 322
hTfpi-Sp-41 E05 CAAAATTGTTCATATTGCCC 35 SEQ ID NO: 323
hTfpi-Sp-42 E05 TATGAACAATTTTGAGACAC 30 SEQ ID NO: 324
hTfpi-Sp-43 E05 TGCAAGAACATTTGTGAAGA 35 SEQ ID NO: 325
hTfpi-Sp-44 E06 CTGTATTTTTTTCCAGCGAA 35 SEQ ID NO: 326
hTfpi-Sp-45 E06 TCCACCTGGAAACCATTCGC 55 SEQ ID NO: 327
hTfpi-Sp-46 E06 TTTTCCAGCGAATGGTTTCC 45 SEQ ID NO: 328
hTfpi-Sp-47 E06 TCCAGCGAATGGTTTCCAGG 55 SEQ ID NO: 329
hTfpi-Sp-48 E06 GGGTTCCATAATTATCCACC 45 SEQ ID NO: 330
hTfpi-Sp-49 E06 GGTTTCCAGGTGGATAATTA 40 SEQ ID NO: 331
hTfpi-Sp-50 E06 GTTATTCACAGCATTGAGCT 40 SEQ ID NO: 332
hTfpi-Sp-51 E06 AGTTATTCACAGCATTGAGC 40 SEQ ID NO: 333
hTfpi-Sp-52 E06 CTTGGTTGATTGCGGAGTCA 50 SEQ ID NO: 334
hTfpi-Sp-53 E06 CCTTGGTTGATTGCGGAGTC 55 SEQ ID NO: 335
hTfpi-Sp-54 E06 CTGGGAACCTTGGTTGATTG 50 SEQ ID NO: 336
hTfpi-Sp-55 E06 CCTGACTCCGCAATCAACCA 55 SEQ ID NO: 337
hTfpi-Sp-56 E06 ACCAAAAAGGCTGGGAACCT 50 SEQ ID NO: 338
hTfpi-Sp-57 E06 AGATTCTTACCAAAAAGGCT 35 SEQ ID NO: 339
hTfpi-Sp-58 E06 AAGATTCTTACCAAAAAGGC 35 SEQ ID NO: 340
hTfpi-Sp-59 E06 ACCAAGGTTCCCAGCCTTTT 50 SEQ ID NO: 341
hTfpi-Sp-60 E06 CCACAAGATTCTTACCAAAA 35 SEQ ID NO: 342
hTfpi-Sp-61 E06 CCTTTTTGGTAAGAATCTTG 35 SEQ ID NO: 343
hTfpi-Sp-62 E07 GTGAAATTCTAAAAACAATC 25 SEQ ID NO: 344
hTfpi-Sp-63 E07 TGATTGTTTTTAGAATTTCA 20 SEQ ID NO: 345
hTfpi-Sp-64 E07 TAGAATTTCACGGTCCCTCA 45 SEQ ID NO: 346
hTfpi-Sp-65 E07 GCTGGAGTGAGACACCATGA 55 SEQ ID NO: 347
hTfpi-Sp-66 E07 TGCTGGAGTGAGACACCATG 55 SEQ ID NO: 348
hTfpi-Sp-67 E07 CGACACAATCCTCTGTCTGC 55 SEQ ID NO: 349
hTfpi-Sp-68 E07 TGTCTCACTCCAGCAGACAG 55 SEQ ID NO: 350
hTfpi-Sp-69 E07 GTAGTAGAATCTGTTCTCAT 35 SEQ ID NO: 351
hTfpi-Sp-70 E07 TTCTACTACAATTCAGTCAT 30 SEQ ID NO: 352
hTfpi-Sp-71 E07 TCTACTACAATTCAGTCATT 30 SEQ ID NO: 353
hTfpi-Sp-72 E07 ATCCACTGTACTTAAATGGG 40 SEQ ID NO: 354
hTfpi-Sp-73 E07 CACATCCACTGTACTTAAAT 35 SEQ ID NO: 355
hTfpi-Sp-74 E07 CCACATCCACTGTACTTAAA 40 SEQ ID NO: 356
hTfpi-Sp-75 E07 TGCCGCCCATTTAAGTACAG 50 SEQ ID NO: 357
hTfpi-Sp-76 E07 CCATTTAAGTACAGTGGATG 40 SEQ ID NO: 358
hTfpi-Sp-77 E07 CATTTAAGTACAGTGGATGT 35 SEQ ID NO: 359
hTfpi-Sp-78 E07 ATTTAAGTACAGTGGATGTG 35 SEQ ID NO: 360
hTfpi-Sp-79 E07 TTTAAGTACAGTGGATGTGG 40 SEQ ID NO: 361
hTfpi-Sp-80 E07 TGCCCTCAGACATTCTTGTT 45 SEQ ID NO: 362
hTfpi-Sp-81 E07 CTTCCAAACAAGAATGTCTG 40 SEQ ID NO: 363
hTfpi-Sp-82 E07 TTCCAAACAAGAATGTCTGA 35 SEQ ID NO: 364
hTfpi-Sp-83 E07 TGTCTGAGGGCATGTAAAAA 40 SEQ ID NO: 365
hTfpi-Sp-84 E08 ATGAAACCTATAAGAGGAAG 35 SEQ ID NO: 366
hTfpi-Sp-85 E08 CTTTGGATGAAACCTATAAG 35 SEQ ID NO: 367
hTfpi-Sp-86 E08 GGCCTCCTTTTGATATTCTT 40 SEQ ID NO: 368
hTfpi-Sp-87 E08 TTCATCCAAAGAATATCAAA 25 SEQ ID NO: 369
hTfpi-Sp-88 E08 ATCCAAAGAATATCAAAAGG 30 SEQ ID NO: 370
hTfpi-Sp-89 E08 TTTTTCTTTTGGTTTTAATT 15 SEQ ID NO: 371
hTfpi-Sp-90 E08 CTGCTTCTTTCTTTTTCTTT 30 SEQ ID NO: 372
hTfpi-Sa-1 E02 TGTGTGTTCTTCATCTTCCT 40 SEQ ID NO: 373
hTfpi-Sa-2 E03 TTATTTTTACTTTATAGATA 10 SEQ ID NO: 374
hTfpi-Sa-3 E03 ATCCGCCTTGAATGCACAAA 45 SEQ ID NO: 375
hTfpi-Sa-4 E03 ATTCATTTTGTGCATTCAAG 30 SEQ ID NO: 376
hTfpi-Sa-5 E03 TACATGGGCCATCATCCGCC 60 SEQ ID NO: 377
hTfpi-Sa-6 E03 TATATAAATTCTTCGCACTG 30 SEQ ID NO: 378
hTfpi-Sa-7 E03 TATTTTCACTCGACAGTGCG 45 SEQ ID NO: 379
hTfpi-Sa-8 E03 GTGCGAAGAATTTATATATG 30 SEQ ID NO: 380
hTfpi-Sa-9 E03 ATGGGGGATGTGAAGGAAAT 45 SEQ ID NO: 381
hTfpi-Sa-10 E03 GAATCGATTTGAAAGTCTGG 40 SEQ ID NO: 382
hTfpi-Sa-11 E04 TTGATTACAGATAATGCAAA 25 SEQ ID NO: 383
hTfpi-Sa-12 E05 TGCTTTTTGGAAGAAGATCC 40 SEQ ID NO: 384
hTfpi-Sa-13 E05 AATATAACCTCGACATATTC 30 SEQ ID NO: 385
hTfpi-Sa-14 E05 GTGTGAACGTTTCAAGTATG 40 SEQ ID NO: 386
hTfpi-Sa-15 E05 GAACAATTTTGAGACACTGG 40 SEQ ID NO: 387
hTfpi-Sa-16 E06 TTCCAGCGAATGGTTTCCAG 50 SEQ ID NO: 388
hTfpi-Sa-17 E06 GAGTTATTCACAGCATTGAG 40 SEQ ID NO: 389
hTfpi-Sa-18 E06 ATGGAACCCAGCTCAATGCT 50 SEQ ID NO: 390
hTfpi-Sa-19 E06 CTTGGTTGATTGCGGAGTCA 50 SEQ ID NO: 391
hTfpi-Sa-20 E06 CTGGGAACCTTGGTTGATTG 50 SEQ ID NO: 392
hTfpi-Sa-21 E06 AGGTTCCCAGCCTTTTTGGT 50 SEQ ID NO: 393
hTfpi-Sa-22 E07 CGACACAATCCTCTGTCTGC 55 SEQ ID NO: 394
hTfpi-Sa-23 E07 GTGTCTCACTCCAGCAGACA 55 SEQ ID NO: 395
hTfpi-Sa-24 E07 TCCCAATGACTGAATTGTAG 40 SEQ ID NO: 396
hTfpi-Sa-25 E07 TGGGCGGCATTTCCCAATGA 55 SEQ ID NO: 397
hTfpi-Sa-26 E07 ATGCCGCCCATTTAAGTACA 45 SEQ ID NO: 398
hTfpi-Sa-27 E07 AAACAATTTTACTTCCAAAC 25 SEQ ID NO: 399
hTfpi-Sa-28 E08 CCTCTTATAGGTTTCATCCA 40 SEQ ID NO: 400
hTfpi-Sa-29 E08 AGGCCTCCTTTTGATATTCT 40 SEQ ID NO: 401
hTfpi-Sa-30 E08 GAAATTTTTGTTAAAAATAT 10 SEQ ID NO: 402
hTfpi-Cj-1 E02 TGGGTTCTGTATTTCAGAGATG 41 SEQ ID NO: 403
hTfpi-Cj-2 E02 TCTTCATTGTGTAAATCATCTC 32 SEQ ID NO: 404
hTfpi-Cj-3 E02 CAGAGATGATTTACACAATGAA 32 SEQ ID NO: 405
hTfpi-Cj-4 E02 TGATTTACACAATGAAGAAAGT 27 SEQ ID NO: 406
hTfpi-Cj-5 E02 CAGGCATACAGAAGCCCAAAGT 50 SEQ ID NO: 407
hTfpi-Cj-6 E02 GGCAGGGGCAAGATTAAGCAGC 59 SEQ ID NO: 408
hTfpi-Cj-7 E02 AATGCTGATTCTGAGGAAGATG 41 SEQ ID NO: 409
hTfpi-Cj-8 E02 TGCTGATTCTGAGGAAGATGAA 41 SEQ ID NO: 410
hTfpi-Cj-9 E03 TACATGGGCCATCATCCGCCTT 55 SEQ ID NO: 411
hTfpi-Cj-10 E03 TCACATCCCCCATATATAAATT 32 SEQ ID NO: 412
hTfpi-Cj-11 E03 AAGTCTGGAAGAGTGCAAAAAA 36 SEQ ID NO: 413
hTfpi-Cj-12 E03 AACCTACCTCTTGTACACATTT 36 SEQ ID NO: 414
hTfpi-Cj-13 E03 AGGGTTCCCAGAAACCTACCTC 55 SEQ ID NO: 415
hTfpi-Cj-14 E05 CACTGTTTTGTCTGATTGTTAT 32 SEQ ID NO: 416
hTfpi-Cj-15 E05 AGGCATCCACCATACTTGAAAC 45 SEQ ID NO: 417
hTfpi-Cj-16 E05 TTGTTCATATTGCCCAGGCATC 45 SEQ ID NO: 418
hTfpi-Cj-17 E05 GCCTGGGCAATATGAACAATTT 41 SEQ ID NO: 419
hTfpi-Cj-18 E07 CACAATCCTCTGTCTGCTGGAG 55 SEQ ID NO: 420
hTfpi-Cj-19 E07 TAGTAGAATCTGTTCTCATTGG 36 SEQ ID NO: 421
hTfpi-Cj-20 E07 AATTGTAGTAGAATCTGTTCTC 32 SEQ ID NO: 422
hTfpi-Cj-21 E07 GTCATTGGGAAATGCCGCCCAT 55 SEQ ID NO: 423
hTfpi-Cj-22 E07 TTGTTTTCATTTCCCCCACATC 41 SEQ ID NO: 424
본 명세서에 의해 개시되는 내용의 일 구현예에서, 가이드핵산은 AT 유전자 및/또는 TFPI 유전자의 표적 서열에 상보적으로 결합하는 가이드 서열을 포함하는 gRNA일 수 있다.
“가이드 서열”은 표적 유전자 또는 핵산의 이중 가닥 중 어느 하나 가닥의 일부 서열에 상보적인 뉴클레오타이드 서열이며, 이때 상기 가이드 서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성을 가지거나 또는 완전한 상보성을 가지는 뉴클레오타이드 서열일 수 있다.
상기 가이드 서열은 10 내지 25개의 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 서열은 10 내지 25개의 뉴클레오타이드 서열, 15 내지 25개의 뉴클레오타이드 서열 또는 20 내지 25개의 뉴클레오타이드 서열일 수 있다.
다른 일 예로, 상기 가이드 서열은 10 내지 15개의 뉴클레오타이드 서열, 15 내지 20개의 뉴클레오타이드 서열 또는 20 내지 25개의 뉴클레오타이드 서열일 수 있다.
본 명세서에 의해 개시되는 표적 유전자는 혈액 응고 저해 유전자일 수 있다.
본 명세서에 의해 개시되는 표적 유전자는 AT 유전자(SERPINC1 유전자) 및/또는 TFPI 유전자일 수 있다.
상기 가이드 서열은 표적 서열과 상보적인 결합을 형성할 수 있다.
상기 표적 서열은 가이드핵산 결합 서열일 수 있다.
“가이드핵산 결합 서열”은 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보성을 가지는 뉴클레오타이드 서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보적인 결합을 할 수 있다. 표적 서열 및 가이드핵산 결합 서열은 표적 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 교정하고자 하는 대상에 따라 달라질 수 있는 뉴클레오타이드 서열로, 표적 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.
상기 표적 서열 및 가이드핵산 결합 서열 관련 설명은 상기 기술한 바와 같다.
상기 가이드핵산 결합 서열은 가이드 서열의 길이와 동일할 수 있다.
상기 가이드핵산 결합 서열은 가이드 서열의 길이보다 짧은 서열일 수 있다.
상기 가이드핵산 결합 서열은 가이드 서열의 길이보다 긴 서열일 수 있다.
상기 가이드 서열은 가이드핵산 결합 서열과 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 뉴클레오타이드 서열일 수 있다.
일 예로, 상기 가이드 서열은 가이드핵산 결합 서열에 상보적이지 않은 1 내지 8개의 뉴클레오타이드 서열을 가지거나 또는 포함할 수 있다.
구현예에서,
본 명세서에 의해 개시되는 가이드 서열은 혈액 응고 저해 유전자의 프로모터 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 AT 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 TFPI 유전자의 프로모터 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 혈액 응고 저해 유전자의 인트론 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 AT 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 TFPI 유전자의 인트론 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 혈액 응고 저해 유전자의 엑손 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 AT 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 TFPI 유전자의 엑손 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 혈액 응고 저해 유전자의 인핸서 영역에 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 AT 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 TFPI 유전자의 인핸서 영역에 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 혈액 응고 저해 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 AT 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 TFPI 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 혈액 응고 저해 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 AT 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 TFPI 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 혈액 응고 저해 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 AT 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 TFPI 유전자의 엑손, 인트론 또는 이의 혼합 부분의 위치한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 혈액 응고 저해 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 예로, 상기 가이드 서열은 AT 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 TFPI 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
본 명세서에 의해 개시되는 가이드 서열은 혈액 응고 저해 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 35개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
“PAM(proto-spacer-adjacent Motif) 서열”은 에디터단백질이 인식할 수 있는 뉴클레오타이드서열이다. 이때, PAM 서열은 에디터단백질의 종류 및 유래된 종에 따라 뉴클레오타이드서열에 차이가 있을 수 있다.
이때, 상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).
NGG(N은 A, T, C 또는 G임);
NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);
NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및
TTN(N은 A, T, C 또는 G임).
일 예로, 상기 가이드 서열은 AT 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 AT 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 AT 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 AT 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 AT 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 AT 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 AT 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 AT 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 예로, 상기 가이드 서열은 TFPI 유전자의 핵산서열 내의 PAM 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 TFPI 유전자의 핵산서열 내의 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 TFPI 유전자의 핵산서열 내의 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 TFPI 유전자의 핵산서열 내의 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 TFPI 유전자의 핵산서열 내의 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 TFPI 유전자의 핵산서열 내의 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
또 다른 일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 TFPI 유전자의 핵산서열 내의 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
일 구체예로서, 에디터단백질이 인식하는 PAM 서열이 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C)인 경우, 상기 가이드 서열은 TFPI 유전자의 핵산서열 내의 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 10 내지 25개의 뉴클레오타이드 서열과 상보적인 결합을 형성할 수 있다.
이하, 본 발명의 일 구체예에서 사용할 수 있는 가이드 서열들의 일 예들은 표 3 및 표 4에 정리하였다. 표 3 및 표 4에 기재된 가이드 서열은 AT 유전자(SERPINC1 유전자) 또는 TFPI 유전자를 표적할 수 있는 가이드 서열로, AT 유전자(SERPINC1 유전자) 또는 TFPI 유전자 내에 위치하는 표적 서열과 상보적인 결합을 형성할 수 있다. 표 3 및 표 4에 기재된 가이드 서열은 표 1 및 표 2의 표적 서열을 각각 표적할 수 있는 가이드 서열이다. 또한, 표 3 및 표 4에 기재된 표적 이름(target name)은 에디터단백질에 따라 SpCas9의 경우 Sp를 기재하였고, SaCas9의 경우 Sa를 기재하였으며, 또한 CjCas9의 경우 Cj를 기재하여 구분하였다.
SERPINC 유전자(AT 유전자)를 표적할 수 있는 가이드 서열(Guide sequences capable of targeting SERPINC1 gene(AT gene))
Target name Loci. Guide sequence SEQ ID NO
hSerpinc1-Sp-1 Exon 01(E01) UCCUAUCACAUUGGAAUACA SEQ ID NO: 425
hSerpinc1-Sp-2 E01 GGUUACAGUUCCUAUCACAU SEQ ID NO: 426
hSerpinc1-Sp-3 E01 GCCAUGUAUUCCAAUGUGAU SEQ ID NO: 427
hSerpinc1-Sp-4 E01 GUGAUAGGAACUGUAACCUC SEQ ID NO: 428
hSerpinc1-Sp-5 E01 CCCCUCUUACCUUUUUCCAG SEQ ID NO: 429
hSerpinc1-Sp-6 E01 GAACUGUAACCUCUGGAAAA SEQ ID NO: 430
hSerpinc1-Sp-7 E02 CCAGAAGCCAAUGAGCAGCA SEQ ID NO: 431
hSerpinc1-Sp-8 E02 CUUUUGUCCUUGCUGCUCAU SEQ ID NO: 432
hSerpinc1-Sp-9 E02 CCUUGCUGCUCAUUGGCUUC SEQ ID NO: 433
hSerpinc1-Sp-10 E02 CUUGCUGCUCAUUGGCUUCU SEQ ID NO: 434
hSerpinc1-Sp-11 E02 UGGGACUGCGUGACCUGUCA SEQ ID NO: 435
hSerpinc1-Sp-12 E02 GGGACUGCGUGACCUGUCAC SEQ ID NO: 436
hSerpinc1-Sp-13 E02 GUCCACAGGGCUCCCGUGAC SEQ ID NO: 437
hSerpinc1-Sp-14 E02 GACCUGUCACGGGAGCCCUG SEQ ID NO: 438
hSerpinc1-Sp-15 E02 UGGCUGUGCAGAUGUCCACA SEQ ID NO: 439
hSerpinc1-Sp-16 E02 UUGGCUGUGCAGAUGUCCAC SEQ ID NO: 440
hSerpinc1-Sp-17 E02 ACAUCUGCACAGCCAAGCCG SEQ ID NO: 441
hSerpinc1-Sp-18 E02 CAUCUGCACAGCCAAGCCGC SEQ ID NO: 442
hSerpinc1-Sp-19 E02 CAUGGGAAUGUCCCGCGGCU SEQ ID NO: 443
hSerpinc1-Sp-20 E02 GGAUUCAUGGGAAUGUCCCG SEQ ID NO: 444
hSerpinc1-Sp-21 E02 UAAAUGCACAUGGGAUUCAU SEQ ID NO: 445
hSerpinc1-Sp-22 E02 GUAAAUGCACAUGGGAUUCA SEQ ID NO: 446
hSerpinc1-Sp-23 E02 GGGGAGCGGUAAAUGCACAU SEQ ID NO: 447
hSerpinc1-Sp-24 E02 CGGGGAGCGGUAAAUGCACA SEQ ID NO: 448
hSerpinc1-Sp-25 E02 CAUGUGCAUUUACCGCUCCC SEQ ID NO: 449
hSerpinc1-Sp-26 E02 UUGCCUUCUUCUCCGGGGAG SEQ ID NO: 450
hSerpinc1-Sp-27 E02 CUCAGUUGCCUUCUUCUCCG SEQ ID NO: 451
hSerpinc1-Sp-28 E02 CCUCAGUUGCCUUCUUCUCC SEQ ID NO: 452
hSerpinc1-Sp-29 E02 UCCUCAGUUGCCUUCUUCUC SEQ ID NO: 453
hSerpinc1-Sp-30 E02 UUACCGCUCCCCGGAGAAGA SEQ ID NO: 454
hSerpinc1-Sp-31 E02 CCCGGAGAAGAAGGCAACUG SEQ ID NO: 455
hSerpinc1-Sp-32 E02 GAAGAAGGCAACUGAGGAUG SEQ ID NO: 456
hSerpinc1-Sp-33 E02 AAGAAGGCAACUGAGGAUGA SEQ ID NO: 457
hSerpinc1-Sp-34 E02 GGGCUCAGAACAGAAGAUCC SEQ ID NO: 458
hSerpinc1-Sp-35 E02 CUCAGAACAGAAGAUCCCGG SEQ ID NO: 459
hSerpinc1-Sp-36 E02 CACGCCGGUUGGUGGCCUCC SEQ ID NO: 460
hSerpinc1-Sp-37 E02 ACACGCCGGUUGGUGGCCUC SEQ ID NO: 461
hSerpinc1-Sp-38 E02 AGAUCCCGGAGGCCACCAAC SEQ ID NO: 462
hSerpinc1-Sp-39 E02 UUCCCAGACACGCCGGUUGG SEQ ID NO: 463
hSerpinc1-Sp-40 E02 CAGUUCCCAGACACGCCGGU SEQ ID NO: 464
hSerpinc1-Sp-41 E02 UGGACAGUUCCCAGACACGC SEQ ID NO: 465
hSerpinc1-Sp-42 E02 AGGCCACCAACCGGCGUGUC SEQ ID NO: 466
hSerpinc1-Sp-43 E02 GGCCACCAACCGGCGUGUCU SEQ ID NO: 467
hSerpinc1-Sp-44 E02 GCGUGUCUGGGAACUGUCCA SEQ ID NO: 468
hSerpinc1-Sp-45 E02 AGCAAAGCGGGAAUUGGCCU SEQ ID NO: 469
hSerpinc1-Sp-46 E02 AGUGGUAGCAAAGCGGGAAU SEQ ID NO: 470
hSerpinc1-Sp-47 E02 AUAGAAAGUGGUAGCAAAGC SEQ ID NO: 471
hSerpinc1-Sp-48 E02 GAUAGAAAGUGGUAGCAAAG SEQ ID NO: 472
hSerpinc1-Sp-49 E02 UGCCAGGUGCUGAUAGAAAG SEQ ID NO: 473
hSerpinc1-Sp-50 E02 UACCACUUUCUAUCAGCACC SEQ ID NO: 474
hSerpinc1-Sp-51 E02 UGUCAUUCUUGGAAUCUGCC SEQ ID NO: 475
hSerpinc1-Sp-52 E02 AAUGUUAUCAUUGUCAUUCU SEQ ID NO: 476
hSerpinc1-Sp-53 E02 UGGAGAUACUCAGGGGUGAC SEQ ID NO: 477
hSerpinc1-Sp-54 E02 AAAGCCGUGGAGAUACUCAG SEQ ID NO: 478
hSerpinc1-Sp-55 E02 AAAAGCCGUGGAGAUACUCA SEQ ID NO: 479
hSerpinc1-Sp-56 E02 CAAAAGCCGUGGAGAUACUC SEQ ID NO: 480
hSerpinc1-Sp-57 E02 GUCACCCCUGAGUAUCUCCA SEQ ID NO: 481
hSerpinc1-Sp-58 E02 CUUGGUCAUAGCAAAAGCCG SEQ ID NO: 482
hSerpinc1-Sp-59 E02 GGCUUUUGCUAUGACCAAGC SEQ ID NO: 483
hSerpinc1-Sp-60 E02 GCUUUUGCUAUGACCAAGCU SEQ ID NO: 484
hSerpinc1-Sp-61 E02 GUCAUUACAGGCACCCAGCU SEQ ID NO: 485
hSerpinc1-Sp-62 E02 UUGCUGGAGGGUGUCAUUAC SEQ ID NO: 486
hSerpinc1-Sp-63 E02 UACCUCCAUCAGUUGCUGGA SEQ ID NO: 487
hSerpinc1-Sp-64 E02 GUACCUCCAUCAGUUGCUGG SEQ ID NO: 488
hSerpinc1-Sp-65 E02 GUCGUACCUCCAUCAGUUGC SEQ ID NO: 489
hSerpinc1-Sp-66 E02 UGACACCCUCCAGCAACUGA SEQ ID NO: 490
hSerpinc1-Sp-67 E02 CACCCUCCAGCAACUGAUGG SEQ ID NO: 491
hSerpinc1-Sp-68 E03 AUCAGAUGUUUUCUCAGAUA SEQ ID NO: 492
hSerpinc1-Sp-69 E03 UCAGUUUGGCAAAGAAGAAG SEQ ID NO: 493
hSerpinc1-Sp-70 E03 AUAGAGUCGGCAGUUCAGUU SEQ ID NO: 494
hSerpinc1-Sp-71 E03 UGUUGGCUUUUCGAUAGAGU SEQ ID NO: 495
hSerpinc1-Sp-72 E03 UACUAACUUGGAGGAUUUGU SEQ ID NO: 496
hSerpinc1-Sp-73 E03 AUUGGCUGAUACUAACUUGG SEQ ID NO: 497
hSerpinc1-Sp-74 E03 GCGAUUGGCUGAUACUAACU SEQ ID NO: 498
hSerpinc1-Sp-75 E03 UUUGUCUCCAAAAAGGCGAU SEQ ID NO: 499
hSerpinc1-Sp-76 E03 GUAUCAGCCAAUCGCCUUUU SEQ ID NO: 500
hSerpinc1-Sp-77 E03 UAAGGGAUUUGUCUCCAAAA SEQ ID NO: 501
hSerpinc1-Sp-78 E03 GUAGGUCUCAUUGAAGGUAA SEQ ID NO: 502
hSerpinc1-Sp-79 E03 GGUAGGUCUCAUUGAAGGUA SEQ ID NO: 503
hSerpinc1-Sp-80 E03 GUCCUGGUAGGUCUCAUUGA SEQ ID NO: 504
hSerpinc1-Sp-81 E03 UACCUUCAAUGAGACCUACC SEQ ID NO: 505
hSerpinc1-Sp-82 E03 CAACUCACUGAUGUCCUGGU SEQ ID NO: 506
hSerpinc1-Sp-83 E03 AUACCAACUCACUGAUGUCC SEQ ID NO: 507
hSerpinc1-Sp-84 E03 CUACCAGGACAUCAGUGAGU SEQ ID NO: 508
hSerpinc1-Sp-85 E03 GACAUCAGUGAGUUGGUAUA SEQ ID NO: 509
hSerpinc1-Sp-86 E03 GAAGUCCAGGGGCUGGAGCU SEQ ID NO: 510
hSerpinc1-Sp-87 E03 UGGAGCCAAGCUCCAGCCCC SEQ ID NO: 511
hSerpinc1-Sp-88 E03 UCACCUUGAAGUCCAGGGGC SEQ ID NO: 512
hSerpinc1-Sp-89 E03 CAACUCACCUUGAAGUCCAG SEQ ID NO: 513
hSerpinc1-Sp-90 E03 GCAACUCACCUUGAAGUCCA SEQ ID NO: 514
hSerpinc1-Sp-91 E03 UGCAACUCACCUUGAAGUCC SEQ ID NO: 515
hSerpinc1-Sp-92 E03 GCUCCAGCCCCUGGACUUCA SEQ ID NO: 516
hSerpinc1-Sp-93 E04 GAUUGCUCUGCAUUUUCCUG SEQ ID NO: 517
hSerpinc1-Sp-94 E04 AAAUGCAGAGCAAUCCAGAG SEQ ID NO: 518
hSerpinc1-Sp-95 E04 CCAUUUGUUGAUGGCCGCUC SEQ ID NO: 519
hSerpinc1-Sp-96 E04 AUUGGACACCCAUUUGUUGA SEQ ID NO: 520
hSerpinc1-Sp-97 E04 CCAGAGCGGCCAUCAACAAA SEQ ID NO: 521
hSerpinc1-Sp-98 E04 CAGAGCGGCCAUCAACAAAU SEQ ID NO: 522
hSerpinc1-Sp-99 E04 GAUUCGGCCUUCGGUCUUAU SEQ ID NO: 523
hSerpinc1-Sp-100 E04 UGGGUGUCCAAUAAGACCGA SEQ ID NO: 524
hSerpinc1-Sp-101 E04 GACAUCGGUGAUUCGGCCUU SEQ ID NO: 525
hSerpinc1-Sp-102 E04 AGGGAAUGACAUCGGUGAUU SEQ ID NO: 526
hSerpinc1-Sp-103 E04 GGCUUCCGAGGGAAUGACAU SEQ ID NO: 527
hSerpinc1-Sp-104 E04 AAUCACCGAUGUCAUUCCCU SEQ ID NO: 528
hSerpinc1-Sp-105 E04 AGCUCAUUGAUGGCUUCCGA SEQ ID NO: 529
hSerpinc1-Sp-106 E04 GAGCUCAUUGAUGGCUUCCG SEQ ID NO: 530
hSerpinc1-Sp-107 E04 CAGAACAGUGAGCUCAUUGA SEQ ID NO: 531
hSerpinc1-Sp-108 E04 CAUCAAUGAGCUCACUGUUC SEQ ID NO: 532
hSerpinc1-Sp-109 E04 UGAGCUCACUGUUCUGGUGC SEQ ID NO: 533
hSerpinc1-Sp-110 E04 UCUGAGUACCUUGAAGUAAA SEQ ID NO: 534
hSerpinc1-Sp-111 E04 GGUUAACACCAUUUACUUCA SEQ ID NO: 535
hSerpinc1-Sp-112 E05 ACUUUGACUUCCACAGGCCC SEQ ID NO: 536
hSerpinc1-Sp-113 E05 UGAUUCUCUUCCAGGGCCUG SEQ ID NO: 537
hSerpinc1-Sp-114 E05 GGCUGAACUUUGACUUCCAC SEQ ID NO: 538
hSerpinc1-Sp-115 E05 GUUCCUUCCUUGUGUUCUCA SEQ ID NO: 539
hSerpinc1-Sp-116 E05 AGUUCCUUCCUUGUGUUCUC SEQ ID NO: 540
hSerpinc1-Sp-117 E05 AGUUCAGCCCUGAGAACACA SEQ ID NO: 541
hSerpinc1-Sp-118 E05 CAGCCCUGAGAACACAAGGA SEQ ID NO: 542
hSerpinc1-Sp-119 E05 AAGGAAGGAACUGUUCUACA SEQ ID NO: 543
hSerpinc1-Sp-120 E05 GAACUGUUCUACAAGGCUGA SEQ ID NO: 544
hSerpinc1-Sp-121 E05 UUCAGCAUCUAUGAUGUACC SEQ ID NO: 545
hSerpinc1-Sp-122 E05 GCAUCUAUGAUGUACCAGGA SEQ ID NO: 546
hSerpinc1-Sp-123 E05 GAUAACGGAACUUGCCUUCC SEQ ID NO: 547
hSerpinc1-Sp-124 E05 AGGAAGGCAAGUUCCGUUAU SEQ ID NO: 548
hSerpinc1-Sp-125 E05 CUUCAGCCACGCGCCGAUAA SEQ ID NO: 549
hSerpinc1-Sp-126 E05 CAAGUUCCGUUAUCGGCGCG SEQ ID NO: 550
hSerpinc1-Sp-127 E05 CGUUAUCGGCGCGUGGCUGA SEQ ID NO: 551
hSerpinc1-Sp-128 E05 GCGCGUGGCUGAAGGCACCC SEQ ID NO: 552
hSerpinc1-Sp-129 E05 GAAGGGCAACUCAAGCACCU SEQ ID NO: 553
hSerpinc1-Sp-130 E05 UGAAGGGCAACUCAAGCACC SEQ ID NO: 554
hSerpinc1-Sp-131 E05 GUGCUUGAGUUGCCCUUCAA SEQ ID NO: 555
hSerpinc1-Sp-132 E05 GUGAUGUCAUCACCUUUGAA SEQ ID NO: 556
hSerpinc1-Sp-133 E05 GGUGAUGUCAUCACCUUUGA SEQ ID NO: 557
hSerpinc1-Sp-134 E05 CAAAGGUGAUGACAUCACCA SEQ ID NO: 558
hSerpinc1-Sp-135 E05 CUUGGGCAAGAUGAGGACCA SEQ ID NO: 559
hSerpinc1-Sp-136 E05 UCUCAGGCUUGGGCAAGAUG SEQ ID NO: 560
hSerpinc1-Sp-137 E05 GCCAGGCUCUUCUCAGGCUU SEQ ID NO: 561
hSerpinc1-Sp-138 E05 GGCCAGGCUCUUCUCAGGCU SEQ ID NO: 562
hSerpinc1-Sp-139 E05 ACCUUGGCCAGGCUCUUCUC SEQ ID NO: 563
hSerpinc1-Sp-140 E05 GCCCAAGCCUGAGAAGAGCC SEQ ID NO: 564
hSerpinc1-Sp-141 E05 GCCUGAGAAGAGCCUGGCCA SEQ ID NO: 565
hSerpinc1-Sp-142 E05 GUUCCUUCUCUACCUUGGCC SEQ ID NO: 566
hSerpinc1-Sp-143 E05 GGUGAGUUCCUUCUCUACCU SEQ ID NO: 567
hSerpinc1-Sp-144 E05 GAGCCUGGCCAAGGUAGAGA SEQ ID NO: 568
hSerpinc1-Sp-145 E05 AGAGAAGGAACUCACCCCAG SEQ ID NO: 569
hSerpinc1-Sp-146 E05 CCACUCUUGCAGCACCUCUG SEQ ID NO: 570
hSerpinc1-Sp-147 E05 GCCACUCUUGCAGCACCUCU SEQ ID NO: 571
hSerpinc1-Sp-148 E05 AGCCACUCUUGCAGCACCUC SEQ ID NO: 572
hSerpinc1-Sp-149 E05 CCCCAGAGGUGCUGCAAGAG SEQ ID NO: 573
hSerpinc1-Sp-150 E05 AGAGGUGCUGCAAGAGUGGC SEQ ID NO: 574
hSerpinc1-Sp-151 E05 GCAAGAGUGGCUGGAUGAAU SEQ ID NO: 575
hSerpinc1-Sp-152 E05 AGAGUGGCUGGAUGAAUUGG SEQ ID NO: 576
hSerpinc1-Sp-153 E05 UGAAUUGGAGGAGAUGAUGC SEQ ID NO: 577
hSerpinc1-Sp-154 E05 AUUGGAGGAGAUGAUGCUGG SEQ ID NO: 578
hSerpinc1-Sp-155 E05 CAAUGCGGAAGCGGGGCAUG SEQ ID NO: 579
hSerpinc1-Sp-156 E05 CCGUCCUCAAUGCGGAAGCG SEQ ID NO: 580
hSerpinc1-Sp-157 E05 GCCGUCCUCAAUGCGGAAGC SEQ ID NO: 581
hSerpinc1-Sp-158 E05 AGCCGUCCUCAAUGCGGAAG SEQ ID NO: 582
hSerpinc1-Sp-159 E05 CAUGCCCCGCUUCCGCAUUG SEQ ID NO: 583
hSerpinc1-Sp-160 E05 AACUGAAGCCGUCCUCAAUG SEQ ID NO: 584
hSerpinc1-Sp-161 E05 CCCCGCUUCCGCAUUGAGGA SEQ ID NO: 585
hSerpinc1-Sp-162 E05 UGAGGACGGCUUCAGUUUGA SEQ ID NO: 586
hSerpinc1-Sp-163 E05 GAAGGAGCAGCUGCAAGACA SEQ ID NO: 587
hSerpinc1-Sp-164 E05 AAGGAGCAGCUGCAAGACAU SEQ ID NO: 588
hSerpinc1-Sp-165 E05 CAGGGCUGAACAGAUCGACA SEQ ID NO: 589
hSerpinc1-Sp-166 E05 CUGGGAGUUUGGACUUUUCA SEQ ID NO: 590
hSerpinc1-Sp-167 E05 CCUGGGAGUUUGGACUUUUC SEQ ID NO: 591
hSerpinc1-Sp-168 E05 CCUAGACAAACCUGGGAGUU SEQ ID NO: 592
hSerpinc1-Sp-169 E05 CCUGAAAAGUCCAAACUCCC SEQ ID NO: 593
hSerpinc1-Sp-170 E06 CGGCCUUCUGCAACAAUACC SEQ ID NO: 594
hSerpinc1-Sp-171 E06 CUUCCAGGUAUUGUUGCAGA SEQ ID NO: 595
hSerpinc1-Sp-172 E06 CUGAGACAUAGAGGUCAUCU SEQ ID NO: 596
hSerpinc1-Sp-173 E06 GGAAUGCAUCUGAGACAUAG SEQ ID NO: 597
hSerpinc1-Sp-174 E06 UGUCUCAGAUGCAUUCCAUA SEQ ID NO: 598
hSerpinc1-Sp-175 E06 UCACCUCAAGAAAUGCCUUA SEQ ID NO: 599
hSerpinc1-Sp-176 E06 AUUCCAUAAGGCAUUUCUUG SEQ ID NO: 600
hSerpinc1-Sp-177 E07 GACCUGCAGGUAAAUGAAGA SEQ ID NO: 601
hSerpinc1-Sp-178 E07 ACGGCCAGCAAUCACAACAG SEQ ID NO: 602
hSerpinc1-Sp-179 E07 AGUACCGCUGUUGUGAUUGC SEQ ID NO: 603
hSerpinc1-Sp-180 E07 CCCUGUUGGGGUUUAGCGAA SEQ ID NO: 604
hSerpinc1-Sp-181 E07 GCCGUUCGCUAAACCCCAAC SEQ ID NO: 605
hSerpinc1-Sp-182 E07 CCGUUCGCUAAACCCCAACA SEQ ID NO: 606
hSerpinc1-Sp-183 E07 CCUUGAAAGUCACCCUGUUG SEQ ID NO: 607
hSerpinc1-Sp-184 E07 GCCUUGAAAGUCACCCUGUU SEQ ID NO: 608
hSerpinc1-Sp-185 E07 GGCCUUGAAAGUCACCCUGU SEQ ID NO: 609
hSerpinc1-Sp-186 E07 CCCCAACAGGGUGACUUUCA SEQ ID NO: 610
hSerpinc1-Sp-187 E07 GGGUGACUUUCAAGGCCAAC SEQ ID NO: 611
hSerpinc1-Sp-188 E07 AAAAACCAGGAAAGGCCUGU SEQ ID NO: 612
hSerpinc1-Sp-189 E07 CAAGGCCAACAGGCCUUUCC SEQ ID NO: 613
hSerpinc1-Sp-190 E07 UCUCUUAUAAAAACCAGGAA SEQ ID NO: 614
hSerpinc1-Sp-191 E07 GAACUUCUCUUAUAAAAACC SEQ ID NO: 615
hSerpinc1-Sp-192 E07 AUGAAGAUAAUAGUGUUCAG SEQ ID NO: 616
hSerpinc1-Sp-193 E07 UCUGAACACUAUUAUCUUCA SEQ ID NO: 617
hSerpinc1-Sp-194 E07 CUGAACACUAUUAUCUUCAU SEQ ID NO: 618
hSerpinc1-Sp-195 E07 AUUUUACUUAACACAAGGGU SEQ ID NO: 619
hSerpinc1-Sp-196 E07 GAACAUUUUACUUAACACAA SEQ ID NO: 620
hSerpinc1-Sp-197 E07 AGAACAUUUUACUUAACACA SEQ ID NO: 621
hSerpinc1-Sa-1 E01 GGUUACAGUUCCUAUCACAU SEQ ID NO: 622
hSerpinc1-Sa-2 E02 CCAAGCCGCGGGACAUUCCC SEQ ID NO: 623
hSerpinc1-Sa-3 E02 UAAAUGCACAUGGGAUUCAU SEQ ID NO: 624
hSerpinc1-Sa-4 E02 CGGGGAGCGGUAAAUGCACA SEQ ID NO: 625
hSerpinc1-Sa-5 E02 CCCCGGAGAAGAAGGCAACU SEQ ID NO: 626
hSerpinc1-Sa-6 E02 ACACGCCGGUUGGUGGCCUC SEQ ID NO: 627
hSerpinc1-Sa-7 E02 AUAGAAAGUGGUAGCAAAGC SEQ ID NO: 628
hSerpinc1-Sa-8 E02 AUCAGCACCUGGCAGAUUCC SEQ ID NO: 629
hSerpinc1-Sa-9 E02 AAUGUUAUCAUUGUCAUUCU SEQ ID NO: 630
hSerpinc1-Sa-10 E02 AUAACAUUUUCCUGUCACCC SEQ ID NO: 631
hSerpinc1-Sa-11 E02 CAAAAGCCGUGGAGAUACUC SEQ ID NO: 632
hSerpinc1-Sa-12 E02 CGGCUUUUGCUAUGACCAAG SEQ ID NO: 633
hSerpinc1-Sa-13 E02 CGUACCUCCAUCAGUUGCUG SEQ ID NO: 634
hSerpinc1-Sa-14 E03 UUCAGUUUGGCAAAGAAGAA SEQ ID NO: 635
hSerpinc1-Sa-15 E03 AGGAUUUGUUGGCUUUUCGA SEQ ID NO: 636
hSerpinc1-Sa-16 E03 GAUUGGCUGAUACUAACUUG SEQ ID NO: 637
hSerpinc1-Sa-17 E03 GGUAGGUCUCAUUGAAGGUA SEQ ID NO: 638
hSerpinc1-Sa-18 E03 UGAGACCUACCAGGACAUCA SEQ ID NO: 639
hSerpinc1-Sa-19 E03 UCCAGCCCCUGGACUUCAAG SEQ ID NO: 640
hSerpinc1-Sa-20 E04 CCCAUUUGUUGAUGGCCGCU SEQ ID NO: 641
hSerpinc1-Sa-21 E04 UCCAGAGCGGCCAUCAACAA SEQ ID NO: 642
hSerpinc1-Sa-22 E04 GUGUCCAAUAAGACCGAAGG SEQ ID NO: 643
hSerpinc1-Sa-23 E04 AGCUCAUUGAUGGCUUCCGA SEQ ID NO: 644
hSerpinc1-Sa-24 E05 ACUGUUCUACAAGGCUGAUG SEQ ID NO: 645
hSerpinc1-Sa-25 E05 GGCUGAAGGCACCCAGGUGC SEQ ID NO: 646
hSerpinc1-Sa-26 E05 UUGAAGGGCAACUCAAGCAC SEQ ID NO: 647
hSerpinc1-Sa-27 E05 ACUCUUGCAGCACCUCUGGG SEQ ID NO: 648
hSerpinc1-Sa-28 E05 AGCCACUCUUGCAGCACCUC SEQ ID NO: 649
hSerpinc1-Sa-29 E05 ACUCACCCCAGAGGUGCUGC SEQ ID NO: 650
hSerpinc1-Sa-30 E05 CAGAGGUGCUGCAAGAGUGG SEQ ID NO: 651
hSerpinc1-Sa-31 E05 GGUGCUGCAAGAGUGGCUGG SEQ ID NO: 652
hSerpinc1-Sa-32 E06 UCACCUCAAGAAAUGCCUUA SEQ ID NO: 653
hSerpinc1-Sa-33 E06 UCCAUAAGGCAUUUCUUGAG SEQ ID NO: 654
hSerpinc1-Sa-34 E07 GGCCGUUCGCUAAACCCCAA SEQ ID NO: 655
hSerpinc1-Sa-35 E07 GGCCUUGAAAGUCACCCUGU SEQ ID NO: 656
hSerpinc1-Sa-36 E07 AACACUAUUAUCUUCAUGGG SEQ ID NO: 657
hSerpinc1-Sa-37 E07 AAGAACAUUUUACUUAACAC SEQ ID NO: 658
hSerpinc1-Cj-1 E01 GAGGUUACAGUUCCUAUCACAU SEQ ID NO: 659
hSerpinc1-Cj-2 E02 CUGUCACGGGAGCCCUGUGGAC SEQ ID NO: 660
hSerpinc1-Cj-3 E02 GCCUUCUUCUCCGGGGAGCGGU SEQ ID NO: 661
hSerpinc1-Cj-4 E02 GGGAAUUGGCCUUGGACAGUUC SEQ ID NO: 662
hSerpinc1-Cj-5 E02 UCCCGCUUUGCUACCACUUUCU SEQ ID NO: 663
hSerpinc1-Cj-6 E02 GCUUGGUCAUAGCAAAAGCCGU SEQ ID NO: 664
hSerpinc1-Cj-7 E02 UAUGACCAAGCUGGGUGCCUGU SEQ ID NO: 665
hSerpinc1-Cj-8 E02 UCAGUUGCUGGAGGGUGUCAUU SEQ ID NO: 666
hSerpinc1-Cj-9 E02 AUGACACCCUCCAGCAACUGAU SEQ ID NO: 667
hSerpinc1-Cj-10 E03 UUGACUUCUAUAGGUAUUUAAG SEQ ID NO: 668
hSerpinc1-Cj-11 E03 UUUCUCAGAUAUGGUGUCAAAC SEQ ID NO: 669
hSerpinc1-Cj-12 E03 UUUGUCUCCAAAAAGGCGAUUG SEQ ID NO: 670
hSerpinc1-Cj-13 E03 GUCCAGGGGCUGGAGCUUGGCU SEQ ID NO: 671
hSerpinc1-Cj-14 E04 GGUGAUUCGGCCUUCGGUCUUA SEQ ID NO: 672
hSerpinc1-Cj-15 E04 UGAGCUCACUGUUCUGGUGCUG SEQ ID NO: 673
hSerpinc1-Cj-16 E04 UACCUUGAAGUAAAUGGUGUUA SEQ ID NO: 674
hSerpinc1-Cj-17 E04 UGCUGGUUAACACCAUUUACUU SEQ ID NO: 675
hSerpinc1-Cj-18 E05 GUGGAAGUCAAAGUUCAGCCCU SEQ ID NO: 676
hSerpinc1-Cj-19 E05 GGAGAGUCGUGUUCAGCAUCUA SEQ ID NO: 677
hSerpinc1-Cj-20 E05 CCUUCCUGGUACAUCAUAGAUG SEQ ID NO: 678
hSerpinc1-Cj-21 E05 CGCCGAUAACGGAACUUGCCUU SEQ ID NO: 679
hSerpinc1-Cj-22 E05 GUUCCGUUAUCGGCGCGUGGCU SEQ ID NO: 680
hSerpinc1-Cj-23 E05 GUCAUCACCUUUGAAGGGCAAC SEQ ID NO: 681
hSerpinc1-Cj-24 E05 CUCCAAUUCAUCCAGCCACUCU SEQ ID NO: 682
hSerpinc1-Cj-25 E06 AGAGGUCAUCUCGGCCUUCUGC SEQ ID NO: 683
hSerpinc1-Cj-26 E06 AUUCCAUAAGGCAUUUCUUGAG SEQ ID NO: 684
hSerpinc1-Cj-27 E07 UGAAGAAGGCAGUGAAGCAGCU SEQ ID NO: 685
hSerpinc1-Cj-28 E07 GCGAACGGCCAGCAAUCACAAC SEQ ID NO: 686
hSerpinc1-Cj-29 E07 GGUUUUUAUAAGAGAAGUUCCU SEQ ID NO: 687
hSerpinc1-Cj-30 E07 UGCAAAGAAUAAGAACAUUUUA SEQ ID NO: 688
TFPI 유전자를 표적할 수 있는 가이드 서열(Guide sequences capable of targeting TFPI gene)
Target name Loci. Guide sequence SEQ ID NO
hTfpi-Sp-1 E02 UGAAGAAAGUACAUGCACUU SEQ ID NO: 689
hTfpi-Sp-2 E02 GAAGAAAGUACAUGCACUUU SEQ ID NO: 690
hTfpi-Sp-3 E02 CAGGGGCAAGAUUAAGCAGC SEQ ID NO: 691
hTfpi-Sp-4 E02 AUCAGCAUUAAGAGGGGCAG SEQ ID NO: 692
hTfpi-Sp-5 E02 AAUCAGCAUUAAGAGGGGCA SEQ ID NO: 693
hTfpi-Sp-6 E02 GAAUCAGCAUUAAGAGGGGC SEQ ID NO: 694
hTfpi-Sp-7 E02 CUCAGAAUCAGCAUUAAGAG SEQ ID NO: 695
hTfpi-Sp-8 E02 CCUCAGAAUCAGCAUUAAGA SEQ ID NO: 696
hTfpi-Sp-9 E02 UCCUCAGAAUCAGCAUUAAG SEQ ID NO: 697
hTfpi-Sp-10 E02 CCCUCUUAAUGCUGAUUCUG SEQ ID NO: 698
hTfpi-Sp-11 E02 GAAGAACACACAAUUAUCAC SEQ ID NO: 699
hTfpi-Sp-12 E03 UUAUUUUUACUUUAUAGAUA SEQ ID NO: 700
hTfpi-Sp-13 E03 GAAUGCAUAAGUUUCAGUGG SEQ ID NO: 701
hTfpi-Sp-14 E03 AAUGAAUGCAUAAGUUUCAG SEQ ID NO: 702
hTfpi-Sp-15 E03 GCAUUCAUUUUGUGCAUUCA SEQ ID NO: 703
hTfpi-Sp-16 E03 UUCAUUUUGUGCAUUCAAGG SEQ ID NO: 704
hTfpi-Sp-17 E03 UGUGCAUUCAAGGCGGAUGA SEQ ID NO: 705
hTfpi-Sp-18 E03 UUUUCAUGAUUGCUUUACAU SEQ ID NO: 706
hTfpi-Sp-19 E03 CUUUUCAUGAUUGCUUUACA SEQ ID NO: 707
hTfpi-Sp-20 E03 CAGUGCGAAGAAUUUAUAUA SEQ ID NO: 708
hTfpi-Sp-21 E03 AGUGCGAAGAAUUUAUAUAU SEQ ID NO: 709
hTfpi-Sp-22 E03 GUGCGAAGAAUUUAUAUAUG SEQ ID NO: 710
hTfpi-Sp-23 E03 UGCGAAGAAUUUAUAUAUGG SEQ ID NO: 711
hTfpi-Sp-24 E03 UUUAUAUAUGGGGGAUGUGA SEQ ID NO: 712
hTfpi-Sp-25 E03 UCAGAAUCGAUUUGAAAGUC SEQ ID NO: 713
hTfpi-Sp-26 E03 UGCAAAAAAAUGUGUACAAG SEQ ID NO: 714
hTfpi-Sp-27 E03 AAAAAAUGUGUACAAGAGGU SEQ ID NO: 715
hTfpi-Sp-28 E04 UGAUUACAGAUAAUGCAAAC SEQ ID NO: 716
hTfpi-Sp-29 E04 AUAAAGACAACAUUGCAACA SEQ ID NO: 717
hTfpi-Sp-30 E05 UCUUCCAAAAAGCAGAAAUC SEQ ID NO: 718
hTfpi-Sp-31 E05 AAAGCCAGAUUUCUGCUUUU SEQ ID NO: 719
hTfpi-Sp-32 E05 UGCUUUUUGGAAGAAGAUCC SEQ ID NO: 720
hTfpi-Sp-33 E05 AUAUAACCUCGACAUAUUCC SEQ ID NO: 721
hTfpi-Sp-34 E05 GAAGAUCCUGGAAUAUGUCG SEQ ID NO: 722
hTfpi-Sp-35 E05 UAUGUCGAGGUUAUAUUACC SEQ ID NO: 723
hTfpi-Sp-36 E05 CUGAUUGUUAUAAAAAUACC SEQ ID NO: 724
hTfpi-Sp-37 E05 CAGUGUGAACGUUUCAAGUA SEQ ID NO: 725
hTfpi-Sp-38 E05 UGUGAACGUUUCAAGUAUGG SEQ ID NO: 726
hTfpi-Sp-39 E05 UUUCAAGUAUGGUGGAUGCC SEQ ID NO: 727
hTfpi-Sp-40 E05 UUCAAGUAUGGUGGAUGCCU SEQ ID NO: 728
hTfpi-Sp-41 E05 CAAAAUUGUUCAUAUUGCCC SEQ ID NO: 729
hTfpi-Sp-42 E05 UAUGAACAAUUUUGAGACAC SEQ ID NO: 730
hTfpi-Sp-43 E05 UGCAAGAACAUUUGUGAAGA SEQ ID NO: 731
hTfpi-Sp-44 E06 CUGUAUUUUUUUCCAGCGAA SEQ ID NO: 732
hTfpi-Sp-45 E06 UCCACCUGGAAACCAUUCGC SEQ ID NO: 733
hTfpi-Sp-46 E06 UUUUCCAGCGAAUGGUUUCC SEQ ID NO: 734
hTfpi-Sp-47 E06 UCCAGCGAAUGGUUUCCAGG SEQ ID NO: 735
hTfpi-Sp-48 E06 GGGUUCCAUAAUUAUCCACC SEQ ID NO: 736
hTfpi-Sp-49 E06 GGUUUCCAGGUGGAUAAUUA SEQ ID NO: 737
hTfpi-Sp-50 E06 GUUAUUCACAGCAUUGAGCU SEQ ID NO: 738
hTfpi-Sp-51 E06 AGUUAUUCACAGCAUUGAGC SEQ ID NO: 739
hTfpi-Sp-52 E06 CUUGGUUGAUUGCGGAGUCA SEQ ID NO: 740
hTfpi-Sp-53 E06 CCUUGGUUGAUUGCGGAGUC SEQ ID NO: 741
hTfpi-Sp-54 E06 CUGGGAACCUUGGUUGAUUG SEQ ID NO: 742
hTfpi-Sp-55 E06 CCUGACUCCGCAAUCAACCA SEQ ID NO: 743
hTfpi-Sp-56 E06 ACCAAAAAGGCUGGGAACCU SEQ ID NO: 744
hTfpi-Sp-57 E06 AGAUUCUUACCAAAAAGGCU SEQ ID NO: 745
hTfpi-Sp-58 E06 AAGAUUCUUACCAAAAAGGC SEQ ID NO: 746
hTfpi-Sp-59 E06 ACCAAGGUUCCCAGCCUUUU SEQ ID NO: 747
hTfpi-Sp-60 E06 CCACAAGAUUCUUACCAAAA SEQ ID NO: 748
hTfpi-Sp-61 E06 CCUUUUUGGUAAGAAUCUUG SEQ ID NO: 749
hTfpi-Sp-62 E07 GUGAAAUUCUAAAAACAAUC SEQ ID NO: 750
hTfpi-Sp-63 E07 UGAUUGUUUUUAGAAUUUCA SEQ ID NO: 751
hTfpi-Sp-64 E07 UAGAAUUUCACGGUCCCUCA SEQ ID NO: 752
hTfpi-Sp-65 E07 GCUGGAGUGAGACACCAUGA SEQ ID NO: 753
hTfpi-Sp-66 E07 UGCUGGAGUGAGACACCAUG SEQ ID NO: 754
hTfpi-Sp-67 E07 CGACACAAUCCUCUGUCUGC SEQ ID NO: 755
hTfpi-Sp-68 E07 UGUCUCACUCCAGCAGACAG SEQ ID NO: 756
hTfpi-Sp-69 E07 GUAGUAGAAUCUGUUCUCAU SEQ ID NO: 757
hTfpi-Sp-70 E07 UUCUACUACAAUUCAGUCAU SEQ ID NO: 758
hTfpi-Sp-71 E07 UCUACUACAAUUCAGUCAUU SEQ ID NO: 759
hTfpi-Sp-72 E07 AUCCACUGUACUUAAAUGGG SEQ ID NO: 760
hTfpi-Sp-73 E07 CACAUCCACUGUACUUAAAU SEQ ID NO: 761
hTfpi-Sp-74 E07 CCACAUCCACUGUACUUAAA SEQ ID NO: 762
hTfpi-Sp-75 E07 UGCCGCCCAUUUAAGUACAG SEQ ID NO: 763
hTfpi-Sp-76 E07 CCAUUUAAGUACAGUGGAUG SEQ ID NO: 764
hTfpi-Sp-77 E07 CAUUUAAGUACAGUGGAUGU SEQ ID NO: 765
hTfpi-Sp-78 E07 AUUUAAGUACAGUGGAUGUG SEQ ID NO: 766
hTfpi-Sp-79 E07 UUUAAGUACAGUGGAUGUGG SEQ ID NO: 767
hTfpi-Sp-80 E07 UGCCCUCAGACAUUCUUGUU SEQ ID NO: 768
hTfpi-Sp-81 E07 CUUCCAAACAAGAAUGUCUG SEQ ID NO: 769
hTfpi-Sp-82 E07 UUCCAAACAAGAAUGUCUGA SEQ ID NO: 770
hTfpi-Sp-83 E07 UGUCUGAGGGCAUGUAAAAA SEQ ID NO: 771
hTfpi-Sp-84 E08 AUGAAACCUAUAAGAGGAAG SEQ ID NO: 772
hTfpi-Sp-85 E08 CUUUGGAUGAAACCUAUAAG SEQ ID NO: 773
hTfpi-Sp-86 E08 GGCCUCCUUUUGAUAUUCUU SEQ ID NO: 774
hTfpi-Sp-87 E08 UUCAUCCAAAGAAUAUCAAA SEQ ID NO: 775
hTfpi-Sp-88 E08 AUCCAAAGAAUAUCAAAAGG SEQ ID NO: 776
hTfpi-Sp-89 E08 UUUUUCUUUUGGUUUUAAUU SEQ ID NO: 777
hTfpi-Sp-90 E08 CUGCUUCUUUCUUUUUCUUU SEQ ID NO: 778
hTfpi-Sa-1 E02 UGUGUGUUCUUCAUCUUCCU SEQ ID NO: 779
hTfpi-Sa-2 E03 UUAUUUUUACUUUAUAGAUA SEQ ID NO: 780
hTfpi-Sa-3 E03 AUCCGCCUUGAAUGCACAAA SEQ ID NO: 781
hTfpi-Sa-4 E03 AUUCAUUUUGUGCAUUCAAG SEQ ID NO: 782
hTfpi-Sa-5 E03 UACAUGGGCCAUCAUCCGCC SEQ ID NO: 783
hTfpi-Sa-6 E03 UAUAUAAAUUCUUCGCACUG SEQ ID NO: 784
hTfpi-Sa-7 E03 UAUUUUCACUCGACAGUGCG SEQ ID NO: 785
hTfpi-Sa-8 E03 GUGCGAAGAAUUUAUAUAUG SEQ ID NO: 786
hTfpi-Sa-9 E03 AUGGGGGAUGUGAAGGAAAU SEQ ID NO: 787
hTfpi-Sa-10 E03 GAAUCGAUUUGAAAGUCUGG SEQ ID NO: 788
hTfpi-Sa-11 E04 UUGAUUACAGAUAAUGCAAA SEQ ID NO: 789
hTfpi-Sa-12 E05 UGCUUUUUGGAAGAAGAUCC SEQ ID NO: 790
hTfpi-Sa-13 E05 AAUAUAACCUCGACAUAUUC SEQ ID NO: 791
hTfpi-Sa-14 E05 GUGUGAACGUUUCAAGUAUG SEQ ID NO: 792
hTfpi-Sa-15 E05 GAACAAUUUUGAGACACUGG SEQ ID NO: 793
hTfpi-Sa-16 E06 UUCCAGCGAAUGGUUUCCAG SEQ ID NO: 794
hTfpi-Sa-17 E06 GAGUUAUUCACAGCAUUGAG SEQ ID NO: 795
hTfpi-Sa-18 E06 AUGGAACCCAGCUCAAUGCU SEQ ID NO: 796
hTfpi-Sa-19 E06 CUUGGUUGAUUGCGGAGUCA SEQ ID NO: 797
hTfpi-Sa-20 E06 CUGGGAACCUUGGUUGAUUG SEQ ID NO: 798
hTfpi-Sa-21 E06 AGGUUCCCAGCCUUUUUGGU SEQ ID NO: 799
hTfpi-Sa-22 E07 CGACACAAUCCUCUGUCUGC SEQ ID NO: 800
hTfpi-Sa-23 E07 GUGUCUCACUCCAGCAGACA SEQ ID NO: 801
hTfpi-Sa-24 E07 UCCCAAUGACUGAAUUGUAG SEQ ID NO: 802
hTfpi-Sa-25 E07 UGGGCGGCAUUUCCCAAUGA SEQ ID NO: 803
hTfpi-Sa-26 E07 AUGCCGCCCAUUUAAGUACA SEQ ID NO: 804
hTfpi-Sa-27 E07 AAACAAUUUUACUUCCAAAC SEQ ID NO: 805
hTfpi-Sa-28 E08 CCUCUUAUAGGUUUCAUCCA SEQ ID NO: 806
hTfpi-Sa-29 E08 AGGCCUCCUUUUGAUAUUCU SEQ ID NO: 807
hTfpi-Sa-30 E08 GAAAUUUUUGUUAAAAAUAU SEQ ID NO: 808
hTfpi-Cj-1 E02 UGGGUUCUGUAUUUCAGAGAUG SEQ ID NO: 809
hTfpi-Cj-2 E02 UCUUCAUUGUGUAAAUCAUCUC SEQ ID NO: 810
hTfpi-Cj-3 E02 CAGAGAUGAUUUACACAAUGAA SEQ ID NO: 811
hTfpi-Cj-4 E02 UGAUUUACACAAUGAAGAAAGU SEQ ID NO: 812
hTfpi-Cj-5 E02 CAGGCAUACAGAAGCCCAAAGU SEQ ID NO: 813
hTfpi-Cj-6 E02 GGCAGGGGCAAGAUUAAGCAGC SEQ ID NO: 814
hTfpi-Cj-7 E02 AAUGCUGAUUCUGAGGAAGAUG SEQ ID NO: 815
hTfpi-Cj-8 E02 UGCUGAUUCUGAGGAAGAUGAA SEQ ID NO: 816
hTfpi-Cj-9 E03 UACAUGGGCCAUCAUCCGCCUU SEQ ID NO: 817
hTfpi-Cj-10 E03 UCACAUCCCCCAUAUAUAAAUU SEQ ID NO: 818
hTfpi-Cj-11 E03 AAGUCUGGAAGAGUGCAAAAAA SEQ ID NO: 819
hTfpi-Cj-12 E03 AACCUACCUCUUGUACACAUUU SEQ ID NO: 820
hTfpi-Cj-13 E03 AGGGUUCCCAGAAACCUACCUC SEQ ID NO: 821
hTfpi-Cj-14 E05 CACUGUUUUGUCUGAUUGUUAU SEQ ID NO: 822
hTfpi-Cj-15 E05 AGGCAUCCACCAUACUUGAAAC SEQ ID NO: 823
hTfpi-Cj-16 E05 UUGUUCAUAUUGCCCAGGCAUC SEQ ID NO: 824
hTfpi-Cj-17 E05 GCCUGGGCAAUAUGAACAAUUU SEQ ID NO: 825
hTfpi-Cj-18 E07 CACAAUCCUCUGUCUGCUGGAG SEQ ID NO: 826
hTfpi-Cj-19 E07 UAGUAGAAUCUGUUCUCAUUGG SEQ ID NO: 827
hTfpi-Cj-20 E07 AAUUGUAGUAGAAUCUGUUCUC SEQ ID NO: 828
hTfpi-Cj-21 E07 GUCAUUGGGAAAUGCCGCCCAU SEQ ID NO: 829
hTfpi-Cj-22 E07 UUGUUUUCAUUUCCCCCACAUC SEQ ID NO: 830
본 명세서에 의해 개시되는 내용의 일 태양은 혈액 응고 저해 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물에 관한 것이다.
상기 유전자 조작용 조성물은 인위적으로 조작된 혈액 응고 저해 유전자의 생성에 이용될 수 있다. 또한, 상기 유전자 조작용 조성물에 의해 인위적으로 조작된 혈액 응고 저해 유전자는 혈액 응고 시스템을 조절할 수 있다.
“인위적으로 조작된(artificially modified or engineered or artificially engineered)”이라는 용어는 자연상태에서 일어나는 존재 그대로의 상태가 아닌, 인위적으로 변형을 가한 상태를 의미한다. 이하에서, 비자연적인 인위적으로 조작된 또는 변형된 혈액 응고 저해 유전자는 인위적인 혈액 응고 저해 유전자라는 용어와 혼용하여 사용할 수 있다.
유전자 조작은 유전자 발현 조절 과정을 고려하여 이루어질 수 있다.
구현예에서, 전사조절, RNA 가공 조절, RNA 수송 조절, RNA 분해 조절, 번역 조절 또는 단백질 변형 조절 단계에서 각 단계에 적합한 조작수단을 선택하여 이루어질 수 있다.
예를 들어, RNAi (RNA 간섭 or RNA silencing)을 이용하여, small RNA(sRNA)가 mRNA를 방해하거나 안정성을 저하시키며, 경우에 따라서는 파괴하여 단백질 합성정보가 중간에서 전달되지 못하게 함으로써 유전정보의 발현을 제어할 수 있다.
구현예에서, 유전자 조작은 DNA 또는 RNA 분자, 바람직하게는 DNA 분자 내 핵산들 사이의 결합들(bonds)의 가수분해(절단(cleavage))을 촉매화할 수 있는 야생형 또는 변종(variant) 효소를 이용할 수 있다. 가이드핵산-에디터단백질 복합체를 이용할 수 있다.
예를 들어, 메가뉴클레아제(meganuclease), 징크핑거(Zinc finger) 뉴클레아제, CRISPR/Cas9(Cas9 단백질), CRISPR-Cpf1(Cpf1 단백질) 및 TALE-뉴클레아제로 이루어진 군에서 선택된 하나 이상의 뉴클레아제를 이용하여 유전자를 조작하여 유전정보의 발현을 제어할 수 있다.
본 명세서에 의해 개시되는 유전자 조작용 조성물은 가이드핵산 및 에디터단백질을 포함할 수 있다.
일 구체예로서, 유전자 조작용 조성물은
(a) 혈액 응고 저해 유전자의 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 하나 이상의 에디터단백질 또는 이를 암호화하는 핵산서열
을 포함할 수 있다.
상기 혈액 응고 저해 유전자 관련 설명은 상기 기술한 바와 같다.
상기 표적 서열 관련 설명을 상기 기술한 바와 같다.
다른 일 구체예로서, 유전자 조작용 조성물은
(a) 혈액 응고 저해 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 하나 이상의 에디터단백질 또는 이를 암호화하는 핵산서열
을 포함할 수 있다.
상기 혈액 응고 저해 유전자 관련 설명은 상기 기술한 바와 같다.
상기 표적 서열 관련 설명은 상기 기술한 바와 같다.
상기 가이드 서열 관련 설명은 상기 기술한 바와 같다.
유전자 조작용 조성물은 가이드핵산-에디터단백질 복합체를 포함할 수 있다.
“가이드핵산-에디터단백질 복합체”는 가이드핵산과 에디터단백질의 상호작용을 통해 형성된 복합체를 의미한다.
상기 가이드핵산 관련 설명은 상기 기술한 바와 같다.
상기 “에디터단백질”은 핵산과 직접적으로 결합하거나, 또는 직접 결합하지는 않지만 상호작용할 수 있는 펩타이드, 폴리펩타이드 또는 단백질을 의미한다.
이때, 상기 핵산은 표적 핵산, 유전자 또는 염색체에 포함된 핵산일 수 있다.
이때, 상기 핵산은 가이드핵산일 수 있다.
상기 에디터단백질은 효소일 수 있다.
이때, 상기 “효소”는 핵산, 유전자 또는 염색체를 절단할 수 있는 도메인을 포함하는 폴리펩타이드 또는 단백질을 의미한다.
상기 효소는 뉴클레아제 또는 제한효소일 수 있다.
상기 에디터단백질은 완전 활성 효소를 포함할 수 있다.
이때, 상기 “완전 활성 효소”는 야생형(wild type) 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능과 동일한 기능을 가지는 효소를 의미한다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소는 DNA 이중 가닥을 모두 절단하는 완전한 활성 효소일 수 있다. 또 다른 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소가 인위적인 조작에 의해 아미노산 서열 중 일부 서열이 삭제(deletion) 또는 치환(substitution)된 경우, 인위적으로 조작된 효소 변이체가 야생형 효소와 동일하게 DNA의 이중 가닥을 절단한다면, 상기 인위적으로 조작된 효소 변이체는 완전 활성 효소일 수 있다.
또한, 상기 완전 활성 효소는 야생형의 효소의 기능보다 향상 된 기능을 가지고 있는 효소를 포함할 수 있다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 야생형 효소보다 증가된 완전한 효소 활성, 즉, 증가된 DNA 이중 가닥을 절단하는 활성을 가질 수 있다.
상기 에디터단백질은 불완전 또는 부분 활성 효소를 포함할 수 있다.
이때, 상기 "불완전 또는 부분 활성 효소"는 야생형 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능의 일부만을 가지는 효소를 의미한다. 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 제1 기능을 가지는 형태 또는 제2 기능을 가지는 형태일 수 있다. 이때, 제1 기능은 DNA의 이중 가닥 중 제1 가닥을 절단하는 기능이고, 제2 기능은 DNA의 이중 가닥 중 제2 가닥을 절단하는 기능일 수 있다. 이때, 상기 제1 기능을 가지는 효소 또는 제2 기능을 가지는 효소는 불완전 또는 부분 활성 효소일 수 있다.
상기 에디터단백질은 불활성 효소를 포함할 수 있다.
이때, 상기 "불활성 효소"는 야생형 효소의 본래의 핵산, 유전자 또는 염색체 절단 기능이 모두 불활성화 된 효소를 의미한다. 예를 들면, 야생형 효소의 특정 변형 또는 조작된 형태는 제1 기능 및 제2 기능이 모두 상실된 형태, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 제2 가닥을 절단하는 제2 기능이 모두 상실된 형태일 수 있다. 이때, 상기 제1 기능 및 제2 기능이 모두 상실된 효소는 불활성 효소일 수 있다.
상기 에디터단백질은 융합단백질일 수 있다.
이때, 상기 “융합 단백질”은 효소에 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 융합하여 생성한 단백질을 의미한다.
상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소에 포함된 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질과 동일하거나 다른 기능을 가지는 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질이 부가된 형태일 수 있다.
이때, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인, 펩타이드, 폴리펩타이드 또는 단백질 일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 디아미네이즈(deaminase)일 수 있다.
상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스래디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.
또한, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
상기 NLS는 아미노산 서열 PKKKRKV(SEQ ID NO: 831)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(SEQ ID NO: 832)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(SEQ ID NO: 833) 또는 RQRRNELKRSP(SEQ ID NO: 834)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: 835)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: 836); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(SEQ ID NO: 837) 및 PPKKARED(SEQ ID NO: 838); 인간 p53의 서열 PQPKKKPL(SEQ ID NO: 839); 마우스 c-abl IV의 서열 SALIKKKKKMAP(SEQ ID NO: 840); 인플루엔자 바이러스 NS1의 서열 DRLRR(SEQ ID NO: 841) 및 PKQKKRK(SEQ ID NO: 842); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(SEQ ID NO: 843); 마우스 Mx1 단백질의 서열 REKKKFLKRR(SEQ ID NO: 844); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: 845); 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(SEQ ID NO: 846)로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다.
상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 특정 기능을 수행하지 않는 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다. 이때, 상기 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소의 기능에 영향을 주지 않는 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 상기 비기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질이 부가된 형태일 수 있다.
상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질일 수 있다.
상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.
상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질일 수 있다.
상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.
이때, 상기 변형은 에디터단백질에 포함된 아미노산의 치환, 제거, 부가 또는 이의 혼합일 수 있다.
또는 상기 변형은 에디터단백질을 암호화하는 뉴클레오타이드 서열 중 일부 뉴클레오타이드의 치환, 제거, 부가 또는 이의 혼합일 수 있다.
또한, 상기 유전자 조작용 조성물은 삽입을 원하는 특정 뉴클레오타이드서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.
이때, 상기 삽입은 원하는 핵산서열은 혈액 응고 저해 유전자의 일부 뉴클레오타이드서열일 수 있다.
이때, 상기 삽입은 원하는 핵산서열은 조작하고자 하는 혈액 응고 저해 유전자의 돌연변이를 교정하거나 돌연변이를 도입하기 위한 핵산 서열일 수 있다.
상기 "도너(donor)"는 손상된 유전자 또는 핵산의 상동성 재조합에 의한 수복을 돕는 뉴클레오타이드서열을 의미한다.
상기 도너는 이중가닥 핵산 또는 단일가닥 핵산일 수 있다.
상기 도너는 선형 또는 원형일 수 있다.
상기 도너는 표적 유전자 또는 핵산에 상동성을 가지는 뉴클레오타이드서열을 포함할 수 있다.
예를 들어, 도너는 특정 뉴클레오타이드서열을 삽입하고자 하는 위치, 예를 들어, 손상된 핵산의 왼쪽(upstream)및 오른쪽(downstream)의 뉴클레오타이드서열과 각각 상동성을 가지는 뉴클레오타이드서열을 포함할 수 있다. 이때, 삽입하고자 하는 특정 뉴클레오타이드서열은 손상된 핵산의 오른쪽 뉴클레오타이드서열에 대해 상동성을 가지는 뉴클레오타이드서열과 손상된 핵산의 왼쪽 뉴클레오타이드서열에 대해 상동성을 가지는 뉴클레오타이드서열 사이에 위치할 수 있다. 이때, 상기 상동성을 가지는 뉴클레오타이드서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성을 갖거나 또는 완전하게 상동성을 가질 수 있다.
상기 도너는 선택적으로 부수적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 부수적인 핵산서열은 도너의 안정성, 표적 내 삽입 효율 또는 상동성 재조합 효율을 높이는 역할을 하는 것일 수 있다.
예를 들어, 상기 부수적인 뉴클레오타이드서열은 뉴클레오타이드 A, T가 풍부한 핵산서열, 즉, A-T 풍부 도메인(A-T rich domain)일 수 있다. 예를 들면, 상기 부수적인 뉴클레오타이드서열은 SMAR(scaffold/matrix attachment region)일 수 있다.
본 명세서에 의해 개시되는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 다양한 형태로 대상 내로 전달 또는 도입될 수 있다.
이때, "대상"은 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 도입되는 유기체, 또는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 작동하는 유기체 또는 유기체로부터 획득한 검체 또는 시료를 의미한다.
상기 대상은 가이드핵산-에디터단백질 복합체의 표적 유전자 또는 염색체를 포함하는 유기체일 수 있다.
상기 유기체는 동물, 동물의 조직 또는 동물 세포일 수 있다.
상기 유기체는 인간, 인간의 조직 또는 인간 세포일 수 있다.
상기 조직은 안구, 피부, 간, 신장, 심장, 폐, 뇌, 근육 또는 혈액일 수 있다.
상기 세포는 간세포, 면역세포, 혈액세포 또는 줄기세포일 수 있다.
상기 검체 또는 시료는 침, 혈액, 간조직, 뇌조직, 간세포, 신경세포, 식세포, 대식세포, T 세포, B 세포, 성상교세포, 암세포 또는 줄기세포 등 표적 유전자 또는 염색체를 포함하는 유기체에서 획득한 것 일 수 있다.
바람직하게는, 상기 대상은 혈액 응고 저해 유전자를 포함하는 유기체일 수 있다.
상기 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 DNA, RNA 또는 이의 혼합의 형태로 대상 내로 전달 또는 도입될 수 있다.
이때, 가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.
또는, 가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 벡터, 비벡터 또는 이들의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 벡터는 바이러스 또는 비바이러스 벡터(예를 들어, 플라스미드)일 수 있다.
상기 비벡터는 네이키드 DNA, DNA 복합체 또는 mRNA일 수 있다.
일 구현예로, 상기 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
일 예로, 상기 벡터는 가이드핵산과 에디터단백질을 암호화하는 핵산서열을 동시에 포함할 수 있다.
다른 일 예로, 상기 벡터는 가이드핵산 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 가이드핵산에 포함되는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.
다른 일 예로, 상기 벡터는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 에디터단백질의 경우, 에디터단백질을 암호화하는 핵산서열은 하나의 벡터에 포함되거나 또는 에디터단백질을 암호화하는 핵산서열이 분할되어 여러 개의 벡터에 포함될 수 있다.
상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.
이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.
상기 프로모터는 RNA 중합효소 II에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 RNA 중합효소 III에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 유도성 프로모터일 수 있다.
상기 프로모터는 대상 특이적 프로모터일 수 있다.
상기 프로모터는 바이러스 또는 비바이러스 프로모터일 수 있다.
상기 프로모터는 제어 영역(즉, 가이드핵산 또는 에디터단백질을 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.
예를 들어, 가이드핵산을 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, 에디터단백질을 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.
벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.
상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.
이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.
이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.
상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.
일반적으로 바이러스는 숙주(예를 들면, 세포)를 감염시켜, 숙주 내에 바이러스의 유전정보를 암호화하는 핵산을 도입시키거나 숙주의 게놈 내로 유전정보를 암호화하는 핵산을 삽입시킬 수 있다. 이러한 특징을 가지는 바이러스를 이용하여 대상 내로 가이드핵산 및/또는 에디터단백질을 도입시킬 수 있다. 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 일시적으로 발현될 수 있다. 또는 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 장기간(예를 들면, 1주, 2주, 3주, 1개월, 2개월, 3개월, 6개월, 9개월, 1년, 2년 또는 영구적) 지속적으로 발현될 수 있다.
바이러스의 패키징 능력은 적어도 2kb 내지 50kb로 바이러스 종류에 따라 다를 수 있다. 이러한 패키징 능력에 따라 가이드핵산 또는 에디터단백질을 단독으로 포함하는 바이러스 벡터를 설계하거나 가이드핵산 및 에디터단백질을 모두 포함하는 바이러스 벡터를 설계할 수 있다. 또는 가이드핵산, 에디터단백질 및 추가 구성요소를 포함하는 바이러스 벡터를 설계할 수 있다.
일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.
다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.
또 다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.
다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.
다른 일 구현예로, 상기 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 비벡터로 대상 내로 전달 또는 도입될 수 있다.
비벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
상기 비벡터는 네이키드 DNA, DNA 복합체, mRNA 또는 이의 혼합일 수 있다.
상기 비벡터는 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 덴드리머, 나노입자, 인산칼슘, 실리카, 실리케이트(오르모실) 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 세포와 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.
다른 일 예로, 나노입자를 이용하여 비벡터를 전달할 수 있다. 상기 나노입자는 무기 나노입자(예를 들면, 자기 나노입자, 실리카 등) 또는 유기 나노입자(예를 들면, 폴리에틸렌 글리콜(PEG)로 코팅된 지질 등)일 수 있다. 상기 나노입자의 외면은 부착을 가능하게 하는 양 전하로 하전된 중합체(예를 들면, 폴리에틸렌이민, 폴리리신, 폴리세린 등)와 컨쥬케이팅될 수 있다.
임의의 구체예로, 지질 외피를 이용하여 전달할 수 있다.
임의의 구체예로, 엑소좀을 이용하여 전달할 수 있다. 엑소좀은 뇌 및 다른 표적 기관에 RNA를 전달할 수 있는, 단백질 및 RNA를 수송하는 내인성 나노-소낭이다.
임의의 구체예로, 리포좀을 이용하여 전달할 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀은 몇몇 상이한 유형의 지질로부터 만들어질 수 있지만; 약물 담체로서 리포좀을 생성하는데 인지질이 가장 통상적으로 사용된다.
또한, 비벡터의 전달을 위한 조성물은 기타 몇몇 다른 첨가제를 포함할 수 있다.
상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태로 대상 내로 전달 또는 도입될 수 있다.
상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 펩타이드, 폴리펩타이드 또는 단백질의 형태는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 펩타이드, 폴리펩타이드 또는 단백질의 전달은 가이드핵산을 암호화하는 핵산서열과 함께 전달될 수 있다.
일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 가이드핵산와 함께 또는 가이드핵산 없이 에디터단백질을 도입시킬 세포와 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.
상기 가이드핵산 및 에디터단백질은 핵산-단백질 혼합의 형태로 대상 내로 전달 또는 도입될 수 있다.
상기 가이드핵산 및 에디터단백질은 가이드핵산-에디터단백질 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.
예를 들어, 상기 가이드핵산은 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.
일 예로, 가이드핵산 및 에디터단백질은 RNA 형태의 가이드핵산과 단백질 형태의 에디터단백질이 가이드핵산-에디터단백질 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.
본 명세서에 의해 개시되는 가이드핵산-에디터단백질 복합체는 표적 핵산, 유전자 또는 염색체를 변형시킬 수 있다.
예를 들어, 가이드핵산-에디터단백질 복합체는 표적 핵산, 유전자 또는 염색체의 서열에 변형(modification)을 유도한다. 그 결과, 상기 표적 핵산, 유전자 또는 염색체에 의해 발현되는 단백질은 그 구조 및/또는 기능이 변형되거나, 그 단백질의 발현이 조절되거나, 그 단백질의 발현이 제거될 수 있다.
상기 가이드핵산-에디터단백질 복합체는 DNA, RNA, 유전자 또는 염색체 수준에서 작용할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자를 조작 또는 변형하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.
상기 가이드핵산-에디터단백질 복합체는 유전자의 전사와 번역의 단계에서 작용할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 전사를 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.
다른 일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 번역을 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.
본 명세서에 의해 개시되는 내용의 일 구체예로서, 유전자 조작용 조성물은 gRNA 및 CRISPR 효소를 포함할 수 있다.
일 구현예에서, 유전자 조작용 조성물은
(a) 혈액 응고 저해 유전자의 표적 서열을 표적화할 수 있는 gRNA 또는 이를 암호화하는 핵산서열; 및
(b) 하나 이상의 CRISPR 효소 또는 이를 암호화하는 핵산서열
을 포함할 수 있다.
상기 혈액 응고 저해 유전자 관련 설명은 상기 기술한 바와 같다.
상기 표적 서열 관련 설명은 상기 기술한 바와 같다.
다른 일 구현예에서, 유전자 조작용 조성물은
(a) 혈액 응고 저해 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 gRNA 또는 이를 암호화하는 핵산서열; 및
(b) 하나 이상의 CRISPR 효소 또는 이를 암호화하는 핵산서열
을 포함할 수 있다.
상기 혈액 응고 저해 유전자 관련 설명은 상기 기술한 바와 같다.
상기 표적 서열 관련 설명은 상기 기술한 바와 같다.
상기 가이드 서열 관련 설명은 상기 기술한 바와 같다.
유전자 조작용 조성물은 gRNA-CRISPR 효소 복합체를 포함할 수 있다.
“gRNA-CRISPR 효소 복합체”는 gRNA과 CRISPR 효소의 상호작용을 통해 형성된 복합체를 의미한다.
상기 gRNA 관련 설명은 상기 기술한 바와 같다.
상기 “CRISPR 효소”는 CRISPR-Cas 시스템의 주요 단백질 구성 요소로, gRNA와 복합체를 형성하여 CRISPR-Cas 시스템을 형성한다.
상기 CRISPR 효소는 CRISPR 효소를 암호화하는 서열을 가지는 핵산 또는 폴리펩타이드(또는 단백질)일 수 있다.
상기 CRISPR 효소는 Type II CRISPR 효소일 수 있다.
Type II CRISPR 효소의 결정 구조는 2종 이상의 자연유래 미생물 Type II CRISPR 효소 분자에 대한 연구(Jinek et al., Science, 343(6176):1247997, 2014) 및 gRNA와 함께 복합체를 이루는 스트렙토코커스 피오게네스 Cas9(SpCas9)에 대한 연구(Nishimasu et al., Cell, 156:935-949, 2014; 및 Anders et al., Nature, 2014, doi: 10.1038/nature13579)를 통해 결정되었다.
Type II CRISPR 효소는 2개의 로브, 즉, 인식(REC) 및 뉴클레아제(NUC) 로브를 포함하며, 각각의 로브는 여러 개의 도메인을 포함한다.
상기 REC 로브는 아르기닌-풍부 브릿지 나선(BH), REC1 도메인 및 REC2 도메인을 포함한다.
이때, 상기 BH 도메인은 긴 α-나선 및 아르기닌 풍부 영역이며, 상기 REC1 및 REC2 도메인은 gRNA 내의 형성되는 이중가닥의, 예를 들어, 단일가닥 gRNA, 이중 gRNA 또는 tracrRNA의 인식에 중요한 역할을 한다.
상기 NUC 로브는 RuvC 도메인, HNH 도메인 및 PAM-상호작용(PI) 도메인을 포함한다. 이때, 상기 RuvC 도메인은 RuvC-유사 도메인을 포괄하는 의미로 사용되고, 또한 상기 HNH 도메인은 HNH-유사 도메인을 포괄하는 의미로 사용된다.
이때, 상기 RuvC 도메인은 Type II CRISPR 효소를 포함하는 자연상태에 존재하는 미생물의 구성원에 대해 구조적으로 유사성을 공유하며, 단일가닥, 예를 들어 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단한다. 상기 RuvC 도메인은 종종 당업계에서 RuvCI 도메인, RuvCII 도메인 및 RuvCIII 도메인으로서, 통상적으로 RuvC I, RuvCII 및 RuvCIII로 지칭된다.
상기 HNH 도메인은 HNH 엔도뉴클레아제와 구조적 유사성을 공유하며, 단일 가닥, 예를 들어 표적 핵산 분자의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단한다. HNH 도메인은 RuvC II와 III 모티프 사이에 위치한다.
상기 PI 도메인은 표적 유전자 또는 핵산 내의 특정 뉴클레오타이드서열, 즉, PAM(Protospacer adjacent motif)을 인식하거나 또는 PAM과 상호작용한다. 이때, 상기 PAM은 Type II CRISPR 효소의 유래(origin)에 따라 다를 수 있다. 예를 들어, CRISPR 효소가 SpCas9 인 경우 PAM은 5'-NGG-3'일 수 있고, 스트렙토코커스 써모필러스 Cas9(StCas9)인 경우 PAM은 5'-NNAGAAW-3'(W = A or T)일 수 있고, 네이세리아 메닝기티디스 Cas9(NmCas9)인 경우 PAM은 5'-NNNNGATT-3'일 수 있고, 캄필로박터 제주니 Cas9(CjCas9)의 경우 PAM은 5'-NNNVRYAC-3' (V = G or C or A, R = A or G, Y = C or T)일 수 있으며, 이때 상기 N은 A, T, G 또는 C; 또는 A, U, G 또는 C일 수 있다. 다만, 전술한 효소의 유래에 따라 PAM이 결정되는 것으로 일반적으로 이해되고 있으나, 해당 유래의 효소의 돌연변이(mutant)에 대한 연구가 진행됨에 따라, 상기 PAM은 달라질 수도 있다.
상기 Type II CRISPR 효소는 Cas9일 수 있다.
상기 Cas9은 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속(Streptococcus sp.), 스타필로코커스 아우레스(Staphylococcus aureus), 캄필로박터 제주니 (Campylobacter jejuni), 노카르디옵시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 알리사이클로바클루스 아시도칼다리우스(AlicyclobacHlus acidocaldarius), 바실러스 슈도마이코이데스(Bacillus pseudomycoides), 바실러스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시비리쿰(Exiguobacterium sibiricum), 락토바실러스 델브루에키이(Lactobacillus delbrueckii), 락토바실러스 살리바리우스(Lactobacillus salivarius), 미크로스 킬라 마리나(Microscilla marina), 부르크홀데리아레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 속(Polaromonas sp.), 크로코스파에라 와트소니이(Crocosphaera watsonii), 시아노테세 속(Cyanothece sp.), 마이크로시스티스 아에루기노사(Microcystis aeruginosa), 시네코코커스 속(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시이(Ammonifex degensii), 칼디셀룰로시럽토 베시이(Caldicelulosiruptor bescii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리듐 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라나에로비우스 써모필러스 (Natranaerobius thermophilus), 펠로토마쿨럼 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실러스 칼두스(Acidithiobacillus caldus), 아시디티오바실러스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 속(Marinobacter sp.), 니트로소코커스 할로필러스(Nitrosococcus halophilus), 니트로소코커스 와트소니(Nitrosococcus watsoni), 슈도알테로 모나스 할로플란크티스(Pseudoalteromonas haloplanktis), 크테도노박테르 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나베나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 속(Nostoc sp.), 아르트로스피라 맥시마(Arthrospira maxima), 아르트로스피라 플라텐시스(Arthrospira platensis), 아르트로스피라 속(Arthrospira sp.), 링비아속(Lyngbya sp.), 마이크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 속(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus) 또는 아카리오클로리스 마리나(Acaryochloris marina) 등 다양한 미생물 유래의 Cas9일 수 있다.
상기 Cas9은 gRNA와 결합하여 표적 유전자 또는 핵산 상에서 표적 서열 또는 위치를 절단 또는 변형시키는 효소로서, gRNA가 상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 HNH 도메인, gRNA와 비상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 RuvC 도메인, 표적, 즉, 타겟과 상호작용하는 REC 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cas9의 구조적 특성은 Hiroshi Nishimasu et al. (2014) Cell 156:935-949를 참고할 수 있다.
상기 Cas9은 자연상태에서 존재하는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법을 통해 비자연적으로 생산된 것일 수 있다.
또한, 상기 CRISPR 효소는 Type V CRISPR 효소일 수 있다.
Type V CRISPR 효소는 Type II CRISPR 효소의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Type II CRISPR 효소의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 표적과 상호작용하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Type V CRISPR 효소의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.
Type V CRISPR 효소는 gRNA와 상호작용할 수 있으며, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 형성할 수 있고, gRNA와 협력하여 가이드 서열을 및 PAM 서열을 포함하는 표적 서열로 근접시킬 수 있다. 이때, 표적 유전자 또는 핵산과 상호작용하기 위한 Type V CRISPR 효소의 능력은 PAM 서열에 의존적이다.
상기 PAM 서열은 표적 유전자 또는 핵산 내에 존재하는 서열로, Type V CRISPR 효소의 PI 도메인에 의해 인식될 수 있다. 상기 PAM 서열은 Type V CRISPR 효소의 유래에 따라 그 서열이 다를 수 있다. 즉, 종마다 특이적으로 인식할 수 있는 PAM 서열이 존재한다. 예를 들어, Cpf1이 인식하는 PAM 서열은 5'-TTN-3' (N은 A, T, C 또는 G)일 수 있다. 다만, 전술한 효소의 유래에 따라 PAM이 결정되는 것으로 일반적으로 이해되고 있으나, 해당 유래의 효소의 돌연변이(mutant)에 대한 연구가 진행됨에 따라, 상기 PAM은 달라질 수도 있다.
상기 Type V CRISPR 효소는 Cpf1일 수 있다.
상기 Cpf1은 Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium 또는 Acidaminococcus 유래의 Cpf1일 수 있다.
상기 Cpf1은 Cas9의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Cas9의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 타겟과 상호작용하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cpf1의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.
상기 Cpf1는 자연상태에서 존재하는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법을 통해 비자연적으로 생산된 것일 수 있다.
상기 CRISPR 효소는 표적 유전자 또는 핵산의 이중가닥을 절단하는 기능을 가지는 뉴클레아제 또는 제한효소일 수 있다.
상기 CRISPR 효소는 완전 활성 CRISPR 효소일 수 있다.
"완전 활성"는 야생형(wild type) CRISPR 효소의 기능과 동일한 기능을 가지고 있는 상태를 의미하며, 이러한 상태의 CRISPR 효소를 완전 활성 CRISPR 효소로 명칭한다. 이때, “야생형(wild type) CRISPR 효소의 기능”은 DNA의 이중 가닥을 절단하는 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능을 모두 가지는 상태를 말한다.
상기 완전 활성 CRISPR 효소는 DNA의 이중 가닥을 절단하는 야생형 CRISPR 효소일 수 있다.
상기 완전 활성 CRISPR 효소는 DNA의 이중 가닥을 절단하는 야생형 CRISPR 효소를 변형 또는 조작시킨 CRISPR 효소 변이체일 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 하나 이상의 아미노산이 다른 아미노산으로 치환되거나 또는 하나 이상의 아미노산이 제거된 효소일 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열에 하나 이상의 아미노산이 부가된 효소일 수 있다. 이때, 부가되는 아미노산의 위치는 야생형 효소의 N 말단, C 말단 또는 아미노산 서열 내일 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소보다 기능이 향상된 완전 활성 효소일 수 있다.
예를 들면, 야생형 CRISPR 효소의 특정 변형 또는 조작된 형태, 즉, CRISPR 효소 변이체는 절단해야 하는 DNA 이중 가닥과 결합하지 않거나 또는 일정한 거리 간격을 유지한 상태에서 DNA 이중 가닥을 절단할 수 있다. 이러한 경우, 상기 변형 또는 조작된 형태는 야생형 CRISPR 효소보다 기능 활성이 향상된 완전 활성 CRISPR 효소일 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소보다 기능이 감소된 완전 활성 CRISPR 효소일 수 있다.
예를 들면, 야생형 CRISPR 효소의 특정 변형 또는 조작된 형태, 즉, CRISPR 효소 변이체는 절단해야 하는 DNA 이중 가닥과 일정 거리이상으로 근접한 상태 또는 특정 결합이 형성된 상태에서 DNA 이중 가닥을 절단할 수 있다. 이때, 특정 결합은, 예를 들어, 효소의 특정 위치의 아미노산과 절단 위치의 DNA 뉴클레오타이드서열과의 결합일 수 있다. 이러한 경우, 상기 변형 또는 조작된 형태는 야생형 CRISPR 효소보다 기능 활성이 감소된 완전 활성 CRISPR 효소일 수 있다.
상기 CRISPR 효소는 불완전 또는 부분 활성 CRISPR 효소일 수 있다.
“불완전 또는 부분 활성”은 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능 중 선택된 하나의 기능을 가지는 상태를 의미한다. 이러한 상태의 CRISPR 효소는 불완전 또는 부분 활성 CRISPR 효소로 명칭한다. 또한 상기 불완전 또는 부분 활성 CRISPR 효소는 니카아제(nickase)로 지칭될 수 있다.
“니카아제(nickase)”는 표적 유전자 또는 핵산의 이중가닥 중 한 가닥만 절단되도록 조작 또는 변형된 CRISPR 효소를 의미하며, 상기 니카아제는 단일가닥, 예를 들어, 표적 유전자 또는 핵산의 gRNA와 비상보성 가닥 또는 상보성 가닥을 절단하는 뉴클레아제 활성을 가진다. 따라서, 이중가닥을 절단하기 위해서는 2개의 니카아제의 뉴클레아제 활성이 필요하다.
상기 니카아제는 CRISPR 효소의 RuvC 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 CRISPR 효소의 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 HNH 도메인은 조작 또는 변경될 수 있다.
일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 니카아제는 변형된 HNH 도메인을 포함하는 Type II CRISPR 효소일 수 있다.
예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 니카아제는 야생형 SpCas9의 아미노산 서열 840번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, SpCas9 변이체는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 니카아제는 야생형 CjCas9의 아미노산 서열 559번 히스티딘을 알라닌으로 변이(mutation)시켜 HNH 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, CjCas9 변이체는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
또한, 상기 니카아제는 CRISPR 효소의 HNH 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 CRISPR 효소의 RuvC 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인은 조작 또는 변경될 수 있다.
일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 니카아제는 변형된 RuvC 도메인을 포함하는 Type II CRISPR 효소일 수 있다.
예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 니카아제는 야생형 SpCas9의 아미노산 서열 10번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, SpCas9 변이체는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.
또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 니카아제는 야생형 CjCas9의 아미노산 서열 8번 아스파르트산을 알라닌으로 변이(mutation)시켜 RuvC 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 니카아제, 즉, CjCas9 변이체는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.
상기 CRISPR 효소는 불활성 CRISPR 효소일 수 있다.
“불활성”은 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능이 모두 상실된 상태를 의미한다. 이러한 상태의 CRISPR 효소는 불활성 CRISPR 효소로 명칭한다.
상기 불활성 CRISPR 효소는 야생형 CRISPR 효소의 뉴클레아제 활성을 가지는 도메인에 변이로 인한 뉴클레아제 불활성을 가질 수 있다.
*상기 불활성 CRISPR 효소는 RuvC 도메인 및 HNH 도메인에 변이로 인한 뉴클레아제 불화성을 가질 수 있다. 즉, 상기 불활성 CRISPR 효소는 CRISPR 효소의 RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인 및 HNH 도메인은 조작 또는 변경될 수 있다.
일 예로, 상기 CRISPR 효소가 Type II CRISPR 효소일 때, 상기 불활성 CRISPR 효소는 변형된 RuvC 도메인 및 HNH 도메인을 포함하는 Type II CRISPR 효소일 수 있다.
예를 들어, 상기 Type II CRISPR 효소가 야생형 SpCas9의 경우, 상기 불활성 CRISPR 효소는 야생형 SpCas9의 아미노산 서열 10번 아스파르트산과 840번 히스티딘을 모두 알라닌으로 변이(mutation)시켜 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성화된 SpCas9 변이체일 수 있다. 이때 생성된 불활성 CRISPR 효소, 즉, SpCas9 변이체는 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성 되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
또 다른 예를 들어, 상기 Type II CRISPR 효소가 야생형 CjCas9의 경우, 상기 불활성 CRISPR 효소는 야생형 CjCas9의 아미노산 서열 8번 아스파르트산과 559번 히스티딘을 모두 알라닌으로 변이(mutation)시켜 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성화된 CjCas9 변이체일 수 있다. 이때 생성된 불활성 CRISPR 효소, 즉, CjCas9 변이체는 RuvC 도메인 및 HNH 도메인의 뉴클레아제 활성이 불활성 되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
상기 CRISPR 효소는 상기 기재된 뉴클레아제 활성 외에도 헬리카제 활성, 즉, 이중가닥 핵산의 나선 구조를 푸는 기능을 가질 수 있다.
또한, 상기 CRISPR 효소는 CRISPR 효소의 헬리카제 활성에 대해 완전 활성, 불완전 또는 부분 활성, 또는 불활성이 되도록 CRISPR 효소를 변형시킬 수 있다.
상기 CRISPR 효소는 야생형 CRISPR 효소를 인위적으로 조작 또는 변형시킨 CRISPR 효소 변이체일 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및/또는 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능을 변형시키기 위해 인위적으로 조작 또는 변형된 CRISPR 효소 변이체일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능 중 제1 기능이 상실된 형태일 수 있다.
또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능 중 제2 기능이 상실된 형태일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 기능, 즉, 제1 기능 및 제2 기능이 모두 상실된 형태일 수 있다.
상기 CRISPR 효소 변이체는 gRNA와 상호작용을 통한 gRNA-CRISPR 효소 복합체 형성할 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 gRNA와 상호작용하는 기능을 변형시키기 위해 인위적으로 조작 또는 변형된 CRISPR 효소 변이체일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소에 비해 gRNA와의 상호작용이 감소된 형태일 수 있다.
또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소에 비해 gRNA의 상호작용이 증가된 형태일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능을 가지면서 gRNA와의 상호작용이 감소된 형태일 수 있다.
또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능을 가지면서 gRNA와의 상호작용이 증가된 형태일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제2 기능을 가지면서 gRNA와의 상호작용이 감소된 형태일 수 있다.
또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제2 기능을 가지면서 gRNA와의 상호작용이 증가된 형태일 수 있다.
예를 들어, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능 및 제2 기능을 가지지 않으면서 gRNA와의 상호작용이 감소된 형태일 수 있다.
또는 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 제1 기능 및 제2 기능을 가지지 않으면서 gRNA와의 상호작용이 증가된 형태일 수 있다.
이때, gRNA와 CRISPR 효소 변이체의 상호작용 세기에 따라 다양한 gRNA-CRISPR 효소 복합체가 형성될 수 있고, CRISPR 효소 변이체에 따라 표적 서열에 접근 또는 절단하는 기능에 차이가 생길 수 있다.
예를 들어, gRNA와의 상호작용이 감소된 CRISPR 효소 변이체에 의해 형성된 gRNA-CRISPR 효소 복합체는 gRNA와 완전히 상보적 결합을 하는 표적 서열에 근접 또는 국소화되는 경우에만 오직 표적 서열의 이중가닥 또는 단일가닥을 절단할 수 있다.
상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산이 변형된 것일 수 있다.
일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산의 치환된 것일 수 있다.
다른 일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산이 제거된 것일 수 있다.
또 다른 일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 내에 적어도 하나 이상의 아미노산이 부가된 것일 수 있다.
일 예로, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 아미노산 서열 중 적어도 하나 이상의 아미노산의 치환, 제거 및/또는 부가된 것일 수 있다.
또한, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 원래 기능, 즉, DNA의 이중 가닥 중 제1 가닥을 절단하는 제1 기능 및 DNA의 이중 가닥 중 제2 가닥을 절단하는 제2 기능, 이외에 선택적으로 기능적(functional) 도메인을 추가로 포함할 수 있다. 이때, 상기 CRISPR 효소 변이체는 야생형 CRISPR 효소의 원래 기능 이외에 부가적인 기능을 가질 수 있다.
상기 기능적 도메인은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.
상기 기능적 도메인은 디아미네이즈(deaminase)일 수 있다.
예를 들어, 불완전 또는 부분 CRISPR 효소에 시티딘 디아미네이즈(cytidine deaminase)를 기능적 도메인으로 추가로 포함할 수 있다. 일 구체예로, SpCas9 니카아제에 시티딘 디아미네이즈, 예를 들면, APOBEC1(apolipoprotein B editing complex 1)를 추가하여 융합 단백질을 생성할 수 있다. 이렇게 형성된 [SpCas9 니카아제]-[APOBEC1]은 뉴클레오타이드 C를 T 또는 U로 뉴클레오타이드 교정 또는 편집에 이용되거나, 또는 뉴클레오타이드 G를 A로 뉴클레오타이드 교정 또는 편집에 이용될 수 있다.
또 다른 예를 들어, 불완전 또는 부분 CRISPR 효소에 아데닌 디아미네이즈(adenine deaminase)를 기능적 도메인으로 추가로 포함할 수 있다. 일 구체예로, SpCas9 니카아제에 아데닌 디아미네이즈, 예를 들면, TadA variants, ADAR2 variants, ADAT2 variants 등을 추가하여 융합 단백질을 생성할 수 있다. 이렇게 형성된 [SpCas9 니카아제]-[TadA variant], [SpCas9 니카아제]-[ADAR2 variant] 또는 [SpCas9 니카아제]-[ADAT2 variant]는 뉴클레오타이드 A를 inosine으로 변형시키며, 변형된 inosine은 polymerase에 의해 뉴클레오타이드 G로 인식되어 실질적으로 뉴클레오타이드 A를 G로 뉴클레오타이드 교정 또는 편집되는 효과를 보이므로, 뉴클레오타이드 A를 G로 뉴클레오타이드 교정 또는 편집에 이용되거나, 또는 뉴클레오타이드 T를 C로 뉴클레오타이드 교정 또는 편집에 이용될 수 있다.
상기 기능적 도메인은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
일 예로, CRISPR 효소는 하나 이상의 NLS를 포함할 수 있다. 이때, 상기 NLS는 CRISPR 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 또는 이들의 조합에 하나 이상의 NLS를 포함할 수 있다. 상기 NLS는 하기로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다: 아미노산 서열 PKKKRKV(SEQ ID NO: 831)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(SEQ ID NO: 832)를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD(SEQ ID NO: 833) 또는 RQRRNELKRSP(SEQ ID NO: 834)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO: 835)를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO: 836); 마이오마(myoma) T 단백질의 서열 VSRKRPRP(SEQ ID NO: 837) 및 PPKKARED(SEQ ID NO: 838); 인간 p53의 서열 PQPKKKPL(SEQ ID NO: 839); 마우스 c-abl IV의 서열 SALIKKKKKMAP(SEQ ID NO: 840); 인플루엔자 바이러스 NS1의 서열 DRLRR(SEQ ID NO: 841) 및 PKQKKRK(SEQ ID NO: 842); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(SEQ ID NO: 843); 마우스 Mx1 단백질의 서열 REKKKFLKRR(SEQ ID NO: 844); 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK(SEQ ID NO: 845); 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(SEQ ID NO: 846).
또한, 상기 CRISPR 효소 변이체는 CRISPR 효소를 분할하여 두 개 이상의 부분으로 나눈 스플릿(split) 형태의 CRISPR 효소를 포함할 수 있다. “스플릿(split)”은 단백질을 기능적으로 또는 구조적으로 또는 임의로 두 개 이상으로 분할하는 것을 의미한다.
상기 스플릿(split) 형태의 CRISPR 효소는 완전 활성 효소, 불완전 또는 부분 활성 효소 또는 불활성 효소일 수 있다.
예를 들어, 상기 CRISPR 효소가 SpCas9의 경우, 656번 타이로신과 657번 트레오닌 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9을 생성할 수 있다.
상기 스플릿(split) 형태의 CRISPR 효소는 선택적으로 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
상기 재구성을 위한 추가 도메인, 펩타이드 폴리펩타이드 또는 단백질은 스플릿(split) 형태의 CRISPR 효소가 구조적으로 야생형 CRISPR 효소와 동일하거나 유사하도록 조립될 수 있다.
상기 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 FRB 및 FKBP dimerization domains; 인테인(intein); ERT 및 VPR domains 또는 특정 조건에서 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.
예를 들어, 상기 CRISPR 효소가 SpCas9의 경우, 713번 세린과 714번 글라이신 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9에 두 부분 중 하나에 FRB 도메인을 연결하고, 나머지 하나에 FKBP 도메인을 연결할 수 있다. 이렇게 생성된 스플릿 SpCas9은 라파마이신이 존재하는 환경에서 FRB 도메인과 FKBP 도메인이 다이머를 형성하여 재구성된 CRISPR 효소를 생성할 수 있다.
본 명세서에 의해 개시되는 CRISPR 효소 또는 CRISPR 효소 변이체는 폴리펩타이드, 단백질 또는 이를 암호화하는 서열을 가지는 핵산일 수 있으며, 상기 CRISPR 효소 또는 CRISPR 효소 변이체를 도입하고자 하는 대상에 맞추어 코돈 최적화(codon optimization)된 것일 수 있다.
“코돈 최적화”는 고유 서열의 적어도 하나의 코돈을 숙주 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노상 서열을 유지함으로써 관심 숙주 세포에서의 발현의 증진을 위해 핵산서열을 변형시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 가지며, 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 mRNA의 번역의 효율과 상호관련 되며, 이는 번역되는 코돈의 특성 및 특정 tRNA 분자의 이용가능성에 의해 좌우되는 것을 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에 가장 빈번하게 사용되는 코돈을 반영한 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다.
본 명세서에 의해 개시되는 gRNA, CRISPR 효소 또는 gRNA-CRISPR 효소 복합체는 다양한 형태로 대상 내로 전달 또는 도입될 수 있다.
상기 대상 관련 설명은 상기 기술한 바와 같다.
일 구현예로서, gRNA 및/또는 CRISPR 효소는 각각을 암호화하는 핵산서열을 포함하는 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.
벡터는 gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열을 포함할 수 있다.
일 예로, 상기 벡터는 gRNA 및 CRISPR 효소를 암호화하는 핵산서열을 동시에 포함할 수 있다.
다른 일 예로, 상기 벡터는 gRNA 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 gRNA에 포함되는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.
다른 일 예로, 상기 벡터는 CRISPR 효소를 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 CRISPR 효소의 경우, CRISPR 효소를 암호화하는 핵산서열은 하나의 벡터에 포함되거나 또는 CRISPR 효소를 암호화하는 핵산서열은 분할되어 여러 개의 벡터에 포함될 수 있다.
상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.
이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.
상기 프로모터는 RNA 중합효소 II에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 RNA 중합효소 III에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 유도성 프로모터일 수 있다.
상기 프로모터는 대상 특이적 프로모터일 수 있다.
상기 프로모터는 바이러스 또는 비바이러스 프로모터일 수 있다.
상기 프로모터는 제어 영역(즉, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.
예를 들어, gRNA를 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, CRISPR 효소를 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.
상기 벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.
상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.
이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.
이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.
상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.
일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.
다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.
또 다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.
다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.
일 구현예로서, gRNA-CRISPR 효소 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.
예를 들어, 상기 gRNA는 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 CRISPR 효소는 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.
일 예로, gRNA 및 CRISPR 효소는 RNA 형태의 gRNA와 단백질 형태의 CRISPR gRNA-CRISPR 효소 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.
상기 CRISPR gRNA-CRISPR 효소 복합체는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
본 명세서에 의해 개시되는 gRNA-CRISPR 효소 복합체는 표적 유전자, 즉, 혈액 응고 저해 유전자를 인위적으로 조작 또는 변형시키는데 이용될 수 있다.
표적 유전자는 앞서 기재한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 조작 또는 변형할 수 있다. 이때, 표적 유전자의 조작 또는 변형은 i) 표적 유전자의 절단 또는 손상과 ii) 손상된 표적 유전자의 수선 또는 수복하는 단계를 모두 포함한다.
상기 i) 표적 유전자의 절단 또는 손상은 CRISPR 복합체를 이용한 표적 유전자의 절단 또는 손상일 수 있으며, 구체적으로는 표적 유전자 내의 표적 서열의 절단 손상일 수 있다.
상기 표적 서열은 gRNA-CRISPR 효소 복합체의 타겟이 될 수 있고, 상기 표적 서열은 CRISPR 효소가 인식하는 PAM 서열을 포함하거나 또는 포함하지 않을 수 있다. 이러한 표적 서열은 실시자에게 gRNA 설계 단계에서 중요한 기준을 제공할 수 있다.
상기 표적 서열은 gRNA-CRISPR 효소 복합체의 gRNA에 의해 특이적으로 인식될 수 있으며, 이로 인해 gRNA-CRISPR 효소 복합체는 인식된 표적 서열에 근접하게 위치할 수 있다.
표적 부위의 "절단(cleavage)"은 폴리뉴클레오타이드의 공유결합(covalent backbone)의 파손(breakage)을 의미한다. 절단은 포스포다이에스터(phosphodiester) 결합의 효소적 또는 화학적 가수분해를 포함하나, 이에 제한되지 않으며, 이외의 다양한 여러 가지 방법들에 의하여 수행될 수 있다. 단일가닥의 절단 및 이중가닥의 절단 모두 가능하며, 이중가닥의 절단은 두 개의 구별되는(distinct) 단일-가닥의 절단의 결과로서 발생할 수 있다. 이중 가닥의 절단은 blunt ends 또는 staggered end(또는 sticky end)를 생성할 수 있다.
일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자의 절단 또는 손상은 표적 서열의 이중가닥이 모두 절단 또는 손상되는 것일 수 있다.
일 구체예로서, CRISPR 효소가 야생형의 SpCas9인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 모두 절단시킬 수 있다.
다른 일 구체예로서, CRISPR 효소가 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)인 경우, 각각의 CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 두 개의 단일가닥을 각각 절단시킬 수 있다. 즉, gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단될 수 있고, 각각의 절단은 순차적으로 또는 동시에 발생할 수 있다.
다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 표적 서열의 이중가닥 중 단일가닥만 절단 또는 손상되는 것일 수 있다. 이때, 단일가닥은 gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥일 수 있고, 또는 gRNA와 상보적 결합을 하지 않는 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥일 수 있다.
일 구체예로서, CRISPR 효소가 SpCas9 니카아제(D10A)인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단시키고, gRNA와 상보적 결합을 하지 않는 표적 서열의 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥은 절단시키지 않을 수 있다.
다른 일 구체예로서, CRISPR 효소가 SpCas9 니카아제(H840A)인 경우, CRISPR 복합체는 gRNA와 상보적 결합을 하지 않는 표적 서열의 가이드핵산 비결합 서열, 즉, gRNA와 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단시키고, gRNA와 상보적 결합을 하는 표적 서열의 가이드핵산 결합 서열, 즉, 상보성 단일가닥은 절단시키지 않을 수 있다.
또 다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 일부 핵산 조각(fragment)를 제거하는 것일 수 있다.
일 구체예로서, 상기 CRISPR 복합체가 서로 다른 표적 서열에 상보적 결합을 하는 두 개의 gRNA와 야생형 SpCas9에 의해 구성되는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하여 제 1 gRNA와 제 2 gRNA 및 SpCas9에 의해 핵산 조각을 제거할 수 있다.
상기 ii) 손상된 표적 유전자의 수선 또는 수복은 비-상동성 말단-결합 (NHEJ) 및 상동 재조합 수리(HDR)을 통해 수선 또는 수복될 수 있다.
상기 비-상동성 말단-결합 (Non-homologous end joining, NHEJ)은 절단된 이중가닥 또는 단일가닥의 양 말단이 함께 결합함으로써 DNA 내 이중가닥 파손을 수복 또는 수선하는 방법으로, 일반적으로, 이중가닥의 파손(예를 들어, 절단)에 의해 형성된 2 개의 적합성 말단이 빈번한 접촉을 반복하여 2개의 말단이 완전히 결합되는 경우 파손된 이중가닥이 복구된다. NHEJ는 모든 세포주기에서 가능한 수복 방식으로, 주로 G1 시기와 같이 세포 내에 주형으로 쓸 상동유전체가 없을 때 발생한다.
NHEJ를 이용한 손상된 유전자 또는 핵산의 수복 과정에서 NHEJ 수선 부위에 핵산 서열의 일부 삽입 및/또는 결실(삽입결실)을 초래하며, 이러한 삽입 및/또는 결실은 리딩 프레임을 변경시키고, 프레임쉬프트 된 전사체 mRNA를 만들어내고, 결과적으로 넌센스-매개 붕괴(nonsense mediated decay)를 겪거나 정상적인 단백질을 합성하는데 실패함으로써 본래의 기능을 상실하게 된다. 또는 추가적으로, 리딩 프레임을 유지하지만, 상당한 양의 서열을 삽입 또는 결실시키는 돌연변이를 초래해 단백질의 기능성을 파괴할 수 있다. 이는 중요한 기능적 도메인의 돌연변이가 단백질의 비중요 영역에서의 돌연변이보다 덜 용인될 가능성이 있기 때문에 좌위 의존적이다.
NHEJ에 의해 생성된 삽입결실 돌연변이는 자연 상태에서 예측 불가능하지만, 주어진 파손 부위에서 특정 삽입 결실 서열이 선호되며, 이는 마이크로상동성의 작은 영역에 기인할 가능성이 있다. 통상적으로 결실 길이는 1 bp 내지 50 bp 범위이며, 삽입은 더 짧게 되는 경향이 있고, 종종 파손 부위를 바로 둘러싸는 짧은 중복 서열을 포함한다.
또한, NHEJ는 돌연변이를 유발하는 과정으로, 특이적 최종 서열의 생성이 필요하지 않은 경우, 작은 서열의 모티프를 결실시키는데 사용될 수 있다.
이러한 NHEJ를 이용하면, CRISPR 복합체에 의해 표적되는 유전자의 특이적 넉아웃(knockout)할 수 있다. CRISPR 효소, 예를 들어, Cas9 또는 Cpf1을 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥의 절단하고, 파손된 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥은 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 핵산의 특이적 넉아웃을 유도할 수 있다. 이때, 상기 CRISPR 효소에 의해 절단되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있으며, 더불어 NHEJ에 의해 수복되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있다.
일 예로, CRISPR 복합체를 이용하여 표적 유전자의 이중가닥을 절단하고 NHEJ에 의해 수복되는 과정을 통해 수복 부위에 다양한 인델 (indel; insertion and deletion)이 발생할 수 있다.
"인델(indel)"은 DNA의 뉴클레오타이드 배열에서 일부 뉴클레오타이드가 중간에 삽입 (insertion)되거나 결실 (deletion) 된 변이를 총칭한다. 인델은 상술한 바와 같이 gRNA-CRISPR 효소 복합체가 혈액 응고 저해 유전자의 핵산(DNA, RNA)를 절단하는 경우, HDR 또는 NHEJ 기작에 의해 수선되는 과정에서 표적 서열에 도입되는 것일 수 있다.
상기 상동 재조합 수리(homology directed repairing, HDR)는 손상된 유전자 또는 핵산을 수선 또는 수복하기 위해 상동성을 가진 서열을 주형으로 이용하는 방식으로 오류 없이 교정할 수 있는 방법으로, 일반적으로, 파손된 DNA을 수선 또는 수복하기 위해, 즉 세포가 가지고 있는 원래의 정보를 복원하기 위해, 변형이 이루어지지 않은 상보적인 뉴클레오타이드서열의 정보를 이용하거나 자매 염색분체의 정보를 이용하여 파손된 DNA를 수선 또는 수복한다. HDR의 가장 일반적인 형태는 상동성 재조합(homologous recombination, HR)이다. HDR은 통상적으로 활발하게 분열하는 세포의 S나 G2/M 시기에 주로 발생하는 수선 또는 수복 방식이다.
HDR을 이용한 손상된 DNA 수선 또는 수복을 위해, 세포가 본래 가지는 상보적인 뉴클레오타이드서열 또는 자매 염색분체를 이용하는 대신에, 상보적인 뉴클레오타이드서열 또는 상동성 뉴클레오타이드서열 정보를 이용한 인공적으로 합성한 DNA 주형, 즉, 상보적인 뉴클레오타이드서열 또는 상동성 뉴클레오타이드서열을 포함하는 핵산 주형을 세포에 제공하여 파손된 DNA를 수선 또는 수복할 수 있다. 이때, 상기 핵산 주형에 추가로 핵산 서열 또는 핵산 조각을 포함시켜 파손된 DNA를 수선 또는 수복 할 때, 파손된 DNA에 추가로 포함시킨 핵산 서열 또는 핵산 조작을 삽입(Knock-In)할 수 있다. 추가로 포함시킨 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있으나, 이에 제한되지 않는다.
일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 뉴클레오타이드서열과 상보적인 뉴클레오타이드서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 뉴클레오타이드서열을 HDR 방법으로 수선 또는 수복할 수 있다.
이때, 상기 상보적인 뉴클레오타이드서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상보적인 뉴클레오타이드서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상보적인 뉴클레오타이드서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상보적인 뉴클레오타이드서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 뉴클레오타이드서열과 상보적인 결합을 하는 뉴클레오타이드서열일 수 있다. 또는 상기 상보적인 뉴클레오타이드서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상보적인 결합을 하는 뉴클레오타이드서열일 수 있다. 상기 상보적인 뉴클레오타이드서열은 15 내지 3000개의 뉴클레오타이드서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상보적인 뉴클레오타이드서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.
다른 일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 뉴클레오타이드서열과 상동성 뉴클레오타이드서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 뉴클레오타이드서열을 HDR 방법으로 수선 또는 수복할 수 있다.
이때, 상기 상동성 뉴클레오타이드서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상동성 뉴클레오타이드서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상동성 뉴클레오타이드서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상동성 뉴클레오타이드서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 뉴클레오타이드서열과 상동성을 가지는 뉴클레오타이드서열일 수 있다. 또는 상기 상보적인 뉴클레오타이드서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상동성을 가지는 뉴클레오타이드서열일 수 있다. 상기 상동성 뉴클레오타이드서열은 15 내지 3000개의 뉴클레오타이드서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상동성 뉴클레오타이드서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.
상기 NHEJ와 HDR 외에도 손상된 표적 유전자를 수선 또는 수복하는 다양한 방법이 존재한다. 예를 들어, 손상된 표적 유전자의 수선 또는 수복 방법은 단일가닥 어닐링, 단일가닥 파손 수선, 미스매치 수선, 뉴클레오타이드 절단 수선 또는 뉴클레오타이드 절단 수선을 이용한 방법일 수 있다.
상기 단일가닥 어닐링(Single-strand annealing, SSA)은 표적 핵산 중에 존재하는 2개의 반복부 서열 사이의 이중가닥 파손을 수선하는 방법으로, 일반적으로 30개 초과의 뉴클레오타이드서열의 반복부 서열을 이용할 수 있다. 파손 말단에서 표적 핵산의 이중가닥에 대해 반복부 서열을 각각의 단일가닥이 가지도록 절단(Sticky end가 되도록)되며, 절단 후 반복부 서열을 함유하는 단일가닥 돌출부는 반복체 서열이 자체적으로 부적절하게 어닐링되는 것을 방지하기 위해 RPA 단백질로 코팅된다. RAD52는 돌출부 상의 각각의 반복부 서열에 결합하고, 상보성 반복부 서열의 어닐링을 가능하게 하는 서열을 정렬한다. 어닐링 후에, 돌출부의 단일가닥 플랩(flap)은 절단되고, 새로운 DNA 합성이 임의의 갭을 채우면서 DNA 이중가닥을 복원한다. 이러한 수복 또는 수선의 결과로, 2개의 반복체 사이의 DNA 서열이 결실되며, 결실 길이는 이용되는 2개의 반복체의 위치를 포함하는 다수의 인자 및 절단 경로 또는 진행도에 의존될 수 있다.
SSA는 HDR 방식과 유사하게는 상보성 서열, 즉 상보성 반복부 서열을 이용하고, 대조적으로는 표적 핵산 서열을 변경 또는 수정하기 위한 핵산 주형을 필요로 하지 않는다.
게놈 내 단일가닥 파손은 상기 논의된 수선 메커니즘과는 별도의 메커니즘인 단일가닥 파손 수선(Single-strand break repair, SSBA)을 통해 수선 또는 수복될 수 있다. DNA 파손의 형태가 단일가닥 파손일 때, PARP1 및/또는 PARP2는 파손을 인식하고 수선 기작을 동원한다. DAN 파손에서 PARP1의 결합 및 활성을 일시적이며, 손상부에 SSBR 단백질 복합체의 안정성을 촉진함으로써 SSBR을 촉진시킨다. SSBR 복합체에서 가장 중요한 단백질은 XRCC1으로, 이는 DNA의 3' 및 5' 말단 가공을 촉진하는 단백질과 상호작용하며, 안정화시킨다. 말단 가공은 일반적을 손상된 3' 말단을 하이드록실화 된 상태 및/또는 5' 말단을 인산염 모이어티로 복구하는 것을 수반하며, 말단이 가공되면, DNA 갭 채우기가 일어난다. DNA 갭 채우기에는 2가지 방법, 즉, 짧은 패치 수선 및 긴 패치 수선이 있으며, 이때 짧은 패치 수선은 빠져있는 단일 뉴클레오타이드의 삽입을 수반한다. DNA 갭 채우기 후, DNA 리가아제는 말단의 결합을 촉진한다.
상기 미스매치 수선(Mismatch repair, MMR)은 잘못 짝지어진 DNA 뉴클레오타이드상에서 작용할 수 있다. MSH2/6 또는 MSH2/3 복합체는 둘 다 미스매치 인식 및 수선의 개시에서 중요한 역할을 하는 ATP 분해효소 활성을 가지며, MSH2/6는 뉴클레오타이드-뉴클레오타이드 미스매치를 우선적으로 인식하고, 1개 또는 2개의 뉴클레오타이드의 미스매치를 동정하는 반면, MSH2/3는 더 큰 미스매치를 우선적으로 인식한다.
상기 뉴클레오타이드 절단 수선(Base excision repair, BER)은 세포주기 전체에서 활성이며, 게놈으로부터 작은 비-나선-뒤틀림 뉴클레오타이드 손상부를 제거하는데 이용되는 수선 방식이다. 손상된 DNA는 당 인산화 백본에 뉴클레오타이드를 연결하는 N-글리코사이드 결합을 절단하여 손상된 뉴클레오타이드를 절단하고, 이어서 포스포디에스테르 백본을 절단하여 DNA 단일가닥 파손을 생성한다. 이렇게 형성된 파손된 단일가닥 말단을 제거하고, 제거된 단일가닥에 의해 발생된 갭을 새로운 상보성 뉴클레오타이드로 채운 후, DNA 리가아제로 새로 채워진 상보성 뉴클레오타이드 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.
상기 뉴클레오타이드 절단 수선(Nucleotide excision repair, NER)은 DNA로부터 큰 나선-뒤틀림 손상을 제거하는 중요한 절단 메커니즘으로, 손상이 인식되면, 손상부를 함유하는 짧은 단일가닥 DNA 세그먼트를 제거하여, 22개 내지 30개 뉴클레오타이드의 단일가닥 갭을 생성한다. 생성된 갭은 새로운 상보성 뉴클레오타이드로 채운 후, DNA 리가아제로 새로 채워진 상보성 뉴클레오타이드 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.
상기 gRNA-CRISPR 효소 복합체에 의한 표적 유전자, 즉, 혈액 응고 저해 유전자의 인위적인 조작 효과는 크게 넉아웃(knockout), 넉다운(knockdown), 넉인(knockin)일 수 있다.
"넉아웃(knockout)"은 표적 유전자 또는 핵산을 불활성화시키는 것을 의미하며, “표적 유전자 또는 핵산의 불활성화”는 표적 유전자 또는 핵산의 전사 및/또는 번역이 되지 못하는 상태를 의미한다. 넉아웃을 통해 질병을 유발하는 유전자 또는 비정상적 기능을 가지는 유전자의 전사 및 번역을 억제하여 단백질의 발현을 막을 수 있다.
예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 NHEJ를 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 파손된 표적 유전자 또는 염색체는 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉아웃을 유도할 수 있다.
다른 예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체 및 도너을 이용하여 표적 유전자 또는 염색체를 편집 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 도너를 이용해 HDR을 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 이때, 도너는 상동성 뉴클레오타이드서열 및 삽입시키길 원하는 뉴클레오타이드서열을 포함한다. 이때, 삽입시키길 원하는 뉴클레오타이드서열은 개수는 삽입 위치 또는 목적에 따라 다양하게 조절될 수 있다. 도너를 이용해 손상된 유전자 또는 염색체가 수복된 경우, 손상된 뉴클레오타이드서열 부위에 삽입시키길 원하는 뉴클레오타이드서열이 삽입되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉아웃을 유도할 수 있다.
"넉다운(knockdown)"은 표적 유전자 또는 핵산의 전사 및/또는 번역을 감소시키거나 표적 단백질의 발현이 감소하는 것을 의미한다. 넉다운을 통해 과발현되는 유전자 또는 단백질의 발현을 조절하여 질병의 발생을 막거나 질병을 치료할 수 있다.
예를 들어, gRNA- CRISPR 불활성 효소-전사 저해 활성 도메인 복합체, 즉, 전사 저해 활성 도메인을 포함하는 CRISPR 불활성 복합체를 이용하여 표적 유전자 또는 염색체를 편집 또는 교정하는 경우, 상기 CRISPR 불활성 복합체가 표적 유전자 또는 염색체에 특이적으로 결합하고, CRISPR 불활성 복합체에 포함된 전사 저해 활성 도메인에 의해 표적 유전자 또는 염색체의 전사가 저해되어 해당 유전자 또는 염색체의 발현이 저해되는 넉다운을 유도할 수 있다.
다른 예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 염색체를 편집 교정하는 경우, 상기 CRISPR 복합체가 표적 유전자 또는 염색체의 프로모터 및/또는 인핸서 부위를 절단할 수 있다. 이때, 상기 gRNA는 표적 유전자 또는 염색체의 프로모터 및/또는 인핸서 부위의 일부 뉴클레오타이드서열을 표적 서열로 인식할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 NHEJ를 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 파손된 표적 유전자 또는 염색체는 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉다운을 유도할 수 있다. 또는 선택적으로 도너를 이용하는 경우, CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 염색체는 HDR을 통해 손상된 유전자 또는 염색체가 수복될 수 있다. 도너를 이용해 손상된 유전자 또는 염색체가 수복된 경우, 손상된 뉴클레오타이드서열 부위에 삽입시키길 원하는 뉴클레오타이드서열이 삽입되며, 이를 통해 표적 유전자 또는 염색체의 특이적 넉다운을 유도할 수 있다.
"넉인(knockin)"은 표적 유전자 또는 핵산에 특정 핵산 또는 유전자를 삽입하는 것을 의미하며, 이때, "특정 핵산 또는 유전자"은 삽입하고자 하는 또는 발현시키기 원하는 핵산 또는 유전자를 의미한다. 넉인을 통해 질병을 유발하는 돌연변이 유전자를 올바르게 교정하거나, 정상 유전자를 삽입하여 정상 유전자의 발현을 유도하여 질병 치료에 이용할 수 있다.
더불어, 넉인은 추가적으로 도너(donor)를 필요로 할 수 있다.
예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체 및 도너를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 도너를 이용해 HDR를 통해 손상된 유전자 또는 핵산이 수복될 수 있다. 이때, 도너는 특정 핵산 또는 유전자를 포함하며, 이를 이용하여 손상된 유전자 또는 염색체에 특정 핵산 또는 유전자를 삽입할 수 있다. 이때, 삽입된 특정 핵산 또는 유전자는 단밸질로의 발현이 유도할 수 있다.
본 명세서에 의해 개시되는 내용의 일 구체예로서, gRNA-CRISPR 효소 복합체는 AT 유전자 및/또는 TFPI 유전자에 인위적인 조작 또는 변형을 가할 수 있다.
상기 gRNA-CRISPR 효소 복합체는 AT 유전자 및/또는 TFPI 유전자의 표적 서열을 특이적으로 인식할 수 있다.
상기 표적 서열은 gRNA-CRISPR 효소 복합체의 gRNA에 의해 특이적으로 인식될 수 있으며, 이로 인해 gRNA-CRISPR 효소 복합체는 인식된 표적 서열에 근접하게 위치할 수 있다.
상기 표적 서열은 AT 유전자 및/또는 TFPI 유전자에 인위적인 변형이 일어나는 부위 또는 영역일 수 있다.
상기 표적 서열은 AT 유전자 및/또는 TFPI 유전자의 프로모터 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.
상기 표적 서열은 AT 유전자 및/또는 TFPI 유전자의 인트론 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.
상기 표적 서열은 AT 유전자 및/또는 TFPI 유전자의 엑손 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.
상기 표적 서열은 AT 유전자 및/또는 TFPI 유전자의 인핸서 영역에 위치한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.
상기 표적 서열은 AT 유전자 및/또는 TFPI 유전자의 핵산서열 내의 PAM(proto-spacer-adjacent Motif) 서열의 5' 말단 및/또는 3' 말단에 인접한 연속하는 10bp 내지 25bp의 뉴클레오타이드 서열일 수 있다.
이때, 상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).
NGG(N은 A, T, C 또는 G임);
NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);
NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G임); 및
TTN(N은 A, T, C 또는 G임).
일 구체예에서, 상기 표적 서열은 표 1에 기재된 뉴클레오타이드서열 중 선택된 하나 이상의 뉴클레오타이드서열일 수 있다.
상기 gRNA-CRISPR 효소 복합체는 gRNA와 CRISPR 효소로 구성될 수 있다.
상기 gRNA는 AT 유전자 및/또는 TFPI 유전자의 표적 서열 중 가이드핵산 결합 서열과 일부 또는 완전한 상보적 결합을 할 수 있는 가이드 도메인을 포함할 수 있다.
상기 가이드 도메인은 가이드핵산 결합 서열에 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보성이거나 또는 완전하게 상보성일 수 있다.
상기 가이드 도메인은 AT 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.
상기 가이드 도메인은 TFPI 유전자의 표적 서열 중 가이드핵산 결합 서열에 상보적인 뉴클레오타이드서열을 포함할 수 있다. 이때, 상기 상보적인 뉴클레오타이드서열은 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다.
상기 gRNA는 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인으로 구성된 군에서 선택된 하나 이상의 도메인을 포함할 수 있다.
상기 CRISPR 효소는 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상일 수 있다. 일 예에서, 상기 에디터단백질은 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질 또는 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질일 수 있다.
상기 gRNA-CRISPR 효소 복합체는 AT 유전자 및/또는 TFPI 유전자에 다양한 인위적인 조작 또는 변형을 가할 수 있다.
상기 인위적으로 조작 또는 변형된 AT 유전자 및/또는 TFPI 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
예를 들어, 인위적으로 조작 또는 변형된 AT 유전자 및/또는 TFPI 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 결실을 포함할 수 있다. 일 예로, 결실되는 뉴클레오타이드는 연속되거나 연속되지 않는 1, 2, 3, 4 또는 5bp 일 수 있다. 다른 일 예로, 결실되는 뉴클레오타이드는 연속되는 2bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 뉴클레오타이드 조각은 2bp 내지 5bp, 6bp 내지 10bp, 11bp 내지 15bp, 16bp 내지 20bp, 21bp 내지 25bp, 26bp 내지 30bp, 31bp 내지 35bp, 36bp 내지 40bp, 41bp 내지 45bp 또는 46bp 내지 50bp일 수 있다. 또다른 일 예로, 결실되는 뉴클레오타이드는 2 이상의 뉴클레오타이드 조각일 수 있다. 이때, 2 이상의 뉴클레오타이드 조각은 뉴클레오타이드 서열이 연속되지 않는, 즉, 하나 이상의 뉴클레오타이드 서열 간격을 가지는 각각의 뉴클레오타이드 조각일 수 있으며, 결실된 2 이상의 뉴클레오타이드 조각에 의해 2 이상의 결실 부위가 발생할 수 있다.
또는, 예를 들어, 인위적으로 조작 또는 변형된 AT 유전자 및/또는 TFPI 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 삽입을 포함할 수 있다. 일 예로, 삽입되는 뉴클레오타이드는 연속된 1, 2, 3, 4 또는 5bp 일 수 있다. 다른 일 예로, 삽입되는 뉴클레오타이드는 연속되는 5bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 뉴클레오타이드 조각은 5bp 내지 10bp, 11bp 내지 50bp, 50bp 내지 100bp, 100bp 내지 200bp, 200bp 내지 300bp, 300bp 내지 400bp, 400bp 내지 500bp, 500bp 내지 750bp 또는 750bp 내지 1000bp일 수 있다. 또 다른 일 예로, 삽입되는 뉴클레오타이드는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있다. 이때, 특정 유전자는 AT 유전자 및/또는 TFPI 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하지 않는 외부에서 유입된 유전자일 수 있다. 또는 특정 유전자는 AT 유전자 및/또는 TFPI 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하는 유전자, 예를 들어, 인간세포 게놈에 존재하는 유전자일 수 있다.
또는, 예를 들어, 인위적으로 조작 또는 변형된 AT 유전자 및/또는 TFPI 유전자는 표적 서열 내에 또는 표적 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 뉴클레오타이드 서열 부위에 하나 이상의 뉴클레오타이드 결실 및 삽입을 포함할 수 있다. 일 예로, 결실되는 뉴클레오타이드는 연속되거나 연속되지 않는 1, 2, 3, 4 또는 5bp 일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 이때, 삽입되는 뉴클레오타이드 조각은 5bp 내지 10bp, 11bp 내지 50bp, 50bp 내지 100bp, 100bp 내지 200bp, 200bp 내지 300bp, 300bp 내지 400bp, 400bp 내지 500bp, 500bp 내지 750bp 또는 750bp 내지 1000bp일 수 있다. 이때, 특정 유전자는 AT 유전자 및/또는 TFPI 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하지 않는 외부에서 유입된 유전자일 수 있다. 또는 특정 유전자는 AT 유전자 및/또는 TFPI 유전자를 포함하는 대상체, 예를 들어, 인간세포가 포함하는 유전자, 예를 들어, 인간세포 게놈에 존재하는 유전자일 수 있다. 다른 일 예로, 결실되는 뉴클레오타이드는 2bp 이상의 뉴클레오타이드로 이루어진 뉴클레오타이드 조각일 수 있다. 이때, 결실되는 뉴클레오타이드 조각은 2bp 내지 5bp, 6bp 내지 10bp, 11bp 내지 15bp, 16bp 내지 20bp, 21bp 내지 25bp, 26bp 내지 30bp, 31bp 내지 35bp, 36bp 내지 40bp, 41bp 내지 45bp 또는 46bp 내지 50bp일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 또 다른 일 예로, 결실되는 뉴클레오타이드는 2 이상의 뉴클레오타이드 조각일 수 있다. 이때, 삽입되는 뉴클레오타이드는 1, 2, 3, 4 또는 5bp; 뉴클레오타이드 조각; 또는 특정 유전자의 일부 또는 전체 뉴클레오타이드 서열일 수 있으며, 상기 결실과 삽입은 순차적으로 일어나거나 동시에 발생할 수 있다. 또한, 상기 삽입은 결실된 2 이상의 부위에 일부 또는 전체 부위에서 발생할 수 있다.
상기 gRNA-CRISPR 효소 복합체는 gRNA 및 CRISPR 효소의 종류에 따라 AT 유전자 및/또는 TFPI 유전자에 다양한 인위적인 조작 또는 변형을 가할 수 있다.
일 예로, 상기 CRISPR 효소가 SpCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 AT 유전자 및/또는 TFPI 유전자는 각 유전자의 표적 영역 내 존재하는 5'-NGG-3' (N은 A, T, G, 또는 C임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
다른 일 예로, 상기 CRISPR 효소가 CjCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 AT 유전자 및/또는 TFPI 유전자는 각 유전자의 표적 영역 내 존재하는 5'-NNNNRYAC-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
또 다른 일 예로, 상기 CRISPR 효소가 StCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 AT 유전자 및/또는 TFPI 유전자는 각 유전자의 표적 영역 내 존재하는 5'-NNAGAAW-3'(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
일 예로, 상기 CRISPR 효소가 NmCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 AT 유전자 및/또는 TFPI 유전자는 각 유전자의 표적 영역 내 존재하는 5'-NNNNGATT-3'(N은 각각 독립적으로 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
다른 일 예로, 상기 CRISPR 효소가 SaCas9 단백질인 경우, 상기 인위적인 조작 또는 변형된 AT 유전자 및/또는 TFPI 유전자는 각 유전자의 표적 영역 내 존재하는 5'-NNGRR(T)-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, (T)는 임의로 포함가능한 서열을 의미함) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
또 다른 일 예로, 상기 CRISPR 효소가 Cpf1 단백질인 경우, 상기 인위적인 조작 또는 변형된 AT 유전자 및/또는 TFPI 유전자는 각 유전자의 표적 영역 내 존재하는 5'-TTN-3'(N은 A, T, C 또는 G임) PAM 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 1bp 내지 25bp의 뉴클레오타이드 서열 부위 내에 다음 중 하나 이상의 변형을 포함할 수 있다:
i) 하나 이상의 뉴클레오타이드의 결실,
ii) 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
iii) 하나 이상의 뉴클레오타이드의 삽입, 또는
iv) 상기 i) 내지 iii) 중에서 선택된 2 가지 이상의 조합.
상기 gRNA-CRISPR 효소 복합체에 의한 AT 유전자 및/또는 TFPI 유전자의 인위적인 조작 효과는 넉아웃(knockout)일 수 있다.
상기 gRNA-CRISPR 효소 복합체에 의한 AT 유전자 및/또는 TFPI 유전자의 인위적인 조작 효과는 AT 유전자 및/또는 TFPI 유전자에 의해 의해 각각 암호화되는 단백질의 발현이 억제될 수 있다.
상기 gRNA-CRISPR 효소 복합체에 의한 AT 유전자 및/또는 TFPI 유전자의 인위적인 조작 효과는 넉다운(knockdown)일 수 있다.
상기 gRNA-CRISPR 효소 복합체에 의한 AT 유전자 및/또는 TFPI 유전자의 인위적인 조작 효과는 AT 유전자 및/또는 TFPI 유전자에 의해 각각 암호화되는 단백질의 발현이 감소될 수 있다.
상기 gRNA-CRISPR 효소 복합체에 의한 AT 유전자 및/또는 TFPI 유전자의 인위적인 조작 효과는 넉인(knockin)일 수 있다.
이때, 상기 넉인 효과는 gRNA-CRISPR 효소 복합체 및 추가적으로 외부 유래 뉴클레오타이드서열 또는 유전자를 포함하는 도너에 의해 유도된 것일 수 있다.
상기 gRNA-CRISPR 효소 복합체에 의한 AT 유전자 및/또는 TFPI 유전자의 인위적인 조작 효과는 외부 유래 뉴클레오타이드서열 또는 유전자에 의해 암호화되는 펩타이드 또는 단백질이 발현될 수 있다.
본 명세서에 의해 개시되는 내용의 일 태양은 혈액 응고 장애를 치료하기 위한 유전자 조작용 조성물을 이용한 혈액 응고 장애 치료방법에 관한 것이다.
본 명세서에 의해 개시되는 일 구체예는 치료 대상에 혈액 응고 저해 유전자를 인위적으로 조작하기 위한 유전자 조작용 조성물의 투여를 포함하는 방법을 이용하는 혈액 응고 장애 치료 용도이다.
이때, 상기 치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유 동물일 수 있다.
“혈액 응고 장애(coagulopathy 또는 bleeding disorder)”은 비정상적인 혈액 응고 시스템에 의해 혈액 응고 생성이 저해 또는 억제되는 것을 의미한다. 이러한 혈액 응고 장애는 혈액 응고, 즉, 혈전의 형성이 저해 또는 억제되어 출혈시 지혈이 더디거나 되지 않는 상태를 포함하며, 이로 인해 발생하는 질병도 모두 포함하는 병적 상태를 의미한다.
이때, 혈액 응고 장애는 비정상적 혈액 응고 시스템 및 혈액 응고 저해 인자 유발 질환을 모두 포함한다.
상기 “혈액 응고 저해 인자 유발 질환”은 혈액 응고 저해 인자의 비정상적인 형태, 예를 들면, 돌연변이 등 또는 비정상적인 발현으로 인해 발생하는 질병을 모두 포함하는 모든 상태를 의미한다.
혈액 응고 장애는 생체 내 비정상적인 혈액 응고 시스템에 의한 질환으로, 혈우병일 수 있다.
일 실시예에서, 혈액 응고 장애는 혈우병 A, 혈우병 B 또는 혈우병 C일 수 있다.
혈우병(hemophilia, haemophilia)은 선천적으로 혈액 응고 인자가 결핍되어 나타나는 선천성 출혈성 질환이다. 혈액 응고 인자는 현재까지 12가지가 알려져 있으며, 선천성 혈액 응고 결핍증 중 혈우병 A는 VIII 인자 결핍(factor VIII deficiency)이 원인이며, 혈우병 B는 IX 인자 결핍(factor IX deficiency, christmas disease), 혈우병 C는 XI 인자 결핍증(factor XI deficiency)이 원인이다. 혈우병 A와 B가 혈우병의 95% 이상을 차지하며, 두 질환 모두 내인계 응고 기전에 관여하는 응고 인자이기 때문에 임상적으로는 쉽게 구별할 수 없다. 혈우병 A, B는 X-linked 열성으로 유전하며 여자는 무증상의 보인자로, 환자는 남아에만 있다.
혈우병 A는 VIII 인자 결핍(factor VIII deficiency)에 의해 증상이 나타난다. 혈우병 A의 20~30%에서는 가족력이 없이 돌연변이에 의하여 발생한다. 발생 빈도는 출생 남아 4,000~1만 명당 1명 꼴이며, 혈우병 A가 B보다 약 5~8배 정도 발생 빈도가 높다.
혈우병 B는 두 번째로 많은 유전성 응고 장애질환으로, 혈우병 B의 출혈증상은 성인보다는 아동과 청소년에서 심하게 나타난다. 보인자인 여성의 경우 증상이 경하기는 하지만 10%에서 출혈의 위험이 있다. 발생 빈도는 출생 남아 2만~2만 5,000명당 1명 꼴이다.
혈우병 C는 전체 응고 인자 결핍증의 2~3% 정도를 차지한다. 한국에는 아직 보고된 증례가 없고, 상염색체 열성으로 유전된다.
혈우병 A의 임상증상은 외상, 치아 발치, 외과적 수술 이후에 나타나는 계속적인 출혈이다. 중증 혈우병 A의 경우 생후 1년 내에 진단이 가능하며, 치료 받지 않은 경우에서 2~5개월 사이에 자연출혈증상이 나타나게 된다.
중등도(moderately severe)의 혈우병 A의 경우에도 자연출혈경향이 있다. 그러나 증상이 나타나는 시기가 지연되어 작은 외상 후 계속적인 출혈로 인해 5~6세 전에 진단을 받게 된다. 경증 혈우병 A의 경우 자연출혈이 없다. 외과적 수술, 치아발치, 심한 손상 후에 계속적인 출혈증상이 나타나게 되며, 평생 진단을 받지 못하는 경우도 있다. 혈우병 A의 출혈증상은 성인보다는 아동과 청소년에서 심하게 나타난다. 보인자인 여성의 경우 증상이 경하기는 하지만 10%에서 출혈의 위험이 있다.
혈우병 B는 IX 인자 결핍(factor IX deficiency)으로 외상, 치아발치 또는 외과적 수술 이후 초기 출혈이 멈춘 후 출혈이 계속된다. 중증의 혈우병 B에서 출혈 관절증이 빈번하게 나타난다. 중증 혈우병 B의 경우 생후 1년 내에 진단이 가능하며, 치료 받지 않은 경우에서 2~5개월 사이에 자연출혈증상이 나타나게 된다. 중등도(moderately severe)의 혈우병 B의 경우에서도 자연출혈 경향이 있지만 중증인 경우보다 나타나는 시기가 지연되어 있다. 중등도의 경우 외상 이후에 계속적인 출혈 증상이 있으며 5~6세 전에 진단을 받게 된다. 경도 혈우병 B는 자연출혈이 없고 외과적 수술, 치아발치, 심한 외상 후에 계속적인 출혈증상이 나타나게 된다. 경증인 경우 증상이 없어 평생 진단을 받지 못하는 경우도 있다.
일반적인 혈우병 치료는 부족한 혈액 응고 인자를 보충해 주는 것으로 현재 VIII 인자, IX 인자 제제가 사용되고 있으며, 치료 중 항체가 생성된 경우 우회 인자를 투여한다(Kemton CL et al., Blood. 2009; 113(1): 11-17).
본 명세서에 의해 개시되는 내용의 일 구체예는 혈액 응고 저해 유전자를 인위적으로 조작할 수 있는 유전자 조작용 조성물을 포함하는 약학적 조성물이다.
상기 유전자 조작용 조성물 관련 설명은 상기 기술한 바와 같다.
일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 혈액 응고 저해 유전자의 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
이때, 상기 혈액 응고 저해 유전자는 AT 유전자 및/또는 TFPI 유전자일 수 있다.
이때, 상기 유전자 조작용 조성물은 가이드핵산 및/또는 에디터단백질은 각각을 암호화하는 핵산서열을 포함하는 벡터를 포함할 수 있다.
이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 및 에디터단백질을 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.
다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 혈액 응고 저해 유전자의 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열;
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열; 및
(c) 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열.
이때, 삽입을 원하는 핵산서열은 혈액 응고 저해 유전자의 일부 서열일 수 있다.
또는 삽입을 원하는 핵산서열은 혈액 응고에 관여하는 단백질을 암호화하는 유전자 전체 또는 일부 핵산서열일 수 있다.
이때, 상기 혈액 응고에 관여하는 단백질은 XII 인자(factor XII), XIIa 인자(factor XIIa), XI 인자(factor XI), XIa 인자(factor XIa), IX 인자(factor IX), IXa 인자(factor IXa), X 인자(factor X), Xa 인자(factor Xa), VIII 인자(factor VIII), VIIIa 인자(factor VIIIa), VII 인자(factor VII), VIIa 인자(factor VIIa), V 인자(factor V), Va 인자(factor Va), 프로트롬빈(prothrombin), 트롬빈(thrombin), XIII 인자(factor XIII), XIIIa 인자(factor XIIIa), 피브리노겐(fibrinogen), 피브린(fibrin) 또는 Tissue factor일 수 있다.
이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 에디터단백질을 암호화하는 핵산서열; 및 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.
상기 약학적 조성물은 부가적 요소를 추가로 더 포함할 수 있다.
상기 부가적 요소는 대상의 체내에 전달하기 위한 적절한 담체를 포함할 수 있다.
또 다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 혈액 응고 저해 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
이때, 상기 혈액 응고 저해 유전자는 AT 유전자 및/또는 TFPI 유전자일 수 있다.
이때, 상기 유전자 조작용 조성물은 가이드핵산 및/또는 에디터단백질은 각각을 암호화하는 핵산서열을 포함하는 벡터를 포함할 수 있다.
이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 및 에디터단백질을 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.
다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 혈액 응고 저해 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열;
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열; 및
(c) 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열.
이때, 삽입을 원하는 핵산서열은 혈액 응고 저해 유전자의 일부 서열일 수 있다.
또는 삽입을 원하는 핵산서열은 혈액 응고에 관여하는 단백질을 암호화하는 유전자 전체 또는 일부 핵산서열일 수 있다.
이때, 상기 혈액 응고에 관여하는 단백질은 XII 인자(factor XII), XIIa 인자(factor XIIa), XI 인자(factor XI), XIa 인자(factor XIa), IX 인자(factor IX), IXa 인자(factor IXa), X 인자(factor X), Xa 인자(factor Xa), VIII 인자(factor VIII), VIIIa 인자(factor VIIIa), VII 인자(factor VII), VIIa 인자(factor VIIa), V 인자(factor V), Va 인자(factor Va), 프로트롬빈(prothrombin), 트롬빈(thrombin), XIII 인자(factor XIII), XIIIa 인자(factor XIIIa), 피브리노겐(fibrinogen), 피브린(fibrin) 또는 Tissue factor일 수 있다.
이때, 가이드핵산 또는 이를 암호화하는 핵산서열; 에디터단백질을 암호화하는 핵산서열; 및 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열은 1 이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.
상기 약학적 조성물은 부가적 요소를 추가로 더 포함할 수 있다.
상기 부가적 요소는 대상의 체내에 전달하기 위한 적절한 담체를 포함할 수 있다.
본 명세서에 의해 개시되는 내용의 일 구체예는 혈액 응고 장애를 치료하기 위해 혈액 응고 장애 유기체에 유전자 조작용 조성물을 투여하는 단계를 포함하는, 혈액 응고 장애의 치료방법이다.
상기 치료방법은 생체의 유전자를 조작하여 혈액 응고 시스템을 조절하는 치료방법일 수 있다. 이러한 치료방법은 생체의 유전자를 조작하기 위한 유전자 조작용 조성물을 체내에 직접 주입하여 이루어질 수 있다.
상기 유전자 조작용 조성물 관련 설명은 상기 기술한 바와 같다.
일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 혈액 응고 저해 유전자의 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
또는 다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 혈액 응고 저해 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
이때, 상기 혈액 응고 저해 유전자는 AT 유전자 및/또는 TFPI 유전자일 수 있다.
상기 가이드 핵산 및 에디터 단백질은, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하거나, 또는 가이드 핵산과 에디터 단백질의 결합으로 복합체를 형성하여 존재할 수 있다.
상기 유전자 조작용 조성물은 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함할 수 있다.
상기 가이드 핵산 및 에디터 단백질, 및/또는 도너는, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재할 수 있다.
이때, 상기 벡터는 플라스미드 또는 바이러스벡터일 수 잇다.
이때, 상기 상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.
상기 혈액 응고 장애 관련 설명은 상기 기술한 바와 같다.
상기 혈액 응고 장애는 혈우병 A, 혈우병 B 또는 혈우병 C일 수 있다.
상기 유전자 조작용 조성물은 혈액 응고 장애를 보이는 치료 대상에 투여될 수 있다.
상기 치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.
상기 유전자 조작용 조성물은 치료 대상에 투여될 수 있다.
상기 투여는 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)으로 수행될 수 있다.
상기 투여는 간내(intrahepatic), 피하(subcutaneous), 피내(intradermal), 안구내(intraocular), 유리체내(intravitreal) 종양내(intratumoral), 절내(intranodal), 골수내(intramedullary), 근육내(intramuscular), 정맥내(intravenous), 림프액내(intralymphatic) 또는 복막내(intraperitoneal)에서 선택된 투여 경로로 수행될 수 있다.
유전자 조작용 조성물의 1회 투여량(소정의 소망하는 효과를 얻기 위한 약학적 유효량)은 투여 대상의 체중 kg 당 104-109 세포, 예컨대, 105 내지 106 세포/kg(체중) 정도로 상기 수치 범위들 내의 모든 정수값들 중에서 선택될 수 있으나, 이에 제한되는 것은 아니고, 투여 대상의 연령, 건강 및 체중, 동시에 받는 치료의 종류, 만약 있다면 치료의 빈도, 원하는 효과의 특성 등을 고려하여 적절히 처방될 수 있다.
본 명세서에 의해 개시되는 몇몇 구형예들의 방법 및 조성물에 의해 혈액 응고 저해 유전자를 인위적으로 조작할 경우, 혈액 응고 시스템의 정상화가 가능하게 되고, 이를 통해 비정상적인 출혈 증상을 억제시키거나 개선시키는 등의 효과를 얻을 수 있다.
본 명세서에 의해 개시되는 내용의 일 구체예는 진핵세포에서 혈액 응고 저해 유전자를 변형하는 방법에 관한 것으로, 이것은 생체 내, 생체 외 또는 시험관 내에서 이루어질 수 있다.
일부 실시형태에서, 방법은 인간 또는 비인간 동물로부터 세포 또는 세포 집단을 시료추출하는 단계, 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체외에서 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비인간 동물 또는 식물에 재도입될 수 있다.
상기 방법은 진핵세포에 유전자 조작용 조성물을 도입시키는 단계를 포함하는, 진핵세포를 인위적으로 조작하는 방법일 수 있다.
상기 유전자 조작용 조성물 관련 설명은 상기 기술한 바와 같다.
일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 혈액 응고 저해 유전자의 표적 서열을 표적화할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
또는 다른 일 구현예로, 상기 유전자 조작용 조성물은 다음을 포함할 수 있다.
(a) 혈액 응고 저해 유전자의 표적 서열과 상보적인 결합을 형성할 수 있는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기티디스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
이때, 상기 혈액 응고 저해 유전자는 AT 유전자 및/또는 TFPI 유전자일 수 있다.
상기 가이드 핵산 및 에디터 단백질은, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하거나, 또는 가이드 핵산과 에디터 단백질의 결합으로 복합체를 형성하여 존재할 수 있다.
상기 도입 단계는 생체 내 또는 생체 외에서 수행될 수 있다.
예를 들어, 도입 단계는 전기천공법 (electroporation), 리포좀, 플라스미드, 바이러스벡터, 나노파티클(nanoparticles) 및 PTD (Protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 수행될 수 있다.
예를 들어, 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다.
이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 자명할 것이다.
실험방법
1. sgRNA 설계
CRISPR RGEN Tools (Institute for Basic Science, Korea)의 Cas-Designer 프로그램을 사용하여 인간의 SERPINC1 및 TFPI 유전자에 대해서 CRISPR/SpCas9 또는 CRISPR/SaCas9 또는 CRISPR/CjCas9에 대한 타겟들을 각각의 PAM을 고려하여 추출하였다. 또한 Cas-Offinder 프로그램을 사용하여 인간 유전체상에서 1-base와 2-base의 mismatched off-target이 예측되지 않는 것들로 선별하였다. 실험에 이용된 sgRNA는 표 3 및 표 4에 기재된 가이드 서열들 중 적어도 하나 이상을 포함하도록 설계하였다.
2. Guide RNA의 활성 검증 및 off-target 분석
HEK293 및 Jurkat 인간세포주 약 2 × 105 세포수에 각각의 guide RNA 서열이 cloning된 sgRNA발현용 벡터 250ng을 Cas9 발현용 벡터 750ng과 함께 Lipofectamine 2000으로 transfection 하였다. 또는 in vitro transcribed sgRNA 1㎍과 Cas9 4㎍을 RNP complex형태로 mix시켜 Electroporation을 통해 transfection 하였다. 약 2 ~ 3일 후 genomic DNA를 추출하고 PCR로 on-target위치를 증폭시킨 후, Next-Generation Sequencing을 위한 sequencing primer에 특이적인 adaptor 및 TruSeq HT 이중 지표 프라이머(TruSeq HT Dual Index primers)를 붙이는 추가적인 PCR을 진행하였다. 이후 paired sequencing을 통하여 나온 read들을 분석하여 on-target 유전체 위치에서의 insertion 또는 deletion (Indels) 확인을 통해 guide RNA들의 활성을 평가하였다.
선별된 guide RNA의 off-target 분석을 위해서는 첫 번째, CRISPR RGEN Tools의 Cas-Offinder를 사용한 in-silico 방법으로 3-base mismatch가 있는 off-target list들을 선별하고, 각각의 off-target에 해당하는 유전체상의 특정 부분에 대한 targeted-deep sequencing을 통한 방법으로 검증하였다. 두 번째 방법으로는, guide RNA와 Cas9 단백질을 37℃에서 overnight로 처리한 인간의 전체 genomic DNA를 Whole Genome Sequencing을 하고, 이후 Digenome-seq 분석을 통해서 잠재적인 list들을 확보하였다. 이후 off-target 후보들 각각의 유전체상의 특정 부분에 대한 targeted-deep sequencing을 통한 방법으로 off-target 위치에서의 indel 도입 여부를 검증하였다.
3. AAV 제작
SpCas9의 유전자교정 도구 전달은 dual AAV system을 사용하였다. 즉, AAV2의 역위 말단 반복(Inverted Tandem Repeat, ITR)사이에 Mammalian 발현용 promoter(EFS, TBG, ICAM2), C- 또는 N-말단에 NLS와 HA태그를 가지는 human codon 최적화된 Cas9, BGHA를 포함하는 벡터 (pAAV-SpCas9) 및 U6 promoter sgRNA서열을 포함하는 벡터 (pAAV-U6-sgRNA)를 각각 합성하여 제작하였다.
또한 다른 시스템의 dual AAV은, Split SpCas9을 이용하였다. 하나의 AAV에는 ITR사이에 promoter(TBG, ICAM2)-SpCas9-Nterm-Intein를 포함하는 벡터를 제작하였고 (pAAV-SpCas9-split-Nterm), 또다른 AAV에는 ITR사이에 promoter(TBG, ICAM2)-Intein-SpCas9-Cterm-U6-SgRNA를 포함하는 벡터를 제작하였다 (pAAV-SpCas9-split-C-term-U6-SgRNA).
CjCas9의 유전자교정 도구 전달은 single AAV system을 사용하였다. 즉, AAV2 ITR사이에 promoter(EFS, TBG, ICAM2), C- 또는 N-말단에 NLS와 HA태그를 가지는 human codon 최적화된 Cas9, BGHA, U6 promoter와 sgRNA 서열을 포함하는 벡터(pAAV-CjCas9-U6-sgRNA)를 합성하여 제작하였다. AAV 생산은, AAV capsid의 위형(pseudotype)에 대한 벡터, 제작된 pAAV 벡터(pAAV-EFS-SpCas9 또는 pAAV-U6-sgRNA 또는 pAAV-EFS-CjCas9-U6-sgRNA), pHelper vector를 1:1:1의 몰농도로 HEK293세포에 동시에 transfection하였다. 72시간 후, 세포를 융해한 후 얻은 virus particle을 iodixanol(Sigma-aldrich)을 이용해 step-gradient 초원심분리기로 분리정제하고, AAV의 정량적인 확인은 qPCR을 이용한 titration 방법으로 측정하였다.
4. Animals 및 injection
A형 및 B형 혈우병 모델 동물로는 각각 F8-KO마우스 및 F9-KO rat을 사용하였다. 제작된 AAV 및 LNP를 intravenous injection 또는 intraperitoneal injection의 방법으로 각각의 CRISPR/Cas9를 동물모델에 전달하였다.
5. In vivo editing test
AAV 및 LNP injection 약 4~6주후에 liver를 제거하고, genomic DNA를 추출하여 PCR 및 targeted-deep-sequencing을 통해 On-target 및 Off-target 위치의 indels을 평가하였다.
6. 혈우병 지표 테스트
AAV 및 LNP injection후 다양한 time point(1W-4W-8W-16W-32W 등)에서 blood를 채취하여 혈중 Serpinc1 및 TFPI의 단백질양을 ELISA를 통해 평가하거나, PT, aPTT assay, Immunohistochemistry, Tail cutting assay(Blood loss 정량) 등을 통해 혈우병 지표를 평가하였다.
실험 결과
1. Guide RNA의 활성 검증
SERPINC1 유전자(AT 유전자) 및 TFPI 유전자를 각각 표적하는 gRNA의 활성을 indel(%)을 통해 확인하고 선별하였다.
1) SERPINC1 유전자(AT 유전자)
① SpCas9
SpCas9을 위한 SERPINC1 유전자(AT 유전자)를 표적하는 gRNA 선별(gRNA selection to target SERPINC1 gene(AT gene) for SpCas9)
Target name Target(w/o PAM)
(SEQ ID NO)
PAM GC content Indels (%)
hMyd88-Sp-Ctrl GTCCATCTCCTCCGCCAGCG(SEQ ID NO: 847) CGG   75.0
hSerpinc1-Sp-3 GCCATGTATTCCAATGTGAT(SEQ ID NO: 21) AGG 40 49.9
hSerpinc1-Sp-4 GTGATAGGAACTGTAACCTC(SEQ ID NO: 22) TGG 45 42.2
hSerpinc1-Sp-12 GGGACTGCGTGACCTGTCAC(SEQ ID NO: 30) GGG 65 61.2
hSerpinc1-Sp-13 GTCCACAGGGCTCCCGTGAC(SEQ ID NO: 31) AGG 70 29.4
hSerpinc1-Sp-19 CATGGGAATGTCCCGCGGCT(SEQ ID NO: 37) TGG 65 56.1
hSerpinc1-Sp-20 GGATTCATGGGAATGTCCCG(SEQ ID NO: 38) CGG 55 1.3
hSerpinc1-Sp-23 GGGGAGCGGTAAATGCACAT(SEQ ID NO: 41) GGG 55 49.3
hSerpinc1-Sp-24 CGGGGAGCGGTAAATGCACA(SEQ ID NO: 42) TGG 60 4.2
hSerpinc1-Sp-25 CATGTGCATTTACCGCTCCC(SEQ ID NO: 43) CGG 55 58.3
hSerpinc1-Sp-30 TTACCGCTCCCCGGAGAAGA(SEQ ID NO: 48) AGG 60 49.5
hSerpinc1-Sp-34 GGGCTCAGAACAGAAGATCC(SEQ ID NO: 52) CGG 55 45.7
hSerpinc1-Sp-36 CACGCCGGTTGGTGGCCTCC(SEQ ID NO: 54) GGG 75 14.9
hSerpinc1-Sp-37 ACACGCCGGTTGGTGGCCTC(SEQ ID NO: 55) CGG 70 6.2
hSerpinc1-Sp-39 TTCCCAGACACGCCGGTTGG(SEQ ID NO: 57) TGG 65 22.5
hSerpinc1-Sp-40 CAGTTCCCAGACACGCCGGT(SEQ ID NO: 58) TGG 65 22.1
hSerpinc1-Sp-42 AGGCCACCAACCGGCGTGTC(SEQ ID NO: 60) TGG 70 0.2
hSerpinc1-Sp-43 GGCCACCAACCGGCGTGTCT(SEQ ID NO: 61) GGG 70 8.2
hSerpinc1-Sp-45 AGCAAAGCGGGAATTGGCCT(SEQ ID NO: 63) TGG 55 0.0
hSerpinc1-Sp-49 TGCCAGGTGCTGATAGAAAG(SEQ ID NO: 67) TGG 50 34.4
hSerpinc1-Sp-50 TACCACTTTCTATCAGCACC(SEQ ID NO: 68) TGG 45 27.3
② SaCas9
SaCas9을 위한 SERPINC1 유전자(AT 유전자)를 표적하는 gRNA 선별(gRNA selection to target SERPINC1 gene(AT gene) for SaCas9)
Target name Target(w/o PAM)
(SEQ ID NO)
PAM GC content Indels(%)
hAPOC3-Cj-Ctrl GAGAGGGCCAGAAATCACCCAA(SEQ ID NO: 848) AGACACAC   64.1
hSerpinc1-Sa-1 GGTTACAGTTCCTATCACAT(SEQ ID NO: 216) TGGAAT 40 51.6
hSerpinc1-Sa-2 CCAAGCCGCGGGACATTCCC(SEQ ID NO: 217) ATGAAT 70 65.2
hSerpinc1-Sa-3 TAAATGCACATGGGATTCAT(SEQ ID NO: 218) GGGAAT 35 49.2
hSerpinc1-Sa-4 CGGGGAGCGGTAAATGCACA(SEQ ID NO: 219) TGGGAT 60 34.5
hSerpinc1-Sa-5 CCCCGGAGAAGAAGGCAACT(SEQ ID NO: 220) GAGGAT 60 44.7
hSerpinc1-Sa-6 ACACGCCGGTTGGTGGCCTC(SEQ ID NO: 221) CGGGAT 70 0.8
hSerpinc1-Sa-7 ATAGAAAGTGGTAGCAAAGC(SEQ ID NO: 222) GGGAAT 40 68.3
hSerpinc1-Sa-9 AATGTTATCATTGTCATTCT(SEQ ID NO: 224) TGGAAT 25 12.9
hSerpinc1-Sa-11 CAAAAGCCGTGGAGATACTC(SEQ ID NO: 226) AGGGGT 50 58.9
hSerpinc1-Sa-13 CGTACCTCCATCAGTTGCTG(SEQ ID NO: 228) GAGGGT 55 75.5
hSerpinc1-Sa-14 TTCAGTTTGGCAAAGAAGAA(SEQ ID NO: 229) GTGGAT 35 26.5
hSerpinc1-Sa-17 GGTAGGTCTCATTGAAGGTA(SEQ ID NO: 232) AGGGAT 45 61.8
hSerpinc1-Sa-18 TGAGACCTACCAGGACATCA(SEQ ID NO: 233) GTGAGT 50 70.2
hSerpinc1-Sa-20 CCCATTTGTTGATGGCCGCT(SEQ ID NO: 235) CTGGAT 55 3.4
hSerpinc1-Sa-21 TCCAGAGCGGCCATCAACAA(SEQ ID NO: 236) ATGGGT 55 68.0
③ CjCas9
CjCas9을 위한 SERPINC1 유전자(AT 유전자)를 표적하는 gRNA 선별(gRNA selection to target SERPINC1 gene(AT gene) for CjCas9)
Target name Target(w/o PAM) PAM GC content Indels(%)
hAPOC3-Cj-Ctrl GAGAGGGCCAGAAATCACCCAA(SEQ ID NO: 848) AGACACAC   36.8
hSerpinc1-Cj-1 GAGGTTACAGTTCCTATCACAT(SEQ ID NO: 253) TGGAATAC 41 24.6
hSerpinc1-Cj-2 CTGTCACGGGAGCCCTGTGGAC(SEQ ID NO: 254) ATCTGCAC 68 0.3
hSerpinc1-Cj-3 GCCTTCTTCTCCGGGGAGCGGT(SEQ ID NO: 255) AAATGCAC 68 1.3
hSerpinc1-Cj-4 GGGAATTGGCCTTGGACAGTTC(SEQ ID NO: 256) CCAGACAC 55 3.9
hSerpinc1-Cj-5 TCCCGCTTTGCTACCACTTTCT(SEQ ID NO: 257) ATCAGCAC 50 0
hSerpinc1-Cj-6 GCTTGGTCATAGCAAAAGCCGT(SEQ ID NO: 258) GGAGATAC 50 3.1
hSerpinc1-Cj-7 TATGACCAAGCTGGGTGCCTGT(SEQ ID NO: 259) AATGACAC 55 17.5
hSerpinc1-Cj-8 TCAGTTGCTGGAGGGTGTCATT(SEQ ID NO: 260) ACAGGCAC 50 0.9
hSerpinc1-Cj-9 ATGACACCCTCCAGCAACTGAT(SEQ ID NO: 261) GGAGGTAC 50 3.2
hSerpinc1-Cj-10 TTGACTTCTATAGGTATTTAAG(SEQ ID NO: 262) TTTGACAC 27 0.3
hSerpinc1-Cj-11 TTTCTCAGATATGGTGTCAAAC(SEQ ID NO: 263) TTAAATAC 36 0
hSerpinc1-Cj-12 TTTGTCTCCAAAAAGGCGATTG(SEQ ID NO: 264) GCTGATAC 41 0.2
hSerpinc1-Cj-13 GTCCAGGGGCTGGAGCTTGGCT(SEQ ID NO: 265) CCATATAC 68 0
hSerpinc1-Cj-14 GGTGATTCGGCCTTCGGTCTTA(SEQ ID NO: 266) TTGGACAC 55 0.1
hSerpinc1-Cj-15 TGAGCTCACTGTTCTGGTGCTG(SEQ ID NO: 267) GTTAACAC 55 7.7
hSerpinc1-Cj-16 TACCTTGAAGTAAATGGTGTTA(SEQ ID NO: 268) ACCAGCAC 32 0.1
hSerpinc1-Cj-17 TGCTGGTTAACACCATTTACTT(SEQ ID NO: 269) CAAGGTAC 36 0.1
hSerpinc1-Cj-18 GTGGAAGTCAAAGTTCAGCCCT(SEQ ID NO: 270) GAGAACAC 50 20.4
hSerpinc1-Cj-19 GGAGAGTCGTGTTCAGCATCTA(SEQ ID NO: 271) TGATGTAC 50 0
hSerpinc1-Cj-20 CCTTCCTGGTACATCATAGATG(SEQ ID NO: 272) CTGAACAC 45 10.1
hSerpinc1-Cj-21 CGCCGATAACGGAACTTGCCTT(SEQ ID NO: 273) CCTGGTAC 55 0.1
hSerpinc1-Cj-22 GTTCCGTTATCGGCGCGTGGCT(SEQ ID NO: 274) GAAGGCAC 64 0.8
hSerpinc1-Cj-23 GTCATCACCTTTGAAGGGCAAC(SEQ ID NO: 275) TCAAGCAC 50 0.1
hSerpinc1-Cj-24 CTCCAATTCATCCAGCCACTCT(SEQ ID NO: 276) TGCAGCAC 50 0
hSerpinc1-Cj-25 AGAGGTCATCTCGGCCTTCTGC(SEQ ID NO: 277) AACAATAC 59 0.3
hSerpinc1-Cj-26 ATTCCATAAGGCATTTCTTGAG(SEQ ID NO: 278) GTGAGTAC 36 2.7
hSerpinc1-Cj-28 GCGAACGGCCAGCAATCACAAC(SEQ ID NO: 280) AGCGGTAC 59 0.4
hSerpinc1-Cj-29 GGTTTTTATAAGAGAAGTTCCT(SEQ ID NO: 281) CTGAACAC 32 1.3
hSerpinc1-Cj-30 TGCAAAGAATAAGAACATTTTA(SEQ ID NO: 282) CTTAACAC 23 0.1
2) TFPI 유전자
① SpCas9
SpCas9을 위한 TFPI 유전자를 표적하는 gRNA 선별(gRNA selection to target TFPI gene for SpCas9)
Target name Target(w/o PAM)
(SEQ ID NO)
PAM GC content Indels (%)
hMyd88-Sp-Ctrl GTCCATCTCCTCCGCCAGCG(SEQ ID NO: 847) CGG   75.2
hTfpi-Sp-4 ATCAGCATTAAGAGGGGCAG(SEQ ID NO: 286) GGG 50 54.9
hTfpi-Sp-6 GAATCAGCATTAAGAGGGGC(SEQ ID NO: 288) AGG 50 26.4
hTfpi-Sp-17 TGTGCATTCAAGGCGGATGA(SEQ ID NO: 299) TGG 50 45.7
hTfpi-Sp-21 AGTGCGAAGAATTTATATAT(SEQ ID NO: 303) GGG 25 62.1
hTfpi-Sp-22 GTGCGAAGAATTTATATATG(SEQ ID NO: 304) GGG 30 31.1
hTfpi-Sp-33 ATATAACCTCGACATATTCC(SEQ ID NO: 315) AGG 35 26.7
hTfpi-Sp-38 TGTGAACGTTTCAAGTATGG(SEQ ID NO: 320) TGG 40 57.0
hTfpi-Sp-43 TGCAAGAACATTTGTGAAGA(SEQ ID NO: 325) TGG 35 1.0
hTfpi-Sp-45 TCCACCTGGAAACCATTCGC(SEQ ID NO: 327) TGG 55 25.5
hTfpi-Sp-47 TCCAGCGAATGGTTTCCAGG(SEQ ID NO: 329) TGG 55 26.0
hTfpi-Sp-52 CTTGGTTGATTGCGGAGTCA(SEQ ID NO: 334) GGG 50 33.6
hTfpi-Sp-53 CCTTGGTTGATTGCGGAGTC(SEQ ID NO: 335) AGG 55 3.2
hTfpi-Sp-54 CTGGGAACCTTGGTTGATTG(SEQ ID NO: 336) CGG 50 37.0
hTfpi-Sp-60 CCACAAGATTCTTACCAAAA(SEQ ID NO: 342) AGG 35 13.2
② SaCas9
SaCas9을 위한 TFPI 유전자를 표적하는 gRNA 선별(gRNA selection to target TFPI gene for SaCas9)
Target name Target(w/o PAM)
(SEQ ID NO)
PAM GC content Indels (%)
hAPOC3-Cj-Ctrl GAGAGGGCCAGAAATCACCCAA(SEQ ID NO: 848) AGACACAC   57.3
hTfpi-Sa-3 ATCCGCCTTGAATGCACAAA(SEQ ID NO: 375) ATGAAT 45 3.0
hTfpi-Sa-5 TACATGGGCCATCATCCGCC(SEQ ID NO: 377) TTGAAT 60 68.2
hTfpi-Sa-8 GTGCGAAGAATTTATATATG(SEQ ID NO: 380) GGGGAT 30 34.6
hTfpi-Sa-10 GAATCGATTTGAAAGTCTGG(SEQ ID NO: 382) AAGAGT 40 72.2
hTfpi-Sa-13 AATATAACCTCGACATATTC(SEQ ID NO: 385) CAGGAT 30 15.1
hTfpi-Sa-14 GTGTGAACGTTTCAAGTATG(SEQ ID NO: 386) GTGGAT 40 38.8
hTfpi-Sa-16 TTCCAGCGAATGGTTTCCAG(SEQ ID NO: 388) GTGGAT 50 58.6
hTfpi-Sa-17 GAGTTATTCACAGCATTGAG(SEQ ID NO: 389) CTGGGT 40 62.6
hTfpi-Sa-18 ATGGAACCCAGCTCAATGCT(SEQ ID NO: 390) GTGAAT 50 38.9
hTfpi-Sa-19 CTTGGTTGATTGCGGAGTCA(SEQ ID NO: 391) GGGAGT 50 67.1
hTfpi-Sa-20 CTGGGAACCTTGGTTGATTG(SEQ ID NO: 392) CGGAGT 50 73.6
hTfpi-Sa-22 CGACACAATCCTCTGTCTGC(SEQ ID NO: 394) TGGAGT 55 47.0
hTfpi-Sa-24 TCCCAATGACTGAATTGTAG(SEQ ID NO: 396) TAGAAT 40 49.5
hTfpi-Sa-25 TGGGCGGCATTTCCCAATGA(SEQ ID NO: 397) CTGAAT 55 57.1
hTfpi-Sa-26 ATGCCGCCCATTTAAGTACA(SEQ ID NO: 398) GTGGAT 45 39.0
③ CjCas9
CjCas9을 위한 TFPI 유전자를 표적하는 gRNA 선별(gRNA selection to target TFPI gene for CjCas9)
Target name Target(w/o PAM)
(SEQ ID NO)
PAM GC content Indels (%)
hAPOC3-Cj-Ctrl GAGAGGGCCAGAAATCACCCAA(SEQ ID NO: 848) AGACACAC   36.8
hTfpi-Cj-1 TGGGTTCTGTATTTCAGAGATG(SEQ ID NO: 403) ATTTACAC 41 0
hTfpi-Cj-2 TCTTCATTGTGTAAATCATCTC(SEQ ID NO: 404) TGAAATAC 32 1.2
hTfpi-Cj-3 CAGAGATGATTTACACAATGAA(SEQ ID NO: 405) GAAAGTAC 32 3.9
hTfpi-Cj-5 CAGGCATACAGAAGCCCAAAGT(SEQ ID NO: 407) GCATGTAC 50 0.8
hTfpi-Cj-6 GGCAGGGGCAAGATTAAGCAGC(SEQ ID NO: 408) AGGCATAC 59 19.3
hTfpi-Cj-7 AATGCTGATTCTGAGGAAGATG(SEQ ID NO: 409) AAGAACAC 41 22.1
hTfpi-Cj-8 TGCTGATTCTGAGGAAGATGAA(SEQ ID NO: 410) GAACACAC 41 17.5
hTfpi-Cj-9 TACATGGGCCATCATCCGCCTT(SEQ ID NO: 411) GAATGCAC 55 0
hTfpi-Cj-10 TCACATCCCCCATATATAAATT(SEQ ID NO: 412) CTTCGCAC 32 0
hTfpi-Cj-11 AAGTCTGGAAGAGTGCAAAAAA(SEQ ID NO: 413) ATGTGTAC 36 0.3
hTfpi-Cj-12 AACCTACCTCTTGTACACATTT(SEQ ID NO: 414) TTTTGCAC 36 0
hTfpi-Cj-13 AGGGTTCCCAGAAACCTACCTC(SEQ ID NO: 415) TTGTACAC 55 1.6
hTfpi-Cj-14 CACTGTTTTGTCTGATTGTTAT(SEQ ID NO: 416) AAAAATAC 32 0.1
hTfpi-Cj-15 AGGCATCCACCATACTTGAAAC(SEQ ID NO: 417) GTTCACAC 45 1
hTfpi-Cj-16 TTGTTCATATTGCCCAGGCATC(SEQ ID NO: 418) CACCATAC 45 0.3
hTfpi-Cj-17 GCCTGGGCAATATGAACAATTT(SEQ ID NO: 419) TGAGACAC 41 0.1
hTfpi-Cj-18 CACAATCCTCTGTCTGCTGGAG(SEQ ID NO: 420) TGAGACAC 55 16.5
hTfpi-Cj-19 TAGTAGAATCTGTTCTCATTGG(SEQ ID NO: 421) CACGACAC 36 8.7
hTfpi-Cj-20 AATTGTAGTAGAATCTGTTCTC(SEQ ID NO: 422) ATTGGCAC 32 0.1
hTfpi-Cj-21 GTCATTGGGAAATGCCGCCCAT(SEQ ID NO: 423) TTAAGTAC 55 1.5
hTfpi-Cj-22 TTGTTTTCATTTCCCCCACATC(SEQ ID NO: 424) CACTGTAC 41 0
따라서, 본 연구에서 제시한 AT 유전자 및 TFPI 유전자를 표적하는 gRNA 및 Cas9을 포함하는 조성물은 혈우병 치료를 위해 사용될 수 있을 것으로 기대된다.
<110> TOOLGEN INCORPORATED <120> A gene editing of anticoagulant factors <130> CP19-142 <150> US 62/703578 <151> 2018-07-26 <160> 848 <170> KoPatentIn 3.0 <210> 1 <211> 12 <212> RNA <213> Streptococcus pyogenes <400> 1 guuuuagagc ua 12 <210> 2 <211> 25 <212> RNA <213> Campylobacter jejuni <400> 2 guuuuagucc cuuuuuaaau uucuu 25 <210> 3 <211> 13 <212> RNA <213> Campylobacter jejuni <400> 3 guuuuagucc cuu 13 <210> 4 <211> 9 <212> RNA <213> Unknown <220> <223> Parcubacteria bacterium <400> 4 uuuguagau 9 <210> 5 <211> 14 <212> RNA <213> Streptococcus pyogenes <400> 5 uagcaaguua aaau 14 <210> 6 <211> 25 <212> RNA <213> Campylobacter jejuni <400> 6 aagaaauuua aaaagggacu aaaau 25 <210> 7 <211> 13 <212> RNA <213> Campylobacter jejuni <400> 7 aagggacuaa aau 13 <210> 8 <211> 11 <212> RNA <213> Unknown <220> <223> Parcubacteria bacterium <400> 8 aaauuucuac u 11 <210> 9 <211> 12 <212> RNA <213> Streptococcus pyogenes <400> 9 aaggcuaguc cg 12 <210> 10 <211> 11 <212> RNA <213> Campylobacter jejuni <400> 10 aaagaguuug c 11 <210> 11 <211> 34 <212> RNA <213> Streptococcus pyogenes <400> 11 uuaucaacuu gaaaaagugg caccgagucg gugc 34 <210> 12 <211> 38 <212> RNA <213> Campylobacter jejuni <400> 12 gggacucugc gggguuacaa uccccuaaaa ccgcuuuu 38 <210> 13 <211> 22 <212> RNA <213> Streptococcus thermophilus <400> 13 guuuuagagc uguguuguuu cg 22 <210> 14 <211> 24 <212> RNA <213> Streptococcus thermophilus <400> 14 cgaaacaaca cagcgaguua aaau 24 <210> 15 <211> 13 <212> RNA <213> Streptococcus thermophilus <400> 15 aaggcuuagu ccg 13 <210> 16 <211> 38 <212> RNA <213> Streptococcus thermophilus <400> 16 uacucaacuu gaaaaggugg caccgauucg guguuuuu 38 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Target sequence <400> 17 atcattggca gactagttcg 20 <210> 18 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Target sequence <400> 18 cgaactagtc tgccaatgat 20 <210> 19 <211> 20 <212> DNA <213> Homo sapiens <400> 19 tcctatcaca ttggaataca 20 <210> 20 <211> 20 <212> DNA <213> Homo sapiens <400> 20 ggttacagtt cctatcacat 20 <210> 21 <211> 20 <212> DNA <213> Homo sapiens <400> 21 gccatgtatt ccaatgtgat 20 <210> 22 <211> 20 <212> DNA <213> Homo sapiens <400> 22 gtgataggaa ctgtaacctc 20 <210> 23 <211> 20 <212> DNA <213> Homo sapiens <400> 23 cccctcttac ctttttccag 20 <210> 24 <211> 20 <212> DNA <213> Homo sapiens <400> 24 gaactgtaac ctctggaaaa 20 <210> 25 <211> 20 <212> DNA <213> Homo sapiens <400> 25 ccagaagcca atgagcagca 20 <210> 26 <211> 20 <212> DNA <213> Homo sapiens <400> 26 cttttgtcct tgctgctcat 20 <210> 27 <211> 20 <212> DNA <213> Homo sapiens <400> 27 ccttgctgct cattggcttc 20 <210> 28 <211> 20 <212> DNA <213> Homo sapiens <400> 28 cttgctgctc attggcttct 20 <210> 29 <211> 20 <212> DNA <213> Homo sapiens <400> 29 tgggactgcg tgacctgtca 20 <210> 30 <211> 20 <212> DNA <213> Homo sapiens <400> 30 gggactgcgt gacctgtcac 20 <210> 31 <211> 20 <212> DNA <213> Homo sapiens <400> 31 gtccacaggg ctcccgtgac 20 <210> 32 <211> 20 <212> DNA <213> Homo sapiens <400> 32 gacctgtcac gggagccctg 20 <210> 33 <211> 20 <212> DNA <213> Homo sapiens <400> 33 tggctgtgca gatgtccaca 20 <210> 34 <211> 20 <212> DNA <213> Homo sapiens <400> 34 ttggctgtgc agatgtccac 20 <210> 35 <211> 20 <212> DNA <213> Homo sapiens <400> 35 acatctgcac agccaagccg 20 <210> 36 <211> 20 <212> DNA <213> Homo sapiens <400> 36 catctgcaca gccaagccgc 20 <210> 37 <211> 20 <212> DNA <213> Homo sapiens <400> 37 catgggaatg tcccgcggct 20 <210> 38 <211> 20 <212> DNA <213> Homo sapiens <400> 38 ggattcatgg gaatgtcccg 20 <210> 39 <211> 20 <212> DNA <213> Homo sapiens <400> 39 taaatgcaca tgggattcat 20 <210> 40 <211> 20 <212> DNA <213> Homo sapiens <400> 40 gtaaatgcac atgggattca 20 <210> 41 <211> 20 <212> DNA <213> Homo sapiens <400> 41 ggggagcggt aaatgcacat 20 <210> 42 <211> 20 <212> DNA <213> Homo sapiens <400> 42 cggggagcgg taaatgcaca 20 <210> 43 <211> 20 <212> DNA <213> Homo sapiens <400> 43 catgtgcatt taccgctccc 20 <210> 44 <211> 20 <212> DNA <213> Homo sapiens <400> 44 ttgccttctt ctccggggag 20 <210> 45 <211> 20 <212> DNA <213> Homo sapiens <400> 45 ctcagttgcc ttcttctccg 20 <210> 46 <211> 20 <212> DNA <213> Homo sapiens <400> 46 cctcagttgc cttcttctcc 20 <210> 47 <211> 20 <212> DNA <213> Homo sapiens <400> 47 tcctcagttg ccttcttctc 20 <210> 48 <211> 20 <212> DNA <213> Homo sapiens <400> 48 ttaccgctcc ccggagaaga 20 <210> 49 <211> 20 <212> DNA <213> Homo sapiens <400> 49 cccggagaag aaggcaactg 20 <210> 50 <211> 20 <212> DNA <213> Homo sapiens <400> 50 gaagaaggca actgaggatg 20 <210> 51 <211> 20 <212> DNA <213> Homo sapiens <400> 51 aagaaggcaa ctgaggatga 20 <210> 52 <211> 20 <212> DNA <213> Homo sapiens <400> 52 gggctcagaa cagaagatcc 20 <210> 53 <211> 20 <212> DNA <213> Homo sapiens <400> 53 ctcagaacag aagatcccgg 20 <210> 54 <211> 20 <212> DNA <213> Homo sapiens <400> 54 cacgccggtt ggtggcctcc 20 <210> 55 <211> 20 <212> DNA <213> Homo sapiens <400> 55 acacgccggt tggtggcctc 20 <210> 56 <211> 20 <212> DNA <213> Homo sapiens <400> 56 agatcccgga ggccaccaac 20 <210> 57 <211> 20 <212> DNA <213> Homo sapiens <400> 57 ttcccagaca cgccggttgg 20 <210> 58 <211> 20 <212> DNA <213> Homo sapiens <400> 58 cagttcccag acacgccggt 20 <210> 59 <211> 20 <212> DNA <213> Homo sapiens <400> 59 tggacagttc ccagacacgc 20 <210> 60 <211> 20 <212> DNA <213> Homo sapiens <400> 60 aggccaccaa ccggcgtgtc 20 <210> 61 <211> 20 <212> DNA <213> Homo sapiens <400> 61 ggccaccaac cggcgtgtct 20 <210> 62 <211> 20 <212> DNA <213> Homo sapiens <400> 62 gcgtgtctgg gaactgtcca 20 <210> 63 <211> 20 <212> DNA <213> Homo sapiens <400> 63 agcaaagcgg gaattggcct 20 <210> 64 <211> 20 <212> DNA <213> Homo sapiens <400> 64 agtggtagca aagcgggaat 20 <210> 65 <211> 20 <212> DNA <213> Homo sapiens <400> 65 atagaaagtg gtagcaaagc 20 <210> 66 <211> 20 <212> DNA <213> Homo sapiens <400> 66 gatagaaagt ggtagcaaag 20 <210> 67 <211> 20 <212> DNA <213> Homo sapiens <400> 67 tgccaggtgc tgatagaaag 20 <210> 68 <211> 20 <212> DNA <213> Homo sapiens <400> 68 taccactttc tatcagcacc 20 <210> 69 <211> 20 <212> DNA <213> Homo sapiens <400> 69 tgtcattctt ggaatctgcc 20 <210> 70 <211> 20 <212> DNA <213> Homo sapiens <400> 70 aatgttatca ttgtcattct 20 <210> 71 <211> 20 <212> DNA <213> Homo sapiens <400> 71 tggagatact caggggtgac 20 <210> 72 <211> 20 <212> DNA <213> Homo sapiens <400> 72 aaagccgtgg agatactcag 20 <210> 73 <211> 20 <212> DNA <213> Homo sapiens <400> 73 aaaagccgtg gagatactca 20 <210> 74 <211> 20 <212> DNA <213> Homo sapiens <400> 74 caaaagccgt ggagatactc 20 <210> 75 <211> 20 <212> DNA <213> Homo sapiens <400> 75 gtcacccctg agtatctcca 20 <210> 76 <211> 20 <212> DNA <213> Homo sapiens <400> 76 cttggtcata gcaaaagccg 20 <210> 77 <211> 20 <212> DNA <213> Homo sapiens <400> 77 ggcttttgct atgaccaagc 20 <210> 78 <211> 20 <212> DNA <213> Homo sapiens <400> 78 gcttttgcta tgaccaagct 20 <210> 79 <211> 20 <212> DNA <213> Homo sapiens <400> 79 gtcattacag gcacccagct 20 <210> 80 <211> 20 <212> DNA <213> Homo sapiens <400> 80 ttgctggagg gtgtcattac 20 <210> 81 <211> 20 <212> DNA <213> Homo sapiens <400> 81 tacctccatc agttgctgga 20 <210> 82 <211> 20 <212> DNA <213> Homo sapiens <400> 82 gtacctccat cagttgctgg 20 <210> 83 <211> 20 <212> DNA <213> Homo sapiens <400> 83 gtcgtacctc catcagttgc 20 <210> 84 <211> 20 <212> DNA <213> Homo sapiens <400> 84 tgacaccctc cagcaactga 20 <210> 85 <211> 20 <212> DNA <213> Homo sapiens <400> 85 caccctccag caactgatgg 20 <210> 86 <211> 20 <212> DNA <213> Homo sapiens <400> 86 atcagatgtt ttctcagata 20 <210> 87 <211> 20 <212> DNA <213> Homo sapiens <400> 87 tcagtttggc aaagaagaag 20 <210> 88 <211> 20 <212> DNA <213> Homo sapiens <400> 88 atagagtcgg cagttcagtt 20 <210> 89 <211> 20 <212> DNA <213> Homo sapiens <400> 89 tgttggcttt tcgatagagt 20 <210> 90 <211> 20 <212> DNA <213> Homo sapiens <400> 90 tactaacttg gaggatttgt 20 <210> 91 <211> 20 <212> DNA <213> Homo sapiens <400> 91 attggctgat actaacttgg 20 <210> 92 <211> 20 <212> DNA <213> Homo sapiens <400> 92 gcgattggct gatactaact 20 <210> 93 <211> 20 <212> DNA <213> Homo sapiens <400> 93 tttgtctcca aaaaggcgat 20 <210> 94 <211> 20 <212> DNA <213> Homo sapiens <400> 94 gtatcagcca atcgcctttt 20 <210> 95 <211> 20 <212> DNA <213> Homo sapiens <400> 95 taagggattt gtctccaaaa 20 <210> 96 <211> 20 <212> DNA <213> Homo sapiens <400> 96 gtaggtctca ttgaaggtaa 20 <210> 97 <211> 20 <212> DNA <213> Homo sapiens <400> 97 ggtaggtctc attgaaggta 20 <210> 98 <211> 20 <212> DNA <213> Homo sapiens <400> 98 gtcctggtag gtctcattga 20 <210> 99 <211> 20 <212> DNA <213> Homo sapiens <400> 99 taccttcaat gagacctacc 20 <210> 100 <211> 20 <212> DNA <213> Homo sapiens <400> 100 caactcactg atgtcctggt 20 <210> 101 <211> 20 <212> DNA <213> Homo sapiens <400> 101 ataccaactc actgatgtcc 20 <210> 102 <211> 20 <212> DNA <213> Homo sapiens <400> 102 ctaccaggac atcagtgagt 20 <210> 103 <211> 20 <212> DNA <213> Homo sapiens <400> 103 gacatcagtg agttggtata 20 <210> 104 <211> 20 <212> DNA <213> Homo sapiens <400> 104 gaagtccagg ggctggagct 20 <210> 105 <211> 20 <212> DNA <213> Homo sapiens <400> 105 tggagccaag ctccagcccc 20 <210> 106 <211> 20 <212> DNA <213> Homo sapiens <400> 106 tcaccttgaa gtccaggggc 20 <210> 107 <211> 20 <212> DNA <213> Homo sapiens <400> 107 caactcacct tgaagtccag 20 <210> 108 <211> 20 <212> DNA <213> Homo sapiens <400> 108 gcaactcacc ttgaagtcca 20 <210> 109 <211> 20 <212> DNA <213> Homo sapiens <400> 109 tgcaactcac cttgaagtcc 20 <210> 110 <211> 20 <212> DNA <213> Homo sapiens <400> 110 gctccagccc ctggacttca 20 <210> 111 <211> 20 <212> DNA <213> Homo sapiens <400> 111 gattgctctg cattttcctg 20 <210> 112 <211> 20 <212> DNA <213> Homo sapiens <400> 112 aaatgcagag caatccagag 20 <210> 113 <211> 20 <212> DNA <213> Homo sapiens <400> 113 ccatttgttg atggccgctc 20 <210> 114 <211> 20 <212> DNA <213> Homo sapiens <400> 114 attggacacc catttgttga 20 <210> 115 <211> 20 <212> DNA <213> Homo sapiens <400> 115 ccagagcggc catcaacaaa 20 <210> 116 <211> 20 <212> DNA <213> Homo sapiens <400> 116 cagagcggcc atcaacaaat 20 <210> 117 <211> 20 <212> DNA <213> Homo sapiens <400> 117 gattcggcct tcggtcttat 20 <210> 118 <211> 20 <212> DNA <213> Homo sapiens <400> 118 tgggtgtcca ataagaccga 20 <210> 119 <211> 20 <212> DNA <213> Homo sapiens <400> 119 gacatcggtg attcggcctt 20 <210> 120 <211> 20 <212> DNA <213> Homo sapiens <400> 120 agggaatgac atcggtgatt 20 <210> 121 <211> 20 <212> DNA <213> Homo sapiens <400> 121 ggcttccgag ggaatgacat 20 <210> 122 <211> 20 <212> DNA <213> Homo sapiens <400> 122 aatcaccgat gtcattccct 20 <210> 123 <211> 20 <212> DNA <213> Homo sapiens <400> 123 agctcattga tggcttccga 20 <210> 124 <211> 20 <212> DNA <213> Homo sapiens <400> 124 gagctcattg atggcttccg 20 <210> 125 <211> 20 <212> DNA <213> Homo sapiens <400> 125 cagaacagtg agctcattga 20 <210> 126 <211> 20 <212> DNA <213> Homo sapiens <400> 126 catcaatgag ctcactgttc 20 <210> 127 <211> 20 <212> DNA <213> Homo sapiens <400> 127 tgagctcact gttctggtgc 20 <210> 128 <211> 20 <212> DNA <213> Homo sapiens <400> 128 tctgagtacc ttgaagtaaa 20 <210> 129 <211> 20 <212> DNA <213> Homo sapiens <400> 129 ggttaacacc atttacttca 20 <210> 130 <211> 20 <212> DNA <213> Homo sapiens <400> 130 actttgactt ccacaggccc 20 <210> 131 <211> 20 <212> DNA <213> Homo sapiens <400> 131 tgattctctt ccagggcctg 20 <210> 132 <211> 20 <212> DNA <213> Homo sapiens <400> 132 ggctgaactt tgacttccac 20 <210> 133 <211> 20 <212> DNA <213> Homo sapiens <400> 133 gttccttcct tgtgttctca 20 <210> 134 <211> 20 <212> DNA <213> Homo sapiens <400> 134 agttccttcc ttgtgttctc 20 <210> 135 <211> 20 <212> DNA <213> Homo sapiens <400> 135 agttcagccc tgagaacaca 20 <210> 136 <211> 20 <212> DNA <213> Homo sapiens <400> 136 cagccctgag aacacaagga 20 <210> 137 <211> 20 <212> DNA <213> Homo sapiens <400> 137 aaggaaggaa ctgttctaca 20 <210> 138 <211> 20 <212> DNA <213> Homo sapiens <400> 138 gaactgttct acaaggctga 20 <210> 139 <211> 20 <212> DNA <213> Homo sapiens <400> 139 ttcagcatct atgatgtacc 20 <210> 140 <211> 20 <212> DNA <213> Homo sapiens <400> 140 gcatctatga tgtaccagga 20 <210> 141 <211> 20 <212> DNA <213> Homo sapiens <400> 141 gataacggaa cttgccttcc 20 <210> 142 <211> 20 <212> DNA <213> Homo sapiens <400> 142 aggaaggcaa gttccgttat 20 <210> 143 <211> 20 <212> DNA <213> Homo sapiens <400> 143 cttcagccac gcgccgataa 20 <210> 144 <211> 20 <212> DNA <213> Homo sapiens <400> 144 caagttccgt tatcggcgcg 20 <210> 145 <211> 20 <212> DNA <213> Homo sapiens <400> 145 cgttatcggc gcgtggctga 20 <210> 146 <211> 20 <212> DNA <213> Homo sapiens <400> 146 gcgcgtggct gaaggcaccc 20 <210> 147 <211> 20 <212> DNA <213> Homo sapiens <400> 147 gaagggcaac tcaagcacct 20 <210> 148 <211> 20 <212> DNA <213> Homo sapiens <400> 148 tgaagggcaa ctcaagcacc 20 <210> 149 <211> 20 <212> DNA <213> Homo sapiens <400> 149 gtgcttgagt tgcccttcaa 20 <210> 150 <211> 20 <212> DNA <213> Homo sapiens <400> 150 gtgatgtcat cacctttgaa 20 <210> 151 <211> 20 <212> DNA <213> Homo sapiens <400> 151 ggtgatgtca tcacctttga 20 <210> 152 <211> 20 <212> DNA <213> Homo sapiens <400> 152 caaaggtgat gacatcacca 20 <210> 153 <211> 20 <212> DNA <213> Homo sapiens <400> 153 cttgggcaag atgaggacca 20 <210> 154 <211> 20 <212> DNA <213> Homo sapiens <400> 154 tctcaggctt gggcaagatg 20 <210> 155 <211> 20 <212> DNA <213> Homo sapiens <400> 155 gccaggctct tctcaggctt 20 <210> 156 <211> 20 <212> DNA <213> Homo sapiens <400> 156 ggccaggctc ttctcaggct 20 <210> 157 <211> 20 <212> DNA <213> Homo sapiens <400> 157 accttggcca ggctcttctc 20 <210> 158 <211> 20 <212> DNA <213> Homo sapiens <400> 158 gcccaagcct gagaagagcc 20 <210> 159 <211> 20 <212> DNA <213> Homo sapiens <400> 159 gcctgagaag agcctggcca 20 <210> 160 <211> 20 <212> DNA <213> Homo sapiens <400> 160 gttccttctc taccttggcc 20 <210> 161 <211> 20 <212> DNA <213> Homo sapiens <400> 161 ggtgagttcc ttctctacct 20 <210> 162 <211> 20 <212> DNA <213> Homo sapiens <400> 162 gagcctggcc aaggtagaga 20 <210> 163 <211> 20 <212> DNA <213> Homo sapiens <400> 163 agagaaggaa ctcaccccag 20 <210> 164 <211> 20 <212> DNA <213> Homo sapiens <400> 164 ccactcttgc agcacctctg 20 <210> 165 <211> 20 <212> DNA <213> Homo sapiens <400> 165 gccactcttg cagcacctct 20 <210> 166 <211> 20 <212> DNA <213> Homo sapiens <400> 166 agccactctt gcagcacctc 20 <210> 167 <211> 20 <212> DNA <213> Homo sapiens <400> 167 ccccagaggt gctgcaagag 20 <210> 168 <211> 20 <212> DNA <213> Homo sapiens <400> 168 agaggtgctg caagagtggc 20 <210> 169 <211> 20 <212> DNA <213> Homo sapiens <400> 169 gcaagagtgg ctggatgaat 20 <210> 170 <211> 20 <212> DNA <213> Homo sapiens <400> 170 agagtggctg gatgaattgg 20 <210> 171 <211> 20 <212> DNA <213> Homo sapiens <400> 171 tgaattggag gagatgatgc 20 <210> 172 <211> 20 <212> DNA <213> Homo sapiens <400> 172 attggaggag atgatgctgg 20 <210> 173 <211> 20 <212> DNA <213> Homo sapiens <400> 173 caatgcggaa gcggggcatg 20 <210> 174 <211> 20 <212> DNA <213> Homo sapiens <400> 174 ccgtcctcaa tgcggaagcg 20 <210> 175 <211> 20 <212> DNA <213> Homo sapiens <400> 175 gccgtcctca atgcggaagc 20 <210> 176 <211> 20 <212> DNA <213> Homo sapiens <400> 176 agccgtcctc aatgcggaag 20 <210> 177 <211> 20 <212> DNA <213> Homo sapiens <400> 177 catgccccgc ttccgcattg 20 <210> 178 <211> 20 <212> DNA <213> Homo sapiens <400> 178 aactgaagcc gtcctcaatg 20 <210> 179 <211> 20 <212> DNA <213> Homo sapiens <400> 179 ccccgcttcc gcattgagga 20 <210> 180 <211> 20 <212> DNA <213> Homo sapiens <400> 180 tgaggacggc ttcagtttga 20 <210> 181 <211> 20 <212> DNA <213> Homo sapiens <400> 181 gaaggagcag ctgcaagaca 20 <210> 182 <211> 20 <212> DNA <213> Homo sapiens <400> 182 aaggagcagc tgcaagacat 20 <210> 183 <211> 20 <212> DNA <213> Homo sapiens <400> 183 cagggctgaa cagatcgaca 20 <210> 184 <211> 20 <212> DNA <213> Homo sapiens <400> 184 ctgggagttt ggacttttca 20 <210> 185 <211> 20 <212> DNA <213> Homo sapiens <400> 185 cctgggagtt tggacttttc 20 <210> 186 <211> 20 <212> DNA <213> Homo sapiens <400> 186 cctagacaaa cctgggagtt 20 <210> 187 <211> 20 <212> DNA <213> Homo sapiens <400> 187 cctgaaaagt ccaaactccc 20 <210> 188 <211> 20 <212> DNA <213> Homo sapiens <400> 188 cggccttctg caacaatacc 20 <210> 189 <211> 20 <212> DNA <213> Homo sapiens <400> 189 cttccaggta ttgttgcaga 20 <210> 190 <211> 20 <212> DNA <213> Homo sapiens <400> 190 ctgagacata gaggtcatct 20 <210> 191 <211> 20 <212> DNA <213> Homo sapiens <400> 191 ggaatgcatc tgagacatag 20 <210> 192 <211> 20 <212> DNA <213> Homo sapiens <400> 192 tgtctcagat gcattccata 20 <210> 193 <211> 20 <212> DNA <213> Homo sapiens <400> 193 tcacctcaag aaatgcctta 20 <210> 194 <211> 20 <212> DNA <213> Homo sapiens <400> 194 attccataag gcatttcttg 20 <210> 195 <211> 20 <212> DNA <213> Homo sapiens <400> 195 gacctgcagg taaatgaaga 20 <210> 196 <211> 20 <212> DNA <213> Homo sapiens <400> 196 acggccagca atcacaacag 20 <210> 197 <211> 20 <212> DNA <213> Homo sapiens <400> 197 agtaccgctg ttgtgattgc 20 <210> 198 <211> 20 <212> DNA <213> Homo sapiens <400> 198 ccctgttggg gtttagcgaa 20 <210> 199 <211> 20 <212> DNA <213> Homo sapiens <400> 199 gccgttcgct aaaccccaac 20 <210> 200 <211> 20 <212> DNA <213> Homo sapiens <400> 200 ccgttcgcta aaccccaaca 20 <210> 201 <211> 20 <212> DNA <213> Homo sapiens <400> 201 ccttgaaagt caccctgttg 20 <210> 202 <211> 20 <212> DNA <213> Homo sapiens <400> 202 gccttgaaag tcaccctgtt 20 <210> 203 <211> 20 <212> DNA <213> Homo sapiens <400> 203 ggccttgaaa gtcaccctgt 20 <210> 204 <211> 20 <212> DNA <213> Homo sapiens <400> 204 ccccaacagg gtgactttca 20 <210> 205 <211> 20 <212> DNA <213> Homo sapiens <400> 205 gggtgacttt caaggccaac 20 <210> 206 <211> 20 <212> DNA <213> Homo sapiens <400> 206 aaaaaccagg aaaggcctgt 20 <210> 207 <211> 20 <212> DNA <213> Homo sapiens <400> 207 caaggccaac aggcctttcc 20 <210> 208 <211> 20 <212> DNA <213> Homo sapiens <400> 208 tctcttataa aaaccaggaa 20 <210> 209 <211> 20 <212> DNA <213> Homo sapiens <400> 209 gaacttctct tataaaaacc 20 <210> 210 <211> 20 <212> DNA <213> Homo sapiens <400> 210 atgaagataa tagtgttcag 20 <210> 211 <211> 20 <212> DNA <213> Homo sapiens <400> 211 tctgaacact attatcttca 20 <210> 212 <211> 20 <212> DNA <213> Homo sapiens <400> 212 ctgaacacta ttatcttcat 20 <210> 213 <211> 20 <212> DNA <213> Homo sapiens <400> 213 attttactta acacaagggt 20 <210> 214 <211> 20 <212> DNA <213> Homo sapiens <400> 214 gaacatttta cttaacacaa 20 <210> 215 <211> 20 <212> DNA <213> Homo sapiens <400> 215 agaacatttt acttaacaca 20 <210> 216 <211> 20 <212> DNA <213> Homo sapiens <400> 216 ggttacagtt cctatcacat 20 <210> 217 <211> 20 <212> DNA <213> Homo sapiens <400> 217 ccaagccgcg ggacattccc 20 <210> 218 <211> 20 <212> DNA <213> Homo sapiens <400> 218 taaatgcaca tgggattcat 20 <210> 219 <211> 20 <212> DNA <213> Homo sapiens <400> 219 cggggagcgg taaatgcaca 20 <210> 220 <211> 20 <212> DNA <213> Homo sapiens <400> 220 ccccggagaa gaaggcaact 20 <210> 221 <211> 20 <212> DNA <213> Homo sapiens <400> 221 acacgccggt tggtggcctc 20 <210> 222 <211> 20 <212> DNA <213> Homo sapiens <400> 222 atagaaagtg gtagcaaagc 20 <210> 223 <211> 20 <212> DNA <213> Homo sapiens <400> 223 atcagcacct ggcagattcc 20 <210> 224 <211> 20 <212> DNA <213> Homo sapiens <400> 224 aatgttatca ttgtcattct 20 <210> 225 <211> 20 <212> DNA <213> Homo sapiens <400> 225 ataacatttt cctgtcaccc 20 <210> 226 <211> 20 <212> DNA <213> Homo sapiens <400> 226 caaaagccgt ggagatactc 20 <210> 227 <211> 20 <212> DNA <213> Homo sapiens <400> 227 cggcttttgc tatgaccaag 20 <210> 228 <211> 20 <212> DNA <213> Homo sapiens <400> 228 cgtacctcca tcagttgctg 20 <210> 229 <211> 20 <212> DNA <213> Homo sapiens <400> 229 ttcagtttgg caaagaagaa 20 <210> 230 <211> 20 <212> DNA <213> Homo sapiens <400> 230 aggatttgtt ggcttttcga 20 <210> 231 <211> 20 <212> DNA <213> Homo sapiens <400> 231 gattggctga tactaacttg 20 <210> 232 <211> 20 <212> DNA <213> Homo sapiens <400> 232 ggtaggtctc attgaaggta 20 <210> 233 <211> 20 <212> DNA <213> Homo sapiens <400> 233 tgagacctac caggacatca 20 <210> 234 <211> 20 <212> DNA <213> Homo sapiens <400> 234 tccagcccct ggacttcaag 20 <210> 235 <211> 20 <212> DNA <213> Homo sapiens <400> 235 cccatttgtt gatggccgct 20 <210> 236 <211> 20 <212> DNA <213> Homo sapiens <400> 236 tccagagcgg ccatcaacaa 20 <210> 237 <211> 20 <212> DNA <213> Homo sapiens <400> 237 gtgtccaata agaccgaagg 20 <210> 238 <211> 20 <212> DNA <213> Homo sapiens <400> 238 agctcattga tggcttccga 20 <210> 239 <211> 20 <212> DNA <213> Homo sapiens <400> 239 actgttctac aaggctgatg 20 <210> 240 <211> 20 <212> DNA <213> Homo sapiens <400> 240 ggctgaaggc acccaggtgc 20 <210> 241 <211> 20 <212> DNA <213> Homo sapiens <400> 241 ttgaagggca actcaagcac 20 <210> 242 <211> 20 <212> DNA <213> Homo sapiens <400> 242 actcttgcag cacctctggg 20 <210> 243 <211> 20 <212> DNA <213> Homo sapiens <400> 243 agccactctt gcagcacctc 20 <210> 244 <211> 20 <212> DNA <213> Homo sapiens <400> 244 actcacccca gaggtgctgc 20 <210> 245 <211> 20 <212> DNA <213> Homo sapiens <400> 245 cagaggtgct gcaagagtgg 20 <210> 246 <211> 20 <212> DNA <213> Homo sapiens <400> 246 ggtgctgcaa gagtggctgg 20 <210> 247 <211> 20 <212> DNA <213> Homo sapiens <400> 247 tcacctcaag aaatgcctta 20 <210> 248 <211> 20 <212> DNA <213> Homo sapiens <400> 248 tccataaggc atttcttgag 20 <210> 249 <211> 20 <212> DNA <213> Homo sapiens <400> 249 ggccgttcgc taaaccccaa 20 <210> 250 <211> 20 <212> DNA <213> Homo sapiens <400> 250 ggccttgaaa gtcaccctgt 20 <210> 251 <211> 20 <212> DNA <213> Homo sapiens <400> 251 aacactatta tcttcatggg 20 <210> 252 <211> 20 <212> DNA <213> Homo sapiens <400> 252 aagaacattt tacttaacac 20 <210> 253 <211> 22 <212> DNA <213> Homo sapiens <400> 253 gaggttacag ttcctatcac at 22 <210> 254 <211> 22 <212> DNA <213> Homo sapiens <400> 254 ctgtcacggg agccctgtgg ac 22 <210> 255 <211> 22 <212> DNA <213> Homo sapiens <400> 255 gccttcttct ccggggagcg gt 22 <210> 256 <211> 22 <212> DNA <213> Homo sapiens <400> 256 gggaattggc cttggacagt tc 22 <210> 257 <211> 22 <212> DNA <213> Homo sapiens <400> 257 tcccgctttg ctaccacttt ct 22 <210> 258 <211> 22 <212> DNA <213> Homo sapiens <400> 258 gcttggtcat agcaaaagcc gt 22 <210> 259 <211> 22 <212> DNA <213> Homo sapiens <400> 259 tatgaccaag ctgggtgcct gt 22 <210> 260 <211> 22 <212> DNA <213> Homo sapiens <400> 260 tcagttgctg gagggtgtca tt 22 <210> 261 <211> 22 <212> DNA <213> Homo sapiens <400> 261 atgacaccct ccagcaactg at 22 <210> 262 <211> 22 <212> DNA <213> Homo sapiens <400> 262 ttgacttcta taggtattta ag 22 <210> 263 <211> 22 <212> DNA <213> Homo sapiens <400> 263 tttctcagat atggtgtcaa ac 22 <210> 264 <211> 22 <212> DNA <213> Homo sapiens <400> 264 tttgtctcca aaaaggcgat tg 22 <210> 265 <211> 22 <212> DNA <213> Homo sapiens <400> 265 gtccaggggc tggagcttgg ct 22 <210> 266 <211> 22 <212> DNA <213> Homo sapiens <400> 266 ggtgattcgg ccttcggtct ta 22 <210> 267 <211> 22 <212> DNA <213> Homo sapiens <400> 267 tgagctcact gttctggtgc tg 22 <210> 268 <211> 22 <212> DNA <213> Homo sapiens <400> 268 taccttgaag taaatggtgt ta 22 <210> 269 <211> 22 <212> DNA <213> Homo sapiens <400> 269 tgctggttaa caccatttac tt 22 <210> 270 <211> 22 <212> DNA <213> Homo sapiens <400> 270 gtggaagtca aagttcagcc ct 22 <210> 271 <211> 22 <212> DNA <213> Homo sapiens <400> 271 ggagagtcgt gttcagcatc ta 22 <210> 272 <211> 22 <212> DNA <213> Homo sapiens <400> 272 ccttcctggt acatcataga tg 22 <210> 273 <211> 22 <212> DNA <213> Homo sapiens <400> 273 cgccgataac ggaacttgcc tt 22 <210> 274 <211> 22 <212> DNA <213> Homo sapiens <400> 274 gttccgttat cggcgcgtgg ct 22 <210> 275 <211> 22 <212> DNA <213> Homo sapiens <400> 275 gtcatcacct ttgaagggca ac 22 <210> 276 <211> 22 <212> DNA <213> Homo sapiens <400> 276 ctccaattca tccagccact ct 22 <210> 277 <211> 22 <212> DNA <213> Homo sapiens <400> 277 agaggtcatc tcggccttct gc 22 <210> 278 <211> 22 <212> DNA <213> Homo sapiens <400> 278 attccataag gcatttcttg ag 22 <210> 279 <211> 22 <212> DNA <213> Homo sapiens <400> 279 tgaagaaggc agtgaagcag ct 22 <210> 280 <211> 22 <212> DNA <213> Homo sapiens <400> 280 gcgaacggcc agcaatcaca ac 22 <210> 281 <211> 22 <212> DNA <213> Homo sapiens <400> 281 ggtttttata agagaagttc ct 22 <210> 282 <211> 22 <212> DNA <213> Homo sapiens <400> 282 tgcaaagaat aagaacattt ta 22 <210> 283 <211> 20 <212> DNA <213> Homo sapiens <400> 283 tgaagaaagt acatgcactt 20 <210> 284 <211> 20 <212> DNA <213> Homo sapiens <400> 284 gaagaaagta catgcacttt 20 <210> 285 <211> 20 <212> DNA <213> Homo sapiens <400> 285 caggggcaag attaagcagc 20 <210> 286 <211> 20 <212> DNA <213> Homo sapiens <400> 286 atcagcatta agaggggcag 20 <210> 287 <211> 20 <212> DNA <213> Homo sapiens <400> 287 aatcagcatt aagaggggca 20 <210> 288 <211> 20 <212> DNA <213> Homo sapiens <400> 288 gaatcagcat taagaggggc 20 <210> 289 <211> 20 <212> DNA <213> Homo sapiens <400> 289 ctcagaatca gcattaagag 20 <210> 290 <211> 20 <212> DNA <213> Homo sapiens <400> 290 cctcagaatc agcattaaga 20 <210> 291 <211> 20 <212> DNA <213> Homo sapiens <400> 291 tcctcagaat cagcattaag 20 <210> 292 <211> 20 <212> DNA <213> Homo sapiens <400> 292 ccctcttaat gctgattctg 20 <210> 293 <211> 20 <212> DNA <213> Homo sapiens <400> 293 gaagaacaca caattatcac 20 <210> 294 <211> 20 <212> DNA <213> Homo sapiens <400> 294 ttatttttac tttatagata 20 <210> 295 <211> 20 <212> DNA <213> Homo sapiens <400> 295 gaatgcataa gtttcagtgg 20 <210> 296 <211> 20 <212> DNA <213> Homo sapiens <400> 296 aatgaatgca taagtttcag 20 <210> 297 <211> 20 <212> DNA <213> Homo sapiens <400> 297 gcattcattt tgtgcattca 20 <210> 298 <211> 20 <212> DNA <213> Homo sapiens <400> 298 ttcattttgt gcattcaagg 20 <210> 299 <211> 20 <212> DNA <213> Homo sapiens <400> 299 tgtgcattca aggcggatga 20 <210> 300 <211> 20 <212> DNA <213> Homo sapiens <400> 300 ttttcatgat tgctttacat 20 <210> 301 <211> 20 <212> DNA <213> Homo sapiens <400> 301 cttttcatga ttgctttaca 20 <210> 302 <211> 20 <212> DNA <213> Homo sapiens <400> 302 cagtgcgaag aatttatata 20 <210> 303 <211> 20 <212> DNA <213> Homo sapiens <400> 303 agtgcgaaga atttatatat 20 <210> 304 <211> 20 <212> DNA <213> Homo sapiens <400> 304 gtgcgaagaa tttatatatg 20 <210> 305 <211> 20 <212> DNA <213> Homo sapiens <400> 305 tgcgaagaat ttatatatgg 20 <210> 306 <211> 20 <212> DNA <213> Homo sapiens <400> 306 tttatatatg ggggatgtga 20 <210> 307 <211> 20 <212> DNA <213> Homo sapiens <400> 307 tcagaatcga tttgaaagtc 20 <210> 308 <211> 20 <212> DNA <213> Homo sapiens <400> 308 tgcaaaaaaa tgtgtacaag 20 <210> 309 <211> 20 <212> DNA <213> Homo sapiens <400> 309 aaaaaatgtg tacaagaggt 20 <210> 310 <211> 20 <212> DNA <213> Homo sapiens <400> 310 tgattacaga taatgcaaac 20 <210> 311 <211> 20 <212> DNA <213> Homo sapiens <400> 311 ataaagacaa cattgcaaca 20 <210> 312 <211> 20 <212> DNA <213> Homo sapiens <400> 312 tcttccaaaa agcagaaatc 20 <210> 313 <211> 20 <212> DNA <213> Homo sapiens <400> 313 aaagccagat ttctgctttt 20 <210> 314 <211> 20 <212> DNA <213> Homo sapiens <400> 314 tgctttttgg aagaagatcc 20 <210> 315 <211> 20 <212> DNA <213> Homo sapiens <400> 315 atataacctc gacatattcc 20 <210> 316 <211> 20 <212> DNA <213> Homo sapiens <400> 316 gaagatcctg gaatatgtcg 20 <210> 317 <211> 20 <212> DNA <213> Homo sapiens <400> 317 tatgtcgagg ttatattacc 20 <210> 318 <211> 20 <212> DNA <213> Homo sapiens <400> 318 ctgattgtta taaaaatacc 20 <210> 319 <211> 20 <212> DNA <213> Homo sapiens <400> 319 cagtgtgaac gtttcaagta 20 <210> 320 <211> 20 <212> DNA <213> Homo sapiens <400> 320 tgtgaacgtt tcaagtatgg 20 <210> 321 <211> 20 <212> DNA <213> Homo sapiens <400> 321 tttcaagtat ggtggatgcc 20 <210> 322 <211> 20 <212> DNA <213> Homo sapiens <400> 322 ttcaagtatg gtggatgcct 20 <210> 323 <211> 20 <212> DNA <213> Homo sapiens <400> 323 caaaattgtt catattgccc 20 <210> 324 <211> 20 <212> DNA <213> Homo sapiens <400> 324 tatgaacaat tttgagacac 20 <210> 325 <211> 20 <212> DNA <213> Homo sapiens <400> 325 tgcaagaaca tttgtgaaga 20 <210> 326 <211> 20 <212> DNA <213> Homo sapiens <400> 326 ctgtattttt ttccagcgaa 20 <210> 327 <211> 20 <212> DNA <213> Homo sapiens <400> 327 tccacctgga aaccattcgc 20 <210> 328 <211> 20 <212> DNA <213> Homo sapiens <400> 328 ttttccagcg aatggtttcc 20 <210> 329 <211> 20 <212> DNA <213> Homo sapiens <400> 329 tccagcgaat ggtttccagg 20 <210> 330 <211> 20 <212> DNA <213> Homo sapiens <400> 330 gggttccata attatccacc 20 <210> 331 <211> 20 <212> DNA <213> Homo sapiens <400> 331 ggtttccagg tggataatta 20 <210> 332 <211> 20 <212> DNA <213> Homo sapiens <400> 332 gttattcaca gcattgagct 20 <210> 333 <211> 20 <212> DNA <213> Homo sapiens <400> 333 agttattcac agcattgagc 20 <210> 334 <211> 20 <212> DNA <213> Homo sapiens <400> 334 cttggttgat tgcggagtca 20 <210> 335 <211> 20 <212> DNA <213> Homo sapiens <400> 335 ccttggttga ttgcggagtc 20 <210> 336 <211> 20 <212> DNA <213> Homo sapiens <400> 336 ctgggaacct tggttgattg 20 <210> 337 <211> 20 <212> DNA <213> Homo sapiens <400> 337 cctgactccg caatcaacca 20 <210> 338 <211> 20 <212> DNA <213> Homo sapiens <400> 338 accaaaaagg ctgggaacct 20 <210> 339 <211> 20 <212> DNA <213> Homo sapiens <400> 339 agattcttac caaaaaggct 20 <210> 340 <211> 20 <212> DNA <213> Homo sapiens <400> 340 aagattctta ccaaaaaggc 20 <210> 341 <211> 20 <212> DNA <213> Homo sapiens <400> 341 accaaggttc ccagcctttt 20 <210> 342 <211> 20 <212> DNA <213> Homo sapiens <400> 342 ccacaagatt cttaccaaaa 20 <210> 343 <211> 20 <212> DNA <213> Homo sapiens <400> 343 cctttttggt aagaatcttg 20 <210> 344 <211> 20 <212> DNA <213> Homo sapiens <400> 344 gtgaaattct aaaaacaatc 20 <210> 345 <211> 20 <212> DNA <213> Homo sapiens <400> 345 tgattgtttt tagaatttca 20 <210> 346 <211> 20 <212> DNA <213> Homo sapiens <400> 346 tagaatttca cggtccctca 20 <210> 347 <211> 20 <212> DNA <213> Homo sapiens <400> 347 gctggagtga gacaccatga 20 <210> 348 <211> 20 <212> DNA <213> Homo sapiens <400> 348 tgctggagtg agacaccatg 20 <210> 349 <211> 20 <212> DNA <213> Homo sapiens <400> 349 cgacacaatc ctctgtctgc 20 <210> 350 <211> 20 <212> DNA <213> Homo sapiens <400> 350 tgtctcactc cagcagacag 20 <210> 351 <211> 20 <212> DNA <213> Homo sapiens <400> 351 gtagtagaat ctgttctcat 20 <210> 352 <211> 20 <212> DNA <213> Homo sapiens <400> 352 ttctactaca attcagtcat 20 <210> 353 <211> 20 <212> DNA <213> Homo sapiens <400> 353 tctactacaa ttcagtcatt 20 <210> 354 <211> 20 <212> DNA <213> Homo sapiens <400> 354 atccactgta cttaaatggg 20 <210> 355 <211> 20 <212> DNA <213> Homo sapiens <400> 355 cacatccact gtacttaaat 20 <210> 356 <211> 20 <212> DNA <213> Homo sapiens <400> 356 ccacatccac tgtacttaaa 20 <210> 357 <211> 20 <212> DNA <213> Homo sapiens <400> 357 tgccgcccat ttaagtacag 20 <210> 358 <211> 20 <212> DNA <213> Homo sapiens <400> 358 ccatttaagt acagtggatg 20 <210> 359 <211> 20 <212> DNA <213> Homo sapiens <400> 359 catttaagta cagtggatgt 20 <210> 360 <211> 20 <212> DNA <213> Homo sapiens <400> 360 atttaagtac agtggatgtg 20 <210> 361 <211> 20 <212> DNA <213> Homo sapiens <400> 361 tttaagtaca gtggatgtgg 20 <210> 362 <211> 20 <212> DNA <213> Homo sapiens <400> 362 tgccctcaga cattcttgtt 20 <210> 363 <211> 20 <212> DNA <213> Homo sapiens <400> 363 cttccaaaca agaatgtctg 20 <210> 364 <211> 20 <212> DNA <213> Homo sapiens <400> 364 ttccaaacaa gaatgtctga 20 <210> 365 <211> 20 <212> DNA <213> Homo sapiens <400> 365 tgtctgaggg catgtaaaaa 20 <210> 366 <211> 20 <212> DNA <213> Homo sapiens <400> 366 atgaaaccta taagaggaag 20 <210> 367 <211> 20 <212> DNA <213> Homo sapiens <400> 367 ctttggatga aacctataag 20 <210> 368 <211> 20 <212> DNA <213> Homo sapiens <400> 368 ggcctccttt tgatattctt 20 <210> 369 <211> 20 <212> DNA <213> Homo sapiens <400> 369 ttcatccaaa gaatatcaaa 20 <210> 370 <211> 20 <212> DNA <213> Homo sapiens <400> 370 atccaaagaa tatcaaaagg 20 <210> 371 <211> 20 <212> DNA <213> Homo sapiens <400> 371 tttttctttt ggttttaatt 20 <210> 372 <211> 20 <212> DNA <213> Homo sapiens <400> 372 ctgcttcttt ctttttcttt 20 <210> 373 <211> 20 <212> DNA <213> Homo sapiens <400> 373 tgtgtgttct tcatcttcct 20 <210> 374 <211> 20 <212> DNA <213> Homo sapiens <400> 374 ttatttttac tttatagata 20 <210> 375 <211> 20 <212> DNA <213> Homo sapiens <400> 375 atccgccttg aatgcacaaa 20 <210> 376 <211> 20 <212> DNA <213> Homo sapiens <400> 376 attcattttg tgcattcaag 20 <210> 377 <211> 20 <212> DNA <213> Homo sapiens <400> 377 tacatgggcc atcatccgcc 20 <210> 378 <211> 20 <212> DNA <213> Homo sapiens <400> 378 tatataaatt cttcgcactg 20 <210> 379 <211> 20 <212> DNA <213> Homo sapiens <400> 379 tattttcact cgacagtgcg 20 <210> 380 <211> 20 <212> DNA <213> Homo sapiens <400> 380 gtgcgaagaa tttatatatg 20 <210> 381 <211> 20 <212> DNA <213> Homo sapiens <400> 381 atgggggatg tgaaggaaat 20 <210> 382 <211> 20 <212> DNA <213> Homo sapiens <400> 382 gaatcgattt gaaagtctgg 20 <210> 383 <211> 20 <212> DNA <213> Homo sapiens <400> 383 ttgattacag ataatgcaaa 20 <210> 384 <211> 20 <212> DNA <213> Homo sapiens <400> 384 tgctttttgg aagaagatcc 20 <210> 385 <211> 20 <212> DNA <213> Homo sapiens <400> 385 aatataacct cgacatattc 20 <210> 386 <211> 20 <212> DNA <213> Homo sapiens <400> 386 gtgtgaacgt ttcaagtatg 20 <210> 387 <211> 20 <212> DNA <213> Homo sapiens <400> 387 gaacaatttt gagacactgg 20 <210> 388 <211> 20 <212> DNA <213> Homo sapiens <400> 388 ttccagcgaa tggtttccag 20 <210> 389 <211> 20 <212> DNA <213> Homo sapiens <400> 389 gagttattca cagcattgag 20 <210> 390 <211> 20 <212> DNA <213> Homo sapiens <400> 390 atggaaccca gctcaatgct 20 <210> 391 <211> 20 <212> DNA <213> Homo sapiens <400> 391 cttggttgat tgcggagtca 20 <210> 392 <211> 20 <212> DNA <213> Homo sapiens <400> 392 ctgggaacct tggttgattg 20 <210> 393 <211> 20 <212> DNA <213> Homo sapiens <400> 393 aggttcccag cctttttggt 20 <210> 394 <211> 20 <212> DNA <213> Homo sapiens <400> 394 cgacacaatc ctctgtctgc 20 <210> 395 <211> 20 <212> DNA <213> Homo sapiens <400> 395 gtgtctcact ccagcagaca 20 <210> 396 <211> 20 <212> DNA <213> Homo sapiens <400> 396 tcccaatgac tgaattgtag 20 <210> 397 <211> 20 <212> DNA <213> Homo sapiens <400> 397 tgggcggcat ttcccaatga 20 <210> 398 <211> 20 <212> DNA <213> Homo sapiens <400> 398 atgccgccca tttaagtaca 20 <210> 399 <211> 20 <212> DNA <213> Homo sapiens <400> 399 aaacaatttt acttccaaac 20 <210> 400 <211> 20 <212> DNA <213> Homo sapiens <400> 400 cctcttatag gtttcatcca 20 <210> 401 <211> 20 <212> DNA <213> Homo sapiens <400> 401 aggcctcctt ttgatattct 20 <210> 402 <211> 20 <212> DNA <213> Homo sapiens <400> 402 gaaatttttg ttaaaaatat 20 <210> 403 <211> 22 <212> DNA <213> Homo sapiens <400> 403 tgggttctgt atttcagaga tg 22 <210> 404 <211> 22 <212> DNA <213> Homo sapiens <400> 404 tcttcattgt gtaaatcatc tc 22 <210> 405 <211> 22 <212> DNA <213> Homo sapiens <400> 405 cagagatgat ttacacaatg aa 22 <210> 406 <211> 22 <212> DNA <213> Homo sapiens <400> 406 tgatttacac aatgaagaaa gt 22 <210> 407 <211> 22 <212> DNA <213> Homo sapiens <400> 407 caggcataca gaagcccaaa gt 22 <210> 408 <211> 22 <212> DNA <213> Homo sapiens <400> 408 ggcaggggca agattaagca gc 22 <210> 409 <211> 22 <212> DNA <213> Homo sapiens <400> 409 aatgctgatt ctgaggaaga tg 22 <210> 410 <211> 22 <212> DNA <213> Homo sapiens <400> 410 tgctgattct gaggaagatg aa 22 <210> 411 <211> 22 <212> DNA <213> Homo sapiens <400> 411 tacatgggcc atcatccgcc tt 22 <210> 412 <211> 22 <212> DNA <213> Homo sapiens <400> 412 tcacatcccc catatataaa tt 22 <210> 413 <211> 22 <212> DNA <213> Homo sapiens <400> 413 aagtctggaa gagtgcaaaa aa 22 <210> 414 <211> 22 <212> DNA <213> Homo sapiens <400> 414 aacctacctc ttgtacacat tt 22 <210> 415 <211> 22 <212> DNA <213> Homo sapiens <400> 415 agggttccca gaaacctacc tc 22 <210> 416 <211> 22 <212> DNA <213> Homo sapiens <400> 416 cactgttttg tctgattgtt at 22 <210> 417 <211> 22 <212> DNA <213> Homo sapiens <400> 417 aggcatccac catacttgaa ac 22 <210> 418 <211> 22 <212> DNA <213> Homo sapiens <400> 418 ttgttcatat tgcccaggca tc 22 <210> 419 <211> 22 <212> DNA <213> Homo sapiens <400> 419 gcctgggcaa tatgaacaat tt 22 <210> 420 <211> 22 <212> DNA <213> Homo sapiens <400> 420 cacaatcctc tgtctgctgg ag 22 <210> 421 <211> 22 <212> DNA <213> Homo sapiens <400> 421 tagtagaatc tgttctcatt gg 22 <210> 422 <211> 22 <212> DNA <213> Homo sapiens <400> 422 aattgtagta gaatctgttc tc 22 <210> 423 <211> 22 <212> DNA <213> Homo sapiens <400> 423 gtcattggga aatgccgccc at 22 <210> 424 <211> 22 <212> DNA <213> Homo sapiens <400> 424 ttgttttcat ttcccccaca tc 22 <210> 425 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 425 uccuaucaca uuggaauaca 20 <210> 426 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 426 gguuacaguu ccuaucacau 20 <210> 427 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 427 gccauguauu ccaaugugau 20 <210> 428 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 428 gugauaggaa cuguaaccuc 20 <210> 429 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 429 ccccucuuac cuuuuuccag 20 <210> 430 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 430 gaacuguaac cucuggaaaa 20 <210> 431 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 431 ccagaagcca augagcagca 20 <210> 432 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 432 cuuuuguccu ugcugcucau 20 <210> 433 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 433 ccuugcugcu cauuggcuuc 20 <210> 434 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 434 cuugcugcuc auuggcuucu 20 <210> 435 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 435 ugggacugcg ugaccuguca 20 <210> 436 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 436 gggacugcgu gaccugucac 20 <210> 437 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 437 guccacaggg cucccgugac 20 <210> 438 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 438 gaccugucac gggagcccug 20 <210> 439 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 439 uggcugugca gauguccaca 20 <210> 440 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 440 uuggcugugc agauguccac 20 <210> 441 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 441 acaucugcac agccaagccg 20 <210> 442 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 442 caucugcaca gccaagccgc 20 <210> 443 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 443 caugggaaug ucccgcggcu 20 <210> 444 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 444 ggauucaugg gaaugucccg 20 <210> 445 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 445 uaaaugcaca ugggauucau 20 <210> 446 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 446 guaaaugcac augggauuca 20 <210> 447 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 447 ggggagcggu aaaugcacau 20 <210> 448 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 448 cggggagcgg uaaaugcaca 20 <210> 449 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 449 caugugcauu uaccgcuccc 20 <210> 450 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 450 uugccuucuu cuccggggag 20 <210> 451 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 451 cucaguugcc uucuucuccg 20 <210> 452 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 452 ccucaguugc cuucuucucc 20 <210> 453 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 453 uccucaguug ccuucuucuc 20 <210> 454 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 454 uuaccgcucc ccggagaaga 20 <210> 455 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 455 cccggagaag aaggcaacug 20 <210> 456 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 456 gaagaaggca acugaggaug 20 <210> 457 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 457 aagaaggcaa cugaggauga 20 <210> 458 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 458 gggcucagaa cagaagaucc 20 <210> 459 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 459 cucagaacag aagaucccgg 20 <210> 460 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 460 cacgccgguu gguggccucc 20 <210> 461 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 461 acacgccggu ugguggccuc 20 <210> 462 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 462 agaucccgga ggccaccaac 20 <210> 463 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 463 uucccagaca cgccgguugg 20 <210> 464 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 464 caguucccag acacgccggu 20 <210> 465 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 465 uggacaguuc ccagacacgc 20 <210> 466 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 466 aggccaccaa ccggcguguc 20 <210> 467 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 467 ggccaccaac cggcgugucu 20 <210> 468 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 468 gcgugucugg gaacugucca 20 <210> 469 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 469 agcaaagcgg gaauuggccu 20 <210> 470 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 470 agugguagca aagcgggaau 20 <210> 471 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 471 auagaaagug guagcaaagc 20 <210> 472 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 472 gauagaaagu gguagcaaag 20 <210> 473 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 473 ugccaggugc ugauagaaag 20 <210> 474 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 474 uaccacuuuc uaucagcacc 20 <210> 475 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 475 ugucauucuu ggaaucugcc 20 <210> 476 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 476 aauguuauca uugucauucu 20 <210> 477 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 477 uggagauacu caggggugac 20 <210> 478 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 478 aaagccgugg agauacucag 20 <210> 479 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 479 aaaagccgug gagauacuca 20 <210> 480 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 480 caaaagccgu ggagauacuc 20 <210> 481 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 481 gucaccccug aguaucucca 20 <210> 482 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 482 cuuggucaua gcaaaagccg 20 <210> 483 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 483 ggcuuuugcu augaccaagc 20 <210> 484 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 484 gcuuuugcua ugaccaagcu 20 <210> 485 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 485 gucauuacag gcacccagcu 20 <210> 486 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 486 uugcuggagg gugucauuac 20 <210> 487 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 487 uaccuccauc aguugcugga 20 <210> 488 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 488 guaccuccau caguugcugg 20 <210> 489 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 489 gucguaccuc caucaguugc 20 <210> 490 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 490 ugacacccuc cagcaacuga 20 <210> 491 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 491 cacccuccag caacugaugg 20 <210> 492 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 492 aucagauguu uucucagaua 20 <210> 493 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 493 ucaguuuggc aaagaagaag 20 <210> 494 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 494 auagagucgg caguucaguu 20 <210> 495 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 495 uguuggcuuu ucgauagagu 20 <210> 496 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 496 uacuaacuug gaggauuugu 20 <210> 497 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 497 auuggcugau acuaacuugg 20 <210> 498 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 498 gcgauuggcu gauacuaacu 20 <210> 499 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 499 uuugucucca aaaaggcgau 20 <210> 500 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 500 guaucagcca aucgccuuuu 20 <210> 501 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 501 uaagggauuu gucuccaaaa 20 <210> 502 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 502 guaggucuca uugaagguaa 20 <210> 503 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 503 gguaggucuc auugaaggua 20 <210> 504 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 504 guccugguag gucucauuga 20 <210> 505 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 505 uaccuucaau gagaccuacc 20 <210> 506 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 506 caacucacug auguccuggu 20 <210> 507 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 507 auaccaacuc acugaugucc 20 <210> 508 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 508 cuaccaggac aucagugagu 20 <210> 509 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 509 gacaucagug aguugguaua 20 <210> 510 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 510 gaaguccagg ggcuggagcu 20 <210> 511 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 511 uggagccaag cuccagcccc 20 <210> 512 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 512 ucaccuugaa guccaggggc 20 <210> 513 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 513 caacucaccu ugaaguccag 20 <210> 514 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 514 gcaacucacc uugaagucca 20 <210> 515 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 515 ugcaacucac cuugaagucc 20 <210> 516 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 516 gcuccagccc cuggacuuca 20 <210> 517 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 517 gauugcucug cauuuuccug 20 <210> 518 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 518 aaaugcagag caauccagag 20 <210> 519 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 519 ccauuuguug auggccgcuc 20 <210> 520 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 520 auuggacacc cauuuguuga 20 <210> 521 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 521 ccagagcggc caucaacaaa 20 <210> 522 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 522 cagagcggcc aucaacaaau 20 <210> 523 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 523 gauucggccu ucggucuuau 20 <210> 524 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 524 ugggugucca auaagaccga 20 <210> 525 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 525 gacaucggug auucggccuu 20 <210> 526 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 526 agggaaugac aucggugauu 20 <210> 527 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 527 ggcuuccgag ggaaugacau 20 <210> 528 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 528 aaucaccgau gucauucccu 20 <210> 529 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 529 agcucauuga uggcuuccga 20 <210> 530 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 530 gagcucauug auggcuuccg 20 <210> 531 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 531 cagaacagug agcucauuga 20 <210> 532 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 532 caucaaugag cucacuguuc 20 <210> 533 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 533 ugagcucacu guucuggugc 20 <210> 534 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 534 ucugaguacc uugaaguaaa 20 <210> 535 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 535 gguuaacacc auuuacuuca 20 <210> 536 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 536 acuuugacuu ccacaggccc 20 <210> 537 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 537 ugauucucuu ccagggccug 20 <210> 538 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 538 ggcugaacuu ugacuuccac 20 <210> 539 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 539 guuccuuccu uguguucuca 20 <210> 540 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 540 aguuccuucc uuguguucuc 20 <210> 541 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 541 aguucagccc ugagaacaca 20 <210> 542 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 542 cagcccugag aacacaagga 20 <210> 543 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 543 aaggaaggaa cuguucuaca 20 <210> 544 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 544 gaacuguucu acaaggcuga 20 <210> 545 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 545 uucagcaucu augauguacc 20 <210> 546 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 546 gcaucuauga uguaccagga 20 <210> 547 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 547 gauaacggaa cuugccuucc 20 <210> 548 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 548 aggaaggcaa guuccguuau 20 <210> 549 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 549 cuucagccac gcgccgauaa 20 <210> 550 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 550 caaguuccgu uaucggcgcg 20 <210> 551 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 551 cguuaucggc gcguggcuga 20 <210> 552 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 552 gcgcguggcu gaaggcaccc 20 <210> 553 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 553 gaagggcaac ucaagcaccu 20 <210> 554 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 554 ugaagggcaa cucaagcacc 20 <210> 555 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 555 gugcuugagu ugcccuucaa 20 <210> 556 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 556 gugaugucau caccuuugaa 20 <210> 557 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 557 ggugauguca ucaccuuuga 20 <210> 558 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 558 caaaggugau gacaucacca 20 <210> 559 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 559 cuugggcaag augaggacca 20 <210> 560 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 560 ucucaggcuu gggcaagaug 20 <210> 561 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 561 gccaggcucu ucucaggcuu 20 <210> 562 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 562 ggccaggcuc uucucaggcu 20 <210> 563 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 563 accuuggcca ggcucuucuc 20 <210> 564 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 564 gcccaagccu gagaagagcc 20 <210> 565 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 565 gccugagaag agccuggcca 20 <210> 566 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 566 guuccuucuc uaccuuggcc 20 <210> 567 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 567 ggugaguucc uucucuaccu 20 <210> 568 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 568 gagccuggcc aagguagaga 20 <210> 569 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 569 agagaaggaa cucaccccag 20 <210> 570 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 570 ccacucuugc agcaccucug 20 <210> 571 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 571 gccacucuug cagcaccucu 20 <210> 572 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 572 agccacucuu gcagcaccuc 20 <210> 573 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 573 ccccagaggu gcugcaagag 20 <210> 574 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 574 agaggugcug caagaguggc 20 <210> 575 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 575 gcaagagugg cuggaugaau 20 <210> 576 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 576 agaguggcug gaugaauugg 20 <210> 577 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 577 ugaauuggag gagaugaugc 20 <210> 578 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 578 auuggaggag augaugcugg 20 <210> 579 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 579 caaugcggaa gcggggcaug 20 <210> 580 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 580 ccguccucaa ugcggaagcg 20 <210> 581 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 581 gccguccuca augcggaagc 20 <210> 582 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 582 agccguccuc aaugcggaag 20 <210> 583 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 583 caugccccgc uuccgcauug 20 <210> 584 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 584 aacugaagcc guccucaaug 20 <210> 585 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 585 ccccgcuucc gcauugagga 20 <210> 586 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 586 ugaggacggc uucaguuuga 20 <210> 587 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 587 gaaggagcag cugcaagaca 20 <210> 588 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 588 aaggagcagc ugcaagacau 20 <210> 589 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 589 cagggcugaa cagaucgaca 20 <210> 590 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 590 cugggaguuu ggacuuuuca 20 <210> 591 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 591 ccugggaguu uggacuuuuc 20 <210> 592 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 592 ccuagacaaa ccugggaguu 20 <210> 593 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 593 ccugaaaagu ccaaacuccc 20 <210> 594 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 594 cggccuucug caacaauacc 20 <210> 595 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 595 cuuccaggua uuguugcaga 20 <210> 596 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 596 cugagacaua gaggucaucu 20 <210> 597 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 597 ggaaugcauc ugagacauag 20 <210> 598 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 598 ugucucagau gcauuccaua 20 <210> 599 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 599 ucaccucaag aaaugccuua 20 <210> 600 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 600 auuccauaag gcauuucuug 20 <210> 601 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 601 gaccugcagg uaaaugaaga 20 <210> 602 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 602 acggccagca aucacaacag 20 <210> 603 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 603 aguaccgcug uugugauugc 20 <210> 604 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 604 cccuguuggg guuuagcgaa 20 <210> 605 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 605 gccguucgcu aaaccccaac 20 <210> 606 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 606 ccguucgcua aaccccaaca 20 <210> 607 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 607 ccuugaaagu cacccuguug 20 <210> 608 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 608 gccuugaaag ucacccuguu 20 <210> 609 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 609 ggccuugaaa gucacccugu 20 <210> 610 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 610 ccccaacagg gugacuuuca 20 <210> 611 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 611 gggugacuuu caaggccaac 20 <210> 612 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 612 aaaaaccagg aaaggccugu 20 <210> 613 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 613 caaggccaac aggccuuucc 20 <210> 614 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 614 ucucuuauaa aaaccaggaa 20 <210> 615 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 615 gaacuucucu uauaaaaacc 20 <210> 616 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 616 augaagauaa uaguguucag 20 <210> 617 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 617 ucugaacacu auuaucuuca 20 <210> 618 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 618 cugaacacua uuaucuucau 20 <210> 619 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 619 auuuuacuua acacaagggu 20 <210> 620 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 620 gaacauuuua cuuaacacaa 20 <210> 621 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 621 agaacauuuu acuuaacaca 20 <210> 622 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 622 gguuacaguu ccuaucacau 20 <210> 623 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 623 ccaagccgcg ggacauuccc 20 <210> 624 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 624 uaaaugcaca ugggauucau 20 <210> 625 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 625 cggggagcgg uaaaugcaca 20 <210> 626 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 626 ccccggagaa gaaggcaacu 20 <210> 627 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 627 acacgccggu ugguggccuc 20 <210> 628 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 628 auagaaagug guagcaaagc 20 <210> 629 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 629 aucagcaccu ggcagauucc 20 <210> 630 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 630 aauguuauca uugucauucu 20 <210> 631 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 631 auaacauuuu ccugucaccc 20 <210> 632 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 632 caaaagccgu ggagauacuc 20 <210> 633 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 633 cggcuuuugc uaugaccaag 20 <210> 634 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 634 cguaccucca ucaguugcug 20 <210> 635 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 635 uucaguuugg caaagaagaa 20 <210> 636 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 636 aggauuuguu ggcuuuucga 20 <210> 637 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 637 gauuggcuga uacuaacuug 20 <210> 638 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 638 gguaggucuc auugaaggua 20 <210> 639 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 639 ugagaccuac caggacauca 20 <210> 640 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 640 uccagccccu ggacuucaag 20 <210> 641 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 641 cccauuuguu gauggccgcu 20 <210> 642 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 642 uccagagcgg ccaucaacaa 20 <210> 643 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 643 guguccaaua agaccgaagg 20 <210> 644 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 644 agcucauuga uggcuuccga 20 <210> 645 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 645 acuguucuac aaggcugaug 20 <210> 646 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 646 ggcugaaggc acccaggugc 20 <210> 647 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 647 uugaagggca acucaagcac 20 <210> 648 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 648 acucuugcag caccucuggg 20 <210> 649 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 649 agccacucuu gcagcaccuc 20 <210> 650 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 650 acucacccca gaggugcugc 20 <210> 651 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 651 cagaggugcu gcaagagugg 20 <210> 652 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 652 ggugcugcaa gaguggcugg 20 <210> 653 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 653 ucaccucaag aaaugccuua 20 <210> 654 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 654 uccauaaggc auuucuugag 20 <210> 655 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 655 ggccguucgc uaaaccccaa 20 <210> 656 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 656 ggccuugaaa gucacccugu 20 <210> 657 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 657 aacacuauua ucuucauggg 20 <210> 658 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 658 aagaacauuu uacuuaacac 20 <210> 659 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 659 gagguuacag uuccuaucac au 22 <210> 660 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 660 cugucacggg agcccugugg ac 22 <210> 661 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 661 gccuucuucu ccggggagcg gu 22 <210> 662 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 662 gggaauuggc cuuggacagu uc 22 <210> 663 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 663 ucccgcuuug cuaccacuuu cu 22 <210> 664 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 664 gcuuggucau agcaaaagcc gu 22 <210> 665 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 665 uaugaccaag cugggugccu gu 22 <210> 666 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 666 ucaguugcug gaggguguca uu 22 <210> 667 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 667 augacacccu ccagcaacug au 22 <210> 668 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 668 uugacuucua uagguauuua ag 22 <210> 669 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 669 uuucucagau auggugucaa ac 22 <210> 670 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 670 uuugucucca aaaaggcgau ug 22 <210> 671 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 671 guccaggggc uggagcuugg cu 22 <210> 672 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 672 ggugauucgg ccuucggucu ua 22 <210> 673 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 673 ugagcucacu guucuggugc ug 22 <210> 674 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 674 uaccuugaag uaaauggugu ua 22 <210> 675 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 675 ugcugguuaa caccauuuac uu 22 <210> 676 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 676 guggaaguca aaguucagcc cu 22 <210> 677 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 677 ggagagucgu guucagcauc ua 22 <210> 678 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 678 ccuuccuggu acaucauaga ug 22 <210> 679 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 679 cgccgauaac ggaacuugcc uu 22 <210> 680 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 680 guuccguuau cggcgcgugg cu 22 <210> 681 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 681 gucaucaccu uugaagggca ac 22 <210> 682 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 682 cuccaauuca uccagccacu cu 22 <210> 683 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 683 agaggucauc ucggccuucu gc 22 <210> 684 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 684 auuccauaag gcauuucuug ag 22 <210> 685 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 685 ugaagaaggc agugaagcag cu 22 <210> 686 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 686 gcgaacggcc agcaaucaca ac 22 <210> 687 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 687 gguuuuuaua agagaaguuc cu 22 <210> 688 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 688 ugcaaagaau aagaacauuu ua 22 <210> 689 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 689 ugaagaaagu acaugcacuu 20 <210> 690 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 690 gaagaaagua caugcacuuu 20 <210> 691 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 691 caggggcaag auuaagcagc 20 <210> 692 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 692 aucagcauua agaggggcag 20 <210> 693 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 693 aaucagcauu aagaggggca 20 <210> 694 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 694 gaaucagcau uaagaggggc 20 <210> 695 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 695 cucagaauca gcauuaagag 20 <210> 696 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 696 ccucagaauc agcauuaaga 20 <210> 697 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 697 uccucagaau cagcauuaag 20 <210> 698 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 698 cccucuuaau gcugauucug 20 <210> 699 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 699 gaagaacaca caauuaucac 20 <210> 700 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 700 uuauuuuuac uuuauagaua 20 <210> 701 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 701 gaaugcauaa guuucagugg 20 <210> 702 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 702 aaugaaugca uaaguuucag 20 <210> 703 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 703 gcauucauuu ugugcauuca 20 <210> 704 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 704 uucauuuugu gcauucaagg 20 <210> 705 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 705 ugugcauuca aggcggauga 20 <210> 706 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 706 uuuucaugau ugcuuuacau 20 <210> 707 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 707 cuuuucauga uugcuuuaca 20 <210> 708 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 708 cagugcgaag aauuuauaua 20 <210> 709 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 709 agugcgaaga auuuauauau 20 <210> 710 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 710 gugcgaagaa uuuauauaug 20 <210> 711 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 711 ugcgaagaau uuauauaugg 20 <210> 712 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 712 uuuauauaug ggggauguga 20 <210> 713 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 713 ucagaaucga uuugaaaguc 20 <210> 714 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 714 ugcaaaaaaa uguguacaag 20 <210> 715 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 715 aaaaaaugug uacaagaggu 20 <210> 716 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 716 ugauuacaga uaaugcaaac 20 <210> 717 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 717 auaaagacaa cauugcaaca 20 <210> 718 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 718 ucuuccaaaa agcagaaauc 20 <210> 719 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 719 aaagccagau uucugcuuuu 20 <210> 720 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 720 ugcuuuuugg aagaagaucc 20 <210> 721 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 721 auauaaccuc gacauauucc 20 <210> 722 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 722 gaagauccug gaauaugucg 20 <210> 723 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 723 uaugucgagg uuauauuacc 20 <210> 724 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 724 cugauuguua uaaaaauacc 20 <210> 725 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 725 cagugugaac guuucaagua 20 <210> 726 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 726 ugugaacguu ucaaguaugg 20 <210> 727 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 727 uuucaaguau gguggaugcc 20 <210> 728 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 728 uucaaguaug guggaugccu 20 <210> 729 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 729 caaaauuguu cauauugccc 20 <210> 730 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 730 uaugaacaau uuugagacac 20 <210> 731 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 731 ugcaagaaca uuugugaaga 20 <210> 732 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 732 cuguauuuuu uuccagcgaa 20 <210> 733 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 733 uccaccugga aaccauucgc 20 <210> 734 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 734 uuuuccagcg aaugguuucc 20 <210> 735 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 735 uccagcgaau gguuuccagg 20 <210> 736 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 736 ggguuccaua auuauccacc 20 <210> 737 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 737 gguuuccagg uggauaauua 20 <210> 738 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 738 guuauucaca gcauugagcu 20 <210> 739 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 739 aguuauucac agcauugagc 20 <210> 740 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 740 cuugguugau ugcggaguca 20 <210> 741 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 741 ccuugguuga uugcggaguc 20 <210> 742 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 742 cugggaaccu ugguugauug 20 <210> 743 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 743 ccugacuccg caaucaacca 20 <210> 744 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 744 accaaaaagg cugggaaccu 20 <210> 745 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 745 agauucuuac caaaaaggcu 20 <210> 746 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 746 aagauucuua ccaaaaaggc 20 <210> 747 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 747 accaagguuc ccagccuuuu 20 <210> 748 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 748 ccacaagauu cuuaccaaaa 20 <210> 749 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 749 ccuuuuuggu aagaaucuug 20 <210> 750 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 750 gugaaauucu aaaaacaauc 20 <210> 751 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 751 ugauuguuuu uagaauuuca 20 <210> 752 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 752 uagaauuuca cggucccuca 20 <210> 753 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 753 gcuggaguga gacaccauga 20 <210> 754 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 754 ugcuggagug agacaccaug 20 <210> 755 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 755 cgacacaauc cucugucugc 20 <210> 756 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 756 ugucucacuc cagcagacag 20 <210> 757 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 757 guaguagaau cuguucucau 20 <210> 758 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 758 uucuacuaca auucagucau 20 <210> 759 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 759 ucuacuacaa uucagucauu 20 <210> 760 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 760 auccacugua cuuaaauggg 20 <210> 761 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 761 cacauccacu guacuuaaau 20 <210> 762 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 762 ccacauccac uguacuuaaa 20 <210> 763 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 763 ugccgcccau uuaaguacag 20 <210> 764 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 764 ccauuuaagu acaguggaug 20 <210> 765 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 765 cauuuaagua caguggaugu 20 <210> 766 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 766 auuuaaguac aguggaugug 20 <210> 767 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 767 uuuaaguaca guggaugugg 20 <210> 768 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 768 ugcccucaga cauucuuguu 20 <210> 769 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 769 cuuccaaaca agaaugucug 20 <210> 770 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 770 uuccaaacaa gaaugucuga 20 <210> 771 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 771 ugucugaggg cauguaaaaa 20 <210> 772 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 772 augaaaccua uaagaggaag 20 <210> 773 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 773 cuuuggauga aaccuauaag 20 <210> 774 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 774 ggccuccuuu ugauauucuu 20 <210> 775 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 775 uucauccaaa gaauaucaaa 20 <210> 776 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 776 auccaaagaa uaucaaaagg 20 <210> 777 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 777 uuuuucuuuu gguuuuaauu 20 <210> 778 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 778 cugcuucuuu cuuuuucuuu 20 <210> 779 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 779 uguguguucu ucaucuuccu 20 <210> 780 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 780 uuauuuuuac uuuauagaua 20 <210> 781 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 781 auccgccuug aaugcacaaa 20 <210> 782 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 782 auucauuuug ugcauucaag 20 <210> 783 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 783 uacaugggcc aucauccgcc 20 <210> 784 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 784 uauauaaauu cuucgcacug 20 <210> 785 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 785 uauuuucacu cgacagugcg 20 <210> 786 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 786 gugcgaagaa uuuauauaug 20 <210> 787 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 787 augggggaug ugaaggaaau 20 <210> 788 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 788 gaaucgauuu gaaagucugg 20 <210> 789 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 789 uugauuacag auaaugcaaa 20 <210> 790 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 790 ugcuuuuugg aagaagaucc 20 <210> 791 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 791 aauauaaccu cgacauauuc 20 <210> 792 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 792 gugugaacgu uucaaguaug 20 <210> 793 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 793 gaacaauuuu gagacacugg 20 <210> 794 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 794 uuccagcgaa ugguuuccag 20 <210> 795 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 795 gaguuauuca cagcauugag 20 <210> 796 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 796 auggaaccca gcucaaugcu 20 <210> 797 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 797 cuugguugau ugcggaguca 20 <210> 798 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 798 cugggaaccu ugguugauug 20 <210> 799 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 799 agguucccag ccuuuuuggu 20 <210> 800 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 800 cgacacaauc cucugucugc 20 <210> 801 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 801 gugucucacu ccagcagaca 20 <210> 802 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 802 ucccaaugac ugaauuguag 20 <210> 803 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 803 ugggcggcau uucccaauga 20 <210> 804 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 804 augccgccca uuuaaguaca 20 <210> 805 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 805 aaacaauuuu acuuccaaac 20 <210> 806 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 806 ccucuuauag guuucaucca 20 <210> 807 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 807 aggccuccuu uugauauucu 20 <210> 808 <211> 20 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 808 gaaauuuuug uuaaaaauau 20 <210> 809 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 809 uggguucugu auuucagaga ug 22 <210> 810 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 810 ucuucauugu guaaaucauc uc 22 <210> 811 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 811 cagagaugau uuacacaaug aa 22 <210> 812 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 812 ugauuuacac aaugaagaaa gu 22 <210> 813 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 813 caggcauaca gaagcccaaa gu 22 <210> 814 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 814 ggcaggggca agauuaagca gc 22 <210> 815 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 815 aaugcugauu cugaggaaga ug 22 <210> 816 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 816 ugcugauucu gaggaagaug aa 22 <210> 817 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 817 uacaugggcc aucauccgcc uu 22 <210> 818 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 818 ucacaucccc cauauauaaa uu 22 <210> 819 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 819 aagucuggaa gagugcaaaa aa 22 <210> 820 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 820 aaccuaccuc uuguacacau uu 22 <210> 821 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 821 aggguuccca gaaaccuacc uc 22 <210> 822 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 822 cacuguuuug ucugauuguu au 22 <210> 823 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 823 aggcauccac cauacuugaa ac 22 <210> 824 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 824 uuguucauau ugcccaggca uc 22 <210> 825 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 825 gccugggcaa uaugaacaau uu 22 <210> 826 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 826 cacaauccuc ugucugcugg ag 22 <210> 827 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 827 uaguagaauc uguucucauu gg 22 <210> 828 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 828 aauuguagua gaaucuguuc uc 22 <210> 829 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 829 gucauuggga aaugccgccc au 22 <210> 830 <211> 22 <212> RNA <213> Artificial Sequence <220> <223> Guide sequence <400> 830 uuguuuucau uucccccaca uc 22 <210> 831 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 831 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 832 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 832 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 833 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 833 Pro Ala Ala Lys Arg Val Lys Leu Asp 1 5 <210> 834 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 834 Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro 1 5 10 <210> 835 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 835 Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly 1 5 10 15 Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro 20 25 30 Arg Asn Gln Gly Gly Tyr 35 <210> 836 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 836 Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu 1 5 10 15 Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys 20 25 30 Asp Glu Gln Ile Leu Lys Arg Arg Asn Val 35 40 <210> 837 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 837 Val Ser Arg Lys Arg Pro Arg Pro 1 5 <210> 838 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 838 Pro Pro Lys Lys Ala Arg Glu Asp 1 5 <210> 839 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 839 Pro Gln Pro Lys Lys Lys Pro Leu 1 5 <210> 840 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 840 Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro 1 5 10 <210> 841 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 841 Asp Arg Leu Arg Arg 1 5 <210> 842 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 842 Pro Lys Gln Lys Lys Arg Lys 1 5 <210> 843 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 843 Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu 1 5 10 <210> 844 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 844 Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg 1 5 10 <210> 845 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 845 Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys 1 5 10 15 Lys Ser Lys Lys 20 <210> 846 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Nuclear localization sequence <400> 846 Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys 1 5 10 15 Lys <210> 847 <211> 20 <212> DNA <213> Homo sapiens <400> 847 gtccatctcc tccgccagcg 20 <210> 848 <211> 22 <212> DNA <213> Homo sapiens <400> 848 gagagggcca gaaatcaccc aa 22

Claims (29)

  1. 혈액 응고 저해 유전자 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산 또는 이를 암호화하는 핵산 서열; 및
    에디터단백질 또는 이를 암호화하는 핵산 서열
    을 포함하는 유전자 조작용 조성물로,
    상기 혈액 응고 저해 유전자는 AT(antithrombin) 유전자 또는 TFPI(tissue factor pathway inhibitor) 유전자이며,
    상기 가이드 서열은 SEQ ID NO: 425 내지 SEQ ID NO: 830의 가이드 서열들 중 선택된 하나 이상의 가이드 서열이고,
    상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합인,
    유전자 조작용 조성물.
  2. 제1항에 있어서,
    상기 표적 서열은 SEQ ID NO: 19 내지 SEQ ID NO: 424 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  3. 제2항에 있어서,
    상기 표적 서열은 SEQ ID NO: 21, 22, 30, 31, 37, 38, 41, 42, 43, 48, 52, 54, 55, 57, 58, 60, 61, 63, 67, 68, 216, 217, 218, 219, 220, 221, 222, 224, 226, 228, 229, 232, 233, 235, 236, 253, 254, 255, 256, 257, 258, 259, 260, 261, 262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272, 273, 274, 275, 276, 277, 278, 280, 281 및 282 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  4. 제2항에 있어서,
    상기 표적 서열은 SEQ ID NO: 286, 288, 299, 303, 304, 315, 320, 325, 327, 329, 334, 335, 336, 342, 375, 377, 380, 382, 385, 386, 388, 389, 390, 391, 392, 394, 396, 397, 398, 403, 404, 405, 407, 408, 409, 410, 411, 412, 413, 414, 415, 416, 417, 418, 419, 420, 421, 422, 423 및 424 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  5. 제1항에 있어서,
    상기 가이드 서열은 SEQ ID NO: 427, 428, 436, 437, 443, 444, 447, 448, 449, 454, 458, 460, 461, 463, 464, 466, 467, 469, 473, 474, 622, 623, 624, 625, 626, 627, 628, 630, 632, 634, 635, 638, 639, 641, 642, 659, 660, 661, 662, 663, 664, 665, 666, 667, 668, 669, 670, 671, 672, 673, 674, 675, 676, 677, 678, 679, 680, 681, 682, 683, 684, 686, 687 및 688 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  6. 제1항에 있어서,
    상기 가이드 서열은 SEQ ID NO: 692, 694, 705, 709, 710, 721, 726, 731, 733, 735, 740, 741, 742, 748, 781, 783, 786, 788, 791, 792, 794, 795, 796, 797, 798, 800, 802, 803, 804, 809, 810, 811, 813, 814, 815, 816, 817, 818, 819, 820, 821, 822, 823, 824, 825, 826, 827, 828, 829 및 830 중 선택된 하나 이상의 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  7. 제1항에 있어서,
    상기 가이드 서열은 AT 유전자의 exon 1, exon 2, exon 3, exon 4, exon 5, exon 6 또는 exon 7에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 유전자 조작용 조성물.
  8. 제1항에 있어서,
    상기 가이드 서열은 TFPI 유전자의 exon 2, exon 3, exon 5, exon 6 또는 exon 7에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 유전자 조작용 조성물.
  9. 제1항에 있어서,
    상기 가이드핵산은 가이드 도메인은 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
  10. 제9항에 있어서,
    상기 가이드 서열은 상기 가이드 도메인에 포함되는 것을 특징으로 하는 유전자 조작용 조성물.
  11. 제1항에 있어서,
    상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
  12. 제1항에 있어서,
    상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 스타필로코커스 아우레우스 (Staphylococcus aureus) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질인 것을 특징으로 하는 유전자 조작용 조성물.
  13. 제1항에 있어서,
    상기 유전자 조작용 조성물은 가이드핵산과 에디터단백질이 결합한 가이드핵산-에디터단백질 복합체 형태이며, 상기 가이드핵산은 guide RNA(gRNA)인 것을 특징으로 하는 유전자 조작용 조성물.
  14. 제1항에 있어서,
    상기 유전자 조작용 조성물은 가이드핵산 및 에디터단백질이 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하는 것을 특징으로 하는 유전자 조작용 조성물.
  15. 제1항에 있어서,
    상기 유전자 조작용 조성물은 삽입을 원하는 핵산서열을 포함하는 도너 또는 이를 암호화하는 핵산서열을 선택적으로 더 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
  16. 제15항에 있어서,
    상기 삽입을 원하는 핵산서열은 혈액 응고 저해 유전자의 일부 핵산 서열인 것을 특징으로 하는 유전자 조작용 조성물.
  17. 제15항에 있어서,
    상기 삽입을 원하는 핵산서열은 혈액 응고에 관여하는 단백질을 암호화하는 유전자 전체 또는 일부 핵산서열인 것을 특징으로 하는 유전자 조작용 조성물.
  18. 제17항에 있어서,
    상기 혈액 응고에 관여하는 단백질은 XII 인자(factor XII), XIIa 인자(factor XIIa), XI 인자(factor XI), XIa 인자(factor XIa), IX 인자(factor IX), IXa 인자(factor IXa), X 인자(factor X), Xa 인자(factor Xa), VIII 인자(factor VIII), VIIIa 인자(factor VIIIa), VII 인자(factor VII), VIIa 인자(factor VIIa), V 인자(factor V), Va 인자(factor Va), 프로트롬빈(prothrombin), 트롬빈(thrombin), XIII 인자(factor XIII), XIIIa 인자(factor XIIIa), 피브리노겐(fibrinogen), 피브린(fibrin) 및 Tissue factor로 구성된 군에서 선택된 하나 이상인 것을 특징으로 하는 유전자 조작용 조성물.
  19. 제15항에 있어서,
    상기 유전자 조작용 조성물은 가이드핵산, 에디터단백질 및 도너가 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하는 것을 특징으로 하는 유전자 조작용 조성물.
  20. 제14항 및 제19항 중 어느 한 항에 있어서,
    상기 벡터는 플라스미드 또는 바이러스벡터인 것을 특징으로 하는 유전자 조작용 조성물.
  21. 제20항에 있어서,
    상기 바이러스 벡터는 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노-연관 바이러스(AAV) 벡터, 백시니아바이러스 벡터, 폭스바이러스 벡터 및 단순포진 바이러스 벡터로 구성된 군에서 선택된 하나 이상인 것을 특징으로 하는 유전자 조작용 조성물.
  22. 혈액 응고 저해 유전자 내에 위치하는 표적 서열과 상보적인 결합을 형성하는 가이드 서열을 포함하는 가이드핵산으로,
    상기 혈액 응고 저해 유전자는 AT(antithrombin) 유전자 또는 TFPI(tissue factor pathway inhibitor) 유전자이며,
    상기 가이드 서열은 SEQ ID NO: 425 내지 SEQ ID NO: 830의 가이드 서열들 중 선택된 하나 이상의 가이드 서열이고,
    상기 상보적인 결합은 0 내지 5개의 미스매칭을 포함하는 결합이며,
    상기 가이드핵산은 에디터단백질과 복합체를 형성할 수 있는 가이드핵산.
  23. 제22항에 있어서,
    상기 가이드 서열은 SEQ ID NO: 427, 428, 436, 437, 443, 444, 447, 448, 449, 454, 458, 460, 461, 463, 464, 466, 467, 469, 473, 474, 622, 623, 624, 625, 626, 627, 628, 630, 632, 634, 635, 638, 639, 641, 642, 659, 660, 661, 662, 663, 664, 665, 666, 667, 668, 669, 670, 671, 672, 673, 674, 675, 676, 677, 678, 679, 680, 681, 682, 683, 684, 686, 687 및 688 중 선택된 하나 이상의 서열인 것을 특징으로 하는 가이드핵산.
  24. 제22항에 있어서,
    상기 가이드 서열은 SEQ ID NO: 692, 694, 705, 709, 710, 721, 726, 731, 733, 735, 740, 741, 742, 748, 781, 783, 786, 788, 791, 792, 794, 795, 796, 797, 798, 800, 802, 803, 804, 809, 810, 811, 813, 814, 815, 816, 817, 818, 819, 820, 821, 822, 823, 824, 825, 826, 827, 828, 829 및 830 중 선택된 하나 이상의 서열인 것을 특징으로 하는 가이드핵산.
  25. 제22항에 있어서,
    상기 가이드 서열은 AT 유전자의 exon 1, exon 2, exon 3, exon 4, exon 5, exon 6 또는 exon 7에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 가이드핵산.
  26. 제22항에 있어서,
    상기 가이드 서열은 TFPI 유전자의 exon 2, exon 3, exon 5, exon 6 또는 exon 7에 위치하는 표적 서열과 상보적인 결합을 형성하는 것을 특징으로 하는 가이드핵산.
  27. 제22항에 있어서,
    상기 가이드핵산은 가이드 도메인은 포함하는 것을 특징으로 하는 가이드핵산.
  28. 제27항에 있어서,
    상기 가이드 서열은 상기 가이드 도메인에 포함되는 것을 특징으로 하는 가이드핵산.
  29. 제22항에 있어서,
    상기 가이드핵산은 제 1 상보적 도메인, 제 2 상보적 도메인, 연결 도메인, 근위 도메인 및 꼬리 도메인인 중 적어도 하나 이상의 도메인은 포함하는 것을 특징으로 하는 가이드핵산.
KR1020190090599A 2018-07-26 2019-07-26 항응고 인자들의 유전자 에디팅 KR20200012786A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201862703578P 2018-07-26 2018-07-26
US62/703,578 2018-07-26

Publications (1)

Publication Number Publication Date
KR20200012786A true KR20200012786A (ko) 2020-02-05

Family

ID=69180684

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190090599A KR20200012786A (ko) 2018-07-26 2019-07-26 항응고 인자들의 유전자 에디팅

Country Status (5)

Country Link
US (1) US20210317448A1 (ko)
EP (1) EP3827847A4 (ko)
KR (1) KR20200012786A (ko)
CN (1) CN112888461A (ko)
WO (1) WO2020022803A1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
ES2785323B2 (es) * 2020-05-14 2020-12-18 Univ Madrid Complutense Metodo in vitro para recuperar la expresion del gen f5 que codifica el factor v de la coagulacion

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2016007328A (es) * 2013-12-12 2017-07-19 Broad Inst Inc Suministro, uso y aplicaciones terapeuticas de sistemas y composiciones crispr-cas para edicion del genoma.
SG11201608701QA (en) * 2014-04-18 2016-11-29 Editas Medicine Inc Crispr-cas-related methods, compositions and components for cancer immunotherapy
JP7215716B2 (ja) * 2017-01-13 2023-01-31 学校法人自治医科大学 肝臓ゲノム上の凝固関連因子遺伝子を破壊するためのaavベクター
CN108118057B (zh) * 2017-12-28 2021-04-06 吴文书 一种基因编辑系统及其制备方法和应用

Also Published As

Publication number Publication date
CN112888461A (zh) 2021-06-01
WO2020022803A1 (ko) 2020-01-30
EP3827847A1 (en) 2021-06-02
EP3827847A4 (en) 2023-07-19
US20210317448A1 (en) 2021-10-14

Similar Documents

Publication Publication Date Title
US20230340456A1 (en) Use of exonucleases to improve crispr/cas-mediated genome editing
KR102621539B1 (ko) 인위적으로 조작된 sc 기능 조절 시스템
TW202027799A (zh) 用於表現因子ix的組成物及方法
KR102662879B1 (ko) 망막 기능장애 질환 치료를 위한 유전자 조작
JP7123982B2 (ja) 肝臓において目的のタンパク質を発現するためのプラットフォーム
JP2022505381A (ja) アルファ1アンチトリプシン欠乏症を治療するための組成物及び方法
KR20200012786A (ko) 항응고 인자들의 유전자 에디팅
KR20200011899A (ko) 인위적인 유전자 조작을 통한 자가면역질환 치료
US20200101173A1 (en) Genome Editing System For Repeat Expansion Mutation
US20230190889A1 (en) Gene editing of anticoagulant factors
US20240043819A1 (en) Modified cas9 system having a dominant negative effector on non-homologous end-joining fused thereto and its use for improved gene editing