CN112888461A - 抗凝因子的基因编辑 - Google Patents

抗凝因子的基因编辑 Download PDF

Info

Publication number
CN112888461A
CN112888461A CN201980063541.XA CN201980063541A CN112888461A CN 112888461 A CN112888461 A CN 112888461A CN 201980063541 A CN201980063541 A CN 201980063541A CN 112888461 A CN112888461 A CN 112888461A
Authority
CN
China
Prior art keywords
seq
sequence
nucleic acid
gene
domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980063541.XA
Other languages
English (en)
Inventor
宋东佑
李贞慜
李圭晙
金云起
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Turkin Corp
Toolgen Inc
Original Assignee
Turkin Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Turkin Corp filed Critical Turkin Corp
Publication of CN112888461A publication Critical patent/CN112888461A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/81Protease inhibitors
    • C07K14/8107Endopeptidase (E.C. 3.4.21-99) inhibitors
    • C07K14/811Serine protease (E.C. 3.4.21) inhibitors
    • C07K14/8121Serpins
    • C07K14/8128Antithrombin III
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/04Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/81Protease inhibitors
    • C07K14/8107Endopeptidase (E.C. 3.4.21-99) inhibitors
    • C07K14/811Serine protease (E.C. 3.4.21) inhibitors
    • C07K14/8114Kunitz type inhibitors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Abstract

本发明涉及用于人工操纵存在于细胞基因组中的抗凝基因以便控制凝血系统的基因编辑组合物。更具体而言,本发明涉及基因编辑组合物,所述基因编辑组合物包含用于靶向抗凝基因的引导核酸和编辑蛋白。另外,本发明涉及使用用于人工操纵抗凝基因的基因编辑组合物来治疗或缓解凝血病的方法。

Description

抗凝因子的基因编辑
技术领域
本发明涉及对凝血抑制基因的人工操纵或修饰以得到正常凝血系统。更具体而言,本发明涉及能够人工调节凝血的系统,所述系统包括能够人工操纵凝血抑制基因以激活异常的凝血系统(即失活的凝血系统)的组合物。
背景技术
血友病是由凝血因子缺乏引起的出血性疾病。血液中的凝血因子由因子I至因子XIII组成,并且血友病由相应因子的遗传缺陷引起。血友病A由因子VIII缺乏引起,并已知影响每5000名男婴中的一名。血友病B由因子IX缺乏引起,并已知影响每20,000名男婴中的一名。全世界的血友病患者估计超过700,000名。
迄今为止已知的疗法主要为持续使用所缺乏的因子,而没有根本性的治疗方法。
因此,存在对能够在单一疗法中实现长期效果的治疗剂的需求,所述治疗剂可以实质上使用基因编辑来敲除使凝血系统失活的蛋白质的表达。
发明内容
技术问题
本发明的一个实施方式是提供治疗凝血病的方法。
本发明的另一实施方式是提供用于基因操纵的组合物。
本发明的又一实施方式是提供一种能够靶向凝血抑制基因的引导核酸。
技术方案
为了解决上述问题,本发明提供了用于基因操纵的组合物,以人工操纵存在于细胞基因组中的凝血抑制基因来调节凝血系统。更具体而言,本发明提供了用于基因操纵的组合物,所述组合物包含能够靶向凝血抑制基因的引导核酸和编辑蛋白。另外,本发明提供了使用用于基因操纵以人工操纵凝血抑制基因的组合物来治疗或改善凝血病的方法。
为了治疗血友病,本发明提供了治疗血友病的方法,所述方法包括向待治疗的受试者中给予(引入)用于基因操纵的组合物。
在一个实施方式中,治疗血友病的方法可以包括向待治疗的受试者中引入(给予)用于基因操纵的组合物。
用于基因操纵的组合物可以包括以下:
引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含与位于凝血抑制基因中的靶序列形成互补结合的引导序列;以及
编辑蛋白或编码所述编辑蛋白的核酸序列。
凝血抑制基因可为AT(抗凝血酶)基因或TFPI(组织因子途径抑制剂)基因。
引导序列可为选自SEQ ID NO:425至SEQ ID NO:830中的一个或多个引导序列。
互补结合可包括0个至5个的错配结合。
在一个实施方式中,引导序列可为选自以下的一个或多个序列:SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:443、SEQ ID NO:444、SEQ IDNO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:454、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:467、SEQ IDNO:469、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:622、SEQ ID NO:623、SEQ ID NO:624、SEQ ID NO:625、SEQ ID NO:626、SEQ ID NO:627、SEQ ID NO:628、SEQ ID NO:630、SEQ IDNO:632、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:638、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:642、SEQ ID NO:659、SEQ ID NO:660、SEQ ID NO:661、SEQ ID NO:662、SEQ IDNO:663、SEQ ID NO:664、SEQ ID NO:665、SEQ ID NO:666、SEQ ID NO:667、SEQ ID NO:668、SEQ ID NO:669、SEQ ID NO:670、SEQ ID NO:671、SEQ ID NO:672、SEQ ID NO:673、SEQ IDNO:674、SEQ ID NO:675、SEQ ID NO:676、SEQ ID NO:677、SEQ ID NO:678、SEQ ID NO:679、SEQ ID NO:680、SEQ ID NO:681、SEQ ID NO:682、SEQ ID NO:683、SEQ ID NO:684、SEQ IDNO:686、SEQ ID NO:687和SEQ ID NO:688。
在一个实施方式中,引导序列可为选自以下的一个或多个序列:SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:705、SEQ ID NO:709、SEQ ID NO:710、SEQ ID NO:721、SEQ IDNO:726、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:740、SEQ ID NO:741、SEQ ID NO:742、SEQ ID NO:748、SEQ ID NO:781、SEQ ID NO:783、SEQ ID NO:786、SEQ IDNO:788、SEQ ID NO:791、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:795、SEQ ID NO:796、SEQ ID NO:797、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:803、SEQ IDNO:804、SEQ ID NO:809、SEQ ID NO:810、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:814、SEQ ID NO:815、SEQ ID NO:816、SEQ ID NO:817、SEQ ID NO:818、SEQ ID NO:819、SEQ IDNO:820、SEQ ID NO:821、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQ ID NO:825、SEQ ID NO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:829和SEQ ID NO:830。
引导序列可与位于AT基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6或外显子7中的靶序列形成互补结合。
引导序列可与位于TFPI基因的外显子2、外显子3、外显子5、外显子6或外显子7中的靶序列形成互补结合。
编辑蛋白可为由酿脓链球菌(Streptococcus pyogenes)衍生而来的Cas9蛋白、由金黄色葡萄球菌(Staphylococcus aureus)衍生而来的Cas9蛋白或由空肠弯曲杆菌(Campylobacter jejuni)衍生而来的Cas9蛋白。
用于基因操纵的组合物可为引导核酸和编辑蛋白组合的引导核酸-编辑蛋白复合体的形式。
此处,引导核酸可为引导RNA(gRNA)。
所述引导核酸和所述编辑蛋白可分别以核酸序列的形式存在于一个或多个载体中。
此处,所述载体可为质粒或病毒载体。
此处,所述病毒载体可为选自于由以下病毒载体所组成的组中的一种或多种病毒载体:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。
用于基因操纵的组合物可任选地进一步包含供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。
此处,待插入的核酸序列可为凝血抑制基因的部分核酸序列。
此处,待插入的核酸序列可为编码凝血相关蛋白的基因的完整或部分序列。
例如,凝血相关蛋白可为选自于由以下所组成的组中的一种或多种蛋白:因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白和组织因子。
引导核酸、编辑蛋白和供体可分别以核酸序列的形式存在于一种或多种载体中。
此处,载体可为质粒或病毒载体。
此处,病毒载体可为选自于由以下所组成的组中的一种或多种病毒载体:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。
给予(引入)可通过注射、输注、植入或移植进行。
给予(引入)可通过选自如下的给予途径进行:肝内、皮下、皮内、眼内、玻璃体内、肿瘤内、结节内、髓内、肌内、静脉内、淋巴管内和腹膜内途径。
血友病可为血友病A、血友病B或血友病C。
待治疗的受试者为哺乳动物,包括人、猴、小鼠和大鼠。
或者,本发明提供了用于特定目的的用于基因操纵的组合物。
在一个实施方式中,用于基因操纵的组合物可以包括以下:
引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含与位于凝血抑制基因中的靶序列形成互补结合的引导序列;以及
编辑蛋白或编码所述编辑蛋白的核酸序列。
凝血抑制基因可为AT(抗凝血酶)基因或TFPI(组织因子途径抑制剂)基因。
引导序列可为选自SEQ ID NO:425至SEQ ID NO:830中的一个或多个引导序列。
互补结合可包括0个至5个错配结合。
靶序列可为选自SEQ ID NO:19至SEQ ID NO:424中的一个或多个序列。
在一个实施方式中,靶序列可为选自以下的一个或多个序列:SEQ ID NO:21、SEQID NO:22、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:41、SEQID NO:42、SEQ ID NO:43、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:55、SEQID NO:57、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:67、SEQID NO:68、SEQ ID NO:216、SEQ ID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQ ID NO:228、SEQID NO:229、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:236、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:256、SEQ ID NO:257、SEQ ID NO:258、SEQID NO:259、SEQ ID NO:260、SEQ ID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQ ID NO:267、SEQ ID NO:268、SEQ ID NO:269、SEQID NO:270、SEQ ID NO:271、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQ ID NO:280、SEQ ID NO:281和SEQ ID NO:282。
在一个实施方式中,靶序列可为选自以下的一个或多个序列:SEQ ID NO:286、SEQID NO:288、SEQ ID NO:299、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:315、SEQ ID NO:320、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:334、SEQ ID NO:335、SEQID NO:336、SEQ ID NO:342、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:385、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:389、SEQ ID NO:390、SEQID NO:391、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:407、SEQ ID NO:408、SEQID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQ ID NO:418、SEQ ID NO:419、SEQID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:423和SEQ ID NO:424。
引导序列可为选自以下的一个或多个序列:SEQ ID NO:427、SEQ ID NO:428、SEQID NO:436、SEQ ID NO:437、SEQ ID NO:443、SEQ ID NO:444、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:454、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:461、SEQID NO:463、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:622、SEQ ID NO:623、SEQ ID NO:624、SEQ ID NO:625、SEQID NO:626、SEQ ID NO:627、SEQ ID NO:628、SEQ ID NO:630、SEQ ID NO:632、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:638、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:642、SEQID NO:659、SEQ ID NO:660、SEQ ID NO:661、SEQ ID NO:662、SEQ ID NO:663、SEQ ID NO:664、SEQ ID NO:665、SEQ ID NO:666、SEQ ID NO:667、SEQ ID NO:668、SEQ ID NO:669、SEQID NO:670、SEQ ID NO:671、SEQ ID NO:672、SEQ ID NO:673、SEQ ID NO:674、SEQ ID NO:675、SEQ ID NO:676、SEQ ID NO:677、SEQ ID NO:678、SEQ ID NO:679、SEQ ID NO:680、SEQID NO:681、SEQ ID NO:682、SEQ ID NO:683、SEQ ID NO:684、SEQ ID NO:686、SEQ ID NO:687和SEQ ID NO:688。
引导序列可为选自以下的一个或多个序列:SEQ ID NO:692、SEQ ID NO:694、SEQID NO:705、SEQ ID NO:709、SEQ ID NO:710、SEQ ID NO:721、SEQ ID NO:726、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:740、SEQ ID NO:741、SEQ ID NO:742、SEQID NO:748、SEQ ID NO:781、SEQ ID NO:783、SEQ ID NO:786、SEQ ID NO:788、SEQ ID NO:791、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:795、SEQ ID NO:796、SEQ ID NO:797、SEQID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:803、SEQ ID NO:804、SEQ ID NO:809、SEQ ID NO:810、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:814、SEQ ID NO:815、SEQID NO:816、SEQ ID NO:817、SEQ ID NO:818、SEQ ID NO:819、SEQ ID NO:820、SEQ ID NO:821、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQ ID NO:825、SEQ ID NO:826、SEQID NO:827、SEQ ID NO:828、SEQ ID NO:829和SEQ ID NO:830。
引导序列可与位于AT基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6或外显子7中的靶序列形成互补结合。
引导序列可与位于TFPI基因的外显子2、外显子3、外显子5、外显子6或外显子7中的靶序列形成互补结合。
引导核酸可包括引导结构域。
此处,引导结构域中可包含引导序列。
引导核酸可包含选自第一互补结构域、第二互补结构域、接头结构域、近端结构域和尾部结构域的一个或多个结构域。
编辑蛋白可为由酿脓链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白或由空肠弯曲杆菌衍生而来的Cas9蛋白。
用于基因操纵的组合物可为引导核酸和编辑蛋白组合的引导核酸-编辑蛋白复合体的形式。
此处,引导核酸可为引导RNA(gRNA)。
引导核酸和编辑蛋白可分别以核酸序列的形式存在于一种或多种载体中。
此处,载体可为质粒或病毒载体。
此处,病毒载体可为选自于由逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒所组成的组中的一种或多种病毒载体。
用于基因操纵的组合物可以任选地进一步包含供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。
此处,待插入的核酸序列可为凝血抑制基因的部分核酸序列。
此处,待插入的核酸序列可为编码凝血相关蛋白的基因的完整或部分序列。
例如,凝血相关蛋白可为选自于由以下所组成的组中的一种或多种蛋白:因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白和组织因子。
引导核酸、编辑蛋白和供体可分别以核酸序列的形式存在于一种或多种载体中。
此处,载体可为质粒或病毒载体。
此处,病毒载体可为选自于由逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒所组成的组中的一种或多种病毒载体。
本发明提供了能够用于特定目的的靶向免疫参与基因的引导核酸。
在一个实施方式中,所述引导核酸可包括与位于凝血抑制基因中的靶序列形成互补结合的引导序列。
凝血抑制基因可为AT(抗凝血酶)基因或TFPI(组织因子途径抑制剂)基因。
引导序列可为选自SEQ ID NO:425至SEQ ID NO:830中的一种或多种引导序列。
互补结合可包括0个至5个错配结合。
引导核酸可与编辑蛋白形成复合体。
在一个实施方式中,引导序列可为选自以下的一个或多个序列:SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:443、SEQ ID NO:444、SEQ IDNO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:454、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:467、SEQ IDNO:469、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:622、SEQ ID NO:623、SEQ ID NO:624、SEQ ID NO:625、SEQ ID NO:626、SEQ ID NO:627、SEQ ID NO:628、SEQ ID NO:630、SEQ IDNO:632、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:638、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:642、SEQ ID NO:659、SEQ ID NO:660、SEQ ID NO:661、SEQ ID NO:662、SEQ IDNO:663、SEQ ID NO:664、SEQ ID NO:665、SEQ ID NO:666、SEQ ID NO:667、SEQ ID NO:668、SEQ ID NO:669、SEQ ID NO:670、SEQ ID NO:671、SEQ ID NO:672、SEQ ID NO:673、SEQ IDNO:674、SEQ ID NO:675、SEQ ID NO:676、SEQ ID NO:677、SEQ ID NO:678、SEQ ID NO:679、SEQ ID NO:680、SEQ ID NO:681、SEQ ID NO:682、SEQ ID NO:683、SEQ ID NO:684、SEQ IDNO:686、SEQ ID NO:687和SEQ ID NO:688。
在一个实施方式中,引导序列可为选自以下的一个或多个序列:SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:705、SEQ ID NO:709、SEQ ID NO:710、SEQ ID NO:721、SEQ IDNO:726、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:740、SEQ ID NO:741、SEQ ID NO:742、SEQ ID NO:748、SEQ ID NO:781、SEQ ID NO:783、SEQ ID NO:786、SEQ IDNO:788、SEQ ID NO:791、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:795、SEQ ID NO:796、SEQ ID NO:797、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:803、SEQ IDNO:804、SEQ ID NO:809、SEQ ID NO:810、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:814、SEQ ID NO:815、SEQ ID NO:816、SEQ ID NO:817、SEQ ID NO:818、SEQ ID NO:819、SEQ IDNO:820、SEQ ID NO:821、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQ ID NO:825、SEQ ID NO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:829和SEQ ID NO:830。
引导序列可与位于AT基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6或外显子7中的靶序列形成互补结合。
引导序列可与位于TFPI基因的外显子2、外显子3、外显子5、外显子6或外显子7中的靶序列形成互补结合。
引导核酸可包含引导结构域。
此处,引导结构域中可包含引导序列。
引导核酸可包含选自第一互补结构域、第二互补结构域、接头结构域、近端结构域和尾部结构域中的一个或多个结构域。
有益效果
根据本发明,可以使用用于基因操纵的组合物来调节凝血系统。更具体而言,根据本发明,可以使用用于基因操纵的组合物通过人工操纵和/或修饰凝血抑制基因以调节凝血抑制基因的功能和/或表达来调节凝血系统,所述组合物包含靶向凝血抑制基因的引导核酸和编辑蛋白。另外,可以使用用于基因操纵以人工操纵凝血抑制基因的组合物来治疗或改善凝血病。
具体实施方式
除非另有定义,本文使用的全部技术术语和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。与本文所述的方法和材料类似或相同的方法和材料可用于本发明的实践或测试中。本文提及的所有出版物、专利申请、专利和其它参考文献都以引用的方式将它们整体并入。此外,材料、方法和实例仅为说明性的,而不旨在为限制性的。
本说明书的公开内容的一个方面涉及引导核酸。
“引导核酸”是指识别靶核酸、基因或染色体并且与编辑蛋白相互作用的核苷酸序列。此处,引导核酸可互补结合至靶核酸、基因或染色体中的部分核苷酸序列。此外,引导核酸的部分核苷酸序列可与编辑蛋白的一些氨基酸相互作用,从而形成引导核酸-编辑蛋白复合体。
引导核酸可执行诱导引导核酸-编辑蛋白复合体定位于靶核酸、基因或染色体的靶区域中的功能。
引导核酸可以以DNA、RNA或DNA/RNA杂合体的形式存在,并且可具有5nt-150nt的核酸序列。
引导核酸可具有一条连续的核酸序列。
例如,所述一条连续的核酸序列可为(N)m,其中N代表A、T、C或G,或A、U、C或G;并且m为1-150的整数。
引导核酸可具有两条以上连续的核酸序列。
例如,所述两条以上连续的核酸序列可为(N)m以及(N)o,其中N代表A、T、C或G,或代表A、U、C或G;m和o为1-150的整数,并且m和o可彼此相同或彼此不同。
引导核酸可包含一个或多个结构域。
所述结构域可为功能结构域,所述功能结构域为引导结构域、第一互补结构域、接头结构域、第二互补结构域、近端结构域或尾部结构域,但不限于此。
此处,一个引导核酸可具有两个以上功能结构域。此处,两个以上功能结构域可彼此不同。或者,一个引导核酸中包含的两个以上功能结构域可彼此相同。例如,一个引导核酸可具有两个以上近端结构域。又例如,一个引导核酸可具有两个以上尾部结构域。但是,一个引导核酸中包含的功能结构域是相同的结构域的描述并不意为两个功能结构域的序列是相同的。即使序列不同,在功能上执行相同功能时,两个功能结构域也可为相同结构域。
将在下面详细描述功能结构域。
i)引导结构域
术语“引导结构域”是能够与靶基因或核酸的双链的任一条链的部分序列互补结合的结构域,并与靶基因或核酸特异性相互作用。例如,引导结构域可执行诱导引导核酸-编辑蛋白复合体定位于靶基因或核酸的特定核苷酸序列的功能。
引导结构域可为10个-35个核苷酸的序列。
在实例中,引导结构域可为10个-35个核苷酸、15个-35个核苷酸、20个-35个核苷酸、25个-35个核苷酸或30个-35个核苷酸的序列。
在另一实例中,引导结构域可为10个-15个核苷酸、15个-20个核苷酸、20个-25个核苷酸、25个-30个核苷酸或30个-35个核苷酸的序列。
引导结构域可包括引导序列。
“引导序列”为与靶基因或核酸的双链的任一条链的部分序列互补的核苷酸序列。此处,引导序列可为具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高互补性或完全互补性的核苷酸序列。
引导序列可为10个-25个核苷酸的序列。
在实例中,引导序列可为10个-25个核苷酸、15个-25个核苷酸或20个-25个核苷酸的序列。
在另一实例中,引导序列可为10个-15个核苷酸、15个-20个核苷酸或20个-25个核苷酸的序列。
此外,引导结构域可进一步包含额外核苷酸序列。
额外核苷酸序列可用于改善或降低引导结构域的功能。
额外核苷酸序列可用于改善或降低引导序列的功能。
额外核苷酸序列可为1个-10个核苷酸的序列。
在一个实例中,额外核苷酸序列可为2个-10个核苷酸、4个-10个核苷酸、6个-10个核苷酸或8个-10个核苷酸的序列。
在另一实例中,额外核苷酸序列可为1-3个核苷酸、3-6个核苷酸或7-10个核苷酸的序列。
在一个实施方式中,额外核苷酸序列可为1个核苷酸的序列、2个核苷酸的序列、3个核苷酸的序列、4个核苷酸的序列、5个核苷酸的序列、6个核苷酸的序列、7个核苷酸的序列、8个核苷酸的序列、9个核苷酸的序列或10个核苷酸的序列。
例如,额外核苷酸序列可为一个核苷酸的序列G(鸟嘌呤)或者两个核苷酸的序列GG。
额外核苷酸序列可位于引导序列的5′端。
额外核苷酸序列可位于引导序列的3′端。
ii)第一互补结构域
术语“第一互补结构域”是包含与下文描述的第二互补结构域互补的核苷酸序列的结构域,其具有足够的互补性以与第二互补结构域形成双链。例如,第一互补结构域可为与第二互补结构域具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的互补性或完全互补性的核苷酸序列。
第一互补结构域可通过互补结合与第二互补结构域形成双链。此处,所形成的双链可通过与编辑蛋白的一些氨基酸相互作用,从而形成引导核酸-编辑蛋白复合体。
第一互补结构域可为5个-35个核苷酸的序列。
在实例中,第一互补结构域可为5个-35个核苷酸、10个-35个核苷酸、15个-35个核苷酸、20个-35个核苷酸、25个-35个核苷酸或30个-35个核苷酸的序列。
在另一实例中,第一互补结构域可为1个-5个核苷酸、5个-10个核苷酸、10个-15个核苷酸、15个-20个核苷酸、20个-25个核苷酸、25个-30个核苷酸或30个-35个核苷酸的序列。
iii)接头结构域
术语“接头结构域”是连接两个以上结构域(两个以上相同或不同的结构域)的核苷酸序列。接头结构域可借助共价结合或非共价结合与两个以上结构域连接,或可共价或非共价地连接两个以上结构域。
接头结构域可为1个-30个核苷酸的序列。
在一个实例中,接头结构域可为1个-5个核苷酸、5个-10个核苷酸、10个-15个核苷酸、15个-20个核苷酸、20个-25个核苷酸或25个-30个核苷酸的序列。
在另一实例中,接头结构域可为1个-30个核苷酸、5个-30个核苷酸、10个-30个核苷酸、15个-30个核苷酸、20个-30个核苷酸或25个-30个核苷酸的序列。
iv)第二互补结构域
术语“第二互补结构域”是包含与上述第一互补结构域互补的核苷酸序列的结构域,其具有足够的互补性以与第一互补结构域形成双链。例如,第二互补结构域可为与第一互补结构域具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的互补性或完全互补性的核苷酸序列。
第二互补结构域可通过互补结合与第一互补结构域形成双链。此处,所形成的双链可通过与编辑蛋白的一些氨基酸相互作用,从而形成引导核酸-编辑蛋白复合体。
第二互补结构域可具有与第一互补结构域互补的核苷酸序列,以及与第一互补结构域没有互补性的核苷酸序列(例如不与第一互补结构域形成双链的核苷酸序列),并可具有比第一互补结构域更长的序列。
第二互补结构域可具有5个-35个核苷酸的序列。
在实例中,第二互补结构域可为1个-35个核苷酸、5个-35个核苷酸、10个-35个核苷酸、15个-35个核苷酸、20个-35个核苷酸、25个-35个核苷酸或30个-35个核苷酸的序列。
在另一实例中,第二互补结构域可为1个-5个核苷酸、5个-10个核苷酸、10个-15个核苷酸、15个-20个核苷酸、20个-25个核苷酸、25个-30个核苷酸或30个-35个核苷酸的序列。
v)近端结构域
术语“近端结构域”是临近第二互补结构域定位的核苷酸序列。
近端结构域中可包含互补核苷酸序列,并可由于互补核苷酸序列而形成双链。
近端结构域可为1个-20个核苷酸的序列。
在一个实例中,近端结构域可为1个-20个核苷酸、5个-20个核苷酸、10个-20个核苷酸或15个-20个核苷酸的序列。
在另一实例中,近端结构域可为1个-5个核苷酸、5个-10个核苷酸、10个-15个核苷酸或15个-20个核苷酸的序列。
vi)尾部结构域
术语“尾部结构域”为位于引导核酸两个末端中的一个或多个末端处的核苷酸序列。
尾部结构域中可包含互补核苷酸序列,并可由于互补核苷酸序列而形成双链。
尾部结构域可为1个-50个核苷酸的序列。
在实例中,尾部结构域可为5个-50个核苷酸、10个-50个核苷酸、15个-50个核苷酸、20个-50个核苷酸、25个-50个核苷酸、30个-50个核苷酸、35个-50个核苷酸、40个-50个核苷酸或45个-50个核苷酸的序列。
在另一实例中,尾部结构域可为1个-5个核苷酸、5个-10个核苷酸、10个-15个核苷酸、15个-20个核苷酸、20个-25个核苷酸、25个-30个核苷酸、30个-35个核苷酸、35个-40个核苷酸、40个-45个核苷酸或45个-50个核苷酸的序列。
同时,所述结构域(即引导结构域、第一互补结构域、接头结构域、第二互补结构域、近端结构域和尾部结构域)中包含的部分或全部核酸序列可选择性地或额外地包含化学修饰。
化学修饰可为但不限于甲基化、乙酰化、磷酸化、硫代磷酸酯连接、锁核酸(LNA)、2′-O-甲基3′硫代磷酸酯(MS)或2′-O-甲基3′硫代PACE(MSP)。
引导核酸包含一个或多个结构域。
引导核酸可包含引导结构域。
引导核酸可包含第一互补结构域。
引导核酸可包含接头结构域。
引导核酸可包含第二互补结构域。
引导核酸可包含近端结构域。
引导核酸可包含尾部结构域。
此处,引导核酸可包含1、2、3、4、5、6个或更多个结构域。
引导核酸可包含1、2、3、4、5、6个或更多个引导结构域。
引导核酸可包含1、2、3、4、5、6个或更多个第一互补结构域。
引导核酸可包含1、2、3、4、5、6个或更多个接头结构域。
引导核酸可包含1、2、3、4、5、6个或更多个第二互补结构域。
引导核酸可包含1、2、3、4、5、6个或更多个近端结构域。
引导核酸可包含1、2、3、4、5、6个或更多个尾部结构域。
此处,引导核酸可双重地包含一种类型的结构域。
引导核酸可单个地或双重地包含数个结构域。
引导核酸可包含相同类型的结构域。此处,相同类型的结构域可具有相同的核酸序列或不同的核酸序列。
引导核酸可包含两种类型的结构域。此处,两种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含三种类型的结构域。此处,三种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含四种类型的结构域。此处,四种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含五种类型的结构域。此处,五种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
引导核酸可包含六种类型的结构域。此处,六种不同类型的结构域可具有不同的核酸序列或相同的核酸序列。
例如,引导核酸可由[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[接头结构域]-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]组成。此处,两个引导结构域可包含用于不同或相同靶标的引导序列;两个第一互补结构域和两个第二互补结构域可具有相同或不同的核酸序列。当引导结构域包含用于不同靶标的引导序列时,引导核酸可与两种不同靶标特异性结合;此处,该特异性结合可以同时进行或顺序进行。此外,接头结构域可被特定的酶切割,并在特定的酶的存在下,引导核酸可被分为两个或三个部分。
在本说明书的公开内容的一个实施方式中,引导核酸可为gRNA。
gRNA
“gRNA”指能够使gRNA-CRISPR酶复合体(即,CRISPR复合体)相对于靶基因或核酸特异性靶向的RNA。此外,gRNA指对靶基因或核酸而言特异的RNA,其可结合至CRISPR酶并将CRISPR酶引导至该靶基因或核酸。
gRNA可包含多个结构域。由于各结构域,相互作用可出现在三维结构或者gRNA链的活性形式中或者这些链之间。
gRNA可称为单链gRNA(单个RNA分子;单个gRNA;sgRNA)或者双链gRNA(包含多于一个RNA分子,通常为两个离散的RNA分子)。
在一个示例性实施方式中,单链gRNA从5′至3′方向可包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)、第一互补结构域、接头结构域、第二互补结构域(该结构域具有与第一互补结构域序列互补的序列,由此与第一互补结构域形成双链核酸)、近端结构域以及任选的尾部结构域。
在另一实施方式中,双链gRNA可包含第一链和第二链;从5′至3′方向,所述第一链包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)以及第一互补结构域,所述第二链包含第二互补结构域(该结构域具有与第一互补结构域序列互补的序列,由此与第一互补结构域形成双链核酸)、近端结构域以及任选的尾部结构域。
此处,第一链可指crRNA,且第二链可指tracrRNA。crRNA可包含引导结构域和第一互补结构域;并且tracrRNA可包含第二互补结构域、近端结构域和任选的尾部结构域。
在又一实施方式中,单链gRNA从3′至5′方向可包含引导结构域(即,包含能够与靶基因或核酸形成互补结合的引导序列的结构域)、第一互补结构域、和第二互补结构域(该结构域具有与第一互补结构域序列互补的序列,由此与第一互补结构域形成双链核酸)。
此处,第一互补结构域可与天然第一互补结构域具有同源性,或可由天然第一互补结构域衍生而来。此外,第一互补结构域可取决于天然存在的物种而在第一互补结构域的核苷酸序列中存在差异、可由天然存在的物种中含有的第一互补结构域衍生而来、或可与天然存在的物种中含有的第一互补结构域具有部分或完全同源性。
在一个示例性实施方式中,第一互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌(Streptococcus thermophilus)、金黄色葡萄球菌或脑膜炎奈瑟菌(Neisseriameningitides)的第一互补结构域或由它们衍生而来的第一互补结构域具有部分(即至少50%以上)或完全同源性。
例如,当第一互补结构域是酿脓链球菌的第一互补结构域或由其衍生而来的第一互补结构域时,第一互补结构域可为5′-GUUUUAGAGCUA-3′(SEQ ID NO:1)或与5′-GUUUUAGAGCUA-3(SEQ ID NO:1)具有部分(即至少50%以上)或完全同源性的核苷酸序列。此处,第一互补结构域可进一步包含(X)n,使得其为5′-GUUUUAGAGCUA(X)n-3′(SEQ ID NO:1)。X可选自于由核苷酸A、T、U和G所组成的组;并且n可表示核苷酸数,其为5-15的整数。此处,(X)n可为相同核苷酸的整数n个重复,或者为其中核苷酸A、T、U和G混合的整数n数量的核苷酸序列。
在另一实例中,当第一互补结构域为空肠弯曲杆菌的第一互补结构域或由其衍生而来的第一互补结构域时,第一互补结构域可为5′-GUUUUAGUCCCUUUUUAAAUUUCUU-3′(SEQID NO:2)或5′-GUUUUAGUCCCUU-3′(SEQ ID NO:3)或者与5′-GUUUUAGUCCCUUUUUAAAUUUCUU-3′(SEQ ID NO:2)或5′-GUUUUAGUCCCUU-3′(SEQ ID NO:3)具有部分(即至少50%以上)或完全同源性的核苷酸序列。此处,第一互补结构域可进一步包含(X)n,使得其为5′-GUUUUAGUCCCUUUUUAAAUUUCUU(X)n-3′(SEQ ID NO:2)或5′-GUUUUAGUCCCUU(X)n-3′(SEQ IDNO:3)。X可选自于由核苷酸A、T、U和G所组成的组;并且n可表示核苷酸数,其为5-15的整数。此处,(X)n可为相同核苷酸的整数n个重复,或者为其中核苷酸A、T、U和G混合的整数n数量的核苷酸序列。
在另一实施方式中,第一互补结构域可与如下菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分(即至少50%以上)或完全同源性:俭菌总门细菌(Parcubacteria bacterium)(GWC2011_GWC2_44_17)、毛螺菌科细菌(Lachnospiraceaebacterium)(MC2017)、Butyrivibrio proteoclasiicus、异域菌门细菌(Peregrinibacteria bacterium)(GW2011_GWA_33_10)、氨基酸球菌属(Acidaminococcussp.)(BV3L6)、猕猴卟啉单胞菌(Porphyromonas macacae)、毛螺菌科细菌(ND2006)、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)、解糖胨普雷沃菌(Prevotella disiens)、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体(Leptospirainadai)、毛螺菌科细菌(MA2020)、新凶手弗朗西斯菌(Francisella novicida)(U112)、Candidatus Methanoplasma termitum或挑剔真杆菌(Eubacterium eligens)。
例如,当第一互补结构域是俭菌总门细菌的第一互补结构域或由其衍生而来的第一互补结构域时,第一互补结构域可为5′-UUUGUAGAU-3′(SEQ ID NO:4)或与5′-UUUGUAGAU-3′(SEQ ID NO:4)具有部分(即至少50%以上)同源性的核苷酸序列。此处,第一互补结构域可进一步包含(X)n,使得其为5′-(X)nUUUGUAGAU-3′(SEQ ID NO:4)。X可选自于由核苷酸A、T、U和G所组成的组;且n可表示核苷酸数,其为1-5的整数。此处,(X)n可为相同核苷酸的整数n个重复,或者为其中核苷酸A、T、U和G混合的整数n数量的核苷酸序列。
此处,接头结构域可为使得第一互补结构域与第二互补结构域连接的核苷酸序列。
接头结构域可分别与第一互补结构域和第二互补结构域形成共价结合或非共价结合。
接头结构域可将第一互补结构域与第二互补结构域共价或非共价连接。
接头结构域适合用于单链gRNA分子中,并可用于通过共价或非共价结合与双链gRNA的第一链和第二链连接或者连接第一链和第二链来产生单链gRNA。
接头结构域可用于通过共价或非共价结合与双链gRNA的crRNA和tracrRNA连接或者连接crRNA和tracrRNA来产生单链gRNA。
此处,第二互补结构域可与天然第二互补结构域具有同源性,或可由天然第二互补结构域衍生而来。此外,第二互补结构域可取决于天然存在的物种而在第二互补结构域的核苷酸序列中存在差异、可由天然存在的物种中含有的第二互补结构域衍生而来、或可与天然存在的物种中含有的第二互补结构域具有部分或完全同源性。
在示例性实施方式中,第二互补结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的第二互补结构域或由它们衍生而来的第二互补结构域具有部分(即至少50%以上)或完全同源性。
例如,当第二互补结构域是酿脓链球菌的第二互补结构域或由其衍生而来的第二互补结构域时,第二互补结构域可为5′-UAGCAAGUUAAAAU-3′(SEQ ID NO:5)或与5′-UAGCAAGUUAAAAU-3′(SEQ ID NO:5)具有部分(即至少50%以上)同源性的核苷酸序列(下划线标出与第一互补结构域形成双链的核苷酸序列)。此处,第二互补结构域可进一步包含(X)n和/或(X)m,使得其为5′-(X)n UAGCAAGUUAAAAU(X)m-3′(SEQ ID NO:5)。X可选自于由核苷酸A、T、U和G所组成的组;并且n和m各自可表示核苷酸数,其中n可为1-15的整数,且m可为1-6的整数。此处,(X)n可为相同核苷酸的整数n个重复,或者为其中核苷酸A、T、U和G混合的整数n数量的核苷酸序列。此外,(X)m可为相同核苷酸的整数m个重复,或者为其中核苷酸A、T、U和G混合的整数m数量的核苷酸序列。
在另一实例中,当第二互补结构域是空肠弯曲杆菌的第二互补结构域或由其衍生而来的第二互补结构域时,第二互补结构域可为5′-AAGAAAUUUAAAAAGGGACUAAAAU-3′(SEQID NO:6)或5′-AAGGGACUAAAAU-3′(SEQ ID NO:7)或者与5′-AAGAAAUUUAAAAAGGGACUAAAAU-3(SEQ ID NO:6)或5′-AAGGGACUAAAAU-3′(SEQ ID NO:7)具有部分(即至少50%以上)同源性的核苷酸序列(下划线标出与第一互补结构域形成双链的核苷酸序列)。此处,第二互补结构域可进一步包含(X)n和/或(X)m,使得其为5′-(X)n AAGAAAUUUAAAAAGGGACUAAAAU(X)m-3′(SEQ ID NO:6)或5′-(X)n AAGGGACUAAAAU(X)m-3′(SEQ ID NO:7)。X可选自于由核苷酸A、T、U和G所组成的组,其中n可为1-15的整数,且m可为1-6的整数。此处,(X)n可为相同核苷酸的整数n个重复,或者其中核苷酸A、T、U和G混合的整数n数量的核苷酸序列。此外,(X)m可为相同核苷酸的整数m个重复,或者其中核苷酸A、T、U和G混合的整数m数量的核苷酸序列。
在另一实施方式中,第二互补结构域可与如下菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分(即至少50%以上)或完全同源性:俭菌总门细菌(GWC2011_GWC2_44_17)、毛螺菌科细菌(MC2017)、Butyrivibrio proteoclasiicus、异域菌门细菌(GW2011_GWA_33_10)、氨基酸球菌属(BV3L6)、猕猴卟啉单胞菌、毛螺菌科细菌(ND2006)、狗口腔卟啉单胞菌、解糖胨普雷沃菌、Moraxella bovoculi(237)、Smiihella sp.(SC_KO8D17)、稻田钩端螺旋体、毛螺菌科细菌(MA2020)、新凶手弗朗西斯菌(U112)、CandidatusMethanoplasma termitum或挑剔真杆菌。
例如,当第二互补结构域是俭菌总门细菌的第二互补结构域或由其衍生而来的第二互补结构域时,第二互补结构域可为5′-AAAUUUCUACU-3′(SEQ ID NO:8)或与5′-AAAUUUCUACU-3′(SEO ID NO:8)具有部分(即至少50%以上)同源性的核苷酸序列(下划线标出与第一互补结构域形成双链的核苷酸序列)。此处,第二互补结构域可进一步包含(X)n和/或(X)m,使得其为5′-(X)nAAAUUUCUACU(X)m-3′(SEQ ID NO:8)。X可选自于由核苷酸A、T、U和G所组成的组;n和m各自可表示核苷酸序列数,其中n可为1-10的整数,且m可为1-6的整数。此处,(X)n可为相同核苷酸的整数n个重复,或者为其中核苷酸A、T、U和G混合的整数n数量的核苷酸序列。此外,(X)m可为相同核苷酸的整数m个重复,或者为其中核苷酸A、T、U和G混合的整数m数量的核苷酸序列。
此处,第一互补结构域和第二互补结构域可彼此互补地结合。
第一互补结构域和第二互补结构域可通过互补结合形成双链。
形成的双链可与CRISPR酶相互作用。
任选地,第一互补结构域可包含不互补结合至第二链的第二互补结构域的额外核苷酸序列。
此处,额外核苷酸序列可为1个-15个核苷酸的序列。例如,额外核苷酸序列可为1个-5个核苷酸、5个-10个核苷酸或10个-15个核苷酸的序列。
此处,近端结构域可为位于第二互补结构域的3′端方向的结构域。
近端结构域可与天然近端结构域具有同源性,或可由天然近端结构域衍生而来。此外,近端结构域可取决于天然存在的物种而在核苷酸序列中存在差异、可由天然存在的物种中含有的近端结构域衍生而来、或可与天然存在的物种中含有的近端结构域具有部分或完全同源性。
在示例性实施方式中,近端结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的近端结构域或由它们衍生而来的近端结构域具有部分(即至少50%以上)或完全同源性。
例如,当近端结构域是酿脓链球菌的近端结构域或由其衍生而来的近端结构域时,近端结构域可为5′-AAGGCUAGUCCG-3′(SEQ ID NO:9)或与5′-AAGGCUAGUCCG-3′(SEQ IDNO:9)具有部分(即至少50%以上)同源性的核苷酸序列。此处,近端结构域可进一步包含(X)n,使其为5′-AAGGCUAGUCCG(X)n-3′(SEQ ID NO:9)。X可选自于由核苷酸A、T、U和G所组成的组;并且n可表示核苷酸数,其可为1-15的整数。此处,(X)n可为相同核苷酸的整数n个重复,或者为其中核苷酸A、T、U和G混合的整数n数量的核苷酸序列。
在又一实施方式中,当近端结构域是空肠弯曲杆菌的近端结构域或由其衍生而来的近端结构域时,近端结构域可为5′-AAAGAGUUUGC-3′(SEQ ID NO:10)或与5′-AAAGAGUUUGC-3′(SEQ ID NO:10)具有至少50%以上同源性的核苷酸序列。此处,近端结构域可进一步包含(X)n,使其为5′-AAAGAGUUUGC(X)n-3′(SEQ ID NO:10)。X可选自于由核苷酸A、T、U和G所组成的组;并且n可表示核苷酸数,其为1-40的整数。此处,(X)n可为相同核苷酸的整数n个重复,或者为其中核苷酸A、T、U和G混合的整数n数量的核苷酸序列。
此处,尾部结构域为能够被选择性地添加至单链gRNA的3′端或双链gRNA的第一链或第二链的结构域。
尾部结构域可与天然尾部结构域具有同源性,或可由天然尾部结构域衍生而来。此外,尾部结构域可取决于天然存在的物种而在核苷酸序列中存在差异、可由天然存在的物种中含有的尾部结构域衍生而来、或可与天然存在的物种中含有的尾部结构域具有部分或完全同源性。
在一个示例性实施方式中,尾部结构域可与酿脓链球菌、空肠弯曲杆菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟菌的尾部结构域或由它们衍生而来的尾部结构域具有部分(即至少50%以上)或完全同源性。
例如,当尾部结构域是酿脓链球菌的尾部结构域或由其衍生而来的尾部结构域时,尾部结构域可为5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3′(SEQ ID NO:11)或与5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3′(SEQ ID NO:11)具有部分(即至少50%以上)同源性的核苷酸序列。此处,尾部结构域可进一步包含(X)n,使其为5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)n-3′(SEQ ID NO:11)。X可选自于由核苷酸A、T、U和G所组成的组;并且n可表示核苷酸数,其为1-15的整数。此处,(X)n可为相同核苷酸的整数n个重复,或者为其中核苷酸A、T、U和G混合的整数n数量的核苷酸序列。
在另一实例中,当尾部结构域是空肠弯曲杆菌的尾部结构域或由其衍生而来的尾部结构域时,尾部结构域可为5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3′(SEQ IDNO:12)或与5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3′(SEQ ID NO:12)具有部分(即至少50%以上)同源性的核苷酸序列。此处,尾部结构域可进一步包含(X)n,使其为5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(X)n-3′(SEQ ID NO:12)。X可选自于由核苷酸A、T、U和G所组成的组;并且n可表示核苷酸数,其为1-15的整数。此处,(X)n可为相同核苷酸的n个重复,或者为其中核苷酸A、T、U和G混合的整数n数量的核苷酸序列。
在另一实施方式中,尾部结构域可在3′端包含参与体外或体内转录方法的1nt-10nt的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板3′端的任意核苷酸序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可为数个尿嘧啶核苷酸或可包含可替代的核苷酸。
gRNA可包含上文所述的多个结构域,并因此可根据gRNA中含有的结构域来调整核酸序列的长度;并且由于各结构域,相互作用可出现在三维结构或者gRNA的活性形式的链中或者这些链之间。
gRNA可指单链gRNA(单个RNA分子)或者双链gRNA(包含多于一个RNA分子,通常为两个离散的RNA分子)。
双链gRNA
双链gRNA由第一链和第二链组成。
此处,第一链可由
5′-[引导结构域]-[第一互补结构域]-3′组成;以及
第二链可由
5′-[第二互补结构域]-[近端结构域]-3′或者
5′-[第二互补结构域]-[近端结构域]-[尾部结构域]-3′组成。
此处,第一链可以指crRNA,第二链可以指tracrRNA。
此处,第一链和第二链可任选地包含额外核苷酸序列。
在一个实施方式中,第一链可为
5′-(N靶标)-(Q)m-3′;或者
5′-(X)a-(N靶标)-(X)b-(Q)m-(X)c-3′。
此处,N靶标是与靶基因或核酸的双链的任一条链的部分序列互补的核苷酸序列,并且N靶标是可根据靶基因或核酸上的靶序列进行改变的核苷酸序列区域。
此处,(Q)m是包含第一互补结构域的核苷酸序列。其包含能够与第二链的第二互补结构域形成互补结合的核酸序列。(Q)m可为与天然存在的物种的第一互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第一互补结构域的核苷酸序列进行改变。Q可各自独立地选自于由A、U、C和G所组成的组;并且m可为核苷酸序列数,其为5-35的整数。
例如,当第一互补结构域与酿脓链球菌的第一互补结构域或由酿脓链球菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5′-GUUUUAGAGCUA-3′(SEQ IDNO:1)或与5′-GUUUUAGAGCUA-3′(SEQ ID NO:1)具有至少50%以上同源性的核苷酸序列。
在另一实例中,当第一互补结构域与空肠弯曲杆菌的第一互补结构域或由空肠弯曲杆菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5′-GUUUUAGUCCCUUUUUAAAUUUCUU-3′(SEQ ID NO:2)或5′-GUUUUAGUCCCUU-3′(SEQ ID NO:3)或者与5′-GUUUUAGUCCCUUUUUAAAUUUCUU-3′(SEQ ID NO:2)或5′-GUUUUAGUCCCUU-3′(SEQ IDNO:3)具有至少50%以上同源性的核苷酸序列。
在又一实例中,当第一互补结构域与嗜热链球菌的第一互补结构域或由嗜热链球菌衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5′-GUUUUAGAGCUGUGUUGUUUCG-3′(SEQ ID NO:13)或与5′-GUUUUAGAGCUGUGUUGUUUCG-3′(SEQID NO:13)具有至少50%以上同源性的核苷酸序列。
此外,(X)a、(X)b和(X)c各自选择性地为额外核苷酸序列,其中X可各自独立地选自于由A、U、C和G所组成的组;并且a、b和c各自可为核苷酸序列数,其为0或1-20的整数。
在一个示例性实施方式中,第二链可为5′-(Z)h-(P)k-3′;或者5′-(X)d-(Z)h-(X)e-(P)k-(X)f-3′。
在另一实施方式中,第二链可为5′-(Z)h-(P)k-(F)i-3′;或者5′-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3′。
此处,(Z)h是包含第二互补结构域的核苷酸序列。其包含能够与第一链的第一互补结构域形成互补结合的核苷酸序列。(Z)h可为与天然存在的物种的第二互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第二互补结构域的核苷酸序列进行修饰。Z可各自独立地选自于由A、U、C和G所组成的组;并h可为核苷酸序列数,其可为5-50的整数。
例如,当第二互补结构域与酿脓链球菌的第二互补结构域或由酿脓链球菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5′-UAGCAAGUUAAAAU-3′(SEQ IDNO:5)或与5′-UAGCAAGUUAAAAU-3′(SEQ ID NO:5)具有至少50%以上同源性的核苷酸序列。
在另一实例中,当第二互补结构域与空肠弯曲杆菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5′-AAGAAAUUUAAAAAGGGACUAAAAU-3′(SEQ ID NO:6)或5′-AAGGGACUAAAAU-3′(SEQ ID NO:7)或者与5′-AAGAAAUUUAAAAAGGGACUAAAAU-3′(SEQ ID NO:6)或5′-AAGGGACUAAAAU-3′(SEQ IDNO:7)具有至少50%以上同源性的核苷酸序列。
在又一实例中,当第二互补结构域与嗜热链球菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5′-CGAAACAACACAGCGAGUUAAAAU-3′(SEQ ID NO:14)或与5′-CGAAACAACACAGCGAGUUAAAAU-3′(SEQ ID NO:14)具有至少50%以上同源性的核苷酸序列。
(P)k是包含近端结构域的核苷酸序列。其可为与天然存在的物种的近端结构域具有部分或完全同源性的序列;根据来源的物种,可对近端结构域的核苷酸序列进行修饰。P可各自独立地选自于由A、U、C和G所组成的组;并且k可为核苷酸序列数,其为1-20的整数。
例如,当近端结构域与酿脓链球菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5′-AAGGCUAGUCCG-3′(SEQ ID NO:9)或与5′-AAGGCUAGUCCG-3′(SEQ ID NO:9)具有至少50%以上同源性的碱基序列。
在另一实例中,当近端结构域与空肠弯曲杆菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5′-AAAGAGUUUGC-3′(SEQ ID NO:10)或与5′-AAAGAGUUUGC-3′(SEQ ID NO:10)具有至少50%以上同源性的核苷酸序列。
在又一实例中,当近端结构域与嗜热链球菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5′-AAGGCUUAGUCCG-3′(SEQ ID NO:15)或与5′-AAGGCUUAGUCCG-3′(SEQ ID NO:15)具有至少50%以上同源性的核苷酸序列。
(F)i可为包含尾部结构域的核苷酸序列。其可为与天然存在的物种的尾部结构域具有部分或完全同源性的序列;根据来源的物种,可对尾部结构域的核苷酸序列进行修饰。F可各自独立地选自于由A、U、C和G所组成的组;并且i可为核苷酸序列数,其为1-50的整数。
例如,当尾部结构域与酿脓链球菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3′(SEQ IDNO:11)或与5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3′(SEQ ID NO:11)具有至少50%以上同源性的核苷酸序列。
在另一实例中,当尾部结构域与空肠弯曲杆菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3′(SEQ ID NO:12)或与5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3′(SEQ IDNO:12)具有至少50%以上同源性的核苷酸序列。
在又一实施方式中,当尾部结构域与嗜热链球菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5′-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3′(SEQ ID NO:16)或与5′-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3′(SEQID NO:16)具有至少50%以上同源性的核苷酸序列。
此外,(F)i可在3′端包含参与体外或体内转录方法的1-10个核苷酸的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板3′端的任意核苷酸序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可为数个尿嘧啶核苷酸或可包含可替代的核苷酸。
此外,(X)d、(X)e和(X)f可为选择性地添加的核苷酸序列,其中X可各自独立地选自于由A、U、C和G所组成的组;并且d、e和f各自可为核苷酸数,其为0或1-20的整数。
单链gRNA
单链gRNA可分为第一单链gRNA和第二单链gRNA。
第一单链gRNA
第一单链gRNA为其中通过接头结构域使得双链gRNA的第一链和第二链连接的单链gRNA。
具体而言,单链gRNA可由如下组成:
5′-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-3′,
5′-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-3′,或
5′-[引导结构域]-[第一互补结构域]-[接头结构域]-[第二互补结构域]-[近端结构域]-[尾部结构域]-3′。
第一单链gRNA可选择性地包含额外核苷酸序列。
在一个示例性实施方式中,第一单链gRNA可为
5′-(N靶标)-(Q)m-(L)j-(Z)h-3′;
5′-(N靶标)-(Q)m-(L)j-(Z)h-(P)k-3′;或者
5′-(N靶标)-(Q)m-(L)j-(Z)h-(P)k-(F)i-3′。
在另一实施方式中,第一单链gRNA可为
5′-(X)a-(N靶标)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-3′;
5′-(X)a-(N靶标)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-3′;或者
5′-(X)a-(N靶标)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3′。
此处,N靶标是与靶基因或核酸的双链的任一条链的部分序列互补的核苷酸序列,并且N靶标是能够根据靶基因或核酸上的靶序列进行改变的核苷酸序列区域。
(Q)m含有包含第一互补结构域的核苷酸序列。其包含能够与第二互补结构域形成互补结合的核苷酸序列。(Q)m可为与天然存在的物种的第一互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第一互补结构域的核苷酸序列进行改变。Q可各自独立地选自于由A、U、C和G所组成的组;并且m可为核苷酸序列数,其为5-35的整数。
例如,当第一互补结构域与酿脓链球菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5′-GUUUUAGAGCUA-3′(SEQ ID NO:1)或与5′-GUUUUAGAGCUA-3′(SEQ ID NO:1)具有至少50%以上同源性的核苷酸序列。
在另一实例中,当第一互补结构域与空肠弯曲杆菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5′-GUUUUAGUCCCUUUUUAAAUUUCUU-3′(SEQ ID NO:2)或5′-GUUUUAGUCCCUU-3′(SEQ ID NO:3)或者与5′-GUUUUAGUCCCUUUUUAAAUUUCUU-3′(SEQ ID NO:2)或5′-GUUUUAGUCCCUU-3′(SEQ IDNO:3)具有至少50%以上同源性的核苷酸序列。
在又一实例中,当第一互补结构域与嗜热链球菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5′-GUUUUAGAGCUGUGUUGUUUCG-3′(SEQ ID NO:13)或与5′-GUUUUAGAGCUGUGUUGUUUCG-3′(SEQ ID NO:13)具有至少50%以上同源性的核苷酸序列。
此外,(L)j是包含接头结构域的核苷酸序列,并且它连接第一互补结构域和第二互补结构域,由此产生单链gRNA。此处,L可各自独立地选自于由A、U、C和G所组成的组;并且j可为核苷酸序列数,其为1-30的整数。
(Z)h是包含第二互补结构域的核苷酸序列,并且包含能够与第一互补结构域互补结合的核苷酸序列。(Z)h可为与天然存在的物种的第二互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第二互补结构域的核苷酸序列进行改变。Z可各自独立地选自于由A、U、C和G所组成的组;并且h为核苷酸序列数,其可为5-50的整数。
例如,当第二互补结构域与酿脓链球菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5′-UAGCAAGUUAAAAU-3′(SEQ ID NO:5)或与5′-UAGCAAGUUAAAAU-3′(SEQ ID NO:5)具有至少50%以上同源性的核苷酸序列。
在另一实例中,当第二互补结构域与空肠弯曲杆菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5′-AAGAAAUUUAAAAAGGGACUAAAAU-3′(SEQ ID NO:6)或5′-AAGGGACUAAAAU-3′(SEQ ID NO:7)或者与5′-AAGAAAUUUAAAAAGGGACUAAAAU-3′(SEQ ID NO:6)或5′-AAGGGACUAAAAU-3′(SEQ IDNO:7)具有至少50%以上同源性的核苷酸序列。
在又一实例中,当第二互补结构域与嗜热链球菌的第二互补结构域或由其衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5′-CGAAACAACACAGCGAGUUAAAAU-3′(SEQ ID NO:14)或与5′-CGAAACAACACAGCGAGUUAAAAU-3′(SEQ ID NO:14)具有至少50%以上同源性的核苷酸序列。
(P)k是包含近端结构域的核苷酸序列。其可为与天然存在的物种的近端结构域具有部分或完全同源性的序列;根据来源的物种,可对近端结构域的核苷酸序列进行修饰。P可各自独立地选自于由A、U、C和G所组成的组;并且k可为核苷酸序列数,其为1-20的整数。
例如,当近端结构域与酿脓链球菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5′-AAGGCUAGUCCG-3′(SEQ ID NO:9)或与5′-AAGGCUAGUCCG-3′(SEQ ID NO:9)具有至少50%以上同源性的核苷酸序列。
在另一实例中,当近端结构域与空肠弯曲杆菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5′-AAAGAGUUUGC-3′(SEQ ID NO:10)或与5′-AAAGAGUUUGC-3′(SEQ ID NO:10)具有至少50%以上同源性的核苷酸序列。
在又一实例中,当近端结构域与嗜热链球菌的近端结构域或由其衍生而来的近端结构域具有部分或完全同源性时,(P)k可为5′-AAGGCUUAGUCCG-3′(SEQ ID NO:15)或与5′-AAGGCUUAGUCCG-3′(SEQ ID NO:15)具有至少50%以上同源性的核苷酸序列。
(F)i可以是包含尾部结构域的核苷酸序列,并且与天然存在的物种的尾部结构域具有部分或完全同源性;根据来源的物种,可对尾部结构域的核苷酸序列进行修饰。F可各自独立地选自于由A、U、C和G所组成的组;并且i可为核苷酸序列数,其为1-50的整数。
例如,当尾部结构域与酿脓链球菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3′(SEQ IDNO:11)或与5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3′(SEQ ID NO:11)具有至少50%以上同源性的核苷酸序列。
在另一实例中,当尾部结构域与空肠弯曲杆菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3′(SEQ ID NO:12)或与5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3′(SEQ IDNO:12)具有至少50%以上同源性的核苷酸序列。
在又一实例中,当尾部结构域与嗜热链球菌的尾部结构域或由其衍生而来的尾部结构域具有部分或完全同源性时,(F)i可为5′-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3′(SEQ ID NO:16)或与5′-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3′(SEQ IDNO:16)具有至少50%以上同源性的核苷酸序列。
此外,(F)i可在3′端包含参与体外或体内转录方法的1-10个核苷酸的序列。
例如,当将T7启动子用于gRNA的体外转录时,尾部结构域可为存在于DNA模板3′端的任意核苷酸序列。此外,当将U6启动子用于体内转录时,尾部结构域可为UUUUUU;当将H1启动子用于转录时,尾部结构域可为UUUU;并且当使用pol-III启动子时,尾部结构域可为数个尿嘧啶核苷酸或可包含可替代的核苷酸。
此外,(X)a、(X)b、(X)c、(X)d、(X)e和(X)f可为选择性地添加的核苷酸序列,其中X可各自独立地选自于由A、U、C和G所组成的组;并且a、b、c、d、e和f各自可为核苷酸序列数,其为0或1-20的整数。
第二单链gRNA
第二单链gRNA可为由引导结构域、第一互补结构域和第二互补结构域组成的单链gRNA。
此处,第二单链gRNA可由如下组成:
5′-[第二互补结构域]-[第一互补结构域]-[引导结构域]-3′;或者
5′-[第二互补结构域]-[接头结构域]-[第一互补结构域]-[引导结构域]-3′。
第二单链gRNA可任选地包含额外核苷酸序列。
在一个示例性实施方式中,第二单链gRNA可为
5′-(Z)h-(Q)m-(N靶标)-3′;或者
5′-(X)a-(Z)h-(X)b-(Q)m-(X)c-(N靶标)-3′。
在另一实施方式中,单链gRNA可为
5′-(Z)h-(L)j-(Q)m-(N靶标)-3′;或者
5′-(X)a-(Z)h-(L)j-(Q)m-(X)c-(N靶标)-3′。
此处,N靶标是与靶基因或核酸的双链的任一条链的部分序列互补的核苷酸序列,并且N靶标是能够根据靶基因或核酸上的靶序列进行改变的核苷酸序列区域。
(Q)m是包含第一互补结构域的核苷酸序列,并且包含能够与第二互补结构域互补结合的核苷酸序列。(Q)m可为与天然存在的物种的第一互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第一互补结构域的核苷酸序列进行改变。Q可各自独立地选自于由A、U、C和G所组成的组;并且m可为核苷酸序列数,其为5-35的整数。
例如,当第一互补结构域与俭菌总门细菌的第一互补结构域或由其衍生而来的第一互补结构域具有部分或完全同源性时,(Q)m可为5′-UUUGUAGAU-3′(SEQ ID NO:4)或与5′-UUUGUAGAU-3′(SEQ ID NO:4)具有至少50%以上同源性的核苷酸序列。
(Z)h是包含第一互补结构域的核苷酸序列,并且包含能够与第二互补结构域互补结合的核苷酸序列。(Z)h可为与天然存在的物种的第二互补结构域具有部分或完全同源性的序列;根据来源的物种,可对第二互补结构域的核苷酸序列进行修饰。Z可各自独立地选自于由A、U、C和G所组成的组;并且h可为核苷酸序列数,其为5-50的整数。
例如,当第二互补结构域与俭菌总门细菌的第二互补结构域或由俭菌总门细菌衍生而来的第二互补结构域具有部分或完全同源性时,(Z)h可为5′-AAAUUUCUACU-3′(SEQ IDNO:8)或与5′-AAAUUUCUACU-3′(SEQ ID NO:8)具有至少50%以上同源性的核苷酸序列。
此外,(L)j是包含接头结构域的核苷酸序列。其为连接第一互补结构域和第二互补结构域的核苷酸序列。此处,L可各自独立地选自于由A、U、C和G所组成的组;并且j可为核苷酸序列数,其为1-30的整数。
此外,(X)a、(X)b和(X)c各自可为选择性地添加的核苷酸,其中X可各自独立地选自于由A、U、C和G所组成的组;并且a、b和c可为核苷酸数,其为0或1-20的整数。
在本说明书的公开内容的一个方面,引导核酸可为能够与凝血抑制基因的靶序列互补结合的gRNA。
术语“凝血抑制基因”是指直接参与抑制凝血或血凝块形成或使凝血系统失活、或具有抑制凝血或血凝块形成或使凝血系统失活的间接作用的所有类型的基因。在这种情况下,由于凝血抑制基因本身或由该凝血抑制基因表达的蛋白质,凝血抑制基因可发挥功能以抑制或阻抑与凝血系统有关的各种基因或各种蛋白质的活性,并发挥功能以直接抑制凝血。术语“凝血系统”是指在体内发生的凝血的整个过程。在这种情况下,凝血系统包括所有类型的正常凝血系统和凝血被延迟的异常凝血系统。由凝血抑制基因表达的蛋白质可以与术语“凝血抑制因子”或“抗凝因子”互换使用。
凝血抑制基因可抑制或阻抑凝血。
凝血抑制基因可抑制或阻抑凝血相关蛋白的表达。
凝血抑制基因可抑制或阻抑凝血相关蛋白的活性。
在这种情况下,凝血相关蛋白可包括因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白或组织因子。
凝血抑制基因可为抗凝血酶(AT)基因。
AT基因是指编码由432个氨基酸组成、可使凝血系统中的各种酶失活的蛋白质的基因,也被称为SERPINC1基因。作为一个实例,AT基因可以包括选自于由以下所组成的组中的一种或多种,但是本发明不限于此:编码人AT(例如NCBI登录号NP_000479等)的基因,例如由NCBI登录号NM_000488等表示的AT基因。
凝血抑制基因可为组织因子途径抑制剂(TFPI)基因。
TFPI基因是指编码能够可逆地抑制因子Xa的蛋白质的基因(全长DNA、cDNA或mRNA)。对于人类而言,TFPI基因位于染色体2q31-q32.1上,并具有9个外显子。作为一个实例,TFPI基因可包括选自以下所组成的组中的一种或多种,但本发明不限于此:编码人TFPI(例如,NCBI登录号NP_001027452、NP_001305870、NP_001316168、NP_001316169、NP_001316170等)的基因,例如由NCBI登录号NM_001032281、NM_006287、NM_001318941、NM_001329239、NM_001329240等表示的TFPI基因。
凝血抑制基因可由哺乳动物衍生而来,所述哺乳动物包括灵长类动物(如人、猴等)、啮齿动物(如大鼠、小鼠等)。
遗传信息可以从诸如NCBI(美国国家生物技术信息中心)的GenBank的已知数据库获得。
在本说明书中的公开内容的一个实施方式中,引导核酸可为靶向AT基因和/或TFP1基因的靶序列的gRNA。
“靶序列”是靶基因或核酸中存在的核苷酸序列,并且具体而言,是靶基因或核酸中的靶区域的部分核苷酸序列;并且此处,“靶区域”是靶基因或核酸中可被引导核酸-编辑蛋白修饰的区域。
在下文中,靶序列可用于指两种类型的核苷酸序列信息。例如,在靶基因的情况下,靶序列可指靶基因DNA的转录链的核苷酸序列信息,或非转录链的核苷酸序列信息。
例如,靶序列可指靶基因A的靶区域中的部分核苷酸序列(转录链),即5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17),或者与其互补的核苷酸序列(非转录链),即5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18)。
靶序列可为5nt-50nt的序列。
在一个示例性实施方式中,靶序列可为16nt的序列、17nt的序列、18nt的序列、19nt的序列、20nt的序列、21nt的序列、22nt的序列、23nt的序列、24nt的序列或25nt的序列。
靶序列包含引导核酸结合序列或引导核酸非结合序列。
“引导核酸结合序列”是与包含在引导核酸的引导结构域中的引导序列具有部分或完全互补性的核苷酸序列,并且可与包含在引导核酸的引导结构域中的引导序列互补结合。靶序列和引导核酸结合序列为可根据靶基因或核酸(即,待遗传操纵或编辑的对象)而改变的核苷酸序列,并且可根据靶基因或核酸进行多种设计。
“引导核酸非结合序列”是与包含在引导核酸的引导结构域中的引导序列具有部分或完全同源性的核苷酸序列,并且可不与包含在引导核酸的引导结构域中的引导序列互补结合。此外,引导核酸非结合序列可为与引导核酸结合序列具有互补性的核苷酸序列,并且可与引导核酸结合序列互补结合。
引导核酸结合序列可为靶序列的部分核苷酸序列,并且靶序列为具有彼此不同的序列顺序的两个核苷酸序列中的一个核苷酸序列,即引导核酸结合序列可为能够彼此互补结合的两个核苷酸序列之一。此处,引导核酸非结合序列可为与靶序列的引导核酸结合序列不同的核苷酸序列。
例如,在靶基因A的靶区域中,当将靶序列设计为部分核苷酸序列,即5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17),以及其互补的核苷酸序列,即5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18),引导核酸结合序列可为两个靶序列之一,即5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17)或5′-CGAACTAGTCTGCCAATGAT-3′(SEQ IDNO:18)。此处,当引导核酸结合序列为5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17)时,引导核酸非结合序列可为5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18);或当引导核酸结合序列为5′-CGAACTAGTCTGCCAATGAT-3′(SEQ ID NO:18)时,引导核酸非结合序列可为5′-ATCATTGGCAGACTAGTTCG-3′(SEQ ID NO:17)。
引导核酸结合序列可为靶序列之一,即与转录链相同的核苷酸序列以及与非转录链相同的核苷酸序列。此处,引导核酸非结合序列可为与靶序列的引导核酸结合序列不同的核苷酸序列。它可为不同于与转录链或非转录链相同的核苷酸序列的核苷酸序列
引导核酸结合序列可具有与靶序列相同的长度。
引导核酸非结合序列可具有与靶序列或引导核酸结合序列相同的长度。
引导核酸结合序列可为5nt-50nt的序列。
在一个示例性实施方式中,引导核酸结合序列可为16nt的序列、17nt的序列、18nt的序列、19nt的序列、20nt的序列、21nt的序列、22nt的序列、23nt的序列、24nt的序列或25nt的序列。
引导核酸非结合序列可为5nt-50nt的序列。
在一个示例性实施方式中,引导核酸非结合序列可为16nt的序列、17nt的序列、18nt的序列、19nt的序列、20nt的序列、21nt的序列、22nt的序列、23nt的序列、24nt的序列或25nt的序列。
引导核酸结合序列可部分或完全互补结合至引导核酸的引导结构域中包含的引导序列,并且引导核酸结合序列的长度可与引导序列的长度相同。
引导核酸结合序列可为与引导核酸的引导结构域中包含的引导序列互补的核苷酸序列,并且例如具有至少70%、75%、80%、85%、90%、95%或更高的互补性或完全互补性的核苷酸序列。
作为实例,引导核酸结合序列可具有或包含不与引导核酸的引导结构域中包含的引导序列互补的1nt-8nt的序列。
引导核酸非结合序列可与引导核酸的引导结构域中包含的引导序列具有部分或完全同源性,并且引导核酸非结合序列的长度可与引导序列的长度相同。
引导核酸非结合序列可为与引导核酸的引导结构域中包含的引导序列具有同源性的核苷酸序列,并且例如具有至少70%、75%、80%、85%、90%、95%或更高的同源性或完全同源性的核苷酸序列。
在一个实例中,引导核酸非结合序列可具有或包含不与引导核酸的引导结构域中包含的引导序列同源的1nt-8nt的序列。
引导核酸非结合序列可与引导核酸结合序列互补结合,并且引导核酸非结合序列可具有与引导核酸结合序列相同的长度。
引导核酸非结合序列可为与引导核酸结合序列互补的核苷酸序列,并且例如具有至少90%、95%或更高的互补性或完全互补性的核苷酸序列。
在一个实例中,引导核酸非结合序列可具有或包含不与引导核酸结合序列互补的1nt-2nt的序列。
此外,引导核酸结合序列可为位于被编辑蛋白识别的核苷酸序列附近的核苷酸序列。
在一个实例中,引导核酸结合序列可为临近被编辑蛋白识别的核苷酸序列的5′端和/或3′端定位的连续的5nt-50nt的序列。
此外,引导核酸非结合序列可为位于被编辑蛋白识别的核苷酸序列附近的核苷酸序列。
在一个实例中,引导核酸非结合序列可为临近被编辑蛋白识别的核苷酸序列的5′端和/或3′端定位的5nt-50nt的连续序列。
“靶向”指与靶基因或核酸中存在的靶序列的引导核酸结合序列互补结合。此处,互补结合可为100%完全互补结合,或70%以上且小于100%的不完全互补结合。因此,“靶向gRNA”是指与靶基因或核酸中存在的靶序列的引导核酸结合序列互补结合的gRNA。
本说明书中公开的靶基因可为凝血抑制基因。
本说明书中公开的靶基因可为AT基因和/或TFPI基因。
在一个实施方式中,本说明书中公开的靶序列可为位于凝血抑制基因的启动子区域中的10nt-35nt的连续序列。
此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。
或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。
在一个实例中,靶序列可为位于AT基因的启动子区域中的10nt-25nt的连续序列。
在另一实例中,靶序列可为位于TFPI基因的启动子区域中的10个-25个连续的核苷酸序列。
本说明书中公开的靶序列可为位于凝血抑制基因的内含子区域中的10nt-35nt的连续序列。
此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。
或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。
在一个实例中,靶序列可为位于AT基因的内含子区域中的10nt-25nt的连续序列。
在另一实例中,靶序列可为位于TFPI基因的内含子区域中的10nt-25nt的连续序列。
本说明书中公开的靶序列可为位于凝血抑制基因的外显子区域中的10nt-35nt的连续序列。
此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。
或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。
在一个实例中,靶序列可为位于AT基因的外显子区域中的10nt-25nt的连续序列。
在另一实例中,靶序列可为位于TFPI基因的外显子区域中的10nt-25nt的连续序列。
本说明书中公开的靶序列可为位于凝血抑制基因的增强子区域中的10nt-35nt的连续序列。
此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。
或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。
在一个实例中,靶序列可为位于AT基因的增强子区域中的10nt-25nt的连续序列。
在另一实例中,靶序列可为位于TFPI基因的增强子区域中的10nt-25nt的连续序列。
本说明书中公开的靶序列可为位于凝血抑制基因的编码区、非编码区或混合区中的10nt-35nt的连续序列。
此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。
或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。
在一个实例中,靶序列可为位于AT基因的编码区、非编码区或混合区中的10nt-25nt的连续序列。
在另一实例中,靶序列可为位于TFPI基因的编码区、非编码区或混合区中的10nt-25nt的连续序列。
本说明书中公开的靶序列可为位于凝血抑制基因的启动子、增强子、3’UTR、多聚A区或混合区中的10nt-35nt的连续序列。
此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。
或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。
在一个实例中,靶序列可为位于AT基因的启动子、增强子、3’UTR、多聚A区或混合区中的10nt-25nt的连续序列。
在另一实例中,靶序列可为位于TFPI基因的启动子、增强子、3’UTR,多聚A区或混合区中的10nt-25nt的连续序列。
本说明书中公开的靶序列可为位于凝血抑制基因的外显子、内含子或混合区中的10nt-35nt的连续序列。
此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。
或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。
在一个实例中,靶序列可为位于AT基因的外显子、内含子或混合区中的10nt-25-nt的连续序列。
在另一实例中,靶序列可为位于TFPI基因的外显子、内含子或混合区中的10nt-25nt的连续序列。
本说明书中公开的靶序列可为包含或临近凝血抑制基因的突变部分(例如,不同于野生型基因的部分)的10nt-35nt的连续序列。
此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。
或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。
在一个实例中,靶序列可为包含或临近AT基因的突变部分(例如,不同于野生型基因的部分)的10nt-25nt的连续序列。
在另一实例中,靶序列可为包含或临近TFPI基因的突变部分(例如,不同于野生型基因的部分)的10nt-25nt的连续序列。
在本说明书中公开的靶序列可为临近凝血抑制基因的核酸序列中的前间区序列邻近基序(PAM)序列的5′端和/或3′端的10nt-35nt的连续序列。
“前间区序列邻近基序(PAM)序列”是可被编辑蛋白识别的核苷酸序列。此处,根据编辑蛋白的类型和编辑蛋白来源物种,PAM序列可具有不同的核苷酸序列。
此处,PAM序列可为例如如下序列中的一种或多种(以5′至3′方向来描述):
NGG(N为A、T、C或G);
NNNNRYAC(N各自独立地为A、T、C或G;R为A或G;并且Y为C或T);
NNAGAAW(N各自独立地为A、T、C或G;并且W为A或T);
NNNNGATT(N各自独立地为A、T、C或G);
NNGRR(T)(N各自独立地为A、T、C或G;并且R为A或G);以及
TTN(N为A、T、C或G)。
此处,靶序列可为10nt-35nt的序列、15nt-35nt的序列、20nt-35nt的序列、25nt-35nt的序列或30nt-35nt的序列。
或者,靶序列可为10nt-15nt的序列、15nt-20nt的序列、20nt-25nt的序列、25nt-30nt的序列或30nt-35nt的序列。
在一个实例中,靶序列可为临近AT基因的核酸序列中的PAM序列的5′端和/或3′端的10nt-25nt的连续序列。
在一个实施方式中,当编辑蛋白识别的PAM序列为5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)序列的5′端或/和3′端的10nt-25nt的连续序列。
在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在一个实施方式中,当编辑蛋白识别的PAM序列为5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在一个实施方式中,当编辑蛋白识别的PAM序列为5′-TTN-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近AT基因的核酸序列中的5′-TTN-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在另一实例中,靶序列可为临近TFPI基因的核酸序列中的PAM序列的5′端和/或3′端的10nt-25nt的连续序列。
在一个实施方式中,当编辑蛋白识别的PAM序列为5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)序列的5′端或/和3′端的10nt-25nt的连续序列。
在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在一个实施方式中,当编辑蛋白识别的PAM序列为5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在另一实施方式中,当编辑蛋白识别的PAM序列为5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
在一个实施方式中,当编辑蛋白识别的PAM序列为5′-TTN-3′(N=A、T、G或C;或A、U、G或C)时,靶序列可为临近TFPI基因的核酸序列中的5′-TTN-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列。
下文中,表1和表2中列出了可用于本说明书中公开的示例性实施方式中的靶序列的实例。表1和表2中公开的靶序列为引导核酸非结合序列及其互补序列,即可从表中列出的序列预测引导核酸结合序列。此外,表1和表2中示出的靶标名称根据编辑蛋白命名,对于SpCas9命名为Sp,对于SaCas9命名为Sa,对于CjCas9命名为Cj。
表1 SERPINC1基因(AT基因)的靶序列
Figure BDA0002994148170000461
Figure BDA0002994148170000471
Figure BDA0002994148170000481
Figure BDA0002994148170000491
Figure BDA0002994148170000501
Figure BDA0002994148170000511
Figure BDA0002994148170000521
Figure BDA0002994148170000531
Figure BDA0002994148170000541
Figure BDA0002994148170000551
Figure BDA0002994148170000561
Figure BDA0002994148170000571
Figure BDA0002994148170000581
Figure BDA0002994148170000591
Figure BDA0002994148170000601
Figure BDA0002994148170000611
表2 TFPI基因的靶序列
Figure BDA0002994148170000621
Figure BDA0002994148170000631
Figure BDA0002994148170000641
Figure BDA0002994148170000651
Figure BDA0002994148170000661
Figure BDA0002994148170000671
Figure BDA0002994148170000681
Figure BDA0002994148170000691
Figure BDA0002994148170000701
作为本说明书中的公开内容的一个实施方式,引导核酸可为包含与AT基因和/或TFPI基因的靶序列互补结合的引导序列的gRNA。
“引导序列”是与靶基因或核酸的双链的任一链的部分序列互补的核苷酸序列。此处,引导序列可为具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的互补性或完全互补性的核苷酸序列。
引导序列可以是10个至25个核苷酸的序列。
在一个实例中,引导序列可为10个至25个、15个至25个、或20个至25个核苷酸的序列。
在另一实例中,引导序列可为10个至15个、15个至20个、或20个至25个核苷酸的序列。
本说明书中公开的靶基因可为凝血抑制基因。
本说明书中公开的靶基因可为AT基因(SERPINC1基因)和/或TFPI基因。
引导序列能够与靶序列形成互补结合。
靶序列可为引导核酸结合序列。
“引导核酸结合序列”是与包含在引导核酸的引导结构域中的引导序列具有互补性的核苷酸序列,并且可与包含在引导核酸的引导结构域中的引导序列互补结合。靶序列和引导核酸结合序列为可根据靶基因或核酸(即,待遗传操纵或编辑的对象)而改变的核苷酸序列,并且可根据靶基因或核酸以各种方式进行设计。
与靶序列和引导核酸结合序列有关的描述与上述相同。
引导核酸结合序列可具有与引导序列相同的长度。
引导核酸结合序列可具有比引导序列更短的长度。
引导核酸结合序列可具有比引导序列更长的长度。
引导序列可为与引导核酸结合序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更高的互补性或完全互补性的核苷酸序列。
在一个实例中,引导序列可具有或包含与引导核酸结合序列不互补的1个至8个核苷酸的序列。
在一个实施方式中,本说明书中公开的引导序列可以与位于凝血抑制基因的启动子区域中的10nt-35nt的连续序列形成互补结合。
在一个实例中,引导序列可与位于AT基因的启动子区域中的10nt-25nt的连续序列形成互补结合。
在另一实例中,引导序列可与位于TFPI基因的启动子区域中的10nt-25nt的连续序列形成互补结合。
本说明书中公开的引导序列可与位于凝血抑制基因的内含子区域中的10nt-35nt的连续序列形成互补结合。
在一个实例中,引导序列可与位于AT基因的内含子区域中的10nt-25nt的连续序列形成互补结合。
在另一实例中,引导序列可与位于TFPI基因的内含子区域中的10nt-25nt的连续序列形成互补结合。
本说明书中公开的引导序列可与位于凝血抑制基因的外显子区域中的10nt-35nt的连续序列形成互补结合。
在一个实例中,引导序列可与位于AT基因的外显子区域中的10nt-25nt的连续序列形成互补结合。
在另一实例中,引导序列可与位于TFPI基因的外显子区域中的10nt-25nt的连续序列形成互补结合。
本说明书中公开的引导序列可与位于凝血抑制基因的增强子区域中的10nt-35nt的连续序列形成互补结合。
在一个实例中,引导序列可与位于AT基因的增强子区域中的10nt-25nt的连续序列形成互补结合。
在另一实例中,引导序列可与位于TFPI基因的增强子区域中的10nt-25nt的连续序列形成互补结合。
本说明书中公开的引导序列可与位于凝血抑制基因的编码区、非编码区或混合区中的10nt-35nt的连续序列形成互补结合。
在一个实例中,引导序列可与位于AT基因的编码区、非编码区或混合区中的10nt-25nt的连续序列形成互补结合。
在另一实例中,引导序列可与位于TFPI基因的编码区、非编码区或混合区中的10nt-25nt的连续序列形成互补结合。
本说明书中公开的引导序列可与位于凝血抑制基因的启动子、增强子、3’UTR、多聚A区或混合区中的10nt-35nt的连续序列形成互补结合。
在一个实例中,引导序列可以与位于AT基因的启动子、增强子、3’UTR、多聚A区或混合区中的10nt-25nt的连续序列形成互补结合。
在另一实例中,引导序列可以与位于TFPI基因的启动子、增强子、3’UTR、多聚A区或混合区中的10nt-25nt的连续序列形成互补结合。
本说明书中公开的引导序列可以与位于凝血抑制基因的外显子、内含子或混合区中的10nt-35nt的连续序列形成互补结合。
在一个实例中,引导序列可与位于AT基因的外显子、内含子或混合区中的10nt-25nt的连续序列形成互补结合。
在另一实例中,引导序列可以与位于TFPI基因的外显子、内含子或混合区中的10nt-25nt的连续序列形成互补结合。
本说明书中公开的引导序列可与包含或临近凝血抑制基因的突变部分(例如,不同于野生型基因的部分)的10nt-35nt的连续序列形成互补结合。
在一个实例中,引导序列可与包含或临近AT基因的突变部分(例如,不同于野生型基因的部分)的10nt-25nt的连续序列形成互补结合。
在另一实例中,引导序列可与包含或临近TFPI基因的突变部分(例如,不同于野生型基因的部分)的10nt-25nt的连续序列形成互补结合。
在本说明书中公开的引导序列可与临近凝血抑制基因的核酸序列中的前间区序列邻近基序(PAM)序列的5′端和/或3′端的10nt-35nt的连续序列形成互补结合。
“前间区序列邻近基序(PAM)序列”是可被编辑蛋白识别的核苷酸序列。此处,根据编辑蛋白的类型和编辑蛋白来源物种,PAM序列可具有不同的核苷酸序列。
此处,PAM序列可为例如如下序列中的一种或多种(以5′至3′方向描述):
NGG(N为A、T、C或G);
NNNNRYAC(N各自独立地为A、T、C或G;R为A或G;并且Y为C或T);
NNAGAAW(N各自独立地为A、T、C或G;并且W为A或T);
NNNNGATT(N各自独立地为A、T、C或G);
NNGRR(T)(N各自独立地为A、T、C或G;并且R为A或G);以及
TTN(N为A、T、C或G)。
在一个实例中,引导序列可与临近AT基因的核酸序列中的前间区序列邻近基序(PAM)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)序列的5′端或/和3′端的10nt-25nt的连续序列形成互补结合。
在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-TTN-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近AT基因的核酸序列中的5′-TTN-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在另一实例中,引导序列可与临近TFPI基因的核酸序列中的前间区序列邻近基序(PAM)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NGG-3′、5′-NAG-3′和/或5′-NGA-3′(N=A、T、G或C;或A、U、G或C)序列的5′端或/和3′端的10nt-25nt的连续序列形成互补结合。
在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NGGNG-3′和/或5′-NNAGAAW-3′(W=A或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NNNNGATT-3′和/或5′-NNNGCTT-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NNNVRYAC-3′(V=G、C或A;R=A或G;Y=C或T;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NAAR-3′(R=A或G;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在另一示例性实施方式中,当编辑蛋白识别的PAM序列为5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-NNGRR-3′、5′-NNGRRT-3′和/或5′-NNGRRV-3′(R=A或G;V=G、C或A;N=A、T、G或C,或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
在一个示例性实施方式中,当编辑蛋白识别的PAM序列为5′-TTN-3′(N=A、T、G或C;或A、U、G或C)时,引导序列可与临近TFPI基因的核酸序列中的5′-TTN-3′(N=A、T、G或C;或A、U、G或C)序列的5′端和/或3′端的10nt-25nt的连续序列形成互补结合。
下文中,表3和表4中列出了可用于本说明书中公开的示例性实施方式中的引导序列的实例。表3和表4中公开的引导序列为能够靶向AT基因(SERPINC1基因)或TFPI基因的引导序列,并且可与位于AT基因(SERPINC1基因)或TFPI基因中的靶序列形成互补结合。表3和表4中公开的引导序列为分别能够靶向表1和表2的靶序列的引导序列。此外,表3和表4中示出的靶标名称根据编辑蛋白命名,对于SpCas9命名为Sp,对于SaCas9命名为Sa,对于CjCas9命名为Cj。
表3能够靶向SERPINC1基因(AT基因)的引导序列
Figure BDA0002994148170000771
Figure BDA0002994148170000781
Figure BDA0002994148170000791
Figure BDA0002994148170000801
Figure BDA0002994148170000811
Figure BDA0002994148170000821
Figure BDA0002994148170000831
Figure BDA0002994148170000841
Figure BDA0002994148170000851
表4能够靶向TFPI基因的引导序列
Figure BDA0002994148170000861
Figure BDA0002994148170000871
Figure BDA0002994148170000881
Figure BDA0002994148170000891
Figure BDA0002994148170000901
Figure BDA0002994148170000911
Figure BDA0002994148170000921
Figure BDA0002994148170000931
Figure BDA0002994148170000941
本说明书的公开内容的一个方面涉及用于基因操纵的组合物,以人工操纵凝血抑制基因。
用于基因操纵的组合物可用于生成经人工操纵的凝血抑制基因。此外,由用于基因操纵的组合物人工操纵的凝血抑制基因可以调节凝血系统。
“经人工操纵(经人工修饰或经工程化或经人工工程化)”是指经人工修饰的状态,而不是以自然发生状态存在。下文中,可以将非天然的经人工操纵或修饰的凝血抑制基因与人工凝血抑制基因互换使用。
可以考虑基因表达调节过程进行基因操纵。
在一个实施方式中,可以通过选择适合于转录调节、RNA加工调节、RNA转运调节、RNA切割调节、翻译调节或蛋白质修饰调节的每个步骤的操纵工具来实现基因操纵。
例如,可以使用RNAi(RNA干扰或RNA沉默)控制遗传信息的表达,以允许小RNA(sRNA)来干扰mRNA或降低mRNA的稳定性,并任选地破坏mRNA,从而防止其提供蛋白质合成信息。
在一个实施方式中,可以使用野生型或变体酶进行基因操纵,所述酶可以催化DNA或RNA分子(优选DNA分子)中的核苷酸之间的键的水解(裂解)。可以使用引导核酸-编辑蛋白复合体。
例如,可以通过使用选自于由大范围核酸酶、锌指核酸酶、CRISPR/Cas9(Cas9蛋白)、CRISPR-Cpf1(Cpf1蛋白)和TALE核酸酶所组成的组中的一种或多种核酸酶操纵基因来控制遗传信息的表达。
本说明书中公开的用于基因操纵的组合物可以包括引导核酸和编辑蛋白。
在一个实施方式中,用于基因操纵的组合物可包括:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够靶向凝血抑制基因的靶序列;以及
(b)一种或多种编辑蛋白或编码所述编辑蛋白的核酸序列。
与凝血抑制基因有关的描述与上述相同。
与靶序列有关的描述与上述相同。
在另一实施方式中,用于基因操纵的组合物可以包括:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;以及
(b)一种或多种编辑蛋白或编码所述编辑蛋白的核酸序列。
与凝血抑制基因有关的描述与上述相同。
与靶序列有关的描述与上述相同。
与引导序列有关的描述与上述相同。
用于基因操纵的组合物可以包括引导核酸-编辑蛋白复合体。
术语“引导核酸-编辑蛋白复合体”是指通过引导核酸与编辑蛋白之间的相互作用形成的复合体。
与引导核酸有关的描述如上所述。
术语“编辑蛋白”指能够与核酸直接结合或无需直接结合而与核酸相互作用的肽、多肽或蛋白。
此处,核酸可为靶核酸、基因或染色体中含有的核酸。
此处,核酸可为引导核酸。
编辑蛋白可为酶。
此处,术语“酶”是指含有能够切割核酸、基因或染色体的结构域的多肽或蛋白。
酶可为核酸酶或限制性酶。
编辑蛋白可包括完全活性的酶。
此处,“完全活性的酶”是指具有与野生型酶的核酸、基因或染色体切割功能相同的功能的酶。例如,切割双链DNA的野生型酶可为将双链DNA全部切割的完全活性的酶。作为另一实例,当切割双链DNA的野生型酶由于人工工程化而经历氨基酸序列的部分序列的删除或置换时,经人工工程化的酶变体与野生型酶一样切割双链DNA,该经人工工程化的酶变体可为完全活性的酶。
此外,完全活性的酶可包括与野生型酶相比具有改善的功能的酶。例如,切割双链DNA的野生型酶的特定修饰或经操纵的形式可具有高于野生型酶的完全的酶活性,即增加的切割双链DNA的活性。
编辑蛋白可包括不完全或部分活性的酶。
此处,“不完全或部分活性的酶”是指具有野生型酶的核酸、基因或染色体切割功能的一些的酶。例如,切割双链DNA的野生型酶的特定修饰或经操纵的形式可为具有第一功能的形式或具有第二功能的形式。此处,第一功能为切割双链DNA的第一链的功能,并且第二功能可为切割双链DNA的第二链的功能。此处,具有第一功能的酶或具有第二功能的酶可为不完全或部分活性的酶。
编辑蛋白可包括失活的酶。
此处,“失活的酶”是指其中野生型酶的核酸、基因或染色体切割功能完全失活的酶。例如,野生型酶的特定修饰或经操纵的形式可为同时丧失第一功能和第二功能的形式,即切割双链DNA的第一链的第一功能和切割其第二链的第二功能均丧失。此处,第一功能和第二功能均丧失的酶可为失活的酶。
编辑蛋白可为融合蛋白。
此处,术语“融合蛋白”是指通过将酶与额外的结构域、肽、多肽或蛋白融合而产生的蛋白。
所述额外的结构域、肽、多肽或蛋白可具有与所述酶中包含的功能结构域、肽、多肽或蛋白相同或不同的功能。
融合蛋白可为以下形式,其中,将功能结构域、肽、多肽或蛋白添加至酶的氨基末端或其附近、酶的羧基末端或其附近、酶的中间部分或它们的组合中的一个或多个处。
此处,功能结构域、肽、多肽或蛋白可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性或核酸结合活性的结构域、肽、多肽或蛋白,或者为用于纯化和分离蛋白(包括肽)的标签或报告基因,但本发明不限于此。
功能结构域、肽、多肽或蛋白可为脱氨酶。
标签包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签;并且报告基因包括谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、自发荧光蛋白(包括绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)),但本发明不限于此。
此外,功能结构域、肽、多肽或蛋白可为核定位序列或信号(NLS)或者核输出序列或信号(nuclear export sequence or signal,NES)。
NLS可为:具有氨基酸序列PKKKRKV(SEQ ID NO:831)的SV40病毒大T抗原的NLS;由核质蛋白衍生而来的NLS(例如具有序列KRPAATKKAGQAKKKK(SEQ ID NO:832)的核质蛋白双分型(nucleoplasmin bipartite)NLS);具有氨基酸序列PAAKRVKLD(SEQ ID NO:833)或RORRNELKRSP(SEQ ID NO:834)的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:835)的hRNPA1 M9 NLS;由输入蛋白α(importin-α)衍生而来的IBB结构域序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:836);肌瘤T蛋白序列VSRKRPRP(SEQ ID NO:837)和PPKKARED(SEQ ID NO:838);人p53序列PQPKKKPL(SEQ IDNO:839);小鼠c-ab1 IV序列SALIKKKKKMAP(SEQ ID NO:840);流感病毒NS1序列DRLRR(SEQID NO:841)和PKQKKRK(SEQ ID NO:842);肝炎病毒δ抗原序列RKLKKKIKKL(SEQ ID NO:843);小鼠Mx1蛋白序列REKKKFLKRR(SEQ ID NO:844);人多聚(ADP-核糖)聚合酶序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:845);或者类固醇激素受体(人)糖皮质激素序列RKCLQAGMNLEARKTKK(SEQ ID NO:846),但本发明不限于此。
额外的结构域、肽、多肽或蛋白可为不执行特定功能的非功能结构域、肽、多肽或蛋白。此处,非功能结构域、肽、多肽或蛋白可为不影响酶功能的结构域、肽、多肽或蛋白。
融合蛋白可为以下形式,其中,将非功能结构域、肽、多肽或蛋白添加至酶的氨基末端或其附近、酶的羧基末端或其附近、酶的中间部分或它们的组合中的一个或多个处。
编辑蛋白可为天然存在的野生型酶或融合蛋白。
编辑蛋白可为部分修饰的酶或融合蛋白的形式。
编辑蛋白可为在天然状态下不存在的人工产生的酶或融合蛋白。
编辑蛋白可为在天然状态下不存在的部分修饰的人工酶或融合蛋白的形式。
此处,修饰可为对编辑蛋白中含有的氨基酸进行置换、去除、添加或其组合。
或者,修饰可为对编码编辑蛋白的核苷酸序列中的一些核苷酸进行置换、去除、添加或其组合。
此外,任选地,用于基因操纵的组合物可进一步包含具有待插入的期望的特定核苷酸序列的供体(donor),或编码所述供体的核酸序列。
此处,待插入的核酸序列可为凝血抑制基因的部分核苷酸序列。
此处,待插入的核酸序列可为用于引入至待操纵的凝血抑制基因中并用于修正该凝血抑制基因的突变的核酸序列。
术语“供体”是指有助于经破坏的基因或核酸的基于同源重组(HR)的修复的核苷酸序列。
供体可为双链核酸或单链核酸。
供体可以线性或环状存在。
供体可包含与靶基因或核酸具有同源性的核苷酸序列。
例如,供体可包含与特定核苷酸序列所插入的位置(经破坏的核酸存在于其中)的上游(左侧)和下游(右侧)的各核苷酸序列具有同源性的核苷酸序列。此处,待插入的特定核苷酸序列可位于与经破坏生物核酸的左侧核苷酸序列具有同源性的核苷酸序列和与经破坏的核酸的右侧核苷酸序列具有同源性的核苷酸序列之间。此处,具有同源性的核苷酸序列可具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更高的同源性或完全同源性。
供体可选择性地包含额外核苷酸序列。此处,额外核酸序列可在增强供体的稳定性、插入靶标中的效率或同源重组效率中发挥作用。
例如,额外的核苷酸序列可为富含核苷酸A和T的核酸序列(即富A-T结构域)。例如,额外的核苷酸序列可为支架/基质附着区(SMAR)。
可以以多种方式将本说明书公开的引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体递送入或导入受试者中。
此处,术语“受试者”是指导入引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体,其中运行(operates)引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体的有机体;或获取自所述有机体的试样或样本。
受试者可为包含引导核酸-编辑蛋白复合体的靶基因或染色体的有机体。
有机体可为动物、动物组织或动物细胞。
有机体可为人、人组织或人细胞。
组织可为眼球、皮肤、肝、肾、心脏、肺、脑、肌肉组织或血液。
细胞可为肝脏细胞、免疫细胞、血细胞或干细胞。
试样或样本可从包含靶基因或染色体的有机体获取,例如唾液、血液、肝组织、脑组织、肝脏细胞、神经细胞、吞噬细胞、巨噬细胞、T细胞、B细胞、星形胶质细胞、癌细胞或干细胞等。
优选地,受试者可为包含凝血抑制基因的有机体。
可以以DNA、RNA的形式或其混合形式将引导核酸、编辑蛋白或引导核酸-编辑蛋白复合体递送入或导入受试者中。
此处,可通过本领域已知的方法将编码引导核酸和/或编辑蛋白的DNA、RNA的形式或其混合形式递送入或导入受试者中。
或者,可通过载体、非载体或它们的组合将编码引导核酸和/或编辑蛋白的DNA、RNA的形式或其混合形式递送入或导入受试者中。
载体可为病毒载体或非病毒载体(例如质粒)。
非载体可为裸DNA、DNA复合体或mRNA。
在一个实施方式中,可通过载体将编码引导核酸和/或编辑蛋白的核酸序列递送入或导入受试者中。
载体可包含编码引导核酸和/或编辑蛋白的核酸序列。
在一个实例中,载体可同时包含编码引导核酸和编辑蛋白的核酸序列。
在另一实例中,载体可包含编码引导核酸的核酸序列。
作为实例,引导核酸中包含的结构域可全部包含于一个载体中,或可将其分割并随后包含于不同载体中。
在另一实例中,载体可包含编码编辑蛋白的核酸序列。
作为实例,在编辑蛋白的情况下,编码编辑蛋白的核酸序列可包含于一个载体中,或可将其分割并随后包含于数个载体中。
载体可含有一种或多种调节/调控成分。
此处,调节/调控成分可包括启动子、增强子、内含子、多聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体和/或2A序列。
启动子可为由RNA聚合酶II识别的启动子。
启动子可为由RNA聚合酶III识别的启动子。
启动子可为诱导型启动子。
启动子可为受试者特异性启动子。
启动子可为病毒或非病毒启动子。
就启动子而言,可根据控制区(即,编码引导核酸或编辑蛋白的核酸序列)而使用适当的启动子。
例如,用于引导核酸的启动子可为H1、EF-1a、tRNA或U6启动子。例如,用于编辑蛋白的启动子可为CMV、EF-1a、EFS、MSCV、PGK或CAG启动子。
载体可为病毒载体或重组病毒载体。
病毒可为DNA病毒或RNA病毒。
此处,DNA病毒可为双链DNA(dsDNA)病毒或单链DNA(ssDNA)病毒。
此处,RNA病毒可为单链RNA(ssRNA)病毒。
病毒可为逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒或单纯疱疹病毒,但本发明不限于此。
一般说来,病毒可感染宿主(例如细胞),由此将编码病毒遗传信息的核酸导入宿主中或将编码遗传信息的核酸插入宿主基因组中。可使用具有此类特征的病毒将引导核酸和/或编辑蛋白导入受试者中。使用病毒导入的引导核酸和/或编辑蛋白可在受试者(例如细胞)中瞬时表达。或者,使用病毒导入的引导核酸和/或编辑蛋白可在受试者(例如细胞)中长时间持续表达(例如1、2、3周,1、2、3、6、9个月,1、2年,或永久)。
根据病毒的类型,病毒的包装能力可在至少2kb至50kb间变化。取决于此类包装能力,可设计包含引导核酸或编辑蛋白的病毒载体或者包含引导核酸和编辑蛋白二者的病毒载体。或者,可设计包含引导核酸、编辑蛋白和额外成分的病毒载体。
在一个实例中,可通过重组慢病毒对编码引导核酸和/或编辑蛋白的核酸序列进行递送或导入。
在另一实例中,可通过重组腺病毒对编码引导核酸和/或编辑蛋白的核酸序列进行递送或导入。
在又一实例中,可通过重组AAV对编码引导核酸和/或编辑蛋白的核酸序列进行递送或导入。
在又一实例中,可通过杂合病毒(例如本文列出的病毒的一种或多种的杂合)对编码引导核酸和/或编辑蛋白的核酸序列进行递送或导入。
在另一实施方式中,可通过非载体将编码引导核酸和/或编辑蛋白的核酸序列递送入或导入受试者中。
非载体可包含编码引导核酸和/或编辑蛋白的核酸序列。
非载体可为裸DNA、DNA复合体、mRNA或它们的混合物。
可通过电穿孔、基因枪、声致穿孔(sonoporation)、磁性转染、瞬时细胞压缩或挤压(transient cell compression or squeezing)(例如在文献“Lee等(2012)Nano Lett.,12,6322-6327”中所记载的)、脂质介导的转染、树枝状大分子、纳米粒子、磷酸钙、二氧化硅、硅酸盐(Ormosil)或它们的组合将非载体递送入或导入受试者中。
在一个实例中,可通过将细胞与编码引导核酸和/或编辑蛋白的核酸序列在卡盒(cartridge)、腔室(chamber)或比色皿(cuvette)中混合并以预定的持续时间和振幅将电刺激施加至细胞来实施借助电穿孔的递送。
在另一实例中,可使用纳米粒子递送非载体。纳米粒子可为无机纳米粒子(例如磁性纳米粒子、二氧化硅等)或有机纳米粒子(例如聚乙二醇(PEG)包覆的脂质等)。纳米粒子的外表面可缀合有可附着的带正电的聚合物(例如聚乙烯亚胺、聚赖氨酸、聚丝氨酸等)。
在某些实施方式中,可使用脂质壳递送非载体。
在某些实施方式中,可使用外泌体(exosome)递送非载体。外泌体是用于转移蛋白和RNA的内源性纳米囊泡,可将RNA递送至脑和另一靶器官。
在某些实施方式中,可使用脂质体递送非载体。脂质体为球形囊泡结构,由围绕内部水性区室的单个或多个层状脂质双层以及相对不透明的外部亲脂磷脂双层组成。尽管脂质体可由数种不同类型的脂质制成,最常使用磷脂来生产作为药物运载体的脂质体。
此外,用于非载体递送的组合物可包含其它添加剂。
可将编辑蛋白以肽、多肽或蛋白的形式递送入或导入受试者中。
可通过本领域已知的方法以肽、多肽或蛋白的形式将编辑蛋白递送入或导入受试者中。
可通过电穿孔、显微注射、瞬时细胞压缩或挤压(例如在文献“Lee等(2012)NanoLett.,12,6322-6327”中所记载的)、脂质介导的转染、纳米粒子、脂质体、肽介导的递送或它们的组合将肽、多肽或蛋白形式递送入或导入受试者中。
肽、多肽或蛋白可与编码引导核酸的核酸序列一起递送。
在一个实例中,可通过将待导入编辑蛋白的细胞与引导核酸或不与引导核酸在卡盒、腔室或比色皿中混合并以预定的持续时间和振幅将电刺激施加至细胞来实施借助电穿孔的递送。
可将引导核酸和编辑蛋白以核酸和蛋白混合的形式递送入或导入受试者中。
可以以引导核酸-编辑蛋白复合体的形式将引导核酸和编辑蛋白递送入或导入受试者中。
例如,引导核酸可为DNA、RNA或其混合物。编辑蛋白可为肽、多肽或蛋白。
在一个实例中,可以以包含RNA型引导核酸和蛋白型编辑蛋白的引导核酸-编辑蛋白复合体(即核糖核蛋白(RNP))的形式将引导核酸和编辑蛋白递送入或导入受试者中。
本说明书公开的引导核酸-编辑蛋白复合体可对靶核酸、基因或染色体进行修饰。
例如,引导核酸-编辑蛋白复合体诱导靶核酸、基因或染色体的序列的修饰。作为结果,可对由靶核酸、基因或染色体表达的蛋白在结构和/或功能上进行修饰,或可调控或抑制该蛋白的表达。
引导核酸-编辑蛋白复合体可在DNA、RNA、基因或染色体水平发挥作用。
在一个实例中,引导核酸-编辑蛋白复合体可操纵或修饰靶基因,来对靶基因编码的蛋白的表达进行调控(例如抑制、阻遏、降低、增加或促进)、或表达其活性受到调控(例如抑制、阻遏、降低、增加或促进)或修饰的蛋白。
引导核酸-编辑蛋白复合体可在基因转录和翻译阶段发挥作用。
在一个实例中,引导核酸-编辑蛋白复合体可促进或抑制靶基因的转录,从而调控(例如抑制、阻遏、降低、增加或促进)靶基因编码的蛋白的表达。
在另一实例中,引导核酸-编辑蛋白复合体可促进或抑制靶基因的翻译,从而调控(例如抑制、阻遏、降低、增加或促进)靶基因编码的蛋白的表达。
在本说明书的公开内容的一个实施方式中,用于基因操纵的组合物可包含gRNA和CRISPR酶。
在一个实施方式中,用于基因操纵的组合物可包含:
(a)gRNA或编码所述gRNA的核酸序列,所述gRNA能够靶向凝血抑制基因的靶序列;以及
(b)一种或多种CRISPR酶或编码所述CRISPR酶的核酸序列。
与凝血抑制基因有关的描述与上述相同。
与靶序列有关的描述与上述相同。
在另一实施方式中,用于基因操纵的组合物可以包括:
(a)gRNA或编码所述gRNA的核酸序列,所述gRNA包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;以及
(b)一种或多种CRISPR酶或编码所述CRISPR酶的核酸序列。
与凝血抑制基因有关的描述与上述相同。
与靶序列有关的描述与上述相同。
与引导序列有关的描述与上述相同。
用于基因操纵的组合物可包含gRNA-CRISPR酶复合体。
术语“gRNA-CRISPR酶复合体”是指由gRNA和CRISPR酶之间的相互作用形成的复合体。
与gRNA有关的描述如上所述。
术语“CRISPR酶”是CRISPR-Cas系统的主要蛋白组分,并且与gRNA形成复合体,从而形成CRISPR-Cas系统。
CRISPR酶可为具有编码CRISPR酶的序列的核酸或多肽(或蛋白)。
CRISPR酶可为II型CRISPR酶。
根据对两种以上类型的天然微生物II型CRISPR酶分子的研究(Jinek等,Science,343(6176):1247997,2014)以及对酿脓链球菌Cas9(SpCas9)与gRNA复合的研究(Nishimasu等,Cell,156:935-949,2014;和Anders等,Nature,2014,doi:10.1038/nature13579),确定了II型CRISPR酶的晶体结构。
II型CRISPR酶包含两个叶(lobes),即识别(REC)叶和核酸酶(NUC)叶,并且各叶包含数个结构域。
REC叶包含富含精氨酸的桥螺旋(BH)结构域、REC1结构域和REC2结构域。
此处,BH结构域为长的α螺旋和富含精氨酸的区域,而REC1结构域和REC2结构域在识别gRNA(例如单链gRNA、双链gRNA或tracrRNA)中形成的双链中起重要作用。
NUC叶包含RuvC结构域、HNH结构域和PAM相互作用(PI)结构域。此处,RuvC结构域涵盖RuvC样结构域,并且HNH结构域涵盖HNH样结构域。
此处,RuvC结构域与包含II型CRISPR酶的天然存在的微生物家族的成员共享结构相似性,并切割单链(例如靶基因或核酸的非互补链,即不与gRNA形成互补结合的链)。在本领域中,RuvC结构域有时指RuvCI结构域、RuvCII结构域或RuvCIII结构域,并且一般称为RuvCI、RuvCII或RuvCIII。
HNH结构域与HNH核酸内切酶共享结构相似性,并切割单链(例如靶核酸分子的互补链,即与gRNA形成互补结合的链)。HNH结构域位于RuvCII和RuvCIII基序之间。
PI结构域识别靶基因或核酸中的特定核苷酸序列(即前间区序列邻近基序(PAM))或与PAM相互作用。此处,PAM可根据II型CRISPR酶的来源而变化。例如,当CRISPR酶是SpCas9时,PAM可为5′-NGG-3′;当CRISPR酶是嗜热链球菌Cas9(StCas9)时,PAM可为5′-NNAGAAW-3′(W=A或T);当CRISPR酶是脑膜炎奈瑟菌Cas9(NmCas9)时,PAM可为5′-NNNNGATT-3′;当CRISPR酶是空肠弯曲杆菌Cas9(CjCas9)时,PAM可为5′-NNNVRYAC-3′(V=G或C或A;R=A或G;Y=C或T),其中,N为A、T、G或C,或A、U、G或C。然而,尽管通常理解根据如上所述的酶的来源来确定PAM,PAM可随着由相应来源衍生而来的酶的突变体的研究进展而改变。
II型CRISPR酶可为Cas9。
Cas9可由多种微生物衍生而来,例如,酿脓链球菌、嗜热链球菌、链球菌属(Streptococcus sp.)、金黄色葡萄球菌、空肠弯曲杆菌、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿色产色链霉菌(Streptomyces viridochromogenes)、绿色产色链霉菌、粉红链孢囊菌(Streptosporangium roseum)、粉红链孢囊菌、酸热脂环酸芽孢杆菌(AlicyclobacHlusacidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、Bacillusselenitireducens、Exiguobacterium sibiricum、德氏乳杆菌(Lactobacillusdelbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、Microscilla marina、伯克氏菌目细菌(Burkholderiales bacterium)、Polaromonas naphthalenivorans、极地单胞菌属(Polaromonas sp.)、Crocosphaera watsonii、蓝杆藻属(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻属(Synechococcus sp.)、阿拉伯糖醋盐杆菌(Acetohalobium arabaticum)、Ammonifex degensii、Caldicelulosiruptor bescii、Candidatus Desulforudis、肉毒梭状芽胞杆菌(Clostridium botulinum)、艰难梭状芽胞杆菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、Natranaerobiusthermophilus、Pelotomaculum thermopropionicum、喜温嗜酸硫杆菌(Acidithiobacilluscaldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillus ferrooxidans)、Allochromatiumvinosum、海杆菌属(Marinobacter sp.)、Nitrosococcus halophilus、Nitrosococcuswatsonii、Pseudoalteromonas haloplanktis、Ktedonobacter racemifer、Methanohalobium evestigatum、多变鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻属(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻属(Arthrospira sp.)、鞘丝藻属(Lyngbyasp.)、Microcoleus chthonoplastes、颤藻属(Oscillatoria sp.)、Petrotoga mobilis、非洲栖热腔菌(Thermosipho africanus)以及Acaryochloris marina。
Cas9为与gRNA结合从而切割或修饰靶基因或核酸的靶序列或位置的酶,并且可由HNH结构域(能够切割与gRNA形成互补结合的核酸链)、RuvC结构域(能够切割与gRNA形成非互补结合的核酸链)、REC结构域(与靶标相互作用)以及PI结构域(识别PAM)组成。对于Cas9的具体结构特征,可参见Hiroshi Nishimasu等,(2014)Cell 156:935-949。
Cas9可从天然存在的微生物中分离或者通过重组或合成方法非天然地产生。
此外,CRISPR酶可为V型CRISPR酶。
V型CRISPR酶包含类似的RuvC结构域(对应于II型CRISPR酶的RuvC结构域),并且缺乏II型CRISPR酶的HNH结构域。但是它反过来包含Nuc结构域并可由REC结构域和WED结构域(与靶标相互作用)以及PI结构域(识别PAM)组成。对于V型CRISPR酶的具体结构特征,可参见Takashi Yamano等(2016)Cell 165:949-962。
V型CRISPR酶可与gRNA相互作用,从而形成gRNA-CRISPR酶复合体,即CRISPR复合体,并且可在gRNA的协作下允许引导序列接近包含PAM序列的靶序列。此处,V型CRISPR酶与靶基因或核酸相互作用的能力依赖于PAM序列。
PAM序列可为靶基因或核酸中存在的序列,并被V型CRISPR酶的PI结构域识别。PAM序列可根据V型CRISPR酶的来源而具有不同的序列。即,每个种类具有能够被特异性识别的PAM序列。例如,由Cpf1识别的PAM序列可为5′-TTN-3′(N为A、T、C或G)。尽管通常理解PAM根据如上所述的酶的来源来确定,但PAM可随着由相应来源衍生而来的酶的突变体的研究进展而改变。
V型CRISPR酶可为Cpf1。
Cpf1可由以下衍生而来:链球菌(Streptococcus)、弯曲杆菌(Campylobacter)、Nitratifractor、葡萄球菌(Staphylococcus)、Parvibaculum、罗氏菌(Roseburia)、奈瑟菌(Neisseria)、葡糖醋杆菌(Gluconacetobacter)、固氮螺菌(Azospirillum)、Sphaerochaeta、乳杆菌(Lactobacillus)、真杆菌(Eubacterium)、棒状杆菌(Corynebacter)、肉食杆菌(Carnobacterium)、红杆菌(Rhodobacter)、李斯特菌(Listeria)、Paludibacter、梭菌(Clostridium)、毛螺菌(Lachnospiraceae)、Clostridiaridium、纤毛菌(Leptotrichia)、弗朗西斯氏菌属(Francisella)、军团杆菌(Legionella)、脂环酸芽孢杆菌(Alicyclobacillus)、Methanomethyophilus、卟啉单胞菌(Porphyromonas)、普雷沃菌(Prevotella)、拟杆菌(Bacteroidetes)、创伤球菌(Helcococcus)、钩端螺旋体(Letospira)、脱硫弧菌(Desulfovibrio)、Desulfonatronum、丰祜菌(Opitutaceae)、肿块芽孢杆菌(Tuberibacillus)、芽孢杆菌(Bacillus)、短芽孢杆菌(Brevibacilus)、甲基杆菌(Methylobacterium)或氨基酸球菌(Acidaminococcus)。
Cpf1包含RuvC样结构域(对应于Cas9的RuvC结构域),并缺乏Cas9的HNH结构域。但是它反过来包含Nuc结构域,并可由REC结构域和WED结构域(与靶标相互作用)以及PI结构域(识别PAM)组成。对于Cpf1的具体结构特征,可参见Takashi Yamano等(2016)Cell 165:949-962。
Cpf1可从天然存在的微生物分离或者通过重组或合成方法非天然地产生。
CRISPR酶可为具有切割靶基因或核酸中的双链核酸的功能的核酸酶或限制性酶。
CRISPR酶可为完全活性的CRISPR酶。
术语“完全活性”是指酶具有与野生型CRISPR酶相同的功能的状态,此状态下的CRISPR酶被称为完全活性的CRISPR酶。此处,“野生型CRISPR酶的功能”是指酶具有切割双链DNA的功能的状态,即具有切割双链DNA的第一链的第一功能和切割双链DNA的第二链的第二功能的状态。
完全活性的CRISPR酶可为切割双链DNA的野生型CRISPR酶。
完全活性的CRISPR酶可为通过对切割双链DNA的野生型CRISPR酶进行修饰或操纵形成的CRISPR酶变体。
CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的一个或多个氨基酸被置换为其它氨基酸或一个或多个氨基酸去除的酶。
CRISPR酶变体可为向野生型CRISPR酶的氨基酸序列添加了一个或多个氨基酸的酶。此处,添加的氨基酸的位置可为野生型酶的N端、C端或氨基酸序列中。
CRISPR酶变体可为与野生型CRISPR酶相比具有改善的功能的完全活性的酶。
例如,野生型CRISPR酶的特定修饰或经操纵的形式(即CRISPR酶变体)可切割双链DNA而不与待切割的双链DNA结合或与其保持一定距离。在这种情况下,修饰或经操纵的形式可为与野生型CRISPR酶相比具有改善的功能活性的完全活性的CRISPR酶。
CRISPR酶变体可为与野生型CRISPR酶相比功能降低的完全活性的CRISPR酶。
例如,野生型CRISPR酶的特定修饰或经操纵的形式(即CRISPR酶变体)可在非常接近待切割的双链DNA或与其形成特异性结合的情况下切割双链DNA。此处,特异性结合可为例如CRISPR酶的特定区域处的氨基酸与切割位置处的DNA核苷酸序列之间的结合。在这种情况下,修饰或经操纵的形式可为与野生型CRISPR酶相比功能活性降低的完全活性的CRISPR酶。
CRISPR酶可为不完全或部分活性的CRISPR酶。
术语“不完全或部分活性”是指酶具有选自野生型CRISPR酶的功能(即,切割双链DNA的第一链的第一功能,以及切割双链DNA的第二链的第二功能)之一的状态。处于此状态下的CRISPR酶称为不完全或部分活性的CRISPR酶。此外,不完全或部分活性的CRISPR酶可称为切口酶(nickase)。
术语“切口酶”是指经操纵或修饰而仅切割靶基因或核酸的双链的一条链的CRISPR酶,切口酶具有切割单链(例如与靶基因或核酸的gRNA互补的链或不与其互补的链)的核酸酶活性。因此,为了切割双链需要两种切口酶的核酸酶活性。
切口酶可具有借助CRISPR酶的RuvC结构域的核酸酶活性。即,切口酶可不包含CRISPR酶的HNH结构域的核酸酶活性,为此可对HNH结构域进行操纵或修饰。
在一个实例中,当CRISPR酶是II型CRISPR酶时,切口酶可为包含修饰的HNH结构域的II型CRISPR酶。
例如,在II型CRISPR酶为野生型SpCas9的情况下,切口酶可为其中通过突变使HNH结构域的核酸酶活性失活的SpCas9变体,所述突变为将野生型SpCas9的氨基酸序列中的第840位氨基酸由组氨酸突变为丙氨酸。由于由此产生的切口酶(即SpCas9变体)具有RuvC结构域的核酸酶活性,因此它能够切割靶基因或核酸的非互补链,即不与gRNA形成互补结合的链。
又例如,在II型CRISPR酶为野生型CjCas9的情况下,切口酶可为其中通过突变使HNH结构域的核酸酶活性失活的CjCas9变体,所述突变为野生型CjCas9的氨基酸序列中的第559位氨基酸由组氨酸突变为丙氨酸。由于由此产生的切口酶(即CjCas9变体)具有RuvC结构域的核酸酶活性,因此它能够切割靶基因或核酸的非互补链,即不与gRNA形成互补结合的链。
此外,切口酶可具有借助CRISPR酶的HNH结构域的核酸酶活性。即,切口酶可不包含RuvC结构域的核酸酶活性,为此可对RuvC结构域进行操纵或修饰。
在一个实例中,当CRISPR酶是II型CRISPR酶时,切口酶可为包含经修饰的RuvC结构域的II型CRISPR酶。
例如,在II型CRISPR酶为野生型SpCas9的情况下,切口酶可为其中通过突变使RuvC结构域的核酸酶活性失活的SpCas9变体,所述突变为野生型SpCas9的氨基酸序列中的第10位氨基酸由天冬氨酸突变为丙氨酸。由于由此产生的切口酶(即SpCas9变体)具有HNH结构域的核酸酶活性,因此它能够切割靶基因或核酸的互补链,即与gRNA形成互补结合的链。
又例如,在II型CRISPR酶为野生型CjCas9的情况下,切口酶可为其中通过突变使RuvC结构域的核酸酶活性失活的CjCas9变体,所述突变为野生型CjCas9的氨基酸序列中的第8位氨基酸由天冬氨酸突变为丙氨酸。由于由此产生的切口酶(即CjCas9变体)具有HNH结构域的核酸酶活性,因此它能够切割靶基因或核酸的互补链,即与gRNA形成互补结合的链。
CRISPR酶可为失活的CRISPR酶。
术语“失活”是指野生型CRISPR酶的功能(即切割双链DNA的第一链的第一功能和切割双链DNA的第二链的第二功能)均丧失的状态。处于此类状态下的CRISPR酶被称为失活的CRISPR酶。
由于野生型CRISPR酶的具有核酸酶活性的结构域中的突变,失活的CRISPR酶可使核酸酶失活。
失活的CRISPR酶可能由于RuvC结构域和HNH结构域中的突变而使核酸酶失活。即,失活的CRISPR酶可不具有由CRISPR酶的RuvC结构域和HNH结构域生成的核酸酶活性,并且为此可对RuvC结构域和HNH结构域进行操纵或修饰。
在一个实例中,当CRISPR酶为II型CRISPR酶时,失活的CRISPR酶可为具有经修饰的RuvC结构域和HNH结构域的II型CRISPR酶。
例如,当II型CRISPR酶为野生型SpCas9时,失活的CRISPR酶可为其中通过野生型SpCas9的氨基酸序列中的第10位天冬氨酸和第840位组氨酸均突变为丙氨酸而使RuvC结构域和HNH结构域的核酸酶活性均失活的SpCas9变体。此处,由于所产生的失活的CRISPR酶(即SpCas9变体)中的RuvC结构域和HNH结构域的核酸酶活性失活,不能完全地切割靶基因或核酸的双链。
在另一实例中,当II型CRISPR酶为野生型CjCas9时,失活的CRISPR酶可为其中通过野生型CjCas9的氨基酸序列中的第8位天冬氨酸和第559位组氨酸均突变为丙氨酸而使RuvC结构域和HNH结构域的核酸酶活性均失活的CjCas9变体。此处,由于所产生的失活的CRISPR酶(即CjCas9变体)中的RuvC结构域和HNH结构域的核酸酶活性失活,不能完全地切割靶基因或核酸的双链。
除上述核酸酶活性外,CRISPR酶可具有解旋酶活性,即,使得双链核酸的螺旋结构退火的能力。
此外,相对于CRISPR酶的解旋酶活性,可对CRISPR酶进行修饰以使CRISPR酶完全、不完全或部分地活化、或失活。
CRISPR酶可为通过对野生型CRISPR酶进行人工操纵或修饰产生的CRISPR酶变体。
CRISPR酶变体可为经人工操纵或修饰的CRISPR酶变体以修饰野生型CRISPR酶的功能(即,切割双链DNA的第一链的第一功能,和/或切割双链DNA的第二链的第二功能)。
例如,CRISPR酶变体可为其中野生型CRISPR酶功能的第一功能丧失的形式。
或者,CRISPR酶变体可为其中野生型CRISPR酶功能的第二功能丧失的形式。
例如,CRISPR酶变体可为其中野生型CRISPR酶的两种功能(即第一功能和第二功能)均丧失的形式。
CRISPR酶变体可通过与gRNA相互作用而形成gRNA-CRISPR酶复合体。
CRISPR酶变体可为经人工操纵或修饰以修饰野生型CRISPR酶的与gRNA相互作用的功能的CRISPR酶变体。
例如,CRISPR酶变体可为具有与野生型CRISPR酶相比降低的与gRNA的相互作用的形式。
或者,CRISPR酶变体可为具有与野生型CRISPR酶相比增加的与gRNA的相互作用的形式。
例如,CRISPR酶变体可为具有野生型CRISPR酶的第一功能以及降低的与gRNA的相互作用的形式。
或者,CRISPR酶变体可为具有野生型CRISPR酶的第一功能以及增加的与gRNA的相互作用的形式。
例如,CRISPR酶变体可为具有野生型CRISPR酶的第二功能以及降低的与gRNA的相互作用的形式。
或者,CRISPR酶变体可为具有野生型CRISPR酶的第二功能以及增加的与gRNA的相互作用的形式。
例如,CRISPR酶变体可为不具有野生型CRISPR酶的第一功能和第二功能并具有降低的与gRNA的相互作用的形式。
或者,CRISPR酶变体可为不具有野生型CRISPR酶的第一功能和第二功能并具有增加的与gRNA的相互作用的形式。
此处,可根据gRNA与CRISPR酶变体之间的相互作用强度来形成多种gRNA-CRISPR酶复合体,并且接近或切割靶序列的功能可根据CRISPR酶变体而存在差异。
例如,仅当非常接近或定位于与gRNA完全互补结合的靶序列时,由与gRNA的相互作用降低的CRISPR酶变体形成的gRNA-CRISPR酶复合体才能够切割靶序列的双链或单链。
CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的至少一个氨基酸被修饰的形式。
作为实例,CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的至少一个氨基酸被置换的形式。
作为另一实例,CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的至少一个氨基酸被删除的形式。
作为又一实例,CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的至少一个氨基酸被添加的形式。
在一个实例中,CRISPR酶变体可为其中野生型CRISPR酶的氨基酸序列的至少一个氨基酸被置换、删除和/或添加的形式。
此外,任选地,除了野生型CRISPR酶的原始功能(即,切割双链DNA的第一链的第一功能以及切割其第二链的第二功能)外,CRISPR酶变体可进一步包含功能结构域。此处,除了野生型CRISPR酶的原始功能外,CRISPR酶变体可具有额外功能。
功能结构域可为具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性或核酸结合活性的结构域,或者为用于分离和纯化蛋白(包括肽)的标签或报告基因,但本发明不限于此。
标签包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签;并且报告基因包括谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、萤光素酶、自发荧光蛋白(包括绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和蓝色荧光蛋白(BFP)),但本发明不限于此。
功能结构域可为脱氨酶。
例如,可进一步包含胞苷脱氨酶作为不完全或部分活性的CRISPR酶的功能结构域。在一个示例性实施方式中,可将胞苷脱氨酶(例如载脂蛋白B编辑复合体1(APOBEC1))添加至SpCas9切口酶,从而产生融合蛋白。如上所述形成的[SpCas9切口酶]-[APOBEC1]可用于由C到T或U的核苷酸编辑或者由G到A的核苷酸编辑中。
在另一实例中,可进一步包含腺嘌呤脱氨酶作为不完全或部分活性的CRISPR酶的功能结构域。在一个示例性实施方式中,可将腺嘌呤脱氨酶(例如TadA变体、ADAR2变体或ADAT2变体等)添加至SpCas9切口酶,从而产生融合蛋白。如上所述形成的[SpCas9切口酶]-[TadA变体]、[SpCas9切口酶]-[ADAR2变体]或[SpCas9切口酶]-[ADAT2变体]可用于由A到G的核苷酸编辑或者由T到C的核苷酸编辑中,由于融合蛋白将核苷酸A修饰为肌苷,经修饰的肌苷被聚合酶识别为核苷酸G,从而实质上表现出由A到G的核苷酸编辑。
功能结构域可为核定位序列或信号(NLS)或者核输出序列或信号(NES)。
在一个实例中,CRISPR酶可包含一个或多个NLS。此处,NLS可包含于CRISPR酶的N端或其附近、所述酶的C端或其附近,或者它们的组合。NLS可为由如下NLS衍生而来的NLS序列,但本发明不限于此:具有氨基酸序列PKKKRKV(SEQ ID NO:831)的SV40病毒大T抗原的NLS;来自核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK(SEQ ID NO:832)的核质蛋白双分型NLS);具有氨基酸序列PAAKRVKLD(SEQ ID NO:833)或RQRRNELKRSP(SEQ ID NO:834)的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:835)的hRNPA1 M9 NLS;来自输入蛋白α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:836);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:837)和PPKKARED(SEQ ID NO:838);人p53的序列PQPKKKPL(SEQ ID NO:839);小鼠c-ab1 IV的序列SALIKKKKKMAP(SEQ ID NO:840);流感病毒NS1的序列DRLRR(SEQ ID NO:841)和PKQKKRK(SEQ ID NO:842);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:843);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:844);人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:845);或者由类固醇激素受体(人)糖皮质激素的序列衍生而来的序列RKCLQAGMNLEARKTKK(SEQ ID NO:846)。
此外,CRISPR酶突变体可包括通过将CRISPR酶分为两个以上部分而制备的拆分型(split-type)CRISPR酶。术语“拆分”是指对蛋白进行功能或结构性划分,或者将蛋白随机划分为两个以上部分。
拆分型CRISPR酶可为完全活性的酶、不完全或部分活性的酶或失活的酶。
例如,当CRISPR酶为SpCas9时,可在第656位残基(酪氨酸)和第657位残基(苏氨酸)之间将SpCas9分为两部分,由此生成拆分型SpCas9。
拆分型CRISPR酶可选择性地包含用于重构(reconstitution)的额外的结构域、肽、多肽或蛋白。
用于重构的额外的结构域、肽、多肽或蛋白可组装以形成在结构上与野生型CRISPR酶相同或类似的拆分型CRISPR酶。
用于重构的额外的结构域、肽、多肽或蛋白可为FRB和FKBP二聚化结构域;内含肽(intein);ERT和VPR结构域;或者在特定条件下形成异二聚体的结构域。
例如,当CRISPR酶为SpCas9时,可在第713位残基(丝氨酸)和第714位残基(甘氨酸)之间将SpCas9分为两部分,从而生成拆分型SpCas9。可将FRB结构域连接至两部分中的一个部分,并将FKBP结构域连接至另一部分。在由此产生的拆分型SpCas9中,FRB结构域和FKBP结构域可以在存在雷帕霉素的环境中形成二聚体,从而生成重构的CRISPR酶。
本说明书中公开的CRISPR酶或CRISPR酶变体可为多肽、蛋白或者具有编码所述多肽、蛋白的序列的核酸,并可针对待导入所述CRISPR酶或CRISPR酶变体的受试者实施密码子优化。
术语“密码子优化”是指通过如下对核酸序列修饰的过程:在保持天然氨基酸序列的同时将天然序列中的至少一个密码子替换为在宿主细胞中更常或最常使用的密码子来改善在宿主细胞中的表达。多种物种对特定氨基酸的特定密码子具有特定偏好,该密码子偏好(不同生物体间密码子使用的差别)通常与mRNA的翻译效率相关,认为这取决于所翻译的密码子的特征和特定tRNA分子的可获得性。细胞中选择的优势tRNA通常反映了肽合成中最常使用的密码子。因此,可基于密码子优化在给定生物体中通过优化基因表达来对基因进行定制化。
可以借助多种形式将本说明书中公开的gRNA、CRISPR酶或gRNA-CRISPR酶复合体递送入或导入受试者中。
受试者相关的描述如上所述。
在一个实施方式中,可通过载体将编码gRNA和/或CRISPR酶的核酸序列递送入或导入受试者中。
载体可包含编码gRNA和/或CRISPR酶的核酸序列。
在一个实例中,载体可同时包含编码gRNA和CRISPR酶的核酸序列。
在另一实例中,载体可包含编码gRNA的核酸序列。
例如,gRNA中包含的结构域可包含在一个载体中,或者可将其分割并随后包含在不同载体中。
在另一实例中,载体可包含编码CRISPR酶的核酸序列。
例如,在CRISPR酶的情况下,编码CRISPR酶的核酸序列可包含在一个载体中,或者可将编码CRISPR酶的核酸序列分割并随后包含在数个载体中。
载体可包含一种或多种调节/调控成分。
此处,调节/调控成分可包括:启动子、增强子、内含子、多聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体和/或2A序列。
启动子可为由RNA聚合酶II识别的启动子。
启动子可为由RNA聚合酶III识别的启动子。
启动子可为诱导型启动子。
启动子可为受试者特异性启动子。
启动子可为病毒启动子或非病毒启动子。
就启动子而言,可根据控制区(即,编码gRNA和/或CRISPR酶的核酸序列)而使用恰当的启动子。
例如,用于gRNA的启动子可为H1、EF-1a、tRNA或U6启动子。例如,用于CRISPR酶的启动子可为CMV、EF-1a、EFS、MSCV、PGK或CAG启动子。
载体可为病毒载体或重组病毒载体。
病毒可为DNA病毒或RNA病毒。
此处,DNA病毒可为双链DNA(dsDNA)病毒或单链DNA(ssDNA)病毒。
此处,RNA病毒可为单链RNA(ssRNA)病毒。
所述病毒可为逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒或单纯疱疹病毒,但本发明不限于此。
在一个实例中,可通过重组慢病毒对编码gRNA和/或CRISPR酶的核酸序列进行递送或导入。
在另一实例中,可通过重组腺病毒对编码gRNA和/或CRISPR酶的核酸序列进行递送或导入。
在又一实例中,可通过重组AAV对编码gRNA和/或CRISPR酶的核酸序列进行递送或导入。
在又一实例中,可通过杂合病毒(例如本文所述的病毒的一种多种的杂合)对编码gRNA和/或CRISPR酶的核酸序列进行递送或导入。
在一个实施方式中,可将gRNA-CRISPR酶复合体递送入或导入受试者中。
例如,gRNA可以以DNA、RNA或其混合物的形式存在。CRISPR酶可以以肽、多肽或蛋白的形式存在。
在一个实例中,可以以包含RNA型gRNA和蛋白型CRISPR的gRNA-CRISPR酶复合体(即核糖核蛋白(RNP))的形式将gRNA和CRISPR酶递送入或导入受试者中。
可通过电穿孔、显微注射、瞬时细胞压缩或挤压(例如在文献“Lee等(2012)NanoLett.,12,6322-6327”中所描述的)、脂质介导的转染、纳米粒子、脂质体、肽介导的递送或它们的组合将gRNA-CRISPR酶复合体递送入或导入受试者中。
本说明书中公开的gRNA-CRISPR酶复合体可用于对靶基因(即凝血抑制基因)进行人工操纵或修饰。
可使用上述的gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因进行操纵或修饰。此处,靶基因的操纵或修饰可包括以下二者:i)对靶基因进行切割或损伤;以及ii)对损伤的靶基因进行修复。
i)靶基因的切割或损伤可为使用CRISPR复合体对靶基因进行切割或损伤,具体而言对靶基因的靶序列进行切割或损伤。
靶序列可成为gRNA-CRISPR酶复合体的靶标,并且靶序列可包含由CRISPR酶识别的PAM序列或者可不包含由CRISPR酶识别的PAM序列。此类靶序列可为参与gRNA设计的人提供关键标准。
靶序列可由gRNA-CRISPR酶复合体的gRNA特异性识别,因此,gRNA-CRISPR酶复合体可位于所识别的靶序列附近。
靶位点处的“切割”是指多聚核苷酸的共价骨架的断裂。切割包括但不限于磷酸二酯键的酶促水解或化学水解,但本发明不限于此。除此之外,可通过多种方法进行切割。单链切割和双链切割都是可能的,其中双链切割可以作为两条不同的单链切割的结果而发生。双链切割可产生平末端或交错(staggered)末端(或粘性末端)。
在一个实例中,使用CRISPR复合体对靶基因进行切割或损伤可为将靶序列的双链完全切割或损伤。
在一个示例性实施方式中,当CRISPR酶为野生型SpCas9时,与gRNA形成互补结合的靶序列的双链可被CRISPR复合体完全切割。
在另一示例性实施方式中,当CRISPR酶为SpCas9切口酶(D10A)和SpCas9切口酶(H840A)时,与gRNA形成互补结合的靶序列的两条单链可分别被每种CRISPR复合体切割。即,SpCas9切口酶(D10A)可切割与gRNA形成互补结合的靶序列的互补单链,而SpCas9切口酶(H840A)可切割与gRNA形成互补结合的靶序列的非互补单链,并且可顺序或同时实施切割。
在另一实例中,使用CRISPR复合体对靶基因或核酸进行切割或损伤可为仅对靶序列的双链中的单链进行切割或损伤。此处,单链可为与gRNA互补结合的靶序列中的引导核酸结合序列(即互补单链),或不与gRNA互补结合的引导核酸非结合序列(即与gRNA非互补的单链)。
在一个示例性实施方式中,当CRISPR酶为SpCas9切口酶(D10A)时,CRISPR复合体可通过SpCas9切口酶(D10A)切割与gRNA互补结合的靶序列的引导核酸结合序列(即互补单链),而可不切割不与gRNA互补结合的引导核酸非结合序列(即与gRNA非互补的单链)。
在另一示例性实施方式中,当CRISPR酶为SpCas9切口酶(H840A)时,CRISPR复合体可通过SpCas9切口酶(H840A)切割与gRNA不互补结合的靶序列的引导核酸非结合序列(即与gRNA非互补的单链),而可不切割与gRNA互补结合的靶序列的引导核酸结合序列(即互补单链)。
在又一实例中,使用CRISPR复合体对靶基因或核酸的切割或损伤可为去除核酸序列的部分片段。
在一个示例性实施方式中,当CRISPR复合体由野生型SpCas9和互补结合至不同靶序列的两个gRNA组成时,可切割与第一gRNA形成互补结合的靶序列的双链,并可切割与第二gRNA形成互补结合的靶序列的双链,从而引起通过第一gRNA和第二gRNA以及SpCas9去除核酸片段。
ii)损伤的靶基因的修复可为借助非同源末端接合(NHEJ)和同源介导的修复(HDR)进行的修复或恢复。
非同源末端接合(NHEJ)是通过将被切割的双链或单链的两端连接在一起来对DNA中的双链断裂进行恢复或修复的方法,一般而言,当将通过双链断裂(例如切割)形成的两个相容末端频繁地彼此接触以将两个末端完全相接,损伤的双链得以修复。NHEJ是能够用于整个细胞周期的恢复方法,并且通常在细胞中无同源基因组用作模板时(例如G1期)发生。
在使用NHEJ对损伤的基因或核酸进行修复的过程中,NHEJ修复区中出现核酸序列的一些插入和/或缺失(插入缺失),此类插入和/或缺失导致读码框位移,产生移码的转录组mRNA。其结果是,由于无义介导的衰变(nonsense-mediated decay)或正常蛋白无法合成,造成固有功能丧失。此外,尽管读码框保持不变,其中序列的相当量的插入或缺失的突变也可导致蛋白功能破坏。由于相比蛋白的非重要区域的突变,重要功能结构域中的突变可能更少被耐受,突变为基因座依赖型的。
尽管不能预期在天然状态下由NHEJ产生的插入缺失突变,特定的插入缺失序列优选在指定的受损区中,并可来自于微同源的小区域。常规地,缺失的长度范围为1bp-50bp,插入趋向于更短,并通常包含直接包围受损区的短重复序列。
此外,NHEJ是造成突变的过程,并且当不必须生成特定的最终序列时,可将NHEJ用于对短序列的基序进行删除。
可使用该NHEJ进行CRISPR复合体所靶向的基因的特异性敲除。可使用CRISPR酶(例如Cas9或Cpf1)切割靶基因或核酸的双链或两条单链,并可借助NHEJ使得受损的双链或两条单链具有插入缺失,从而诱导靶基因或核酸的特异性敲除。此处,被CRISPR酶切割的靶基因或核酸的位点可为非编码区或编码区,此外,由NHEJ恢复的靶基因或核酸的位点可为非编码区或编码区。
在一个实例中,可使用CRISPR复合体切割靶基因的双链,并且可通过借助NHEJ的修复在修复区生成多种插入缺失(插入和缺失)。
术语“插入缺失”是指通过向DNA的核苷酸序列中插入部分核苷酸或从DNA的核苷酸序列中删除部分核苷酸而形成的变异。当gRNA-CRISPR酶复合体如上所述切割凝血抑制基因的核酸(DNA、RNA)时,在通过HDR或NHEJ进行修复期间,可向靶序列中引入插入缺失。
同源介导修复(HDR)是无错修正方法,其使用同源序列作为模板对损伤的核酸或基因进行修复或恢复,一般而言,为修复或恢复受损DNA(即,恢复细胞的固有信息),利用未被修饰的互补核苷酸序列的信息或者姐妹染色单体的信息对受损DNA进行修复。HDR最常见的类型为同源重组(HR)。HDR是通常出现在活跃分裂的细胞的S期或G2/M期的修复或恢复方法。
为使用HDR而不使用细胞的姐妹染色单体或互补核苷酸序列对损伤的DNA进行修复或恢复,可将使用互补核苷酸序列或同源核苷酸序列的信息人工合成的DNA模板(即,包含互补核苷酸序列或同源核苷酸序列的核酸模板)提供至细胞,从而修复或恢复受损DNA。此处,当进一步将核酸序列或核酸片段添加至核酸模板来修复或恢复受损DNA时,可使进一步添加至受损DNA的核酸序列或核酸片段经受敲入。进一步添加的核酸序列或核酸片段可为对由正常基因的突变修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸,但本发明不限于此。
在一个实例中,可使用CRISPR复合体切割靶基因或核酸的双链或单链,可将核酸模板(该核酸模板包含与临近切割位点的核苷酸序列互补的核苷酸序列)提供至细胞,并可借助HDR修复或恢复靶基因或核酸的被切割的核苷酸序列。
此处,包含互补核苷酸序列的核酸模板可具有受损DNA(即,被切割的双链或单链)的互补核苷酸序列,并进一步包含待被插入至受损DNA中的核酸序列或核酸片段。可使用包含互补核苷酸序列和待插入的核酸序列或核酸片段的核酸模板将额外核酸序列或核酸片段插入至受损DNA中(即,靶基因或核酸的切割位点)。此处,待插入的核酸序列或核酸片段以及额外核酸序列或核酸片段可为对由正常基因或核酸的突变修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸。互补核苷酸序列可为与受损DNA互补结合的核苷酸序列(即,靶基因或核酸被切割的双链或单链的右侧和左侧的核苷酸序列)。或者,互补核苷酸序列可为与受损DNA互补结合的核苷酸序列(即,靶基因或核酸的被切割的双链或单链的3′和5′端)。互补核苷酸序列可为15nt-3000nt的序列,可根据靶基因或核酸或核酸模板的大小对互补核苷酸序列的长度或大小进行适当设计。此处,核酸模板可为双链或单链的核酸,并可为线性或环状,但本发明不限于此。
在另一实例中,使用CRISPR复合体切割靶基因或核酸的双链或单链,将核酸模板(该核酸模板包含与临近切割位点的核苷酸序列具有同源性的核苷酸序列)提供至细胞,并可通过HDR修复或恢复靶基因或核酸的被切割的核苷酸序列。
此处,包含同源核苷酸序列的核酸模板可具有与受损DNA(即,被切割的双链或单链)具有同源性的核苷酸序列,并进一步包含待插入至受损DNA的核酸序列或核酸片段。可使用包含同源核苷酸序列和待插入的核酸序列或核酸片段的核酸模板将额外核酸序列或核酸片段插入至受损DNA(即,靶基因或核酸的切割位点)。此处,待插入的核酸序列或核酸片段以及额外核酸序列或核酸片段可为对由正常基因或核酸的突变修饰的靶基因或核酸进行修正的核酸序列或核酸片段,或者为待在细胞中表达的基因或核酸。同源核苷酸序列可为与受损DNA具有同源性的核苷酸序列(即,靶基因或核酸的被切割的双链或单链的右侧和左侧的核苷酸序列)。或者,互补的核苷酸序列可为与受损DNA具有同源性的核苷酸序列(即,靶基因或核酸的被切割的双链或单链的3′和5′端)。同源核苷酸序列可为15nt-3000nt的序列,可根据靶基因或核酸或核酸模板的大小对同源核苷酸序列的长度或大小进行适当设计。此处,核酸模板可为双链或单链的核酸,并可为线性或环状,但本发明不限于此。
除了NHEJ和HDR,存在多种对损伤的靶基因进行修复或恢复的方法。例如,对损伤的靶基因进行修复或恢复的方法可为单链退火、单链断裂修复、错配修复、核苷酸切割修复或使用核苷酸切割修复的方法。
单链退火(SSA)是对靶核酸中存在的两个重复序列间的双链断裂进行修复的方法,一般使用多于30个核苷酸的重复序列。对重复序列进行切割(以具有粘性末端),从而在靶核酸双链的各断裂端处具有单链,并且在切割后用RPA蛋白对含有重复序列的单链垂悬部分(overhang)进行包覆,来防止重复序列彼此的不适当退火。RAD52结合至垂悬部分上的各重复序列,并排列能够对互补重复序列进行退火的序列。退火后,垂悬部分的单链flap被切割,合成新DNA来填充特定缺口,从而恢复DNA双链。该修复或恢复的结果是两个重复间的DNA序列被删除,并且删除长度可取决于多种因素(包括本文使用的两个重复的位置以及切割过程的路径或程度)。
就对靶核酸序列进行修饰或修正而言,与HDR类似,SSA利用互补序列(即互补重复序列);与HDR不同,SSA不需要核酸模板。
可通过单链断裂修复(SSBR,与上述修复机制不同的机制)对基因组中的单链断裂进行修复或恢复。在单链DNA断裂的情况下,PARP1和/或PARP2识别断裂并动员修复机制。PARP1对DNA断裂的结合和活性是暂时的,通过促进损伤区域中SSBR蛋白复合体的稳定性来促进SSBR。SSBR复合体中最重要的蛋白是XRCC1,它与促进DNA的3′和5′端加工的蛋白相互作用来稳定DNA。末端加工通常涉及将损伤的3′端修复为羟基化状态和/或将损伤的5′端修复为磷酸部分,并在末端加工后发生DNA缺口填充。存在两种DNA缺口填充方法,即短补丁(patch)修复和长补丁修复,而短补丁修复涉及单核苷酸的插入。在DNA缺口填充后,DNA连接酶促进末端连接。
错配修复(MMR)作用于错配的DNA核苷酸。MSH2/6或MSH2/3复合体各自具有ATPase活性,并因此在识别错配和引发修复中起到重要作用,并且MSH2/6主要识别核苷酸-核苷酸错配并识别一个或两个核苷酸的错配,而MSH2/3主要识别更长的错配。
碱基切除修复(BER)是在整个细胞周期中均活跃的修复方法,其用于从基因组中去除小的非螺旋扭曲碱基损伤区。在损伤的DNA中,通过切割连接核苷酸与脱氧核糖-磷酸骨架的N-糖苷键去除损伤的核苷酸,随后切割磷酸二酯键骨架,从而生成单链DNA中的断裂。去除由此形成的受损单链末端,并利用新的互补核苷酸填充由于单链去除而造成的缺口,随后通过DNA连接酶将新填充的互补核苷酸的末端连接至骨架,引起对损伤DNA的修复或恢复。
核苷酸切除修复(NER)是对于从DNA中去除大的螺旋扭曲损伤而言重要的切除机制,当识别到损伤时,去除含有损伤区域的短单链DNA片段,产生22-30个核苷酸的单链缺口。利用新的互补核苷酸填充生成的缺口,并通过DNA连接酶将新填充的互补核苷酸的末端与骨架连接,引起对损伤DNA的修复或恢复。
通过gRNA-CRISPR酶复合体对靶基因(即,凝血抑制基因)进行人工操纵的效果可主要为敲除、敲减、敲入。
“敲除”是指靶基因或核酸的失活,而“靶基因或核酸的失活”是指不发生靶基因或核酸的转录和/或翻译的状态。通过敲除可对造成疾病的基因或具有异常功能的基因的转录和翻译进行抑制,阻止蛋白表达。
例如,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因或染色体进行编辑时,可使用CRISPR复合体对靶基因或染色体进行切割。可通过NHEJ对使用CRISPR复合体损伤的靶基因或染色体进行修复。通过NHEJ在损伤的靶基因或染色体中生成了插入缺失,从而诱导靶基因或染色体的特异性敲除。
在另一实例中,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)和供体对靶基因或染色体进行编辑时,可使用CRISPR复合体对靶基因或核酸进行切割。使用CRISPR复合体损伤的靶基因或核酸可使用供体借助HDR进行修复。此处,供体包含同源核苷酸序列和期望插入的核苷酸序列。此处,可根据插入的位置或目的来对待插入的核苷酸序列的数目进行改变。当使用供体对损伤的靶基因或染色体进行修复时,将待插入的核苷酸序列插入到损伤的核苷酸序列区域,从而诱导靶基因或染色体的特异性敲除。
“敲减”是指靶基因或核酸的转录和/或翻译或靶蛋白的表达降低。通过借助敲减对基因或蛋白的过表达进行调节,可预防疾病发作或可治疗疾病。
例如,当使用gRNA-CRISPR失活酶-转录抑制活性结构域复合体(即,包含转录抑制活性结构域的CRISPR失活复合体)对靶基因或染色体进行编辑时,CRISPR失活复合体可特异性地结合至靶基因或染色体,并通过CRISPR失活复合体中包含的转录抑制活性结构域对靶基因或染色体的转录进行抑制,从而诱导敲减(其中靶基因或染色体的表达被抑制)。
在另一实例中,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)对靶基因或染色体进行编辑时,可使用CRISPR复合体对靶基因或染色体的启动子和/或增强子区域进行切割。此处,gRNA可以将靶基因或染色体的启动子和/或增强子区域的部分核苷酸序列识别为靶序列。可以通过NHEJ对使用CRISPR复合体损伤的靶基因或染色体进行修复。通过NHEJ在损伤的靶基因或染色体中生成了插入缺失,从而诱导靶基因或染色体特异性敲减。或者,当任选地使用供体时,可以通过HDR对使用CRISPR复合体损伤的靶基因或染色体进行修复。当使用供体对损伤的靶基因或染色体进行修复时,将待插入的核苷酸序列插入至损伤的核苷酸序列区域,从而诱导靶基因或染色体特异性敲减。
“敲入”是指将特定核酸或基因插入至靶基因或核酸,此处,“特定核酸或基因”是指待插入或待表达的感兴趣的核酸或基因。借助敲入通过修正至正常或插入正常基因来诱导正常基因的表达,可将造成疾病的突变基因用于疾病治疗。
此外,敲入可进一步需要供体。
例如,当使用gRNA-CRISPR酶复合体(即CRISPR复合体)和供体对靶基因或核酸进行编辑时,可使用CRISPR复合体对靶基因或核酸进行切割。可使用供体借助HDR对使用CRISPR复合体损伤的靶基因或核酸进行修复。此处,供体可包含特定核酸或基因,并可用于将特定核酸或基因插入至损伤的基因或染色体。此处,插入的特定核酸或基因可诱导蛋白的表达。
在本说明书的公开内容的一个实施方式中,gRNA-CRISPR酶复合体可将人工操作或修饰赋予至AT基因和/或TFPI基因。
gRNA-CRISPR酶复合体可以特异性识别AT基因和/或TFPI基因的靶序列。
靶序列可被gRNA-CRISPR酶复合体的gRNA特异性识别,因此,gRNA-CRISPR酶复合体可位于所识别的靶序列附近。
靶序列可为在AT基因和/或TFPI基因中发生人工修饰的区域或区。
靶序列可为位于AT基因和/或TFPI基因的启动子区域中的10bp-25bp的连续核苷酸序列。
靶序列可为位于AT基因和/或TFPI基因的内含子区域中的10bp-25bp的连续核苷酸序列。
靶序列可为位于AT基因和/或TFPI基因的外显子区域中的10bp-25bp的连续核苷酸序列。
靶序列可为位于AT基因和/或TFPI基因的增强子区域中的10bp-25bp的连续核苷酸序列。
靶序列可为位于AT基因和/或TFPI基因的核酸序列中的PAM序列的5′端和/或3′端附近的10bp-25bp的连续核苷酸序列。
此处,PAM序列可为如下序列中的一种或多种(以5′至3′方向来描述):
NGG(N为A、T、C或G);
NNNNRYAC(N各自独立地为A、T、C或G;R为A或G;且Y为C或T);
NNAGAAW(N各自独立地为A、T、C或G;且W为A或T);
NNNNGATT(N各自独立地为A、T、C或G);
NNGRR(T)(N各自独立地为A、T、C或G;且R为A或G);以及
TTN(N为A、T、C或G)。
在一个实施方式中,靶序列可为选自表1中描述的核苷酸序列中的一个或多个核苷酸序列。
gRNA-CRISPR酶复合体可由gRNA和CRISPR酶组成。
gRNA可包含能够与AT基因和/或TFPI基因的靶序列的引导核酸结合序列部分或完全互补结合的引导结构域。
引导结构域可与引导核酸结合序列具有至少70%、75%、80%、85%、90%或95%的互补性或完全互补性。
引导结构域可包含与AT基因的靶序列的引导核酸结合序列互补的核苷酸序列。此处,互补核苷酸序列可以包含0个至5个、0个至4个、0个至3个或0个至2个错配。
引导结构域可包含与TFPI基因的靶序列的引导核酸结合序列互补的核苷酸序列。此处,互补核苷酸序列可以包含0个至5个、0个至4个、0个至3个或0个至2个错配。
gRNA可包含选自于由第一互补结构域、接头结构域、第二互补结构域、近端结构域和尾部结构域所组成的组中的一个或多个结构域。
CRISPR酶可为选自于由以下所组成的组中的一种或多种蛋白:酿脓链球菌衍生而来的Cas9蛋白、空肠弯曲杆菌衍生而来的Cas9蛋白、嗜热链球菌衍生而来的Cas9蛋白、金黄色葡萄球菌衍生而来的Cas9蛋白、脑膜炎奈瑟菌衍生而来的Cas9蛋白以及Cpf1蛋白。在一个实例中,编辑蛋白可为空肠弯曲杆菌衍生而来的Cas9蛋白或金黄色葡萄球菌衍生而来的Cas9蛋白。
gRNA-CRISPR酶复合体可将多种人工操纵或修饰赋予至AT基因和/或TFPI基因。
在经人工操纵或修饰的AT基因和/或TFPI基因中,位于靶序列中或靠近靶序列的5′端和/或3′端的1bp-50bp的连续核苷酸序列区域中可发生一种或多种修饰。该修饰如下:
i)一个或多个核苷酸的删除,
ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,
iii)一个或多个核苷酸的插入,或
iv)选自于i)至iii)中的两种以上的组合。
例如,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于靶序列中或靠近靶序列的5′端和/或3′端的1-50bp的连续核苷酸序列区域中可删除一个或多个核苷酸。在一个实例中,删除的核苷酸可以是1bp、2bp、3bp、4bp或5bp的序贯或非序贯的核苷酸。在另一实例中,删除的核苷酸可为由2bp以上的序贯的核苷酸组成的核苷酸片段。此处,核苷酸片段的大小可为2bp至5bp、6bp至10bp、11bp至15bp、16bp至20bp、21bp至25bp、26bp至30bp、31bp至35bp、36bp至40bp、41bp至45bp或46bp至50bp。在又一实例中,删除的核苷酸可为两个以上的核苷酸片段。此处,两个以上的核苷酸片段可为不连续的独立核苷酸片段(即具有一个或多个核苷酸序列缺口),并且由于两个以上的删除的核苷酸片段而可产生两个以上的删除位点。
或者,例如,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于靶序列中或靠近靶序列的5′端和/或3′端的1bp-50bp的连续核苷酸序列区域中可发生一个或多个核苷酸的插入。在一个实例中,插入的核苷酸可为1bp、2bp、3bp、4bp或5bp的序贯的核苷酸。在另一实例中,插入的核苷酸可为由5bp以上的序贯的核苷酸组成的核苷酸片段。此处,核苷酸片段的大小可为5bp至10bp、11bp至50bp、50bp至100bp、100bp至200bp、200bp至300bp、300bp至400bp、400bp至500bp、500bp至750bp或750bp至1000bp。在又一实例中,插入的核苷酸可为特定基因的部分或完整的核苷酸序列。此处,特定基因可为包含AT基因和/或TFPI基因的对象(例如人细胞)中不包含的从外部引入的基因。或者,特定基因可为包含AT基因和/或TFPI基因的对象(例如人细胞)中包含的基因。例如,特定基因可为存在于人细胞的基因组中的基因。
或者,例如,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于靶序列中或靠近靶序列的5′端和/或3′端的1bp-50bp的连续核苷酸序列区域中可删除和插入一个或多个核苷酸。在一个实例中,删除的核苷酸可为1bp、2bp、3bp、4bp或5bp的序贯或非序贯的核苷酸。此处,插入的核苷酸可为1bp、2bp、3bp、4bp或5bp的核苷酸,核苷酸片段,或特定基因的部分或完整的核苷酸序列;并且删除和插入可以序贯发生或同时发生。此处,插入的核苷酸片段的大小可为5bp至10bp、11bp至50bp、50bp至100bp、100bp至200bp、200bp至300bp、300bp至400bp、400bp至500bp、500bp至750bp或750bp至1000bp。此处,特定基因可为包含AT基因和/或TFPI基因的对象(例如人细胞)中不包含的从外部引入的基因。或者,特定基因可为包含AT基因和/或TFPI基因的对象(例如人细胞)中包含的基因。例如,特定基因可为存在于人细胞的基因组中的基因。在另一实例中,删除的核苷酸可为由2bp以上的核苷酸组成的核苷酸片段。此处,删除的核苷酸片段的大小可为2bp至5bp、6bp至10bp、11bp至15bp、16bp至20bp、21bp至25bp、26bp至30bp、31bp至35bp、36bp至40bp、41bp至45bp或46bp至50bp。此处,插入的核苷酸可为1bp、2bp、3bp、4bp或5bp的核苷酸,核苷酸片段,或特定基因的部分或完整的核苷酸序列;并且删除和插入可序贯发生或同时发生。在另一实例中,缺失的核苷酸可为两个以上的核苷酸片段。此处,插入的核苷酸可为1bp、2bp、3bp、4bp或5bp的核苷酸,核苷酸片段,或特定基因的部分或完整的核苷酸序列;并且删除和插入可以序贯发生或同时发生。此外,插入可发生在两个以上的被删除部分的局部或完整的部分中。
根据gRNA和CRISPR酶的类型,gRNA-CRISPR酶复合体可以将多种人工操纵或修饰赋予至AT基因和/或TFPI基因。
在一个实例中,当CRISPR酶为SpCas9蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-NGG-3′(N为A、T、G或C)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:
i)一个或多个核苷酸的删除,
ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,
iii)一个或多个核苷酸的插入,或
iv)选自于i)至iii)中的两种以上的组合。
在另一实例中,当CRISPR酶为CjCas9蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-NNNNRYAC-3′(N各自独立地为A、T、G或C,R为A或G,且Y为C或T)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:
i)一个或多个核苷酸的删除,
ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,
iii)一个或多个核苷酸的插入,或
iv)选自于i)至iii)中的两种以上的组合。
在又一实例中,当CRISPR酶为StCas9蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-NNAGAAW-3(N各自独立地为A、T、C或G,且W为A或T)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:
i)一个或多个核苷酸的删除,
ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,
iii)一个或多个核苷酸的插入,或
iv)选自于i)至iii)中的两种以上的组合。
在一个实例中,当CRISPR酶为NmCas9蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-NNNNGATT-3′(N各自独立地为A、T、C或G)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:
i)一个或多个核苷酸的删除,
ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,
iii)一个或多个核苷酸的插入,或
iv)选自于i)至iii)中的两种以上的组合。
在又一实例中,当CRISPR酶为SaCas9蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-NNGRR(T)-3′(N各自独立地为A、T、C或G,R为A或G,且(T)意指任何可插入序列)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:
i)一个或多个核苷酸的删除,
ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,
iii)一个或多个核苷酸的插入,或
iv)选自于i)至iii)中的两种以上的组合。
在又一实例中,当CRISPR酶为Cpf1蛋白时,在经人工操纵或修饰的AT基因和/或TFPI基因中,位于各个基因的靶区域中存在的5′-TNN-3′(N为A、T、C或G)的PAM序列的5′端和/或3′端附近的1bp至50bp、1bp至40bp、或1bp至30bp、并优选1bp至25bp的连续核苷酸序列区域中可包含一个或多个修饰。该修饰如下:
i)一个或多个核苷酸的删除,
ii)将一个或多个核苷酸置换为不同于野生型基因的核苷酸,
iii)一个或多个核苷酸的插入,或
iv)选自于i)至iii)中的两种以上的组合。
由gRNA-CRISPR酶复合体引起的对AT基因和/或TFPI基因的人工操纵作用可为敲除。
由gRNA-CRISPR酶复合体引起的对AT基因和/或TFPI基因的人工操纵作用可为抑制由AT基因和/或TFPI基因中的每一个所编码的蛋白质的表达。
由gRNA-CRISPR酶复合体引起的对AT基因和/或TFPI基因的人工操纵作用可为敲减。
由gRNA-CRISPR酶复合体引起的对AT基因和/或TFPI基因的人工操纵作用可为减少由AT基因和/或TFPI基因中的每一个所编码的蛋白质的表达。
由gRNA-CRISPR酶复合体引起的对AT基因和/或TFPI基因的人工操纵作用可为敲入。
此处,敲入作用可由gRNA-CRISPR酶复合体和额外包含外源核苷酸序列或基因的供体进行诱导。
由gRNA-CRISPR酶复合体和供体引起的对AT基因和/或TFPI基因的人工操纵作用可为对由外源核苷酸序列或基因编码的肽或蛋白质进行表达。
本说明书中公开的一个方面涉及使用用于基因操纵以治疗凝血病的组合物来治疗凝血病的方法。
本说明书中公开的一个实施方式提供了使用以下方法治疗凝血病的用途,所述方法包括向治疗受试者中给予用于基因操纵以人工操纵凝血抑制基因的组合物。
此处,治疗受试者可为哺乳动物,包括灵长类动物(如人、猴等)和啮齿动物(如大鼠、小鼠等)。
术语“凝血病(即,出血性障碍)”是指血液凝块的形成被异常的凝血系统抑制或阻抑的病症。该凝血病包括凝血(即血栓形成)被抑制或阻抑、并因此出血不停止或止血被延迟的病症。它是指包括由此引起的所有类型疾病的病理状况。
在这种情况下,凝血病包括由异常的凝血系统和凝血抑制因子引起的所有类型的疾病。
术语“凝血抑制因子诱导的疾病”是指包括由于凝血抑制因子的异常形式(例如突变等)或表达异常而引起的所有类型的疾病的所有病症。
凝血病可为血友病,是由体内异常凝血系统引起的疾病。
在一个实施方式中,凝血病可为血友病A、血友病B或血友病C。
血友病(或血友病)是由凝血因子缺乏而天生地引起的先天性出血性疾病。迄今为止,已知有12种凝血因子。在先天性凝血缺乏的症状中,血友病A由因子VIII的缺乏引起,血友病B由因子IX(Christmas病)的缺乏引起,且血友病C由因子XI的缺乏引起。血友病A和血友病B占血友病的95%或更多,并且由于两种疾病均具有与内在凝血机制相关的凝血因子,因此可能不容易在临床上彼此区分开。血友病A和血友病B天生地为X连锁隐性性状,女性为沉默携带者,而只有男婴保持为患者。
血友病A是VIII因子缺乏的症状。血友病A的20%至30%由无家族史的突变引起。其发病率约为每4,000至10,000名男婴中的一名,而血友病A的发病率为血友病B的约5至8倍。
血友病B是遗传性凝血障碍的第二常见类型,并且据观察,儿童和青少年中血友病B的出血症状比在成人中更为明显。女性携带者有轻微的症状,但是10%的女性携带者有出血的风险。其发病率约为每20,000至25,000名男婴中一名。
血友病C占所有凝血因子缺乏症的约2%至3%。在韩国,尚无血友病C病例的报道,其天生地为常染色体隐性的。
血友病A的临床症状是外伤、拔牙和手术后不受控制的出血。严重的血友病A可能在出生后一年内被诊断出,并且在不进行治疗的情况下在2个月至5个月出现自发性出血症状。
同样,中度严重的血友病A倾向于发展出自发性出血。但是,由于症状出现的延迟,其在5岁至6岁之前通过轻微创伤后不受控制的出血被诊断。在轻度血友病A的情况下未观察到自发性出血。轻度血友病A具有手术、拔牙和重伤后不受控制的出血的症状,并在许多情况下,可能一生中不被诊断。血友病A的出血症状在儿童和青少年中比在成人中更为明显。女性携带者具有轻度症状,但是10%的女性携带者有出血的风险。
由于缺乏因子IX,血友病B具有在外伤、拔牙或手术停止后的最初出血后出现不受控制的出血的症状。在严重的B型血友病中经常观察到关节积血。严重的血友病B可能在出生后一年内被诊断出,并且在不进行治疗的情况下在2个月至5个月出现自发性出血症状。此外,中度严重的血友病B倾向于发展出自发性出血,但与严重的血友病B相比,其出现延迟。中度严重的血友病B具有外伤后不受控制的出血的症状,并在5岁至6岁之前被诊断出。轻度血友病B没有自发性出血,并且具有手术、拔牙和重伤后不受控制的出血的症状。轻度血友病B可能一生中完全不会被诊断出,因为它没有任何症状。
血友病的一般治疗是通过补充不足的凝血因子来实现的。在这种情况下,当前使用因子VIII和因子IX制剂,并且在治疗过程中产生抗体时给予旁路因子(Kemton CL等,Blood.2009;113(1):11-17)。
本说明书的公开内容的一个实施方式提供了如下的药物组合物,所述药物组合物包含可人工操纵凝血抑制基因的用于基因操纵的组合物。
与用于基因操纵的组合物有关的描述如上所述。
在一个实施方式中,用于基因操纵的组合物可包含以下组分:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够靶向凝血抑制基因的靶序列;以及
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。
此处,凝血抑制基因可为AT基因和/或TFPI基因。
此处,用于基因操纵的组合物可包含载体,所述载体包含分别编码引导核酸和/或编辑蛋白的核酸序列。
此处,引导核酸或编码所述引导核酸的核酸序列、以及编码编辑蛋白的核酸序列可以一种或多种载体的形式存在。它们可以以同源或异源载体的形式存在。
在另一实施方式中,用于基因操纵的组合物可以包含以下组分:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够靶向凝血抑制基因的靶序列;
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白;以及
(c)供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。
此处,待插入的核酸序列可为凝血抑制基因的部分序列。
或者,待插入的核酸序列可为编码凝血相关蛋白的基因的完整或部分序列。
此处,凝血相关蛋白可为因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白或组织因子。
此处,引导核酸或编码所述引导核酸的核酸序列、以及编码编辑蛋白的核酸序列、以及包含待插入的核酸序列的供体或编码所述供体的核酸序列可以以一种或多种载体的形式存在。它们可以以同源或异源载体的形式存在。
该药物组合物可进一步包含额外的组分。
额外的组分可包括用于递送至受试者体内的合适的载体。
在另一实施方式中,用于基因操纵的组合物可以包括以下组分:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;以及
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。
此处,凝血抑制基因可为AT基因和/或TFPI基因。
此处,用于基因操纵的组合物可包含载体,所述载体包含分别编码引导核酸和/或编辑蛋白的核酸序列。
此处,引导核酸或编码所述引导核酸的核酸序列、以及编码编辑蛋白的核酸序列可以以一种或多种载体的形式存在。它们可以以同源或异源载体的形式存在。
在另一实施方式中,用于基因操纵的组合物可以包括以下组分:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白;以及
(c)供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。
此处,待插入的核酸序列可为凝血抑制基因的部分序列。
或者,待插入的核酸序列可为编码凝血相关蛋白的基因的完整或部分序列。
此处,与凝血相关的蛋白质可以是因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白或组织因子。
此处,引导核酸或编码所述引导核酸的核酸序列、以及编码编辑蛋白的核酸序列、以及包含待插入的核酸序列的供体或编码所述供体的核酸序列可以以一种或多种载体的形式存在。它们可以以同源或异源载体的形式存在。
该药物组合物可以进一步包含额外的组分。
额外的组分可包括用于递送到受试者体内的合适的载体。
本说明书的公开内容的一个实施方式提供了治疗凝血病的方法,所述方法包括向患有凝血病的有机体给予用于基因操纵的组合物以治疗凝血病。
该治疗方法可为通过操纵有机体的基因来调节凝血系统的治疗方法。此类治疗方法可通过将用于基因操纵的组合物直接注射到体内以操纵有机体的基因来实现。
与用于基因操纵的组合物有关的描述如上所述。
在一个实施方式中,用于基因操纵的组合物可包含以下组分:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够靶向凝血抑制基因的靶序列;以及
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。
或者,在另一实施方式中,用于基因操纵的组合物可包含以下组分:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;以及
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。
此处,凝血抑制基因可为AT基因和/或TFPI基因。
引导核酸和编辑蛋白可以各自以核酸序列的形式存在于一种或多种载体中,或者通过将引导核酸和编辑蛋白结合形成复合体而存在。
任选地,用于基因操纵的组合物可以进一步包含供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。
引导核酸和编辑蛋白和/或供体可各自以核酸序列的形式存在于一种或多种载体中。
此处,载体可为质粒或病毒载体。
此处,病毒载体可以是选自于由逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒所组成的组中的一种或多种。
与凝血病有关的描述如上所述。
凝血病可为血友病A、血友病B或血友病C。
可向患有凝血病的治疗受试者中给予用于基因操纵的组合物。
治疗受试者可为哺乳动物,包括灵长类动物(如人、猴等)和啮齿动物(如大鼠、小鼠等)。
可以向治疗受试者给予用于基因操纵的组合物。
给予可通过注射、输注、植入或移植进行。
给予可通过选自如下的给予途径进行:肝内、皮下、皮内、眼内、玻璃体内、肿瘤内、结节内、髓内、肌内、静脉内、淋巴管内和腹膜内途径。
用于基因操纵的组合物的剂量(用于获得预定的期望的效果的药学上有效的量)为约104个至109个细胞/kg(给予受试者的体重),例如,约105个至106个细胞/kg(体重),其可以从数值范围内的所有整数中选择,但是本发明不限于此。可以考虑给予受试者的年龄、健康状况和体重、同时治疗的类型、以及(如果可能的话)治疗的频率和期望的效果来适当地对组合物开处方。
当使用根据本说明书中公开的一些实施方式的方法和组合物对凝血抑制基因进行人工操纵时,可以使凝血系统正常化,从而达到抑制或改善异常出血症状等的效果。
本说明书中公开的一个实施方式涉及修饰真核细胞中的凝血抑制基因的方法,所述方法可以在体内、离体或在体外进行。
在一些实施方式中,该方法包括从人或非人动物中取出细胞或细胞群,并修饰该一个或多个细胞。培养可以在离体的任何阶段进行。该一个或多个细胞甚至可以重新引入非人动物或植物中。
该方法可为人工操纵真核细胞的方法,所述方法包括将用于基因操纵的组合物引入真核细胞。
与用于基因操作的组合物有关的描述如上所述。
在一个实施方式中,用于基因操纵的组合物可包含以下组分:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸能够靶向凝血抑制基因的靶序列;以及
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。
或者,在另一实施方式中,用于基因操纵的组合物可包含以下组分:
(a)引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含能够与凝血抑制基因的靶序列形成互补结合的引导序列;以及
(b)编辑蛋白或编码所述编辑蛋白的核酸序列,所述编辑蛋白包括选自于由以下所组成的组中的一种或多种蛋白:由酿脓链球菌衍生而来的Cas9蛋白、由空肠弯曲杆菌衍生而来的Cas9蛋白、由嗜热链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白、由脑膜炎奈瑟菌衍生而来的Cas9蛋白和Cpf1蛋白。
此处,凝血抑制基因可为AT基因和/或TFPI基因。
引导核酸和编辑蛋白可各自以核酸序列的形式存在于一种或多种载体中,或者通过将引导核酸和编辑蛋白结合形成复合体而存在。
引入步骤可以在体内或离体进行。
例如,可以通过选自电穿孔、脂质体、质粒、病毒载体、纳米颗粒和蛋白质转位结构域(PTD)融合蛋白方法中的一种或多种方法来进行引入步骤。
例如,病毒载体可为选自于由以下所组成的组中的一种或多种:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。
实施例
下文中,将参考实施例更详细地描述本发明。
提供这些实施例仅是为了阐明本发明,并且将对于本领域的普通技术人员显而易见的是,本发明的范围不限于以下实施例。
实验方法
1.sgRNA的设计
使用CRISPR RGEN工具(韩国基础科学研究院,韩国)的Cas-Designer程序,考虑到每个PAM,从人SERPINC1和TFPI基因中提取CRISPR/SpCas9或CRISPR/SaCas9或CRISPR/CjCas9的靶标。而且,使用Cas-Offinder程序筛选了靶标,所述靶标的1个碱基和2个碱基错配的脱靶位点在人基因组中不期望。将本实验中使用的sgRNA设计为包括表3和表4中所列出的至少一个引导序列。
2.对引导RNA活性的确认和脱靶分析
使用Lipofectamine 2000,用克隆有各引导RNA序列的250ng的sgRNA表达载体与750ng的Cas9表达载体一起转染HEK293和Jurkat人细胞系(细胞计数:2×105个细胞)。或者,将1μg体外转录的sgRNA和4μg Cas9以RNP复合体的形式混合,并通过电穿孔进行转染。约2至3天后,提取基因组DNA,并通过PCR在中靶位点进行扩增,然后使所得的PCR产物经受额外的PCR,以将对用于下一代测序的测序引物和TruSeq HT双索引引物具有特异性的衔接子连接至PCR产物。此后,分析通过配对测序获得的读长,以通过确认中靶基因组位点处的插入或删除(插入缺失)对引导RNA的活性进行评价。
对于经筛选的引导RNA的脱靶分析,首先,使用CRISPR RGEN工具的Cas-Offinder通过计算机模拟方法筛选3碱基错配脱靶列表,并通过对应于每个脱靶位点的基因组某个区域的靶向深度测序的方法进行验证。作为第二种方法,使人全基因组DNA经受全基因组测序,并通过Digenome-seq分析确定了潜在的清单,所述人全基因组DNA用引导RNA和Cas9蛋白在37℃下处理过夜。然后,通过每个脱靶候选者的基因组的某个区域的靶向深度测序的方法,对插入缺失是否添加至脱靶位点处进行验证。
3.AAV构建
使用双AAV系统递送SpCas9基因编辑工具。即,通过合成构建以下中每一个:包含BGHA、在其C末端或N末端处具有NLS-HA标签的人密码子优化的Cas9和在AAV2的反向串联重复序列(ITR)之间的哺乳动物表达启动子(EFS、TBG和ICAM2)的载体(pAAV-SpCas9),以及包含U6启动子sgRNA序列的载体(pAAV-U6-sgRNA)。
此外,另一双AAV系统使用Split SpCas9。在一个AAV中,构建了包含在ITR之间的启动子(TBG、ICAM2)-SpCas9-Nterm-Intein的载体(pAAV-SpCas9-split-Nterm),并且在另一AAV中,构建了包含在ITR之间的启动子(TBG、ICAM2)-Intein-SpCas9-Cterm-U6-SgRNA的载体(pAAV-SpCas9-split-C-term-U6-SgRNA)。
使用单个AAV系统递送CjCas9基因编辑工具。即,通过合成构建包含如下的载体(pAAV-CjCas9-U6-sgRNA):在AAV2 ITR之间的启动子(EFS、TBG和ICAM2),在其C末端或N末端处具有NLS-HA标签的人密码子优化的Cas9,BGHA、U6启动子和sgRNA序列。为了生产AAV,将HEK293细胞用AAV衣壳的假型的载体、构建的pAAV载体(pAAV-EFS-SpCas9或pAAV-U6-sgRNA或pAAV-EFS-CjCas9-U6-sgRNA)以及pHelper载体以1∶1∶1的摩尔浓度同时进行转染。72小时后,裂解细胞,然后通过使用碘克沙醇(Sigma-Aldrich)的逐步梯度超速离心分离并纯化得到的病毒颗粒,并通过使用qPCR的滴定法进行AAV的定量测定。
4.动物和注射
将F8-KO小鼠和F9-KO大鼠分别用作血友病A和血友病B模型动物。使用静脉内或腹膜内注射所构建的AAV和LNP的方法,将每种CRISPR/Cas9递送至动物模型。
5.体内编辑测试
AAV和LNP注射后约4周至6周,取出肝脏,并提取基因组DNA,以通过PCR和靶向深度测序来评价中靶和脱靶位点处的插入缺失。
6.血友病指示物测试
AAV和LNP注射后,在各个时间点(1W-4W-8W-16W-32W等)收集血液,以通过ELISA评价血液中的Serpinc1和TFPI蛋白的量,或通过PT、aPTT测定法、免疫组织化学、切尾测定法(tail cutting assay)(失血定量)等来评价血友病指示物。
实验结果
1.对引导RNA的活性的验证
通过插入缺失(%)证实了靶向SERPINC1基因(AT基因)和TFPI基因中的每一种的gRNA的活性,以筛选gRNA。
1)SERPINC1基因(AT基因)
①SpCas9
表5对于SpCas9,选择gRNA以靶向SERPINC1基因(AT基因)
Figure BDA0002994148170001431
Figure BDA0002994148170001441
②SaCas9
表6对于SaCas9,选择gRNA以靶向SERPINC1基因(AT基因)
Figure BDA0002994148170001443
Figure BDA0002994148170001451
③CjCas9
表7对于CjCas9,选择gRNA以靶向SERPINC1基因(AT基因)
Figure BDA0002994148170001461
Figure BDA0002994148170001471
2)TFPI基因
①SpCas9
表8对于SpCas9,选择gRNA以靶向TFPI基因
Figure BDA0002994148170001481
Figure BDA0002994148170001491
②SaCas9
表9对于SaCas9,选择gRNA以靶向TFPI基因
Figure BDA0002994148170001492
Figure BDA0002994148170001501
③CjCas9
表10对于CjCas9,选择gRNA以靶向TFPI基因
Figure BDA0002994148170001503
Figure BDA0002994148170001511
因此,预期包含靶向本研究中提出的AT基因和TFPI基因的gRNA和Cas9的组合物可用于治疗血友病。
工业实用性
根据本发明,可以使用用于基因操纵的组合物通过人工操纵和/或修饰凝血抑制基因以调节凝血抑制基因的功能和/或表达来调节凝血系统,所述组合物包含靶向凝血抑制基因的引导核酸和编辑蛋白,并因此可以使用该用于基因操纵的组合物来治疗或改善凝血病。
序列表文本
AT基因和TFPI基因的靶序列和能够靶向该靶序列的引导序列。
<110> 株式会社图尔金(TOOLGEN INCORPORATED)
<120> 抗凝因子的基因编辑
<130> OPP17-052-PCT
<150> US 62/703578
<151> 2018-07-26
<160> 848
<170> KoPatentIn 3.0
<210> 1
<211> 12
<212> RNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 1
guuuuagagc ua 12
<210> 2
<211> 25
<212> RNA
<213> 空肠弯曲杆菌(Campylobacter jejuni)
<400> 2
guuuuagucc cuuuuuaaau uucuu 25
<210> 3
<211> 13
<212> RNA
<213> 空肠弯曲杆菌(Campylobacter jejuni)
<400> 3
guuuuagucc cuu 13
<210> 4
<211> 9
<212> RNA
<213> 未知
<220>
<223> 俭菌总门细菌(Parcubacteria bacterium)
<400> 4
uuuguagau 9
<210> 5
<211> 14
<212> RNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 5
uagcaaguua aaau 14
<210> 6
<211> 25
<212> RNA
<213> 空肠弯曲杆菌(Campylobacter jejuni)
<400> 6
aagaaauuua aaaagggacu aaaau 25
<210> 7
<211> 13
<212> RNA
<213> 空肠弯曲杆菌(Campylobacter jejuni)
<400> 7
aagggacuaa aau 13
<210> 8
<211> 11
<212> RNA
<213> 未知
<220>
<223> 俭菌总门细菌(Parcubacteria bacterium)
<400> 8
aaauuucuac u 11
<210> 9
<211> 12
<212> RNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 9
aaggcuaguc cg 12
<210> 10
<211> 11
<212> RNA
<213> 空肠弯曲杆菌(Campylobacter jejuni)
<400> 10
aaagaguuug c 11
<210> 11
<211> 34
<212> RNA
<213> 酿脓链球菌(Streptococcus pyogenes)
<400> 11
uuaucaacuu gaaaaagugg caccgagucg gugc 34
<210> 12
<211> 38
<212> RNA
<213> 空肠弯曲杆菌(Campylobacter jejuni)
<400> 12
gggacucugc gggguuacaa uccccuaaaa ccgcuuuu 38
<210> 13
<211> 22
<212> RNA
<213> 嗜热链球菌(Streptococcus thermophilus)
<400> 13
guuuuagagc uguguuguuu cg 22
<210> 14
<211> 24
<212> RNA
<213> 嗜热链球菌(Streptococcus thermophilus)
<400> 14
cgaaacaaca cagcgaguua aaau 24
<210> 15
<211> 13
<212> RNA
<213> 嗜热链球菌(Streptococcus thermophilus)
<400> 15
aaggcuuagu ccg 13
<210> 16
<211> 38
<212> RNA
<213> 嗜热链球菌(Streptococcus thermophilus)
<400> 16
uacucaacuu gaaaaggugg caccgauucg guguuuuu 38
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶序列
<400> 17
atcattggca gactagttcg 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 靶序列
<400> 18
cgaactagtc tgccaatgat 20
<210> 19
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 19
tcctatcaca ttggaataca 20
<210> 20
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 20
ggttacagtt cctatcacat 20
<210> 21
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 21
gccatgtatt ccaatgtgat 20
<210> 22
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 22
gtgataggaa ctgtaacctc 20
<210> 23
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 23
cccctcttac ctttttccag 20
<210> 24
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 24
gaactgtaac ctctggaaaa 20
<210> 25
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 25
ccagaagcca atgagcagca 20
<210> 26
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 26
cttttgtcct tgctgctcat 20
<210> 27
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 27
ccttgctgct cattggcttc 20
<210> 28
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 28
cttgctgctc attggcttct 20
<210> 29
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 29
tgggactgcg tgacctgtca 20
<210> 30
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 30
gggactgcgt gacctgtcac 20
<210> 31
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 31
gtccacaggg ctcccgtgac 20
<210> 32
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 32
gacctgtcac gggagccctg 20
<210> 33
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 33
tggctgtgca gatgtccaca 20
<210> 34
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 34
ttggctgtgc agatgtccac 20
<210> 35
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 35
acatctgcac agccaagccg 20
<210> 36
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 36
catctgcaca gccaagccgc 20
<210> 37
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 37
catgggaatg tcccgcggct 20
<210> 38
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 38
ggattcatgg gaatgtcccg 20
<210> 39
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 39
taaatgcaca tgggattcat 20
<210> 40
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 40
gtaaatgcac atgggattca 20
<210> 41
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 41
ggggagcggt aaatgcacat 20
<210> 42
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 42
cggggagcgg taaatgcaca 20
<210> 43
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 43
catgtgcatt taccgctccc 20
<210> 44
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 44
ttgccttctt ctccggggag 20
<210> 45
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 45
ctcagttgcc ttcttctccg 20
<210> 46
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 46
cctcagttgc cttcttctcc 20
<210> 47
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 47
tcctcagttg ccttcttctc 20
<210> 48
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 48
ttaccgctcc ccggagaaga 20
<210> 49
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 49
cccggagaag aaggcaactg 20
<210> 50
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 50
gaagaaggca actgaggatg 20
<210> 51
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 51
aagaaggcaa ctgaggatga 20
<210> 52
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 52
gggctcagaa cagaagatcc 20
<210> 53
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 53
ctcagaacag aagatcccgg 20
<210> 54
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 54
cacgccggtt ggtggcctcc 20
<210> 55
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 55
acacgccggt tggtggcctc 20
<210> 56
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 56
agatcccgga ggccaccaac 20
<210> 57
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 57
ttcccagaca cgccggttgg 20
<210> 58
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 58
cagttcccag acacgccggt 20
<210> 59
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 59
tggacagttc ccagacacgc 20
<210> 60
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 60
aggccaccaa ccggcgtgtc 20
<210> 61
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 61
ggccaccaac cggcgtgtct 20
<210> 62
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 62
gcgtgtctgg gaactgtcca 20
<210> 63
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 63
agcaaagcgg gaattggcct 20
<210> 64
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 64
agtggtagca aagcgggaat 20
<210> 65
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 65
atagaaagtg gtagcaaagc 20
<210> 66
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 66
gatagaaagt ggtagcaaag 20
<210> 67
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 67
tgccaggtgc tgatagaaag 20
<210> 68
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 68
taccactttc tatcagcacc 20
<210> 69
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 69
tgtcattctt ggaatctgcc 20
<210> 70
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 70
aatgttatca ttgtcattct 20
<210> 71
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 71
tggagatact caggggtgac 20
<210> 72
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 72
aaagccgtgg agatactcag 20
<210> 73
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 73
aaaagccgtg gagatactca 20
<210> 74
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 74
caaaagccgt ggagatactc 20
<210> 75
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 75
gtcacccctg agtatctcca 20
<210> 76
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 76
cttggtcata gcaaaagccg 20
<210> 77
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 77
ggcttttgct atgaccaagc 20
<210> 78
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 78
gcttttgcta tgaccaagct 20
<210> 79
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 79
gtcattacag gcacccagct 20
<210> 80
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 80
ttgctggagg gtgtcattac 20
<210> 81
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 81
tacctccatc agttgctgga 20
<210> 82
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 82
gtacctccat cagttgctgg 20
<210> 83
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 83
gtcgtacctc catcagttgc 20
<210> 84
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 84
tgacaccctc cagcaactga 20
<210> 85
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 85
caccctccag caactgatgg 20
<210> 86
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 86
atcagatgtt ttctcagata 20
<210> 87
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 87
tcagtttggc aaagaagaag 20
<210> 88
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 88
atagagtcgg cagttcagtt 20
<210> 89
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 89
tgttggcttt tcgatagagt 20
<210> 90
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 90
tactaacttg gaggatttgt 20
<210> 91
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 91
attggctgat actaacttgg 20
<210> 92
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 92
gcgattggct gatactaact 20
<210> 93
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 93
tttgtctcca aaaaggcgat 20
<210> 94
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 94
gtatcagcca atcgcctttt 20
<210> 95
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 95
taagggattt gtctccaaaa 20
<210> 96
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 96
gtaggtctca ttgaaggtaa 20
<210> 97
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 97
ggtaggtctc attgaaggta 20
<210> 98
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 98
gtcctggtag gtctcattga 20
<210> 99
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 99
taccttcaat gagacctacc 20
<210> 100
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 100
caactcactg atgtcctggt 20
<210> 101
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 101
ataccaactc actgatgtcc 20
<210> 102
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 102
ctaccaggac atcagtgagt 20
<210> 103
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 103
gacatcagtg agttggtata 20
<210> 104
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 104
gaagtccagg ggctggagct 20
<210> 105
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 105
tggagccaag ctccagcccc 20
<210> 106
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 106
tcaccttgaa gtccaggggc 20
<210> 107
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 107
caactcacct tgaagtccag 20
<210> 108
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 108
gcaactcacc ttgaagtcca 20
<210> 109
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 109
tgcaactcac cttgaagtcc 20
<210> 110
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 110
gctccagccc ctggacttca 20
<210> 111
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 111
gattgctctg cattttcctg 20
<210> 112
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 112
aaatgcagag caatccagag 20
<210> 113
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 113
ccatttgttg atggccgctc 20
<210> 114
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 114
attggacacc catttgttga 20
<210> 115
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 115
ccagagcggc catcaacaaa 20
<210> 116
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 116
cagagcggcc atcaacaaat 20
<210> 117
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 117
gattcggcct tcggtcttat 20
<210> 118
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 118
tgggtgtcca ataagaccga 20
<210> 119
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 119
gacatcggtg attcggcctt 20
<210> 120
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 120
agggaatgac atcggtgatt 20
<210> 121
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 121
ggcttccgag ggaatgacat 20
<210> 122
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 122
aatcaccgat gtcattccct 20
<210> 123
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 123
agctcattga tggcttccga 20
<210> 124
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 124
gagctcattg atggcttccg 20
<210> 125
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 125
cagaacagtg agctcattga 20
<210> 126
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 126
catcaatgag ctcactgttc 20
<210> 127
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 127
tgagctcact gttctggtgc 20
<210> 128
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 128
tctgagtacc ttgaagtaaa 20
<210> 129
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 129
ggttaacacc atttacttca 20
<210> 130
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 130
actttgactt ccacaggccc 20
<210> 131
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 131
tgattctctt ccagggcctg 20
<210> 132
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 132
ggctgaactt tgacttccac 20
<210> 133
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 133
gttccttcct tgtgttctca 20
<210> 134
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 134
agttccttcc ttgtgttctc 20
<210> 135
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 135
agttcagccc tgagaacaca 20
<210> 136
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 136
cagccctgag aacacaagga 20
<210> 137
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 137
aaggaaggaa ctgttctaca 20
<210> 138
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 138
gaactgttct acaaggctga 20
<210> 139
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 139
ttcagcatct atgatgtacc 20
<210> 140
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 140
gcatctatga tgtaccagga 20
<210> 141
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 141
gataacggaa cttgccttcc 20
<210> 142
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 142
aggaaggcaa gttccgttat 20
<210> 143
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 143
cttcagccac gcgccgataa 20
<210> 144
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 144
caagttccgt tatcggcgcg 20
<210> 145
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 145
cgttatcggc gcgtggctga 20
<210> 146
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 146
gcgcgtggct gaaggcaccc 20
<210> 147
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 147
gaagggcaac tcaagcacct 20
<210> 148
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 148
tgaagggcaa ctcaagcacc 20
<210> 149
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 149
gtgcttgagt tgcccttcaa 20
<210> 150
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 150
gtgatgtcat cacctttgaa 20
<210> 151
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 151
ggtgatgtca tcacctttga 20
<210> 152
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 152
caaaggtgat gacatcacca 20
<210> 153
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 153
cttgggcaag atgaggacca 20
<210> 154
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 154
tctcaggctt gggcaagatg 20
<210> 155
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 155
gccaggctct tctcaggctt 20
<210> 156
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 156
ggccaggctc ttctcaggct 20
<210> 157
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 157
accttggcca ggctcttctc 20
<210> 158
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 158
gcccaagcct gagaagagcc 20
<210> 159
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 159
gcctgagaag agcctggcca 20
<210> 160
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 160
gttccttctc taccttggcc 20
<210> 161
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 161
ggtgagttcc ttctctacct 20
<210> 162
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 162
gagcctggcc aaggtagaga 20
<210> 163
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 163
agagaaggaa ctcaccccag 20
<210> 164
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 164
ccactcttgc agcacctctg 20
<210> 165
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 165
gccactcttg cagcacctct 20
<210> 166
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 166
agccactctt gcagcacctc 20
<210> 167
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 167
ccccagaggt gctgcaagag 20
<210> 168
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 168
agaggtgctg caagagtggc 20
<210> 169
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 169
gcaagagtgg ctggatgaat 20
<210> 170
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 170
agagtggctg gatgaattgg 20
<210> 171
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 171
tgaattggag gagatgatgc 20
<210> 172
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 172
attggaggag atgatgctgg 20
<210> 173
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 173
caatgcggaa gcggggcatg 20
<210> 174
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 174
ccgtcctcaa tgcggaagcg 20
<210> 175
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 175
gccgtcctca atgcggaagc 20
<210> 176
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 176
agccgtcctc aatgcggaag 20
<210> 177
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 177
catgccccgc ttccgcattg 20
<210> 178
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 178
aactgaagcc gtcctcaatg 20
<210> 179
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 179
ccccgcttcc gcattgagga 20
<210> 180
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 180
tgaggacggc ttcagtttga 20
<210> 181
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 181
gaaggagcag ctgcaagaca 20
<210> 182
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 182
aaggagcagc tgcaagacat 20
<210> 183
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 183
cagggctgaa cagatcgaca 20
<210> 184
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 184
ctgggagttt ggacttttca 20
<210> 185
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 185
cctgggagtt tggacttttc 20
<210> 186
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 186
cctagacaaa cctgggagtt 20
<210> 187
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 187
cctgaaaagt ccaaactccc 20
<210> 188
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 188
cggccttctg caacaatacc 20
<210> 189
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 189
cttccaggta ttgttgcaga 20
<210> 190
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 190
ctgagacata gaggtcatct 20
<210> 191
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 191
ggaatgcatc tgagacatag 20
<210> 192
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 192
tgtctcagat gcattccata 20
<210> 193
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 193
tcacctcaag aaatgcctta 20
<210> 194
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 194
attccataag gcatttcttg 20
<210> 195
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 195
gacctgcagg taaatgaaga 20
<210> 196
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 196
acggccagca atcacaacag 20
<210> 197
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 197
agtaccgctg ttgtgattgc 20
<210> 198
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 198
ccctgttggg gtttagcgaa 20
<210> 199
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 199
gccgttcgct aaaccccaac 20
<210> 200
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 200
ccgttcgcta aaccccaaca 20
<210> 201
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 201
ccttgaaagt caccctgttg 20
<210> 202
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 202
gccttgaaag tcaccctgtt 20
<210> 203
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 203
ggccttgaaa gtcaccctgt 20
<210> 204
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 204
ccccaacagg gtgactttca 20
<210> 205
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 205
gggtgacttt caaggccaac 20
<210> 206
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 206
aaaaaccagg aaaggcctgt 20
<210> 207
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 207
caaggccaac aggcctttcc 20
<210> 208
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 208
tctcttataa aaaccaggaa 20
<210> 209
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 209
gaacttctct tataaaaacc 20
<210> 210
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 210
atgaagataa tagtgttcag 20
<210> 211
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 211
tctgaacact attatcttca 20
<210> 212
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 212
ctgaacacta ttatcttcat 20
<210> 213
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 213
attttactta acacaagggt 20
<210> 214
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 214
gaacatttta cttaacacaa 20
<210> 215
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 215
agaacatttt acttaacaca 20
<210> 216
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 216
ggttacagtt cctatcacat 20
<210> 217
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 217
ccaagccgcg ggacattccc 20
<210> 218
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 218
taaatgcaca tgggattcat 20
<210> 219
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 219
cggggagcgg taaatgcaca 20
<210> 220
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 220
ccccggagaa gaaggcaact 20
<210> 221
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 221
acacgccggt tggtggcctc 20
<210> 222
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 222
atagaaagtg gtagcaaagc 20
<210> 223
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 223
atcagcacct ggcagattcc 20
<210> 224
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 224
aatgttatca ttgtcattct 20
<210> 225
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 225
ataacatttt cctgtcaccc 20
<210> 226
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 226
caaaagccgt ggagatactc 20
<210> 227
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 227
cggcttttgc tatgaccaag 20
<210> 228
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 228
cgtacctcca tcagttgctg 20
<210> 229
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 229
ttcagtttgg caaagaagaa 20
<210> 230
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 230
aggatttgtt ggcttttcga 20
<210> 231
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 231
gattggctga tactaacttg 20
<210> 232
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 232
ggtaggtctc attgaaggta 20
<210> 233
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 233
tgagacctac caggacatca 20
<210> 234
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 234
tccagcccct ggacttcaag 20
<210> 235
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 235
cccatttgtt gatggccgct 20
<210> 236
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 236
tccagagcgg ccatcaacaa 20
<210> 237
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 237
gtgtccaata agaccgaagg 20
<210> 238
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 238
agctcattga tggcttccga 20
<210> 239
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 239
actgttctac aaggctgatg 20
<210> 240
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 240
ggctgaaggc acccaggtgc 20
<210> 241
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 241
ttgaagggca actcaagcac 20
<210> 242
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 242
actcttgcag cacctctggg 20
<210> 243
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 243
agccactctt gcagcacctc 20
<210> 244
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 244
actcacccca gaggtgctgc 20
<210> 245
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 245
cagaggtgct gcaagagtgg 20
<210> 246
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 246
ggtgctgcaa gagtggctgg 20
<210> 247
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 247
tcacctcaag aaatgcctta 20
<210> 248
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 248
tccataaggc atttcttgag 20
<210> 249
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 249
ggccgttcgc taaaccccaa 20
<210> 250
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 250
ggccttgaaa gtcaccctgt 20
<210> 251
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 251
aacactatta tcttcatggg 20
<210> 252
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 252
aagaacattt tacttaacac 20
<210> 253
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 253
gaggttacag ttcctatcac at 22
<210> 254
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 254
ctgtcacggg agccctgtgg ac 22
<210> 255
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 255
gccttcttct ccggggagcg gt 22
<210> 256
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 256
gggaattggc cttggacagt tc 22
<210> 257
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 257
tcccgctttg ctaccacttt ct 22
<210> 258
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 258
gcttggtcat agcaaaagcc gt 22
<210> 259
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 259
tatgaccaag ctgggtgcct gt 22
<210> 260
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 260
tcagttgctg gagggtgtca tt 22
<210> 261
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 261
atgacaccct ccagcaactg at 22
<210> 262
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 262
ttgacttcta taggtattta ag 22
<210> 263
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 263
tttctcagat atggtgtcaa ac 22
<210> 264
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 264
tttgtctcca aaaaggcgat tg 22
<210> 265
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 265
gtccaggggc tggagcttgg ct 22
<210> 266
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 266
ggtgattcgg ccttcggtct ta 22
<210> 267
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 267
tgagctcact gttctggtgc tg 22
<210> 268
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 268
taccttgaag taaatggtgt ta 22
<210> 269
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 269
tgctggttaa caccatttac tt 22
<210> 270
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 270
gtggaagtca aagttcagcc ct 22
<210> 271
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 271
ggagagtcgt gttcagcatc ta 22
<210> 272
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 272
ccttcctggt acatcataga tg 22
<210> 273
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 273
cgccgataac ggaacttgcc tt 22
<210> 274
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 274
gttccgttat cggcgcgtgg ct 22
<210> 275
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 275
gtcatcacct ttgaagggca ac 22
<210> 276
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 276
ctccaattca tccagccact ct 22
<210> 277
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 277
agaggtcatc tcggccttct gc 22
<210> 278
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 278
attccataag gcatttcttg ag 22
<210> 279
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 279
tgaagaaggc agtgaagcag ct 22
<210> 280
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 280
gcgaacggcc agcaatcaca ac 22
<210> 281
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 281
ggtttttata agagaagttc ct 22
<210> 282
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 282
tgcaaagaat aagaacattt ta 22
<210> 283
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 283
tgaagaaagt acatgcactt 20
<210> 284
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 284
gaagaaagta catgcacttt 20
<210> 285
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 285
caggggcaag attaagcagc 20
<210> 286
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 286
atcagcatta agaggggcag 20
<210> 287
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 287
aatcagcatt aagaggggca 20
<210> 288
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 288
gaatcagcat taagaggggc 20
<210> 289
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 289
ctcagaatca gcattaagag 20
<210> 290
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 290
cctcagaatc agcattaaga 20
<210> 291
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 291
tcctcagaat cagcattaag 20
<210> 292
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 292
ccctcttaat gctgattctg 20
<210> 293
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 293
gaagaacaca caattatcac 20
<210> 294
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 294
ttatttttac tttatagata 20
<210> 295
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 295
gaatgcataa gtttcagtgg 20
<210> 296
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 296
aatgaatgca taagtttcag 20
<210> 297
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 297
gcattcattt tgtgcattca 20
<210> 298
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 298
ttcattttgt gcattcaagg 20
<210> 299
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 299
tgtgcattca aggcggatga 20
<210> 300
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 300
ttttcatgat tgctttacat 20
<210> 301
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 301
cttttcatga ttgctttaca 20
<210> 302
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 302
cagtgcgaag aatttatata 20
<210> 303
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 303
agtgcgaaga atttatatat 20
<210> 304
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 304
gtgcgaagaa tttatatatg 20
<210> 305
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 305
tgcgaagaat ttatatatgg 20
<210> 306
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 306
tttatatatg ggggatgtga 20
<210> 307
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 307
tcagaatcga tttgaaagtc 20
<210> 308
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 308
tgcaaaaaaa tgtgtacaag 20
<210> 309
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 309
aaaaaatgtg tacaagaggt 20
<210> 310
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 310
tgattacaga taatgcaaac 20
<210> 311
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 311
ataaagacaa cattgcaaca 20
<210> 312
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 312
tcttccaaaa agcagaaatc 20
<210> 313
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 313
aaagccagat ttctgctttt 20
<210> 314
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 314
tgctttttgg aagaagatcc 20
<210> 315
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 315
atataacctc gacatattcc 20
<210> 316
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 316
gaagatcctg gaatatgtcg 20
<210> 317
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 317
tatgtcgagg ttatattacc 20
<210> 318
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 318
ctgattgtta taaaaatacc 20
<210> 319
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 319
cagtgtgaac gtttcaagta 20
<210> 320
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 320
tgtgaacgtt tcaagtatgg 20
<210> 321
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 321
tttcaagtat ggtggatgcc 20
<210> 322
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 322
ttcaagtatg gtggatgcct 20
<210> 323
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 323
caaaattgtt catattgccc 20
<210> 324
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 324
tatgaacaat tttgagacac 20
<210> 325
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 325
tgcaagaaca tttgtgaaga 20
<210> 326
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 326
ctgtattttt ttccagcgaa 20
<210> 327
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 327
tccacctgga aaccattcgc 20
<210> 328
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 328
ttttccagcg aatggtttcc 20
<210> 329
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 329
tccagcgaat ggtttccagg 20
<210> 330
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 330
gggttccata attatccacc 20
<210> 331
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 331
ggtttccagg tggataatta 20
<210> 332
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 332
gttattcaca gcattgagct 20
<210> 333
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 333
agttattcac agcattgagc 20
<210> 334
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 334
cttggttgat tgcggagtca 20
<210> 335
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 335
ccttggttga ttgcggagtc 20
<210> 336
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 336
ctgggaacct tggttgattg 20
<210> 337
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 337
cctgactccg caatcaacca 20
<210> 338
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 338
accaaaaagg ctgggaacct 20
<210> 339
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 339
agattcttac caaaaaggct 20
<210> 340
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 340
aagattctta ccaaaaaggc 20
<210> 341
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 341
accaaggttc ccagcctttt 20
<210> 342
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 342
ccacaagatt cttaccaaaa 20
<210> 343
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 343
cctttttggt aagaatcttg 20
<210> 344
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 344
gtgaaattct aaaaacaatc 20
<210> 345
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 345
tgattgtttt tagaatttca 20
<210> 346
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 346
tagaatttca cggtccctca 20
<210> 347
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 347
gctggagtga gacaccatga 20
<210> 348
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 348
tgctggagtg agacaccatg 20
<210> 349
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 349
cgacacaatc ctctgtctgc 20
<210> 350
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 350
tgtctcactc cagcagacag 20
<210> 351
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 351
gtagtagaat ctgttctcat 20
<210> 352
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 352
ttctactaca attcagtcat 20
<210> 353
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 353
tctactacaa ttcagtcatt 20
<210> 354
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 354
atccactgta cttaaatggg 20
<210> 355
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 355
cacatccact gtacttaaat 20
<210> 356
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 356
ccacatccac tgtacttaaa 20
<210> 357
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 357
tgccgcccat ttaagtacag 20
<210> 358
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 358
ccatttaagt acagtggatg 20
<210> 359
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 359
catttaagta cagtggatgt 20
<210> 360
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 360
atttaagtac agtggatgtg 20
<210> 361
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 361
tttaagtaca gtggatgtgg 20
<210> 362
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 362
tgccctcaga cattcttgtt 20
<210> 363
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 363
cttccaaaca agaatgtctg 20
<210> 364
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 364
ttccaaacaa gaatgtctga 20
<210> 365
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 365
tgtctgaggg catgtaaaaa 20
<210> 366
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 366
atgaaaccta taagaggaag 20
<210> 367
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 367
ctttggatga aacctataag 20
<210> 368
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 368
ggcctccttt tgatattctt 20
<210> 369
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 369
ttcatccaaa gaatatcaaa 20
<210> 370
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 370
atccaaagaa tatcaaaagg 20
<210> 371
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 371
tttttctttt ggttttaatt 20
<210> 372
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 372
ctgcttcttt ctttttcttt 20
<210> 373
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 373
tgtgtgttct tcatcttcct 20
<210> 374
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 374
ttatttttac tttatagata 20
<210> 375
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 375
atccgccttg aatgcacaaa 20
<210> 376
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 376
attcattttg tgcattcaag 20
<210> 377
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 377
tacatgggcc atcatccgcc 20
<210> 378
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 378
tatataaatt cttcgcactg 20
<210> 379
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 379
tattttcact cgacagtgcg 20
<210> 380
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 380
gtgcgaagaa tttatatatg 20
<210> 381
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 381
atgggggatg tgaaggaaat 20
<210> 382
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 382
gaatcgattt gaaagtctgg 20
<210> 383
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 383
ttgattacag ataatgcaaa 20
<210> 384
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 384
tgctttttgg aagaagatcc 20
<210> 385
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 385
aatataacct cgacatattc 20
<210> 386
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 386
gtgtgaacgt ttcaagtatg 20
<210> 387
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 387
gaacaatttt gagacactgg 20
<210> 388
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 388
ttccagcgaa tggtttccag 20
<210> 389
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 389
gagttattca cagcattgag 20
<210> 390
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 390
atggaaccca gctcaatgct 20
<210> 391
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 391
cttggttgat tgcggagtca 20
<210> 392
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 392
ctgggaacct tggttgattg 20
<210> 393
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 393
aggttcccag cctttttggt 20
<210> 394
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 394
cgacacaatc ctctgtctgc 20
<210> 395
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 395
gtgtctcact ccagcagaca 20
<210> 396
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 396
tcccaatgac tgaattgtag 20
<210> 397
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 397
tgggcggcat ttcccaatga 20
<210> 398
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 398
atgccgccca tttaagtaca 20
<210> 399
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 399
aaacaatttt acttccaaac 20
<210> 400
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 400
cctcttatag gtttcatcca 20
<210> 401
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 401
aggcctcctt ttgatattct 20
<210> 402
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 402
gaaatttttg ttaaaaatat 20
<210> 403
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 403
tgggttctgt atttcagaga tg 22
<210> 404
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 404
tcttcattgt gtaaatcatc tc 22
<210> 405
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 405
cagagatgat ttacacaatg aa 22
<210> 406
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 406
tgatttacac aatgaagaaa gt 22
<210> 407
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 407
caggcataca gaagcccaaa gt 22
<210> 408
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 408
ggcaggggca agattaagca gc 22
<210> 409
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 409
aatgctgatt ctgaggaaga tg 22
<210> 410
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 410
tgctgattct gaggaagatg aa 22
<210> 411
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 411
tacatgggcc atcatccgcc tt 22
<210> 412
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 412
tcacatcccc catatataaa tt 22
<210> 413
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 413
aagtctggaa gagtgcaaaa aa 22
<210> 414
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 414
aacctacctc ttgtacacat tt 22
<210> 415
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 415
agggttccca gaaacctacc tc 22
<210> 416
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 416
cactgttttg tctgattgtt at 22
<210> 417
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 417
aggcatccac catacttgaa ac 22
<210> 418
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 418
ttgttcatat tgcccaggca tc 22
<210> 419
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 419
gcctgggcaa tatgaacaat tt 22
<210> 420
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 420
cacaatcctc tgtctgctgg ag 22
<210> 421
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 421
tagtagaatc tgttctcatt gg 22
<210> 422
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 422
aattgtagta gaatctgttc tc 22
<210> 423
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 423
gtcattggga aatgccgccc at 22
<210> 424
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 424
ttgttttcat ttcccccaca tc 22
<210> 425
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 425
uccuaucaca uuggaauaca 20
<210> 426
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 426
gguuacaguu ccuaucacau 20
<210> 427
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 427
gccauguauu ccaaugugau 20
<210> 428
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 428
gugauaggaa cuguaaccuc 20
<210> 429
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 429
ccccucuuac cuuuuuccag 20
<210> 430
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 430
gaacuguaac cucuggaaaa 20
<210> 431
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 431
ccagaagcca augagcagca 20
<210> 432
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 432
cuuuuguccu ugcugcucau 20
<210> 433
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 433
ccuugcugcu cauuggcuuc 20
<210> 434
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 434
cuugcugcuc auuggcuucu 20
<210> 435
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 435
ugggacugcg ugaccuguca 20
<210> 436
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 436
gggacugcgu gaccugucac 20
<210> 437
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 437
guccacaggg cucccgugac 20
<210> 438
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 438
gaccugucac gggagcccug 20
<210> 439
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 439
uggcugugca gauguccaca 20
<210> 440
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 440
uuggcugugc agauguccac 20
<210> 441
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 441
acaucugcac agccaagccg 20
<210> 442
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 442
caucugcaca gccaagccgc 20
<210> 443
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 443
caugggaaug ucccgcggcu 20
<210> 444
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 444
ggauucaugg gaaugucccg 20
<210> 445
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 445
uaaaugcaca ugggauucau 20
<210> 446
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 446
guaaaugcac augggauuca 20
<210> 447
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 447
ggggagcggu aaaugcacau 20
<210> 448
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 448
cggggagcgg uaaaugcaca 20
<210> 449
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 449
caugugcauu uaccgcuccc 20
<210> 450
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 450
uugccuucuu cuccggggag 20
<210> 451
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 451
cucaguugcc uucuucuccg 20
<210> 452
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 452
ccucaguugc cuucuucucc 20
<210> 453
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 453
uccucaguug ccuucuucuc 20
<210> 454
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 454
uuaccgcucc ccggagaaga 20
<210> 455
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 455
cccggagaag aaggcaacug 20
<210> 456
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 456
gaagaaggca acugaggaug 20
<210> 457
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 457
aagaaggcaa cugaggauga 20
<210> 458
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 458
gggcucagaa cagaagaucc 20
<210> 459
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 459
cucagaacag aagaucccgg 20
<210> 460
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 460
cacgccgguu gguggccucc 20
<210> 461
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 461
acacgccggu ugguggccuc 20
<210> 462
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 462
agaucccgga ggccaccaac 20
<210> 463
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 463
uucccagaca cgccgguugg 20
<210> 464
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 464
caguucccag acacgccggu 20
<210> 465
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 465
uggacaguuc ccagacacgc 20
<210> 466
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 466
aggccaccaa ccggcguguc 20
<210> 467
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 467
ggccaccaac cggcgugucu 20
<210> 468
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 468
gcgugucugg gaacugucca 20
<210> 469
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 469
agcaaagcgg gaauuggccu 20
<210> 470
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 470
agugguagca aagcgggaau 20
<210> 471
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 471
auagaaagug guagcaaagc 20
<210> 472
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 472
gauagaaagu gguagcaaag 20
<210> 473
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 473
ugccaggugc ugauagaaag 20
<210> 474
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 474
uaccacuuuc uaucagcacc 20
<210> 475
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 475
ugucauucuu ggaaucugcc 20
<210> 476
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 476
aauguuauca uugucauucu 20
<210> 477
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 477
uggagauacu caggggugac 20
<210> 478
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 478
aaagccgugg agauacucag 20
<210> 479
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 479
aaaagccgug gagauacuca 20
<210> 480
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 480
caaaagccgu ggagauacuc 20
<210> 481
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 481
gucaccccug aguaucucca 20
<210> 482
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 482
cuuggucaua gcaaaagccg 20
<210> 483
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 483
ggcuuuugcu augaccaagc 20
<210> 484
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 484
gcuuuugcua ugaccaagcu 20
<210> 485
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 485
gucauuacag gcacccagcu 20
<210> 486
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 486
uugcuggagg gugucauuac 20
<210> 487
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 487
uaccuccauc aguugcugga 20
<210> 488
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 488
guaccuccau caguugcugg 20
<210> 489
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 489
gucguaccuc caucaguugc 20
<210> 490
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 490
ugacacccuc cagcaacuga 20
<210> 491
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 491
cacccuccag caacugaugg 20
<210> 492
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 492
aucagauguu uucucagaua 20
<210> 493
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 493
ucaguuuggc aaagaagaag 20
<210> 494
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 494
auagagucgg caguucaguu 20
<210> 495
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 495
uguuggcuuu ucgauagagu 20
<210> 496
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 496
uacuaacuug gaggauuugu 20
<210> 497
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 497
auuggcugau acuaacuugg 20
<210> 498
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 498
gcgauuggcu gauacuaacu 20
<210> 499
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 499
uuugucucca aaaaggcgau 20
<210> 500
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 500
guaucagcca aucgccuuuu 20
<210> 501
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 501
uaagggauuu gucuccaaaa 20
<210> 502
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 502
guaggucuca uugaagguaa 20
<210> 503
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 503
gguaggucuc auugaaggua 20
<210> 504
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 504
guccugguag gucucauuga 20
<210> 505
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 505
uaccuucaau gagaccuacc 20
<210> 506
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 506
caacucacug auguccuggu 20
<210> 507
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 507
auaccaacuc acugaugucc 20
<210> 508
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 508
cuaccaggac aucagugagu 20
<210> 509
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 509
gacaucagug aguugguaua 20
<210> 510
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 510
gaaguccagg ggcuggagcu 20
<210> 511
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 511
uggagccaag cuccagcccc 20
<210> 512
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 512
ucaccuugaa guccaggggc 20
<210> 513
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 513
caacucaccu ugaaguccag 20
<210> 514
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 514
gcaacucacc uugaagucca 20
<210> 515
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 515
ugcaacucac cuugaagucc 20
<210> 516
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 516
gcuccagccc cuggacuuca 20
<210> 517
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 517
gauugcucug cauuuuccug 20
<210> 518
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 518
aaaugcagag caauccagag 20
<210> 519
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 519
ccauuuguug auggccgcuc 20
<210> 520
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 520
auuggacacc cauuuguuga 20
<210> 521
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 521
ccagagcggc caucaacaaa 20
<210> 522
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 522
cagagcggcc aucaacaaau 20
<210> 523
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 523
gauucggccu ucggucuuau 20
<210> 524
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 524
ugggugucca auaagaccga 20
<210> 525
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 525
gacaucggug auucggccuu 20
<210> 526
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 526
agggaaugac aucggugauu 20
<210> 527
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 527
ggcuuccgag ggaaugacau 20
<210> 528
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 528
aaucaccgau gucauucccu 20
<210> 529
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 529
agcucauuga uggcuuccga 20
<210> 530
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 530
gagcucauug auggcuuccg 20
<210> 531
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 531
cagaacagug agcucauuga 20
<210> 532
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 532
caucaaugag cucacuguuc 20
<210> 533
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 533
ugagcucacu guucuggugc 20
<210> 534
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 534
ucugaguacc uugaaguaaa 20
<210> 535
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 535
gguuaacacc auuuacuuca 20
<210> 536
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 536
acuuugacuu ccacaggccc 20
<210> 537
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 537
ugauucucuu ccagggccug 20
<210> 538
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 538
ggcugaacuu ugacuuccac 20
<210> 539
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 539
guuccuuccu uguguucuca 20
<210> 540
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 540
aguuccuucc uuguguucuc 20
<210> 541
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 541
aguucagccc ugagaacaca 20
<210> 542
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 542
cagcccugag aacacaagga 20
<210> 543
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 543
aaggaaggaa cuguucuaca 20
<210> 544
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 544
gaacuguucu acaaggcuga 20
<210> 545
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 545
uucagcaucu augauguacc 20
<210> 546
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 546
gcaucuauga uguaccagga 20
<210> 547
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 547
gauaacggaa cuugccuucc 20
<210> 548
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 548
aggaaggcaa guuccguuau 20
<210> 549
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 549
cuucagccac gcgccgauaa 20
<210> 550
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 550
caaguuccgu uaucggcgcg 20
<210> 551
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 551
cguuaucggc gcguggcuga 20
<210> 552
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 552
gcgcguggcu gaaggcaccc 20
<210> 553
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 553
gaagggcaac ucaagcaccu 20
<210> 554
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 554
ugaagggcaa cucaagcacc 20
<210> 555
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 555
gugcuugagu ugcccuucaa 20
<210> 556
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 556
gugaugucau caccuuugaa 20
<210> 557
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 557
ggugauguca ucaccuuuga 20
<210> 558
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 558
caaaggugau gacaucacca 20
<210> 559
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 559
cuugggcaag augaggacca 20
<210> 560
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 560
ucucaggcuu gggcaagaug 20
<210> 561
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 561
gccaggcucu ucucaggcuu 20
<210> 562
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 562
ggccaggcuc uucucaggcu 20
<210> 563
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 563
accuuggcca ggcucuucuc 20
<210> 564
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 564
gcccaagccu gagaagagcc 20
<210> 565
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 565
gccugagaag agccuggcca 20
<210> 566
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 566
guuccuucuc uaccuuggcc 20
<210> 567
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 567
ggugaguucc uucucuaccu 20
<210> 568
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 568
gagccuggcc aagguagaga 20
<210> 569
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 569
agagaaggaa cucaccccag 20
<210> 570
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 570
ccacucuugc agcaccucug 20
<210> 571
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 571
gccacucuug cagcaccucu 20
<210> 572
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 572
agccacucuu gcagcaccuc 20
<210> 573
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 573
ccccagaggu gcugcaagag 20
<210> 574
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 574
agaggugcug caagaguggc 20
<210> 575
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 575
gcaagagugg cuggaugaau 20
<210> 576
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 576
agaguggcug gaugaauugg 20
<210> 577
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 577
ugaauuggag gagaugaugc 20
<210> 578
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 578
auuggaggag augaugcugg 20
<210> 579
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 579
caaugcggaa gcggggcaug 20
<210> 580
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 580
ccguccucaa ugcggaagcg 20
<210> 581
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 581
gccguccuca augcggaagc 20
<210> 582
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 582
agccguccuc aaugcggaag 20
<210> 583
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 583
caugccccgc uuccgcauug 20
<210> 584
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 584
aacugaagcc guccucaaug 20
<210> 585
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 585
ccccgcuucc gcauugagga 20
<210> 586
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 586
ugaggacggc uucaguuuga 20
<210> 587
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 587
gaaggagcag cugcaagaca 20
<210> 588
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 588
aaggagcagc ugcaagacau 20
<210> 589
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 589
cagggcugaa cagaucgaca 20
<210> 590
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 590
cugggaguuu ggacuuuuca 20
<210> 591
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 591
ccugggaguu uggacuuuuc 20
<210> 592
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 592
ccuagacaaa ccugggaguu 20
<210> 593
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 593
ccugaaaagu ccaaacuccc 20
<210> 594
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 594
cggccuucug caacaauacc 20
<210> 595
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 595
cuuccaggua uuguugcaga 20
<210> 596
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 596
cugagacaua gaggucaucu 20
<210> 597
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 597
ggaaugcauc ugagacauag 20
<210> 598
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 598
ugucucagau gcauuccaua 20
<210> 599
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 599
ucaccucaag aaaugccuua 20
<210> 600
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 600
auuccauaag gcauuucuug 20
<210> 601
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 601
gaccugcagg uaaaugaaga 20
<210> 602
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 602
acggccagca aucacaacag 20
<210> 603
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 603
aguaccgcug uugugauugc 20
<210> 604
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 604
cccuguuggg guuuagcgaa 20
<210> 605
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 605
gccguucgcu aaaccccaac 20
<210> 606
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 606
ccguucgcua aaccccaaca 20
<210> 607
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 607
ccuugaaagu cacccuguug 20
<210> 608
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 608
gccuugaaag ucacccuguu 20
<210> 609
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 609
ggccuugaaa gucacccugu 20
<210> 610
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 610
ccccaacagg gugacuuuca 20
<210> 611
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 611
gggugacuuu caaggccaac 20
<210> 612
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 612
aaaaaccagg aaaggccugu 20
<210> 613
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 613
caaggccaac aggccuuucc 20
<210> 614
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 614
ucucuuauaa aaaccaggaa 20
<210> 615
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 615
gaacuucucu uauaaaaacc 20
<210> 616
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 616
augaagauaa uaguguucag 20
<210> 617
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 617
ucugaacacu auuaucuuca 20
<210> 618
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 618
cugaacacua uuaucuucau 20
<210> 619
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 619
auuuuacuua acacaagggu 20
<210> 620
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 620
gaacauuuua cuuaacacaa 20
<210> 621
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 621
agaacauuuu acuuaacaca 20
<210> 622
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 622
gguuacaguu ccuaucacau 20
<210> 623
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 623
ccaagccgcg ggacauuccc 20
<210> 624
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 624
uaaaugcaca ugggauucau 20
<210> 625
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 625
cggggagcgg uaaaugcaca 20
<210> 626
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 626
ccccggagaa gaaggcaacu 20
<210> 627
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 627
acacgccggu ugguggccuc 20
<210> 628
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 628
auagaaagug guagcaaagc 20
<210> 629
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 629
aucagcaccu ggcagauucc 20
<210> 630
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 630
aauguuauca uugucauucu 20
<210> 631
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 631
auaacauuuu ccugucaccc 20
<210> 632
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 632
caaaagccgu ggagauacuc 20
<210> 633
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 633
cggcuuuugc uaugaccaag 20
<210> 634
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 634
cguaccucca ucaguugcug 20
<210> 635
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 635
uucaguuugg caaagaagaa 20
<210> 636
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 636
aggauuuguu ggcuuuucga 20
<210> 637
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 637
gauuggcuga uacuaacuug 20
<210> 638
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 638
gguaggucuc auugaaggua 20
<210> 639
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 639
ugagaccuac caggacauca 20
<210> 640
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 640
uccagccccu ggacuucaag 20
<210> 641
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 641
cccauuuguu gauggccgcu 20
<210> 642
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 642
uccagagcgg ccaucaacaa 20
<210> 643
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 643
guguccaaua agaccgaagg 20
<210> 644
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 644
agcucauuga uggcuuccga 20
<210> 645
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 645
acuguucuac aaggcugaug 20
<210> 646
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 646
ggcugaaggc acccaggugc 20
<210> 647
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 647
uugaagggca acucaagcac 20
<210> 648
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 648
acucuugcag caccucuggg 20
<210> 649
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 649
agccacucuu gcagcaccuc 20
<210> 650
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 650
acucacccca gaggugcugc 20
<210> 651
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 651
cagaggugcu gcaagagugg 20
<210> 652
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 652
ggugcugcaa gaguggcugg 20
<210> 653
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 653
ucaccucaag aaaugccuua 20
<210> 654
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 654
uccauaaggc auuucuugag 20
<210> 655
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 655
ggccguucgc uaaaccccaa 20
<210> 656
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 656
ggccuugaaa gucacccugu 20
<210> 657
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 657
aacacuauua ucuucauggg 20
<210> 658
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 658
aagaacauuu uacuuaacac 20
<210> 659
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 659
gagguuacag uuccuaucac au 22
<210> 660
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 660
cugucacggg agcccugugg ac 22
<210> 661
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 661
gccuucuucu ccggggagcg gu 22
<210> 662
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 662
gggaauuggc cuuggacagu uc 22
<210> 663
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 663
ucccgcuuug cuaccacuuu cu 22
<210> 664
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 664
gcuuggucau agcaaaagcc gu 22
<210> 665
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 665
uaugaccaag cugggugccu gu 22
<210> 666
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 666
ucaguugcug gaggguguca uu 22
<210> 667
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 667
augacacccu ccagcaacug au 22
<210> 668
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 668
uugacuucua uagguauuua ag 22
<210> 669
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 669
uuucucagau auggugucaa ac 22
<210> 670
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 670
uuugucucca aaaaggcgau ug 22
<210> 671
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 671
guccaggggc uggagcuugg cu 22
<210> 672
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 672
ggugauucgg ccuucggucu ua 22
<210> 673
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 673
ugagcucacu guucuggugc ug 22
<210> 674
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 674
uaccuugaag uaaauggugu ua 22
<210> 675
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 675
ugcugguuaa caccauuuac uu 22
<210> 676
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 676
guggaaguca aaguucagcc cu 22
<210> 677
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 677
ggagagucgu guucagcauc ua 22
<210> 678
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 678
ccuuccuggu acaucauaga ug 22
<210> 679
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 679
cgccgauaac ggaacuugcc uu 22
<210> 680
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 680
guuccguuau cggcgcgugg cu 22
<210> 681
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 681
gucaucaccu uugaagggca ac 22
<210> 682
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 682
cuccaauuca uccagccacu cu 22
<210> 683
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 683
agaggucauc ucggccuucu gc 22
<210> 684
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 684
auuccauaag gcauuucuug ag 22
<210> 685
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 685
ugaagaaggc agugaagcag cu 22
<210> 686
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 686
gcgaacggcc agcaaucaca ac 22
<210> 687
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 687
gguuuuuaua agagaaguuc cu 22
<210> 688
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 688
ugcaaagaau aagaacauuu ua 22
<210> 689
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 689
ugaagaaagu acaugcacuu 20
<210> 690
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 690
gaagaaagua caugcacuuu 20
<210> 691
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 691
caggggcaag auuaagcagc 20
<210> 692
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 692
aucagcauua agaggggcag 20
<210> 693
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 693
aaucagcauu aagaggggca 20
<210> 694
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 694
gaaucagcau uaagaggggc 20
<210> 695
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 695
cucagaauca gcauuaagag 20
<210> 696
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 696
ccucagaauc agcauuaaga 20
<210> 697
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 697
uccucagaau cagcauuaag 20
<210> 698
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 698
cccucuuaau gcugauucug 20
<210> 699
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 699
gaagaacaca caauuaucac 20
<210> 700
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 700
uuauuuuuac uuuauagaua 20
<210> 701
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 701
gaaugcauaa guuucagugg 20
<210> 702
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 702
aaugaaugca uaaguuucag 20
<210> 703
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 703
gcauucauuu ugugcauuca 20
<210> 704
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 704
uucauuuugu gcauucaagg 20
<210> 705
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 705
ugugcauuca aggcggauga 20
<210> 706
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 706
uuuucaugau ugcuuuacau 20
<210> 707
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 707
cuuuucauga uugcuuuaca 20
<210> 708
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 708
cagugcgaag aauuuauaua 20
<210> 709
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 709
agugcgaaga auuuauauau 20
<210> 710
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 710
gugcgaagaa uuuauauaug 20
<210> 711
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 711
ugcgaagaau uuauauaugg 20
<210> 712
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 712
uuuauauaug ggggauguga 20
<210> 713
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 713
ucagaaucga uuugaaaguc 20
<210> 714
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 714
ugcaaaaaaa uguguacaag 20
<210> 715
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 715
aaaaaaugug uacaagaggu 20
<210> 716
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 716
ugauuacaga uaaugcaaac 20
<210> 717
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 717
auaaagacaa cauugcaaca 20
<210> 718
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 718
ucuuccaaaa agcagaaauc 20
<210> 719
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 719
aaagccagau uucugcuuuu 20
<210> 720
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 720
ugcuuuuugg aagaagaucc 20
<210> 721
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 721
auauaaccuc gacauauucc 20
<210> 722
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 722
gaagauccug gaauaugucg 20
<210> 723
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 723
uaugucgagg uuauauuacc 20
<210> 724
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 724
cugauuguua uaaaaauacc 20
<210> 725
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 725
cagugugaac guuucaagua 20
<210> 726
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 726
ugugaacguu ucaaguaugg 20
<210> 727
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 727
uuucaaguau gguggaugcc 20
<210> 728
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 728
uucaaguaug guggaugccu 20
<210> 729
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 729
caaaauuguu cauauugccc 20
<210> 730
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 730
uaugaacaau uuugagacac 20
<210> 731
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 731
ugcaagaaca uuugugaaga 20
<210> 732
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 732
cuguauuuuu uuccagcgaa 20
<210> 733
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 733
uccaccugga aaccauucgc 20
<210> 734
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 734
uuuuccagcg aaugguuucc 20
<210> 735
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 735
uccagcgaau gguuuccagg 20
<210> 736
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 736
ggguuccaua auuauccacc 20
<210> 737
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 737
gguuuccagg uggauaauua 20
<210> 738
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 738
guuauucaca gcauugagcu 20
<210> 739
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 739
aguuauucac agcauugagc 20
<210> 740
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 740
cuugguugau ugcggaguca 20
<210> 741
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 741
ccuugguuga uugcggaguc 20
<210> 742
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 742
cugggaaccu ugguugauug 20
<210> 743
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 743
ccugacuccg caaucaacca 20
<210> 744
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 744
accaaaaagg cugggaaccu 20
<210> 745
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 745
agauucuuac caaaaaggcu 20
<210> 746
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 746
aagauucuua ccaaaaaggc 20
<210> 747
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 747
accaagguuc ccagccuuuu 20
<210> 748
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 748
ccacaagauu cuuaccaaaa 20
<210> 749
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 749
ccuuuuuggu aagaaucuug 20
<210> 750
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 750
gugaaauucu aaaaacaauc 20
<210> 751
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 751
ugauuguuuu uagaauuuca 20
<210> 752
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 752
uagaauuuca cggucccuca 20
<210> 753
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 753
gcuggaguga gacaccauga 20
<210> 754
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 754
ugcuggagug agacaccaug 20
<210> 755
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 755
cgacacaauc cucugucugc 20
<210> 756
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 756
ugucucacuc cagcagacag 20
<210> 757
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 757
guaguagaau cuguucucau 20
<210> 758
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 758
uucuacuaca auucagucau 20
<210> 759
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 759
ucuacuacaa uucagucauu 20
<210> 760
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 760
auccacugua cuuaaauggg 20
<210> 761
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 761
cacauccacu guacuuaaau 20
<210> 762
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 762
ccacauccac uguacuuaaa 20
<210> 763
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 763
ugccgcccau uuaaguacag 20
<210> 764
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 764
ccauuuaagu acaguggaug 20
<210> 765
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 765
cauuuaagua caguggaugu 20
<210> 766
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 766
auuuaaguac aguggaugug 20
<210> 767
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 767
uuuaaguaca guggaugugg 20
<210> 768
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 768
ugcccucaga cauucuuguu 20
<210> 769
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 769
cuuccaaaca agaaugucug 20
<210> 770
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 770
uuccaaacaa gaaugucuga 20
<210> 771
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 771
ugucugaggg cauguaaaaa 20
<210> 772
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 772
augaaaccua uaagaggaag 20
<210> 773
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 773
cuuuggauga aaccuauaag 20
<210> 774
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 774
ggccuccuuu ugauauucuu 20
<210> 775
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 775
uucauccaaa gaauaucaaa 20
<210> 776
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 776
auccaaagaa uaucaaaagg 20
<210> 777
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 777
uuuuucuuuu gguuuuaauu 20
<210> 778
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 778
cugcuucuuu cuuuuucuuu 20
<210> 779
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 779
uguguguucu ucaucuuccu 20
<210> 780
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 780
uuauuuuuac uuuauagaua 20
<210> 781
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 781
auccgccuug aaugcacaaa 20
<210> 782
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 782
auucauuuug ugcauucaag 20
<210> 783
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 783
uacaugggcc aucauccgcc 20
<210> 784
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 784
uauauaaauu cuucgcacug 20
<210> 785
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 785
uauuuucacu cgacagugcg 20
<210> 786
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 786
gugcgaagaa uuuauauaug 20
<210> 787
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 787
augggggaug ugaaggaaau 20
<210> 788
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 788
gaaucgauuu gaaagucugg 20
<210> 789
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 789
uugauuacag auaaugcaaa 20
<210> 790
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 790
ugcuuuuugg aagaagaucc 20
<210> 791
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 791
aauauaaccu cgacauauuc 20
<210> 792
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 792
gugugaacgu uucaaguaug 20
<210> 793
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 793
gaacaauuuu gagacacugg 20
<210> 794
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 794
uuccagcgaa ugguuuccag 20
<210> 795
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 795
gaguuauuca cagcauugag 20
<210> 796
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 796
auggaaccca gcucaaugcu 20
<210> 797
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 797
cuugguugau ugcggaguca 20
<210> 798
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 798
cugggaaccu ugguugauug 20
<210> 799
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 799
agguucccag ccuuuuuggu 20
<210> 800
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 800
cgacacaauc cucugucugc 20
<210> 801
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 801
gugucucacu ccagcagaca 20
<210> 802
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 802
ucccaaugac ugaauuguag 20
<210> 803
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 803
ugggcggcau uucccaauga 20
<210> 804
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 804
augccgccca uuuaaguaca 20
<210> 805
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 805
aaacaauuuu acuuccaaac 20
<210> 806
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 806
ccucuuauag guuucaucca 20
<210> 807
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 807
aggccuccuu uugauauucu 20
<210> 808
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 808
gaaauuuuug uuaaaaauau 20
<210> 809
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 809
uggguucugu auuucagaga ug 22
<210> 810
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 810
ucuucauugu guaaaucauc uc 22
<210> 811
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 811
cagagaugau uuacacaaug aa 22
<210> 812
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 812
ugauuuacac aaugaagaaa gu 22
<210> 813
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 813
caggcauaca gaagcccaaa gu 22
<210> 814
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 814
ggcaggggca agauuaagca gc 22
<210> 815
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 815
aaugcugauu cugaggaaga ug 22
<210> 816
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 816
ugcugauucu gaggaagaug aa 22
<210> 817
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 817
uacaugggcc aucauccgcc uu 22
<210> 818
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 818
ucacaucccc cauauauaaa uu 22
<210> 819
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 819
aagucuggaa gagugcaaaa aa 22
<210> 820
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 820
aaccuaccuc uuguacacau uu 22
<210> 821
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 821
aggguuccca gaaaccuacc uc 22
<210> 822
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 822
cacuguuuug ucugauuguu au 22
<210> 823
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 823
aggcauccac cauacuugaa ac 22
<210> 824
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 824
uuguucauau ugcccaggca uc 22
<210> 825
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 825
gccugggcaa uaugaacaau uu 22
<210> 826
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 826
cacaauccuc ugucugcugg ag 22
<210> 827
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 827
uaguagaauc uguucucauu gg 22
<210> 828
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 828
aauuguagua gaaucuguuc uc 22
<210> 829
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 829
gucauuggga aaugccgccc au 22
<210> 830
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 引导序列
<400> 830
uuguuuucau uucccccaca uc 22
<210> 831
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 831
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 832
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 832
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 833
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 833
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 834
<211> 11
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 834
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 835
<211> 38
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 835
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 836
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 836
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 837
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 837
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 838
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 838
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 839
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 839
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 840
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 840
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 841
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 841
Asp Arg Leu Arg Arg
1 5
<210> 842
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 842
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 843
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 843
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 844
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 844
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 845
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 845
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 846
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> 核定位序列
<400> 846
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 847
<211> 20
<212> DNA
<213> 智人(Homo sapiens)
<400> 847
gtccatctcc tccgccagcg 20
<210> 848
<211> 22
<212> DNA
<213> 智人(Homo sapiens)
<400> 848
gagagggcca gaaatcaccc aa 22

Claims (48)

1.一种治疗血友病的方法,所述方法包括向待治疗的受试者中给予用于基因操纵的组合物,其中,所述用于基因操纵的组合物包括以下:
引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含与位于凝血抑制基因中的靶序列形成互补结合的引导序列;以及
编辑蛋白或编码所述编辑蛋白的核酸序列,
其中,所述凝血抑制基因为AT(抗凝血酶)基因或TFPI(组织因子途径抑制剂)基因,
其中,所述引导序列为选自SEQ ID NO:425至SEQ ID NO:830中的一个或多个引导序列,
其中,所述互补结合包括0个至5个错配结合。
2.如权利要求1所述的方法,其中,所述引导序列是选自以下的一个或多个序列:SEQID NO:427、SEQ ID NO:428、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:443、SEQ ID NO:444、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:454、SEQ ID NO:458、SEQID NO:460、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:466、SEQ ID NO:467、SEQ ID NO:469、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:622、SEQ ID NO:623、SEQID NO:624、SEQ ID NO:625、SEQ ID NO:626、SEQ ID NO:627、SEQ ID NO:628、SEQ ID NO:630、SEQ ID NO:632、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:638、SEQ ID NO:639、SEQID NO:641、SEQ ID NO:642、SEQ ID NO:659、SEQ ID NO:660、SEQ ID NO:661、SEQ ID NO:662、SEQ ID NO:663、SEQ ID NO:664、SEQ ID NO:665、SEQ ID NO:666、SEQ ID NO:667、SEQID NO:668、SEQ ID NO:669、SEQ ID NO:670、SEQ ID NO:671、SEQ ID NO:672、SEQ ID NO:673、SEQ ID NO:674、SEQ ID NO:675、SEQ ID NO:676、SEQ ID NO:677、SEQ ID NO:678、SEQID NO:679、SEQ ID NO:680、SEQ ID NO:681、SEQ ID NO:682、SEQ ID NO:683、SEQ ID NO:684、SEQ ID NO:686、SEQ ID NO:687和SEQ ID NO:688。
3.如权利要求1所述的方法,其中,所述引导序列为选自以下的一个或多个序列:SEQID NO:692、SEQ ID NO:694、SEQ ID NO:705、SEQ ID NO:709、SEQ ID NO:710、SEQ ID NO:721、SEQ ID NO:726、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:740、SEQID NO:741、SEQ ID NO:742、SEQ ID NO:748、SEQ ID NO:781、SEQ ID NO:783、SEQ ID NO:786、SEQ ID NO:788、SEQ ID NO:791、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:795、SEQID NO:796、SEQ ID NO:797、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ ID NO:803、SEQ ID NO:804、SEQ ID NO:809、SEQ ID NO:810、SEQ ID NO:811、SEQ ID NO:813、SEQID NO:814、SEQ ID NO:815、SEQ ID NO:816、SEQ ID NO:817、SEQ ID NO:818、SEQ ID NO:819、SEQ ID NO:820、SEQ ID NO:821、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQID NO:825、SEQ ID NO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:829和SEQ ID NO:830。
4.如权利要求1所述的方法,其中,所述引导序列与位于AT基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6或外显子7中的靶序列形成互补结合。
5.如权利要求1所述的方法,其中,所述引导序列与位于TFPI基因的外显子2、外显子3、外显子5、外显子6或外显子7中的靶序列形成互补结合。
6.如权利要求1所述的方法,其中,所述编辑蛋白为由酿脓链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白或由空肠弯曲杆菌衍生而来的Cas9蛋白。
7.如权利要求1所述的方法,其中,所述用于基因操纵的组合物为引导核酸和编辑蛋白组合的引导核酸-编辑蛋白复合体的形式,
其中,所述引导核酸为引导RNA(gRNA)。
8.如权利要求1所述的方法,其中,所述引导核酸和所述编辑蛋白分别以核酸序列的形式存在于一种或多种载体中。
9.如权利要求1所述的方法,其中,所述用于基因操纵的组合物任选地进一步包括供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。
10.如权利要求9所述的方法,其中,所述待插入的核酸序列为凝血抑制基因的部分核酸序列。
11.如权利要求9所述的方法,其中,所述待插入的核酸序列为编码凝血相关蛋白的基因的完整或部分序列。
12.如权利要求11所述的方法,其中,所述凝血相关蛋白为选自于由以下所组成的组中的一种或多种蛋白:因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白和组织因子。
13.如权利要求9所述的方法,其中,所述引导核酸、所述编辑蛋白和所述供体分别以核酸序列的形式存在于一种或多种载体中。
14.如权利要求8或13所述的方法,其中,所述载体为质粒或病毒载体。
15.如权利要求14所述的方法,其中,所述病毒载体为选自于由以下所组成的组中的一种或多种病毒载体:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。
16.如权利要求1所述的方法,其中,所述给予通过注射、输注、植入或移植进行。
17.如权利要求1所述的方法,其中,所述给予通过选自如下的给予途径进行:肝内、皮下、皮内、眼内、玻璃体内、肿瘤内、结节内、髓内、肌内、静脉内、淋巴管内和腹膜内途径。
18.如权利要求1所述的方法,其中,所述血友病为血友病A、血友病B或血友病C。
19.如权利要求1所述的方法,其中,所述待治疗的受试者为哺乳动物,所述哺乳动物包括人、猴、小鼠和大鼠。
20.一种用于基因操纵的组合物,所述组合物包括:
引导核酸或编码所述引导核酸的核酸序列,所述引导核酸包含与位于凝血抑制基因中的靶序列形成互补结合的引导序列;以及
编辑蛋白或编码所述编辑蛋白的核酸序列,
其中,所述凝血抑制基因为AT(抗凝血酶)基因或TFPI(组织因子途径抑制剂)基因,
其中,所述引导序列为选自SEQ ID NO:425至SEQ ID NO:830中的一个或多个引导序列,
其中,所述互补结合包括0个至5个错配结合。
21.如权利要求20所述的组合物,其中,所述靶序列为选自SEQ ID NO:19至SEQ ID NO:424中的一个或多个序列。
22.如权利要求21所述的组合物,其中,所述靶序列为选自以下的一个或多个序列:SEQID NO:21、SEQ ID NO:22、SEQ ID NO:30、SEQ ID NO:31、SEQ ID NO:37、SEQ ID NO:38、SEQID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:48、SEQ ID NO:52、SEQ ID NO:54、SEQID NO:55、SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:63、SEQID NO:67、SEQ ID NO:68、SEQ ID NO:216、SEQ ID NO:217、SEQ ID NO:218、SEQ ID NO:219、SEQ ID NO:220、SEQ ID NO:221、SEQ ID NO:222、SEQ ID NO:224、SEQ ID NO:226、SEQID NO:228、SEQ ID NO:229、SEQ ID NO:232、SEQ ID NO:233、SEQ ID NO:235、SEQ ID NO:236、SEQ ID NO:253、SEQ ID NO:254、SEQ ID NO:255、SEQ ID NO:256、SEQ ID NO:257、SEQID NO:258、SEQ ID NO:259、SEQ ID NO:260、SEQ ID NO:261、SEQ ID NO:262、SEQ ID NO:263、SEQ ID NO:264、SEQ ID NO:265、SEQ ID NO:266、SEQ ID NO:267、SEQ ID NO:268、SEQID NO:269、SEQ ID NO:270、SEQ ID NO:271、SEQ ID NO:272、SEQ ID NO:273、SEQ ID NO:274、SEQ ID NO:275、SEQ ID NO:276、SEQ ID NO:277、SEQ ID NO:278、SEQ ID NO:280、SEQID NO:281和SEQ ID NO:282。
23.如权利要求21所述的组合物,其中,所述靶序列为选自以下的一个或多个序列:SEQID NO:286、SEQ ID NO:288、SEQ ID NO:299、SEQ ID NO:303、SEQ ID NO:304、SEQ ID NO:315、SEQ ID NO:320、SEQ ID NO:325、SEQ ID NO:327、SEQ ID NO:329、SEQ ID NO:334、SEQID NO:335、SEQ ID NO:336、SEQ ID NO:342、SEQ ID NO:375、SEQ ID NO:377、SEQ ID NO:380、SEQ ID NO:382、SEQ ID NO:385、SEQ ID NO:386、SEQ ID NO:388、SEQ ID NO:389、SEQID NO:390、SEQ ID NO:391、SEQ ID NO:392、SEQ ID NO:394、SEQ ID NO:396、SEQ ID NO:397、SEQ ID NO:398、SEQ ID NO:403、SEQ ID NO:404、SEQ ID NO:405、SEQ ID NO:407、SEQID NO:408、SEQ ID NO:409、SEQ ID NO:410、SEQ ID NO:411、SEQ ID NO:412、SEQ ID NO:413、SEQ ID NO:414、SEQ ID NO:415、SEQ ID NO:416、SEQ ID NO:417、SEQ ID NO:418、SEQID NO:419、SEQ ID NO:420、SEQ ID NO:421、SEQ ID NO:422、SEQ ID NO:423和SEQ ID NO:424。
24.如权利要求20所述的组合物,其中,所述引导序列为选自以下的一个或多个序列:SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:443、SEQ IDNO:444、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:454、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:466、SEQ IDNO:467、SEQ ID NO:469、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:622、SEQ ID NO:623、SEQ ID NO:624、SEQ ID NO:625、SEQ ID NO:626、SEQ ID NO:627、SEQ ID NO:628、SEQ IDNO:630、SEQ ID NO:632、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:638、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:642、SEQ ID NO:659、SEQ ID NO:660、SEQ ID NO:661、SEQ IDNO:662、SEQ ID NO:663、SEQ ID NO:664、SEQ ID NO:665、SEQ ID NO:666、SEQ ID NO:667、SEQ ID NO:668、SEQ ID NO:669、SEQ ID NO:670、SEQ ID NO:671、SEQ ID NO:672、SEQ IDNO:673、SEQ ID NO:674、SEQ ID NO:675、SEQ ID NO:676、SEQ ID NO:677、SEQ ID NO:678、SEQ ID NO:679、SEQ ID NO:680、SEQ ID NO:681、SEQ ID NO:682、SEQ ID NO:683、SEQ IDNO:684、SEQ ID NO:686、SEQ ID NO:687和SEQ ID NO:688。
25.如权利要求20所述的组合物,其中,所述引导序列为选自以下的一个或多个序列:SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:705、SEQ ID NO:709、SEQ ID NO:710、SEQ IDNO:721、SEQ ID NO:726、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:740、SEQ ID NO:741、SEQ ID NO:742、SEQ ID NO:748、SEQ ID NO:781、SEQ ID NO:783、SEQ IDNO:786、SEQ ID NO:788、SEQ ID NO:791、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:795、SEQ ID NO:796、SEQ ID NO:797、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQ IDNO:803、SEQ ID NO:804、SEQ ID NO:809、SEQ ID NO:810、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:814、SEQ ID NO:815、SEQ ID NO:816、SEQ ID NO:817、SEQ ID NO:818、SEQ IDNO:819、SEQ ID NO:820、SEQ ID NO:821、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQ ID NO:825、SEQ ID NO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:829和SEQ IDNO:830。
26.如权利要求20所述的组合物,其中,所述引导序列与位于AT基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6或外显子7中的靶序列形成互补结合。
27.如权利要求20所述的组合物,其中,所述引导序列与位于TFPI基因的外显子2、外显子3、外显子5、外显子6或外显子7中的靶序列形成互补结合。
28.如权利要求20所述的组合物,其中,所述引导核酸包含引导结构域。
29.如权利要求28所述的组合物,其中,所述引导结构域中包含所述引导序列。
30.如权利要求20所述的组合物,其中,所述引导核酸包含选自第一互补结构域、第二互补结构域、接头结构域、近端结构域和尾部结构域中的一个或多个结构域。
31.如权利要求20所述的组合物,其中,所述编辑蛋白为由酿脓链球菌衍生而来的Cas9蛋白、由金黄色葡萄球菌衍生而来的Cas9蛋白或由空肠弯曲杆菌衍生而来的Cas9蛋白。
32.如权利要求20所述的组合物,其中,所述用于基因操纵的组合物为引导核酸和编辑蛋白组合的引导核酸-编辑蛋白复合体的形式,
其中,所述引导核酸为引导RNA(gRNA)。
33.如权利要求20所述的组合物,其中,所述引导核酸和所述编辑蛋白分别以核酸序列的形式存在于一种或多种载体中。
34.如权利要求20所述的组合物,其中,所述用于基因操纵的组合物任选地进一步包括供体或编码所述供体的核酸序列,所述供体包含待插入的核酸序列。
35.如权利要求34所述的组合物,其中,所述待插入的核酸序列为凝血抑制基因的部分核酸序列。
36.如权利要求34所述的组合物,其中,所述待插入的核酸序列为编码凝血相关蛋白的基因的完整或部分序列。
37.如权利要求36所述的组合物,其中,所述凝血相关蛋白为选自于由以下所组成的组中的一种或多种蛋白:因子XII、因子XIIa、因子XI、因子XIa、因子IX、因子IXa、因子X、因子Xa、因子VIII、因子VIIIa、因子VII、因子VIIa、因子V、因子Va、凝血酶原、凝血酶、因子XIII、因子XIIIa、纤维蛋白原、纤维蛋白和组织因子。
38.如权利要求34所述的组合物,其中,所述引导核酸、所述编辑蛋白和所述供体分别以核酸序列的形式存在于一种或多种载体中。
39.如权利要求33或38所述的组合物,其中,所述载体为质粒或病毒载体。
40.如权利要求39所述的组合物,其中,所述病毒载体为选自于由以下所组成的组中的一种或多种病毒载体:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。
41.一种引导核酸,所述引导核酸包括与位于凝血抑制基因中的靶序列形成互补结合的引导序列,
其中,所述凝血抑制基因为AT(抗凝血酶)基因或TFPI(组织因子途径抑制剂)基因,
其中,所述引导序列为选自SEQ ID NO:425至SEQ ID NO:830中的一个或多个引导序列,
其中,所述互补结合包括0个至5个错配结合,
其中,所述引导核酸能够与编辑蛋白形成复合体。
42.如权利要求41所述的引导核酸,其中,所述引导序列为选自以下的一个或多个序列:SEQ ID NO:427、SEQ ID NO:428、SEQ ID NO:436、SEQ ID NO:437、SEQ ID NO:443、SEQID NO:444、SEQ ID NO:447、SEQ ID NO:448、SEQ ID NO:449、SEQ ID NO:454、SEQ ID NO:458、SEQ ID NO:460、SEQ ID NO:461、SEQ ID NO:463、SEQ ID NO:464、SEQ ID NO:466、SEQID NO:467、SEQ ID NO:469、SEQ ID NO:473、SEQ ID NO:474、SEQ ID NO:622、SEQ ID NO:623、SEQ ID NO:624、SEQ ID NO:625、SEQ ID NO:626、SEQ ID NO:627、SEQ ID NO:628、SEQID NO:630、SEQ ID NO:632、SEQ ID NO:634、SEQ ID NO:635、SEQ ID NO:638、SEQ ID NO:639、SEQ ID NO:641、SEQ ID NO:642、SEQ ID NO:659、SEQ ID NO:660、SEQ ID NO:661、SEQID NO:662、SEQ ID NO:663、SEQ ID NO:664、SEQ ID NO:665、SEQ ID NO:666、SEQ ID NO:667、SEQ ID NO:668、SEQ ID NO:669、SEQ ID NO:670、SEQ ID NO:671、SEQ ID NO:672、SEQID NO:673、SEQ ID NO:674、SEQ ID NO:675、SEQ ID NO:676、SEQ ID NO:677、SEQ ID NO:678、SEQ ID NO:679、SEQ ID NO:680、SEQ ID NO:681、SEQ ID NO:682、SEQ ID NO:683、SEQID NO:684、SEQ ID NO:686、SEQ ID NO:687和SEQ ID NO:688。
43.如权利要求41所述的引导核酸,其中,所述引导序列为选自以下的一个或多个序列:SEQ ID NO:692、SEQ ID NO:694、SEQ ID NO:705、SEQ ID NO:709、SEQ ID NO:710、SEQID NO:721、SEQ ID NO:726、SEQ ID NO:731、SEQ ID NO:733、SEQ ID NO:735、SEQ ID NO:740、SEQ ID NO:741、SEQ ID NO:742、SEQ ID NO:748、SEQ ID NO:781、SEQ ID NO:783、SEQID NO:786、SEQ ID NO:788、SEQ ID NO:791、SEQ ID NO:792、SEQ ID NO:794、SEQ ID NO:795、SEQ ID NO:796、SEQ ID NO:797、SEQ ID NO:798、SEQ ID NO:800、SEQ ID NO:802、SEQID NO:803、SEQ ID NO:804、SEQ ID NO:809、SEQ ID NO:810、SEQ ID NO:811、SEQ ID NO:813、SEQ ID NO:814、SEQ ID NO:815、SEQ ID NO:816、SEQ ID NO:817、SEQ ID NO:818、SEQID NO:819、SEQ ID NO:820、SEQ ID NO:821、SEQ ID NO:822、SEQ ID NO:823、SEQ ID NO:824、SEQ ID NO:825、SEQ ID NO:826、SEQ ID NO:827、SEQ ID NO:828、SEQ ID NO:829和SEQ ID NO:830。
44.如权利要求41所述的引导核酸,其中,所述引导序列与位于AT基因的外显子1、外显子2、外显子3、外显子4、外显子5、外显子6或外显子7中的靶序列形成互补结合。
45.如权利要求41所述的引导核酸,其中,所述引导序列与位于TFPI基因的外显子2、外显子3、外显子5、外显子6或外显子7中的靶序列形成互补结合。
46.如权利要求41所述的引导核酸,其中,所述引导核酸包含引导结构域。
47.如权利要求46所述的引导核酸,其中,所述引导结构域中包含所述引导序列。
48.如权利要求41所述的引导核酸,其中,所述引导核酸包含选自第一互补结构域、第二互补结构域、接头结构域、近端结构域和尾部结构域中的一个或多个结构域。
CN201980063541.XA 2018-07-26 2019-07-25 抗凝因子的基因编辑 Pending CN112888461A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862703578P 2018-07-26 2018-07-26
US62/703,578 2018-07-26
PCT/KR2019/009238 WO2020022803A1 (ko) 2018-07-26 2019-07-25 항응고 인자들의 유전자 에디팅

Publications (1)

Publication Number Publication Date
CN112888461A true CN112888461A (zh) 2021-06-01

Family

ID=69180684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980063541.XA Pending CN112888461A (zh) 2018-07-26 2019-07-25 抗凝因子的基因编辑

Country Status (5)

Country Link
US (1) US20210317448A1 (zh)
EP (1) EP3827847A4 (zh)
KR (1) KR20200012786A (zh)
CN (1) CN112888461A (zh)
WO (1) WO2020022803A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11866726B2 (en) 2017-07-14 2024-01-09 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
ES2785323B2 (es) * 2020-05-14 2020-12-18 Univ Madrid Complutense Metodo in vitro para recuperar la expresion del gen f5 que codifica el factor v de la coagulacion

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160340661A1 (en) * 2013-12-12 2016-11-24 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for genome editing
WO2018131551A1 (ja) * 2017-01-13 2018-07-19 学校法人自治医科大学 肝臓ゲノム上の凝固関連因子遺伝子を破壊するためのaavベクター

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230152175A (ko) * 2014-04-18 2023-11-02 에디타스 메디신, 인코포레이티드 암 면역요법을 위한 crispr-cas-관련 방법, 조성물 및 구성성분
CN108118057B (zh) * 2017-12-28 2021-04-06 吴文书 一种基因编辑系统及其制备方法和应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160340661A1 (en) * 2013-12-12 2016-11-24 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for genome editing
WO2018131551A1 (ja) * 2017-01-13 2018-07-19 学校法人自治医科大学 肝臓ゲノム上の凝固関連因子遺伝子を破壊するためのaavベクター

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MAXIMILIAN HAEUSSLER等: "Evaluation of off-target and on-target scoring algorithms and integration into the guide RNA selection tool CRISPOR", GENOME BIOLOGY, vol. 17, no. 1, pages 1 - 12, XP055551329, DOI: 10.1186/s13059-016-1012-2 *

Also Published As

Publication number Publication date
KR20200012786A (ko) 2020-02-05
WO2020022803A1 (ko) 2020-01-30
US20210317448A1 (en) 2021-10-14
EP3827847A4 (en) 2023-07-19
EP3827847A1 (en) 2021-06-02

Similar Documents

Publication Publication Date Title
AU2016326711B2 (en) Use of exonucleases to improve CRISPR/Cas-mediated genome editing
CA3009727A1 (en) Compositions and methods for the treatment of hemoglobinopathies
CN110248957B (zh) 经人工操纵的sc功能控制系统
JP7123982B2 (ja) 肝臓において目的のタンパク質を発現するためのプラットフォーム
EP3690045A2 (en) Gene manipulation for treatment of retinal dysfunction disorder
KR20210096088A (ko) 전이유전자 전달용 조성물 및 방법
CN112888461A (zh) 抗凝因子的基因编辑
JP2023515710A (ja) CRISPR媒介式エクソン欠失用の最適なgRNA対を発見するためのハイスループットスクリーニング法
US20200101173A1 (en) Genome Editing System For Repeat Expansion Mutation
KR20200011899A (ko) 인위적인 유전자 조작을 통한 자가면역질환 치료
EP3730610A1 (en) Modified cas9 system and its use for improved gene editing
KR20210113393A (ko) 혈액응고인자 viii 유전자 역위 보정에 의한 혈우병 치료용 조성물
US20230190889A1 (en) Gene editing of anticoagulant factors
KR20190037167A (ko) 혈액응고인자 viii 유전자 역위 보정능의 유전자 가위 시스템으로 구성된 혈우병 치료용 조성물
KR102662879B1 (ko) 망막 기능장애 질환 치료를 위한 유전자 조작

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination