CN111163633A - 包含人源化ttr基因座的非人类动物及其使用方法 - Google Patents

包含人源化ttr基因座的非人类动物及其使用方法 Download PDF

Info

Publication number
CN111163633A
CN111163633A CN201880063051.5A CN201880063051A CN111163633A CN 111163633 A CN111163633 A CN 111163633A CN 201880063051 A CN201880063051 A CN 201880063051A CN 111163633 A CN111163633 A CN 111163633A
Authority
CN
China
Prior art keywords
ttr
human
sequence
locus
human animal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880063051.5A
Other languages
English (en)
Other versions
CN111163633B (zh
Inventor
梅根·德拉蒙德-萨缪尔森
杰弗里·海恩斯
苏珊娜·哈特福德
大卫·弗伦杜威
布莱恩·扎姆布罗维兹
安德鲁·J·墨菲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN111163633A publication Critical patent/CN111163633A/zh
Application granted granted Critical
Publication of CN111163633B publication Critical patent/CN111163633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0278Knock-in vertebrates, e.g. humanised vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0025Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
    • A61K48/0041Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being polymeric
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • A01K2217/054Animals comprising random inserted nucleic acids (transgenic) inducing loss of function
    • A01K2217/058Animals comprising random inserted nucleic acids (transgenic) inducing loss of function due to expression of inhibitory nucleic acid, e.g. siRNA, antisense
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10041Use of virus, viral particle or viral elements as a vector

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Environmental Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本文提供包含人源化TTR基因座的非人类动物基因组、非人类动物细胞和非人类动物以及使用所述非人类动物基因组、非人类动物细胞和非人类动物的方法。包含人源化TTR基因座的非人类动物细胞或非人类动物表达人转甲状腺素蛋白或嵌合的转甲状腺素蛋白,来自人转甲状腺素蛋白的片段。本文提供使用包含人源化TTR基因座的非人类动物以评价诸如设计为靶定人TTR的核酸酶试剂之类的人‑TTR‑靶向试剂的体内效率的方法。本文还提供产生所述包含人源化TTR基因座的非人类动物的方法。

Description

包含人源化TTR基因座的非人类动物及其使用方法
相关申请的交叉引用
本申请要求2017年9月29日提交的美国申请US62/565,980和2018年6月1日提交的美国申请US62/679,142以及2018年8月21日提交的美国申请US62/720,292的权益,其每一个的全部内容通过引用并入本文,用于所有目的。
对通过EFS WEB提交的作为TEXT文件的序列表的引用
在文件519832SEQLIST.txt中写入的序列表的大小为139千字节,其于2018年9月25日创建并通过引用并入本文。
背景技术
转甲状腺素蛋白(TTR)是在血清和带有甲状腺激素和视黄醇的视黄醇结合蛋白的脑脊液中发现的蛋白质。肝脏分泌TTR进入血液中,同时脉络丛分泌TTR进入脑脊液中。TTR还在视网膜色素上皮细胞中产生并被分泌进入玻璃体中。错误折叠的且聚集的TTR在淀粉样蛋白疾病老年全身性淀粉样变性(SSA),家族性类淀粉多发性神经病变(FAP)和家族性类淀粉心肌症(FAC)中的多种组织和器官中累积。
用于TTR淀粉样变性疾病的一种有望的治疗方式是降低患者体内的TTR载荷。然而,本领域仍然需要如下合适的非人类动物,其在内源Ttr-基因座处提供人-TTR靶向试剂的真实的人靶点或接近人-TTR靶向试剂的真实的人靶点的近似靶点,从而能够检测这些试剂在活体动物中的作用效率和作用模式并且能够在人源化蛋白和人源化基因是存在的TTR的唯一形式的情况下进行药代动力学和药效学研究。
发明内容
本文提供包含人源化TTR基因座的非人类动物以及使用这些非人类动物的方法。本文还提供包含人源化TTR基因座的非人类动物基因组或细胞。
一方面,本文提供包含人源化TTR基因座的非人类动物基因组,非人类动物细胞或非人类动物。这样的非人类动物基因组,非人类动物细胞或非人类动物可在其基因组中包含基因修饰的内源Ttr-基因座,该内源Ttr-基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列。一些这样的非人类动物基因组,非人类动物细胞或非人类动物可包含基因修饰的内源Ttr-基因座,其中,内源Ttr-基因座的包含Ttr-编码的序列和非编码序列这两者的区域已被删除并且被相应的人TTR序列取代,该人TTR序列包含TTR编码序列和非编码序列这两者。任选地,基因修饰的内源Ttr-基因座包含内源Ttr启动子。任选地,人TTR序列可操作地连接至内源Ttr启动子。任选地,所述内源Ttr-基因座中的至少一个内含子和至少一个外显子已被删除并且被相应的人TTR序列取代。
在一些这样的非人类动物基因组,非人类动物细胞或非人类动物中,内源Ttr-基因座的整个Ttr-编码序列已被删除并且被相应的人TTR序列取代。任选地,内源Ttr-基因座的从Ttr-起始密码子至Ttr-终止密码子的区域已被删除并且被相应的人TTR序列取代。
在一些这样的非人类动物基因组,非人类动物细胞或非人类动物中,基因修饰的内源Ttr基因座包含人TTR3’非翻译区域。在一些这样的非人类动物中,内源Ttr5’非翻译区域未被删除并且未被相应的人TTR序列取代。
在一些这样的非人类动物基因组,非人类动物细胞或非人类动物中,内源Ttr-基因座的从Ttr-起始密码子至Ttr-终止密码子的区域已被删除并且被人TTR序列取代,所述人TTR序列包含相应的人TTR序列和人TTR3’非翻译区域,并且,内源Ttr5’非翻译区域未被删除并且未被相应的人TTR序列取代,并且内源Ttr启动子未被删除并且未被相应的人TTR序列取代。任选地,基因修饰的内源Ttr基因座处的人TTR序列包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ ID NO:18中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性。任选地,基因修饰的内源Ttr基因座编码包含如下序列,基本由如下序列构成或由如下序列构成的蛋白质,该序列与SEQ ID NO:1中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性。任选地,基因修饰的内源Ttr基因座包含编码序列,该编码序列包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ ID N:90中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性。任选地,基因修饰的内源Ttr基因座包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ ID NO:14或SEQ ID NO:15中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性。
在一些这样的非人类动物基因组,非人类动物细胞或非人类动物中,基因修饰的内源Ttr基因座编码包含信号肽的转甲状腺素蛋白前体蛋白,并且内源Ttr基因座的编码信号肽的区域未被删除并且未被相应的人TTR序列取代。任选地,内源Ttr基因座的第一外显子未被删除并且未被相应的人TTR序列取代。任选地,内源Ttr基因座的第一外显子和第一内含子未被删除并且未被相应的人TTR序列取代。任选地,内源Ttr基因座的从第二Ttr外显子的起始至Ttr终止密码子的区域已被删除并且被相应的人TTR序列取代。任选地,基因修饰的内源Ttr基因座包含人TTR3’非翻译区域。
在一些这样的非人类动物基因组,非人类动物细胞或非人类动物中,内源Ttr基因座的从第二Ttr外显子至Ttr终止密码子的区域已被删除并且被包含相应的人TTR序列和人TTR3’非翻译区域的人TTR序列取代,并且内源Ttr5’非翻译区域未被删除并且未被相应的人TTR序列取代,并且内源Ttr启动子未被删除并且未被相应的人TTR序列取代。任选地,基因修饰的内源Ttr基因座处的人TTR序列包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ ID NO:19中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性。任选地,基因修饰的内源Ttr基因座编码包含如下序列,基本由如下序列构成或由如下序列构成的蛋白质,该序列与SEQ ID NO:2中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性。任选地,基因修饰的内源Ttr基因座包含编码序列,该编码序列包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ IDN:91中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性。任选地,基因修饰的内源Ttr基因座包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ ID NO:16或SEQ ID NO:17中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性。
在一些这样的非人类动物基因组,非人类动物细胞或非人类动物中,基因修饰的内源Ttr基因座不包含选择盒或报告体基因。在一些这样的非人类动物基因组,非人类动物细胞或非人类动物中,基因修饰的内源Ttr基因座包含选择盒或报告体基因。在一些这样的非人类动物基因组,非人类动物细胞或非人类动物中,所述非人类动物基因组,非人类动物细胞或非人类动物对于基因修饰的内源Ttr基因座而言是纯合的。在一些这样的非人类动物基因组,非人类动物细胞或非人类动物中,所述非人类动物基因组,非人类动物细胞或非人类动物对于基因修饰的内源Ttr基因座而言是杂合的。
在一些这样的非人类动物基因组,非人类动物细胞或非人类动物中,所述非人类动物是哺乳动物。任选地,所述哺乳动物是啮齿类动物。任选地,所述啮齿类动物是大鼠或小鼠。任选地,所述非人类动物是小鼠。
另一方面,本文提供使用包含人源化TTR基因座的非人类动物体内评价人TTR-靶向试剂的活性的方法,这样的方法可包括:(a)向上述非人类动物中的任一种给药人-TTR-靶向试剂;以及(b)在非人类动物体内评价人-TTR-靶向试剂的活性。
在一些这样的方法中,所述给药包括腺相关病毒(AAV)-介导的递送,脂质纳米颗粒(LNP)-介导的递送或流体动力学递送(HDD)。任选地,所述给药包括LNP-介导的递送,并且任选地LNP剂量为约0.1mg/kg至约2mg/kg。任选地,所述给药包括AAV8-介导的递送。
在一些这样的方法中,步骤(b)包括从所述非人类动物中分离肝脏并且评价人-TTR-靶向试剂在肝脏中的活性。任选地,步骤(b)还包括评价人-TTR-靶向试剂在非肝脏器官或组织中的活性。
在一些这样的方法中,所述人-TTR-靶向试剂是基因组编辑试剂,并且所述评价包括评价对基因修饰的Ttr基因座的修饰。任选地,所述评价包括测量基因修饰的Ttr基因座中的插入或删除的频率。在一些这样的方法中,所述评价包括测量由基因修饰的Ttr基因座编码的Ttr信使RNA的表达。在一些这样的方法中,所述评价包括测量由基因修饰的Ttr基因座编码的TTR蛋白的表达。任选地,测量TTR蛋白的表达包括测量非人类动物中的TTR蛋白的血清水平。任选地,所述活性在非人类动物的肝脏中进行评价。
在一些这样的方法中,人-TTR-靶向试剂包含设计为靶向人TTR基因的区域的核酸酶试剂。任选地,所述核酸酶试剂包含Cas蛋白质和设计为靶向人TTR基因中的向导RNA靶向序列的向导RNA。任选地,Cas蛋白质是Cas9蛋白质。任选地,人-TTR-靶向试剂还包含外源供体核酸,其中,所述外源供体核酸被设计为与人TTR基因重组。任选地,外源供体核酸是单链寡脱氧核苷酸(ssODN)。
另一方面,本文提供优化人-TTR-靶向试剂的体内活性的方法。该方法可包括:(I)在其基因组中包含基因修饰的内源Ttr基因座的第一非人类动物中第一次进行上述评价人-TTR-靶向试剂的体内活性的方法中的任一种,所述基因修饰的内源Ttr基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者;(II)改变可变量并且在第二非人类动物中使用改变的可变量再次执行步骤(I)的方法,所述第二非人类动物在其基因组中包含基因修饰的内源Ttr基因座,该内源Ttr基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者;以及(III)将步骤(I)中人-TTR-靶向试剂的活性与步骤(II)中人-TTR-靶向试剂的活性进行比较并且选择产生较高活性的方法。任选地,步骤(III)可包括选择产生较高的效率,较高的精确度,较高的一致性或较高的特异性的方法。
任选地,步骤(II)中改变的可变量是将人-TTR-靶向试剂引入非人类动物的递送方法。任选地,给药包括LNP-介导的递送并且步骤(II)中改变的可变量是LNP制剂。任选地,步骤(II)中改变的可变量是将人-TTR-靶向试剂引入非人类动物的给药途径。任选地,步骤(II)中改变的可变量是引入至非人类动物的人-TTR-靶向试剂的浓度或量。任选地,步骤(II)中改变的可变量是引入至非人类动物的人-TTR-靶向试剂的形式。任选地,步骤(II)中改变的可变量是引入至非人类动物的人-TTR-靶向试剂。
在一些这样的方法中,人-TTR-靶向试剂包括Cas蛋白质(例如,Cas9蛋白质)和设计为靶向人TTR基因中的向导RNA靶向序列的向导RNA。任选地,步骤(II)中改变的可变量是向导RNA序列或向导RNA靶向序列。任选地,Cas蛋白质和向导RNA分别以RNA的形式被给药,并且步骤(II)中改变的可变量是Cas mRNA与向导RNA的比例。任选地,步骤(II)中改变的可变量是向导RNA的修饰。
另一方面,本文提供产生包含人源化TTR基因座的非人类动物的方法。一些这样的方法包括:(a)向非人类动物胚胎干(ES)细胞中引入:(i)靶向内源Ttr基因座中的靶向序列的核酸酶试剂,以及(ii)包含核酸插入体的靶向载体,所述核酸插入体包含侧面具有5’同源臂和3’同源臂的人TTR序列,所述5’同源臂与内源Ttr基因座中的5’靶向序列对应,所述3’同源臂与内源Ttr基因座中3’靶向序列对应,其中,所述靶向载体与内源Ttr基因座重组以产生在其基因修饰的内源Ttr基因座中包含人TTR序列的基因修饰的非人类ES细胞;(b)将所述基因修饰的非人类ES细胞引入至非人类动物宿主胚胎;以及(c)在代孕母体中孕育所述非人类动物宿主胚胎,其中,所述代孕母体产生在其基因组中包含基因修饰的内源Ttr基因座的F0子代基因修饰的非人类动物,所述基因修饰的内源Ttr基因座包含人TTR序列。
在一些这样的方法中,所述核酸酶试剂包含Cas蛋白质(例如,Cas9蛋白质)和向导RNA。在一些这样的方法中,所述靶向载体是长度为至少10kb的大靶向载体或者5’同源臂和3’同源臂的总长度为至少10kb的大靶向载体。在一些这样的方法中,所述非人类动物是小鼠或大鼠。在一些这样的方法中,所述非人类动物是小鼠。
附图说明
图1A显示了人和小鼠转甲状腺素蛋白(TTR)前体蛋白(分别为SEQ ID NO:1和6)的比对。其中显示了信号肽,T4结合结构域,相位0外显子/内含子边界以及相位1/2外显子/内含子边界。
图1B显示了人和小鼠转甲状腺素蛋白(TTR)编码序列(分别为SEQ ID NO:90和92)的比对。
图2显示了野生型鼠类Ttr基因座,人源化小鼠Ttr基因座的第一版本和人源化小鼠Ttr基因座的第二版本的示意图(未按照比例绘制)。其中显示了选择盒中的外显子、内含子、5’非翻译区域(UTR),3’UTR,起始密码子(ATG),终止密码子(TGA)以及loxP印迹。白色长方形显示鼠类序列,黑色长方形显示人序列。
图3显示了靶向建立人源化小鼠Ttr基因座的第一版本的示意图(未按照比例绘制)。其中显示了野生型小鼠Ttr基因座,带有自删除新霉素(SDC-Neo)选择盒的人源化小鼠Ttr基因座的F0等位基因(MAID 7576)以及带有由除去SDC-Neo选择盒产生的loxP印迹的人源化小鼠Ttr基因座的F1等位基因(MAID 7577)。白色长方形显示鼠类序列,黑色长方形显示人序列。
图4显示了靶向建立人源化小鼠Ttr基因座的第二版本的示意图(未按照比例绘制)。其中显示了野生型小鼠Ttr基因座,带有SDC-Neo选择盒的人源化小鼠Ttr基因座的F0等位基因以及带有由除去SDC-Neo选择盒产生的loxP印迹的人源化小鼠Ttr基因座的F1等位基因。白色长方形显示鼠类序列,黑色长方形显示人序列。
图5A显示了用于筛选第一靶定的小鼠Ttr基因座的策略的示意图(未按照比例绘制),包括缺失等位基因分析法(7576mTU,9090mTM,和9090mTD),获得等位基因分析法(7576hTU,7576hTD,Neo),滞留分析法(9090retU,9090retU2,9090retU3,9090retD,9090retD2,9090retD3)和设计为覆盖被CRISPR向导中断的区域的CRISPR分析法(9090mTGU,mGU,9090mTGD,和mGD)。白色长方形显示鼠类序列,黑色长方形显示人序列。
图5B显示了用于筛选第二靶定的小鼠Ttr基因座的策略的示意图(未按照比例绘制),包括缺失等位基因分析法(4552mTU,9212mTU,9090mTM,9212mTD),获得等位基因分析法(7655hTU,7576hTD,Neo),滞留分析法(9204mretU,9204mretD)和设计为覆盖被CRISPR向导中断的区域的CRISPR分析法(mGU,mGD,和9212mTGD)。白色长方形显示鼠类序列,黑色长方形显示人序列。
图6显示了β-肌动蛋白(Actb),β-2微球蛋白(B2M),小家鼠(Mus musculus)转甲状腺素蛋白(Mm Ttr)和智人(Homo sapiens)转甲状腺素蛋白(Hs TTR)在下述样本中的mRNA表达,所述样本来自于(1)对于人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F0等位基因)而言的F0代小鼠纯合体的肝脏样本,(2)野生型小鼠的肝脏样本,(3)对于人源化小鼠Ttr基因座的第一版本而言的F0代小鼠纯合体的脾脏样本,以及(4)野生型小鼠的脾脏样本。较低的Ct值表示较高的表达。
图7A和图7B显示了血清和脑脊液(CSF)中的人TTR蛋白质水平(图7A)和小鼠TTR蛋白质水平(图7B)的ELISA分析结果。所测试的样品包括来自对于人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F0等位基因)而言的F0代小鼠纯合体的血清和CSF,人血清和CSF对照,以及小鼠(F1H14)血清和CSF对照。
图7C显示了血清中人TTR蛋白质水平(1)和小鼠TTR蛋白质水平(2)的ELISA分析的结果。所测试的样品包括来自对于由第一克隆(克隆7576C-G7)产生的人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F0等位基因)而言的F0代小鼠纯合体的血清样品,来自对于由第二克隆(克隆7576A-A5)产生的人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F0等位基因)而言的F0代小鼠纯合体的血清样品,以及野生型小鼠(F1H4)。小鼠血清和人血清用作对照。
图8显示了血清样品中通过western印迹确定的人TTR蛋白质表达,所述血清样品来自野生型小鼠(F1H4),对于由第一克隆(克隆7576C-G7)产生的人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F0等位基因)而言的F0代小鼠纯合体,以及对于由第二克隆(克隆7576A-A5)产生的人源化小鼠Ttr基因座的第一版本而言的F0代小鼠纯合体。小鼠血清用作阴性对照,人血清用作阳性对照。小鼠IgG用作负载对照。
图9显示了肝脏和肾脏样品中通过western印迹确定的人TTR蛋白质表达,所述肝脏和肾脏样品来自野生型小鼠(F1H4),对于由第一克隆(克隆7576C-G7)产生的人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F0等位基因)而言的F0代小鼠纯合体,以及对于由第二克隆(克隆7576A-A5)产生的人源化小鼠Ttr基因座的第一版本而言的F0代小鼠纯合体。小鼠血清用作阴性对照,人血清用作阳性对照。GAPDH用作负载对照。
图10显示了通过第二代测序(NGS)确定的在从对于人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F0等位基因)而言的F0代小鼠纯合体中分离出来的初级肝细胞中人源化小鼠Ttr基因座处的基因组编辑百分比(通过溶解的细胞池中PCR反应中读取的序列总数观察到的插入或删除总数)。所测试的样品包括未处理的肝细胞和用包含Cas9 mRNA和设计为靶向人TTR的向导RNA的脂质纳米颗粒处理的肝细胞。
图11A至图11H显示了将含有Cas9 mRNA和设计为靶向人TTR的向导RNA的脂质纳米颗粒注射至对于人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F0等位基因)而言的F0代小鼠纯合体之后14天的丙氨酸转氨酶(ALT)(图11A),天冬氨酸转氨酶(AST)(图11B),甘油三酯(图11C),胆固醇(图11D),高密度脂蛋白(HDL)(图11E),低密度脂蛋白(LDL)(图11F),未酯化的脂肪酸(NEFA)(图11G)和白蛋白(图11H)的血清化学分析。U/L是指单位/升,mg/dL是指毫克/分升,mEq/L是指毫当量/升,g/dL是指克/分升。
图12显示了通过第二代测序(NGS)确定的来自将缓冲对照或包含Cas9 mRNA和设计为靶向人TTR的向导RNA的脂质纳米颗粒注射至对于人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F0等位基因)而言的F0代小鼠纯合体之后14天的肝脏样本中人源化小鼠Ttr基因座处的基因组编辑百分比(通过溶解的细胞池中PCR反应中读取的序列总数观察到的插入或删除总数)。
图13显示了野生型小鼠(F1H4),通过流体动力学递送(HDD)引入人TTR质粒的小鼠以及通过HDD引入嵌合小鼠/人TTR质粒(由外显子1编码的区域是小鼠,由外显子2-4编码的区域是人)的小鼠中ELISA分析人TTR血清水平的结果。显示了两个阴性对照,并且人血清用作阳性对照。
图14显示了在将缓冲对照或包含Cas9 mRNA和设计为靶向人TTR的人TTR向导RNA1的脂质纳米颗粒注射至对于人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F1等位基因,衍生自克隆7576B-F10)而言的F2代小鼠纯合体之后8天的肝脏细胞溶解产物中ELISA分析人TTR水平的结果。
图15A和图15B显示了在将缓冲对照或包含Cas9 mRNA和设计为靶向人TTR的人TTR向导RNA 1的脂质纳米颗粒注射至对于人源化小鼠Ttr基因座的第一版本(MAID 7576;来自图3的F1等位基因,衍生自克隆7576B-F10)而言的F2代小鼠纯合体之后8天的血清样品(图15A中为1:5000稀释度,图15B中为1:10000稀释度)中ELISA分析人TTR水平的结果。
图16显示了hTTR7577/7577,hTTR7655/7655,hTTR7655/7656,和hTTR7656/7656,以及hTTR7656/WT小鼠的血浆样品中ELISA分析人TTR水平的结果。
图17A和图17B显示了hTTRWT/WT和hTTR7577/7577小鼠(3月龄)的血浆样品中ELISA分析人TTR水平和小鼠TTR水平的结果。人血清用作对照。
图17C显示了3月龄hTTRWT/WT和hTTR7577/7577小鼠的肝脏样品中mTTR mRNA的表达(1)和hTTR mRNA的表达(2)。较低的Ct值代表较高的表达。
图18显示了野生型小鼠(F1H4),hTTR7577/7577(hTTR v1),和hTTR7656/7656(hTTRv2)小鼠(2-3月龄)的血浆样品中ELISA分析人TTR水平的结果。
图19显示了通过第二代测序确定的在将缓冲对照或包含Cas9mRNA和设计为靶向人TTR的向导RNA的脂质纳米颗粒注射至对于人源化小鼠Ttr基因座的第一版本而言的小鼠纯合体之后的肝脏样品中人源化小鼠Ttr基因座处的基因组编辑百分比。
图20显示了在将缓冲对照或包含Cas9 mRNA和设计为靶向人TTR的向导RNA的脂质纳米颗粒注射至对于人源化小鼠Ttr基因座的第一版本而言的小鼠纯合体之后的血清样品中ELISA分析人TTR水平的结果。
具体实施方式
释义
本文中可互换使用的术语“蛋白质”,“多肽”和“肽”包括任何长度的氨基酸的聚合形式,包括编码的和非编码的氨基酸以及化学或生物化学修饰的或衍生的氨基酸。这些术语还包括诸如具有修饰的肽骨架的多肽之类的已经被修饰的聚合物。术语“结构域”是指蛋白质或多肽的具有特定功能或结构的任何部分。
蛋白质被描述为具有“N-末端”和“C-末端”。术语“N-末端”涉及蛋白质或多肽的起始点,其以具有游离胺基(-NH2)的氨基酸为终点。术语“C-末端”涉及氨基酸链(蛋白质或多肽)的终点,其以游离羧基(-COOH)为终点。
本文中可互换使用的术语“核酸”和“多核苷酸”包括任何长度的核苷酸的聚合形式,包括核糖核苷酸,脱氧核糖核苷酸或其类似物或修饰的形式。它们包括单链DNA或RNA,双链DNA或RNA和多链DNA或RNA,基因组DNA,cDNA,DNA-RNA杂合体以及包含嘌呤碱基,嘧啶碱基或其他天然的、化学修饰的、生物化学修饰的、非天然的或衍生得到的核苷酸碱基的聚合物。
核酸被描述为具有“5’端”和“3’端”,因为单核苷酸以使一个单核苷酸戊糖环的5’磷酸酯在一个方向上通过磷酸二酯键连接至相邻的单核苷酸戊糖环的3’氧的方式发生反应形成寡核苷酸。若寡核苷酸的5’磷酸酯没有与单核苷酸戊糖环的3’氧连接,那么寡核苷酸的这一端被称为5’端。如果寡核苷酸的3’氧没有与另一单核苷酸戊糖环的5’磷酸酯连接,那么寡核苷酸的这一端被称为3’端。即便核酸序列内部形成较大的寡核苷酸,那么核酸序列也可被描述为具有5’端和3’端。在线性或环状DNA分子中,离散元件被称为“上游”元件或“下游”的5’元件或3’元件。
术语“基因组整合的”是指已被引入至细胞内使得核苷酸序列整合至细胞的基因组中的核酸。任何操作规程可用于将核酸稳定地合并至细胞的基因组中。
术语“表达载体”或“表达构建体”或“表达盒”是指如下重组核酸,其含有可操作地连接至合适的核酸序列的期望的编码序列,所述合适的核酸序列是可操作地连接的编码序列在特定宿主细胞或生物体内表达所必需的。在原核生物中表达所必需的核酸序列通常包括启动子、操纵子(任选)和核糖体结合位点,以及其他序列。通常已知真核细胞使用启动子、增强子以及终止和聚腺苷酸化信号,虽然一些元件可能被删除或添加了其他元件,但是不会牺牲必要的表达。
术语“靶向载体”是指可通过同源重组,非同源末端结合介导的连接或任何其他重组方式引入至细胞基因组中的目标位置的重组核酸。
术语“病毒载体”是指重组核酸,其包含病毒来源中的至少一种元件并且包括足以包装至病毒载体颗粒中或能够包装至病毒载体颗粒中的元件。载体和/或颗粒可用于将DNA,RNA或其他核酸离体或体内转染至细胞的目的。本领域已知多种形式的病毒载体。
与蛋白质、核酸和细胞有关的术语“分离的”包括相对于通常可能原位存在的细胞成分或生物体成分而相对地进行纯化的蛋白质、核酸和细胞,相当于并且包括蛋白质、核酸或细胞的基本纯的制剂。术语“分离的”还包括具有非天然生成的相应成分或蛋白质或核酸的蛋白质或核酸,所述非天然生成的相应成分或蛋白质或核酸是化学合成的并且因此基本没有被其他蛋白质或核酸污染。术语“分离的”还包括从与其天然伴生的大多数其他细胞成分或生物体成分中分离出来的或纯化得到的蛋白质、核酸或细胞(例如,其他细胞蛋白、核酸或者细胞或细胞外成分)。
术语“野生型”包括具有在正常(与突变、患病、发生改变等相反的)状态或情况中发现的结构和/或活性的实体。野生型基因和多肽通常以多种不同的形式(例如,等位基因)存在。
术语“内源序列”是指在细胞或非人类动物中天然出现的核酸序列。例如,非人类动物的内源Ttr序列是指在非人类动物的Ttr基因座处天然出现的原生Ttr序列。
“外源”分子或序列包括外源形式的通常不存在于细胞中的分子或序列。通常存在包括相对于细胞的特定发育阶段和环境条件的存在。例如,外源分子或序列可包括细胞内的相应内源序列的突变形式(例如,内源序列的人源化形式)或可包括对应于细胞内的内源序列的不同形式的(即,不存在于染色体内)序列。相反,内源分子或序列包括通常以内源形式在特定环境条件下在特定发育阶段存在于特定细胞中的分子或序列。
本文中在涉及核酸或蛋白质时使用术语“异源”表明核酸或蛋白质包括至少两个不会天然地在同一分子中一同出现的片段。例如,当涉及核酸片段或蛋白质片段时使用术语“异源”表明核酸或蛋白质包括两个或多个子序列,该子序列没有在本质上彼此相同的关系(例如,连接在一起)中发现。例如,核酸载体的“异源”区域是另一核酸分子内或与另一核酸分子连接的核酸的片段,所述另一核酸分子没有被发现与其他分子本质上相关。例如,核酸载体的异源区域可包括如下编码序列,其侧面具有没有发现与该编码序列本质上相关的序列。类似地,蛋白质的“异源”区域是另一肽分子内的或与另一肽分子连接的氨基酸的片段,所述另一肽分子没有被发现与其他肽分子本质上相关(例如,融合蛋白或带有标签的蛋白)。类似地,核酸或蛋白质可包括异源标签或异源分泌物或定位序列。
“密码子优化”利用了密码子的简并性,如指定氨基酸的三碱基对密码子组合的多样性所展现的那样,并且,所述密码子优化总体上包括通过由宿主细胞基因中更加频繁使用的或最频繁使用的密码子取代天然序列中的至少一个密码子并同时保留天然氨基酸序列来修饰核酸序列以提高其在特定宿主细胞中的表达的过程。例如,编码Cas9蛋白质的核酸可被修饰为与天然生成的核酸序列相比取代了给定的原核细胞或真核细胞中具有较高使用频率的密码子,所述原核细胞或真核细胞包括细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞或任何其他宿主细胞。密码子使用表格易于获取自例如,在“密码子使用数据库(Codon Usage Database)”。这些表格可以多种方式进行调节。参见,Nakamura等人,(2000)Nucleic Acids Research 28:292,该参考文献的全部内容通过引用并入本文,用于所有目的。还可获得用于在特定宿主中进行表达的特定序列的密码子优化的计算机算法(参见例如,Gene Forge)。
术语“基因座”是指基因(或显著序列),DNA序列,多肽-编码序列的特定位置,或生物体基因组的染色体上的位置。例如,“Ttr-基因座”可以是指Ttr-基因,Ttr-DNA序列,转甲状腺素蛋白编码序列的特定位置或生物体的基因组的染色体上的Ttr-位置,所述生物体已被识别为其中带有这样的序列。“Ttr-基因座”可包含Ttr-基因的调节性元件,包括,例如,增强子,启动子,5’和/或3’非翻译区域(UTR)或者它们的组合。
术语“基因”是指编码产物(例如,RNA产物和/或多肽产物)并且包括被非编码内含子干扰的编码区域和位于靠近5’和3’端上的编码区域的序列的染色体中的DNA序列,这样,所述基因对应于全长mRNA(包括5’和3’非翻译序列)。术语“基因”还包括其他非编码序列,其包括调节性序列(例如,启动子,增强子和转录因子结合位点),聚腺苷酸化信号,内部核糖体进入位点,沉默子,隔离序列和基质连接区域。这些序列可能靠近基因的编码区域(例如,10kb之内)或者位于较远的位点,并且它们会影响基因的转录和翻译水平或速度。
术语“等位基因”是指基因的变体形式。一些基因具有多个不同的形式,其位于染色体上的相同的位置或染色体上的基因座处。双倍体生物体在每个基因座处具有两个等位基因。每对等位基因代表特定基因的基因座的基因分型。如果特定基因座处具有两个相同的等位基因,那么,基因分型被描述为纯合体,如果特定基因座处的两个等位基因不同,那么基因分型被描述为杂合体。
基因的“编码区域”或“编码序列”由基因的编码蛋白质的DNA或RNA部分构成,所述DNA或RNA部分由外显子构成。所述区域在5’端上的起始密码子处开始并且在3’端的终止密码子处结束。
“启动子”是DNA的调节性区域,其通常包括能够指向RNA聚合酶II以在特定的多核苷酸序列的合适的转录起始位点启动RNA合成的TATA盒。启动子还可包括影响转录启动速度的其他区域。本文公开的启动子序列调节可操作地连接的多核苷酸的转录。启动子在本文公开的细胞类型(例如,真核细胞、非人类哺乳动物细胞、人类细胞、啮齿动物细胞、多能细胞、单细胞期胚胎、分化的细胞或其组合)中的一种或多种中可具有活性。例如,启动子可以是组成性活性启动子、条件性启动子、可诱导的启动子、时间限制启动子(例如,发育调节的启动子)或空间限制启动子(例如,细胞特异性或组织特异性启动子)。启动子的实例可在例如WO2013/176772中找到,该参考文献的全部内容通过引入并入本文,用于所有目的。
“可操作地连接”或“被可操作地连接的”包括两个或多个成分(例如,启动子和另一序列元件)并列在一起,使这两个成分正常发挥作用并使得所述成分中的至少一个能够调节在其他成分中的至少一个之后发挥功能。例如,如果启动子响应一个或多个转录调节因子的存在或不存在控制编码序列的转录水平,那么所述启动子可以可操作地连接至所述编码序列。可操作的连接可包括彼此邻近的序列或反向作用的序列(例如,调节性序列可远距离发挥作用以控制所述编码序列的转录)。
核酸的“互补”是指核酸的一个链中的核苷酸序列根据其碱基的方向性与相对的核酸链上的另一序列形成氢键。DNA中的互补碱基通常是A与T和C与G。在RNA中,互补碱基通常是C与G和U与A。互补性可以是完全互补的或者大量/充分互补的。两个核酸之间的完全互补是指两个核酸可形成二倍体,其中,该二倍体中的每个碱基通过沃森-克里克(Watson-
Crick)碱基配对原则与互补碱基键合。“大量”或“充分”互补是指一个链中的序列不与相对链中的序列全部和/或完全互补,但是在这两个链上的碱基之间出现足够的键合以在一系列杂交条件(例如,盐浓度和温度)下形成稳定的杂交复合物。这些条件可使用序列和预测杂交的链的Tm(熔融温度)的标准数学计算方法进行预测,或可使用常规方法由经验确定Tm来进行预测。
Tm包括两个核酸链之间形成的杂交复合物群发生50%变性(即,双链核酸分子群的一半解离成单链)的温度。在低于Tm温度的条件下,有利于形成杂交复合物,而在高于Tm温度的条件下,有利于杂交复合物中的链发生熔融或分离。可使用例如Tm=81.5+0.41(%G+C)估算在1M NaCl水溶液中具有已知的G+C含量的核酸的Tm,虽然其他已知的Tm计算方法需要考虑核酸的结构特征。
“杂交条件”包括通过互补链相互作用和氢键合将一个核酸链结合至另一核酸链以生成杂交复合物的累积环境。这些条件包括含有核酸的水溶液或有机溶液的化学成分及其浓度(例如,盐、螯合剂、甲酰胺)以及混合物的温度。诸如孵育时间的长度或反应腔室的尺寸之类的其他因素可有助于所述环境。参见,例如,Sambrook等人,Molecular Cloning,ALaboratory Manual,2.sup.nd ed.,pp.1.90-1.91,9.47-9.51,1 1.47-11.57(ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989),该参考文献的全部内容通过引用并入本文,用于所有目的。
虽然在碱基之间可能会发生错配,但是,杂交要求两个核酸包含互补的序列。适于在两个核酸之间发生杂交的条件取决于核酸的长度和互补的程度,其是本领域熟知的可变量。两个核苷酸序列之间的互补程度越大,具有那些序列的核酸的杂交体的熔融温度(Tm)的数值越大。对于具有较短的互补片段(例如,35个核苷酸或更少的核苷酸互补,30个核苷酸或更少的核苷酸互补,25个核苷酸或更少的核苷酸互补,22个核苷酸或更少的核苷酸互补,20个核苷酸或更少的核苷酸互补,或18个核苷酸或更少的核苷酸互补)的核酸之间的杂交而言,错配位置变得非常重要(参见上述Sambrook等人,11.7-11.8)。通常,可杂交的核酸的长度为至少约10个核苷酸。可杂交的核酸的示例性的最小长度包括至少约15个核苷酸,至少约20个核苷酸,至少约22个核苷酸,至少约25个核苷酸,以及至少约30个核苷酸。而且,温度和洗涤溶液的盐浓度可根据诸如互补区域的长度和互补程度之类的因素进行必要地调节。
多核苷酸的序列不需要与待进行特异性杂交的其靶向核酸的序列100%互补。而且,多核苷酸可在一个或多个片段上进行杂交,使得中间的片段或邻近片段不涉及杂交事件(例如,环结构或发夹结构)。多核苷酸(例如,gRNA)可包括与其所靶定的靶向核酸序列内的目标区域具有至少70%序列互补性,至少80%序列互补性,至少90%序列互补性,至少95%序列互补性,至少99%序列互补性或100%序列互补性。例如,18个至20个核苷酸与目标区域互补并且因此进行特异性杂交的gRNA可表现出90%的互补性。在该实例中,剩余的非互补性核苷酸可以是成簇的或穿插在互补核苷酸之间并且无需彼此相邻或与互补的核苷酸相邻。
核酸内核酸序列的特定片段之间的互补百分比可使用BLAST(碱基局部比对检索工具,basic local alignment search tool)程序和PowerBLAST程序(Altschul等人,(1990)J.Mol.Biol.215:403-410;Zhang and Madden(1997)Genome Res.7:649-656,其每一个的全部内容通过引用并入本文,用于所有目的)进行常规确定或通过使用Gap程序(Wisconsin Sequence Analysis Package,Version 8for Unix,Genetics ComputerGroup,University Research Park,Madison Wis.),使用默认设置进行常规确定,所述Gap程序使用Smith和Waterman算法((1981),Adv.Appl.Math.,2,482-489,其全部内容通过引用并入本文,用于所有目的)。
本文提供的方法和组合物使用多种不同的成分。全文中的一些成分可具有活性变体和碎片。这些成分包括例如:Cas蛋白质,CRISPR RNA,tracrRNA,和向导RNA。这些成分中的每一个的生物活性在本文中进行描述。术语“功能”是指蛋白质或核酸(或其片段或变体)展现出生物活性或功能的固有能力。这些生物活性或功能可包括例如:Cas蛋白质结合至向导RNA以及结合至目标DNA序列的能力。功能片段或变体的生物功能可以是相同的或相对于原始功能片段或变体实质上可发生改变(例如,关于其特异性或选择性或效率),但是仍然保留其基本生物功能。
术语“变体”是指不同于种群中的最普遍的序列的核苷酸序列(例如,一个核苷酸的差异)或者不同于种群中的最普遍的序列的蛋白质序列(例如,一个氨基酸的差异)。
涉及蛋白质的术语“片段”是指比全长蛋白质具有更短或更少的氨基酸的蛋白质。涉及核酸的术语“片段”是指比全长核酸具有更短或更少的核苷酸的核酸。片段可以是例如N-末端片段(即,除去了蛋白质的C末端部分),C-末端片段(即,除去了蛋白质的N末端部分),或内部片段。
涉及两个多核苷酸或多肽序列的上下文中的“序列一致性”或“一致性”涉及在特定比对窗口上进行最大一致性比对时两个序列中的相同残基。
当针对蛋白质使用序列一致性的百分比时,不一致的残基位置通常由于保守氨基酸的取代而不同,其中,氨基酸残基被具有类似化学性质(例如,电荷或疏水性)的其他氨基酸残基取代并且因此不会改变分子的功能特性。当序列的不同之处在于保守取代时,序列一致性百分比可向上调节以校正取代的保守性。因这种保守取代而不同的序列被称为具有“序列类似性”或“类似性”。本领域熟知进行这种调节的方式。通常,这涉及将保守取代记为部分错配而非完全错配,从而增加序列一致性百分比。因此,例如,在等同氨基酸计分为1并且非保守取代计分为0的条件下,保守取代的计分为0和1之间。例如,如在程序PC/GENE(Intelligenetics,Mountain View,California)中所实施的,计算保守取代的计分。
“序列一致性的百分比”包括通过在比较窗口上比较两个最佳比对的序列(完全匹配的残基的最大数目)所确定的数值,其中,对于两个序列的最佳比对而言,比较窗口中的多核苷酸序列的一部分可包括相比于参比序列(其不包括添加或删除)的添加或删除(即,空隙)。百分比如下进行计算:确定两个序列中出现等同的核酸碱基或氨基酸残基的位置数目以获得匹配的位置数目,匹配的位置数目除以比较窗口中的总位置数目并乘以100以得到序列一致性百分数。除非另有说明(例如,较短的序列包括连接的异源序列),比较窗口是全长的进行比较的两个较短的序列。
除非另有说明,序列一致性/类似性数值包括通过使用如下参数的GAP版本10而获得的数值,所述参数为:对于核苷酸序列的%一致性和%相似性使用50的GAP权重和3的长度权重以及nwsgapdna.cmp计分矩阵,对于氨基酸序列的%一致性和%相似性使用8的GAP权重和2的长度权重以及BLOSUM62计分矩阵,或其任何等同程序。“等同程序”包括任何序列比较程序,对于所考虑的任何两个序列而言,当与GAP版本10生成的相应比对比较时,所述序列比较程序产生具有等同的核苷酸或氨基酸残基匹配和序列一致性等同百分比的比对。
术语“保守氨基酸取代”是指使用类似尺寸、电荷或极性的不同氨基酸取代通常存在于序列中的氨基酸。保守取代的实例包括将非极性(疏水)残基(例如,异亮氨酸、缬氨酸或亮氨酸)取代为另一非极性残基。类似地,保守取代的实例包括将一个极性(亲水性)残基取代为另一极性残基,例如,精氨酸和赖氨酸之间的取代,谷氨酰胺和天冬酰胺之间的取代,或甘氨酸和丝氨酸之间的取代。此外,将碱性残基(例如,赖氨酸、精氨酸或组氨酸)取代为另一碱性残基或将一个酸性残基(例如,天冬氨酸或谷氨酸)取代为另一酸性残基是保守取代的其他实例。非保守取代的实例包括将非极性(疏水)氨基酸残基(例如,异亮氨酸、缬氨酸、亮氨酸、丙氨酸或甲硫氨酸)取代为极性(亲水)残基(例如,半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸)和/或将极性残基取代为非极性残基。典型的氨基酸分类在下表1中予以总结。
表1.氨基酸分类
Figure BDA0002428169960000191
“同源性”序列(例如,核酸序列)包括与已知的参比序列等同的或基本类似的序列,例如,其与已知的参比序列具有至少50%,至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或至少100%的一致性。同源性序列可包括例如,直系同源序列和旁系同源序列。例如,同源性基因通常通过歧异成种事件(直系同源基因)或基因重复事件(旁系同源基因)起源于共同的祖DNA序列。“直系同源”基因包括通过歧异成种从共同的祖基因进化而来的不同物种中的基因。直系同源通常在进化过程中保留了相同的功能。“旁系同源”基因包括基因组中的重复事件所涉及的基因。旁系同源可在进化过程中发展出新的功能。
术语“体外(in vitro)”包括人工环境以及在人工环境(例如,试管)中发生的加工或反应。术语“体内(in vivo)”包括天然环境(例如,细胞或生物体或人体)以及在天然环境中发生的加工或反应。术语“离体(ex vivo)”包括已从个体体内取出的细胞以及在该细胞中发生的加工或反应。
术语“报告体基因”是指具有编码基因产物(通常为酶)的序列的核酸,在将包含可操作地连接至内源或异源启动子和/或增强子元件的报告体基因序列的构建体引入至含有(或可能含有)活化所述启动子和/或增强子元件所必需的因子的细胞中时易于定量分析所述基因产物。报告体基因的实例包括但不限于:编码β-半乳糖苷酶(lacZ)的基因,细菌氯霉素乙酰转移酶(cat)基因,萤火虫荧光素酶基因,编码β-葡萄糖醛酸酶(GUS)的基因,以及编码荧光蛋白的基因。“报告体蛋白”是指由报告体基因编码的蛋白质。
本文使用的术语“荧光报告体蛋白”是指可基于荧光进行检测的报告体蛋白,其中,所述荧光可直接来自于报告体蛋白,来自于报告体蛋白在荧光底物上的活性或来自于对荧光标记的化合物结合具有亲和性的蛋白质。荧光蛋白的实例包括绿色荧光蛋白(例如,GFP,GFP-2,tagGFP,turboGFP,eGFP,Emerald,Azami Green,Monomeric Azami Green,CopGFP,AceGFP,和ZsGreenl),黄色荧光蛋白(例如,YFP,eYFP,Citrine,Venus,YPet,PhiYFP,和ZsYellowl),蓝色荧光蛋白(例如,BFP,eBFP,eBFP2,Azurite,mKalamal,GFPuv,Sapphire,和T-sapphire),青色荧光蛋白(例如,CFP,eCFP,Cerulean,CyPet,AmCyanl,和Midoriishi-Cyan),红色荧光蛋白(例如,RFP,mKate,mKate2,mPlum,DsRed monomer,mCherry,mRFP1,DsRed-Express,DsRed2,DsRed-Monomer,HcRed-Tandem,HcRedl,AsRed2,eqFP611,mRaspberry,mStrawberry,和Jred),橙色荧光蛋白(例如,mOrange,mKO,Kusabira-Orange,Monomeric Kusabira-Orange,mTangerine,和tdTomato)和任何其他合适的可通过流式细胞术方法检测其在细胞中的存在的荧光蛋白。
响应双链断裂(DSB)的修复主要通过两种保守DNA修复通路:同源重组(HR)和非同源性末端结合(NHEJ)而发生。参见,Kasparek&Humphrey(2011)Seminars in Cell&Dev.Biol.22:886-897,其全部内容通过引用并入本文,用于所有目的。同样,由外源供体核酸介导的目标核酸的修复可包括两个多核苷酸之间的遗传信息进行交换的任何过程。
术语“重组”包括在两个多核苷酸之间发生遗传信息交换的任何过程并且“重组”可通过任何机理发生。重组可通过同源定向修复(HDR)或同源重组(HR)发生。HDR或HR包括可能需要核苷酸序列同源性的核酸修复形式,使用作为用于修复“目标”分子(即,经历了双链断裂的分子)的模板的“供体”分子并且引起遗传信息从供体转移至靶标。在不受任何特定理论的限制的条件下,这些转移可能会涉及在断裂的靶标和供体之间形成的异源双链DNA的错配校正和/或合成依赖的链退火和/或相关过程,在所述合成依赖的链退火过程中,所述供体用于再合成将会成为靶标的一部分的遗传信息。在一些情况下,供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分整合进入靶标DNA。参见,Wang等人,(2013)Cell 153:910-918;Mandalos等人,(2012)PLOS ONE 7:e45768:1-9;and Wang等人,(2013)Nat Biotechnol.31:530-532,这些参考文献中的每一个的全部内容通过引用并入本文,用于所有目的。
NHEJ包括通过使断裂末端彼此直接连接或使断裂末端连接至外源序列而无需同源模板而对核酸中的双链断裂进行修复。通过NHEJ进行非邻近序列的连接通常可在双链断裂的位点附近产生删除、插入或位移。例如,NHEJ还可通过使断裂末端与外源供体核酸的末端直接连接(例如,基于NHEJ的捕获)而产生外源供体核酸的定向整合。当同源定向修复(HDR)通路不易于使用(例如,在未分化的细胞,初始细胞和难以进行同源DNA修复的细胞中)时,这种NHEJ介导的定向整合对于外源供体核酸的插入而言是优选的。此外,与同源定向修复形成鲜明对照的是,不太需要涉及裂解位点侧面较大区域的序列一致性的知识,这些知识在尝试向具有对其基因组序列不太了解的基因组的生物体内进行定向插入时是有益的。整合可通过将外源供体核酸和裂解的基因组序列之间的平端进行连接或通过使用外源供体核酸连接粘性末端(即,具有5’或3’的悬挂)来进行,其中,所述外源供体核酸位于与由裂解的基因组序列中的核酸酶试剂生成的那些悬挂相容的悬挂的侧面。参见例如,US2011/020722,WO 2014/033644,WO 2014/089290,和Maresca等人,(2013)GenomeRes.23(3):539-546,这些参考文献中的每一个的全部内容通过引用并入本文,用于所有目的。如果平端被连接,那么可能需要靶点切除和/或供体切除以生成片段连接所需的微同源区域,靶点切除和/或供体切除可能会在靶向序列中产生不想要的改变。
术语“抗原-结合蛋白”包括与抗原结合的任何蛋白质。抗原-结合蛋白的实例包括抗体,抗体的抗原结合片段,多特异性抗体(例如,双特异性抗体),scFV,双-scFV,双抗体,三抗体,四抗体,V-NAR,VHH,VL,F(ab),F(ab)2,DVD(双可变结构域抗原-结合蛋白),SVD(单可变结构域抗原-结合蛋白),双特异性T-细胞接合器(BiTE)或Davisbody(美国专利US8,586,713,其全部内容通过引用并入本文,用于所有目的)。
术语“抗原”是指作为整个分子或分子中的结构域的物质,所述抗原能够诱发产生对这种物质具有结合特异性的抗体。术语抗原还包括如下物质,其在野生型宿主生物体中不会通过自识别诱发抗体产生,但是可通过合适的基因工程破坏免疫耐受性在宿主动物中诱发这种反应。
术语“表位”是指抗原上的与抗原-结合蛋白(例如,抗体)结合的位点。表位可由连续氨基酸或通过一个或多个蛋白质的三级折叠而并列的非连续氨基酸形成。由连续氨基酸形成的表位(也称为线性表位)通常在暴露于变性溶剂时仍然保留,而由三级折叠形成的表位(也称为构象表位)在经变性溶剂处理之后通常缺失。表位通常包括独特空间构象中的至少3个氨基酸并且更加通常地包括独特空间构象中的至少5个或8至10个氨基酸。确定表位的空间构象的方法包括例如:x射线晶体学和二维核磁共振。参见,例如,Epitope MappingProtocols,in Methods in Molecular Biology,Vol.66,Glenn E.Morris,编辑(1996),其全部内容通过引用并入本文,用于所有目的。
本文所述的抗体补位通常包括最小的互补决定区(CDR),其特异性识别异源表位(例如,重链和/或轻链可变结构域的CDR3区域)。
术语“抗体”包括免疫球蛋白分子,其包含四个多肽链,通过二硫键相互连接的两个重链(H)和两个轻链(L)。每个重链包括重链可变结构域和重链恒定区(CH)。重链恒定区包括三个结构域:CH1,CH2和CH3。每个轻链包括轻链可变结构域和轻链恒定区(CL)。重链可变结构域和轻链可变结构域可进一步再分为高变区(其被称为互补决定区(CDR)),高变区中穿插有更加恒定的区域,其称为骨架区(FR)。每个重链可变结构域和轻链可变结构域包括三个CDR和四个FR,其以如下顺序从氨基末端排列至羧基末端:FR1,CDR1,FR2,CDR2,FR3,CDR3,FR4(重链CDR可简称为HCDR1,HCDR2和HCDR3;轻链CDR可简称为LCDR1,LCDR2和LCDR3)。术语“高亲和性”抗体是指对于其目标表位具有约10-9M或更低(例如,约1×10-9M,1×10-10M,1×10-11M,或约1×10-12M)的KD的抗体。在一种实施方式中,KD通过表面等离子共振(例如,BIACORETM)进行测量,在另一实施方式中,KD通过ELISA进行测量。
抗原-结合蛋白与其目标抗原的特异性结合包括具有至少106,107,108,109,或1010M-1的亲和性的结合。特异性结合的量级可检测地高于对至少一个不相关靶点的非特异性结合并且与对至少一个不相关靶点的非特异性结合可相区别。特异性结合可以是特定功能基团或特定空间配合(例如,锁和钥匙的类型)之间的键合形成的结果,而非特异性结合通常是范德华力的结果。然而,特异性结合不必然意味着抗原-结合蛋白结合一个且唯一一个靶点。
术语“反义RNA”是指与在细胞中转录的信使RNA链互补的单链RNA。
术语“小干扰RNA(siRNA)”是指诱导RNA干扰(RNAi)通路的典型双链RNA分子。这些分子的长度可发生改变(通常为18至30个碱基对)并且包含与反义链中的其目标mRNA的不同程度的互补性。一些但不是全部siRNA具有位于正义链和/或反义链的5’端或3’端上的未配对的悬挂碱基。术语“siRNA”包括两个不同的链的二聚体,以及可形成包含二聚体区域的发夹结构的单链。双链结构的长度可以例如小于20个核苷酸,25个核苷酸,30个核苷酸,35个核苷酸,40个核苷酸,45个核苷酸或50个核苷酸。例如,双链结构可形成长度为约21至23个核苷酸,长度为约19至25个核苷酸,或长度为约19至23个核苷酸。
术语“短发夹RNA(shRNA)”是指在发夹结构中自杂交的并且可在加工之后诱导RNA干扰(RNAi)通路的单链RNA碱基。这些分子可具有不同的长度(通常长度为约50至90个核苷酸,或者在一些情况下长度高达大于250个核苷酸,例如,对于微小RNA-适配的shRNA)。shRNA分子在细胞中进行加工以形成siRNA,该siRNA进而可敲低基因表达。shRNA可并入载体中。术语“shRNA”也是指DNA分子,可从该DNA分子转录得到短发夹RNA分子。
组合物或方法“包含”或“包括”一种或多种所记载的成分可能包括其他未特别记载的成分。例如,“包含”或“包括”蛋白质的组合物可能只含有蛋白质或含有蛋白质以及其他成分。过渡性措辞“基本由…构成”是指权利要求的范围被解释为包含权利要求中所记载的指定成分以及不会实质上影响要求保护的发明的基本特征和新特征的那些成分。因此,本发明的权利要求中所使用的术语“基本由…构成”无意被解释为等同于“包含”。
“任选的”或“任选地”是指后续描述的事件或情况可能发生或可能不发生并且该描述包括所述事件或情况发生的实例和所述事件或所述情况不发生的实例。
数值范围的指定包括所述范围内的或所述范围所限定的所有整数以及该范围内由整数限定的所有子范围。
除非另有明确说明,术语“约”包括所述值的测量误差的标准偏差(例如,SEM)范围内的值。
术语“和/或”是指并且包括所列出的相关项目中的一个或多个中的任何可能的组合或所有可能的组合并且当使用可选术语“或”时包括缺少某些组合。
术语“或”是指具体列表中的任何一个成员并且还包括所列出的成员中的任何组合。
除非另有明确说明,单数形式的冠词“a”,“an”以及“the”包括复数指代物。例如,术语“单数形式的蛋白质”或“至少一个蛋白质”可包括多个蛋白质,包括其混合物。
统计学上显著的是指p≤0.05。
I.概述
本文公开了在其基因组中包含人源化TTR基因座的非人类动物基因组,非人类动物细胞和非人类动物以及使用这些非人类动物细胞和非人类动物的方法。包含人源化TTR基因座的非人类动物细胞或非人类动物表达人转甲状腺素蛋白或包含人转甲状腺素蛋白的一个或多个片段的嵌合转甲状腺素蛋白。这些非人类动物细胞和非人类动物可用于离体或体内评价人-TTR-靶向试剂(例如,CRISPR/Cas9基因组编辑试剂)的递送或效率并且可在优化这些试剂的离体或体内递送效率的方法中使用。
在本文公开的一些非人类动物细胞和非人类动物中,大多数或全部人TTR基因组DNA被插入相应的直系同源非人类动物Ttr基因座中。在本文公开的一些非人类动物细胞和非人类动物中,大多数或全部非人类动物Ttr基因组DNA被对应的直系同源人TTR基因组DNA一对一取代。与带有cDNA插入的非人类动物相比,当内含子-外显子结构和剪接机制保留时,表达水平应当更高,这是因为保守的调节性元件更有可能保持完整并且经过RNA加工的剪接转录体比cDNA更稳定。相反,将人TTR cDNA(例如,在5’UTR中具有人工β-球蛋白内含子的插入)插入至非人类动物Ttr基因座中将会破坏保守的调节性元件,例如,非人类动物Ttr的第一外显子和内含子中所包含的那些保守的调节性元件。采用相应的直系同源人基因组序列取代非人类动物基因组序列或在相应的直系同源非人类动物Ttr基因座中插入人TTR基因组序列更有可能导致内源Ttr基因座中的转基因的可靠表达。类似地,在随机的基因组基因座处而非内源非人类动物Ttr基因座处带有人-TTR-编码序列的转基因插入的转基因非人类动物无法准确地反应Ttr表达的内源调节。采用相应的直系同源人基因组DNA一对一取代大多数或全部非人类动物基因组DNA得到的人源化TTR等位基因或者将人TTR基因组序列插入相应的直系同源非人类Ttr基因座中得到的人源化TTR等位基因将提供人-TTR-靶向试剂(例如,设计为靶向人TTR的CRISPR/Cas9试剂)的真实的人靶点或靠近真实的人靶点的近似靶点,从而能够测试这些试剂在活体动物中的效率和作用模式并且在人源化蛋白和人源化基因是所存在的TTR的唯一形式的条件下进行药代动力学和药效学研究。
II.包含人源化TTR基因座的非人类动物
本文公开的细胞和非人类动物在其基因组中包含人源化TTR基因座。包含人源化TTR基因座的细胞或非人类动物表达人转甲状腺素蛋白或部分人源化的、嵌合的转甲状腺素蛋白,在所述部分人源化的、嵌合的转甲状腺素蛋白中,天然转甲状腺素蛋白的一个或多个片段已被来自人转甲状腺素蛋白的相应的片段取代。
A.转甲状腺素蛋白(TTR)
本文公开的细胞和非人类动物包含人源化转甲状腺素蛋白(Ttr)基因座。转甲状腺素蛋白(TTR)是主要由肝脏合成的127个氨基酸,55kDa血清和脑脊液转运蛋白,但是其也由脉络丛产生。转甲状腺素蛋白也被称为前白蛋白,甲状腺素结合前白蛋白,ATTR,TBPA,CTS,CTS1,HEL111,HsT2651和PALB。在转甲状腺素蛋白的天然状态下,TTR作为四聚体存在。在纯合体中,同源四聚体包含等同的127个氨基酸的富含β-片层结构的亚单元。在杂合体中,TTR四聚体可由变体和/或野生型亚单元构成,通常以统计方式合并。在血清和脑脊液中,TTR负责携带甲状腺素(T4)和结合有视黄醇的RBP(视黄醇结合蛋白)。
除非另有明确说明,本文中所涉及的人转甲状腺素蛋白(TTR)或其片段或结构域包括天然的野生型人氨基酸序列,该氨基酸序列包括其同种型和等位变体。转甲状腺素蛋白前体蛋白包括信号序列(通常为20个氨基酸),而成熟的转甲状腺素蛋白不包括该信号序列。示例性的TTR多肽序列指定为登录号NP_000362.1(NCBI)和P02766.1(UniProt)(等同的,均在SEQ ID NO:1中列出)。根据UniProt登录号P02766.1可对残基进行编号,成熟蛋白的第一氨基酸(即,不包括20个氨基酸的信号序列)指定为残基1。在任何其他TTR蛋白中,根据UniProt登录号P02766.1中的相应残基以最大比对对残基进行编号。
人TTR基因位于染色体18上并且包括四个外显子和三个内含子。示例性的人TTR基因为GenBank登录号NG_009490.1(SEQ ID NO:3)所指定的序列中的残基5001至12258。SEQID NO:3中的四个外显子分别包括残基1-205,1130-1260,3354-3489,和6802-7258。SEQ IDNO:3中的TTR编码序列包括残基137-205,1130-1260,3354-3489,和6802-6909。NCBI登录号NM_000371.3(SEQ ID NO:4)指定了示例性的人TTR mRNA。
小鼠Ttr基因位于染色体18上并且还包括四个外显子和三个内含子。示例性的小鼠Ttr基因为GenBank登录号NC_000084.6(SEQ ID NO:5)指定的序列中的残基20665250至20674326。SEQ ID NO:5中的四个外显子分别包括残基1-258,1207-1337,4730-4865,和8382-9077。SEQ ID NO:5中的Ttr编码序列包括残基190-258,1207-1337,4730-4865,和8382-8489。UniProt登录号P07309.1或NCBI登录号NP_038725.1(等同的,均在SEQ ID NO:6中列出)指定了示例性的小鼠TTR蛋白。NCBI登录号NM_013697.5(SEQ ID NO:7)指定了示例性的小鼠Ttr mRNA。
UniProt登录号P02767指定了示例性的大鼠TTR蛋白。UniProt登录号P50390指定了示例性的猪TTR蛋白。UniProt登录号P27731指定了示例性的鸡TTR蛋白。UniProt登录号O46375指定了示例性的牛TTR蛋白。UniProt登录号P12303指定了示例性的羊TTR蛋白。UniProt登录号Q5U7I5指定了示例性的黑猩猩TTR蛋白。UniProt登录号Q5NVS2指定了示例性的猩猩TTR蛋白。UniProt登录号P07489指定了示例性的兔TTR蛋白。UniProt登录号Q8HXW1指定了示例性的食蟹猴(猕猴)TTR蛋白。
转甲状腺素蛋白(TTR)淀粉样变性是一种全身性疾病,其特征为致病性错误折叠的TTR和由TTR构成的淀粉样蛋白原纤维的细胞外沉积。TTR淀粉样变性通常由于天然TTR四聚体形式的不稳定引起(由于环境条件或遗传条件引起),这导致TTR分解、错误折叠且聚集形成在各种不同的器官和组织中累积的淀粉样蛋白原纤维,从而产生进行性功能障碍。解离的单体具有形成错误折叠的蛋白质聚集体和淀粉样蛋白原纤维的倾向。
在人体内,野生型TTR四聚体和由突变的和野生型亚单元构成的混合的四聚体这两者可解离、错误折叠并聚集,伴随产生淀粉状蛋白生成,从而导致有丝分裂后的组织的退化。因此,TTR淀粉样变性包括由致病性错误折叠的TTR产生的疾病,所述致病性错误折叠的TTR由于TTR中的突变或非突变的错误折叠的TTR产生。
老年性全身淀粉样变性(SSA)和老年性心脏淀粉样变性(SCA)是年龄相关类型的淀粉样变性,其由于野生型TTR淀粉样蛋白沉积在心脏的心肌细胞的外部和内部而引起。TTR淀粉样变性也是遗传性(家族性)淀粉样变性的最常见的形式,其由使得TTR蛋白质不稳定的突变而引起。与TTR基因中的点突变相关的TTR淀粉样变性包括家族性淀粉样蛋白多发性神经病变(FAP),家族性淀粉样蛋白心肌病(FAC)和中枢神经系统选择性淀粉样变性(CNSA)。
B.人源化TTR基因座
本文公开的人源化TTR基因座可以是全部Ttr基因被相应的直系同源人TTR序列取代的Ttr基因座,或者其可以是只有部分Ttr基因被相应的直系同源人TTR序列取代的Ttr基因座(即,人源化的)。人源化的TTR基因座可还包括插入至内源Ttr基因座中而不会取代相应的直系同源内源序列的人TTR序列。对应于内源Ttr序列的特定片段的人TTR序列是指当人TTR和内源Ttr进行最佳比对时与内源Ttr序列的特定片段进行比对的人TTR的区域。任选地,人TTR序列被修饰为基于在非人类动物的密码子的使用而密码子优化的。被取代的区域或插入的(即,人源化的)区域可包括诸如外显子之类的编码区域,诸如内含子之类的非编码区域,非翻译区域或调节性区域(例如,启动子,增强子或转录抑制结合元件),或它们的任何组合。
人源化的TTR基因座是内源Ttr基因座的某个区域已被删除并且被相应的直系同源人TTR序列(例如,直系同源野生型人TTR序列)取代的基因座。可选地,人源化TTR基因座是人TTR基因座的某个区域已被插入至相应的内源非人类动物Ttr基因座中的基因座。作为一个实例,内源Ttr基因座的取代区域或插入区域可包括编码序列(即,所有或部分外显子)和非编码序列(即,所有或部分内含子),例如,至少一个外显子和至少一个内含子。例如,被取代或插入的区域可包括至少一个外显子和至少一个内含子。包含编码序列和非编码序列这两者的取代区域或插入区域可以是内源Ttr基因座的连续区域,这是指没有介入在取代的或插入的编码序列和取代的或插入的非编码序列之间的序列。例如,取代的或插入的区域包含至少一个外显子和至少一个邻近的内含子。取代的或插入的区域可包含一个外显子,两个外显子,三个外显子,四个外显子或内源Ttr基因座的所有外显子。插入的人TTR序列可包括一个外显子,两个外显子,三个外显子,四个外显子或人TTR基因的所有外显子。类似地,取代的区域可包括一个内含子,两个内含子,三个内含子或内源Ttr基因座的所有内含子。插入的人TTR序列可包括一个内含子,两个内含子,三个内含子或人TTR基因的所有内含子。任选地,内源Ttr基因座中的一个或多个内含子和/或一个或多个外显子仍然是未修饰的(即,未被删除和取代)。例如,内源Ttr基因座的第一外显子可仍然未被修饰。类似地,内源Ttr基因座的第一外显子和第一内含子可仍然未被修饰。
在一个具体的实施例中,转甲状腺素蛋白前体蛋白的整个编码序列可被删除并且被相应的直系同源人TTR序列取代。例如,内源Ttr基因座的在起始密码子开始并在终止密码子结束的区域可被删除并被相应的直系同源人TTR序列取代。在另一具体的实施例中,可插入人转甲状腺素蛋白前体蛋白的整个编码序列。例如,可插入人TTR基因座在起始密码子开始并在终止密码子结束的区域。
包括调节性序列的侧面非翻译区域也可以被人源化。Ttr基因座的第一外显子通常包括起始密码子上游的5’非翻译区域。类似地,Ttr基因座的最后的外显子通常包括终止密码子下游的3’非翻译区域。Ttr起始密码子上游和Ttr终止密码子下游的区域可以是未被修饰的或可以是被删除的并且被相应的直系同源人TTR序列取代。例如,5’非翻译区域(UTR),3’UTR或5’UTR和3’UTR这两者可以被人源化,或者5’UTR,3’UTR或5’UTR和3’UTR这两者可仍然是内源性的。在一个具体的实施例中,5’UTR仍然是内源性的。在另一具体的实施例中,3’UTR是人源化的但是5’UTR仍然是内源性的。在另一具体的实施例中,5’UTR仍然是内源性的并且人TTR 3’UTR被插入至内源Ttr基因座。例如,人TTR 3’UTR可取代内源3’UTR或可被插入而不取代内源3’UTR(例如,其可插入内源3’UTR的上游)。
编码转甲状腺素蛋白前体蛋白的一个或多个结构域的内源Ttr基因座的一个或多个区域可以被人源化。类似地,编码转甲状腺素蛋白前体蛋白的一个或多个结构域的内源Ttr基因座的一个或多个区域可仍然是未修饰的(即,未被删除和取代)。例如,转甲状腺素蛋白前体蛋白通常在N-末端具有信号肽。例如,该信号肽的长度可以为约20个氨基酸。编码信号肽的内源Ttr基因座的区域可仍然是未被修饰的(即,未被删除和取代),或可被删除并被相应的直系同源人TTR序列取代。类似地,内源Ttr基因座的编码被抗-人-TTR抗原结合蛋白识别的表位的区域可以被人源化。
基于被相应的直系同源序列取代的程度或人TTR序列的插入程度,诸如启动子之类的调节性序列可以是同源性的或可通过取代或插入人直系同源序列而提供。例如,人源化TTR基因座可包括内源非人类动物Ttr启动子。转甲状腺素蛋白前体蛋白的位于基因修饰的内源Ttr基因座处的编码序列可以可操作地连接至内源Ttr启动子。例如,人TTR序列可以可操作地连接至内源Ttr启动子。
作为具体的实例,人源化TTR基因座可以是内源Ttr基因座的区域已被删除并且被相应的直系同源人TTR序列取代的基因座或者是其中插入的人TTR基因座的区域包括Ttr起始密码子至终止密码子的区域,基本由Ttr起始密码子至终止密码子的区域构成或由Ttr起始密码子至终止密码子的区域构成的基因座。插入的人TTR序列可还包含人TTR 3’UTR。例如,人源化TTR基因座处的人TTR序列可包含从TTR起始密码子至3’UTR的末端的区域,基本由从TTR起始密码子至3’UTR的末端的区域构成,或由从TTR起始密码子至3’UTR的末端的区域构成。任选地,修饰的内源Ttr基因座中的Ttr编码序列可操作地连接至内源Ttr启动子。人源化TTR基因座处的人TTR序列可包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ ID NO:18具有至少85%,90%,95%,96%,97%,98%,99%,或100%的一致性。人源化TTR基因座可包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ ID NO:14或15具有至少85%,90%,95%,96%,97%,98%,99%,或100%的一致性。人源化TTR基因座处的编码序列(CDS)可包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ ID NO:90(或编码相同蛋白质的其降解物)具有至少85%,90%,95%,96%,97%,98%,99%,或100%的一致性。所得到的由人源化TTR基因座编码的人转甲状腺素蛋白前体蛋白可包含如下序列,基本由如下序列构成,或由如下序列构成,该序列与SEQID NO:1具有至少85%,90%,95%,96%,97%,98%,99%,或100%的一致性。
作为另一具体实例,人源化TTR基因座可以是内源Ttr基因座的区域被删除并被相应的直系同源人TTR序列取代的基因座或者可以是其中插入的人TTR基因座区域包括从第二Ttr外显子开始至终止密码子的区域,基本由上述区域构成或由上述区域构成的基因座。插入的人TTR序列可还包含人TTR 3’UTR。例如,人源化TTR基因座处的人TTR序列可包含从第二人TTR外显子开始至3’UTR结束的区域,基本由该区域构成或由该区域构成。任选地,修饰的内源Ttr基因座中的Ttr编码序列可操作地连接至内源Ttr启动子。人源化TTR基因座处的人TTR序列可包括如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ IDNO:19具有至少85%,90%,95%,96%,97%,98%,99%,或100%的一致性。人源化TTR基因座可包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQ ID NO:16或17具有至少85%,90%,95%,96%,97%,98%,99%,或100%的一致性。人源化TTR基因座处的编码序列(CDS)可包含如下序列,基本由如下序列构成或由如下序列构成,该序列与SEQID NO:91(或编码相同蛋白质的其降解物)具有至少85%,90%,95%,96%,97%,98%,99%,或100%的一致性。所得到的由人源化TTR基因座编码的嵌合转甲状腺素蛋白前体蛋白可包含如下序列,基本由如下序列构成,或由如下序列构成,该序列与SEQ ID NO:2具有至少85%,90%,95%,96%,97%,98%,99%,或100%的一致性。
通过人源化TTR基因座表达的TTR蛋白可以是完全人TTR蛋白或嵌合的内源/人TTR蛋白(例如,如果非人类动物是小鼠,那么TTR蛋白可以是嵌合小鼠/人TTR蛋白)。例如,转甲状腺素蛋白前体蛋白的信号肽可以是内源的并且蛋白的其余部分可以是人的。可选地,转甲状腺素蛋白前体蛋白的N-末端可以是内源的并且蛋白的其余部分可以是人的。例如,N-末端的5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,或25个氨基酸可以是内源的并且其余部分可以是人的。在具体的实例中,N-末端的23个氨基酸是内源的并且蛋白质的其余部分是人的。
任选地,人源化TTR基因座可包含其他元件。这些元件的实例可包括选择盒,报告体基因,重组酶识别位点或其他元件。作为一个实例,人源化的TTR基因座可包含可除去的选择盒(例如,自-删除选择盒),其侧面具有重组酶识别序列(例如,loxP位点)。可选地,人源化TTR基因座可缺少其他元件(例如,可缺少选择盒和/或缺少报告体基因)。合适的报告体基因和报告体蛋白的实例在本文的其他地方公开。合适的选择标志物的实例包括:新霉素磷酸转移酶(neor),潮霉素B磷酸转移酶(hygr),嘌呤霉素-N-乙酰转移酶(puror),灭瘟素S脱氢酶(bsrr),黄嘌呤/鸟嘌呤磷酸核糖转移酶(gpt)以及单纯疱疹病毒胸苷激酶(HSV-k)。重组酶的实例包括Cre,Flp,和Dre重组酶。Cre重组酶的一个实例是Crei,其中,编码Cre重组酶的两个外显子被内含子分隔开以防止其在原核细胞中的表达。这些重组酶可还包括细胞核定位信号,从而促进定位至细胞核(例如,NLS-Crei)。重组酶识别位点包括被位点特异性重组酶识别的并且可用作重组事件的底物的核苷酸序列。重组酶识别位点的实例包括:FRT,FRT11,FRT71,attp,att,rox,和lox位点,例如,loxP,lox511,lox2272,lox66,lox71,loxM2,和lox5171。
诸如报告体基因或选择盒之类的其他元件可以是侧面具有重组酶识别位点的自删除盒。参见,例如,US8,697,851和US 2013/0312129,其每一个的全部内容通过引用并入本文,用于所有目的。作为一个实例,自删除盒可包括Crei基因(包括编码Cre重组酶的两个外显子,其被内含子分隔开)和新霉素耐药基因,所述Crei基因可操作地连接至小鼠Prm1启动子,所述新霉素耐药基因可操作地连接至人泛素启动子。通过使用Prm1启动子,可特异性地删除F0动物的雄性生殖细胞中的自删除盒。编码选择标志物的多核苷酸可以可操作地连接至在被靶定的细胞中具有活性的启动子。启动子的实例在本文的其他地方描述。作为另一特定实例,自删除的选择盒可包括潮霉素耐药基因编码序列,所述潮霉素耐药基因编码序列可操作地连接至其后带有聚腺苷酸化信号的一个或多个启动子(例如,人泛素启动子和EM7启动子),所述潮霉素耐药基因编码序列之后带有可操作地连接至一个或多个启动子(例如,mPrm1启动子)的Crei编码序列,所述Crei编码序列之后带有另一聚腺苷酸化信号,其中,整个盒的侧面具有loxP位点。
人源化TTR基因座还可以是条件性等位基因。例如,所述条件性等位基因可以是US2011/0104799中描述的多功能等位基因,该美国申请的全部内容通过引用并入本文,用于所有目的。例如,所述条件性等位基因可包括:(a)对于目标基因的转录正义方向上的启动序列;(b)正义或反义方向上的药物选择盒(DSC);(c)反义方向上的目标核苷酸序列(NSI),以及(d)反义方向上的条件反转模块(COIN,其使用外显子分裂的内含子和可倒转的类似基因组的模块)。参见,例如,US2011/0104799。条件性等位基因可还包含暴露于第一重组酶之后重组形成条件性等位基因的可重组的单元,所述条件性等位基因(i)缺乏启动序列和DSC,并且(ii)包含正义方向上的NSI和反义方向上的COIN。参见,例如,US2011/0104799。
C.包含人源化TTR基因座的非人类动物基因组,非人类动物细胞和非人类动物
本文提供包含本文所述的人源化TTR基因座的非人类动物基因组,非人类动物细胞和非人类动物。所述基因组,细胞或非人类动物可以是对于人源化TTR基因座而言杂合的或纯化的。双倍体生物体在每个基因的基因座处具有两个等位基因。每对等位基因代表了特定基因的基因座的基因分型。如果特定基因座处具有两个等同的等位基因,那么基因分型被描述为纯合体,如果特定基因座处的两个等位基因是不同的,那么基因分型被描述为杂合体。
例如,本文提供的非人类动物基因组或细胞可以是包含Ttr基因座的任何非人类细胞或与人TTR基因座同源或直系同源的基因的基因座。基因组可以来自真核细胞或所述细胞可以是真核细胞,所述真核细胞包括例如,动物细胞,哺乳动物细胞,非人类哺乳动物细胞,和人细胞。术语“动物”包括哺乳动物,鱼类和鸟类。哺乳动物细胞可以是例如:非人类哺乳动物细胞,啮齿动物细胞,大鼠细胞,小鼠细胞或仓鼠细胞。其他非人类哺乳动物包括例如:非人类灵长类动物,猴子,猿猴,猩猩,猫,狗,兔,马,家畜(例如,牛科动物,例如,奶牛,阉牛等等;绵羊科动物,例如,绵羊,山羊等等;以及猪科动物,例如,猪和野猪)。本文还包括家养动物和农业动物。术语“非人类”排除了人类。
细胞还可以是任何类型的未分化的或分化的状态。例如,细胞可以是全能细胞,多能细胞(例如,人多能细胞或非人类多能细胞,例如,小鼠胚胎干(ES)细胞或大鼠ES细胞),或非多能细胞。全能细胞包括可产生任何细胞类型的未分化的细胞,并且多能细胞包括具有发育成多于一种分化的细胞类型的能力的未分化的细胞。这些多能细胞和/或全能细胞可以是例如:ES细胞或类ES细胞,例如,诱导多能干(iPS)细胞。ES细胞包括在引入至胚胎中之后能够有助于使胚胎发育成任何组织的胚胎衍生的全能细胞或多能细胞。ES细胞可衍生自囊胚的内部细胞团并且能够分化成三种脊椎动物胚层(内胚层,外胚层和中胚层)中的任一胚层的细胞。
本文提供的细胞也可以是生殖细胞(例如,精子或卵细胞)。所述细胞可以是有丝分裂感受态细胞或有丝分裂惰性细胞,减数分裂感受态细胞或减数分裂惰性细胞。类似地,细胞还可以是初级体细胞或非初级体细胞的细胞。体细胞包括不是配子,生殖细胞,配子母细胞或未分化的干细胞的任何细胞。例如,细胞可以是肝脏细胞,例如,肝母细胞或肝细胞。
本文提供的合适的细胞还包括初级细胞。初级细胞包括直接从生物体,器官或组织中分离出来的细胞或细胞培养物。初级细胞包括既未转化的也非永生的细胞。它们包括自生物体,器官或组织获得的任何细胞,所述细胞先前没有在组织培养中进行传代或先前已经在组织培养中进行了传代但是无法在组织培养中进行无限传代。这些细胞可通过常规技术进行分离并且包括例如:肝细胞。
本文提供的其他合适的细胞包括非永生的细胞。非永生的细胞包括来自多细胞生物体的细胞,所述多细胞生物体通常不会无限繁殖但是由于突变或发生改变其逃避了正常的细胞老化而能够继续进行分化。所述突变或改变可以自然发生或有意诱导。非永生的细胞系的具体实例是HepG2人肝癌细胞系。本领域熟知多种类型的非永生的细胞。非永生细胞或初级细胞包括通常用于培养或表达重组基因或蛋白质的细胞。
本文提供的细胞还包括单细胞期胚胎(即,已受精的卵细胞或受精卵)。这种单细胞期胚胎可来自于任何遗传背景(例如,小鼠BALB/c,小鼠C57BL/6,小鼠129,或它们的组合),可以是新鲜的或冷冻的并且可源自于自然繁殖或体外受精。
本文提供的细胞可以是正常的健康细胞或可以是患病的或带有突变的细胞。
在特定的实例中,非人类动物细胞是胚胎干(ES)细胞或肝脏细胞,例如,小鼠或大鼠ES细胞或肝脏细胞。
包含本文所述的人源化TTR基因座的非人类动物可由本文其他地方描述的方法产生。术语“动物”包括哺乳动物,鱼类和鸟类。非人类哺乳动物包括例如:非人类灵长类动物,猴子,猿猴,猩猩,猫,狗,马,兔,啮齿动物(例如,小鼠,大鼠,仓鼠以及豚鼠)以及家畜(例如,牛科动物,例如,奶牛和阉牛,绵羊科动物,例如,绵羊和山羊,以及猪科动物,例如,猪和野猪)。本文还包括家养动物和农业动物。术语“非人类动物”排除了人类。优选的非人类动物包括例如:啮齿动物,例如,小鼠和大鼠。
非人类动物可来自于任何遗传背景。例如,合适的小鼠可来自于129种系,C57BL/6种系,129种系和C57BL/6种系的混合,BALB/c种系,或Swiss Webster种系。129种系的实例包括129P1,129P2,129P3,129X1,129S1(例如,129S1/SV,129S1/Svlm),129S2,129S4,129S5,129S9/SvEvH,129S6(129/SvEvTac),129S7,129S8,129T1,和129T2。参见,例如,Festing等人,(1999)Mammalian Genome 10(8):836,其全部内容通过引用并入本文,用于所有目的。C57BL种系的实例包括C57BL/A,C57BL/An,C57BL/GrFa,C57BL/Kal_wN,C57BL/6,C57BL/6J,C57BL/6ByJ,C57BL/6NJ,C57BL/10,C57BL/10ScSn,C57BL/10Cr,和C57BL/Ola。合适的小鼠还可来自于前述129种系和前述C57BL/6种系的混合(例如,50%129和50%C57BL/6)。类似地,合适的小鼠可来自于前述129种系的混合或前述BL/6种系的混合(例如,129S6(129/SvEvTac)种系)。
类似地,大鼠可来自于任何大鼠种系,包括例如,ACI大鼠种系,Dark Agouti(DA)大鼠种系,Wistar大鼠种系,LEA大鼠种系,Sprague Dawley(SD)大鼠种系或Fischer大鼠种系(例如,Fisher F344或Fisher F6)。大鼠还可获自于衍生自上述两种或多种种系的混合的种系。例如,合适的大鼠可获自DA种系或ACI种系。ACI大鼠种系被表征为具有黑色刺豚鼠,其具有白色腹部和足部以及RT1av1单体型。这些种系可获自包括Harlan实验室在内的多种不同的来源。Dark Agouti(DA)大鼠种系被表征为具有刺豚鼠外表和RT1av1单体型。这些大鼠获自包括Charles River和Harlan实验室在内的多种不同的来源。一些合适的大鼠可来自同系交配大鼠种系。参见例如,US2014/0235933,其全部内容通过引用并入本文,用于所有目的。
III.使用包含人源化TTR基因座的非人类动物体内或离体评价人-TTR-靶向试剂的效率的方法
本文提供使用包含本文所述的人源化TTR基因座的非人类动物评价或优化人-TTR-靶向试剂(例如,治疗性分子或复合物)的体内或离体递送或效率的各种不同的方法。因为非人类动物包括人源化TTR基因座,因此,非人类动物将会更加准确地反应人TTR-靶向试剂的效率。这些非人类动物对于测试设计为靶向人TTR基因的基因组编辑试剂而言尤其有用,这是因为本文公开的非人类动物包含人源化内源Ttr基因座,而非在随机的基因座处具有人TTR序列的转基因插入,并且人源化内源Ttr基因座包含来自编码区域和非编码区域这两者的直系同源人基因组TTR序列,而非人工cDNA序列。
A.体内或离体测试人-TTR-靶向试剂的效率的方法
本文提供各种不同的使用包含本文公开的人源化TTR基因座的非人类动物体内评价人-TTR-靶向试剂的递送或效率的方法。这些方法可包括:(a)向非人类动物中引入人-TTR-靶向试剂(即,将人-TTR-靶向试剂给药于非人类动物),以及(b)评价人-TTR-靶向试剂的活性。
所述人-TTR-靶向试剂可以是任何靶向人TTR基因座(人TTR基因),人TTR mRNA或人转甲状腺素蛋白的生物或化学试剂。人-TTR-靶向试剂的实例在本文的其他地方公开并且包括例如:基因组编辑试剂。例如,人-TTR-靶向试剂可以是TTR-靶向核酸(例如,CRISPR/Cas向导RNA,短发夹RNA(shRNA),或小干扰RNA(siRNA))或编码TTR-靶向蛋白的核酸(例如,Cas蛋白质,例如,Cas9,ZFN,或TALEN)。可选地,人-TTR-靶向试剂可以是TTR-靶向抗体或抗原结合蛋白,或者任何其他靶定人TTR的大分子或小分子。
这些人-TTR-靶向试剂可通过本文其他地方更加详细公开的任何递送方法(例如,AAV,LNP或HDD)给药并且可通过任何给药途径给药。递送治疗性复合物和分子的方式以及给药途径在本文其他地方详细公开。在特定方法中,试剂通过AAV-介导的递送进行递送。例如,AAV8可用于靶定肝脏。在其他特定方法中,试剂通过LNP介导的递送进行递送。在其他特定方法中,试剂通过流体动力学递送(HDD)进行递送。剂量可以是任何合适的剂量。例如,在通过LNP介导的递送递送试剂(例如,Cas9 mRNA和gRNA)的一些方法中,剂量可以是约0.01至约10mg/kg,约0.01至约5mg/kg,约0.01至约4mg/kg,约0.01至约3mg/kg,约0.01至约2mg/kg,约0.01至约1mg/kg,约0.1至约10mg/kg,约0.1至约6mg/kg;约0.1至约5mg/kg,约0.1至约4mg/kg,约0.1至约3mg/kg,约0.1至约2mg/kg,约0.1至约1mg/kg,约0.3至约10mg/kg,约0.3至约6mg/kg;between about0.3至约5mg/kg,约0.3至约4mg/kg,约0.3至约3mg/kg,约0.3至约2mg/kg,约0.3至约1mg/kg,约0.1mg/kg,约0.3mg/kg,约1mg/kg,约2mg/kg,或约3mg/kg。在特定实施例中,剂量为约0.1至约6mg/kg,约0.1至约3mg/kg,或约0.1至约2mg/kg。在具体实施例中,人-TTR-靶向试剂是基因组编辑试剂,LNP剂量为约1mg/kg,并且在人源化TTR基因座处的基因编辑的百分比为约70%至约80%。在另一具体实施例中,人-TTR-靶向试剂是基因组编辑试剂,LNP剂量为约0.3mg/kg,并且编辑百分比为约50%至约80%。在另一具体实施例中,人-TTR-靶向试剂是基因组编辑试剂,LNP剂量为约0.1mg/kg,并且编辑百分比为约20%至约80%。在另一具体实施例中,LNP剂量为约1mg/kg,血清TTR水平降低至约0%至对照水平的约10%或约0%至对照水平的约35%。在另一具体实施例中,LNP剂量为约0.3mg/kg,并且血清TTR水平降低至约0%至约对照水平的20%或约0%至对照水平的约95%。在另一具体实施例中,LNP剂量为约0.1mg/kg,并且血清TTR水平降低至约0%至对照水平的约60%或约0%至对照水平的约99%。
用于评价人-TTR-靶向试剂的活性的方法是本领域熟知的并且在本文的其他地方提供。对活性的评价可以在本文公开的任何细胞类型、任何组织类型或任何器官类型中进行。在一些方法中,在肝脏细胞中评价活性。如果TTR-靶向试剂是基因组编辑试剂(例如,核酸酶试剂),这些方法可包括评价对人源化TTR基因座的修饰。作为一个实例,所述评价可包括测量人源化TTR基因座处的非同源末端连接(NHEJ)的活性。这可包括例如:测量人源化TTR基因座中的插入或删除的频率。例如,所述评价可包括对从非人类动物中分离出来的一个或多个细胞中的人源化TTR基因座进行测序(例如,第二代测序)。评价可包括从非人类动物中分离目标器官(例如,肝脏)或组织以及评价目标器官或组织中的人源化TTR基因座的修饰。评价还可包括评价目标器官或组织内的两个或多个不同的细胞类型中的人源化TTR基因座的修饰。类似地,评价可包括从非人类动物中分离非目标器官或组织(例如,两个或多个非目标器官或组织)以及评价非目标器官或组织中的人源化TTR基因座的修饰。
这些方法可还包括测量由人源化TTR基因座产生的mRNA的表达水平,或通过测量由人源化TTR基因座编码的蛋白质的表达水平来测量所产生的mRNA的表达水平。例如,可在特定细胞、组织或器官类型(例如,肝脏)中测量蛋白质水平或者可测量血清中所分泌的水平。用于评价通过人源化TTR基因座进行表达的Ttr mRNA或蛋白质的表达的方法在本文其他地方提供并且是本领域熟知的。
上文提供的用于评价体内活性的各种不同的方法还可用于评价本文其他地方所描述的人-TTR-靶向试剂的离体活性。
作为一个实例,如果人-TTR-靶向试剂是基因组编辑试剂(例如,核酸酶试剂),那么可评价人源化TTR基因座处的编辑百分比(例如,在肝脏细胞中)。例如,编辑百分比(例如,从溶解的细胞池中进行的PCR反应所读取的总序列数上观察到的插入或删除总数)可以是至少约10%,约20%,约30%,约40%,约50%,约60%,约70%,约80%,约90%,约95%,约99%,或者例如,约1%至约99%,约10%至约99%,约20%至约99%,约30%至约99%,约40%至约99%,约50%至约99%,约60%至约99%,约1%至约90%,约10%至约90%,约20%至约90%,约30%至约90%,约40%至约90%,约50%至约90%,约60%至约90%,约1%至约80%,约10%至约80%,约20%至约80%,约30%至约80%,约40%至约80%,约50%至约80%,或约60%至约80%。
作为另一实例,可评价血清TTR水平。例如,血清TTR水平可降低至少约10%,至少约20%,至少约30%,至少约40%,至少约50%,至少约60%,至少约65%,至少约70%,至少约80%,至少约90%,至少约95%,至少约99%,或例如,约1%至约99%,约10%至约99%,约20%至约99%,约30%至约99%,约40%至约99%,约50%至约99%,约60%至约99%,约70%至约99%,约80%至约99%,约1%至约90%,约10%至约90%,约20%至约90%,约30%至约90%,约40%至约90%,约50%至约90%,约60%至约90%,约70%至约90%,或约80%至约90%。
在一些方法中,人-TTR-靶向试剂是核酸酶试剂,例如,CRISPR/Cas核酸酶试剂,其靶定人TTR基因。这些方法可包括例如:(a)向非人类动物中引入设计为裂解人TTR基因(例如,诸如Cas9之类的Cas蛋白质和设计为靶定人TTR基因中的向导RNA靶向序列的向导RNA)的核酸酶试剂;以及(b)评价人源化TTR基因座的修饰。
在使用CRISPR/Cas核酸酶的情况下,例如,当向导RNA和Cas蛋白质形成复合物并将Cas蛋白质定向至人源化TTR基因座,并且Cas/向导RNA复合物裂解向导RNA靶向序列,触发通过细胞的修复(例如,通过非同源末端连接(NHEJ),如果没有供体序列存在的话)时,将会诱导人源化TTR基因座的修饰。
任选地,可引入两个或多个向导RNA,其每一个被设计为靶定人TTR基因中的不同向导RNA靶向序列。例如,两个向导RNA可被设计为切除两个向导RNA靶向序列之间的基因组序列。当第一向导RNA与Cas蛋白质形成复合物并将Cas蛋白质定向至人源化TTR基因座,第二向导RNA与Cas蛋白质形成复合物并将Cas蛋白质定向至人源化TTR基因座,第一Cas/向导RNA复合物裂解第一向导RNA靶向序列并且第二Cas/向导RNA裂解第二向导RNA靶向序列,从而使得介入序列被切除时,将会诱导人源化TTR基因座的修饰。
任选地,能够与人TTR基因重组并且能够修饰人TTR基因的外源供体核酸也被引入至非人类动物。任选地,核酸酶试剂或Cas蛋白质可栓系至本文其他地方描述的外源供体核酸。例如,当向导RNA与Cas蛋白质形成复合物并将Cas蛋白质定向至人源化TTR基因座,Cas/向导RNA复合物裂解向导RNA靶向序列并且人源化TTR基因座与外源供体核酸重组以修饰人源化TTR基因座时,将会诱导人源化TTR基因座的修饰。所述外源供体核酸可与人源化TTR基因座重组,例如通过同源定向修复(HDR)或通过NHEJ-介导的插入进行重组。可使用任何类型的外源供体核酸,其实例在本文其他地方提供。
B.优化人-TTR-靶向试剂的体内或离体递送或效率的方法
本文提供用于优化将人-TTR-靶向试剂递送至细胞或非人类动物或用于优化人-TTR-靶向试剂的体内活性或效率的各种不同的方法。这些方法可包括例如:(a)在包含人源化TTR基因座的第一非人类动物或第一细胞中第一次执行上述测试人-TTR-靶向试剂的效率的方法;(b)改变可变量并在包含人源化TTR基因座的第二非人类动物(即,相同物种)或第二细胞中采用改变的可变量再次执行上述方法;以及(c)将步骤(a)中的人-TTR-靶向试剂的活性与步骤(b)中的人-TTR-靶向试剂的活性进行比较,并且选择产生较高活性的方法。
本文还公开了测量人-TTR-靶向试剂的递送,效率或活性的方法。例如,这些方法可包括测量人源化TTR基因座的修饰。对人源化TTR基因座的更有效的修饰可以是指基于非人类动物或非人类动物细胞中的期望作用的不同事件。例如,对人源化TTR基因座的更有效的修饰可以是指较高的修饰水平,较高的精确度,较高的一致性或较高的特异性中的一种或多种或所有。人源化TTR基因座的较高的修饰水平(即,较高的效率)是指靶定特定目标细胞类型中,特定目标组织中或特定目标器官中(例如,肝脏)更高百分比的细胞。较高的精确度是指对人源化TTR基因座的更加精确的修饰(例如,更高百分比的靶定细胞具有相同的修饰或具有期望的修饰,而没有额外的不想要的插入和删除(例如,NHEJ indel))。如果靶定多于一种类型的细胞、组织或器官,那么更高的一致性是指在不同类型的靶定细胞、组织或器官中对人源化TTR基因座具有更加一致的修饰(例如,对肝脏中更多数量的细胞类型进行修饰)。如果靶定特定器官,更高的一致性也是指在该器官(例如,肝脏)中的所有位置上进行更加一致的修饰。更高的特异性可以是指对靶定的基因组基因座或基因座具有更高的特异性,对靶定的细胞类型具有更高的特异性,对靶定的组织类型具有更高的特异性,或者对靶定的器官具有更高的特异性。例如,提高的基因组基因座特异性是指对脱靶的基因组基因座产生较少的修饰(例如,代替或除了对目标基因组基因座进行修饰之外,在不理想的脱靶基因组基因座处具有较低百分比的靶定细胞具有修饰)。类似地,提高的细胞类型特异性,组织类型特异性或器官类型特异性是指如果靶定了特定细胞类型,组织类型或器官类型,那么对脱靶的细胞类型,组织类型或器官类型具有较少的修饰(例如,当靶定特定器官(例如,肝脏)时,在不想要靶定的器官或组织中的细胞具有较少的修饰)。
被改变的可变量可以是任何参数。作为一个实例,改变的可变量可以是将人-TTR-靶向试剂引入至细胞或非人类动物中的包装方法或递送方法。本文其他地方公开了递送方法的实例,例如,LNP,HDD和AAV。例如,改变的可变量可以是AAV血清型。类似地,给药可包括LNP-介导的递送,并且改变的可变量可以是LNP制剂。作为另一实例,改变的可变量可以是将人-TTR-靶向试剂引入至细胞或非人类动物的给药途径。本文的其他地方公开了给药途径的实例,例如,静脉内,玻璃体内,脑实质内和鼻腔灌注。
作为另一实例,改变的可变量可以是引入的人-TTR-靶向试剂的浓度或量。作为另一实例,改变的可变量可以是相对于引入的另一人-TTR-靶向试剂(例如,向导RNA,Cas蛋白质或外源供体核酸)的浓度或量的引入的一种人-TTR-靶向试剂(例如,向导RNA,Cas蛋白质或外源供体核酸)的浓度或量。
作为另一实例,改变的可变量可以是相对于评价试剂的活性或效率的时机引入人-TTR-靶向试剂的时机。作为另一实例,改变的可变量可以是引入人-TTR-靶向试剂的次数或频率。作为另一实例,改变的可变量可以是相对于引入另一人-TTR-靶向试剂(例如,向导RNA,Cas蛋白质或外源供体核酸)的时机引入一种人-TTR-靶向试剂(例如,向导RNA,Cas蛋白质或外源供体核酸)的时机。
作为另一实例,改变的可变量可以是引入的人-TTR-靶向试剂的形式。例如,向导RNA可以以DNA或RNA的形式被引入。Cas蛋白质(例如,Cas9)可以以DNA的形式,RNA的形式或蛋白质(例如,与向导RNA复合)的形式被引入。外源供体核酸可以是DNA,RNA,单链,双链,线性,环状等等。类似地,各个成分可包括用于稳定性的修饰,降低脱靶作用的修饰或促进递送的修饰等等的各种不同的组合。作为另一实例,改变的可变量可以是引入的人-TTR-靶向试剂(例如,引入具有不同序列的不同向导RNA,引入不同Cas蛋白质(例如,引入具有不同序列的不同Cas蛋白质,或引入具有不同序列但编码相同Cas蛋白质氨基酸序列的核酸),或引入具有不同序列的不同外源供体核酸)。
在特定实施例中,人-TTR-靶向试剂包括Cas蛋白质和设计为靶向人TTR基因中的向导RNA靶向序列的向导RNA。在这些方法中,改变的可变量可以是向导RNA序列和/或向导RNA靶向序列。在一些这样的方法中,Cas蛋白质和向导RNA可均以RNA的形式进行给药并且改变的可变量可以是Cas mRNA与向导RNA(例如在LNP制剂中)的比例。在一些这样的方法中,改变的可变量可以是向导RNA的修饰(例如,带有修饰的向导RNA与不带有修饰的向导RNA进行比较)。
C.人-TTR-靶向试剂
人-TTR-靶向试剂可以是靶定人TTR基因,人TTR mRNA或人TTR蛋白质的任何试剂。例如,其可以是基因组编辑试剂,例如,裂解人TTR基因中的靶向序列的核酸酶试剂,其可以是靶定人TTR mRNA的反义寡核苷酸,其可以是靶定人TTR蛋白质的表位的抗原结合蛋白,或者其可以是靶定人TTR的小分子。本文公开的方法中的人-TTR-靶向试剂可以是已知的人-TTR-靶向试剂,可以是假定的TTR-靶向试剂(例如,设计为靶定人TTR的候选试剂),或者其可以是筛选用于人-TTR-靶向活性的试剂。
(1)靶定人TTR基因的核酸酶试剂
人-TTR-靶向试剂可以是基因组编辑试剂,例如,裂解人TTR基因中的靶向序列的核酸酶试剂。核酸酶靶向序列包括由核酸酶试剂诱导切口或双链断裂的DNA序列。核酸酶试剂的靶向序列可以是细胞内源性的(或原生的)或者所述靶向序列可以是细胞外源的。细胞外源的靶向序列不是在细胞的基因组中天然生成的。靶向序列也可以是目标多核苷酸外源的,理想的是其位于目标基因座处。在一些情况下,靶向序列只存在于宿主细胞的基因组中。
靶向序列的长度可以是不同的,并且包括例如,对于锌手指核酸酶(ZFN)对而言,靶向序列为约30-36bp(即,对于每个ZFN为约15-18bp),对于类转录活化因子核酸酶(TALEN)而言为约36bp,或对于CRISPR/Cas9向导RNA而言为约20bp。
在期望的靶向序列处诱导切口或双链断裂的任何核酸酶试剂可用于本文公开的方法和组合物中。可使用天然生成的或原生的核酸酶试剂,只要核酸酶试剂在期望的靶向序列中诱导切口或双链断裂。可选地,可使用修饰的或工程化的核酸酶试剂。“工程化的核酸酶试剂”包括从其原生形式被工程化(修饰或衍生)为特异性识别和诱导期望的靶向序列中的切口或双链断裂的核酸酶。因此,工程化的核酸酶可衍生自原生的、天然生成的核酸酶试剂或者其可以是人工产生的或合成的。工程化的核酸酶可诱导靶向序列中的切口或双链断裂,例如,其中,靶向序列不是被原生(非工程化的或未修饰的)核酸酶试剂识别的序列。对核酸酶试剂的修饰可以是蛋白质裂解试剂中仅仅一个氨基酸的修饰或者可以是核酸裂解试剂中仅仅一个核苷酸的修饰。本文中在靶向序列或其他DNA中产生切口或双链断裂可以是指“切断”或“裂解”靶向序列或其他DNA。
本文还提供示例性的靶向序列的活性变体和片段。这些活性变体可包括与给定的靶向序列具有至少65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列一致性,其中,所述活性变体保留了生物活性,因此能够以序列特异性的方式被核酸酶试剂识别和裂解。测量核酸酶试剂对靶向序列的双链断裂的方法是本领域熟知的。参见,例如,Frendewey等人,(2010)Methods in Enzymology 476:295-307,其全部内容通过引用并入本文,用于所有目的。
核酸酶试剂的靶向序列可位于Ttr基因座中的任何位置或靠近Ttr基因座的任何位置。靶向序列可位于Ttr基因的编码区域中,或可位于影响基因表达的调节性区域中。核酸酶试剂的靶向序列可位于内含子、外显子、启动子、增强子、调节性区域或任何非蛋白质编码区域中。
一种类型的核酸酶试剂是类转录活性因子核酸酶(TALEN)。TAL因子核酸酶是一类序列特异性核酸酶,其可用于在原核生物体或真核生物体的基因组中在特定靶向序列处产生双链断裂。TAL因子核酸酶通过将原生的或工程化的类转录活性(TAL)因子或其功能部分融合至内切核酸酶(例如,FokI)的催化结构域而产生。独特的模块化的TAL因子DNA结合结构域能够设计出具有潜在的任何给定的DNA识别特异性的蛋白质。因此,TAL因子核酸酶的DNA结合结构域可被工程化为识别特定的DNA靶向位点,因此,用于在期望的靶向序列处产生双链断裂。参见,WO 2010/079430;Morbitzer等人,(2010)PNAS 10.1073/pnas.1013133107;Scholze&Boch(2010)Virulence 1:428-432;Christian等人,Genetics(2010)186:757-761;Li等人,(2010)Nuc.Acids Res.(2010)doi:10.1093/nar/gkq704;andMiller等人,(2011)Nature Biotechnology 29:143–148,其每一个的全部内容通过引用并入本文,用于所有目的。
合适的TAL核酸酶的实例以及用于制备合适的TAL核酸酶的方法在本领域公开,例如,在US 2011/0239315 A1,US 2011/0269234 A1,US 2011/0145940 A1,US 2003/0232410A1,US 2005/0208489 A1,US 2005/0026157 A1,US 2005/0064474 A1,US 2006/0188987A1,and US 2006/0063231 A1中公开,这些美国专利申请中的每一个的全部内容通过引用并入本文。在各种不同的实施方式中,TAL因子核酸酶被工程化为在例如目标基因座中或在目标基因组基因座中在靶向核酸序列中或附近进行切断,其中,靶向核酸序列位于待由靶向载体修饰的序列处或附近。适用于本文提供的各种不同的方法和组合物的TAL核酸酶包括特异性地设计为在待由本文所述的靶向载体修饰的靶向核酸序列处或附近进行结合的那些TAL核酸酶。
在一些TALEN中,每个TALEN单体包括33至35个TAL重复单元,其通过两个高变残基识别单个碱基对。在一些TALEN中,核酸酶试剂是包含基于TAL-重复单元的DNA结合结构域的嵌合蛋白,该基于TAL重复单元的DNA结合结构域可操作地连接至诸如FokI内切核酸酶之类的独立的核酸酶。例如,核酸酶试剂可包括第一基于TAL重复单元的DNA结合结构域和第二基于TAL重复单元的DNA结合结构域,其中,第一基于TAL重复单元的DNA结合结构域和第二基于TAL重复单元的DNA结合结构域均可操作地连接至FokI核酸酶,其中,第一基于TAL重复单元的DNA结合结构域和第二基于TAL重复单元的DNA结合结构域识别由不同长度(12-20bp)的间隔序列分隔开的靶向DNA序列的每个链中的两个连续靶向DNA序列,其中,FokI核酸酶亚单元二聚化生成在靶向序列处产生双链断裂的活性核酸酶。
在本文公开的各种不同的方法和组合物中使用的核酸酶试剂可还包括锌手指核酸酶(ZFN)。在一些ZFN中,ZFN中的每个单体包括三个或多个基于锌手指的DNA结合结构域,其中,每个基于锌手指的DNA结合结构域结合至3bp亚位点。在其他ZFN中,ZFN是包含基于锌手指的DNA结合结构域的嵌合蛋白,该基于锌手指的DNA结合结构域可操作地连接至诸如FokI内切核酸酶之类的独立的核酸酶。例如,核酸酶试剂可包括第一ZFN和第二ZFN,其中,第一ZFN和第二ZFN中的每一个可操作地连接至FokI核酸酶亚单元,其中,第一和第二ZFN识别由约5-7bp间隔体分隔开的靶向DNA序列的每个链中的两个连续的靶向DNA序列,并且,其中,FokI核酸酶亚单元二聚化生成产生双链断裂的活性核酸酶。参见,例如,US20060246567;US20080182332;US20020081614;US20030021776;WO/2002/057308A2;US20130123484;US20100291048;WO/2011/017293A2;以及Gaj等人,(2013)Trends inBiotechnology,31(7):397-405,其每一个的全部内容通过引用并入本文。
另一类型的核酸酶试剂是大范围核酸酶。基于保守序列基序,大范围核酸酶被分为四个家族,其为LAGLIDADG,GIY-YIG,H-N-H,和His-Cys box家族。这些基序参与金属离子的配位和磷酸二酯键的水解。大范围核酸酶对于其较长靶向序列是显著的并且对于耐受其DNA底物中的一些序列多态性而言是显著的。大范围核酸酶结构域,结构和功能是本领域已知的,参见例如,Guhan and Muniyappa(2003)Crit Rev Biochem Mol Biol 38:199-248;Lucas等人,,(2001)Nucleic Acids Res 29:960-9;Jurica and Stoddard,(1999)CellMol Life Sci 55:1304-26;Stoddard,(2006)Q Rev Biophys 38:49-95;and Moure等人,,(2002)Nat Struct Biol 9:764。在一些实例中,使用天然生成的变体和/或工程化衍生物大范围核酸酶。用于修饰动力学,共因子相互作用,表达,优化条件和/或靶向序列特异性的方法以及活性筛选方法是本领域已知的。参见,例如,Epinat等人,,(2003)Nucleic AcidsRes 31:2952-62;Chevalier等人,,(2002)Mol Cell 10:895-905;Gimble等人,,(2003)MolBiol 334:993-1008;Seligman等人,,(2002)Nucleic Acids Res 30:3870-9;Sussman等人,,(2004)J Mol Biol 342:31-41;Rosen等人,,(2006)Nucleic Acids Res 34:4791-800;Chames等人,,(2005)Nucleic Acids Res 33:e178;Smith等人,,(2006)NucleicAcids Res 34:e149;Gruen等人,,(2002)Nucleic Acids Res 30:e29;Chen and Zhao,(2005)Nucleic Acids Res 33:e154;WO2005105989;WO2003078619;WO2006097854;WO2006097853;WO2006097784;和WO2004031346,其中的每一个的全部内容通过引用并入本文。
可使用任何大范围核酸酶,包括,例如,I-SceI,I-SceII,I-SceIII,I-SceIV,I-SceV,I-SceVI,I-SceVII,I-CeuI,I-CeuAIIP,I-CreI,I-CrepsbIP,I-CrepsbIIP,I-CrepsbIIIP,I-CrepsbIVP,I-TliI,I-PpoI,PI-PspI,F-SceI,F-SceII,F-SuvI,F-TevI,F-TevII,I-AmaI,I-AniI,I-ChuI,I-CmoeI,I-CpaI,I-CpaII,I-CsmI,I-CvuI,I-CvuAIP,I-DdiI,I-DdiII,I-DirI,I-DmoI,I-HmuI,I-HmuII,I-HsNIP,I-LlaI,I-MsoI,I-NaaI,I-NanI,I-NcIIP,I-NgrIP,I-NitI,I-NjaI,I-Nsp236IP,I-PakI,I-PboIP,I-PcuIP,I-PcuAI,I-PcuVI,I-PgrIP,I-PobIP,I-PorI,I-PorIIP,I-PbpIP,I-SpBetaIP,I-ScaI,I-SexIP,I-SneIP,I-SpomI,I-SpomCP,I-SpomIP,I-SpomIIP,I-SquIP,I-Ssp6803I,I-SthPhiJP,I-SthPhiST3P,I-SthPhiSTe3bP,I-TdeIP,I-TevI,I-TevII,I-TevIII,I-UarAP,I-UarHGPAIP,I-UarHGPA13P,I-VinIP,I-ZbiIP,PI-MtuI,PI-MtuHIP PI-MtuHIIP,PI-PfuI,PI-PfuII,PI-PkoI,PI-PkoII,PI-Rma43812IP,PI-SpBetaIP,PI-SceI,PI-TfuI,PI-TfuII,PI-ThyI,PI-TliI,PI-TliII,或者它们的任何活性变体或片段。
大范围核酸酶可识别例如12至40个碱基对的双链DNA序列。在一些情况下,大范围核酸酶识别基因组中的一个完全匹配的靶向序列。
一些大范围核酸酶是归巢核酸酶(homing nucleases)。归巢核酸酶的一种类型是归巢核酸酶的LAGLIDADG家族,包括,例如,I-SceI,I-CreI,和I-Dmol。
核酸酶试剂可还包括下文详细描述的CRISPR/Cas系统。
本文还提供核酸酶试剂的活性变体和片段(即,工程化的核酸酶试剂)。这样的活性变体可包含与天然核酸酶试剂具有至少65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列一致性,其中,所述活性变体保留了在期望的靶向序列处进行切断的能力并且因此保留了切口或双链断裂诱导活性。例如,本文所述的任何核酸酶试剂可从原生的内切核酸酶序列进行修饰并且设计为识别并诱导靶向序列处的切口或双链断裂,所述靶向序列不被原生核酸酶试剂识别。因此,一些工程化的核酸酶具有诱导靶向序列处的切口或双链断裂的特异性,所述靶向序列不同于相应的原生核酸酶试剂靶向序列。对切口或双链断裂诱导活性的分析是本领域已知的并且通常测量在包含靶向序列的DNA底物上的内切核酸酶的总体活性和特异性。
核酸酶试剂可通过任何已知的方式引入至细胞或非人类动物。编码核酸酶试剂的多肽可直接引入至细胞或非人类动物。可选地,编码核酸酶试剂的多核苷酸可被引入至细胞或非人类动物。当引入编码核酸酶试剂的多核苷酸时,核酸酶试剂可瞬时、条件性地或组成性地在细胞中表达。编码核酸酶试剂的多核苷酸可被包含在表达盒中并且可以可操作地连接至条件性启动子、可诱导启动子、组成性启动子或组织特异性启动子。启动子的实例在本文其他地方进一步讨论。可选地,核酸酶试剂作为编码核酸酶试剂的mRNA可引入至细胞中。
编码核酸酶试剂的多核苷酸可稳定地整合至细胞的基因组中并且可操作地连接至在细胞中具有活性的启动子。可选地,编码核酸酶试剂的多核苷酸可以位于靶向载体中。
当通过引入编码核酸酶试剂的多核苷酸将核酸酶试剂提供至细胞时,这种编码核酸酶试剂的多核苷酸可被修饰为取代在目标细胞中相对于编码核酸酶试剂的天然生成的多核苷酸序列具有较高的使用频率的密码子。例如,编码核酸酶试剂的多核苷酸可被修饰为取代在给定的目标真核细胞中相对于天然生成的多核苷酸序列具有较高的使用频率的密码子,所述真核细胞包括人细胞、非人类细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其他目标宿主细胞。
(2)靶定人TTR基因的CRISPR/Cas系统
特定类型的人-TTR-靶向试剂可以是靶定人TTR基因的CRISPR/Cas系统。CRISPR/Cas系统包括Cas基因的表达或定向活化所涉及的转录体和其他元件。CRISPR/Cas系统可以是例如,I型系统,II型系统或III型系统。可选地,CRISPR/Cas系统可以是V型系统(例如,V-A亚型或V-B亚型)。在本文公开的组合物和方法中使用的CRISPR/Cas系统可以是非天然生成的。“非天然生成的”系统包括显示出人工参与的任何事件,例如,从系统的天然生成的状态改变或突变而来的系统中的一个或多个成分,至少基本上不含与系统本质上天然相关的至少一种其他成分,或与系统非天然相关的至少一种其他成分相关联。例如,非天然生成的CRISPR/Cas系统可使用包含非天然一同生成的gRNA和Cas蛋白质的CRISPR复合物,非天然生成的Cas蛋白质或非天然生成的gRNA。
Cas蛋白质和编码Cas蛋白质的多核苷酸。Cas蛋白质通常包含可与向导RNA(gRNA,下文中详细描述)发生相互作用的至少一个RNA识别结构域或至少一个RNA结合结构域。Cas蛋白质可还包含核酸酶结构域(例如,DNase或RNase结构域),DNA结合结构域,解旋酶结构域,蛋白质-蛋白质相互作用结构域,二聚化结构域和其他结构域。一些这样的结构域(例如DNase结构域)可来自于原生Cas蛋白质。可添加其他这样的结构域以产生修饰的Cas蛋白质。核酸酶结构域对核酸裂解具有催化活性,所述核酸裂解包括核酸分子的共价键的断裂。裂解可产生平端或交错端,并且其可以是单链或双链裂解。例如,野生型Cas9蛋白质通常会产生平端裂解产物。可选地,野生型Cpf1蛋白质(例如,FnCpf1)可产生带有5-核苷酸5’悬挂的裂解产物,其中,裂解发生在非目标链上的PAM序列的第18个碱基对之后以及目标链上的第23个碱基之后。Cas蛋白质可具有完全裂解活性以在目标基因组基因座处产生双链断裂(例如,带有平端的双链断裂),或者Cas蛋白质可以是在目标基因组基因座处产生单链断裂的切口酶。
Cas蛋白质的实例包括Cas1,Cas1B,Cas2,Cas3,Cas4,Cas5,Cas5e(CasD),Cas6,Cas6e,Cas6f,Cas7,Cas8a1,Cas8a2,Cas8b,Cas8c,Cas9(Csn1 or Csx12),Cas10,Cas10d,CasF,CasG,CasH,Csy1,Csy2,Csy3,Cse1(CasA),Cse2(CasB),Cse3(CasE),Cse4(CasC),Csc1,Csc2,Csa5,Csn2,Csm2,Csm3,Csm4,Csm5,Csm6,Cmr1,Cmr3,Cmr4,Cmr5,Cmr6,Csb1,Csb2,Csb3,Csx17,Csx14,Csx10,Csx16,CsaX,Csx3,Csx1,Csx15,Csf1,Csf2,Csf3,Csf4,和Cu1966,以及它们的同系物或修饰形式。
示例性的Cas蛋白质是Cas9蛋白质或从Cas9蛋白质衍生得到的蛋白质。Cas9蛋白质获自II型CRISPR/Cas系统并且通常与保守结构共享四个关键基序。基序1,2和4是类RuvC基序,并且基序3是HNH基序。示例性的Cas9蛋白质来自产脓链球菌(Streptococcuspyogenes),嗜热链球菌(Streptococcus thermophilus),链球菌属(Streptococcus sp.),金黄色葡萄球菌(Staphylococcus aureus),拟诺卡氏菌(Nocardiopsis dassonvillei),始旋链霉素(Streptomyces pristinaespiralis),绿色产色链霉菌(Streptomycesviridochromogenes),绿色产色链霉菌(Streptomyces viridochromogenes),玫瑰链孢囊菌(Streptosporangium roseum),玫瑰链孢囊菌(Streptosporangium roseum),酯环酸芽孢杆菌(Alicyclobacillus acidocaldarius),假真菌样芽孢杆菌(Bacilluspseudomycoides),还原砸酸盐芽孢杆菌(Bacillus selenitireducens),西伯利亚微杆菌(Exiguobacterium sibiricum),保加利亚乳杆菌(Lactobacillus delbrueckii),唾液乳杆菌(Lactobacillus salivarius),海洋微颤菌(Microscilla marina),伯克氏菌目(Burkholderiales bacterium),Polaromonas naphthalenivorans,极单胞菌(Polaromonas sp.),海洋固氮蓝藻(Crocosphaera watsonii),蓝杆藻(Cyanothece sp.),铜绿微囊藻(Microcystis aeruginosa),聚球藻(Synechococcus sp.),阿拉伯糖醋盐杆菌(Acetohalobium arabaticum),Ammonifex degensii,嗜热厌氧菌(Caldicelulosiruptorbecscii),Candidatus Desulforudis,肉毒杆菌(Clostridium botulinum),艰难梭菌(Clostridium difficile),大芬戈尔德菌(Finegoldia magna),嗜热盐碱厌氧菌(Natranaerobius thermophilus),Pelotomaculum thermopropionicum,喜温硫杆菌(Acidithiobacillus caldus),嗜酸氧化亚铁硫杆菌(Acidithiobacillusferrooxidans),Allochromatium vinosum,海杆状菌(Marinobactersp.),嗜盐亚硝化球菌(Nitrosococcushalophilus),瓦氏亚硝化球菌(Nitrosococcuswatsoni),河豚毒素假交替单胞菌(Pseudoalteromonashaloplanktis),成簇细枝菌(Ktedonobacterracemifer),调查甲烷盐菌(Methanohalobiumevestigatum),多变鱼腥藻(Anabaenavariabilis),泡沫节球菌(Nodularia spumigena),念球藻(Nostoc sp.),极大节螺藻(Arthrospira maxima),钝顶节螺藻(Arthrospira platensis),节旋藻(Arthrospira sp.),鞘丝藻(Lyngbya sp.),原型微鞘藻(Microcoleus chthonoplastes),颤藻(Oscillatoria sp.),Petrotogamobilis,Thermosipho africanus,Acaryochloris marina,脑膜炎双球菌(Neisseriameningitidis)或空肠弯曲菌(Campylobacter jejuni)。Cas9家族成员中的其他实例在WO2014/131833中描述,其全部内容通过引用并入本文,用于所有目的。来自化脓性链球菌(S.pyogenes)的Cas9(SpCas9)(SwissProt登录号:Q99ZW2)是示例性的Cas9蛋白质。来自金黄色葡萄糖球菌(S.aureus)的Cas9(SaCas9)(UniPort登录号:J7RUA5)是另一示例性的Cas9蛋白质。来自空肠弯曲菌(Campylobacter jejuni)的Cas9(CjCas9)(UniPort登录号为:Q0P897)是另一示例性的Cas9蛋白质。参见,例如,Kim等人,(2017)Nat.Comm.8:14500,其全部内容通过引用并入本文,用于所有目的。SaCas9比SpCas9小,并且,CjCas9比SaCas9和SpCas9小。示例性的Cas9蛋白质序列可包括SEQ ID NO:94,基本由SEQ ID NO:94构成或由SEQ ID NO:94构成。示例性的编码Cas9蛋白质的DNA可包括SEQ ID NO:93,基本由SEQ IDNO:93构成或由SEQ ID NO:93构成。
Cas蛋白质的另一实例是Cpf1(来自普氏菌属(Prevotella)和弗浪西斯氏菌1(Francisella 1)的CRISPR)蛋白质。Cpf1是包含与Cas9的对应结构域具有同源性的类RuvC核酸酶结构域以及Cas9的特有的富精氨酸簇的对应物的较大的蛋白质(约1300个氨基酸)。然而,Cpf1缺乏存在于Cas9蛋白质中的HNH核酸酶结构域,并且类Ruv-C结构域在Cpf1序列中是连续的,这与Cas9形成鲜明对照,Ruv-C结构域包含包括HNH结构域在内的较长的插入体。参见例如,Zetsche等人,(2015)Cell 163(3):759-771,其全部内容通过引用并入本文,用于所有目的。示例性的Cpf1蛋白质来自土拉弗朗西斯菌1(Francisella tularensis 1),土拉弗朗西斯菌亚种novicida(Francisella tularensis subsp.novicida),Prevotellaalbensis,毛螺旋菌科细菌MC2017 1(Lachnospiraceae bacterium MC2017 1),丁酸弧菌(Butyrivibrio proteoclasticus),佩莱格里尼菌科细菌GW2011_GWA2_33_10(Peregrinibacteria bacterium GW2011_GWA2_33_10),Parcubacteria细菌GW2011_GWC2_44_17(Parcubacteria bacterium GW2011_GWC2_44_17),Smithella sp.SCADC,氨基酸球菌属BV3L6(Acidaminococcus sp.BV3L6),毛螺菌科细菌MA2020(Lachnospiraceaebacterium MA2020),Candidatus Methanoplasma termitum,挑剔真杆菌(Eubacteriumeligens),牛眼莫拉氏菌237(Moraxella bovoculi 237),Leptospira inadai,毛螺菌科细菌ND2006(Lachnospiraceae bacterium ND2006),狗口腔红棕色单胞菌3(Porphyromonascrevioricanis 3),解糖胨普雷沃菌(Prevotella disiens),以及猕猴卟啉单胞菌(Porphyromonas macacae)。来自新泽西弗朗西斯菌U112(Francisella novicida U112)的Cpf1(FnCpf1,UniProt登录号:A0Q7Q2)是示例性的Cpf1蛋白质。
Cas蛋白质可以是野生型蛋白质(即,天然生成的那些),修饰的Cas蛋白质(即,Cas蛋白质变体)或者野生型或修饰的Cas蛋白质的片段。Cas蛋白质也可以是关于野生型或修饰的Cas蛋白质的催化活性的活性变体或片段。关于催化活性的活性变体或片段可包含与野生型或修饰的Cas蛋白质或其部分具有至少80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高的序列一致性,其中,活性变体保留了在期望的裂解位点进行切断的能力并且因此保留了切口诱导活性或双链断裂诱导活性。切口诱导活性或双链断裂诱导活性的分析方法是本领域已知的并且该分析方法通常测量在包含裂解位点的DNA底物上的Cas蛋白质的整体活性和特异性。
Cas蛋白质可被修饰为提高或降低核酸结合亲和性,核酸结合特异性和酶活性中的一种或多种。Cas蛋白质还可被修饰为改变蛋白质的任何其他活性或性质,例如稳定性。例如,Cas蛋白质的一个或多个核酸酶结构域可以被修饰、删除或灭活,或者Cas蛋白质可被截短以除去对蛋白质功能非必需的结构域或优化(例如,提高或降低)Cas蛋白质的活性或性质。
修饰的Cas蛋白质的一个实例是修饰的SpCas9-HF1蛋白质,其是产脓链球菌Cas9的高保真度变体,其带有设计为降低非特异性DNA接触的改变(N497A/R661A/Q695A/Q926A)。参见,例如,Kleinstiver等人,(2016)Nature 529(7587):490-495,其全部内容通过引用并入本文,用于所有目的。修饰的Cas蛋白质的另一实例是设计为降低脱靶效应的修饰的eSpCas9变体(K848A/K1003A/R1060A)。参见,例如,Slaymaker等人,(2016)Science351(6268):84-88,其全部内容通过引用并入本文,用于所有目的。其他SpCas9变体包括K855A和K810A/K1003A/R1060A。
Cas蛋白质可包括至少一个核酸酶结构域,例如,DNase结构域。例如,野生型Cpf1蛋白质通常包含裂解目标DNA的双链的类RuvC结构域,其可能处于二聚结构中。Cas蛋白质还可包含至少两个核酸酶结构域,例如,DNase结构域。例如,野生型Cas9蛋白质通常包含类RuvC核酸酶结构域和类HNH核酸酶结构域。RuvC和HNH结构域可分别切割双链DNA的不同链以在DNA中产生双链断裂。参见,例如,Jinek等人,(2012)Science 337:816-821,其全部内容通过引用并入本文,用于所有目的。
核酸酶结构域中的一个或多个或全部可被删除或发生突变,这样它们不再是功能性的或具有降低的核酸酶活性。例如,如果Cas9蛋白质中的核酸酶结构域中的一个被删除或发生突变,得到的Cas9蛋白质可被称为切口酶并且可在双链DNA中的向导RNA靶向序列处产生单链断裂,但不会产生双链断裂(即,它可裂解互补链或非互补链,但不会裂解这两者)。如果两个核酸酶结构域均被删除或发生突变,那么得到的Cas蛋白质(例如,Cas9)将具有降低的裂解双链DNA的双链的能力(例如,无核酸酶或核酸酶惰性Cas蛋白质或催化失活的Cas蛋白质(dCas))。将Cas9转化成切口酶的突变的实例是在来自化脓性链球菌的Cas9的RuvC结构域中的D10A(在Cas9的位置10将天冬氨酸盐突变为丙氨酸)突变。类似地,来自化脓性链球菌的Cas9的HNH结构域中的H939A(氨基酸位置839处组氨酸突变为丙氨酸),H840A(氨基酸位置840处组氨酸突变为丙氨酸)或N863A(在氨基酸位置N863处天冬酰胺突变为丙氨酸)可将Cas9转化为切口酶。将Cas9转化为切口酶的突变的其他实例包括对来自嗜热链球菌(S.thermophilus)的Cas9进行的相应突变。参见,例如,Sapranauskas等人,(2011)Nucleic Acids Research 39:9275-9282和WO 2013/141680,其中的每一个的全部内容通过引用并入本文,用于所有目的。这些突变可使用诸如位点定向突变形成,PCR介导的突变形成,或总基因合成之类的方法产生。产生切口酶的其他突变的实例可在例如WO 2013/176772和WO 2013/142578中找到,其中的每一个的全部内容通过引用并入本文,用于所有目的。如果Cas蛋白质中的所有核酸酶结构域均被删除或发生突变(例如,Cas9蛋白质中的两个核酸酶结构域均被删除或发生突变),那么得到的Cas蛋白质(例如,Cas9)将具有降低的裂解双链DNA的双链的能力(例如,无核酸酶或核酸酶惰性Cas蛋白质)。一个具体的实例是D10A/H840A化脓性链球菌Cas9双突变或与化脓性链球菌Cas9进行最佳比对时来自另一物种的Cas9中的相应的双突变。另一具体的实例是D10A/N863A化脓性链球菌Cas9双突变或在与化脓性链球菌Cas9进行最佳比对时来自另一物种的Cas9中的相应的双突变。
本领域还已知使金黄色葡萄球菌Cas9蛋白质的催化结构域中的突变失活的实例。例如,金黄色葡萄球菌Cas9酶(SaCas9)可包含位置N580的取代(例如,N580A取代)和位置D10的取代(例如,D10A取代),从而产生核酸酶惰性Cas蛋白质。参见,例如,WO 2016/106236,其全部内容通过引用并入本文,用于所有目的。
本领域还已知使Cpf1蛋白质的催化结构域中的突变失活的实例。对于来自新泽西弗朗西斯菌U112(Francisella novicida U112)的Cpf1(FnCpf1),来自氨基酸球菌属BV3L6(Acidaminococcus sp.BV3L6)的Cpf1(AsCpf1),来自毛螺菌科细菌ND2006(Lachnospiraceae bacterium ND2006)的Cpf1(LbCpf1)以及来自牛眼莫拉氏菌237(Moraxella bovoculi 237)的Cpf1(MbCpf1 Cpf1)而言,这些突变可包括AsCpf1的位置908,993或1263处的突变或Cpf1直系同源物中的相应位置处的突变,或者LbCpf1的位置832,925,947或1180处的突变或Cpf1直系同源物中的相应位置处的突变。这些突变可包括例如,AsCpf1的突变D908A,E993A和D1263A中的一个或多个或者Cpf1直系同源物中的相应突变中的一个或多个,或LbCpf1的D832A,E925A,D947A和D1180A中的一个或多个或者Cpf1直系同源物中的相应突变中的一个或多个。参见,例如,US 2016/0208243,其全部内容通过引用并入本文,用于所有目的。
Cas蛋白质(例如,核酸酶活性Cas蛋白质或核酸酶惰性Cas蛋白质)还可以可操作地连接至作为融合蛋白的异源多肽。例如,Cas蛋白质可融合至裂解结构域或表观遗传修饰结构域。参见,WO2014/089290,其全部内容通过引用并入本文,用于所有目的。Cas蛋白质还可融合至提供提高的或降低的稳定性的异源多肽。融合的结构域或异源多肽可位于N-末端,C-末端或Cas蛋白质内部。
作为一个实例,Cas蛋白质可融合至提供亚细胞定位的一个或多个异源多肽。这些异源多肽可包括例如:一个或多个核定位信号(NLS),例如,用于靶向细胞核的单组分SV40NLS和/或双组分α-内输蛋白NLS,用于靶向线粒体的线粒体定位信号,ER滞留信号,等等。参见,例如,Lange等人,(2007)J.Biol.Chem.282:5101-5105,其全部内容通过引用并入本文,用于所有目的。这些亚细胞定位信号可位于Cas蛋白质的N-末端,C-末端或任何其他地方。NLS可包含碱性氨基酸的延伸并且可以是单组分序列或双组分序列。任选地,Cas蛋白质可包含两个或多个NLS,包括N-末端的NLS(例如,α-内输蛋白NLS或单组分NLS)和C-末端的NLS(例如,SV40 NLS或双组分NLS)。Cas蛋白质还可以包含位于N-末端的两个或多个NLS和/或位于C-末端的两个或多个NLS。
Cas蛋白质还可以可操作地连接至细胞渗透结构域或蛋白转导结构域。例如,所述细胞渗透结构域可衍生自HIV-1TAT蛋白质,来自人乙型肝炎病毒的TLM细胞渗透基序,MPG,Pep-1,VP22,来自单纯性疱疹病毒的细胞渗透肽或聚精氨酸肽序列。参见,例如,WO2014/089290和WO 2013/176772,其每一个的全部内容通过引用并入本文,用于所有目的。所述细胞渗透结构域可位于Cas蛋白质的N-末端,C-末端或任何其他地方。
Cas蛋白质还可以可操作地连接至易于跟踪或纯化的异源多肽,例如,荧光蛋白,纯化标签或表位标签。荧光蛋白的实例包括绿色荧光蛋白(例如,GFP,GFP-2,tagGFP,turboGFP,eGFP,Emerald,Azami Green,Monomeric Azami Green,CopGFP,AceGFP,ZsGreenl),黄色荧光蛋白(例如,YFP,eYFP,Citrine,Venus,YPet,PhiYFP,ZsYellowl),蓝色荧光蛋白(例如,eBFP,eBFP2,Azurite,mKalamal,GFPuv,Sapphire,T-sapphire),青色荧光蛋白(例如,eCFP,Cerulean,CyPet,AmCyanl,Midoriishi-Cyan),红色荧光蛋白(例如,mKate,mKate2,mPlum,DsRed monomer,mCherry,mRFP1,DsRed-Express,DsRed2,DsRed-Monomer,HcRed-Tandem,HcRedl,AsRed2,eqFP611,mRaspberry,mStrawberry,Jred),橙色荧光蛋白(例如,mOrange,mKO,Kusabira-Orange,Monomeric Kusabira-Orange,mTangerine,tdTomato)和任何其他合适的荧光蛋白。标签的实例包括谷胱甘肽-S-转移酶(GST),甲壳素结合蛋白(CBP),麦芽糖结合蛋白,硫氧还蛋白(TRX),聚(NANP),串联亲和纯化(TAP)标签,myc,AcV5,AU1,AU5,E,ECS,E2,FLAG,血球凝集素(HA),nus,Softag 1,Softag3,Strep,SBP,Glu-Glu,HSV,KT3,S,S1,T7,V5,VSV-G,组氨酸(His),生物素羟基载体蛋白(BCCP)和钙调蛋白。
Cas蛋白质还可栓系于外源供体核酸或标记的核酸。这样的栓系(即,物理连接)可通过共价相互作用或非共价相互作用来完成,并且栓系可以是直接的(例如,通过直接融合或化学偶联,其可通过对蛋白质上的半胱氨酸或赖氨酸残基进行修饰或内含肽修饰来完成)或者栓系可通过一个或多个介入的连接体或适体分子(例如链霉亲和素或适体)来完成。参见例如,Pierce等人,(2005)Mini Rev.Med.Chem.5(1):41-55;Duckworth等人,(2007)Angew.Chem.Int.Ed.Engl.46(46):8819-8822;Schaeffer and Dixon(2009)Australian J.Chem.62(10):1328-1332;Goodman等人,(2009)Chembiochem.10(9):1551-1557;以及Khatwani等人,(2012)Bioorg.Med.Chem.20(14):4532-4539,其每一个的全部内容通过引用并入本文,用于所有目的。合成蛋白质-核酸偶联物的非共价策略包括生物素-链霉亲和素和镍-组氨酸方法。共价蛋白质-核酸偶联物可通过使用多种化学试剂将功能性核酸和蛋白质进行合适地连接而合成得到。这些化学试剂中的一些涉及寡核苷酸与蛋白质表面上的氨基酸残基(例如,赖氨酸的氨基或半胱氨酸的巯基)的直接连接,而其他更加复杂的方案需要对蛋白质进行翻译后修饰或涉及催化或反应性蛋白质结构域。蛋白质与核酸的共价连接方法可包括例如,寡核苷酸与蛋白质赖氨酸或半胱氨酸残基的化学交联,表达的蛋白质连接法,化学酶方法和使用光适体。外源供体核酸或标记的核酸可栓系至Cas蛋白质内的C末端,N末端或内部区域。在一个实例中,外源供体核酸或标记的核酸栓系至Cas蛋白质的C末端或N末端。同样,Cas蛋白质可栓系至外源供体核酸或标记的核酸内的5’端,3’端或内部区域。也就是说,外源供体核酸或标记的核酸可在任何方向上和极性上栓系。例如,Cas蛋白质可被栓系至外源供体核酸或标记的核酸的5’端或3’端。
可以任何形式提供Cas蛋白质。例如,Cas蛋白质可以蛋白质的形式提供,例如,与gRNA复合的Cas蛋白质。可选地,Cas蛋白质可以编码Cas蛋白质的核酸的形式提供,例如,RNA(信使RNA(mRNA))或DNA。任选地,编码Cas蛋白质的核酸可以是被优化为在特定细胞或生物体内有效翻译为蛋白质的密码子。例如,编码Cas蛋白质的核酸可被修饰为取代在细菌细胞,酵母细胞,人细胞,非人类细胞,哺乳动物细胞,啮齿动物细胞,小鼠细胞,大鼠细胞或任何其他目标宿主细胞中相对于天然生成的多核苷酸序列具有较高的使用频率的密码子。当将编码Cas蛋白质的核酸引入至细胞中时,Cas蛋白质可在细胞中瞬时、条件性或组成性表达。
作为mRNA提供的Cas蛋白质可被修饰以改善稳定性和/或免疫原性性质。所述修饰可对mRNA中的一个或多个核苷进行。对mRNA核碱基进行化学修饰的实例包括假尿苷,1-甲基假尿苷和5-甲基-胞苷。例如,可使用包含N1-甲基假尿苷的加帽的且聚腺苷酸化的CasmRNA。同样,Cas mRNA可通过删除尿苷使用同义密码子进行修饰。
编码Cas蛋白质的核酸可被稳定地整合在细胞的基因组中并可操作地连接至在细胞中具有活性的启动子。可选地,编码Cas蛋白质的核酸可以可操作地连接至表达构建体中的启动子。表达构建体包括能够定向基因或其他目标核酸序列(例如,Cas基因)的表达的任何核酸构建体,所述核酸构建体可将这种目标核酸序列传递至目标细胞。例如,编码Cas蛋白质的核酸可位于包含核酸插入体的靶向载体中和/或位于包含编码gRNA的DNA的载体中。可选地,其可以位于载体或质粒中,所述载体或质粒不同于包含核酸插入体的靶向载体和/或不同于编码gRNA的DNA的载体。可在表达构建体中使用的启动子包括例如在如下细胞中的一种或多种中具有活性的启动子:真核细胞,人细胞,非人类细胞,哺乳动物细胞,非人类哺乳动物细胞,啮齿动物细胞,小鼠细胞,大鼠细胞,仓鼠细胞,兔细胞,多能细胞,胚胎干(ES)细胞,或受精卵。这些启动子可以是例如:条件性启动子,可诱导启动子,组成性启动子或组织特异性启动子。任选地,所述启动子可以是驱动Cas蛋白质在一个方向上表达并且驱动向导RNA在另一方向上表达的双向启动子。这样的双向启动子可由如下成分构成:(1)包含如下三个外部控制元件的完全、常规、单向Pol III启动子:远端序列元件(DSE),近端序列元件(PSE)和TATA盒;以及(2)第二基本Pol III启动子,其包括PSE和逆向融合至DSE的5’末端的TATA盒。例如,在H1启动子中,DSE靠近PSE和TATA盒并且启动子可通过产生杂交启动子而成为双向启动子,在所述杂交启动子中,通过添加衍生自U6启动子的PSE和TATA盒控制逆向转录。参见,例如,US 2016/0074535,其全部内容通过引用并入本文,用于所有目的。使用双向启动子表达编码Cas蛋白质和向导RNA的基因同时允许产生紧凑的表达盒以促进递送。
向导RNA。“向导RNA”或“gRNA”是结合至Cas蛋白质(例如,Cas9蛋白质)并使该Cas蛋白质靶向目标DNA中的特定位置的RNA分子。向导RNA可包含两个片段:“DNA靶向片段”和“蛋白质结合片段”。“片段”包括诸如RNA中的核苷酸的连续延伸片段之类的分子的某个部分或区域。诸如Cas9的gRNA之类的一些gRNA可包含两个不同的RNA分子:“活化RNA”(例如,tracrRNA)和“靶向RNA”(例如CRISPR RNA或crRNA)。其他gRNA是单个RNA分子(单个RNA多核苷酸),其还可称为“单分子gRNA”,“单个向导RNA”或“sgRNA”。参见,例如,WO 2013/176772,WO 2014/065596,WO 2014/089290,WO 2014/093622,WO 2014/099750,WO 2013/142578,和WO 2014/131833,其中的每一个的全部内容通过引用并入本文,用于所有目的。对于Cas9而言,例如,单个向导RNA可包含(例如通过连接体)融合至tracrRNA的crRNA。对于Cpf1而言,例如,只需要crRNA就可实现与目标序列的结合和/或裂解目标序列。术语“向导RNA”和“gRNA”包括双分子(即,模块化)gRNA和单分子gRNA。
示例性的双分子gRNA包含类crRNA(“CRISPR RNA”或“靶向RNA”或“crRNA”或“crRNA重复序列”)分子和对应的类tracrRNA(“反式激活CRISPR RNA”,或“活化RNA”或“tracrRNA”)分子。crRNA包含gRNA的DNA靶向片段(单链)和形成gRNA的蛋白质结合片段的dsRNA双倍体的一半的核苷酸延伸序列(即,crRNA尾部)。位于DNA靶向片段的下游(3’)的crRNA尾部的实例包含GUUUUAGAGCUAUGCU(SEQ ID NO:87),基本由GUUUUAGAGCUAUGCU(SEQID NO:87)构成或由GUUUUAGAGCUAUGCU(SEQ ID NO:87)构成。本文公开的DNA靶向片段中的任一个可连接至SEQ ID NO:87的5’端以形成crRNA。
对应的tracrRNA(活化RNA)包含形成gRNA的蛋白质结合片段的dsRNA双倍体的另一半的核苷酸延伸序列。crRNA的核苷酸延伸序列与tracrRNA的核苷酸延伸序列互补并杂交以形成gRNA的蛋白质结合结构域的dsRNA双倍体。这样,每个crRNA可被认为具有对应的tracrRNA。
tracrRNA序列的实例包含
AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQID NO:88),基本由
AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQID NO:88)构成或由
AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQID NO:88)构成。
在既需要crRNA又需要tracrRNA的系统中,crRNA和对应的tracrRNA杂交形成gRNA。在仅需要crRNA的系统中,crRNA可以是gRNA。crRNA还提供通过杂交至相对链(即,互补链)而靶向向导RNA靶向序列的单链DNA靶向片段。如果用于在细胞内进行修饰,给定的crRNA或tracrRNA分子的提取序列可被设计为对使用了RNA分子的物种具有特异性。参见,例如,Mali等人,(2013)Science 339:823-826;Jinek等人,(2012)Science 337:816-821;Hwang等人,(2013)Nat.Biotechnol.31:227-229;Jiang等人,(2013)Nat.Biotechnol.31:233-239;以及Cong等人,(2013)Science 339:819-823,上述参考文献中的每一个的全部内容通过引用并入本文,用于所有目的。
给定的gRNA的DNA-靶向片段(crRNA)包含与目标DNA中的序列(即,向导RNA靶向序列的相对链上的向导RNA识别序列的互补链)互补的核苷酸序列。gRNA的DNA靶向片段以序列特异性的方式通过杂交(即,碱基配对)与目标DNA发生相互作用。这样,DNA-靶向片段的核苷酸序列可发生改变并且决定了目标DNA中的gRNA和目标DNA发生相互作用的位置。目标gRNA的DNA-靶向片段可被修饰为与目标DNA内的任何期望的序列进行杂交。天然生成的crRNA基于CRISPR/Cas系统和生物体而不同,但是通常包含长度为21个核苷酸至72个核苷酸的靶向片段,其侧面具有长度为21个核苷酸至46个核苷酸的两个正向重复序列(DR)(参见,例如,WO 2014/131833,其全部内容通过引用并入本文,用于所有目的)。在化脓性链球菌的情况下,DR的长度为36个核苷酸并且靶向片段的长度为30个核苷酸。位于3’的DR与对应的tracrRNA互补并且与对应的tracrRNA杂交,其进而结合至Cas蛋白质。
DNA-靶向片段的长度可以为至少约12个核苷酸,至少约15个核苷酸,至少约17个核苷酸,至少约18个核苷酸,至少约19个核苷酸,至少约20个核苷酸,至少约25个核苷酸,至少约30个核苷酸,至少约35个核苷酸,至少约40个核苷酸。这样的DNA-靶向片段的长度可以为约12个核苷酸至约100个核苷酸,约12个核苷酸至约80个核苷酸,约12个核苷酸至约50个核苷酸,约12个核苷酸至约40个核苷酸,约12个核苷酸至约30个核苷酸,约12个核苷酸至约25个核苷酸,或约12个核苷酸至约20个核苷酸。例如,DNA靶向片段可以为约15个核苷酸至约25个核苷酸(例如,约17个核苷酸至约20个核苷酸或约17个核苷酸,约18个核苷酸,约19个核苷酸或约20个核苷酸)。参见,例如,US 2016/0024523,其全部内容通过引用并入本文,用于所有目的。对于来自化脓性链球菌的Cas9而言,典型的DNA-靶向片段的长度为16个核苷酸至20个核苷酸或17个核苷酸至20个核苷酸。对于来自金黄色葡萄球菌的Cas9而言,典型的DNA-靶向片段的长度为21个核苷酸至23个核苷酸。对于Cpf1而言,典型的DNA-靶向片段的长度为至少16个核苷酸或至少18个核苷酸。
TracrRNA可以是任何形式(例如,全长tracrRNA或部分活性tracrRNA)并且具有不同的长度。它们可包括初级转录体或加工过的形式。例如,tracrRNA(作为单个向导RNA的一部分或作为双分子gRNA的一部分作为单个的分子)可包含全部或部分野生型tracrRNA序列(例如,约为或多于约20,26,32,45,48,54,63,67,85个野生型tracrRNA序列或者更多),基本由全部或部分野生型tracrRNA序列(例如,约为或多于约20,26,32,45,48,54,63,67,85个野生型tracrRNA序列或者更多)构成或由全部或部分野生型tracrRNA序列(例如,约为或多于约20,26,32,45,48,54,63,67,85个野生型tracrRNA序列或者更多)构成。来自化脓性链球菌的野生型tracrRNA序列的实例包括171个核苷酸,89个核苷酸,75个核苷酸和65个核苷酸的版本。参见,例如,Deltcheva等人,(2011)Nature 471:602-607;WO 2014/093661,其每一个的全部内容通过引用并入本文,用于所有目的。单个向导RNA(sgRNA)中的tracrRNA的实例包括在sgRNA的+48,+54,+67和+85版本中发现的tracrRNA片段,其中,“+n”表示多达野生型tracrRNA的+n个核苷酸被包括在sgRNA中。参见,US 8,697,359,其全部内容通过引用并入本文,用于所有目的。
DNA靶向片段和目标DNA中的向导RNA识别序列的互补链之间的互补百分比可为至少60%(例如,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少97%,至少98%,至少99%,或100%)。DNA靶向片段和目标DNA中的向导RNA识别序列的互补链之间的互补百分比可为至少60%,超过约20个连续核苷酸互补。作为实例,DNA靶向片段和目标DNA中的向导RNA识别序列的互补链之间的互补百分比为100%,目标DNA的互补链中的向导RNA识别序列的互补链的5’端具有14个连续核苷酸互补并且其余部分的互补百分比为0%这么低。在这种情况下,DNA-靶向片段被认为长度为14个核苷酸。作为另一实例,DNA-靶向片段和目标DNA中的向导RNA识别序列的互补链之间的互补百分比为100%,目标DNA的互补链中的向导RNA识别序列的互补链的5’端具有7个连续核苷酸互补并且其余部分的互补百分比为0%这么低。在这种情况下,DNA靶向片段被认为长度为7个核苷酸。在一些向导RNA中,DNA靶向片段中的至少17个核苷酸与目标DNA互补。例如,DNA靶向片段的长度可以为20个核苷酸并且可包含与向导RNA识别序列的互补链的1个,2个或3个错配。优选地,所述错配不与前间区序列邻近基序(PAM)序列相邻(例如,错配位于DNA靶向片段的5’端或者错配远离PAM序列至少2个碱基对,至少3个碱基对,至少4个碱基对,至少5个碱基对,至少6个碱基对,至少7个碱基对,至少8个碱基对,至少9个碱基对,至少10个碱基对,至少11个碱基对,至少12个碱基对,至少13个碱基对,至少14个碱基对,至少15个碱基对,至少16个碱基对,至少17个碱基对,至少18个碱基对,或至少19个碱基对)。
gRNA的蛋白结合片段可包含彼此互补的核苷酸的两个延伸片段。蛋白结合片段的互补核苷酸进行杂交形成双链RNA双倍体(dsRNA)。目标gRNA的蛋白结合片段与Cas蛋白质发生相互作用并且gRNA通过DNA-靶向片段将结合的Cas蛋白质定向至目标DNA中的特定核苷酸序列。
单个向导RNA具有DNA靶向片段和骨架序列(即,向导RNA的蛋白结合序列或Cas结合序列)。例如,这种向导RNA具有5’DNA靶向片段和3’骨架序列。示例性的骨架序列包括如下序列,基本由如下序列构成或由如下序列构成:
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(版本1;SEQ ID NO:89);GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本2;SEQ ID NO:8);
GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本3;SEQ ID NO:9);以及
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本4;SEQ ID NO:10)。靶向任何向导RNA靶向序列的向导RNA可包括例如:位于融合至向导RNA的3’端上的示例性的向导RNA骨架序列中的任一个的向导RNA的5’端上的DNA靶向片段。也就是说,本文公开的DNA靶向片段中的任一个可连接至SEQ ID NO:89,8,9或10中的任一个的5’端以形成单个向导RNA(嵌合向导RNA)。本文其他地方公开的向导RNA版本1,2,3和4涉及分别与骨架版本1,2,3和4连接的DNA靶向片段(即,向导序列或向导)。
向导RNA可包括提供额外的期望特性(例如,修饰的或调节的稳定性,亚细胞定位,荧光标签跟踪,蛋白质或蛋白质复合物的结合位点,等等)的修饰或序列。这些修饰的实例包括例如:5’帽(例如,7-甲基鸟苷酸帽(m7G));3’聚腺苷酸化尾(即,3’poly(A)尾);核糖开关序列(例如,允许由蛋白质和/或蛋白质复合物调节稳定性和/或调节可及性);稳定性控制序列,形成dsRNA双倍体的序列(即,发夹),将RNA定向至亚细胞位置(例如,细胞核,线粒体,叶绿体,等等)的修饰或序列;提供跟踪的修饰或序列(例如,直接偶联至荧光分子、偶联至有利于荧光检测的基团、允许进行荧光检测的序列,等等);为蛋白质提供结合位点的修饰或序列(例如,作用于DNA上的蛋白质,包括DNA甲基转移酶,DNA脱甲基酶,组蛋白乙酰转移酶,组蛋白脱乙酰酶,等等),以及它们的组合。修饰的其他实例包括工程化的茎环双倍体结构,工程化的凸出区域,茎环双倍体结构的工程化的发夹3’,或其任何组合。参见例如,US2015/0376586,其全部内容通过引用并入本文,用于所有目的。凸出部分可以是由类crRNA区域和最小的类tracrRNA区域构成的双倍体内的核苷酸的未配对区域。在双倍体的一侧,凸出部分可包括未配对的5’-XXY-3’,其中,X是任何嘌呤并且Y可以是可与相对链上的核苷酸形成摇摆碱基对的核苷酸,在双倍体的另一侧,凸出部分可包含未配对的核苷酸区域。
未修饰的核酸可易于发生降解。外源核酸还可诱导固有免疫反应。修饰可有助于引入稳定性并且降低免疫原性。向导RNA可包括修饰的核苷和修饰的核苷酸,包括例如下列中的一种或多种:(1)改变或取代磷酸二酯骨架连接中的未连接的磷酸盐氧中的一个或两个和/或连接的磷酸盐氧中的一个或多个;(2)改变或取代核糖中的成分,例如,改变或取代核糖上的2’羟基;(3)由脱磷酸连接体取代磷酸基团;(4)修饰或取代天然生成的碱基;(5)取代或修饰核糖-磷酸酯骨架;(6)修饰寡核苷酸的3’端或5’端(例如,除去,修饰或取代末端磷酸酯基团或基团的结合);以及(7)修饰糖类。其他可能的向导RNA修饰包括修饰或取代尿嘧啶或聚-尿嘧啶束(poly-uracil tract)。参见,例如,WO 2015/048577和US 2016/0237455,其每一个的全部内容通过引用并入本文,用于所有目的。类似的修饰可作用于Cas编码核酸,例如,Cas mRNA。
作为一个实例,向导RNA的5’或3’端的核苷酸可包括硫代磷酸键(例如,碱基可具有作为硫代磷酸基团的修饰的磷酸酯基团)。例如,向导RNA可包括位于向导RNA的5’端或3’端的2个,3个或4个末端核苷酸之间的硫代磷酸键。作为另一实例,位于向导RNA的5’端和/或3’端的核苷酸可具有2’-O-甲基修饰。例如,向导RNA可包括位于向导RNA的5’端和/或3’端(例如,5’端)的2个,3个或4个末端核苷酸的2’-O-甲基修饰。参见,例如,WO 2017/173054A1和Finn等人,(2018)Cell Reports 22:1-9,其每一个的全部内容通过引用并入本文,用于所有目的。在一个特定的实例中,向导RNA包括位于前三个5’和3’末端RNA残基处的2’-O甲基类似物和3’-硫代磷酸核苷酸间键合。在另一特定实例中,向导RNA被修饰为由2’-O-甲基类似物取代不与Cas9蛋白质发生相互作用的所有2’OH基团,并且,与Cas9具有最小相互作用的向导RNA的尾部区域被5’和3’硫代磷酸核苷酸间键修饰。参见,例如,Yin等人,(2017)Nat.Biotech.35(12):1179-1187,其全部内容通过引用并入本文,用于所有目的。本领域提供修饰的向导RNA的其他实例,例如,WO2018/107028A1,其全部内容通过引用并入本文,用于所有目的。
本文提供任何形式的向导RNA。例如,以RNA的形式提供gRNA,作为两个分子(不同的crRNA和tracrRNA)或作为一个分子(sgRNA),并且任选地,提供与Cas蛋白质的复合物形式的RNA。gRNA还可以编码gRNA的DNA的形式提供。编码gRNA的DNA可编码单个RNA分子(sgRNA)或不同的RNA分子(例如,不同的crRNA和tracrRNA)。在后一种情况下,编码gRNA的DNA可作为DNA分子或作为分别编码crRNA和tracrRNA的不同的DNA分子提供。
当以DNA的形式提供gRNA时,gRNA可在细胞中瞬时表达,条件性表达或组成性表达。编码gRNA的DNA可被稳定地整合至细胞的基因组中并且可操作地连接至在细胞中具有活性的启动子。可选地,编码gRNA的DNA可以可操作地连接至表达构建体中的启动子。例如,编码gRNA的DNA可位于包含异源核酸的载体中,例如,编码Cas蛋白质的核酸。可选地,编码gRNA的DNA可以位于载体中或质粒中,所述载体或质粒从包含编码Cas蛋白质的核酸的载体中分离出来。可用于这种表达构建体的启动子包括例如在下列细胞中的一种或多种中具有活性的启动子:真核细胞、人细胞、非人类细胞、哺乳动物细胞、非人类哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导多能干(iPS)细胞或单细胞期胚胎。这些启动子可以是例如,条件性启动子,可诱导启动子,组成性启动子或组织特异性启动子。这些启动子还可以是例如,双向启动子。合适的启动子的特定实例包括RNA聚合酶III启动子,例如,人U6启动子,大鼠U6聚合酶III启动子或小鼠U6聚合酶III启动子。
可选地,gRNA可通过各种不同的其他方法制备。例如,gRNA可使用例如T7 RNA聚合酶通过体外转录进行制备(参见,例如,WO 2014/089290和WO 2014/065596,其每一个的全部内容通过引用并入本文,用于所有目的)。向导RNA还可以是通过化学合成制备的通过合成方法产生的分子。
向导RNA识别序列和向导RNA靶向序列。术语“向导RNA识别序列”包括存在于如下目标DNA中的核酸序列,只要存在足够的结合条件所述目标DNA将会结合gRNA的DNA靶向片段。本文使用的术语向导RNA识别序列包含目标双链DNA的两个链(即,与向导RNA杂交的互补链上的序列以及与前间区序列邻近基序(PAM)邻近的非互补链上的对应序列)。本文使用的术语“向导RNA靶向序列”具体地是指与PAM邻近的非互补链上的序列(即,PAM的上游或5’)。也就是说,向导RNA靶向序列是指与在互补链上与向导RNA杂交的序列对应的非互补链上的序列。向导RNA靶向序列等同于向导RNA的DNA靶向片段,但是由胸腺嘧啶替代了尿嘧啶。作为一个实例,Cas9酶的向导RNA靶向序列是指在与5’-NGG-3’PAM邻近的非互补链上的序列。向导RNA识别序列包括设计为与向导RNA具有互补性的序列,其中,向导RNA识别序列的互补链和向导RNA的DNA靶向片段之间的杂交促进CRISPR复合物的形成。只要具有足以导致杂交并促进CRISPR复合物的形成的互补性,就不必要求具有完全互补。向导RNA识别序列或向导RNA靶向序列还包括Cas蛋白质的裂解位点,其在下文中详细描述。向导RNA识别序列或向导RNA靶向序列可包含任何多核苷酸,其可位于例如细胞的细胞核内或细胞质内或位于细胞的细胞器(例如线粒体或叶绿体)内。
目标DNA内的向导RNA识别序列可被Cas蛋白质或gRNA靶定(即,与Cas蛋白质或gRNA结合,或与Cas蛋白质或gRNA杂交或与Cas蛋白质或gRNA互补)。合适的DNA/RNA结合条件包括通常存在于细胞中的生理条件。本领域已知其他合适的DNA/RNA结合条件(例如,无细胞系统中的条件)(参见,例如,Molecular Cloning:A Laboratory Manual,3rd Ed.(Sambrook等人,Harbor Laboratory Press 2001),其全部内容通过引用并入本文,用于所有目的)。与Cas蛋白或gRNA互补并杂交的目标DNA的链可被称为“互补链”,并且与“互补链”互补的目标DNA的链(因此,其不与Cas蛋白质或gRNA互补)可被称为“非互补链”或“模板链”。
Cas蛋白质可在待与gRNA的DNA靶向片段结合的目标DNA中存在的核酸序列的内部或外部的位点处裂解核酸。“裂解位点”包括Cas蛋白质产生单链断裂或双链断裂的核酸位置。例如,CRISPR复合物(包含与向导RNA识别序列的互补链杂交并与Cas蛋白复合的gRNA)的形成可导致在待与gRNA的DNA靶向片段结合的目标DNA中存在的核酸序列中或附近(例如,距离所述核酸序列的1个,2个,3个,4个,5个,6个,7个,8个,9个,10个,20个,50个或更多个碱基对内)发生一个链的断裂或两个链的断裂。如果裂解位点位于待与gRNA的DNA靶向片段结合的核酸序列外部,那么,裂解位点仍被认为位于“向导RNA识别序列”内或“向导RNA靶向序列”内。裂解位点可仅位于核酸的一个链上或位于核酸的两个链上。裂解位点可位于核酸的两个链上的相同位置(产生平端)或位于每个链上的不同位点(产生交错端(即,悬挂))。例如,可通过使用两个Cas蛋白质产生交错端,每个Cas蛋白质在不同链上的不同裂解位点产生单个链断裂,从而产生双链断裂。例如,第一切口酶可在双链DNA(dsDNA)的第一链上产生单链断裂并且第二切口酶可在dsDNA的第二链上产生单链断裂,这就产生了悬挂序列。在一些情况下,第一链上的切口酶的向导RNA识别序列或向导RNA靶向序列与第二链上的切口酶的向导RNA识别序列或向导RNA靶向序列分隔开至少2个碱基对,至少3个碱基对,至少4个碱基对,至少5个碱基对,至少6个碱基对,至少7个碱基对,至少8个碱基对,至少9个碱基对,至少10个碱基对,至少15个碱基对,至少20个碱基对,至少25个碱基对,至少30个碱基对,至少40个碱基对,至少50个碱基对,至少75个碱基对,至少100个碱基对,至少250个碱基对,至少500个碱基对,或至少1,000个碱基对。
Cas蛋白质对目标DNA的位点特异性结合和/或裂解可发生在不同的位置,这由(i)gRNA和目标DNA之间的碱基对互补性和(ii)目标DNA中的被称为前间区序列邻近基序(PAM)的短基序确定。PAM可位于与向导RNA杂交的链相对的非互补链上的向导RNA靶向序列的侧面。任选地,向导RNA靶向序列的侧面可具有PAM的3’端。可选地,向导RNA靶向序列的侧面可具有PAM的5’端。例如,Cas蛋白质的裂解位点可位于PAM序列的上游或下游约1个碱基对至约10个碱基对或约2个碱基对至约5碱基对(例如,3个碱基对)的位置。在一些情况下(例如,当使用来自化脓性链球菌的Cas9或使用紧密相关的Cas9时),非互补链的PAM序列可以是5’-N1GG-3’,其中N1是任何DNA核苷酸并且就是目标DNA的非互补链的向导RNA识别序列的3’(即,就是向导RNA靶向序列的3’)。这样,互补链的PAM序列可以是5’-CCN2-3’,其中,N2是任何DNA核苷酸并且就是目标DNA的互补链的向导RNA识别序列的5’。在一些这样的情况下,N1和N2可以是互补的并且N1-N2碱基对可以是任何碱基对(例如,N1=C并且N2=G,N1=G并且N2=C;N1=A并且N2=T;或N1=T,并且N2=A)。在Cas9来自金黄色葡萄糖球菌的情况下,PAM可以是NNGRRT或NNGRR,其中,N可以是A,G,C,或T,并且R可以是G或A。在Cas9来自空肠弯曲菌的情况下,PAM可以是例如NNNNACAC或NNNNRYAC,其中,N可以是A,G,C,或T,并且R可以是G或A。在一些情况(例如,对于FnCpf1而言)下,PAM序列可以是5’端的上游并且具有序列5’-TTN-3’。
除了PAM序列之外,下文还提供向导RNA靶向序列的实例。例如,向导RNA靶向序列可以是就在由Cas9蛋白质识别的NGG基序之前的20个核苷酸的DNA序列。这些向导RNA靶向序列连同PAM序列的实例是GN19NGG(SEQ ID NO:11)或N20NGG(SEQ ID NO:12)。参见,例如,WO2014/165825,其全部内容通过引用并入本文,用于所有目的。5’端的鸟嘌呤可通过RNA聚合酶促进细胞内的转录。向导RNA靶向序列连同PAM序列的其他实例可包括5’端的两个鸟嘌呤核苷酸(例如,GGN20NGG,SEQ ID NO:13)以通过T7聚合酶促进体外有效转录。参见,例如,WO2014/065596,其全部内容通过引用并入本文,用于所有目的。其他向导RNA靶向序列连同PAM序列的长度可为SEQ ID NO:11-13的4个核苷酸至22个核苷酸,其包括5’G或GG以及3’GG或NGG。其他向导RNA靶向序列的长度为SEQ ID NO:11-13的14个核苷酸至20个核苷酸。
向导RNA识别序列或向导RNA靶向序列可以是细胞内源的或外源性的任何核酸序列。向导RNA识别序列或向导RNA靶向序列可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如,调节性序列)或可包括这两者。
(3)靶定人TTR基因的外源供体核酸
本文公开的方法和组合物可在核酸酶试剂裂解人源化TTR基因座之后利用外源供体核酸修饰人源化TTR基因座。在这些方法中,核酸酶试剂裂解人源化TTR基因座以产生单链断裂(切口)或双链断裂,并且外源供体核酸通过非同源末端连接(NHEJ)介导的连接或通过同源定向修复事件重组人源化TTR基因座。任选地,采用外源供体核酸进行修复除去或干扰核酸酶靶向序列,使得已被靶定的等位基因无法被核酸酶再次靶定。
外源供体核酸可包含脱氧核糖核酸(DNA)或核糖核酸(RNA),它们可以是单链的或双链的,并且它们可以是线性形式或环状形式。例如,外源供体核酸可以是单链寡脱氧核苷酸(ssODN)。参见,例如,Yoshimi等人,(2016)Nat.Commun.7:10431,其全部内容通过引用并入本文,用于所有目的。示例性的外源供体核酸的长度为约50个核苷酸至约5kb,约50个核苷酸至约3kb,或约50个核苷酸至约1,000个核苷酸。其他示例性的外源供体核酸的长度为约40个核苷酸至约200个核苷酸。例如,外源供体核酸的长度可以为约50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-110个核苷酸,110-120个核苷酸,120-130个核苷酸,130-140个核苷酸,140-150个核苷酸,150-160个核苷酸,160-170个核苷酸,170-180个核苷酸,180-190个核苷酸,或190-200个核苷酸。可选地,外源供体核酸的长度可以为约50-100个核苷酸,100-200个核苷酸,200-300个核苷酸,300-400个核苷酸,400-500个核苷酸,500-600个核苷酸,600-700个核苷酸,700-800个核苷酸,800-900个核苷酸,或900-1000个核苷酸。可选地,外源供体核酸的长度可以为约1-1.5kb,1.5-2kb,2-2.5kb,2.5-3kb,3-3.5kb,3.5-4kb,4-4.5kb,或4.5-5kb。可选地,外源供体核酸的长度可以为例如不超过5kb,4.5kb,4kb,3.5kb,3kb,2.5kb,2kb,1.5kb,1kb,900个核苷酸,800个核苷酸,700个核苷酸,600个核苷酸,500个核苷酸,400个核苷酸,300个核苷酸,200个核苷酸,100个核苷酸,或50个核苷酸。外源供体核酸(例如,靶向载体)还可以更长。
在一个实例中,外源供体核酸是长度为约80个核苷酸至约200个核苷酸的ssODN。在另一实例中,外源供体核酸是长度为约80个核苷酸至约3kb的ssODN。这样的ssODN可具有同源臂,例如,其长度为约40个核苷酸至约60个核苷酸。这样的ssODN还可具有例如长度为约30个核苷酸至100个核苷酸的同源臂。所述同源臂可以是对称的(例如,每个同源臂的长度均为40个核苷酸或60个核苷酸)或所述同源臂可以是非对称的(例如,一个同源臂的长度为36个核苷酸,另一同源臂的长度为91个核苷酸)。
外源供体核酸可包括提供额外的理想特性(例如,改良的或调节的稳定性,采用荧光标记跟踪或检测,用于蛋白质或蛋白质复合物的结合位点,等等)的修饰或序列。外源供体核酸可包含一个或多个荧光标记,纯化标签,表位标签或其组合。例如,外源供体核酸可包含一个或多个荧光标记(例如,荧光蛋白或其他荧光团或染料),例如,至少一个荧光标记,至少2个荧光标记,至少3个荧光标记,至少4个荧光标记或至少5个荧光标记。示例性的荧光标记包括诸如荧光素(例如,6-羧基荧光素(6-FAM))之类的荧光团,德克萨斯红,HEX,Cy3,Cy5,Cy5.5,Pacific Blue,5-(和6-)-羧基四甲基罗丹明(TAMRA)和Cy7。用于标记寡核苷酸的多种荧光染料是商业上可获得的(例如,可获自Integrated DNA Technologies)。这些荧光标记(例如,内部荧光标记)可用于例如检测外源供体核酸,所述外源供体核酸已直接整合至具有与外源供体核酸的末端相容的凸出端的裂解的目标核酸。标记或标签可位于外源供体核酸内的5’端,3’端或位于外源供体核酸内部。例如,外源供体核酸可以在5’端与来自Integrated DNA Technologies的IR700荧光团(
Figure BDA0002428169960000701
700)偶联。
外源供体核酸可还包含核酸插入体,该核酸插入体包括待整合至人源化TTR基因座的DNA片段。核酸插入体在人源化TTR基因座处的整合可导致将目标核酸序列添加至人源化TTR基因座,删除人源化TTR基因座处的目标核酸序列或取代人源化TTR基因座处的目标核酸序列(即,删除和插入)。一些外源供体核酸被设计为在人源化TTR基因座处插入核酸插入体而不会在人源化TTR基因座处产生任何相应的删除。其他外源供体核酸被设计为删除人源化TTR基因座处的目标核酸序列而不会产生核酸插入体的任何相应插入。其他外源供体核酸被设计为删除人源化TTR基因座处的目标核酸序列并且使用核酸插入体将其取代。
在人源化TTR基因座处被删除和/或取代的核酸插入体或相应核酸可具有各种不同的长度。人源化TTR基因座处的被删除和/或取代的示例性的核酸插入体或相应的核酸的长度为约1个核苷酸至约5kb或约1个核苷酸至约1,000个核苷酸。例如,在人源化TTR基因座处被删除和/或取代的核酸插入体或相应的核酸的长度可以为约1-10个核苷酸,10-20个核苷酸,20-30个核苷酸,30-40个核苷酸,40-50个核苷酸,50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-110个核苷酸,110-120个核苷酸,120-130个核苷酸,130-140个核苷酸,140-150个核苷酸,150-160个核苷酸,160-170个核苷酸,170-180个核苷酸,180-190个核苷酸,或190-120个核苷酸。同样,人源化TTR基因座处的被删除和/或取代的核酸插入体或相应核酸的长度可以为1-100个核苷酸,100-200个核苷酸,200-300个核苷酸,300-400个核苷酸,400-500个核苷酸,500-600个核苷酸,600-700个核苷酸,700-800个核苷酸,800-900个核苷酸,或900-1000个核苷酸。同样,在人源化TTR基因座处被删除和/或取代的核酸插入体或相应的核酸的长度可以为约1-1.5kb,1.5-2kb,2-2.5kb,2.5-3kb,3-3.5kb,3.5-4kb,4-4.5kb,或4.5-5kb,或者更长。
核酸插入体可包含与取代靶定的所有序列或部分序列同源或直系同源的序列。例如,核酸插入体可包含如下序列:该序列与人源化TTR基因座处取代靶定的序列相比包含一个或多个点突变(例如,1个,2个,3个,4个,5个或更多)。任选地,这些点突变可在编码的多肽中产生保守氨基酸取代(例如,谷氨酸[Glu,E]取代天冬氨酸[Asp,D])。
用于非同源末端连接介导的插入的供体核酸。一些外源供体核酸在5’端和/或3’端具有短单链区域,其与在人源化TTR基因座处由核酸酶介导的裂解产生的一个或多个悬挂互补。这些悬挂也可被称为5’和3’同源臂。例如,一些外源供体核酸在5’端和/或3’端具有短单链区域,其与在人源化TTR基因座处的由5’和/或3’目标序列的核酸酶介导的裂解产生的一个或多个悬挂互补。一些这样的外源供体核酸具有仅位于5’端或仅位于3‘端的互补区域。例如,一些这样的外源供体核酸具有仅位于5’端与人源化TTR基因座处的5’目标序列产生的悬挂互补的互补区域或具有仅位于3’端与人源化TTR基因座处的3’目标序列产生的悬挂互补的互补区域。其他这样的外源供体核酸在5’端和3’端均具有互补区域。例如,其他这样的外源供体核酸具有位于5’和3’这两端的分别与人源化TTR基因座处的核酸酶介导的裂解产生的第一和第二悬挂互补的互补区域。例如,如果外源供体核酸是双链的,那么单链互补区域可从供体核酸的顶部链的5’端和供体核酸的底部链的5’端延伸出来,从而在每一端产生5’悬挂。可选地,单链互补区域可从供体核酸的顶部链的3’端和模板的底部链的3’端延伸出来,从而产生3’悬挂。
互补区域可具有任何足以促进外源供体核酸和目标核酸之间的连接的长度。示例性的互补区域的长度为约1个核苷酸至约5个核苷酸,约1个核苷酸至约25个核苷酸,或约5个核苷酸至约150个核苷酸。例如,互补区域的长度可以为至少约1个核苷酸,2个核苷酸,3个核苷酸,4个核苷酸,5个核苷酸,6个核苷酸,7个核苷酸,8个核苷酸,9个核苷酸,10个核苷酸,11个核苷酸,12个核苷酸,13个核苷酸,14个核苷酸,15个核苷酸,16个核苷酸,17个核苷酸,18个核苷酸,19个核苷酸,20个核苷酸,21个核苷酸,22个核苷酸,23个核苷酸,24个核苷酸,或25个核苷酸。可选地,互补区域的长度可以为约5-10个核苷酸,10-20个核苷酸,20-30个核苷酸,30-40个核苷酸,40-50个核苷酸,50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-110个核苷酸,110-120个核苷酸,120-130个核苷酸,130-140个核苷酸,或140-150个核苷酸,或者更长。
这些互补区域可以与两对切口酶产生的悬挂互补。带有交错端的两个双链断裂可通过使用产生第一双链断裂的裂解DNA的相对链的第一和第二切口酶以及产生第二双链断裂的裂解DNA的相对链的第三和第四切口酶产生。例如,Cas蛋白质可用于在与第一、第二、第三和第四向导RNA对应的第一、第二、第三和第四向导RNA靶向序列上产生切口。所述第一和第二向导RNA靶向序列可位于产生第一裂解位点的位置,这样由第一和第二切口酶在DNA的第一和第二链上产生的切口产生了双链断裂(即,第一裂解位点包含位于第一和第二向导RNA靶向序列内的切口)。类似地,第三和第四向导RNA靶向序列可位于产生第二裂解位点的位置,这样,由第三和第四切口酶在DNA的第一和第二链上产生的切口产生了双链断裂(即,第二裂解位点包含位于第三和第四向导RNA靶向序列内的切口)。优选地,位于第一和第二向导RNA靶向序列和/或第三和第四向导RNA靶向序列内的切口可以是产生悬挂的偏置切口。偏置窗口可以是例如至少约5bp,10bp,20bp,30bp,40bp,50bp,60bp,70bp,80bp,90bp,100bp或更大。参见,Ran等人,(2013)Cell 154:1380-1389;Mali等人,(2013)Nat.Biotech.31:833-838;和Shen等人,(2014)Nat.Methods 11:399-404,其每一个的全部内容通过引用并入本文,用于所有目的。在这些情况下,双链外源供体核酸可使用如下单链互补区域设计,所述单链互补区域与由第一和第二向导RNA靶向序列内的切口产生的悬挂以及由第三和第四向导RNA靶向序列内的切口产生的悬挂互补。这样的外源供体核酸随后可通过非同源末端连接介导的连接插入。
通过同源定向修复进行插入的供体核酸。一些外源供体核酸包含同源臂。如果外源供体核酸还包含核酸插入体,那么所述同源臂可位于所述核酸插入体的侧面。为了便于参考,本文中的同源臂被称为5’和3’(即,上游和下游)同源臂。该术语涉及同源臂与外源供体核酸内的核酸插入体的相对位置。5’和3’同源臂对应于人源化TTR基因座内的区域,该区域在本文中被分别称为“5’靶向序列”和“3’靶向序列”。
当两个区域彼此之间共享足够水平的序列一致性时,同源臂和靶向序列彼此之间“对应”以作为同源重组反应的底物。术语“同源”包括与对应序列等同或与对应序列共享序列一致性的DNA序列。给定的目标序列和在外源供体核酸中发现的对应的同源臂之间的序列一致性可以是允许同源重组发生的任何程度的序列一致性。例如,外源供体核酸(或其片段)的同源臂和目标序列(或其片段)共享的序列一致性的量可以是至少50%,55%,60%,65%,70%,75%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%序列一致性,从而所述序列经历同源重组。而且,同源臂和对应的目标序列之间的具有同源性的对应区域可具有足以促进同源重组的任何长度。示例性的同源臂的长度为约25个核苷酸至约2.5kb,约25个核苷酸至约1.5kb或约25个核苷酸至约500个核苷酸。例如,给定的同源臂(或同源臂中的每一个)和/或对应的目标序列可包含长度为约25-30个核苷酸,30-40个核苷酸,40-50个核苷酸,50-60个核苷酸,60-70个核苷酸,70-80个核苷酸,80-90个核苷酸,90-100个核苷酸,100-150个核苷酸,150-200个核苷酸,200-250个核苷酸,250-300个核苷酸,300-350个核苷酸,350-400个核苷酸,400-450个核苷酸,或450-500个核苷酸的具有同源性的对应区域,这样,同源臂具有足以与目标核酸内的对应的目标序列进行同源重组的同源性。可选地,给定的同源臂(或每个同源臂)和/或对应的目标序列可包含长度为约0.5kb至约1kb,约1kb至约1.5kb,约1.5kb至约2kb,或约2kb至约2.5kb的同源性对应区域。例如,同源臂中的每一个的长度可为约750个核苷酸。同源臂可以是对称的(每个同源臂具有大约相同的长度)或可以是非对称的(一个同源臂比另一个长)。
当核酸酶试剂与外源供体核酸联合使用时,5’和3’目标序列优选地位于足够靠近核酸酶裂解位点的位置(例如,足够靠近核酸酶靶向序列的位置之内),从而促进核酸酶裂解位点处单链断裂(切口)或双链断裂之后目标序列和同源臂之间发生同源重组事件。术语“核酸酶裂解位点”包括由核酸酶试剂产生切口或双链断裂的DNA序列(例如,与向导RNA复合的Cas9蛋白)。目标基因座内的与外源供体核酸的5’和3’同源臂对应的目标序列位于“足够靠近核酸酶裂解位点的位置”,只要该距离能够促进核酸酶裂解位点处单链断裂或双链断裂之后5’和3’目标序列和同源臂之间发生同源重组事件。因此,对应于外源供体核酸的5’和/或3’同源臂的目标序列可以是例如位于给定的核酸酶裂解位点的至少1个核苷酸之内,或给定的核酸酶裂解位点的至少10个核苷酸至约1,000个核苷酸之内。作为实例,核酸酶裂解位点可以就在目标序列中的至少一个或两个的附近。
对应于外源供体核酸的同源臂的目标序列和核酸酶裂解位点之间的空间关系可发生改变。例如,目标序列可位于核酸酶裂解位点的5’端,目标序列可位于核酸酶裂解位点的3’端,或目标序列可位于核酸酶裂解位点的侧面。
(4)其他人-TTR-靶向试剂
还可使用本文公开的非人类动物评价任何其他已知的或假定的人-TTR-靶向试剂的活性。类似地,可使用本文公开非人类动物筛选具有人-TTR-靶向活性的任何其他分子。
其他人-TTR-靶向试剂的实例包括反义寡核苷酸(例如,siRNA或shRNA),其通过RNA干扰(RNAi)发挥作用。反义寡核苷酸(ASO)或反义RNA是设计为通过选择性结合至编码靶定蛋白质的RNA防止靶定蛋白质的表达从而防止发生翻译的短的合成的核苷酸链。这些化合物以高亲和性和选择性通过熟知的沃森-克里克碱基配对(Watson-Crick basepairing)(杂交)与RNA结合。RNA干扰(RNAi)是用于控制基因表达的内源细胞机制,其中,结合至RNA诱导的沉默复合物(RISC)的小干扰RNA(siRNA)介导目标信使RNA(mRNA)的裂解。人-TTR-靶向反义寡核苷酸的实例是本领域已知的。参见,例如,Ackermann等人,(2012)Amyloid Suppl 1:43-44and Coelho等人,(2013)N.Engl.J.Med.369(9):819-829,其每一个的全部内容通过引用并入本文,用于所有目的。
其他人-TTR-靶向试剂包括设计为特异性结合人TTR表位的抗体或抗原结合蛋白。
其他人-TTR-靶向试剂包括小分子试剂。这样的小分子试剂的一个实例是tafamidis,其通过动力学稳定转甲状腺素蛋白(TTR)的正确折叠的四聚形式而发挥作用。参见,例如,Hammarstrom等人,(2003)Science 299:713-716,其全部内容通过引用并入本文,用于所有目的。
D.向非人类动物或非人类动物细胞给药人-TTR-靶向试剂
本文公开的方法包括向非人类动物或非人类动物细胞引入各种不同的分子(例如,人-TTR-靶向试剂,例如,治疗分子或复合物),其包括核酸,蛋白质,核酸-蛋白质复合物或蛋白质复合物。“引入”包括以使分子接近细胞的内部或接近非人类动物内的细胞的内部的方式向细胞或非人类动物呈递所述分子(例如,核酸或蛋白质)。所述引入可通过任何方式完成并且上述成分中的两个或多个(例如,上述成分中的两个或所有成分)可同时或按顺序以任何组合引入至细胞或非人类动物。例如,可在引入向导RNA之前将Cas蛋白质引入细胞或非人类动物,或者可在引入向导RNA之后引入Cas蛋白质。作为另一实例,可在引入Cas蛋白质和向导RNA之前引入外源供体核酸,或可在引入Cas蛋白质和向导RNA之后引入外源供体核酸(例如,可在引入Cas蛋白质和向导RNA之前或之后的约1小时,2小时,3小时,4小时,8小时,12小时,24小时,36小时,48小时或72小时给药外源供体核酸)。参见,例如,US2015/0240263和US 2015/0110762,其每一个的全部内容通过引用并入本文,用于所有目的。此外,上述成分中的两种或多种可通过相同的递送方法或不同的递送方法引入至细胞或非人类动物。类似地,上述成分中的两种或多种可通过相同的给药途径或不同的给药途径引入至非人类动物。
在一些方法中,CRISPR/Cas系统的各个成分被引入至非人类动物或细胞。向导RNA可以RNA的形式(例如,体外转录的RNA)或编码向导RNA的DNA的形式引入至非人类动物或细胞中。当以DNA的形式引入向导RNA时,编码向导RNA的DNA可以可操作地连接至在非人类动物中的细胞中具有活性的启动子。例如,向导RNA可通过AAV递送并在U6启动子下体内表达。这样的DNA可以位于一个或多个表达构建体中。例如,这些表达构建体可以是单个核酸分子的成分。可选地,它们可以任何组合被分开在两个或多个核酸分子之间(即,编码一个或多个CRISPR RNA的DNA和编码一个或多个tracrRNA的DNA可以是不同的核酸分子的成分)。
同样,可以以任何形式提供Cas蛋白质。例如,Cas蛋白质可以蛋白质的形式提供,例如,与gRNA复合的Cas蛋白质。可选地,Cas蛋白质可以编码Cas蛋白质的核酸的形式提供,例如,RNA(例如,信使RNA(mRNA))或DNA。任选地,编码Cas蛋白质的核酸可以是被优化为在特定细胞或生物体内有效翻译为蛋白质的密码子。例如,编码Cas蛋白质的核酸可被修饰为取代在哺乳动物细胞,啮齿动物细胞,小鼠细胞,大鼠细胞或任何其他目标宿主细胞中相对于天然生成的多核苷酸序列具有较高的使用频率的密码子。当编码Cas蛋白质的核酸被引入至非人类动物中时,Cas蛋白质可在非人类动物的细胞中被瞬时、条件性或组成性表达。
编码Cas蛋白质或向导RNA的核酸可以可操作地连接至表达构建体中的启动子。表达构建体包括任何能够定向目标基因或其他目标核酸序列(例如,Cas基因)的表达的核酸构建体并且所述核酸构建体可将这样的目标核酸序列转移至目标细胞。例如,编码Cas蛋白质的核酸可位于包含编码一种或多种gRNA的DNA的载体中。可选地,编码Cas蛋白质的核酸可位于与包含编码一种或多种gRNA的DNA的载体不同的载体或质粒中。可在表达构建体中使用的合适的启动子包括例如在下列细胞中的一种或多种中具有活性的启动子:真核细胞,人细胞,非人类细胞,哺乳动物细胞,非人类哺乳动物细胞,啮齿动物细胞,小鼠细胞,大鼠细胞,仓鼠细胞,兔细胞,多能细胞,胚胎干(ES)细胞,成体干细胞,发育受限祖细胞,诱导多能性干(iPS)细胞或单细胞期胚胎。这些启动子可以是例如条件性启动子,可诱导启动子,组成性启动子或组织特异性启动子。任选地,所述启动子可以是驱动Cas蛋白质在一个方向上表达并且驱动向导RNA在另一方向上表达的双向启动子。这些双向启动子可由如下成分构成:(1)包含3个外部控制元件的完整传统单向Pol III启动子:远端序列元件(DSE),近端序列元件(PSE)和TATA盒;和(2)包括在反方向上融合至DSE的5’末端的PSE和TATA盒的第二碱性Pol III启动子。例如,在H1启动子中,DSE接近PSE和TATA盒并且所述启动子可通过产生杂交启动子在双向上产生,在所述杂交启动子中,反向转录通过添加源自U6启动子的PSE和TATA盒来控制。参见,例如,US2016/0074535,其全部内容通过引用并入本文,用于所有目的。使用双向启动子表达编码Cas蛋白质和向导RNA的基因同时允许产生紧凑表达盒以促进递送。
可在包含载体的组合物中提供引入至非人类动物或细胞中的分子(例如,Cas蛋白质或向导RNA),所述载体提高了引入的分子的稳定性(例如,延长了其在给定的存储条件(例如,-20℃,4℃或室温)下的存储时间段,在该时间段内降解产物仍然低于阈值,例如,低于起始核酸或蛋白质的重量的0.5%;或者提高了体内稳定性)。这种载体的非限定性实例包括聚(乳酸)(PLA)微球,聚(D,L-乳酸-co-羟基乙酸)(PLGA)微球,脂质体,胶束,反相胶束,脂质卷(lipid cochleate)和脂质微管。
本文提供各种不同的方法和组合物将核酸或蛋白质引入细胞或非人类动物。将核酸引入各种不同的细胞类型中的方法是本领域已知的并且包括例如,稳定转染法,瞬时转染法和病毒介导的方法。
转染规程以及将核酸序列引入细胞中的操作规程可能各不相同。非限定性的转染方法包括使用脂质体,纳米颗粒,磷酸钙(Graham等人,(1973)Virology 52(2):456–67,Bacchetti等人,(1977)Proc.Natl.Acad.Sci.USA 74(4):1590–4,以及Kriegler,M(1991).Transfer and Expression:A Laboratory Manual.New York:W.H.Freeman andCompany.pp.96–97),树枝状聚合物,或诸如DEAE-葡聚糖或聚乙烯亚胺之类的阳离子聚合物的基于化学的转染方法。非化学方法包括电穿孔,Sono-穿孔,和光转染。基于颗粒的转染包括使用基因枪或磁性辅助转染(Bertram(2006)Current PharmaceuticalBiotechnology 7,277–28)。病毒方法也可用于转染。
将核酸或蛋白质引入细胞内还可以由电穿孔介导,由胞质内注射介导,由病毒感染介导,由腺病毒介导,由腺相关病毒介导,由慢病毒介导,由逆转录病毒介导,由转染介导,由脂质介导的转染介导,或由核转染(nucleofection)介导。核转染是一种改进的电穿孔技术,其不仅能够将核酸底物递送至细胞质而且还可以通过核膜将核酸底物递送至细胞核内。此外,在本文公开的方法中使用核转染相对于常规电穿孔需要少得多的细胞(例如,相对于常规电穿孔需要7百万个细胞,其仅需要约2百万个细胞)。在一个实例中,核转染使用
Figure BDA0002428169960000781
NUCLEOFECTORTM系统进行。
将核酸或蛋白质引入细胞(例如,受精卵)内还可通过显微注射完成。在受精卵(即,单细胞期胚胎)中,显微注射可进入母本和/或父本原核中或进入细胞质内。如果显微注射只进入一个原核中,父本原核由于其具有较大的尺寸而是优选的。mRNA的显微注射优选地进入细胞质内(例如,将mRNA直接递送至翻译装置),而Cas蛋白质或编码Cas蛋白质或编码RNA的多核苷酸的显微注射优选地进入细胞核/原核内。可选地,显微注射可通过注射进入细胞核/原核和细胞质这两者来实施:首先可将针头引入细胞核/原核内并注射第一量,并且在将所述针头从单细胞期胚胎中移出时,向细胞质中注射第二量。如果将Cas蛋白质注射至细胞质内,那么Cas蛋白质优选地包含细胞核定位信号以确保递送至细胞核/原核。实施显微注射的方法是本领域熟知的。参见,例如,Nagy等人,(Nagy A,GertsensteinM,Vintersten K,Behringer R.,2003,Manipulating the Mouse Embryo.Cold SpringHarbor,New York:Cold Spring Harbor Laboratory Press);还可参见Meyer等人,(2010)Proc.Natl.Acad.Sci.USA 107:15022-15026以及Meyer等人,(2012)Proc.Natl.Acad.Sci.USA 109:9354-9359。
用于将核酸或蛋白质引入细胞内或非人类动物体内的其他方法可包括例如,载体递送,颗粒介导的递送,核外体介导的递送,脂质纳米颗粒介导的递送,细胞渗透肽介导的递送,或可植入设备介导的递送。作为特定实例,可将核酸或蛋白质引入至诸如聚(乳酸)(PLA)微球,聚(D,L-乳酸-co-羟基乙酸)(PLGA)微球,脂质体,胶束,反相胶束,脂质卷(lipid cochleate)或脂质微管之类的载体中的细胞或非人类动物。递送至非人类动物的一些特定实例包括流体力学递送,病毒介导的递送(例如,腺相关病毒(AAV)介导的递送)和脂质纳米颗粒介导的递送。
将核酸和蛋白质引入细胞或非人类动物还可通过流体力学递送(HDD)完成。流体力学递送作为一种体内递送细胞内DNA的方法而出现。对于将基因递送至实质细胞而言,只需要将必需DNA序列通过所选择的血管进行注射,这消除了与目前的病毒载体和合成载体相关的安全顾虑。当将DNA注射至血流中时,DNA能够到达接近血液的不同组织中的细胞。流体力学递送使用将大量溶液快速注射进入循环中的不可压缩的血液中产生的力以克服内皮的物理障碍和细胞膜的物理障碍,所述细胞膜防止较大的且细胞膜不可渗透的化合物进入实质细胞。除了DNA的递送之外,该方法可用于体内有效细胞内递送RNA,蛋白质和其他小化合物。参见,例如,Bonamassa等人,(2011)Pharm.Res.28(4):694-701,其全部内容通过引用并入本文,用于所有目的。
引入核酸还可通过病毒介导的递送(例如,AAV-介导的递送或慢病毒介导的递送)完成。其他示例性的病毒/病毒载体包括逆转录病毒,腺病毒,牛痘病毒,痘病毒以及单纯疱疹病毒。所述病毒可感染分化的细胞,未分化的细胞或分化的和未分化的细胞这两者。病毒可被整合至宿主基因组或可选地不整合至宿主基因组。这些病毒还可被工程化以具有降低的免疫性。病毒可以是能够进行复制的或可以是复制有缺陷的(例如,缺乏一种或多种多轮病毒复制和/或包装所必需的基因)。病毒可导致瞬时表达,长期表达(例如,至少1周,两周,1个月,2个月,或3个月),或者永久表达(例如,Cas9和/或gRNA的永久表达)。示例性的病毒滴度(例如,AAV滴度)包括1012个载体基因组/mL,1013个载体基因组/mL,1014个载体基因组/mL,1015个载体基因组/mL和1016个载体基因组/mL。
ssDNA AAV基因组由两个开放阅读框Rep和Cap构成,其侧面具有两个允许互补DNA链合成的倒置末端重复序列(inverted terminal repeat)。当构建AAV转移质粒时,转基因被放置于两个ITR之间并且Rep和Cap可以反式提供。除了Rep和Cap之外,AAV可能需要包含来自腺病毒的基因的辅助质粒。这些基因(E4,E2a和VA)介导AAV复制。例如,转移质粒,Rep/Cap和辅助质粒可被转染至含有腺病毒基因E1+的HEK293细胞中以产生感染的AAV颗粒。可选地,Rep,Cap和腺病毒辅助基因可被合并至单个质粒中。类似的包装细胞和包装方法可用于其他病毒,例如,逆转录病毒。
已识别了AAV的多种血清型。这些血清型的区别在于其所感染的细胞类型(即,其趋向性),这使得特定细胞类型被优先转导。CNS组织的血清型包括AAV1,AAV2,AAV4,AAV5,AAV8,和AAV9。心脏组织的血清型包括AAV1,AAV8和AAV9。肾脏组织的血清型包括AAV2。肺组织的血清型包括AAV4,AAV5,AAV6和AAV9。胰腺组织的血清型包括AAV8。光感受器细胞的血清型包括AAV2,AAV5和AAV8。视网膜色素上皮组织的血清型包括AAV1,AAV2,AAV4,AAV5,和AAV8。骨骼肌组织的血清型包括AAV1,AAV6,AAV7,AAV8,和AAV9。肝脏组织的血清型包括AAV7,AAV8和AAV9,尤其是AAV8。
趋向性还可通过假型进行细分,其是衣壳和来自不同病毒血清型的基因组的混合。例如,AAV2/5表示病毒包含包装在血清型5的衣壳中的血清2的基因组。假型病毒的使用可改善转导效率并且改变趋向性。源自不同血清型的杂交衣壳还可用于改变病毒趋向性。例如,AAV-DJ包含来自八个血清型的杂交衣壳并且在各种不同的细胞类型中在体内显示出较高的传染性。AAV-DJ8是显示出AAV-DJ性质但带有提高的脑部摄入的另一实例。AAV血清型还可通过突变进行修饰。AAV2的突变修饰的实例包括Y444F,Y500F,Y730F,和S662V。AAV3的突变修饰的实例包括Y705F,Y731F和T492V。AAV6的突变修饰的实例包括S663V和T492V。其他假型/修饰的AAV变体包括AAV2/1,AAV2/6,AAV2/7,AAV2/8,AAV2/9,AAV2.5,AAV8.2,和AAV/SASTG。
为了加快转基因表达,可使用自身互补的AAV(scAAV)变体。因为AAV依赖于细胞的DNA复制装置以合成AAV的单链DNA基因组的互补链,因此可延缓转基因表达。为了解决这种延缓,可使用包含能够在感染之后自发退火的互补序列的scAAV,从而消除进行宿主细胞DNA合成的需求。然而,还可使用单链AAV(ssAAV)载体。
为了增加包装容量,较长的转基因可在两个AAV转移质粒之间分离开,第一部分具有3’剪接供体并且第二部分具有5’剪接受体。在细胞的共感染之后,这些病毒形成串联体,被剪接在一起,并且可表达全长转基因。虽然这使得更长的转基因进行表达,但是表达不够有效。用于增加容量的类似的方法使用了同源重组。例如,可在两个转移质粒之间分开转基因,但是分开的转基因之间具有大量序列重叠,这样共表达诱导同源重组以及全长转基因的表达。
引入核酸和蛋白质还可通过脂质纳米颗粒(LNP)介导的递送来完成。例如,LNP介导的递送可用于递送Cas mRNA和向导RNA的组合或Cas蛋白质和向导RNA的组合。通过这些方法进行的递送导致Cas瞬时表达并且生物可降解的脂质改善了清除率,改善了耐受性并降低了免疫原性。脂质制剂可保护生物分子不发生降解,而同时改善它们的细胞摄入。脂质纳米颗粒是包含多种彼此通过分子间作用力而物理相关联的脂质分子的颗粒。这些脂质纳米颗粒包括微球(包括单层和多层囊泡,例如,脂质体),分散相乳液,胶束或悬浮液中的内部相。这些脂质纳米颗粒可用于包裹一种或多种核酸或蛋白质用于递送。包含阳离子脂质的制剂可用于递送诸如核酸之类的聚阴离子。可包括的其他脂质是中性脂质(即,不带电荷的或两性脂质),阴离子脂质,提高转染的辅助脂质以及增加纳米颗粒在体内的存在时间长度的隐形脂质。合适的阳离子脂质,中性脂质,阴离子脂质,辅助脂质和隐形脂质的实例可在WO2016/010840A1中找到,其全部内容通过引用并入本文,用于所有目的。示例性的脂质纳米颗粒可包含阳离子脂质和一种或多种其他成分。在一个实例中,其他成分可包含诸如胆固醇之类的辅助脂质。在另一实例中,其他成分可包含诸如胆固醇之类的辅助脂质和诸如DSPC之类的中性脂质。在另一实例中,其他成分可包含诸如胆固醇之类的辅助脂质,诸如DSPC之类的任选的中性脂质,以及诸如S010,S024,S027,S031,或S033之类的隐形脂质(stealth lipid)。
LNP可包含下列成分中的一种或多种或者全部:(i)用于包裹和胞内逃逸的脂质;(ii)用于稳定的中性脂质;(iii)用于稳定的辅助脂质;以及(iv)隐形脂质。参见,例如,Finn等人,(2018)Cell Reports 22:1-9和WO 2017/173054 A1,其每一个的全部内容通过引用并入本文,用于所有目的。在一些LNP中,载体(cargo)可包括向导RNA或编码向导RNA的核酸。在一些LNP中,载体(cargo)可包括编码Cas核酸酶的mRNA(例如,Cas9)和向导RNA或编码向导RNA的核酸。
用于包裹和胞内逃逸的脂质可以是阳离子脂质。脂质还可以是生物可降解的脂质,例如,生物可降解的可电离的脂质。合适的脂质的一个实例是脂质A或LP01,其是(9Z,12Z)-3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基十八烷-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基(9Z,12Z)-十八烷-9,12-二烯酸酯。参见,例如,Finn等人,(2018)Cell Reports 22:1-9和WO 2017/173054 A1,其每一个的全部内容通过引用并入本文,用于所有目的。合适的脂质的另一实例是脂质B,其是((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧))双(辛烷-8,1-二基)双(癸酸盐),也称为((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧))双(辛烷-8,1-二基)双(癸酸盐)。合适的脂质的另一实例是脂质C,其是2-((4-(((3-(二甲基氨基)丙氧基)羰基)氧)十六酰基)氧)丙烷-1,3-二基(9Z,9’Z,12Z,12’Z)-双(十八烷-9,12-二烯酸酯)。合适的脂质的另一实例是脂质D,其是3-(((3-(二甲基氨基)丙氧基)羰基)氧)-13-(辛酰基氧)十三烷基3-辛基十一酸酯。其他合适的脂质包括4-(N,N-二甲基胺基)丁酸-6,9,28,31-四烯-19-基4-(二甲基氨基)丁酸酯(heptatriaconta-6,9,28,31-tetraen-19-yl 4-(dimethylamino)butanoate,也称为Dlin-MC3-DMA(MC3))。
用于本文所述的LNP的一些这样的脂质是体内可生物降解的。例如,包含这种脂质的LNP包括其中至少75%的脂质在8小时内,10小时内,12小时内,24小时内或48小时内或者3天内,4天内,5天内,6天内,7天内或10天内从血浆中清除的那些LNP。作为另一实例,LNP中至少50%的脂质在8小时内,10小时内,12小时内,24小时内或48小时内或者3天内,4天内,5天内,6天内,7天内或10天内从血浆中清除。
这些脂质可以是基于其所在的培养基的pH可电离的。例如,在弱酸性培养基中,脂质可被质子化并且因此带有正电荷。相反,在弱碱性培养基中,例如,pH为约7.35的血液中,脂质可不被质子化,因此不带有电荷。在一些实施方式中,在pH为至少约9,9.5或10的条件下脂质可以被质子化。这样的脂质的带电荷的能力与其固有pKa相关。例如,脂质可独立地具有约5.8至约6.2的pKa。
中性脂质发挥稳定并改善LNP的加工的作用。合适的中性脂质的实例包括多种不同的中性的,不带电荷的或两性脂质。用于本文公开的内容中的中性磷脂的实例包括但不限于:5-十七烷基苯-1,3-二醇(间苯二酚),二棕榈酰基磷脂酰胆碱(DPPC),二硬脂酰基磷脂酰胆碱(DSPC),磷酰胆碱(DOPC),二肉豆蔻酰基磷脂酰胆碱(DMPC),磷脂酰胆碱(PLPC),1,2-二硬脂酰基-sn-甘油-3-磷酸胆碱(DAPC),磷脂酰乙醇胺(PE),卵黄磷脂酰胆碱(EPC),二月桂酰基磷脂酰胆碱(DLPC),二肉豆蔻酰基磷脂酰胆碱(DMPC),1-肉豆蔻酰基-2-棕榈酰基磷脂酰胆碱(MPPC),1-棕榈酰基-2-肉豆蔻酰基磷脂酰胆碱(PMPC),1-棕榈酰基-2-硬脂酰基磷脂酰胆碱(PSPC),1,2-二花生酰基-sn-甘油-3-磷酸胆碱(DBPC),1-硬脂酰基-2-棕榈酰基磷脂酰胆碱(SPPC),1,2-双二十碳烯酰基-sn-甘油-3-磷酸胆碱(DEPC),棕榈酰基油酰基磷脂酰胆碱(POPC),溶血磷脂酰胆碱,二油酰基磷脂酰乙醇胺(DOPE),二亚油酰基磷脂酰胆碱,二硬脂酰基磷脂酰乙醇胺(DSPE),二肉豆蔻酰基磷脂酰乙醇胺(DMPE),二棕榈酰基磷脂酰乙醇胺(DPPE),棕榈酰基油酰基磷脂酰乙醇胺(POPE),溶血磷脂酰乙醇胺以及它们的组合。例如,中性磷脂可选自二硬脂酰基磷脂酰胆碱(DSPC)和二肉豆蔻酰基磷脂酰乙醇胺(DMPE)。
辅助脂质包括提高转染的脂质。通过辅助脂质提高转染的机理可包括提高颗粒稳定性。在一些情况下,辅助脂质可提高膜融合性。辅助脂质包括类固醇,固醇以及烷基间苯二酚。合适的辅助脂质的实例包括胆固醇,5-十七烷基间苯二酚,以及胆固醇半琥珀酸酯。在一个实例中,辅助脂质可以是胆固醇或胆固醇半琥珀酸酯。
隐形脂质包括改变纳米颗粒可在体内存在的时间长度的脂质。隐形脂质可通过例如降低颗粒聚集以及控制颗粒尺寸有助于制剂的加工。隐形脂质可调节LNP的药代动力学性质。合适的隐形脂质包括具有连接至脂质基团的亲水头端的脂质。
隐形脂质的亲水头端基团可包括例如选自基于如下聚合物的聚合物基团:PEG(有时称为聚乙二醇),聚噁唑啉,聚乙烯醇,聚丙三醇,聚(N-乙烯吡咯烷酮),聚氨基酸,以及聚N-(2-羟丙基)甲基丙烯酰胺。术语PEG是指任何聚乙二醇或其他聚亚甲基醚聚合物。在一些LNP制剂中,PEG是PEG-2K,也称为PEG2000,其平均分子量为约2,000道尔顿。参见例如,WO2017/173054 A1,其全部内容通过引用并入本文,用于所有目的。
隐形脂质的脂质基团可衍生自例如甘油二酯或二酰基甘酰胺,包括含有二烷基甘油或二烷基甘酰胺基团的那些,所述二烷基甘油或二烷基甘酰胺基团具有长度独立地为含有约C4至约C40饱和或不饱和碳原子的烷基链,其中,所述链可包含诸如酰胺或酯之类的一个或多个官能团。二烷基甘油或二烷基甘酰胺还可包含一个或多个取代的烷基。
作为一个实例,隐形脂质可选自:PEG-二月桂酰基甘油,PEG-二肉豆蔻酰基甘油(PEG-DMG),PEG-二棕榈酰基甘油,PEG-二硬脂酰基甘油(PEG-DSPE),PEG-二月桂基甘酰胺,PEG-二肉豆蔻基甘酰胺,PEG-二棕榈酰基甘酰胺,和PEG-二硬脂酰基甘酰胺,PEG-胆固醇(l-[8'-(胆甾-5-烯-3[β]-氧)甲酰胺-3',6'-二氧辛烷基]氨基甲酰-[Ω]-甲基-聚乙二醇,PEG-DMB(3,4-双十四氧苄基-[Ω]-甲基-聚乙二醇醚),1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG),1,2-二硬脂酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE),1,2-二硬脂酰基-sn-甘油,甲氧基聚乙二醇(PEG2k-DSG),聚乙二醇-2000-二甲基丙烯酸酯(PEG2k-DMA),以及1,2-二硬酯基氧丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一种特定实例中,隐形脂质可以是PEG2k-DMG。
制剂中,LNP可包含不同摩尔比例的各个组分的脂质。CCD脂质的mol-%可以是例如约30mol-%至约60mol-%,约35mol-%至约55mol-%,约40mol-%至约50mol-%,约42mol-%至约47mol-%,或约45%。辅助脂质的mol-%可以为例如约30mol-%至约60mol-%,约35mol-%至约55mol-%,约40mol-%至约50mol-%,约41mol-%至约46mol-%,或约44mol-%。中性脂质的mol-%可以为例如约1mol-%至约20mol-%,约5mol-%至约15mol-%,约7mol-%至约12mol-%,或约9mol-%。隐形脂质的mol-%可以为例如约1mol-%至约10mol-%,约1mol-%至约5mol-%,约1mol-%至约3mol-%,约2mol-%,或约1mol-%。
LNP中生物可降解脂质(N)的带有正电荷的氨基基团与待包裹的核酸的带有负电荷的磷酸基团(P)之间可具有不同比例。这可在数学上由方程式N/P表示。例如,N/P比例可以为约0.5至约100,约1至约50,约1至约25,约1至约10,约1至约7,约3至约5,约4至约5,约4,约4.5或约5。N/P比例还可以为约4至约7,或约4.5至约6。在特定实施例中,N/P比例可以是4.5或可以是6。
在一些LNP中,载体可包含Cas mRNA和gRNA。Cas mRNA和gRNA可具有不同的比例。例如,LNP制剂可包括如下比例的Cas mRNA和gRNA核酸:约25:1至约1:25,约10:1至约1:10,约5:1至约1:5,或约1:1。可选地,LNP制剂可包括如下比例的Cas mRNA和gRNA核酸:约1:1至约1:5,或约10:1。可选地,LNP制剂可包括如下比例的Cas mRNA和gRNA核酸:约1:10,25:1,10:1,5:1,3:1,1:1,1:3,1:5,1:10,或1:25。可选地,LNP制剂可包括比例为约1:1至约1:2的Cas mRNA和gRNA核酸。在特定实施例中,Cas mRNA和gRNA的比例可以为约1:1或约1:2。
在一些LNP中,载体可包含外源供体核酸和gRNA。外源供体核酸和gRNA可具有不同比例。例如,LNP制剂可包括如下比例的外源供体核酸和gRNA核酸:约25:1至约1:25,约10:1至约1:10,约5:1至约1:5,或约1:1。可选地,LNP制剂可包括如下比例的外源供体核酸和gRNA核酸:约1:1至约1:5,约5:1至约1:1,约10:1,或约1:10。可选地,LNP制剂可包括如下比例的外源供体核酸和gRNA核酸:约1:10,25:1,10:1,5:1,3:1,1:1,1:3,1:5,1:10,或1:25。
合适的LNP的具体实例具有4.5的氮磷比(N/P)并且包含摩尔比为45:44:9:2的生物可降解的阳离子脂质,胆固醇,DSPC和PEG2k-DMG。生物可降解的阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙基)羰基)氧)甲基)丙基十八碳-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙基)羰基)氧)甲基)丙基(9Z,12Z)-十八碳-9,12-二烯酸酯。参见,例如,Finn等人,(2018)Cell Reports 22:1-9,其全部内容通过引用并入本文,用于所有目的。Cas9 mRNA与向导RNA的重量比可以为1:1。合适的LNP的另一具体实例包含摩尔比为50:38.5:10:1.5的Din-MC3-DMA(MC3),胆固醇,DSPC,以及PEG-DMG。
合适的LNP的另一具体实例具有氮磷比(N/P)为6并且包含摩尔比为50:38:9:3的生物可降解的阳离子脂质,胆固醇,DSPC和PEG2k-DMG。生物可降解的阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙基)羰基)氧)甲基)丙基十八碳-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙基)羰基)氧)甲基)丙基(9Z,12Z)-十八碳-9,12-二烯酸酯。Cas9 mRNA与向导RNA的重量比可以为1:2。
可选择降低免疫原性的递送模式。例如,Cas蛋白质和gRNA可通过不同的模式进行递送(例如,双模态递送)。这些不同的模式可赋予目标递送分子(例如,Cas或编码Cas的核酸,gRNA或编码gRNA的核酸,或外源供体核酸/修复模板)不同的药效学或药代动力学性质。例如,不同的模式可产生不同的组织分布,不同的半衰期或不同的时间分布。一些递送模式(例如,递送通过自主复制或基因组整合留存在细胞中的核酸载体)产生更持久的表达并且更加持久地存在于分子中,而其他递送模式是瞬时的并且不太持久(例如,递送RNA或蛋白质)。以更加瞬时的方式递送Cas蛋白质(例如mRNA或蛋白质)可确保Cas/gRNA复合物仅仅存在较短的时间段并且仅在较短的时间段内具有活性并且可降低免疫原性,该免疫原性由来自通过MHC分子在细胞表面展示的细菌衍生的Cas酶的肽引起。这些瞬时递送还可降低脱靶修饰的可能性。
体内给药可通过合适的途径进行,例如,肠胃外给药,静脉内给药,口服给药,皮下给药,动脉内给药,颅内给药,鞘内给药,腹膜内给药,局部给药,鼻内给药或肌肉内给药。全身给药模式包括例如:口服途径和肠胃外途径。肠胃外途径的实例包括静脉内途径,动脉内途径,骨内途径,肌肉内途径,皮内途径,皮下途径,鼻内途径和腹膜内途径。具体实例是静脉内输注。鼻灌注和玻璃体内注射是其他特定实例。局部给药模式包括例如:鞘内途径,脑室内途径,脑实质内途径(例如,定位脑实质内递送至纹状体(例如,递送至尾状核内或硬膜内),大脑皮层,中央前回,海马体(例如,递送至齿状回或CA3区域),颞叶皮层,杏仁核,额叶皮层,丘脑,小脑,髓质,下丘脑,顶盖,被盖或黑质),眼内途径,框内途径,结膜下途径,玻璃体内途径,视网膜下途径和经虹膜途径。相比于全身给药(例如,静脉内给药)而言,明显较少量(与全身方式相比)的成分可在局部给药(例如,脑实质内给药或玻璃体内给药)时发挥作用。局部给药模式还可降低或消除当全身给药治疗有效量的成分时可能产生的潜在的毒副作用的发生率。
体内给药可通过任何合适的途径进行,包括例如:肠胃外途径,静脉内途径,口服途径,皮下途径,动脉内途径,颅内途径,鞘内途径,腹膜内途径,局部途径,鼻内途径,或者肌肉内途径。特定的实例是静脉内输注。含有向导RNA和/或Cas蛋白质(或编码向导RNA和/或Cas蛋白质的核酸)的组合物可使用一种或多种生理学和药学上可接受的载体,稀释剂,赋形剂或助剂配制。剂型可依赖于所选择的给药途径。术语“药学上可接受的”是指载体,稀释剂,赋形剂或助剂与制剂的其他成分相容并且对制剂的接受者不会产生实质的有害作用。
给药频率和剂量次数可取决于外源供体核酸,向导RNA或Cas蛋白质(或编码向导RNA或Cas蛋白质的核酸)的半衰期,以及给药途径等等因素。将核酸或蛋白质引入细胞或非人类动物中可进行一次或在一段时间段内进行多次。例如,引入可在一段时间段内进行至少两次,至少三次,至少四次,至少五次,至少六次,至少七次,至少八次,至少九次,至少10次,至少11次,至少12次,至少13次,至少14次,至少15次,至少16次,至少17次,至少18次,至少19次或至少20次。
E.体内或离体测量人-TTR-靶向试剂的递送,活性或效率
本文公开的方法可还包括检测或测量人-TTR-靶向试剂的活性。例如,如果人-TTR-靶向试剂是基因组编辑试剂(例如,设计为靶定人TTR基因座的CRISPR/Cas),那么所述测量可包括评价人源化TTR基因座的修饰。
可使用各种不同的方法识别具有靶定的基因修饰的细胞。筛选可包括用于评价亲本染色体的等位基因修饰(MOA)的定量分析方法。例如,所述定量分析方法可通过定量PCR(例如,实时PCR(qPCR))进行。实时PCR可利用识别目标基因座的第一引物组和识别未靶定的参比基因座的第二引物组。所述引物组可包括识别扩增的序列的荧光探针。合适的定量分析方法的其他实例包括荧光原位杂交(FISH),比较基因组杂交,等温DNA扩增,与固定化探针的定量杂交,
Figure BDA0002428169960000881
探针,
Figure BDA0002428169960000882
分子信标探针或ECLIPSETM探针技术(参见,例如,US 2005/0144655,其全部内容通过引用并入本文,用于所有目的)。
还可使用第二代测序(NGS)进行筛选。第二代测序还可被称为“NGS”或“大规模平行测序”或“高通量测序”。除了MOA分析方法之外,还可使用NGS作为筛选工具以定义靶定的基因修饰的确切本质以及整个细胞类型或组织类型或器官类型中靶定的基因修饰是否一致。
评价非人类动物体内的人源化TTR基因座的修饰可在来自任何组织或器官的任何细胞类型中进行。例如,所述评价可在来自相同组织或器官的多种细胞类型中进行或在来自组织或器官中的多个位置的细胞中进行。这可提供关于目标组织或器官中何种类型的细胞被靶定或人-TTR-靶向试剂达到组织或器官的那个部分的信息。作为另一实例,所述评价可在多种类型的组织中进行或可在多种器官中进行。在靶定了特定组织,器官或细胞类型的方法中,这可提供关于如何有效靶定组织或器官以及其他组织或器官中是否产生脱靶作用的信息。
如果试剂被设计为使人源化TTR基因座惰化,影响人源化TTR基因座的表达,防止人源化TTR mRNA的翻译或清除人源化TTR蛋白质,那么所述测量可包括评价人源化TTRmRNA或蛋白质的表达。该测量可在肝脏中进行或可在特定的细胞类型或肝脏内的特定区域中进行,或该测量可涉及测量分泌的人源化TTR蛋白质的血清水平。
人源化TTR蛋白质的产生和分泌可通过任何已知的方法进行评价。例如,可使用已知的分析方法通过测量非人类动物的肝脏中编码的mRNA的水平或非人类动物的肝脏中编码的蛋白质的水平对表达进行评价。人源化TTR蛋白质的分泌可通过使用已知的分析方法测量非人类动物中编码的人源化TTR蛋白质的血浆水平或血清水平来评价。
IV.产生包含人源化TTR基因座的非人类动物的方法
本文提供用于产生包含本文公开的人源化TTR基因座的非人类动物的各种不同的方法。用于产生基因修饰的生物体的任何简便的方法或操作规程适用于产生这种基因修饰的非人类动物。参见,例如,Cho等人,(2009)Current Protocols in Cell Biology42:19.11:19.11.1–19.11.22and Gama Sosa等人,(2010)Brain Struct.Funct.214(2-3):91-109,其每一个的全部内容通过引用并入本文,用于所有目的。这些基因修饰的非人类动物可通过例如在靶定的Ttr基因座处敲入基因而产生。
例如,产生包含人源化TTR基因座的非人类动物的方法可包括:(1)修饰多能细胞的基因组以包含人源化TTR基因座;(2)识别或选择包含人源化TTR基因座的基因修饰的多能细胞;(3)将所述基因修饰的多能细胞引入非人类动物宿主胚胎中;以及(4)将宿主胚胎植入代孕母体中并在代孕母体中孕育。任选地,包含修饰的多能细胞(例如,非人类ES细胞)的宿主胚胎可被孵育至囊胚阶段,随后植入代孕母体中并进行孕育,从而产生F0非人类动物。所述代孕母体随后可产生包含人源化TTR基因座的F0代非人类动物。
所述方法可还包括识别具有修饰的目标基因组基因座(即,人源化TTR基因座)的细胞或动物。可使用各种不同的方法识别具有靶定的基因修饰的细胞和动物。
筛选步骤可包括例如,用于评价亲本染色体的等位基因修饰(MOA)的定量分析方法。例如,所述定量分析方法可通过定量PCR(例如,实时PCR(qPCR))进行。实时PCR可利用识别目标基因座的第一引物组和识别未靶定的参比基因座的第二引物组。所述引物组可包括识别扩增的序列的荧光探针。
合适的定量分析方法的其他实例包括荧光原位杂交(FISH),比较基因组杂交,等温DNA扩增,与固定化探针的定量杂交,
Figure BDA0002428169960000901
探针,
Figure BDA0002428169960000902
分子信标探针或ECLIPSETM探针技术(参见,例如,US 2005/0144655,其全部内容通过引用并入本文,用于所有目的)。
合适的多能细胞的实例是胚胎干(ES)细胞(例如,小鼠ES细胞或大鼠ES细胞)。修饰的多能细胞可通过例如重组而产生,所述重组包括(a)向细胞引入一种或多种包含侧面具有对应于5’和3’靶向位点的5’和3’同源臂的插入体核酸的靶向载体,其中,所述插入体核酸包含人源化TTR基因座;和(b)识别在其基因组中包含整合于内源Ttr基因座处的插入体核酸的至少一个细胞。可选地,修饰的多能细胞可通过如下步骤产生:(a)向细胞中引入:(i)核酸酶试剂,其中,所述核酸酶试剂在内源Ttr基因座中的靶向序列中诱导切口或双链断裂;以及(ii)一个或多个包含侧面具有对应于5’和3’靶向位点的5’和3’同源臂的插入体核酸的靶向载体,其中,所述5’和3’靶向位点位于足够靠近靶向序列的位置,其中,所述插入体核酸包含人源化TTR基因座;和(c)识别包含内源Ttr基因座处的修饰(例如,插入体核酸的整合)的至少一个细胞。可使用在期望的靶向序列中诱导切口或双链断裂的任何核酸酶试剂。合适的核酸酶的实例包括类转录活性因子核酸酶(TALEN),锌手指核酸酶(ZFN),大范围核酸酶和成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关(Cas)系统或该系统的成分(例如,CRISPR/Cas9)。参见,例如,US 2013/0309670和US 2015/0159175,其每一个的全部内容通过引用并入本文,用于所有目的。
在特定实施例中,产生包含人源化TTR基因座的非人类动物的方法可包括:(a)向非人类动物胚胎干(ES)细胞中引入:(i)靶向内源Ttr基因座中的靶向序列的核酸酶试剂;和(ii)包含核酸插入体的靶向载体,所述核酸插入体包含侧面具有对应于内源Ttr基因座中的5’靶向序列的5’同源臂和对应于内源Ttr基因座中的3’靶向序列的3’同源臂的人TTR序列,其中,所述靶向载体与内源Ttr基因座重组以产生在其基因组中包含基因修饰的内源Ttr基因座的基因修饰非人类ES细胞,所述基因修饰的内源Ttr基因座包含人TTR序列;(b)向非人类动物宿主胚胎中引入基因修饰的非人类ES细胞;和(c)在代孕母体中孕育所述非人类动物宿主胚胎,其中,所述代孕母体产生F0子代基因修饰的非人类动物,该非人类动物在其基因组中包含基因修饰的内源Ttr基因座,该内源Ttr基因座包含人TTR序列。
在一些这样的方法中,核酸酶试剂可包括Cas蛋白质(例如,Cas9蛋白质)和靶定内源Ttr基因座中的靶向序列的向导RNA,但是也可使用其他合适的核酸酶试剂。CRISPR/Cas和CRISPR/Cas系统在本文的其他地方描述。任选地,可使用两个或多个(例如,三个或四个)核酸酶试剂(例如,向导RNA)。靶向序列可以是内源Ttr基因座内的任何合适的靶向序列。例如,所述靶向序列可位于起始密码子和/或终止密码子的约10个核苷酸之内,约20个核苷酸之内,约30个核苷酸之内,约40个核苷酸之内,约50个核苷酸之内,约100个核苷酸之内,约200个核苷酸之内,约300个核苷酸之内,约400个核苷酸之内,约500个核苷酸之内,约1000个核苷酸之内,约2000个核苷酸之内,约3000个核苷酸之内,约4000个核苷酸之内,或约5000个核苷酸之内(例如,一个靶向序列靠近起始密码子并且一个靶向序列靠近终止密码子)。
在一些这样的方法中,靶向载体是长度为至少10kb的大靶向载体或其中5’和3’同源臂的总长度为至少10kb的大靶向载体,但是其他类型的外源供体核酸也可使用并且是本领域熟知的。5’和3’同源臂可分别对应于5’和3’靶向序列,其位于被人TTR插入体核酸取代的区域的侧面或位于其中插入了人TTR插入体核酸的区域的侧面。外源供体核酸或靶向载体可通过同源定向修复与靶向基因座重组或可通过NHEJ-介导的插入而被插入以产生人源化TTR基因座。
供体细胞可引入任何阶段的宿主胚胎中,例如,囊胚期或前桑椹胚胎(pre-morula)期(即,4细胞期或8细胞期)。产生了能够通过种系遗传基因修饰的子代。参见,例如,US7,294,754,其全部内容通过引用并入本文,用于所有目的。
可选地,产生本文其他地方描述的非人类动物的方法可包括:(1)使用上述用于修饰多能细胞的方法修饰单细胞期胚胎的基因组以包含人源化TTR基因座;(2)选择基因修饰的胚胎;和(3)将基因修饰的胚胎植入代孕母体并在代孕母体中孕育。产生能够通过种系遗传基因修饰的子代。
细胞核转移技术还可用于产生非人类哺乳动物。简言之,细胞核转移的方法可包括如下步骤:(1)从卵细胞中除去细胞核或提供除去细胞核的卵细胞;(2)分离或提供待与除去细胞核的卵细胞结合的供体细胞或细胞核;(3)将细胞或细胞核插入除去细胞核的卵细胞以形成重新构成的细胞;(4)将重新构成的细胞植入动物的子宫以形成胚胎;以及(5)使胚胎发育。在这些方法中,卵细胞通常提取自死亡的动物,虽然它们也可分离自活体动物的输卵管和/或卵巢。卵细胞可在多种熟知的培养基中发育成熟,随后除去细胞核。除去卵细胞的细胞核可以多种熟知的方式进行。将供体细胞或细胞核插入除去细胞核的卵细胞以形成重新构成的细胞可通过在透明带下进行供体细胞的显微注射随后进行融合来完成。融合可通过在接触/融合平面上施加DC电脉冲来诱导(电融合),通过使细胞暴露于融合促进化学试剂(例如,聚乙二醇)来诱导,或通过使诸如仙台病毒(Sendai virus)之类的病毒失活来诱导。可在细胞核供体和受体卵细胞的融合之前,过程中和/或之后通过电学方式和/或非电学方式活化重新构成的细胞。活化方法包括电脉冲,化学诱导休克,精子穿透,增加卵细胞中的二价阳离子的水平,以及降低卵细胞中细胞蛋白质的磷酸化作用(通过激酶抑制剂的方式)。活化的重新构成的细胞或胚胎可在熟知的培养基中培养并随后转移至动物的子宫。参见,例如,US 2008/0092249,WO 1999/005266,US 2004/0177390,WO 2008/017234,和美国专利US7,612,250,其每一个的全部内容通过引用并入本文,用于所有目的。
本文提供的各种不同的方法能够产生基因修饰的非人类F0动物,其中,基因修饰的F0动物的细胞包括人源化TTR基因座。基于用于产生F0动物的方法,F0动物体内具有人源化TTR基因座的细胞的数量将会发生改变。通过例如
Figure BDA0002428169960000931
方法将供体ES细胞引入来自相应的生物体(例如,8细胞阶段小鼠胚胎)的前桑葚阶段胚胎能够产生更高百分比的F0动物的细胞群,从而包括具有目标核苷酸序列的细胞,所述目标核苷酸序列包含靶定的基因修饰。例如,非人类F0动物的至少50%,60%,65%,70%,75%,85%,86%,87%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%的细胞分布可包含具有靶定的修饰的细胞群。
基因修饰的F0动物的细胞可以是对于人源化TTR基因座而言杂合的或可以是对于人源化TTR基因座而言纯合的。
上文或下文记载的所有专利的提交文件,网页内容,其他公开出版物,登录号等等的全部内容通过引用并入本文用于所有目的,这与将专利的提交文件,网页内容,其他公开出版物,登录号等等中的每一个单独地且特别地通过引用并入本文的程度相同。如果序列的不同版本与不同时间的登录号相关,那么意味着版本与本申请的有效提交日期的登录号相关。有效提交日期是指早于实际提交日期或涉及登录号的优先权申请(如果有的话)的提交日期。同样,如果不同版本的公开出版物、网页等在不同的时间公开,那么,除非另有说明,是指与申请的有效提交日期最近的日期公开的版本。除非另有明确说明,本发明的任何特征、步骤、元素、实施方式或方面可与任何其他联合使用。虽然本发明已通过举例说明和实例的方式进行了一些详细描述为了明确和理解本发明,但是明显的是,可在所附的权利要求的范围内做出一些改变和修饰。
对序列的简要描述
所附的序列表中列出的核苷酸和氨基酸序列显示为使用标准字母缩写用于核苷酸碱基以及三字母编码用于氨基酸。核苷酸序列遵循在序列的5’端开始并且正向书写至3’端(即,每一行从左至右)的标准惯例。仅显示了每个核苷酸序列的一个链,但是可被理解的是通过参考所显示的链互补链也包括在本文内。当提供编码氨基酸序列的核苷酸序列时,应当理解的是,还提供了编码相同氨基酸的密码子简并变体。氨基酸序列遵循在序列的氨基末端开始并正向书写至羧基末端(即,每一行从左至右)的标准惯例。
表2.对序列的描述
Figure BDA0002428169960000941
Figure BDA0002428169960000951
Figure BDA0002428169960000961
实施例
实施例1.包含人源化TTR基因座的小鼠的产生
用于TTR淀粉样变性疾病的一种有望的治疗方式是通过使用基因组编辑技术(例如,CRISPR/Cas9技术)惰化基因来降低患者体内的TTR载量。为了帮助CRISPR/Cas9治疗方法的发展,开发了在Ttr基因中具有靶定的修饰的小鼠。
产生的第一Ttr等位基因是小鼠转甲状腺素蛋白编码序列的完全删除并且由人TTR基因的直系同源部分对其进行取代。产生了包含5’同源臂的大的靶向载体,所述5’同源臂包括从小鼠Ttr起始密码子上游开始的33.7kb序列和小鼠Ttr终止密码子下游的34.5kb序列,从而以从人TTR起始密码子至最后人TTR外显子(外显子4,包括人3’UTR)的末端的大约7.1kb的直系同源人TTR序列和侧面具有loxP位点的自删除新霉素选择盒(SDC Neo)取代从小鼠Ttr起始密码子至小鼠Ttr终止密码子的大约8.3kb的区域。参见图3。SDC Neo盒从5’至3’方向上包括如下成分:loxP位点,小鼠鱼精蛋白(Prm1)启动子,Crei(优化为包括内含子的Cre编码序列),polyA,人泛素启动子,新霉素磷酸转移酶(neor)编码序列,polyA,loxP。为了产生人源化等位基因,靶定小鼠Ttr基因座的CRISPR/Cas9成分连同大靶向载体被引入至F1H4小鼠胚胎干细胞。使用图5A和表3中列出的引物和探针进行等位基因缺失分析,等位基因获得分析,滞留分析和CRISPR分析以确定小鼠Ttr等位基因的人源化。等位基因缺失分析,等位基因获得分析和滞留分析在例如US 2014/0178879;US 2016/0145646;WO2016/081923;以及Frendewey等人,(2010)Methods Enzymol.476:295-307中进行描述,上述参考文献中的每一个的全部内容通过引用并入本文,用于所有目的。CRISPR分析是设计为覆盖被CRISPR gRNA中断的区域的
Figure BDA0002428169960000971
分析方法。当CRISPR gRNA切断并产生indel(插入或删除)时,
Figure BDA0002428169960000972
分析方法将无法进行扩增并因此报告CRISPR裂解。图3中显示了带有SDC Neo盒的版本和切除了SDC Neo盒的版本。随后使用
Figure BDA0002428169960000973
方法产生F0小鼠。参见,例如,US 7,576,259;US 7,659,442;US 7,294,754;US 2008/007800;以及Poueymirou等人,(2007)Nature Biotech.25(1):91-99,其中的每一个的全部内容通过引用并入本文,用于所有目的。
从多个人源化ES细胞克隆(包括克隆7576A-A5,7576C-G7,和7576B-F10)中产生F0代小鼠(50%C57BL/6NTac和50%129S6/SvEvTac)。预期的F0代小鼠中的人源化小鼠Ttr基因座的序列在SEQ ID NO:14中列出并且包括SDC Neo盒。通过动物繁殖产生F1代和F2代小鼠(75%C57BL/6NTac和25%129S6/SvEvTac)。预期的F1代和F2代小鼠中人源化小鼠Ttr基因座的序列在SEQ ID NO:15中列出并且不包括SDC Neo盒。
人和小鼠转甲状腺素蛋白前体蛋白序列的比较在图1A中显示,人和小鼠转甲状腺素蛋白编码序列的比较在图1B中显示,并且图2中显示了野生型小鼠Ttr基因座和最终人源化小鼠Ttr基因座(带有被删除的SDC Neo盒的人源化TTR版本1)的示意图。从起始密码子至终止密码子的内源小鼠Ttr基因座序列在SEQ ID NO:20中提供。预期的带有SDC Neo盒的人源化小鼠Ttr基因座的序列和预期的不带有SDC Neo盒的人源化小鼠Ttr基因座的序列分别在SEQ ID NO:14和15中列出。由人源化小鼠Ttr基因座编码的预期的转甲状腺素蛋白前体蛋白在SEQ ID NO:1中列出。该等位基因提供人TTR CRISPR/Cas9治疗中的真实人靶点,从而能够测试活体动物中CRISPR/Cas9治疗的效率和作用模式以及在人蛋白是所存在的TTR的唯一形式的情况下进行药代动力学研究和药效学研究。
Figure BDA0002428169960000991
Figure BDA0002428169960001001
实施例2.表征包含人源化TTR基因座的小鼠
随后表征了来自克隆7576A-A5和7576C-G7的人源化TTR小鼠F0群组。如图6所示,人源化TTR mRNA在八周龄的纯合F0代人源化TTR小鼠的肝脏中强烈表达。通过RT-qPCR分析了每种组织中等质量的RNA。每种基因分型分析五只小鼠,每个样品重复四次。每种组织均具有提取的RNA。基因组DNA被降解,这样其不计入qPCR反应中。RNA被逆转录并且使用对人TTR和小鼠Ttr具有特异性的分析方法分别检测人TTR转录体和小鼠Ttr转录体。如所预期的,纯合的人源化TTR小鼠表现出在肝脏中人TTR显著表达(ct值低于30),而WT小鼠表现出ct值为30且更高,这表明没有人TTR表达。相反,野生型小鼠表现出在肝脏中小鼠Ttr的显著表达,而纯合的人源化TTR小鼠表现出ct值为30并且更高,这说明小鼠Ttr没有内源性表达。
进行ELISA分析评价八周龄纯合F0代人源化TTR小鼠的血清和脑脊液中的人TTR蛋白水平和小鼠TTR蛋白水平。人TTR ELISA试剂盒(Aviva Systems Biology;批号:OKIA00081;对于血清进行1:250稀释;对于CSF进行1:1000稀释)用于评价人TTR水平。小鼠TTR ELISA试剂盒(Aviva Systems Biology;批号:OKIA00111;对于血清进行1:4000稀释;对于CSF进行1:10000稀释)用于评价小鼠TTR水平。人血清和人CSF用作人TTR的阳性对照和小鼠TTR的阴性对照,F1H4血清和F1H4CSF用作人TTR的阴性对照和小鼠TTR的阳性对照。如图7A所示,在人源化TTR小鼠的血清中检测到人TTR,但是在野生型(F1H4)小鼠的血清中没有检测到人TTR。如图7B所示,在人源化TTR小鼠的血清中没有检测到小鼠TTR,但在野生型小鼠血清中检测到了小鼠TTR。进一步在衍生自两种不同的人源化小鼠TtrES细胞克隆(7576C-G7和7576A-A5)的人源化TTR小鼠中评价了血清中人和小鼠TTR水平。如图7C所示,在衍生自克隆7576A-A5的人源化TTR小鼠的血清中检测到了人TTR。
通过western印迹分析,在八周龄纯合的人源化TTR小鼠的血清样品,肝脏样品和肾脏样品中评价人TTR蛋白的表达。结果如图8至图9所示。血清样品(5μL总体积/孔)在Laemlli缓冲液(包含SDS和β-巯基乙醇)中进行煮沸并且在4%至20%的变性梯度凝胶(抗TTR抗体:1:1000;Abcam;ab75815)上进行分解。小鼠IgG(抗小鼠IgG-HRP:1:7500,JacksonImmunoResearch)用作负载对照。对于人源化小鼠Ttr克隆7576C-G7和7576A-A5而言,每组测试三只小鼠。对于野生型小鼠对照(F1H4)而言,每组测试五只小鼠。小鼠血清和人血清分别用作阴性对照和阳性对照。如图8所示,通过western印迹检测了来自人源化小鼠Ttr克隆的血清中的人TTR。
在Laemlli缓冲液(包含SDS和β-巯基乙醇)中煮沸肝脏和肾脏样品(100μg总蛋白/孔)并在4%至20%的变性梯度凝胶(抗TTR抗体:1:1000;Abcam;ab75815)上进行分解。GAPDH(抗-GAPDH:1:2000,Santa Cruz)用作负载对照。对于人源化小鼠Ttr克隆7576C-G7和7576A-A5而言,每组测试三只小鼠。对于野生型小鼠对照(F1H4)而言,每组测试五只小鼠。小鼠血清和人血清分别用作阴性对照和阳性对照。如图9所示,通过western印迹检测了来自由克隆7576A-A5产生的纯合的人源化TTR小鼠的血清中的人TTR。
总体而言,TTR HumIn(TTR7576/7576)F0小鼠被发现具有可检测量的循环hTTR。此外,来自克隆7576C-A5的小鼠的肝脏和血浆中具有可检测量的hTTR。
我们假设新霉素耐药选择盒的除去可能会增加人TTR的分泌。测量来自五周龄对于带有新霉素选择盒(TTR7576/7576)的完全人源化小鼠Ttr基因座而言纯合的小鼠的非末端下颌下出血的血浆样品中的人TTR水平,对于带有新霉素选择盒(TTR7576/WT)的完全人源化小鼠Ttr基因座而言杂合的小鼠的非末端下颌下出血的血浆样品中的人TTR水平,对于不带有新霉素选择盒(TTR7577/WT)的完全人源化小鼠Ttr基因座而言杂合的小鼠的非末端下颌下出血的血浆样品中的人TTR水平以及野生型小鼠(F1H4)的非末端下颌下出血的血浆样品中的人TTR水平。使用AssayPro人TTR(hTTR)ELISA试剂盒(批号:EP3010-1;1:40000稀释)分析人TTR水平。使用Aviva Systems Biology小鼠TTR(mTTR)ELISA试剂盒(批号:OKIA00111;1:4000稀释)分析小鼠TTR血清水平。先前测定了AssayPro人TTR ELISA试剂盒对检测人TTR具有特异性,但是对小鼠TTR不具有特异性,并且先前测定了Aviva Systems Biology小鼠TTRELISA试剂盒对检测小鼠TTR具有特异性,但是对人TTR不具有特异性(数据未显示)。如表4所示,除去新霉素选择盒导致血清中人TTR水平在统计学上显著提高。MAID7576是指带有新霉素选择盒的人源化TTR基因座。MAID7577是指带有除去的新霉素选择盒的人源化TTR基因座。提高的人TTR mRNA表达也在肝脏中观察到(数据未显示)。对于hTTR和mTTR(TTR-WT7576 /WT和TTR-WT7577/WT)而言杂合的小鼠具有提高的循环hTTR,这可能是由于通过异聚(例如,杂交TTR物种)相互作用提高了稳定性。
表4.循环人TTR水平和小鼠TTR水平
TTR<sup>7576/7576</sup> TTR<sup>7576/WT</sup> TTR<sup>7577/WT</sup> F1H4
mTTR,μg/mL(SD) N.D. 207.62(15.39) 359.9(38.07)** 919.96(79.73)
hTTR,μg/mL(SD) 0.61(0.43) 28.507(5.61) 39.93(3.70)** N.D.
还测试了由不同的克隆7576B-F10产生的F2代纯合人源化TTR小鼠中的血清和肝脏TTR水平(每组三只小鼠)。如图14所示(Tris盐水蔗糖(TSS)对照样品),肝脏样品中的人TTR的水平为高于1000ng/mL。如图15A和图15B所示(TSS样品),在血清样品中检测到了人TTR水平为80,000ng/mL或更高。
在另一实验中,通过下颌下出血从三月龄的TTR WT HumIn(v1.0,hTTR7577/7577,克隆B-F10)F2纯合小鼠中收集血液。使用物种特异性ELISA试剂盒(hTTR,Aviva,批号:#OKIA00081;mTTR,Aviva,批号:#OKIA00111)测定了血浆中的hTTR水平。如图17A和图17B以及表5所示,hTTR以52.1+/-10.7μg/mL被分泌至TTR WT HumIn(v1.0,克隆B-F10)F2纯合小鼠的循环中,且没有可检测水平的mTTR。野生型对照小鼠(F1H4)和WT HumIn(v1.0,hTTR7577 /7577,克隆B-F10)小鼠的肝脏样品中mTTR和hTTR的mRNA水平如图17C所示。
表5.血浆hTTR和mTTR水平
hTTR,μg/mL(SD) mTTR,μg/mL(SD)
TTR<sup>WT/WT</sup> N.D. 831.5(129.9)
TTR<sup>7577/7577</sup> 52.1(10.7) 无可检测的
人血清 234.5(n.a.) 无可检测的
实施例3.使用包含人源化TTR基因座的小鼠离体和体内检测靶定人TTR的向导RNA
随后使用F0代人源化TTR小鼠群组离体和体内测试靶定人TTR的向导RNA。作为对概念的验证,首先测试了从由克隆7576C-G7产生的F0代人源化TTR小鼠中分离的初级肝细胞中的人TTR向导RNA。使用50mL含有1X PenStrep的肝脏灌注介质对来自huTTRhI/hI小鼠的肝脏进行灌注,随后采用50mL肝脏消化介质(HBSS,100mM CaCl2,500mM HEPES,胶原蛋白酶)进行灌注。一旦肝脏表现出被消化,将其放置于含有1X PenStrep和L-谷氨酰胺的洗涤介质中。撕破肝脏以通过轻微振荡从肝脏中释放肝细胞。一旦细胞被释放,使其通过70μm的筛网过滤器并在4℃下50g条件下旋转4分钟。使用洗涤缓冲液洗涤小粒两次。随后将小粒重悬于20mL 38%-40%的Percoll并在4℃下200g条件下旋转10分钟。洗涤小粒两次并将其重悬于种植培养基(Williams E培养基,1X Penstrep,1X L-谷氨酰胺,5%FBS)中。以300,000细胞/孔的密度将细胞接种在24孔包被有胶原蛋白的组织培养平板中。在使得细胞贴壁6至18小时之后,使用不含有FBS的培养基更换种植培养基。所使用的试剂在表6中显示。
表6.用于分离初级肝细胞的试剂
材料 批号
肝脏灌注介质 Gibco[17701-038]
HBSS(1x) Gibco[14175-079]
肝细胞洗涤介质 Gibco[17704-024]
Williams E培养基 Gibco[A12176-01]
Penstrep(100x) Gibco[15140163]
L-谷氨酰胺(200mM) Gibco[25030081]
FBS补充物 Gibco[A13450]
HEPES Gibco[15630080]
胶原蛋白 Gibco[A1048301]
醋酸 Sigma[A6283]
Liberase TM Roche[TM05401119001]
初级肝细胞融化和接种补充物 Gibco[CM3000]
初级肝细胞维持补充物 Gibco[CM4000]
细胞分离液(Percoll) GE[17-0891-01]
将脂质纳米颗粒(LNP)(含有Cas9 mRNA和人TTR gRNA(版本1和版本2,其均靶定人TTR外显子2))加至分离后24小时的肝细胞。简言之,对于每个孔而言,以500μL包含3%小鼠血清的肝细胞维持培养基中500ng的浓度添加LNP并在37℃下孵育5分钟。洗涤接种的细胞并将500μL在培养基中孵育的LNP添加至每个孔。48小时后,通过细胞制备得到DNA细胞溶解产物并对每个所测试的向导RNA进行第二代测序。
如图10所示,在分离自人源化TTR小鼠的初级肝细胞中通过两种向导RNA观察到人源化TTR基因中的编辑。人TTR向导RNA1具有20.4%的编辑效率,并且人TTR向导RNA2具有7.53%的编辑效率。在靶定外显子3的人TTR向导RNA中观察到类似结果(编辑效率17.37%,数据未显示)。编辑效率是指通过第二代测序确定的溶解的细胞池中通过PCR反应中读取的总序列数上观察到的插入或删除的总数。
接着,在人源化TTR小鼠体内测试人TTR向导RNA1和2。使用来自克隆7576A-A5和7576C-G7的F0代人源化TTR小鼠(TtrhI/hI)。如表7所示,由新鲜LNP靶定三组动物。
表7.LNP研究的动物组
分组 描述
1 Ttr<sup>hI/hI</sup> 1M 1F A-A5和2M 1F C-G7:LNP(gRNA1)@2mg/kg
2 Ttr<sup>hI/hI</sup>1M 1F A-A5和2M 1F C-G7:LNP(gRNA2)@2mg/kg
3 Ttr<sup>hI/hI</sup> 1M A-A5和2M C-G7:Tris-盐水蔗糖
使用人TTR向导RNA和由一个NLS和无HA标签编码Cas9的mRNA配制LNP。LNP的氮磷(N/P)比为4.5并且LNP包含摩尔比为45:44:9:2的阳离子脂质,胆固醇,DSPC和PEG2k-DMG。本文所述的体外和体内LNP实验中使用的阳离子脂质是(9Z,12Z)-3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基十八烷-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基(9Z,12Z)-十八烷-9,12-二烯酸酯。向导RNA与Cas9 mRNA的重量比为1:1。表8中提供了其他LNP制剂的具体细节。
表8.人TTR LNP制剂
Figure BDA0002428169960001071
在进行注射之前对小鼠进行称重,并且制备LNP(包含Cas9 mRNA和人TTR gRNA),通过在Tris-盐水蔗糖中进行稀释配制成剂量为2mg/kg,这样每只小鼠的递送体积为200μl。通过尾静脉注射进行静脉内递送。8至14天之后,麻醉小鼠并且收获血清和肝脏组织。将组织加工处理成DNA细胞溶解产物,并随后由第二代测序(NGS)分析该DNA细胞溶解产物。
对肝脏酶ALT,AST,甘油三酯,总胆固醇,HDL,LDL,未酯化的脂肪酸(NEFA)和白蛋白的血清化学分析显示了各种不同的治疗组之间没有统计学上的差异。参见图11A至图11H。在靶定外显子3的人TTR向导RNA中观察到类似的结果(数据未显示)。
NGS显示肝脏中显著编辑人TTR gRNA 1(平均42.8%)和人TTR gRNA 2(平均36.0%)。参见图12。编辑效率是指溶解的细胞池中通过PCR反应中读取的总序列数上观察到的插入或删除的总数。在其他组织中观察到最小的基因编辑水平或没有观察到统计学上显著的基因编辑水平。
接着,在来自克隆7576B-F10的F2代纯合人源化TTR小鼠体内测试人TTR向导RNA1。每次给药前均对动物进行称重以进行剂量计算并且在给药后进行24小时监控健康情况。向动物静脉内给药1mg/kg,0.3mg/kg,和0.1mg/kg的含有上述人TTR向导RNA 1和编码Cas9的mRNA的LNP制剂。Tris-盐水蔗糖用作对照。每组测试三只小鼠。在尸体检测(给药后8天)中收集肝脏和血液(用于血清)用于分析。在含有人TTR向导RNA 1和编码Cas9的mRNA的LNP制剂的剂量为1mg/kg的条件下,在肝脏中观察到的人源化TTR基因座的编辑百分比为50.7%,在含有人TTR向导RNA 1和编码Cas9的mRNA的LNP制剂的剂量为0.3mg/kg的条件下,在肝脏中观察到的人源化TTR基因座的编辑百分比为13.0%,在含有人TTR向导RNA 1和编码Cas9的mRNA的LNP制剂的剂量为0.1mg/kg的条件下,在肝脏中观察到的人源化TTR基因座的编辑百分比为2.3%,在对照小鼠中观察到编辑百分比小于0.1%。随后,测量给药的小鼠的肝脏细胞溶解产物和血清中的人TTR水平。肝脏溶解在浓度为100mg/mL的RIPA和蛋白酶抑制剂中。人TTR ELISA试剂盒(Aviva Systems Biology;批号:OKIA00081;对于肝脏细胞溶解产物而言进行1:100稀释;对于血清而言进行1:5000或1:10000稀释)用于评价人TTR水平。如图14所示,在对照动物的肝脏细胞溶解产物中测量到人TTR的水平高于1000ng/mL,并且在给药了1mg/kg的含有人TTR向导RNA 1和编码Cas9的mRNA的LNP制剂的动物中这些水平降低了大于50%。如图15A和图15B所示,在对照动物的血清中测试到人TTR的水平为80,000ng/mL或更高,并且在给药了1mg/kg的含有人TTR向导RNA 1和编码Cas9的mRNA的LNP制剂的动物中人TTR水平下降了66%。
接着,在纯合的人源化TTR小鼠体内测试了三种不同的人TTR向导RNA(人TTR向导RNA3,4和5)。含有Cas9 mRNA的LNP制剂与向导RNA的重量比为1:2。LNP包含摩尔比为50:38:9:3的阳离子脂质((9Z,12Z)-3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基十八烷-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基(9Z,12Z)-十八烷-9,12-二烯酸酯)、胆固醇、DSPC和PEG2k-DMG,并且N:P为6。
首先,评价了在人源化TTR基因座处的编辑。在注射之前称重小鼠并且制备剂量为1mg/kg,0.3mg/kg,和0.1mg/kg(n=5只小鼠/组)的LNP(包含Cas9 mRNA和人TTR gRNA)。通过尾静脉注射进行静脉内递送。如上所述,随后麻醉小鼠,收获血清和肝脏组织。将组织加工处理成DNA细胞溶解产物,其随后通过第二代测序(NGS)进行分析。NGS显示在所有测试的剂量条件下每种人TTR gRNA均在肝脏中以剂量依赖方式显著编辑。参见图19。使用设计为扩增目标区域用于NGS分析的引物确定肝脏编辑结果。
其次,评价血清TTR水平。给药之前对小鼠进行称重用于剂量计算。通过静脉内方式向小鼠给药1mg/kg,0.3mg/kg,和0.1mg/kg(n=5只小鼠/组)的含有上述人TTR向导RNA3,4或5和编码Cas9的mRNA的LNP制剂。LNP制剂包含重量比为1:2的Cas9 mRNA和向导RNA。LNP包含摩尔比为50:38:9:3的阳离子脂质((9Z,12Z)-3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基十八烷-9,12-二烯酸酯,也称为3-((4,4-双(辛基氧)丁酰基)氧)-2-((((3-(二乙基氨基)丙氧基)羰基)氧)甲基)丙基(9Z,12Z)-十八烷-9,12-二烯酸酯)、胆固醇、DSPC和PEG2k-DMG,并且N:P为6。Tris-盐水蔗糖用作对照。如上所述,稍后收集血液(用于血清)用于分析。随后测试给药的小鼠的血清中的人TTR水平。如上所述评价人血清TTR水平。如图20所示,在所有剂量条件下给药每种向导RNA的小鼠中人TTR水平以剂量依赖的方式显著降低。
实施例4.产生包含编码嵌合小鼠/人TTR蛋白的人源化TTR基因座和小鼠信号序列的小鼠
我们假设TTR的小鼠信号序列可提高hTTR分泌至更高的水平。构建了包含用于小鼠Ttr(mTtr)信号序列的cDNA插入体+hTTR(“m/hTTR”)的流体动力学递送(HDD)质粒。使用pRG977载体和表9中列出的cDNA插入体的HDD构建体通过HDD注射至雄性C57/BL6小鼠中,每只小鼠为59天龄。在HDD后第4天在下颌下血液中进行ELISA。F1H4血浆和人血清被包括在ELISA中分别作为阴性对照和阳性对照。
表9.HDD实验的总结
HDD构建体 小鼠数量 体重;g(SD) cDNA插入体
Nanoluc 8 21.5(2.23) Nanoluc
对照蛋白 7 22.8(1.40) 对照蛋白
hTTR 8 23.4(0.74) hTTR信号序列+hTTR
m/hTTR 8 22.9(0.66) mTTR信号序列+hTTR
结果在图13中显示。野生型C57/BL6小鼠的HDD揭示了当与人信号序列TTR+hTTR(“hTTR”)比较时使用TTR的小鼠信号序列事实上提高了hTTR向血浆中的分泌。这说明C57/BL6小鼠可用于预测TTR构建体将会产生更强的hTTR分泌。
基于这些结果,产生了如下另一人源化TTR等位基因,其包含删除从第二外显子起始至终止密码子的小鼠Ttr基因座的区域并使用人TTR基因的直系同源部分对其进行取代,但是其还包括人TTR基因的3’UTR。产生了包含5’同源臂的大靶向载体以使用从人TTR基因中第二外显子的起始至最后人TTR外显子的末端的大约6.1kb的直系同源人TTR序列(外显子4,包括人3’UTR)和侧面具有loxP位点的自删除的新霉素选择盒(SDC Neo)取代从小鼠Ttr基因中的第二外显子的起始至小鼠Ttr终止密码子的大约7.3kb的区域,其中,所述5’同源臂包括从小鼠Ttr基因的第二外显子的上游36kb的序列和小鼠Ttr终止密码子的下游34.5kb的序列。参见图4。为了产生人源化等位基因,将靶定小鼠Ttr基因座的CRISPR/Cas成分以及大靶向载体引入至F1H4小鼠胚胎干细胞中。使用图5B和表3中列出的引物和探针进行等位基因缺失分析,等位基因获得分析和滞留分析以确定小鼠Ttr等位基因的人源化。图4中显示了带有SDC Neo盒的版本和切除SDC Neo盒之后的版本。随后使用
Figure BDA0002428169960001111
方法产生F0小鼠。
图1A显示了人转甲状腺素蛋白前体蛋白序列和小鼠转甲状腺素蛋白前体蛋白序列的比较,图1B显示了人转甲状腺素蛋白编码序列和小鼠转甲状腺素蛋白编码序列的比较,并且在图2中显示了野生型小鼠Ttr基因座和最终人源化小鼠Ttr基因座(带有删除的SDC Neo盒的人源化TTR版本2)的示意图。在SEQ ID NO:16和17中分别列出了预期的带有SDC Neo盒和不带有SDC Neo盒的人源化小鼠Ttr基因座的序列。MAID7655是指带有新霉素选择盒的人源化TTR基因座(保留了小鼠信号序列)。MAID7656是指带有除去的新霉素选择盒的人源化TTR基因座(保留了小鼠信号序列)。由人源化小鼠Ttr基因座(嵌合小鼠/人TTR蛋白)编码的预期的转甲状腺素蛋白前体蛋白在SEQ ID NO:2中列出。
随后,将人TTR ELISA试剂盒(Aviva Systems Biology;批号:OKIA00081;1:2000稀释)用于评价不同版本的1至3月龄的人源化TTR小鼠中的血浆人TTR水平。小鼠包括野生型对照小鼠和带有野生型、MAID7577,MAID7655,和MAID7656等位基因的各种不同的组合的小鼠。MAID7577是指带有除去的新霉素选择盒的人源化TTR基因座。MAID7655是指带有新霉素选择盒的人源化TTR基因座(保留小鼠信号序列)。MAID7656是指带有除去的新霉素选择盒的人源化TTR基因座(保留了小鼠信号序列)。数据在图16和表10中予以总结。如图16所示,hTTR7577/7577小鼠(克隆B-F10)具有约55μg/mL循环hTTR,其具有显著性但是低于野生型小鼠或人血清中的生理水平。当与带有人TTR信号序列(hTTR7577/7577)的人源化TTR小鼠比较时,带有小鼠TTR信号序列(hTTR7655/7655,hTTR7655/7656,和hTTR7656/7656)的人源化TTR小鼠不具有提高的分泌的TTR水平。
表10.血浆TTR水平
Figure BDA0002428169960001121
在另一实验中,人TTR ELISA试剂盒(Aviva Systems Biology;批号:OKIA00081;1:2000稀释)随后用于评价2至3月龄的不同版本的人源化TTR小鼠中血浆人TTR水平。小鼠包括野生型对照小鼠(标记为F1H4)和对于MAID7577或MAID7656等位基因而言纯合的小鼠。MAID7577是指带有除去的新霉素选择盒的人源化TTR基因座。MAID7656是指带有除去的新霉素选择盒的人源化TTR基因座(保留了小鼠信号序列)。数据在图18和表11中予以总结。如图18所示,hTTR7577/7577小鼠(hTTR v1)具有约55μg/mL循环hTTR,其是显著的但是低于野生型小鼠或人血清中的生理水平。当与带有人TTR信号序列(hTTR7577/7577)的人源化TTR小鼠比较时,带有小鼠TTR信号序列(hTTR7656/7656;hTTRv2)的人源化TTR小鼠具有提高的分泌的TTR水平。
表11.血浆hTTR水平
TTR种系 hTTR,μg/mL(SD)
hTTR v2 88.45(1.465)
F1H4 未检测到
序列表
<110> 瑞泽恩制药公司
<120> 包含人源化TTR基因座的非人类动物及其使用方法
<130> 57766-519832
<150> US 62/565,980
<151> 2017-09-29
<150> US 62/679,142
<151> 2018-06-01
<150> US 62/720,292
<151> 2018-08-21
<160> 94
<170> PatentIn version 3.5
<210> 1
<211> 147
<212> PRT
<213> 智人
<400> 1
Met Ala Ser His Arg Leu Leu Leu Leu Cys Leu Ala Gly Leu Val Phe
1 5 10 15
Val Ser Glu Ala Gly Pro Thr Gly Thr Gly Glu Ser Lys Cys Pro Leu
20 25 30
Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Ile Asn Val
35 40 45
Ala Val His Val Phe Arg Lys Ala Ala Asp Asp Thr Trp Glu Pro Phe
50 55 60
Ala Ser Gly Lys Thr Ser Glu Ser Gly Glu Leu His Gly Leu Thr Thr
65 70 75 80
Glu Glu Glu Phe Val Glu Gly Ile Tyr Lys Val Glu Ile Asp Thr Lys
85 90 95
Ser Tyr Trp Lys Ala Leu Gly Ile Ser Pro Phe His Glu His Ala Glu
100 105 110
Val Val Phe Thr Ala Asn Asp Ser Gly Pro Arg Arg Tyr Thr Ile Ala
115 120 125
Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Thr Asn
130 135 140
Pro Lys Glu
145
<210> 2
<211> 147
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 2
Met Ala Ser Leu Arg Leu Phe Leu Leu Cys Leu Ala Gly Leu Val Phe
1 5 10 15
Val Ser Glu Ala Gly Pro Ala Gly Thr Gly Glu Ser Lys Cys Pro Leu
20 25 30
Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Ile Asn Val
35 40 45
Ala Val His Val Phe Arg Lys Ala Ala Asp Asp Thr Trp Glu Pro Phe
50 55 60
Ala Ser Gly Lys Thr Ser Glu Ser Gly Glu Leu His Gly Leu Thr Thr
65 70 75 80
Glu Glu Glu Phe Val Glu Gly Ile Tyr Lys Val Glu Ile Asp Thr Lys
85 90 95
Ser Tyr Trp Lys Ala Leu Gly Ile Ser Pro Phe His Glu His Ala Glu
100 105 110
Val Val Phe Thr Ala Asn Asp Ser Gly Pro Arg Arg Tyr Thr Ile Ala
115 120 125
Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Thr Asn
130 135 140
Pro Lys Glu
145
<210> 3
<211> 7258
<212> DNA
<213> 智人
<400> 3
gttgactaag tcaataatca gaatcagcag gtttgcagtc agattggcag ggataagcag 60
cctagctcag gagaagtgag tataaaagcc ccaggctggg agcagccatc acagaagtcc 120
actcattctt ggcaggatgg cttctcatcg tctgctcctc ctctgccttg ctggactggt 180
atttgtgtct gaggctggcc ctacggtgag tgtttctgtg acatcccatt cctacattta 240
agattcacgc taaatgaagt agaagtgact ccttccagct ttgccaacca gcttttatta 300
ctagggcaag ggtacccagc atctattttt aatataatta attcaaactt caaaaagaat 360
gaagttccac tgagcttact gagctgggac ttgaactctg agcattctac ctcattgctt 420
tggtgcatta ggtttgtaat atctggtacc tctgtttcct cagatagatg atagaaataa 480
agatatgata ttaaggaagc tgttaatact gaattttcag aaaagtatcc ctccataaaa 540
tgtatttggg ggacaaactg caggagatta tattctggcc ctatagttat tcaaaacgta 600
tttattgatt aatctttaaa aggcttagtg aacaatattc tagtcagata tctaattctt 660
aaatcctcta gaagaattaa ctaatactat aaaatgggtc tggatgtagt tctgacatta 720
ttttataaca actggtaaga gggagtgact atagcaacaa ctaaaatgat ctcaggaaaa 780
cctgtttggc cctatgtatg gtacattaca tcttttcagt aattccactc aaatggagac 840
ttttaacaaa gcaactgttc tcaggggacc tattttctcc cttaaaattc attatacaca 900
tccctggttg atagcagtgt gtctggaggc agaaaccatt cttgctttgg aaacaattac 960
gtctgtgtta tactgagtag ggaagctcat taattgtcga cacttacgtt cctgataatg 1020
ggatcagtgt gtaattcttg tttcgctcca gatttctaat accacaaaga ataaatcctt 1080
tcactctgat caattttgtt aacttctcac gtgtcttctc tacacccagg gcaccggtga 1140
atccaagtgt cctctgatgg tcaaagttct agatgctgtc cgaggcagtc ctgccatcaa 1200
tgtggccgtg catgtgttca gaaaggctgc tgatgacacc tgggagccat ttgcctctgg 1260
gtaagttgcc aaagaaccct cccacaggac ttggttttat cttcccgttt gcccctcact 1320
tggtagagag aggctcacat catctgctaa agaatttaca agtagattga aaaacgtagg 1380
cagaggtcaa gtatgccctc tgaaggatgc cctctttttg ttttgcttag ctaggaagtg 1440
accaggaacc tgagcatcat ttaggggcag acagtagaga aaagaaggaa tcagaactcc 1500
tctcctctag ctgtggtttg caaccctttt gggtcacaga acactttatg taggtgatga 1560
aaagtaaaca ttctatgccc agaaaaaatg cacagataca cacacataca aaatcatata 1620
tgtgatttta ggagtttcac agattccctg gtgtccctgg gtaacaccaa agctaagtgt 1680
ccttgtctta gaattttagg aaaaggtata atgtgtatta acccattaac aaaaggaaag 1740
gaattcagaa atattattaa ccaggcatct gtctgtagtt aatatggatc acccaaaacc 1800
caaggctttt gcctaatgaa cactttgggg cacctactgt gtgcaaggct gggggctgtc 1860
aagctcagtt aaaaaaaaaa agatagaaga gatggatcca tgaggcaaag tacagcccca 1920
ggctaatccc acgatcaccc gacttcatgt ccaagagtgg cttctcacct tcattagcca 1980
gttcacaatt ttcatggagt ttttctacct gcactagcaa aaacttcaag gaaaatacat 2040
attaataaat ctaagcaaag tgaccagaag acagagcaat caggagaccc tttgcatcca 2100
gcagaagagg aactgctaag tatttacatc tccacagaga agaatttctg ttgggtttta 2160
attgaacccc aagaaccaca tgattcttca accattattg ggaagatcat tttcttaggt 2220
ctggttttaa ctggcttttt atttgggaat tcatttatgt ttatataaaa tgccaagcat 2280
aacatgaaaa gtggttacag gactattcta agggagagac agaatggaca ccaaaaatat 2340
tccaatgttc ttgtgaatct tttccttgca ccaggacaaa aaaaaaaaga agtgaaaaga 2400
agaaaggagg aggggcataa tcagagtcag taaagacaac tgctattttt atctatcgta 2460
gctgttgcag tcaaatggga agcaatttcc aacattcaac tatggagctg gtacttacat 2520
ggaaatagaa gttgcctagt gtttgttgct ggcaaagagt tatcagagag gttaaatata 2580
taaaagggaa aagagtcaga tacaggttct tcttcctact ttaggttttc cactgtgtgt 2640
gcaaatgata ctccctggtg gtgtgcagat gcctcaaagc tatcctcaca ccacaaggga 2700
gaggagcgag atcctgctgt cctggagaag tgcagagtta gaacagctgt ggccacttgc 2760
atccaatcat caatcttgaa tcacagggac tctttcttaa gtaaacatta tacctggccg 2820
ggcacggtgg ctcacgcctg taatcccagc actttgggat gccaaagtgg gcatatcatc 2880
tgaggtcagg agttcaagac cagcctggcc aacatggcaa aactccgtct ttatgaaaaa 2940
tacaaaaatt agccaggcat ggtggcaggc gcctgtaatc ccagctaatt gggaggctga 3000
ggctggagaa tcccttgaat ctaggaggca gaggttgcag tgagctgaga tcgtgccatt 3060
gcactccagc ctgggtgaca agagtaaaac tctgtctcaa aaaaaaaaaa ttatacctac 3120
attctcttct tatcagagaa aaaaatctac agtgagcttt tcaaaaagtt tttacaaact 3180
ttttgccatt taatttcagt taggagtttt ccctacttct gacttagttg aggggaaatg 3240
ttcataacat gtttataaca tgtttatgtg tgttagttgg tgggggtgta ttactttgcc 3300
atgccatttg tttcctccat gcgtaactta atccagactt tcacacctta taggaaaacc 3360
agtgagtctg gagagctgca tgggctcaca actgaggagg aatttgtaga agggatatac 3420
aaagtggaaa tagacaccaa atcttactgg aaggcacttg gcatctcccc attccatgag 3480
catgcagagg tgagtataca gaccttcgag ggttgttttg gttttggttt ttgcttttgg 3540
cattccagga aatgcacagt tttactcagt gtaccacaga aatgtcctaa ggaaggtgat 3600
gaatgaccaa aggttccctt tcctattata caagaaaaaa ttcacaacac tctgagaagc 3660
aaatttcttt ttgactttga tgaaaatcca cttagtaaca tgacttgaac ttacatgaaa 3720
ctactcatag tctattcatt ccactttata tgaatattga tgtatctgct gttgaaataa 3780
tagtttatga ggcagccctc cagaccccac gtagagtgta tgtaacaaga gatgcaccat 3840
tttatttctc gaaaacccgt aacattcttc attccaaaac acatctggct tctcggaggt 3900
ctggacaagt gattcttggc aacacatacc tatagagaca ataaaatcaa agtaataatg 3960
gcaacacaat agataacatt taccaagcat acaccatgtg gcagacacaa ttataagtgt 4020
tttccatatt taacctactt aatcctcagg aataagccac tgaggtcagt cctattatta 4080
tccccatctt atagatgaag aaaatgaggc accaggaagt caaataactt gtcaaaggtc 4140
acaagactag gaaatacaca agtagaaatg tttacaatta aggcccaggc tgggtttgcc 4200
ctcagttctg ctatgcctcg cattatgccc caggaaactt tttcccttgt gaaagccaag 4260
cttaaaaaaa gaaaagccac atttgtaacg tgctctgttc ccctgcctat ggtgaggatc 4320
ttcaaacagt tatacatgga cccagtcccc ctgccttctc cttaatttct taagtcattt 4380
gaaacagatg gctgtcatgg aaatagaatc cagacatgtt ggtcagagtt aaagatcaac 4440
taattccatc aaaaatagct cggcatgaaa gggaactatt ctctggctta gtcatggatg 4500
agactttcaa ttgctataaa gtggttcctt tattagacaa tgttaccagg gaaacaacag 4560
gggtttgttt gacttctggg gcccacaagt caacaagaga gccccatcta ccaaggagca 4620
tgtccctgac tacccctcag ccagcagcaa gacatggacc ccagtcaggg caggagcagg 4680
gtttcggcgg cgcccagcac aagacattgc ccctagagtc tcagccccta ccctcgagta 4740
atagatctgc ctacctgaga ctgttgtttg cccaagagct gggtctcagc ctgatgggaa 4800
ccatataaaa aggttcactg acatactgcc cacatgttgt tctctttcat tagatcttag 4860
cttccttgtc tgctcttcat tcttgcagta ttcattcaac aaacattaaa aaaaaaaaaa 4920
agcattctat gtgtggaaca ctctgctaga tgctgtggat ttagaaatga aaatacatcc 4980
cgacccttgg aatggaaggg aaaggactga agtaagacag attaagcagg accgtcagcc 5040
cagcttgaag cccagataaa tacggagaac aagagagagc gagtagtgag agatgagtcc 5100
caatgcctca ctttggtgac gggtgcgtgg tgggcttcat gcagcttctt ctgataaatg 5160
cctccttcag aactggtcaa ctctaccttg gccagtgacc caggtggtca tagtagattt 5220
accaagggaa aatggaaact tttattagga gctcttaggc ctcttcactt catggatttt 5280
tttttccttt ttttttgaga tggagttttg ccctgtcacc caggctggaa tgcagtggtg 5340
caatctcagc tcactgcaac ctccgcctcc caggttcaag caattctcct gcctcagcct 5400
cccgagtagc tgggactaca ggtgtgcgcc accacaccag gctaattttt gtattttttg 5460
taaagacagg ttttcaccac gttggccagg ctggtctgaa ctccagacct caggtgattc 5520
acctgtctca gcctcccaaa gtgctgggat tacaggtgtg agccaccgtg cccggctact 5580
tcatggattt ttgattacag attatgcctc ttacaatttt taagaagaat caagtgggct 5640
gaaggtcaat gtcaccataa gacaaaagac atttttatta gttgattcta gggaattggc 5700
cttaagggga gccctttctt cctaagagat tcttaggtga ttctcacttc ctcttgcccc 5760
agtattattt ttgtttttgg tatggctcac tcagatcctt ttttcctcct atccctaagt 5820
aatccgggtt tctttttccc atatttagaa caaaatgtat ttatgcagag tgtgtccaaa 5880
cctcaaccca aggcctgtat acaaaataaa tcaaattaaa cacatcttta ctgtcttcta 5940
cctctttcct gacctcaata tatcccaact tgcctcactc tgagaaccaa ggctgtccca 6000
gcacctgagt cgcagatatt ctactgattt gacagaactg tgtgactatc tggaacagca 6060
ttttgatcca caatttgccc agttacaaag cttaaatgag ctctagtgca tgcatatata 6120
tttcaaaatt ccaccatgat cttccacact ctgtattgta aatagagccc tgtaatgctt 6180
ttacttcgta tttcattgct tgttatacat aaaaatatac ttttcttctt catgttagaa 6240
aatgcaaaga ataggagggt gggggaatct ctgggcttgg agacaggaga cttgccttcc 6300
tactatggtt ccatcagaat gtagactggg acaatacaat aattcaagtc tggtttgctc 6360
atctgtaaat tgggaagaat gtttccagct ccagaatgct aaatctctaa gtctgtggtt 6420
ggcagccact attgcagcag ctcttcaatg actcaatgca gttttgcatt ctccctacct 6480
tttttttcta aaaccaataa aatagataca gcctttaggc tttctgggat ttcccttagt 6540
caagctaggg tcatcctgac tttcggcgtg aatttgcaaa acaagacctg actctgtact 6600
cctgctctaa ggactgtgca tggttccaaa ggcttagctt gccagcatat ttgagctttt 6660
tccttctgtt caaactgttc caaaatataa aagaataaaa ttaattaagt tggcactgga 6720
cttccggtgg tcagtcatgt gtgtcatctg tcacgttttt cgggctctgg tggaaatgga 6780
tctgtctgtc ttctctcata ggtggtattc acagccaacg actccggccc ccgccgctac 6840
accattgccg ccctgctgag cccctactcc tattccacca cggctgtcgt caccaatccc 6900
aaggaatgag ggacttctcc tccagtggac ctgaaggacg agggatggga tttcatgtaa 6960
ccaagagtat tccattttta ctaaagcagt gttttcacct catatgctat gttagaagtc 7020
caggcagaga caataaaaca ttcctgtgaa aggcactttt cattccactt taacttgatt 7080
ttttaaattc ccttattgtc ccttccaaaa aaaagagaat caaaatttta caaagaatca 7140
aaggaattct agaaagtatc tgggcagaac gctaggagag atccaaattt ccattgtctt 7200
gcaagcaaag cacgtattaa atatgatctg cagccattaa aaagacacat tctgtaaa 7258
<210> 4
<211> 938
<212> DNA
<213> 智人
<400> 4
gttgactaag tcaataatca gaatcagcag gtttgcagtc agattggcag ggataagcag 60
cctagctcag gagaagtgag tataaaagcc ccaggctggg agcagccatc acagaagtcc 120
actcattctt ggcaggatgg cttctcatcg tctgctcctc ctctgccttg ctggactggt 180
atttgtgtct gaggctggcc ctacgggcac cggtgaatcc aagtgtcctc tgatggtcaa 240
agttctagat gctgtccgag gcagtcctgc catcaatgtg gccgtgcatg tgttcagaaa 300
ggctgctgat gacacctggg agccatttgc ctctgggaaa accagtgagt ctggagagct 360
gcatgggctc acaactgagg aggaatttgt agaagggata tacaaagtgg aaatagacac 420
caaatcttac tggaaggcac ttggcatctc cccattccat gagcatgcag aggtggtatt 480
cacagccaac gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc 540
ctattccacc acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga 600
cctgaaggac gagggatggg atttcatgta accaagagta ttccattttt actaaagcag 660
tgttttcacc tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga 720
aaggcacttt tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa 780
aaaaagagaa tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa 840
cgctaggaga gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct 900
gcagccatta aaaagacaca ttctgtaaaa aaaaaaaa 938
<210> 5
<211> 9077
<212> DNA
<213> Mus 肌肉
<400> 5
ctaatctccc taggcaaggt tcatatttgt gtaggttact tattctcctt ttgttgacta 60
agtcaataat cagaatcagc aggtttggag tcagcttggc agggatcagc agcctgggtt 120
ggaaggaggg ggtataaaag ccccttcacc aggagaagcc gtcacacaga tccacaagct 180
cctgacagga tggcttccct tcgactcttc ctcctttgcc tcgctggact ggtatttgtg 240
tctgaagctg gccccgcggt gagtgatcct gtgagcgatc cagacatggc agttagacct 300
tagataaaga agaagtgcct tcttccagat gtgagaacta gagtactcag actctatatt 360
taccattaga ctccaaagag aagagctgga gtgcctctgg ctcttccttc tattgcttta 420
gcgcattggg tctgtagtgc tcagtctctg gtgtccttag ataataaaga tatgagatta 480
acatagaaat aaagatataa aagggctgga tgtatagttt agtggtccag tgtatgccta 540
gtatgtgaaa agccttctgt tcaacctcta gcaatagaaa aacaagatat attctcggtg 600
gggctgttaa tattgaattc tcataaaatc tttaatatat ttagtatgcc tattatgttg 660
ttatatttta gttctttagc taatcaaaat gcattattga tctttctttg tctttttttg 720
gccaacactc tattccagtc tttgaaaaag tcctttaaaa gagttaatca gtataattaa 780
atgagtcagg aagtatgtga gggttatttt acaaccagag ggaattacta tagcaacagc 840
tgattagaat gatctcaaga aaaagcccat tctgtctttt tgcaccatgc acctttcagt 900
ggctccattc agatggagag gcaaacagag caatggctct cagagggcct attttccctt 960
tgaacattca ttatccatat ccctggtgca cagcagtgca tctgggggca gaaactgttc 1020
ttgctttgga aacaatgctg tctatgtcat actggataaa gaagctcatt aattgtcaac 1080
acttatgtta tcataatggg atcagcatgt acttttggtt ttgttccaga gtctatcacc 1140
ggaaagaaca agccggttta ctctgaccca tttcactgac atttctcttg tctcctctgt 1200
gcccagggtg ctggagaatc caaatgtcct ctgatggtca aagtcctgga tgctgtccga 1260
ggcagccctg ctgtagacgt ggctgtaaaa gtgttcaaaa agacctctga gggatcctgg 1320
gagccctttg cctctgggta agcttgtaga aagcccacca tgggaccggt tccaggttcc 1380
catttgctct tattcgtgtt agattcagac acacacaact taccagctag agggctcaga 1440
gagagggctc aggggcgaag ggcacgtatt gctcttgtaa gagacacagg tttaattcct 1500
agcaccagaa tggcagctca taaccatctg aaactcacag tcttaggaga tctgggtatc 1560
tgacattctc ttctacccac catgtgtgtg gtgcacaaat tcacatgcag gcatcaaatc 1620
ttataaacaa caacaaaaaa ccaacaaacc tggtagcaaa agaagattag aaggttaaac 1680
atatgagccg agagcttttg ttttgttttg ttttgttttg ttttgtttac atttcaaatg 1740
ttatcccctt tctcggtccc cctccccaaa ccctctaccc cattctctcc tccccttctt 1800
ctatgagggt gttccccacc aacccactcc caccttcctg ctctcgaatt cccctatact 1860
gggacatcaa gccttcacag aatcaagggc ctctcctccc attgatgccc gacaatgtca 1920
tcctctgcta cctatgtggc tggagccatg ggtcccttca tgtatcctcc ttggttggtg 1980
gtttagtctc tgggaggtct gggggatctg gttgattgat attattgttc ttcctatgag 2040
attgcaaacc ccttcagctc cttcggtcct ttaactcctc cactggggac cccgagctca 2100
gtccaatggt tggctgtgag catccaccag cagaggcctt tttttttttt tttaacaaag 2160
ctgctttatt atgttgctta gagcatgacc aggaaccaga gcacagtcca agactgaagg 2220
gaggaaaagg gggggagtca ataaccccac tgtttcatag tggtttgcaa cccttttata 2280
tcacagccca ctttaggcaa ataatgaaaa ttatagtctc cagggacaga gaagatggtg 2340
caggaagtga agtgcctgct cagaaaatgg gggcttgaat gtgagttccc agactctgtg 2400
taagatgccc agcatcgaag tgcatgctta taacaccagc ctggaggtag aagcttagaa 2460
acaggggtac cctgaagttg cttgttcacc agtgtccctg aatgggtagg tgcatgtttg 2520
gtgagagacc ctgtctcaaa aatcaaggtg taggataatt gaaaatacct agctttgagc 2580
ttagatcatg caaatgtgta cacacactca cacacaccac acacacaaaa aaatgcagag 2640
acagagagat acagagagac agagagatac agagacagag acagagagaa aaggagaaag 2700
taaaaaacaa ataatttaaa gacccatggc cacaaagagg ctcaaagaca agcacgtata 2760
aaaccataca catgtaattt taggagtttt cagattccct ggtacccgtg ggtgatgcac 2820
aagctttgaa tcccagtctt aaaatcttac gaagaacgtg ttcgtgtgtg ctaatttatt 2880
gatgagagga aaggaattga caaagtgccc ttccggagct tcctgcatta cccagactca 2940
gggttttttt aaatgtacac tcagaacaga gtagctctgt gcaagggtag caaccacgaa 3000
gcttaataag aaacatatcg tgagagatct gcaaggcaaa tctaggggct gaccaatctc 3060
acagtcaccc actagcatgt caacacaact tcccacctgt gctagccact tagcaatttt 3120
gtgttgttct gttttgtttt tgtttttaac aaagcaattt caaagagatt tctaattcat 3180
ctaaacaaac aaaccaaaag gaaaacagca aagacgccct gagcacttag cagagcagct 3240
atgcagttat gactcctggg tggagacttt atatcaggct tcaactgaat acctagaacc 3300
tactagtgct cttcatcaat ccttgggaag gtcattttct tttggtgctg ttttgagttt 3360
ctatttgtta atgtcttcat aattatacac gtgttgagca cagcatgcaa agtgattagg 3420
ggaatctagt tggagtggaa tggataccca aatattcaga ctttcttgtg actcttcttt 3480
cttgtaccca catcaaaaaa aaaaaaaatg gagatgagac atggtcagag tcactaaaac 3540
cagctgctac ttttaattac gtggggagca gtttctaaca ttgccattat tgaactgatg 3600
ctgcctgggt ggaaatggaa atcacttagt atttcttgtt ggcaaagaat tactgaatgg 3660
attaaatttc caaagggaga agtcagttac aagtcttttc tttgtttatt aggctttctg 3720
ctatgataaa ttacactact tccagaagtt acccttaggc catgggacac tggactatca 3780
ctctgctgtc acaagagatt acagagttag tcaaggcagc ttgtgacacc ttcagggact 3840
gtcataaact tccagcaagt cattaatcct gaatgcaata ctgtgtgtgt gtgtctatgt 3900
gtgtttgtat gtctgtgtgt gtcttatgtc tgtgtctctg tgtgtgtgtg tgtttgtgtg 3960
tgtgtgtgta tgtatgcctg tgtgtgtctt atgtctgtgt ttgtgtgtct gtgtgtgtct 4020
tatgtctgtg tttgtatgtc tgtgtgtgtc tgtgtgtgtc ttatgtctgt gtctctgtgt 4080
gtgtgtgtgt gtatgtatgt atgtatgtat gtatgtgtat gtgtttgcat ctctctgtgt 4140
gtctgcgctt atatatttgt gtatgtgttt atgtgttcgc ctttgtgcgt tgttggggat 4200
tgaatccagg ggaatacaaa tgttaagaaa gaacgttacc actaagcttc acctgtaggc 4260
cttaaagctt ttctttcttt taaaaattgt aattaattca ttttcagtca ggatctccac 4320
acctcgtccc tgctgctcta gaactcacta tttaaacaca atcgccctca aacctgcagc 4380
aaccctcccg cctctaccct gcgagcacta gaataataac aggtgacccc acacgcctag 4440
attaagacct ttaaggtaaa cattttacta tattttagtc tcataagaca agatgctaca 4500
ataaagctgt acataaagtt ccctcgaatt tcttgctatt ttaactcaaa cataaggatt 4560
tcctcctttt tgattcaggt aacagaaaaa atacacaggt acatacatgt acacacatga 4620
acacacacgc atcacaacca catatgcgca cgcttgtgtg atctatcatt taccatgcca 4680
ctgaactctt ctttccccat aaattcctct ggacttgtgt gccctccagg aagaccgcgg 4740
agtctggaga gctgcacggg ctcaccacag atgagaagtt tgtagaagga gtgtacagag 4800
tagaactgga caccaaatcg tactggaaga cacttggcat ttccccgttc catgaattcg 4860
cggatgtaag tggacacacc aagttgtttg gattttgttt ttagtctcag gaaattccct 4920
tcgctcttgc tgtacgatgg gcatgagtgg aaagtagatt ccacagccag aatccacagt 4980
gctgggaaag caagccttct gaatttttct aaaactcatt tagcaacatg gcctgaacct 5040
gttcacactg cttatggtca gctaactata tttatgtaaa tattcatttc tctgttgagg 5100
aaatgttagt atttgctttt gaggcaacct ccagatacca tggagggcat gtcatagtca 5160
aagagagggc tccctatggt atttctctaa attctggcat ttcctttatt ccaaagcaca 5220
tctagtgtcc ccagaagttt gggtagacaa ttcttggcaa cacagagaat tacaacatgt 5280
tcaaaaccca acagcttaat atctaaatca tcaagcaaac atcacatggc aaagggattt 5340
ctgaatcaaa actgtttcat ccttatgatc aacctatgga ggtctagcct cgacttacac 5400
ccattttacc aataagctaa gagaagctaa gttcctcatc aaggacacaa ggctagcatg 5460
tgtgagcaag tgacagagtt gccctctatg ttggttagtg tgccttagcc agtgtctcag 5520
taagaaatgg agctaaatca aaacccaagg ccaacagcca aaggcacatg agtaaccttt 5580
gcttggcact gggctcagtt tccctggctc ctctcagtcc tcagttcaca gaggcagctg 5640
tcatgcaaat agaatccaag cttgttggtc agacctggag ataacaaatt ccatcaaaaa 5700
tagctcctca tgtgacctag tttgctgtct gttgctatga tacacaccat gaccgaaaag 5760
caaccctggg gagagaaggg tttatttcat cttacagctt acagttcacc atggaggaaa 5820
gccaggtggg aacctggaag tggaaattga agcagagacc agaaaggaat gctgtttact 5880
ggctggctta gctccttttc ttatacagct taggtctatg tgcccagggg atggtactgc 5940
cgagcatagg ctgagcccgc ctacatcaac cattagtcaa aaaaaggtcc atagacttgc 6000
ctacaggcca atctcatgga ggcaataccc cagtggaggg tccctcttcg caggttactc 6060
tagtttgtgt caagttgaca aaacctaacc acaaagcaca aacagggtct gcccttgtgg 6120
cttagccatg gatgacactc tcagatgatg gtgttaccag acaaaccaga ggggctcacc 6180
aagagtctgc cacctaccaa ggtagtactc tactcctcac tgggcaccaa cacccatatt 6240
agctgggcca gtacaggacc cttgctgttt cctgcatgaa ttgtccatag accctgggtc 6300
tcagcctgcc gggagtacct gtaagtagtc gcctcaaaca cattattcct gttggaagac 6360
ttgtctgatt ctcttttaga actcaatcaa caaacgtttt tattttgttt tggctttttg 6420
gagacaagat ctctcatagg ccagcctgac ttgaatgtag ctgaggatga cctgtgctgc 6480
taatcttctc gcctcttcct cccaagtggt aggataatag gcataagaca ccacagcagt 6540
tttactccat accagggctc tgaacccaga ctttaaacac tctatcaact gattcacatt 6600
cccaccccat cattcaacaa acatttgaaa aataaaaccc ttctgccttg agcactctgc 6660
taaatacagc ctttgagtgc ggagtatttc ctcacaacca gggtccaaga tgaccccatc 6720
atacatacca cggaaaatta ggagatgttt ttaggtctct ttgcttgggg taatttttat 6780
gtgtgtgtgt acacagccct gtgcgtgtgt gtgtgtgtgt gtgtgtgtgt gtacaggcac 6840
acacgtgtat gcatgtagag gctacataaa aaccttaggt gtcattctca ggcactctgt 6900
tcaccccttc acacagcccg aacacacaaa atttgaggca ttagcctgga gctcaccagt 6960
taggctagac tgacttgcca gcagacccca ggctgtctcc atctccccag ctctgggatt 7020
acaaactcta tcataccaga catttttata catattctga gcataaaatt catgtcttca 7080
ggctaacaag tcaagagctt aaatgactga gctctcttac gtggtggatt ttttttaaaa 7140
ctacataata tctttttttt ttttttcact tctggggaag aaacaaatga gcctgagtga 7200
caatgcgaca gaaaagaaat tttgaggagt gtgtgtgtct gtgtgtgtgg tggcacatgc 7260
ctctcatcta atgctagagg ctacagtaga atgctcctga attagtggcc agccaaggcc 7320
aagggctagg gttgtaactc agtggcagag ggcttgccta gcattcgcag gatttgatcc 7380
atagcgctat aaataataat aaataaatac aacagtctaa gatgattctc cctttcattt 7440
atctggatgt tatttttgtg ttagttttac tctgtcatcc aatcattgtt tgccctatat 7500
ttggacattt aaaaaaaatc tttattccaa gtgtgttcaa agctgtatcc aaaacctgtc 7560
caccaaatga gtccaatgac atacatcttc tatattacca tctgttccag atttggctga 7620
ctcccggcac ctgggctgtt gctgcaccca tgtctcagat agtctagtga tttgagaagt 7680
gactagtaat tgcaaaatcc agactttgtc cagaaacttc tatgagctcc aaaactttca 7740
tttacatttc tgccagccac aaaccgcttg tgttgtggag agaaccctgt gatgtcttcc 7800
cacagcatct cagccttgtt tcttccctta aaatattcat cttttcacat tagaacatgc 7860
aaagggacag tgggagcgaa acccctggac tgggacgcac gaagccttcc tttctggtca 7920
ggctctcact gtagaaactt aggccggttt cagcatgcag tctgctggag aatggctcct 7980
gccaacattc caggtctgga agtttgtagt ggagttgttg ataaccactg ttcgccacag 8040
gtcttttgtt tgtgggtgtc agtgtttcta ctctcctgac ttttatctga acccaagaaa 8100
gggaacaata gccttcaagc tctctgtgac tctgatctga ccagggccac ccacactgca 8160
gaaggaaact tgcaaagaga gacctgcaat tctctaagag ctccacacag ctccaaagac 8220
ttaggcagca tattttaatc taattattcg tcccccaacc ccaccccaga ggacagttag 8280
acaataaaag gaagattacc agcttagcat cctgtgaaca ctttgtctgc agctcctacc 8340
tctgggctct gttagaacta gctgtctctc ctctctccta ggtggttttc acagccaacg 8400
actctggcca tcgccactac accatcgcag ccctgctcag cccatactcc tacagcacca 8460
cggctgtcgt cagcaacccc cagaattgag agactcagcc caggaggacc aggatcttgc 8520
caaagcagta gcatcccatt tgtaccaaaa cagtgttctt gctctataaa ccgtgttagc 8580
agctcaggaa gatgccgtga agcattctta ttaaaccacc tgctatttca ttcaaactgt 8640
gtttcttttt tatttcctca tttttctccc ctgctcctaa aacccaaaat cttctaaaga 8700
attctagaag gtatgcgatc aaacttttta aagaaagaaa atactttttg actcatggtt 8760
taaaggcatc ctttccatct tggggaggtc atgggtgctc ctggcaactt gcttgaggaa 8820
gataggtcag aaagcagagt ggaccaaccg ttcaatgttt tacaagcaaa acatacacta 8880
agcatggtct gtagctatta aaagcacaca atctgaaggg ctgtagatgc acagtagtgt 8940
tttcccagag catgttcaaa agccctgggt tcaatcacaa tactgaaaag taggccaaaa 9000
aacattctga aaatgaaata tttgggtttt tttttataac ctttagtgac taaataaaga 9060
caaatctaag agactaa 9077
<210> 6
<211> 147
<212> PRT
<213> Mus 肌肉
<400> 6
Met Ala Ser Leu Arg Leu Phe Leu Leu Cys Leu Ala Gly Leu Val Phe
1 5 10 15
Val Ser Glu Ala Gly Pro Ala Gly Ala Gly Glu Ser Lys Cys Pro Leu
20 25 30
Met Val Lys Val Leu Asp Ala Val Arg Gly Ser Pro Ala Val Asp Val
35 40 45
Ala Val Lys Val Phe Lys Lys Thr Ser Glu Gly Ser Trp Glu Pro Phe
50 55 60
Ala Ser Gly Lys Thr Ala Glu Ser Gly Glu Leu His Gly Leu Thr Thr
65 70 75 80
Asp Glu Lys Phe Val Glu Gly Val Tyr Arg Val Glu Leu Asp Thr Lys
85 90 95
Ser Tyr Trp Lys Thr Leu Gly Ile Ser Pro Phe His Glu Phe Ala Asp
100 105 110
Val Val Phe Thr Ala Asn Asp Ser Gly His Arg His Tyr Thr Ile Ala
115 120 125
Ala Leu Leu Ser Pro Tyr Ser Tyr Ser Thr Thr Ala Val Val Ser Asn
130 135 140
Pro Gln Asn
145
<210> 7
<211> 1237
<212> DNA
<213> Mus 肌肉
<400> 7
ctaatctccc taggcaaggt tcatatttgt gtaggttact tattctcctt ttgttgacta 60
agtcaataat cagaatcagc aggtttggag tcagcttggc agggatcagc agcctgggtt 120
ggaaggaggg ggtataaaag ccccttcacc aggagaagcc gtcacacaga tccacaagct 180
cctgacagga tggcttccct tcgactcttc ctcctttgcc tcgctggact ggtatttgtg 240
tctgaagctg gccccgcggg tgctggagaa tccaaatgtc ctctgatggt caaagtcctg 300
gatgctgtcc gaggcagccc tgctgtagac gtggctgtaa aagtgttcaa aaagacctct 360
gagggatcct gggagccctt tgcctctggg aagaccgcgg agtctggaga gctgcacggg 420
ctcaccacag atgagaagtt tgtagaagga gtgtacagag tagaactgga caccaaatcg 480
tactggaaga cacttggcat ttccccgttc catgaattcg cggatgtggt tttcacagcc 540
aacgactctg gccatcgcca ctacaccatc gcagccctgc tcagcccata ctcctacagc 600
accacggctg tcgtcagcaa cccccagaat tgagagactc agcccaggag gaccaggatc 660
ttgccaaagc agtagcatcc catttgtacc aaaacagtgt tcttgctcta taaaccgtgt 720
tagcagctca ggaagatgcc gtgaagcatt cttattaaac cacctgctat ttcattcaaa 780
ctgtgtttct tttttatttc ctcatttttc tcccctgctc ctaaaaccca aaatcttcta 840
aagaattcta gaaggtatgc gatcaaactt tttaaagaaa gaaaatactt tttgactcat 900
ggtttaaagg catcctttcc atcttgggga ggtcatgggt gctcctggca acttgcttga 960
ggaagatagg tcagaaagca gagtggacca accgttcaat gttttacaag caaaacatac 1020
actaagcatg gtctgtagct attaaaagca cacaatctga agggctgtag atgcacagta 1080
gtgttttccc agagcatgtt caaaagccct gggttcaatc acaatactga aaagtaggcc 1140
aaaaaacatt ctgaaaatga aatatttggg ttttttttta taacctttag tgactaaata 1200
aagacaaatc taagagacta aaaaaaaaaa aaaaaaa 1237
<210> 8
<211> 82
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 8
guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60
aaaaguggca ccgagucggu gc 82
<210> 9
<211> 76
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 9
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 10
<211> 86
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 10
guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60
uugaaaaagu ggcaccgagu cggugc 86
<210> 11
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (2)..(21)
<223> n = A, T, C, or G
<400> 11
gnnnnnnnnn nnnnnnnnnn ngg 23
<210> 12
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(21)
<223> n = A, T, C, or G
<400> 12
nnnnnnnnnn nnnnnnnnnn ngg 23
<210> 13
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (3)..(23)
<223> n = A, T, C, or G
<400> 13
ggnnnnnnnn nnnnnnnnnn nnngg 25
<210> 14
<211> 12208
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(97)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (98)..(7298)
<223> 人序列
<220>
<221> misc_feature
<222> (7299)..(12108)
<223> SDC Neo 盒
<220>
<221> misc_feature
<222> (12109)..(12208)
<223> 小鼠序列
<400> 14
agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 60
gagaagccgt cacacagatc cacaagctcc tgacaggatg gcttctcatc gtctgctcct 120
cctctgcctt gctggactgg tatttgtgtc tgaggctggc cctacggtga gtgtttctgt 180
gacatcccat tcctacattt aagattcacg ctaaatgaag tagaagtgac tccttccagc 240
tttgccaacc agcttttatt actagggcaa gggtacccag catctatttt taatataatt 300
aattcaaact tcaaaaagaa tgaagttcca ctgagcttac tgagctggga cttgaactct 360
gagcattcta cctcattgct ttggtgcatt aggtttgtaa tatctggtac ctctgtttcc 420
tcagatagat gatagaaata aagatatgat attaaggaag ctgttaatac tgaattttca 480
gaaaagtatc cctccataaa atgtatttgg gggacaaact gcaggagatt atattctggc 540
cctatagtta ttcaaaacgt atttattgat taatctttaa aaggcttagt gaacaatatt 600
ctagtcagat atctaattct taaatcctct agaagaatta actaatacta taaaatgggt 660
ctggatgtag ttctgacatt attttataac aactggtaag agggagtgac tatagcaaca 720
actaaaatga tctcaggaaa acctgtttgg ccctatgtat ggtacattac atcttttcag 780
taattccact caaatggaga cttttaacaa agcaactgtt ctcaggggac ctattttctc 840
ccttaaaatt cattatacac atccctggtt gatagcagtg tgtctggagg cagaaaccat 900
tcttgctttg gaaacaatta cgtctgtgtt atactgagta gggaagctca ttaattgtcg 960
acacttacgt tcctgataat gggatcagtg tgtaattctt gtttcgctcc agatttctaa 1020
taccacaaag aataaatcct ttcactctga tcaattttgt taacttctca cgtgtcttct 1080
ctacacccag ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt 1140
ccgaggcagt cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac 1200
ctgggagcca tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta 1260
tcttcccgtt tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac 1320
aagtagattg aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt 1380
gttttgctta gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag 1440
aaaagaagga atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag 1500
aacactttat gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac 1560
acacacatac aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg 1620
ggtaacacca aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt 1680
aacccattaa caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt 1740
taatatggat cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg 1800
tgtgcaaggc tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc 1860
atgaggcaaa gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg 1920
gcttctcacc ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca 1980
aaaacttcaa ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa 2040
tcaggagacc ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag 2100
aagaatttct gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt 2160
gggaagatca ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg 2220
tttatataaa atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga 2280
cagaatggac accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa 2340
aaaaaaaaag aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa 2400
ctgctatttt tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa 2460
ctatggagct ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag 2520
ttatcagaga ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac 2580
tttaggtttt ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag 2640
ctatcctcac accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt 2700
agaacagctg tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta 2760
agtaaacatt atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga 2820
tgccaaagtg ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca 2880
aaactccgtc tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat 2940
cccagctaat tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca 3000
gtgagctgag atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca 3060
aaaaaaaaaa attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt 3120
ttcaaaaagt ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc 3180
tgacttagtt gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg 3240
gtgggggtgt attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact 3300
ttcacacctt ataggaaaac cagtgagtct ggagagctgc atgggctcac aactgaggag 3360
gaatttgtag aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt 3420
ggcatctccc cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt 3480
ggttttggtt tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag 3540
aaatgtccta aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa 3600
attcacaaca ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac 3660
atgacttgaa cttacatgaa actactcata gtctattcat tccactttat atgaatattg 3720
atgtatctgc tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt 3780
atgtaacaag agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa 3840
cacatctggc ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac 3900
aataaaatca aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt 3960
ggcagacaca attataagtg ttttccatat ttaacctact taatcctcag gaataagcca 4020
ctgaggtcag tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag 4080
tcaaataact tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt 4140
aaggcccagg ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact 4200
ttttcccttg tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt 4260
cccctgccta tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct 4320
ccttaatttc ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt 4380
tggtcagagt taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat 4440
tctctggctt agtcatggat gagactttca attgctataa agtggttcct ttattagaca 4500
atgttaccag ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag 4560
agccccatct accaaggagc atgtccctga ctacccctca gccagcagca agacatggac 4620
cccagtcagg gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt 4680
ctcagcccct accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc 4740
tgggtctcag cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg 4800
ttctctttca ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa 4860
caaacattaa aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga 4920
tttagaaatg aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca 4980
gattaagcag gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag 5040
cgagtagtga gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca 5100
tgcagcttct tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac 5160
ccaggtggtc atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg 5220
cctcttcact tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac 5280
ccaggctgga atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa 5340
gcaattctcc tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca 5400
ggctaatttt tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga 5460
actccagacc tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt 5520
gagccaccgt gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt 5580
ttaagaagaa tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt 5640
agttgattct agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg 5700
attctcactt cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct 5760
tttttcctcc tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta 5820
tttatgcaga gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa 5880
acacatcttt actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact 5940
ctgagaacca aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact 6000
gtgtgactat ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga 6060
gctctagtgc atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt 6120
aaatagagcc ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata 6180
cttttcttct tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg 6240
gagacaggag acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa 6300
taattcaagt ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc 6360
taaatctcta agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc 6420
agttttgcat tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg 6480
ctttctggga tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa 6540
aacaagacct gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct 6600
tgccagcata tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa 6660
attaattaag ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt 6720
tcgggctctg gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac 6780
gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc 6840
acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac 6900
gagggatggg atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc 6960
tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt 7020
tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa 7080
tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga 7140
gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta 7200
aaaagacaca ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa 7260
aagacacatt ccaagggccc acttctttac tgtgggcact cgagataact tcgtataatg 7320
tatgctatac gaagttatat gcatgccagt agcagcaccc acgtccacct tctgtctagt 7380
aatgtccaac acctccctca gtccaaacac tgctctgcat ccatgtggct cccatttata 7440
cctgaagcac ttgatggggc ctcaatgttt tactagagcc cacccccctg caactctgag 7500
accctctgga tttgtctgtc agtgcctcac tggggcgttg gataatttct taaaaggtca 7560
agttccctca gcagcattct ctgagcagtc tgaagatgtg tgcttttcac agttcaaatc 7620
catgtggctg tttcacccac ctgcctggcc ttgggttatc tatcaggacc tagcctagaa 7680
gcaggtgtgt ggcacttaac acctaagctg agtgactaac tgaacactca agtggatgcc 7740
atctttgtca cttcttgact gtgacacaag caactcctga tgccaaagcc ctgcccaccc 7800
ctctcatgcc catatttgga catggtacag gtcctcactg gccatggtct gtgaggtcct 7860
ggtcctcttt gacttcataa ttcctagggg ccactagtat ctataagagg aagagggtgc 7920
tggctcccag gccacagccc acaaaattcc acctgctcac aggttggctg gctcgaccca 7980
ggtggtgtcc cctgctctga gccagctccc ggccaagcca gcaccatggg aacccccaag 8040
aagaagagga aggtgcgtac cgatttaaat tccaatttac tgaccgtaca ccaaaatttg 8100
cctgcattac cggtcgatgc aacgagtgat gaggttcgca agaacctgat ggacatgttc 8160
agggatcgcc aggcgttttc tgagcatacc tggaaaatgc ttctgtccgt ttgccggtcg 8220
tgggcggcat ggtgcaagtt gaataaccgg aaatggtttc ccgcagaacc tgaagatgtt 8280
cgcgattatc ttctatatct tcaggcgcgc ggtctggcag taaaaactat ccagcaacat 8340
ttgggccagc taaacatgct tcatcgtcgg tccgggctgc cacgaccaag tgacagcaat 8400
gctgtttcac tggttatgcg gcggatccga aaagaaaacg ttgatgccgg tgaacgtgca 8460
aaacaggtaa atataaaatt tttaagtgta taatgatgtt aaactactga ttctaattgt 8520
ttgtgtattt taggctctag cgttcgaacg cactgatttc gaccaggttc gttcactcat 8580
ggaaaatagc gatcgctgcc aggatatacg taatctggca tttctgggga ttgcttataa 8640
caccctgtta cgtatagccg aaattgccag gatcagggtt aaagatatct cacgtactga 8700
cggtgggaga atgttaatcc atattggcag aacgaaaacg ctggttagca ccgcaggtgt 8760
agagaaggca cttagcctgg gggtaactaa actggtcgag cgatggattt ccgtctctgg 8820
tgtagctgat gatccgaata actacctgtt ttgccgggtc agaaaaaatg gtgttgccgc 8880
gccatctgcc accagccagc tatcaactcg cgccctggaa gggatttttg aagcaactca 8940
tcgattgatt tacggcgcta aggatgactc tggtcagaga tacctggcct ggtctggaca 9000
cagtgcccgt gtcggagccg cgcgagatat ggcccgcgct ggagtttcaa taccggagat 9060
catgcaagct ggtggctgga ccaatgtaaa tattgtcatg aactatatcc gtaacctgga 9120
tagtgaaaca ggggcaatgg tgcgcctgct ggaagatggc gattaggcgg ccggccgcta 9180
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 9240
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 9300
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 9360
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatcccccgg 9420
ctagagttta aacactagaa ctagtggatc ccccgggatc atggcctccg cgccgggttt 9480
tggcgcctcc cgcgggcgcc cccctcctca cggcgagcgc tgccacgtca gacgaagggc 9540
gcagcgagcg tcctgatcct tccgcccgga cgctcaggac agcggcccgc tgctcataag 9600
actcggcctt agaaccccag tatcagcaga aggacatttt aggacgggac ttgggtgact 9660
ctagggcact ggttttcttt ccagagagcg gaacaggcga ggaaaagtag tcccttctcg 9720
gcgattctgc ggagggatct ccgtggggcg gtgaacgccg atgattatat aaggacgcgc 9780
cgggtgtggc acagctagtt ccgtcgcagc cgggatttgg gtcgcggttc ttgtttgtgg 9840
atcgctgtga tcgtcacttg gtgagtagcg ggctgctggg ctggccgggg ctttcgtggc 9900
cgccgggccg ctcggtggga cggaagcgtg tggagagacc gccaagggct gtagtctggg 9960
tccgcgagca aggttgccct gaactggggg ttggggggag cgcagcaaaa tggcggctgt 10020
tcccgagtct tgaatggaag acgcttgtga ggcgggctgt gaggtcgttg aaacaaggtg 10080
gggggcatgg tgggcggcaa gaacccaagg tcttgaggcc ttcgctaatg cgggaaagct 10140
cttattcggg tgagatgggc tggggcacca tctggggacc ctgacgtgaa gtttgtcact 10200
gactggagaa ctcggtttgt cgtctgttgc gggggcggca gttatggcgg tgccgttggg 10260
cagtgcaccc gtacctttgg gagcgcgcgc cctcgtcgtg tcgtgacgtc acccgttctg 10320
ttggcttata atgcagggtg gggccacctg ccggtaggtg tgcggtaggc ttttctccgt 10380
cgcaggacgc agggttcggg cctagggtag gctctcctga atcgacaggc gccggacctc 10440
tggtgagggg agggataagt gaggcgtcag tttctttggt cggttttatg tacctatctt 10500
cttaagtagc tgaagctccg gttttgaact atgcgctcgg ggttggcgag tgtgttttgt 10560
gaagtttttt aggcaccttt tgaaatgtaa tcatttgggt caatatgtaa ttttcagtgt 10620
tagactagta aattgtccgc taaattctgg ccgtttttgg cttttttgtt agacgtgttg 10680
acaattaatc atcggcatag tatatcggca tagtataata cgacaaggtg aggaactaaa 10740
ccatgggatc ggccattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg 10800
agaggctatt cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt 10860
tccggctgtc agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc 10920
tgaatgaact gcaggacgag gcagcgcggc tatcgtggct ggccacgacg ggcgttcctt 10980
gcgcagctgt gctcgacgtt gtcactgaag cgggaaggga ctggctgcta ttgggcgaag 11040
tgccggggca ggatctcctg tcatctcacc ttgctcctgc cgagaaagta tccatcatgg 11100
ctgatgcaat gcggcggctg catacgcttg atccggctac ctgcccattc gaccaccaag 11160
cgaaacatcg catcgagcga gcacgtactc ggatggaagc cggtcttgtc gatcaggatg 11220
atctggacga agagcatcag gggctcgcgc cagccgaact gttcgccagg ctcaaggcgc 11280
gcatgcccga cggcgatgat ctcgtcgtga cccatggcga tgcctgcttg ccgaatatca 11340
tggtggaaaa tggccgcttt tctggattca tcgactgtgg ccggctgggt gtggcggacc 11400
gctatcagga catagcgttg gctacccgtg atattgctga agagcttggc ggcgaatggg 11460
ctgaccgctt cctcgtgctt tacggtatcg ccgctcccga ttcgcagcgc atcgccttct 11520
atcgccttct tgacgagttc ttctgagggg atccgctgta agtctgcaga aattgatgat 11580
ctattaaaca ataaagatgt ccactaaaat ggaagttttt cctgtcatac tttgttaaga 11640
agggtgagaa cagagtacct acattttgaa tggaaggatt ggagctacgg gggtgggggt 11700
ggggtgggat tagataaatg cctgctcttt actgaaggct ctttactatt gctttatgat 11760
aatgtttcat agttggatat cataatttaa acaagcaaaa ccaaattaag ggccagctca 11820
ttcctcccac tcatgatcta tagatctata gatctctcgt gggatcattg tttttctctt 11880
gattcccact ttgtggttct aagtactgtg gtttccaaat gtgtcagttt catagcctga 11940
agaacgagat cagcagcctc tgttccacat acacttcatt ctcagtattg ttttgccaag 12000
ttctaattcc atcagacctc gacctgcagc ccctagataa cttcgtataa tgtatgctat 12060
acgaagttat gctaggtaac tataacggtc ctaaggtagc gagctagcga gactcagccc 12120
aggaggacca ggatcttgcc aaagcagtag catcccattt gtaccaaaac agtgttcttg 12180
ctctataaac cgtgttagca gctcagga 12208
<210> 15
<211> 7476
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(97)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (98)..(7298)
<223> 人序列
<220>
<221> misc_feature
<222> (7299)..(7376)
<223> 盒 LoxP 印迹
<220>
<221> misc_feature
<222> (7377)..(7476)
<223> 小鼠序列
<400> 15
agcttggcag ggatcagcag cctgggttgg aaggaggggg tataaaagcc ccttcaccag 60
gagaagccgt cacacagatc cacaagctcc tgacaggatg gcttctcatc gtctgctcct 120
cctctgcctt gctggactgg tatttgtgtc tgaggctggc cctacggtga gtgtttctgt 180
gacatcccat tcctacattt aagattcacg ctaaatgaag tagaagtgac tccttccagc 240
tttgccaacc agcttttatt actagggcaa gggtacccag catctatttt taatataatt 300
aattcaaact tcaaaaagaa tgaagttcca ctgagcttac tgagctggga cttgaactct 360
gagcattcta cctcattgct ttggtgcatt aggtttgtaa tatctggtac ctctgtttcc 420
tcagatagat gatagaaata aagatatgat attaaggaag ctgttaatac tgaattttca 480
gaaaagtatc cctccataaa atgtatttgg gggacaaact gcaggagatt atattctggc 540
cctatagtta ttcaaaacgt atttattgat taatctttaa aaggcttagt gaacaatatt 600
ctagtcagat atctaattct taaatcctct agaagaatta actaatacta taaaatgggt 660
ctggatgtag ttctgacatt attttataac aactggtaag agggagtgac tatagcaaca 720
actaaaatga tctcaggaaa acctgtttgg ccctatgtat ggtacattac atcttttcag 780
taattccact caaatggaga cttttaacaa agcaactgtt ctcaggggac ctattttctc 840
ccttaaaatt cattatacac atccctggtt gatagcagtg tgtctggagg cagaaaccat 900
tcttgctttg gaaacaatta cgtctgtgtt atactgagta gggaagctca ttaattgtcg 960
acacttacgt tcctgataat gggatcagtg tgtaattctt gtttcgctcc agatttctaa 1020
taccacaaag aataaatcct ttcactctga tcaattttgt taacttctca cgtgtcttct 1080
ctacacccag ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt 1140
ccgaggcagt cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac 1200
ctgggagcca tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta 1260
tcttcccgtt tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac 1320
aagtagattg aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt 1380
gttttgctta gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag 1440
aaaagaagga atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag 1500
aacactttat gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac 1560
acacacatac aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg 1620
ggtaacacca aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt 1680
aacccattaa caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt 1740
taatatggat cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg 1800
tgtgcaaggc tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc 1860
atgaggcaaa gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg 1920
gcttctcacc ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca 1980
aaaacttcaa ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa 2040
tcaggagacc ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag 2100
aagaatttct gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt 2160
gggaagatca ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg 2220
tttatataaa atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga 2280
cagaatggac accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa 2340
aaaaaaaaag aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa 2400
ctgctatttt tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa 2460
ctatggagct ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag 2520
ttatcagaga ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac 2580
tttaggtttt ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag 2640
ctatcctcac accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt 2700
agaacagctg tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta 2760
agtaaacatt atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga 2820
tgccaaagtg ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca 2880
aaactccgtc tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat 2940
cccagctaat tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca 3000
gtgagctgag atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca 3060
aaaaaaaaaa attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt 3120
ttcaaaaagt ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc 3180
tgacttagtt gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg 3240
gtgggggtgt attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact 3300
ttcacacctt ataggaaaac cagtgagtct ggagagctgc atgggctcac aactgaggag 3360
gaatttgtag aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt 3420
ggcatctccc cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt 3480
ggttttggtt tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag 3540
aaatgtccta aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa 3600
attcacaaca ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac 3660
atgacttgaa cttacatgaa actactcata gtctattcat tccactttat atgaatattg 3720
atgtatctgc tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt 3780
atgtaacaag agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa 3840
cacatctggc ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac 3900
aataaaatca aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt 3960
ggcagacaca attataagtg ttttccatat ttaacctact taatcctcag gaataagcca 4020
ctgaggtcag tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag 4080
tcaaataact tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt 4140
aaggcccagg ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact 4200
ttttcccttg tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt 4260
cccctgccta tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct 4320
ccttaatttc ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt 4380
tggtcagagt taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat 4440
tctctggctt agtcatggat gagactttca attgctataa agtggttcct ttattagaca 4500
atgttaccag ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag 4560
agccccatct accaaggagc atgtccctga ctacccctca gccagcagca agacatggac 4620
cccagtcagg gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt 4680
ctcagcccct accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc 4740
tgggtctcag cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg 4800
ttctctttca ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa 4860
caaacattaa aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga 4920
tttagaaatg aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca 4980
gattaagcag gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag 5040
cgagtagtga gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca 5100
tgcagcttct tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac 5160
ccaggtggtc atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg 5220
cctcttcact tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac 5280
ccaggctgga atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa 5340
gcaattctcc tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca 5400
ggctaatttt tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga 5460
actccagacc tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt 5520
gagccaccgt gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt 5580
ttaagaagaa tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt 5640
agttgattct agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg 5700
attctcactt cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct 5760
tttttcctcc tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta 5820
tttatgcaga gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa 5880
acacatcttt actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact 5940
ctgagaacca aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact 6000
gtgtgactat ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga 6060
gctctagtgc atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt 6120
aaatagagcc ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata 6180
cttttcttct tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg 6240
gagacaggag acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa 6300
taattcaagt ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc 6360
taaatctcta agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc 6420
agttttgcat tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg 6480
ctttctggga tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa 6540
aacaagacct gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct 6600
tgccagcata tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa 6660
attaattaag ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt 6720
tcgggctctg gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac 6780
gactccggcc cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc 6840
acggctgtcg tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac 6900
gagggatggg atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc 6960
tcatatgcta tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt 7020
tcattccact ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa 7080
tcaaaatttt acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga 7140
gatccaaatt tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta 7200
aaaagacaca ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa 7260
aagacacatt ccaagggccc acttctttac tgtgggcact cgagataact tcgtataatg 7320
tatgctatac gaagttatgc taggtaacta taacggtcct aaggtagcga gctagcgaga 7380
ctcagcccag gaggaccagg atcttgccaa agcagtagca tcccatttgt accaaaacag 7440
tgttcttgct ctataaaccg tgttagcagc tcagga 7476
<210> 16
<211> 11218
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(100)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (101)..(6308)
<223> 人序列
<220>
<221> misc_feature
<222> (6309)..(11118)
<223> SDC Neo 盒
<220>
<221> misc_feature
<222> (11119)..(11218)
<223> 小鼠序列
<400> 16
atgtactttt ggttttgttc cagagtctat caccggaaag aacaagccgg tttactctga 60
cccatttcac tgacatttct cttgtctcct ctgtgcccag ggcaccggtg aatccaagtg 120
tcctctgatg gtcaaagttc tagatgctgt ccgaggcagt cctgccatca atgtggccgt 180
gcatgtgttc agaaaggctg ctgatgacac ctgggagcca tttgcctctg ggtaagttgc 240
caaagaaccc tcccacagga cttggtttta tcttcccgtt tgcccctcac ttggtagaga 300
gaggctcaca tcatctgcta aagaatttac aagtagattg aaaaacgtag gcagaggtca 360
agtatgccct ctgaaggatg ccctcttttt gttttgctta gctaggaagt gaccaggaac 420
ctgagcatca tttaggggca gacagtagag aaaagaagga atcagaactc ctctcctcta 480
gctgtggttt gcaacccttt tgggtcacag aacactttat gtaggtgatg aaaagtaaac 540
attctatgcc cagaaaaaat gcacagatac acacacatac aaaatcatat atgtgatttt 600
aggagtttca cagattccct ggtgtccctg ggtaacacca aagctaagtg tccttgtctt 660
agaattttag gaaaaggtat aatgtgtatt aacccattaa caaaaggaaa ggaattcaga 720
aatattatta accaggcatc tgtctgtagt taatatggat cacccaaaac ccaaggcttt 780
tgcctaatga acactttggg gcacctactg tgtgcaaggc tgggggctgt caagctcagt 840
taaaaaaaaa aagatagaag agatggatcc atgaggcaaa gtacagcccc aggctaatcc 900
cacgatcacc cgacttcatg tccaagagtg gcttctcacc ttcattagcc agttcacaat 960
tttcatggag tttttctacc tgcactagca aaaacttcaa ggaaaataca tattaataaa 1020
tctaagcaaa gtgaccagaa gacagagcaa tcaggagacc ctttgcatcc agcagaagag 1080
gaactgctaa gtatttacat ctccacagag aagaatttct gttgggtttt aattgaaccc 1140
caagaaccac atgattcttc aaccattatt gggaagatca ttttcttagg tctggtttta 1200
actggctttt tatttgggaa ttcatttatg tttatataaa atgccaagca taacatgaaa 1260
agtggttaca ggactattct aagggagaga cagaatggac accaaaaata ttccaatgtt 1320
cttgtgaatc ttttccttgc accaggacaa aaaaaaaaag aagtgaaaag aagaaaggag 1380
gaggggcata atcagagtca gtaaagacaa ctgctatttt tatctatcgt agctgttgca 1440
gtcaaatggg aagcaatttc caacattcaa ctatggagct ggtacttaca tggaaataga 1500
agttgcctag tgtttgttgc tggcaaagag ttatcagaga ggttaaatat ataaaaggga 1560
aaagagtcag atacaggttc ttcttcctac tttaggtttt ccactgtgtg tgcaaatgat 1620
actccctggt ggtgtgcaga tgcctcaaag ctatcctcac accacaaggg agaggagcga 1680
gatcctgctg tcctggagaa gtgcagagtt agaacagctg tggccacttg catccaatca 1740
tcaatcttga atcacaggga ctctttctta agtaaacatt atacctggcc gggcacggtg 1800
gctcacgcct gtaatcccag cactttggga tgccaaagtg ggcatatcat ctgaggtcag 1860
gagttcaaga ccagcctggc caacatggca aaactccgtc tttatgaaaa atacaaaaat 1920
tagccaggca tggtggcagg cgcctgtaat cccagctaat tgggaggctg aggctggaga 1980
atcccttgaa tctaggaggc agaggttgca gtgagctgag atcgtgccat tgcactccag 2040
cctgggtgac aagagtaaaa ctctgtctca aaaaaaaaaa attataccta cattctcttc 2100
ttatcagaga aaaaaatcta cagtgagctt ttcaaaaagt ttttacaaac tttttgccat 2160
ttaatttcag ttaggagttt tccctacttc tgacttagtt gaggggaaat gttcataaca 2220
tgtttataac atgtttatgt gtgttagttg gtgggggtgt attactttgc catgccattt 2280
gtttcctcca tgcgtaactt aatccagact ttcacacctt ataggaaaac cagtgagtct 2340
ggagagctgc atgggctcac aactgaggag gaatttgtag aagggatata caaagtggaa 2400
atagacacca aatcttactg gaaggcactt ggcatctccc cattccatga gcatgcagag 2460
gtgagtatac agaccttcga gggttgtttt ggttttggtt tttgcttttg gcattccagg 2520
aaatgcacag ttttactcag tgtaccacag aaatgtccta aggaaggtga tgaatgacca 2580
aaggttccct ttcctattat acaagaaaaa attcacaaca ctctgagaag caaatttctt 2640
tttgactttg atgaaaatcc acttagtaac atgacttgaa cttacatgaa actactcata 2700
gtctattcat tccactttat atgaatattg atgtatctgc tgttgaaata atagtttatg 2760
aggcagccct ccagacccca cgtagagtgt atgtaacaag agatgcacca ttttatttct 2820
cgaaaacccg taacattctt cattccaaaa cacatctggc ttctcggagg tctggacaag 2880
tgattcttgg caacacatac ctatagagac aataaaatca aagtaataat ggcaacacaa 2940
tagataacat ttaccaagca tacaccatgt ggcagacaca attataagtg ttttccatat 3000
ttaacctact taatcctcag gaataagcca ctgaggtcag tcctattatt atccccatct 3060
tatagatgaa gaaaatgagg caccaggaag tcaaataact tgtcaaaggt cacaagacta 3120
ggaaatacac aagtagaaat gtttacaatt aaggcccagg ctgggtttgc cctcagttct 3180
gctatgcctc gcattatgcc ccaggaaact ttttcccttg tgaaagccaa gcttaaaaaa 3240
agaaaagcca catttgtaac gtgctctgtt cccctgccta tggtgaggat cttcaaacag 3300
ttatacatgg acccagtccc cctgccttct ccttaatttc ttaagtcatt tgaaacagat 3360
ggctgtcatg gaaatagaat ccagacatgt tggtcagagt taaagatcaa ctaattccat 3420
caaaaatagc tcggcatgaa agggaactat tctctggctt agtcatggat gagactttca 3480
attgctataa agtggttcct ttattagaca atgttaccag ggaaacaaca ggggtttgtt 3540
tgacttctgg ggcccacaag tcaacaagag agccccatct accaaggagc atgtccctga 3600
ctacccctca gccagcagca agacatggac cccagtcagg gcaggagcag ggtttcggcg 3660
gcgcccagca caagacattg cccctagagt ctcagcccct accctcgagt aatagatctg 3720
cctacctgag actgttgttt gcccaagagc tgggtctcag cctgatggga accatataaa 3780
aaggttcact gacatactgc ccacatgttg ttctctttca ttagatctta gcttccttgt 3840
ctgctcttca ttcttgcagt attcattcaa caaacattaa aaaaaaaaaa aagcattcta 3900
tgtgtggaac actctgctag atgctgtgga tttagaaatg aaaatacatc ccgacccttg 3960
gaatggaagg gaaaggactg aagtaagaca gattaagcag gaccgtcagc ccagcttgaa 4020
gcccagataa atacggagaa caagagagag cgagtagtga gagatgagtc ccaatgcctc 4080
actttggtga cgggtgcgtg gtgggcttca tgcagcttct tctgataaat gcctccttca 4140
gaactggtca actctacctt ggccagtgac ccaggtggtc atagtagatt taccaaggga 4200
aaatggaaac ttttattagg agctcttagg cctcttcact tcatggattt ttttttcctt 4260
tttttttgag atggagtttt gccctgtcac ccaggctgga atgcagtggt gcaatctcag 4320
ctcactgcaa cctccgcctc ccaggttcaa gcaattctcc tgcctcagcc tcccgagtag 4380
ctgggactac aggtgtgcgc caccacacca ggctaatttt tgtatttttt gtaaagacag 4440
gttttcacca cgttggccag gctggtctga actccagacc tcaggtgatt cacctgtctc 4500
agcctcccaa agtgctggga ttacaggtgt gagccaccgt gcccggctac ttcatggatt 4560
tttgattaca gattatgcct cttacaattt ttaagaagaa tcaagtgggc tgaaggtcaa 4620
tgtcaccata agacaaaaga catttttatt agttgattct agggaattgg ccttaagggg 4680
agccctttct tcctaagaga ttcttaggtg attctcactt cctcttgccc cagtattatt 4740
tttgtttttg gtatggctca ctcagatcct tttttcctcc tatccctaag taatccgggt 4800
ttctttttcc catatttaga acaaaatgta tttatgcaga gtgtgtccaa acctcaaccc 4860
aaggcctgta tacaaaataa atcaaattaa acacatcttt actgtcttct acctctttcc 4920
tgacctcaat atatcccaac ttgcctcact ctgagaacca aggctgtccc agcacctgag 4980
tcgcagatat tctactgatt tgacagaact gtgtgactat ctggaacagc attttgatcc 5040
acaatttgcc cagttacaaa gcttaaatga gctctagtgc atgcatatat atttcaaaat 5100
tccaccatga tcttccacac tctgtattgt aaatagagcc ctgtaatgct tttacttcgt 5160
atttcattgc ttgttataca taaaaatata cttttcttct tcatgttaga aaatgcaaag 5220
aataggaggg tgggggaatc tctgggcttg gagacaggag acttgccttc ctactatggt 5280
tccatcagaa tgtagactgg gacaatacaa taattcaagt ctggtttgct catctgtaaa 5340
ttgggaagaa tgtttccagc tccagaatgc taaatctcta agtctgtggt tggcagccac 5400
tattgcagca gctcttcaat gactcaatgc agttttgcat tctccctacc ttttttttct 5460
aaaaccaata aaatagatac agcctttagg ctttctggga tttcccttag tcaagctagg 5520
gtcatcctga ctttcggcgt gaatttgcaa aacaagacct gactctgtac tcctgctcta 5580
aggactgtgc atggttccaa aggcttagct tgccagcata tttgagcttt ttccttctgt 5640
tcaaactgtt ccaaaatata aaagaataaa attaattaag ttggcactgg acttccggtg 5700
gtcagtcatg tgtgtcatct gtcacgtttt tcgggctctg gtggaaatgg atctgtctgt 5760
cttctctcat aggtggtatt cacagccaac gactccggcc cccgccgcta caccattgcc 5820
gccctgctga gcccctactc ctattccacc acggctgtcg tcaccaatcc caaggaatga 5880
gggacttctc ctccagtgga cctgaaggac gagggatggg atttcatgta accaagagta 5940
ttccattttt actaaagcag tgttttcacc tcatatgcta tgttagaagt ccaggcagag 6000
acaataaaac attcctgtga aaggcacttt tcattccact ttaacttgat tttttaaatt 6060
cccttattgt cccttccaaa aaaaagagaa tcaaaatttt acaaagaatc aaaggaattc 6120
tagaaagtat ctgggcagaa cgctaggaga gatccaaatt tccattgtct tgcaagcaaa 6180
gcacgtatta aatatgatct gcagccatta aaaagacaca ttctgtaaat gagagagcct 6240
tattttcctg taaccttcag caaatagcaa aagacacatt ccaagggccc acttctttac 6300
tgtgggcact cgagataact tcgtataatg tatgctatac gaagttatat gcatgccagt 6360
agcagcaccc acgtccacct tctgtctagt aatgtccaac acctccctca gtccaaacac 6420
tgctctgcat ccatgtggct cccatttata cctgaagcac ttgatggggc ctcaatgttt 6480
tactagagcc cacccccctg caactctgag accctctgga tttgtctgtc agtgcctcac 6540
tggggcgttg gataatttct taaaaggtca agttccctca gcagcattct ctgagcagtc 6600
tgaagatgtg tgcttttcac agttcaaatc catgtggctg tttcacccac ctgcctggcc 6660
ttgggttatc tatcaggacc tagcctagaa gcaggtgtgt ggcacttaac acctaagctg 6720
agtgactaac tgaacactca agtggatgcc atctttgtca cttcttgact gtgacacaag 6780
caactcctga tgccaaagcc ctgcccaccc ctctcatgcc catatttgga catggtacag 6840
gtcctcactg gccatggtct gtgaggtcct ggtcctcttt gacttcataa ttcctagggg 6900
ccactagtat ctataagagg aagagggtgc tggctcccag gccacagccc acaaaattcc 6960
acctgctcac aggttggctg gctcgaccca ggtggtgtcc cctgctctga gccagctccc 7020
ggccaagcca gcaccatggg aacccccaag aagaagagga aggtgcgtac cgatttaaat 7080
tccaatttac tgaccgtaca ccaaaatttg cctgcattac cggtcgatgc aacgagtgat 7140
gaggttcgca agaacctgat ggacatgttc agggatcgcc aggcgttttc tgagcatacc 7200
tggaaaatgc ttctgtccgt ttgccggtcg tgggcggcat ggtgcaagtt gaataaccgg 7260
aaatggtttc ccgcagaacc tgaagatgtt cgcgattatc ttctatatct tcaggcgcgc 7320
ggtctggcag taaaaactat ccagcaacat ttgggccagc taaacatgct tcatcgtcgg 7380
tccgggctgc cacgaccaag tgacagcaat gctgtttcac tggttatgcg gcggatccga 7440
aaagaaaacg ttgatgccgg tgaacgtgca aaacaggtaa atataaaatt tttaagtgta 7500
taatgatgtt aaactactga ttctaattgt ttgtgtattt taggctctag cgttcgaacg 7560
cactgatttc gaccaggttc gttcactcat ggaaaatagc gatcgctgcc aggatatacg 7620
taatctggca tttctgggga ttgcttataa caccctgtta cgtatagccg aaattgccag 7680
gatcagggtt aaagatatct cacgtactga cggtgggaga atgttaatcc atattggcag 7740
aacgaaaacg ctggttagca ccgcaggtgt agagaaggca cttagcctgg gggtaactaa 7800
actggtcgag cgatggattt ccgtctctgg tgtagctgat gatccgaata actacctgtt 7860
ttgccgggtc agaaaaaatg gtgttgccgc gccatctgcc accagccagc tatcaactcg 7920
cgccctggaa gggatttttg aagcaactca tcgattgatt tacggcgcta aggatgactc 7980
tggtcagaga tacctggcct ggtctggaca cagtgcccgt gtcggagccg cgcgagatat 8040
ggcccgcgct ggagtttcaa taccggagat catgcaagct ggtggctgga ccaatgtaaa 8100
tattgtcatg aactatatcc gtaacctgga tagtgaaaca ggggcaatgg tgcgcctgct 8160
ggaagatggc gattaggcgg ccggccgcta atcagccata ccacatttgt agaggtttta 8220
cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat gaatgcaatt 8280
gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca 8340
aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc 8400
aatgtatctt atcatgtctg gatcccccgg ctagagttta aacactagaa ctagtggatc 8460
ccccgggatc atggcctccg cgccgggttt tggcgcctcc cgcgggcgcc cccctcctca 8520
cggcgagcgc tgccacgtca gacgaagggc gcagcgagcg tcctgatcct tccgcccgga 8580
cgctcaggac agcggcccgc tgctcataag actcggcctt agaaccccag tatcagcaga 8640
aggacatttt aggacgggac ttgggtgact ctagggcact ggttttcttt ccagagagcg 8700
gaacaggcga ggaaaagtag tcccttctcg gcgattctgc ggagggatct ccgtggggcg 8760
gtgaacgccg atgattatat aaggacgcgc cgggtgtggc acagctagtt ccgtcgcagc 8820
cgggatttgg gtcgcggttc ttgtttgtgg atcgctgtga tcgtcacttg gtgagtagcg 8880
ggctgctggg ctggccgggg ctttcgtggc cgccgggccg ctcggtggga cggaagcgtg 8940
tggagagacc gccaagggct gtagtctggg tccgcgagca aggttgccct gaactggggg 9000
ttggggggag cgcagcaaaa tggcggctgt tcccgagtct tgaatggaag acgcttgtga 9060
ggcgggctgt gaggtcgttg aaacaaggtg gggggcatgg tgggcggcaa gaacccaagg 9120
tcttgaggcc ttcgctaatg cgggaaagct cttattcggg tgagatgggc tggggcacca 9180
tctggggacc ctgacgtgaa gtttgtcact gactggagaa ctcggtttgt cgtctgttgc 9240
gggggcggca gttatggcgg tgccgttggg cagtgcaccc gtacctttgg gagcgcgcgc 9300
cctcgtcgtg tcgtgacgtc acccgttctg ttggcttata atgcagggtg gggccacctg 9360
ccggtaggtg tgcggtaggc ttttctccgt cgcaggacgc agggttcggg cctagggtag 9420
gctctcctga atcgacaggc gccggacctc tggtgagggg agggataagt gaggcgtcag 9480
tttctttggt cggttttatg tacctatctt cttaagtagc tgaagctccg gttttgaact 9540
atgcgctcgg ggttggcgag tgtgttttgt gaagtttttt aggcaccttt tgaaatgtaa 9600
tcatttgggt caatatgtaa ttttcagtgt tagactagta aattgtccgc taaattctgg 9660
ccgtttttgg cttttttgtt agacgtgttg acaattaatc atcggcatag tatatcggca 9720
tagtataata cgacaaggtg aggaactaaa ccatgggatc ggccattgaa caagatggat 9780
tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac 9840
agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc 9900
tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc 9960
tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag 10020
cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc 10080
ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg 10140
atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc 10200
ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc 10260
cagccgaact gttcgccagg ctcaaggcgc gcatgcccga cggcgatgat ctcgtcgtga 10320
cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca 10380
tcgactgtgg ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg 10440
atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg 10500
ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgagggg 10560
atccgctgta agtctgcaga aattgatgat ctattaaaca ataaagatgt ccactaaaat 10620
ggaagttttt cctgtcatac tttgttaaga agggtgagaa cagagtacct acattttgaa 10680
tggaaggatt ggagctacgg gggtgggggt ggggtgggat tagataaatg cctgctcttt 10740
actgaaggct ctttactatt gctttatgat aatgtttcat agttggatat cataatttaa 10800
acaagcaaaa ccaaattaag ggccagctca ttcctcccac tcatgatcta tagatctata 10860
gatctctcgt gggatcattg tttttctctt gattcccact ttgtggttct aagtactgtg 10920
gtttccaaat gtgtcagttt catagcctga agaacgagat cagcagcctc tgttccacat 10980
acacttcatt ctcagtattg ttttgccaag ttctaattcc atcagacctc gacctgcagc 11040
ccctagataa cttcgtataa tgtatgctat acgaagttat gctaggtaac tataacggtc 11100
ctaaggtagc gagctagcga gactcagccc aggaggacca ggatcttgcc aaagcagtag 11160
catcccattt gtaccaaaac agtgttcttg ctctataaac cgtgttagca gctcagga 11218
<210> 17
<211> 6486
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(100)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (101)..(6308)
<223> 人序列
<220>
<221> misc_feature
<222> (6309)..(6386)
<223> 盒 LoxP 印迹
<220>
<221> misc_feature
<222> (6387)..(6486)
<223> 小鼠序列
<400> 17
atgtactttt ggttttgttc cagagtctat caccggaaag aacaagccgg tttactctga 60
cccatttcac tgacatttct cttgtctcct ctgtgcccag ggcaccggtg aatccaagtg 120
tcctctgatg gtcaaagttc tagatgctgt ccgaggcagt cctgccatca atgtggccgt 180
gcatgtgttc agaaaggctg ctgatgacac ctgggagcca tttgcctctg ggtaagttgc 240
caaagaaccc tcccacagga cttggtttta tcttcccgtt tgcccctcac ttggtagaga 300
gaggctcaca tcatctgcta aagaatttac aagtagattg aaaaacgtag gcagaggtca 360
agtatgccct ctgaaggatg ccctcttttt gttttgctta gctaggaagt gaccaggaac 420
ctgagcatca tttaggggca gacagtagag aaaagaagga atcagaactc ctctcctcta 480
gctgtggttt gcaacccttt tgggtcacag aacactttat gtaggtgatg aaaagtaaac 540
attctatgcc cagaaaaaat gcacagatac acacacatac aaaatcatat atgtgatttt 600
aggagtttca cagattccct ggtgtccctg ggtaacacca aagctaagtg tccttgtctt 660
agaattttag gaaaaggtat aatgtgtatt aacccattaa caaaaggaaa ggaattcaga 720
aatattatta accaggcatc tgtctgtagt taatatggat cacccaaaac ccaaggcttt 780
tgcctaatga acactttggg gcacctactg tgtgcaaggc tgggggctgt caagctcagt 840
taaaaaaaaa aagatagaag agatggatcc atgaggcaaa gtacagcccc aggctaatcc 900
cacgatcacc cgacttcatg tccaagagtg gcttctcacc ttcattagcc agttcacaat 960
tttcatggag tttttctacc tgcactagca aaaacttcaa ggaaaataca tattaataaa 1020
tctaagcaaa gtgaccagaa gacagagcaa tcaggagacc ctttgcatcc agcagaagag 1080
gaactgctaa gtatttacat ctccacagag aagaatttct gttgggtttt aattgaaccc 1140
caagaaccac atgattcttc aaccattatt gggaagatca ttttcttagg tctggtttta 1200
actggctttt tatttgggaa ttcatttatg tttatataaa atgccaagca taacatgaaa 1260
agtggttaca ggactattct aagggagaga cagaatggac accaaaaata ttccaatgtt 1320
cttgtgaatc ttttccttgc accaggacaa aaaaaaaaag aagtgaaaag aagaaaggag 1380
gaggggcata atcagagtca gtaaagacaa ctgctatttt tatctatcgt agctgttgca 1440
gtcaaatggg aagcaatttc caacattcaa ctatggagct ggtacttaca tggaaataga 1500
agttgcctag tgtttgttgc tggcaaagag ttatcagaga ggttaaatat ataaaaggga 1560
aaagagtcag atacaggttc ttcttcctac tttaggtttt ccactgtgtg tgcaaatgat 1620
actccctggt ggtgtgcaga tgcctcaaag ctatcctcac accacaaggg agaggagcga 1680
gatcctgctg tcctggagaa gtgcagagtt agaacagctg tggccacttg catccaatca 1740
tcaatcttga atcacaggga ctctttctta agtaaacatt atacctggcc gggcacggtg 1800
gctcacgcct gtaatcccag cactttggga tgccaaagtg ggcatatcat ctgaggtcag 1860
gagttcaaga ccagcctggc caacatggca aaactccgtc tttatgaaaa atacaaaaat 1920
tagccaggca tggtggcagg cgcctgtaat cccagctaat tgggaggctg aggctggaga 1980
atcccttgaa tctaggaggc agaggttgca gtgagctgag atcgtgccat tgcactccag 2040
cctgggtgac aagagtaaaa ctctgtctca aaaaaaaaaa attataccta cattctcttc 2100
ttatcagaga aaaaaatcta cagtgagctt ttcaaaaagt ttttacaaac tttttgccat 2160
ttaatttcag ttaggagttt tccctacttc tgacttagtt gaggggaaat gttcataaca 2220
tgtttataac atgtttatgt gtgttagttg gtgggggtgt attactttgc catgccattt 2280
gtttcctcca tgcgtaactt aatccagact ttcacacctt ataggaaaac cagtgagtct 2340
ggagagctgc atgggctcac aactgaggag gaatttgtag aagggatata caaagtggaa 2400
atagacacca aatcttactg gaaggcactt ggcatctccc cattccatga gcatgcagag 2460
gtgagtatac agaccttcga gggttgtttt ggttttggtt tttgcttttg gcattccagg 2520
aaatgcacag ttttactcag tgtaccacag aaatgtccta aggaaggtga tgaatgacca 2580
aaggttccct ttcctattat acaagaaaaa attcacaaca ctctgagaag caaatttctt 2640
tttgactttg atgaaaatcc acttagtaac atgacttgaa cttacatgaa actactcata 2700
gtctattcat tccactttat atgaatattg atgtatctgc tgttgaaata atagtttatg 2760
aggcagccct ccagacccca cgtagagtgt atgtaacaag agatgcacca ttttatttct 2820
cgaaaacccg taacattctt cattccaaaa cacatctggc ttctcggagg tctggacaag 2880
tgattcttgg caacacatac ctatagagac aataaaatca aagtaataat ggcaacacaa 2940
tagataacat ttaccaagca tacaccatgt ggcagacaca attataagtg ttttccatat 3000
ttaacctact taatcctcag gaataagcca ctgaggtcag tcctattatt atccccatct 3060
tatagatgaa gaaaatgagg caccaggaag tcaaataact tgtcaaaggt cacaagacta 3120
ggaaatacac aagtagaaat gtttacaatt aaggcccagg ctgggtttgc cctcagttct 3180
gctatgcctc gcattatgcc ccaggaaact ttttcccttg tgaaagccaa gcttaaaaaa 3240
agaaaagcca catttgtaac gtgctctgtt cccctgccta tggtgaggat cttcaaacag 3300
ttatacatgg acccagtccc cctgccttct ccttaatttc ttaagtcatt tgaaacagat 3360
ggctgtcatg gaaatagaat ccagacatgt tggtcagagt taaagatcaa ctaattccat 3420
caaaaatagc tcggcatgaa agggaactat tctctggctt agtcatggat gagactttca 3480
attgctataa agtggttcct ttattagaca atgttaccag ggaaacaaca ggggtttgtt 3540
tgacttctgg ggcccacaag tcaacaagag agccccatct accaaggagc atgtccctga 3600
ctacccctca gccagcagca agacatggac cccagtcagg gcaggagcag ggtttcggcg 3660
gcgcccagca caagacattg cccctagagt ctcagcccct accctcgagt aatagatctg 3720
cctacctgag actgttgttt gcccaagagc tgggtctcag cctgatggga accatataaa 3780
aaggttcact gacatactgc ccacatgttg ttctctttca ttagatctta gcttccttgt 3840
ctgctcttca ttcttgcagt attcattcaa caaacattaa aaaaaaaaaa aagcattcta 3900
tgtgtggaac actctgctag atgctgtgga tttagaaatg aaaatacatc ccgacccttg 3960
gaatggaagg gaaaggactg aagtaagaca gattaagcag gaccgtcagc ccagcttgaa 4020
gcccagataa atacggagaa caagagagag cgagtagtga gagatgagtc ccaatgcctc 4080
actttggtga cgggtgcgtg gtgggcttca tgcagcttct tctgataaat gcctccttca 4140
gaactggtca actctacctt ggccagtgac ccaggtggtc atagtagatt taccaaggga 4200
aaatggaaac ttttattagg agctcttagg cctcttcact tcatggattt ttttttcctt 4260
tttttttgag atggagtttt gccctgtcac ccaggctgga atgcagtggt gcaatctcag 4320
ctcactgcaa cctccgcctc ccaggttcaa gcaattctcc tgcctcagcc tcccgagtag 4380
ctgggactac aggtgtgcgc caccacacca ggctaatttt tgtatttttt gtaaagacag 4440
gttttcacca cgttggccag gctggtctga actccagacc tcaggtgatt cacctgtctc 4500
agcctcccaa agtgctggga ttacaggtgt gagccaccgt gcccggctac ttcatggatt 4560
tttgattaca gattatgcct cttacaattt ttaagaagaa tcaagtgggc tgaaggtcaa 4620
tgtcaccata agacaaaaga catttttatt agttgattct agggaattgg ccttaagggg 4680
agccctttct tcctaagaga ttcttaggtg attctcactt cctcttgccc cagtattatt 4740
tttgtttttg gtatggctca ctcagatcct tttttcctcc tatccctaag taatccgggt 4800
ttctttttcc catatttaga acaaaatgta tttatgcaga gtgtgtccaa acctcaaccc 4860
aaggcctgta tacaaaataa atcaaattaa acacatcttt actgtcttct acctctttcc 4920
tgacctcaat atatcccaac ttgcctcact ctgagaacca aggctgtccc agcacctgag 4980
tcgcagatat tctactgatt tgacagaact gtgtgactat ctggaacagc attttgatcc 5040
acaatttgcc cagttacaaa gcttaaatga gctctagtgc atgcatatat atttcaaaat 5100
tccaccatga tcttccacac tctgtattgt aaatagagcc ctgtaatgct tttacttcgt 5160
atttcattgc ttgttataca taaaaatata cttttcttct tcatgttaga aaatgcaaag 5220
aataggaggg tgggggaatc tctgggcttg gagacaggag acttgccttc ctactatggt 5280
tccatcagaa tgtagactgg gacaatacaa taattcaagt ctggtttgct catctgtaaa 5340
ttgggaagaa tgtttccagc tccagaatgc taaatctcta agtctgtggt tggcagccac 5400
tattgcagca gctcttcaat gactcaatgc agttttgcat tctccctacc ttttttttct 5460
aaaaccaata aaatagatac agcctttagg ctttctggga tttcccttag tcaagctagg 5520
gtcatcctga ctttcggcgt gaatttgcaa aacaagacct gactctgtac tcctgctcta 5580
aggactgtgc atggttccaa aggcttagct tgccagcata tttgagcttt ttccttctgt 5640
tcaaactgtt ccaaaatata aaagaataaa attaattaag ttggcactgg acttccggtg 5700
gtcagtcatg tgtgtcatct gtcacgtttt tcgggctctg gtggaaatgg atctgtctgt 5760
cttctctcat aggtggtatt cacagccaac gactccggcc cccgccgcta caccattgcc 5820
gccctgctga gcccctactc ctattccacc acggctgtcg tcaccaatcc caaggaatga 5880
gggacttctc ctccagtgga cctgaaggac gagggatggg atttcatgta accaagagta 5940
ttccattttt actaaagcag tgttttcacc tcatatgcta tgttagaagt ccaggcagag 6000
acaataaaac attcctgtga aaggcacttt tcattccact ttaacttgat tttttaaatt 6060
cccttattgt cccttccaaa aaaaagagaa tcaaaatttt acaaagaatc aaaggaattc 6120
tagaaagtat ctgggcagaa cgctaggaga gatccaaatt tccattgtct tgcaagcaaa 6180
gcacgtatta aatatgatct gcagccatta aaaagacaca ttctgtaaat gagagagcct 6240
tattttcctg taaccttcag caaatagcaa aagacacatt ccaagggccc acttctttac 6300
tgtgggcact cgagataact tcgtataatg tatgctatac gaagttatgc taggtaacta 6360
taacggtcct aaggtagcga gctagcgaga ctcagcccag gaggaccagg atcttgccaa 6420
agcagtagca tcccatttgt accaaaacag tgttcttgct ctataaaccg tgttagcagc 6480
tcagga 6486
<210> 18
<211> 7201
<212> DNA
<213> 智人
<400> 18
atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60
ggccctacgg tgagtgtttc tgtgacatcc cattcctaca tttaagattc acgctaaatg 120
aagtagaagt gactccttcc agctttgcca accagctttt attactaggg caagggtacc 180
cagcatctat ttttaatata attaattcaa acttcaaaaa gaatgaagtt ccactgagct 240
tactgagctg ggacttgaac tctgagcatt ctacctcatt gctttggtgc attaggtttg 300
taatatctgg tacctctgtt tcctcagata gatgatagaa ataaagatat gatattaagg 360
aagctgttaa tactgaattt tcagaaaagt atccctccat aaaatgtatt tgggggacaa 420
actgcaggag attatattct ggccctatag ttattcaaaa cgtatttatt gattaatctt 480
taaaaggctt agtgaacaat attctagtca gatatctaat tcttaaatcc tctagaagaa 540
ttaactaata ctataaaatg ggtctggatg tagttctgac attattttat aacaactggt 600
aagagggagt gactatagca acaactaaaa tgatctcagg aaaacctgtt tggccctatg 660
tatggtacat tacatctttt cagtaattcc actcaaatgg agacttttaa caaagcaact 720
gttctcaggg gacctatttt ctcccttaaa attcattata cacatccctg gttgatagca 780
gtgtgtctgg aggcagaaac cattcttgct ttggaaacaa ttacgtctgt gttatactga 840
gtagggaagc tcattaattg tcgacactta cgttcctgat aatgggatca gtgtgtaatt 900
cttgtttcgc tccagatttc taataccaca aagaataaat cctttcactc tgatcaattt 960
tgttaacttc tcacgtgtct tctctacacc cagggcaccg gtgaatccaa gtgtcctctg 1020
atggtcaaag ttctagatgc tgtccgaggc agtcctgcca tcaatgtggc cgtgcatgtg 1080
ttcagaaagg ctgctgatga cacctgggag ccatttgcct ctgggtaagt tgccaaagaa 1140
ccctcccaca ggacttggtt ttatcttccc gtttgcccct cacttggtag agagaggctc 1200
acatcatctg ctaaagaatt tacaagtaga ttgaaaaacg taggcagagg tcaagtatgc 1260
cctctgaagg atgccctctt tttgttttgc ttagctagga agtgaccagg aacctgagca 1320
tcatttaggg gcagacagta gagaaaagaa ggaatcagaa ctcctctcct ctagctgtgg 1380
tttgcaaccc ttttgggtca cagaacactt tatgtaggtg atgaaaagta aacattctat 1440
gcccagaaaa aatgcacaga tacacacaca tacaaaatca tatatgtgat tttaggagtt 1500
tcacagattc cctggtgtcc ctgggtaaca ccaaagctaa gtgtccttgt cttagaattt 1560
taggaaaagg tataatgtgt attaacccat taacaaaagg aaaggaattc agaaatatta 1620
ttaaccaggc atctgtctgt agttaatatg gatcacccaa aacccaaggc ttttgcctaa 1680
tgaacacttt ggggcaccta ctgtgtgcaa ggctgggggc tgtcaagctc agttaaaaaa 1740
aaaaagatag aagagatgga tccatgaggc aaagtacagc cccaggctaa tcccacgatc 1800
acccgacttc atgtccaaga gtggcttctc accttcatta gccagttcac aattttcatg 1860
gagtttttct acctgcacta gcaaaaactt caaggaaaat acatattaat aaatctaagc 1920
aaagtgacca gaagacagag caatcaggag accctttgca tccagcagaa gaggaactgc 1980
taagtattta catctccaca gagaagaatt tctgttgggt tttaattgaa ccccaagaac 2040
cacatgattc ttcaaccatt attgggaaga tcattttctt aggtctggtt ttaactggct 2100
ttttatttgg gaattcattt atgtttatat aaaatgccaa gcataacatg aaaagtggtt 2160
acaggactat tctaagggag agacagaatg gacaccaaaa atattccaat gttcttgtga 2220
atcttttcct tgcaccagga caaaaaaaaa aagaagtgaa aagaagaaag gaggaggggc 2280
ataatcagag tcagtaaaga caactgctat ttttatctat cgtagctgtt gcagtcaaat 2340
gggaagcaat ttccaacatt caactatgga gctggtactt acatggaaat agaagttgcc 2400
tagtgtttgt tgctggcaaa gagttatcag agaggttaaa tatataaaag ggaaaagagt 2460
cagatacagg ttcttcttcc tactttaggt tttccactgt gtgtgcaaat gatactccct 2520
ggtggtgtgc agatgcctca aagctatcct cacaccacaa gggagaggag cgagatcctg 2580
ctgtcctgga gaagtgcaga gttagaacag ctgtggccac ttgcatccaa tcatcaatct 2640
tgaatcacag ggactctttc ttaagtaaac attatacctg gccgggcacg gtggctcacg 2700
cctgtaatcc cagcactttg ggatgccaaa gtgggcatat catctgaggt caggagttca 2760
agaccagcct ggccaacatg gcaaaactcc gtctttatga aaaatacaaa aattagccag 2820
gcatggtggc aggcgcctgt aatcccagct aattgggagg ctgaggctgg agaatccctt 2880
gaatctagga ggcagaggtt gcagtgagct gagatcgtgc cattgcactc cagcctgggt 2940
gacaagagta aaactctgtc tcaaaaaaaa aaaattatac ctacattctc ttcttatcag 3000
agaaaaaaat ctacagtgag cttttcaaaa agtttttaca aactttttgc catttaattt 3060
cagttaggag ttttccctac ttctgactta gttgagggga aatgttcata acatgtttat 3120
aacatgttta tgtgtgttag ttggtggggg tgtattactt tgccatgcca tttgtttcct 3180
ccatgcgtaa cttaatccag actttcacac cttataggaa aaccagtgag tctggagagc 3240
tgcatgggct cacaactgag gaggaatttg tagaagggat atacaaagtg gaaatagaca 3300
ccaaatctta ctggaaggca cttggcatct ccccattcca tgagcatgca gaggtgagta 3360
tacagacctt cgagggttgt tttggttttg gtttttgctt ttggcattcc aggaaatgca 3420
cagttttact cagtgtacca cagaaatgtc ctaaggaagg tgatgaatga ccaaaggttc 3480
cctttcctat tatacaagaa aaaattcaca acactctgag aagcaaattt ctttttgact 3540
ttgatgaaaa tccacttagt aacatgactt gaacttacat gaaactactc atagtctatt 3600
cattccactt tatatgaata ttgatgtatc tgctgttgaa ataatagttt atgaggcagc 3660
cctccagacc ccacgtagag tgtatgtaac aagagatgca ccattttatt tctcgaaaac 3720
ccgtaacatt cttcattcca aaacacatct ggcttctcgg aggtctggac aagtgattct 3780
tggcaacaca tacctataga gacaataaaa tcaaagtaat aatggcaaca caatagataa 3840
catttaccaa gcatacacca tgtggcagac acaattataa gtgttttcca tatttaacct 3900
acttaatcct caggaataag ccactgaggt cagtcctatt attatcccca tcttatagat 3960
gaagaaaatg aggcaccagg aagtcaaata acttgtcaaa ggtcacaaga ctaggaaata 4020
cacaagtaga aatgtttaca attaaggccc aggctgggtt tgccctcagt tctgctatgc 4080
ctcgcattat gccccaggaa actttttccc ttgtgaaagc caagcttaaa aaaagaaaag 4140
ccacatttgt aacgtgctct gttcccctgc ctatggtgag gatcttcaaa cagttataca 4200
tggacccagt ccccctgcct tctccttaat ttcttaagtc atttgaaaca gatggctgtc 4260
atggaaatag aatccagaca tgttggtcag agttaaagat caactaattc catcaaaaat 4320
agctcggcat gaaagggaac tattctctgg cttagtcatg gatgagactt tcaattgcta 4380
taaagtggtt cctttattag acaatgttac cagggaaaca acaggggttt gtttgacttc 4440
tggggcccac aagtcaacaa gagagcccca tctaccaagg agcatgtccc tgactacccc 4500
tcagccagca gcaagacatg gaccccagtc agggcaggag cagggtttcg gcggcgccca 4560
gcacaagaca ttgcccctag agtctcagcc cctaccctcg agtaatagat ctgcctacct 4620
gagactgttg tttgcccaag agctgggtct cagcctgatg ggaaccatat aaaaaggttc 4680
actgacatac tgcccacatg ttgttctctt tcattagatc ttagcttcct tgtctgctct 4740
tcattcttgc agtattcatt caacaaacat taaaaaaaaa aaaaagcatt ctatgtgtgg 4800
aacactctgc tagatgctgt ggatttagaa atgaaaatac atcccgaccc ttggaatgga 4860
agggaaagga ctgaagtaag acagattaag caggaccgtc agcccagctt gaagcccaga 4920
taaatacgga gaacaagaga gagcgagtag tgagagatga gtcccaatgc ctcactttgg 4980
tgacgggtgc gtggtgggct tcatgcagct tcttctgata aatgcctcct tcagaactgg 5040
tcaactctac cttggccagt gacccaggtg gtcatagtag atttaccaag ggaaaatgga 5100
aacttttatt aggagctctt aggcctcttc acttcatgga tttttttttc cttttttttt 5160
gagatggagt tttgccctgt cacccaggct ggaatgcagt ggtgcaatct cagctcactg 5220
caacctccgc ctcccaggtt caagcaattc tcctgcctca gcctcccgag tagctgggac 5280
tacaggtgtg cgccaccaca ccaggctaat ttttgtattt tttgtaaaga caggttttca 5340
ccacgttggc caggctggtc tgaactccag acctcaggtg attcacctgt ctcagcctcc 5400
caaagtgctg ggattacagg tgtgagccac cgtgcccggc tacttcatgg atttttgatt 5460
acagattatg cctcttacaa tttttaagaa gaatcaagtg ggctgaaggt caatgtcacc 5520
ataagacaaa agacattttt attagttgat tctagggaat tggccttaag gggagccctt 5580
tcttcctaag agattcttag gtgattctca cttcctcttg ccccagtatt atttttgttt 5640
ttggtatggc tcactcagat ccttttttcc tcctatccct aagtaatccg ggtttctttt 5700
tcccatattt agaacaaaat gtatttatgc agagtgtgtc caaacctcaa cccaaggcct 5760
gtatacaaaa taaatcaaat taaacacatc tttactgtct tctacctctt tcctgacctc 5820
aatatatccc aacttgcctc actctgagaa ccaaggctgt cccagcacct gagtcgcaga 5880
tattctactg atttgacaga actgtgtgac tatctggaac agcattttga tccacaattt 5940
gcccagttac aaagcttaaa tgagctctag tgcatgcata tatatttcaa aattccacca 6000
tgatcttcca cactctgtat tgtaaataga gccctgtaat gcttttactt cgtatttcat 6060
tgcttgttat acataaaaat atacttttct tcttcatgtt agaaaatgca aagaatagga 6120
gggtggggga atctctgggc ttggagacag gagacttgcc ttcctactat ggttccatca 6180
gaatgtagac tgggacaata caataattca agtctggttt gctcatctgt aaattgggaa 6240
gaatgtttcc agctccagaa tgctaaatct ctaagtctgt ggttggcagc cactattgca 6300
gcagctcttc aatgactcaa tgcagttttg cattctccct accttttttt tctaaaacca 6360
ataaaataga tacagccttt aggctttctg ggatttccct tagtcaagct agggtcatcc 6420
tgactttcgg cgtgaatttg caaaacaaga cctgactctg tactcctgct ctaaggactg 6480
tgcatggttc caaaggctta gcttgccagc atatttgagc tttttccttc tgttcaaact 6540
gttccaaaat ataaaagaat aaaattaatt aagttggcac tggacttccg gtggtcagtc 6600
atgtgtgtca tctgtcacgt ttttcgggct ctggtggaaa tggatctgtc tgtcttctct 6660
cataggtggt attcacagcc aacgactccg gcccccgccg ctacaccatt gccgccctgc 6720
tgagccccta ctcctattcc accacggctg tcgtcaccaa tcccaaggaa tgagggactt 6780
ctcctccagt ggacctgaag gacgagggat gggatttcat gtaaccaaga gtattccatt 6840
tttactaaag cagtgttttc acctcatatg ctatgttaga agtccaggca gagacaataa 6900
aacattcctg tgaaaggcac ttttcattcc actttaactt gattttttaa attcccttat 6960
tgtcccttcc aaaaaaaaga gaatcaaaat tttacaaaga atcaaaggaa ttctagaaag 7020
tatctgggca gaacgctagg agagatccaa atttccattg tcttgcaagc aaagcacgta 7080
ttaaatatga tctgcagcca ttaaaaagac acattctgta aatgagagag ccttattttc 7140
ctgtaacctt cagcaaatag caaaagacac attccaaggg cccacttctt tactgtgggc 7200
a 7201
<210> 19
<211> 6208
<212> DNA
<213> 智人
<400> 19
ggcaccggtg aatccaagtg tcctctgatg gtcaaagttc tagatgctgt ccgaggcagt 60
cctgccatca atgtggccgt gcatgtgttc agaaaggctg ctgatgacac ctgggagcca 120
tttgcctctg ggtaagttgc caaagaaccc tcccacagga cttggtttta tcttcccgtt 180
tgcccctcac ttggtagaga gaggctcaca tcatctgcta aagaatttac aagtagattg 240
aaaaacgtag gcagaggtca agtatgccct ctgaaggatg ccctcttttt gttttgctta 300
gctaggaagt gaccaggaac ctgagcatca tttaggggca gacagtagag aaaagaagga 360
atcagaactc ctctcctcta gctgtggttt gcaacccttt tgggtcacag aacactttat 420
gtaggtgatg aaaagtaaac attctatgcc cagaaaaaat gcacagatac acacacatac 480
aaaatcatat atgtgatttt aggagtttca cagattccct ggtgtccctg ggtaacacca 540
aagctaagtg tccttgtctt agaattttag gaaaaggtat aatgtgtatt aacccattaa 600
caaaaggaaa ggaattcaga aatattatta accaggcatc tgtctgtagt taatatggat 660
cacccaaaac ccaaggcttt tgcctaatga acactttggg gcacctactg tgtgcaaggc 720
tgggggctgt caagctcagt taaaaaaaaa aagatagaag agatggatcc atgaggcaaa 780
gtacagcccc aggctaatcc cacgatcacc cgacttcatg tccaagagtg gcttctcacc 840
ttcattagcc agttcacaat tttcatggag tttttctacc tgcactagca aaaacttcaa 900
ggaaaataca tattaataaa tctaagcaaa gtgaccagaa gacagagcaa tcaggagacc 960
ctttgcatcc agcagaagag gaactgctaa gtatttacat ctccacagag aagaatttct 1020
gttgggtttt aattgaaccc caagaaccac atgattcttc aaccattatt gggaagatca 1080
ttttcttagg tctggtttta actggctttt tatttgggaa ttcatttatg tttatataaa 1140
atgccaagca taacatgaaa agtggttaca ggactattct aagggagaga cagaatggac 1200
accaaaaata ttccaatgtt cttgtgaatc ttttccttgc accaggacaa aaaaaaaaag 1260
aagtgaaaag aagaaaggag gaggggcata atcagagtca gtaaagacaa ctgctatttt 1320
tatctatcgt agctgttgca gtcaaatggg aagcaatttc caacattcaa ctatggagct 1380
ggtacttaca tggaaataga agttgcctag tgtttgttgc tggcaaagag ttatcagaga 1440
ggttaaatat ataaaaggga aaagagtcag atacaggttc ttcttcctac tttaggtttt 1500
ccactgtgtg tgcaaatgat actccctggt ggtgtgcaga tgcctcaaag ctatcctcac 1560
accacaaggg agaggagcga gatcctgctg tcctggagaa gtgcagagtt agaacagctg 1620
tggccacttg catccaatca tcaatcttga atcacaggga ctctttctta agtaaacatt 1680
atacctggcc gggcacggtg gctcacgcct gtaatcccag cactttggga tgccaaagtg 1740
ggcatatcat ctgaggtcag gagttcaaga ccagcctggc caacatggca aaactccgtc 1800
tttatgaaaa atacaaaaat tagccaggca tggtggcagg cgcctgtaat cccagctaat 1860
tgggaggctg aggctggaga atcccttgaa tctaggaggc agaggttgca gtgagctgag 1920
atcgtgccat tgcactccag cctgggtgac aagagtaaaa ctctgtctca aaaaaaaaaa 1980
attataccta cattctcttc ttatcagaga aaaaaatcta cagtgagctt ttcaaaaagt 2040
ttttacaaac tttttgccat ttaatttcag ttaggagttt tccctacttc tgacttagtt 2100
gaggggaaat gttcataaca tgtttataac atgtttatgt gtgttagttg gtgggggtgt 2160
attactttgc catgccattt gtttcctcca tgcgtaactt aatccagact ttcacacctt 2220
ataggaaaac cagtgagtct ggagagctgc atgggctcac aactgaggag gaatttgtag 2280
aagggatata caaagtggaa atagacacca aatcttactg gaaggcactt ggcatctccc 2340
cattccatga gcatgcagag gtgagtatac agaccttcga gggttgtttt ggttttggtt 2400
tttgcttttg gcattccagg aaatgcacag ttttactcag tgtaccacag aaatgtccta 2460
aggaaggtga tgaatgacca aaggttccct ttcctattat acaagaaaaa attcacaaca 2520
ctctgagaag caaatttctt tttgactttg atgaaaatcc acttagtaac atgacttgaa 2580
cttacatgaa actactcata gtctattcat tccactttat atgaatattg atgtatctgc 2640
tgttgaaata atagtttatg aggcagccct ccagacccca cgtagagtgt atgtaacaag 2700
agatgcacca ttttatttct cgaaaacccg taacattctt cattccaaaa cacatctggc 2760
ttctcggagg tctggacaag tgattcttgg caacacatac ctatagagac aataaaatca 2820
aagtaataat ggcaacacaa tagataacat ttaccaagca tacaccatgt ggcagacaca 2880
attataagtg ttttccatat ttaacctact taatcctcag gaataagcca ctgaggtcag 2940
tcctattatt atccccatct tatagatgaa gaaaatgagg caccaggaag tcaaataact 3000
tgtcaaaggt cacaagacta ggaaatacac aagtagaaat gtttacaatt aaggcccagg 3060
ctgggtttgc cctcagttct gctatgcctc gcattatgcc ccaggaaact ttttcccttg 3120
tgaaagccaa gcttaaaaaa agaaaagcca catttgtaac gtgctctgtt cccctgccta 3180
tggtgaggat cttcaaacag ttatacatgg acccagtccc cctgccttct ccttaatttc 3240
ttaagtcatt tgaaacagat ggctgtcatg gaaatagaat ccagacatgt tggtcagagt 3300
taaagatcaa ctaattccat caaaaatagc tcggcatgaa agggaactat tctctggctt 3360
agtcatggat gagactttca attgctataa agtggttcct ttattagaca atgttaccag 3420
ggaaacaaca ggggtttgtt tgacttctgg ggcccacaag tcaacaagag agccccatct 3480
accaaggagc atgtccctga ctacccctca gccagcagca agacatggac cccagtcagg 3540
gcaggagcag ggtttcggcg gcgcccagca caagacattg cccctagagt ctcagcccct 3600
accctcgagt aatagatctg cctacctgag actgttgttt gcccaagagc tgggtctcag 3660
cctgatggga accatataaa aaggttcact gacatactgc ccacatgttg ttctctttca 3720
ttagatctta gcttccttgt ctgctcttca ttcttgcagt attcattcaa caaacattaa 3780
aaaaaaaaaa aagcattcta tgtgtggaac actctgctag atgctgtgga tttagaaatg 3840
aaaatacatc ccgacccttg gaatggaagg gaaaggactg aagtaagaca gattaagcag 3900
gaccgtcagc ccagcttgaa gcccagataa atacggagaa caagagagag cgagtagtga 3960
gagatgagtc ccaatgcctc actttggtga cgggtgcgtg gtgggcttca tgcagcttct 4020
tctgataaat gcctccttca gaactggtca actctacctt ggccagtgac ccaggtggtc 4080
atagtagatt taccaaggga aaatggaaac ttttattagg agctcttagg cctcttcact 4140
tcatggattt ttttttcctt tttttttgag atggagtttt gccctgtcac ccaggctgga 4200
atgcagtggt gcaatctcag ctcactgcaa cctccgcctc ccaggttcaa gcaattctcc 4260
tgcctcagcc tcccgagtag ctgggactac aggtgtgcgc caccacacca ggctaatttt 4320
tgtatttttt gtaaagacag gttttcacca cgttggccag gctggtctga actccagacc 4380
tcaggtgatt cacctgtctc agcctcccaa agtgctggga ttacaggtgt gagccaccgt 4440
gcccggctac ttcatggatt tttgattaca gattatgcct cttacaattt ttaagaagaa 4500
tcaagtgggc tgaaggtcaa tgtcaccata agacaaaaga catttttatt agttgattct 4560
agggaattgg ccttaagggg agccctttct tcctaagaga ttcttaggtg attctcactt 4620
cctcttgccc cagtattatt tttgtttttg gtatggctca ctcagatcct tttttcctcc 4680
tatccctaag taatccgggt ttctttttcc catatttaga acaaaatgta tttatgcaga 4740
gtgtgtccaa acctcaaccc aaggcctgta tacaaaataa atcaaattaa acacatcttt 4800
actgtcttct acctctttcc tgacctcaat atatcccaac ttgcctcact ctgagaacca 4860
aggctgtccc agcacctgag tcgcagatat tctactgatt tgacagaact gtgtgactat 4920
ctggaacagc attttgatcc acaatttgcc cagttacaaa gcttaaatga gctctagtgc 4980
atgcatatat atttcaaaat tccaccatga tcttccacac tctgtattgt aaatagagcc 5040
ctgtaatgct tttacttcgt atttcattgc ttgttataca taaaaatata cttttcttct 5100
tcatgttaga aaatgcaaag aataggaggg tgggggaatc tctgggcttg gagacaggag 5160
acttgccttc ctactatggt tccatcagaa tgtagactgg gacaatacaa taattcaagt 5220
ctggtttgct catctgtaaa ttgggaagaa tgtttccagc tccagaatgc taaatctcta 5280
agtctgtggt tggcagccac tattgcagca gctcttcaat gactcaatgc agttttgcat 5340
tctccctacc ttttttttct aaaaccaata aaatagatac agcctttagg ctttctggga 5400
tttcccttag tcaagctagg gtcatcctga ctttcggcgt gaatttgcaa aacaagacct 5460
gactctgtac tcctgctcta aggactgtgc atggttccaa aggcttagct tgccagcata 5520
tttgagcttt ttccttctgt tcaaactgtt ccaaaatata aaagaataaa attaattaag 5580
ttggcactgg acttccggtg gtcagtcatg tgtgtcatct gtcacgtttt tcgggctctg 5640
gtggaaatgg atctgtctgt cttctctcat aggtggtatt cacagccaac gactccggcc 5700
cccgccgcta caccattgcc gccctgctga gcccctactc ctattccacc acggctgtcg 5760
tcaccaatcc caaggaatga gggacttctc ctccagtgga cctgaaggac gagggatggg 5820
atttcatgta accaagagta ttccattttt actaaagcag tgttttcacc tcatatgcta 5880
tgttagaagt ccaggcagag acaataaaac attcctgtga aaggcacttt tcattccact 5940
ttaacttgat tttttaaatt cccttattgt cccttccaaa aaaaagagaa tcaaaatttt 6000
acaaagaatc aaaggaattc tagaaagtat ctgggcagaa cgctaggaga gatccaaatt 6060
tccattgtct tgcaagcaaa gcacgtatta aatatgatct gcagccatta aaaagacaca 6120
ttctgtaaat gagagagcct tattttcctg taaccttcag caaatagcaa aagacacatt 6180
ccaagggccc acttctttac tgtgggca 6208
<210> 20
<211> 8300
<212> DNA
<213> Mus 肌肉
<400> 20
atggcttccc ttcgactctt cctcctttgc ctcgctggac tggtatttgt gtctgaagct 60
ggccccgcgg tgagtgatcc tgtgagcgat ccagacatgg cagttagacc ttagataaag 120
aagaagtgcc ttcttccaga tgtgagaact agagtactca gactctatat ttaccattag 180
actccaaaga gaagagctgg agtgcctctg gctcttcctt ctattgcttt agcgcattgg 240
gtctgtagtg ctcagtctct ggtgtcctta gataataaag atatgagatt aacatagaaa 300
taaagatata aaagggctgg atgtatagtt tagtggtcca gtgtatgcct agtatgtgaa 360
aagccttctg ttcaacctct agcaatagaa aaacaagata tattctcggt ggggctgtta 420
atattgaatt ctcataaaat ctttaatata tttagtatgc ctattatgtt gttatatttt 480
agttctttag ctaatcaaaa tgcattattg atctttcttt gtcttttttt ggccaacact 540
ctattccagt ctttgaaaaa gtcctttaaa agagttaatc agtataatta aatgagtcag 600
gaagtatgtg agggttattt tacaaccaga gggaattact atagcaacag ctgattagaa 660
tgatctcaag aaaaagccca ttctgtcttt ttgcaccatg cacctttcag tggctccatt 720
cagatggaga ggcaaacaga gcaatggctc tcagagggcc tattttccct ttgaacattc 780
attatccata tccctggtgc acagcagtgc atctgggggc agaaactgtt cttgctttgg 840
aaacaatgct gtctatgtca tactggataa agaagctcat taattgtcaa cacttatgtt 900
atcataatgg gatcagcatg tacttttggt tttgttccag agtctatcac cggaaagaac 960
aagccggttt actctgaccc atttcactga catttctctt gtctcctctg tgcccagggt 1020
gctggagaat ccaaatgtcc tctgatggtc aaagtcctgg atgctgtccg aggcagccct 1080
gctgtagacg tggctgtaaa agtgttcaaa aagacctctg agggatcctg ggagcccttt 1140
gcctctgggt aagcttgtag aaagcccacc atgggaccgg ttccaggttc ccatttgctc 1200
ttattcgtgt tagattcaga cacacacaac ttaccagcta gagggctcag agagagggct 1260
caggggcgaa gggcacgtat tgctcttgta agagacacag gtttaattcc tagcaccaga 1320
atggcagctc ataaccatct gaaactcaca gtcttaggag atctgggtat ctgacattct 1380
cttctaccca ccatgtgtgt ggtgcacaaa ttcacatgca ggcatcaaat cttataaaca 1440
acaacaaaaa accaacaaac ctggtagcaa aagaagatta gaaggttaaa catatgagcc 1500
gagagctttt gttttgtttt gttttgtttt gttttgttta catttcaaat gttatcccct 1560
ttctcggtcc ccctccccaa accctctacc ccattctctc ctccccttct tctatgaggg 1620
tgttccccac caacccactc ccaccttcct gctctcgaat tcccctatac tgggacatca 1680
agccttcaca gaatcaaggg cctctcctcc cattgatgcc cgacaatgtc atcctctgct 1740
acctatgtgg ctggagccat gggtcccttc atgtatcctc cttggttggt ggtttagtct 1800
ctgggaggtc tgggggatct ggttgattga tattattgtt cttcctatga gattgcaaac 1860
cccttcagct ccttcggtcc tttaactcct ccactgggga ccccgagctc agtccaatgg 1920
ttggctgtga gcatccacca gcagaggcct tttttttttt ttttaacaaa gctgctttat 1980
tatgttgctt agagcatgac caggaaccag agcacagtcc aagactgaag ggaggaaaag 2040
ggggggagtc aataacccca ctgtttcata gtggtttgca acccttttat atcacagccc 2100
actttaggca aataatgaaa attatagtct ccagggacag agaagatggt gcaggaagtg 2160
aagtgcctgc tcagaaaatg ggggcttgaa tgtgagttcc cagactctgt gtaagatgcc 2220
cagcatcgaa gtgcatgctt ataacaccag cctggaggta gaagcttaga aacaggggta 2280
ccctgaagtt gcttgttcac cagtgtccct gaatgggtag gtgcatgttt ggtgagagac 2340
cctgtctcaa aaatcaaggt gtaggataat tgaaaatacc tagctttgag cttagatcat 2400
gcaaatgtgt acacacactc acacacacca cacacacaaa aaaatgcaga gacagagaga 2460
tacagagaga cagagagata cagagacaga gacagagaga aaaggagaaa gtaaaaaaca 2520
aataatttaa agacccatgg ccacaaagag gctcaaagac aagcacgtat aaaaccatac 2580
acatgtaatt ttaggagttt tcagattccc tggtacccgt gggtgatgca caagctttga 2640
atcccagtct taaaatctta cgaagaacgt gttcgtgtgt gctaatttat tgatgagagg 2700
aaaggaattg acaaagtgcc cttccggagc ttcctgcatt acccagactc agggtttttt 2760
taaatgtaca ctcagaacag agtagctctg tgcaagggta gcaaccacga agcttaataa 2820
gaaacatatc gtgagagatc tgcaaggcaa atctaggggc tgaccaatct cacagtcacc 2880
cactagcatg tcaacacaac ttcccacctg tgctagccac ttagcaattt tgtgttgttc 2940
tgttttgttt ttgtttttaa caaagcaatt tcaaagagat ttctaattca tctaaacaaa 3000
caaaccaaaa ggaaaacagc aaagacgccc tgagcactta gcagagcagc tatgcagtta 3060
tgactcctgg gtggagactt tatatcaggc ttcaactgaa tacctagaac ctactagtgc 3120
tcttcatcaa tccttgggaa ggtcattttc ttttggtgct gttttgagtt tctatttgtt 3180
aatgtcttca taattataca cgtgttgagc acagcatgca aagtgattag gggaatctag 3240
ttggagtgga atggataccc aaatattcag actttcttgt gactcttctt tcttgtaccc 3300
acatcaaaaa aaaaaaaaat ggagatgaga catggtcaga gtcactaaaa ccagctgcta 3360
cttttaatta cgtggggagc agtttctaac attgccatta ttgaactgat gctgcctggg 3420
tggaaatgga aatcacttag tatttcttgt tggcaaagaa ttactgaatg gattaaattt 3480
ccaaagggag aagtcagtta caagtctttt ctttgtttat taggctttct gctatgataa 3540
attacactac ttccagaagt tacccttagg ccatgggaca ctggactatc actctgctgt 3600
cacaagagat tacagagtta gtcaaggcag cttgtgacac cttcagggac tgtcataaac 3660
ttccagcaag tcattaatcc tgaatgcaat actgtgtgtg tgtgtctatg tgtgtttgta 3720
tgtctgtgtg tgtcttatgt ctgtgtctct gtgtgtgtgt gtgtttgtgt gtgtgtgtgt 3780
atgtatgcct gtgtgtgtct tatgtctgtg tttgtgtgtc tgtgtgtgtc ttatgtctgt 3840
gtttgtatgt ctgtgtgtgt ctgtgtgtgt cttatgtctg tgtctctgtg tgtgtgtgtg 3900
tgtatgtatg tatgtatgta tgtatgtgta tgtgtttgca tctctctgtg tgtctgcgct 3960
tatatatttg tgtatgtgtt tatgtgttcg cctttgtgcg ttgttgggga ttgaatccag 4020
gggaatacaa atgttaagaa agaacgttac cactaagctt cacctgtagg ccttaaagct 4080
tttctttctt ttaaaaattg taattaattc attttcagtc aggatctcca cacctcgtcc 4140
ctgctgctct agaactcact atttaaacac aatcgccctc aaacctgcag caaccctccc 4200
gcctctaccc tgcgagcact agaataataa caggtgaccc cacacgccta gattaagacc 4260
tttaaggtaa acattttact atattttagt ctcataagac aagatgctac aataaagctg 4320
tacataaagt tccctcgaat ttcttgctat tttaactcaa acataaggat ttcctccttt 4380
ttgattcagg taacagaaaa aatacacagg tacatacatg tacacacatg aacacacacg 4440
catcacaacc acatatgcgc acgcttgtgt gatctatcat ttaccatgcc actgaactct 4500
tctttcccca taaattcctc tggacttgtg tgccctccag gaagaccgcg gagtctggag 4560
agctgcacgg gctcaccaca gatgagaagt ttgtagaagg agtgtacaga gtagaactgg 4620
acaccaaatc gtactggaag acacttggca tttccccgtt ccatgaattc gcggatgtaa 4680
gtggacacac caagttgttt ggattttgtt tttagtctca ggaaattccc ttcgctcttg 4740
ctgtacgatg ggcatgagtg gaaagtagat tccacagcca gaatccacag tgctgggaaa 4800
gcaagccttc tgaatttttc taaaactcat ttagcaacat ggcctgaacc tgttcacact 4860
gcttatggtc agctaactat atttatgtaa atattcattt ctctgttgag gaaatgttag 4920
tatttgcttt tgaggcaacc tccagatacc atggagggca tgtcatagtc aaagagaggg 4980
ctccctatgg tatttctcta aattctggca tttcctttat tccaaagcac atctagtgtc 5040
cccagaagtt tgggtagaca attcttggca acacagagaa ttacaacatg ttcaaaaccc 5100
aacagcttaa tatctaaatc atcaagcaaa catcacatgg caaagggatt tctgaatcaa 5160
aactgtttca tccttatgat caacctatgg aggtctagcc tcgacttaca cccattttac 5220
caataagcta agagaagcta agttcctcat caaggacaca aggctagcat gtgtgagcaa 5280
gtgacagagt tgccctctat gttggttagt gtgccttagc cagtgtctca gtaagaaatg 5340
gagctaaatc aaaacccaag gccaacagcc aaaggcacat gagtaacctt tgcttggcac 5400
tgggctcagt ttccctggct cctctcagtc ctcagttcac agaggcagct gtcatgcaaa 5460
tagaatccaa gcttgttggt cagacctgga gataacaaat tccatcaaaa atagctcctc 5520
atgtgaccta gtttgctgtc tgttgctatg atacacacca tgaccgaaaa gcaaccctgg 5580
ggagagaagg gtttatttca tcttacagct tacagttcac catggaggaa agccaggtgg 5640
gaacctggaa gtggaaattg aagcagagac cagaaaggaa tgctgtttac tggctggctt 5700
agctcctttt cttatacagc ttaggtctat gtgcccaggg gatggtactg ccgagcatag 5760
gctgagcccg cctacatcaa ccattagtca aaaaaaggtc catagacttg cctacaggcc 5820
aatctcatgg aggcaatacc ccagtggagg gtccctcttc gcaggttact ctagtttgtg 5880
tcaagttgac aaaacctaac cacaaagcac aaacagggtc tgcccttgtg gcttagccat 5940
ggatgacact ctcagatgat ggtgttacca gacaaaccag aggggctcac caagagtctg 6000
ccacctacca aggtagtact ctactcctca ctgggcacca acacccatat tagctgggcc 6060
agtacaggac ccttgctgtt tcctgcatga attgtccata gaccctgggt ctcagcctgc 6120
cgggagtacc tgtaagtagt cgcctcaaac acattattcc tgttggaaga cttgtctgat 6180
tctcttttag aactcaatca acaaacgttt ttattttgtt ttggcttttt ggagacaaga 6240
tctctcatag gccagcctga cttgaatgta gctgaggatg acctgtgctg ctaatcttct 6300
cgcctcttcc tcccaagtgg taggataata ggcataagac accacagcag ttttactcca 6360
taccagggct ctgaacccag actttaaaca ctctatcaac tgattcacat tcccacccca 6420
tcattcaaca aacatttgaa aaataaaacc cttctgcctt gagcactctg ctaaatacag 6480
cctttgagtg cggagtattt cctcacaacc agggtccaag atgaccccat catacatacc 6540
acggaaaatt aggagatgtt tttaggtctc tttgcttggg gtaattttta tgtgtgtgtg 6600
tacacagccc tgtgcgtgtg tgtgtgtgtg tgtgtgtgtg tgtacaggca cacacgtgta 6660
tgcatgtaga ggctacataa aaaccttagg tgtcattctc aggcactctg ttcacccctt 6720
cacacagccc gaacacacaa aatttgaggc attagcctgg agctcaccag ttaggctaga 6780
ctgacttgcc agcagacccc aggctgtctc catctcccca gctctgggat tacaaactct 6840
atcataccag acatttttat acatattctg agcataaaat tcatgtcttc aggctaacaa 6900
gtcaagagct taaatgactg agctctctta cgtggtggat tttttttaaa actacataat 6960
atcttttttt tttttttcac ttctggggaa gaaacaaatg agcctgagtg acaatgcgac 7020
agaaaagaaa ttttgaggag tgtgtgtgtc tgtgtgtgtg gtggcacatg cctctcatct 7080
aatgctagag gctacagtag aatgctcctg aattagtggc cagccaaggc caagggctag 7140
ggttgtaact cagtggcaga gggcttgcct agcattcgca ggatttgatc catagcgcta 7200
taaataataa taaataaata caacagtcta agatgattct ccctttcatt tatctggatg 7260
ttatttttgt gttagtttta ctctgtcatc caatcattgt ttgccctata tttggacatt 7320
taaaaaaaat ctttattcca agtgtgttca aagctgtatc caaaacctgt ccaccaaatg 7380
agtccaatga catacatctt ctatattacc atctgttcca gatttggctg actcccggca 7440
cctgggctgt tgctgcaccc atgtctcaga tagtctagtg atttgagaag tgactagtaa 7500
ttgcaaaatc cagactttgt ccagaaactt ctatgagctc caaaactttc atttacattt 7560
ctgccagcca caaaccgctt gtgttgtgga gagaaccctg tgatgtcttc ccacagcatc 7620
tcagccttgt ttcttccctt aaaatattca tcttttcaca ttagaacatg caaagggaca 7680
gtgggagcga aacccctgga ctgggacgca cgaagccttc ctttctggtc aggctctcac 7740
tgtagaaact taggccggtt tcagcatgca gtctgctgga gaatggctcc tgccaacatt 7800
ccaggtctgg aagtttgtag tggagttgtt gataaccact gttcgccaca ggtcttttgt 7860
ttgtgggtgt cagtgtttct actctcctga cttttatctg aacccaagaa agggaacaat 7920
agccttcaag ctctctgtga ctctgatctg accagggcca cccacactgc agaaggaaac 7980
ttgcaaagag agacctgcaa ttctctaaga gctccacaca gctccaaaga cttaggcagc 8040
atattttaat ctaattattc gtcccccaac cccaccccag aggacagtta gacaataaaa 8100
ggaagattac cagcttagca tcctgtgaac actttgtctg cagctcctac ctctgggctc 8160
tgttagaact agctgtctct cctctctcct aggtggtttt cacagccaac gactctggcc 8220
atcgccacta caccatcgca gccctgctca gcccatactc ctacagcacc acggctgtcg 8280
tcagcaaccc ccagaattga 8300
<210> 21
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 21
cacagacaat cagacgtacc agta 24
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 22
ccagctttgc cagtttacga 20
<210> 23
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 23
ttggacggtt gccctctt 18
<210> 24
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 24
gatggcttcc cttcgactct tc 22
<210> 25
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 25
cactgacatt tctcttgtct cctct 25
<210> 26
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 26
gggctcacca cagatgagaa g 21
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 27
cactgttcgc cacaggtctt 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 28
gctcagccca tactcctaca 20
<210> 29
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 29
gcccaggagg accaggat 18
<210> 30
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 30
ggcaacttgc ttgaggaaga 20
<210> 31
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 31
gcagcaaccc agcttcactt 20
<210> 32
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 32
actgagctgg gacttgaac 19
<210> 33
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 33
tgcctcactc tgagaacca 19
<210> 34
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 34
ggtggagagg ctattcggc 19
<210> 35
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 35
ggccgtgcat gtgttcag 18
<210> 36
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 36
ggttcccatt tgctcttatt cgt 23
<210> 37
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 37
cccacactgc agaaggaaac ttg 23
<210> 38
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 38
ggttcccatt tgctcttatt cgt 23
<210> 39
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 39
ccagcttagc atcctgtgaa ca 22
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 40
ggcaacttgc ttgaggaaga 20
<210> 41
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 41
tgtggagttc agtagtgtgg ag 22
<210> 42
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 42
cactgacatt tctcttgtct cctct 25
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 43
gggacatctc ggtttcctga ctt 23
<210> 44
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 44
tccacactac tgaactccac aa 22
<210> 45
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 45
cggaacactc gctctacgaa a 21
<210> 46
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 46
gggccagctt cagacaca 18
<210> 47
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 47
cccagggtgc tggagaatcc aa 22
<210> 48
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 48
gccaagtgtc ttccagtacg at 22
<210> 49
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 49
gttccctttc ttgggttcag a 21
<210> 50
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 50
gatgctactg ctttggcaag atc 23
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 51
cctgagctgc taacacggtt 20
<210> 52
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 52
agctacagac catgcttagt gta 23
<210> 53
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 53
tgccagttta ggaggaatat gttc 24
<210> 54
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 54
ctgaggaaac agaggtacca gatat 25
<210> 55
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 55
agtcacacag ttctgtcaaa tcag 24
<210> 56
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 56
gaacacggcg gcatcag 17
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 57
tcctgtggga gggttctttg 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 58
ccctctctct gagccctcta 20
<210> 59
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 59
gctgcctaag tctttggagc t 21
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 60
ccctctctct gagccctcta 20
<210> 61
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 61
gagaggagag acagctagtt ctaac 25
<210> 62
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 62
agctacagac catgcttagt gta 23
<210> 63
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 63
gccctcttca tacaggaatc ac 22
<210> 64
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 64
cggacagcat ccaggactt 19
<210> 65
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 65
tcatgtaatc tggcttcaga gtggga 26
<210> 66
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 66
tgggaggcaa ttcttagttt caatgga 27
<210> 67
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 67
tcccaaaggt gtctgtctgc aca 23
<210> 68
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 68
ctcctttgcc tcgctggact gg 22
<210> 69
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 69
cggacagcat ccaggactt 19
<210> 70
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 70
agaaggagtg tacagagtag aactggaca 29
<210> 71
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 71
tgtttgtggg tgtcagtgtt tctactc 27
<210> 72
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 72
caccacggct gtcgtcagca a 21
<210> 73
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 73
cttgccaaag cagtagcatc cca 23
<210> 74
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 74
aggtcagaaa gcagagtgga cca 23
<210> 75
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 75
cccaggcaat tcctaccttc cca 23
<210> 76
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 76
tctgagcatt ctacctcatt gctttggt 28
<210> 77
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 77
aggctgtccc agcacctgag tcg 23
<210> 78
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 78
tgggcacaac agacaatcgg ctg 23
<210> 79
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 79
aaggctgctg atgacacctg gga 23
<210> 80
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 80
agattcagac acacacaact taccagc 27
<210> 81
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 81
agacctgcaa ttctctaaga gctccaca 28
<210> 82
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 82
agattcagac acacacaact taccagc 27
<210> 83
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 83
ttgtctgcag ctcctacctc tggg 24
<210> 84
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 84
aggtcagaaa gcagagtgga cca 23
<210> 85
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 85
ttgacatgtg tgggtgagag attttactg 29
<210> 86
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 86
cccagggtgc tggagaatcc aa 22
<210> 87
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 87
guuuuagagc uaugcu 16
<210> 88
<211> 67
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 88
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugcuuu 67
<210> 89
<211> 77
<212> RNA
<213> 人工序列
<220>
<223> 合成的
<400> 89
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcu 77
<210> 90
<211> 444
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 90
atggcttctc atcgtctgct cctcctctgc cttgctggac tggtatttgt gtctgaggct 60
ggccctacgg gcaccggtga atccaagtgt cctctgatgg tcaaagttct agatgctgtc 120
cgaggcagtc ctgccatcaa tgtggccgtg catgtgttca gaaaggctgc tgatgacacc 180
tgggagccat ttgcctctgg gaaaaccagt gagtctggag agctgcatgg gctcacaact 240
gaggaggaat ttgtagaagg gatatacaaa gtggaaatag acaccaaatc ttactggaag 300
gcacttggca tctccccatt ccatgagcat gcagaggtgg tattcacagc caacgactcc 360
ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct 420
gtcgtcacca atcccaagga atga 444
<210> 91
<211> 444
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 91
atggcttccc ttcgactctt cctcctttgc ctcgctggac tggtatttgt gtctgaagct 60
ggccccgcgg gcaccggtga atccaagtgt cctctgatgg tcaaagttct agatgctgtc 120
cgaggcagtc ctgccatcaa tgtggccgtg catgtgttca gaaaggctgc tgatgacacc 180
tgggagccat ttgcctctgg gaaaaccagt gagtctggag agctgcatgg gctcacaact 240
gaggaggaat ttgtagaagg gatatacaaa gtggaaatag acaccaaatc ttactggaag 300
gcacttggca tctccccatt ccatgagcat gcagaggtgg tattcacagc caacgactcc 360
ggcccccgcc gctacaccat tgccgccctg ctgagcccct actcctattc caccacggct 420
gtcgtcacca atcccaagga atga 444
<210> 92
<211> 444
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 92
atggcttccc ttcgactctt cctcctttgc ctcgctggac tggtatttgt gtctgaagct 60
ggccccgcgg gtgctggaga atccaaatgt cctctgatgg tcaaagtcct ggatgctgtc 120
cgaggcagcc ctgctgtaga cgtggctgta aaagtgttca aaaagacctc tgagggatcc 180
tgggagccct ttgcctctgg gaagaccgcg gagtctggag agctgcacgg gctcaccaca 240
gatgagaagt ttgtagaagg agtgtacaga gtagaactgg acaccaaatc gtactggaag 300
acacttggca tttccccgtt ccatgaattc gcggatgtgg ttttcacagc caacgactct 360
ggccatcgcc actacaccat cgcagccctg ctcagcccat actcctacag caccacggct 420
gtcgtcagca acccccagaa ttga 444
<210> 93
<211> 4176
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<220>
<221> misc_feature
<222> (1)..(3)
<223> 起始密码子
<220>
<221> misc_feature
<222> (10)..(30)
<223> 5' NLS
<220>
<221> misc_feature
<222> (4126)..(4173)
<223> 3' NLS
<220>
<221> misc_feature
<222> (4174)..(4176)
<223> 终止密码子
<400> 93
atggacaagc ccaagaaaaa gcggaaagtg aagtacagca tcggcctgga catcggcacc 60
aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag 120
gtgctgggca acaccgacag gcacagcatc aagaagaacc tgatcggcgc cctgctgttc 180
gacagcggcg aaacagccga ggccaccaga ctgaagagaa ccgccagaag aagatacacc 240
aggcggaaga acaggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg 300
gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga caagaagcac 360
gagagacacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc 420
accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgagactg 480
atctacctgg ccctggccca catgatcaag ttcagaggcc acttcctgat cgagggcgac 540
ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac 600
cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc tatcctgtct 660
gccagactga gcaagagcag aaggctggaa aatctgatcg cccagctgcc cggcgagaag 720
aagaacggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag 780
agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac 840
gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt cctggccgcc 900
aagaacctgt ctgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc 960
aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc 1020
ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagaaat cttcttcgac 1080
cagagcaaga acggctacgc cggctacatc gatggcggcg ctagccagga agagttctac 1140
aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg 1200
aacagagagg acctgctgag aaagcagaga accttcgaca acggcagcat cccccaccag 1260
atccacctgg gagagctgca cgctatcctg agaaggcagg aagattttta cccattcctg 1320
aaggacaacc gggaaaagat cgagaagatc ctgaccttca ggatccccta ctacgtgggc 1380
cccctggcca gaggcaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc 1440
accccctgga acttcgagga agtggtggac aagggcgcca gcgcccagag cttcatcgag 1500
agaatgacaa acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg 1560
ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag tgaaatacgt gaccgaggga 1620
atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc 1680
aagaccaaca gaaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag 1740
tgcttcgact ccgtggaaat ctccggcgtg gaagatagat tcaacgcctc cctgggcaca 1800
taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggataacga agagaacgag 1860
gacattctgg aagatatcgt gctgaccctg acactgtttg aggaccgcga gatgatcgag 1920
gaaaggctga aaacctacgc tcacctgttc gacgacaaag tgatgaagca gctgaagaga 1980
aggcggtaca ccggctgggg caggctgagc agaaagctga tcaacggcat cagagacaag 2040
cagagcggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa ccggaacttc 2100
atgcagctga tccacgacga cagcctgaca ttcaaagagg acatccagaa agcccaggtg 2160
tccggccagg gcgactctct gcacgagcat atcgctaacc tggccggcag ccccgctatc 2220
aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggcaga 2280
cacaagcccg agaacatcgt gatcgagatg gctagagaga accagaccac ccagaaggga 2340
cagaagaact cccgcgagag gatgaagaga atcgaagagg gcatcaaaga gctgggcagc 2400
cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg 2460
tactacctgc agaatggccg ggatatgtac gtggaccagg aactggacat caacagactg 2520
tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga ctccatcgat 2580
aacaaagtgc tgactcggag cgacaagaac agaggcaaga gcgacaacgt gccctccgaa 2640
gaggtcgtga agaagatgaa gaactactgg cgacagctgc tgaacgccaa gctgattacc 2700
cagaggaagt tcgataacct gaccaaggcc gagagaggcg gcctgagcga gctggataag 2760
gccggcttca tcaagaggca gctggtggaa accagacaga tcacaaagca cgtggcacag 2820
atcctggact cccggatgaa cactaagtac gacgaaaacg ataagctgat ccgggaagtg 2880
aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac 2940
aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg 3000
ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac 3060
aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc 3120
gccaagtact tcttctacag caacatcatg aactttttca agaccgaaat caccctggcc 3180
aacggcgaga tcagaaagcg ccctctgatc gagacaaacg gcgaaaccgg ggagatcgtg 3240
tgggataagg gcagagactt cgccacagtg cgaaaggtgc tgagcatgcc ccaagtgaat 3300
atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag 3360
aggaacagcg acaagctgat cgccagaaag aaggactggg accccaagaa gtacggcggc 3420
ttcgacagcc ctaccgtggc ctactctgtg ctggtggtgg ctaaggtgga aaagggcaag 3480
tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc 3540
tttgagaaga accctatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac 3600
ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggcag aaagagaatg 3660
ctggcctctg ccggcgaact gcagaaggga aacgagctgg ccctgcctag caaatatgtg 3720
aacttcctgt acctggcctc ccactatgag aagctgaagg gcagccctga ggacaacgaa 3780
cagaaacagc tgtttgtgga acagcataag cactacctgg acgagatcat cgagcagatc 3840
agcgagttct ccaagagagt gatcctggcc gacgccaatc tggacaaggt gctgtctgcc 3900
tacaacaagc acagggacaa gcctatcaga gagcaggccg agaatatcat ccacctgttc 3960
accctgacaa acctgggcgc tcctgccgcc ttcaagtact ttgacaccac catcgaccgg 4020
aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc 4080
ggcctgtacg agacaagaat cgacctgtct cagctgggag gcgacaagag acctgccgcc 4140
actaagaagg ccggacaggc caaaaagaag aagtga 4176
<210> 94
<211> 1391
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<220>
<221> MISC_FEATURE
<222> (4)..(10)
<223> 5' NLS
<220>
<221> MISC_FEATURE
<222> (1376)..(1391)
<223> 3' NLS
<400> 94
Met Asp Lys Pro Lys Lys Lys Arg Lys Val Lys Tyr Ser Ile Gly Leu
1 5 10 15
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
20 25 30
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
35 40 45
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
50 55 60
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
65 70 75 80
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
85 90 95
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
100 105 110
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
115 120 125
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
130 135 140
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
145 150 155 160
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
165 170 175
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
180 185 190
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
195 200 205
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
210 215 220
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
225 230 235 240
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
245 250 255
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
260 265 270
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
275 280 285
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
290 295 300
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
305 310 315 320
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
325 330 335
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
340 345 350
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
355 360 365
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
370 375 380
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
385 390 395 400
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
405 410 415
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
420 425 430
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
435 440 445
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
450 455 460
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
465 470 475 480
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
485 490 495
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
500 505 510
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
515 520 525
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
530 535 540
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
545 550 555 560
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
565 570 575
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
580 585 590
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
595 600 605
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
610 615 620
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
625 630 635 640
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
645 650 655
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
660 665 670
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
675 680 685
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
690 695 700
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
705 710 715 720
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
725 730 735
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
740 745 750
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
755 760 765
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
770 775 780
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
785 790 795 800
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
805 810 815
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
820 825 830
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
835 840 845
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
850 855 860
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
865 870 875 880
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
885 890 895
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
930 935 940
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
945 950 955 960
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
965 970 975
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
995 1000 1005
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr
1010 1015 1020
Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys
1025 1030 1035
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1040 1045 1050
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1055 1060 1065
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1070 1075 1080
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
1085 1090 1095
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser
1100 1105 1110
Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1115 1120 1125
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1130 1135 1140
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
1145 1150 1155
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile
1160 1165 1170
Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe
1175 1180 1185
Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1190 1195 1200
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys
1205 1210 1215
Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1220 1225 1230
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1235 1240 1245
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln
1250 1255 1260
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1265 1270 1275
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1280 1285 1290
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1295 1300 1305
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1310 1315 1320
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1325 1330 1335
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1340 1345 1350
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1355 1360 1365
Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys
1370 1375 1380
Ala Gly Gln Ala Lys Lys Lys Lys
1385 1390
权利要求书(按照条约第19条的修改)
1.一种非人类动物,该非人类动物在其基因组中包含基因修饰的内源Ttr基因座,该内源Ttr基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者。
2.如权利要求1所述的非人类动物,其中,所述内源Ttr基因座的包含Ttr编码序列和非编码序列这两者的区域已被删除并且被包含TTR编码序列和非编码序列这两者的相应的人TTR序列取代。
3.如权利要求1或2所述的非人类动物,其中,所述基因修饰的内源Ttr基因座包含内源Ttr启动子,其中,所述人TTR序列可操作地连接至所述内源Ttr启动子。
4.如前述权利要求中任一项所述的非人类动物,其中,所述内源Ttr基因座的至少一个内含子和至少一个外显子已被删除并且被相应的人TTR序列取代。
5.如前述权利要求中任一项所述的非人类动物,其中,所述内源Ttr基因座的全部Ttr编码序列已被删除并且被相应的人TTR序列取代。
6.如权利要求5所述的非人类动物,其中,所述内源Ttr基因座的从Ttr起始密码子至Ttr终止密码子的区域已被删除并且被相应的人TTR序列取代。
7.如前述权利要求中任一项所述的非人类动物,其中,所述基因修饰的内源Ttr基因座包含人TTR 3’非翻译区域。
8.如前述权利要求中任一项所述的非人类动物,其中,内源Ttr5’非翻译区域未被删除并且未被相应的人TTR序列取代。
9.如前述权利要求中任一项所述的非人类动物,其中,所述内源Ttr基因座的从Ttr起始密码子至Ttr终止密码子的区域已被删除并且被包含相应的人TTR序列和人TTR 3’非翻译区域的人TTR序列取代;并且
其中,所述内源Ttr 5’非翻译区域没有被删除并且没有被相应的人TTR序列取代;并且,
其中,所述内源Ttr启动子未被删除并且未被相应的人TTR序列取代。
10.如权利要求9所述的非人类动物,其中:
(i)所述基因修饰的内源Ttr基因座处的人TTR序列包括与SEQ ID NO:18中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列;
(ii)所述基因修饰的内源Ttr基因座编码包含如下序列的蛋白质,所述序列与SEQ IDNO:1中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性;
(iii)所述基因修饰的内源Ttr基因座包含编码序列,该编码序列包含与SEQ ID NO:90中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列;
(iv)所述基因修饰的内源Ttr基因座包含与SEQ ID NO:14或15中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列。
11.如权利要求1至4中任一项所述的非人类动物,其中,所述基因修饰的内源Ttr基因座编码包含信号肽的转甲状腺素蛋白前体蛋白并且编码信号肽的内源Ttr基因座的区域未被删除并且未被相应的人TTR序列取代。
12.如权利要求11所述的非人类动物,其中,所述内源Ttr基因座的第一外显子未被删除并且未被相应的人TTR序列取代。
13.如权利要求12所述的非人类动物,其中,所述内源Ttr基因座的第一外显子和第一内含子未被删除并且未被相应的人TTR序列取代。
14.如权利要求11至13中任一项所述的非人类动物,其中,所述内源Ttr基因座的从第二Ttr外显子的起始至Ttr终止密码子的区域已被删除并且被相应的人TTR序列取代。
15.如权利要求11至14中任一项所述的非人类动物,其中,所述基因修饰的内源Ttr基因座包括人TTR 3’非翻译区域。
16.如权利要求11至15中任一项所述的非人类动物,其中,所述内源Ttr基因座的从第二Ttr外显子至Ttr终止密码子的区域已被删除并且被包含相应的人TTR序列和人TTR 3’非翻译区域的人TTR序列取代;并且
其中,内源Ttr 5’非翻译区域未被删除并且未被相应的人TTR序列取代;并且
其中,内源Ttr启动子未被删除并且未被相应的人TTR序列取代。
17.如权利要求16所述的非人类动物,其中:
(i)基因修饰的内源Ttr基因座处的人TTR序列包含与SEQ ID NO:19中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列;或
(ii)基因修饰的内源Ttr基因座编码包含如下序列的蛋白质,所述序列与SEQ ID NO:2中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性;
(iii)基因修饰的内源Ttr基因座包含编码序列,该编码序列包含与SEQ ID NO:91中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列;或
(iv)基因修饰的内源Ttr基因座包含与SEQ ID NO:16或17中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列。
18.如前述权利要求中任一项所述的非人类动物,其中,所述基因修饰的内源Ttr基因座不包含选择盒或报告体基因。
19.如前述权利要求中任一项所述的非人类动物,其中,所述非人类动物对于基因修饰的内源Ttr基因座而言是纯合的。
20.如前述权利要求中任一项所述的非人类动物,其中,所述非人类动物是哺乳动物。
21.如权利要求20所述的非人类动物,其中,所述非人类动物是大鼠或小鼠。
22.如权利要求21所述的非人类动物,其中,所述非人类动物是小鼠。
23.一种体内评价人-TTR-靶向试剂的活性的方法,其包括:
(a)向权利要求1至22中任一项所述的非人类动物给药人-TTR-靶向试剂;和
(b)在所述非人类动物体内评价人-TTR-靶向试剂的活性。
24.如权利要求23所述的方法,其中,所述给药包括腺相关病毒(AAV)-介导的递送,脂质纳米颗粒(LNP)-介导的递送或流体动力学递送(HDD)。
25.如权利要求24所述的方法,其中,所述给药包括LNP介导的递送。
26.如权利要求25所述的方法,其中,LNP剂量为约0.1mg/kg至约2mg/kg。
27.如权利要求24所述的方法,其中,所述给药包括AAV8-介导的递送。
28.如权利要求23至27中任一项所述的方法,其中,步骤(b)包括从非人类动物中分离肝脏并且在肝脏中评价人-TTR-靶向试剂的活性。
29.如权利要求28所述的方法,其中,步骤(b)还包括在不同于肝脏的器官或组织中评价人-TTR-靶向试剂的活性。
30.如权利要求23至29中任一项所述的方法,其中,所述人-TTR-靶向试剂是基因组编辑试剂并且所述评价包括评价对基因修饰的Ttr基因座的修饰。
31.如权利要求30所述的方法,其中,所述评价包括测量基因修饰Ttr基因座中的插入或删除的频率。
32.如权利要求23至31中任一项所述的方法,其中,所述评价包括测量由基因修饰的Ttr基因座编码的Ttr信使RNA的表达。
33.如权利要求23至32中任一项所述的方法,其中,所述评价包括测量由基因修饰的Ttr基因座编码的TTR蛋白的表达。
34.如权利要求33所述的方法,其中,所述评价TTR蛋白的表达包括测量非人类动物中TTR蛋白的血清水平。
35.如权利要求30至33中任一项所述的方法,其中,在非人类动物的肝脏中评价活性。
36.如权利要求23至35中任一项所述的方法,其中,所述人-TTR-靶向试剂包括设计为靶定人TTR基因的区域的核酸酶试剂。
37.如权利要求36所述的方法,其中,所述核酸酶试剂包括Cas蛋白质和设计为靶定人TTR基因中的向导RNA靶向序列的向导RNA。
38.如权利要求37所述的方法,其中,所述Cas蛋白质是Cas9蛋白质。
39.如权利要求36至38中任一项所述的方法,其中,所述人-TTR-靶向试剂还包括外源供体核酸,其中,所述外源供体核酸被设计为与人TTR基因重组。
40.如权利要求39所述的方法,其中,所述外源供体核酸是单链寡脱氧核苷酸(ssODN)。
41.一种优化人-TTR-靶向试剂的体内活性的方法,其包括:
(I)在第一非人类动物中第一次执行权利要求23至40中任一项所述的方法,所述第一非人类动物在其基因组中包含基因修饰的内源Ttr基因座,该内源Ttr基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者;
(II)改变可变量并且使用改变的可变量在第二非人类动物中再次执行步骤(I)的方法,所述第二非人类动物在其基因组中包含基因修饰的内源Ttr基因座,该内源Ttr基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者;以及
(III)比较步骤(I)中人-TTR-靶向试剂的活性和步骤(II)中人-TTR-靶向试剂的活性,并且选择产生较高活性的方法。
42.如权利要求41所述的方法,其中,步骤(II)中改变的可变量是将人-TTR-靶向试剂引入至非人类动物中的递送方法。
43.如权利要求42所述的方法,其中,所述给药包括LNP-介导的递送并且步骤(II)中改变的可变量是LNP制剂。
44.如权利要求41所述的方法,其中,步骤(II)中改变的可变量是将人-TTR-靶向试剂引入至非人类动物中的给药途径。
45.如权利要求41所述的方法,其中,步骤(II)中改变的可变量是引入至非人类动物中的人-TTR-靶向试剂的浓度或量。
46.如权利要求41所述的方法,其中,步骤(II)中改变的可变量是引入至非人类动物中的人-TTR-靶向试剂的形式。
47.如权利要求41所述的方法,其中,步骤(II)中改变的可变量是引入至非人类动物中的人-TTR-靶向试剂。
48.如权利要求41所述的方法,其中,所述人-TTR-靶向试剂包括Cas蛋白质和设计为靶定人TTR基因中的向导RNA靶向序列的向导RNA。
49.如权利要求48所述的方法,其中,步骤(II)中改变的可变量是向导RNA序列或向导RNA靶向序列。
50.如权利要求48所述的方法,其中,Cas蛋白质和向导RNA均以RNA的形式施用并且步骤(II)中改变的可变量是Cas mRNA与向导RNA的比例。
51.如权利要求48所述的方法,其中,步骤(II)中改变的可变量是向导RNA修饰。
52.一种产生权利要求1至22中任一项所述的非人类动物的方法,其包括:
(a)向非人类动物胚胎干(ES)细胞中引入:
(i)靶定内源Ttr基因座中的靶向序列的核酸酶试剂;和
(ii)包含核酸插入体的靶向载体,所述核酸插入体包含侧面具有与内源Ttr基因座中的5’靶向序列对应的5’同源臂和与内源Ttr基因座中的3’靶向序列对应的3’同源臂的人TTR序列,
其中,所述靶向载体与内源Ttr基因座重组以产生基因修饰的非人类ES细胞,该非人类ES细胞在其基因组中包含基因修饰的内源Ttr基因座,该基因修饰的内源Ttr基因座包含人TTR序列;
(b)将基因修饰的非人类ES细胞引入至非人类动物宿主胚胎中;以及
(c)在代孕母体中孕育所述非人类动物宿主胚胎,其中,所述代孕母体产生F0子代基因修饰的非人类动物,该非人类动物在其基因组中包含基因修饰的内源Ttr基因座,该基因修饰的内源Ttr基因座包含人TTR序列。
53.如权利要求52所述的方法,其中,所述核酸酶试剂包含Cas蛋白质和向导RNA。
54.如权利要求53所述的方法,其中,所述Cas蛋白质是Cas9蛋白质。
55.如权利要求52至54中任一项所述的方法,其中,所述靶向载体是长度为至少10kb的大靶向载体或者5’和3’同源臂的总长度为至少10kb的大靶向载体。
56.如权利要求52至55中任一项所述的方法,其中,所述非人类动物是小鼠或大鼠。
57.如权利要求56所述的方法,其中,所述非人类动物是小鼠。
58.一种非人类动物细胞,在其基因组中包括基因修饰的内源Ttr基因座,该Ttr基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者。
59.一种非人类动物基因组,其包含基因修饰的内源Ttr基因座,该Ttr基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者。
60.一种靶向载体,其包含核酸插入体,该核酸插入体包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者,所述非编码序列侧面具有与内源非人类动物Ttr基因座中的5’靶向序列对应的5’同源臂和与内源非人类动物Ttr基因座中的3’靶向序列对应的3’同源臂。

Claims (57)

1.一种非人类动物,该非人类动物在其基因组中包含基因修饰的内源Ttr基因座,该内源Ttr基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者。
2.如权利要求1所述的非人类动物,其中,所述内源Ttr基因座的包含Ttr编码序列和非编码序列这两者的区域已被删除并且被包含TTR编码序列和非编码序列这两者的相应的人TTR序列取代。
3.如权利要求1或2所述的非人类动物,其中,所述基因修饰的内源Ttr基因座包含内源Ttr启动子,其中,所述人TTR序列可操作地连接至所述内源Ttr启动子。
4.如前述权利要求中任一项所述的非人类动物,其中,所述内源Ttr基因座的至少一个内含子和至少一个外显子已被删除并且被相应的人TTR序列取代。
5.如前述权利要求中任一项所述的非人类动物,其中,所述内源Ttr基因座的全部Ttr编码序列已被删除并且被相应的人TTR序列取代。
6.如权利要求5所述的非人类动物,其中,所述内源Ttr基因座的从Ttr起始密码子至Ttr终止密码子的区域已被删除并且被相应的人TTR序列取代。
7.如前述权利要求中任一项所述的非人类动物,其中,所述基因修饰的内源Ttr基因座包含人TTR 3’非翻译区域。
8.如前述权利要求中任一项所述的非人类动物,其中,内源Ttr5’非翻译区域未被删除并且未被相应的人TTR序列取代。
9.如前述权利要求中任一项所述的非人类动物,其中,所述内源Ttr基因座的从Ttr起始密码子至Ttr终止密码子的区域已被删除并且被包含相应的人TTR序列和人TTR 3’非翻译区域的人TTR序列取代;并且
其中,所述内源Ttr 5’非翻译区域没有被删除并且没有被相应的人TTR序列取代;并且,
其中,所述内源Ttr启动子未被删除并且未被相应的人TTR序列取代。
10.如权利要求9所述的非人类动物,其中:
(i)所述基因修饰的内源Ttr基因座处的人TTR序列包括与SEQ ID NO:18中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列;
(ii)所述基因修饰的内源Ttr基因座编码包含如下序列的蛋白质,所述序列与SEQ IDNO:1中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性;
(iii)所述基因修饰的内源Ttr基因座包含编码序列,该编码序列包含与SEQ ID NO:90中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列;
(iv)所述基因修饰的内源Ttr基因座包含与SEQ ID NO:14或15中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列。
11.如权利要求1至4中任一项所述的非人类动物,其中,所述基因修饰的内源Ttr基因座编码包含信号肽的转甲状腺素蛋白前体蛋白并且编码信号肽的内源Ttr基因座的区域未被删除并且未被相应的人TTR序列取代。
12.如权利要求11所述的非人类动物,其中,所述内源Ttr基因座的第一外显子未被删除并且未被相应的人TTR序列取代。
13.如权利要求12所述的非人类动物,其中,所述内源Ttr基因座的第一外显子和第一内含子未被删除并且未被相应的人TTR序列取代。
14.如权利要求11至13中任一项所述的非人类动物,其中,所述内源Ttr基因座的从第二Ttr外显子的起始至Ttr终止密码子的区域已被删除并且被相应的人TTR序列取代。
15.如权利要求11至14中任一项所述的非人类动物,其中,所述基因修饰的内源Ttr基因座包括人TTR 3’非翻译区域。
16.如权利要求11至15中任一项所述的非人类动物,其中,所述内源Ttr基因座的从第二Ttr外显子至Ttr终止密码子的区域已被删除并且被包含相应的人TTR序列和人TTR 3’非翻译区域的人TTR序列取代;并且
其中,内源Ttr 5’非翻译区域未被删除并且未被相应的人TTR序列取代;并且
其中,内源Ttr启动子未被删除并且未被相应的人TTR序列取代。
17.如权利要求16所述的非人类动物,其中:
(i)基因修饰的内源Ttr基因座处的人TTR序列包含与SEQ ID NO:19中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列;或
(ii)基因修饰的内源Ttr基因座编码包含如下序列的蛋白质,所述序列与SEQ ID NO:2中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性;
(iii)基因修饰的内源Ttr基因座包含编码序列,该编码序列包含与SEQ ID NO:91中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列;或
(iv)基因修饰的内源Ttr基因座包含与SEQ ID NO:16或17中列出的序列具有至少90%,95%,96%,97%,98%,99%,或100%的一致性的序列。
18.如前述权利要求中任一项所述的非人类动物,其中,所述基因修饰的内源Ttr基因座不包含选择盒或报告体基因。
19.如前述权利要求中任一项所述的非人类动物,其中,所述非人类动物对于基因修饰的内源Ttr基因座而言是纯合的。
20.如前述权利要求中任一项所述的非人类动物,其中,所述非人类动物是哺乳动物。
21.如权利要求20所述的非人类动物,其中,所述非人类动物是大鼠或小鼠。
22.如权利要求21所述的非人类动物,其中,所述非人类动物是小鼠。
23.一种体内评价人-TTR-靶向试剂的活性的方法,其包括:
(a)向权利要求1至22中任一项所述的非人类动物给药人-TTR-靶向试剂;和
(b)在所述非人类动物体内评价人-TTR-靶向试剂的活性。
24.如权利要求23所述的方法,其中,所述给药包括腺相关病毒(AAV)-介导的递送,脂质纳米颗粒(LNP)-介导的递送或流体动力学递送(HDD)。
25.如权利要求24所述的方法,其中,所述给药包括LNP介导的递送。
26.如权利要求25所述的方法,其中,LNP剂量为约0.1mg/kg至约2mg/kg。
27.如权利要求24所述的方法,其中,所述给药包括AAV8-介导的递送。
28.如权利要求23至27中任一项所述的方法,其中,步骤(b)包括从非人类动物中分离肝脏并且在肝脏中评价人-TTR-靶向试剂的活性。
29.如权利要求28所述的方法,其中,步骤(b)还包括在不同于肝脏的器官或组织中评价人-TTR-靶向试剂的活性。
30.如权利要求23至29中任一项所述的方法,其中,所述人-TTR-靶向试剂是基因组编辑试剂并且所述评价包括评价对基因修饰的Ttr基因座的修饰。
31.如权利要求30所述的方法,其中,所述评价包括测量基因修饰Ttr基因座中的插入或删除的频率。
32.如权利要求23至31中任一项所述的方法,其中,所述评价包括测量由基因修饰的Ttr基因座编码的Ttr信使RNA的表达。
33.如权利要求23至32中任一项所述的方法,其中,所述评价包括测量由基因修饰的Ttr基因座编码的TTR蛋白的表达。
34.如权利要求33所述的方法,其中,所述评价TTR蛋白的表达包括测量非人类动物中TTR蛋白的血清水平。
35.如权利要求30至33中任一项所述的方法,其中,在非人类动物的肝脏中评价活性。
36.如权利要求23至35中任一项所述的方法,其中,所述人-TTR-靶向试剂包括设计为靶定人TTR基因的区域的核酸酶试剂。
37.如权利要求36所述的方法,其中,所述核酸酶试剂包括Cas蛋白质和设计为靶定人TTR基因中的向导RNA靶向序列的向导RNA。
38.如权利要求37所述的方法,其中,所述Cas蛋白质是Cas9蛋白质。
39.如权利要求36至38中任一项所述的方法,其中,所述人-TTR-靶向试剂还包括外源供体核酸,其中,所述外源供体核酸被设计为与人TTR基因重组。
40.如权利要求39所述的方法,其中,所述外源供体核酸是单链寡脱氧核苷酸(ssODN)。
41.一种优化人-TTR-靶向试剂的体内活性的方法,其包括:
(I)在第一非人类动物中第一次执行权利要求23至40中任一项所述的方法,所述第一非人类动物在其基因组中包含基因修饰的内源Ttr基因座,该内源Ttr基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者;
(II)改变可变量并且使用改变的可变量在第二非人类动物中再次执行步骤(I)的方法,所述第二非人类动物在其基因组中包含基因修饰的内源Ttr基因座,该内源Ttr基因座包含人TTR序列,该人TTR序列包含TTR编码序列和非编码序列这两者;以及
(III)比较步骤(I)中人-TTR-靶向试剂的活性和步骤(II)中人-TTR-靶向试剂的活性,并且选择产生较高活性的方法。
42.如权利要求41所述的方法,其中,步骤(II)中改变的可变量是将人-TTR-靶向试剂引入至非人类动物中的递送方法。
43.如权利要求42所述的方法,其中,所述给药包括LNP-介导的递送并且步骤(II)中改变的可变量是LNP制剂。
44.如权利要求41所述的方法,其中,步骤(II)中改变的可变量是将人-TTR-靶向试剂引入至非人类动物中的给药途径。
45.如权利要求41所述的方法,其中,步骤(II)中改变的可变量是引入至非人类动物中的人-TTR-靶向试剂的浓度或量。
46.如权利要求41所述的方法,其中,步骤(II)中改变的可变量是引入至非人类动物中的人-TTR-靶向试剂的形式。
47.如权利要求41所述的方法,其中,步骤(II)中改变的可变量是引入至非人类动物中的人-TTR-靶向试剂。
48.如权利要求41所述的方法,其中,所述人-TTR-靶向试剂包括Cas蛋白质和设计为靶定人TTR基因中的向导RNA靶向序列的向导RNA。
49.如权利要求48所述的方法,其中,步骤(II)中改变的可变量是向导RNA序列或向导RNA靶向序列。
50.如权利要求48所述的方法,其中,Cas蛋白质和向导RNA均以RNA的形式施用并且步骤(II)中改变的可变量是Cas mRNA与向导RNA的比例。
51.如权利要求48所述的方法,其中,步骤(II)中改变的可变量是向导RNA修饰。
52.一种产生权利要求1至22中任一项所述的非人类动物的方法,其包括:
(a)向非人类动物胚胎干(ES)细胞中引入:
(i)靶定内源Ttr基因座中的靶向序列的核酸酶试剂;和
(ii)包含核酸插入体的靶向载体,所述核酸插入体包含侧面具有与内源Ttr基因座中的5’靶向序列对应的5’同源臂和与内源Ttr基因座中的3’靶向序列对应的3’同源臂的人TTR序列,
其中,所述靶向载体与内源Ttr基因座重组以产生基因修饰的非人类ES细胞,该非人类ES细胞在其基因组中包含基因修饰的内源Ttr基因座,该基因修饰的内源Ttr基因座包含人TTR序列;
(b)将基因修饰的非人类ES细胞引入至非人类动物宿主胚胎中;以及
(c)在代孕母体中孕育所述非人类动物宿主胚胎,其中,所述代孕母体产生F0子代基因修饰的非人类动物,该非人类动物在其基因组中包含基因修饰的内源Ttr基因座,该基因修饰的内源Ttr基因座包含人TTR序列。
53.如权利要求52所述的方法,其中,所述核酸酶试剂包含Cas蛋白质和向导RNA。
54.如权利要求53所述的方法,其中,所述Cas蛋白质是Cas9蛋白质。
55.如权利要求52至54中任一项所述的方法,其中,所述靶向载体是长度为至少10kb的大靶向载体或者5’和3’同源臂的总长度为至少10kb的大靶向载体。
56.如权利要求52至55中任一项所述的方法,其中,所述非人类动物是小鼠或大鼠。
57.如权利要求56所述的方法,其中,所述非人类动物是小鼠。
CN201880063051.5A 2017-09-29 2018-09-28 包含人源化ttr基因座的非人类动物及其使用方法 Active CN111163633B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201762565980P 2017-09-29 2017-09-29
US62/565,980 2017-09-29
US201862679142P 2018-06-01 2018-06-01
US62/679,142 2018-06-01
US201862720292P 2018-08-21 2018-08-21
US62/720,292 2018-08-21
PCT/US2018/053389 WO2019067875A1 (en) 2017-09-29 2018-09-28 NON-HUMAN ANIMALS COMPRISING A HUMANIZED TTR LOCUS AND METHODS OF USE

Publications (2)

Publication Number Publication Date
CN111163633A true CN111163633A (zh) 2020-05-15
CN111163633B CN111163633B (zh) 2022-09-09

Family

ID=63858215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880063051.5A Active CN111163633B (zh) 2017-09-29 2018-09-28 包含人源化ttr基因座的非人类动物及其使用方法

Country Status (14)

Country Link
US (2) US20190098879A1 (zh)
EP (2) EP4276185A3 (zh)
JP (1) JP7139419B2 (zh)
KR (1) KR102544051B1 (zh)
CN (1) CN111163633B (zh)
AU (1) AU2018338790B2 (zh)
BR (1) BR112020003609A2 (zh)
CA (1) CA3071712C (zh)
ES (1) ES2962277T3 (zh)
IL (1) IL272328B2 (zh)
MX (1) MX2020003589A (zh)
NZ (1) NZ761329A (zh)
SG (1) SG11202000771UA (zh)
WO (1) WO2019067875A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112795595A (zh) * 2020-12-24 2021-05-14 中山大学 一种遗传性转甲状腺素蛋白淀粉样变性疾病的基因治疗系统
CN113684272A (zh) * 2021-09-08 2021-11-23 百世诺(北京)医学检验实验室有限公司 基于突变的ttr基因的心肌淀粉样变性检测试剂盒
CN117604034A (zh) * 2023-11-23 2024-02-27 赛业(苏州)生物科技有限公司 一种制备人源化ttr小鼠的方法及其应用

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2020003589A (es) 2017-09-29 2020-07-22 Regeneron Pharma Animales no humanos que comprenden un locus ttr humanizado y metodos de uso.
DK3687287T3 (da) 2017-09-29 2023-10-16 Regeneron Pharma Gnavere, udtrykkende humaniseret c1q-kompleks
CA3098040A1 (en) 2018-07-16 2020-01-23 Regeneron Pharmaceuticals, Inc. Non-human animal models of ditra disease and uses thereof
CA3133360A1 (en) 2019-04-04 2020-10-08 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized coagulation factor 12 locus
EP3978607A4 (en) * 2019-05-27 2023-01-25 Transgenic Inc. HUMANIZED EXON MOUSE
US11891618B2 (en) 2019-06-04 2024-02-06 Regeneron Pharmaceuticals, Inc. Mouse comprising a humanized TTR locus with a beta-slip mutation and methods of use
AU2020289581A1 (en) 2019-06-07 2021-11-18 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized albumin locus
WO2021108363A1 (en) 2019-11-25 2021-06-03 Regeneron Pharmaceuticals, Inc. Crispr/cas-mediated upregulation of humanized ttr allele
EP4099821A1 (en) * 2020-02-07 2022-12-14 Regeneron Pharmaceuticals, Inc. <smallcaps/>? ? ?klkb1? ? ? ? ?non-human animals comprising a humanizedlocus and methods of use
WO2021195079A1 (en) * 2020-03-23 2021-09-30 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106255702A (zh) * 2013-12-20 2016-12-21 生物控股有限公司 基于抗体的对转甲状腺素蛋白(ttr)淀粉样变性的疗法及其人源抗体

Family Cites Families (129)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5958883A (en) 1992-09-23 1999-09-28 Board Of Regents Of The University Of Washington Office Of Technology Animal models of human amyloidoses
US5523226A (en) 1993-05-14 1996-06-04 Biotechnology Research And Development Corp. Transgenic swine compositions and methods
JP2000512141A (ja) 1996-06-06 2000-09-19 ユニバーシティ・オブ・ワシントン パーレカン遺伝子組換え動物及びアミロイド症を治療するための化合物を同定する方法
AU8587598A (en) 1997-07-26 1999-02-16 Wisconsin Alumni Research Foundation Trans-species nuclear transfer
US6599692B1 (en) 1999-09-14 2003-07-29 Sangamo Bioscience, Inc. Functional genomics using zinc finger proteins
US20030104526A1 (en) 1999-03-24 2003-06-05 Qiang Liu Position dependent recognition of GNN nucleotide triplets by zinc fingers
US20050144655A1 (en) 2000-10-31 2005-06-30 Economides Aris N. Methods of modifying eukaryotic cells
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
AU2884102A (en) 2000-12-07 2002-06-18 Sangamo Biosciences Inc Regulation of angiogenesis with zinc finger proteins
AU2002225187A1 (en) 2001-01-22 2002-07-30 Sangamo Biosciences, Inc. Zinc finger polypeptides and their use
US7273923B2 (en) 2001-01-22 2007-09-25 Sangamo Biosciences, Inc. Zinc finger proteins for DNA binding and gene regulation in plants
WO2002059621A2 (en) 2001-01-24 2002-08-01 Bayer Corporation Regulation of transthyretin to treat obesity
AUPR451401A0 (en) 2001-04-20 2001-05-24 Monash University A method of nuclear transfer
BRPI0307383B1 (pt) 2002-01-23 2019-12-31 The Univ Of Utah Research Foundation método de recombinação genética direcionada em célula de planta hospedeira
DE60316124T3 (de) 2002-03-15 2018-03-22 Cellectis Hybride and einzelkettige meganukleasen und deren anwendungen
WO2003080809A2 (en) 2002-03-21 2003-10-02 Sangamo Biosciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
US7612250B2 (en) 2002-07-29 2009-11-03 Trustees Of Tufts College Nuclear transfer embryo formation method
WO2004037977A2 (en) 2002-09-05 2004-05-06 California Institute Of Thechnology Use of chimeric nucleases to stimulate gene targeting
AU2003290518A1 (en) 2002-09-06 2004-04-23 Fred Hutchinson Cancer Research Center Methods and compositions concerning designed highly-specific nucleic acid binding proteins
US7888121B2 (en) 2003-08-08 2011-02-15 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
US8409861B2 (en) 2003-08-08 2013-04-02 Sangamo Biosciences, Inc. Targeted deletion of cellular DNA sequences
US20050244869A1 (en) * 2004-04-05 2005-11-03 Brown-Driver Vickie L Modulation of transthyretin expression
EP1591521A1 (en) 2004-04-30 2005-11-02 Cellectis I-Dmo I derivatives with enhanced activity at 37 degrees C and use thereof
US20080038227A1 (en) 2004-08-04 2008-02-14 Ignacio Torres Aleman Animal model of neurodegenerative diseases, the procedure for producing the model and applications thereof
WO2006033859A2 (en) 2004-09-16 2006-03-30 Sangamo Biosciences, Inc. Compositions and methods for protein production
PT1802193E (pt) 2004-10-19 2014-06-23 Regeneron Pharma Método para gerar um murganho homozigótico para uma modificação genética
US20110158974A1 (en) 2005-03-15 2011-06-30 Cellectis Heterodimeric Meganucleases and Use Thereof
WO2006097784A1 (en) 2005-03-15 2006-09-21 Cellectis I-crei meganuclease variants with modified specificity, method of preparation and uses thereof
WO2006105602A1 (en) 2005-04-06 2006-10-12 The Walter And Eliza Hall Institute Of Medical Research Animal models and cells with a modified gene encoding transthyretin-related protein and applications thereof
JP4692417B2 (ja) 2006-06-30 2011-06-01 富士ゼロックス株式会社 画像形成装置
CN101117633B (zh) 2006-08-03 2011-07-20 上海交通大学附属儿童医院 一种细胞核移植方法
BRPI0720048A8 (pt) 2006-12-14 2023-02-07 Dow Agrosciences Llc Proteínas de dedo de zinco não-canônicas otimizadas
GB0710976D0 (en) * 2007-06-07 2007-07-18 Bioalvo Am Screening method
WO2009126161A1 (en) 2008-04-11 2009-10-15 Utc Fuel Cells, Llc Fuel cell and bipolar plate having manifold sump
WO2010017509A1 (en) 2008-08-07 2010-02-11 Isis Pharmaceuticals, Inc. Modulation of transthyretin expression for the treatment of cns related disorders
WO2010030203A1 (en) 2008-09-09 2010-03-18 Biocodex - Incubação De Empresas De Ciências Da Vida, S.A. Monoclonal antibody to human amyloidogenic and modified forms of transthyretin and its use in the detection and treatment of fap and pathologies presenting modified ttr
AU2009307677C1 (en) 2008-10-20 2022-09-22 Alnylam Pharmaceuticals, Inc. Compositions and methods for inhibiting expression of transthyretin
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
AU2010226313B2 (en) 2009-03-20 2014-10-09 Sangamo Therapeutics, Inc. Modification of CXCR4 using engineered zinc finger proteins
US8772008B2 (en) 2009-05-18 2014-07-08 Sangamo Biosciences, Inc. Methods and compositions for increasing nuclease activity
EP2445936A1 (en) 2009-06-26 2012-05-02 Regeneron Pharmaceuticals, Inc. Readily isolated bispecific antibodies with native immunoglobulin format
US20120178647A1 (en) 2009-08-03 2012-07-12 The General Hospital Corporation Engineering of zinc finger arrays by context-dependent assembly
US8518392B2 (en) 2009-08-14 2013-08-27 Regeneron Pharmaceuticals, Inc. Promoter-regulated differentiation-dependent self-deleting cassette
US8541646B2 (en) 2009-10-06 2013-09-24 Regeneron Pharmaceuticals, Inc. Genetically modified mice and engraftment
CA2779858C (en) 2009-10-29 2019-10-29 Aris N. Economides Multifunctional alleles
JP5723378B2 (ja) 2009-11-03 2015-05-27 アルナイラム ファーマシューティカルズ, インコーポレイテッドAlnylam Pharmaceuticals, Inc. トランスサイレチン(ttr)を阻害する脂質製剤化組成物及び方法
CN102770539B (zh) 2009-12-10 2016-08-03 明尼苏达大学董事会 Tal效应子介导的dna修饰
MX343559B (es) * 2010-04-29 2016-11-10 Ionis Pharmaceuticals Inc Modulacion de la expresion de transtiretina.
RU2577978C2 (ru) 2011-02-15 2016-03-20 Ридженерон Фармасьютикалз, Инк. Гуманизированные m-csf мыши
JP6120451B2 (ja) 2011-10-28 2017-04-26 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. ヒト化il−6および/またはil−6受容体
MY164836A (en) 2011-10-28 2018-01-30 Regeneron Pharma Genetically modified major histocompatibility complex mice
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
WO2013163394A1 (en) 2012-04-25 2013-10-31 Regeneron Pharmaceuticals, Inc. Nuclease-mediated targeting with large targeting vectors
DK3401400T3 (da) 2012-05-25 2019-06-03 Univ California Fremgangsmåder og sammensætninger til rna-styret mål-dna-modifikation og til rna-styret transskriptionsmodulering
US8962913B2 (en) 2012-06-18 2015-02-24 Regeneron Pharmaceuticals, Inc. Humanized IL-7 rodents
WO2014033644A2 (en) 2012-08-28 2014-03-06 Novartis Ag Methods of nuclease-based genetic engineering
CN110643600A (zh) 2012-10-23 2020-01-03 基因工具股份有限公司 用于切割靶dna的系统及其用途
EP4389764A2 (en) 2012-11-05 2024-06-26 Regeneron Pharmaceuticals, Inc. Genetically modified non-human animals and methods of use thereof
JP6620018B2 (ja) 2012-12-06 2019-12-11 シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニーSigma−Aldrich Co., LLC Crisprに基づくゲノム修飾および制御
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
EP3553174A1 (en) 2012-12-17 2019-10-16 President and Fellows of Harvard College Rna-guided human genome engineering
CN109913495B (zh) 2013-02-20 2022-11-25 瑞泽恩制药公司 大鼠的遗传修饰
US20150342163A1 (en) 2013-02-22 2015-12-03 Regeneron Pharmaceuticals, Inc. Genetically modified major histocompatibility complex mice
PL2958937T3 (pl) 2013-02-22 2019-01-31 Regeneron Pharmaceuticals, Inc. Myszy ekspresjonujące humanizowany główny układ zgodności tkankowej
EP2922393B2 (en) 2013-02-27 2022-12-28 Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Gene editing in the oocyte by cas9 nucleases
CA2907198C (en) 2013-03-15 2019-12-10 The General Hospital Corporation Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing
CN105518146B (zh) 2013-04-04 2022-07-15 哈佛学院校长同事会 利用CRISPR/Cas系统的基因组编辑的治疗性用途
CN111500630A (zh) 2013-04-16 2020-08-07 瑞泽恩制药公司 大鼠基因组的靶向修饰
PT2992098T (pt) 2013-05-01 2019-07-05 Ionis Pharmaceuticals Inc Composições e métodos para modular a expressão de hbv e ttr
CA2915845A1 (en) 2013-06-17 2014-12-24 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells
AU2014281028B2 (en) 2013-06-17 2020-09-10 Massachusetts Institute Of Technology Delivery and use of the CRISPR-Cas systems, vectors and compositions for hepatic targeting and therapy
JP6702858B2 (ja) 2013-06-17 2020-06-03 ザ・ブロード・インスティテュート・インコーポレイテッド ウイルス成分を使用して障害および疾患をターゲティングするためのCRISPR−Cas系および組成物の送達、使用および治療上の適用
JP2016528890A (ja) 2013-07-09 2016-09-23 プレジデント アンド フェローズ オブ ハーバード カレッジ CRISPR/Cas系を用いるゲノム編集の治療用の使用
US20160168235A1 (en) 2013-07-19 2016-06-16 Board Of Regents Of The University Of Texas System Transthyretin amyloid-selective and polyreactive catabodies
RS64573B1 (sr) * 2013-09-23 2023-10-31 Regeneron Pharma Ne-humana životinja sa humanizovanim signalno-regulatornim proteinskim genom
US20160237455A1 (en) 2013-09-27 2016-08-18 Editas Medicine, Inc. Crispr-related methods and compositions
WO2015051159A1 (en) 2013-10-02 2015-04-09 The Rockefeller University Amyloid protofibril antibodies and methods of use thereof
EP3461331A1 (en) 2013-10-15 2019-04-03 Regeneron Pharmaceuticals, Inc. Humanized il-15 animals
ES2881473T3 (es) 2013-10-17 2021-11-29 Sangamo Therapeutics Inc Métodos de suministro y composiciones para la modificación por ingeniería genética del genoma mediada por nucleasas
US9546384B2 (en) 2013-12-11 2017-01-17 Regeneron Pharmaceuticals, Inc. Methods and compositions for the targeted modification of a mouse genome
US10604562B2 (en) 2014-01-29 2020-03-31 Km Biologics Co., Ltd. Anti-transthyretin humanized antibody
US10370680B2 (en) 2014-02-24 2019-08-06 Sangamo Therapeutics, Inc. Method of treating factor IX deficiency using nuclease-mediated targeted integration
EP3122365B1 (en) 2014-03-25 2023-05-03 Arcturus Therapeutics, Inc. Transthyretin allele selective una oligomers for gene silencing
RU2020103811A (ru) 2014-05-05 2020-02-18 Регенерон Фармасьютикалз, Инк. Гуманизированные животные по с5 и с3
NO2785538T3 (zh) 2014-05-07 2018-08-04
KR102627332B1 (ko) 2014-05-19 2024-01-26 리제너론 파마슈티칼스 인코포레이티드 인간 epo를 발현하는 유전자 변형된 비-인간 동물
SG11201609154TA (en) 2014-05-30 2016-12-29 Regeneron Pharma Humanized dipeptidyl peptidase iv (dpp4) animals
WO2015191693A2 (en) 2014-06-10 2015-12-17 Massachusetts Institute Of Technology Method for gene editing
EP3155101B1 (en) 2014-06-16 2020-01-29 The Johns Hopkins University Compositions and methods for the expression of crispr guide rnas using the h1 promoter
PT3157956T (pt) 2014-06-19 2020-04-09 Regeneron Pharma Animais não humanos com um gene 1 de morte programada humanizada em células
SI3354732T1 (sl) 2014-06-23 2020-07-31 Regeneron Pharmaceuticals, Inc. Z nukleazo posredovan DNA sklop
US20150376587A1 (en) 2014-06-25 2015-12-31 Caribou Biosciences, Inc. RNA Modification to Engineer Cas9 Activity
HUE041584T2 (hu) 2014-06-26 2019-05-28 Regeneron Pharma Célzott genetikai módosítások és alkalmazási módszerek és készítmények
JP6778175B2 (ja) 2014-07-16 2020-10-28 ノバルティス アーゲー 脂質ナノ粒子ホスト中に核酸を封入する方法
BR112017005245A2 (pt) 2014-09-19 2017-12-12 Regeneron Pharma animal não humano geneticamente modificado, métodos para produzir célula t, hibridoma de célula t, um ácido nucleico, um anticorpo específico, uma célula humana, um animal não humano geneticamente modificado e para induzir uma resposta imunológica, célula, hibridoma de célula t, ácido nucleico, anticorpo específico, receptor de antígeno quimérico, embrião não humano, locus de um receptor de antígeno quimérico, e, composição de ácidos nucleicos.
PT3221457T (pt) 2014-11-21 2019-06-27 Regeneron Pharma Métodos e composições para modificação genética visada através da utilização de arn guia emparelhados
WO2016106236A1 (en) 2014-12-23 2016-06-30 The Broad Institute Inc. Rna-targeting system
TWI781507B (zh) 2015-01-28 2022-10-21 愛爾蘭商普羅佘納生物科技有限公司 抗甲狀腺素運送蛋白抗體
RU2732628C2 (ru) 2015-04-06 2020-09-21 Регенерон Фармасьютикалз, Инк. Опосредованные гуманизированными т-клетками иммунные ответы у не относящихся к человеку животных
JP6851319B2 (ja) 2015-04-27 2021-03-31 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア ヒト疾患のCRISPR/Cas9媒介性の修正のためのデュアルAAVベクター系
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
ES2959815T3 (es) 2015-09-21 2024-02-28 Arcturus Therapeutics Inc Edición génica selectiva de alelo y usos de la misma
EP3159407A1 (en) 2015-10-23 2017-04-26 Silence Therapeutics (London) Ltd Guide rnas, methods and uses
US10306874B2 (en) 2015-11-20 2019-06-04 Regeneron Pharmaceuticals, Inc. Non-human animals having a humanized lymphocyte-activation gene 3
ES2908669T3 (es) 2016-02-04 2022-05-03 Regeneron Pharma Animales no humanos que tienen un gen ANGPTL8 modificado genéticamente
KR102493894B1 (ko) 2016-02-29 2023-01-31 리제너론 파마슈티칼스 인코포레이티드 인간화 tmprss 유전자를 갖는 설치류
TWI773666B (zh) 2016-03-30 2022-08-11 美商英特利亞醫療公司 Crispr/cas 組分之脂質奈米粒子調配物
WO2018007871A1 (en) 2016-07-08 2018-01-11 Crispr Therapeutics Ag Materials and methods for treatment of transthyretin amyloidosis
WO2018049009A2 (en) 2016-09-07 2018-03-15 Sangamo Therapeutics, Inc. Modulation of liver genes
CN110291198A (zh) 2016-12-08 2019-09-27 因特利亚治疗公司 经修饰的指导rna
SG11201907606XA (en) 2017-02-27 2019-09-27 Regeneron Pharma Humanized model of kidney and liver disorders
DK3687287T3 (da) 2017-09-29 2023-10-16 Regeneron Pharma Gnavere, udtrykkende humaniseret c1q-kompleks
JP2021500864A (ja) 2017-09-29 2021-01-14 インテリア セラピューティクス,インコーポレイテッド Ttr遺伝子編集およびattrアミロイドーシスの治療用の組成物および方法
MX2020003589A (es) 2017-09-29 2020-07-22 Regeneron Pharma Animales no humanos que comprenden un locus ttr humanizado y metodos de uso.
CA3089331A1 (en) 2018-03-19 2019-09-26 Regeneron Pharmaceuticals, Inc. Transcription modulation in animals using crispr/cas systems
JP7328243B2 (ja) 2018-03-26 2023-08-16 リジェネロン・ファーマシューティカルズ・インコーポレイテッド 治療薬を試験するためのヒト化げっ歯類
US11690921B2 (en) 2018-05-18 2023-07-04 Sangamo Therapeutics, Inc. Delivery of target specific nucleases
MX2020013293A (es) 2018-06-08 2021-05-12 Intellia Therapeutics Inc Guías modificadas de arn para edición génica.
AU2019288373A1 (en) 2018-06-19 2021-01-14 The Board Of Regents Of The University Of Texas System Lipid nanoparticle compositions for delivery of mRNA and long nucleic acids
CA3098040A1 (en) 2018-07-16 2020-01-23 Regeneron Pharmaceuticals, Inc. Non-human animal models of ditra disease and uses thereof
CA3133360A1 (en) 2019-04-04 2020-10-08 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized coagulation factor 12 locus
EP3978607A4 (en) 2019-05-27 2023-01-25 Transgenic Inc. HUMANIZED EXON MOUSE
US11891618B2 (en) 2019-06-04 2024-02-06 Regeneron Pharmaceuticals, Inc. Mouse comprising a humanized TTR locus with a beta-slip mutation and methods of use
AU2020289581A1 (en) 2019-06-07 2021-11-18 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized albumin locus
WO2021108363A1 (en) 2019-11-25 2021-06-03 Regeneron Pharmaceuticals, Inc. Crispr/cas-mediated upregulation of humanized ttr allele
WO2021195079A1 (en) 2020-03-23 2021-09-30 Regeneron Pharmaceuticals, Inc. Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106255702A (zh) * 2013-12-20 2016-12-21 生物控股有限公司 基于抗体的对转甲状腺素蛋白(ttr)淀粉样变性的疗法及其人源抗体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GANG ZHAO等: "Inconsistency between hepatic expression and serum concentration of transthyretin in mice humanized at the transthyretin locus", 《GENES TO CELLS》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112795595A (zh) * 2020-12-24 2021-05-14 中山大学 一种遗传性转甲状腺素蛋白淀粉样变性疾病的基因治疗系统
CN113684272A (zh) * 2021-09-08 2021-11-23 百世诺(北京)医学检验实验室有限公司 基于突变的ttr基因的心肌淀粉样变性检测试剂盒
CN117604034A (zh) * 2023-11-23 2024-02-27 赛业(苏州)生物科技有限公司 一种制备人源化ttr小鼠的方法及其应用

Also Published As

Publication number Publication date
MX2020003589A (es) 2020-07-22
IL272328A (en) 2020-03-31
CN111163633B (zh) 2022-09-09
CA3071712A1 (en) 2019-04-04
EP3585162A1 (en) 2020-01-01
EP3585162C0 (en) 2023-08-30
BR112020003609A2 (pt) 2020-09-01
KR102544051B1 (ko) 2023-06-16
US20190098879A1 (en) 2019-04-04
US20230078551A1 (en) 2023-03-16
KR20200058446A (ko) 2020-05-27
EP4276185A3 (en) 2024-02-21
ES2962277T3 (es) 2024-03-18
CA3071712C (en) 2023-02-14
IL272328B2 (en) 2023-05-01
JP2021500867A (ja) 2021-01-14
EP3585162B1 (en) 2023-08-30
SG11202000771UA (en) 2020-04-29
AU2018338790A8 (en) 2020-03-19
WO2019067875A1 (en) 2019-04-04
IL272328B1 (en) 2023-01-01
JP7139419B2 (ja) 2022-09-20
AU2018338790B2 (en) 2022-09-15
US12010979B2 (en) 2024-06-18
NZ761329A (en) 2023-04-28
AU2018338790A1 (en) 2020-02-20
EP4276185A2 (en) 2023-11-15

Similar Documents

Publication Publication Date Title
CN111163633B (zh) 包含人源化ttr基因座的非人类动物及其使用方法
CN111885915B (zh) 使用crispr/cas系统对动物进行转录调制
US20210261985A1 (en) Methods and compositions for assessing crispr/cas-mediated disruption or excision and crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
JP2020532952A (ja) Casトランスジェニックマウスの胚性幹細胞およびマウスならびにその使用
KR20220016869A (ko) 베타-슬립 돌연변이를 갖는 인간화 ttr 좌위를 포함하는 비-인간 동물 및 사용 방법
US11622547B2 (en) Genetically modified mouse that expresses human albumin
US20190032156A1 (en) Methods and compositions for assessing crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
KR20220097414A (ko) X-연관 연소 망막층간분리 치료법을 위한 crispr 및 aav 전략
KR20220062079A (ko) 지질 나노입자에 의해 전달되는 CRISPR/Cas 시스템을 사용한 동물에서의 전사 조절
RU2784927C1 (ru) Отличные от человека животные, включающие в себя гуманизированный ttr локус, и способы применения

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Megan Drummond Samuelson

Inventor after: Jeffrey Haynes

Inventor after: Susanna Hartford

Inventor after: David Frendwey

Inventor after: Brian Zambrowitz

Inventor after: Andrew J ink is luxuriant and rich with fragrance

Inventor before: Megan Drummond Samuelson

Inventor before: Jeffrey Haynes

Inventor before: Susanna Hartford

Inventor before: David Frendwey

Inventor before: Brian Zambrowitz

Inventor before: Andrew J ink is luxuriant and rich with fragrance

GR01 Patent grant
GR01 Patent grant