CN115989041A - 经工程化为表达adar1的细胞和非人动物及其用途 - Google Patents

经工程化为表达adar1的细胞和非人动物及其用途 Download PDF

Info

Publication number
CN115989041A
CN115989041A CN202180052720.0A CN202180052720A CN115989041A CN 115989041 A CN115989041 A CN 115989041A CN 202180052720 A CN202180052720 A CN 202180052720A CN 115989041 A CN115989041 A CN 115989041A
Authority
CN
China
Prior art keywords
adar1
animal
polypeptide
human
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180052720.0A
Other languages
English (en)
Inventor
杨海林
普拉尚·莫尼安
奇克杜·沙克蒂·希瓦利拉
苏布拉马尼安·马拉潘
钱德拉·瓦尔格赛
帕查穆图·坎德萨米
陆根良
于辉
大卫·查尔斯·唐奈·巴特勒
卢恰诺·恩里克·阿波尼
清水护
斯特凡尼·米歇尔·斯坦德利
大卫·约翰·布莱
杰克·大卫·戈弗雷
岩本直树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wave Life Sciences Pte Ltd
Original Assignee
Wave Life Sciences Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wave Life Sciences Pte Ltd filed Critical Wave Life Sciences Pte Ltd
Publication of CN115989041A publication Critical patent/CN115989041A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New breeds of animals
    • A01K67/027New breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2207/00Modified animals
    • A01K2207/15Humanized animals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; CARE OF BIRDS, FISHES, INSECTS; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/01Animal expressing industrially exogenous proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • C12N2015/8518Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic expressing industrially exogenous proteins, e.g. for pharmaceutical use, human insulin, blood factors, immunoglobulins, pseudoparticles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y305/00Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
    • C12Y305/04Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)

Abstract

除其他外,本披露提供了经工程化为表达ADAR1多肽或其特征性部分的细胞和非人动物。在一些实施例中,本披露提供了经工程化为表达人ADAR1多肽或其特征性部分的细胞和非人动物。在一些实施例中,非人动物是经遗传修饰的啮齿类动物,例如小鼠、大鼠等。在一些实施例中,非人动物是小鼠。在一些实施例中,本披露提供了用于评估药剂的技术,这些技术包括将该药剂施用于经工程化为表达ADAR1多肽或其特征性部分的细胞或非人动物。在一些实施例中,这样的细胞或非人动物经工程化为表达人ADAR1多肽或其特征性部分。在一些实施例中,药剂是药物制剂。在一些实施例中,药剂是或包含寡核苷酸。

Description

经工程化为表达ADAR1的细胞和非人动物及其用途
相关申请的交叉引用
本申请要求2020年8月24日提交的美国临时申请号63/069,698、2020年11月8日提交的63/111,072和2021年4月14日提交的63/175,031的优先权,其各自的全部内容通过引用并入本文。
背景技术
寡核苷酸可用于多种应用,例如治疗、诊断和/或研究应用。例如,靶向多种基因的寡核苷酸可用于治疗与此类靶基因有关的病症、障碍或疾病。
发明内容
除其他外,本披露提供了经工程化为包含和/或表达ADAR1多肽或其特征性部分的细胞、胚胎和非人动物。在一些实施例中,胚胎和非人动物经工程化为包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸。
在一些实施例中,细胞是啮齿类动物例如小鼠细胞。在一些实施例中,胚胎是啮齿类动物胚胎,例如小鼠胚胎。在一些实施例中,非人动物是啮齿类动物。在一些实施例中,其为大鼠。在一些实施例中,其为小鼠。
在一些实施例中,ADAR1多肽或其特征性部分是或包含灵长类(例如人)ADAR1多肽或其特征性部分。在一些实施例中,ADAR1多肽或其特征性部分是或包含人ADAR1 p110多肽或其特征性部分。在一些实施例中,ADAR1多肽或其特征性部分是或包含人ADAR1 p150多肽或其特征性部分。在一些实施例中,ADAR1多肽或其特征性部分是或包含人ADAR1。在一些实施例中,ADAR1多肽或其特征性部分是或包含人ADAR1 p110肽。在一些实施例中,ADAR1多肽或其特征性部分是或包含人ADAR1 p150肽。在一些实施例中,ADAR1多肽或其特征性部分是或包含灵长类动物(例如人)ADAR1的一个或多个或所有以下结构域:Z-DNA结合结构域、dsRNA结合结构域和脱氨酶结构域。在一些实施例中,ADAR1多肽或其特征性部分是或包含灵长类动物(例如人)ADAR1Z-DNA结合结构域中的一者或两者;替代性地或另外地,在一些实施例中,ADAR1多肽或其特征性部分是或包含灵长类动物(例如人)ADAR1 dsRNA结合结构域中的一者、两者或全部;替代性地或另外地,ADAR1多肽或其特征性部分是或包含灵长类动物(例如人)脱氨酶结构域。在一些实施例中,灵长类动物(例如人)ADAR1多肽或其特征性部分可与非灵长类动物(例如啮齿类动物例如小鼠)ADAR1多肽或其特征性部分一起表达,例如一个或多个人dsRNA结合结构域可经工程化为与小鼠ADAR1脱氨酶结构域一起表达以形成人-小鼠杂合ADAR1多肽。在一些实施例中,ADAR1多肽或其特征性部分是或包含非灵长类动物(例如啮齿类动物(例如小鼠))ADAR1,其中非灵长类动物ADAR1是经改造化使其一个或多个结构域被一个或多个相应的灵长类动物(例如,人)ADAR1结构域(例如,Z-DNA结合结构域、dsRNA结合结构域和/或脱氨酶结构域)替换。
除其他外,提供的技术(例如细胞、胚胎、动物、方法等)可用于评估其活性可能与ADAR1相关的各种药剂。例如,在一些实施例中,所提供的技术作为动物模型特别有用,用于评估/表征各种药剂,例如寡核苷酸及其组合物,用于核酸编辑、例如转录物中的腺苷编辑(例如A到I的转换)。除其他外,本披露包括这样的共识:可在多种人系统(例如,细胞)中提供编辑的多种药剂(例如,寡核苷酸)及其组合物可能在不含或不表达人ADAR1)的某些细胞(例如啮齿类动物细胞例如小鼠细胞)和某些动物诸如啮齿类动物(例如,小鼠)中不会显示出编辑或显示出低得多的编辑水平。特别地,小鼠(一种常用的动物模型)对于评估用于在人中编辑的多种药剂(例如,寡核苷酸)可能具有有限的用途,因为在人细胞中有活性的多种药剂在未经工程化为包含或表达适当的ADAR1(例如,人ADAR1)多肽或其特征性部分的小鼠细胞和动物中不提供或提供非常低水平的活性(参见图22-26,野生型(WT)小鼠和细胞、人细胞以及经工程化为表达hADAR1 p110的细胞和小鼠(huADAR小鼠)的数据)。在一些实施例中,本披露提供了经工程化为表达ADAR1多肽或其特征性部分(例如,人ADAR1 p110、p150等)的细胞和非人动物(例如,啮齿类动物诸如小鼠),以及它们用于评估/表征编辑剂(诸如各种寡核苷酸)及其组合物的用途。除其他外,此类工程化的细胞和/或动物与未如此工程化的细胞和/或动物相比可展示出与人细胞中的活性更相关和/或更可预测人细胞中的活性的活性。
在一些实施例中,工程化的细胞、胚胎、非人动物等都是经遗传修饰的。在一些实施例中,工程化的细胞、胚胎、非人动物包含多核苷酸,其序列编码本文所述的ADAR1多肽或其特征性部分。在一些实施例中,工程化的细胞、胚胎、非人动物的基因组包含多核苷酸,其序列编码本文所述的ADAR1多肽或其特征性部分。在一些实施例中,工程化的非人动物的种系基因组包含多核苷酸,其序列编码本文所述的ADAR1多肽或其特征性部分。
在一些实施例中,本披露提供了经遗传修饰的啮齿类动物。在一些实施例中,所提供的经遗传修饰的啮齿类动物是大鼠或小鼠。在一些实施例中,所有内源序列都是大鼠或小鼠序列。例如,在一些实施例中,经遗传修饰的啮齿类动物是小鼠,所有内源序列都是小鼠序列。在一些实施例中,经遗传修饰的啮齿类动物是大鼠,并且所有内源序列都是大鼠序列。
在一些实施例中,本披露提供了本文提供的经遗传修饰的啮齿类动物的繁殖群体,其包括第一经遗传修饰的啮齿类动物、第二经遗传修饰的啮齿类动物和第三经遗传修饰的啮齿类动物,其中该第一、第二和第三经遗传修饰的啮齿类动物均为本文所述的经遗传修饰的啮齿类动物。在一些实施例中,第三经遗传修饰的啮齿类动物是第一经遗传修饰的啮齿类动物和第二经遗传修饰的啮齿类动物的后代。
在一些实施例中,工程化的细胞、胚胎、非人动物等是杂合的。在一些实施例中,工程化的细胞、胚胎、非人动物等是纯合的。
在一些实施例中,本披露提供了用于制造工程化的细胞、胚胎、非人动物等的技术。在一些实施例中,本披露提供了用于评估/表征工程化的细胞、胚胎、非人动物等的技术。
附图说明
这里包括的附图由以下附图组成,仅用于说明目的,而非限制。
图1显示了用于构建生成根据本披露的非人动物的实施例中使用的靶向载体(在实例1中描述)的策略的示例性实施例的图示,未按比例绘制。“LR”表示靶向ROSA26基因座的由SEQ ID NO:62所示的5'同源臂,“腺病毒剪接受体”表示如由SEQ ID NO:57所示的剪接受体,“CDS”表示由SEQ ID NO:14所示的ADAR1 p110基因座序列,“WPRE”表示由SEQ ID NO:56所示的土拨鼠肝炎病毒转录后调节元件,“bGH聚(A)信号”表示由SEQ ID NO:59所示的牛生长激素聚(A)信号,“RR”表示靶向ROSA26基因座的由SEQ ID NO:63所示的3'同源臂,“Ori”表示质粒复制起点,并且“AmpR”表示氨苄青霉素抗性基因。
图2显示了用于构建生成根据本披露的非人动物的实施例中使用的靶向载体(在实例1中描述)的策略的示例性实施例的图示,未按比例绘制。“LR”表示靶向ROSA26基因座的由SEQ ID NO:62所示的5'同源臂,“腺病毒剪接受体”表示如由SEQ ID NO:57所示的剪接受体,“CDS”表示由SEQ ID NO:3所示的ADAR1 p150基因座序列,“WPRE”表示由SEQ ID NO:56所示的土拨鼠肝炎病毒转录后调节元件,“bGH聚(A)信号”表示由SEQ ID NO:59所示的牛生长激素聚(A)信号,“RR”表示靶向ROSA26基因座的由SEQ ID NO:63所示的3'同源臂,“Ori”表示质粒复制起点,并且“AmpR”表示氨苄青霉素抗性基因。
图3描绘了一系列用于靶向小鼠ROSA26基因座的指导RNA的某些数据。使用荧光素酶中断测定法确定sgRNA分子的相对Cas9/sgRNA活性。选择Sg12进一步用于转基因动物的创建。
图4描绘了将靶向载体A(EGE-JGY-045-CDS-p110)引入WT ROSA26等位基因中的靶向方案。5'和3'同源臂与靶向的等位基因互补。
图5描绘了构建体EGE-JGY-045-A(包含如SEQ ID NO:64所示的huADAR1 p110的靶向载体)的某些限制酶消化和DNA印迹策略。各种平行限制酶消化测定用于确认ADAR1多核苷酸的正确掺入。此外,5'和3'(WPRE探针)DNA印迹探针旨在确认靶向载体整合到ROSA26基因座后的基因分型结果。
图6描述了某些限制酶消化结果,用于确认靶向载体A构建体#6的正确克隆。平行进行三个限制酶消化测定,包括1)限制酶XhoI和BamHI,其中成功克隆和消化产生长度为7069bp和3039bp的产物;2)限制酶SalI,成功克隆和消化产生长度为4765bp、3255bp和2115bp的产物;3)限制酶ScaI,成功克隆和消化产生长度为7093bp和3042bp的产物。构建体#6用于将人ADAR1(huADAR1)p110额外克隆和基因间引入小鼠基因组。
图7描述了用于筛选成功的huADAR1 p110整合事件的引物设计。对于PCR引物组序列和预测的产物大小,请参见表2。
图8描绘了用于确认成功的huADAR1 p110整合事件的引物设计。对于PCR引物组序列和预测的产物大小,请参见表2。
图9描绘了ROSA26基因座中huADAR1 p110整合事件的初始首建动物基因分型。A:来自四只潜在首建动物(founder animal)EY744-005、-008、-0036和-0037的PCR产物,其各自显示与预测产物大小相匹配的适当大小的2219bp产物。B:来自四只潜在首建动物EY74-005、-008、-0036和-0037的PCR产物,其各自显示与预测产物大小相匹配的适当大小的2221bp产物。C:来自四只潜在首建动物EY74-005、-008、-0036和-0037的PCR产物,其各自显示与预测产物大小相匹配的适当大小的3191bp产物。对于PCR引物组序列和预测的产物大小,请参见表2。
图10描绘了针对首建动物杂交后整合的huADAR1 p110的存在的F1基因分型。A:来自五只潜在huADAR1 p110 F1小鼠1E7Y45-00010、-0002、-0003、-004和-0013的PCR产物,其各自显示与预测产物大小相匹配的适当大小的2219bp产物。B:来自五只潜在huADAR1 p110F1小鼠1E7Y45-00010、-0002、-0003、-004和-0013的PCR产物,其各自显示与预测产物大小相匹配的适当大小的2221bp产物。C:来自五只潜在huADAR1 p110 F1小鼠1E7Y45-00010、-0002、-0003、-004和-0013的PCR产物,其各自显示与预测产物大小相匹配的适当大小的3191bp产物。D:来自五只潜在huADAR1 p110 F1小鼠1E7Y45-00010、-0002、-0003、-004和-0013的PCR产物,其各自显示与预测产物大小相匹配的并表明杂合性的适当大小的469bp产物。E:来自五只潜在huADAR1 p110 F1小鼠1E7Y45-00010、-0002、-0003、-004和-0013的PCR产物,其各自显示与预测产物大小相匹配的并表明杂合性的适当大小的264bp产物。对于PCR引物组序列和预测的产物大小,请参见表2。
图11描绘了确认ADAR1多核苷酸正确整合的DNA印迹策略结果。在DNA印迹分析中,huADAR1 p110转基因的存在通过9.9kb处的5'探针和4.7kb处的3'探针鉴定(在11A中描绘,在11B中描绘)。另外存在6.1kb 5'探针证实了F1动物的杂合性。
图12描绘了构建体EGE-JGY-046-A(包含如SEQ ID NO:65所示的huADAR1 p150的靶向载体)的限制酶消化和DNA印迹策略。各种平行限制酶消化测定用于确认ADAR1多核苷酸的正确掺入。此外,5'和3'(WPRE探针)DNA印迹探针旨在确认靶向载体整合到ROSA26基因座后的基因分型结果。
图13描绘了用于鉴定靶向载体B构建体的正确克隆的限制酶消化结果。A:平行进行的初始三个限制酶消化测定,包括1)限制酶BamHI和SacI,其中成功的克隆和消化产生长度为5452bp、4214bp和1354bp的产物(由构建体#5和#6表示);2)限制酶XhoI和MluI,其中成功克隆和消化产生长度为6196bp和4824bp的产物(由构建体#5和#6表示);3)限制酶SalI,其中成功克隆和消化产生长度为4765bp、4140bp和2115bp的产物(由构建体#5和#6表示)。构建体#5用于另外的限制酶确认。B:质粒扩增后的三次确认性酶切,包括1)限制酶BamHI和SacI,其中成功克隆和酶切产生长度为5452bp、4214bp和1354bp的产物。2)限制酶XhoI和MluI,其中成功克隆和消化产生长度为6196bp和4824bp的产物;3)限制酶NdeI和KpnI,其中成功克隆和消化产生长度为5405bp、3244bp和2371bp的产物。选择构建体#5将人ADAR1(huADAR1)p150进行基因间引入小鼠基因组。
图14描述了用于筛选成功的huADAR1 p150整合事件的引物设计。对于PCR引物组序列和预测的产物大小,请参见表2。
图15描绘了用于确认成功的huADAR1 p150整合事件的引物设计。对于PCR引物组序列和预测的产物大小,请参见表2。
图16描绘了ROSA26基因座中huADAR1 p150整合事件的初始首建动物基因分型。A:来自七种潜在首建动物EY746-005、-0012、-0016、-0024、-0030、-0051和-0054的PCR产物,其各自显示与预测产物大小相匹配的适当大小的2211bp产物。B:描绘了来自七种潜在首建动物EY746-005、-0012、-0016、-0024、-0030、-0051和-0054的PCR产物,其各自显示与预测产物大小相匹配的适当大小的2221bp产物。C:描绘了来自七种潜在首建动物EY746-005、-0012、-0016、-0024、-0030、-0051和-0054的PCR产物,其各自显示与预测产物大小相匹配的适当大小的1521bp产物。D:描绘了来自七种潜在首建动物EY746-005、-0012、-0016、-0024、-0030、-0051和-0054的PCR产物,其各自显示与预测产物大小相匹配的适当大小的2719bp产物。对于PCR引物组序列和预测的产物大小,请参见表2。
图17描绘了针对首建动物杂交后整合的huADAR1 p150的存在的F1基因分型。A:来自17只潜在F1转基因动物1EY746-007、-0013、-0015、-0016、-0019、-0021、-0024、-0030、-0032、-0033、-0035、-0047、-0048、-00580、-0064、-0065和-0070的PCR产物,其大多数显示与预测产物大小相匹配的适当大小的2211bp产物。B:来自17只潜在F1转基因动物1EY746-007、-0013、-0015、-0016、-0019、-0021、-0024、-0030、-0032、-0033、-0035、-0047、-0048、-00580、-0064、-0065和-0070的PCR产物,其大多数显示与预测产物大小相匹配的适当大小的2221bp产物。C:来自17只潜在F1转基因动物1EY746-007、-0013、-0015、-0016、-0019、-0021、-0024、-0030、-0032、-0033、-0035、-0047、-0048、-00580、-0064、-0065和-0070的PCR产物,其大多数显示与预测产物大小相匹配的适当大小的1512bp产物。D:来自17只潜在F1转基因动物1EY746-007、-0013、-0015、-0016、-0019、-0021、-0024、-0030、-0032、-0033、-0035、-0047、-0048、-00580、-0064、-0065和-0070的PCR产物,其大多数显示与预测产物大小相匹配的适当大小的2719bp产物。对于PCR引物组序列和预测的产物大小,请参见表2。
图18描绘了确认ADAR1多核苷酸整合的DNA印迹策略(A)和结果(B)。在DNA印迹分析中,huADAR1 p150转基因的存在通过9.9kb处的5'探针和4.7kb处的3'探针鉴定。另外存在8.9kb 5'探针证实了F1动物的杂合性。图B中的结果显示1E7Y46-0024包含适当的转基因条带模式,显示出干净的杂合性(即,没有另外的未鉴定条带)。选择动物1E7Y46-0024用于通过PCR进行进一步的基因分型分析。
图19描绘了针对首建动物杂交后整合的huADAR1 p150的存在的补充F1基因分型。A:来自潜在F1转基因动物1EY746-0024的PCR产物,其显示与预测产物大小相匹配的并表明杂合性的适当大小的469bp产物。B:描绘了来自潜在F1转基因动物1EY746-0024的PCR产物,其显示与预测产物大小相匹配的并表明杂合性的适当大小的256bp产物。对于PCR引物组序列和预测的产物大小,请参见表2。
图20描绘了证实huADAR1 p110在转基因小鼠(也标记为hADAR)中表达的示例性蛋白质印迹分析结果。A:人原代肝细胞中人ADAR1的表达,WT C57BL/6J小鼠中缺乏huADAR1表达,而huADAR1 p110转基因小鼠中的表达水平与人肝细胞相似。GAPDH用作上样对照,并使用9ug或4.5ug标准化蛋白质输入进行分析。B:人诱导神经元(iCell公司诱导神经元(iNeurons))中人ADAR1的中枢神经系统(CNS)表达,WT C57BL/6J小鼠中缺乏huADAR1表达,以及huADAR1 p110转基因小鼠在小脑、脑桥/延髓中、皮质和中脑的表达水平与人诱导神经元相似。GAPDH用作标准化蛋白质输入的上样对照。
图21描绘了证实huADAR1 p110在转基因小鼠中表达的示例性蛋白质印迹分析结果。huADAR1 p110转基因小鼠中huADAR1 p110在中枢神经系统(CNS)和肺中的表达,以及在WT C57BL/6J小鼠中缺乏huADAR1 CNS或肺表达。GAPDH用作标准化蛋白质输入的上样对照。
图22描绘了内源性小鼠UGP2转录物的体内肝组织编辑水平。在第0天、第2天和第4天给小鼠给予10mg/kg WV-38700或WV-38702或对照媒剂(PBS);在实验第6天(初始治疗暴露后7天),收集肝组织用于测量huADAR1 p110转基因小鼠或WT C57BL/6J小鼠肝中由ADAR蛋白介导的寡核苷酸定向RNA编辑。在huADAR1 p110小鼠中可检测到WV-38702诱导的编辑事件,而在WT C57BL/6J小鼠中未检测到WV-38702诱导的编辑。
图23描绘了内源性小鼠EEF1A1转录物的体内肝组织编辑水平。在第0天、第2天和第4天给小鼠给予10mg/kg WV-38697或WV-38699或对照媒剂(PBS);在实验第6天(初始治疗暴露后7天),收集肝组织用于测量huADAR1 p110转基因小鼠或WT C57BL/6J小鼠肝中由ADAR蛋白介导的寡核苷酸定向RNA编辑。与WT C57BL/6J小鼠中WV-38699诱导的编辑相比,在huADAR1 p110小鼠中检测到由WV-38699诱导的编辑事件的丰度更高。
图24描绘了UGP2(A)或EEF1A1(B)在人肝细胞、WT C57BL/6J小鼠原代肝细胞或转基因huADAR1 p110小鼠原代肝细胞中的体外编辑水平。UGP2或EEF1A1的转录物使用WV-38700或WV-38702(UGP2)或WV-38697或WV-38699(EEF1A1)被靶向,其中每一个都包含GalNAc并被递送用于裸式(gymnotic)摄取。A:给予1uM寡核苷酸时的平均UGP2编辑水平。B:给予1uM寡核苷酸时的平均EEF1A1编辑水平。
图25描绘了UGP2在人肝细胞、WT C57BL/6J小鼠原代肝细胞或转基因huADAR1p110小鼠原代肝细胞中的体外编辑水平。UGP2的转录物使用包含用以介导摄取的GalNAc的WV-38700、WV-38701或WV-38702被靶向。A:在人肝细胞、WT C57BL/6J小鼠肝细胞和huADAR1p110转基因小鼠肝细胞中给予1uM WV-38701或WV-38702时的平均UGP2编辑水平。B:人肝细胞中WV-38700、WV-38701和WV-38702的浓度依赖性编辑水平。C:WT C57BL/6J小鼠肝细胞中WV-38700、WV-38701和WV-38702的浓度依赖性编辑水平。D:huADAR1 p110转基因小鼠肝细胞中WV-38700、WV-38701和WV-38702的浓度依赖性编辑水平。
图26描绘了EEF1A1在人肝细胞、WT C57BL/6J小鼠原代肝细胞或转基因huADAR1p110小鼠原代肝细胞中的体外编辑水平。EEF1A1的转录物使用包含用以介导摄取的GalNAc的WV-38697、WV-38698或WV-38699被靶向。A:在人肝细胞、WT C57BL/6J小鼠肝细胞和huADAR1 p110转基因小鼠肝细胞中给予1uM WV-38698、WV-38697或WV-38699时的平均EEF1A1编辑水平。B:人肝细胞中寡核苷酸WV-38697、WV-38698或WV-38699的浓度依赖性编辑水平。C:WT C57BL/6J小鼠肝细胞中寡核苷酸WV-38697、WV-38698或WV-38699的浓度依赖性编辑水平。D:huADAR1 p110转基因小鼠肝细胞中寡核苷酸WV-38697、WV-38698或WV-38699的浓度依赖性编辑水平。
图27描绘了体内CNS组织(例如,皮层、海马、纹状体、脑干、小脑和脊髓)内源性小鼠UGP2转录物的编辑水平。小鼠在第0天以100ug或在第0天以50ug和在第2天以50ug给予对照媒剂(PBS)或WV-40590。在实验第6天(初始治疗暴露后7天),收获CNS组织用于测量huADAR1 p110转基因小鼠CNS中的定向RNA编辑。A:huADAR1 p110小鼠的平均CNS编辑水平。PBS没有诱导编辑。在一些实施例中,在测试条件下,使用100ug的单剂量产生比两个时间上分散的50ug剂量更大的编辑响应。B:体外人CNS细胞(诱导神经元或诱导星形胶质细胞(iAstrocytes))WV-40590裸式摄取浓度依赖性编辑水平。
图28描绘了体内CNS组织(例如,皮层、海马、纹状体、脑干、小脑和脊髓)内源性小鼠SRSF1转录物的编辑水平。小鼠在第0天以100ug或在第0天以50ug和在第2天以50ug给予对照媒剂(PBS)或WV-40592。在实验第6天(初始治疗暴露后7天),收获CNS组织用于测量huADAR1 p110转基因小鼠CNS中的定向RNA编辑。A:WV-40592在huADAR1 p110小鼠中诱导的平均CNS编辑水平。PBS没有诱导编辑。在一些实施例中,在测试条件下,使用100ug的单剂量产生比两个时间上分散的50ug剂量更大的编辑响应。B:体外人CNS细胞(诱导神经元或诱导星形胶质细胞(iAstrocytes))WV-40592裸式摄取浓度依赖性编辑水平。
图29描绘了表达突变等位基因huSERPINA1-Pi*Z的人源化SERPINA1小鼠与huADAR小鼠的示例性遗传杂交。由此产生的后代是双转基因SERPINA1-Pi*Z/huADAR小鼠,其可以作为模型进行体内已知突变等位基因的编辑,这些突变等位基因易于通过ADAR进行编辑(例如,用于评估各种药剂如寡核苷酸药剂的特性和/或活性)。
定义
本发明的范围由所附权利要求限定并且不受本文描述的某些实施例限制。阅读本说明书的本领域技术人员将意识到可以等同于所描述的实施例的或者在权利要求的范围内的各种修改。一般而言,除非另有明确说明,否则此处使用的术语与它们在本领域中的理解含义一致。下面提供了某些术语的明确定义;本说明书通篇特定实例中的这些和其他术语的含义对于本领域技术人员来说从上下文中将是清楚的。在整个说明书中阐述了以下和其他术语的附加定义。本说明书中引用的专利和非专利文献参考或其相关部分可以在指定的地方通过引用并入。
在权利要求书中使用诸如“第一”、“第二”、“第三”等序数术语来修改权利要求要素,这本身并不表示一个权利要求要素相对于另一权利要求要素的任何优先、居先或次序,或执行方法的行为的时间顺序,而是仅用作标记,以区分具有相同名称的一个权利要求要素与具有相同名称的另一要素(但用于序数词)以区分权利要求要素。
除非有相反的明确指示,否则本文所用的冠词“一个(a)”和“一种(an)”应理解为包括复数指代物。如果组成员中的一个、多于一个或所有在给定产品或工艺中存在、使用或以其他方式与给定产品或工艺相关,则包含组的一个或多个成员的“或”组的一个或多个成员之间的权利要求或描述被视为满足,除非有相反的指示或从上下文中明显看出。在一些实施例中,组的确切一个成员在给定产品或方法中存在、使用或以其他方式与给定产品或方法相关。在一些实施例中,多于一个或所有组成员在给定产品或方法中存在、使用或以其他方式与给定产品或方法相关。应当理解,本发明涵盖所有变化、组合和排列,其中来自一个或多个所列权利要求的一个或多个限制、要素、条款、描述性术语等被引入到从属于相同基本权利要求(或相关的任何其他权利要求)的另一个权利要求中,除非另有说明或除非对本领域普通技术人员显而易见的是将出现矛盾或不一致。当要素以列表形式呈现时(例如马库什组中的或类似格式),应理解要素的每个子组也被披露,并且任何一个或多个要素都可以从组中去除。应当理解,一般而言,在实施例或方面被称为“包括”特定要素、特征等的情况下,某些实施例或方面“由这样的要素、特征等组成”或“基本上由这样的要素、特征等组成”。为简单起见,这些实施例并未在所有情况下都在本文中以如此多的文字具体阐述。还应当理解,任何实施例或方面都可以明确地从权利要求中排除,而不管说明书中是否记载了具体的排除。
除非另有说明,否则寡核苷酸及其元件(例如,碱基序列、糖修饰、核苷酸间键联、键联磷立体化学、其模式等)的描述是从5'至3'进行的。如本领域的技术人员将理解,在一些实施例中,寡核苷酸可以作为盐形式,特别是药学上可接受的盐形式(例如,钠盐)提供和/或使用。如本领域技术人员也将理解的,在一些实施例中,组合物中的单一寡核苷酸可被认为具有相同的构成和/或结构,即使在这样的组合物(例如,液体组合物)中,特别地,这样的寡核苷酸在特定时间可能处于不同的一种或多种盐形式(并且例如在液体组合物中时,其可以溶解并且寡核苷酸链可以阴离子形式存在)。例如,本领域技术人员将理解,在给定的pH下,沿着寡核苷酸链的单个核苷酸间键联可以呈酸(H)形式,或呈多种可能的盐形式之一(例如,钠盐或不同阳离子的盐,取决于制备物或组合物中可能存在哪些离子),并且将会理解,只要它们的酸形式(例如,用H+替换所有阳离子,如果有的话)具有相同的构成和/或结构,这样的单一寡核苷酸可以适当地认为具有相同的构成和/或结构。
施用:如本文所用,包括将组合物(例如抗原或抗体)施用于受试者或系统(例如施用于细胞、器官、组织、生物体或其相关组分或组分集)。技术人员将理解,施用途径可以根据例如接受组合物施用的受试者或系统、组合物的性质、施用目的等而变化。例如,在某些实施例中,对动物受试者的施用(例如,对人或啮齿类动物)可以是支气管(包括通过支气管滴注)、口腔、肠内、皮间、动脉内、皮内、胃内、髓内、肌内、鼻内、腹膜内、鞘内、静脉内、心室内、粘膜、鼻腔、口腔、直肠、皮下、舌下、局部、气管(包括通过气管内滴注)、透皮、阴道和/或玻璃体。在一些实施例中,施用可涉及间歇施用。在一些实施例中,施用可涉及连续给药(例如灌注)至少选定的时间段。
动物:如本文中所用,术语“动物”是指动物界的任何成员。在一些实施例中,“动物”是指处于任何发育阶段的人。在一些实施例中,“动物”是指处于任何发育阶段的非人动物。在某些实施例中,非人动物是哺乳动物(例如,啮齿类动物、小鼠、大鼠、兔、猴、狗、猫、羊、牛、灵长类动物和/或猪)。在一些实施例中,非人动物是非灵长类动物。在一些实施例中,非人动物是啮齿类动物。在一些实施例中,非人动物是大鼠。在一些实施例中,非人动物是小鼠。在一些实施例中,动物包括但不限于哺乳动物、鸟类、爬行动物、两栖动物、鱼类和/或蠕虫。在一些实施例中,动物可是转基因动物、经基因工程化的动物和/或克隆体。
大约:当应用于一个或多个目的值时,包括类似于规定参考值的值。在某些实施例中,术语“大约”或“约”是指落在所陈述参考值的±10%(大于或小于)内的数值范围,除非另有说明或从上下文中可以明显看出(除非该数字超过可能值的100%)。
生物活性:如本文所用,指在生物系统中在体外或体内(例如生物体中)具有活性的任何药剂的特征。例如,当存在于生物体中时,在该生物体中具有生物效应的药剂被认为具有生物活性。在具体的实施例中,当蛋白质或多肽具有生物活性时,该蛋白质或多肽的具有该蛋白质或多肽的至少一种生物活性的部分通常称为“生物活性”部分。
特征性部分:如本文所用,术语“特征性部分”在最广泛的意义上是指下述物质部分:其存在(或不存在)与该物质的特定特征、属性或活性的存在(或不存在)相关。在一些实施例中,物质的特征性部分是在该物质中和在共享特定特征、属性或活性的相关物质中发现,而未在不共享特定特征、属性或活性的那些物质中发现的部分。在某些实施例中,特征性部分与完整物质共享至少一个功能特性。例如,在一些实施例中,蛋白或多肽的“特征性部分”是含有氨基酸的连续区段或氨基酸的连续区段的集合的部分,这些氨基酸区段一起是蛋白或多肽特有的。在一些实施例中,每个这样的连续区段通常包含至少2、5、10、15、20、50或更多个氨基酸。通常,物质的特征性部分(例如,蛋白、抗体等的特征性部分)是这样的部分,其除了上文指定的序列和/或结构同一性之外,还与相关的完整物质共享至少一种功能特性。在一些实施例中,特征性部分可以是生物活性的。
特征性序列元件:如本文所用,短语“特征性序列元件”是指在聚合物中(例如,在多肽或核酸中)发现的序列元件,其代表该聚合物的特征性部分。在一些实施例中,特征性序列元件的存在与聚合物的特定活性或特性的存在或水平相关。在一些实施例中,特征性序列元件的存在(或不存在)将特定聚合物定义为此类聚合物的特定家族或组的成员(或不是成员)。特征性序列元件通常包含至少两个单体(例如氨基酸或核苷酸)。在一些实施例中,特征性序列元件包括至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50个或更多单体(例如,连续连接的单体)。在一些实施例中,特征性序列元件包括由一个或多个间隔区隔开的至少第一和第二段连续单体,所述间隔区的长度在共享序列元件的聚合物中可以变化或不变化。
手性受控的寡核苷酸组合物:如本文所用,术语“手性受控的寡核苷酸组合物”、“手性受控的核酸组合物”等是指包含多个寡核苷酸(或核酸)的组合物,该多个寡核苷酸(或核酸)共享共同碱基序列,其中该多个寡核苷酸(或核酸)在一个或多个手性核苷酸间键联(手性受控的或立体限定的核苷酸间键联,其手性键联磷在组合物中呈Rp或Sp(“立体限定的”),而非如同非手性受控的核苷酸间键联一样的随机Rp和Sp混合物)处共享相同的键联磷立体化学。在一些实施例中,手性受控的寡核苷酸组合物包含共享以下的多个寡核苷酸(或核酸):1)共同碱基序列,2)共同骨架键联模式,以及3)共同骨架磷修饰模式,其中该多个寡核苷酸(或核酸)在一个或多个手性核苷酸间键联(手性受控的或立体限定的核苷酸间键联,其手性键联磷在组合物中呈Rp或Sp(“立体限定的”),而非如同非手性受控的核苷酸间键联一样的随机Rp和Sp混合物)处共享相同的键联磷立体化学。与非手性受控的寡核苷酸组合物中的随机水平相比,手性受控的寡核苷酸组合物中该多个寡核苷酸(或核酸)的水平是预定的/控制的或富集的(例如,通过手性受控的寡核苷酸制备以立体选择性地形成一个或多个手性核苷酸间键联)。在一些实施例中,手性控制的寡核苷酸组合物中的所有寡核苷酸的约1%-100%(例如,约5%-100%、10%-100%、20%-100%、30%-100%、40%-100%、50%-100%、60%-100%、70%-100%、80%-100%、90%-100%、95%-100%、50%-90%,或约5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%,或至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)是所述多种寡核苷酸。在一些实施例中,手性控制的寡核苷酸组合物中具有共同碱基序列、共同骨架键联模式和共同骨架磷修饰模式的所有寡核苷酸的约1%-100%(例如,约5%-100%、10%-100%、20%-100%、30%-100%、40%-100%、50%-100%、60%-100%、70%-100%、80%-100%、90-100%、95-100%、50%-90%,或约5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%、或至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%)是所述多种寡核苷酸。在一些实施例中,水平是组合物中的所有寡核苷酸的;或组合物中具有共同碱基序列(例如,多种寡核苷酸或一种寡核苷酸类型的碱基序列)的所有寡核苷酸的;或组合物中具有共同碱基序列、共同骨架键联模式以及共同骨架磷修饰模式的所有寡核苷酸的;或组合物中具有共同碱基序列、共同碱基修饰模式、共同糖修饰模式、共同核苷酸间键联类型模式、和/或共同核苷酸间键联修饰模式的所有寡核苷酸的约1%-100%(例如,约5%-100%、10%-100%、20%-100%、30%-100%、40%-100%、50%-100%、60%-100%、70%-100%、80%-100%、90%-100%、95%-100%、50%-90%,或约5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%,或至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)。在一些实施例中,多种寡核苷酸在约1-50个(例如,约1-10、1-20、5-10、5-20、10-15、10-20、10-25、10-30,或约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20,或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、或20个)手性核苷酸间键联处具有相同的立体化学。在一些实施例中,所述多种寡核苷酸在约1%-100%(例如,约5%-100%、10%-100%、20%-100%、30%-100%、40%-100%、50%-100%、60%-100%、70%-100%、80%-100%、90%-100%、95%-100%、50%-90%,约5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%,或至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%)的手性核苷酸间键联处具有相同的立体化学。在一些实施例中,多个寡核苷酸(或核酸)共享相同的糖和/或核碱基修饰模式。在一些实施例中,多个寡核苷酸(或核酸)是相同寡核苷酸的多种形式(例如,相同寡核苷酸的酸和/或多种盐)。在一些实施例中,多个寡核苷酸(或核酸)具有相同的构成。在一些实施例中,多种寡核苷酸(或核酸)的水平是组合物中的与多种寡核苷酸(或核酸)具有相同构成的所有寡核苷酸(或核酸)的约1%-100%(例如约5%-100%、10%-100%、20%-100%、30%-100%、40%-100%、50%-100%、60%-100%、70%-100%、80%-100%、90-100%、95-100%、50%-90%,或约5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%,或至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)。在一些实施例中,每个手性核苷酸间键联是手性受控的核苷酸间键联,并且组合物是完全手性受控的寡核苷酸组合物。在一些实施例中,多个寡核苷酸(或核酸)在结构上相同。在一些实施例中,手性受控的核苷酸间键联具有至少80%、85%、90%的非对映纯度,具有至少96%的非对映纯度。在一些实施例中,手性受控的核苷酸间键联具有至少97%的非对映纯度。在一些实施例中,手性受控的核苷酸间键联具有至少98%的非对映纯度。在一些实施例中,手性受控的核苷酸间键联具有至少99%的非对映纯度。在一些实施例中,水平的百分比是或至少是(DS)nc,其中DS是如本披露中所述的非对映纯度(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%或更高),并且nc是本披露中描述的手性控制的核苷酸间键联的数目(例如1-50、1-40、1-30、1-25、1-20、5-50、5-40、5--30、5-25、5-20、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25个或更多个)。在一些实施例中,水平的百分比为或至少为(DS)nc,其中DS为95%-100%。例如,当DS为99%并且nc为10时,该百分比为或至少为90%((99%)10≈0.90=90%)。在一些实施例中,组合物中多个寡核苷酸的水平表示为寡核苷酸中每个手性受控的核苷酸间键联链的非对映纯度的乘积。在一些实施例中,连接寡核苷酸(或核酸)中的两个核苷的核苷酸间键联的非对映纯度由连接相同的两个核苷的二聚体的核苷酸间键联的非对映纯度表示,其中使用可比较的条件,在一些情况下,相同的合成循环条件制备二聚体(例如,对于寡核苷酸.......NxNy......中Nx与Ny之间的键联,二聚体是NxNy)。在一些实施例中,不是所有的手性核苷酸间键联都是手性受控的核苷酸间键联,并且组合物是部分地手性受控的寡核苷酸组合物。在一些实施例中,如在立体随机寡核苷酸组合物(例如,如本领域技术人员所理解的,来自传统寡核苷酸合成,例如亚磷酰胺方法)中通常观察到的,非手性受控的核苷酸间键联具有小于约80%、75%、70%、65%、60%、55%或约50%的非对映纯度。在一些实施例中,多个寡核苷酸(或核酸)具有相同的类型。在一些实施例中,手性受控的寡核苷酸组合物包含非随机水平或控制水平的各个寡核苷酸类型或核酸类型。例如,在一些实施例中,手性受控的寡核苷酸组合物包含一种且不超过一种寡核苷酸类型。在一些实施例中,手性受控的寡核苷酸组合物包含超过一种寡核苷酸类型。在一些实施例中,手性受控的寡核苷酸组合物包含多种寡核苷酸类型。在一些实施例中,手性受控的寡核苷酸组合物是一种寡核苷酸类型的寡核苷酸的组合物,该组合物包含非随机水平或控制水平的该寡核苷酸类型的多个寡核苷酸。91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%,通常至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%。在一些实施例中,手性受控的核苷酸间键联具有至少95%的非对映纯度。在一些实施例中,手性受控的核苷酸间键联。在一些实施例中,本披露中的寡核苷酸组合物是手性受控的寡核苷酸组合物。
可比较的:术语“可比较的”在本文中用于描述两组(或更多组)彼此充分相似的条件或环境,以允许比较所获得的结果或观察到的现象。在一些实施例中,可比较的条件或环境的组的特征在于多个基本相同的特征和一个或少数变化的特征。本领域普通技术人员将理解,当由足够数量和类型的基本相同的特征表征时,条件的组彼此是可比较的,以保证合理的结论,即在不同组的条件或环境下获得的结果或观察到的现象的差异是由那些变化的特征的变化引起或指示的。
保守的:如本文所用,是指描述保守氨基酸取代的情况,包括用具有相似化学性质(例如,电荷或疏水性)的侧链R基团的另一个氨基酸残基取代氨基酸残基。通常,保守氨基酸取代不会显著改变蛋白质目的功能特性,例如,受体与配体结合的能力。具有相似化学性质的侧链的氨基酸组的实例包括:脂肪族侧链,例如甘氨酸(Gly,G)、丙氨酸(Ala,A)、缬氨酸(Val,V)、亮氨酸(Leu,L)和异亮氨酸(Ile,I);脂肪族羟基侧链,例如丝氨酸(Ser,S)和苏氨酸(Thr,T);含酰胺的侧链,例如天冬酰胺(Asn,N)和谷氨酰胺(Gln,Q);芳香族侧链,例如苯丙氨酸(Phe,F)、酪氨酸(Tyr,Y)和色氨酸(Trp,W);碱性侧链,例如赖氨酸(Lys,K)、精氨酸(Arg,R)、组氨酸(His,H);酸性侧链,例如天冬氨酸(Asp,D)和谷氨酸(Glu,E);和含硫侧链,如半胱氨酸(Cys,C)和甲硫氨酸(Met,M)。保守氨基酸取代基团包括例如缬氨酸/亮氨酸/异亮氨酸(Val/Leu/Ile,V/L/I)、苯丙氨酸/酪氨酸(Phe/Tyr,F/Y)、赖氨酸/精氨酸(Lys/Arg,K/R)、丙氨酸/缬氨酸(Ala/Val、A/V)、谷氨酸/天冬氨酸(Glu/Asp、E/D)和天冬酰胺/谷氨酰胺(Asn/Gln、N/Q)。在一些实施例中,保守氨基酸取代可以是用丙氨酸取代蛋白质中的任何天然残基,如在例如丙氨酸扫描诱变中所使用的。在一些实施例中,进行保守取代,其在Gonnet,G.H.等人,1992,Science[科学]256:1443-1445中披露的PAM250对数似然矩阵中具有正值。在一些实施例中,取代是适度保守的替代,其中取代在PAM250对数似然矩阵中具有非负值。
对照:如本文所用,“对照”是指本领域理解的含义,是与结果进行比较的标准。通常,对照用于通过分离变量来增强实验的完整性,以便对这些变量做出结论。在一些实施例中,对照是与测试反应或测定同时进行以提供比较物的反应或测定。“对照”还包括“对照动物”。“对照动物”可具有本文所述的修饰、不同于本文所述的修饰或无修饰(即,野生型动物)。在一个实验中,应用了“测试”参数(例如,正在测试的变量)。在第二实验中,“对照”,未应用正在测试的变量。在一些实施例中,对照是历史对照(即,先前进行的测试或测定,或先前已知的量或结果)。在一些实施例中,对照是或包括打印的或以其他方式保存的记录。对照可以是阳性对照或阴性对照。
破坏:如本文所用,指与DNA分子(例如,与内源同源序列如基因或基因座)的同源重组事件的结果。在一些实施例中,破坏可实现或代表DNA序列的插入、缺失、取代、替换、错义突变或移码,或其任何组合。插入可以包括整个基因或基因片段的插入,例如外显子,其来源可能不是内源序列(例如异源序列)。在一些实施例中,破坏可以增加基因或基因产物的(例如,由基因编码的多肽的)表达和/或活性。在一些实施例中,破坏可降低基因或基因产物的表达和/或活性。在一些实施例中,破坏可以改变基因或编码的基因产物(例如,编码的多肽)的序列。在一些实施例中,破坏可以使基因或编码的基因产物(例如,编码的多肽)截短或片段化。在一些实施例中,破坏可以延伸基因或编码的基因产物。在一些这样的实施例中,破坏可以实现融合多肽的组装。在一些实施例中,破坏可能影响基因或基因产物的水平,但不影响活性。在一些实施例中,破坏可能影响基因或基因产物的活性,但不影响水平。在一些实施例中,破坏可能对基因或基因产物的水平没有显著影响。在一些实施例中,破坏可能对基因或基因产物的活性没有显著影响。在一些实施例中,破坏可能对基因或基因产物的水平或活性没有显著影响。
内源启动子:如本文所用,“启动子”是指例如野生型生物体中的与内源基因天然相关联的启动子。
工程化的:如本文所用,一般指已通过人工进行操纵的方面。例如,在一些实施例中,当两个或更多个没有以自然界中的顺序连接在一起的序列被人工操纵成在工程化的多核苷酸中彼此直接连接时,多核苷酸可以被认为是“工程化的”。在一些实施例中,工程化的多核苷酸可包含调节序列,该调节序列在自然界中发现与第一编码序列可操作地关联但不与第二编码序列可操作地关联,通过人工连接使得该调节序列与第二编码序列可操作地关联。替代性地/另外地,在一些实施例中,各自编码在自然界中不彼此连接的多肽元件或结构域的第一和第二核酸序列可以在单个工程化的多核苷酸中彼此连接。相比之下,在一些实施例中,如果细胞或生物体已被操纵以致其遗传信息被改变(例如,以前没有的新的遗传材料已经被引入,或者以前存在的遗传材料已经被改变或移除),则该细胞或生物体可以被认为是“工程化的”。正如通常的实践和本领域技术人员所理解的那样,工程化的多核苷酸或细胞的后代通常仍被称为“工程化的”,即使实际操纵是在先前的实体上进行的。此外,如本领域技术人员将理解的,可使用多种方法,通过这些方法可实现如本文所述的“工程化”。例如,在一些实施例中,“工程化”可涉及通过使用被编程为执行分析或比较,或以其他方式分析、推荐和/或选择序列、改变等的计算机系统进行的选择或设计(例如核酸序列、多肽序列、细胞、组织和/或生物体的选择或设计界)。替代性地或另外地,在一些实施例中,“工程化”可涉及使用体外化学合成方法和/或重组核酸技术,例如核酸扩增(例如,通过聚合酶链式反应)杂交、突变、转化、转染等,和/或各种受控交配方法中的任何一种。如本领域技术人员所理解的,各种已建立的此类技术(例如用于重组DNA、寡核苷酸合成以及组织培养和转化(例如电穿孔、脂质转染等))是本领域众所周知的,并且在本说明书通篇引用和/或讨论的各种一般和更具体的参考文献中进行了描述。参见,例如Sambrook等人,MolecularCloning:ALaboratory Manual[分子克隆:实验室手册]第2版,冷泉港实验室出版社,冷泉港,纽约,1989和Principles of Gene Manipulation:An Introduction to GeneticManipulation[基因操纵原理:基因操纵导论],第5版,Old,R.W.和S.B.Primrose编辑,布莱克威尔科学公司(Blackwell Science,Inc.),1994。
基因:如本文所用,指染色体中的编码产物(例如,RNA产物和/或多肽产物)的DNA序列。在一些实施例中,基因包括编码序列(即,编码特定产物的序列)。在一些实施例中,基因包括非编码序列。在一些特定的实施例中,基因可以包括编码(例如外显子)和非编码(例如内含子)序列。在一些实施例中,基因可包括一个或多个调节序列(例如启动子、增强子等)和/或内含子序列,其例如可控制或影响基因表达的一个或多个方面(例如,细胞类型特异性表达、诱导表达等)。为了清楚起见,我们注意到,如在本披露中所使用的,术语“基因”通常是指核酸的编码多肽或其片段的一部分;该术语可以任选地包括调节序列,正如本领域普通技术人员从上下文中清楚的那样。该定义并非旨在排除术语“基因”对非蛋白质编码表达单元的应用,而是为了澄清,在大多数情况下,本文中使用的术语是指编码多肽的核酸。
经遗传修饰的非人动物或经遗传工程化非人动物:在本文中可互换使用,指任何非天然存在的非人动物(例如啮齿类动物,例如大鼠或小鼠),其中非人动物的一个或多个细胞全部或部分地含有编码目的多肽的异源核酸和/或基因。例如,在一些实施例中,“经遗传修饰的非人动物”或“经遗传工程化的非人动物”是指包含如本文所述的转基因或转基因构建体的非人动物。在一些实施例中,异源核酸和/或基因通过有意的遗传操纵,例如通过显微注射或通过重组病毒感染,通过引入前体细胞而被直接或间接地引入细胞。术语遗传操纵不包括经典的育种技术,而是针对一个或多个重组DNA分子的引入。该分子可以整合在染色体内。短语“经遗传修饰的非人动物”或“经遗传工程化的非人动物”是指异源核酸和/或基因杂合或纯合的动物,和/或具有异源核酸和/或基因的单拷贝或多拷贝的动物。
种系基因组:如本文所用,指在动物形成中使用的生殖细胞(例如配子,例如精子或卵子)中发现的基因组。种系基因组是动物细胞基因组DNA的来源。在一些实施例中,在其种系基因组中具有修饰的动物(例如,小鼠或大鼠)被认为在其所有细胞的基因组DNA中具有修饰。
种系序列:如本文所用,指在野生型动物(例如小鼠、大鼠或人)的内源种系基因组中发现的DNA序列,或由在动物(例如,小鼠、大鼠或人)的内源种系基因组中发现的DNA序列编码的RNA或氨基酸序列。
异源:如本文所用,指来自不同来源的药剂或实体。例如,当用于指存在于特定细胞或生物体中的多肽、基因或基因产物时,该术语阐明相关多肽、基因或基因产物:1)通过人工设计;2)通过人工(例如,通过基因工程)被引入细胞或生物体(或其前体);和/或3)不是由相关细胞或生物体自然产生或不存在于相关细胞或生物体中(例如,相关细胞类型或生物体类型)。“异源”还包括通常存在于特定天然细胞或生物体中但已被改变或修饰的多肽、基因或基因产物,例如,通过突变或置于非天然相关联的调节元件(例如,启动子)的控制下,并且在一些实施例中,非内源性调节元件(例如,启动子)的控制下。
宿主细胞:如本文所用,是指其中已引入核酸或蛋白质的细胞。阅读本披露的技术人员将理解这样的术语不仅指特定的主题细胞,而且用于指这样的细胞的后代。因为由于突变或环境影响,某些修饰可能在后续世代中发生,所以这种后代实际上可能与亲本细胞不同,但仍包括在短语“宿主细胞”的范围内。在一些实施例中,宿主细胞是或包含原核或真核细胞。一般而言,宿主细胞是适合于接收和/或产生异源核酸或蛋白质的任何细胞,而不管该细胞被指定为哪个生命界。示例性细胞包括原核生物和真核生物(单细胞或多细胞)、细菌细胞(例如大肠杆菌、芽孢杆菌属物种(Bacillus spp.)、链霉菌属物种(Streptomycesspp.)等的菌株)、分枝杆菌细胞、真菌细胞、酵母细胞(例如,酿酒酵母(Saccharomycescerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、毕赤酵母(Pichiapastoris)、甲醇毕赤酵母(Pichia methanolica)等)、植物细胞、昆虫细胞(例如SF-9、SF-21、杆状病毒感染的昆虫细胞、粉纹夜蛾(Trichoplusia ni)等)、非人动物细胞、人细胞或细胞融合体,例如杂交瘤或四细胞杂交瘤。在一些实施例中,细胞是人、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施例中,细胞是真核细胞并且选自以下细胞:中国仓鼠卵巢(CHO)(例如CHO K1、DXB-11CHO、Veggie-CHO)、COS(例如COS-7)、视网膜细胞、Vero、CV1、肾(例如,HEK293、293EBNA、MSR 293、MDCK、HaK、BHK)、HeLa、HepG2、WI38、MRC 5、Colo205、HB 8065、HL-60(例如,BHK21)、Jurkat、Daudi、A431(表皮)、CV-1、U937、3T3、L细胞、C127细胞、SP2/0、NS-0、MMT 060562、Sertoli细胞、BRL 3A细胞、HT1080细胞、骨髓瘤细胞、肿瘤细胞和衍生自上述细胞的细胞系。在一些实施例中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如PER.
Figure BDA0004094631750000221
细胞)。在一些实施例中,宿主细胞是或包含分离的细胞。在一些实施例中,宿主细胞是组织的一部分。在一些实施例中,宿主细胞是生物体的一部分。
同一性:如本文所用,术语“同一性”是指聚合物分子之间,例如核酸分子之间(例如寡核苷酸,DNA,RNA等)之间和/或多肽分子之间的整体相关性。在一些实施例中,如果聚合分子的序列是至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%相同的,则认为它们彼此“基本上相同”。例如,两个核酸或多肽序列的同一性百分比的计算可以通过为了最佳比较目的而对两个序列进行比对来进行(例如,可以在第一序列和第二序列中的一个或两个中引入缺口以实现最佳比对,并且出于比较目的,可以忽略不相同的序列)。在某些实施例中,为了比较目的而比对的序列的长度为参考序列长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少是95%或基本上100%。然后比较相应位置的核苷酸。当第一序列中的一个位置被与第二序列中相应位置相同的残基(例如,核苷酸或氨基酸)占据时,则分子在该位置是相同的。考虑到缺口的数目和每个缺口的长度(这需要引入以实现两个序列的最佳比对),两个序列之间的同一性百分比为序列共享的相同位置的数目的函数。可以使用数学算法完成序列的比较和两个序列之间的百分比同一性的确定。例如,可以使用Meyers和Miller算法(CABIOS,1989,4:11-17)确定两个核苷酸序列之间的同一性百分比,所述算法已被并入ALIGN程序(2.0版)。在一些示例性实施例中,使用ALIGN程序进行的核酸序列比较使用PAM120权重残基表,缺口长度罚分12和缺口罚分4。替代性地,可以使用NWSgapdna.CMP矩阵,使用GCG软件包中的GAP程序确定两个核苷酸序列之间的同一性百分比。在某些实施例中,如本文所用的与序列比较相关的同一性是指通过本领域已知的可用于测量核苷酸和/或氨基酸序列同一性的多种不同算法确定的同一性。在一些实施例中,使用ClustalWv.1.83(慢)比对确定本文所述的同一性,该比对采用10.0的开放缺口罚分、0.1的延伸缺口罚分,并使用Gonnet相似性矩阵(MACVECTORTM10.0.2,MacVector Inc.公司,2008)。
代替:如本文所用,指位置取代,其中第一核酸序列位于染色体中第二核酸序列的位置(例如,其中第二核酸序列先前(例如,最初)位于染色体中,例如位于第二核酸序列的内源基因座处)。短语“代替”不要求从例如基因座或染色体移除第二核酸序列。在一些实施例中,第二核酸序列和第一核酸序列彼此可比,因为例如第一和第二序列彼此同源,含有相应的元件(例如蛋白质编码元件、调节元件等)和/或具有相似或相同的序列。在一些实施例中,第一和/或第二核酸序列包括启动子、增强子、剪接供体位点、剪接受体位点、内含子、外显子、非翻译区(UTR)中的一个或多个;在一些实施例中,第一和/或第二核酸序列包括一个或多个编码序列。在一些实施例中,第一核酸序列是第二核酸序列的同系物或变体(例如突变体)。在一些实施例中,第一核酸序列是第二序列的直向同源物或同系物。在一些实施例中,第一核酸序列是或包含人核酸序列。在一些实施例中,包括在第一核酸序列是或包含人核酸序列的情况下,第二核酸序列是或包含啮齿类动物序列(例如,小鼠或大鼠序列)。在一些实施例中,包括在第一核酸序列是或包含人核酸序列的情况下,第二核酸序列是或包含人序列。在一些实施例中,第一核酸序列是第二序列的变体或突变体(即,与第二序列相比包含一个或多个序列差异(例如取代)的序列)。如此放置的核酸序列可以包括一个或多个调节序列,这些调节序列是用于获得如此放置的序列的源核酸序列的一部分(例如,启动子、增强子、5'-或3'-非翻译区等)。例如,在各种实施例中,第一核酸序列是用异源序列取代内源序列,导致从如此放置的核酸序列(包含异源序列)产生基因产物,但不表达内源序列;第一核酸序列是具有编码多肽的核酸序列的内源基因组序列,该多肽具有与由内源序列编码的多肽相似的功能(例如,内源基因组序列编码非-人可变区多肽(全部或部分),并且DNA片段编码一个或多个人可变区多肽(全部或部分))。在各种实施例中,人或非人灵长类动物ADAR基因区段或其片段代替内源非人动物(例如,啮齿类动物,例如,大鼠或小鼠)基因区段或片段。
体外:如本文所用,指发生在人工环境中的事件,例如在试管或反应容器中、在细胞培养物中等,而不是在多细胞生物体中。
体内:如本文所用,“事件”是指发生在多细胞生物体(例如人和/或非人动物)内的事件。在基于细胞的系统的上下文中,该术语可用于指发生在活细胞内的事件(与例如体外系统不同)。
分离的:如本文所用,指物质和/或实体已经(1)与最初生产时(无论是在自然界和/或实验环境中)相关的至少一些组分分离,和/或(2)由人工设计、生产、准备和/或制造。分离的物质和/或实体可以与最初与之相关联的其他组分的约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%分离。在一些实施例中,分离的药剂与最初与之相关联的其他组分的10%至100%、15%-100%、20%-100%、25%-100%、30%-100%、35%-100%、40%-100%、45%-100%、50%-100%、55%-100%、60%-100%、65%-100%、70%-100%、75%-100%、80%-100%、85%-100%、90%-100%、95%-100%、96%-100%、97%-100%、98%-100%或99%-100%分离。在一些实施例中,分离的药剂与最初与之相关联的其他组分的10%至100%、10%-99%、10%-98%、10%-97%、10%-96%、10%-95%、10%-90%、10%-85%、10%-80%、10%-75%、10%-70%、10%-65%、10%-60%、10%-55%、10%-50%、10%-45%、10%-40%、10%-35%、10%-30%、10%-25%、10%-20%或10%-15%分离。在一些实施例中,分离的药剂与最初与之相关联的其他组分的11%-99%、12%-98%、13%-97%、14%-96%、15%-95%、20%-90%、25%-85%、30%-80%、35%-75%、40%-70%、45%-65%、50%-60%或55%-60%分离。在一些实施例中,分离的药剂是约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%纯。在一些实施例中,分离的药剂是80%-99%、85%-99%、90%-99%、95%-99%、96%-99%、97%-99%或98%-99%纯。在一些实施例中,分离的药剂是80%-99%、80%-98%、80%-97%、80%-96%、80%-95%、80%-90%或80%-85%纯。在一些实施例中,分离的药剂是85%-98%、90%-97%或95%-96%纯。在一些实施例中,物质基本上不含其他组分时是“纯的”。在一些实施例中,如本领域技术人员所理解的,在与某些其他组分(例如,一种或多种载剂或赋形剂(例如缓冲液、溶剂、水等))组合之后,物质仍可被认为是“分离的”或甚至“纯的”;在此类实施例中,计算物质的百分比分离或纯度而不包括此类载剂或赋形剂。仅举一个实例子,在一些实施例中,自然界中存在的生物聚合物如多肽或多核苷酸当以下情况时被认为是“分离的”:a)由于其起源或衍生来源与自然界中天然状态下伴随的组分中的一些或全部成分无关联;b)它基本上不含来自自然界中产生它的物种的相同物种的其他多肽或核酸;或c)由以下表达或与之相关联:来自不属于自然界中产生它的物种的细胞或其他表达系统的组分。因此,例如,在一些实施例中,化学合成的或在不同于天然产生它的细胞系统中合成的多肽被认为是“分离的”多肽。替代性地或另外地,在一些实施例中,已经经受一种或多种纯化技术的多肽可以被认为是“分离的”多肽,其程度是它已经与以下其他组分分离:a)在自然界中与它相关联的组分;和/或b)最初生产时与它相关联的组分。
自然出现:如本文所用,涉及生物元件(例如核酸序列)时是指生物元件可以在细胞或生物体中(例如,动物)的指定背景和/或位置中找到,没有工程化(例基因工程)。换句话说,自然出现在指定背景和/或位置中的序列不在作为工程化(例如,基因工程)的结果的指定背景和/或位置中。
非人动物:如本文所用,“脊椎动物”是指非人的任何脊椎动物。在一些实施例中,非人动物是环口鱼、硬骨鱼、软骨鱼(例如,鲨鱼或鳐鱼)、两栖动物、爬行动物、哺乳动物和鸟类。在一些实施例中,非人动物是哺乳动物。在一些实施例中,非人哺乳动物是灵长类动物、山羊、绵羊、猪、狗、牛或啮齿类动物。在一些实施例中,非人动物是啮齿类动物,例如大鼠或小鼠。在一些实施例中,非人动物是大鼠。在一些实施例中,非人动物是小鼠。
可操作地连接:如本文所用,指组分的并置,其中所描述的组分处于允许它们以其预期方式起作用的关系中(例如,当组分存在于适当的组织、细胞类型、细胞活动等中时)。“可操作地连接”至编码序列的控制序列是以这样一种方式连接,使得在与该控制序列兼容的条件下实现所述编码序列的表达。“可操作地连接的”序列包括与目的基因邻接的表达控制序列和反式或以一定距离起作用以控制目的基因(或目的序列)的表达控制序列。术语“表达控制序列”包括影响与它们连接的编码序列的表达和加工所需的多核苷酸序列。“表达控制序列”包括:适当的转录起始、终止、启动子和增强子序列;高效的RNA处理信号,例如剪接和聚腺苷酸化信号;稳定细胞质mRNA的序列;增强翻译效率的序列(即,科扎克共有序列);增强多肽稳定性的序列;并且当需要时,增强多肽分泌的序列。此类控制序列的性质根据宿主生物体而不同。例如,在原核生物中,此类控制序列通常包括启动子、核糖体结合位点、和转录终止序列,而在真核生物中,通常此类控制序列包括启动子和转录终止序列。术语“控制序列”旨在包括其存在对于表达和加工而言是必需的所有组分,并且还可以包括其存在是有利的另外的组分,例如前导序列和融合配偶体序列。
药物组合物:如本文所用,术语“药物组合物”是指与一种或多种药学上可接受的载剂一起配制的活性剂。在一些实施例中,活性剂以适合于在治疗方案中施用的单位剂量存在,其显示当施用于相关群体时实现预定的治疗效果的统计学显著概率。在一些实施例中,药物组合物能以固体或液体形式被特别配制以进行施用,包括适用于以下的那些:口服施用,例如,浸液(drench)(水性或非水溶液或悬浮液)、片剂(例如针对口腔、舌下和全身吸收的那些)、丸剂、粉剂、颗粒剂、糊剂(应用于舌);肠胃外施用,例如,作为例如无菌溶液或悬浮液或持续释放的配制品通过皮下、肌内、静脉内或硬膜外注射;局部应用,例如,作为乳膏剂、软膏剂、或控制释放贴剂或喷雾剂应用于皮肤、肺或口腔;阴道内或直肠内,例如作为阴道栓剂、乳膏剂或泡沫剂;舌下;眼部;透皮;或经鼻、肺以及应用于其他粘膜表面。
药学上可接受的:如本文所用,短语“药学上可接受的”是指在合理医学判断的范围内适合于与人和动物的组织接触使用而无过多毒性、刺激、过敏反应或其他问题或并发症,与合理的效益/风险比相称的那些化合物、材料、组合物和/或剂型。
药学上可接受的载剂:如本文所用,术语“药学上可接受的载剂”意指药学上可接受的材料、组合物或媒介物,诸如液体或固体填充剂、稀释剂、赋形剂或溶剂包封材料,其涉及将主题化合物从一个器官(或身体的一部分)携带或运输到另一个器官或身体的一部分。在与配制品的其他成分相容并且对患者无害的意义上,每种载剂必须是“可接受的”。可充当药学上可接受的载剂的材料的一些实例包括:糖,诸如乳糖、葡萄糖和蔗糖;淀粉,诸如玉米淀粉和马铃薯淀粉;纤维素及其衍生物,诸如羧甲基纤维素钠、乙基纤维素和乙酸纤维素;粉状黄芪胶;麦芽;明胶;滑石;赋形剂,诸如可可脂和栓剂蜡;油,诸如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油;二醇,诸如丙二醇;多元醇,诸如甘油、山梨醇、甘露醇和聚乙二醇;酯,诸如油酸乙酯和月桂酸乙酯;琼脂;缓冲剂,诸如氢氧化镁和氢氧化铝;海藻酸;无热原水;等渗盐水;林格氏溶液;乙醇;pH缓冲溶液;聚酯、聚碳酸酯和/或聚酸酐;以及在药物配制品中采用的其他无毒相容的物质。
药学上可接受的盐:如本文所用,术语“药学上可接受的盐”是指适合于在制药环境中使用的此类化合物的盐,即,在合理医学判断的范围内,适合于与人和低等动物的组织接触使用而无不当毒性、刺激、过敏反应等并且与合理的效益/风险比相称的盐。药学上可接受的盐是本领域公知的。例如,S.M.Berge等人在J.Pharmaceutical Sciences[药物科学杂志],66:1-19(1977)中详细地描述了药学上可接受的盐。在一些实施例中,药学上可接受的盐包括但不限于无毒的酸加成盐,其是使用无机酸诸如盐酸、氢溴酸、磷酸、硫酸和高氯酸或使用有机酸诸如乙酸、马来酸、酒石酸、柠檬酸、琥珀酸或丙二酸或通过使用本领域中所使用的其他方法诸如离子交换形成的具有氨基的盐。在一些实施例中,药学上可接受的盐包括但不限于己二酸盐、藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯甲酸盐、硫酸氢盐、硼酸盐、丁酸盐、樟脑酸盐、樟脑磺酸盐、柠檬酸盐、环戊烷丙酸盐、二葡糖酸盐、十二烷基硫酸盐、乙磺酸盐、甲酸盐、富马酸盐、葡庚糖酸盐、甘油磷酸盐、葡糖酸盐、半硫酸盐(hemisulfate)、庚酸盐、己酸盐、氢碘化物、2-羟基-乙磺酸盐、乳糖酸盐(lactobionate)、乳酸盐、月桂酸盐、月桂基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、甲磺酸盐、2-萘磺酸盐、烟酸盐、硝酸盐、油酸盐、草酸盐、棕榈酸盐、双羟萘酸盐、果胶酸盐、过硫酸盐、3-苯基丙酸盐、磷酸盐、苦味酸盐、新戊酸盐、丙酸盐、硬脂酸盐、琥珀酸盐、硫酸盐、酒石酸盐、硫氰酸盐、对甲苯磺酸盐、十一酸盐、戊酸盐等。在一些实施例中,所提供的化合物(例如,寡核苷酸)包含一个或多个酸性基团,并且药学上可接受的盐是碱金属盐、碱土金属盐或铵盐(例如,N(R)3的铵盐,其中每个R在本披露中被独立地定义和描述)。代表性碱金属或碱土金属盐包括钠盐、锂盐、钾盐、钙盐、镁盐等。在一些实施例中,药学上可接受的盐是钠盐。在一些实施例中,药学上可接受的盐是钾盐。在一些实施例中,药学上可接受的盐是钙盐。在一些实施例中,药学上可接受的盐适当地包括使用平衡离子(诸如卤离子、氢氧根、羧酸根、硫酸根、磷酸根、硝酸根、具有从1至6个碳原子的烷基、磺酸根以及芳基磺酸根)形成的无毒铵、季铵以及胺阳离子。在一些实施例中,所提供的化合物包含多于一个酸性基团,例如,寡核苷酸可以包含两个或更多个酸性基团(例如,天然磷酸酯键联和/或经修饰的核苷酸间键联)。在一些实施例中,这种化合物的药学上可接受的盐(或者通常,盐)包含两个或更多个阳离子,该两个或更多个阳离子可以是相同的或不同的。在一些实施例中,在药学上可接受的盐(或一般地,盐)中,酸性基团中所有可电离氢(例如在具有不超过约11、10、9、8、7、6、5、4、3或2;在一些实施例中,不超过约7;在一些实施例中,不超过约6;在一些实施例中,不超过约5;在一些实施例中,不超过约4;在一些实施例中,不超过约3的pKa的水溶液中)被阳离子替代。在一些实施例中,每个硫代磷酸酯和磷酸酯基团独立地以其盐形式存在(例如,如果是钠盐,则分别是-O-P(O)(SNa)-O-和-O-P(O)(ONa)-O-)。在一些实施例中,每个硫代磷酸酯和磷酸酯核苷酸间键联独立地以其盐形式存在(例如,如果是钠盐,则分别是-O-P(O)(SNa)-O-和-O-P(O)(ONa)-O-)。在一些实施例中,药学上可接受的盐是寡核苷酸的钠盐。在一些实施例中,药学上可接受的盐是寡核苷酸的钠盐,其中每个酸性磷酸酯和经修饰的磷酸酯基团(例如,硫代磷酸酯,磷酸酯等)(如果有的话)以盐形式存在(所有均以钠盐)。
多肽:如本文所用,指任何氨基酸聚合链。在一些实施例中,多肽具有天然存在的氨基酸序列。在一些实施例中,多肽具有自然界中不存在的氨基酸序列。在一些实施例中,多肽具有工程化的氨基酸序列,因为它是通过人工的作用设计和/或产生的。在一些实施例中,多肽具有由自然界中不存在的序列编码的氨基酸序列(例如,工程化的序列,因为它通过人工的作用设计和/或产生以编码所述多肽)。在一些实施例中,多肽可包含天然氨基酸、非天然氨基酸或两者或由其组成。在一些实施例中,多肽可包含仅天然氨基酸或仅非天然氨基酸或由其组成。在一些实施例中,多肽可包含D-氨基酸、L-氨基酸或两者。在一些实施例中,多肽可包含仅D-氨基酸。在一些实施例中,多肽可包含仅L-氨基酸。在一些实施例中,多肽可以包括一个或多个侧基或其他修饰,例如,修饰或连接至一个或多个氨基酸侧链,在多肽的N-末端,在多肽的C-末端,或其任何组合。在一些实施例中,此类侧基或修饰可选自由以下组成的组:乙酰化、酰胺化、脂化、甲基化、聚乙二醇化等,包括其组合。在一些实施例中,多肽可以是环状的,和/或可以包含环状部分。在一些实施例中,多肽不是环状的和/或不包含任何环状部分。在一些实施例中,多肽是线性的。在一些实施例中,多肽可以是或包含钉合多肽。在一些实施例中,术语“多肽”可以附加到参考多肽、活性或结构的名称;在这种情况下,它在本文中用于指代具有相关活性或结构的多肽,因此可以被认为是相同类别或家族的多肽的成员。对于每个这样的类别,本说明书提供和/或本领域技术人员将知道该类别内的示例性多肽,其氨基酸序列和/或功能是已知的;在一些实施例中,此类示例性多肽是多肽类别或家族的参考多肽。在一些实施例中,多肽类别或家族的成员与该类别的参考多肽(在一些实施例中与该类别中的所有多肽)显示出显著序列同源性或同一性、共享共同序列基序(例如,特征性序列元件)和/或共享共同活性(在一些实施例中在可比较的水平下或在指定范围内)。例如,在一些实施例中,成员多肽显示与参考多肽的序列同源性或同一性的总体程度为至少约30-40%,并且通常大于约50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多和/或包括显示非常高的序列同一性(通常大于90%或甚至95%、96%、97%、98%或99%)的至少一个区域(例如,在一些实施例中可能是或包含特征性序列元件的保守区域)。这样的保守区通常包括至少3-4个,通常多达20个或更多个氨基酸;在一些实施例中,保守区包括至少一段至少2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多个连续氨基酸。在一些实施例中,相关多肽可包含亲本多肽的片段或由其组成。在一些实施例中,有用的多肽可以包含多个片段或由多个片段组成,其中每个片段都存在于同一亲本多肽中,且彼此之间的空间排列与目的多肽中存在的空间排列不同(例如,在亲本中直接连接的片段可以在目的多肽中空间分离,反之亦然,和/或片段可以以与亲本中不同的顺序存在于目的多肽中),因此目的多肽是其亲本多肽的衍生物。
重组体:如本文所用,意指通过重组方式设计、工程化、制备、表达、产生、制造和/或分离的多肽,例如使用转染到宿主细胞中的重组表达载体表达的多肽;从重组体组合人多肽文库中分离的多肽;从动物(例如,小鼠、兔、绵羊、鱼等)分离的多肽,其是转基因的或以其他方式被操纵以表达编码多肽或其一个或多个组分、一个或多个部分、一个或多个元件或一个或多个结构域和/或指导多肽或其一个或多个组分、一个或多个部分、一个或多个元件或一个或多个结构域的表达的一个或多个基因或基因组分;和/或通过任何其他方式制备、表达、创建或分离的多肽,所述方式包括将选定的核酸序列元件进行剪接或相互连接、化学合成选定的序列元件和/或以其他方式生成编码以下和/或指导以下的表达的核酸:多肽或其一个或多个组分、一个或多个部分、一个或多个元件或一个或多个结构域。在一些实施例中,在自然界中发现一种或多种这样的选定序列元件。在一些实施例中,用计算机模拟设计一个或多个这样的选定序列元件。在一些实施例中,一个或多个这样的选定的序列元件由已知序列元件(例如,来自天然或合成来源,例如在目的来源生物体(例如人、小鼠等的)的种系中)的诱变(例如体内或体外)产生。在一些实施例中,重组多肽具有由诱变产生的氨基酸序列(例如,体外或体内,例如,在非人动物中),使得重组多肽的氨基酸序列是这样的序列,这些序列虽然起源于多肽序列并与多肽序列相关,但可能不天然存在于非人动物的体内基因组中。
参考:如本文所用,指标准或对照药剂、动物、队列、个体、群体、样品、序列或值,目的药剂、动物、队列、个体、群体、样品、序列或值与其进行比较。在一些实施例中,参考药剂、动物、队列、个体、群体、样品、序列或值与目的药剂、动物、队列、个体、群体、样品、序列或值的测试或确定基本上同时进行测试和/或确定。在一些实施例中,参考药剂、动物、队列、个体、群体、样品、序列或值是历史参考,任选地体现在有形介质中。在一些实施例中,参考可以指对照。“参考”还包括“参考动物。”“参考动物”可具有本文所述的修饰、不同于本文所述的修饰或无修饰(即,野生型动物)。通常,如本领域技术人员所理解的,参考药剂、动物、队列、个体、群体、样品、序列或值在与用于确定或表征目的药剂、动物(例如,哺乳动物)、队列、个体、群体、样品、序列或值的条件可比较的条件下确定或表征。
替换:如本文所用,指一种过程,通过该过程,在宿主基因座(例如,在基因组中)中发现的“被替换的”核酸序列(例如,基因)被从该基因座中去除,并且不同的“替换”核酸位于其位置。在一些实施例中,被替换的核酸序列和替换核酸序列彼此可比,因为例如它们彼此同源,含有相应的元件(例如蛋白质编码元件、调节元件等)和/或具有相似或相同的序列。在一些实施例中,替换的核酸序列包括启动子、增强子、剪接供体位点、剪接受体位点、内含子、外显子、非翻译区(UTR)中的一个或多个;在一些实施例中,替换核酸序列包括一个或多个编码序列。在一些实施例中,替换核酸序列是被替换的核酸序列的同系物或变体(例如突变体)。在一些实施例中,替换核酸序列是被替换的序列的直向同源物或同系物。在一些实施例中,替换核酸序列是或包含人核酸序列。在一些实施例中,包括在替换核酸序列是或包含人核酸序列的情况下,被替换的核酸序列是或包含啮齿类动物序列(例如,小鼠或大鼠序列)。在一些实施例中,包括在替换核酸序列是或包含人核酸序列的情况下,被替换的核酸序列是或包含人序列。在一些实施例中,替换核酸序列是被替换的序列的变体或突变体(即,与被替换的序列相比包含一个或多个序列差异(例如取代)的序列)。如此放置的核酸序列可以包括一个或多个调节序列,这些调节序列是用于获得如此放置的序列的源核酸序列的一部分(例如,启动子、增强子、5'-或3'-非翻译区等)。例如,在各种实施例中,替换是用异源序列取代内源序列,导致从如此放置的核酸序列(包含异源序列)产生基因产物,但不表达内源序列;替换是用编码多肽的核酸序列替换内源基因组序列,该多肽具有与由内源序列编码的多肽相似的功能。在一些实施例中,内源非人ADAR1基因区段或其片段被人ADAR1基因区段或其片段替换。
受试者:如本文所用,术语“受试者”或“测试受试者”是指任何生物体,根据本披露向该生物体施用化合物(例如,寡核苷酸)或组合物,例如用于实验、诊断、预防和/或治疗目的。通常的受试者包括动物(例如,哺乳动物,如小鼠、大鼠、兔、非人灵长类动物、和人;昆虫;蠕虫;等)和植物。在一些实施例中,受试者是人。在一些实施例中,受试者可能患有和/或易患疾病、障碍和/或病症。
基本上:如在此所使用,指展示出目的特征或特性的总体的或接近总体的范围或程度的定性的状态。生物领域的普通技术人员应当理解的是生物学和化学现象(如果有的话)很少会达到完成和/或进行到完成或实现或避免一个绝对的结果。因此,术语“基本上”被用在此处用来获得在许多生物学和化学现象中潜在地缺少的内在的完全性。与第二序列基本上相同或互补的碱基序列与第二序列不完全相同或互补,但与第二序列大部分或几乎相同或互补。在一些实施例中,具有与另一寡核苷酸或核酸基本上互补的序列的寡核苷酸以与具有完全互补序列的寡核苷酸类似的方式与该寡核苷酸或核酸形成双链体。
基本上相似:如本文所用,是指氨基酸或核酸序列之间的比较。如本领域普通技术人员所理解的,如果两个序列在相应的位置上包含相似的残基(例如,氨基酸或核苷酸),则它们通常被认为是“基本上相似”。如本领域所理解的,虽然相似的残基可以是相同的残基(也参见下面的基本同一性),但是相似的残基也可以是具有适当可比较的结构和/或功能特征的不相同的残基。例如,如本领域普通技术人员所熟知的,某些氨基酸通常被分类为“疏水性”或“亲水性”氨基酸,和/或具有“极性”或“非极性”侧链。将一个氨基酸替换为另一个相同类型的氨基酸通常可被视为“保守”取代。下表总结了典型的氨基酸分类。
Figure BDA0004094631750000321
Figure BDA0004094631750000331
不明确的氨基酸 3字母 1字母
天冬酰胺或天冬氨酸 Asx B
谷氨酰胺或谷氨酸 Glx Z
亮氨酸或异亮氨酸 Xle J
未指定或未知的氨基酸 Xaa X
如本领域所熟知的,可以使用多种算法中的任何一种来比较氨基酸或核酸序列,包括商业计算机程序中可用的那些算法,例如用于核苷酸序列的BLASTN和用于氨基酸序列的BLASTP、缺口BLAST和PSI-BLAST。示例性的此类程序在以下中描述:Altschul,S.F.等人,1990,J.Mol.Biol.[分子生物学杂志],215(3):403-10;Altschul,S.F.等人,1996,Meth.Enzymol.[酶学方法]266:460-80;Altschul,S.F.等人,1997,Nucleic Acids Res.[核酸研究],25:3389-402;Baxevanis,A.D.和B.F.F.Ouellette(编辑)Bioinformatics:APractical Guide to the Analysis of Genes and Proteins[生物信息学:基因和蛋白质分析实用指南],Wiley,1998;和Misener等人(编辑.)Bioinformatics Methods andProtocols,Methods in Molecular Biology[生物信息学方法和方案,分子生物学方法],第132卷,胡玛纳出版社(Humana Press),1998。除了鉴定相似序列之外,上述程序通常还提供相似程度的指示。在一些实施例中,如果两个序列在相关残基区段上的相应残基中至少例如但不限于80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多是相似的(例如,相同或包括保守取代),则认为这两个序列基本上相似。在一些实施例中,相关区段是完整序列(例如基因序列、基因区段、编码结构域的序列、多肽或结构域)。在一些实施例中,相关区段是至少9、10、11、12、13、14、15、16、17或更多个残基。在一些实施例中,相关区段是至少10、15、20、25、30、35、40、45、50或更多个残基。在一些实施例中,相关区段包括沿着完整序列的连续残基。在一些实施例中,相关区段包括沿完整序列的不连续残基,例如,由多肽或其部分的折叠构象聚集在一起的不连续残基。
基本上同一性:如本文所用,是指氨基酸或核酸序列之间的比较。如本领域普通技术人员所理解的,如果两个序列在相应的位置上包含相同的残基(例如,氨基酸或核苷酸),则它们通常被认为是“基本上相同”。如本领域所熟知的,可以使用多种算法中的任何一种来比较氨基酸或核酸序列,包括商业计算机程序中可用的那些算法,例如用于核苷酸序列的BLASTN和用于氨基酸序列的BLASTP、缺口BLAST和PSI-BLAST。示例性的此类程序在以下中描述:Altschul,S.F.等人,1990,J.Mol.Biol.[分子生物学杂志],215(3):403-10;Altschul,S.F.等人,1996,Meth.Enzymol.[酶学方法]266:460-80;Altschul,S.F.等人,1997,Nucleic Acids Res.[核酸研究],25:3389-402;Baxevanis,A.D.和B.F.F.Ouellette(编辑)Bioinformatics:APractical Guide to the Analysis of Genes and Proteins[生物信息学:基因和蛋白质分析实用指南],Wiley,1998;和Misener等人(编辑.)Bioinformatics Methods and Protocols,Methods in Molecular Biology[生物信息学方法和方案,分子生物学方法],第132卷,胡玛纳出版社(Humana Press),1998。除了鉴定相同序列之外,上述程序通常还提供同一性程度的指示。在一些实施例中,如果两个序列在相关残基区段上的相应残基中至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多是相同的,则认为这两个序列是基本上相同的。在一些实施例中,相关残基区段是完整的序列。在一些实施例中,相关残基区段是,例如,但不限于,至少10、15、20、25、30、35、40、45、50、55、60、65,70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500或更多残基。
靶向构建体或靶向载体:如本文所用,是指包含靶向区域的多核苷酸分子。靶向区域包含与靶细胞、组织或动物中的序列相同或基本上相同的序列,并通过同源重组将靶向构建体整合到细胞、组织或动物的基因组内的位置。使用位点特异性重组酶识别位点(例如,loxP或Frt位点)进行靶向的靶向区域也包括在本文中并进行了描述。在一些实施例中,本文所述的靶向构建体还包含特定目的核酸序列或基因、选择标记、控制和/或调节序列,以及允许通过有助于或促进涉及此类序列的重组的蛋白质的外源添加而介导的重组的其他核酸序列。在一些实施例中,本文所述的靶向构建体进一步包含目的基因的全部或部分,其中目的基因是编码多肽的全部或部分的异源基因,该多肽可具有与由内源序列编码的蛋白质相似的功能。在一些实施例中,本文所述的靶向构建体进一步包含目的基因的全部或部分,其中目的基因是编码多肽的全部或部分的异源基因,该多肽与由内源序列编码的蛋白质相比具有一种或多种不同的功能。在一些实施例中,如本文所述的靶向构建体进一步包含人源化目的基因的全部或部分,其中该目的人源化基因编码多肽的全部或部分,该多肽可具有与由内源序列编码的多肽相似的功能。在一些实施例中,如本文所述的靶向构建体进一步包含人源化目的基因的全部或部分,其中该目的人源化基因编码多肽(例如,人ADAR1)的全部或部分,该多肽与由内源序列编码的多肽(例如,小鼠ADAR1)相比具有一个或多个不同的功能。在一些实施例中,靶向构建体(或靶向载体)可包含通过人工操纵的核酸序列。例如,在一些实施例中,可以构建靶向构建体(或靶向载体)以包含工程化或重组的多核苷酸,所述多核苷酸包含两个或更多个序列,这些序列在自然界中并未按该顺序连接在一起,但可通过人工进行操纵在工程化或重组的多核苷酸中彼此直接连接。
治疗剂:如本文所用,术语“治疗剂”通常是指当施用于受试者时引起期望的作用(例如,期望的生物学、临床或药理作用)的任何药剂。在一些实施例中,如果药剂在整个合适群体中表现出统计学上显著的作用,则认为该药剂是治疗剂。在一些实施例中,合适的人群是患有和/或易患疾病、障碍或病症的受试者的群体。在一些实施例中,合适的群体是模型生物的群体。在一些实施例中,可以通过一项或多项标准来定义合适的群体,这些标准诸如为年龄组、性别、遗传背景、在接受疗法之前预先存在的临床病症。在一些实施例中,当以有效量向受试者施用时,治疗剂是减轻以下,改善以下,缓解以下,抑制以下,预防以下,延迟以下的发作,降低以下的严重性和/或降低以下的发生率的物质:受试者中的疾病、障碍和/或病症的一种或多种症状或特征。在一些实施例中,“治疗剂”是在可以被销售施用于人之前已经或需要被政府机构批准的药剂。在一些实施例中,“治疗剂”是需要药物处方才能施用于人的药剂。在一些实施例中,治疗剂是所提供的化合物,例如所提供的寡核苷酸。
治疗有效量:如本文所用,术语“治疗有效量”意指当作为治疗方案的一部分施用时引发所希望的生物反应的物质(例如,治疗剂、组合物和/或配制品)的量。在一些实施例中,物质的治疗有效量是当施用于患有或易患疾病、障碍和/或病症的受试者时,足以治疗、诊断、预防、和/或延迟疾病、障碍和/或病症的发作的量。如本领域的普通技术人员将理解,物质的有效量可取决于以下这类因素变化:如所希望的生物学终点、待递送的物质、靶细胞或组织等。例如,用于治疗疾病、障碍和/或病症的配制品中化合物的有效量是缓解、改善、减轻、抑制、预防、延迟疾病、障碍和/或病症的一种或多种症状或特征的发作,降低疾病、障碍和/或病症的一种或多种症状或特征的严重程度,和/或降低疾病、障碍和/或病症的一种或多种症状或特征的发病率的量。在一些实施例中,以单个剂量施用治疗有效量;在一些实施例中,需要多个单位剂量来递送治疗有效量。
转基因或转基因构建体:如本文所用,指核酸序列(编码,例如目的多肽的全部或部分),其已通过人工例如通过本文描述的方法引入细胞中。转基因可以是部分地异源的或完全地异源的,即对于引入它的经遗传工程化的动物或细胞来说是外来的。转基因可以包括一个或多个转录调节序列和任何其他核酸,例如内含子或启动子,其对于所选核酸序列的表达可能是必需的。
治疗:如本文所用,术语“治疗(treat、treatment、或treating)”是指用于部分地或完全缓解、改善、减轻、抑制、预防、延迟疾病、障碍和/或病症的一种或多种症状或特征的发作,降低疾病、障碍和/或病症的一种或多种症状或特征的严重程度,和/或降低疾病、障碍和/或病症的一种或多种症状或特征的发生率的任何方法。治疗可以施用于未表现出疾病、障碍和/或病症的迹象的受试者。在一些实施例中,治疗可以施用给仅表现出疾病、障碍和/或病症的早期迹象的受试者,例如出于降低与疾病、障碍和/或病症相关联的病理学风险的目的。
载体:如本文所用,指能够转运与其相关联的另一核酸的核酸分子。在一些实施例中,载体能够在宿主细胞如真核和/或原核细胞中进行染色体外复制和/或表达它们所连接的核酸。能够指导可操作地连接的基因的表达的载体在本文中称为“表达载体”。
野生型:如本文所用,指具有在“正常”(与突变、患病、改变、工程化、转基因等相对)状态或背景下自然界中发现的结构和/或活性的实体。本领域普通技术人员将理解,野生型基因和多肽通常以多种不同形式(例如,等位基因)存在。
如本领域技术人员将理解的,本文描述的涉及提供的化合物和/或提供的化合物的表征(例如,寡核苷酸)的方法和组合物通常也适用于此类化合物的药学上可接受的盐
具体实施方式
除其他外,本披露包括以下认识:某些动物(例如小鼠)及其细胞可能不容易用作评估用于核酸编辑(例如编辑转录物中的腺苷(例如,那些G至A的突变))的药剂和组合物的模型。例如,在一些实施例中,可以在人体系统(例如,人细胞)中提供活性的药剂和组合物在动物(例如小鼠)中表现出没有活性或大大降低的活性,该动物的内源ADAR蛋白可能与人ADAR蛋白显著不同。
在一些实施例中,本披露提供工程化的动物及其细胞,其中动物被工程化以包含或表达ADAR1多肽或其特征性部分,和/或编码此类ADAR1多肽或其特征性部分的多核苷酸。在一些实施例中,在将此类ADAR1多肽或其特征性部分引入工程化的动物或细胞后,与未如此工程化的动物或细胞相比,当施用编辑剂例如寡核苷酸时,工程化的动物或细胞可证明一个或多个靶的编辑水平增加。在一些实施例中,一个或多个靶的编辑水平与在参考人细胞(例如相同类型的细胞)中观察到的水平可比较、相关或平行。本领域技术人员理解,各种药剂,包括本文所述的各种寡核苷酸组合物,可在人细胞中提供编辑,并可用于评估特定ADAR1多肽或其特征性部分是否适用于工程化动物或细胞(例如,基于在表达此类ADAR1多肽或其特征性部分的工程化的动物或细胞中观察到的编辑水平),动物或细胞是否应被工程化(例如,将各种药剂在这些动物或细胞中的活性与在人系统中观察到的活性进行比较),或者工程化的动物或细胞是否适合评估用于编辑活动的药剂活性(例如,在这样的动物或细胞中评估各种药剂(包括活性和/或非活性药剂)并与在人系统中观察到的活性进行比较)。
如本文所述,在一些实施例中,ADAR1多肽或其特征性部分是或包含灵长类动物(例如人)ADAR1的一个或多个或所有以下结构域:Z-DNA结合结构域、dsRNA结合结构域和脱氨酶结构域。在一些实施例中,ADAR1多肽或其特征性部分是或包含灵长类动物(例如人)ADAR1 Z-DNA结合结构域中的一者或两者;替代性地或另外地,在一些实施例中,ADAR1多肽或其特征性部分是或包含灵长类动物(例如人)ADAR1 dsRNA结合结构域中的一者、两者或全部;替代性地或另外地,ADAR1多肽或其特征性部分是或包含灵长类动物(例如人)脱氨酶结构域。在一些实施例中,灵长类动物(例如人)ADAR1多肽或其特征性部分可与非灵长类动物(例如啮齿类动物例如小鼠)ADAR1多肽或其特征性部分一起表达,例如一个或多个人dsRNA结合结构域可经工程化为与小鼠ADAR1脱氨酶结构域一起表达以形成人-小鼠杂合ADAR1多肽。在一些实施例中,ADAR1多肽或其特征性部分是或包含非灵长类动物(例如啮齿类动物(例如小鼠))ADAR1,其中非灵长类动物ADAR1是经改造化使其一个或多个结构域被一个或多个相应的灵长类动物(例如,人)ADAR1结构域(例如,Z-DNA结合结构域、dsRNA结合结构域和/或脱氨酶结构域)替换。在一些实施例中,ADAR1多肽或其特征性部分是或包含人ADAR1。在一些实施例中,ADAR1多肽或其特征性部分是或包含人ADAR1 p110。在一些实施例中,ADAR1多肽或其特征性部分是人ADAR1 p110。在一些实施例中,ADAR1多肽或其特征性部分是或包含人ADAR1 p150。在一些实施例中,ADAR1多肽或其特征性部分是人ADAR1 p150。
在一些实施例中,ADAR1多肽或其特征性部分是或包含与灵长类动物,例如人ADAR1或其特征性部分共享约80%-100%、例如约或至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%同一性的序列。在一些实施例中,ADAR1多肽或其特征性部分是或包含与人ADAR1的一个或多个结构域共享约80%-100%、例如约或至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%同一性的序列。在一些实施例中,无论氨基酸序列同源性如何,ADAR1多肽或其特征性部分包含与人ADAR1的特征性部分和/或一个或多个结构域共享一种或多种功能的序列或结构。在一些实施例中,一个或多个结构域是或包含一个或多个Z-DNA结合结构域。在一些实施例中,一个或多个结构域是或包含一个或多个或所有dsRNA结合结构域。在一些实施例中,一个或多个结构域是或包含脱氨酶结构域。
在一些实施例中,动物是啮齿类动物。在一些实施例中,动物是大鼠。在一些实施例中,动物是小鼠。
除其他外,本披露提供了这样的见解,即可以利用非人动物中作用于RNA1(ADAR1)的人腺苷脱氨酶的表达来生成可用于评估和表征用于各种应用(包括治疗用途)的各种编辑剂(例如寡核苷酸)的模式生物。除其他外,与未如此工程化的动物相比,这种动物在对编辑剂诸如寡核苷酸的反应中可产生更类似于人系统中的增强的RNA编辑。此类编辑剂例如寡核苷酸可用于改变靶RNA的功能性(例如编码序列、调节元件等)序列。在一些实施例中,如本文所述的工程化的非人动物可以提供用于评估编辑剂和/或开发人治疗剂的有效且高效的平台。在一些实施例中,本披露提供了能够表达用于RNA编辑的人ADAR1的经遗传修饰的非人动物。
除其他外,本披露认识到,各种试剂(包括用于非人动物中定点RNA编辑的寡核苷酸)的表征面临各种挑战,因为在人细胞中引发稳健的RNA编辑事件的药剂(例如寡核苷酸)可能无法在非人模型(例如啮齿类动物,例如大鼠或小鼠)中产生可比较的效果。例如,使用寡核苷酸(其利用内源小鼠ADAR1对UGP2进行定点编辑)处理的小鼠通常无法产生与在人细胞系中观察到的编辑反应可比较的编辑反应(参见图24和25)。本披露进一步认识到,在非人动物中产生人ADAR1(huADAR1)可以提供重要的体内数据,用于表征与异常RNA编辑相关的特定编辑事件、药剂和/或疾病。
根据本披露,可以利用各种技术将ADAR1多肽或其特征性部分掺入细胞和非人动物中,例如,通过引入多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。在一些实施例中,将多核苷酸引入细胞和非人动物的基因组中。在一些实施例中,将多核苷酸引入细胞和非人动物的种系基因组中。如本领域技术人员所理解的,可以根据本披露利用用于产生转基因啮齿类动物(例如小鼠或大鼠)的各种技术。在一些实施例中,转基因啮齿类动物(例如小鼠或大鼠)是通过将多核苷酸进行原核注射到啮齿类动物(例如小鼠或大鼠)胚胎的单个细胞(例如受精卵)中产生的,其中多核苷酸将整合到啮齿类动物(例如,小鼠)基因组中(例如,可能随机的和/或以定点方法)。在一些实施例中,该方法产生转基因啮齿类动物(例如小鼠或大鼠)并用于将新的遗传信息插入基因组或过度表达内源基因。在某些实施例中,该方法还允许替换、缺失和/或修饰内源啮齿类动物基因。在一些实施例中,产生转基因啮齿类动物的替代方法包括用含有DNA序列的DNA构建体修饰胚胎干细胞(例如,用于随机基因组插入和/或以定点方式)。选择与基因组DNA重组的胚胎干细胞,然后将其注射到小鼠囊胚中。在一些实施例中,产生转基因啮齿类动物的替代方法涉及使用Cre-Lox重组技术的位点特异性重组,该技术涉及在重组酶的帮助下靶向和剪接特定基因。Cre在特定细胞类型中表达,从而产生靶向的基因的细胞类型特异性缺失。该方法需要将Cre小鼠与floxed(用loxP序列夹住靶向读段基因)小鼠交配,以产生在特定细胞类型中缺失靶向的基因的条件性基因敲除小鼠
除其他外,本披露证明当施用各种编辑剂,例如寡核苷酸时,包含和/或表达ADAR1多肽或其特征性部分(例如,人ADAR1(例如,p110))的工程化的细胞和/或非人动物(例如小鼠)与未如此进行工程化的细胞和/或非人动物相比可以出乎意料地提供与在人细胞中观察到的那些更相似或更相关的编辑(例如,在质量和/或数量、或多种因子/条件的模式/趋势等方面)。在一些实施例中,此类细胞和非人动物令人惊讶地可用于评估、表征、鉴定和/或开发各种编辑剂,例如,各种靶向腺苷的寡核苷酸。
在一些实施例中,本披露提供了表达编码huADAR1的转录物(包括高度相关的转录物变体4(编码ADAR1 p110蛋白)和转录物变体1(编码ADAR1 p150蛋白)编码序列)的经遗传修饰的非人动物(例如,啮齿类动物,例如,小鼠)。
在一些实施例中,用于产生表达(例如人或非人灵长类动物的)ADAR1或其特征性部分的非人动物的方法在本文中被表征。在一些实施例中,本文描述了利用所述转基因动物的方法。
在一些实施例中,表达灵长类动物例如人ADAR1多肽或其特征性部分的细胞和非人动物(例如啮齿类动物,例如大鼠或小鼠)有用于表征、鉴定和/或开发各种药剂,例如,寡核苷酸,其可以指导靶序列或其产物中的G至A突变的校正,例如通过ADAR介导的脱氨作用。在一些实施例中,所提供的药剂,例如寡核苷酸,可以通过募集人ADAR1(huADAR1)并促进ADAR介导的脱氨作用而经由ADAR介导的脱氨作用指导靶序列或其产物中G至A的突变的校正。然而,无论如何,本披露不限于任何特定机制。在一些实施例中,本披露提供了非人动物(例如啮齿类动物,例如大鼠或小鼠)、寡核苷酸、组合物、方法等,其可用于表征各种RNA代谢相关途径,例如但不限于:双链RNA干扰、单链RNA干扰、RNA酶H介导的敲低、翻译的空间位阻、先天免疫和/或两种或多种此类途径的组合。
在一些实施例中,描述了表征适合于指导位点特异性ADAR1编辑的寡核苷酸的方法。在一些实施例中,寡核苷酸可以含有不是为互补性而设计的部分(例如,环、蛋白结合序列等,用于募集蛋白,例如ADAR)。在一些实施例中,表征的寡核苷酸可以与其靶核酸(例如,前体mRNA、成熟mRNA等)杂交。在一些实施例中,寡核苷酸可以在RNA加工的任何阶段与靶RNA序列核酸(包括但不限于前体mRNA或成熟mRNA)杂交。在一些实施例中,寡核苷酸可与核酸或其互补序列的任何元件杂交,包括但不限于:启动子区域、增强子区域、转录终止区域、翻译起始信号、翻译终止信号、编码区域、非编码区域、外显子、内含子、内含子/外显子或外显子/内含子连接,5'UTR或3'UTR。
作用于RNA的腺苷脱氨酶
据报道,腺苷到肌苷(A-到-I)的修饰是人中最常见的mRNA相关碱基修饰之一,估计约有160万个编辑位点分布在人转录组中。RNA的A-到-I编辑导致腺苷脱氨为肌苷。肌苷通常可以被各种细胞机器解释为鸟苷,从而改变转录物的编码、折叠、剪接和/或运输。据报道,内源性A-到-I编辑受到严格调节,并且这种修饰过程是由高度保守的酶家族(称为作用于RNA的腺苷脱氨酶(ADAR))进行的,据报道这些酶在整个后生动物界都很活跃并且据报道它们对某些哺乳动物的生存至关重要。据报道,改变的编辑可能对人健康产生严重后果,并可能导致影响干扰素病、神经系统疾病、心血管疾病和癌症进展。有报道称ADAR酶家族被认为是高度保守的,许多ADAR遵循相似的结构布局,具有可变数量的氨基(N)末端双链RNA结合结构域(dsRBD)和羧基(C)末端脱氨酶结构域。除了规范结构域外,人ADAR1还包含一个或两个Z-DNA结合结构域。在人中,存在三个已知的编码功能性ADAR酶的基因座:ADAR1、ADAR2和非催化活性的ADAR3。
在人和许多真核生物中,据报道,作用于RNA 1(ADAR1)的腺苷脱氨酶负责大部分RNA编辑事件,据报道,ADAR1介导的RNA编辑在抗病毒免疫中发挥重要作用,并且可能是区分内源性和病毒性RNA所必需的,从而预防自身免疫性疾病。在人中,据报道ADAR1蛋白具有两种主要的同种型(通常称为长p150和短p110),它们是由可变启动子和起始密码子产生的。ADAR1 p150据报道由干扰素诱导,而ADAR1 p110据报道相对普遍表达。
在一些实施例中,ADAR可以结合dsRNA靶标并以进行性方式起作用,依次使某些腺苷脱氨。在一些实施例中,ADAR可以结合dsRNA靶标并以特异性和精确的方式起作用以仅编辑某些腺苷。通过使用治疗剂外源性地指导内源ADAR1介导的A-到-I RNA编辑功能可用于纠正RNA水平的基因组突变,也可用于调节肿瘤抗原性。在一些实施例中,可以通过使用外源提供的寡核苷酸(例如RNA和/或其经修饰形式)将ADAR酶引导至某些RNA序列。在一些实施例中,所提供的寡核苷酸的滴定可能导致定点RNA编辑水平的响应性变化。
寡核苷酸和寡核苷酸组合物
在一些实施例中,能够提供编辑(例如A到I编辑)的药剂是寡核苷酸药剂。在一些实施例中,以下寡核苷酸和组合物描述于本披露中。在一些实施例中,组合物是手性受控的寡核苷酸组合物。在寡核苷酸的手性控制的寡核苷酸组合物中,与寡核苷酸的立体随机制备相比,组合物富集寡核苷酸。如本文所证明的,寡核苷酸及其组合物在施用给包含或表达合适的ADAR1多肽或其特征性部分的细胞和/或动物时可以提供腺苷编辑。在一些实施例中,寡核苷酸及其组合物可用于评估/表征ADAR1多肽或其特征性部分,或经工程化为表达ADAR1多肽或其特征性部分的细胞或非人动物。在一些实施例中,评估和/或表征包括比较经工程化为包含或表达ADAR1多肽或其特征性部分的细胞和/或动物、未如此经工程化的细胞和/或动物和/或相应人系统(例如,可比较的细胞和/或组织,(例如,相同类型的细胞和/或组织),等等)中的编辑水平。在一些实施例中,特别有用的是ADAR1多肽或其特征性部分,以及经工程化为包含和/或表达此类ADAR1多肽或其特征性部分的细胞和非人动物,它们可提供与对应的人系统(例如,定性和/或定量地)相似或可比较的编辑水平、谱、模式等(来自一种或多种药剂),特别是当与在工程化之前表达的对应的ADAR1多肽或其特征部分或在工程化之前的细胞和非人动物相比时更相似或更可比较。
表1-某些有用的寡核苷酸和组合物如下所述:
Figure BDA0004094631750000431
Figure BDA0004094631750000441
注意事项:
表1(例如,表1A、表1B和表1C)中的描述、碱基序列和立体化学/键联因其长度而可能分为多行。除非另有说明,否则表1中的所有寡核苷酸均为单链的。如本领域技术人员所理解的,除非另外指明(例如,用r、m、m5、eo等),否则核苷单元是未修饰的并且含有未修饰的核碱基和2'-脱氧糖;除非另外指明,否则键联是天然磷酸酯键联;酸性/碱性基团独立地可以盐的形式存在。如果未指定糖,则糖是天然DNA糖;并且如果未指定核苷酸间键联,则核苷酸间键联是天然磷酸酯键联。烷基部分和修饰:
m:2'-OMe;
f:2'-F;
O、PO:磷酸二酯(磷酸酯)。其可以是键联或是末端基团(或其组分),例如接头与寡核苷酸链之间的键联、核苷酸间键联(天然磷酸酯键联)等。磷酸二酯通常在立体化学/键联列中以“O”指示而通常不在描述列中标记(如果其为末端基团,例如5'末端基团,则其在描述中指示而通常不在立体化学/键联列中指示);如果在描述列中未指示键联,则除非另外指明,否则其通常是磷酸二酯。注意,接头(例如,L001)与寡核苷酸链之间的磷酸酯键联可以不在描述列中标记,但可以在立体化学/键联列中用“O”指示;
*、PS:硫代磷酸酯。它可以是末端基团(如果其为末端基团,例如5'末端基团,则在描述列中指示而通常不在立体化学/键联中指示),或键联,例如,接头(例如,L001)与寡核苷酸链之间的键联、核苷酸间键联(硫代磷酸酯核苷酸间键联)等;
R、Rp:呈Rp构象的硫代磷酸酯。注意,描述中的*R表示呈Rp构型的单个硫代磷酸酯键联;
S、Sp:呈Sp构象的硫代磷酸酯。注意,描述中的*S表示呈Sp构型的单个硫代磷酸酯键联;
X:立体随机硫代磷酸酯;
n001:
Figure BDA0004094631750000451
nX:立体随机n001;
nR或n001R:呈Rp构型的n001;
nS或n001S:呈Sp构型的n001;
Mod001:
Figure BDA0004094631750000461
L001:-NH-(CH2)6-接头(C6接头、C6胺接头或C6氨基接头),其通过-NH-连接到Mod(例如,Mod001),并且在例如WV-38697的情况下,通过磷酸酯键联(O或PO)连接到寡核苷酸链的5'末端。例如,在WV-38697中,L001通过-NH-(形成酰胺基团-C(O)-NH-)连接到Mod001,并且通过磷酸酯键联(O)连接到寡核苷酸链。
工程化的动物、细胞和组织
提供了非人动物,其被工程化以包含和/或表达外源ADAR1多肽或其特征性部分(例如,其体细胞和/或种系组织包含多核苷酸,其序列编码ADAR1多肽或其中的特征性部分)。在一些实施例中,所提供的细胞、组织或非人动物的基因组中的编码外源ADAR1多肽或其特征性部分的多核苷酸。在一些实施例中,这样的多核苷酸是非人动物的种系基因组。在本文所述的各种实施例中,经遗传修饰的非人动物是啮齿类动物,例如大鼠或小鼠,并且本文描述的非人元件(增强子、恒定区等)是啮齿类动物,例如大鼠或小鼠元件。本文所述的非人动物的合适实例包括但不限于啮齿类动物,例如大鼠或小鼠,特别是小鼠。
在一些实施例中,本披露提供改善的体内系统,用于鉴定和开发新药剂和/或表征已知药剂,例如寡核苷酸,用于体内和/或体外由ADAR1介导的定点RNA编辑。例如,开发的寡核苷酸可用于治疗影响人的各种疾病。此外,本披露包括认识到具有工程化的人ADAR1基因座例如工程化的人ADAR1的非人动物(例如啮齿类动物,例如大鼠或小鼠)是有用的。在一些实施例中,本文所述的非人动物提供改善的体内系统,用于开发寡核苷酸或基于寡核苷酸的治疗剂以施用于人。在一些实施例中,本文所述的非人动物提供改善的体内系统,用于开发与以不包含人ADAR1编码区序列的现有体内啮齿类动物系统为特征的寡核苷酸或基于寡核苷酸的治疗剂相比以改善的和/或不同的性能(例如靶RNA编辑水平)为特征的寡核苷酸或基于寡核苷酸的治疗剂。
除其他外,本披露提供非人动物(例如,啮齿类动物,例如,大鼠或小鼠)、非人(例如,啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织,其具有经工程化为包括人ADAR1编码区或其特征性部分的内源基因座。在一些实施例中,人ADAR1编码区的序列可操作地连接至非人调节区。
除其他外,本披露提供非人动物(例如,啮齿类动物,例如,大鼠或小鼠)、非人(例如,啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织,其具有经工程化为包括非人灵长类动物(NHP)ADAR编码区或其特征性部分的内源基因座。在一些实施例中,NHP ADAR编码区的序列可操作地连接至非人调节区。
在一些实施例中,非人ADAR基因是或包含选自下组的哺乳动物ADAR基因,该组由以下组成:灵长类动物、山羊、绵羊、猪、狗、牛或啮齿类动物(例如大鼠或小鼠的)ADAR基因。
在一些实施例中,非人ADAR是或包含灵长类动物ADAR1多肽或其特征性部分。
在一些实施例中,本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织在其基因组中包含内源ADAR1基因(例如其种系基因组),该内源ADAR1基因编码ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段。在一些实施例中,本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织在其基因组中包含内源ADAR1基因(例如其种系基因组),该内源ADAR1基因不再以WT方式起作用,例如,它被缺失、替换和/或突变以产生亚等位基因和/或零等位基因。在一些实施例中,本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织在其基因组中包含另外的ADAR1基因(例如其种系基因组),该另外的ADAR1基因编码另外的啮齿类动物ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段。在一些实施例中,工程化的动物或其细胞不包含或不表达其野生型ADAR1。在一些实施例中,在工程化的动物或其细胞中,其原始ADAR1被描述的ADAR1多肽或其特征性部分(例如包含灵长类动物例如人ADAR1多肽或其特征性部分)所替换。
在一些实施例中,工程化的非人动物或其细胞包含或表达ADAR1多肽,该多肽包含灵长类动物的一个或多个结构域,例如人ADAR1或其特征性元件序列。
在一些实施例中,工程化的细胞、组织或非人动物包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸。在一些实施例中,此类多核苷酸包含一个或多个内含子。在一些实施例中,由此类多核苷酸编码的多肽包含灵长类动物例如人ADAR1的一个或多个结构域或特征性部分。在一些实施例中,由此类多核苷酸编码的多肽包含一个或多个部分,该一个或多个部分可以执行灵长类动物例如人ADAR1的一个或多个结构域或特征性部分的一种或多种功能,其中一种或多种功能不能由一个或多个相应的小鼠部分执行,或者不能以可比较的水平执行。在一些实施例中,由此类多核苷酸编码的多肽可以执行灵长类动物例如人ADAR1的一个或多个结构域或特征性部分的一种或多种功能,其中一种或多种功能不能由相应的小鼠ADAR1执行,或者不能以可比较的水平执行。
在一些实施例中,由此类多核苷酸编码的多肽包含一个或多个部分,该一个或多个部分独立地与灵长类动物例如人ADAR1(例如,人ADAR1 p110)的一个或多个结构域或特征性部分具有一定水平的同源性。在一些实施例中,此类编码的多肽包含一个或多个部分,与未如此工程化的细胞、组织、动物等中的ADAR1部分相比,该一个或多个部分独立地与灵长类动物例如人ADAR1(例如,人ADAR1 p110)的一个或多个结构域或特征性部分具有更高水平的同源性。在一些实施例中,同源性是大约或至少约50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,同源性是大约或至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,同源性是约或至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,同源性是约或至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
在一些实施例中,由此类多核苷酸编码的多肽与灵长类动物例如人ADAR1(例如人ADAR1 p110)具有一定水平的同源性。在一些实施例中,与未如此工程化的细胞、组织、动物等中的ADAR1相比,此类编码的多肽与灵长类动物例如人ADAR1(例如,人ADAR1 p110)具有更高水平的同源性。在一些实施例中,同源性是大约或至少约50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,同源性是大约或至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,同源性是约或至少约85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在一些实施例中,同源性是约或至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。
在一些实施例中,本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织在其基因组中包含外源ADAR1基因(例如其种系基因组),该外源ADAR1基因编码人ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段。在一些实施例中,本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织在其基因组中包含外源ADAR1基因(例如其种系基因组),该外源ADAR1基因编码非人灵长类动物(NHP)ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段。在一些实施例中,本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织在其基因组中包含外源ADAR1基因(例如其种系基因组),该外源ADAR1基因编码嵌合ADAR1多肽(例如包含来自多于一个物种的特征,即衍生自人ADAR1基因的腺苷脱氨酶结构域和衍生自NHP ADAR1基因的一个或多个双链RNA结合结构域)、其功能性直向同源物、功能性同系物或功能片段。
在一些实施例中,编码多肽、其功能性直向同源物、功能性同系物或功能片段的外源ADAR1基因从内源ADAR1基因座表达。在一些实施例中,如本文所述的经遗传修饰的非人动物中的外源ADAR1基因并非源自该特定非人动物(例如,包含人ADAR1基因或NHP ADAR1的小鼠基因)。在一些实施例中,本文所述的非人动物包括异位外源ADAR1基因。如本文所用,“异位”ADAR1基因座是指与出现在野生型非人动物中的内源ADAR1基因处于不同环境中的ADAR1基因座。例如,外源ADAR1基因可能位于不同的染色体上,位于不同的基因座,或位于不同的序列附近。示例性异位外源ADAR1基因是位于安全港基因座(例如,ROSA26基因座、H11基因座、TIGRE基因座和/或MYH9基因座)内的人ADAR1 p110或p150编码基因座。在一些实施例中,本文所述的非人动物包括插入的或整合的ADAR1基因。
在一些实施例中,本文所述的非人动物、非人细胞或非人组织包括在其基因组(例如,其种系基因组)中插入一个或多个编码一个或多个人ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的核苷酸序列。
在一些实施例中,本文所述的非人动物、非人细胞或非人组织包括在其基因组(例如,其种系基因组)中插入一个或多个编码一个或多个NHP ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的核苷酸序列。
在一些实施例中,编码一个或多个ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列被插入和/或位于与内源小鼠ADAR1基因座相同的染色体上。在一些实施例中,编码一个或多个人ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列被插入和/或位于与内源小鼠ADAR1基因座相同的染色体上。在一些实施例中,编码一个或多个人ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列被插入和/或位于的位置使得编码一个或多个人ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列与内源小鼠ADAR1基因邻接。在一些实施例中,编码一个或多个人ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列被插入和/或位于的位置使得编码一个或多个人ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列与内源小鼠ADAR1基因相邻。在一些实施例中,编码一个或多个人ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列被插入和/或位于的位置使得编码一个或多个人ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列在功能上替代内源小鼠ADAR1基因。
在一些实施例中,编码一个或多个ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列被插入和/或位于与内源小鼠ADAR1基因座相同的染色体上。在一些实施例中,编码一个或多个NHP ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列被插入和/或位于与内源小鼠ADAR1基因座相同的染色体上。在一些实施例中,编码一个或多个NHP ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列被插入和/或位于的位置使得编码一个或多个NHP ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列与内源小鼠ADAR1基因邻接。在一些实施例中,编码一个或多个NHP ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列被插入和/或位于的位置使得编码一个或多个NHP ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列与内源小鼠ADAR1基因相邻。在一些实施例中,编码一个或多个NHPADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列被插入和/或位于的位置使得编码一个或多个NHP ADAR1多肽、其功能性直向同源物、功能性同系物或功能片段的一个或多个核苷酸序列在功能上替代内源小鼠ADAR1基因。
在一些实施例中,本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织包含外源ADAR1基因,该外源ADAR1基因响应于外源提供的潜在治疗性寡核苷酸恢复或增强了的ADAR活性。在一些实施例中,外源ADAR1基因响应于寡核苷酸将ADAR编辑活性恢复到与包括功能性内源ADAR1基因的人细胞和/或组织中的水平可比较的水平。在一些实施例中,外源ADAR1基因响应于寡核苷酸将ADAR编辑活性恢复到略低于包括功能性内源ADAR1基因的人细胞和/或组织中的水平。在一些实施例中,外源ADAR1基因响应于寡核苷酸将ADAR编辑活性恢复到低于包括功能性内源ADAR1基因的人细胞和/或组织中的水平。
在一些实施例中,本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织包含外源ADAR1基因,该外源ADAR1基因与不含该外源ADAR1基因的WT动物相比时响应于外源提供的潜在治疗性寡核苷酸增强了ADAR活性。在一些实施例中,外源ADAR1基因响应于寡核苷酸促进ADAR编辑活性至显著高于在不表达外源ADAR1基因的非人动物、组织和/或细胞中发现的水平。在一些实施例中,外源ADAR1基因将ADAR活性增强至不包括外源ADAR1基因的可比WT动物的ADAR活性的至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍或至少10倍的水平。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织是外源ADAR1基因纯合或杂合的(例如,如本文所述,整合在已知或随机位点)。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在ROSA26基因座处的外源ADAR1基因是纯合或杂合的。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在H11基因座处的外源ADAR1基因是纯合或杂合的。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在TIGRE基因座处的外源ADAR1基因是纯合或杂合的。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在MYH9基因座处的外源ADAR1基因是纯合或杂合的。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在位于易于使用Cre-Lox P和/或Flp-FRT进行操纵的基因座处的外源ADAR1基因是纯合或杂合的;参见例如,Kim等人,“Mouse Cre-LoxPsystem:general principles to determine tissue-specific roles of target genes[小鼠Cre-LoxP系统:确定靶基因组织特异性作用的一般原则]”Laboratory AnimalResearch[实验动物研究](2018)34(4),147-159。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在Cre-Lox P终止或诱导型loxP-Cre位点处的外源ADAR1基因是纯合或杂合的。在某些这样的实施例中,当与在组织特异性启动子下具有Cre的小鼠杂交时,所述基因座可以在转基因动物中产生组织特异性外源ADAR1表达。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在与诱导型启动子(例如四环素响应元件、雌激素受体靶向基序,和/或在他莫昔芬的控制下)可操作地连接的位点处的外源ADAR1基因是纯合或杂合的。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在与普遍表达型启动子(例如CMV、SV40、延伸因子1α、CBA/CAGG、泛素C和/或磷酸甘油酸激酶1)可操作地连接的位点处的外源ADAR1基因是纯合或杂合的。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在已知位点处的外源ADAR1基因是纯合或杂合的。在某些实施例中,外源ADAR1基因的整合通过使用基因编辑工具如核酸内切酶来促进。在某些实施例中,使用靶向已知基因座的CRISPR/Cas9促进外源ADAR1基因整合。在某些实施例中,使用靶向已知基因座的TALEN促进外源ADAR1基因整合。在某些实施例中,使用靶向已知基因座的锌指核酸酶促进外源ADAR1基因整合。
在提供的非人动物(例如啮齿类动物,例如大鼠或小鼠)、非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的一些实施例中,内源ADAR1基因座被全部地或部分地缺失。在提供的非人动物、非人细胞或非人组织的一些实施例中,内源ADAR1基因座在功能上沉默或在其他方面非功能性的(例如,通过基因靶向)。在提供的非人动物、非人细胞或非人组织的一些特定实施例中,该非人动物、非人细胞或非人组织对于功能性沉默的或在其他方面非功能性的内源ADAR1基因座是纯合的。在一些实施例中,非人动物(例如啮齿类动物,例如大鼠或小鼠)、非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织不能可检测地表达内源ADAR1多肽。在提供的非人动物(例如啮齿类动物,例如大鼠或小鼠)、非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的一些实施例中,内源ADAR1基因座是完整的并且是至少部分功能性的。
在一些实施例中,如本文所述的非人动物、非人细胞或非人组织具有进一步包含编码外源ADAR1的可操作地连接至转录和/或翻译调节元件的核酸序列的基因组。
在一些实施例中,转录控制元件包括剪接受体元件、科扎克序列、WPRE序列、聚(A)信号序列和/或其任何组合。
在一些实施例中,用如本文所述的一个或多个外源ADAR1基因序列改变、置换、破坏、缺失、替换或工程化的非人ADAR1基因座是鼠ADAR1基因座。在一些实施例中,将如本文所述的一个或多个人ADAR1基因序列插入到所述非人ADAR1基因座的两个拷贝的一个非人ADAR1基因座拷贝(即,等位基因)中,从而产生相对于ADAR1基因座序列杂合的非人动物(例如,其中一个拷贝来自外源ADAR1基因,另一个拷贝来自内源ADAR1基因座)。在一些实施例中,提供了一种非人动物,其对于包括如本文所述的一个或多个ADAR1序列的外源ADAR1基因是纯合。
在一些实施例中,内源非人ADAR1基因座的一个或多个内源非人ADAR1序列(或其部分)未被缺失。在一些实施例中,内源非人ADAR1基因座的一个或多个内源ADAR1序列(或其部分)被缺失。在一些实施例中,内源非人ADAR1基因座的一个或多个内源非人ADAR1序列被改变、置换、破坏、缺失或替换,使得所述非人ADAR1基因座在功能上沉默。在一些实施例中,内源非人ADAR1基因座的一个或多个内源非人ADAR1序列被改变、置换、破坏、缺失或替换为靶向载体,使得所述非人ADAR1基因座在功能上失活(即,不能以产生在本文所述的非人动物的蛋白质环境中表达和/或可检测的功能性ADAR1多肽)。用于使内源基因失活的方法是本领域已知的。
在一些实施例中,外源ADAR1基因或转基因或其表达产物可以使用多种方法检测,包括例如PCR、DNA印迹、限制性片段长度多态性(RFLP)、等位基因获得或丢失测定、蛋白质印迹、FACS分析等等。在一些实施例中,如本文所述的非人动物、非人细胞或非人组织相对于如本文所述的外源ADAR1基因是杂合的。在一些实施例中,如本文所述的非人动物、非人细胞或非人组织相对于如本文所述的外源ADAR1基因是半合的。在一些实施例中,如本文所述的非人动物、非人细胞或非人组织含有如本文所述的外源ADAR1基因或转基因的一个或多个拷贝。
本披露认识到在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,动物、细胞或组织将利用整合在其基因组中的外源ADAR1基因的产物。因此,在各种实施例中,整合在本文所述的非人动物、非人细胞或非人组织内的外源ADAR1基因座可编码呈亚等位基因的外源ADAR1基因。
本披露提供了来自本文所述的非人动物(例如啮齿类动物,例如大鼠、小鼠)的细胞和组织。在一些实施例中,细胞或组织是肝细胞或组织。在一些实施例中,细胞或组织是神经元细胞或组织。在一些实施例中,可分离来自如本文所述的非人动物的任何细胞或组织。在一些实施例中,提供了来自如本文所述的非人动物的分离的细胞和/或分离的组织。在一些实施例中,分离的细胞可以永生化。
如本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠)可用于在充足条件和时间下表征一个或多个目的寡核苷酸,在该充足条件和时间下非人动物由于所述一个或多个寡核苷酸而产生和/或具有产生分子响应(例如,RNA编辑、转录改变、翻译改变等)的潜力。
在一些实施例中,非人动物(例如啮齿类动物,例如大鼠或小鼠)产生表达可以结合一个或多个目的RNA种类的人ADAR1多肽的细胞群。在某些实施例中,人ADAR1多肽可通过与定点潜在治疗性寡核苷酸相互作用而结合一个或多个目的RNA种类。在一些实施例中,人ADAR1多肽结合一个或多个目的RNA种类,并且人ADAR1多肽用于编辑所述RNA分子。
在一些实施例中,本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织包含整合在其基因组中的由SEQ ID NO:3或SEQ ID NO:14所示的外源ADAR1基因。
在一些实施例中,非人动物,例如小鼠,经工程化为包含或表达工程化的ADAR1,其中该动物(例如小鼠)的工程化之前的ADAR1的一个或多个结构域或部分独立地替换为灵长类动物例如人ADAR1(例如,人ADAR1 p110或p150)的一个或多个结构域(例如,一个或多个Z-DNA结合结构域、一个或多个或所有dsRNA结合结构域和/或脱氨酶结构域,等)或特征性部分。在一些实施例中,表达工程化的ADAR1的细胞和/或动物可以在施用编辑剂(例如,寡核苷酸组合物(例如,本文描述的那些))时提供更高水平的编辑。
核酸构建体
通常,含有外源ADAR序列(例如ADAR1,例如人或NHP ADAR1基因)或其一个或多个部分的多核苷酸分子与载体连接(例如,插入载体),优选DNA载体,以便在宿主细胞中复制多核苷酸分子。
ADAR序列可以直接从已知序列或来源(例如,文库)克隆,或根据GenBank或其他公开可用数据库的已发布序列,从计算机模拟设计的种系序列合成。可替代地,细菌人工染色体(BAC)文库可以提供目的ADAR DNA序列(例如,人ADAR1序列和/或其特征性部分)。BAC文库可包含大小为100-150kb的插入片段,并且能够容纳大至300kb的插入片段(Shizuya,等人,1992,Proc.Natl.Acad.Sci.[美国国家科学院院刊],USA 89:8794-8797;Swiatek,等人,1993,Genes and Development[基因与发育]7:2071-2084;Kim,等人,1996,Genomics[基因组学]34 213-218)。例如,已经描述了平均插入大小为164-196kb的人BAC文库(Osoegawa,K.等人,2001,Genome Res.[基因组研究]11(3):483-96;Osoegawa,K.等人,1998,Genomics[基因组学]52:1-8,文章编号GE985423)。人和非人动物基因组BAC文库已经构建并可在市场上买到(例如,赛默飞世尔公司(ThermoFisher))。基因组BAC文库也可以作为ADAR DNA序列和转录控制区的来源。
可替代地,可以从酵母人工染色体(YAC)分离、克隆和/或转移ADAR1 DNA序列。例如,人ADAR1基因的核苷酸序列已经确定。可以克隆整个ADAR1基因座(人或非人)并将其包含在几个YAC中。无论包含的序列如何,如果使用多个YAC并包含重叠相似性区域,它们可以在酵母宿主菌株内重组以产生代表整个基因座或基因座所期望部分(例如,以靶向载体所靶向的区域)的单个构建体。YAC臂可以通过改装用哺乳动物选择盒进行额外修饰,以帮助通过本领域已知和/或本文所述的方法将构建体引入胚胎干细胞或胚胎中。
用于构建如本文所述的工程化的ADAR1基因座的外源ADAR基因区段的DNA和氨基酸序列可获自公开的数据库(例如,GenBank、IMGT等)和/或公开的序列。用于构建如本文所述的工程化的ADAR基因座的NHP ADAR基因区段的DNA和氨基酸序列可获自公开的数据库(例如,GenBank、IMGT等)和/或公开的序列。
在一些实施例中,多核苷酸,例如编码ADAR1多肽或其特征性部分的多核苷酸,或外源ADAR基因可以针对宿主非人动物进行密码子优化。密码子优化的序列是工程化的序列,并且优选地编码由非密码子优化的亲本多核苷酸编码的相同多肽(或多肽特征性部分的生物活性片段,其具有与全长多肽基本相同的活性)。本领域技术人员会认识到,由于密码子的简并性(例如,遗传密码的冗余),多个不同的三碱基对密码子组合可以指定氨基酸,并且一级多核苷酸序列可以被大量修饰,同时保留编码的多肽的一级序列。
在一些特定的实施例中,含有人ADAR1基因区段(例如,人ADAR1和/或其特征性部分)的核酸构建体可操作地连接至人或非人(例如,啮齿类动物,例如大鼠或小鼠)调节元件(例如,如本文所述)。在一些实施例中,调节元件可以是启动子。在一些实施例中,调节区可以是增强子。
在一些实施例中,含有人ADAR序列的核酸构建体还包含人和/或鼠来源的基因间DNA。在一些实施例中,基因间DNA是或包含非编码序列(例如,非编码人序列、非编码啮齿类动物序列、非编码非人灵长类动物序列和/或其组合)。
可以使用本领域已知的方法制备核酸构建体。例如,可以将核酸构建体制备成较大质粒的一部分。这种制备允许以本领域已知的有效方式克隆和选择正确的构建。如本文所述,含有人ADAR序列的核酸构建体的全部或部分可以位于质粒上的限制性位点之间,以便它们可以从剩余的质粒序列中分离出来,用于掺入所期望的非人动物(例如,啮齿类动物,例如,大鼠或小鼠)。
用于制备核酸构建体(例如质粒)和转化宿主生物体的各种方法是本领域已知的。对于其他适用于原核和真核细胞的表达系统,以及一般重组程序,请参见Principles ofGene Manipulation:An Introduction to Genetic Manipulation[基因操纵原理:基因操纵导论],第5版,Old,R.W.和S.B.Primrose编辑,布莱克威尔科学公司,1994和MolecularCloning:A Laboratory Manual[分子克隆:实验室手册],第2版,Sambrook,J.等人编辑,冷泉港实验室出版社:1989。
除其他外,本披露提供如本文所述的一些多核苷酸是多核苷酸构建体。根据本披露的多核苷酸构建体包括本领域已知的所有那些,包括粘粒、质粒(例如,裸露的或包含在脂质体中)和病毒构建体(例如,慢病毒、逆转录病毒、腺病毒和腺相关病毒构建体),其中掺入包含人ADAR1基因或其特征性部分的多核苷酸。本领域技术人员将能够选择合适的构建体以及细胞来制备本文所述的任何多核苷酸。在一些实施例中,构建体是质粒(即,可以在细胞内自主复制的环状DNA分子)。在一些实施例中,构建体可以是粘粒(例如pWE或sCos系列)。
在一些实施例中,构建体是病毒构建体。在一些实施例中,病毒构建体是慢病毒、逆转录病毒、腺病毒或腺相关病毒构建体。在一些实施例中,构建体是腺相关病毒(AAV)构建体(参见,例如Asokan等人,Mol.Ther.[分子疗法]20:699-7080,2012)。在一些实施例中,病毒构建体是腺病毒构建体。在一些实施例中,病毒构建体也可以基于或衍生自甲病毒属。甲病毒属包括辛德毕斯(Sindbis)(和VEEV)病毒、奥拉病毒(Aura virus)、巴班基病毒(Babanki virus)、巴马森林病毒(Barmah Forest virus)、比巴鲁病毒(Bebaru virus)、卡巴斯欧病毒(Cabassou virus)、基孔肯雅病毒(Chikungunya virus)、东方马脑炎病毒(Eastern equine encephalitis virus)、埃沃格雷病毒(Everglades virus)、摩根堡病毒(Fort Morgan virus)、盖塔病毒(Getah virus)、高地J病毒(Highlands J virus)、克孜拉加奇病毒(Kyzylagach virus)、马亚罗病毒(Mayaro virus)、美三病毒(Me Tri virus)、米德尔堡病毒(Middelburg virus)、莫斯达斯佩德拉斯病毒(Mosso das Pedras virus)、木坎博病毒(Mucambo virus)、恩杜姆病毒(Ndumu virus)、阿尼昂尼昂病毒(O’nyong-nyongvirus)、皮克苏纳病毒(Pixuna virus)、里约内格罗病毒(Rio Negro virus)、罗斯河病毒(Ross River virus)、鲑鱼胰腺病病毒(Salmon pancreas disease virus)、塞姆利基森林病毒(Semliki Forest virus)、南方象海豹病毒(Southern elephant seal virus)、图那特病毒(Tonate virus)、特罗卡拉病毒(Trocara virus)、乌纳病毒(Una virus)、委内瑞拉马脑炎病毒(Venezuelan equine encephalitis virus)、西方马脑炎病毒(Westernequine encephalitis virus)、和瓦塔罗阿病毒(Whataroa virus)。通常,此类病毒的基因组编码可在宿主细胞的细胞质中翻译的非结构蛋白(例如复制子)和结构蛋白(例如,衣壳和包膜)。罗斯河病毒、辛德毕斯病毒、塞姆利基森林病毒(SFV)和委内瑞拉马脑炎病毒(VEEV)都已用于开发用于编码序列递送的病毒构建体。假型病毒可通过组合甲病毒包膜糖蛋白和逆转录病毒衣壳形成。甲病毒构建体的实例可以在例如美国公开号20150050243、20090305344和20060177819中找到。
本文提供的构建体可以具有不同的大小。在一些实施例中,构建体是质粒并且可以包括多达约1kb、多达约2kb、多达约3kb、多达约4kb、多达约5kb、多达约6kb、多达约7kb、多达约8kb、多达约9kb、多达约10kb、多达约11kb、多达约12kb、多达约13kb、多达约14kb或多达约15kb的总长度。在一些实施例中,构建体是质粒并且可以具有在约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约1kb至约11kb、约1kb至约12kb、约1kb至约13kb、约1kb至约14kb或约1kb至约15kb范围内的总长度。
在一些实施例中,构建体是病毒构建体并且可以具有多达10kb的核苷酸总数。在一些实施例中,病毒构建体可具有在约1kb至约2kb,1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约1kb至约9kb、约1kb至约10kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约2kb至约9kb、约2kb至约10kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约3kb至约9kb、约3kb至约10kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约4kb至约9kb、约4kb至约10kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约5kb至约9kb、约5kb至约10kb、约6kb至约7kb、约6kb至约8kb、约6kb至约9kb、约6kb至约10kb、约7kb至约8kb、约7kb至约9kb、约7kb至约10kb、约8kb至约9kb、约8kb至约10kb或约9kb至约10kb范围内的核苷酸总数。
在一些实施例中,构建体是慢病毒构建体并且可以具有多达8kb的核苷酸总数。在一些实例中,慢病毒构建体可具有约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约6kb至约8kb、约6kb至约7kb或约7kb至约8kb的核苷酸总数。
在一些实施例中,构建体是腺病毒构建体并且可以具有多达8kb的核苷酸总数。在一些实施例中,腺病毒构建体可具有在约1kb至约2kb、约1kb至约3kb、约1kb至约4kb、约1kb至约5kb、约1kb至约6kb、约1kb至约7kb、约1kb至约8kb、约2kb至约3kb、约2kb至约4kb、约2kb至约5kb、约2kb至约6kb、约2kb至约7kb、约2kb至约8kb、约3kb至约4kb、约3kb至约5kb、约3kb至约6kb、约3kb至约7kb、约3kb至约8kb、约4kb至约5kb、约4kb至约6kb、约4kb至约7kb、约4kb至约8kb、约5kb至约6kb、约5kb至约7kb、约5kb至约8kb、约6kb至约7kb、约6kb至约8kb或约7kb至约8kb范围内的核苷酸总数。
本文描述的任何构建体还可包括控制序列,例如,选自下组的控制列:转录起始序列、转录终止序列、启动子序列、增强子序列、RNA剪接序列、聚腺苷酸化(聚(A))序列、科扎克共有序列和/或可能包含转录前或转录后调节和/或控制元件的其他非翻译区。在一些实施例中,启动子可以是天然启动子、组成型启动子、诱导型启动子和/或组织特异性启动子。本文描述了控制序列的非限制性实例。
示例性ADAR1序列实施例
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1或基因组基因座或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:具有完整基因组多核苷酸或基因座(例如,由SEQ ID NO:1)的显著部分(例如,约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%和/或100%)或其一部分的核苷酸序列,它们可以任何适当的方式重组。
SEQ ID NO:1-作用于RNA1(ADAR1)的腺苷脱氨酶-基因组序列
GAACCGGAGCCATCTTGGGCCCGGCGCGCAGACCCGCGGAGTTTCCCGTGCCGACGCCCCGGGGCCACTTCCAGTGCGGAGTAGCGGAGGCGTGGGGGCCTCGAGGGGCTGGCGCGGCCCAGCGGTCGGGCCAGGGTCGTGCCGCCGGCGGGTCGGGCCGGGCAATGCCTCGCGGGCGCAATGAATCCGCGGCAGGTAAGCCGGGCCGGCCTTGGACCTTCGCCGCCGTCTGGGTTCGTTTACAACCTCACAGGCTTTGTGTTGCAGTGCGTAGCGTGTGCGTCTTGTGAGTGTTAGAGTGTGTGTGTGTGTGTCGTCTTGCCAAGCAGCATTGCTGGTTTAGGAATTTGTGCGTCTTGTGAGTGTGTGTGTGTGGGTGTGTGTCGTCTTGCCAAGCAGCATTGCTGGTTTAGGAATTTGTGCGTCTTGTGAGAGTGTGTGTGTGTGTGTGTGCGTGTGTGTGTAGTCTTGCCAAGCAGCATTGCTGGTTTAGGAATTTGTGAATTTGTATCCTGCTCATTAATTCTGCAGAATGGAGCAGTGCGTGAAGAGGGCTTGGGGGAAAATGCGCCCCCGTCTGAGTAGGAAGGCCTGAGCCCATGTCAAGGCAGACACATCGTCTCCCTTTCTGCTAGGGCCCCTTGTGGAACCCCCTACCCCCGCTTTAGCCCCACTTGAACAACGTTCGGACTTTGAGCAGCGCACACTATCCTCAGCTCACCTTATCCACCTCCTGAAGGCCTTCTGGGAGTTAAAAATGGCACTTAAGCTGTAGGAGAAAGCTTGTTAACCACTTTATAGCTAAAAACTGGGAAAACACAAATGGCCTTCAGCAGGTTAACAGATAAACTGAAATACATCCACATAATGGGATACTGCTTAGTAGTGAAGAGGAAATACTGTTACAAGTAACAACACGGGTGACTCGCAAGTGCGTTATGCTAAGCACGAGAAGCCAGACTCAAAAGGCTGCATACTGTATGAGTCCATTTATATGACATTCTGGAAAAAAAAAACCACAGTTATAGGGATGGAAAGTGGATCCGTGGGTGCCAGGGACTGGGTATCGTGGAAGAAATTGATTGTTGAGTGGCATGAAAAAGCTTTTTAGGGAAATAGAAATGTTCTATATCTTGATTGTGGTGGCGATTGTCGAAATTCATAGATTTATACACTTAAAAGGATAAATTTTACTGTATCTAAATTATATACCTCAATTTTGTTAAGATATATATATATTTTTTTTTTTTTAAGCACTCCTTTGAAAGGATTAAGGACGCCTAACTTGAAGGAAAAGCATTTCTGCACAGGTGTCAGTGTATTGCACTGTGGAACCTGTGTGGTAAAGGCAAAGGGGGTAGTGCTTATCTCTTGATCCTAAATATGTGAGACCAGATTAAAGTGAAATCTGGGAGGCAATGAATGTTAAATGAGTTGTTATGTAATTTGCATAGAGGTGATGCTGAGAGATTTAGAAAGGATCACTGTGGGTTGCTTGCTCACTTTCTTGCTCTCCTATTCCGTAGCTTTCCAAATGGCTGTACTCAACGGTGGCTTGGTGTTTAGGGGATTTAAGGGGGGCAAAAAGAAAGATTAATAATCTCCTCCTCTCCCTCTAACCCTACTGCCCTAAGATATCCTTAGCAAACTTACATCTCCTTTCTTTTCTCTGTGTTCATTCCATTGTGCGCACACATACACATTCATGGATTTTCTCTTTTTGTTTAGGGAAAAAAATTATAATGTACATACTATTCTACAACTTTTTGTTGTTTTATTGAACATTATATGATTCCTAAATTATCCCCAGGTGAATACAAATAGATATGACACATTTTAAAAAAATAAAATAACTGGCCGGGCGTGGTAGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGAGGGCGGATCAGGAGATCGACACCATCCTGGCCAGCATGGTGAAACCCCATCTCTACTAAAAATACAAAAATTAGCTGGGTGTGGTGGCGTGCGCCTGTAATCCCAGCTACTCCGGAGGCTGAGGCAGGAGAATCACTTGAACCCGGGAGGCGGAGATTGCAGTGAGCTGAGATCACACTGCACTCCAGCCTGATTGCAGTGAGCCGAGATCATGCCACTGCACTCCAGCTTGGCAACAGAGCGAGACTCCGTCTCACAAGAAAAAAAATAACCGTGTGAGTACTATTCCATAGAATGAATGTTTCATAATTTAATTCTTCTATAGACAGACATTAAAATATTTTCCAGATTTGGGCCAAGAGTAGCAGTTTAAAAAACATTTAGCTTTTAACTGACTCTAGCCACTTTGAAACACAATTTTTTTTTCCCAAGGTCACTCAAAGAGCTAATAGGAGAACCCCTAAGTCCCATAATTCAGCTCTGGGAGCCAGCACTCACTCTGTACACACATTTGCCTCTGTCCCTAGCAATATGGTGGGCGTGAGGGTGCAGCAAGAGGAACAAGAAAGAAATGATTGCTTGCATAGTGGCGTCTTGTTCATGCAGTCATTAATTCAACAAATGTTTGTTGAGAATCAGCTTTGTGCCAAGTGCTAGAGAGGTTGAGATGATTGAAGCATAGTCCTTGACCCCCAAGAGCTCACCATGGAATCAACTGAAGCCCCTCATCAGTACTGTGTTGGGAATATTGAGAGTGGAGAGTTGAGTATAACTTATAGGACACCTAATGTTAATTACCTTTCAGACACTGCAATGTGTGTGTGCCATAAAAAAAAAAAAAATCCAGTAGCTCTGATACGAGGGAAAGTAAATGGTTTAACAGGTGCTGAGTAGGAGAAGCTCAAGGAGAGGAAACCCCAAGGGCTGAAGAAGGTGGGAGTCAGGAGTCTCCTGAAGCAAGTGGCATTTAAGGAGCTCTATAAGGAAAGGGTCAGAGTTGTGATAGGTGGCTGTGGAGGGAGATGTGCCACCTGGATTGGCATGTAGAGGGATAGAAAGATTATAGGCCTTTGCAATGGCCCAGTAAGAGGTAATGAGGGGCTGGAACTGGAAGAAAACACATTTAAGACACAGTACAGAGGTGGCAGACAAGGTGGGACTTGGCAACTACCTGATGAGATCCAGGAGATGAGGCCAGGAGGCGGGCAGCAAAGATGACGCAGGTTTCTAGCCTTAATAGGCTAGGAGGAGAGTGATGCCATTAGCAATAAGAACTACAGGAGAAGGAGCTGAGTTTGAGGGAACTATTAATTTGGTTCAGAATATGTGCTGTTTGAGTTATGGCAGGATATTTAAGTGGACAGACTGTCGACATAGTTGGAAATTCAGATCTTAAGCTCCCACACAAGGTAGTGGCTGGACATAGTAGATTTGAGTGCTCTTGCTTCAGAGGGCTAGTTTAGGTTGGGGCAGTGATTAAAGCAACCTAGGAAATAAATTATAAAGGAAGAAGAGGTCCTTAAAACCTTGGAGACTGATTATATAAAGGGTGGATCCGTTAATACAGTAGCTATTAAAAAATTATAAGGGGTGGGAAAAAGGGACAAAGAAGAAAAAAGAGGTGAAAGACCTTTGCTGTGTCACCAAACCCTGGGAGGAGAATTTTTTAAAAGAAGAGTACTCAATCCACAGTGAACTAAGGCATGTTTGTTAAACACAATTGACCACCACACAGCGAAGACCCAAATGAGGTTCAAGAGAAGGAATTTTTATGGACCCTGTTAGCACAAGTCAAGGTCCTTCTCCAGTACCACTGGGAAGCTTTGGAGAAGAAAAGGGGGACAGTGGGCCTTGGGTGGAGAAGGGAACTGACCATGAGATCCAGGTGGGGTGAGGAGGTGTGTGAAGTCAGAGTGGGGAAGAATCAGGGTGGCTTACTGGCAGCTTCACCGGGGTCATGCGAGGAGCAGGTTCCACCAGAGTAAGGAGTGAAGTTGTAGAAACACAGGGAAGTCACCATCAGAAAAGAGCAGGAGTCAAGAAACTATGGCCCACAGGTACAAACTACCTGTTTTTATAAATAAAGCTTCATGGTAAATGAATTGTAAATAAAGTTTTGCATATTGTGTGAGGCTGTTTTTGTGCTACAGTGGCAGAGCTGTCTGGCCCTTTATAGAAAAAGTTTATCAGCCACTGGAAAAGAGTTGCAGGATTTGAGGTCTTGGTGTGATGGCCTAGGTTAGAGTCATAGTGAGATTGAAGGAGTAGCTAGACAAGCCAATTGTGTGGCAGAAAGGTAGGGATGGAGATCACTGGGTTAAGGATCCTTGTAGCCAGGACACCATGAGAGTGATTGACAAGAATGCTGAAATCCCCTAAGTGTGTCAGGATGTGGAAGAGTAGAAGGCTAGAGTTATGGAAGAAAGGGTCCCACCTCTACCTGTGCAGCCTCCAGGAGAGTCTGAGGAGGGGGCGGTGAGTGTGAGTAAATGTTGTCAGAATCCCTCCTCCCAGTCTACAAGCCCCAGGGAAAGGAAGCAAGGTGTTTACTGACACCCCCAGGCTTATAAGTACTTCCTGGCTCCATCACCCTCCAGTGAACAGCCCTGGGGAGAAGACAGTACTGGTTTGCAGGTGGGTGGGTGGGGAAAGGGGTCACAGGTGCTTGGTGTTCTGGTAAATGTGCATATGAGAACATGGGGTTGCTTGTGCCCTGTCCGTCAGGGTTCAGAAGAACGTGCAGTGGAAGCAGCTATGGGGAAGTAGCTAGGGAAGGTAGGACTGGTCTGAGGTGGTGAGGAGCAGATGCTGCCAGCTCCACACATCCAGGAGAGCCTGGGTGGTTTGGGCAAAAGTCTCTGGCATCCCTTCTGAGCCTGGGTACCACACTGAAGAGTGAGGACAGTGTGCCATTTTTATCAGGAAACCCTCCAGCTCCCTGAAGACCAAATTCTGATCCTCCTGGGATGGCAGTGAAGAGCCACAGAGATGACTCTGAGGTCCCGTGGCCTTTTCCCACCTGGAGATTGTTTTCGTTACTGCGCTGTTACAGCCTTGGAGGACTGGGGTTCAGTTTCATCCAATCACATTTCTTCTTTTGTCATAGTCATCTAAACGATAGATCTTAGAGACAGGTGGGCAAGGGGTGCACTGGTGAGCCTGACTTAAGGAGAGGTCATCTCGTCCCTTCCCTAGTCCCATCTCCCTTGGTTATTGTTATTTCATGTGATTGTTCTGGTTATTTCAGGTTATTCTGTTTTTGTTTTCAAAACAATAACATATATTTGTTGTTCTGATTTTAAAGGGGTAATTGTTTTGGTAACTAGAAAATTACCTTCTCAACTCCCTTAAATTCTGTCAAAGGGAAAAGTAAGTTAGGTTGCTGGAGAGGCTATGCTGAGGCCTCAGAACCTCTGTATTCCTGGAAGTTCTGCGTGCTTTGCCTCCTGCTCCCCTCTCTGTGTTCCTGTTGGCAGGCCCCTAGGCAGGATTTAGGAGGTAGGCAAGTCACCCTAGCCAAGTCATAAGCCCATGGCTCAATTGCCTTCTCAGCCCTTCAAGGGCTGTTCCACAGGCAGCAAAGGGAGGGGCCTCCACAGGTTCACCACTGCAGCCCTAATTCATTTTCTTTTTCCACTGTCTTATTCTGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGGTAAGAGACCACCCAGGAACTGTACCTAGGGTTGGGGTCAGGTGCTTTTGCTCCTGACGCAGTCTTGGCTGATTTGTGAGCAGTGCTGTTTGGTGGCGCCTATCTTTTCCTCCTTCCCTTCTGCCTTTTAGCTAAATTCCCCTTGATTGGCCCTTTCTCCAGATATTGAGCAGGGAATATAGACCTTGGACCAGCCAGAATCTTGGCTGAACAAGGGGGAGGTTGACTCTGTTGGCTGTAATGAAGCTTCTTTAGAAATGATTGGTTTTGGCCGTACGCGGTGGCTCATGCCTGTAATCCCAGCACTTTTTGAGGCCGAGGCAGGCATATCACGAGGTCAGGAGTTTGAGACCAGCCTGGCCAACATGGTGAAACCCTGTCTCTACTAAAAATACAAAAATTAGCTGGGCGTGGTGGCGTGCACCTGTAGTCCCAGCTACTCAGGAAGCTGAGACAGGAGAATCACTTGAACCCAGGAGGCAGAGGTTGCAGTGAACTGAGATTGCGCCACTGCACTCCAGCCTGGGCCACAGAGCAAGACTCCATCTCAAAAAAAAAAAAGAAAGAAATGATTGGTCTTGGGGGCCGGGGCGGTGGCTTACGACTGTAATCCCAGCACTTTGGGAGGCCAAGGCAGGCAGATCATGAGGTGAGGAATTCGAGACCAGCCTGGCCAACATGGTGAAACCCCATCTCTACTAAAAATACAAAAATTAGCTGGGGGTGGTGGTGCTTGCCTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCACTTGAACCCAGGAGGTGGAGGTTGTAGTGAGCCGAGATTGGCGCCACTGCACTCCAGCCTGGGCGACAGAGTGAGACTCCATCTTGGAAAAAGAAAGAAAAAAGAAAAACATGATTGATCTCCATGCATCAATATCATGCCTGCCTCCTAAGGCAGAGGTAATGAAGACTTAATTCCCTTCTGTAGGCCTTCCCCTCCTCCCTAAGCCGTTTTCTGAGAGAGGTGCAGGAGCAGGTGGGTTGGGGCAGGCTGCATACACAGTGGGGGTGGGTTGTGCTGCTAAGCAGCAGCAGGTCCACAATCCCCCCTCTGCATAGCTCCTGGGGGGAAAGGATGGAGGAGCGTGTGCACGGCTGCCTGCCTGTTGAAGGTGGTGGTTCTAATTTTATAAACCTCCTCTGCACAGATGGGTAGGCTAGCACTTGCTGCCACTCCTGAGCTGTGAAGTCAGCCTTTACCTCACTCAGATAGCTGGTCAGGCCCTGCACTGTAGGTCCTAATAGGCCAGTGGACAGATTGAGGAAAACAGGAGCTTCTGAAGGGCATAACAGAGAGCAAAACCACTGAAGCTGAGTGGCTGCAGCTGCAGCCAGGGAAAGAGCCAGTAGGATGGGGGAGAATTCCACTGACCTTTATGTTTACCTAGCCTGGTTTCTAGGGGTGTAGATTCCTGGCTAGGGCCCTTATTCCTTGTCTTGACTGTCTTCATGACACCAATTTGGCATTTCAGGAGAGCGGTTAAGAAAAGGAGTTGTGTCTGTCCAAAAGCTGGCAAGGCCAGAGCTGGATTGTTTGGGGTAGAGACTGGATGGCCGTCATTCTCTTTTGCCTCCATCCCTCCTCCCCAGAGTTGGAGGAAAGCAGTGGATTTTGTGGTTAGTCATTCTTTGGACTCACACTAAAAGAAACATTGGTGCCATGTTCAAATATATCAGAAGACCTAGGAAATAAGAAATTTGACCTACTTTTCTAAATGAAATCCCAGACTGAGCAAAGAGCTCACCACATTTGAAAGCTTGAACAAAGGGGGCCTAGGCTAAGTCCAGAGGCCTAGAACAAATGCTTTTTTATTTTCTACATAACAAGGGGAAATTCCTTGTTATGTAGAAAATAGCTGGAGACAAATGGTGCTATAGAGTGACTCATAACAAACTACGGTGATATAGGTCTAGGGACAAAAGCAGGCCACTGATAAGTGGCAGATGCCTGATCCCCCTAGGTAGTGGGGAGTGTGAGACTGGGTTATAAGAAGCCTTCACTATCTTTTAGGACCCTCCCTTGAGGAGGCCAGTCTACCACAATTGCTTTAGAATGAAGGTCTTTTGGTTGCTCACAAGACTATAATGGTAATTTTTGGCTCATCATTTTTGTGTGTGTGGGTTTTATCTTAATTCATTGTTAAAGAGATAGTGGGTTTCCCCTGAGCTAGTTTCCTATCATCTGTGCCTATGTTTGCTTCACTGAGCTATGGGGAAAGAGTCACTGGCTGCTTTGTTTACAAAAAGAAAGGACAGGCTGAGCCTTAAGGAGTAGGAAGGAGTTCCTTGGCCTACCCTTCATCTCCACAAGTGAAAAGCCCCTTAGCGTAGCAGAAAATTCCAGGTTGAAGGTCTCTTTGGAGAAGGCAGAAGGAGTGACCTAGACTCCTGTTCACACATCTAATCACTTTCCGTCAAGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGGTAGGTGTCCTCCTGCCATCTGGGAGGATCAGTTCCCTGTCAGTGTCTGGATTGTAACTGACTCCCTTGAGGCAATCCCAGCCTAAACAACTGACACCATCTCGGAGTCAGCTTCCCACTCTTCCCTCTACCCTATCTCGCCAGCCCACCTTTCCTCCTCTCATACCCAGCTCCTCTGTCTGCTCCTGTCCCAACATAATTGGATTTACAGAATTTCGGACTTGAAAGAGACCTGAAAGTTTATTGAGGCCAATCTCCTCTCTTGGAAGATGCGGAATGAGAGCTCCAGCAGCCCCTTTAACTTTGGGAAGCCAACCCCTTGACAGGTGGTGGGAATAAAGTCCCCCATCCCCATCCCTTCTTCTGTGATGGACTAACCAGTGTTTTCTTAGTTTTGTTTTCTTCTTGTCTCTCATTTTCTCTAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTATGTCCTACGTGTCCTCTGTCCAGCTGAGGTTTTCTCAGAAAGAAAAAGAGACACATTTTCTTCCTTGCCTCCTCAGGGATGGCAGATTGACCAATTTCTCCTGTTTCAAAATGGGGAAAGGAGGGCTCTGAGGTCCTGGTTGCTGCTTGTGAGGCAGACAATTAGGGATTAGGAATTCAAAGGGAATTCCTGGCCCACCCTCTATCTCCTCTATAAGCACTAGGGAGGTTCACGGCTTGGAGGTCACTCACTGTTGGTGGGACAGAAAGGTACAGGACCTGAGAAGCTCTCTGCCTGTGGGTCTATAGACTCACATGTTCAAGAGAAGTGTTCCTGGAAGAGGTGAAACTAGGTTGATGCTTAAATGTTGAAAGGGGTCAGCCAGGCTAAGAGACACTGGCTGTTCAAGGCAGAAGTGACTGCATGAGATGTGACTGCACAGAGGTGATGTGTTCAAGGAAATTACCAGTAGTGGAGGATGGCAGCCTGGCAGAGGCTAGGTCAGGCTCCTCAGTCAAAACCATTTTAATCCTTCTACGTGCTTCATCTCCTGTCAGGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGGTAGGGCGTTTTCCTACTCAAAAGATACAGGTCATTTTTAGCAACTGAGTGGTTTAAGATTGCCAGTGACTCCCTCAACATTTCCTGAAGTGTTTATGGCTCCTCTGTTTGATGGATTCTCCTTTAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTGAGTGTCCTAGTCCTGGCTAATGCATGTGTCACCAGTTGGGGATGGTCTGTAACCCAGGGAAAACAAGGGTGTGCTTTAGCTGTGTAGGACAGAAGGGGCGAGTTGAGGGAAACAAGTCCAGCCCTGTCTCCACGGCCTCTTAGAAGACAATAGACCTGCCAAGAGTGAATGCGTTCACTCTTCCAGTAAGCATGATCCTTTTTAATTTTTTGACTAGTTTTAATTTTTAAAGAAATGTATAGGTACATTAAAAAATCATTCAGGCCAGACATGGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGTTGAGGCAGGTAGATTACCTGAGGTCGGGAGTTCAAGACCAGCCGGACCATATGAGGAAACCCTGTCTCTACTAAAAATACAAAAATTAGCTGGGCGTGGCAGCGGGTGCCTGTAATCCCAGCTACTCGGGAGGCAGACAGGAGAATTGATTGAAGCTGGGAGGCGGAGGTTGCAGTGAGCTGAGATCGCACCACTGCACTCCAGCCTGAGCAACAGAGCAAGACTCCATCTTGAAAAAAATCATTCAAGCTGATTGAAAAAGTAGTCATTTCAATGAAAAGTCTCATTTCCGTCTCAGACTTCTAGTTTCCCTCCCTAGACCCATATATTACTATAGCCCTGCATTAGCAACTGGGATGCGGTCTGAGAAGCATGGTTTTGTTGTTGTGAGAACATCAGTGTGTATTTACATAAACCTAGATGGCATGGGCTCCTACACACGTACAGGCTGTATGGTATGGCCGGTTGCTCCTAGGCTACAAACCTGTACAGCATGTAACTGTAGTGAATACTGTGGGCAGCTGCAACACACTGGTAAGTATTGGTGTCTATCTAAACAGCAAAAAGATACAGTAAAAAGACAGCATAAAGGATTAAAAAAATACTACACCTGTATAGGGCGCCTGCCATGAATGGAGCTTGCAGGACTAGAAGTTGCTGTGGGTGAGTCAGCCAGTGAGTGGAGAATGAATATGAGGGCCTAGGACATGACTGTACACTAATGTAGGCTTTGTAAACACTGTTCACTTAGGCTAACTACATTTATTTAAAATATTTTTCTTTAATAAATTAACCTTAGCTTACTGTAACTTTTTTACTTTATTTTTACTTTATTTTTTACTTTATTAACTTTTTTATTTTTTGTTCCTTTTGTAATAATACTTAGCTTAAAACACAAACATGTTGTACTGCTATCCAAAAATATTTCCTTTGTTTATATCCTTAATTCTATAGTCTTTTTTCTGTTTGTAAATTTTTTTATTTTTTTAACTTTTTAAACTTTTTTGTTGAAAGCTAAGATGAAAATACATTAGCTGTTAGCCTAGGCCTACACAGGGTCAGGATCCTCAGTATCACTGTCTTCCACCTCCACGTCTTGTCCCACTGTAAGGTGTTCAGGGGCAATAACATGCATGGGGGCCGTCATCTCCTATGGTAACAGTGCTTTCTGGAATACCTGCCTGAGGCTTTTTTTAGTTACTTATTTTTCTAGAAGTAGAAGGAGTATACGCTGAAATAATGATAAAAATATAGTAAACACATAAGGAGCGTGTAGCCTAGATCCCTCGCATTCACAGTTCACAGTCGAGTTCACACTCCTACAAGAATCTCATGCTGCTGCTGATCCCACAGGAGGCGGAGCTCGGACCAGAATGCTTTCTTGCTCGCCACTCACCTCTTCCTGTGTGCCCAGGTTCCTAACAGGTTACAGAGCCCTGCACTTGGTGATAAGAATTTTTCAGCTCCATCATAATCTTACGGGGCCCCTGTCATATGTGTGATTTATCATTGAACAAAACACTGTTATGCAGTACATGACTATACCAGTTTCTTGAGTCCTTCTAGAAATTGCTGTGCATAACTAGCACATTTTCCCTTTTGTCTTTTTAAACAAGTATATCTTCTGTTTTATACGTTGACTCCTTTACTTACCAGACTTCTTGCATAGCTGCATAGTATTTCATTGAATAGAAGCTGACAAATTCAGTTTCTCAGAAGTAAACATTTAATAGGGACTTAGGAACAGAAATGATGTCTTGGGTGGCTGCAAGATGGTGGATCCCTGCACTTACCCTCCAGAAAGTATGCTTTCTATAGAGGCTTTTTTGGTTAAACATGCAGCTGGTCACACATTATACTTTCTTGTGAAACTTATGAGCACTAGCTGGTGGGGAGGCTTGGTAGACATCTTTGTGTGGAATTATTTATGCTACCCAACACTTTGGGATGCGGGAGTCAGATATTGGTGGTCATAGTGGTTTTGCATCAAGATGGCATCACTCTTGCCATGCAACCGGCATGTTTTCTTAATCTCTAAGGTCTATCACAAAGTGGAAAAGCAAGGTGTAAAGTGAGGGGAGAGGTGAAGATTGTCTGTATATGTCTAGAATATTTTCTTGAAGGATCGAAAAAACTGGCAACTGTGTTTGCTTCTGGGGAAGGAGGGACACTTTTATTGTACACTCTTAACTGTTTGAATTTTCACATGTTTGGCATCCAACTTGTCCATTTTAAAGTCATTAAGGAAAAAAGCTTATAAAAATGCTATCTTGTTACTTTAAATTTGTCTCTCCTTAATAGAAGTAATGTCAGCCGGGCGCAGTGGCTTACGCCTATAATCCCAGCACTTTGGGAGGCCGAGGTGGGTGGATCATTTGAGCTCAGTAATTTGAGACCAGCCTGGCCAACATGGTAAAACCCCATCTCTACTAAAAATACAAAAAATAGCTGAGCATGGTGGTATGCCCCTGTATGCCAGCTACTCCGGAGGCTGAGCAGGAGAATTACTTGAACCCAGGAGGCGGAAGTTGCAGTGACCTGAGATTGTGCCACTGCACTCCAGCCTGGGTGATGGAGTGAGACTCCGTCTCAAAAAAAAAAACAAAAAAATCAGAAGTAATGGCATTTCATTTATTCATATTTATGTGTTATTTGCATTTCCTTTTCTGTGAACCACCTGTTCTTGTCCTTTTCCAGTTTTCTTTCAGATTGTTACTCTCATGGATATGTAAGAACTTTTAACATAATTTTTAAAAGTAGCCCTTTGCCCAACATGACCCAATTTAGAACACACATCTGCCCACTGTTTAAGCCATCTGGAAAAGGAGAGGCCCAGTCTCCCTCCAGCTGCTCTTCTACTAATTCATATCCTTCATCTCAATAAGCACCTCCTTATCTTTAAGCACAGTCCTTCAGATGATAGGTTCAGTGCATTTCCTCTTTCTCTTCTGTGAAATCTTCTGTGAAATCCTTTCTAGGACTTCAAGTCAGCCATTCATTGAGAATGTAAGAACTTACTATGAACTAGATGGAAGATACAAAAAATTGCTGCCCCTGAGTGTGTAGCAGACATATAGCCATAGCAGTATTGAAATGTGCCATTGGAGGTGAATGCAGAGTGCTGTGGGGACACAGAGGACACTGCTGCCACTGTCTGCCAGGGAGCTGAGGAAGGTTGCATAGAGAGGGGAAATGCTAATTGAGTAACTACGTTTATTAACTATCTCGTACAATAATATACTTTAGTTGCTTCTTAATGTGAATTATGCTGGGTCTTTTTTTCCTTTCTGTCTACTGTGGCTGGTGACGTTAACTAATTTTATGACTTCTTTTCTGTTTTTTTTTTTTTTTTTTTTTGGAGATGGAGTCTCACTCTGTCACCCAGGCTGGAGTGCAGTGGCGCAGTCTCAGCTCACTGCAACCTCCGCCTCCTGGGTTCAAACAATTCTCTTGCCTCAGCTCCTCGAGTAGCTGGGATTACAGGCATCTGCCACCACATCTGACTATTTTTGTATTTTTAGTAGAGACAGAGTTTCACCATGTTGGCCAGGCTGGTCTTCAACTCCTGACCTCAGATGATCCACCCGCCTCAGCCTCCCAAAGTGCTGGGATTACAGGCATGAACCACCGCGACAGCCATGACCTTTAATATCTAAATGCTGGAGACCACTCAGAGCTCCCGATTCCTCCATCTAGTTGCTTACTTGTCACCTCTGTTTGGATTAACATCCCTAATATGACATGTCCAAAGCAGAACTCTTGGGTTTTGCCCCCTTCGCTTCATTTCCCCCAAGTCTTTCCCAGCTTAGTAAGTGATACCACTGTCTACCCAGTGGCTCAAGTCAGAAACCTGAGGATCATCTTTTCCTCTATCTCCTTTACCTCCTTCGTCAACTCATCCTTAAGTCCTATTGGTTATACTTAGAATTTCTATCCCAAATCCCTTCCTCTTCTTTCCACCTCCAGCGTCAGCACTCTAATCCAAGCCACTGTCTCATCTAGACTGTCACAATAGCCTCCTAACTGATCTTTATACTTTATTTACTCAACACTTATTTATGGAGTATCTTCTATTTTTTTTAGAACAGGAACCAAACATTAACCAATAGTCACCTAAAGAAATGTAAGATCTCATATTTGATAAGTATTCCAAAGGGCTGGAGTTGCAGCGAGAATCAATTATAGCACAGTTTGACTTAGGAAGGAGAGGGGGAAGGGCTTCCCCAAGAAGTACTGCCTGAGCTGAGACTTTAAGGATGATGAAGAGAGAAAGACTGAGGGTTCTAGGCGAAGGACACTGTTAAATCCTGTGGTGGGAGAAGCGCAGAGCTGGCAAAGAGGCTGAGAGGAGGCACTTATGGCAATAGCCCCATTTGGCTAGTGGCTACCATATTGGATAGCACAGCTCTAAAGGATTCTAGTTGCATAATTAACAAACTTTATCATATATGTAAATATATCAGTATAAAACTTTGCACGTAAGAGTTCATATTCTTTTCAAACACATGGGGCAGTCATGAAATTCTCCTGGATCCCTGAGGTAAAGATACTACACAATCTGTCCCTCCTGACCGCCTTCACCATCTTCTTTTCATGCCACTGTCCCTCTCATTCTGAACTTAAGCCCACTGGCCTGCACGGGCCTGCCAGCATGGACAAAGAAAAGAGTGAAGGCATTTAGTTGCTTCGGATCATCAAGGAACAGTGAGAAACTCCATGTGGTTGAACATAAACGTTGATTCCTTTTACTGCCTGAGCTGCTAAGTCTTGAAACTGAAGCCTCTGTTATATGCAGTTAGAGTATCCAAAGCTGGGTTCTCAGCCAGTAGATTAGGATCTGGTTGAAAGCTAGGATTCTTGATGCCTTGTCTGGTACATTTCCAAGCTGTTTTGCTCCACCATGCTCTTCCCTCTGTGTTTGGAAATTACCAGCCGGAGCGGTAGAAGCCACCTCCCTGCTCCACTTGGGCACTTTATTGTCAGCGCAGCTCATGCGCCCAAGATCCATTCCTTACCCCAGAGTTAGCTTAAGCCTGCCAGGAGTCAAAAAAACAACTCCCAGCAAAACCTGGGTCCCTGGCCTAAGGCCGACCTTGACCTAATGACCTCTCCAGGTCAAGTCCCCTTGAGCTAATAGGAAGTAAATGAGGGAATGGAGTTGGGCGCTTTAAAAATCAGACAGTGTATGAAGTAACAGTGACTTGTGGGGAGAAAGGTAGTCCCTTCTGATTTCTGCTTAAGAAGAGAGTCCAAGTTGGTGCTAGCATTTCGTTAAGCCTTCCTCATACTTCATAATCTTCCTTTATAGTAAGGACAGGCTCAGAGCCTTTGCAGGTAACAGTATCTAGTCAGAATTTTATAACATGATTTTATCATATTCTGTTTTACAGCCACCTTCAATATGTGGCAAGTGATACTGGTTTTCCATTTACAGTAGTGAAACAAAGTTTCCTATTTCAGTGTGTTTACATTTTTATCTCTTTTTTCATACCTAGTATTACGGATATTTACATTTTTAGAGTCTGTTTGTTTATTTTAGAGATGGGGATCTTGCTGTCTCGCGCAGGCTGGAGTGCAGTGATATGGTCATAGCTCACTGCAGCCTTGACCTCCAGGGCTCAAGTGATCCTCTCACCCCAGCCTCCCAAGTAGCTGAGACTATAGGCACAGACCACCGTGCCCAGCTAAATTTTTTTTTTTTTTTTTAAGAGACAGGGGTCTCGCTATGTTGCCTGGGGGATTACTATGTTGCCCAGGCTGGTCTTGAACTCCTGGCCTCAAGTGATCTCCCACCTTAGCTCCTCAAGTTGCTGGGATTACAGGTGTGAGCCACAATGGCTGGCTCTAAGAAGTCAATTTAGAGAAAAATATTAATTAATAGTCCAAGTAATACCTGGATGTGGCACAAATCATGTGGTGATTCATGAATGACCAAAATCTAGGAAATGCTGCCTTAGAAACAGCTTCTGTTTGACGGGTCCATATGTTTGCAAGACTGGCCACATCTTCAGCAAAACTAACCCTTCCTTGGAACAATGTCAGGGTCTGGCACTTGTCTTCATTCTCTGTTTCTCATCCCAAAGGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACAGTTAAGACGTCTACTTTTGGTGCCTTTTTTGGGGCGGGGGGGTCCTCCTAACTCCTAAGTGGAGGTGGCTCTTGCTGTCATGCGAGTTATTCCTAGGCTTTACTCTTAGCCTCGAGAGAGCAGTAACTGGGACACTAGATGTAAGAAGGAAAAGATGACTCACACGACAAGTAGAGCTTGATCTCCCTGCCCACGGTGAATATGGTGGACACAGCCTCAGCTTTGTGGTGCTGACACAGCCTCTTTTCCCCACAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGTGAGTGAGGCTCTGAGACATGCCGCCTCCCATGGCGCCTGAAAGCGGGTGCCTCTCATCCTCCCCTGGAGTCCATGCATGTAAGTCCAAGGCAGGGAGAAGAGACTTCATTTTAGCTACAGTCAATTCAGAGTGAGGAATGAGTTCTTAGTTCCTAGAGGAGAGAATATGGGAGTCTAGGATCTGAGAAACTGAGGCTGTTTCTGCCTTGAAGCTTTCAGAACAAATAGCCTTCATCCTGTTTTCCATCGGTTTCCTTCCATTATTCTATTTCTGTTTTAAACACCTTCCTAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTGAGCGAGGTCAGAGCTGTGGCCCGGCTGCCCGGCTGTGGAGAGCTCCAGTTCCCTGCCCCACATGGCTCTGACACGGCCTCTGAATCCCCCTCAGACAGACGGGTCATGATGTGGCAGTGGCAGCCTTTGCTTTTCACCCGTCCATTTGAACCTGTCTGATGGAATCCATCCCCTCTGTGAGCTGAGCTGCCTCCCACTGCTCGGCCTGTTTTTAAATGCTGTCCTTTTTTCTGCTAACTCTGCTGCTTCATGTTCTTTTCTAAAAACACAAAATGACCTTTTAGTCCTCAGGGCCTTGAGGATGAGGCAGCTTTCCATTTCCGTTTGAGGACCTACACAACCTTGATGCCCCTGCCAGCTTTCTCCTCTAGCTCACCTTTTCTTTAATTTATGAAGGGAGAGACTTAGAAAGGAGCAACAGCTTCCTGTAGTCCTTGAATCAGTTTGCTCTGCTCTAGAATCCCTGTAGCCGCCATAGCGAGGAGCCCTCAGCAGAAATGAAGGAGACCCAAAAGGCTAACTATGCTTTATGAAATGCTGAGGTCTCCCCTGGAGAATTTCCACCTGATAAACTGTGAAACGTCTGCAACATTGAGACTTTTCCTTACTTTCTCATTTGGAGGTCAGATTATAGAAACAACTGCTTTTCCCAGAATTGAACCTGCCTTCCTAACCAGACTTTCTTTTTGTAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGGTCTGTACAGTTCCTGTTGCTGCCAGGGTGGGCCCTGCCAGGCTGTTAGAATTGGGTATCCAAATGCTCTCCTGGCCTGTAAATCGAACCTGATACAATAAGCCACACTCCACTGTGGGTTTGAGGTCCATATTCAGGTGTAGATGACTCACATGTACTGCTGTCCACCTCCAGTCTCCCATGGTAGGCCTTAGAAAACATCCCTTGCTTCTGTCACATCTGACTGTTTTGGAGCCCCACGAAATTGCAGATTTCCCACAGGTGAGTTTTAACAGCCACCCCTGTTTTTCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGTGAGTGATACATGCCCCCGCCTCCTTTCCTCAAAAGGCTCTGCAAGGTCCAGGGACCCCAAGTCTCTACAAGGCTGCTAGGATTTTACCATTAGTCACTGGGCACAGAGGTGCTGTTTACAGGAAAGGGAAGACCTGGGTCAGGGAGCTGTGTGGTAAGATCAGGGTTCTATTTTGAATGTGTTAGTTTGGGAGATCTGGGAGATCCCCAAGTCAAATAGGAGGTGGGGGTTCCCATGTGGAGCTCAGAGGAGGGAGCTTGGCTGGAAATAGAAATATGGGAGTCATCCCCCTATAGGGTCTTCATGGCCATGAGAATGCATAGGATTACCTCAAGAAAGCGGGGAGGAAATGAAGAGTGCGGCACAACCAAGCCCTGAGGAGTTGACAGATGAGGATGCCAAATGCTGGGGTCCCCTCCTGTCTAGCTGGCAGTTGACTCTGCCTTGTCCACTGGCTCCTTCTCTCCTATCCTCTCCTGTCTCCTTACTGTCTCTTCGCATCCACTCCATTGCGTTCAGGCCACGTCAGCAGTCATCATGGTGGTCCTGAAACCTTGCTAAATACCCTAAAGTATAGACACAGTTACCATGGAGCCGGTGCTCCACTCCTAGGTATATGCTGCAGAGAGATGGAGATCTGTGTCCACACGGAAACTAATATGTGAATGTTCATGGCAGCATTACTCACAAGAGCCAAAAAAGTGGAAACAACCCAGACGTCCATCAGCTGATGGATTCATAAATAAAACATCAAATATATCCATAAATTGAATATTATTTTGGCCATAAAAAGAAGTGAAGTGCTGATACATGCTTACAATATGGATGCACTTGAAAACTTGATGCCAAATGAAAAAAGCCAGTCACAAAAGATCACATATTGTATGATTCCATTTATATGAAATGTCCAGAATAGACAAATCCATAGAGACAGAAAGTAGATGAGTGGTTGCCAGGGCCAGGAGTGGGAGAGTTGGAGAGATGAGGAGTGACTGCGCCAATGGGTAGAAGGTTTCTTTTTGGAGCGATGAAATGTTCTAAAATTGACTGTGGTGACAGTTGCAGAACTCTGTGAATATACTAAAAATGACTGAATTGTATGCTTTAAATGGGTGAACTGTATGGCATATGAACTATATCTCAGTAAAGCATTTTTTTTTGTTTTTTTTTAAACCCGATAGTGGTTTCCCACTGCACTGCATATACAAGCAAAACCTGCTGTGATCACCCGGCCTCCTCTCATGCCACTTTCCCCATCCCTCGCATATGCTCTGTCCACACTGGCTCTCTGTCAGGCGCCTGAACAGCCAATCCGCTGGCTGCCTTGGGGCCTTTGCTTTTGTCCTGTGTGCCTGAAACACTTACTCCAGCTGTCCTCCTCCATGTCTGGGCTCCCCTGCTGCTGCTGTCCCAGGAGGTGTCCCCTGTGGTCCTCCGTCATAGCTGCCTCAGAGCCTTCAGAGCACTGTCAGCATCTGGAATTCTTCCGTATGTACTGGCTACTGGTTTAGTGTCTATTCTCTTCCCTTTCAATCTCCTCACCACCATAGATGTTTTAAGAGCACAAAGATCTTACTTGGTTTTGCTCACCGTTCTTTCCCAGCACCAAGCATAGTGCCTGGCGCATAGCAGGGGCTGTGAAATATGTGAAGAATGAATGAATGTAGCCTGTGGCCCAAGCTTAAGGAGGATAGAAACCACGCCAGGGAGTGGTTTGGTCCATTGGCGCCTGTGGGTCTGACCCAAGTCTCTCACACAGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTAAGGGGCCTGCCTTGGGATCTGGAACTGGTCTGTCCTTCTTGTGCCCAGATCCCAAACTGCATGCTTTATTGCCAGGTGTTTTGTCTCCCTTATCAAAGTGAGCATGATTCACTCCTCAGTAATTGATTGAGTGTCCAGTCTGCTGTGGTAGGAAGATCCTGGTAGCCCCAGTCAGAAGGTGCTTCCTAACAAGGCAGCTGTTTCTCTTTCTTGACAACTATATCTTGTACCTCCAAAATCCCCACATGCTTCTGCCTCTTAACAGCATTTGGTGCAAACACAGGTATATATGTTTCTCTTTTTTGTACTCAGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTGCTATAACCCCCTTCTATTTTCCCTGACATTTTCCTCCTTTTCAAGCAGTCATGTAAACAGAGGAAAAATGTACACTGTGGGCAAGGGGAACATTGCCCACAGTGGTAGCCCACAAGGGAACATTGCCCACAGTGGCCCACCACCAACATTGGTTGGTCTCCCAAGAACTTAAACTTTCTTCCTTTTGGATGCCAAGGGCTTTTCTTCTCTTAGTCTGGAATTAATCTGAATCGAGGTGGAGTTAGTATGTCTAGAGGGTGCTCAGTCTTAGCCAAACAGAACCCTAAATACAGGGGAAAGATCATGACCCCACACTTCCTCTCTCCTATGAGTCTTGAGTCCCTGCTTCAGAATCTTATTCCTGAAAGGTTTCCATCTTTCTCCCGTTGCTTCTGGGATTCCTAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGTAAGGAGACAGGAGAGCGCAGTGAGGACCAAGCCTCTGCCCTGACTTGCAAGGGTGCATCATACCTCTGCAGTCTCAGGGCTTGAGAGCCGCCTCCCCTCCCACGGTGTCTCCACTGTGAGCTCCTTATCTTACAGGTCCCAGGTGAATAATGAGTGCTTTTGTTTCTCTAGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1转录物变体1或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4或特征性部分相同的核苷酸序列。在某些实施例中,编码的人ADAR1氨基酸序列与SEQ ID NO:5或SEQ ID NO:6的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:5或SEQ ID NO:6的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:5或SEQ ID NO:6。
SEQ ID NO:2-人ADAR1-转录物变体1cDNA序列
GAACCGGAGCCATCTTGGGCCCGGCGCGCAGACCCGCGGAGTTTCCCGTGCCGACGCCCCGGGGCCACTTCCAGTGCGGAGTAGCGGAGGCGTGGGGGCCTCGAGGGGCTGGCGCGGCCCAGCGGTCGGGCCAGGGTCGTGCCGCCGGCGGGTCGGGCCGGGCAATGCCTCGCGGGCGCAATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
SEQ ID NO:3-人ADAR1-示例性转录物变体1编码序列
ATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:4-人ADAR1-转录物变体1编码序列
ATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:5-人ADAR1-示例性转录物变体1氨基酸序列(又名同种型-a,和/或p150)
MNPRQGYSLSGYYTHPFQGYEHRQLRYQQPGPGSSPSSFLLKQIEFLKGQLPEAPVIGKQTPSLPPSLPGLRPRFPVLLASSTRGRQVDIRGVPRGVHLGSQGLQRGFQHPSPRGRSLPQRGVDCLSSHFQELSIYQDQEQRILKFLEELGEGKATTAHDLSGKLGTPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSGVVRPDGHSQGAPNSDPSLEPEDRNSTSVSEDLLEPFIAVSAQAWNQHSGVVRPDSHSQGSPNSDPGLEPEDSNSTSALEDPLEFLDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNAEFLTCNIPTSNASNNMVTTEKVENGQEPVIKLENRQEARPEPARLKPPVHYNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTAESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMASDNQPEGMISESLDNLESMMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIIMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNFYLCPV
SEQ ID NO:6-人ADAR1-转录物变体1氨基酸序列(又名同种型-a,和/或p150)
MNPRQGYSLSGYYTHPFQGYEHRQLRYQQPGPGSSPSSFLLKQIEFLKGQLPEAPVIGKQTPSLPPSLPGLRPRFPVLLASSTRGRQVDIRGVPRGVHLRSQGLQRGFQHPSPRGRSLPQRGVDCLSSHFQELSIYQDQEQRILKFLEELGEGKATTAHDLSGKLGTPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSGVVRPDGHSQGAPNSDPSLEPEDRNSTSVSEDLLEPFIAVSAQAWNQHSGVVRPDSHSQGSPNSDPGLEPEDSNSTSALEDPLEFLDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNAEFLTCNIPTSNASNNMVTTEKVENGQEPVIKLENRQEARPEPARLKPPVHYNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTAESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMASDNQPEGMISESLDNLESMMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIIMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNFYLCPV
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1转录物变体2或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:7或SEQ ID NO:8或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ ID NO:7或SEQ ID NO:8或特征性部分相同的核苷酸序列。在某些实施例中,编码的人ADAR1氨基酸序列与SEQ ID NO:9或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:9或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:7-人ADAR1-转录物变体2cDNA序列
GAACCGGAGCCATCTTGGGCCCGGCGCGCAGACCCGCGGAGTTTCCCGTGCCGACGCCCCGGGGCCACTTCCAGTGCGGAGTAGCGGAGGCGTGGGGGCCTCGAGGGGCTGGCGCGGCCCAGCGGTCGGGCCAGGGTCGTGCCGCCGGCGGGTCGGGCCGGGCAATGCCTCGCGGGCGCAATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
SEQ ID NO:8-人ADAR1-转录物变体2编码序列
ATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:9-人ADAR1-转录物变体2氨基酸序列(又名同种型-b)
MNPRQGYSLSGYYTHPFQGYEHRQLRYQQPGPGSSPSSFLLKQIEFLKGQLPEAPVIGKQTPSLPPSLPGLRPRFPVLLASSTRGRQVDIRGVPRGVHLRSQGLQRGFQHPSPRGRSLPQRGVDCLSSHFQELSIYQDQEQRILKFLEELGEGKATTAHDLSGKLGTPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSGVVRPDGHSQGAPNSDPSLEPEDRNSTSVSEDLLEPFIAVSAQAWNQHSGVVRPDSHSQGSPNSDPGLEPEDSNSTSALEDPLEFLDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNAEFLTCNIPTSNASNNMVTTEKVENGQEPVIKLENRQEARPEPARLKPPVHYNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTAESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMASDNQPEGMISESLDNLESMMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTELPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIIMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNFYLCPV
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1转录物变体3或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:10或SEQ ID NO:11或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,人ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ IDNO:10或SEQ ID NO:11或特征性部分相同的核苷酸序列。在某些实施例中,编码的人ADAR1氨基酸序列与SEQ ID NO:12或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:12或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:10-人ADAR1-转录物变体3cDNA序列
GAACCGGAGCCATCTTGGGCCCGGCGCGCAGACCCGCGGAGTTTCCCGTGCCGACGCCCCGGGGCCACTTCCAGTGCGGAGTAGCGGAGGCGTGGGGGCCTCGAGGGGCTGGCGCGGCCCAGCGGTCGGGCCAGGGTCGTGCCGCCGGCGGGTCGGGCCGGGCAATGCCTCGCGGGCGCAATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
SEQ ID NO:11-人ADAR1-转录物变体3编码序列
ATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:12-人ADAR1-转录物变体3氨基酸序列
MNPRQGYSLSGYYTHPFQGYEHRQLRYQQPGPGSSPSSFLLKQIEFLKGQLPEAPVIGKQTPSLPPSLPGLRPRFPVLLASSTRGRQVDIRGVPRGVHLRSQGLQRGFQHPSPRGRSLPQRGVDCLSSHFQELSIYQDQEQRILKFLEELGEGKATTAHDLSGKLGTPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSGVVRPDGHSQGAPNSDPSLEPEDRNSTSVSEDLLEPFIAVSAQAWNQHSGVVRPDSHSQGSPNSDPGLEPEDSNSTSALEDPLEFLDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNAEFLTCNIPTSNASNNMVTTEKVENGQEPVIKLENRQEARPEPARLKPPVHYNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTAESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMASDNQVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTELPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIIMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNFYLCPV
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1转录物变体4或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:13、SEQ ID NO:14或SEQ ID NO:15或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ ID NO:13、SEQ ID NO:14或SEQ ID NO:15或特征性部分相同的核苷酸序列。在某些实施例中,编码的人ADAR1氨基酸序列与SEQ ID NO:16或特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:16或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:13-人ADAR1-转录物变体4cDNA序列
ATTGATTCCCGACTGAAGGTAGAGAAGGCTACGTGGTGGGGGAGGGTGGGGGGAGGGTCGCGGCCGCACTGGCAGTCTCCGGGTGTCCGGCCGTGTCCCGAGGAAGTGCAAGACCCGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
SEQ ID NO:14-人ADAR1-示例性p110转录物变体编码序列
ATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTAAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:15-人ADAR1-转录物变体4、5、7、8和9编码序列
ATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:16-人ADAR1-转录物变体4、5、7、8和9氨基酸序列(也称为同种型-d和/或p110)
MAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNAEFLTCNIPTSNASNNMVTTEKVENGQEPVIKLENRQEARPEPARLKPPVHYNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTAESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMASDNQPEGMISESLDNLESMMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIIMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNFYLCPV
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1转录物变体51或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:17或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ IDNO:17或特征性部分相同的核苷酸序列。在某些实施例中,编码的人ADAR1氨基酸序列与SEQID NO:16或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:16或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:17-人ADAR1-转录物变体5cDNA序列
CCTGGCCAGCATGGTGAAACCCCATCTCTACTAAAAATACAAAAATTAGCTGGGTGTGGTGGCGTGCGCCTGTAATCCCAGCTACTCCGGAGGCTGAGGCAGGAGAATCACTTGAACCCGGGAGGCGGAGATTGCAGTGAGCTGAGATCACACTGCACTCCAGCCTGATTGCAGTGAGCCGAGATCATGCCACTGCACTCCAGCTTGGCAACAGAGCGAGACTCCGTCTCACAAGAAAAAAAATAACCGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1转录物变体6或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:18或SEQ ID NO:19或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ ID NO:18或SEQ ID NO:19或特征性部分相同的核苷酸序列。在某些实施例中,编码的人ADAR1氨基酸序列与SEQ ID NO:20或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:20或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:18-人ADAR1-转录物变体6cDNA序列
TGATGTCACCAATCTGCGACCAGACCATTGATTCCCGACTGAAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
SEQ ID NO:19-人ADAR1-转录物变体6编码序列
ATGTCACCAATCTGCGACCAGACCATTGATTCCCGACTGAAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:20-人ADAR1-转录物变体6氨基酸序列(又名同种型-e)
MSPICDQTIDSRLKGYSLSGYYTHPFQGYEHRQLRYQQPGPGSSPSSFLLKQIEFLKGQLPEAPVIGKQTPSLPPSLPGLRPRFPVLLASSTRGRQVDIRGVPRGVHLRSQGLQRGFQHPSPRGRSLPQRGVDCLSSHFQELSIYQDQEQRILKFLEELGEGKATTAHDLSGKLGTPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSGVVRPDGHSQGAPNSDPSLEPEDRNSTSVSEDLLEPFIAVSAQAWNQHSGVVRPDSHSQGSPNSDPGLEPEDSNSTSALEDPLEFLDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNAEFLTCNIPTSNASNNMVTTEKVENGQEPVIKLENRQEARPEPARLKPPVHYNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTAESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMASDNQPEGMISESLDNLESMMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIIMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNFYLCPV
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1转录物变体7或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:21或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ IDNO:21或特征性部分相同的核苷酸序列。在某些实施例中,编码的人ADAR1氨基酸序列与SEQID NO:16或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:16或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:21-人ADAR1-转录物变体7cDNA序列
TGATGTCACCAATCTGCGACCAGACCATTGATTCCCGACTGAAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1转录物变体8或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:22或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ IDNO:22或特征性部分相同的核苷酸序列。在某些实施例中,编码的人ADAR1氨基酸序列与SEQID NO:16或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:16或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:22-人ADAR1-转录物变体8cDNA序列
GAACCGGAGCCATCTTGGGCCCGGCGCGCAGACCCGCGGAGTTTCCCGTGCCGACGCCCCGGGGCCACTTCCAGTGCGGAGTAGCGGAGGCGTGGGGGCCTCGAGGGGCTGGCGCGGCCCAGCGGTCGGGCCAGGGTCGTGCCGCCGGCGGGTCGGGCCGGGCAATGCCTCGCGGGCGCAATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1转录物变体9或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:23或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ IDNO:23或特征性部分相同的核苷酸序列。在某些实施例中,编码的人ADAR1氨基酸序列与SEQID NO:16或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:16或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:23-人ADAR1-转录物变体9cDNA序列
GGCGCGGAGAGAGGGAGGACCGGGCGTCATGCTGTTTCTGGCCTGAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCAGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或人ADAR1基因由以下表示或包含以下:编码人ADAR1转录物变体10或其特征性部分的序列。在某些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:24或SEQ ID NO:25或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或人ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ ID NO:24或SEQ ID NO:25或特征性部分相同的核苷酸序列。在某些实施例中,编码的人ADAR1氨基酸序列与SEQ ID NO:26或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:26或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:24-人ADAR1-转录物变体10cDNA序列
GAACCGGAGCCATCTTGGGCCCGGCGCGCAGACCCGCGGAGTTTCCCGTGCCGACGCCCCGGGGCCACTTCCAGTGCGGAGTAGCGGAGGCGTGGGGGCCTCGAGGGGCTGGCGCGGCCCAGCGGTCGGGCCAGGGTCGTGCCGCCGGCGGGTCGGGCCGGGCAATGCCTCGCGGGCGCAATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGGTACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCAGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGTGAGAGAGGTAGGTCGTAGCATTCCTCATCACATGGTCAGGGGATTTTTTTTTCTCCTTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTCCCCCAAGTGAAGAGGCAGAAACCTAAGAAGTTATCTTTTCTTTCTACCCAAAGCATACATAGTCACTGAGCACCTGCGGTCCATTTCCTCTTAAAAGTTTTGTTTTGATTTGTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGCGGTCTTGATTAGGTTTCAGTCAACTCTGGATCATGTCAGGGACTGATAATTTCATTTGTGGATTACGCAGACCCCTCTACTTCCCCTCTTTCCCTTCTGAGATTCTTTCCTTGTGATCTGAATGTCTCCTTTTCCCCCTCAGAGGGCAAAGAGGTGAACATAAAGGATTTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGCCACGGAAGTGTGATTGGAGCCTGCAGATAATGCCCAGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTATCACTTTCTCCGGCAGCTGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGCTGCTCAAGCAATAGCAGAGGTTTCACCCGGCAGGATGACACAGACCACTTCCCAGGGAGCACGGGCATGCCTTGGAATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCATTCCTAGGAATATTTTCCCCGCCAATGCTGGGCGTACACCCTAGCCAACGGGACAAATCCTAGAGGGTATAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTTAACGTCACTGTTCCACCCGGTGTAATATCTCTCATGACAGTGACACCAAGGGAAGTTGACTAAGTCACATGTAAATTAGGAGTGTTTTAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGATAACCTGTAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGGGCGCAGACCTGATCTTTATAGGGTTGACATAGAAAGCAGTAGTTGTGGGTGAAAGGGCAGGTTGTCTTCAAACTCTGTGAGGTAGAATCCTTTGTCTATACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCTCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAACTGTCAGTGCTTGAAACTGTTTCCTTTACTCATGTTGAAGGGACTTTGTTGGCTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGGTGCCGTGGTGATGGCTGCAGTCCAGTTTTGTGATGCTGCTTTTACGTGTCCCTCGATAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGAGCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGGGAACGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCATCCTCTGTCTGGTAGAGACATTCACATCTTTGCTTTTATTCTATGCTCTCTGTACTTTTGACCAAAAATTGACCAAAGTAAGAAAATGCAAGTTCTAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACTGGTAGGGAAGTGGCGCCTGTCTCCTGGAGTGGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGGCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCTCTTCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAGGTTGTTTGGCCTCTCTGGTCCATCTTGGGCATTAGGTTCTCCAGCAGAGCTCTGGCCAGCTGCCTCTTCTTTAACTGGGAACACAGGCTCTCACAAGATCAGAACCCCCACTCACCCCCAAGATCTTATCTAGCAAGCCTGTAGTATTCAGTTTCTGTTGTAGGAAGAGAGCGAGGCATCCCTGAATTCCACGCATCTGCTGGAAACGAGCCGTGTCAGATCGCACATCCCTGCGCCCCCATGCCCCTCTGAGTCACACAGGACAGAGGAGGCAGAGCTTCTGCCCACTGTTATCTTCACTTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGACCCTCCCTACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTCGTTGGTTTTTTGGAGTCTTGGTTGTGACTCCAAGAGCAGAGTGAGGAAGACCCCCAAGCATAGACTCGGGTACTGTGATGATGGCTGCAGTCCAGTTTTATGATTCTGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACAAGAATCTGAATTCTTAGAAA
SEQ ID NO:25-人ADAR1-转录物变体10编码序列
ATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:26-人ADAR1-转录物变体10氨基酸序列(又名同种型-f)
MAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNAEFLTCNIPTSNASNNMVTTEKVENGQEPVIKLENRQEARPEPARLKPPVHYNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTAESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMASDNQPEGMISESLDNLESMMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTELPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIIMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNFYLCPV
在一些实施例中,ADAR1多肽或其特征性部分,例如在工程化的细胞、组织、非人动物等中包含和/或表达的那些,是包含人ADAR1的一个或多个特征性序列元件或部分的多肽。在一些实施例中,ADAR1多肽或其特征性部分,例如在工程化的细胞、组织、非人动物等中包含和/或表达的那些,是包含人ADAR1 p110的一个或多个特征性序列元件或部分的多肽。在一些实施例中,ADAR1多肽或其特征性部分,例如在工程化的细胞、组织、非人动物等中包含和/或表达的那些,是包含ADAR1 p150的一个或多个特征性序列元件或部分的多肽。在一些实施例中,ADAR1多肽是或包含以下氨基酸序列,该氨基酸序列与SEQ ID NO:27-32的示例性人ADAR1 p110双链RNA结合结构域(dsRBD)氨基酸序列相同,相差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)同源性。在一些实施例中,ADAR1多肽是或包含以下氨基酸序列,该氨基酸序列与SEQ ID NO:33-37的示例性人ADAR1p110Z-DNA结合结构域氨基酸序列相同,相差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)同源性。在一些实施例中,ADAR1多肽是或包含以下氨基酸序列,该氨基酸序列与SEQ ID NO:38-40的示例性人ADAR1 p110脱氨酶结构域氨基酸序列相同,相差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)同源性。在一些实施例中,对于SEQ ID NO:27-40的两个或更多个或每个氨基酸序列,ADAR1多肽独立地包含相同或差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)同源性的氨基酸序列。
在某些实施例中,ADAR1多肽或其特征性部分(例如包含在工程化的细胞、组织或非人动物(例如啮齿类动物,例如,大鼠或小鼠)中)由以下表示或包含以下:一个或多个ADAR1双链RNA结合结构域(dsRBD)或其特征性部分。在某些实施例中,ADAR1 dsRBD氨基酸序列与SEQ ID NO:27-32的氨基酸序列相同,相差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)同源性。
SEQ ID NO:27-人ADAR1-氨基酸序列
PIQVLHEYGMKTKNIPVYECERSDVQIHVPTFTFRVTVGDITCTGEGTSKKLAKHRAAEAAINILK
SEQ ID NO:28-人ADAR1-氨基酸序列
NPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLE
SEQ ID NO:29-人ADAR1-氨基酸序列
SPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHG
SEQ ID NO:30-人ADAR1-氨基酸序列
NPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIG
SEQ ID NO:31-ADAR1-氨基酸序列
PKSLLQELAQKRKLPPEYELVKEEGPDHAPRFTVTVKVGGRTGEGEGSSKKEAKQRAAEAALRSLK
SEQ ID NO:32-ADAR1-氨基酸序列
NPV-GLLEYA------CEF-L--QSGPPHEPKF-YQV-VGGR--PPV-A-SKKBAKQ-AA--AM--L-G
在某些实施例中,ADAR1多肽或其特征性部分(例如包含在工程化的细胞、组织或非人动物(例如啮齿类动物,例如,大鼠或小鼠)中)由以下表示或包含以下:一个或多个ADAR1 Z-DNA结合结构域或其特征性部分。在某些实施例中,ADAR1 Z-DNA结合结构域氨基酸序列与SEQ ID NO:33-37的氨基酸序列相同,相差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)同源性。
SEQ ID NO:33-人ADAR1-氨基酸序列
DMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKK
SEQ ID NO:34-人ADAR1-氨基酸序列
IYQDQEQRILKFLEELGGKATTAHDLSGKLGTKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVST
SEQ ID NO:35-人ADAR1-氨基酸序列
LSIYQDQEQRILKFLEELGEGKATTAHDLSGKLGTPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAV
SEQ ID NO:36-人ADAR1-氨基酸序列
FLDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTD
SEQ ID NO:37-ADAR1-氨基酸序列
DAQECAEKILELLENLGEGKAATAIALERGLSTKREINRVLYDLERKGDVYREDGTPPRWFLTCAK
在某些实施例中,ADAR1多肽或其特征性部分(例如包含在工程化的细胞、组织或非人动物(例如啮齿类动物,例如,大鼠或小鼠)中)由以下表示或包含以下:一个或多个ADAR1脱氨酶结构域或其特征性部分。在某些实施例中,ADAR1脱氨酶结构域氨基酸序列与SEQ ID NO:38-40的氨基酸序列相同,相差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)同源性。
SEQ ID NO:38-人ADAR1-氨基酸序列
SLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNSQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTESRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSIYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKGLKDMGYGNWISKPQEEKNF
SEQ ID NO:39-人ADAR1-氨基酸序列
SHRCFTLTKILAAIIMKKMGVVVSLGTGNRCVKDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKSIFEPAKGGLQIKKTVSFHLYISTAPCGDGALFDKSCKLRTKVENGEGTIPDIVPTWDGIRERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGLRHPFIVNHPKSVNWCLADGLEILDGTRGTVPRNELSRVSKKNIFLLFKKLCSFRYRR.LSYGEAKKAARDYETAKKGLKDMGYGNWIPQEEKNFY
SEQ ID NO:40-ADAR1-氨基酸序列
VLEKFSLPTILAGVVMTNEKQVVSLGTGTKCISEKLSPNGLVLNDCHAEILARRGFLRFLYSELQLSIFEKNKEGYKLKSNVLFHLYISTLPCGDASIFSPLEKLRTKIEIGEGTVPDIVQTWDGIGERLLSMSCSDKIARWNVLGVQGALLSHFIEPIYLSSIVLGSLYSAEHLERALYGRLDPDGLPTPFRVNRPLSVNWSQGDELEILNGLTGKTSLGSPSRLCKKALFRLFQKLCSKLKRDISYAEAKEAASEYQEAKEALNKAGLGSWIPPEQDQFK
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或ADAR1基因由以下表示或包含以下:编码非人灵长类动物(NHP)ADAR1转录物或其特征性部分的序列。在一些实施例中,ADAR1多核苷酸或NHP ADAR1转录物是转录物变体X1。在某些实施例中,ADAR1多核苷酸或NHP ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:41或SEQ ID NO:42或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或NHP ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ ID NO:41或SEQ ID NO:42或特征性部分相同的核苷酸序列。在某些实施例中,编码的ADAR1氨基酸序列与SEQ ID NO:43或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:43或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:41-NHP ADAR1-转录物变体X1 cDNA序列
ATGATGTCACCAATCTGCGACCACACCATTGATTCCCGACTGAAGGTAGAGAGGGCTACGTGGTGGGGGAGGGCGGGGGGAGGGTATCGGCCGCACTGGCAGCCTCCGGGTGTTCGGCCGTGTCCGGAGGAAGTACAAGACCCGGGGTATTCCCTCAACGGATACTACCCCCATCCATTTCAAGGCTATGAGCACAGAAAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAATAGTTTCCTGCTTAAGCAAATAGAGTTTCTCAAGGGGCAGATCCCAGAAGCGCCGGTGATTGGAAAGCAGACACCATCACTGCCACCTTCCCTCCCAGGACTCCAGCCAAGGTTTCCAGTACTACCTGCCTCTAGTACCAGAGGCAGGCAAGTGGATATCAGGGGTGTCCCCAGGTGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGATTCCGCCACGGAGAGGTGTTGATTGCCTTTCCTCACAATTCCAGGAACTGAGTATCAACCAAGATCAGGAACAAAGGATCTTAAAGTTCTTGGAAGAGCTTGGGGAAGGGAAGGCCACTACAGCACATGATCTGTCTTGGAAACTGGGGGCTCCAAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCAGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCAAATTTGGAACCTGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTGAGCCTTTTATCTCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGAGTCGAGTTTGGAACCTGAAGACAGAAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTTGACATGGCTGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTCACCAAGGCCCGAGATATAAATGCCGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACACAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATAGTAACCACCGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGTCAGGAGGCAAGACCAGAACCAGTAAGACTGAAACCACCTGTTCATAACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAAAAAGAATCAGAGAAGACCACAGAGTCCCAGACCCCCACCCCTTCAGCTACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTCGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAGCCCAAGTTCCAGTACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCCCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCAACCAACTCCATGACTTCTGATGACCAGCCCGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCGTGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACTTGAACACCAATCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCTGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCTTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCGTTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTGAAGGGAGAAACTGTCAATGACTGCCATGCAGAAATCATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACCCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTCTATATCAGCACCGCTCCATGTGGAGATGGTGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGACTCCCGCCACTACCCTGTCTTTGAGAATCCCAAACAAGGCAAGCTCCGCACCAAGGTGGAAAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTACCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAATGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTTACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGGGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCGTATATGATTCCAAAAGGCAATCTGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGATGGTACCAGAGGCACCGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAAGCTTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCGGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGAGAGAGAGGTAGGTCGTAGCGTTCCTCATCACATGGTCAGGGGATTTTTTTTTCCTCCTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTTCCCCCAAGTGAAGAGGTAGAAACCTAAGAAGTTATCTTTTCTTTCTATAACTCAAAGCATACATAGTCACTGAGCACCTGCAGTCCATTTCCTCTTAAAAGTTTTTTTTTTTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGTGGTCTTGATTAGGTTTCAGTCAATTCTGGATCATGTCCGAGACTGATGATTTCTTTTGTGGATTACGCAGACCCCTCTACTTCCCCCTTCCCCTTCTGAGGTTCTTTCCTTGTGATCAGAATTTCTCCTTTTCTCCCTCAGAGGGTAAAAAGGTGAACTTAAAGGATCTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGTCACGGAAGTGTGATTGGAGCCTACAGATAATGCCCTGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTGCCCCTTTCCCCGGCAGCAGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGTTGCCCAAGCCATAGCGGAGGTTTCACCCAGCAAGGTGACACAGACCACTTCCCAGGAGCACGGGCATGCCTTGGGATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCACTCCTAGGAATTTGCCCTGCAAATGCTGGGCGTGCACCCTAGCCAACGTAGGAAAAAATCCAGGACAAATCCTAGAGGGTAGAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTCACGTCACTGTTCTACCCTGCATAATATCTCTCATGACAGTGACACCAAGAGAAGTTGACTAAGTCATATGTAAATTAGGAGTGTTTAAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGACAACCTATAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGAGCGCAGACCTGATCTTTATAGTGTTGACATAGAAAGCAGTAGTAGTGGGTGAAAGGACAGGTTGTCTTCAAACTCTGTGAGGTGGAATCTTTTGTCTACACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCCCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAATTGTCAATGCTTGAAACTATTTCTTTTACTCATGTTGAAGGGACTTTGTTGACTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGAGTGCCGTGATGGCTGCGGTCCAGTTTTGTGATTCTGCTTTTACGTGTTACTTGGTAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGACCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGAGAATGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCACCCTCTGTCTGGTAGAGACATTGACATCTTTGCTTTTATTCTATACCCTCGGTACTTTTGACCAAAAAATGACCAAAATAAGAAAATGCAACTTTAAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACCGGTAGGGAAATGATGCCTGTCTCCTGGGGTAGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGTCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAAGCTGTTTGGCCTCTCTGGTCCGTCTTGGGCATTAGATTCTCCAGCAGAGCTCTGGCCAGCTGCCTCCTCTTTAACTGGGAACACGGGCTCTCACAAGATCAGAACCCCCACTCACCCCTGAGATCTTATCTAGCAAGCCTGTAGTATTCCGTTTCTGTTGTAGGAAGAGCGCGAGGCATCCCTGAATTCCATGCATCTGCTGGAAATGAGCCGTGTCAGATCGCACACCCCCGCGCCCCCATGCCCCTCTGAGTCACACGGGACAGAGGAGGCAGAGCTTCCGCCCACTGTTATCTTCAATTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGCCCCTCCCCACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTTGTTGGTTTTTTGGAGTCTTGGTTTTGACTCCAAGAACAGAGTCAGGAAGACCCCAAGCATAGACTTGGGTACCGTGAAAATGGCTGCAGTCCAGTTTTATGATTCCGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACCAAGAATCTGAATTCTTA
SEQ ID NO:42-NHP ADAR1-转录物变体X1编码序列
ATGATGTCACCAATCTGCGACCACACCATTGATTCCCGACTGAAGGTAGAGAGGGCTACGTGGTGGGGGAGGGCGGGGGGAGGGTATCGGCCGCACTGGCAGCCTCCGGGTGTTCGGCCGTGTCCGGAGGAAGTACAAGACCCGGGGTATTCCCTCAACGGATACTACCCCCATCCATTTCAAGGCTATGAGCACAGAAAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAATAGTTTCCTGCTTAAGCAAATAGAGTTTCTCAAGGGGCAGATCCCAGAAGCGCCGGTGATTGGAAAGCAGACACCATCACTGCCACCTTCCCTCCCAGGACTCCAGCCAAGGTTTCCAGTACTACCTGCCTCTAGTACCAGAGGCAGGCAAGTGGATATCAGGGGTGTCCCCAGGTGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGATTCCGCCACGGAGAGGTGTTGATTGCCTTTCCTCACAATTCCAGGAACTGAGTATCAACCAAGATCAGGAACAAAGGATCTTAAAGTTCTTGGAAGAGCTTGGGGAAGGGAAGGCCACTACAGCACATGATCTGTCTTGGAAACTGGGGGCTCCAAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCAGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCAAATTTGGAACCTGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTGAGCCTTTTATCTCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGAGTCGAGTTTGGAACCTGAAGACAGAAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTTGACATGGCTGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTCACCAAGGCCCGAGATATAAATGCCGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACACAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATAGTAACCACCGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGTCAGGAGGCAAGACCAGAACCAGTAAGACTGAAACCACCTGTTCATAACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAAAAAGAATCAGAGAAGACCACAGAGTCCCAGACCCCCACCCCTTCAGCTACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTCGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAGCCCAAGTTCCAGTACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCCCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCAACCAACTCCATGACTTCTGATGACCAGCCCGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCGTGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACTTGAACACCAATCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCTGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCTTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCGTTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTGAAGGGAGAAACTGTCAATGACTGCCATGCAGAAATCATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACCCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTCTATATCAGCACCGCTCCATGTGGAGATGGTGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGACTCCCGCCACTACCCTGTCTTTGAGAATCCCAAACAAGGCAAGCTCCGCACCAAGGTGGAAAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTACCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAATGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTTACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGGGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCGTATATGATTCCAAAAGGCAATCTGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGATGGTACCAGAGGCACCGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAAGCTTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:43-NHP ADAR1-转录物变体X1氨基酸序列
MMSPICDHTIDSRLKVERATWWGRAGGGYRPHWQPPGVRPCPEEVQDPGYSLNGYYPHPFQGYEHRKLRYQQPGPGSSPNSFLLKQIEFLKGQIPEAPVIGKQTPSLPPSLPGLQPRFPVLPASSTRGRQVDIRGVPRCVHLGSQGLQRGFQHPSPRGRIPPRRGVDCLSSQFQELSINQDQEQRILKFLEELGEGKATTAHDLSWKLGAPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSRVVRPDGHSQGAPNSDPNLEPEDRNSTSVSEDLEPFISVSAQAWNQHSGVVRPDGHSQGAPNSESSLEPEDRNSTSALEDPLEFFDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNTEFLTCNIPTSNASNNIVTTEKVENGQEPVIKLENSQEARPEPVRLKPPVHNNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTTESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMTSDDQPEGMISESLDNLESVMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIVMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNPQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTDSRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSVYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKSLKDMGYGNWISKPQEEKNFYLCPV
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或ADAR1基因由以下表示或包含以下:编码非人灵长类动物(NHP)ADAR1转录物或其特征性部分的序列。在一些实施例中,NHP ADAR1转录物变体是转录物变体X2。在某些实施例中,ADAR1多核苷酸或NHP ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:44或SEQ ID NO:45或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或NHP ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ IDNO:44或SEQ ID NO:45或特征性部分相同的核苷酸序列。在某些实施例中,编码的ADAR1氨基酸序列与SEQ ID NO:46或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:46或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:44-NHP ADAR1-转录物变体X2 cDNA序列
ACGCCCGGCGCGCCAATGATGTCACCAATCTGCGACCACACCATTGATTCCCGACTGAAGGTAGAGAGGGCTACGTGGTGGGGGAGGGCGGGGGGAGGGTATCGGCCGCACTGGCAGCCTCCGGGTGTTCGGCCGTGTCCGGAGGAAGTACAAGACCCGGGGTATTCCCTCAACGGATACTACCCCCATCCATTTCAAGGCTATGAGCACAGAAAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAATAGTTTCCTGCTTAAGCAAATAGAGTTTCTCAAGGGGCAGATCCCAGAAGCGCCGGTGATTGGAAAGCAGACACCATCACTGCCACCTTCCCTCCCAGGACTCCAGCCAAGGTTTCCAGTACTACCTGCCTCTAGTACCAGAGGCAGGCAAGTGGATATCAGGGGTGTCCCCAGGTGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGATTCCGCCACGGAGAGGTGTTGATTGCCTTTCCTCACAATTCCAGGAACTGAGTATCAACCAAGATCAGGAACAAAGGATCTTAAAGTTCTTGGAAGAGCTTGGGGAAGGGAAGGCCACTACAGCACATGATCTGTCTTGGAAACTGGGGGCTCCAAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCAGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCAAATTTGGAACCTGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTGAGCCTTTTATCTCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGAGTCGAGTTTGGAACCTGAAGACAGAAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTTGACATGGCTGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTCACCAAGGCCCGAGATATAAATGCCGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACACAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATAGTAACCACCGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGTCAGGAGGCAAGACCAGAACCAGTAAGACTGAAACCACCTGTTCATAACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAAAAAGAATCAGAGAAGACCACAGAGTCCCAGACCCCCACCCCTTCAGCTACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTCGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAGCCCAAGTTCCAGTACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCCCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCAACCAACTCCATGACTTCTGATGACCAGCCCGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCGTGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACTTGAACACCAATCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCTGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCTTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCGTTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTGAAGGGAGAAACTGTCAATGACTGCCATGCAGAAATCATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACCCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTCTATATCAGCACCGCTCCATGTGGAGATGGTGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGACTCCCGCCACTACCCTGTCTTTGAGAATCCCAAACAAGGCAAGCTCCGCACCAAGGTGGAAAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTACCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAATGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTTACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGGGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCGTATATGATTCCAAAAGGCAATCTGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGATGGTACCAGAGGCACCGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAAGCTTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCGGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGAGAGAGAGGTAGGTCGTAGCGTTCCTCATCACATGGTCAGGGGATTTTTTTTTCCTCCTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTTCCCCCAAGTGAAGAGGTAGAAACCTAAGAAGTTATCTTTTCTTTCTATAACTCAAAGCATACATAGTCACTGAGCACCTGCAGTCCATTTCCTCTTAAAAGTTTTTTTTTTTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGTGGTCTTGATTAGGTTTCAGTCAATTCTGGATCATGTCCGAGACTGATGATTTCTTTTGTGGATTACGCAGACCCCTCTACTTCCCCCTTCCCCTTCTGAGGTTCTTTCCTTGTGATCAGAATTTCTCCTTTTCTCCCTCAGAGGGTAAAAAGGTGAACTTAAAGGATCTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGTCACGGAAGTGTGATTGGAGCCTACAGATAATGCCCTGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTGCCCCTTTCCCCGGCAGCAGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGTTGCCCAAGCCATAGCGGAGGTTTCACCCAGCAAGGTGACACAGACCACTTCCCAGGAGCACGGGCATGCCTTGGGATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCACTCCTAGGAATTTGCCCTGCAAATGCTGGGCGTGCACCCTAGCCAACGTAGGAAAAAATCCAGGACAAATCCTAGAGGGTAGAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTCACGTCACTGTTCTACCCTGCATAATATCTCTCATGACAGTGACACCAAGAGAAGTTGACTAAGTCATATGTAAATTAGGAGTGTTTAAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGACAACCTATAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGAGCGCAGACCTGATCTTTATAGTGTTGACATAGAAAGCAGTAGTAGTGGGTGAAAGGACAGGTTGTCTTCAAACTCTGTGAGGTGGAATCTTTTGTCTACACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCCCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAATTGTCAATGCTTGAAACTATTTCTTTTACTCATGTTGAAGGGACTTTGTTGACTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGAGTGCCGTGATGGCTGCGGTCCAGTTTTGTGATTCTGCTTTTACGTGTTACTTGGTAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGACCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGAGAATGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCACCCTCTGTCTGGTAGAGACATTGACATCTTTGCTTTTATTCTATACCCTCGGTACTTTTGACCAAAAAATGACCAAAATAAGAAAATGCAACTTTAAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACCGGTAGGGAAATGATGCCTGTCTCCTGGGGTAGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGTCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAAGCTGTTTGGCCTCTCTGGTCCGTCTTGGGCATTAGATTCTCCAGCAGAGCTCTGGCCAGCTGCCTCCTCTTTAACTGGGAACACGGGCTCTCACAAGATCAGAACCCCCACTCACCCCTGAGATCTTATCTAGCAAGCCTGTAGTATTCCGTTTCTGTTGTAGGAAGAGCGCGAGGCATCCCTGAATTCCATGCATCTGCTGGAAATGAGCCGTGTCAGATCGCACACCCCCGCGCCCCCATGCCCCTCTGAGTCACACGGGACAGAGGAGGCAGAGCTTCCGCCCACTGTTATCTTCAATTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGCCCCTCCCCACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTTGTTGGTTTTTTGGAGTCTTGGTTTTGACTCCAAGAACAGAGTCAGGAAGACCCCAAGCATAGACTTGGGTACCGTGAAAATGGCTGCAGTCCAGTTTTATGATTCCGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACCAAGAATCTGAATTCTTA
SEQ ID NO:45-NHP ADAR1-转录物变体X2编码序列
ATGATGTCACCAATCTGCGACCACACCATTGATTCCCGACTGAAGGTAGAGAGGGCTACGTGGTGGGGGAGGGCGGGGGGAGGGTATCGGCCGCACTGGCAGCCTCCGGGTGTTCGGCCGTGTCCGGAGGAAGTACAAGACCCGGGGTATTCCCTCAACGGATACTACCCCCATCCATTTCAAGGCTATGAGCACAGAAAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAATAGTTTCCTGCTTAAGCAAATAGAGTTTCTCAAGGGGCAGATCCCAGAAGCGCCGGTGATTGGAAAGCAGACACCATCACTGCCACCTTCCCTCCCAGGACTCCAGCCAAGGTTTCCAGTACTACCTGCCTCTAGTACCAGAGGCAGGCAAGTGGATATCAGGGGTGTCCCCAGGTGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGATTCCGCCACGGAGAGGTGTTGATTGCCTTTCCTCACAATTCCAGGAACTGAGTATCAACCAAGATCAGGAACAAAGGATCTTAAAGTTCTTGGAAGAGCTTGGGGAAGGGAAGGCCACTACAGCACATGATCTGTCTTGGAAACTGGGGGCTCCAAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCAGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCAAATTTGGAACCTGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTGAGCCTTTTATCTCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGAGTCGAGTTTGGAACCTGAAGACAGAAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTTGACATGGCTGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTCACCAAGGCCCGAGATATAAATGCCGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACACAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATAGTAACCACCGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGTCAGGAGGCAAGACCAGAACCAGTAAGACTGAAACCACCTGTTCATAACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAAAAAGAATCAGAGAAGACCACAGAGTCCCAGACCCCCACCCCTTCAGCTACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTCGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAGCCCAAGTTCCAGTACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCCCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCAACCAACTCCATGACTTCTGATGACCAGCCCGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCGTGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACTTGAACACCAATCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCTGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCTTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCGTTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTGAAGGGAGAAACTGTCAATGACTGCCATGCAGAAATCATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACCCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTCTATATCAGCACCGCTCCATGTGGAGATGGTGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGACTCCCGCCACTACCCTGTCTTTGAGAATCCCAAACAAGGCAAGCTCCGCACCAAGGTGGAAAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTACCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAATGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTTACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGGGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCGTATATGATTCCAAAAGGCAATCTGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGATGGTACCAGAGGCACCGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAAGCTTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:46-NHP ADAR1-转录变体X2氨基酸序列
MMSPICDHTIDSRLKVERATWWGRAGGGYRPHWQPPGVRPCPEEVQDPGYSLNGYYPHPFQGYEHRKLRYQQPGPGSSPNSFLLKQIEFLKGQIPEAPVIGKQTPSLPPSLPGLQPRFPVLPASSTRGRQVDIRGVPRCVHLGSQGLQRGFQHPSPRGRIPPRRGVDCLSSQFQELSINQDQEQRILKFLEELGEGKATTAHDLSWKLGAPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSRVVRPDGHSQGAPNSDPNLEPEDRNSTSVSEDLEPFISVSAQAWNQHSGVVRPDGHSQGAPNSESSLEPEDRNSTSALEDPLEFFDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNTEFLTCNIPTSNASNNIVTTEKVENGQEPVIKLENSQEARPEPVRLKPPVHNNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTTESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMTSDDQPEGMISESLDNLESVMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTELPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIVMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNPQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTDSRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSVYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKSLKDMGYGNWISKPQEEKNFYLCPV
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或ADAR1基因由以下表示或包含以下:编码非人灵长类动物(NHP)ADAR1转录物变体或其特征性部分的序列。在一些实施例中,NHP ADAR1转录物变体是转录物变体X3。在某些实施例中,ADAR1多核苷酸或NHP ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:47或SEQ ID NO:48或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或NHP ADAR1基因包含以下或由以下组成:与核苷酸序列SEQID NO:47或SEQ ID NO:48或特征性部分相同的核苷酸序列。在某些实施例中,编码的ADAR1氨基酸序列与SEQ ID NO:49或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:49或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:47-NHP ADAR1-转录物变体X3 cDNA序列
ACGCCCGGCGCGCCAATGATGTCACCAATCTGCGACCACACCATTGATTCCCGACTGAAGGGGTATTCCCTCAACGGATACTACCCCCATCCATTTCAAGGCTATGAGCACAGAAAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAATAGTTTCCTGCTTAAGCAAATAGAGTTTCTCAAGGGGCAGATCCCAGAAGCGCCGGTGATTGGAAAGCAGACACCATCACTGCCACCTTCCCTCCCAGGACTCCAGCCAAGGTTTCCAGTACTACCTGCCTCTAGTACCAGAGGCAGGCAAGTGGATATCAGGGGTGTCCCCAGGTGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGATTCCGCCACGGAGAGGTGTTGATTGCCTTTCCTCACAATTCCAGGAACTGAGTATCAACCAAGATCAGGAACAAAGGATCTTAAAGTTCTTGGAAGAGCTTGGGGAAGGGAAGGCCACTACAGCACATGATCTGTCTTGGAAACTGGGGGCTCCAAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCAGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCAAATTTGGAACCTGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTGAGCCTTTTATCTCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGAGTCGAGTTTGGAACCTGAAGACAGAAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTTGACATGGCTGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTCACCAAGGCCCGAGATATAAATGCCGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACACAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATAGTAACCACCGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGTCAGGAGGCAAGACCAGAACCAGTAAGACTGAAACCACCTGTTCATAACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAAAAAGAATCAGAGAAGACCACAGAGTCCCAGACCCCCACCCCTTCAGCTACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTCGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAGCCCAAGTTCCAGTACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCCCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCAACCAACTCCATGACTTCTGATGACCAGCCCGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCGTGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACTTGAACACCAATCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCTGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCTTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCGTTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTGAAGGGAGAAACTGTCAATGACTGCCATGCAGAAATCATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACCCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTCTATATCAGCACCGCTCCATGTGGAGATGGTGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGACTCCCGCCACTACCCTGTCTTTGAGAATCCCAAACAAGGCAAGCTCCGCACCAAGGTGGAAAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTACCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAATGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTTACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGGGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCGTATATGATTCCAAAAGGCAATCTGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGATGGTACCAGAGGCACCGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAAGCTTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCGGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGAGAGAGAGGTAGGTCGTAGCGTTCCTCATCACATGGTCAGGGGATTTTTTTTTCCTCCTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTTCCCCCAAGTGAAGAGGTAGAAACCTAAGAAGTTATCTTTTCTTTCTATAACTCAAAGCATACATAGTCACTGAGCACCTGCAGTCCATTTCCTCTTAAAAGTTTTTTTTTTTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGTGGTCTTGATTAGGTTTCAGTCAATTCTGGATCATGTCCGAGACTGATGATTTCTTTTGTGGATTACGCAGACCCCTCTACTTCCCCCTTCCCCTTCTGAGGTTCTTTCCTTGTGATCAGAATTTCTCCTTTTCTCCCTCAGAGGGTAAAAAGGTGAACTTAAAGGATCTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGTCACGGAAGTGTGATTGGAGCCTACAGATAATGCCCTGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTGCCCCTTTCCCCGGCAGCAGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGTTGCCCAAGCCATAGCGGAGGTTTCACCCAGCAAGGTGACACAGACCACTTCCCAGGAGCACGGGCATGCCTTGGGATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCACTCCTAGGAATTTGCCCTGCAAATGCTGGGCGTGCACCCTAGCCAACGTAGGAAAAAATCCAGGACAAATCCTAGAGGGTAGAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTCACGTCACTGTTCTACCCTGCATAATATCTCTCATGACAGTGACACCAAGAGAAGTTGACTAAGTCATATGTAAATTAGGAGTGTTTAAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGACAACCTATAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGAGCGCAGACCTGATCTTTATAGTGTTGACATAGAAAGCAGTAGTAGTGGGTGAAAGGACAGGTTGTCTTCAAACTCTGTGAGGTGGAATCTTTTGTCTACACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCCCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAATTGTCAATGCTTGAAACTATTTCTTTTACTCATGTTGAAGGGACTTTGTTGACTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGAGTGCCGTGATGGCTGCGGTCCAGTTTTGTGATTCTGCTTTTACGTGTTACTTGGTAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGACCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGAGAATGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCACCCTCTGTCTGGTAGAGACATTGACATCTTTGCTTTTATTCTATACCCTCGGTACTTTTGACCAAAAAATGACCAAAATAAGAAAATGCAACTTTAAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACCGGTAGGGAAATGATGCCTGTCTCCTGGGGTAGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGTCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAAGCTGTTTGGCCTCTCTGGTCCGTCTTGGGCATTAGATTCTCCAGCAGAGCTCTGGCCAGCTGCCTCCTCTTTAACTGGGAACACGGGCTCTCACAAGATCAGAACCCCCACTCACCCCTGAGATCTTATCTAGCAAGCCTGTAGTATTCCGTTTCTGTTGTAGGAAGAGCGCGAGGCATCCCTGAATTCCATGCATCTGCTGGAAATGAGCCGTGTCAGATCGCACACCCCCGCGCCCCCATGCCCCTCTGAGTCACACGGGACAGAGGAGGCAGAGCTTCCGCCCACTGTTATCTTCAATTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGCCCCTCCCCACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTTGTTGGTTTTTTGGAGTCTTGGTTTTGACTCCAAGAACAGAGTCAGGAAGACCCCAAGCATAGACTTGGGTACCGTGAAAATGGCTGCAGTCCAGTTTTATGATTCCGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACCAAGAATCTGAATTCTTA
SEQ ID NO:48-NHP ADAR1-转录物变体X3编码序列
ATGATGTCACCAATCTGCGACCACACCATTGATTCCCGACTGAAGGGGTATTCCCTCAACGGATACTACCCCCATCCATTTCAAGGCTATGAGCACAGAAAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAATAGTTTCCTGCTTAAGCAAATAGAGTTTCTCAAGGGGCAGATCCCAGAAGCGCCGGTGATTGGAAAGCAGACACCATCACTGCCACCTTCCCTCCCAGGACTCCAGCCAAGGTTTCCAGTACTACCTGCCTCTAGTACCAGAGGCAGGCAAGTGGATATCAGGGGTGTCCCCAGGTGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGATTCCGCCACGGAGAGGTGTTGATTGCCTTTCCTCACAATTCCAGGAACTGAGTATCAACCAAGATCAGGAACAAAGGATCTTAAAGTTCTTGGAAGAGCTTGGGGAAGGGAAGGCCACTACAGCACATGATCTGTCTTGGAAACTGGGGGCTCCAAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCAGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCAAATTTGGAACCTGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTGAGCCTTTTATCTCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGAGTCGAGTTTGGAACCTGAAGACAGAAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTTGACATGGCTGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTCACCAAGGCCCGAGATATAAATGCCGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACACAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATAGTAACCACCGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGTCAGGAGGCAAGACCAGAACCAGTAAGACTGAAACCACCTGTTCATAACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAAAAAGAATCAGAGAAGACCACAGAGTCCCAGACCCCCACCCCTTCAGCTACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTCGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAGCCCAAGTTCCAGTACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCCCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCAACCAACTCCATGACTTCTGATGACCAGCCCGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCGTGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACTTGAACACCAATCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCTGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCTTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCGTTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTGAAGGGAGAAACTGTCAATGACTGCCATGCAGAAATCATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACCCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTCTATATCAGCACCGCTCCATGTGGAGATGGTGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGACTCCCGCCACTACCCTGTCTTTGAGAATCCCAAACAAGGCAAGCTCCGCACCAAGGTGGAAAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTACCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAATGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTTACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGGGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCGTATATGATTCCAAAAGGCAATCTGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGATGGTACCAGAGGCACCGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAAGCTTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:49-NHP ADAR1-转录变体X3氨基酸序列
MMSPICDHTIDSRLKGYSLNGYYPHPFQGYEHRKLRYQQPGPGSSPNSFLLKQIEFLKGQIPEAPVIGKQTPSLPPSLPGLQPRFPVLPASSTRGRQVDIRGVPRCVHLGSQGLQRGFQHPSPRGRIPPRRGVDCLSSQFQELSINQDQEQRILKFLEELGEGKATTAHDLSWKLGAPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSRVVRPDGHSQGAPNSDPNLEPEDRNSTSVSEDLEPFISVSAQAWNQHSGVVRPDGHSQGAPNSESSLEPEDRNSTSALEDPLEFFDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNTEFLTCNIPTSNASNNIVTTEKVENGQEPVIKLENSQEARPEPVRLKPPVHNNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTTESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMTSDDQPEGMISESLDNLESVMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIVMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNPQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTDSRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSVYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKSLKDMGYGNWISKPQEEKNFYLCPV
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或ADAR1基因由以下表示或包含以下:编码非人灵长类动物(NHP)ADAR1转录物的序列。在一些实施例中,NHP ADAR1转录物变体是预测的转录物变体X4。在某些实施例中,ADAR1多核苷酸或NHP ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:50或SEQ ID NO:51或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或NHP ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ ID NO:50或SEQ ID NO:51或特征性部分相同的核苷酸序列。在某些实施例中,编码的ADAR1氨基酸序列与SEQ ID NO:52或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ IDNO:52或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:50-NHP ADAR1-转录物变体X4 cDNA序列TCCTCTTGGCCAAACTTTCCGGAGGGGAAGGCTTTCAGAGGAAACGAAAGCGAAATTGAACCGGAGCCATCTTGGGCCCGGCGCGCAGACCCGCAGAGTTTCCTGTGCCGACGCCTCGGGCTACTTGCAGTGCGAAGCAGCAGGGGTGTGGGGGCCTCGAGGGGCTGGCGCGGCCCAGCGGTCTGGCCAGGGTCGTGCCGCCGGCGGGTCGGGTTGGGTCGGGCAATGCCTCTCCGGCGCCATGAACCCGCGGCAGGGGTATTCCCTCAACGGATACTACCCCCATCCATTTCAAGGCTATGAGCACAGAAAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAATAGTTTCCTGCTTAAGCAAATAGAGTTTCTCAAGGGGCAGATCCCAGAAGCGCCGGTGATTGGAAAGCAGACACCATCACTGCCACCTTCCCTCCCAGGACTCCAGCCAAGGTTTCCAGTACTACCTGCCTCTAGTACCAGAGGCAGGCAAGTGGATATCAGGGGTGTCCCCAGGTGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGATTCCGCCACGGAGAGGTGTTGATTGCCTTTCCTCACAATTCCAGGAACTGAGTATCAACCAAGATCAGGAACAAAGGATCTTAAAGTTCTTGGAAGAGCTTGGGGAAGGGAAGGCCACTACAGCACATGATCTGTCTTGGAAACTGGGGGCTCCAAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCAGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCAAATTTGGAACCTGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTGAGCCTTTTATCTCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGAGTCGAGTTTGGAACCTGAAGACAGAAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTTGACATGGCTGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTCACCAAGGCCCGAGATATAAATGCCGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACACAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATAGTAACCACCGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGTCAGGAGGCAAGACCAGAACCAGTAAGACTGAAACCACCTGTTCATAACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAAAAAGAATCAGAGAAGACCACAGAGTCCCAGACCCCCACCCCTTCAGCTACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTCGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAGCCCAAGTTCCAGTACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCCCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCAACCAACTCCATGACTTCTGATGACCAGCCCGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCGTGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACTTGAACACCAATCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCTGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCTTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCGTTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTGAAGGGAGAAACTGTCAATGACTGCCATGCAGAAATCATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACCCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTCTATATCAGCACCGCTCCATGTGGAGATGGTGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGACTCCCGCCACTACCCTGTCTTTGAGAATCCCAAACAAGGCAAGCTCCGCACCAAGGTGGAAAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTACCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAATGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTTACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGGGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCGTATATGATTCCAAAAGGCAATCTGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGATGGTACCAGAGGCACCGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAAGCTTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCGGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGAGAGAGAGGTAGGTCGTAGCGTTCCTCATCACATGGTCAGGGGATTTTTTTTTCCTCCTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTTCCCCCAAGTGAAGAGGTAGAAACCTAAGAAGTTATCTTTTCTTTCTATAACTCAAAGCATACATAGTCACTGAGCACCTGCAGTCCATTTCCTCTTAAAAGTTTTTTTTTTTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGTGGTCTTGATTAGGTTTCAGTCAATTCTGGATCATGTCCGAGACTGATGATTTCTTTTGTGGATTACGCAGACCCCTCTACTTCCCCCTTCCCCTTCTGAGGTTCTTTCCTTGTGATCAGAATTTCTCCTTTTCTCCCTCAGAGGGTAAAAAGGTGAACTTAAAGGATCTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGTCACGGAAGTGTGATTGGAGCCTACAGATAATGCCCTGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTGCCCCTTTCCCCGGCAGCAGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGTTGCCCAAGCCATAGCGGAGGTTTCACCCAGCAAGGTGACACAGACCACTTCCCAGGAGCACGGGCATGCCTTGGGATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCACTCCTAGGAATTTGCCCTGCAAATGCTGGGCGTGCACCCTAGCCAACGTAGGAAAAAATCCAGGACAAATCCTAGAGGGTAGAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTCACGTCACTGTTCTACCCTGCATAATATCTCTCATGACAGTGACACCAAGAGAAGTTGACTAAGTCATATGTAAATTAGGAGTGTTTAAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGACAACCTATAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGAGCGCAGACCTGATCTTTATAGTGTTGACATAGAAAGCAGTAGTAGTGGGTGAAAGGACAGGTTGTCTTCAAACTCTGTGAGGTGGAATCTTTTGTCTACACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCCCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAATTGTCAATGCTTGAAACTATTTCTTTTACTCATGTTGAAGGGACTTTGTTGACTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGAGTGCCGTGATGGCTGCGGTCCAGTTTTGTGATTCTGCTTTTACGTGTTACTTGGTAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGACCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGAGAATGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCACCCTCTGTCTGGTAGAGACATTGACATCTTTGCTTTTATTCTATACCCTCGGTACTTTTGACCAAAAAATGACCAAAATAAGAAAATGCAACTTTAAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACCGGTAGGGAAATGATGCCTGTCTCCTGGGGTAGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGTCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAAGCTGTTTGGCCTCTCTGGTCCGTCTTGGGCATTAGATTCTCCAGCAGAGCTCTGGCCAGCTGCCTCCTCTTTAACTGGGAACACGGGCTCTCACAAGATCAGAACCCCCACTCACCCCTGAGATCTTATCTAGCAAGCCTGTAGTATTCCGTTTCTGTTGTAGGAAGAGCGCGAGGCATCCCTGAATTCCATGCATCTGCTGGAAATGAGCCGTGTCAGATCGCACACCCCCGCGCCCCCATGCCCCTCTGAGTCACACGGGACAGAGGAGGCAGAGCTTCCGCCCACTGTTATCTTCAATTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGCCCCTCCCCACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTTGTTGGTTTTTTGGAGTCTTGGTTTTGACTCCAAGAACAGAGTCAGGAAGACCCCAAGCATAGACTTGGGTACCGTGAAAATGGCTGCAGTCCAGTTTTATGATTCCGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACCAAGAATCTGAATTCTTA
SEQ ID NO:51-NHP ADAR1-转录物变体X4编码序列
ATGAACCCGCGGCAGGGGTATTCCCTCAACGGATACTACCCCCATCCATTTCAAGGCTATGAGCACAGAAAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAATAGTTTCCTGCTTAAGCAAATAGAGTTTCTCAAGGGGCAGATCCCAGAAGCGCCGGTGATTGGAAAGCAGACACCATCACTGCCACCTTCCCTCCCAGGACTCCAGCCAAGGTTTCCAGTACTACCTGCCTCTAGTACCAGAGGCAGGCAAGTGGATATCAGGGGTGTCCCCAGGTGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGATTCCGCCACGGAGAGGTGTTGATTGCCTTTCCTCACAATTCCAGGAACTGAGTATCAACCAAGATCAGGAACAAAGGATCTTAAAGTTCTTGGAAGAGCTTGGGGAAGGGAAGGCCACTACAGCACATGATCTGTCTTGGAAACTGGGGGCTCCAAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCAGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCAAATTTGGAACCTGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTGAGCCTTTTATCTCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGAGTCGAGTTTGGAACCTGAAGACAGAAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTTGACATGGCTGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTCACCAAGGCCCGAGATATAAATGCCGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACACAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATAGTAACCACCGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGTCAGGAGGCAAGACCAGAACCAGTAAGACTGAAACCACCTGTTCATAACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAAAAAGAATCAGAGAAGACCACAGAGTCCCAGACCCCCACCCCTTCAGCTACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTCGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAGCCCAAGTTCCAGTACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCCCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCAACCAACTCCATGACTTCTGATGACCAGCCCGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCGTGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACTTGAACACCAATCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCTGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCTTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCGTTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTGAAGGGAGAAACTGTCAATGACTGCCATGCAGAAATCATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACCCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTCTATATCAGCACCGCTCCATGTGGAGATGGTGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGACTCCCGCCACTACCCTGTCTTTGAGAATCCCAAACAAGGCAAGCTCCGCACCAAGGTGGAAAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTACCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAATGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTTACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGGGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCGTATATGATTCCAAAAGGCAATCTGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGATGGTACCAGAGGCACCGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAAGCTTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:52-NHP ADAR1-转录物变体X4氨基酸序列
NPRQGYSLNGYYPHPFQGYEHRKLRYQQPGPGSSPNSFLLKQIEFLKGQIPEAPVIGKQTPSLPPSLPGLQPRFPVLPASSTRGRQVDIRGVPRCVHLGSQGLQRGFQHPSPRGRIPPRRGVDCLSSQFQELSINQDQEQRILKFLEELGEGKATTAHDLSWKLGAPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSRVVRPDGHSQGAPNSDPNLEPEDRNSTSVSEDLEPFISVSAQAWNQHSGVVRPDGHSQGAPNSESSLEPEDRNSTSALEDPLEFFDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNTEFLTCNIPTSNASNNIVTTEKVENGQEPVIKLENSQEARPEPVRLKPPVHNNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTTESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMTSDDQPEGMISESLDNLESVMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTEVTPVTGASLRRTMLLLSRSPEAQPKTLPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIVMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNPQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTDSRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSVYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKSLKDMGYGNWISKPQEEKNFYLCPV
在某些实施例中,掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ADAR1多核苷酸或ADAR1基因由以下表示或包含以下:编码非人灵长类动物(NHP)ADAR1转录物变体的序列。在一些实施例中,NHP ADAR1转录物变体是预测的转录物变体X5。在某些实施例中,ADAR1多核苷酸或NHP ADAR1基因包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQID NO:53或SEQ ID NO:54或其特征性部分的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,ADAR1多核苷酸或NHP ADAR1基因包含以下或由以下组成:与核苷酸序列SEQ ID NO:53或SEQ ID NO:54或特征性部分相同的核苷酸序列。在某些实施例中,编码的ADAR1氨基酸序列与SEQ ID NO:55或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在某些实施例中,编码和/或表达的ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ IDNO:55或其特征性部分的氨基酸序列相同、差异不超过1、2、3、4、5、6、7、8、9或10个氨基酸,或具有至少90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:53-NHP ADAR1-转录物变体X5 cDNA序列
CCTCTTGGCCAAACTTTCCGGAGGGGAAGGCTTTCAGAGGAAACGAAAGCGAAATTGAACCGGAGCCATCTTGGGCCCGGCGCGCAGACCCGCAGAGTTTCCTGTGCCGACGCCTCGGGCTACTTGCAGTGCGAAGCAGCAGGGGTGTGGGGGCCTCGAGGGGCTGGCGCGGCCCAGCGGTCTGGCCAGGGTCGTGCCGCCGGCGGGTCGGGTTGGGTCGGGCAATGCCTCTCCGGCGCCATGAACCCGCGGCAGGGGTATTCCCTCAACGGATACTACCCCCATCCATTTCAAGGCTATGAGCACAGAAAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAATAGTTTCCTGCTTAAGCAAATAGAGTTTCTCAAGGGGCAGATCCCAGAAGCGCCGGTGATTGGAAAGCAGACACCATCACTGCCACCTTCCCTCCCAGGACTCCAGCCAAGGTTTCCAGTACTACCTGCCTCTAGTACCAGAGGCAGGCAAGTGGATATCAGGGGTGTCCCCAGGTGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGATTCCGCCACGGAGAGGTGTTGATTGCCTTTCCTCACAATTCCAGGAACTGAGTATCAACCAAGATCAGGAACAAAGGATCTTAAAGTTCTTGGAAGAGCTTGGGGAAGGGAAGGCCACTACAGCACATGATCTGTCTTGGAAACTGGGGGCTCCAAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCAGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCAAATTTGGAACCTGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTGAGCCTTTTATCTCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGAGTCGAGTTTGGAACCTGAAGACAGAAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTTGACATGGCTGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTCACCAAGGCCCGAGATATAAATGCCGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACACAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATAGTAACCACCGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGTCAGGAGGCAAGACCAGAACCAGTAAGACTGAAACCACCTGTTCATAACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAAAAAGAATCAGAGAAGACCACAGAGTCCCAGACCCCCACCCCTTCAGCTACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTCGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAGCCCAAGTTCCAGTACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCCCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCAACCAACTCCATGACTTCTGATGACCAGCCCGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCGTGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACTTGAACACCAATCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCTGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCTTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCGTTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTGAAGGGAGAAACTGTCAATGACTGCCATGCAGAAATCATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACCCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTCTATATCAGCACCGCTCCATGTGGAGATGGTGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGACTCCCGCCACTACCCTGTCTTTGAGAATCCCAAACAAGGCAAGCTCCGCACCAAGGTGGAAAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTACCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAATGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTTACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGGGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCGTATATGATTCCAAAAGGCAATCTGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGATGGTACCAGAGGCACCGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAAGCTTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGTATGCTCCGGTGACAGATGGATTAGGGTGTGTCATACTAGGGTGAGAGAGAGGTAGGTCGTAGCGTTCCTCATCACATGGTCAGGGGATTTTTTTTTCCTCCTTTTTTTTCTTTTTAAGCCATAATTGGTGATACTGAAAACTTTGGGTTCCCATTTATCCTGCTTTCTTTGGGATTGCTAGGCAAGGTCTGGCCAGGCCCCCCTTTTTTTCCCCCAAGTGAAGAGGTAGAAACCTAAGAAGTTATCTTTTCTTTCTATAACTCAAAGCATACATAGTCACTGAGCACCTGCAGTCCATTTCCTCTTAAAAGTTTTTTTTTTTTTCCATTTCCTTTCCCTTTGTGTTTGCTACACTGACCTCTTGTGGTCTTGATTAGGTTTCAGTCAATTCTGGATCATGTCCGAGACTGATGATTTCTTTTGTGGATTACGCAGACCCCTCTACTTCCCCCTTCCCCTTCTGAGGTTCTTTCCTTGTGATCAGAATTTCTCCTTTTCTCCCTCAGAGGGTAAAAAGGTGAACTTAAAGGATCTGGTGAAACATTTGTAAGGGTAGGAGTTGAAAACTGCAGTTCCCAGTGTCACGGAAGTGTGATTGGAGCCTACAGATAATGCCCTGCCATCCTCCCATCCTGCACTTTAGCCAGCTGCAGGGCGGGCAAGGCAAGGAAAGCTGCTTCCCTGGAAGTGTGCCCCTTTCCCCGGCAGCAGGGAAGTCTAGAACCAGCCAGACTGGGTTAAGGGAGTTGCCCAAGCCATAGCGGAGGTTTCACCCAGCAAGGTGACACAGACCACTTCCCAGGAGCACGGGCATGCCTTGGGATATTGCCAAGCTTCCAGCTGCCTCTTCTCCTAAAGCACTCCTAGGAATTTGCCCTGCAAATGCTGGGCGTGCACCCTAGCCAACGTAGGAAAAAATCCAGGACAAATCCTAGAGGGTAGAAAATCATCTCTGCTCAGATAATCATGACTTAGCAAGAATAAGGGCAAAAAATCCTGTTGGCTCACGTCACTGTTCTACCCTGCATAATATCTCTCATGACAGTGACACCAAGAGAAGTTGACTAAGTCATATGTAAATTAGGAGTGTTTAAAAGAATGCCATAGATGTTGATTCTTAACTGCTACAGACAACCTATAATTGAGCAGATTTAAAATTCAGGCATACTTTTCCATTTATCCAAGTGCTTTCATTTTTCCAGATGGCTTCAGAAGTAGGCTCGTGGGCAGAGCGCAGACCTGATCTTTATAGTGTTGACATAGAAAGCAGTAGTAGTGGGTGAAAGGACAGGTTGTCTTCAAACTCTGTGAGGTGGAATCTTTTGTCTACACCTCCATGAACATTGACTCGTGTGTTCAGAGCCTTTGGCCTCCCTGTGGAGTCTGGCTCTCTGGCTCCTGTGCATTCTTTGAATAGTCACTCGTAAAAATTGTCAATGCTTGAAACTATTTCTTTTACTCATGTTGAAGGGACTTTGTTGACTTTTAGAGTGTTGGTCATGACTCCAAGAGCAGAGCAGGGAAGAGCCCAAGCATAGACTTGAGTGCCGTGATGGCTGCGGTCCAGTTTTGTGATTCTGCTTTTACGTGTTACTTGGTAACAGTCAGCTAGACACACTCAGGAGGACTACTGAGGCTCTGCGACCTTCAGGACCTGAGCCTGCCTCTCTCCTTTAGATGACAGACCTTCATCTGAGAATGTGCTGAGCCAGCACCCTCAGATGATTTCCCTCCAAACTGCTGACTAGGTCACCCTCTGTCTGGTAGAGACATTGACATCTTTGCTTTTATTCTATACCCTCGGTACTTTTGACCAAAAAATGACCAAAATAAGAAAATGCAACTTTAAAAAATAGACTAAGGATGCCTTTGCAGAACACCAAAGCATCCCAAGGAACCGGTAGGGAAATGATGCCTGTCTCCTGGGGTAGAAGAGGCCTGCTCCCTGGCTCTGGGTCTGCTGGGGGCACAGTAAATCAGTCTTGGCACCCACATCCAGGTCAGAGAGGTCTGTGGTTCTCAGCATCAGAAGGCAGCGCAGCCCCTCTCCAGGCTACAGGGTTGTCACCTGCTGAGTCCTCAAGCTGTTTGGCCTCTCTGGTCCGTCTTGGGCATTAGATTCTCCAGCAGAGCTCTGGCCAGCTGCCTCCTCTTTAACTGGGAACACGGGCTCTCACAAGATCAGAACCCCCACTCACCCCTGAGATCTTATCTAGCAAGCCTGTAGTATTCCGTTTCTGTTGTAGGAAGAGCGCGAGGCATCCCTGAATTCCATGCATCTGCTGGAAATGAGCCGTGTCAGATCGCACACCCCCGCGCCCCCATGCCCCTCTGAGTCACACGGGACAGAGGAGGCAGAGCTTCCGCCCACTGTTATCTTCAATTTCTTTGTCCAGTCTTTTGTTTTTAATAAGCAGTGCCCCTCCCCACTCTTCTTTTTAATGATTTTTGTAGTTGATTTGTCTGAACTGTGGCTACTGTGCATTCCTTGAATAATCACTTGTAAAAATTGTCAGTGCTTGAAGCTGTTTCCTTTACTCACATTGAAGGGACTTTGTTGGTTTTTTGGAGTCTTGGTTTTGACTCCAAGAACAGAGTCAGGAAGACCCCAAGCATAGACTTGGGTACCGTGAAAATGGCTGCAGTCCAGTTTTATGATTCCGCTTTTATGTGTCCCTTGATAACAGTGACTTAACAATATACATTCCTCATAAATAAAAAAAAAACCAAGAATCTGAATTCTTA
SEQ ID NO:54-NHP ADAR1-转录物变体X5编码序列
ATGAACCCGCGGCAGGGGTATTCCCTCAACGGATACTACCCCCATCCATTTCAAGGCTATGAGCACAGAAAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAATAGTTTCCTGCTTAAGCAAATAGAGTTTCTCAAGGGGCAGATCCCAGAAGCGCCGGTGATTGGAAAGCAGACACCATCACTGCCACCTTCCCTCCCAGGACTCCAGCCAAGGTTTCCAGTACTACCTGCCTCTAGTACCAGAGGCAGGCAAGTGGATATCAGGGGTGTCCCCAGGTGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGATTCCGCCACGGAGAGGTGTTGATTGCCTTTCCTCACAATTCCAGGAACTGAGTATCAACCAAGATCAGGAACAAAGGATCTTAAAGTTCTTGGAAGAGCTTGGGGAAGGGAAGGCCACTACAGCACATGATCTGTCTTGGAAACTGGGGGCTCCAAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCAGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCAAATTTGGAACCTGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTGAGCCTTTTATCTCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGAGTCGAGTTTGGAACCTGAAGACAGAAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTTGACATGGCTGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTCACCAAGGCCCGAGATATAAATGCCGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACACAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATAGTAACCACCGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGTCAGGAGGCAAGACCAGAACCAGTAAGACTGAAACCACCTGTTCATAACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAAAAAGAATCAGAGAAGACCACAGAGTCCCAGACCCCCACCCCTTCAGCTACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTCGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAGCCCAAGTTCCAGTACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCCCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCAACCAACTCCATGACTTCTGATGACCAGCCCGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCGTGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACTTGAACACCAATCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCTGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGCTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCTTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCGTTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTGAAGGGAGAAACTGTCAATGACTGCCATGCAGAAATCATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACCCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTCTATATCAGCACCGCTCCATGTGGAGATGGTGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGACTCCCGCCACTACCCTGTCTTTGAGAATCCCAAACAAGGCAAGCTCCGCACCAAGGTGGAAAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTACCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAATGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTTACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGGGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCGTATATGATTCCAAAAGGCAATCTGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGATGGTACCAGAGGCACCGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAAGCTTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAG
SEQ ID NO:55-NHP ADAR1-转录变体X5氨基酸序列
MNPRQGYSLNGYYPHPFQGYEHRKLRYQQPGPGSSPNSFLLKQIEFLKGQIPEAPVIGKQTPSLPPSLPGLQPRFPVLPASSTRGRQVDIRGVPRCVHLGSQGLQRGFQHPSPRGRIPPRRGVDCLSSQFQELSINQDQEQRILKFLEELGEGKATTAHDLSWKLGAPKKEINRVLYSLAKKGKLQKEAGTPPLWKIAVSTQAWNQHSRVVRPDGHSQGAPNSDPNLEPEDRNSTSVSEDLEPFISVSAQAWNQHSGVVRPDGHSQGAPNSESSLEPEDRNSTSALEDPLEFFDMAEIKEKICDYLFNVSDSSALNLAKNIGLTKARDINAVLIDMERQGDVYRQGTTPPIWHLTDKKRERMQIKRNTNSVPETAPAAIPETKRNTEFLTCNIPTSNASNNIVTTEKVENGQEPVIKLENSQEARPEPVRLKPPVHNNGPSKAGYVDFENGQWATDDIPDDLNSIRAAPGEFRAIMEMPSFYSHGLPRCSPYKKLTECQLKNPISGLLEYAQFASQTCEFNMIEQSGPPHEPRFKFQVVINGREFPPAEAGSKKVAKQDAAMKAMTILLEEAKAKDSGKSEESSHYSTEKESEKTTESQTPTPSATSFFSGKSPVTTLLECMHKLGNSCEFRLLSKEGPAHEPKFQYCVAVGAQTFPSVSAPSKKVAKQMAAEEAMKALHGEATNSMTSDDQPEGMISESLDNLESVMPNKVRKIGELVRYLNTNPVGGLLEYARSHGFAAEFKLVDQSGPPHEPKFVYQAKVGGRWFPAVCAHSKKQGKQEAADAALRVLIGENEKAERMGFTELPLTGSTFHDQIAMLSHRCFNTLTNSFQPSLLGRKILAAIVMKKDSEDMGVVVSLGTGNRCVKGDSLSLKGETVNDCHAEIISRRGFIRFLYSELMKYNPQTAKDSIFEPAKGGEKLQIKKTVSFHLYISTAPCGDGALFDKSCSDRAMESTDSRHYPVFENPKQGKLRTKVENGEGTIPVESSDIVPTWDGIRLGERLRTMSCSDKILRWNVLGLQGALLTHFLQPIYLKSVTLGYLFSQGHLTRAICCRVTRDGSAFEDGLRHPFIVNHPKVGRVSVYDSKRQSGKTKETSVNWCLADGYDLEILDGTRGTVDGPRNELSRVSKKNIFLLFKKLCSFRYRRDLLRLSYGEAKKAARDYETAKNYFKKSLKDMGYGNWISKPQEEKNFYLCPV
在一些实施例中,提供的非人动物(例如啮齿类动物,例如大鼠或小鼠)包含来自本文披露的任何序列的多核苷酸或外源衍生的ADAR1基因座。在一些实施例中,提供的非人动物(例如啮齿类动物,例如大鼠或小鼠)包含通过本文披露的序列的任何部分的重组产生的外源衍生的ADAR1基因座。
示例性启动子
在一些实施例中,构建体(例如含有人ADAR1基因的构建体)包含启动子。术语“启动子”是指被酶/蛋白质识别的DNA序列,可以促进和/或启动可操作地连接的基因(例如,人ADAR1基因)的转录。例如,启动子通常指例如RNA聚合酶和/或任何相关因子结合并且可以从其启动转录的核苷酸序列。因此,在一些实施例中,构建体(例如,包含人ADAR1基因的靶向构建体和/或载体)包含可操作地连接至本文所述的非限制性示例启动子之一的启动子。
在一些实施例中,启动子是诱导型启动子、组成型启动子、哺乳动物细胞启动子、病毒启动子、嵌合启动子、工程化的启动子、组织特异性启动子、插入位点内源启动子或本领域已知的任何其他类型的启动子。在一些实施例中,启动子是RNA聚合酶II启动子,例如哺乳动物RNA聚合酶II启动子。在一些实施例中,启动子是RNA聚合酶III启动子,包括但不限于HI启动子、人U6启动子、小鼠U6启动子或猪U6启动子。启动子通常是能够在内耳细胞中促进转录的启动子。在一些实施例中,启动子是耳蜗特异性启动子或耳蜗定向性启动子。在一些实施例中,启动子是毛细胞特异性启动子或支持细胞特异性启动子。
多种启动子是本领域已知的,可用于本文。可用于本文的启动子的非限制性实例包括:人EFlα、人巨细胞病毒(CMV)(美国专利号5,168,062)、人泛素C(UBC)、小鼠磷酸甘油酸激酶1、多瘤腺病毒、猿猴病毒40(SV40)、β-珠蛋白、β-肌动蛋白、甲胎蛋白、γ-珠蛋白、β-干扰素、γ-谷氨酰转移酶、小鼠乳腺肿瘤病毒(MMTV)、劳斯肉瘤病毒、大鼠胰岛素、甘油醛-3-磷酸脱氢酶、金属硫蛋白II(MT II)、淀粉酶、组织蛋白酶、MI毒蕈碱受体、逆转录病毒LTR(例如,人T细胞白血病病毒HTLV)、AAV ITR、白介素-2、胶原酶、血小板衍生生长因子、腺病毒5E2、溶基质素、鼠MX基因、葡萄糖调节蛋白(GRP78和GRP94)、α-2-巨球蛋白、波形蛋白、MHC I类基因H-2K b、HSP70、增殖蛋白、肿瘤坏死因子、促甲状腺激素基因、免疫球蛋白轻链、T细胞受体、HLA DQa和DQ、白介素-2受体、MHC II类、MHC II类HLA-DRa、肌肉肌酸激酶、前白蛋白(甲状腺素转运蛋白)、弹性蛋白酶I、白蛋白基因、c-fos、c-HA-ras、神经细胞粘附分子(NCAM)、H2B(TH2B)组蛋白、大鼠生长激素、人血清淀粉样蛋白(SAA)、肌钙蛋白I(TNI)、杜氏肌营养不良、人免疫缺陷病毒、和长臂猿白血病病毒(GALV)启动子。启动子的其他实例是本领域已知的。参见,例如Lodish,Molecular Cell Biology[分子细胞生物学],弗里曼公司(Freeman and Company),纽约2007。
在一些实施例中,启动子是CMV立即早期启动子。在一些实施例中,启动子是CAG启动子或CAG/CBA启动子。在某些实施例中,启动子包含CMV/CBA增强子/启动子构建体。在某些实施例中,启动子包含CAG启动子或CMV/CBA/SV-40增强子/启动子构建体。
术语“组成型”启动子是指一种核苷酸序列,当其与编码蛋白质(例如,pendrin蛋白)的核酸可操作地连接时,导致在大多数或所有的生理条件下RNA从细胞中的核酸转录。
组成型启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子(参见,例如Boshart等人,Cell[细胞]41:521-530,1985)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EFl-α启动子(英杰公司)。
诱导型启动子允许调节基因表达并且可以通过外源提供的化合物、环境因素例如温度或特定生理状态的存在例如急性期、细胞的特定分化状态或仅在复制细胞中进行调节。诱导型启动子和诱导型系统可从各种商业来源获得,包括但不限于英杰公司、克隆技术公司(Clontech)和阿瑞雅德公司(Ariad)。诱导型启动子的其他实例是本领域已知的。
受外源提供的化合物调节的诱导型启动子的实例包括锌诱导型绵羊金属硫蛋白(MT)启动子、地塞米松(Dex)诱导型小鼠乳腺肿瘤病毒(MMTV)启动子、T7聚合酶启动子系统(WO 98/10088);蜕皮激素昆虫启动子(No等人,Proc.Natl.Acad Sci.US.A.[美国国家科学院院刊],93:3346-3351,1996),四环素抑制系统(Gossen等人,Proc.Natl.Acad Sci.US.A.[美国国家科学院院刊],89:5547-5551,1992),四环素诱导系统(Gossen等人,Science[科学],268:1766-1769,1995,另见Harvey等人,Curr.Opin.Chem.Biol.[化学生物学新见],2:512-518,1998),RU486诱导型系统(Wang等人,Nat.Biotech.[自然生物技术],15:239-243,1997和Wang等人,Gene Ther.[基因治疗],4:432-441,1997),和雷帕霉素诱导型系统(Magari等人,J.Clin.Invest.[临床研究杂志],100:2865-2872,1997)。
术语“组织特异性”启动子是指仅在某些特定细胞类型和/或组织中有活性的启动子(例如,特异性基因的转录仅发生在表达与组织特异性启动子结合的转录调节蛋白和/或控制蛋白的细胞内)。
在一些实施例中,调节序列和/或控制序列赋予组织特异性基因表达能力。在一些情况下,组织特异性调节序列和/或控制序列结合以组织特异性方式诱导转录的组织特异性转录因子。
在一些实施例中,组织特异性启动子是中枢神经系统(CNS)特异性启动子。CNS特异性启动子的非限制性实例包括但不限于基因的启动子或其功能部分:Aldh1l1、CaMIIα、Dlx1、Dlx5/6、Gad2、GFAP、Grik4、Lepr、Nes、nNOS、Pdgfrα、PLP1、Pv(Pvalb)、Slc17a6、Sst、Vip、Pcp2、Slc6a3(DAT)、ePet(Fev)、Npy2r、Cdh3和/或Htr6;参见例如,Kim等人,“MouseCre-LoxP system:general principles to determine tissue-specific roles oftarget genes[小鼠Cre-LoxP系统:确定靶基因组织特异性作用的一般原则]”LaboratoryAnimal Research[实验动物研究](2018)34(4),147-159。在某些实施例中,CNS特异性启动子包含以下或由以下组成:核苷酸序列,该核苷酸序列与以下基因的启动子相同或具有至少70%、75%、80%、85%、90%、92%、94%、96%、98%或99%同源性:Aldh1l1、CaMIIα、Dlx1、Dlx5/6、Gad2、GFAP、Grik4、Lepr、Nes、nNOS、Pdgfrα、PLP1、Pv(Pvalb)、Slc17a6、Sst、Vip、Pcp2、Slc6a3(DAT)、ePet(Fev)、Npy2r、Cdh3和/或Htr6。
在一些实施例中,组织特异性启动子是眼细胞特异性启动子。眼细胞特异性启动子的非限制性实例包括但不限于基因的启动子或其功能部分:EFS、GRK1、CRX、NRL、和/或RCVRN。在某些实施例中,眼系统特异性启动子包含以下或由以下组成:核苷酸序列,该核苷酸序列与以下基因的启动子相同或具有至少70%、75%、80%、85%、90%、92%、94%、96%、98%或99%同源性:EFS、GRK1、CRX、NRL、和/或RCVRN。
在一些实施例中,组织特异性启动子是肝系统特异性启动子。肝系统特异性启动子的非限制性实例包括但不限于基因的启动子或其功能部分:EFS、EF-la、MSCV、PGK、CAG、ALB、和/或SERPINA1。在某些实施例中,肝系统特异性启动子包含以下或由以下组成:核苷酸序列,该核苷酸序列与以下基因的启动子相同或具有至少70%、75%、80%、85%、90%、92%、94%、96%、98%或99%同源性:EFS、EF-la、MSCV、PGK、CAG、ALB、和/或SERPINA1。
在一些实施例中,提供的核酸构建体包含选自CAG、CBA、CMV或CB7启动子的启动子序列。在某些实施例中,启动子包含以下或由以下组成:核苷酸序列,该核苷酸序列与CAG、CBA、CMV或CB7启动子相同或具有至少70%、75%、80%、85%、90%、92%、94%、96%、98%或99%同源性。
在本文所述的任何核酸构建体的一些实施例中,第一或唯一核酸构建体还包括至少一个选自CNS、眼和/或肝细胞特异性启动子的启动子序列或其功能部分。
示例性增强子
在一些情况下,构建体可以包括增强子序列。在一些实施例中,术语“增强子”是指可以增加编码目的蛋白质(例如人和/或NHP ADAR1蛋白质)的核酸的转录水平的核苷酸序列。增强子序列(长度通常为50-1500bp)通常通过为转录相关蛋白(例如转录因子)提供额外的结合位点来提高转录水平。在一些实施例中,在内含子序列中发现增强子序列。与启动子序列不同,增强子序列可以在距离转录起始位点更远(例如,与启动子相比)的地方起作用。增强子的非限制性实例包括RSV增强子、CMV增强子和/或SV40增强子。在一些实施例中,构建体包含CMV增强子。在一些实施例中,SV-40衍生的增强子是SV-40T内含子序列。在一些实施例中,增强子序列是土拨鼠肝炎病毒转录后调节元件(WPRE)。在一些实施例中,增强子序列包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:56所示的WPRE核酸序列相同或至少具有至少70%、75%、80%、85%、90%、92%、94%、96%、98%或99%同源性。
SEQ ID NO:56-示例性WPRE核酸序列
AATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGC
示例性编码序列侧翼非翻译区
在一些实施例中,本文所述的任何构建体可包括非翻译区(UTR),例如5'UTR或3'UTR。基因的UTR被转录但不被翻译。5'UTR从转录起始位点开始并继续到起始密码子,但不包括起始密码子。3'UTR紧随终止密码子开始,一直持续到转录终止信号。UTR的调节和/或控制特征可以掺入本文所述的任何构建体、组合物、试剂盒或方法中以增强或以其他方式调节ADAR1蛋白的表达。
天然5'UTR包括在翻译起始中起作用的序列。在一些实施例中,5'UTR可以包含序列,如科扎克序列,其通常已知参与核糖体启动许多基因翻译的过程。科扎克序列具有共有序列CCR(A/G)CCAUGG,其中R是起始密码子(AUG)上游三个碱基的嘌呤(A或G),起始密码子后跟另一个“G”。在某些实施例中,科扎克序列是GCCACC。还已知5'UTR也可以形成参与延长因子结合的二级结构。
在一些实施例中,5'UTR包含在本文所述的任何构建体中。5’UTR的非限制性实例,包括来自以下基因的那些:白蛋白、血清淀粉样蛋白A、载脂蛋白A/B/E、转铁蛋白、甲胎蛋白、促红细胞生成素、因子VIII和ADAR1,可用于增强核酸分子如mRNA的表达。
在一些实施例中,来自由CNS中的细胞转录的mRNA的5'UTR可以包含在本文所述的任何构建体、组合物、试剂盒和方法中。在一些实施例中,5'UTR衍生自内源ADAR1基因座并且可以包括由SEQ ID NO:1例示的内源序列的全部或部分。在一些实施例中,5'UTR序列与SEQ ID NO:2、7、10、13、17、18、21、22、23或24中任一个的5'UTR序列至少85%、90%、95%、98%或99%相同。
3'UTR紧邻目的基因终止密码子的3'。在一些实施例中,来自由CNS中的细胞转录的mRNA的3'UTR可以包含在本文所述的任何构建体、组合物、试剂盒和方法中。在一些实施例中,3'UTR衍生自内源ADAR1基因座并且可以包括由SEQ ID NO:1例示的内源序列的全部或部分。在一些实施例中,3'UTR序列与SEQ ID NO:2、7、10、13、17、18、21、22、23或24中任一个的5'UTR序列至少85%、90%、95%、98%或99%相同。
已知3'UTR中嵌有一段腺苷和尿苷(以RNA形式)或胸苷(以DNA形式)。这些富含AU的特征在高周转率的基因中特别普遍。基于它们的序列特征和功能特性,富含AU的元件(ARE)可以分为三类(Chen等人,Mal.Cell.Biol.[分子细胞生物学]15:5777-5788,1995;Chen等人,Mal.Cell Biol.[分子细胞生物学]15:2010-2018,1995):I类ARE在富含U的区域内含有AUUUA基序的几个分散的拷贝。例如,c-Myc和MyoD mRNA包含I类ARE。II类ARE具有两个或更多个重叠的UUAUUUA(U/A)(U/A)九聚体。GM-CSF和TNF-αmRNA是包含II类ARE的实例。III类ARE的定义不太明确。这些富含U的区域不包含AUUUA基序,此类的两个充分研究的实例是c-Jun和肌细胞生成素mRNA。
已知与ARE结合的大多数蛋白质会破坏信使的稳定性,而已经记载ELAV家族的成员,尤其是HuR可以增加mRNA的稳定性。HuR与所有三个类别的ARE结合。将HuR特异性结合位点工程化到核酸分子的3′UTR中,这将导致HuR结合,从而使信使在体内稳定。
在一些实施例中,3'UTR ARE的引入、去除或修饰可用于调节编码ADAR1蛋白的mRNA的稳定性。在其他实施例中,可以去除或突变ARE以增加细胞内稳定性并因此增加ADAR1蛋白的翻译和产生。
在其他实施例中,非ARE序列可以掺入5'或3'UTR。在一些实施例中,内含子或内含子序列的一部分可以掺入本文提供的任何构建体、组合物、试剂盒和方法中的多核苷酸的侧翼区域。掺入内含子序列可能会增加蛋白质生产和mRNA水平。
示例性内部核糖体进入位点(IRES)
在一些实施例中,编码ADAR1蛋白的构建体可以包括内部核糖体进入位点(IRES)。IRES形成复杂的二级结构,其允许从IRES所在位置紧接下游的mRNA的任何位置开始翻译(参见,例如,Pelletier和Sonenberg,Mal.Cell.Biol.[分子细胞生物学]8(3):1103-1112,1988)。
本领域技术人员已知有几种IRES序列,包括来自以下的那些:例如口蹄疫病毒(FMDV)、脑心肌炎病毒(EMCV)、人鼻病毒(HRV)、蟋蟀麻痹病毒、人免疫缺陷病毒(HIV)、甲型肝炎病毒(HAV)、丙型肝炎病毒(HCV)和脊髓灰质炎病毒(PV)。参见,例如,Alberts,Molecular Biology of the Cell[细胞分子生物学],Garland Science[加兰科学],2002;和Hellen等人,Genes Dev.[基因发育]15(13):1593-612,2001。
在一些实施例中,掺入编码ADAR1蛋白的构建体中的IRES序列是口蹄疫病毒(FMDV)2A序列。口蹄疫病毒2A序列是一种小肽(长度约为18个氨基酸),已显示可介导多蛋白的切割(Ryan,MD等人,EMBO 4:928-933,1994;Mattion等人,J Virology[病毒学杂志]70:8124-8127,1996;Furler等人,Gene Therapy[基因疗法]8:864-873,2001;和Halpin等人,Plant Journal[植物杂志]4:453-459,1999)。2A序列的切割活性先前已在人工系统中得到证实,包括质粒和基因疗法构建体(AAV和逆转录病毒)(Ryan等人,EMBO 4:928-933,1994;Mattion等人,J Virology[病毒学杂志]70:8124-8127,1996;Furler等人,GeneTherapy[基因疗法]8:864-873,2001;和Halpin等人,Plant Journal[植物杂志]4:453-459,1999;de Felipe等人,Gene Therapy[基因疗法]6:198-208,1999;de Felipe等人,Human Gene Therapy[人基因疗法]I I:1921-1931,2000;和Klump等人,Gene Therapy[基因疗法]8:811-817,2001)。
IRES可用于本文所述的任何构建体。在一些实施例中,IRES可以是包含多于一个构建体的组合物的一部分。在一些实施例中,IRES用于从单个基因转录物产生多于一个多肽。
示例性剪接位点
在一些实施例中,本文提供的任何构建体可包括剪接供体和/或剪接受体序列,其在转录期间发生的RNA加工过程中是有功能的。在一些实施例中,剪接位点参与反式剪接。在一些实施例中,本文提供的构建体可包括与由SEQ ID NO:57表示的剪接受体序列至少85%、90%、95%、98%或99%相同的剪接受体序列。
SEQ ID NO:57-示例性剪接受体核酸序列
gtgacctgcacgtctagggcgcagtagtccagggtttccttgatgatgtcatacttatcctgtcccttttttttccacagctcgcggttgaggacaaactcttcgcggtctttccagt
示例性聚腺苷酸化序列
在一些实施例中,本文提供的构建体可以包括聚腺苷酸化(聚(A))信号序列。大多数新生的真核mRNA在其3'端具有在复杂的过程中添加的聚(A)尾,该过程包括初级转录物的切割和由聚(A)信号序列驱动的偶联聚腺苷酸化反应(参见,例如,Proudfoot等人,Cell[细胞]108:501-512,2002)。聚(A)尾赋予mRNA稳定性和可转移性(Molecular Biology ofthe Cell[细胞分子生物学],B.Alberts等人第3版,Garland Publishing[加兰德出版社],1994)。在一些实施例中,聚(A)信号序列位于编码序列的3'。
如本文所用,“聚腺苷酸化”是指聚腺苷酰基部分或其经修饰的变体与信使RNA分子的共价连接。在真核生物中,大多数信使RNA(mRNA)分子在3'端被聚腺苷酸化。3'聚(A)尾是通过酶(聚腺苷酸聚合酶)的作用添加到前体mRNA上的腺嘌呤核苷酸(例如,50、60、70、100、200、500、1000、2000、3000、4000、或5000)的长序列。在一些实施例中,将聚(A)尾添加到包含特定序列(例如聚(A)信号)的转录物上。聚(A)尾和相关蛋白有助于保护mRNA免受外切核酸酶的降解。聚腺苷酸化还在转录终止、mRNA从细胞核输出和翻译中起作用。聚腺苷酸化通常在DNA转录成RNA后立即在细胞核中发生,但也可以稍后在细胞质中发生。转录终止后,通过与RNA聚合酶相关的内切核酸酶复合物的作用切割mRNA链。切割位点通常被表征为切割位点附近存在碱基序列AAUAAA。在mRNA被切割后,腺苷残基被添加到切割位点处的游离3'末端上。
如本文所用,“聚(A)信号序列”或“聚腺苷酸化信号序列”是触发内切核酸酶切割mRNA并将一系列腺苷添加到切割的mRNA的3'末端的序列。
有几种聚(A)信号序列可供使用,包括衍生自牛生长激素(bGH)的那些(Woychik等人,Proc.Natl.Acad Sci.US.A.[美国国家科学院院刊]81(13):3944-3948,1984;美国专利号5,122,458)、小鼠-β-珠蛋白、小鼠-α-珠蛋白(Orkin等人,EMBO J[欧洲分子生物学组织杂志]4(2):453-456,1985;Thein等人,Blood 71(2):313-319,1988),人胶原,多瘤病毒(Batt等人,Mal.Cell Biol.[分子细胞生物学]15(9):4783-4790,1995),单纯疱疹病毒胸苷激酶基因(HSV TK),IgG重链基因聚腺苷酸化信号(US 2006/0040354),人生长激素(hGH)(Szymanski等人,Mal.Therapy[分子疗法]15(7):1340-1347,2007),由SV40聚(A)位点组成的组,如SV40晚期和早期聚(A)位点(Schek等人,Mal.Cell Biol.[分子细胞生物学]12(12):5386-5393,1992)。
聚(A)信号序列可以是AATAAA。AATAAA序列可以用与AATAAA同源并能够发出聚腺苷酸化信号的其他六核苷酸序列取代,包括ATTAAA、AGTAAA、CATAAA、TATAAA、GATAAA、ACTAAA、AATATA、AAGAAA、AATAAT、AAAAAA、AATGAA、AATCAA、AACAAA、AATCAA、AATAAC、AATAGA、AATTAA、或AATAAG(参见,例如,WO 06/12414)。
在一些实施例中,聚(A)信号序列可以是合成的聚腺苷酸化位点(参见例如基于Levitt等人,Genes Dev.[基因与发育]3(7):1019-1025,1989的普洛麦格公司(Promega)的pCl-neo表达构建体)。在一些实施例中,聚(A)信号序列是可溶性神经纤毛蛋白-1(sNRP)(AAATAAAATACGAAATG)的聚腺苷酸化信号(参见例如WO 05/073384)。在一些实施例中,聚(A)信号序列包含bGHpA或由其组成。在一些实施例中,聚(A)信号包含SEQ ID NO:58或SEQID NO:59或由其组成。在一些实施例中,聚(A)信号序列包含SV40聚(A)位点或由其组成。在一些实施例中,聚(A)信号包含SEQ ID NO:60或由其组成。聚(A)信号序列的其他实例是本领域已知的。在一些实施例中,聚(A)序列与SEQ ID NO:58-60中任一个所示的聚(A)序列至少85%、90%、95%、98%或99%相同。
SEQ ID NO:58-示例性bGH聚(A)信号序列
CTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGG
SEQ ID NO:59-示例性bGH聚(A)信号序列
CTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATGGCAGGCATGCTGGGGA
SEQ ID NO:60-示例性SV40聚(A)信号序列
AACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTA
示例性去稳定化结构域
在一些实施例中,本文提供的任何构建体可以任选地包括编码用于蛋白表达的时间控制的去稳定化结构域(“去稳定化序列”)的序列。去稳定化序列的非限制性实例包括编码FK506序列、二氢叶酸还原酶(DHFR)序列或其他示例性去稳定化序列的序列。
在没有稳定化配体的情况下,与去稳定化序列可操作地连接的蛋白序列通过泛素化降解。相反,在稳定化配体的存在下,蛋白降解被抑制,从而允许活性地表达与去稳定化序列可操作地连接的蛋白序列。作为稳定蛋白表达的阳性对照,可以通过常规手段检测蛋白表达,包括酶测定、射线照相测定、比色测定、荧光测定或其他光谱测定;荧光激活细胞分选(FACS)测定;免疫学测定(例如酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学)。
去稳定化序列的另外实例是本领域已知的。在一些实施例中,去稳定化序列是FK506和雷帕霉素结合蛋白(FKBP12)序列,稳定化配体是Shield-1(Shld1)(Banaszynski等人(2012)Cell[细胞]126(5):995-1004)。在一些实施例中,去稳定化序列是DHFR序列,并且稳定化配体是甲氧苄啶(TMP)(Iwamoto等人(2010)Chem Biol[化学与生物学]17:981-988)。
在一些实施例中,去稳定化序列是FKBP12序列,并且通过蛋白质印迹在受试细胞(例如,啮齿类动物细胞,例如,大鼠或小鼠细胞)中检测到存在携带FKBP12基因的核酸构建体。在一些实施例中,去稳定化序列可用于验证本文所述的任何核酸构建体的时间特异性活性。
示例性报告序列或元件
在一些实施例中,本文提供的构建体可任选地包括编码报告多肽和/或蛋白质的序列(“报告序列”)。报告序列的非限制性实例包括编码以下的DNA序列:β-内酰胺酶、β-半乳糖苷酶(LacZ)、碱性磷酸酶、胸苷激酶、绿色荧光蛋白(GFP)、红色荧光蛋白、mCherry荧光蛋白、黄色荧光蛋白、氯霉素乙酰转移酶(CAT)和荧光素酶。报告序列的另外实例是本领域已知的。当与驱动其表达的控制元件相关联时,报告序列可以提供可通过常规手段检测的信号,包括酶促、射线照相、比色、荧光或其他光谱测得;荧光激活细胞分选(FACS)测定;免疫学测定(例如酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)和免疫组织化学)。
在一些实施例中,报告序列是LacZ基因,并且通过β-半乳糖苷酶活性测定在非人细胞(例如,啮齿类动物细胞,例如,大鼠或小鼠细胞)中检测到存在携带LacZ基因的构建体。当报告基因是荧光蛋白(例如,绿色荧光蛋白)或荧光素酶时,在非人细胞(例如,啮齿类动物细胞,例如,大鼠或小鼠)中携带荧光蛋白或荧光素酶的构建体的存在可以通过荧光技术(例如,荧光显微镜或FACS)或光度计中的光产生(例如,分光光度计或IVIS成像仪器)来测量。在一些实施例中,报告序列可用于验证本文所述的任何构建体的组织特异性靶向能力和组织特异性启动子调节活性和/或控制活性。
在一些实施例中,报告序列是FLAG标签(例如,3xFLAG标签),并且在非人细胞(例如,啮齿类动物细胞,例如,大鼠或小鼠)中携带FLAG标签的构建体的存在通过蛋白质结合或检测测定(例如,蛋白质印迹、免疫组织化学、放射免疫测定(RIA)、质谱法)来检测。示例性3xFLAG标签序列作为SEQ ID NO:61提供。
SEQ ID NO:61-示例性3xFLAG标签序列
GGATCCCGGGCTGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGACTACAAGGATGACGATGACAAG
示例性另外序列
在一些实施例中,本披露的构建体可包括一个或多个克隆位点。在一些这样的实施例中,在制造用于将核酸构建体施用于受试者之前可能不完全去除克隆位点。在一些实施例中,克隆位点可能具有功能性作用,包括作为接头序列,或作为科扎克位点的一部分。正如本领域技术人员所理解的,克隆位点可以在一级序列上发生显著变化,同时保留其所期望的功能。在一些实施例中,构建体可以包含克隆位点的任何组合。某些克隆位点如下所示。
示例性克隆位点A
TTAATTAA
示例性克隆位点B
GCTAGCTCAGATCAGGCCGGCCCTATCTGCACGTGCGTACAGCGATCGCCAAATTCGATATCAAGCTTATCGAT(SEQ ID NO:94)
示例性克隆位点C
ATCGATACCGTCGACCTCGACCTCGA(SEQ ID NO:95)
示例性克隆位点D
ACTAGTACGCGT(SEQ ID NO:96)
靶向载体
靶向载体可用于将核酸构建体引入靶基因组基因座。靶向载体可包含核酸构建体和位于所述核酸构建体侧翼的同源臂;本领域的技术人员将意识到通常适用于靶向载体的设计、结构和/或使用的多种选择和特征。例如,靶向载体可以是线性形式或环状形式,并且它们可以是单链或双链的。靶向载体可以是脱氧核糖核酸(DNA)或核糖核酸(RNA)。为了便于引用,同源臂在本文中称为5'和3'(即上游和下游,即左和右)同源臂。该术语涉及同源臂与靶向载体在核酸构建体内的相对位置。5'和3'同源臂对应于靶向的基因座内的区域或另一个靶向载体内的区域,其在本文中分别称为“5'靶序列”和“3'靶序列”。在一些实施例中,同源臂也可作为5'或3'靶序列发挥作用。在一些实施例中,本披露提供靶向载体,其包含所提供的技术,该技术的序列编码如本文所述的ADAR1多肽或其特征性部分。
在一些实施例中,本文描述的方法提供传统的转基因非人动物创建。在此类实施例中,将包含外源ADAR1基因的载体注射到受精卵中并随机整合到基因组内。在一些实施例中,这样的随机插入位点可以在蛋白质编码区内并且可以导致内源蛋白质和/或基因的功能改变。在一些这样的实施例中,外源ADAR1基因可以作为单独的编码区、作为包含蛋白质标签的编码区、作为具有可操作地连接的启动子的编码区、作为包含聚(A)位点的编码区,作为包括任何另外的调节区的编码区或其任何组合进行掺入。
在一些实施例中,本文描述的方法提供利用Tol2转座子系统的传统转基因非人动物创建。在此类实施例中,将包含外源ADAR1基因的载体注射到受精卵中并随机整合到基因组的富A/T的区域内。在一些实施例中,这样的随机插入位点可以在蛋白质编码区内并且可以导致内源蛋白质和/或基因的功能改变。在一些这样的实施例中,外源ADAR1基因可以作为单独的编码区、作为包含蛋白质标签的编码区、作为具有可操作地连接的启动子的编码区、作为包含聚(A)位点的编码区,作为包括任何另外的调节区的编码区或其任何组合进行掺入。
在一些实施例中,本文描述的提供传统转基因非人动物创建的方法可以利用大基因组片段(例如1mb、10mb、100mb和/或1000mb)。在一些实施例中,传统转基因非人动物可包含转基因区域,这些转基因区域包括启动子、内含子、外显子和/或另外的基因组调节区域。在一些实施例中,传统转基因非人动物创建可以利用酵母人工染色体(YAC)、细菌人工染色体(BAC)、人人工染色体、P1衍生的人工染色体(PAC)或可以包含在合适的宿主细胞中的任何其他工程化的区域。
在一些实施例中,本文所述的方法采用两个、三个或更多个能够彼此重组的靶向载体。在一些实施例中,第一、第二和第三靶向载体各自包含5'和3'同源臂。第一靶向载体的3'同源臂包含与第二靶向载体的5'同源臂重叠的序列(即重叠序列),这允许第一和第二载体之间的同源重组。
在双组分靶向方法的一些实施例中,第一靶向载体的5'同源臂和第二靶向载体的3'同源臂可类似于靶基因组基因座(即靶序列)内的相应区段,这可以促进第一和第二靶向载体与相应基因组区段的同源重组并修饰靶基因组基因座。
在三组分靶向方法的一些实施例中,第二靶向载体的3'同源臂可包含与第三靶向载体的5'同源臂重叠的序列(即重叠序列),这可以允许第二和第三靶向载体之间的同源重组。第一靶向载体的5'同源臂和第三靶向载体的3'同源臂可类似于与靶基因组基因座(即靶序列)内的相应片段,这可以促进第一和第三靶向载体与相应基因组区段的同源重组并修饰靶基因组基因座。
在一些实施例中,同源臂和靶序列或两个同源臂在两个区域彼此共享足够水平的序列同一性使得它们可以充当同源重组反应的底物时彼此“对应”或“相应”。给定靶序列与在靶向载体上发现的相应同源臂之间(即重叠序列)或两个同源臂之间的序列同一性可以是允许发生同源重组的任何程度的序列同一性。仅举一个实例,由靶向载体(或其片段)的同源臂与另一靶向载体的靶序列或靶基因组基因座(或其片段)的靶序列共享的序列同一性的量可以是例如但不限于至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,使得这些序列进行同源重组。
此外,同源臂和相应靶序列之间的相应相似区域(例如同一性)可以是足以促进靶基因组基因座处的同源重组的任何长度。例如,给定的同源臂和/或相应的靶序列可以包含相应的相似区域,这些相似区域是但不限于约0.2-0.5kb、0.2-1kb、0.2-1.5kb、0.2-2kb、0.2-2.5kb、0.2-3kb、0.2-3.5kb、0.2-4kb、0.2-4.5kb或0.2-5kb的长度,使得同源臂具有足够的相似性以与细胞的靶基因组座位内或另一靶向载体内的一个或多个相应靶序列进行同源重组。在一些实施例中,给定的同源臂和/或相应的靶序列可包含相应的相似区域,这些相似区域例如但不限于约5-10kb、5-15kb、5-20kb、5-25kb、5-30kb、5-35kb、5-40kb、5-45kb、5-50kb、5-55kb、5-60kb、5-65kb、5-70kb、5-75kb、5-80kb、5-85kb、5-90kb、5-95kb、5-100kb、100-200kb或200-300kb的长度(如本文别处所述),使得同源臂具有足够的相似性以与细胞的靶基因组座位内或另一靶向载体内的一个或多个相应靶序列进行同源重组。在一些实施例中,给定的同源臂和/或相应的靶序列包含相应的相似区域,这些相似区域例如但不限于约10-100kb、15-100kb、20-100kb、25-100kb、30-100kb、35-100kb、40-100kb、45-100kb、50-100kb、55-100kb、60-100kb、65-100kb、70-100kb、75-100kb、80-100kb、85-100kb、90-100kb,或95-100kb的长度(如本文别处所述),使得同源臂具有足够的相似性以与细胞的靶基因组座位内或另一靶向载体内的一个或多个相应靶序列进行同源重组。
在一些实施例中,第一靶向载体的3'同源臂与第二靶向载体的5'同源臂或第二靶向载体的3'同源臂与第三靶向载体的5'同源臂的重叠序列载体可以是足以促进所述靶向载体之间的同源重组的任何长度。例如,给定的同源臂和/或相应的靶序列可以包含相应的相似区域,这些相似区域是例如但不限于约0.2-0.5kb、0.2-1kb、0.2-1.5kb、0.2-2kb、0.2-2.5kb、0.2-3kb、0.2-3.5kb、0.2-4kb、0.2-4.5kb或0.2-5kb的长度,使得同源臂具有足够的相似性以与细胞的靶基因组座位内或另一靶向载体内的一个或多个相应靶序列进行同源重组。在一些实施例中,同源臂的给定重叠序列可包含相应的重叠区域,这些重叠区域是约1-5kb、5-10kb、5-15kb、5-20kb、5-25kb、5-30kb、5-35kb、5-40kb、5-45kb、5-50kb、5-55kb、5-60kb、5-65kb、5-70kb、5-75kb、5-80kb、5-85kb、5-90kb、5-95kb、5-100kb、100-200kb或200-300kb的长度,使得同源臂的重叠序列具有足够的相似性以与另一靶向载体内的相应重叠序列进行同源重组。在一些实施例中,同源臂的给定重叠序列包含重叠区域,该重叠区域是约1-100kb、5-100kb、10-100kb、15-100kb、20-100kb、25-100kb、30-100kb、35-100kb、40-100kb、45-100kb、50-100kb、55-100kb、60-100kb、65-100kb、70-100kb、75-100kb、80-100kb、85-100kb、90-100kb或95-100kb的长度,使得同源臂的重叠序列具有足够的相似性以与另一靶向载体内的相应重叠序列进行同源重组。在一些实施例中,重叠序列为1-5kb,包括端值。在一些实施例中,重叠序列为约1kb至约70kb,包括端值。在一些实施例中,重叠序列为约10kb至约70kb,包括端值。在一些实施例中,重叠序列为约10kb至约50kb,包括端值。在一些实施例中,重叠序列为至少10kb。在一些实施例中,重叠序列为至少20kb。例如,重叠序列可以是约1kb至约5kb(含端值)、约5kb至约10kb(含端值)、约10kb至约15kb(含端值)、约15kb至约20kb(含端值)、约20kb至约25kb(含端值)、约25kb至约30kb(含端值)、约30kb至约35kb(含端值)、约35kb至约40kb(含端值)、约40kb至约45kb(含端值)、约45kb至约50kb(含端值)、约50kb至约60kb(含端值)、约60kb至约70kb(含端值)、约70kb至约80kb(含端值)、约80kb至约90kb(含端值)、约90kb至约100kb(含端值)、约100kb至约120kb(含端值)、约120kb至约140kb(含端值)、约140kb至约160kb(含端值)、约160kb至约180kb(含端值)、约180kb至约200kb(含端值)、约200kb至约220kb(含端值)、约220kb至约240kb(含端值)、约240kb至约260kb(含端值)、约260kb至约280kb(含端值)或约280kb至约300kb(含端值)。仅举一个实例,重叠序列可以是约20kb至约60kb,包括端值。可替代地,重叠序列可以是至少1kb、至少5kb、至少10kb、至少15kb、至少20kb、至少25kb、至少30kb、至少35kb、至少40kb、至少45kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少120kb、至少140kb、至少160kb、至少180kb、至少200kb、至少220kb、至少240kb、至少260kb、至少280kb或至少300kb。在一些实施例中,重叠序列可以是至多400kb、至多350kb、至多300kb、至多280kb、至多260kb、至多240kb、至多220kb、至多200kb、至多180kb、至多160kb、至多140kb、至多120kb、至多100kb、至多90kb、至多80kb、至多70kb、至多60kb或至多50kb。
用于基因组掺入的示例性位点
在一些实施例中,同源臂可以对应于细胞天然的基因座(例如,靶向的基因座),或者可替代地它们可以对应于整合到细胞基因组中的异源或外源DNA区段的区域,包括例如转基因、表达盒或DNA的异源或外源区域。在一些实施例中,同源臂可以对应于细胞中靶向载体上的区域。在一些实施例中,靶向载体的同源臂可对应于酵母人工染色体(YAC)、细菌人工染色体(BAC)、人人工染色体、P1衍生的人工染色体(PAC)的区域或含在合适的宿主细胞中的任何其他工程化的区域。更进一步,靶向载体的同源臂可以对应于或衍生自BAC文库、粘粒文库或P1噬菌体文库的区域。在一些特定的实施例中,靶向载体的同源臂对应于原核生物、酵母、鸟类(例如鸡)、非人哺乳动物、啮齿类动物、人、大鼠、小鼠、仓鼠、兔、猪、牛、鹿、绵羊、山羊、猫、狗、雪貂、灵长类动物(例如,狨猴、恒河猴)、驯养哺乳动物、农业哺乳动物或任何其他目的生物的天然、异源或外源的基因座。在一些实施例中,同源臂对应于以下细胞的基因座,其在不存在由核酸酶药剂(例如,Cas蛋白、锌指核酸酶蛋白和/或TALEN蛋白)诱导的切口或双链断裂时,显示出对使用常规方法的靶向的有限敏感性或显示出在靶向的位点处的成功整合水平相对较低和/或脱靶整合水平显著。在一些实施例中,同源臂被设计成包括工程化的DNA。
在一些实施例中,一个或多个靶向载体的5'和3'同源臂对应于靶向的基因组。可替代地,同源臂对应于相关基因组。例如,靶向的基因组是第一品系的小鼠基因组,并且靶向臂对应于第二品系的小鼠基因组,其中第一品系和第二品系是不同的。在某些实施例中,同源臂对应于相同动物的基因组或来自相同品系的基因组,例如,靶向的基因组是第一品系的小鼠基因组,并且靶向臂对应于来自同一小鼠或同一品系的小鼠基因组。
靶向载体的同源臂可以是足以促进与相应靶序列的同源重组事件的任何长度,包括例如长度是0.2-1kb(含端值)、1-5kb(含端值)、5-10kb(含端值)、5-15kb(含端值)、5-20kb(含端值)、5-25kb(含端值)、5-30kb(含端值)、5-35kb(含端值)、5-40kb(含端值)、5-45kb(含端值)、5-50kb(含端值)、5-55kb(含端值)、5-60kb(含端值)、5-65kb(含端值)、5-70kb(含端值)、5-75kb(含端值)、5-80kb(含端值)、5-85kb(含端值)、5-90kb(含端值)、5-95kb(含端值)、5-100kb(含端值)、100-200kb(含端值)或200-300kb(含端值)。在一些实施例中,靶向载体的同源臂具有足以促进与相应靶序列的同源重组事件的长度,该长度是0.2-100kb(含端值)、1-100kb(含端值)、5-100kb(含端值)、10-100kb(含端值)、15-100kb(含端值)、20-100kb(含端值)、25-100kb(含端值)、30-100kb(含端值)、35-100kb(含端值)、40-100kb(含端值)、45-100kb(含端值)、50-100kb(含端值)、55-100kb(含端值)、60-100kb(含端值)、65-100kb(含端值)、70-100kb(含端值)、75-100kb(含端值)、80-100kb(含端值)、85-100kb(含端值)、90-100kb(含端值)或95-100kb(含端值)。如本文所述,大的靶向载体可以使用更长的靶向臂。
在某些实施例中,ADAR1多核苷酸或外源ADAR1基因座被掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的内源基因座。在一些情况下,内源基因座是ADAR1基因座。在某些此类情况下,内源ADAR1基因座可能会被外源ADAR1基因替换。在一些实施例中,替换可以是部分的,或者可以是完全的。在一些实施例中,ADAR1多核苷酸或外源ADAR1基因掺入内源ADAR1基因座并可操作地连接至内源ADAR1启动子。
在某些实施例中,ADAR1多核苷酸或外源ADAR1基因座被掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的内源基因座。在一些情况下,内源基因座是由组成型启动子驱动的基因座。在一些实施例中,内源基因座是由组织特异性启动子驱动的基因座。
在某些实施例中,将ADAR1多核苷酸或外源ADAR1基因掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的易于进行Cre/LoxP操纵的位点。在某些实施例中,ADAR1多核苷酸或外源ADAR1掺入靶向载体内侧接LoxP重组位点的位点中或位于靶向载体内侧翼是LoxP重组位点。在某些实施例中,具有包含或掺入侧翼是LoxP位点的位点的外源ADAR1基因的非人动物(例如啮齿类动物,例如大鼠或小鼠)可以进一步与在一个或多个组织特异性、时间特异性和/或诱导型启动子的控制下表达Cre重组酶的动物进行杂交。
在某些实施例中,将ADAR1多核苷酸或外源ADAR1基因掺入非人动物(例如,啮齿类动物,例如,大鼠或小鼠),非人(例如,啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的易于使用Cre-LoxP和/或Flp-FRT进行操纵的基因座处;参见例如,Kim等人,“Mouse Cre-LoxP system:general principles to determinetissue-specific roles of target genes[小鼠Cre-LoxP系统:确定靶基因组织特异性作用的一般原则]”Laboratory Animal Research[实验动物研究](2018)34(4),147-159。
在某些实施例中,将ADAR1多核苷酸或外源ADAR1基因掺入非人动物(例如,啮齿类动物,例如,大鼠或小鼠),非人(例如,啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的Cre/LoxP终止或诱导型Cre/LoxP位点处。在某些这样的实施例中,当与在组织特异性启动子下具有Cre的小鼠杂交时,所述基因座可以在转基因动物中产生组织特异性外源ADAR1表达。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在与诱导型启动子(例如四环素响应元件、雌激素受体靶向基序,和/或在他莫昔芬的控制下)可操作地连接的位点处的外源ADAR1基因是纯合或杂合的。
在某些实施例中,将ADAR1多核苷酸或外源ADAR1基因掺入非人动物(例如,啮齿类动物,例如,大鼠或小鼠),非人(例如,啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的已知起转录热点和/或转录安全港作用的基因座(如本领域中丰富和熟知的)处。
在某些实施例中,将ADAR1多核苷酸或外源ADAR1基因掺入非人动物(例如,啮齿类动物,例如,大鼠或小鼠),非人(例如,啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的ROSA26基因座处。
在某些实施例中,将ADAR1多核苷酸或外源ADAR1基因掺入非人动物(例如,啮齿类动物,例如,大鼠或小鼠),非人(例如,啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的H11基因座处。
在某些实施例中,将ADAR1多核苷酸或外源ADAR1基因掺入非人动物(例如,啮齿类动物,例如,大鼠或小鼠),非人(例如,啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的TIGRE基因座处。
在某些实施例中,将ADAR1多核苷酸或外源ADAR1基因掺入非人动物(例如,啮齿类动物,例如,大鼠或小鼠),非人(例如,啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的MYH9基因座处。
在本文描述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织的实施例中,非人动物、非人细胞或非人组织对于整合在与普遍表达型启动子(例如CMV、SV40、延伸因子1α、CBA/CAGG、泛素C和/或磷酸甘油酸激酶1)可操作地连接的位点处的ADAR1多核苷酸或外源ADAR1基因是纯合或杂合的。
在某些实施例中,将ADAR1多核苷酸或ADAR1基因座掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ROSA26基因座位点处。在某些实施例中,用于插入ROSA26基因座位点中的5'同源臂包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:62的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,用于插入ROSA26基因座位点中的5'同源臂包含以下或由以下组成:与SEQ ID NO:62的核苷酸序列相同的核苷酸序列。
SEQ ID NO:62-用于插入ROSA26基因座位点中的示例性5'同源臂
GGAAGAGTCCTGACCCAGGGAAGACATTAAAAAGGTAGTGGGGTCGACTAGATGAAGGAGAGCCTTTCTCTCTGGGCAAGAGCGGTGCAATGGTGTGTAAAGGTAGCTGAGAAGACGAAAAGGGCAAGCATCTTCCTGCTACCAGGCTGGGGAGGCCCAGGCCCACGACCCCGAGGAGAGGGAACGCAGGGAGACTGAGGTGACCCTTCTTTCCCCCGGGGCCCGGTCGTGTGGTTCGGTGTCTCTTTTCTGTTGGACCCTTACCTTGACCCAGGCGCTGCCGGGGCCTGGGCCCGGGCTGCGGCGCACGGCACTCCCGGGAGGCAGCGAGACTCGAGTTAGGCCCAACGCGGCGCCACGGCGTTTCCTGGCCGGGAATGGCCCGTACCCGTGAGGTGGGGGTGGGGGGCAGAAAAGGCGGAGCGAGCCCGAGGCGGGGAGGGGGAGGGCCAGGGGCGGAGGGGGCCGGCACTACTGTGTTGGCGGACTGGCGGGACTAGGGCTGCGTGAGTCTCTGAGCGCAGGCGGGCGGCGGCCGCCCCTCCCCCGGCGGCGGCAGCGGCGGCAGCGGCGGCAGCTCACTCAGCCCGCTGCCCGAGCGGAAACGCCACTGACCGCACGGGGATTCCCAGTGCCGGCGCCAGGGGCACGCGGGACACGCCCCCTCCCGCCGCGCCATTGGCCTCTCCGCCCACCGCCCCACACTTATTGGCCGGTGCGCCGCCAATCAGCGGAGGCTGCCGGGGCCGCCTAAAGAAGAGGCTGTGCTTTGGGGCTCCGGCTCCTCAGAGAGCCTCGGCTAGGTAGGGGATCGGGACTCTGGCGGGAGGGCGGCTTGGTGCGTTTGCGGGGATGGGCGGCCGCGGCAGGCCCTCCGAGCGTGGTGGAGCCGTTCTGTGAGACAGCCGGGTACGAGTCGTGACGCTGGAAGGGGCAAGCGGGTGGTGGGCAGGAATGCGGTCCGCCCTGCAGCAACCGGAGGGGGAGGGAGAAGGGAGCGGAAAAGTCTCCACCGGACGCGGCCATGGCTCGGGGGGGGGGGGGCAGCGGAGGAGCGCTTCCGGCCGACGTCTCGTCGCTGATTGGCTTCTTTTCCTCCCGCCGTGTGTGAAAACACAAATGGCGTGTTTTGGTTGGCGTAAGGCGCCTGTCAGTTAACGGCAGCCGGAGTGCGCAGCCGCCGGCAGCCTCGCTCTGCCCACTGGGTGGGGCGGGAGGTAGGTGGGGTGAGGCGAGCTGGACGTGCGGGCGCGGTCGGCCTCTGGCGGGGCGGGGGAGGGGAGGGAGGGTCAGCGAAAGTAGCTCGCGCGCGAGCGGCCGCCCACCCTCCCCTTCCTCTGGGGGAGTCGTTTTACCCGCCGCCGGCCGGGCCTCGTCGTCTGATTGGCTCTCGGGGCCCAGAAAACTGGCCCTTGCCATTGGCTCGTGTTCGTGCAAGTTGAGTCCATCCGCCGGCCAGCGGGGGCGGCGAGGAGGCGCTCCCAGGTTCCGGCCCTCCCCTCGGCCCCGCGCCGCAGAGTCTGGCCGCGCGCCCCTGCGCAACGTGGCAGGAAGCGCGCGCTGGGGGCGGGGACGGGCAGTAGGGCTGAGCGGCTGCGGGGCGGGTGCAAGCACGTTTCCGACTTGAGTTGCCTCAAGAGGGGCGTGCTGAGCCAGACCTCCATCGCGCACTCCGGGGAGTGGAGGGAAGGAGCGAGGGCTCAGTTGGGCTGTTTTGGAGGCAGGAAGCACTTGCTCTCCCAAAGTCGCTCTGAGTTGTTATCAGTAAGGGAGCTGCAGTGGAGTAGGCGGGGAGAAGGCCGCACCCTTCTC
在某些实施例中,将ADAR1多核苷酸或ADAR1基因座掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ROSA26基因座位点处。在某些实施例中,用于插入ROSA26基因座位点中的3'同源臂包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQ ID NO:63的核苷酸序列相同、差异不超过1、2、3、4、5、6、7、8、9、或10个核苷酸,或具有至少90%、92%、94%、96%、98%或99%同源性。在一些实施例中,用于插入ROSA26基因座位点中的3'同源臂包含以下或由以下组成:与SEQ ID NO:63的核苷酸序列相同的核苷酸序列。
SEQ ID NO:63-用于插入ROSA26基因座位点中的示例性3'同源臂
CGGAGGGGGGAGGGGAGTGTTGCAATACCTTTCTGGGAGTTCTCTGCTGCCTCCTGGCTTCTGAGGACCGCCCTGGGCCTGGGAGAATCCCTTCCCCCTCTTCCCTCGTGATCTGCAACTCCAGTCTTTCTAGAAGATGGGCGGGAGTCTTCTGGGCAGGCTTAAAGGCTAACCTGGTGTGTGGGCGTTGTCCTGCAGGGGAATTGAACAGGTGTAAAATTGGAGGGACAAGACTTCCCACAGATTTTCGGTTTTGTCGGGAAGTTTTTTAATAGGGGCAAATAAGGAAAATGGGAGGATAGGTAGTCATCTGGGGTTTTATGCAGCAAAACTACAGGTTATTATTGCTTGTGATCCGCCTCGGAGTATTTTCCATCGAGGTAGATTAAAGACATGCTCACCCGAGTTTTATACTCTCCTGCTTGAGATCCTTACTACAGTATGAAATTACAGTGTCGCGAGTTAGACTATGTAAGCAGAATTTTAATCATTTTTAAAGAGCCCAGTACTTCATATCCATTTCTCCCGCTCCTTCTGCAGCCTTATCAAAAGGTATTTTAGAACACTCATTTTAGCCCCATTTTCATTTATTATACTGGCTTATCCAACCCCTAGACAGAGCATTGGCATTTTCCCTTTCCTGATCTTAGAAGTCTGATGACTCATGAAACCAGACAGATTAGTTACATACACCACAAATCGAGGCTGTAGCTGGGGCCTCAACACTGCAGTTCTTTTATAACTCCTTAGTACACTTTTTGTTGATCCTTTGCCTTGATCCTTAATTTTCAGTGTCTATCACCTCTCCCGTCAGGTGGTGTTCCACATTTGGGCCTATTCTCAGTCCAGGGAGTTTTACAACAATAGATGTATTGAGAATCCAACCTAAAGCTTAACTTTCCACTCCCATGAATGCCTCTCTCCTTTTTCTCCATTTATAAACTGAGCTATTAACCATTAATGGTTTCCAGGTGGATGTCTCCTCCCCCAATATTACCTGATGTATCTTACATATTGCCAGGCTGATATTTTAAGACATTAAAAGGTATATTTCATTATTGAGCCACATGGTATTGATTACTGCTTACTAAAATTTTGTCATTGTACACATCTGTAAAAGGTGGTTCCTTTTGGAATGCAAAGTTCAGGTGTTTGTTGTCTTTCCTGACCTAAGGTCTTGTGAGCTTGTATTTTTTCTATTTAAGCAGTGCTTTCTCTTGGACTGGCTTGACTCATGGCATTCTACACGTTATTGCTGGTCTAAATGTGATTTTGCCAAGCTTCTTCAGGACCTATAATTTTGCTTGACTTGTAGCCAAACACAAGTAAAATGATTAAGCAACAAATGTATTTGTGAAGCTTGGTTTTTAGGTTGTTGTGTTGTGTGTGCTTGTGCTCTATAATAATACTATCCAGGGGCTGGAGAGGTGGCTCGGAGTTCAAGAGCACAGACTGCTCTTCCAGAAGTCCTGAGTTCAATTCCCAGCAACCACATGGTGGCTCACAACCATCTGTAATGGGATCTGATGCCCTCTTCTGGTGTGTCTGAAGACCACAAGTGTATTCACATTAAATAAATAAATCCTCCTTCTTCTTCTTTTTTTTTTTTTTAAAGAGAATACTGTCTCCAGTAGAATTTACTGAAGTAATGAAATACTTTGTGTTTGTTCCAATATGGTAGCCAATAATCAAATTACTCTTTAAGCACTGGAAATGTTACCAAGGAACTAATTTTTATTTGAAGTGTAACTGTGGACAGAGGAGCCATAACTGCAGACT
用于基因组掺入的示例性靶向载体
在某些实施例中,利用靶向载体将ADAR1多核苷酸或ADAR1基因座掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ROSA26基因座位点处。在某些实施例中,用于插入ROSA26基因座位点的靶向载体包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQID NO:64的核苷酸序列相同或具有至少60%、65%、70%、75%、80%、82%、84%、86%、88%、90%、92%、94%、96%、98%或99%同源性。在某些实施例中,用于插入ROSA26基因座位点的靶向载体包含以下或由以下组成:与SEQ ID NO:64的核苷酸序列相同的核苷酸序列。
SEQ ID NO:64-用于插入ROSA26基因座的示例性ADAR1靶向载体
GGAAGAGTCCTGACCCAGGGAAGACATTAAAAAGGTAGTGGGGTCGACTAGATGAAGGAGAGCCTTTCTCTCTGGGCAAGAGCGGTGCAATGGTGTGTAAAGGTAGCTGAGAAGACGAAAAGGGCAAGCATCTTCCTGCTACCAGGCTGGGGAGGCCCAGGCCCACGACCCCGAGGAGAGGGAACGCAGGGAGACTGAGGTGACCCTTCTTTCCCCCGGGGCCCGGTCGTGTGGTTCGGTGTCTCTTTTCTGTTGGACCCTTACCTTGACCCAGGCGCTGCCGGGGCCTGGGCCCGGGCTGCGGCGCACGGCACTCCCGGGAGGCAGCGAGACTCGAGTTAGGCCCAACGCGGCGCCACGGCGTTTCCTGGCCGGGAATGGCCCGTACCCGTGAGGTGGGGGTGGGGGGCAGAAAAGGCGGAGCGAGCCCGAGGCGGGGAGGGGGAGGGCCAGGGGCGGAGGGGGCCGGCACTACTGTGTTGGCGGACTGGCGGGACTAGGGCTGCGTGAGTCTCTGAGCGCAGGCGGGCGGCGGCCGCCCCTCCCCCGGCGGCGGCAGCGGCGGCAGCGGCGGCAGCTCACTCAGCCCGCTGCCCGAGCGGAAACGCCACTGACCGCACGGGGATTCCCAGTGCCGGCGCCAGGGGCACGCGGGACACGCCCCCTCCCGCCGCGCCATTGGCCTCTCCGCCCACCGCCCCACACTTATTGGCCGGTGCGCCGCCAATCAGCGGAGGCTGCCGGGGCCGCCTAAAGAAGAGGCTGTGCTTTGGGGCTCCGGCTCCTCAGAGAGCCTCGGCTAGGTAGGGGATCGGGACTCTGGCGGGAGGGCGGCTTGGTGCGTTTGCGGGGATGGGCGGCCGCGGCAGGCCCTCCGAGCGTGGTGGAGCCGTTCTGTGAGACAGCCGGGTACGAGTCGTGACGCTGGAAGGGGCAAGCGGGTGGTGGGCAGGAATGCGGTCCGCCCTGCAGCAACCGGAGGGGGAGGGAGAAGGGAGCGGAAAAGTCTCCACCGGACGCGGCCATGGCTCGGGGGGGGGGGGGCAGCGGAGGAGCGCTTCCGGCCGACGTCTCGTCGCTGATTGGCTTCTTTTCCTCCCGCCGTGTGTGAAAACACAAATGGCGTGTTTTGGTTGGCGTAAGGCGCCTGTCAGTTAACGGCAGCCGGAGTGCGCAGCCGCCGGCAGCCTCGCTCTGCCCACTGGGTGGGGCGGGAGGTAGGTGGGGTGAGGCGAGCTGGACGTGCGGGCGCGGTCGGCCTCTGGCGGGGCGGGGGAGGGGAGGGAGGGTCAGCGAAAGTAGCTCGCGCGCGAGCGGCCGCCCACCCTCCCCTTCCTCTGGGGGAGTCGTTTTACCCGCCGCCGGCCGGGCCTCGTCGTCTGATTGGCTCTCGGGGCCCAGAAAACTGGCCCTTGCCATTGGCTCGTGTTCGTGCAAGTTGAGTCCATCCGCCGGCCAGCGGGGGCGGCGAGGAGGCGCTCCCAGGTTCCGGCCCTCCCCTCGGCCCCGCGCCGCAGAGTCTGGCCGCGCGCCCCTGCGCAACGTGGCAGGAAGCGCGCGCTGGGGGCGGGGACGGGCAGTAGGGCTGAGCGGCTGCGGGGCGGGTGCAAGCACGTTTCCGACTTGAGTTGCCTCAAGAGGGGCGTGCTGAGCCAGACCTCCATCGCGCACTCCGGGGAGTGGAGGGAAGGAGCGAGGGCTCAGTTGGGCTGTTTTGGAGGCAGGAAGCACTTGCTCTCCCAAAGTCGCTCTGAGTTGTTATCAGTAAGGGAGCTGCAGTGGAGTAGGCGGGGAGAAGGCCGCACCCTTCTCTTAATTAAGTGACCTGCACGTCTAGGGCGCAGTAGTCCAGGGTTTCCTTGATGATGTCATACTTATCCTGTCCCTTTTTTTTCCACAGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTGCCACCATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTAAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGGCTAGCTCAGATCAGGCCGGCCCTATCTGCACGTGCGTACAGCGATCGCCAAATTCGATATCAAGCTTATCGATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCATCGATACCGTCGACCTCGACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATGGCAGGCATGCTGGGGAACTAGTACGCGTCGGAGGGGGGAGGGGAGTGTTGCAATACCTTTCTGGGAGTTCTCTGCTGCCTCCTGGCTTCTGAGGACCGCCCTGGGCCTGGGAGAATCCCTTCCCCCTCTTCCCTCGTGATCTGCAACTCCAGTCTTTCTAGAAGATGGGCGGGAGTCTTCTGGGCAGGCTTAAAGGCTAACCTGGTGTGTGGGCGTTGTCCTGCAGGGGAATTGAACAGGTGTAAAATTGGAGGGACAAGACTTCCCACAGATTTTCGGTTTTGTCGGGAAGTTTTTTAATAGGGGCAAATAAGGAAAATGGGAGGATAGGTAGTCATCTGGGGTTTTATGCAGCAAAACTACAGGTTATTATTGCTTGTGATCCGCCTCGGAGTATTTTCCATCGAGGTAGATTAAAGACATGCTCACCCGAGTTTTATACTCTCCTGCTTGAGATCCTTACTACAGTATGAAATTACAGTGTCGCGAGTTAGACTATGTAAGCAGAATTTTAATCATTTTTAAAGAGCCCAGTACTTCATATCCATTTCTCCCGCTCCTTCTGCAGCCTTATCAAAAGGTATTTTAGAACACTCATTTTAGCCCCATTTTCATTTATTATACTGGCTTATCCAACCCCTAGACAGAGCATTGGCATTTTCCCTTTCCTGATCTTAGAAGTCTGATGACTCATGAAACCAGACAGATTAGTTACATACACCACAAATCGAGGCTGTAGCTGGGGCCTCAACACTGCAGTTCTTTTATAACTCCTTAGTACACTTTTTGTTGATCCTTTGCCTTGATCCTTAATTTTCAGTGTCTATCACCTCTCCCGTCAGGTGGTGTTCCACATTTGGGCCTATTCTCAGTCCAGGGAGTTTTACAACAATAGATGTATTGAGAATCCAACCTAAAGCTTAACTTTCCACTCCCATGAATGCCTCTCTCCTTTTTCTCCATTTATAAACTGAGCTATTAACCATTAATGGTTTCCAGGTGGATGTCTCCTCCCCCAATATTACCTGATGTATCTTACATATTGCCAGGCTGATATTTTAAGACATTAAAAGGTATATTTCATTATTGAGCCACATGGTATTGATTACTGCTTACTAAAATTTTGTCATTGTACACATCTGTAAAAGGTGGTTCCTTTTGGAATGCAAAGTTCAGGTGTTTGTTGTCTTTCCTGACCTAAGGTCTTGTGAGCTTGTATTTTTTCTATTTAAGCAGTGCTTTCTCTTGGACTGGCTTGACTCATGGCATTCTACACGTTATTGCTGGTCTAAATGTGATTTTGCCAAGCTTCTTCAGGACCTATAATTTTGCTTGACTTGTAGCCAAACACAAGTAAAATGATTAAGCAACAAATGTATTTGTGAAGCTTGGTTTTTAGGTTGTTGTGTTGTGTGTGCTTGTGCTCTATAATAATACTATCCAGGGGCTGGAGAGGTGGCTCGGAGTTCAAGAGCACAGACTGCTCTTCCAGAAGTCCTGAGTTCAATTCCCAGCAACCACATGGTGGCTCACAACCATCTGTAATGGGATCTGATGCCCTCTTCTGGTGTGTCTGAAGACCACAAGTGTATTCACATTAAATAAATAAATCCTCCTTCTTCTTCTTTTTTTTTTTTTTAAAGAGAATACTGTCTCCAGTAGAATTTACTGAAGTAATGAAATACTTTGTGTTTGTTCCAATATGGTAGCCAATAATCAAATTACTCTTTAAGCACTGGAAATGTTACCAAGGAACTAATTTTTATTTGAAGTGTAACTGTGGACAGAGGAGCCATAACTGCAGACT
在某些实施例中,利用靶向载体将ADAR1多核苷酸或ADAR1基因座掺入非人动物(例如啮齿类动物,例如大鼠或小鼠)的ROSA26基因座位点处。在某些实施例中,用于插入ROSA26基因座位点的靶向载体包含以下或由以下组成:核苷酸序列,该核苷酸序列与SEQID NO:65的核苷酸序列相同或具有至少60%、65%、70%、75%、80%、82%、84%、86%、88%、90%、92%、94%、96%、98%或99%同源性。在某些实施例中,用于插入ROSA26基因座位点的靶向载体包含以下或由以下组成:与SEQ ID NO:65的核苷酸序列相同的核苷酸序列。
SEQ ID NO:65-用于插入ROSA26基因座的示例性ADAR1靶向载体
GGAAGAGTCCTGACCCAGGGAAGACATTAAAAAGGTAGTGGGGTCGACTAGATGAAGGAGAGCCTTTCTCTCTGGGCAAGAGCGGTGCAATGGTGTGTAAAGGTAGCTGAGAAGACGAAAAGGGCAAGCATCTTCCTGCTACCAGGCTGGGGAGGCCCAGGCCCACGACCCCGAGGAGAGGGAACGCAGGGAGACTGAGGTGACCCTTCTTTCCCCCGGGGCCCGGTCGTGTGGTTCGGTGTCTCTTTTCTGTTGGACCCTTACCTTGACCCAGGCGCTGCCGGGGCCTGGGCCCGGGCTGCGGCGCACGGCACTCCCGGGAGGCAGCGAGACTCGAGTTAGGCCCAACGCGGCGCCACGGCGTTTCCTGGCCGGGAATGGCCCGTACCCGTGAGGTGGGGGTGGGGGGCAGAAAAGGCGGAGCGAGCCCGAGGCGGGGAGGGGGAGGGCCAGGGGCGGAGGGGGCCGGCACTACTGTGTTGGCGGACTGGCGGGACTAGGGCTGCGTGAGTCTCTGAGCGCAGGCGGGCGGCGGCCGCCCCTCCCCCGGCGGCGGCAGCGGCGGCAGCGGCGGCAGCTCACTCAGCCCGCTGCCCGAGCGGAAACGCCACTGACCGCACGGGGATTCCCAGTGCCGGCGCCAGGGGCACGCGGGACACGCCCCCTCCCGCCGCGCCATTGGCCTCTCCGCCCACCGCCCCACACTTATTGGCCGGTGCGCCGCCAATCAGCGGAGGCTGCCGGGGCCGCCTAAAGAAGAGGCTGTGCTTTGGGGCTCCGGCTCCTCAGAGAGCCTCGGCTAGGTAGGGGATCGGGACTCTGGCGGGAGGGCGGCTTGGTGCGTTTGCGGGGATGGGCGGCCGCGGCAGGCCCTCCGAGCGTGGTGGAGCCGTTCTGTGAGACAGCCGGGTACGAGTCGTGACGCTGGAAGGGGCAAGCGGGTGGTGGGCAGGAATGCGGTCCGCCCTGCAGCAACCGGAGGGGGAGGGAGAAGGGAGCGGAAAAGTCTCCACCGGACGCGGCCATGGCTCGGGGGGGGGGGGGCAGCGGAGGAGCGCTTCCGGCCGACGTCTCGTCGCTGATTGGCTTCTTTTCCTCCCGCCGTGTGTGAAAACACAAATGGCGTGTTTTGGTTGGCGTAAGGCGCCTGTCAGTTAACGGCAGCCGGAGTGCGCAGCCGCCGGCAGCCTCGCTCTGCCCACTGGGTGGGGCGGGAGGTAGGTGGGGTGAGGCGAGCTGGACGTGCGGGCGCGGTCGGCCTCTGGCGGGGCGGGGGAGGGGAGGGAGGGTCAGCGAAAGTAGCTCGCGCGCGAGCGGCCGCCCACCCTCCCCTTCCTCTGGGGGAGTCGTTTTACCCGCCGCCGGCCGGGCCTCGTCGTCTGATTGGCTCTCGGGGCCCAGAAAACTGGCCCTTGCCATTGGCTCGTGTTCGTGCAAGTTGAGTCCATCCGCCGGCCAGCGGGGGCGGCGAGGAGGCGCTCCCAGGTTCCGGCCCTCCCCTCGGCCCCGCGCCGCAGAGTCTGGCCGCGCGCCCCTGCGCAACGTGGCAGGAAGCGCGCGCTGGGGGCGGGGACGGGCAGTAGGGCTGAGCGGCTGCGGGGCGGGTGCAAGCACGTTTCCGACTTGAGTTGCCTCAAGAGGGGCGTGCTGAGCCAGACCTCCATCGCGCACTCCGGGGAGTGGAGGGAAGGAGCGAGGGCTCAGTTGGGCTGTTTTGGAGGCAGGAAGCACTTGCTCTCCCAAAGTCGCTCTGAGTTGTTATCAGTAAGGGAGCTGCAGTGGAGTAGGCGGGGAGAAGGCCGCACCCTTCTCTTAATTAAGTGACCTGCACGTCTAGGGCGCAGTAGTCCAGGGTTTCCTTGATGATGTCATACTTATCCTGTCCCTTTTTTTTCCACAGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTGCCACCATGAATCCGCGGCAGGGGTATTCCCTCAGCGGATACTACACCCATCCATTTCAAGGCTATGAGCACAGACAGCTCAGATACCAGCAGCCTGGGCCAGGATCTTCCCCCAGTAGTTTCCTGCTTAAGCAAATAGAATTTCTCAAGGGGCAGCTCCCAGAAGCACCGGTGATTGGAAAGCAGACACCGTCACTGCCACCTTCCCTCCCAGGACTCCGGCCAAGGTTTCCAGTACTACTTGCCTCCAGTACCAGAGGCAGGCAAGTGGACATCAGGGGTGTCCCCAGGGGCGTGCATCTCGGAAGTCAGGGGCTCCAGAGAGGGTTCCAGCATCCTTCACCACGTGGCAGGAGTCTGCCACAGAGAGGTGTTGATTGCCTTTCCTCACATTTCCAGGAACTGAGTATCTACCAAGATCAGGAACAAAGGATCTTAAAGTTCCTGGAAGAGCTTGGGGAAGGGAAGGCCACCACAGCACATGATCTGTCTGGGAAACTTGGGACTCCGAAGAAAGAAATCAATCGAGTTTTATACTCCCTGGCAAAGAAGGGCAAGCTACAGAAAGAGGCAGGAACACCCCCTTTGTGGAAAATCGCGGTCTCCACTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACGGTCATAGCCAAGGAGCCCCAAACTCAGACCCGAGTTTGGAACCGGAAGACAGAAACTCCACATCTGTCTCAGAAGATCTTCTTGAGCCTTTTATTGCAGTCTCAGCTCAGGCTTGGAACCAGCACAGCGGAGTGGTAAGACCAGACAGTCATAGCCAAGGATCCCCAAACTCAGACCCAGGTTTGGAACCTGAAGACAGCAACTCCACATCTGCCTTGGAAGATCCTCTTGAGTTTTTAGACATGGCCGAGATCAAGGAGAAAATCTGCGACTATCTCTTCAATGTGTCTGACTCCTCTGCCCTGAATTTGGCTAAAAATATTGGCCTTACCAAGGCCCGAGATATAAATGCTGTGCTAATTGACATGGAAAGGCAGGGGGATGTCTATAGACAAGGGACAACCCCTCCCATATGGCATTTGACAGACAAGAAGCGAGAGAGGATGCAAATCAAGAGAAATACGAACAGTGTTCCTGAAACCGCTCCAGCTGCAATCCCTGAGACCAAAAGAAACGCAGAGTTCCTCACCTGTAATATACCCACATCAAATGCCTCAAATAACATGGTAACCACAGAAAAAGTGGAGAATGGGCAGGAACCTGTCATAAAGTTAGAAAACAGGCAAGAGGCCAGACCAGAACCAGCAAGACTGAAACCACCTGTTCATTACAATGGCCCCTCAAAAGCAGGGTATGTTGACTTTGAAAATGGCCAGTGGGCCACAGATGACATCCCAGATGACTTGAATAGTATCCGCGCAGCACCAGGTGAGTTTCGAGCCATCATGGAGATGCCCTCCTTCTACAGTCATGGCTTGCCACGGTGTTCACCCTACAAGAAACTGACAGAGTGCCAGCTGAAGAACCCCATCAGCGGGCTGTTAGAATATGCCCAGTTCGCTAGTCAAACCTGTGAGTTCAACATGATAGAGCAGAGTGGACCACCCCATGAACCTCGATTTAAATTCCAGGTTGTCATCAATGGCCGAGAGTTTCCCCCAGCTGAAGCTGGAAGCAAGAAAGTGGCCAAGCAGGATGCAGCTATGAAAGCCATGACAATTCTGCTAGAGGAAGCCAAAGCCAAGGACAGTGGAAAATCAGAAGAATCATCCCACTATTCCACAGAGAAAGAATCAGAGAAGACTGCAGAGTCCCAGACCCCCACCCCTTCAGCCACATCCTTCTTTTCTGGGAAGAGCCCCGTCACCACACTGCTTGAGTGTATGCACAAATTGGGGAACTCCTGCGAATTCCGTCTCCTGTCCAAAGAAGGCCCTGCCCATGAACCCAAGTTCCAATACTGTGTTGCAGTGGGAGCCCAAACTTTCCCCAGTGTGAGTGCTCCCAGCAAGAAAGTGGCAAAGCAGATGGCCGCAGAGGAAGCCATGAAGGCCCTGCATGGGGAGGCGACCAACTCCATGGCTTCTGATAACCAGCCTGAAGGTATGATCTCAGAGTCACTTGATAACTTGGAATCCATGATGCCCAACAAGGTCAGGAAGATTGGCGAGCTCGTGAGATACCTGAACACCAACCCTGTGGGTGGCCTTTTGGAGTACGCCCGCTCCCATGGCTTTGCTGCTGAATTCAAGTTGGTCGACCAGTCCGGACCTCCTCACGAGCCCAAGTTCGTTTACCAAGCAAAAGTTGGGGGTCGCTGGTTCCCAGCCGTCTGCGCACACAGCAAGAAGCAAGGCAAGCAGGAAGCAGCAGATGCGGCTCTCCGTGTCTTGATTGGGGAGAACGAGAAGGCAGAACGCATGGGTTTCACAGAGGTAACCCCAGTGACAGGGGCCAGTCTCAGAAGAACTATGCTCCTCCTCTCAAGGTCCCCAGAAGCACAGCCAAAGACACTCCCTCTCACTGGCAGCACCTTCCATGACCAGATAGCCATGCTGAGCCACCGGTGCTTCAACACTCTGACTAACAGCTTCCAGCCCTCCTTGCTCGGCCGCAAGATTCTGGCCGCCATCATTATGAAAAAAGACTCTGAGGACATGGGTGTCGTCGTCAGCTTGGGAACAGGGAATCGCTGTGTGAAAGGAGATTCTCTCAGCCTAAAAGGAGAAACTGTCAATGACTGCCATGCAGAAATAATCTCCCGGAGAGGCTTCATCAGGTTTCTCTACAGTGAGTTAATGAAATACAACTCCCAGACTGCGAAGGATAGTATATTTGAACCTGCTAAGGGAGGAGAAAAGCTCCAAATAAAAAAGACTGTGTCATTCCATCTGTATATCAGCACTGCTCCGTGTGGAGATGGCGCCCTCTTTGACAAGTCCTGCAGCGACCGTGCTATGGAAAGCACAGAATCCCGCCACTACCCTGTCTTCGAGAATCCCAAACAAGGAAAGCTCCGCACCAAGGTGGAGAACGGAGAAGGCACAATCCCTGTGGAATCCAGTGACATTGTGCCTACGTGGGATGGCATTCGGCTCGGGGAGAGACTCCGTACCATGTCCTGTAGTGACAAAATCCTACGCTGGAACGTGCTGGGCCTGCAAGGGGCACTGTTGACCCACTTCCTGCAGCCCATTTATCTCAAATCTGTCACATTGGGTTACCTTTTCAGCCAAGGGCATCTGACCCGTGCTATTTGCTGTCGTGTGACAAGAGATGGGAGTGCATTTGAGGATGGACTACGACATCCCTTTATTGTCAACCACCCCAAGGTTGGCAGAGTCAGCATATATGATTCCAAAAGGCAATCCGGGAAGACTAAGGAGACAAGCGTCAACTGGTGTCTGGCTGATGGCTATGACCTGGAGATCCTGGACGGTACCAGAGGCACTGTGGATGGGCCACGGAATGAATTGTCCCGGGTCTCCAAAAAGAACATTTTTCTTCTATTTAAGAAGCTCTGCTCCTTCCGTTACCGCAGGGATCTACTGAGACTCTCCTATGGTGAGGCCAAGAAAGCTGCCCGTGACTACGAGACGGCCAAGAACTACTTCAAAAAAGGCCTGAAGGATATGGGCTATGGGAACTGGATTAGCAAACCCCAGGAGGAAAAGAACTTTTATCTCTGCCCAGTATAGGCTAGCTCAGATCAGGCCGGCCCTATCTGCACGTGCGTACAGCGATCGCCAAATTCGATATCAAGCTTATCGATAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCATCGATACCGTCGACCTCGACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATGGCAGGCATGCTGGGGAACTAGTACGCGTCGGAGGGGGGAGGGGAGTGTTGCAATACCTTTCTGGGAGTTCTCTGCTGCCTCCTGGCTTCTGAGGACCGCCCTGGGCCTGGGAGAATCCCTTCCCCCTCTTCCCTCGTGATCTGCAACTCCAGTCTTTCTAGAAGATGGGCGGGAGTCTTCTGGGCAGGCTTAAAGGCTAACCTGGTGTGTGGGCGTTGTCCTGCAGGGGAATTGAACAGGTGTAAAATTGGAGGGACAAGACTTCCCACAGATTTTCGGTTTTGTCGGGAAGTTTTTTAATAGGGGCAAATAAGGAAAATGGGAGGATAGGTAGTCATCTGGGGTTTTATGCAGCAAAACTACAGGTTATTATTGCTTGTGATCCGCCTCGGAGTATTTTCCATCGAGGTAGATTAAAGACATGCTCACCCGAGTTTTATACTCTCCTGCTTGAGATCCTTACTACAGTATGAAATTACAGTGTCGCGAGTTAGACTATGTAAGCAGAATTTTAATCATTTTTAAAGAGCCCAGTACTTCATATCCATTTCTCCCGCTCCTTCTGCAGCCTTATCAAAAGGTATTTTAGAACACTCATTTTAGCCCCATTTTCATTTATTATACTGGCTTATCCAACCCCTAGACAGAGCATTGGCATTTTCCCTTTCCTGATCTTAGAAGTCTGATGACTCATGAAACCAGACAGATTAGTTACATACACCACAAATCGAGGCTGTAGCTGGGGCCTCAACACTGCAGTTCTTTTATAACTCCTTAGTACACTTTTTGTTGATCCTTTGCCTTGATCCTTAATTTTCAGTGTCTATCACCTCTCCCGTCAGGTGGTGTTCCACATTTGGGCCTATTCTCAGTCCAGGGAGTTTTACAACAATAGATGTATTGAGAATCCAACCTAAAGCTTAACTTTCCACTCCCATGAATGCCTCTCTCCTTTTTCTCCATTTATAAACTGAGCTATTAACCATTAATGGTTTCCAGGTGGATGTCTCCTCCCCCAATATTACCTGATGTATCTTACATATTGCCAGGCTGATATTTTAAGACATTAAAAGGTATATTTCATTATTGAGCCACATGGTATTGATTACTGCTTACTAAAATTTTGTCATTGTACACATCTGTAAAAGGTGGTTCCTTTTGGAATGCAAAGTTCAGGTGTTTGTTGTCTTTCCTGACCTAAGGTCTTGTGAGCTTGTATTTTTTCTATTTAAGCAGTGCTTTCTCTTGGACTGGCTTGACTCATGGCATTCTACACGTTATTGCTGGTCTAAATGTGATTTTGCCAAGCTTCTTCAGGACCTATAATTTTGCTTGACTTGTAGCCAAACACAAGTAAAATGATTAAGCAACAAATGTATTTGTGAAGCTTGGTTTTTAGGTTGTTGTGTTGTGTGTGCTTGTGCTCTATAATAATACTATCCAGGGGCTGGAGAGGTGGCTCGGAGTTCAAGAGCACAGACTGCTCTTCCAGAAGTCCTGAGTTCAATTCCCAGCAACCACATGGTGGCTCACAACCATCTGTAATGGGATCTGATGCCCTCTTCTGGTGTGTCTGAAGACCACAAGTGTATTCACATTAAATAAATAAATCCTCCTTCTTCTTCTTTTTTTTTTTTTTAAAGAGAATACTGTCTCCAGTAGAATTTACTGAAGTAATGAAATACTTTGTGTTTGTTCCAATATGGTAGCCAATAATCAAATTACTCTTTAAGCACTGGAAATGTTACCAAGGAACTAATTTTTATTTGAAGTGTAACTGTGGACAGAGGAGCCATAACTGCAGACT
促进靶向载体整合的核酸酶药剂
在一些实施例中,核酸酶药剂(例如CRISPR/Cas系统、锌指核酸酶和/或TALEN)可以与靶向载体组合使用以促进靶基因座的修饰(例如ADAR1基因座的修饰和/或被靶向用于外源蛋白插入的基因座的修饰)。此类核酸酶药剂及其用途是本领域众所周知的,并且可以促进靶向载体和靶基因座之间的同源重组。当核酸酶药剂与靶向载体组合使用时,靶向载体可包含对应于足够接近核酸酶切割位点的5'和3'靶序列的5'和3'同源臂,以促进在核酸酶切割位点出现缺口或双链断裂后靶序列和同源臂之间的同源重组事件。在一些实施例中,术语“核酸酶切割位点”包括由核酸酶药剂在其处产生切口或双链断裂(例如,Cas9切割位点)的DNA序列。对应于靶向载体的5'和3'同源臂的靶向基因座内的靶序列如果距离足以促进在识别位点的切口或双链断裂后5'和3'靶序列和同源臂之间的同源重组事件的发生,则“位于足够接近”核酸酶切割位点。因此,在某些实施例中,对应于靶向载体的5'和/或3'同源臂的靶序列在给定识别位点的至少一个核苷酸内或在给定识别位点的至少10个核苷酸至约14kb内。在一些实施例中,核酸酶切割位点紧邻至少一个、两个、三个、四个和/或更多个靶序列。
对应于靶向载体的同源臂的靶序列和核酸酶切割位点的空间关系可以变化。例如,靶序列可位于核酸酶切割位点的5',靶序列可位于识别位点的3',或靶序列可位于核酸酶切割位点的侧翼。
与单独使用靶向载体相比,靶向载体与核酸酶药剂的组合使用可导致靶向效率增加。例如,当靶向载体与核酸酶药剂联合使用时,靶向载体的靶向效率与使用单独靶向载体相比可提高至少两倍、至少三倍、至少四倍、至少五倍、至少六倍、至少七倍、至少八倍、至少九倍、至少十倍或在由这些整数形成的范围内,例如2-10倍。
在一些实施例中,靶向载体包含同源臂,其对应于并衍生自比旨在在细胞中进行同源重组的其他方法通常使用的那些更大的核酸序列。在一些实施例中,靶向载体包含同源臂,其对应于并衍生自比旨在在细胞中进行同源重组的其他方法通常使用的那些更短的核酸序列。在一些实施例中,同源臂的长度至少为10kb,或者5'同源臂和3'同源臂的总和可为例如至少10kb。在一些实施例中,同源臂的长度小于10kb,或者5'同源臂和3'同源臂的总和可例如小于10kb。
在一些实施例中,包含核酸构建体的靶向载体比旨在在细胞中进行同源重组的其他方法通常使用的那些更大。例如,在一些实施例中,传统上由于其大小限制而不能被基于质粒的靶向载体容纳的大基因座仍然可以通过使用大靶向载体来使用。例如,靶向的基因座可以是(即5'和3'同源臂可以对应于)使用常规方法不可靶向的细胞基因座,或者在不存在由核酸酶药剂(例如,Cas蛋白)诱导的切口或双链断裂时只能错误地靶向或只能以明显低的效率靶向的细胞基因座。在一些实施例中,大靶向载体可包括衍生自细菌人工染色体(BAC)、人人工染色体或酵母人工染色体(YAC)的载体。大靶向载体可以是线性形式或环形形式。大靶向载体的实例及其制备方法描述与以下中:例如Macdonald(2014),美国专利号6,586,251、6,596,541和7,105,348;和国际专利申请公开号WO 2002/036789。
制备提供的非人动物的方法
本领域技术人员理解,可以利用各种技术来制备根据本披露的工程化的细胞、组织、动物等。本文提供了用于制备非人动物(例如啮齿类动物,例如小鼠)的组合物和方法,非人动物的种系基因组包含工程化的人ADAR1基因,该基因包括一个或多个功能性ADAR1结构域(例如,Z结合结构域、双链RNA结合基序和/或RNA脱氨酶基序)。在一些实施例中,本文所述的方法包括插入人ADAR蛋白的转录独立部分,其可以通过反式剪接受体和/或供体的作用在体内重新连接。
在一些实施例中,非人ADAR1基因座可以是用于插入人ADAR1基因的位点。在一些实施例中,任何合适的整合基因座可以是用于插入人ADAR1编码序列的位点。
在一些实施例中,人ADAR1基因可以处于一个或多个异源蛋白质增强子和/或启动子的控制之下。在一些实施例中,本文所述的方法包括插入编码人ADAR蛋白的单个人ADAR1基因。在一些实施例中,本文所述的方法包括插入编码多于一个人ADAR多肽的多于一个人ADAR1基因。
本文提供了用于制备非人动物(例如啮齿类动物,例如小鼠)的组合物和方法,非人动物的种系基因组包含工程化的非人灵长类动物(NHP)ADAR1基因座,其包括一个或多个功能性ADAR1结构域(例如,Z结合结构域、双链RNA结合基序和/或RNA脱氨酶基序)。在一些实施例中,本文所述的方法包括插入NHP ADAR蛋白的转录独立部分,其可以通过反式剪接受体和/或供体的作用在体内重新连接。
在一些实施例中,非人ADAR1基因座可以是用于插入NHP ADAR1基因的位点。在一些实施例中,任何合适的整合基因座可以是用于插入NHP ADAR1编码序列的位点。
在一些实施例中,NHP ADAR1基因可以处于一个或多个异源蛋白质增强子和/或启动子的控制之下。在一些实施例中,本文所述的方法包括插入编码NHP ADAR蛋白的单个NHPADAR1基因。在一些实施例中,本文所述的方法包括插入多于一个编码NHP ADAR多肽的NHPADAR1基因。
用于创建转基因动物的胚胎干细胞修饰
在一些实施例中,制备所提供的非人动物的方法包括将包含外源ADAR1基因的遗传物质插入非人动物(例如啮齿类动物,例如,大鼠或小鼠)的胚胎干细胞。在一些实施例中,方法包括在单个ES细胞克隆中的多个插入。在一些实施例中,方法包括在连续的ES细胞克隆中进行的顺序插入。在一些实施例中,方法包括在工程化的ES细胞克隆中进行的单个插入。
在一些实施例中,涉及使用胚胎干细胞的制备非人转基因动物的方法可以具有通过本领域已知的任何方式引入的靶向载体和/或核酸构建体。在一些实施例中,通过包括但不限于以下的方法将转基因引入胚胎干细胞:电穿孔、基于脂质的转染、基于脂质的纳米颗粒、逆转录病毒感染和/或慢病毒感染。
在制备非人动物(例如啮齿类动物,例如小鼠)的方法的一些实施例中,将DNA片段引入非人胚胎干细胞中。
在一些实施例中,包括使用胚胎干细胞修饰来产生转基因动物的方法可以利用本文所述的任何分子生物学技术或试剂。
在一些实施例中,使用本领域已知的方法将包含ADAR1编码序列的靶向载体电穿孔到小鼠ES细胞中。已经历同源重组的克隆的筛选和/或选择产生经修饰的ES细胞,用于生成表达huADAR1的嵌合小鼠。使用对huADAR1转基因具有特异性的引物和探针,通过PCR筛选确认阳性ES细胞克隆。引物和探针取决于目的插入基因座而异。靶向的ES细胞用作供体ES细胞,并使用适当的方法引入8细胞期小鼠胚胎(例如,通过
Figure BDA0004094631750001851
方法(参见,例如,美国专利号7,294,754和Poueymirou等人(2007).F0 generation mice thatare essentially fully derived from the donor gene-targeted ES cells allowingimmediate phenotypic analyses[基本上完全衍生自允许立即进行表型分析的供体基因靶向ES细胞的F0代小鼠],Nature Biotech.[自然生物技术]25(1):91-99)。使用本领域已知的方法通过基因分型来鉴定表达huADAR1的转基因小鼠。小鼠被培育成huADAR1插入基因座的稳定杂合和/或纯合转基因传递。
用于创建转基因动物的受精卵注射
在适当的情况下,外源ADAR1基因(例如,编码人ADAR1蛋白的人ADAR1)可以单独进行修饰,以包括针对在非人动物中表达优化的密码子(例如,参见美国专利号5,670,356和5,874,304)。密码子优化的序列是工程化的序列,并且优选地编码由非密码子优化的亲本多核苷酸编码的相同多肽(或多肽特征性部分的生物活性片段,其具有与全长多肽基本相同的活性)。在一些实施例中,编码外源ADAR1蛋白的外源ADAR1基因可单独包括改变的序列以优化特定细胞类型的密码子使用(例如,啮齿类动物细胞,例如,小鼠细胞)。例如,如本文所述,待插入非人动物基因组中的每个核苷酸序列的密码子(例如啮齿类动物,例如小鼠)可以针对在非人动物的细胞中表达。这样的序列可以被描述为密码子优化的序列。
在一些实施例中,编码外源ADAR1基因的核苷酸序列的插入采用如本文所述的非人动物种系基因组的最少量修饰,并导致外源ADAR1基因的表达(例如,人ADAR1基因或NHPADAR1基因)。用于产生工程化的非人动物(例如啮齿类动物,例如大鼠或小鼠)的方法,包括敲除和敲入,是本领域已知的(参见例如,Gene Targeting:A Practical Approach[基因靶向:一种实用的方法],Joyner,编辑,牛津大学出版社公司(Oxford University Press,Inc.),2000)。例如,遗传工程化的啮齿类动物的产生可以任选地包括破坏一个或多个内源啮齿类动物基因(或基因区段)的遗传基因座和在一些实施例中,在与内源啮齿类动物基因(或基因区段)相同的位置,将一个或多个异源基因(或基因区段或核苷酸序列)引入啮齿类动物基因组。在一些实施例中,编码外源ADAR1基因(例如人ADAR1基因或NHP ADAR1基因)的核苷酸序列被随机插入啮齿类动物的种系基因组中。在一些实施例中,编码外源ADAR1基因的核苷酸序列被引入啮齿类动物种系基因组中的非人(例如,啮齿类动物,例如,大鼠或小鼠)ADAR1基因座的上游;在一些特定的实施例中,内源ADAR1基因座被改变、修饰或过程化以包含人和/或NHP ADAR1基因区段,其中可以利用衍生自啮齿类动物、人和/或NHP的ADAR1基因区段的任何组合。
图1和图2提供了示例性核酸构建体的示意图(未按比例),这些核酸构建体经过工程化以将外源ADAR1基因引入小鼠种系基因组。图4和12说明了这些构建体预测整合到小鼠ROSA26基因座中。构建此类包含靶向载体的工程化核酸构建体的方法是本领域已知的。一旦产生,靶向载体可以被线性化注射到啮齿类动物受精卵中,或者电穿孔到啮齿类动物胚胎干(ES)细胞中以产生其种系基因组包含外源ADAR1基因的啮齿类动物。在一些实施例中,可以使用本领域已知的方法选择和/或筛选包含含有外源ADAR1基因的靶向载体的啮齿类动物ES细胞的确认。如以下实例部分所述,包含注射的核酸构建体(其包含含有外源ADAR1基因的靶向载体)的啮齿类动物受精卵可用于产生包含整合的外源ADAR1基因的转基因非人动物,此类动物可以从移植到代孕母体中的可存活注射受精卵群体中筛选。
在一些实施例中,通过电穿孔将靶向载体引入非人(例如啮齿类动物,例如小鼠或大鼠)胚胎细胞(例如受精卵和/或干细胞)使得靶向载体中包含的序列导致非人(例如,啮齿类动物,例如,大鼠或小鼠)细胞或非人动物(例如,啮齿类动物,例如,大鼠或小鼠)表达外源ADAR1基因的能力。如本文所述,产生了遗传工程化的非人动物,其中外源ADAR1基因已经产生和/或掺入非人动物的种系基因组中(例如,在确定的位点,和/或在随机位点)。在一些实施例中,使用本领域已知的方法(例如PCR、蛋白质印迹等)确认外源ADAR1基因的插入和/或表达。在一些实施例中,然后使用衍生自包含外源ADAR1基因的非人胚胎干细胞的组织、细胞和/或动物在体外或体内表征如本文所述的寡核苷酸。
在一些实施例中,制备经遗传修饰的非人动物(例如啮齿类动物,例如小鼠)的方法包括在非人动物的种系基因组中工程化人ADAR1基因,以包含与组织特异性调节区可操作地连接的序列。
在一些实施例中,制备经遗传修饰的非人动物(例如啮齿类动物,例如小鼠)的方法包括在非人动物的种系基因组中工程化人ADAR1基因,以包含与时间特异性调节区可操作地连接的序列。
在一些实施例中,制备经遗传修饰的非人动物(例如啮齿类动物,例如小鼠)的方法包括在非人动物的种系基因组中工程化人ADAR1基因,以包含与底物特异性调节区可操作地连接的序列。
在一些实施例中,提供了由如本文所述的方法制备、产生、生产、获得或可获得的非人动物(例如啮齿类动物,例如大鼠或小鼠)。
在制备非人动物(例如啮齿类动物,例如大鼠或小鼠)的方法的一些实施例中,将DNA片段引入其种系基因组包含内源ADAR1基因座的非人胚胎干细胞和/或受精卵中。替代性地或另外地,在一些实施例中,如本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠)的种系基因组还包含缺失的、失活的、功能性沉默的或在其他方面非功能性的内源ADAR1基因座。可以使用本文描述的方法和/或本领域已知的方法来实现基因修饰以缺失基因或遗传基因座或使其失去功能。
可以根据如本文所述的外源ADAR1基因在其种系基因组中的存在和/或外源ADAR1蛋白在非人动物的组织或细胞中的表达来鉴定遗传工程化的首建非人动物(例如啮齿类动物,例如大鼠或小鼠)。然后可以使用遗传工程化的首建非人动物来繁殖携带外源ADAR1基因的另外非人动物,从而产生一组非人动物,每只动物都携带一个或多个外源ADAR1基因拷贝。此外,携带外源ADAR1基因的遗传工程化的非人动物可以进一步按需要与携带其他转基因(例如人疾病基因)或其他突变内源基因座的其他遗传工程化的非人动物杂交。
遗传工程化的非人动物(例如,啮齿类动物,例如,大鼠或小鼠)也可以被生产以包含允许转基因或一个或多个整合序列的受调节的、定向的、可诱导的和/或细胞类型特异性表达的选定系统。例如,本文所述的非人动物可以被工程化以包含一个或多个编码外源ADAR1基因的有条件地表达的序列(例如,综述于Rajewski,K.等人,1996,J.Clin.Invest.[临床研究杂志]98(3):600-3)。示例性系统包括噬菌体P1的Cre/loxP重组酶系统(参见例如,Lakso,M.等人,1992,Proc.Natl.Acad.Sci.U.S.A.[美国国家科学院院刊]89:6232-6)和酿酒酵母的FLP/Frt重组酶系统(O’Gorman,S.等人,1991,Science[科学]251:1351-5)。此类动物可以通过以下来提供:构建“双重”遗传工程化的动物来提供,例如通过交配两只遗传工程化所述的动物,其中一只含有包含选定修饰的转基因(例如如本文所述的外源ADAR1基因),另一个包含编码重组酶的转基因(例如,Cre重组酶)。
适合外源ADAR1基因表达的非人动物
非人动物(例如啮齿类动物,例如大鼠或小鼠)可如上所述或使用本领域已知的方法制备,以包含另外的人、人源化或在其他方面工程化的基因,这通常取决于非人动物的预期用途。人、人源化或在其他方面工程化的基因的遗传材料可以通过以下来引入:进一步改变具有如上所述的遗传修饰或改变的细胞基因组(例如胚胎干细胞,和/或衍生自包含外源ADAR1基因的转基因啮齿动物的受精卵的注射),或通过本领域已知的育种技术用所期望的其他遗传修饰的或工程化的品系。
如本领域技术人员所理解的,各种相容的小鼠品系(例如,WT,含有一个或多个转基因,在内源基因座中含有一个或多个突变等)可以繁育成本文所述的任一工程化小鼠以产生任何数量的表达ADAR1(例如,NHP ADAR1、人ADAR1等)多肽或其特征性部分和任何其他遗传特征(例如,天然小鼠突变基因座、疾病建模内源性小鼠基因突变基因座、表达目的人基因突变的转基因衍生突变动物等)的经遗传修饰的小鼠品系。可以利用各种技术来产生对于编码如本文所述的ADAR1多肽或其特征性部分(例如人ADAR1)的转基因多核苷酸而言杂合或纯合的小鼠。在一些实施例中,将huADAR1纯合或杂合的经遗传修饰的小鼠(例如,实例中描述的那些)繁育成对于可能与ADAR功能相关的目的内源小鼠基因的突变(缺失、功能获得、功能丧失、等)而言纯合或杂合的小鼠。将表达所期望ADAR1或其特征性部分并且对于目的基因而言杂合的所得后代杂交以获得对于ADAR1和/或目的基因而言纯合和/或杂合的小鼠。在一些实施例中,繁育可以由商业繁育者进行(例如,杰克逊实验室(The JacksonLaboratory))。在某些实施例中,对于转基因ADAR1插入而言杂合的小鼠(例如,如本文所述的)与平衡系杂交,以维持稳定的杂合转基因ADAR1传递。在一些实施例中,紧密连锁的表型可检测标记被遗传工程化到转基因ADAR1小鼠中以帮助杂交和/或基因分型。
尽管本文广泛讨论了描述在小鼠(即具有整合到其种系基因组中的外源ADAR1基因的小鼠)中构建外源ADAR1基因的实施例,但也提供了包含外源ADAR1基因的其他非人动物。此类非人动物包括任何可进行遗传修饰以表达如本文所述的外源ADAR1多肽和/或其片段的动物,包括例如哺乳动物,例如小鼠,大鼠、兔、猪、牛(例如,奶牛、公牛、水牛)、鹿、绵羊、山羊、鸡、猫、狗、雪貂、灵长类动物(例如,狨猴、恒河猴)等。例如,对于那些不容易获得合适的可遗传修饰的ES细胞的非人动物,采用其他方法来制备包含遗传修饰的非人动物。此类方法包括,例如修饰非ES细胞基因组(例如成纤维细胞或诱导的多能细胞)和使用体细胞核转移(SCNT)将经遗传修饰的基因组转移至合适的细胞,例如去核的卵母细胞,并在合适的条件下在非人动物中孕育经修饰的细胞(例如经修饰的卵母细胞)以形成胚胎。
修饰非人动物种系基因组(例如猪、牛、啮齿类动物、鸡等基因组)的方法包括,例如使用锌指核酸酶(ZFN)、转录激活子样效应核酸酶(TALEN)或Cas蛋白(即CRISPR/Cas系统)以包括外源ADAR1基因。可以在例如美国专利号9,738,897和美国专利申请公开号US2016/0145646(2016年5月26日发布)和US 2016/0177339(2016年6月23日公布)中找到用于修饰非人动物种系基因组的方法的指南。
在一些实施例中,本文所述的非人动物是哺乳动物。在一些实施例中,如本文所述的非人动物是小型哺乳动物,例如跳鼠总科(Dipodoidea)或鼠总科(Muroidea)的小型哺乳动物。在一些实施例中,本文所述的经遗传修饰的动物是啮齿类动物。在一些实施例中,本文所述的啮齿类动物选自小鼠、大鼠和仓鼠。在一些实施例中,本文所述的啮齿类动物选自鼠总科。在一些实施例中,本文所述的经遗传修饰的动物来自选自以下的科:丽仓鼠科(Calomyscidae)(例如,鼠样仓鼠)、仓鼠科(Cricetidae)(例如,仓鼠、新世界(New World)大鼠和小鼠、田鼠),鼠科(真小鼠和大鼠、沙鼠、非洲刺毛鼠、冠鼠)、马岛鼠科(Nesomyidae)(攀鼠、岩鼠、白尾鼠、马达加斯加大鼠和小鼠)、帚尾鼠科(Platacanthomyidae)(例如,多刺睡鼠(spiny dormice))和鼹形鼠科(Spalacidae)(例如,鼹形鼠、竹鼠和鼢鼠)。在一些特定的实施例中,如本文所述的经遗传修饰的啮齿类动物选自真正的小鼠或大鼠(鼠科)、沙鼠、刺鼠和冠鼠。在一些特定的实施例中,本文所述的经遗传修饰的小鼠来自鼠科的成员。在一些实施例中,本文所述的非人动物是啮齿类动物。在一些特定实施例中,本文所述的啮齿类动物选自小鼠和大鼠。在一些实施例中,本文所述的非人动物是小鼠。
在一些实施例中,本文所述的非人动物是啮齿类动物,其是选自C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola的C57BL品系的小鼠。在一些特定的实施例中,本文所述的小鼠是选自下组的129-品系,该组由以下组成:品系129P1、129P2、129P3、129X1、129S1(例如,129S1/SV、129S1/SvIm)、129S2、129S4、129S5、129S9/SvEvH、129/SvJae、129S6(129/SvEvTac)、129S7、129S8、129T1、129T2(参见,例如Festing等人,1999,MammalianGenome[哺乳动物基因组]10:836;Auerbach,W.等人,2000,Biotechniques[生物技术]29(5):1024-1028,1030,1032)。在一些特定的实施例中,如本文所述的经遗传修饰的小鼠是前述129品系和前述C57BL/6品系的混合。在一些特定实施例中,本文所述的小鼠是前述129品系的混合,或前述BL/6品系的混合。在一些特定实施例中,如本文所述的混合物的129品系是129S6(129/SvEvTac)品系。在一些实施例中,本文所述的小鼠是BALB品系,例如,BALB/c品系。在一些实施例中,如本文所述的小鼠是BALB品系和另一前述品系的混合。
在一些实施例中,本文所述的非人动物是大鼠。在一些特定的实施例中,本文所述的大鼠选自Wistar大鼠、LEA品系、Sprague Dawley品系、Fischer品系、F344、F6和DarkAgouti。在一些特定的实施例中,本文所述的大鼠品系是两个或更多个选自由Wistar、LEA、Sprague Dawley、Fischer、F344、F6和Dark Agouti组成的组的品系的混合。
大鼠多能和/或全能细胞可以来自任何大鼠品系,包括例如ACI大鼠品系(最初衍生自August和Copenhagen品系的近交品系)、Dark Agouti(DA)大鼠品系、Wistar大鼠品系、LEA大鼠品系、Sprague Dawley(SD)大鼠品系或Fischer大鼠品系,例如Fisher F344或Fisher F6。大鼠多能和/或全能细胞也可以从衍生自上述两个或更多个品系的混合的品系中获得。例如,大鼠多能和/或全能细胞可以来自DA品系或ACI品系。ACI大鼠品系的特征是具有黑色刺鼠,其具有白色腹部和足部以及RT1av1单倍型。此类品系可从多种来源获得,包括哈兰实验室(Harlan Laboratories)。来自ACI大鼠的大鼠ES细胞系的实例是ACI.G1大鼠ES细胞。DA大鼠品系的特征是具有刺鼠皮毛和RT1av1单倍型。此类大鼠可从各种来源获得,包括查尔斯河(Charles River)和哈兰实验室。来自DA大鼠的大鼠ES细胞系的实例是DA.2B大鼠ES细胞系和DA.2C大鼠ES细胞系。在一些实施例中,大鼠多能和/或全能细胞来自近交大鼠品系(参见,例如,美国专利申请公开号2014-0235933A1)。使用本文所述的方法和/或构建体在(例如大鼠ES细胞中的)大鼠基因组中进行修饰的指导可以在例如美国专利申请公开号2014-0310828和2017-0204430中找到。
在一些实施例中,有用的技术在例如US 10314297中描述并且可以根据本披露使用。如本领域技术人员所理解的,许多有用的技术可从各种供应商和/或服务提供商商业获得。
在一些实施例中,包含或表达ADAR1多肽或其特征性部分的非人动物(例如小鼠)与包含要编辑的腺苷的第二非人动物(例如小鼠)交配。在一些实施例中,第二非人动物是病症、障碍或疾病的动物模型,例如,可能受益于腺苷编辑的动物模型(例如,与G至A突变相关的动物模型)。本领域技术人员理解,腺苷编辑可以在多种潜在机制中提供益处,例如以下中的一种或多种:剪接调节(增加或减少一种或多种转录物和/或由此编码的产物的水平/活性)、降低一种或多种转录物和/或由此编码的产物的水平/活性(例如,通过引入A至I突变),增加一种或多种转录物和/或由此编码的产物的水平/活性(例如,通过校正G至A突变))等。在一些实施例中,繁育产品是非人动物,其包含或表达如本文所述的ADAR1多肽或其特征性部分,并且包含靶腺苷(例如,与可受益于腺苷编辑的病症、障碍或疾病相关的腺苷)。在一些实施例中,此类非人动物和来自其的细胞和/或组织可用于评估各种药剂,例如寡核苷酸,以及组合物,以鉴定、评估、开发用于编辑靶腺苷用于例如各种生物和/或治疗应用(例如,用于预防和/或治疗可能受益于腺苷编辑的病症、障碍或疾病)的药剂和组合物。
例如,在一些实施例中,第二动物是α1-抗胰蛋白酶(A1AT)缺乏症的有用模型。在一些实施例中,第二动物包含对应于人SERPINA1基因中的1024G>A(E342K)突变的G至A突变。在一些实施例中,第二动物是人源化的并且包含人SERPINA1基因或其片段。在一些实施例中,片段包含与一种或多种病症、障碍或疾病相关的一个或多个突变。在一些实施例中,突变是1024G>A(E342K)。在一些实施例中,第二动物是人源化的并且包含含有Pi*Z突变等位基因的人SERPINA1基因。在一些实施例中,第二动物是NOD.Cg-Prkdcscid Il2rgtm1WjlTg(SERPINA1*E342K)#Slcw/SzJ小鼠(例如,参见杰克逊实验室货号:028842;NSG-PiZ,还有Borel F;Tang Q;Gernoux G;Greer C;Wang Z;Barzel A;Kay MA;Shultz LD;Greiner DL;Flotte TR;Brehm MA;Mueller C.2017.Survival Advantage of Both Human HepatocyteXenografts and Genome-Edited Hepatocytes for Treatment of alpha-1AntitrypsinDeficiency.[人肝细胞异种移植物和基因组编辑的肝细胞治疗α-1抗胰蛋白酶缺乏症的生存优势]Mol Ther[分子疗法]25(11):2477-2489PubMed:29032169MGI:J:243726,和Li S;Ling C;Zhong L;Li M;Su Q;He R;Tang Q;Greiner DL;Shultz LD;Brehm MA;Flotte TR;Mueller C;Srivastava A;Gao G.2015。Efficient and Targeted Transduction ofNonhuman Primate Liver With Systemically Delivered Optimized AAV3B Vectors.[用系统递送的优化AAV3B载体高效和靶向转导非人灵长类动物肝]Mol Ther[分子疗法]23(12):1867-76PubMed:26403887MGI:J:230567)。在一些实施例中,产物细胞、组织或非人动物包含对应于人SERPINA1基因中的1024G>A(E342K)突变的G至A突变,并且包含或表达如本文所述的ADAR1多肽或其特征性部分。在一些实施例中,产物细胞、组织或非人动物包含含有对应于1024G>A(E342K)突变的G至A突变的人SERPINA1Pi*Z等位基因,并且包含或表达如本文所述的人ADAR1多肽或其特征性部分。在一些实施例中,产物细胞、组织或非人动物包含含有对应于1024G>A(E342K)突变的G至A突变的人SERPINA1 Pi*Z等位基因,并且是野生型和/或不表达如本文所述的人ADAR1多肽或其特征性部分,并且可以充当相对对照。
除其他外,据报道,SERPINA1基因的突变会导致α1-抗胰蛋白酶(A1AT)缺乏症。导致A1AT缺乏症的突变有时可以根据它们在编码突变的氨基酸的SERPINA1基因中的靶位置来描述。在美国,据报道A1AT缺乏症的患病率在5,000分之一到7,000分之一之间。据报道,A1AT缺乏症是北欧血统受试者中最常见的遗传疾病之一。在一些实施例中,严重的A1AT缺乏症会引起肺气肿,受试者在其第三或第四个十年中出现肺气肿。据报道,A1AT缺乏症也可引起肝衰竭和肝细胞癌,高达30%的患有严重A1AT缺乏的受试者会发展出明显的肝病,包括肝硬化、暴发性肝衰竭和肝细胞癌。
据报道,SERPINA1基因中有两个主要突变导致A1AT。据报道,这些错义突变影响蛋白质构象和分泌,导致A1AT循环水平降低。据报道,更常见和更严重的突变是成熟A1AT蛋白氨基酸位置342处的谷氨酸到赖氨酸的取代(E342K,“Z突变”),这可能源于例如c.1024G>A突变。携带Z突变的等位基因有时被鉴定为PiZ等位基因。PiZ等位基因纯合的受试者称为PiZZ携带者,据报道其表达正常水平的10-15%的血清A1AT。据报道,大约95%的具有A1AT缺陷症症状的受试者具有PiZZ基因型。在一些实施例中,此类突变在非人模型生物体中重演。在一些实施例中,此类非人模型生物体是包含人SERPINA1Pi*Z等位基因的小鼠,该等位基因包含对应于1024G>A(E342K)突变的G至A突变。
在一些实施例中,A1AT靶位置包含以下或由以下组成:SERPINA1基因中的一个或多个核苷酸突变,这导致在E342处包含氨基酸突变的A1AT突变蛋白的表达。在某些实施例中,A1AT靶位置包含以下或由以下组成:SERPINA1基因中位置c.1024处的核苷酸突变,这导致在E342处包含氨基酸突变的A1AT突变蛋白的表达。在某些实施例中,A1AT靶位置包含以下或由以下组成:SERPINA1基因中的核苷酸突变c.1024G>A,这导致包含氨基酸突变E342K的A1AT突变蛋白的表达。
在某些实施例中,包含人SERPINA1 Pi*Z等位基因的非人模型生物体还可包含使动物人源化的另外基因突变和/或修饰。在一些实施例中,人源化动物是免疫缺陷的,并且在一些实施例中,是极度免疫缺陷的。在一些实施例中,此类动物可具有基因型NOD.Cg-Prkdcscid Il2rgtm1Wjl/SzJ。在一些实施例中,此类小鼠在NOD/ShiLtJ遗传背景上携带两个突变;严重联合免疫缺陷(scid)和IL2受体共同γ链的完整无效等位基因(IL2rgnull)。在一些实施例中,scid突变在DNA修复复合蛋白Prkdc中,并导致小鼠B细胞和T细胞缺陷。在一些实施例中,IL2rg无效突变阻止通过多个受体的细胞因子信号传导,导致功能性NK细胞缺陷。在一些实施例中,严重免疫缺陷允许小鼠人源化,例如,通过本领域已知的方法,例如人CD34+造血干细胞(HSC)、外周血单核细胞(PBMC)、患者来源的异种移植物(PDX)和/或成体干细胞和组织的植入。
在一些实施例中,本披露提供了用于评估药剂(例如寡核苷酸)或其组合物的方法,这些方法包括向动物、细胞或组织施用本文所述的药剂或组合物。在一些实施例中,评估药剂或组合物用于预防或治疗病症、障碍或疾病。在一些实施例中,动物、细胞、组织,例如,如本文各种实施例中所述,是动物模型或细胞或组织,用于各种病症、障碍或疾病(例如,包含与各种病症、障碍或疾病相关的突变,和/或与各种病症、障碍或疾病相关的细胞、组织、器官等或各种病症、障碍或疾病的细胞、组织、器官等),它们被工程化以包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸。在一些实施例中,可以通过将(例如,IVF、自然繁育等)作为各种病症、障碍或疾病的模型动物但未被工程化以包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸的动物与经工程化为包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸的动物交配繁育来提供动物。在一些实施例中,可以通过将其序列编码ADAR1多肽或其特征性部分的多核苷酸引入细胞或组织中来提供细胞或组织。在一些实施例中,本披露提供了一种用于预防或治疗病症、障碍或疾病的方法,该方法包括向受试者施用有效量的药剂或其组合物,其中在本文提供的动物中评估药剂或组合物(例如,经工程化为包含ADAR1多肽或其特征性部分的动物,经工程化为包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸的动物,针对病症、障碍或疾病的经工程化为包含ADAR1多肽或其特征性部分的模型动物,针对病症、障碍或疾病的经工程化为包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸的模型动物)。在一些实施例中,本披露提供了一种用于预防或治疗病症、障碍或疾病的方法,该方法包括向受试者施用有效量的药剂或其组合物,其中在本文提供的细胞或组织中评估药剂或组合物。在一些实施例中,动物、细胞或组织包含SERPINA1突变(例如,1024G>A(E342K))并且被工程化以包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸。在一些实施例中,动物是非人动物。在一些实施例中,细胞是非人动物细胞。在一些实施例中,组织是非人动物组织。在一些实施例中,非人动物是啮齿类动物。在一些实施例中,非人动物是小鼠。在一些实施例中,非人动物是大鼠。在一些实施例中,非人动物是非人灵长类动物。
如本领域技术人员所理解的,在一些实施例中,动物在一个或多个或所有序列方面可以是杂合的。在一些实施例中,动物在一个或多个或所有序列方面是纯合的。在一些实施例中,动物在一个或多个或所有工程化的序列方面是半合的。在一些实施例中,动物在一个或多个序列方面是纯合的,并且在一个或多个序列方面是杂合的。在一些实施例中,动物就其序列编码ADAR1多肽或其特征性部分的多核苷酸而言是杂合的。在一些实施例中,动物就其序列编码ADAR1多肽或其特征性部分的多核苷酸而言是纯合的。在一些实施例中,动物就编码多核苷酸(其序列编码ADAR1多肽或其特征性部分(例如,不表达外源ADAR1多肽或其特征性部分))的基因座而言是纯合野生型的,并且可以作为相对对照。在一些实施例中,某些动物就与各种病症、障碍或疾病相关的一个或多个多核苷酸序列而言是杂合的,并且就其序列编码ADAR1多肽或其特征性部分的多核苷酸而言是杂合的。在一些实施例中,某些动物就与各种病症、障碍或疾病相关的一个或多个多核苷酸序列而言是纯合的,并且就其序列编码ADAR1多肽或其特征性部分的多核苷酸而言是杂合的。在一些实施例中,某些动物就与各种病症、障碍或疾病相关的一个或多个多核苷酸序列而言是杂合的,并且就其序列编码ADAR1多肽或其特征性部分的多核苷酸而言是纯合的。在一些实施例中,某些动物就与各种病症、障碍或疾病相关的一个或多个多核苷酸序列而言是纯合的,并且就其序列编码ADAR1多肽或其特征性部分的多核苷酸而言是纯合的。细胞或组织就各个序列方面而言是类似的杂合、半合和/或纯合的。
在一些实施例中,本披露提供的方法包括:1)评估药剂或其组合物,包括使该药剂或其组合物与所提供的与病症、障碍或疾病相关的细胞或组织或与病症、障碍或疾病的细胞或组织接触,和2)向患有或易患病症、障碍或疾病的受试者施用有效量的药剂或其组合物。在一些实施例中,本披露提供的方法包括:1)评估药剂或其组合物,包括将该药剂或其组合物施用于所提供的动物,该动物是病症、障碍或疾病的动物模型,和2)向患有或易患病症、障碍或疾病的受试者施用有效量的药剂或其组合物。在一些实施例中,如本文所述,细胞、组织或动物经工程化为包含ADAR1多肽或其特征性部分。在一些实施例中,细胞、组织或动物经工程化为包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸。在一些实施例中,细胞、组织或动物还包含与病症、障碍或疾病相关的核苷酸序列(例如,突变)。在一些实施例中,动物是啮齿类动物,例如小鼠、大鼠等。在一些实施例中,细胞或组织是啮齿类动物,例如小鼠、大鼠等。在一些实施例中,细胞是种系细胞。在一些实施例中,细胞群、组织或动物的一部分而不是所有细胞,例如特定细胞类型或组织或位置的细胞,包含与病症、障碍或疾病相关的核苷酸序列(例如突变),并且这部分的细胞经工程化为包含ADAR1多肽或其特征性部分或经工程化为包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸。在一些实施例中,肝细胞的集合包含SERPINA1突变,例如1024G>A(E342K)和其序列编码ADAR1多肽或其特征性部分的多核苷酸。本领域的技术人员理解,各种技术可用于在各种细胞、组织或器官中任选地受控引入和/或表达核苷酸序列,并且可根据本披露内容加以利用。在一些实施例中,如本文所述,细胞、组织或动物在基因组中,在一些实施例中在种系基因组中包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。在一些实施例中,如本文所述,细胞、组织或动物在基因组中,在一些实施例中在种系基因组中包含与病症、障碍或疾病相关的核苷酸序列(例如,突变)。
如本文所述,在一些实施例中,多核苷酸编码人ADAR1p110或其特征性部分。在一些实施例中,多核苷酸编码人ADAR1 p110。在一些实施例中,多核苷酸编码人ADAR1 p150或其特征性部分。在一些实施例中,多核苷酸编码人ADAR1 p150。在一些实施例中,细胞、组织或动物(例如,huADAR小鼠或来自其的细胞或组织)经工程化为包含和/或表达其序列编码人ADAR1 p110多肽或其特征性部分的多核苷酸。在一些实施例中,细胞、组织或动物(例如,huADAR小鼠或来自其的细胞或组织)经工程化为包含和/或表达其序列编码人ADAR1p110多肽的多核苷酸。在一些实施例中,细胞、组织或动物(例如,huADAR小鼠或来自其的细胞或组织)经工程化为包含和/或表达其序列编码人ADAR1 p150多肽或其特征性部分的多核苷酸。在一些实施例中,细胞、组织或动物(例如,huADAR小鼠或来自其的细胞或组织)经工程化为包含和/或表达其序列编码人ADAR1 p150多肽的多核苷酸。如本文所述,在一些实施例中,动物是啮齿类动物,例如小鼠或大鼠。
在一些实施例中,ADAR(例如,人ADAR1)转基因建立在受精卵上,例如,包含突变(例如,人SERPINA1中的1024G>A(E342K))的SERPINA1小鼠受精卵,反之亦然。在一些实施例中,受精卵是纯合的。在一些实施例中,受精卵是杂合的。
使用提供的非人动物、细胞或组织的方法
非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如大鼠或小鼠)细胞和非人(例如,啮齿类动物,例如,大鼠或小鼠)组织可用作开发治疗剂(例如,寡核苷酸)的平台。特别地,如本文所述的非人动物、非人细胞和非人组织代表了用于鉴定和表征药剂(例如,适用于腺苷编辑的寡核苷酸)的特别有利的平台。
在一些实施例中,本披露提供非人动物(例如啮齿类动物,例如大鼠或小鼠)、非人(例如啮齿类动物,例如大鼠或小鼠)细胞和非人(例如啮齿类动物,例如大鼠或小鼠)组织可用于表征/评估用于腺苷编辑(例如,A至I)的各种药剂(例如寡核苷酸)及其组合物的方法中。在一些实施例中,组合物是寡核苷酸组合物。在一些实施例中,寡核苷酸包含各种修饰,例如,碱基、糖、核苷酸间键联修饰等。在一些实施例中,经修饰的核苷酸间键联(例如,硫代磷酸酯核苷酸间键联)中的连接磷是手性的(正如本领域技术人员所理解的,天然DNA和RNA分子中常见的天然磷酸酯键联是非手性的)。在一些实施例中,对于各种生物学或治疗用途,寡核苷酸包含大量修饰,并且在一些情况下,不含天然RNA糖以用于例如改进的稳定性。在一些实施例中,组合物是立体随机寡核苷酸组合物。在一些实施例中,组合物是手性受控的寡核苷酸组合物,其中一个或多个或所有手性连接磷是独立地手性受控的。
利用非人动物进行体内药剂评估
在一些实施例中,非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如大鼠或小鼠)细胞和非人(例如啮齿类动物,例如大鼠或小鼠)组织可用于表征体内寡核苷酸,其中与WT非人动物(例如啮齿类动物,例如大鼠或小鼠)相比,外源ADAR1基因在所述非人动物中的表达提供了改善的表征平台。
在一些实施例中,用目的寡核苷酸在一定条件和时间下处理(例如注射)如本文所述的非人动物(例如经遗传修饰的啮齿类动物,例如经遗传修饰的大鼠或小鼠),所述条件和时间足以使非人动物发展和/或有可能发展ADAR介导的对所述目的寡核苷酸的响应。在一些实施例中,注射可以是但不限于:
在一些实施例中,用目的寡核苷酸在一定条件和时间下处理(例如注射)如本文所述的非人动物(例如经遗传修饰的啮齿类动物,例如经遗传修饰的大鼠或小鼠),所述条件和时间足以使非人动物发展和/或有可能发展ADAR介导的对所述目的寡核苷酸的响应。从经处理的非人动物(或一个或多个细胞,例如一个或多个B细胞)中分离和/或鉴定RNA分子(例如,目的寡核苷酸的靶标)的序列并且使用测量例如亲和力、特异性、编辑水平、转录物稳定性、翻译效率、蛋白质结合配偶体、核定位等的各种测定来表征。在不同的实施例中,使用如本文所述的非人动物、非人细胞和/或非人组织表征的寡核苷酸包含一个或多个有助于靶向内源目的基因座的区域。
在一些实施例中,用目的寡核苷酸处理本文所述的非人动物(例如经遗传修饰的啮齿类动物,例如经遗传修饰的大鼠或小鼠)并且监测和/或评估所述寡核苷酸在特定组织中的作用。
利用非人动物衍生的细胞进行体外药剂评估
在一些实施例中,包含转基因ADAR1基因座的本文所述的非人(例如啮齿类动物,例如大鼠或小鼠)细胞可用于表征潜在治疗有效的寡核苷酸的方法,该方法包括:(a)在非人细胞中表达:(i)包含人ADAR1基因的第一核苷酸序列;(ii)包含目的人疾病基因座的任选的另外核苷酸序列。以及(b)将以下引入非人细胞:(i)第一外源寡核苷酸,其具有在表达的ADAR基因介导的特定RNA位点进行定点RNA编辑的潜力;(ii)任选的另外一个或多个外源寡核苷酸,其具有在表达的ADAR基因介导的特定RNA位点进行定点RNA编辑的潜力。
在一些实施例中,包含转基因ADAR1基因座的本文所述的非人(例如啮齿类动物,例如大鼠或小鼠)细胞可用于表征潜在治疗有效的寡核苷酸的方法,该方法包括对衍生自ADAR1转基因小鼠的细胞进行表征。在一些实施例中,此类细胞可以是本领域已知的任何目的细胞谱系和/或目的类型。在一些实施例中,此类细胞可以是但不限于:原代小鼠肝细胞、表皮细胞、上皮细胞、皮层神经元、感觉神经元、效应神经元、激素分泌细胞、外分泌上皮细胞、屏障细胞、心肌细胞、白细胞、淋巴细胞、B细胞、T细胞、骨髓细胞、成骨细胞、软骨细胞、成软骨细胞、脂肪细胞、心脏肌细胞、肌肉细胞、成纤维细胞、生殖细胞、滋养细胞、肾细胞和/或衍生自任何上述细胞的诱导干细胞或其产物。
如本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如大鼠或小鼠)细胞和非人(例如,啮齿类动物,例如,大鼠或小鼠)组织可用于鉴定具有作为定点编辑介体功能潜力的寡核苷酸。
如本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如大鼠或小鼠)细胞和非人(例如啮齿类动物,例如大鼠或小鼠)组织提供改善的体内系统和生物材料来源(例如,细胞、核苷酸、多肽、蛋白质复合物)用于生产和表征可用于各种测定的寡核苷酸和/或多核苷酸。在各种实施例中,如本文所述的非人动物、非人细胞和非人组织用于开发治疗剂,所述治疗剂靶向目的RNA(例如,已知在疾病相关途径中起作用的RNA分子)和/或调节与所述目的RNA分子相关的一种或多种活性和/或调节所述目的RNA分子与其他潜在结合配偶体(例如,可以作用于细胞内RNA分子的任何调节机构,例如翻译中涉及的蛋白质和/或RNA种类、先天免疫中涉及的蛋白质和/或RNA种类、RNA干扰中涉及的蛋白质和/或RNA种类等)的相互作用。
例如,在各种实施例中,如本文所述的非人动物、非人细胞和非人组织用于开发治疗剂,所述治疗剂靶向一个或多个受体多肽、调节受体多肽活性和/或调节受体多肽与其他结合配偶体的相互作用。在各种实施例中,如本文所述的非人动物、非人细胞和非人组织用于鉴定、筛选和/或开发治疗剂(例如寡核苷酸),所述治疗剂结合并促进ADAR介导的对一个或多个目的RNA分子的编辑和/或调节。
在各种实施例中,如本文所述的非人动物、非人细胞和非人组织用于筛选和开发候选治疗剂(例如,寡核苷酸),所述治疗剂阻断一个或多个目的RNA分子的活性,或者阻断所述目的RNA分子与其他细胞内途径之间的一种或多种相互作用的活性。
在各种实施例中,如本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如大鼠或小鼠)细胞和非人(例如,啮齿类动物,例如大鼠或小鼠)组织用于确定一种或多种候选寡核苷酸的药代动力学谱。在各种实施例中,如本文所述的一个或多个非人动物、非人细胞和非人组织以及一个或多个对照或参考非人动物、非人细胞和非人组织各自暴露于一个或多个药剂,例如各种剂量的寡核苷酸(例如小于0.1mg/kg、0.1mg/kg、0.2mg/kg、0.3mg/kg、0.4mg/kg、0.5mg/kg、1mg/kg、2mg/kg、3mg/kg、4mg/kg、5mg/mg、7.5mg/kg、10mg/kg、15mg/kg、20mg/kg、25mg/kg、30mg/kg、40mg/kg或50mg/kg或更多)。在一些实施例中,寡核苷酸可以以随性别而改变的速率给药于非人动物,例如,在一些实施例中,雄性动物可能比可比较的雌性动物接受更高的剂量,而在其他实施例中,雌性动物可能比可比较的雄性动物接受更高的剂量。在一些实施例中,候选治疗性寡核苷酸可如本文所述通过任何所期望的施用途径给药至非人动物,包括肠胃外和非肠胃外施用途径。肠胃外途径包括,例如,静脉内、动脉内、门静脉内、肌肉内、皮下、腹膜内、脊柱内、鞘内、脑室内、颅内、胸膜内或其他注射途径。在一些实施例中,施用可以是非肠胃外的,在一些实施例中,非肠胃外途径包括,例如口服、鼻腔、透皮、肺部、直肠、口腔、阴道、眼部。在一些实施例中,施用也可以通过连续输注、局部施用、从植入物(凝胶、膜等)持续释放和/或静脉内注射来进行。在一些实施例中,生物组织(例如器官、血液、细胞、分泌物等)在不同时间点(例如0小时、6小时、1天、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天或多达30天或更多天)从非人动物(人源化和对照)中分离。可以使用从本文所述的非人动物、非人细胞和非人组织获得的样品进行各种测定以确定施用的候选治疗性寡核苷酸的药代动力学谱,包括但不限于编辑水平、转录物水平、翻译水平等。
在各种实施例中,如本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如大鼠或小鼠)细胞和非人(例如,啮齿类动物,例如大鼠或小鼠)组织用于测量阻断或调节目的RNA分子的活性的治疗性作用以及由于其细胞变化而对基因表达的影响。
来自所提供的非人动物(例如,啮齿类动物,例如,大鼠或小鼠)的细胞可以被分离并按需要使用,或者可以在培养物中维持多代。在各种实施例中,来自所提供的非人动物的细胞被永生化(例如,通过使用病毒)并无限期地维持在培养物中(例如,连续培养)。
在一些实施例中,非人(例如啮齿类动物,例如大鼠或小鼠)细胞是非人淋巴细胞。在一些实施例中,非人细胞选自B细胞、树突细胞、巨噬细胞、单核细胞和T细胞。在一些实施例中,非人细胞是未成熟B细胞、成熟幼稚B细胞、活化B细胞、记忆B细胞和/或浆细胞。
在一些实施例中,非人(例如啮齿类动物,例如大鼠或小鼠)细胞是非人胚胎干(ES)细胞。在一些实施例中,非人ES细胞是啮齿类动物ES细胞。在一些特定的实施例中,啮齿类动物ES细胞是小鼠ES细胞并且来自129品系、C57BL品系、BALB/c或其混合。在一些特定的实施例中,啮齿类动物胚胎干细胞是小鼠胚胎干细胞并且是129和C57BL品系的混合。在一些特定的实施例中,啮齿类动物胚胎干细胞是小鼠胚胎干细胞并且是129、C57BL和BALB/c品系的混合。
在一些实施例中,提供了使用本文所述的非人(例如啮齿类动物,例如大鼠或小鼠)ES细胞来制备非人动物。在一些特定的实施例中,非人ES细胞是小鼠ES细胞并且用于制备包含如本文所述的外源ADAR1的小鼠。在一些特定的实施例中,非人ES细胞是大鼠ES细胞并且用于制造包含如本文所述的外源ADAR1的大鼠。
在一些实施例中,非人(例如啮齿类动物,例如大鼠或小鼠)组织选自但不限于脂肪、膀胱、脑、乳房、骨髓、眼睛、心脏、肠、肾、肝、肺、淋巴结、肌肉、胰腺、血浆、血清、皮肤、脾、胃、胸腺、睾丸、卵和/或其组合。
在一些实施例中,提供了从如本文所述的分离的非人细胞或组织制备、生成、产生或获得的永生化细胞。
在一些实施例中,提供了从如本文所述的非人ES细胞准备、生成、产生或获得的非人(例如啮齿类动物,例如大鼠或小鼠)胚胎。在一些特定实施例中,非人胚胎是啮齿类动物胚胎;在一些实施例中,小鼠胚胎;在一些实施例中,大鼠胚胎。
如本文所述的非人动物(例如,啮齿类动物,例如,大鼠或小鼠)提供体内系统,用于生成结合目的多肽的人抗体可变区的变体(例如,人Vλ结构域变体)。此类变体包括具有所期望功能、特异性、与目的多肽的两个或更多个变体共有的共同表位的低交叉反应性的人抗体可变区。在一些实施例中,使用本文所述的非人动物来表征包含一系列变体序列的寡核苷酸组,从而允许对目的RNA分子进行靶向修饰。在一些实施例中,针对所期望或改善的功能筛选所述寡核苷酸组。
在一些实施例中,提供如本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如,大鼠或小鼠)细胞或非人(例如,啮齿类动物,例如,大鼠或小鼠)组织用于制造和/或开发用于疗法或诊断的药物(例如,寡核苷酸或其片段)。
在一些实施例中,提供如本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠),非人(例如啮齿类动物,例如大鼠或小鼠)细胞或非人(例如啮齿类动物,例如大鼠或小鼠)组织用于制造和/或开发用于治疗、预防或改善疾病、障碍或病症的药物。
在一些实施例中,提供如本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠)、非人(例如啮齿类动物,例如大鼠或小鼠)细胞或非人(例如啮齿类动物,例如大鼠或小鼠)组织在制造和/或开发用于医学例如用作药品的药物或疫苗中的用途。
在一些实施例中,本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠)提供体内系统用于分析和测试药物或疫苗。在各种实施例中,候选药物或疫苗可递送至如本文所述的一种或多种非人动物,随后监测非人动物以确定对药物或疫苗的一种或多种表型(例如肉眼可见和/或分子可检测的)响应,药物或疫苗的安全性谱,或对疾病或病症的影响和/或疾病或病症的一种或多种症状。用于确定安全性谱的示例性方法包括毒性测量、最佳剂量浓度、抗体(即抗药物)响应、药物或疫苗的功效以及可能的风险因素。可以在此类非人动物中改善和/或开发此类药物或疫苗。
可以通过多种方式确定疫苗功效。简而言之,使用本领域已知的方法对本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠)进行疫苗接种,然后用疫苗进行激发,或者将疫苗施用于已经感染的非人动物。一个或多个非人动物对疫苗的响应可通过监测该一个或多个非人动物(或从其分离的细胞)和/或对该一个或多个非人动物(或从其分离的细胞)进行一个或多个测定以确定疫苗的功效。然后使用本领域已知和/或本文所述的一种或多种测量将一个或多个非人动物对疫苗的响应与对照动物进行比较。
疫苗功效可进一步通过病毒中和测定来确定。简而言之,免疫本文所述的非人动物(例如啮齿类动物,例如大鼠或小鼠)并在免疫后的不同天数收集血清。血清的连续稀释液与病毒预孵育,在此期间血清中对病毒特异的抗体将与其结合。然后将病毒/血清混合物添加到允许细胞中,以通过噬菌斑测定或微量中和测定确定感染性。如果血清中的抗体中和了病毒,则与对照组相比,斑块更少或相对荧光素酶单位更低。
在一些实施例中,所提供的动物、细胞、组织等可用于制造商业批次的药剂及其组合物。在一些实施例中,本披露提供了方法,该方法包括:
将药剂或其组合物施用于细胞或其群体;以及
评估细胞或其群体中转录物中的腺苷的编辑。
在一些实施例中,本披露提供了方法,该方法包括:
将药剂或其组合物施用于动物或其群体;以及
评估该动物或其群体的一个或多个细胞或组织中转录物中的腺苷的编辑。
在一些实施例中,本披露提供了方法,该方法包括:
将寡核苷酸组合物施用于细胞或其群体;以及
评估细胞或其群体中转录物中的腺苷的编辑。
在一些实施例中,本披露提供了方法,该方法包括:
将寡核苷酸组合物施用于动物或其群体;以及
评估该动物或其群体的一个或多个细胞或组织中转录物中的腺苷的编辑。
在一些实施例中,细胞或其群体在体外生长,例如,在细胞培养物中。在一些实施例中,将药剂或组合物施用于动物的细胞或其群体。在一些实施例中,在施用后从动物中分离细胞或组织以用于评估编辑水平。在一些实施例中,细胞或组织与病症、障碍或疾病相关或是病症、障碍或疾病的细胞或组织。在一些实施例中,施用单一剂量。在一些实施例中,施用两个或更多个剂量,其中在剂量之间具有相同或不同的合适时间段。在一些实施例中,在合适的给药时间段之后进行评估。在一些实施例中,分析多个样品的编辑水平。在一些实施例中,评估来自不同点(例如,给药后的不同时间点和/或不同给药次数后)的样品。
在一些实施例中,被施用的药剂或组合物来自非商业批次的批次。在一些实施例中,它来自第一商业批次之前的批次。在一些实施例中,它来自为药剂或组合物的体外评估和/或在动物模型中的评估而制备的批次。在一些实施例中,确定药剂或组合物可以提供来自评估的足够水平的编辑。在一些实施例中,在评估之后制造或获得药剂或组合物,例如作为商业批次、以商业规模、作为药物产品等和/或用于向受试者(例如,人受试者)释放、交付和/或施用。
在一些实施例中,施用的药剂或组合物来自商业批次,例如,以商业规模获得或制造的批次。在一些实施例中,施用的药剂或组合物来自药物产品,例如,适合施用给受试者(例如,人受试者)的药物产品。在一些实施例中,将腺苷的编辑水平,例如与本文所述的病症、障碍或疾病相关的G->A突变,与另一批次的药剂或组合物的编辑水平进行比较。在一些实施例中,将水平与第一商业生产之前的非商业生产(例如,在开发的早期阶段使用的生产)的水平进行比较。在一些实施例中,将水平与另一商业批次的水平进行比较。在一些实施例中,将水平与参考样品或药物产品的水平进行比较。在一些实施例中,将水平与另一批次的药物产品的水平进行比较。在一些实施例中,将水平与参考范围进行比较。在一些实施例中,参考范围是用于维持药剂或组合物的多个批次/制备的编辑活性的相关一致性的范围。在一些实施例中,参考范围源自一个或多个批次的商业生产和/或药物产品。在一些实施例中,参考范围源自一批或多批商业生产和/或药物产品和/或商业前批次(例如,早期研究和开发阶段的那些)。在一些实施例中,参考范围为约10%-100%、20%-100%、30%-100%、40%-100%、50%-100%、60%-100%、70%-100%、80%-100%、90-100%、95-100%、20%-90%、30%-90%、40%-90%、50%-90%、60%-90%、70%-90%、80-90%、20%-85%、30%-85%、40%-85%、50%-85%、60%-85%、70%-85%、80-85%、20%-80%、30%-80%、40%-80%、50%-80%、60%-80%、70%-80%、20%-75%、30%-75%、40%-75%、50%-75%、60%-75%、70%-75%,或10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的约+/-(约1%、2%、3%、4%、5%、6%、7%、8%、9%或10%),或至少约10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些实施例中,当腺苷的编辑水平与被比较的水平可比较或在参考范围内时,一个批次的商业生产或药物产品被释放,例如用于交付、进一步加工(例如,包装)、分配、施用(例如,给受试者,例如人受试者)等。在一些实施例中,当腺苷的编辑水平与被比较的水平不可比较或在参考范围之外时,一个批次的商业生产或药物产品被拒绝交付、分配、施用等,被扣留(例如,用于进一步加工或被销毁),或被销毁。
如本文所述,在一些实施例中,细胞或动物是非人细胞或动物。在一些实施例中,细胞或动物是工程化的非人细胞或动物,例如,工程化为包含或表达ADAR1多肽,例如hADAR1,或其片段或特征性部分的那些,如本文所述。在一些实施例中,细胞是啮齿类动物细胞。在一些实施例中,动物是啮齿类动物。在一些实施例中,啮齿类动物是小鼠。在一些实施例中,啮齿类动物是大鼠。
在一些实施例中,药剂是寡核苷酸。在一些实施例中,组合物是寡核苷酸组合物。在一些实施例中,组合物是立体随机寡核苷酸组合物。在一些实施例中,组合物是手性受控的寡核苷酸组合物。在一些实施例中,手性受控的寡核苷酸组合物包含多个寡核苷酸,其中多个寡核苷酸中的每个寡核苷酸独立地是特定寡核苷酸或其盐,并且组合物中具有特定寡核苷酸或其盐组成的所有寡核苷酸中的约1%-100%(例如约5%-100%、10%-100%、20%-100%、30%-100%、40%-100%、50%-100%、60%-100%、70%-100%、80%-100%、90-100%、95-100%、20%-90%、30%-90%、40%-90%、50%-90%、60%-90%、70%-90%、80-90%、20%-85%、30%-85%、40%-85%、50%-85%、60%-85%、70%-85%、80-85%、20%-80%、30%-80%、40%-80%、50%-80%、60%-80%、70%-80%、20%-75%、30%-75%、40%-75%、50%-75%、60%-75%、70%-75%,或约5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%,或至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)是该多个寡核苷酸中的寡核苷酸。在一些实施例中,手性受控的寡核苷酸组合物包含多个共享相同组成的寡核苷酸,其中组合物中共享相同组成的所用寡核苷酸中的约1%-100%(例如约5%-100%、10%-100%、20%-100%、30%-100%、40%-100%、50%-100%、60%-100%、70%-100%、80%-100%、90-100%、95-100%、20%-90%、30%-90%、40%-90%、50%-90%、60%-90%、70%-90%、80-90%、20%-85%、30%-85%、40%-85%、50%-85%、60%-85%、70%-85%、80-85%、20%-80%、30%-80%、40%-80%、50%-80%、60%-80%、70%-80%、20%-75%、30%-75%、40%-75%、50%-75%、60%-75%、70%-75%,或约5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%,或至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)是该多个寡核苷酸中的寡核苷酸。在一些实施例中,该百分比是约或是至少约(DS)nc,其中DS是90%-100%(例如、95%-100%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%或更多)并且nc是特定寡核苷酸中手性核苷酸间键联的数量。在一些实施例中,nc是5或更多(例如,5-30、5-25、5-20、10-30、10-25、10-20、15-30、15-25、15-20、约或至少约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30)。在一些实施例中,百分比是约10%-100%、20%-100%、30%-100%、40%-100%、50%-100%、60%-100%、70%-100%、80%-100%、90-100%、95-100%、20%-90%、30%-90%、40%-90%、50%-90%、60%-90%、70%-90%、80-90%、20%-85%、30%-85%、40%-85%、50%-85%、60%-85%、70%-85%、80-85%、20%-80%、30%-80%、40%-80%、50%-80%、60%-80%、70%-80%、20%-75%、30%-75%、40%-75%、50%-75%、60%-75%、70%-75%,或约10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%,或至少10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些实施例中,手性受控的寡核苷酸组合物包含寡核苷酸或其盐,其中组合物中共享特定寡核苷酸或其盐组成的所有寡核苷酸中,约或至少约90%(例如、90-100%、95%-100%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%或更多)的此类寡核苷酸与特定寡核苷酸共享相同的键联磷构型。在一些实施例中,手性受控的寡核苷酸组合物包含寡核苷酸,其中寡核苷酸的一个或多个(例如,1-50、5-30、5-25、5-20、10-30、10-25、10-20、15-30、15-25、15-20,约或至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30)或每个手性键联磷独立地具有约或至少约90%(例如、90-100%、95%-100%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%或更多)的非对映体比率(如本文所用,x%=x:(100-x),例如,90%=90:10。手性中心的非对映体比率可称为手性中心的非对映体纯度)。在一些实施例中,每个手性核苷酸间键联具有约或至少约90%(例如、90-100%、95%-100%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%或更多)的非对映体比率。本领域技术人员理解,对于外消旋寡核苷酸组合物,每个键联磷的非对映体比率通常为约50%,并且组合物中共享寡核苷酸(或其盐)组成的所有寡核苷酸的百分比是寡核苷酸(或其盐)为约2nc。在一些实施例中,组合物是药学上可接受的组合物。
试剂盒
本发明还提供了一种包装或试剂盒,其包括一个或多个容器,其中至少装有非人细胞、蛋白质(单一或复合物(例如,抗体或其片段))、DNA片段、靶向载体,或其任何组合,如本文所述。试剂盒可用于任何适用的方法(例如,研究方法)。任选地,与此类一个或多个容器相关联的可以是规范药品或生物制品的制造、使用或销售的政府机构规定的形式的通知,该通知反映了(a)制造、使用或销售机构对人施用的批准,(b)使用说明,和/或(c)管理两个或更多个实体之间的材料和/或生物产品(例如,本文所述的非人动物或非人细胞)的转移的合同,及其组合。
在一些实施例中,提供了包含如本文所述的非人细胞、非人组织、永生化细胞、非人ES细胞或非人胚胎的试剂盒。在一些实施例中,提供了包含来自如本文所述的非人动物、非人细胞、非人组织、永生化细胞、非人ES细胞或非人胚胎的氨基酸的试剂盒。在一些实施例中,提供了包含来自如本文所述的非人动物、非人细胞、非人组织、永生化细胞、非人ES细胞或非人胚胎的核酸(例如,编码本文所述的人ADAR1序列的核酸)的试剂盒。在一些实施例中,提供了包含从如本文所述的非人动物、非人细胞、非人组织、永生化细胞、非人ES细胞或非人胚胎鉴定的序列(氨基酸和/或核酸序列)的试剂盒。
在一些实施例中,提供了用于制造和/或开发用于疗法或诊断的药物(例如寡核苷酸)的如本文所述的试剂盒。
在一些实施例中,提供了用于制造和/或开发用于治疗、预防或改善疾病、障碍或病症的药物(例如寡核苷酸)的如本文所述的试剂盒。
某些实施例的其他特征将在示例性实施例的以下描述的过程中变得明显,给出这些示例性实施例是为了说明而不旨在对其进行限制。
除其他外,本披露提供以下实施例:
1.一种非人动物,其经工程化为包含ADAR1多肽或其特征性部分。
2.一种非人动物,其经工程化为包含和/或表达多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
3.如前述实施例中任一项所述的动物,其中该动物的基因组包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
4.如前述实施例中任一项所述的动物,其中该动物的种系基因组包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
5.如前述实施例中任一项所述的动物,其中该多核苷酸包含一个或多个内含子。
6.如实施例1-4中任一项所述的动物,其中该多核苷酸不包含内含子。
7.如前述实施例中任一项所述的动物,其中该动物经工程化为表达ADAR1多肽或其特征性部分。
8.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分的表达在一个或多个细胞和/或组织中是可诱导的。
9.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分的表达在一个或多个细胞和/或组织中是组成型的。
10.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分的表达是组织特异性的。
11.如前述实施例中任一项所述的动物,其中该动物是啮齿类动物。
12.如前述实施例中任一项所述的动物,其中该动物是小鼠。
13.如前述实施例中任一项所述的动物,其中该动物是大鼠。
14.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分是或包含脱氨酶结构域。
15.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)dsRBD。
16.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)Z-DNA结合结构域。
17.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其片段的氨基酸序列。
18.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其特征性部分的氨基酸序列。
19.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽的氨基酸序列。
20.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分的氨基酸序列是灵长类动物ADAR1多肽的氨基酸序列。
21.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分是或包含灵长类动物ADAR1多肽或其特征性部分。
22.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分是灵长类动物ADAR1多肽。
23.如前述实施例中任一项所述的动物,其中该灵长类动物ADAR1多肽是人ADAR1多肽。
24.如前述实施例中任一项所述的动物,其中该灵长类动物ADAR1多肽是人ADAR1的p110同种型。
25.如实施例1-23中任一项所述的动物,其中该灵长类动物ADAR1多肽是人ADAR1的p150同种型。
26.如实施例1-22中任一项所述的动物,其中该灵长类动物ADAR1多肽是非人灵长类动物ADAR1多肽。
27.如实施例1-22中任一项所述的动物,其中该灵长类动物ADAR1多肽是猴ADAR1多肽。
28.如实施例1-22中任一项所述的动物,其中该灵长类动物ADAR1多肽为食蟹猴ADAR1多肽。
29.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分,当与靶向靶腺苷的寡核苷酸组合物接触时,在该工程化的动物的一个或多个细胞或组织中提供与在参考动物的相应细胞或组织中观察到的水平(“参考编辑水平”)相比增加的该靶腺苷的编辑水平(“工程化的编辑水平”),其中该参考动物未经工程化为表达该ADAR1多肽或其特征性部分。
30.如前述实施例中任一项所述的动物,其中该ADAR1多肽或其特征性部分,当与靶向靶腺苷的寡核苷酸组合物接触时,在一个或多个经工程化为表达该ADAR1多肽或其特征性部分的细胞和/或组织中提供与在未经工程化为表达该ADAR1多肽或其特征性部分的参考细胞或组织中观察到的水平相比增加的该靶腺苷的编辑水平(“工程化的编辑水平”)。
31.如实施例29或30所述的动物,其中该寡核苷酸组合物是WV-38700,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
32.如实施例29-31中任一项所述的动物,其中该寡核苷酸组合物是WV-38702,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
33.如实施例29-32任一项所述的动物,其中该寡核苷酸组合物是WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
34.如实施例29-33任一项所述的动物,其中寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷。
35.如实施例29-34中任一项所述的动物,其中该寡核苷酸组合物是WV-38697,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
36.如实施例29-35中任一项所述的动物,其中该寡核苷酸组合物是WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
37.如实施例29-36中任一项所述的动物,其中该一个或多个细胞或组织是肝组织。
38.如实施例29-36中任一项所述的动物,其中该一个或多个细胞或组织是小鼠肝细胞。
39.如前述实施例中任一项所述的动物,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
40.如前述实施例中任一项所述的动物,其中该工程化的编辑水平是该参考编辑水平的约或至少约2倍。
41.如前述实施例中任一项所述的动物,其中该工程化的编辑水平是该参考编辑水平的约或至少约5倍。
42.如前述实施例中任一项所述的动物,其中该工程化的编辑水平是该参考编辑水平的约或至少约10倍。
43.如前述实施例中任一项所述的动物,其中该动物是杂合的。
44.如实施例1-43中任一项所述的动物,其中该动物是纯合的。
45.一种非人胚胎,其经工程化为包含ADAR1多肽或其特征性部分。
46.一种非人胚胎,其经工程化为包含和/或表达多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
47.如前述实施例中任一项所述的胚胎,其中该胚胎的基因组包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
48.如前述实施例中任一项所述的胚胎,其中该多核苷酸包含一个或多个内含子。
49.如实施例45-47中任一项所述的胚胎,其中该多核苷酸不包含内含子。
50.如前述实施例中任一项所述的胚胎,其中该胚胎经工程化为表达ADAR1多肽或其特征性部分。
51.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分的表达是可诱导的。
52.如实施例45-50中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分的表达是组成型的。
53.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分的表达可操作地连接至一个或多个组织特异性调节元件或受一个或多个组织特异性调节元件调节。
54.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分是或包含脱氨酶结构域。
55.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)dsRBD。
56.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)Z-DNA结合结构域。
57.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其片段的氨基酸序列。
58.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其特征性部分的氨基酸序列。
59.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽的氨基酸序列。
60.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分的氨基酸序列是灵长类动物ADAR1多肽的氨基酸序列。
61.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分是或包含灵长类动物ADAR1多肽或其特征性部分。
62.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分是灵长类动物ADAR1多肽。
63.如前述实施例中任一项所述的胚胎,其中该灵长类动物ADAR1多肽是人ADAR1多肽。
64.如前述实施例中任一项所述的胚胎,其中该灵长类动物ADAR1多肽是人ADAR1的p110同种型。
65.如实施例45-63中任一项所述的胚胎,其中该灵长类动物ADAR1多肽是人ADAR1的p150同种型。
66.如实施例45-62中任一项所述的胚胎,其中该灵长类动物ADAR1多肽是非人灵长类动物ADAR1多肽。
67.如实施例45-62中任一项所述的胚胎,其中该灵长类动物ADAR1多肽是猴ADAR1多肽。
68.如实施例45-62中任一项所述的胚胎,其中该灵长类动物ADAR1多肽为食蟹猴ADAR1多肽。
69.如前述实施例中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分,当与靶向靶腺苷的寡核苷酸组合物接触时,在一个或多个经工程化为表达该ADAR1多肽或其特征性部分的细胞和/或组织中提供与在未经工程化为表达该ADAR1多肽或其特征性部分的参考细胞或组织中观察到的水平相比增加的该靶腺苷的编辑水平(“工程化的编辑水平”)。
70.如实施例69所述的胚胎,其中该寡核苷酸组合物是WV-38700,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
71.如实施例69-70中任一项所述的胚胎,其中该寡核苷酸组合物是WV-38702,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
72.如实施例69-71中任一项所述的胚胎,其中该寡核苷酸组合物是WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
73.如实施例69-72中任一项所述的胚胎,其中该寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷。
74.如实施例69-73中任一项所述的胚胎,其中该寡核苷酸组合物是WV-38697,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
75.如实施例69-74中任一项所述的胚胎,其中该寡核苷酸组合物是WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
76.如实施例69-75中任一项所述的胚胎,其中该一个或多个细胞或组织是肝组织。
77.如实施例69-75中任一项所述的胚胎,其中该一个或多个细胞或组织是小鼠肝细胞。
78.如前述实施例中任一项所述的胚胎,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
79.如前述实施例中任一项所述的胚胎,其中该工程化的编辑水平是该参考编辑水平的约或至少约2倍。
80.如前述实施例中任一项所述的胚胎,其中该工程化的编辑水平是该参考编辑水平的约或至少约5倍。
81.如前述实施例中任一项所述的胚胎,其中该工程化的编辑水平是该参考编辑水平的约或至少约10倍。
82.如前述实施例中任一项所述的胚胎,其中该胚胎是杂合的。
83.如实施例45-82中任一项所述的胚胎,其中该胚胎是纯合的。
84.一种细胞,其经工程化为包含ADAR1多肽或其特征性部分。
85.一种细胞,其经工程化为包含和/或表达多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
86.如前述实施例中任一项所述的细胞,其中该细胞是非人细胞。
87.如前述实施例中任一项所述的细胞,其中该细胞是胚胎干细胞。
88.如前述实施例中任一项所述的细胞,其中该细胞的基因组包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
89.如前述实施例中任一项所述的细胞,其中该多核苷酸包含一个或多个内含子。
90.如实施例84-88中任一项所述的细胞,其中该多核苷酸不包含内含子。
91.如前述实施例中任一项所述的细胞,其中该细胞经工程化为表达ADAR1多肽或其特征性部分。
92.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分的表达是可诱导的。
93.如实施例84-91中任一项所述的细胞,其中该ADAR1多肽或其特征性部分的表达是组成型的。
94.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分的表达可操作地连接至一个或多个组织特异性调节元件或受一个或多个组织特异性调节元件调节。
95.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分是或包含脱氨酶结构域。
96.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)dsRBM。
97.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)Z-DNA结合结构域。
98.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其片段的氨基酸序列。
99.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其特征性部分的氨基酸序列。
100.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽的氨基酸序列。
101.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分的氨基酸序列是灵长类动物ADAR1多肽的氨基酸序列。
102.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分是或包含灵长类动物ADAR1多肽或其特征性部分。
103.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分是灵长类动物ADAR1多肽。
104.如前述实施例中任一项所述的细胞,其中该灵长类动物ADAR1多肽是人ADAR1多肽。
105.如前述实施例中任一项所述的细胞,其中该灵长类动物ADAR1多肽是人ADAR1的p110同种型。
106.如实施例84-104中任一项所述的细胞,其中该灵长类动物ADAR1多肽是人ADAR1的p150同种型。
107.如实施例84-103中任一项所述的细胞,其中该灵长类动物ADAR1多肽是非人灵长类动物ADAR1多肽。
108.如实施例84-103中任一项所述的细胞,其中该灵长类动物ADAR1多肽是猴ADAR1多肽。
109.如实施例84-103中任一项所述的细胞,其中该灵长类动物ADAR1多肽为食蟹猴ADAR1多肽。
110.如前述实施例中任一项所述的细胞,其中该ADAR1多肽或其特征性部分,当与靶向靶腺苷的寡核苷酸组合物接触时,在一个或多个经工程化为表达该ADAR1多肽或其特征性部分的细胞和/或组织中提供与在未经工程化为表达该ADAR1多肽或其特征性部分的参考细胞或组织中观察到的水平相比增加的该靶腺苷的编辑水平(“工程化的编辑水平”)。
111.如实施例110所述的细胞,其中该寡核苷酸组合物是WV-38700,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
112.如实施例110-111中任一项所述的细胞,其中该寡核苷酸组合物是WV-38702,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
113.如实施例110-112中任一项所述的细胞,其中该寡核苷酸组合物是WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
114.如实施例110-113中任一项所述的细胞,其中该寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷。
115.如实施例110-114中任一项所述的细胞,其中该寡核苷酸组合物是WV-38697,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
116.如实施例110-115中任一项所述的细胞,其中该寡核苷酸组合物是WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
117.如实施例110-116中任一项所述的细胞,其中该一个或多个细胞或组织是肝组织。
118.如实施例110-116中任一项所述的细胞,其中该一个或多个细胞或组织是小鼠肝细胞。
119.如前述实施例中任一项所述的细胞,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
120.如前述实施例中任一项所述的细胞,其中该工程化的编辑水平是该参考编辑水平的约或至少约2倍。
121.如前述实施例中任一项所述的细胞,其中该工程化的编辑水平是该参考编辑水平的约或至少约5倍。
122.如前述实施例中任一项所述的细胞,其中该工程化的编辑水平是该参考编辑水平的约或至少约10倍。
123.如前述实施例中任一项所述的细胞,其中该细胞是杂合的。
124.如实施例84-122中任一项所述的细胞,其中该细胞是纯合的。
125.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:27相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
126.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:28相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
127.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:29相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
128.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:30相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
129.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:31相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
130.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:32相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
131.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:33相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
132.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:34相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
133.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:35相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
134.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:36相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
135.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:37相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
136.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:38相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
137.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:39相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
138.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:40相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%)96%、97%、98%或99%)同源性。
139.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:27。
140.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:28。
141.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:29。
142.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:30。
143.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:31。
144.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:32。
145.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:33。
146.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:34。
147.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:35。
148.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:36。
149.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:37。
150.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:38。
151.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:39。
152.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:40。
153.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:5或其特征性部分。
154.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:6或其特征性部分。
155.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:9或其特征性部分。
156.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:12或其特征性部分。
157.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:16或其特征性部分。
158.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:20或其特征性部分。
159.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:26或其特征性部分。
160.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:43或其特征性部分。
161.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:46或其特征性部分。
162.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:49或其特征性部分。
163.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:52或其特征性部分。
164.如前述实施例中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ ID NO:55或其特征性部分。
165.如前述实施例中任一项所述的动物、胚胎或细胞,其中该动物、胚胎或细胞是或包含与病症、障碍或疾病相关的细胞、组织或器官或病症、障碍或疾病的细胞、组织或器官。
166.如实施例165所述的动物、胚胎或细胞,其中与病症、障碍或疾病相关的细胞、组织或器官或病症、障碍或疾病的细胞、组织或器官是或包含肿瘤。
167.如前述实施例中任一项所述的动物、胚胎或细胞,其中该动物、胚胎或细胞包含与病症、障碍或疾病相关的核苷酸序列。
168.如实施例167所述的动物、胚胎或细胞,其中与病症、障碍或疾病相关的核苷酸序列是纯合的。
169.如实施例167所述的动物、胚胎或细胞,其中与病症、障碍或疾病相关的核苷酸序列是杂合的。
170.如实施例167所述的动物、胚胎或细胞,其中与病症、障碍或疾病相关的核苷酸序列是半合的。
171.如实施例167-170中任一项所述的动物、胚胎或细胞,其中与病症、障碍或疾病相关的核苷酸序列在基因组中。
172.如实施例167-171中任一项所述的动物、胚胎或细胞,其中与病症、障碍或疾病相关的核苷酸序列在一些但不是所有细胞的基因组中。
173.如实施例167-172中任一项所述的动物、胚胎或细胞,其中与病症、障碍或疾病相关的核苷酸序列在种系基因组中。
174.如实施例167-173中任一项所述的动物、胚胎或细胞,其中与病症、障碍或疾病相关的核苷酸序列是突变。
175.如前述实施例中任一项所述的动物、胚胎或细胞,其中与病症、障碍或疾病相关的核苷酸序列是G至A的突变。
176.如前述实施例中任一项所述的动物、胚胎或细胞,其中与病症、障碍或疾病相关的核苷酸序列是SERPINA1中的G至A突变。
177.如前述实施例中任一项所述的动物、胚胎或细胞,其中该动物、胚胎或细胞包含对应于人SERPINA1基因中的1024G>A(E342K)突变的G至A突变。
178.如前述实施例中任一项所述的动物、胚胎或细胞,其中该动物、胚胎或细胞包含人SERPINA1基因中的1024G>A(E342K)突变。
179.如前述实施例中任一项所述的动物、胚胎或细胞,其中该动物、胚胎或细胞包含NOD.Cg-Prkdcscid Il2rgtm1Wjl Tg(SERPINA1*E342K)#Slcw/SzJ。
180.如前述实施例中任一项所述的动物、胚胎或细胞,其中该动物、胚胎或细胞包含与病症、障碍或疾病相关的G至A突变。
181.一种多核苷酸,其包含:
a)编码ADAR1多肽或其特征性部分的ADAR1多核苷酸,
b)ADAR1多核苷酸上游的5'同源臂,和
c)ADAR1多核苷酸下游的3'同源臂,
其中该5'和3'同源臂独立地包含分别对应于非人动物基因组中的5'和3'靶序列的核苷酸序列,其中该5'靶序列在该3'靶序列的上游。
182.如实施例181所述的多核苷酸,其中该5'靶序列与该3'靶序列直接连接。
183.如实施例181所述的多核苷酸,其中该5'靶序列与该3'靶序列之有约或少于约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、或10kb。
184.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多核苷酸包含一个或多个内含子。
185.如实施例181-183中任一项的所述的多核苷酸,其中该ADAR1多核苷酸不包含内含子。
186.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多核苷酸是密码子优化的以在动物宿主细胞中表达ADAR1多肽或其特征性部分。
187.如实施例186所述的多核苷酸,其中该动物是啮齿类动物。
188.如实施例186所述的多核苷酸,其中该动物是小鼠。
189.如实施例186所述的多核苷酸,其中该动物是大鼠。
190.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸包含用于该ADAR1多核苷酸的可诱导表达的调节元件。
191.如实施例181-189中任一项所述的多核苷酸,其中该多核苷酸包含用于该ADAR1多核苷酸的组成型表达的调节元件。
192.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸包含用于该ADAR1多核苷酸的组织特异性表达的调节元件。
193.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分是或包含脱氨酶结构域。
194.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)dsRBM。
195.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)Z-DNA结合结构域。
196.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其片段的氨基酸序列。
197.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其特征性部分的氨基酸序列。
198.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽的氨基酸序列。
199.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分的氨基酸序列是灵长类动物ADAR1多肽的氨基酸序列。
200.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分是或包含灵长类动物ADAR1多肽或其特征性部分。
201.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分是灵长类动物ADAR1多肽。
202.如前述实施例中任一项所述的多核苷酸,其中该灵长类动物ADAR1多肽是人ADAR1多肽。
203.如前述实施例中任一项所述的多核苷酸,其中该灵长类动物ADAR1多肽是人ADAR1的p110同种型。
204.如实施例181-202中任一项所述的多核苷酸,其中该灵长类动物ADAR1多肽是人ADAR1的p150同种型。
205.如实施例181-201中任一项所述的多核苷酸,其中该灵长类动物ADAR1多肽是非人灵长类动物ADAR1多肽。
206.如实施例181-201中任一项所述的多核苷酸,其中该灵长类动物ADAR1多肽是猴ADAR1多肽。
207.如实施例181-201中任一项所述的多核苷酸,其中该灵长类动物ADAR1多肽为食蟹猴ADAR1多肽。
208.如前述实施例中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分,当与靶向靶腺苷的寡核苷酸组合物接触时,在一个或多个经工程化为表达该ADAR1多肽或其特征性部分的细胞和/或组织中提供与在未经工程化为表达该ADAR1多肽或其特征性部分的参考细胞或组织中观察到的水平相比增加的该靶腺苷的编辑水平(“工程化的编辑水平”)。
209.如实施例208所述的多核苷酸,其中该寡核苷酸组合物是WV-38700,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
210.如实施例208-209中任一项所述的多核苷酸,其中该寡核苷酸组合物是WV-38702,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
211.如实施例208-210中任一项所述的多核苷酸,其中该寡核苷酸组合物是WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
212.如实施例208-211中任一项所述的多核苷酸,其中该寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷。
213.如实施例208-212中任一项所述的多核苷酸,其中该寡核苷酸组合物是WV-38697,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
214.如实施例208-213中任一项所述的多核苷酸,其中该寡核苷酸组合物是WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
215.如实施例208-214中任一项所述的多核苷酸,其中该一个或多个细胞或组织是肝组织。
216.如实施例208-214中任一项所述的多核苷酸,其中该一个或多个细胞或组织是小鼠肝细胞。
217.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸具有或包含编码如前述实施例中任一项所述的ADAR1多肽或其特征性部分的序列。
218.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:2或其特征性部分。
219.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:3或其特征性部分。
220.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:4或其特征性部分。
221.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:7或其特征性部分。
222.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:8或其特征性部分。
223.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:10或其特征性部分。
224.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:11或其特征性部分。
225.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:13或其特征性部分。
226.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:14或其特征性部分。
227.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:15或其特征性部分。
228.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:17或其特征性部分。
229.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:18或其特征性部分。
230.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:19或其特征性部分。
231.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:21或其特征性部分。
232.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:22或其特征性部分。
233.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:23或其特征性部分。
234.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:24或其特征性部分。
235.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:25或其特征性部分。
236.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:41或其特征性部分。
237.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:42或其特征性部分。
238.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:44或其特征性部分。
239.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:45或其特征性部分。
240.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:47或其特征性部分。
241.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:48或其特征性部分。
242.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:50或其特征性部分。
243.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:51或其特征性部分。
244.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:53或其特征性部分。
245.如前述实施例中任一项所述的多核苷酸,其中该多核苷酸的序列是或包含SEQ ID NO:54或其特征性部分。
246.如前述实施例中任一项所述的多核苷酸,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
247.如前述实施例中任一项所述的多核苷酸,其中该工程化的编辑水平是该参考编辑水平的约或至少约2倍。
248.如前述实施例中任一项所述的多核苷酸,其中该工程化的编辑水平是该参考编辑水平的约或至少约5倍。
249.如前述实施例中任一项所述的多核苷酸,其中该工程化的编辑水平是该参考编辑水平的约或至少约10倍。
250.如前述实施例中任一项所述的动物、胚胎或细胞,其包含和/或表达如前述实施例中任一项所述的多核苷酸。
251.一种载体,其包含或表达编码ADAR1多肽或其特征性部分的ADAR1多核苷酸。
252.一种载体,其包含和/或表达:
a)编码ADAR1多肽或其特征性部分的ADAR1多核苷酸,
b)ADAR1多核苷酸上游的5'同源臂,和
c)ADAR1多核苷酸下游的3'同源臂,
其中该5'和3'同源臂独立地包含分别对应于非人动物基因组中的5'和3'靶序列的核苷酸序列,其中该5'靶序列在该3'靶序列的上游。
253.如实施例252所述的载体,其中该5'靶序列与该3'靶序列直接连接。
254.如实施例252所述的载体,其中该5'靶序列与该3'靶序列之有约或少于约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、或10kb。
255.如前述实施例中任一项所述的载体,其中该ADAR1多核苷酸包含一个或多个内含子。
256.如实施例251-254中任一项的所述的载体,其中该ADAR1多核苷酸不包含内含子。
257.如前述实施例中任一项所述的载体,其中该ADAR1多核苷酸是密码子优化的以在动物宿主细胞中表达ADAR1多肽或其特征性部分。
258.如实施例186所述的载体,其中该动物是啮齿类动物。
259.如实施例186所述的载体,其中该动物是小鼠。
260.如实施例186所述的载体,其中该动物是大鼠。
261.如前述实施例中任一项所述的载体,其中该载体包含用于该ADAR1多核苷酸的可诱导表达的调节元件。
262.如实施例251-260中任一项所述的载体,其中该载体包含用于该ADAR1多核苷酸的组成型表达的调节元件。
263.如前述实施例中任一项所述的载体,其中该载体包含用于该ADAR1多核苷酸的组织特异性表达的调节元件。
264.如前述实施例中任一项所述的载体,其中该ADAR1多肽或其特征性部分是或包含脱氨酶结构域。
265.如前述实施例中任一项所述的载体,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)dsRBM。
266.如前述实施例中任一项所述的载体,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)Z-DNA结合结构域。
267.如前述实施例中任一项所述的载体,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其片段的氨基酸序列。
268.如前述实施例中任一项所述的载体,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其特征性部分的氨基酸序列。
269.如前述实施例中任一项所述的载体,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽的氨基酸序列。
270.如前述实施例中任一项所述的载体,其中该ADAR1多肽或其特征性部分的氨基酸序列是灵长类动物ADAR1多肽的氨基酸序列。
271.如前述实施例中任一项所述的载体,其中该ADAR1多肽或其特征性部分是或包含灵长类动物ADAR1多肽或其特征性部分。
272.如前述实施例中任一项所述的载体,其中该ADAR1多肽或其特征性部分是灵长类动物ADAR1多肽。
273.如前述实施例中任一项所述的载体,其中该灵长类动物ADAR1多肽是人ADAR1多肽。
274.如前述实施例中任一项所述的载体,其中该灵长类动物ADAR1多肽是人ADAR1的p110同种型。
275.如实施例251-273中任一项所述的载体,其中该灵长类动物ADAR1多肽是人ADAR1的p150同种型。
276.如实施例251-272中任一项所述的载体,其中该灵长类动物ADAR1多肽是非人灵长类动物ADAR1多肽。
277.如实施例251-272中任一项所述的载体,其中该灵长类动物ADAR1多肽是猴ADAR1多肽。
278.如实施例251-272中任一项所述的载体,其中该灵长类动物ADAR1多肽为食蟹猴ADAR1多肽。
279.如前述实施例中任一项所述的载体,其中该ADAR1多肽或其特征性部分,当与靶向靶腺苷的寡核苷酸组合物接触时,在一个或多个经工程化为表达该ADAR1多肽或其特征性部分的细胞和/或组织中提供与在未经工程化为表达该ADAR1多肽或其特征性部分的参考细胞或组织中观察到的水平相比增加的该靶腺苷的编辑水平(“工程化的编辑水平”)。
280.如实施例279所述的载体,其中该寡核苷酸组合物是WV-38700,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
281.如实施例279-280中任一项所述的载体,其中该寡核苷酸组合物是WV-38702,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
282.如实施例279-281中任一项所述的载体,其中该寡核苷酸组合物是WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
283.如实施例279-282中任一项所述的载体,其中该寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷。
284.如实施例279-283中任一项所述的载体,其中该寡核苷酸组合物是WV-38697,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
285.如实施例279-284中任一项所述的载体,其中该寡核苷酸组合物是WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
286.如实施例279-285中任一项所述的载体,其中该一个或多个细胞或组织是肝组织。
287.如实施例279-285中任一项所述的载体,其中该一个或多个细胞或组织是小鼠肝细胞。
288.如前述实施例中任一项所述的载体,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
289.如前述实施例中任一项所述的载体,其中该工程化的编辑水平是该参考编辑水平的约或至少约2倍。
290.如前述实施例中任一项所述的载体,其中该工程化的编辑水平是该参考编辑水平的约或至少约5倍。
291.如前述实施例中任一项所述的载体,其中该工程化的编辑水平是该参考编辑水平的约或至少约10倍。
292.如前述实施例中任一项所述的载体,其中该载体是靶向载体。
293.一种载体,其包含和/或表达如前述实施例中任一项所述的多核苷酸。
294.如前述实施例中任一项所述的动物、胚胎或细胞,其包含如前述实施例中任一项所述的多核苷酸。
295.如前述实施例中任一项所述的动物、胚胎或细胞,其表达如前述实施例中任一项所述的多核苷酸。
296.如前述实施例中任一项所述的动物、胚胎或细胞,其中与未经工程化为表达该ADAR1多肽或其特征性部分的参考动物、胚胎或细胞中的水平(“参考编辑水平”)相比,该动物、胚胎或细胞提供更高的ADAR1靶腺苷编辑水平(“工程化的编辑水平”)。
297.如实施例296所述的动物、胚胎或细胞,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
298.如实施例296所述的动物、胚胎或细胞,其中该工程化的编辑水平是该参考编辑水平的约或至少约2倍。
299.如实施例296所述的动物、胚胎或细胞,其中该工程化的编辑水平是该参考编辑水平的约或至少约5倍。
300.如实施例296所述的动物、胚胎或细胞,其中该工程化的编辑水平是该参考编辑水平的约或至少约10倍。
301.一种细胞群,其包含多个细胞,每个细胞独立地是如前述实施例中任一项所述的细胞。
302.一种细胞群,其中每个细胞独立地是如前述实施例中任一项所述的细胞。
303.一种方法,其包括将如前述实施例中任一项所述的多核苷酸或载体引入细胞、胚胎或动物中。
304.如实施例303所述的方法,其中该细胞、胚胎或动物在引入之前不包含或不表达ADAR1多核苷酸。
305.如实施例303所述的方法,其中该细胞、胚胎或动物在引入之前不包含或不表达灵长类动物或人ADAR1多核苷酸。
306.如实施例303-305中任一项所述的方法,其中该细胞、胚胎或动物是啮齿类动物细胞胚胎或动物。
307.如实施例303-305中任一项所述的方法,其中该细胞、胚胎或动物是小鼠细胞胚胎或动物。
308.如实施例303-305中任一项所述的方法,其中该细胞、胚胎或动物是大鼠细胞胚胎或动物。
309.如实施例303-308中任一项所述的方法,其中该方法提供如前述实施例中任一项所述的细胞、胚胎或动物。
310.一种制备非人动物的方法,该方法包括:
(a)将编码ADAR1多肽或其特征性部分的ADAR1多核苷酸引入非人动物的ES细胞的基因组中;以及
(b)使用步骤(a)中生成的ES细胞生成非人动物。
311.一种制备非人动物的方法,该方法包括:
(a)将如前述实施例中任一项所述的多核苷酸引入非人动物的ES细胞的基因组中;以及
(b)使用步骤(a)中生成的ES细胞生成非人动物。
312.一种制备非人动物的方法,该方法包括:
(a)将编码ADAR1多肽或其特征性部分的ADAR1多核苷酸引入非人动物的受精卵的基因组中;以及
(b)使用步骤(a)中生成的受精卵生成非人动物。
313.一种制备非人动物的方法,该方法包括:
(a)将如前述实施例中任一项所述的多核苷酸引入非人动物的受精卵的基因组中;以及
(b)使用步骤(a)中生成的受精卵生成非人动物。
314.一种制备非人动物的经遗传修饰的ES细胞的方法,该方法包括:
将编码ADAR1多肽或其特征性部分的ADAR1多核苷酸引入非人动物的ES细胞的基因组中。
315.一种制备非人动物的经遗传修饰的ES细胞的方法,该方法包括:
将如前述实施例中任一项所述的多核苷酸引入非人动物的ES细胞的基因组中。
316.一种生成工程化的细胞的方法,该方法包括:
将编码ADAR1多肽或其特征性部分的ADAR1多核苷酸引入非人动物的细胞中。
317.一种生成工程化的细胞的方法,该方法包括:
将如前述实施例中任一项所述的多核苷酸引入非人动物的细胞中。
318.如前述实施例中任一项所述的方法,其包括以下步骤:
将细胞的基因组与核酸酶接触以产生DNA断裂;以及
引入如前述实施例中任一项所述的多核苷酸。
319.如实施例318所述的方法,其中该核酸酶是CRISPR/Cas9。
320.如实施例318所述的方法,其中该核酸酶是锌指核酸酶。
321.如实施例318所述的方法,其中该核酸酶是转录激活子样效应核酸酶。
322.一种用于产生动物、胚胎或细胞的方法,该方法包括向第一动物、胚胎或细胞引入多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
323.如实施例322所述的方法,其中ADAR1多肽是人ADAR1。
324.如实施例322所述的方法,其中ADAR1多肽是人ADAR1 p110。
325.如实施例322所述的方法,其中ADAR1多肽是人ADAR1 p150。
326.一种用于生成动物、胚胎或细胞的方法,该方法包括将第一动物与第二动物交配,其中该第二动物是如前述实施例中任一项所述的动物。
327.如实施例322-326中任一项所述的方法,其中第一动物、胚胎或细胞是或包含与病症、障碍或疾病相关的细胞、组织或器官或病症、障碍或疾病的细胞、组织或器官。
328.一种用于生成动物、胚胎或细胞的方法,该方法包括将与病症、障碍或疾病相关的第一细胞、组织或器官或病症、障碍或疾病的第一细胞、组织或器官引入如前述实施例中任一项所述的第二动物、胚胎或细胞。
329.如实施例327-328中任一项所述的方法,其中与病症、障碍或疾病相关的细胞、组织或器官或病症、障碍或疾病的细胞、组织或器官是或包含肿瘤。
330.如实施例322-329中任一项所述的方法,其中第一动物、胚胎或细胞包含与病症、障碍或疾病相关的核苷酸序列。
331.如实施例322-330中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列是纯合的。
332.如实施例322-330中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列是杂合的。
333.如实施例322-330中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列是半合的。
334.如实施例322-333中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列在基因组中。
335.如实施例322-334中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列在一些但不是所有细胞的基因组中。
336.如实施例322-335中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列在种系基因组中。
337.如实施例322-336中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列是突变。
338.如实施例322-337中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列是G至A突变。
339.如实施例322-337中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列是SERPINA1中的G至A突变。
340.如实施例322-337中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列对应于人SERPINA1基因中的1024G>A(E342K)突变。
341.如实施例322-337中任一项所述的方法,其中与病症、障碍或疾病相关的核苷酸序列是人SERPINA1基因中的1024G>A(E342K)突变。
342.如实施例322-337中任一项所述的方法,其中第一动物、胚胎或细胞是NOD.Cg-Prkdcscid Il2rgtm1Wjl Tg(SERPINA1*E342K)#Slcw/SzJ小鼠(杰克逊实验室货号:028842)。
343.一种评估用于腺苷编辑的药剂或其组合物的方法,该方法包括以下步骤:
向如前述实施例中任一项所述的动物、胚胎或细胞施用药剂。
344.如实施例343所述的方法,其中该药剂或其组合物是寡核苷酸组合物。
345.如实施例343-344中任一项所述的方法,其中与未经工程化为表达该ADAR1多肽或其特征性部分的参考动物、胚胎或细胞中的水平(“参考编辑水平”)相比,该药剂或其组合物在该工程化的动物、胚胎或细胞中提供更高的编辑水平(“工程化的编辑水平”)。
346.一种方法,其包括在如前述实施例中任一项所述的动物、胚胎或细胞中表达RNA,其中编辑该RNA的靶腺苷。
347.如实施例346所述的方法,其包括向该动物、胚胎或细胞施用靶向该靶腺苷的药剂或其组合物。
348.如实施例346所述的方法,其包括向该动物、胚胎或细胞施用靶向该靶腺苷的寡核苷酸或寡核苷酸组合物。
349.如实施例346-348中任一项所述的方法,其中与未经工程化为表达该ADAR1多肽或其特征性部分的参考动物、胚胎或细胞中的水平(“参考编辑水平”)相比,该靶向的腺苷以更高的水平(“工程化的编辑水平”)被编辑。
350.如实施例343-349中任一项所述的方法,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
351.如实施例343-349中任一项所述的方法,其中该工程化的编辑水平是该参考编辑水平的约或至少约2倍。
352.如实施例343-349中任一项所述的方法,其中该工程化的编辑水平是该参考编辑水平的约或至少约5倍。
353.如实施例343-349中任一项所述的方法,其中该工程化的编辑水平是该参考编辑水平的约或至少约10倍。
354.一种表征ADAR1多肽或其特征性部分的方法,该方法包括:
在动物的工程化的宿主细胞或动物中表达ADAR1多肽或其特征性部分;
评估ADAR1多肽或其特征性部分的表达水平,或转录物中靶腺苷的编辑水平。
355.如实施例354所述的方法,其中该ADAR1多肽或其特征性部分是人ADAR1多肽或其特征性部分。
356.如实施例354-355中任一项所述的方法,其中该动物是非人动物。
357.如实施例354-355中任一项所述的方法,其中该动物是啮齿类动物。
358.如实施例354-355中任一项所述的方法,其中该动物是小鼠。
359.如实施例354-355中任一项所述的方法,其中该动物是大鼠。
360.如实施例354-359中任一项所述的方法,其包括评估该ADAR1多肽或其特征性部分的表达水平。
361.如实施例354-360中任一项所述的方法,其包括评估转录物中靶腺苷的编辑水平。
362.如实施例361所述的方法,其包括向该宿主细胞或动物施用靶向该靶腺苷的寡核苷酸组合物。
363.如实施例362所述的方法,其中该寡核苷酸组合物是WV-38700,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
364.如实施例362-363中任一项所述的方法,其中该寡核苷酸组合物是WV-38702,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
365.如实施例362-364中任一项所述的方法,其中该寡核苷酸组合物是WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷。
366.如实施例362-365中任一项所述的方法,其中该寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷。
367.如实施例362-366中任一项所述的方法,其中该寡核苷酸组合物是WV-38697,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
368.如实施例362-367中任一项所述的方法,其中该寡核苷酸组合物是WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
369.如实施例354-368中任一项所述的方法,其中该宿主细胞是肝细胞。
370.如实施例354-369中任一项所述的方法,其包括将ADAR1多肽或其特征性部分的表达水平与未经工程化为表达ADAR1多肽或其特征性部分的参考细胞或动物中的表达水平进行比较。
371.如实施例354-370中任一项所述的方法,其包括将靶腺苷编辑水平与未经工程化为表达ADAR1多肽或其特征性部分的参考细胞或动物中的水平进行比较。
372.一种用于表征药剂或寡核苷酸或组合物的方法,该方法包括:
将该药剂或寡核苷酸或组合物施用于包含或表达ADAR1多肽或其特征性部分,或编码ADAR1多肽或其特征性部分的多核苷酸的细胞或其群体。
373.如实施例372所述的方法,其中该细胞是如前述实施例中任一项所述的细胞。
374.一种用于表征寡核苷酸或组合物的方法,该方法包括:
将该寡核苷酸或组合物施用于包含或表达ADAR1多肽或其特征性部分,或编码ADAR1多肽或其特征性部分的多核苷酸的非人动物或其群体。
375.如实施例374所述的方法,其中该动物是如前述实施例中任一项所述的动物。
376.如实施例372-375中任一项所述的方法,其中与在工程化之前的细胞或工程化之前的动物的细胞或其群体中观察到的寡核苷酸或组合物的活性水平相比,从细胞或动物的细胞或其群体中观察到的寡核苷酸或组合物的活性水平与在可比较的人细胞或其群体中观察到的寡核苷酸或组合物的活性水平更相似。
377.如实施例376所述的方法,其中可比较的人细胞与细胞或动物的细胞具有相同的类型。
378.如实施例372-377中任一项所述的方法,其中评估药剂或寡核苷酸或组合物用于预防或治疗病症、障碍或疾病,其中该细胞或动物是实施例165-180中任一项所述的细胞或动物。
379.如实施例378所述的方法,其中病症、障碍或疾病是与人SERPINA1中的G至A突变相关的病症、障碍或疾病。
380.如实施例378所述的方法,其中病症、障碍或疾病是与人SERPINA1中的1024G>A相关的病症、障碍或疾病。
381.如实施例378所述的方法,其中病症、障碍或疾病是α-1抗胰蛋白酶缺乏症。
382.一种方法,其包括:
评估细胞、组织或动物中的药剂或其组合物,其中该细胞、组织或动物是或包含与病症、障碍或疾病相关的细胞、组织或器官或病症、障碍或疾病的细胞、组织或器官,和/或包含与病症、障碍或疾病相关的核苷酸序列;以及
向易患或患有病症、障碍或疾病的受试者施用有效量的用于预防或治疗该病症、障碍或疾病的药剂或组合物。
383.一种方法,其包括:
向易患或患有病症、障碍或疾病的受试者施用有效量的用于预防或治疗该病症、障碍或疾病的药剂或组合物,其中在细胞、组织或动物中评估该药剂或组合物,其中该细胞、组织或动物是或包含与病症、障碍或疾病相关的细胞、组织或器官或病症、障碍或疾病的细胞、组织或器官,和/或包含与病症、障碍或疾病相关的核苷酸序列。
384.如实施例382或383所述的方法,其中该受试者是人。
385.如实施例382-383中任一项所述的方法,其中病症、障碍或疾病与G至A突变相关。
386.如实施例382-383中任一项所述的方法,其中病症、障碍或疾病与人SERPINA1基因中的1024G>A(E342K)突变相关。
387.如实施例382-386中任一项所述的方法,其中病症、障碍或疾病是α-1抗胰蛋白酶缺乏症。
388.如实施例382-386中任一项所述的方法,其中该细胞或动物是如实施例165-180中任一项所述。
389.一种方法,其包括
将药剂或其组合物施用于细胞或其群体;以及
评估细胞或其群体中转录物中的腺苷的编辑。
390.如实施例389所述的方法,其中该细胞或其群体在体外生长。
391.如实施例389所述的方法,其中将该药剂或其组合物施用于动物中的细胞或其群体。
392.一种方法,其包括
将药剂或其组合物施用于动物或其群体;以及
评估该动物或其群体的一个或多个细胞或组织中转录物中的腺苷的编辑。
393.如实施例389-392中任一项所述的方法,其中该药剂是寡核苷酸。
394.一种方法,其包括
将寡核苷酸组合物施用于细胞或其群体;以及
评估细胞或其群体中转录物中的腺苷的编辑。
395.如实施例394所述的方法,其中该细胞或其群体在体外生长。
396.如实施例394所述的方法,其中将该寡核苷酸组合物施用于动物中的细胞或其群体。
397.一种方法,其包括
将寡核苷酸组合物施用于动物或其群体;以及
评估该动物或其群体的一个或多个细胞或组织中转录物中的腺苷的编辑。
398.如实施例394-397中任一项所述的方法,其中该寡核苷酸组合物是手性受控的寡核苷酸组合物。
399.如实施例389-398中任一项所述的方法,其中该细胞、动物或其种群是如前述实施例中任一项所述。
400.如实施例382-399中任一项所述的方法,其中该细胞或组织是啮齿类动物细胞或组织,或者动物是啮齿类动物。
401.如实施例400所述的方法,其中该啮齿类动物是大鼠。
402.如实施例400所述的方法,其中该啮齿类动物是小鼠。
403.如实施例382-402中任一项所述的方法,其中该细胞、组织或动物包含或表达人ADAR1或其片段。
404.如实施例382-402中任一项所述的方法,其中该细胞、组织或动物包含或表达人ADAR1或其特征性部分。
405.如实施例382-404中任一项所述的方法,其中该药剂、其组合物或该寡核苷酸组合物提供与在参考细胞或动物中观察到的水平(“参考编辑水平”)相比增加的腺苷编辑水平(“工程化的编辑水平”),其中该参考动物未经工程化为表达ADAR1多肽或其特征性部分。
406.如实施例382-399中任一项所述的方法,其中该药剂、其组合物或该寡核苷酸组合物提供与在参考细胞或动物中观察到的水平(“参考编辑水平”)相比增加的腺苷编辑水平(“工程化的编辑水平”),其中该参考动物未经工程化为表达人ADAR1多肽或其特征性部分。
407.如实施例382-406中任一项所述的方法,其中该细胞是肝中的一种类型的细胞。
408.如实施例382-406中任一项所述的方法,其中该细胞是肝细胞。
409.如前述实施例中任一项所述的动物,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
410.如前述实施例中任一项所述的动物,其中该工程化的编辑水平是该参考编辑水平的约或至少约2倍。
411.如前述实施例中任一项所述的动物,其中该工程化的编辑水平是该参考编辑水平的约或至少约5倍。
412.如前述实施例中任一项所述的动物,其中该工程化的编辑水平是该参考编辑水平的约或至少约10倍。
413.如实施例382-412中任一项所述的方法,包括获得或制造用于施用的药剂、其组合物或寡核苷酸组合物。
414.如实施例413所述的方法,其中该药剂、其组合物或该寡核苷酸组合物不是为施用于受试者而制造。
415.如实施例413或414所述的方法,其中该药剂、其组合物或该寡核苷酸组合物不作为药物产品制造。
416.如实施例413-415中任一项所述的方法,其中该药剂、其组合物或该寡核苷酸组合物不是商业批次。
417.如实施例413所述的方法,其中该药剂、其组合物或该寡核苷酸组合物是为施用于受试者而制造。
418.如实施例413或417所述的方法,其中该药剂、其组合物或该寡核苷酸组合物作为药物产品制造。
419.如实施例413和417-418中任一项所述的方法,其中该药剂、其组合物或该寡核苷酸组合物是商业批次。
420.如实施例382-419中任一项所述的方法,其包括在评估之后获得一个批次的药剂、其组合物或寡核苷酸组合物。
421.如实施例382-420中任一项所述的方法,其包括在评估之后制造一个批次的药剂、其组合物或寡核苷酸组合物。
422.如实施例382-421中任一项所述的方法,其中该批次是商业批次。
423.如实施例382-422中任一项所述的方法,其包括生产适合施用于受试者的药剂、其组合物或寡核苷酸组合物的药物产品。
424.如实施例414-423中任一项所述的方法,其中受试者是人。
425.如实施例382-424中任一项所述的方法,其包括:
将来自商业批次的样品或药剂、其组合物或寡核苷酸组合物的药物产品施用给细胞或动物或其群体,
评估该细胞、或该动物或其群体的一个或多个细胞或组织中转录物中的腺苷的编辑。
426.如实施例425所述的方法,其中该腺苷的编辑处于与第一商业生产之前的非商业生产可比较的水平。
427.如实施例425-426中任一项所述的方法,其中该腺苷的编辑处于与另一批次的商业生产或药物产品可比较的水平。
428.如实施例425-427中任一项所述的方法,其中该腺苷的编辑处于与参考样品或药品可比较的水平。
429.如实施例425-428中任一项所述的方法,其中该腺苷的编辑处于参考范围内的水平。
430.如实施例425-429中任一项所述的方法,其包括释放商业批次或药物产品用于交付、分配或施用。
431.如实施例425所述的方法,其中该腺苷的编辑处于与第一商业生产之前的非商业生产不可比较的水平。
432.如实施例425或431所述的方法,其中该腺苷的编辑处于与另一批次的商业生产或药物产品不可比较的水平。
433.如实施例425和431-432中任一项所述的方法,其中该腺苷的编辑处于与参考样品或药物产品不可比较的水平。
434.如实施例425和431-433中任一项所述的方法,其中该腺苷的编辑处于不在参考范围内的水平。
435.如实施例425和431-434中任一项所述的方法,其包括拒绝商业批次或药物产品用于交付、分配或施用。
实例
提供以下实例以向技术人员描述如何制备和使用本文所述的细胞、组织、动物、方法、组合物等;并且不旨在限制本披露的范围。除非另有说明,否则温度以摄氏度表示,压力为大气压或接近大气压。
所提供技术的某些实例(化合物(寡核苷酸、试剂等)、组合物、方法(制备方法、使用方法、评估方法等)、多核苷酸、多肽(例如ADAR1多肽或其特征性部分)、细胞、组织、非人动物等)在此呈现。
本领域的技术人员应了解,可以利用许多技术来评估所提供技术的特性和/或活性,例如下文实例中所描述的那些技术。
用于制备寡核苷酸和寡核苷酸组合物(立体随机的和手性控制的)的多种技术是已知的并且可以根据本披露使用,包括例如在以下文献中描述的方法和试剂:US 9982257、US 20170037399、US 20180216108、US 20180216107、US 9598458、WO 2017/062862、WO2018/067973、WO 2017/160741、WO 2017/192679、WO 2017/210647、WO 2018/098264、WO2018/223056、WO 2018/237194、WO 2019/032607、WO 2019/055951、WO 2019/075357、WO2019/200185、WO 2019/217784和/或WO 2019/032612。
实例1-包含作用于RNA 1(ADAR1)编码序列的人腺苷脱氨酶的靶向载体的产生。
使用本领域公认的标准分子生物学技术制备人ADAR-1编码同种型多核苷酸(例如,DNA片段通过从头DNA合成或克隆产生)。该片段包含作用于RNA1的人腺苷脱氨酶的完整编码序列或其功能和特征性部分(如SEQ ID NO:27-40所示)。
合成了人ADAR-1同种型p110(例如,转录变体4)多核苷酸并通过桑格测序来证实。将片段(2942bp)用PacI和NheI消化,并使用本领域已知的方法连接到mROSA-KI-12p载体(用PacI和NheI线性化)中。该片段包含作用于编码p110多肽(SEQ ID NO:16)的RNA 1转录物的人腺苷脱氨酶完整编码序列(SEQ ID NO:14)。
还合成了人ADAR-1同种型p150(转录变体1)多核苷酸并通过桑格测序来证实。将片段(3827bp)用PacI和NheI消化,并使用本领域已知的方法连接到mROSA-KI-12p载体(用PacI和NheI线性化)中。该片段包含作用于编码p150多肽(SEQ ID NO:6)的RNA1转录物的人腺苷脱氨酶完整编码序列(SEQ ID NO:3)。
将上述段落中描述的ADAR1 p110和p150编码多核苷酸连接到mROSA-KI-12p靶向载体中,以产生靶向载体A(参见图1和图4)和靶向载体B(参见图2)。为了帮助繁殖,含有靶向载体的质粒包含氨苄青霉素抗性阳性选择标记和复制起点。靶向载体以5'到3'的顺序包含:5'(又名左)同源臂(SEQ ID NO:62),腺病毒衍生的剪接受体(SEQ ID NO:57),科扎克序列,目的编码序列(例如,对于人ADAR1的CDS)(SEQ ID NO:14或SEQ ID NO:3),土拨鼠肝炎病毒转录后调节元件(WPRE)(SEQ ID NO:56),牛生长激素(bGH)聚腺苷酸化信号(SEQ IDNO:59),和3'(也称为右)同源臂(SEQ ID NO:63)。对于靶向载体A和B,靶向ROSA26基因座的同源臂是相同的,并且与小鼠ROSA26等位基因第一个外显子周围的区域同源。5'同源臂包含1812bp并由SEQ ID NO:62表示。3'同源臂包含1779bp并由SEQ ID NO:63表示。对于靶向载体A,完整的靶向序列由SEQ ID NO:64表示。对于靶向载体B,完整的靶向序列由SEQ IDNO:65表示。
本领域技术人员将认识到编码ADAR1多肽或其特征性部分的多核苷酸可以根据本披露插入到各种其他位置,例如其他啮齿类动物转录港(也称为转录热点,例如,如本文所述的),内源小鼠ADAR1基因座,和/或ROSA26等位基因内的不同位点。
在克隆靶向载体后,可以使用限制酶消化和片段大小分析来确认CDS插入到相应的靶载体中。本领域技术人员将认识到,可以使用替代性筛选方法(例如桑格测序、选择性PCR等)来确认构建体的产生。
靶向载体A的限制性消化产生可变的片段大小,这取决于所使用的限制酶(参见图5)。三种限制酶的组合被用来产生可变的片段大小,通过正确的插入观察到以下产物:1)XhoI+BamHI酶切产生长度为7096bp+3039bp的线性片段;2)SalI消化产生长度为4765bp+3255bp+2115bp的线性片段;3)ScaI消化产生长度为7093bp+3042bp的线性片段(见图6)。消化后,克隆序列#6和#7显示出正确的条带模式,并且在桑格测序之后,克隆#6被选择用于进一步使用。
靶向载体B的限制性消化产生可变的片段大小,这取决于所使用的限制酶(参见图12)。三种限制酶的组合被用来产生可变的片段大小,通过正确的插入观察到以下产物:1)BamHI+SacI酶切产生长度为5452bp+4214bp+1354bp的线性片段;2)XhoI+MluI酶切产生长度为6196bp+4824bp的线性片段;3)SalI酶切产生长度为4765bp+4140bp+2115bp的线性片段;4)NdeI+KpnI消化产生长度为5405bp+3244bp+2371bp的线性片段(见图13)。消化后,克隆序列#5和#6显示出正确的条带模式,并且在桑格测序之后,克隆#5被选择用于进一步使用。
本领域技术人员理解,也可以根据本披露利用其他技术,例如载体、限制酶等来制备用于引入非人动物及其细胞的多核苷酸。
实例2-包含人ADAR1编码序列的小鼠受精卵和动物的产生。
根据本披露可以使用各种技术。例如,在一些实施例中,将(例如,如本文所述的)靶向载体与能够产生位点特异性双链断裂和/或单链切口的位点定向酶(例如,CRISPR/Cas9、TALEN和/或锌指核酸酶)组合注射到小鼠受精卵中。本领域技术人员将认识到有大量的小鼠基因型适合受精卵注射和转基因动物产生。注射后,受精卵被转移到代孕母体体内。妊娠后,使用本领域已知的方法对幼仔进行基因分型(例如,剪尾)并记录具有潜在插入的动物用于进一步分析。
将包含极致基因组编辑(EGETM)系统试剂(由Biocytogen公司开发并可从其商购,包含图3中鉴定的sgRNA 12)与靶向载体A(例如,如实例中所述1)组合的注射混合物注射到C57BL/6J小鼠受精卵中以产生转基因动物。使用本领域已知的技术注射受精卵;然后将324个注射的受精卵转移到代孕母体体内。在这324个受精卵中,有38个产生了可存活的后代。使用PCR(引物组合:6、7和8;参见表2和图7和8)和随后的桑格测序对幼仔进行基因分型。首建动物幼仔#E7Y45-0005、#E7Y45-0008、#E7Y45-0036和#E7Y45-0037被确认含有通过同源重组插入基因组的目的CDS(例如,编码ADAR1 p110)(见图9)。
将包含极致基因组编辑(EGETM)系统试剂(由Biocytogen公司开发并可从其商购,包含图3中鉴定的sgRNA 12)与靶向载体B(例如,如实例中所述1)组合的注射混合物注射到C57BL/6J小鼠受精卵中以产生转基因动物。使用本领域已知的技术注射受精卵;将462个注射的受精卵转移到代孕母体体内。在这462个受精卵中,有71个产生了可存活的后代。使用PCR(引物组合:6、8、10和11;参见表2和图14和15)和随后的桑格测序对幼仔进行基因分型。首建动物幼仔#E7Y46-0012和#E7Y46-0051被确认含有通过同源重组插入基因组的目的CDS(例如,编码ADAR1 p150)(见图16)。
表2–用于转基因小鼠基因分型的引物
Figure BDA0004094631750002491
Figure BDA0004094631750002501
实例3-包含人ADAR1编码序列的稳定种系整合小鼠的产生
使用本领域已知的标准方法,使用如上文实例2所述创建的首建动物幼仔来建立huADAR1的稳定种系传递。
将对于huADAR1 p110插入而言是杂合的初始幼仔与C57BL/6J小鼠杂交以产生稳定的F1后代。在一个杂交中,WT雄性C57BL/6J动物与确认的等位基因携带者雌性#E7Y45-0005交配,使用PCR对产生的幼仔进行基因分型(引物组合:4、5、6、7和8;参见表2,以及图7和8)和7只基因分型的幼仔中有4只被证实对于huADAR1p110插入而言杂合(参见图10)。在另一个杂交中,一些WT雌性C57BL/6J与确认的等位基因携带者雄性#E7Y45-0037交配,使用PCR对产生的幼仔进行基因分型(引物组合:4、5、6、7和8;参见表,以及图7和8)和54只基因分型的幼仔中有1只被证实对于huADAR1 p110插入而言杂合(参见图10)。使用本领域已知的方法对这些F1动物进行DNA印迹基因分型,以确认huADAR1 p110转基因的存在(预测条带大小见图5和表3,结果见图11)。五只预测为huADAR1 p110杂合的F1动物被证实为等位基因阳性携带者。这些结果显示huADAR1 p110转基因的稳定种系传递。
将对于huADAR1 p150插入而言是杂合的初始幼仔与C57BL/6J小鼠杂交以产生稳定的F1后代。在一个杂交中,WT雌性C57BL/6J动物与确认的等位基因携带者雄性#E7Y46-0051交配,使用PCR对产生的幼仔进行基因分型(引物组合:8、9、10和11;参见表2,基因分型数据未显示),所有基因分型的第一代结果幼仔都不能成为huADAR1 p150插入的携带者,这一结果并不意外,因为不能保证每个杂交的每个首建动物都进行种系传递。在WT雌性C57BL/6J动物和确认的等位基因携带者雄性#E7Y46-0051之间进行了另外的杂交,并产生了数十只另外的幼仔。使用PCR对所得幼仔进行基因分型(引物组合:8、9、10和11;参见表2、图17),16只基因分型的幼仔被阳性地鉴定为潜在的huADAR1 p150插入携带者(参见图16)。使用本领域已知的方法对这些F1动物进行DNA印迹基因分型,以确认huADAR1 p150转基因的存在(预测条带大小见图12和表3,结果见图17)。在这16只动物中,通过DNA印迹分析随后进行另外的PCR分析,1只动物被确认为huADAR1 p150杂合携带者(参见图18)。这些结果显示huADAR1 p150转基因的稳定种系传递。
表3–DNA印迹基因分型转基因小鼠的限制酶策略
Figure BDA0004094631750002511
Figure BDA0004094631750002521
根据本披露可通过标准育种技术产生纯合的工程化动物。例如,将包含其序列编码人ADAR1 p110的多核苷酸的杂合动物交配以产生多窝幼仔,最初可获得的基因型分析数据表明存在19个WT、34个杂合子和13个纯合子。
实例4-huADAR1 p110在转基因小鼠中的体内表达。
如实例3中所述,分别为huADAR1 p110和huADAR1 p150建立了稳定的huADAR1表达。然后对动物进行进一步分析以确认huADAR1表达。
使用本领域已知的方法对杂合huADAR1 p110动物和WT C57BL/6J小鼠进行安乐死和组织采集。使用本领域已知的标准方法纯化蛋白质样品。同时,原代人肝细胞(吉布科公司(Gibco)被繁殖和收获用于蛋白质样品。在纯化和浓度归一化之后,使用蛋白质印迹分析蛋白质样品,其中GAPDH作为上样对照(参见图20A)。在huADAR1p110杂合转基因小鼠中观察到与人肝细胞中观察到的水平可比较的稳健huADAR1 p110表达,而对照C57BL/6J小鼠未显示huADAR1表达。这些结果表明huADAR1 p110在杂合转基因动物中被稳健地转录和翻译并稳定表达。
使用本领域已知的方法对杂合huADAR1 p110动物和WT C57BL/6J小鼠进行安乐死和CNS组织采集。使用本领域已知的标准方法纯化蛋白质样品。平行地,诱导的神经元(诱导神经元)(可从BrainXell公司商购)被繁殖和收获用于蛋白质样品。在纯化和浓度归一化之后,使用蛋白质印迹分析蛋白质样品,其中GAPDH作为上样对照(参见图20B)。在huADAR1p110杂合转基因小鼠的小脑、脑桥/延髓、皮质和中脑中观察到与人诱导神经元中观察到的水平可比较的稳健huADAR1 p110表达。这些结果表明huADAR1 p110在杂合转基因动物中被稳健地转录和翻译并稳定表达。
使用本领域已知的方法对杂合huADAR1 p110动物和WT C57BL/6J小鼠进行安乐死和肺组织采集。使用本领域已知的标准方法纯化蛋白质样品。在纯化和浓度归一化之后,使用蛋白质印迹分析蛋白质样品,其中GAPDH作为上样对照(参见图21)。与未显示肺特异性huADAR1表达的对照C57BL/6J小鼠相比,在huADAR1 p110杂合转基因小鼠肺样品中观察到稳健的huADAR1 p110表达。这些结果表明huADAR1 p110在杂合转基因动物中被稳健地转录和翻译并稳定表达。
使用本领域已知的方法对杂合和/或纯合huADAR1 p150动物和WT C57BL/6J小鼠进行安乐死和组织采集。使用本领域已知的标准方法纯化蛋白质样品。平行地,诱导的神经元(诱导神经元)(可从BrainXell公司商购)被繁殖和收获用于蛋白质样品。在纯化和浓度归一化后,使用具有合适上样对照(例如,GAPDH)的蛋白质印迹分析蛋白质样品。评估HuADAR1 p150表达。
实例5-UGP2在huADAR转基因小鼠中的体内编辑。
除其他外,所提供的技术,例如,非人动物被工程化为包含或表达ADAR1多肽或其特征性部分,对于评估腺苷编辑剂特别有用。
在一些实施例中,将靶向UDP-葡萄糖焦磷酸化酶2(UGP2)的寡核苷酸组合物(见表1)或对照媒剂通过以皮下递送PBS中10mg/kg的寡核苷酸的三个剂量方案(例如,第0天、第2天和第4天)引入到huADAR1 p110小鼠和对照WT小鼠中,在第6天处死小鼠用于立即活检。从huADAR p110动物和对照动物中收获肝样品;然后从肝中收集总RNA。如本领域技术人员所理解的,可以根据本披露利用各种技术,例如,SV 96总RNA分离系统方案(普洛麦格公司(Promega):Z3505)。使用具有随机六聚体引物的高容量cDNA逆转录试剂盒(生命技术公司(Life Technologies),目录号4388950)的RT-PCR用于生成cDNA文库。使用Phusion高保真DNA聚合酶方案(赛默公司(Thermo):F-530XL),使用位于内源表达的靶RNA的编辑位点的侧翼的引物(参见表4)来扩增目的cDNA种类。对PCR产物进行桑格测序,并使用EditR程序计算ADAR介导的编辑的百分比。与WT动物相比,huADAR p110动物中UGP2的体内编辑水平更高(参见图22)。
表4-用于量化位点特异性寡核苷酸介导的RNA编辑水平的示例性引物
Figure BDA0004094631750002541
实例6-EEF1A1在huADAR转基因小鼠中的体内编辑。
除其他外,所提供的技术,例如,非人动物被工程化为包含或表达ADAR1多肽或其特征性部分,对于评估腺苷编辑剂特别有用。
在一些实施例中,将靶向真核翻译延伸因子1α1(EEF1A1)的寡核苷酸组合物(见表1)或对照媒剂通过以皮下递送PBS中10mg/kg的寡核苷酸的三个剂量方案(例如,第0天、第2天和第4天)引入到huADAR1 p110小鼠和对照WT小鼠中,在第6天处死小鼠用于立即活检。从huADAR p110动物和对照动物中收获肝样品;然后从肝中收集总RNA。如本领域技术人员所理解的,可以根据本披露利用各种技术,例如,SV 96总RNA分离系统方案(普洛麦格公司(Promega):Z3505)。使用具有随机六聚体引物的高容量cDNA逆转录试剂盒(生命技术公司(Life Technologies),目录号4388950)的RT-PCR用于生成cDNA文库。使用Phusion高保真DNA聚合酶方案(赛默公司(Thermo):F-530XL),使用位于内源表达的靶RNA的编辑位点的侧翼的引物(参见表4)来扩增目的cDNA种类。对PCR产物进行桑格测序,并使用EditR程序计算ADAR介导的编辑的百分比。与WT动物相比,huADAR p110动物中EEF1A1的体内编辑水平更高(参见图23)。
实例7-UGP2和EEF1A1在衍生自huADAR转基因小鼠的原代肝细胞中通过裸式和/或GalNAc介导的寡核苷酸摄取进行的体外编辑。
除其他外,所提供的技术,例如,非人动物、细胞和组织被工程化为包含或表达ADAR1多肽或其特征性部分,对于评估腺苷编辑剂特别有用。在某些实施例中,从huADAR1转基因动物收获原代细胞并用于评估RNA编辑。
在一些实施例中,在衍生自huADAR1 p110动物的原代小鼠肝细胞中评估寡核苷酸组合物。同时作为对照,原代小鼠肝细胞从WT C57BL/6J小鼠中分离出来,并培养人肝细胞系。靶向UGP2或EEF1A1 mRNA(见表1)的寡核苷酸组合物在裸式自由摄取条件下被递送到分离的肝细胞中。48小时后,使用合适的技术(例如SV 96总RNA分离系统方案(普洛麦格公司:Z3505))收集总RNA。使用具有随机六聚体引物的高容量cDNA逆转录试剂盒(生命技术公司(Life Technologies),目录号4388950)的RT-PCR用于生成cDNA文库。使用Phusion高保真DNA聚合酶方案(赛默公司(Thermo):F-530XL),使用位于内源表达的靶RNA的编辑位点的侧翼的引物(参见表4)来扩增目的cDNA种类。对PCR产物进行桑格测序,并使用EditR程序计算ADAR介导的编辑的百分比(参见图24)。从huADAR p110动物分离的原代肝细胞中的编辑水平高于在从WT小鼠分离的原代肝细胞中观察到的水平,并且与在人细胞中观察到的水平相比于与在WT小鼠中观察到的水平更相似。
在一些实施例中,在衍生自huADAR1 p110动物的原代小鼠肝细胞中评估寡核苷酸和组合物。同时作为对照,原代小鼠肝细胞从WT C57BL/6J小鼠中分离出来,并培养人肝细胞系。靶向UGP2或EEF1A1 mRNA的GalNac缀合寡核苷酸(见表1)被递送以摄取到分离的肝细胞中。48小时后,使用SV 96总RNA分离系统方案(普洛麦格公司:Z3505)收集总RNA。使用具有随机六聚体引物的高容量cDNA逆转录试剂盒(生命技术公司(Life Technologies),目录号4388950)的RT-PCR用于生成cDNA文库。使用Phusion高保真DNA聚合酶方案(赛默公司(Thermo):F-530XL),使用位于内源表达的靶RNA的编辑位点的侧翼的引物(参见表4)来扩增目的cDNA种类。对PCR产物进行桑格测序,并使用EditR程序计算ADAR介导的编辑的百分比(参见图25和图26)。从huADAR p110动物分离的原代肝细胞中的编辑水平高于在从WT小鼠分离的原代肝细胞中观察到的水平,并且与在人细胞中观察到的水平相比于与在WT小鼠中观察到的水平更相似(参见图25和图26)。
在一些实施例中,在衍生自huADAR1 p150动物的原代小鼠肝细胞中评估寡核苷酸和组合物。同时作为对照,原代小鼠肝细胞从WT C57BL/6J小鼠中分离出来,并培养人肝细胞系。靶向UGP2或EEF1A1 mRNA(见表1)的寡核苷酸在裸式自由摄取条件下被递送到分离的肝细胞中。48小时后,使用SV 96总RNA分离系统方案(普洛麦格公司:Z3505)收集总RNA。使用具有随机六聚体引物的高容量cDNA逆转录试剂盒(生命技术公司(Life Technologies),目录号4388950)的RT-PCR用于生成cDNA文库。使用Phusion高保真DNA聚合酶方案(赛默公司(Thermo):F-530XL),使用位于内源表达的靶RNA的编辑位点的侧翼的引物(参见表4)来扩增目的cDNA种类。对PCR产物进行桑格测序,并使用EditR程序计算ADAR介导的编辑的百分比。从huADAR p150动物分离的原代肝细胞中的编辑水平高于在从WT小鼠分离的原代肝细胞中观察到的水平,并且与在人细胞中观察到的水平相比于与在WT小鼠中观察到的水平更相似。
在一些实施例中,在衍生自huADAR1 p150动物的原代小鼠肝细胞中评估寡核苷酸和组合物。同时作为对照,原代小鼠肝细胞从WT C57BL/6J小鼠中分离出来,并培养人肝细胞系。靶向UGP2或EEF1A1 mRNA的GalNac缀合寡核苷酸(见表1)被递送以摄取到分离的肝细胞中。48小时后,使用SV 96总RNA分离系统方案(普洛麦格公司:Z3505)收集总RNA。使用具有随机六聚体引物的高容量cDNA逆转录试剂盒(生命技术公司(Life Technologies),目录号4388950)的RT-PCR用于生成cDNA文库。使用Phusion高保真DNA聚合酶方案(赛默公司(Thermo):F-530XL),使用位于内源表达的靶RNA的编辑位点的侧翼的引物(参见表4)来扩增目的cDNA种类。对PCR产物进行桑格测序,并使用EditR程序计算ADAR介导的编辑的百分比。从huADAR p150动物分离的原代肝细胞中的编辑水平高于在从WT小鼠分离的原代肝细胞中观察到的水平,并且与在人细胞中观察到的水平相比于与在WT小鼠中观察到的水平更相似。
实例8-UGP2在huADAR转基因小鼠中的体内编辑。
除其他外,所提供的技术,例如,非人动物被工程化为包含或表达ADAR1多肽或其特征性部分,对于评估腺苷编辑剂特别有用。在某些实施例中,将编辑剂施用于工程化的huADAR1小鼠,并收获特定组织(例如,CNS相关组织)用于编辑分析。
在一些实施例中,通过单次脑室内(ICV)注射100μg寡核苷酸或两次ICV注射(第0天和第2天)各50μg(总计100μg),将靶向UDP-葡萄糖焦磷酸化酶2(UGP2)的寡核苷酸组合物或对照媒剂引入huADAR1 p110小鼠。在第6天处死小鼠用于立即活检。CNS样品是从huADARp110动物身上采集的;通过已知的空间/功能描述(例如,皮层、海马、纹状体、脑干、小脑和脊髓)进一步划分样品,然后使用合适的技术从每个样品中收集总RNA(例如,SV 96总RNA分离系统方案(普洛麦格公司:Z3505))。使用具有随机六聚体引物的高容量cDNA逆转录试剂盒(生命技术公司(Life Technologies),目录号4388950)的RT-PCR用于生成cDNA文库。使用Phusion高保真DNA聚合酶方案(赛默公司(Thermo):F-530XL),使用位于内源表达的靶RNA的编辑位点的侧翼的引物(参见表4)来扩增目的cDNA种类。对PCR产物进行桑格测序,并使用EditR程序计算ADAR介导的编辑的百分比。观察到不同水平的体内编辑。在人诱导神经元和/或诱导星形胶质细胞中也观察到编辑活性(裸式寡核苷酸摄取,在第6天测量)(参见图27)。
实例9-SRSF1在huADAR转基因小鼠中的体内编辑。
除其他外,所提供的技术,例如,非人动物被工程化为包含或表达ADAR1多肽或其特征性部分,对于评估腺苷编辑剂特别有用。在某些实施例中,从huADAR1转基因动物收获特定组织(例如,CNS相关组织)并评估寡核苷酸组合物进行的编辑。
在一些实施例中,通过单次脑室内(ICV)注射100ug寡核苷酸或两次ICV注射(第0天和第2天)50ug,将靶向富含丝氨酸和精氨酸的剪接因子1(SRSF1)的寡核苷酸组合物或对照媒剂引入huADAR1 p110小鼠。在第6天处死小鼠用于立即活检。CNS样品是从huADAR p110动物身上采集的;通过已知的空间/功能描述(例如,皮层、海马、纹状体、脑干、小脑和脊髓)进一步划分样品,然后使用合适的技术从每个样品中收集总RNA(例如,SV 96总RNA分离系统方案(普洛麦格公司:Z3505))。使用具有随机六聚体引物的高容量cDNA逆转录试剂盒(生命技术公司(Life Technologies),目录号4388950)的RT-PCR用于生成cDNA文库。使用Phusion高保真DNA聚合酶方案(赛默公司(Thermo):F-530XL),使用位于内源表达的靶RNA的编辑位点的侧翼的引物(有关引物信息,请参见表4)来扩增目的cDNA种类。对PCR产物进行桑格测序,并使用EditR程序计算ADAR介导的编辑的百分比。观察到不同水平的体内编辑。在人诱导神经元和/或诱导星形胶质细胞中也观察到编辑活性(裸式寡核苷酸摄取,在第6天测量)(参见图28)。
实例10-SERPINA1-Pi*Z在huADAR转基因小鼠中的体内编辑。
如本文所述,经工程化为包含ADAR1多肽或其特征性部分,或以包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸的动物可以与各种动物(例如,各种病症、障碍或疾病的模型动物)杂交,以提供,除其他外,既包含与各种病症、障碍或疾病相关的特征性元件又包含ADAR1多肽或其特征性部分或其序列编码ADAR1多肽或其特征性部分的多核苷酸的动物模型。在一些实施例中,动物是包含SERPINA1-Pi*Z的模型动物。在一些实施例中,动物包含人SERPINA1的1024G>A(E342K)突变和其序列编码ADAR1多肽或其特征性部分的多核苷酸。除其他外,此类动物可用于评估用于编辑人SERPINA1的1024G>A(E342K)突变的各种药剂,例如寡核苷酸。除其他外,所提供的技术,例如,非人动物被工程化为包含或表达ADAR1多肽或其特征性部分,对于评估腺苷编辑剂特别有用。
在一些实施例中,本文所述的huADAR小鼠与另一只包含目的核苷酸序列(例如,与病症、障碍或疾病相关的突变)的小鼠杂交。在某些实施例中,根据本披露,使用本领域已知的体外受精进行这种杂交。在某些实施例中,此类小鼠包含人丝氨酸蛋白酶抑制剂家族A成员1(SERPINA1)多核苷酸序列或其特征性部分。在某些实施例中,此类小鼠是SERPINA1-Pi*Z小鼠,包含含有对应于1024G>A(E342K)突变的G至A突变的人SERPINA1基因。在一些实施例中,所得后代包含人SERPINA1-Pi*Z多核苷酸序列或其特征性部分(例如,包含突变(例如与病症、障碍或疾病相关的1024G>A)的部分)和huADAR1多核苷酸序列或其片段(见图29)。在一些实施例中,双转基因动物(例如,包含人ADAR1序列或其特征性部分和与病症、障碍或疾病相关的序列)也可以包含杂合、半合和/或纯合形式的另外背景突变或等位基因(这赋予它们人源化(即具有免疫缺陷表型)),这类基因型包括但不限于NOD.Cg-PrkdcscidIl2rgtm1Wjl/SzJ或NOD/ShiLtJ,替代性合适人源化小鼠品系是本领域已知的。在一些实施例中,包含其序列编码ADAR1多肽或其特征性部分的多核苷酸的小鼠与包含SERPINA1突变(例如,与病症、障碍或疾病(例如,α1-抗胰蛋白酶(A1AT)缺乏症)相关的1024G>A)的小鼠杂交。在一些实施例中,杂交的第二小鼠是杰克逊实验室货号:028842;NSG-PiZ(另见BorelF;Tang Q;Gernoux G;Greer C;Wang Z;Barzel A;Kay MA;Shultz LD;Greiner DL;FlotteTR;Brehm MA;Mueller C.2017.Survival Advantage of Both Human HepatocyteXenografts and Genome-Edited Hepatocytes for Treatment of alpha-1AntitrypsinDeficiency.[人肝细胞异种移植物和基因组编辑的肝细胞治疗α-1抗胰蛋白酶缺乏症的生存优势]Mol Ther[分子疗法]25(11):2477-2489PubMed:29032169MGI:J:243726,和Li S;Ling C;Zhong L;Li M;Su Q;He R;Tang Q;Greiner DL;Shultz LD;Brehm MA;Flotte TR;Mueller C;Srivastava A;Gao G.2015。Efficient and Targeted Transduction ofNonhuman Primate Liver With Systemically Delivered Optimized AAV3B Vectors.[用系统递送的优化AAV3B载体高效和靶向转导非人灵长类动物肝]Mol Ther[分子疗法]23(12):1867-76PubMed:26403887MGI:J:230567)。如本文所述,在一些实施例中,huADAR小鼠经工程化为包含和/或表达其序列编码人ADAR1 p110多肽或其特征性部分的多核苷酸。在一些实施例中,huADAR小鼠被工程化以包含和/或表达其序列编码人ADAR1 p150多肽或其特征性部分的多核苷酸。
在一些实施例中,本文所述的huADAR小鼠与另一只包含目的核苷酸序列的小鼠杂交。在一些实施例中,包含其序列编码ADAR1多肽的多核苷酸的小鼠与包含SERPINA1突变(例如,与病症、障碍或疾病(例如,α1-抗胰蛋白酶(A1AT)缺乏症)相关的1024G>A)的小鼠杂交。在一些实施例中,根据本披露,使用本领域已知的体外受精进行这种杂交。在一些实施例中,此类小鼠包含人丝氨酸蛋白酶抑制剂家族A成员1(SERPINA1)多核苷酸序列或其特征性部分。在一些实施例中,此类小鼠是SERPINA1-Pi*Z小鼠,包含含有对应于例如1024G>A(E342K)突变的G至A突变或与其相应的遗传特征的人SERPINA1基因。在一些实施例中,所得后代包含人SERPINA1-Pi*Z多核苷酸序列和huADAR1多核苷酸序列(例如,参见图29)。在一些实施例中,双转基因动物还包含杂合、半合和/或纯合(野生型或突变体)形式的另外背景突变或等位基因,这赋予它们人源化(例如,具有免疫缺陷表型)。在一些实施例中,此类基因型包括NOD.Cg-Prkdcscid Il2rgtm1Wjl/SzJ。
如本领域技术人员所理解的,根据本披露可以使用多种技术进行杂交繁育。在一些实施例中,技术是或包括IVF(例如,使用杂合或纯合huADAR小鼠的精子和来自另一小鼠的卵母细胞,或反之亦然)。在一些实施例中,技术是或包括自然繁育(例如,使用杂合或纯合huADAR小鼠的精子和来自另一小鼠的卵母细胞,或反之亦然)。
例如,在一些实施例中,利用来自huADAR雄性小鼠的杂合精子和来自NOD.Cg-Prkdcscid Il2rgtm1Wjl Tg(SERPINA1*E342K)#Slcw/SzJ(NSG-PiZ,货号028842)雌性小鼠的卵母细胞经由例如IVF生成Prkdcscid杂合/Il2rgtm1Wjl杂合/Tg(SERPINA1*E342K)#Slcw杂合/hADAR杂合雌性小鼠和Prkdcscid杂合/Il2rgtm1Wjl半合/Tg(SERPINA1*E342K)#Slcw杂合/hADAR杂合雄性小鼠。在一些实施例中,利用来自huADAR雄性小鼠的纯合精子和来自NOD.Cg-Prkdcscid Il2rgtm1Wjl Tg(SERPINA1*E342K)#Slcw/SzJ(NSG-PiZ,货号028842)雌性小鼠的卵母细胞经由例如IVF生成Prkdcscid杂合/Il2rgtm1Wjl杂合/Tg(SERPINA1*E342K)#Slcw杂合/hADAR杂合雌性小鼠和Prkdcscid杂合/Il2rgtm1Wjl半合/Tg(SERPINA1*E342K)#Slcw杂合/hADAR杂合雄性小鼠。在一些实施例中,利用来自品系“hADAR”雄性小鼠的纯合精子和来自NOD.Cg-Prkdcscid Il2rgtm1Wjl Tg(SERPINA1*E342K)#Slcw/SzJ(NSG-PiZ,货号028842)雌性小鼠的卵母细胞,并且使得到的小鼠与例如NOD/ShiLtJ(杰克逊实验室货号001976)小鼠杂交以建立一系列克隆。在一些实施例中,生成的小鼠是(假设Prkdcscid/Il2rgtm1Wjl/Tg(SERPINA1*E342K)#Slcw/hADAR基因顺序)HET HET HET HET、HET WILD HET HET、WILD HET HET HET、WILD WILD HET HET、HET HEMIHET HET、HET HEMI HET WILD、HET HET HET WILD和/或WILD HEMI HET HET。本领域技术人员理解,雄性或雌性配子可以从任一品系中提供,例如在一些实施例中卵母细胞可以从huADAR品系提供,而精子可以从其他基因型提供,例如NOD.Cg-Prkdcscid Il2rgtm1Wjl Tg(SERPINA1*E342K)#Slcw/SzJ(NSG-PiZ,货号028842)。在一些实施例中,huADAR(或hADAR)小鼠被工程化以包含和/或表达其序列编码ADAR1多肽或其特征性部分的多核苷酸。在一些实施例中,动物在其基因组中包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。在一些实施例中,动物在其种系基因组中包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。在一些实施例中,ADAR1多肽是人ADAR1。在一些实施例中,人ADAR1是人ADAR1p110。在一些实施例中,人ADAR1是人ADAR1 p150。例如,使用本文所述的一种或多种方案(例如,使用杂合的hADAR1精子和IVF)生成了许多包含人ADAR1 p110和人SERPINA1中的1024G>A(E342K)突变的动物。如本领域技术人员所理解的,在一些实施例中,可以进一步繁育产生的动物以产生具有所期望基因型的动物,例如,杂合、半合或纯合小鼠。如本领域技术人员所理解的,在一些实施例中,包含一个或多个基因座(例如,Prkdcscid、Il2rgtm1Wjl、Tg(SERPINA1*E342K)#Slcw和/或hADAR)的纯合野生型等位基因的动物可以提供适当的相对对照。
在一些实施例中,使用IVF,将来自huADAR雄性小鼠的杂合精子和来自NOD.Cg-Prkdcscid Il2rgtm1Wjl Tg(SERPINA1*E342K)#Slcw/SzJ(NSG-PiZ,货号028842)雌性小鼠的卵母细胞进行杂交以生成Prkdcscid杂合/Il2rgtm1Wjl杂合/Tg(SERPINA1*E342K)#Slcw杂合/hADAR杂合雌性小鼠和Prkdcscid杂合/Il2rgtm1Wjl半合/Tg(SERPINA1*E342K)#Slcw杂合/hADAR杂合雄性小鼠。此外,产生的幼仔具有基因型(假设Prkdcscid/Il2rgtm1Wjl/Tg(SERPINA1*E342K)#Slcw/hADAR基因顺序)HET HET HET HET、HET WILD HET HET、WILD HETHET HET、WILD WILD HET HET、HET HEMI HET HET、HET HEMI HET WILD、HET HET HET WILD和/或WILD HEMI HET HET。使用本文所述的一种或多种方案(例如,使用杂合的hADAR1精子和IVF)生成了许多包含人ADAR1 p110和人SERPINA1中的1024G>A(E342K)突变的动物。在一些实施例中,包含一个或多个基因座(例如,Prkdcscid、Il2rgtm1Wjl、Tg(SERPINA1*E342K)#Slcw和/或hADAR)的纯合野生型等位基因的动物可以作为适当的相对对照。
在一些实施例中,使用提供的技术评估药剂及其组合物,例如靶向SERPINA1例如SERPINA1-Pi*Z中的突变的寡核苷酸组合物。例如,在一些实施例中,将寡核苷酸组合物或对照组合物通过剂量方案(例如,在第0天、第2天和第4天的三剂量方案)皮下递送合适的量(例如PBS中的10mg/kg寡核苷酸)而引入双转基因SERPINA1-Pi*Z/huADAR1 p110小鼠,以及任选的转基因SERPINA1-Pi*Z小鼠和/或对照WT小鼠,在一段时间后,例如,在第6天,小鼠被处死用于立即活检。从双转基因SERPINA1-Pi*Z/huADAR1动物、转基因SERPINA1-Pi*Z动物和对照WT动物中收获肝样品;然后从肝中收集总RNA。如本领域技术人员所理解的,可以根据本披露利用各种技术,例如,SV 96总RNA分离系统方案(普洛麦格公司(Promega):Z3505)。例如使用具有随机六聚体引物的高容量cDNA逆转录试剂盒(生命技术公司(LifeTechnologies),目录号4388950)的RT-PCR用于生成cDNA文库。使用例如Phusion高保真DNA聚合酶方案(赛默公司(Thermo):F-530XL),使用位于SERPINA1-Pi*Z靶RNA的编辑位点的侧翼的引物来扩增目的cDNA种类。对PCR产物进行桑格测序,并使用例如EditR程序计算ADAR介导的编辑的百分比。本领域技术人员理解,也可以根据本披露使用各种其他测序技术。等位基因特异性PCR、qPCR或ARMS测定也可用于评估编辑。在一些实施例中,与转基因SERPINA1-Pi*Z动物或WT动物相比,在双转基因SERPINA1-Pi*Z/huADAR动物中观察到SERPINA1-Pi*Z mRNA的不同体内编辑水平。在一些实施例中,可以用双转基因动物而不使用转基因SERPINA1-Pi*Z动物不使用hADAR1或WT动物进行评估。在一些实施例中,与对照组合物相比,寡核苷酸组合物提供更高的编辑水平。在一些实施例中,对照组合物是对照媒剂。在一些实施例中,对照组合物包含与待评估的寡核苷酸组合物相比不同的寡核苷酸。在一些实施例中,对照组合物是立体无规组合物。在一些实施例中,待评估的寡核苷酸组合物是手性受控的寡核苷酸组合物。
使用提供的技术评估多种寡核苷酸药剂及其组合物,例如靶向SERPINA1例如SERPINA1-Pi*Z中的突变的寡核苷酸组合物。在一些实施例中,测试原代肝细胞衍生自Prkdcscid杂合/Il2rgtm1Wjl杂合/Tg(SERPINA1*E342K)#Slcw杂合/hADAR杂合雌性小鼠和Prkdcscid杂合/Il2rgtm1Wjl半合/Tg(SERPINA1*E342K)#Slcw杂合/hADAR杂合雄性小鼠。在一些实施例中,对照原代肝细胞衍生自Prkdcscid杂合/Il2rgtm1Wjl杂合/Tg(SERPINA1*E342K)#Slcw杂合/hADAR野生型雌性小鼠和Prkdcscid杂合/Il2rgtm1Wjl半合/Tg(SERPINA1*E342K)#Slcw杂合/hADAR野生型雄性小鼠。在一些实施例中,将不同浓度的寡核苷酸组合物(例如,0.3uM或3uM)或对照组合物引入衍生自双转基因SERPINA1-Pi*Z/huADAR1 p110小鼠的用以进行裸式摄取的原代肝细胞。根据本披露,可以使用各种技术分析RNA编辑事件。在一些实施例中,使用了SV 96总RNA分离系统方案(普洛麦格公司:Z3505)。在一些实施例中,例如使用具有随机六聚体引物的高容量cDNA逆转录试剂盒(生命技术公司(Life Technologies),目录号4388950)的RT-PCR用于生成cDNA文库。在一些实施例中,使用Phusion高保真DNA聚合酶方案(赛默公司(Thermo):F-530XL),使用位于SERPINA1-Pi*Z靶RNA的编辑位点的侧翼的引物来扩增目的cDNA种类。在一些实施例中,对PCR产物进行桑格测序并计算ADAR介导的编辑的百分比。与对照组合物和/或具有较低浓度的测试寡核苷酸的组合物相比,各种寡核苷酸组合物提供了更高的编辑水平。
在一些实施例中,对样品(例如,来自用药剂或其组合物(例如,寡核苷酸组合物)和/或对照组合物处理的动物的血清、血液、肝等;例如,见上文)中的A1AT蛋白浓度进行了分析。如本领域技术人员所理解的,可以根据本披露利用各种技术,例如蛋白质浓度可以通过Elisa测定来定量。A1AT蛋白质浓度可以使用A1AT ELISA(例如Abcam-ab108799)按照制造商的说明进行计算。简而言之,生成标准品,例如,使用稀释至合适浓度的重组A1AT蛋白,例如,在合适的稀释剂中为25ng/mL,并以合适的倍数例如2倍连续稀释多个点,例如7个点。从肝样品中收获蛋白质样品。将制备的标准品和稀释的蛋白质样品添加到包被并封闭的96孔板的SERPINA1抗体孔中,并在室温下孵育2小时。用提供的ELISA洗涤缓冲液洗涤板,例如6次(300ul/孔),然后将生物素化的SERPINA1抗体在合适的稀释剂中稀释至1X,并添加到每个孔中合适的时间长度,例如,在室温下1小时。洗涤孔,将在合适的稀释剂中稀释至1X的链霉亲和素-过氧化物酶复合物添加到每个孔中,持续合适的时间段,例如,在室温下30分钟。在将3,3',5,5'-四甲基联苯胺(TMB)添加到每个孔之前最后一次清洗孔,并将板显影一段合适的时间,例如20分钟,之后添加终止溶液。然后在450nm和570nm读取板。从450nm的读数中减去570nm的读数以说明光学不完整性,并对板进行量化。在一些实施例中,与转基因SERPINA1-Pi*Z动物或WT动物相比,双转基因SERPINA1-Pi*Z/huADAR动物中的SERPINA1-Pi*Z蛋白水平更高。在一些实施例中,可以用双转基因动物而不使用转基因SERPINA1-Pi*Z动物不使用hADAR1或WT动物进行评估。在一些实施例中,与对照组合物相比,寡核苷酸组合物提供更高的编辑水平和/或更高水平的A1AT蛋白和/或活性。在一些实施例中,与对照组合物相比,寡核苷酸组合物提供更高水平/活性的A1AT。在一些实施例中,与对照组合物相比,寡核苷酸组合物提供更高水平的正确折叠的和/或分泌的A1AT蛋白和/或活性。在一些实施例中,与对照组合物相比,寡核苷酸组合物提供更高水平的A1AT蛋白和/或活性。如本领域技术人员所理解的,水平、特性和/或活性,包括序列,也可以使用其他技术例如质谱法来评估。在一些实施例中,基于LC-MS的蛋白质组学技术用于定量A1AT蛋白(例如,野生型和/或突变蛋白(例如,由经编辑或未经编辑的RNA编码))。在一些实施例中,对生物样品(例如,来自用药剂或其组合物(例如,寡核苷酸组合物)和/或对照组合物处理的动物;例如,见上文)中的A1AT蛋白进行了分析。例如,在一些实施例中,分析生物样品中的A1AT蛋白,所述生物样品例如是来自用RNA编辑修饰剂处理的动物(例如,来自用本文所述的药剂或组合物(例如,寡核苷酸组合物)和/或对照组合物处理的本文所述的动物;例如,参见上文)的至少一种组织(例如,肝、肾、肌肉和/或心脏等)或生物流体(例如,血清和/或血液等)。在一些实施例中,评估了血清或血液中A1AT蛋白的水平、特性和/或活性。
在一些实施例中,对照组合物是对照媒剂。在一些实施例中,对照组合物包含与待评估的寡核苷酸组合物相比不同的寡核苷酸。在一些实施例中,对照组合物是立体无规组合物。在一些实施例中,待评估的寡核苷酸组合物是手性受控的寡核苷酸组合物。
等效物
虽然本文中已描述且展示了多种实施例,但本领域普通技术人员将容易想到,用于执行本披露中所描述的功能和/或获得本披露中所描述的结果和/或一个或多个优势的多种其他方法和/或结构,并且此类变化和/或修改中的每一者均被视为包括在内。更一般而言,本领域普通技术人员将容易理解,本文所述的所有参数、尺寸、材料、构型等意指实例,并且实际参数、尺寸、材料和/或构型等将取决于使用本披露的传授内容的一个或多个特定应用。本领域技术人员将认识到,或能够仅使用常规实验就确定本披露中所述的特定实施例的许多等效物。因此,应当理解,上述实施例仅通过实例方式呈现,并且在所附权利要求书及其等效物的范围内,所要求的技术可以按照具体描述和要求以外的方式实施。另外,如果特征、系统、物品、材料、试剂盒和/或方法等不是相互矛盾的,则在本披露的范围内包括两个或更多个此类特征、系统、物品、材料、试剂盒和/或方法等的任何组合。

Claims (102)

1.一种经工程化为包含人ADAR1多肽或其特征性部分的非人动物,一种经工程化为包含和/或表达多核苷酸的非人动物,该多核苷酸的序列编码人ADAR1多肽或其特征性部分。
2.一种经工程化为包含ADAR1多肽或其特征性部分的非人动物,或一种经工程化为包含和/或表达多核苷酸的非人动物,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
3.如前述权利要求中任一项所述的动物,其中该动物的基因组包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
4.如前述权利要求中任一项所述的动物,其中该动物的种系基因组包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
5.如前述权利要求中任一项所述的动物,其中该动物经工程化为表达ADAR1多肽或其特征性部分。
6.如前述权利要求中任一项所述的动物,其中该ADAR1多肽或其特征性部分的表达在一个或多个细胞和/或组织中是可诱导的。
7.如前述权利要求中任一项所述的动物,其中该ADAR1多肽或其特征性部分的表达在一个或多个细胞和/或组织中是组成型的。
8.如前述权利要求中任一项所述的动物,其中该ADAR1多肽或其特征性部分的表达是组织特异性的。
9.如前述权利要求中任一项所述的动物,其中该动物是啮齿类动物。
10.如前述权利要求中任一项所述的动物,其中该动物是小鼠。
11.如前述权利要求中任一项所述的动物,其中该动物是大鼠。
12.如前述权利要求中任一项所述的动物,其中该ADAR1多肽或其特征性部分是或包含脱氨酶结构域。
13.如前述权利要求中任一项所述的动物,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)dsRBD。
14.如前述权利要求中任一项所述的动物,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如,1、2、3或更多个)Z-DNA结合结构域。
15.如前述权利要求中任一项所述的动物,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其片段的氨基酸序列、灵长类动物ADAR1多肽或其特征性部分的氨基酸序列,和/或灵长类动物ADAR1多肽的氨基酸序列,或该ADAR1多肽或其特征性部分的氨基酸序列是灵长类动物ADAR1多肽的氨基酸序列。
16.如权利要求2-15中任一项所述的动物,其中该ADAR1多肽或其特征性部分是灵长类动物ADAR1多肽。
17.如权利要求2-16中任一项所述的动物,其中该灵长类动物ADAR1多肽是人ADAR1多肽。
18.如前述权利要求中任一项所述的动物,其中该灵长类动物ADAR1多肽是人ADAR1的p110同种型。
19.如权利要求1-17中任一项所述的动物,其中该灵长类动物ADAR1多肽是人ADAR1的p150同种型。
20.如前述权利要求中任一项所述的动物,其中该ADAR1多肽或其特征性部分,当与靶向靶腺苷的寡核苷酸组合物接触时,在该工程化的动物的一个或多个细胞或组织中提供与在参考动物的相应细胞或组织中观察到的水平(“参考编辑水平”)相比增加的该靶腺苷的编辑水平(“工程化的编辑水平”),其中该参考动物未经工程化为表达该ADAR1多肽或其特征性部分。
21.如权利要求20所述的动物,其中该寡核苷酸组合物是WV-38700、WV-38702或WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷,和/或其中该寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷,和/或其中该寡核苷酸组合物是WV-38697或WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
22.如前述权利要求中任一项所述的动物,其中该一个或多个细胞或组织是肝组织,或其中该一个或多个细胞或组织是小鼠肝细胞。
23.如前述权利要求中任一项所述的动物,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
24.如前述权利要求中任一项所述的动物,其中该动物是杂合的。
25.如权利要求1-24中任一项所述的动物,其中该动物是纯合的。
26.一种经工程化为包含ADAR1多肽或其特征性部分的非人胚胎,或一种经工程化为包含和/或表达多核苷酸的非人胚胎,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
27.如前述权利要求中任一项所述的胚胎,其中该胚胎的基因组包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分,和/或其中该胚胎经工程化为表达ADAR1多肽或其特征性部分,和/或其中该ADAR1多肽或其特征性部分是或包含脱氨酶结构域,和/或其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如1、2、3或更多个)dsRBD,和/或一个或多个(例如1、2、3或更多个)Z-DNA结合结构域。
28.如前述权利要求中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其片段的氨基酸序列,任选地其中该灵长类动物ADAR1多肽是人ADAR1多肽,或其中该灵长类动物ADAR1多肽是人ADAR1的p110同种型,或者是人ADAR1的p150同种型。
29.如前述权利要求中任一项所述的胚胎,其中该ADAR1多肽或其特征性部分,当与靶向靶腺苷的寡核苷酸组合物接触时,在一个或多个经工程化为表达该ADAR1多肽或其特征性部分的细胞和/或组织中提供与在未经工程化为表达该ADAR1多肽或其特征性部分的参考细胞或组织中观察到的水平相比增加的该靶腺苷的编辑水平(“工程化的编辑水平”),任选地其中该寡核苷酸组合物是WV-38700、WV-38702或WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷,和/或其中该寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷,并且其中该寡核苷酸组合物是WV-38697或WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷,并且任选地其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
30.如前述权利要求中任一项所述的胚胎,其中该胚胎是杂合的。
31.如权利要求26-30中任一项所述的胚胎,其中该胚胎是纯合的。
32.一种经工程化为包含ADAR1多肽或其特征性部分的细胞,或一种经工程化为包含和/或表达多核苷酸的细胞,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
33.如前述权利要求中任一项所述的细胞,其中该细胞是非人细胞。
34.如前述权利要求中任一项所述的细胞,其中该细胞是胚胎干细胞。
35.如前述权利要求中任一项所述的细胞,其中该细胞的基因组包含多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
36.如前述权利要求中任一项所述的细胞,其中该ADAR1多肽或其特征性部分是或包含脱氨酶结构域。
37.如前述权利要求中任一项所述的细胞,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如1、2、3或更多个)dsRBD,和/或一个或多个(例如1、2、3或更多个)Z-DNA结合结构域。
38.如前述权利要求中任一项所述的细胞,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其片段的氨基酸序列。
39.如前述权利要求中任一项所述的细胞,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其特征性部分的氨基酸序列。
40.如前述权利要求中任一项所述的细胞,其中该灵长类动物ADAR1多肽是人ADAR1多肽。
41.如前述权利要求中任一项所述的细胞,其中该灵长类动物ADAR1多肽是人ADAR1的p110同种型,或者是人ADAR1的p150同种型。
42.如前述权利要求中任一项所述的细胞,其中该ADAR1多肽或其特征性部分,当与靶向靶腺苷的寡核苷酸组合物接触时,在一个或多个经工程化为表达该ADAR1多肽或其特征性部分的细胞和/或组织中提供与在未经工程化为表达该ADAR1多肽或其特征性部分的参考细胞或组织中观察到的水平相比增加的该靶腺苷的编辑水平(“工程化的编辑水平”)。
43.如权利要求42所述的细胞,其中该寡核苷酸组合物是WV-38700、WV-38702或WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷,和/或其中该寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷,和/或其中该寡核苷酸组合物是WV-38697或WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
44.如前述权利要求中任一项所述的细胞,其中该一个或多个细胞或组织是肝组织。
45.如前述权利要求中任一项所述的细胞,其中该一个或多个细胞或组织是小鼠肝细胞。
46.如前述权利要求中任一项所述的细胞,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
47.如前述权利要求中任一项所述的细胞,其中该细胞是杂合的。
48.如权利要求32-46中任一项所述的细胞,其中该细胞是纯合的。
49.如前述权利要求中任一项所述的动物、胚胎或细胞,其中ADAR1多肽或其特征性部分的氨基酸序列是或包含以下序列,该序列与SEQ ID NO:27、28、29、30、31、32、33、34、35、36、37、38、39或40相同,差异不超过1-10(例如,1-8、1-5、1、2、3、4、5、6、7、8、9或10)个氨基酸,或具有约或至少约90%-100%(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)同源性,和/或其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQIDNO:27、28、29、30、31、32、33、34、35、36、37、38、39或40,和/或其中ADAR1多肽或其特征性部分的氨基酸序列是或包含SEQ IDNO:5、6、9、12、16、20、26、43、46、49、52或55,或其特征性部分。
50.如前述权利要求中任一项所述的动物、胚胎或细胞,其中该动物、胚胎或细胞包含与病症、障碍或疾病相关的G至A突变。
51.如前述权利要求中任一项所述的动物、胚胎或细胞,其中该动物、胚胎或细胞包含对应于人SERPINA1基因中的1024G>A(E342K)突变的G至A突变。
52.一种多核苷酸,其包含:
a)编码ADAR1多肽或其特征性部分的ADAR1多核苷酸,
b)ADAR1多核苷酸上游的5'同源臂,和
c)ADAR1多核苷酸下游的3'同源臂,
其中该5'和3'同源臂独立地包含分别对应于非人动物基因组中的5'和3'靶序列的核苷酸序列,其中该5'靶序列在该3'靶序列的上游。
53.如前述权利要求中任一项所述的多核苷酸,其中该ADAR1多核苷酸经密码子优化以在动物宿主细胞中表达ADAR1多肽或其特征性部分。
54.如权利要求53所述的多核苷酸,其中该动物是小鼠或大鼠。
55.如前述权利要求中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分是或包含脱氨酶结构域。
56.如前述权利要求中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分是或包含一个或多个(例如1、2、3或更多个)dsRBD,和/或一个或多个(例如1、2、3或更多个)Z-DNA结合结构域。
57.如前述权利要求中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分的氨基酸序列是或包含灵长类动物ADAR1多肽或其片段的氨基酸序列。
58.如前述权利要求中任一项所述的多核苷酸,其中该灵长类动物ADAR1多肽是人ADAR1多肽。
59.如前述权利要求中任一项所述的多核苷酸,其中该灵长类动物ADAR1多肽是人ADAR1的p110同种型,或者是人ADAR1的p150同种型。
60.如前述权利要求中任一项所述的多核苷酸,其中该ADAR1多肽或其特征性部分,当与靶向靶腺苷的寡核苷酸组合物接触时,在一个或多个经工程化为表达该ADAR1多肽或其特征性部分的细胞和/或组织中提供与在未经工程化为表达该ADAR1多肽或其特征性部分的参考细胞或组织中观察到的水平相比增加的该靶腺苷的编辑水平(“工程化的编辑水平”)。
61.如权利要求60所述的多核苷酸,其中该寡核苷酸组合物是WV-38700、WV-38702或WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷,和/或其中该寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷,和/或其中该寡核苷酸组合物是WV-38697或WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
62.如前述权利要求中任一项所述的多核苷酸,其中该多核苷酸具有或包含编码如前述权利要求中任一项所述的ADAR1多肽或其特征性部分的序列,和/或其中该多核苷酸的序列是或包含SEQ ID NO:2、3、4、7、8、10、11、13、14、15、17、18、19、21、22、23、24、25、41,42、44、45、47、48、50、51、53或54,或其特征性部分。
63.如前述权利要求中任一项所述的多核苷酸,其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍。
64.如前述权利要求中任一项所述的动物、胚胎或细胞,其包含和/或表达如前述权利要求中任一项所述的多核苷酸。
65.一种包含或表达编码ADAR1多肽或其特征性部分的ADAR1多核苷酸的载体,或一种包含和/或表达以下的载体:
a)编码ADAR1多肽或其特征性部分的ADAR1多核苷酸,
b)ADAR1多核苷酸上游的5'同源臂,和
c)ADAR1多核苷酸下游的3'同源臂,
其中该5'和3'同源臂独立地包含分别对应于非人动物基因组中的5'和3'靶序列的核苷酸序列,其中该5'靶序列在该3'靶序列的上游;或
一种载体,或如权利要求70所述的载体,其中该载体包含和/或表达如前述权利要求中任一项所述的多核苷酸。
66.一种细胞群,其包含多个如前述权利要求中任一项所述的细胞,其中每个细胞独立地是如前述权利要求中任一项所述的细胞。
67.一种方法,其包括将如前述权利要求中任一项所述的多核苷酸或载体引入细胞、胚胎或动物中。
68.如权利要求67所述的方法,其中该细胞、胚胎或动物在引入之前不包含或不表达ADAR1多核苷酸,或不表达灵长类动物或人ADAR1多核苷酸,和/或其中该细胞胚胎或动物是啮齿类动物,优选小鼠或大鼠。
69.一种制备非人动物的方法,该方法包括:
(a)将编码ADAR1多肽或其特征性部分的ADAR1多核苷酸引入非人动物的ES细胞的基因组中;以及
(b)使用步骤(a)中生成的ES细胞生成非人动物;或
一种制备非人动物的方法,该方法包括:
(a)将如前述权利要求中任一项所述的多核苷酸引入非人动物的ES细胞的基因组中;以及
(b)使用步骤(a)中生成的ES细胞生成非人动物;或
一种制备非人动物的方法,该方法包括:
(a)将编码ADAR1多肽或其特征性部分的ADAR1多核苷酸引入非人动物的受精卵的基因组中;以及
(b)使用步骤(a)中生成的受精卵生成非人动物;或
一种制备非人动物的方法,该方法包括:
(a)将如前述权利要求中任一项所述的多核苷酸引入非人动物的受精卵的基因组中;以及
(b)使用步骤(a)中生成的受精卵生成非人动物;或
一种制备非人动物的经遗传修饰的ES细胞的方法,该方法包括:
将编码ADAR1多肽或其特征性部分的ADAR1多核苷酸引入非人动物的ES细胞的基因组中;或
一种制备非人动物的经遗传修饰的ES细胞的方法,该方法包括:
将如前述权利要求中任一项所述的多核苷酸引入非人动物的ES细胞的基因组中;或
一种生成工程化的细胞的方法,该方法包括:
将编码ADAR1多肽或其特征性部分的ADAR1多核苷酸引入非人动物的细胞中;或
一种生成工程化的细胞的方法,该方法包括:
将如前述权利要求中任一项所述的多核苷酸引入非人动物的细胞中。
70.如前述权利要求中任一项所述的方法,其包括以下步骤:
将细胞的基因组与核酸酶接触以产生DNA断裂;以及
引入如前述权利要求中任一项所述的多核苷酸。
71.如权利要求70所述的方法,其中该核酸酶是CRISPR/Cas9,锌指核酸酶,或转录激活子样效应核酸酶。
72.一种用于产生动物、胚胎或细胞的方法,该方法包括向第一动物、胚胎或细胞引入多核苷酸,该多核苷酸的序列编码ADAR1多肽或其特征性部分。
73.如权利要求72所述的方法,其中该多核苷酸是如前述权利要求中任一项所述的多核苷酸。
74.一种用于生成动物、胚胎或细胞的方法,该方法包括将第一动物与第二动物交配,其中该第二动物是如前述权利要求中任一项所述的动物。
75.如权利要求72-74中任一项所述的方法,其中第一动物、胚胎或细胞是或包含与病症、障碍或疾病相关的细胞、组织或器官或病症、障碍或疾病的细胞、组织或器官。
76.一种用于生成动物、胚胎或细胞的方法,该方法包括将与病症、障碍或疾病相关的第一细胞、组织或器官或病症、障碍或疾病的第一细胞、组织或器官引入如前述权利要求中任一项所述的第二动物、胚胎或细胞。
77.一种评估用于腺苷编辑的药剂或其组合物的方法,该方法包括以下步骤:
向如前述权利要求中任一项所述的动物、胚胎或细胞施用药剂。
78.如权利要求77所述的方法,其中该药剂或其组合物是寡核苷酸组合物;和/或其中与未经工程化为表达该ADAR1多肽或其特征性部分的参考动物、胚胎或细胞中的水平(“参考编辑水平”)相比,该药剂或其组合物在该工程化的动物、胚胎或细胞中提供更高的编辑水平(“工程化的编辑水平”)。
79.一种方法,其包括在如前述权利要求中任一项所述的动物、胚胎或细胞中表达RNA,其中编辑该RNA的靶腺苷。
80.如权利要求79所述的方法,其包括向该动物、胚胎或细胞施用靶向该靶腺苷的寡核苷酸或其组合物。
81.如权利要求79-80中任一项所述的方法,其中与未经工程化为表达该ADAR1多肽或其特征性部分的参考动物、胚胎或细胞中的水平(“参考编辑水平”)相比,该靶向的腺苷以更高的水平(“工程化的编辑水平”)被编辑(例如其中该工程化的编辑水平是该参考编辑水平的约或至少约1.5、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100或更多倍)。
82.一种表征ADAR1多肽或其特征性部分的方法,该方法包括:
在动物的工程化的宿主细胞或动物中表达ADAR1多肽或其特征性部分;
评估ADAR1多肽或其特征性部分的表达水平,或转录物中靶腺苷的编辑水平。
83.如权利要求82所述的方法,其中该ADAR1多肽或其特征性部分是人ADAR1多肽或其特征性部分。
84.如权利要求82-83中任一项的方法,其中该动物是非人动物,或者其中该动物是啮齿类动物,或者其中该动物是小鼠或大鼠。
85.如权利要求82-84中任一项所述的方法,其包括评估该ADAR1多肽或其特征性部分的表达水平,和/或评估转录物中靶腺苷的编辑水平。
86.如权利要求85所述的方法,其包括向该宿主细胞或动物施用靶向该靶腺苷的寡核苷酸组合物。
87.如权利要求86所述的方法,其中该寡核苷酸组合物是WV-38700、WV-38702或WV-40590,并且该靶腺苷是该寡核苷酸组合物在人或小鼠UGP2转录物中靶向的腺苷,和/或其中该寡核苷酸组合物是WV-40592,并且该靶腺苷是该寡核苷酸组合物在人或小鼠SRSF1转录物中靶向的腺苷,和/或其中该寡核苷酸组合物是WV-38697或WV-38699,并且该靶腺苷是该寡核苷酸组合物在人或小鼠EEF1A1转录物中靶向的腺苷。
88.一种用于表征药剂或寡核苷酸或组合物的方法,该方法包括:
将该药剂或寡核苷酸或组合物施用于包含或表达ADAR1多肽或其特征性部分,或编码ADAR1多肽或其特征性部分的多核苷酸的细胞或其群体。
89.如权利要求88所述的方法,其中该细胞是如前述权利要求中任一项所述的细胞。
90.一种用于表征寡核苷酸或组合物的方法,该方法包括:
将该寡核苷酸或组合物施用于包含或表达ADAR1多肽或其特征性部分,或编码ADAR1多肽或其特征性部分的多核苷酸的非人动物或其群体。
91.如权利要求88所述的方法,其中该动物是如前述权利要求中任一项所述的动物。
92.如权利要求88-91中任一项所述的方法,其中与在工程化之前的细胞或工程化之前的动物的细胞或其群体中观察到的寡核苷酸或组合物的活性水平相比,从细胞或动物的细胞或其群体中观察到的寡核苷酸或组合物的活性水平与在可比较的人细胞或其群体中观察到的寡核苷酸或组合物的活性水平更相似,和/或其中可比较的人细胞与细胞或动物的细胞具有相同的类型。
93.一种方法,其包括:
评估细胞、组织或动物中的药剂或其组合物,其中该细胞、组织或动物是或包含与病症、障碍或疾病相关的细胞、组织或器官或病症、障碍或疾病的细胞、组织或器官,和/或包含与病症、障碍或疾病相关的核苷酸序列;以及
向易患或患有病症、障碍或疾病的受试者施用有效量的用于预防或治疗该病症、障碍或疾病的药剂或组合物;或
一种方法,其包括:
向易患或患有病症、障碍或疾病的受试者施用有效量的用于预防或治疗该病症、障碍或疾病的药剂或组合物,其中在细胞、组织或动物中评估该药剂或组合物,其中该细胞、组织或动物是或包含与病症、障碍或疾病相关的细胞、组织或器官或病症、障碍或疾病的细胞、组织或器官,和/或包含与病症、障碍或疾病相关的核苷酸序列。
94.如权利要求93所述的方法,其中该受试者是人,和/或其中病症、障碍或疾病与G至A突变相关,和/或其中病症、障碍或疾病与人SERPINA1基因中的1024G>A(E342K)突变相关,和/或其中病症、障碍或疾病是α-1抗胰蛋白酶缺乏症。
95.一种方法,其包括
将药剂或其组合物施用于细胞或其群体;以及
评估细胞或其群体中转录物中的腺苷的编辑;或
一种方法,其包括
将药剂或其组合物施用于动物或其群体;以及
评估该动物或其群体的一个或多个细胞或组织中转录物中的腺苷的编辑;或
一种方法,其包括
将寡核苷酸组合物施用于细胞或其群体;以及
评估细胞或其群体中转录物中的腺苷的编辑;或
一种方法,其包括
将寡核苷酸组合物施用于动物或其群体;以及
评估该动物或其群体的一个或多个细胞或组织中转录物中的腺苷的编辑。
96.如权利要求95所述的方法,其中该寡核苷酸组合物是手性受控的寡核苷酸组合物。
97.如权利要求95-96中任一项所述的方法,其中该细胞、动物或其群体是如前述权利要求中任一项所述。
98.如权利要求93-97中任一项所述的方法,其包括在评估步骤之后以商业规模获得药剂、其组合物或寡核苷酸组合物和/或用于对人施用和/或作为药物产品。
99.如权利要求93-98中任一项所述的方法,其包括:
将来自商业批次的样品或药剂、其组合物或寡核苷酸组合物的药物产品施用给细胞或动物或其群体,
评估该细胞、或该动物或其群体的一个或多个细胞或组织中转录物中的腺苷的编辑。
100.如权利要求99所述的方法,其中该腺苷的编辑处于与第一商业生产之前的非商业生产可比较的水平,和/或其中该腺苷的编辑处于与另一批次的商业生产或药物产品可比较的水平,和/或其中该腺苷的编辑处于与参考样品或药物产品可比较的水平,和/或其中该腺苷的编辑处于参考范围内的水平,和/或包括释放商业批次或药物产品用于交付、分配或施用。
101.如权利要求99所述的方法,其中该腺苷的编辑处于与第一商业生产之前的非商业生产不可比较的水平,和/或其中该腺苷的编辑处于与另一批次的商业生产或药物产品不可比较的水平,和/或其中该腺苷的编辑处于与参考样品或药物产品不可比较的水平,和/或其中该腺苷的编辑处于不在参考范围内的水平,和/或包括拒绝商业批次或药物产品用于交付、分配或施用。
102.如说明书或如实施例1-435中任一项所述的细胞、动物、胚胎、多核苷酸、载体、多肽或方法。
CN202180052720.0A 2020-08-24 2021-08-23 经工程化为表达adar1的细胞和非人动物及其用途 Pending CN115989041A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202063069698P 2020-08-24 2020-08-24
US63/069,698 2020-08-24
US202063111072P 2020-11-08 2020-11-08
US63/111,072 2020-11-08
US202163175031P 2021-04-14 2021-04-14
US63/175,031 2021-04-14
PCT/US2021/047205 WO2022046667A1 (en) 2020-08-24 2021-08-23 Cells and non-human animals engineered to express adar1 and uses thereof

Publications (1)

Publication Number Publication Date
CN115989041A true CN115989041A (zh) 2023-04-18

Family

ID=80353901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180052720.0A Pending CN115989041A (zh) 2020-08-24 2021-08-23 经工程化为表达adar1的细胞和非人动物及其用途

Country Status (4)

Country Link
US (1) US20230329201A1 (zh)
EP (1) EP4199957A1 (zh)
CN (1) CN115989041A (zh)
WO (1) WO2022046667A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110088113A (zh) 2016-11-23 2019-08-02 波涛生命科学有限公司 用于亚磷酰胺和寡核苷酸合成的组合物和方法
CN110997692A (zh) 2017-06-02 2020-04-10 波涛生命科学有限公司 寡核苷酸组合物及其使用方法
CN111051281A (zh) 2017-06-21 2020-04-21 波涛生命科学有限公司 用于合成的化合物、组合物和方法
WO2019032612A1 (en) 2017-08-08 2019-02-14 Wave Life Sciences Ltd. OLIGONUCLEOTIDE COMPOSITIONS AND ASSOCIATED METHODS
AU2018333065B2 (en) 2017-09-18 2024-04-18 Wave Life Sciences Ltd. Technologies for oligonucleotide preparation
WO2023196844A2 (en) * 2022-04-05 2023-10-12 Spotlight Therapeutics Adar specific guide rnas and uses thereof

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2019318079A1 (en) * 2018-08-07 2021-01-28 Massachusetts Institute Of Technology Novel Cas12b enzymes and systems
GB2590880A (en) * 2018-09-06 2021-07-07 Univ California RNA and DNA base editing via engineered ADAR recruitment

Also Published As

Publication number Publication date
WO2022046667A1 (en) 2022-03-03
US20230329201A1 (en) 2023-10-19
EP4199957A1 (en) 2023-06-28

Similar Documents

Publication Publication Date Title
US20230329201A1 (en) Cells and non-human animals engineered to express adar1 and uses thereof
US11234420B2 (en) Method for constructing PD-1 gene modified humanized animal model and use thereof
KR102294755B1 (ko) C9orf72 유전자좌에서 헥사뉴클레오티드 반복 확장을 갖는 비인간 동물
US11279948B2 (en) Genetically modified non-human animal with human or chimeric OX40
JP7386292B2 (ja) 操作されたイムノグロブリンラムダ軽鎖座位を有する非ヒト動物
US10945418B2 (en) Genetically modified non-human animal with human or chimeric PD-L1
WO2018041118A1 (en) Genetically modified non-human animal with human or chimeric pd-l1
AU2003218382B2 (en) Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
EP2864489B1 (en) Site-specific integration
CN108531487B (zh) 人源化sirpa基因改造动物模型的制备方法及应用
US20190373866A1 (en) Genetically Modified Non-Human Animal With Human Or Chimeric OX40
CN106163273B (zh) 具有人源化FC-γ受体的非人动物
KR20130097156A (ko) 트랜스제닉 동물 및 이의 사용 방법
CN111432635A (zh) 具有经工程改造的免疫球蛋白λ轻链的非人动物以及所述非人动物的用途
KR20220016880A (ko) 카파 유전자좌에서 발현된 제한적 람다 경쇄 레퍼토리를 갖는 비-인간 동물 및 이의 용도
CN113897369A (zh) KRT10定点基因敲入P2A-CrePR1-T2A-tdTomato小鼠模型的构建及应用
CN112626122B (zh) hKDR人源化小鼠模型及其建立方法和应用
CN113564145B (zh) 用于胞嘧啶碱基编辑的融合蛋白及其应用
JP5481661B2 (ja) 変異導入遺伝子作製方法
CN114134183A (zh) 一种siglec15基因人源化动物模型的构建方法及应用
CN115279184A (zh) B4galt1介导的功能的啮齿动物模型
Macdonald et al. Analysis of transcriptional regulatory regions in vivo
JP2005500835A (ja) Pervスクリーニング法およびその使用
EP2921048B1 (en) Sus scrofa v2g: a safe-harbor site for long-term expression and high integration rate of transgenes in pig
CN114410630B (zh) 一种tbc1d8b基因敲除小鼠动物模型的构建方法及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination