CN114008193A - Tdp-43蛋白病的建模 - Google Patents

Tdp-43蛋白病的建模 Download PDF

Info

Publication number
CN114008193A
CN114008193A CN202080045369.8A CN202080045369A CN114008193A CN 114008193 A CN114008193 A CN 114008193A CN 202080045369 A CN202080045369 A CN 202080045369A CN 114008193 A CN114008193 A CN 114008193A
Authority
CN
China
Prior art keywords
tdp
polypeptide
mutant
human animal
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080045369.8A
Other languages
English (en)
Inventor
阿尔蒂·夏尔马-康宁
大卫·弗伦杜威
布莱恩·扎姆布罗维兹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Regeneron Pharmaceuticals Inc
Original Assignee
Regeneron Pharmaceuticals Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Regeneron Pharmaceuticals Inc filed Critical Regeneron Pharmaceuticals Inc
Publication of CN114008193A publication Critical patent/CN114008193A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0603Embryonic cells ; Embryoid bodies
    • C12N5/0606Pluripotent embryonic cells, e.g. embryonic stem cells [ES]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0276Knock-out vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K49/00Preparations for testing in vivo
    • A61K49/0004Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
    • A61K49/0008Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4703Inhibitors; Suppressors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4707Muscular dystrophy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0603Embryonic cells ; Embryoid bodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0602Vertebrate cells
    • C12N5/0618Cells of the nervous system
    • C12N5/0619Neurons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5044Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
    • G01N33/5058Neurological cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5044Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics involving specific cell types
    • G01N33/5073Stem cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5008Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
    • G01N33/5082Supracellular entities, e.g. tissue, organisms
    • G01N33/5088Supracellular entities, e.g. tissue, organisms of vertebrates
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • G01N33/6896Neurological disorders, e.g. Alzheimer's disease
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • A01K2217/077Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out heterozygous knock out animals displaying phenotype
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • A01K2267/0318Animal model for neurodegenerative disease, e.g. non- Alzheimer's
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/8509Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
    • C12N2015/8527Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic for producing animal models, e.g. for tests or diseases
    • C12N2015/8536Animal models for genetic diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.
    • C12N2310/141MicroRNAs, miRNAs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/34Spatial arrangement of the modifications
    • C12N2310/341Gapmers, i.e. of the type ===---===
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2503/00Use of cells in diagnostics
    • C12N2503/02Drug screening
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2506/00Differentiation of animal cells from one lineage to another; Differentiation of pluripotent cells
    • C12N2506/02Differentiation of animal cells from one lineage to another; Differentiation of pluripotent cells from embryonic cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/30Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/28Neurological disorders
    • G01N2800/2835Movement disorders, e.g. Parkinson, Huntington, Tourette

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Medicinal Chemistry (AREA)
  • Hematology (AREA)
  • Toxicology (AREA)
  • Veterinary Medicine (AREA)
  • Environmental Sciences (AREA)
  • Plant Pathology (AREA)
  • Pathology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Neurology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Gynecology & Obstetrics (AREA)
  • Food Science & Technology (AREA)
  • Reproductive Health (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)

Abstract

本文所述的发现是,TDP‑43的核定位信号(NLS)和朊病毒样结构域(PLD)都不是体外胚胎干细胞培养和分化成运动神经元所必需的。ES细胞表达这些TDP‑43突变体并分化成表现出ALS样表型的运动神经元、由此TDP‑43突变体重新分布至并聚集在细胞质中、并且无法调控隐藏的外显子剪接的能力,使得这些细胞可充当TDP‑43蛋白病的模型,用于测试可消散此类蛋白病的候选治疗剂。另外,这些ES细胞可以用于成功产生非人动物,例如小鼠,它们也表现出ALS的标志性症状并且可用于测试可用于治疗TDP‑43蛋白病的候选剂。

Description

TDP-43蛋白病的建模
相关申请的交叉引用
本申请根据35U.S.C.§119(3)要求2019年6月27日提交的美国临时申请序列号62/867,785的权益,所述临时申请的公开内容特此以引用的方式整体并入。
对经由EFS WEB以文本文件提交的序列表的引用
以文件10312WO01_ST25.txt编写的序列表是35千字节,在2020年6月25日创建,并且特此以引用的方式并入。
技术领域
本文描述了评价TDP-43及其结构域、非人动物和非人动物细胞以及核酸的生物学作用的方法。还提供了包含此类非人动物、非人动物细胞或核酸的TDP-43蛋白病模型及其使用方法。
背景技术
肌萎缩性侧索硬化症(ALS)是一种破坏性的神经退行性疾病,其影响运动神经元,从而导致肢体瘫痪并最终因膈肌衰竭而死亡。在ALS患者组织的尸检中,一个几乎普遍的病理发现是TDP-43(反式激活应答DNA结合蛋白43kDa)在细胞质内含物中的积累。
TDP-43的特征在于具有核定位信号(NLS)结构域、两个RNA识别基序(RRM1和RRM2)、推定的核输出信号(NES)结构域和富含甘氨酸的朊病毒样结构域(PLD)。与核不均一核糖核蛋白(hnRNP)家族的成员类似,TDP-43是主要的核RNA结合蛋白,是所有哺乳动物细胞活力和动物正常发育所需要的。TDP-43从细胞核到细胞质的重新分布及其在不溶性聚集体中的积累是ALS疾病的两个关键诊断标志。
尽管TDP-43的细胞质积累与ALS相关联,但TDP-43的每个结构域与TDP-43的生物学功能之间的关系尚不清楚。
发明内容
本文提供了胚胎干(ES)细胞、由其培养的组织(例如原始外胚层、胚状体、运动神经元)和由其衍生而来的非人动物,它们表达缺乏功能性结构域的突变体TDP-43多肽并且可能表现出ALS样表型。还提供了组合物及其制备和使用方法。还提供了编码缺乏功能性结构域的突变体TDP-43多肽的突变TARDBP基因以及缺乏功能性结构域的突变体TDP-43多肽。还提供了示例性治疗性寡核苷酸,例如反义寡核苷酸,其能够恢复TARDBP表达的自身调节。
本文描述了非人动物(例如啮齿动物(例如大鼠或小鼠))和非人动物细胞(例如胚胎干(ES)细胞、胚状体、胚胎干细胞衍生的运动神经元(ESMN)等),其包含编码突变体TDP-43多肽的突变TARDBP基因,例如,其中突变TARDBP基因包含野生型TARDBP基因的核苷酸序列,所述核苷酸序列包含突变使得突变体TDP-43包含对应野生型TDP-43多肽的氨基酸序列,但有突变(例如,点突变、取代、替换、插入、缺失等中的一个或多个)。在一些实施方案中,野生型TARDBP基因包含SEQ ID NO:2(包括其简并变体)、SEQ ID NO:4(包括其简并变体)或SEQ ID NO:6(包括其简并变体)中所陈述的序列,其分别编码包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的氨基酸序列的野生型TDP-43多肽。
在一些实施方案中,编码突变体TDP-43多肽的突变TARDBP基因替换非人动物或非人动物细胞的内源性TARDBP基因座处的内源性TARDBP基因。在一些实施方案中,非人动物细胞或非人动物对于编码突变体TDP-43多肽的突变TARDBP基因是杂合的。例如,在一些实施方案中,除本文所述的突变TARDBP基因之外,非人动物或非人动物细胞还包含(a)野生型TARDBP基因或(b)包含敲除突变(例如条件性敲除突变)的TARDBP基因。在一些实施方案中,条件性敲除突变包含位点特异性重组识别序列,例如loxp序列,任选地其中位点特异性重组识别序列(例如loxp序列)位于编码外显子(例如外显子3)的侧翼。在一些实施方案中,包含敲除突变的TARDBP基因包含loxp序列,其位于TARDBP基因的缺失的外显子3的侧翼。在一些实施方案中,敲除突变包含TDP-43肽的整个编码序列的缺失。
在一些实施方案中,非人动物或非人动物细胞包含(i)在内源性TARDBP基因座处,用编码突变体TDP-43多肽的突变TARDBP基因替换内源性TARDBP基因,和(ii)在同源染色体的另一个内源性TARDBP基因座处的包含敲除突变的TARDBP基因或野生型TARDBP基因。
在一些实施方案中,非人动物或非人动物细胞包含在内源性TARDBP基因座处的包含条件性敲除突变的TARDBP基因,以及在同源染色体的另一个内源性TARDBP基因座处的包含整个TARDBP编码序列缺失的TARDBP基因。
在一些实施方案中,非人动物细胞或非人动物对于编码突变体TDP-43多肽的突变TARDBP基因是纯合的。
在一些实施方案中,非人动物或非人动物细胞不表达野生型TDP-43多肽。
在一些实施方案中,非人动物或非人动物细胞表达野生型TDP-43多肽。
在一些实施方案中,前述权利要求中任一项所述的非人动物或非人动物细胞包含与对照细胞中野生型TARDBP基因的mRNA转录水平相当的突变TARDBP基因的mRNA转录水平、与对照细胞中野生型TDP-43多肽的水平相比增加的突变体TDP-43多肽水平、在(例如运动神经元的)细胞质中存在的与细胞核中相比更高浓度的突变体TDP-43多肽、与野生型TDP-43多肽相比具有增加的不溶性的突变体TDP-43多肽、包含突变体TDP-43多肽的细胞质聚集体、增加的隐藏外显子的剪接和/或降低的可变剪接的TDP-43形式的水平。在一些实施方案中,非人动物表现出主要由快肌(诸如胫前肌肉)构成的肌肉组织的去神经支配和/或主要由慢肌(诸如肋间肌肉)构成的肌肉组织的正常神经支配。
在一些实施方案中,如本文所述的非人动物细胞在体外培养。本文还描述了包含本文所述的非人动物细胞的非人动物组织。
在一些实施方案中,非人动物组织和/或非人动物细胞包含在组合物中。
在一些实施方案中,突变体TDP-43多肽与野生型TDP-43多肽相比缺乏功能性结构域,并且其中非人动物或非人动物细胞表达突变体TDP-43多肽,任选地其中野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。
在一些实施方案中,突变体TDP-43多肽缺乏选自由以下组成的组的功能性结构域:核定位信号(NLS)、RNA识别基序1(RRM1)、RNA识别基序2(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)或它们的组合。在一些实施方案中,突变TARDBP基因是包含突变(例如包含点突变、取代、插入、缺失或它们的组合)的非人动物的TARDBP基因。在一些实施方案中,非人动物的TARDBP基因如SEQ ID NO:2或SEQ ID NO:4所陈述。在一些实施方案中,突变TARDBP基因是人的TARDBP基因,其包含突变,例如点突变、取代、插入、缺失或它们的组合。在一些实施方案中,突变TARDBP。在一些实施方案中,人的TARDBP基因如SEQ ID NO:5所陈述。
在一些实施方案中,突变体TDP 43多肽由于以下一项或多项而缺乏功能性结构域:(a)NLS中氨基酸的点突变,(b)RRM1中氨基酸的点突变,(c)RRM2中氨基酸的点突变,(d)核输出信号的至少一部分的缺失,以及(e)朊病毒样结构域的至少一部分的缺失。例如,在一些实施方案中,突变体TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列,所述序列还包含(a)NLS中氨基酸的点突变,(b)RRM1中氨基酸的点突变,(c)RRM2中氨基酸的点突变,(d)核输出信号的至少一部分的缺失,以及(e)朊病毒样结构域的至少一部分的缺失。在一些实施方案中,(a)NLS中氨基酸的点突变包括K82A、K83A、R84A、K95A、K97A、K98A或它们的组合,(b)RRM1中的点突变包括F147L和/或F149L,(c)RRM2中的点突变包括F194L和/或F229L,(d)核输出信号缺失的至少一部分的缺失包括在野生型TDP-43多肽的位置239和250处及其之间的氨基酸的缺失,并且(e)朊病毒样结构域的至少一部分的缺失包括在野生型TDP43多肽的位置274和414处及其之间的氨基酸的缺失。在一些实施方案中,与野生型TDP-43多肽相比,突变体TDP-43多肽包含K82A、K83A、R84A、K95A、K97A和/或K98A,任选地其中野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。在一些实施方案中,突变体TDP-43多肽缺乏位于野生型TDP-43多肽的位置274至414处的氨基酸之间并包括所述位置处的氨基酸的朊病毒样结构域,任选地其中野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。在一些实施方案中,与野生型TDP-43多肽相比,突变体TDP-43多肽包含F147L和F149L,任选地其中野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。在一些实施方案中,与野生型TDP-43多肽相比,突变体TDP-43多肽包含F194L和F229L,任选地其中野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。在一些实施方案中,与野生型TDP-43多肽相比,突变体TDP-43多肽缺乏位于位置239与250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号,任选地其中野生型TDP-43多肽包含如SEQ IDNO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。
还提供了本文所述的突变体TDP 43多肽和编码所述突变体TDP 43多肽的核酸分子。在一些实施方案中,编码如本文所述的突变体TDP-43多肽的核酸分子还包含从5'至3':5'同源臂、编码突变体TDP-43多肽的核酸序列和3'同源臂,其中所述核酸在啮齿动物细胞中经历同源重组。在一些实施方案中,5'和3'同源臂与大鼠序列同源,使得所述核酸在内源性大鼠TARDBP基因座处经历同源重组并且编码突变体TDP-43多肽的核酸序列替换内源性TARDBP编码序列。在一些实施方案中,5'和3'同源臂与小鼠序列同源,使得所述核酸在内源性小鼠TARDBP基因座处经历同源重组并且编码突变体TDP-43多肽的核酸序列替换内源性TARDBP编码序列。
本文还描述了用于制备本文所述的非人动物和非人动物细胞的方法。在一些实施方案中,所述方法包括修饰非人动物或非人动物细胞的基因组以包含编码突变体TDP 43多肽的突变TARDBP基因,其中与野生型TDP-43相比突变体TDP-43多肽缺乏功能性结构域,任选地其中野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。在一些实施方案中,修饰包括用编码如本文所述的突变体TDP-43多肽的突变TARDBP基因替换内源性TARDBP基因。在一些实施方案中,修饰还包括用包含敲除突变(例如条件性敲除突变)的TARDBP基因替换内源性TARDBP基因。在一些实施方案中,所述方法还包括在消除包含敲除突变的TARDBP基因表达的条件下培养细胞。
本文还描述了使用非人动物、非人动物细胞、非人动物组织和组合物的方法。在一些实施方案中,非人动物、非人动物细胞、非人动物组织和组合物用于方法中,例如鉴定用于治疗疾病的治疗候选物和/或评价TDP-43结构域的生物学功能的方法。在鉴定治疗候选物的一些实施方案中,所述方法包括(a)使如本文所述的非人动物、非人动物细胞、非人动物组织或包含非人动物细胞或组织的组合物(例如体外培养物)与候选剂接触,(b)评价非人动物、非人细胞或组织的表型和/或TDP-43生物活性,以及(c)鉴定使非人动物、非人细胞或组织恢复与表达野生型TDP-43多肽的对照细胞或组织相当的表型和/或TDP-43生物活性的候选剂。
在评价TDP-4的生物学功能的一些实施方案中,所述方法包括(a)修饰胚胎干(ES)细胞以包含编码突变体TDP 43多肽的突变TARDBP基因,所述多肽缺乏选自由以下组成的组的功能性结构域:核定位信号(NLS)、第一RNA识别基序(RRM1)、第一RNA识别基序(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)和它们的组合,(b)任选地在体外分化修饰的ES细胞和/或由修饰的ES细胞获得遗传修饰的非人动物,以及(c)评价遗传修饰的ES细胞、由其衍生的原始外胚层、由其衍生的运动神经元或由其衍生的非人动物的表型和/或TDP-43生物活性。在一些实施方案中,如权利要求39或权利要求40所述的方法,其中所述表型通过细胞培养、荧光原位杂交、蛋白质印迹分析或它们的组合来评价。在一些实施方案中,评价表型包括测量遗传修饰的ES细胞、由其衍生的原始外胚层、由其衍生的运动神经元或由其衍生的非人动物的活力。在一些实施方案中,评价表型包括确定突变体TDP-43多肽的细胞定位。在一些实施方案中,评价突变体TDP-43多肽的生物活性包括测量受TDP-43调控的包含隐藏外显子的基因的剪接产物。在一些实施方案中,受TDP-43调控的包含隐藏外显子的基因包括Crem、Fyxd2、Clf1。在一些实施方案中,突变体TDP-43多肽的生物活性包括测量可变剪接的TDP-43的水平。
本文还描述了可用作治疗TDP-43蛋白病的候选剂的寡核苷酸(例如,反义寡核苷酸、siRNA、CRISPR/Cas系统等)。在一些实施方案中,反义寡核苷酸包含靶向可变5'与3'剪接点之间的TDP-43 mRNA序列的间隔体基序(gapmer motif)。在一些实施方案中,反义寡核苷酸包含靶向可变5'与3'剪接点之间的TDP-43 mRNA序列的间隔体基序,其中可变5'剪接点与选自由以下组成的组的TARDBP基因组位置相关:(a)4号染色体:148,618,647;(b)4号染色体:148,618,665;和(c)4号染色体:148,618,674,并且其中可变3'剪接点与4号染色体:148,617,705的TARDBP基因组位置相关。在一些siRNA实施方案中,siRNA包含靶向可变5'与3'剪接点之间的TDP-43 mRNA序列的序列。在一些实施方案中,包含序列的siRNA靶向可变5’与3'剪接点之间的TDP-43 mRNA序列,其中所述可变5'剪接点与选自由以下组成的组的TARDBP基因组位置相关:(a)4号染色体:148,618,647;(b)4号染色体:148,618,665;和(c)4号染色体:148,618,674,并且其中可变3'剪接点与4号染色体:148,617,705的TARDBP基因组位置相关。在一些CRISPR/Cas系统实施方案中,所述系统包含Cas9蛋白和至少一种gRNA,其中所述gRNA识别位于或靠近TDP-43 mRNA的5'可变剪接位点和/或位于或靠近3'可变剪接位点的序列。在一些实施方案中,CRISPR/Cas系统包含Cas9蛋白和至少一种gRNA,其中所述gRNA识别位于或靠近TARDBP基因组位置处的序列,所述基因组位置选自由以下组成的组:(a)4号染色体:148,618,647;(b)4号染色体:148,618,665;(c)4号染色体:148,618,674,(d)4号染色体:148,617,705和它们的组合。
附图说明
专利或申请文件含有至少一幅彩图。在提出请求并支付必要费用后,本事务所将提供具有一张或多张彩色附图的本专利或专利申请公布的副本。
图1提供了TDP-43的说明(未按比例),核定位信号的相对位置(NLS;氨基酸82-98)、两个RNA识别基序的相对位置(RRM1;氨基酸106-176,和RRM2;氨基酸191-262),推定的核输出信号的相对位置(E;氨基酸239-248),朊病毒样结构域的相对位置(PLD;氨基酸274-414),ALS相关的氨基酸取代突变和ALS相关的C末端片段。星号突出显示与有或没有ALS的FTD症状相关联的突变。在健康个体中也观察到A90V、S92L、N267S、G287S、G294V、G368S、S375G、A382T、I383V、N390S和N390D突变。
图2A提供了小鼠TARDBP基因组结构的说明(未按比例),其描绘了外显子1-6(矩形)、非翻译区(未填充矩形)和从ATG起始密码子开始的翻译区(填充矩形)。图2B提供了小鼠(m)TDP-43和人(h)TDP-43多肽的氨基酸序列比对、多肽的氨基酸位置以及在mTDP-43和hTDP-43序列下面的共有序列。一般来说,比对中的框区域显示出核定位信号(NLS:氨基酸82-98)、RNA识别基序1(RRM1:氨基酸106-176)、RNA识别基序2(RRM2:氨基酸191-262)、推定的核输出信号(E:氨基酸239-248)和富含甘氨酸的朊病毒样结构域(PLD:氨基酸274-414)。小鼠TDP-43与人TDP-43之间的氨基酸错配也被加框并在共有序列中用破折号描绘。外显子连接点也被描绘为垂直线,代表在所示连接点处接合的外显子(EX)。氨基酸286与287之间的垂直线提供了一个可变5'剪接位点(参见图11A)。
图3A提供了两个示例性TARDBP无效等位基因的说明(未按比例):(1)在cre介导的重组后去除外显子3之后,包含被loxP位点特异性重组识别位点(三角形)侧接的外显子3的条件性敲除等位基因,以下称为“-”,以及(2)包含整个TARDBP编码序列缺失的TARDBP无效等位基因,以下称为“ΔCDS”。描绘了外显子1-6(矩形)、非翻译区(未填充矩形)、翻译区(填充矩形)以及起始ATG和终止TGA密码子的相对位置。图3B提供了由各种形式的突变TARDBP基因编码的非限制性突变体TDP-43多肽的说明性描绘(未按比例)。具体而言,在这些实例和相关图中:
“WT”是指野生型TARDBP基因,
“loxP-Ex3loxP”是指包含侧接loxP的(floxed)外显子3的突变TARDBP基因
“-”是指在cre介导的loxP-Ex3loxP重组后缺乏包含野生型TARDBP基因的外显子3的序列的核苷酸序列的突变TARDBP基因,
“ΔCDS”是指缺乏TARDBP的整个编码序列的突变TARDBP基因,
“ΔNLS”是指编码突变体TDP-43多肽的突变的TARDBP基因,所述多肽包含以下点突变:K82A、K83A、R84A、K95A、K97A和K98A,
“ΔRRM1”是指编码突变体TDP-43多肽的突变TARDBP基因,所述多肽包含以下点突变:F147L和F149L,
“ΔRRM2”是指编码突变体TDP-43多肽的突变TARDBP基因,所述多肽包含以下点突变:F194L和F229L,
“ΔE”是指编码突变体TDP-43多肽的突变TARDBP基因,所述多肽缺乏野生型TDP-43多肽的氨基酸239至250,并且
“ΔPLD”是指编码突变体TDP-43多肽的突变TARDBP基因,所述多肽缺乏野生型TDP-43多肽的氨基酸274至414。
对于ΔE和ΔPLD突变体TDP-43多肽,斜纹线代表缺失的区域。
图4说明了用于将胚胎干(ES)细胞分化成运动神经元的方案。还示出了包含如图所示的突变TARDBP基因的ES细胞在ES细胞阶段在Cre介导的外显子3缺失(-)后保持活力、达到原始外胚层(PE)阶段和/或达到运动神经元(MN)阶段的能力。
图5说明了用于评价胚胎干细胞衍生的运动神经元(ESMN)的活力的方案。还示出了在条件性敲除等位基因(-)激活后包含所指定的突变TARDBP基因的ESMN的活力的结果。
图6A提供了由识别TDP-43的N末端(α-TDP-43 N末端)的抗TDP-43抗体或识别TDP-43的C末端(α-TDP-43 C末端)的抗TDP-43抗体识别的TDP-43区域的未按比例描绘。图6B提供了用如图6A所描绘的识别TDP-43的N末端(αTDP-43 N末端)或TDP-43的C末端(αTDP-43 C末端)的抗体染色的细胞的细胞质级分和细胞核级分的蛋白质印迹。Cre介导的外显子3缺失(-)发生在ES细胞阶段,并且根据图4中描绘的方案,用ES培养基、ADFNK培养基、包含视黄酸和音猬因子的ADFNK培养基以及ESMN培养基培养细胞,以产生胚胎干细胞衍生的运动神经元(ESMN)。细胞质级分和细胞核级分是从TDP-43WT/-修饰的ESMN、ΔNLS/-修饰的ESMN、ΔE/-修饰的ESMN、ΔPLD/-修饰的ESMN或垂死的ΔRRM1/-修饰的细胞中分离而来的。还提供了提供对照TDP-43WT/-ESMN(●)、ΔNLS/-修饰的ESMN(▲)、ΔRRM1/-修饰的细胞
Figure BDA0003422664410000111
或ΔPLD/-修饰的ESMN(■)的细胞质与细胞核TDP-43的比率的图。
图7提供了包含所指定的突变TARDBP基因的修饰的胚胎干细胞衍生的运动神经元(ESMN)在40倍放大率下的荧光原位杂交图像。图像在ES细胞阶段去除突变TARDBP基因的外显子3(-)后捕获,并且根据图4中描绘的方案,用ES培养基、ADFNK培养基、包含视黄酸和音猬因子的ADFNK培养基以及ESMN培养基培养细胞,以产生胚胎干细胞衍生的运动神经元(ESMN)。用识别TDP-43的C末端的抗体(αTDP-43 C末端;上图)或用抗MAP2抗体和DAPI(下图)对细胞进行染色。
图8提供了包含所指定的突变TARDBP基因的修饰的胚胎干细胞衍生的运动神经元(ESMN)在40倍放大率下的荧光原位杂交图像。图像在ES细胞阶段去除突变TARDBP基因的外显子3(-)后捕获,并且根据图4中描绘的方案,用ES培养基、ADFNK培养基、包含视黄酸和音猬因子的ADFNK培养基以及ESMN培养基培养细胞,以产生胚胎干细胞衍生的运动神经元(ESMN)。用识别TDP-43的N末端的抗体(αTDP-43 N末端;上图)或用抗MAP2抗体和DAPI(下图)对细胞进行染色。
图9A提供了细胞的肌氨酰可溶性(sarkosyl-soluble)和肌氨酰不溶性(sarkosyl-insoluble)级分的抗TDP-43抗体染色的蛋白质印迹。Cre介导的外显子3缺失(-)发生在ES细胞阶段,并且根据图4中描绘的方案,用ES培养基、ADFNK培养基、包含视黄酸和音猬因子的ADFNK培养基以及ESMN培养基培养细胞,以产生胚胎干细胞衍生的运动神经元(ESMN)。肌氨酰可溶性和肌氨酰不溶性级分是从TDP-43WT/-修饰的ESMN、ΔNLS/-修饰的ESMN、ΔE/-修饰的ESMN、ΔPLD/-修饰的ESMN或ΔRRM1/-修饰的细胞中分离而来的。还提供了提供由这些ESMN表达的不溶性/可溶性TDP-43的比率的图。图9B提供了示出TDP-43 mRNA(左图;y轴)或蛋白质(右图;y轴)表达水平的图。Cre介导的外显子3缺失(-)发生在ES细胞阶段,并且根据图4中描绘的方案,用ES培养基、ADFNK培养基、包含视黄酸和音猬因子的ADFNK培养基以及ESMN培养基培养细胞,以产生胚胎干细胞衍生的运动神经元(ESMN)。将ΔNLS/-修饰的ESMN、ΔE/-修饰的ESMN、ΔPLD/-修饰的ESMN或垂死ΔRRM1/-修饰的细胞的mRNA水平与对照(TDP-43WT/-修饰的ESMN(WT/-))进行比较。图9C提供了用细胞裂解物的抗TDP-43或抗GAPDH抗体染色的蛋白质印迹。Cre介导的外显子3缺失(-)发生在ES细胞阶段,并且根据图4中描绘的方案,用ES培养基、ADFNK培养基、包含视黄酸和音猬因子的ADFNK培养基以及ESMN培养基培养细胞,以产生胚胎干细胞衍生的运动神经元(ESMN)。细胞裂解物是在放线菌酮(CHX+)处理长达16小时后从TDP-43WT/-修饰的ESMN、ΔNLS/-修饰的ESMN、ΔE/-修饰的ESMN、ΔPLD/-修饰的ESMN或垂死的ΔRRM1/-修饰的细胞中分离而来的。还提供了提供放线菌酮处理后(x轴;小时)由对照TDP-43WT/-修饰的ESMN(●)、ΔNLS/-修饰的ESMN(■)、ΔRRM1/-修饰的细胞(▲)、或ΔPLD/-修饰的ESMN
Figure BDA0003422664410000121
表达的%TDP-43蛋白(y轴)的图。
图10提供了发生在三个被认为受TDP-43调控的基因中的正常和隐藏外显子剪接的说明(未按比例):Crem、Fyxd2和Clf1,以及示出正常剪接产物(填充条)和异常剪接产物(带图案的条和未填充条)水平的图表。Cre介导的外显子3缺失(-)发生在ES细胞阶段,并且根据图4中描绘的方案,用ES培养基、ADFNK培养基、包含视黄酸和音猬因子的ADFNK培养基以及ESMN培养基培养细胞,以产生胚胎干细胞衍生的运动神经元(ESMN)。示出了由ΔNLS/-修饰的ESMN、ΔE/-修饰的ESMN、ΔPLD/-修饰的ESMN或ΔRRM1/-修饰的细胞和对照(TDP-43WT/-)对Crem、Fyxd2和Clf1产生的隐藏外显子剪接的水平
图11A提供了发生在TDP-43基因中的正常和可变剪接事件的说明(未按比例)。图11B提供了示出可变剪接的TDP-43 mRNA的水平的图。Cre介导的外显子3缺失(-)发生在ES细胞阶段,并且根据图4中描绘的方案,用ADFNK培养基、包含视黄酸和音猬因子的ADFNK培养基以及ESMN培养基培养细胞,以产生胚胎干细胞衍生的运动神经元(ESMN)。示出了由未修饰的ES细胞(WT/WT)、ΔNLS/-修饰的ESMN、ΔE/-修饰的ESMN、ΔPLD/-修饰的ESMN或垂死的ΔRRM1/修饰的细胞产生的可变剪接的TDP-43 mRNA的水平。
图12提供了示出注射了TDP-43-/-ES细胞、TDP-43ΔNLS/-修饰的ES细胞、TDP-43ΔPLD/-修饰的ES细胞、TDP-43ΔNLS/WT修饰的ES细胞、TDP-43ΔPLD/WT修饰的ES细胞、TDP-43WT/-修饰的ES细胞、TDP-43loxP-Ex3-loxP/WT修饰的ES细胞、或野生型TDP-43WT/WTES细胞的8细胞胚胎受精后的存活时间的图。E3.5(胚胎第3.5天)、E 10.5(胚胎第10.5天)、E 15.5(胚胎第15.5天)、P0(出生后第0天)。
图13A、图13B和图13C提供了从分离自16周龄小鼠(n=2)的脊髓组织分离而来的运动神经元的蛋白质印迹。经检查的小鼠表达自(i)内源性TARDBP基因座:包含侧接loxP的外显子3的突变TARDBP基因(loxP-Ex3-loxP)、包含NLS中敲除突变的突变TARDBP基因(ΔNLS)、或包含朊病毒样结构域缺失的突变TARDBP基因(ΔPLD),和(ii)同源染色体上的另一个TARDBP基因座处的野生型(WT)TARDBP基因。图13A示出了用识别TDP-43的N末端或TDP-43的C末端的相应α-TDP-43 N末端抗体或α-TDP-43 C末端抗体染色的运动神经元的细胞质级分和细胞核级分(参见例如,图6A)。还提供了提供从loxP-Ex3-loxP/WT小鼠(●)、ΔNLS/WT小鼠(▲)或ΔPLD/WT小鼠
Figure BDA0003422664410000141
中分离而来的脊髓组织的细胞质与细胞核TDP-43的比率的图。图13B提供了用16周龄小鼠分离并用识别磷酸化TDP-43的抗体染色的脊髓组织的细胞质和细胞核级分的蛋白质印迹。图13C提供了用识别TDP-43的N末端或TDP-43的C末端的相应α-TDP-43 N末端抗体(参见例如图6A)或α-TDP-43 C末端抗体(参见例如图6A)染色的细胞的肌氨酰可溶性和肌氨酰不溶性级分的蛋白质印迹。
图14提供了从分离自16周龄小鼠的脊髓组织分离而来的运动神经元的40倍放大率下的荧光原位杂交图像。经检查的小鼠表达自(i)内源性TARDBP基因座:包含侧接loxP的外显子3的突变TARDBP基因(loxP-Ex3-loxP)、包含NLS中敲除突变的突变TARDBP基因(ΔNLS)、或包含朊病毒样结构域缺失的突变TARDBP基因(ΔPLD),和(ii)同源染色体上的另一个TARDBP基因座处的野生型(WT)TARDBP基因。用识别TDP-43的N末端的抗体(αTDP-43M末端;上图)或用抗chAT抗体和抗NeuN抗体(下图)对细胞进行染色。还示出了提供在表达仅野生型TDP-43(●)、突变体ΔNLS TDP-43多肽和野生型TDP-43多肽(■)、突变体ΔNLS TDP-43多肽和野生型TDP-43多肽(■)两者、或突变体ΔPLD TDP-43多肽和野生型TDP-43多肽两者(▲)的动物中表现出细胞质聚集体的运动神经元的百分比的图。
图15A提供了从16周龄小鼠分离而来的胫骨前肌肌肉组织或肋间肌肉组织在10倍或40倍放大率下的荧光原位杂交图像。用识别突触素、金环蛇毒素和/或DAPI的抗体对组织进行染色。箭头表示去神经支配的肌肉连接点,并且星号表示部分神经支配的神经肌肉连接点。图15B是提供从loxP-Ex3-loxP/WT小鼠(●)、ΔNLS/WT小鼠(▲)、或ΔPLD/WT小鼠
Figure BDA0003422664410000142
分离而来的胫骨前肌(TA)肌肉组织或肋间肌肉中神经支配的神经肌肉连接点(NMJ;y轴)的百分比的图。
具体实施方式
综述
TDP-43是一种主要的核RNA/DNA结合蛋白,其在RNA加工和代谢中起作用,所述作用包括RNA转录、剪接、转运和稳定。通过结合其自身mRNA中的3'UTR序列来介导的TDP-43的RNA结合特性似乎对其自动调节性活性至关重要。Ayala等人(2011)EMBO J.30:277-88。细胞应激后,TDP-43定位至细胞质应激颗粒,并且可在应激颗粒形成中发挥作用。TDP-43从其在细胞核中的正常位置错误定位至细胞质,并在那里聚集。聚集的TDP-43被泛素化、过度磷酸化和截短。另外,细胞质中的TDP-43聚集是几乎所有ALS病例的组成部分。Becker等人(2017)Nature 544:367-371。百分之九十七的ALS病例显示出细胞质TDP-43聚集体的死后病理。在大约45%的散发性额颞叶变性(FTLDU)中可看到相同的病理。TDP-43最初被鉴定为FTLDU、FTLD伴运动神经元疾病(FTDMND)和ALS/MND(ALS10)的泛素阳性、tau阴性内含物的主要病理蛋白,现在认为这些病症代表TDP-43蛋白病的不同临床表现。Gitcho等人(2009)Acta Neuropath118:633-645。在约3%的家族性ALS患者和约1.5%的散发性疾病患者中发生TARDBPB突变。Lattante等人(2013)Hum.Mutat.34:812-26。在不到1%的病例中,TARDBP基因中的各种突变与ALS相关联。参见图1。如图1所示,与ALS相关的联TARDBP基因中的大多数突变可在朊病毒样结构域(PLD)中找到。因此,理解TDP-43发挥的所有功能可能会阐明其在诸如ALS、FLTDU和FLTD等的神经病理中的作用。
很明显,TDP-43是细胞和有机体生命所必需的。TDP-43的耗尽会导致胚胎死亡。因此,初始模型依赖于TDP-43或其突变体形式的过表达,或TDP-43的耗尽。已经创建了各种评价TDP-43在ALS病理中的作用的模型。在Tsao等人(2012)Brain Res 1462:26-39中进行了综述。
例如,过表达TDP-43A315T突变体的转基因小鼠在约3至4个月大时出现进行性异常,并在约5个月大时死亡。Wegorzewska等人(2009)Proc Natl Acad Sci USA 106:18809-814。尽管所述异常与这些突变体小鼠的脑和脊髓中TDP-43 C末端片段的存在相关,但未检测到细胞质TDP-43聚集体。这些观察使Wegorzewska等人提出,神经元对TDP-43相关神经退行性的易感性与DNA/RNA结合蛋白功能的改变相关,而不是与毒性聚集相关。Wegorzewska等人(2009),同上。相比之下,在涉及TDP-43过表达的两项独立研究中,转基因小鼠表现出神经退行性属性,其包括与细胞质聚集相关的进行性运动功能失调。Tsai等人(2010)J.Exp.Med.207:1661-1673和Wils等人(2010)Proc Natl Acad Sci USA 107:3858-63)。
在功能丧失研究中,使用条件性敲除突变的TDP-43的遍在缺失导致小鼠表现出代谢表型和过早死亡。Chiang等人(2010)Proc Natl Acad Sci USA 107:16320-324。小鼠胚胎干细胞中TDP-43的耗尽导致某些基因的隐藏外显子被剪接成mRNA,破坏mRNA的翻译并促进无义介导的mRNA衰变。Ling等人(2015)Science 349:650-655。由于来自ALS/FTD患者的死后脑组织显示出对隐藏外显子剪接的阻遏受损,这项研究表明TDP-43正常起到阻遏隐藏外显子剪接和保持内含子完整性的作用,并且TDP-43剪接缺陷可导致某些神经退行性疾病中的TDP-43-蛋白病。Ling等人(2015),同上。由于TDP-43的N末端(例如NLS)的点突变导致细胞核中TDP-43寡聚化的不稳定和隐藏剪接调控的丧失,因此假设TDP-43的由N末端驱动的头对尾寡聚化起到分离易于聚集的C末端结构域(例如PLD),并因此防止形成病理性聚集体的作用。Afroz等人(2017)Nature Communications 8:45。
在ALS中,首先出现的病理特征之一是轴突从神经肌肉连接点处缩回,从而引起肌肉去神经支配。这种去神经支配继续进行,导致运动神经元细胞体的丧失和肌肉萎缩。通过轴突神经支配的突触前标志物的丧失可观察到去神经支配:VAChT、突触囊泡蛋白2(SV2)、突触素和神经丝。运动终板仍然存在,但最终会破碎并消失。最近,在包含疾病相关突变的敲入TARDBP基因的纯合子小鼠中表现出剂量依赖性去神经支配。Ebstein(2019)CellReports 26:364-373。
尽管TDP-43耗尽导致胚胎死亡,但此处显示出表达缺乏功能性结构域的TDP-43突变体的胚胎干(ES)细胞保持活力并且可分化成运动神经元(ESMN)。参见,图4至图5。这些观察的独特之处在于,如本文所述的ES或ESMN表达突变体TDP-43多肽,所述突变体TDP-43多肽:
(1)缺乏功能性结构域,例如,缺乏功能性NLS、缺乏功能性RRM1、缺乏功能性RRM2、缺乏功能性E或缺乏功能性PLD,并且
(2)由内源性转录启动子和前mRNA剪接信号以正常水平表达。参见例如,图2和图9。
使用本文所述的ES和ESMN,表明RRM1是ES细胞和由其衍生的运动神经元的活力所需要的。参见,图4至图5。而且,(1)缺乏功能性NLS或功能性PLD和(2)来自内源性基因座的正常水平的突变体TDP-43多肽的表达再现了ESMN中ALS疾病的两个标志:
(i)TDP-43从细胞核到细胞质的重新分布,和
(ii)在细胞质内含物中的积累。参见,图6至图8。
令人惊讶的是,ΔPLD突变体,即包含功能性NLS但缺乏PLD的TDP-43多肽,在细胞质中聚集。参见例如,Afroz等人(2017),同上。值得注意的是,由ΔPLD突变体形成的点状内含物似乎比由ΔNLS突变体(即缺乏功能性NLS并包含PLD的TDP-43多肽)形成的内含物丰度更低且在性质上有所不同。此外,表达ΔPLD或ΔNLS的ESMN的ALS样表型与基因的隐藏外显子剪接的阻遏减少相关联,对于这些基因的剪接事件通常由野生型TDP-43调控。图9。还示出了ESMN中ΔPLD或ΔNLS突变的TARDBP基因的表达与涉及3'非翻译区内含子的可变剪接事件的减少之间的相关性,所述可变剪接事件导致可变剪接的TDP-43 mRNA缺乏编码PLD结构域的序列或其部分和终止密码子。图10;另参见Avendano-Vazquez等人(2012)Genes&Dev.26:1679-84;Ayala YM,等人(2011)EMBO J 30:277–288。后一种观察表明,仅耗尽由正常剪接事件引起的野生型或ALS相关序列可对治疗与PLD突变相关联的ALS具有潜在的治疗性。
表达来自内源性基因座的野生型TARDBP基因和ΔPLD或ΔNLS突变的TARDBP基因的小鼠也表现出TDP-43蛋白病的标志。与仅表达野生型蛋白的动物相比,在表达突变体ΔPLD或ΔNLS TDP-43多肽的动物的脊髓运动神经元中观察到增加的TDP-43从细胞核到细胞质的错误定位、细胞质TDP-43的磷酸化和TDP-43的细胞质聚集(图13A至图13B和图14)。缺乏功能性NLS的TDP-43突变体,而不是缺乏PLD的TDP-43突变体,是不溶性的(图13C)。而且,在这些表达突变体ΔPLD或ΔNLS TDP-43蛋白的小鼠中也观察到主要由快肌纤维组成的肌肉的去神经支配,而不是主要由慢肌纤维组成的肌肉的去神经支配(图15A至图15B)。
本文提供的发现不仅提供了一种评价有活力的胚胎干(ES)细胞和组织以及由其衍生的非人动物(例如,原始外胚层、由其衍生的运动神经元(ESMN))中的TDP-43突变的方法,还提供了表达缺乏功能性结构域的突变体TDP-43多肽的ES细胞、ESMN细胞和非人动物。表达缺乏功能性结构域的突变体TDP-43多肽的ES、ESMN细胞、非人动物(例如啮齿动物,例如大鼠和小鼠)还可分别用作TDP-43蛋白病的体外或体内模型,例如,在鉴定其治疗候选物的方法中。
TARDBP基因和TDP-43多肽
TARDBP基因编码TDP-43多肽,也称为TAR DNA结合蛋白、TARDBP、43-KD和TDP43,以及TDP-43。不同物种的野生型TAR DBP基因和由其编码的野生型TDP-43多肽的核酸序列是本领域众所周知的。例如,野生型TARDBP基因和野生型TDP-43多肽的相应核酸和氨基酸序列可在美国国家医学图书馆(NIH)国家生物技术信息中心(NCBI)基因数据库中找到。参见例如,www.ncbi.nlm.nih.gove/gene/?term=TARDBP的网站。在一些实施方案中,野生型小鼠TARD BP基因包含编码野生型小鼠TDP-43多肽的核苷酸序列,所述多肽包含如GenBank登录号NP_663531(SEQ ID NO:1)所陈述的氨基酸序列,或其由于保守氨基酸取代而与其不同的变体。在一些实施方案中,野生型小鼠TARDBP基因包含如GenBank登录号NM_145556.4(SEQ ID NO:2)所陈述的核酸序列,或其由于遗传密码的简并性和/或保守密码子取代而与其不同的变体。在一些实施方案中,野生型大鼠TARDBP基因包含编码野生型大鼠TDP-43多肽的核苷酸序列,所述多肽包含如GenBank登录号NP_001011979(SEQ ID NO:3)所陈述的氨基酸序列,或其由于保守氨基酸取代而与其不同的变体。在一些实施方案中,野生型大鼠TARDBP基因包含如GenBank登录号NM_001011979.2(SEQ ID NO:4)所陈述的核酸序列,或其由于遗传密码的简并性和/或保守密码子取代而与其不同的变体。在一些实施方案中,野生型人TARDBP基因编码TDP-43多肽,其包含如GenBa nk登录号NP_031401.1(SEQ ID NO:5)所陈述的氨基酸,或其由于保守氨基酸取代而与其不同的变体。在一些实施方案中,野生型人TARDBP基因包含如GenBank登录号NM_007375.3(SEQ ID NO:6)所陈述的核酸序列,或其由于遗传密码的简并性和/或保守密码子取代而与其不同的变体。
本文描述了突变TARDBP基因。突变TARDBP基因可包含敲除突变。突变TARDBP基因可编码突变体TDP-43多肽,其中突变体TDP-43多肽缺乏功能性结构域。例如,突变TARDBP基因可包含编码TDP-43结构域的核苷酸序列,所述结构域包含点突变、部分或全部结构域内的插入和/或部分或全部结构域的缺失,其中所述点突变、插入和/或缺失导致结构域的功能丧失,并且其中突变TARDBP基因仍然编码TDP-43多肽,尽管突变体TDP-43多肽由于突变而缺乏功能性结构域。多肽可称为突变体TDP-43多肽,其中它包含至少一个野生型TDP-43结构域或其变体且/或其中它被抗TDP-43抗体或其抗原结合部分特异性结合。类似地,突变TARDBP基因可这样分类,其中突变TARDBP基因编码突变体TDP-43多肽,例如,包含至少一个野生型TDP-43结构域或其变体和/或可被抗TDP-43抗体或其抗原结合部分特异性结合的多肽。
TDP-43的结构域已被鉴定为核定位信号(NLS)、两个RNA识别基序(RRM1和RRM2)、推定的核输出信号(E)和富含甘氨酸的朊病毒样域(PLD)。参见图1和图2。野生型TDP-43多肽包含氨基酸82-99处的TDP-43 NLS、氨基酸106-176处的TDP-43RRM1、氨基酸191-262处的TDP-43RRM2、氨基酸239-248处的TDP-43E和氨基酸274-414处的TDP-43 PLD。
经典NLS序列包含碱性氨基酸段,主要是赖氨酸(K)和精氨酸(R)残基,并且二分NLS包含这些碱性氨基酸的两个簇,它们被包含约10-13个氨基酸的接头区域隔开。经典NLS的碱性氨基酸序列的氨基酸取代和/或缺失可消除经典NLS的功能。McLane和Corbett(2009)IUBMB Life 61:697-706。TDP-43 NLS在位置82、83、84、95、97和98处包含赖氨酸和精氨酸残基。被修饰以在位置82、83、84、95、97和/或98处包含氨基酸取代和/或缺失的野生型TDP-43多肽可缺乏功能性NLS。缺乏功能性NLS的突变体TDP-43多肽可包含SEQ ID NO:1中陈述的氨基酸序列,所述氨基酸序列被修饰以在位置82、83、84、95、97和/或98处包含氨基酸取代和/或缺失。缺乏功能性NLS的突变体TDP-43多肽可包含SEQ ID NO:3中陈述的氨基酸序列,所述氨基酸序列被修饰以在位置82、83、84、95、97和/或98处包含氨基酸取代和/或缺失。缺乏功能性NLS的突变体TDP-43多肽可包含SEQ ID NO:5中陈述的氨基酸序列,所述氨基酸序列被修饰以在位置82、83、84、95、97和/或98处包含氨基酸取代和/或缺失。因此,编码缺乏功能性TDP-43 NLS的突变体TDP-43蛋白的突变TARDBP基因可包含编码TDP-43多肽的序列,所述TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列,所述序列被修饰以包含(i)在选自由82、83、84、95、97和/或98和它们的组合组成的组的位置处的氨基酸取代,和/或(ii)在位置82和98处及其之间的任何氨基酸的缺失。编码缺乏功能性TDP-43 NLS的突变体TDP-43蛋白的突变TARDBP基因可包含编码如SEQ ID NO:1、SEQID NO:3或SEQ ID NO:5所陈述的氨基酸序列的核苷酸序列,所述氨基酸序列被修饰以包含选自由K82A、K83A、R84A、K95A、K97A、K98A或它们的组合组成的组的氨基酸取代。编码缺乏功能性TDP-43NLS的突变体TDP-43蛋白的突变TARDBP基因可包含编码如SEQ ID NO:1、SEQID NO:3或SEQ ID NO:5所陈述的氨基酸序列的核苷酸序列,所述氨基酸序列被修饰以包含以下氨基酸取代:K82A、K83A、R84A、K95A、K97A和K98A。
由典型RRM产生的RNA结合通常是通过典型RRM的四链反平行β折叠表面与单链RNA之间的接触来实现的。Melamed等人(2013)RNA19:1537-1551。中央两条β链中的两个高度保守的基序,RNP1(共有K/R-G-F/Y-G/A-F/Y-V/I/L-X-F/Y,其中X是任何氨基酸)和RNP2(共有I/V/L-F/Y-I/V/L-X-N-L,其中X是任何氨基酸)是RNA结合的主要介体。Melamed等人(2013),同上。
位于野生型TDP-43多肽的氨基酸位置106-176处的TDP-43 RRM1包含位于氨基酸位置106-111处的RNP2共有序列(LIVLGL;SEQ ID NO:7)和位于氨基酸位置145-152处的RNP1共有序列(KGFGFVRF;SEQ ID NO:8)。先前,W113、T115、F147、F149、D169、R171和N179被鉴定为核酸结合的关键残基。被修饰以包含(i)在选自由113、115、147、149、169、171、179和它们的任何组合组成的组的位置处的氨基酸取代,(ii)在位置106-176处及其之间的任何氨基酸的缺失或取代,(iii)在位置106-111处及其之间的任何氨基酸的缺失或取代,(iv)在位置145-152处及其之间的任何氨基酸的缺失或取代,或(v)(i)-(iv)的任何组合的野生型TDP-43多肽可缺乏功能性RRM1。缺乏功能性RRM1的突变体TDP-43多肽可包含如SEQ IDNO:1所陈述的序列,所述序列被修饰以包含(i)在选自由113、115、147、149、169、171、179和它们的任何组合组成的组的位置处的氨基酸取代,(ii)在位置106-176处及其之间的任何氨基酸的缺失或取代,(iii)在位置106-111处及其之间的任何氨基酸的缺失或取代,(iv)在位置145-152处及其之间的任何氨基酸的缺失或取代,或(v)(i)-(iv)的任何组合。缺乏功能性RRM1的突变体TDP-43多肽可包含如SEQ ID NO:3所陈述的序列,所述序列被修饰以包含(i)在选自由113、115、147、149、169、171、179和它们的任何组合组成的组的位置处的氨基酸取代,(ii)在位置106-176处及其之间的任何氨基酸的缺失或取代,(iii)在位置106-111处及其之间的任何氨基酸的缺失或取代,(iv)在位置145-152处及其之间的任何氨基酸的缺失或取代,或(v)(i)-(iv)的任何组合。缺乏功能性RRM1的突变体TDP-43多肽可包含如SEQ ID NO:5所陈述的序列,所述序列被修饰以包含(i)在选自由113、115、147、149、169、171、179和它们的任何组合组成的组的位置处的氨基酸取代,(ii)在位置106-176处及其之间的任何氨基酸的缺失或取代,(iii)在位置106-111处及其之间的任何氨基酸的缺失或取代,(iv)在位置145-152处及其之间的任何氨基酸的缺失或取代,或(v)(i)-(iv)的任何组合。因此,编码缺乏功能性RRM1的突变体TDP-43多肽的突变TARDBP基因可包含编码TDP-43多肽的核苷酸序列,所述TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ IDNO:5所陈述的氨基酸序列,所述氨基酸序列被修饰以包含(i)在选自由113、115、147、149、169、171、179和它们的任何组合组成的组的位置处的氨基酸取代,(ii)在位置106-176处及其之间的任何氨基酸的缺失或取代,(iii)在位置106-111处及其之间的任何氨基酸的缺失或取代,(iv)在位置145-152处及其之间的任何氨基酸的缺失或取代,或(v)(i)-(iv)的任何组合。编码缺乏功能性RRM1的突变体TDP-43多肽的突变TARDBP基因可包含编码TDP-43多肽的核苷酸序列,所述TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的氨基酸序列,所述氨基酸序列被修饰以包含F147L和/或F149L突变。编码缺乏功能性RRM1的突变体TDP-43多肽的突变TARDBP基因可包含编码TDP-43多肽的核苷酸序列,所述TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的氨基酸序列,所述氨基酸被修饰以包含以下氨基酸取代:F147L和F149L。
位于野生型TDP-43多肽的氨基酸位置191-262处的TDP-43 RRM2包含位于氨基酸位置193-198处的RNP2共有序列(VFVGRC;SEQ ID NO:9)和位于氨基酸位置227-233处的RNP1共有序列(RAFAFVT;SEQ ID NO:10)。F194和F229可被认为是核酸结合的关键残基。被修饰以包含(i)在选自由194和/或229组成的组的位置处的氨基酸取代,(ii)在位置193-198处及其之间的任何氨基酸的缺失或取代,(iii)在位置227-233处及其之间的任何氨基酸的缺失或取代,(iv)在位置191-262处及其之间的任何氨基酸的缺失或取代,或(v)(i)-(iv)的任何组合的野生型TDP-43多肽可缺乏功能性RRM2。缺乏功能性RRM2的突变体TDP-43多肽可包含如SEQ ID NO:1所陈述的序列,所述序列被修饰以包含(i)在选自由194和/或229组成的组的位置处的氨基酸取代,(ii)在位置193-198处及其之间的任何氨基酸的缺失或取代,(iii)在位置227-233处及其之间的任何氨基酸的缺失或取代,(iv)在位置191-262处及其之间的任何氨基酸的缺失或取代,或(v)(i)-(iv)的任何组合。缺乏功能性RRM2的突变体TDP-43多肽可包含如SEQ ID NO:3所陈述的序列,所述序列被修饰以包含(i)在选自由194和/或229组成的组的位置处的氨基酸取代,(ii)在位置193-198处及其之间的任何氨基酸的缺失或取代,(iii)在位置227-233处及其之间的任何氨基酸的缺失或取代,(iv)在位置191-262处及其之间的任何氨基酸的缺失或取代,或(v)(i)-(iv)的任何组合。缺乏功能性RRM2的突变体TDP-43多肽可包含如SEQ ID NO:5所陈述的序列,所述序列被修饰以包含(i)在选自由194和/或229组成的组的位置处的氨基酸取代,(ii)在位置193-198处及其之间的任何氨基酸的缺失或取代,(iii)在位置227-233处及其之间的任何氨基酸的缺失或取代,(iv)在位置191-262处及其之间的任何氨基酸的缺失或取代,或(v)(i)-(iv)的任何组合。因此,编码缺乏功能性RRM2的突变体TDP-43多肽的突变TARDBP基因可包含编码TDP-43多肽的核苷酸序列,所述TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的氨基酸序列,所述氨基酸序列被修饰以包含(i)在野生型TDP-43多肽的位置194和/或229处的氨基酸取代,(ii)在位置191-262处及其之间的任何氨基酸的缺失或取代,或(iii)(i)和(ii)两者。编码缺乏功能性RRM2的突变体TDP-43多肽的突变TARDBP基因可包含编码TDP-43多肽的核苷酸序列,所述TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ IDNO:5所陈述的氨基酸序列,所述氨基酸序列被修饰以包含F194L和/或F229L突变。编码缺乏功能性RRM2的突变体TDP-43多肽的突变TARDBP基因可包含编码TDP-43多肽的核苷酸序列,所述TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的氨基酸序列,所述氨基酸序列被修饰以包含F194L和F229L突变。
野生型TDP-43多肽的核输出信号可位于氨基酸239-248处。缺乏功能性核输出信号的突变体TDP-43多肽可包含如SEQ ID NO:1所陈述的氨基酸序列,所述氨基酸序列被修饰以包含在位置236-251处及其之间的任何氨基酸的缺失。缺乏核输出信号的突变体TDP-43多肽可包含如SEQ ID NO:1所陈述的氨基酸序列,所述氨基酸序列被修饰以包含至少氨基酸239-250的缺失。缺乏核输出信号的突变体TDP-43多肽可包含如SEQ ID NO:3所陈述的氨基酸序列,所述氨基酸序列被修饰以包含在位置236-251处及其之间的任何氨基酸的缺失。缺乏核输出信号的突变体TDP-43多肽可包含如SEQ ID NO:3所陈述的氨基酸序列,所述氨基酸序列被修饰以包含至少氨基酸239-250的缺失。缺乏核输出信号的突变体TDP-43多肽可包含如SEQ ID NO:5所陈述的氨基酸序列,所述氨基酸序列被修饰以包含在位置236-251处及其之间的任何氨基酸的缺失。缺乏核输出信号的突变体TDP-43多肽可包含如SEQID NO:5所陈述的氨基酸序列,所述氨基酸序列被修饰以包含至少氨基酸239-250的缺失。因此,编码缺乏功能性核输出信号的突变体TDP-43多肽的突变TARDBP基因可包含编码TDP-43多肽的核苷酸序列,所述TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的氨基酸序列,所述氨基酸序列被修饰以包含在位置236-251处及其之间的氨基酸的缺失,例如在239-250处及其之间的氨基酸的缺失。
野生型TDP-43多肽的朊病毒样结构域(PLD)可位于氨基酸274-414处。缺乏功能性PLD的突变体TDP-43多肽可包含如SEQ ID NO:1所陈述的氨基酸序列,所述氨基酸序列被修饰以包含在位置274-414处及其之间的至少一个或所有氨基酸的缺失。缺乏功能性PLD的突变体TDP-43多肽可包含如SEQ ID NO:3所陈述的氨基酸序列,所述氨基酸序列被修饰以包含在位置274-414处及其之间的至少一个或所有氨基酸的缺失。缺乏功能性PLD的突变体TDP-43多肽可包含如SEQ ID NO:5所陈述的氨基酸序列,所述氨基酸序列被修饰以包含在位置274-414处及其之间的至少一个或所有氨基酸的缺失。因此,编码突变体TDP-43多肽的突变TARDBP基因可包含编码TDP-43多肽的核苷酸序列,所述TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的氨基酸序列,所述氨基酸序列被修饰以包含在位置274-414处及其之间的至少一个或所有氨基酸的缺失。
突变TARDBP基因可包含图3A中说明的结构。突变TARDBP基因可编码图3A中描绘的突变体TDP-43多肽。
制备包含和表达突变体TARDBP基因的细胞和非人动物的方法
如上所述,本文提供的方法和组合物允许对TARDBP基因座进行靶向遗传修饰,例如用于制备包含突变TARDBP基因的细胞和/或用于评价TDP-43结构域的生物学功能。还认识到可进行另外的靶向遗传修饰。允许进行这些靶向遗传修饰的此类系统可采用多种组分并且为便于参考,本文中的术语“靶向基因组整合系统”一般包括整合事件所需的所有组分(即各种核酸酶剂、识别位点、插入DNA多核苷酸、靶向载体、靶基因组基因座等)。
制备表达突变体TDP-43多肽的非人动物细胞和/或用于评价TDP-43结构域的生物学功能的方法可包括修饰细胞的基因组以包含突变TARDBP基因。突变TARDBP基因可编码突变体TDP-43多肽,其中所述突变体TDP-43多肽缺乏功能性结构域。
制备表达突变体TDP-43多肽的非人动物细胞和/或用于评价TDP-43结构域的生物学功能的方法可包括修饰细胞的基因组以包含突变TARDBP基因,其中所述突变TARDBP基因包含敲除突变。
本文提供的方法包括将包含靶向基因组整合系统的各种组分的一种或多种多核苷酸或多肽构建体引入细胞中。“引入”意指以所述序列进入细胞内部的方式向细胞呈递所述序列(多肽或多核苷酸)。本文提供的方法不依赖于将靶向基因组整合系统的任何组分引入细胞中的特定方法,仅依赖于多核苷酸进入至少一个细胞内部。用于将多核苷酸引入各种细胞类型中的方法是本领域已知的,并且包括但不限于稳定转染方法、瞬时转染方法和病毒介导的方法。
在一些实施方案中,所述方法和组合物中采用的细胞具有稳定掺入其基因组中的DNA构建体。“稳定掺入”或“稳定引入”意指将多核苷酸引入细胞中以使得核苷酸序列整合到细胞的基因组中并且能够由其后代遗传。任何方案都可用于稳定掺入DNA构建体或靶向基因组整合系统的各种组分。
转染方案以及用于将多肽或多核苷酸序列引入到细胞中的方案可以变化。非限制性转染方法包括基于化学的转染方法,包括使用脂质体;纳米粒子;磷酸钙(Graham等人(1973).Virology 52(2):456–67,Bacchetti等人(1977)Proc Natl Acad Sci USA 74(4):1590–4和Kriegler,M(1991).Transfer and Expression:A Laboratory Manual。NewYork:W.H.Freeman and Company.第96–97页);树枝状聚合物;或阳离子聚合物,诸如DEAE-葡聚糖或聚乙烯亚胺。非化学方法包括电穿孔、超音波穿孔和光学转染。基于粒子的转染包括使用基因枪、磁体辅助转染(Bertram,J.(2006)Current PharmaceuticalBiotechnology 7,277–28)。还可使用病毒方法进行转染。
可使用本文公开的各种方法产生包含突变TARDBP基因的细胞。修饰可包括用编码突变体TDP-43多肽的突变TARDBP基因替换内源性TARDBP基因和/或用包含敲除突变(诸如条件性敲除突变)的TARDBP基因替换内源性TARDBP基因。修饰可包括在消除包含敲除突变的TARDBP基因表达的条件下培养细胞。可消除TARDBP基因表达的条件可包括表达重组酶蛋白,例如cre-重组酶。
此类修饰方法可包括(1)使用本文公开的方法在非人动物的多能细胞的所关注的靶TARDBP基因组基因座处整合突变TARDBP基因以产生在靶向TARDBP基因组基因座中包含突变TARDBP基因的遗传修饰的多能细胞;以及(2)选择在靶TARDBP基因组基因座处具有突变的TARDBP基因的遗传修饰的多能细胞。可通过(3)将遗传修饰的多能细胞引入到非人动物的宿主胚胎中,例如,在前桑椹胚阶段;以及(4)将包含遗传修饰的多能细胞的宿主胚胎植入代孕母体中以产生衍生自遗传修饰的多能细胞的F0代来进一步产生动物。非人动物可以是非人哺乳动物、啮齿动物、小鼠、大鼠、仓鼠、猴子、农业哺乳动物或家养哺乳动物,或者鱼或鸟。
多能细胞可以是人ES细胞、非人ES细胞、啮齿动物ES细胞、小鼠ES细胞、大鼠ES细胞、仓鼠ES细胞、猴ES细胞、农业哺乳动物ES细胞或家养哺乳动物ES细胞。在其他实施方案中,多能细胞是非人细胞、哺乳动物细胞、人细胞、非人哺乳动物细胞、人多能细胞、人ES细胞、人成体干细胞、发育受限的人祖细胞、人iPS细胞、啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞。在一个实施方案中,靶向遗传修饰导致突变TARDBP基因。
小鼠多能细胞、全能细胞或宿主胚胎可来自任何小鼠品系,包括例如近交品系、杂交品系和远交品系。小鼠品系的实例包括129品系、C57BL品系(例如C57BL/6品系)、129和C57BL/6的混合(例如50%129和50%C57BL/6)、BALB/c品系和Swiss Webster品系。129品系的实例包括129P1、129P2、129P3、129X1、129S1(例如12951/SV、12951/SvIm)、129S2、129S4、129S5、12959/SvEvH、129S6(129/SvEvTac)、129S7、129S8、129T1和129T2(参见例如,Festing等人(1999)Revised nomenclature for strain 129mice,Mammalian Genome 10:836)。C57BL品系的实例包括C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/01a。小鼠可以是上述129品系(例如129S6(129/SvEvTac)品系)和上述C57BL/6品系的混合、一种或多种上述129品系的混合、或一种或多种上述C57BL品系的混合。小鼠还可来自除129品系之外的品系。
大鼠多能细胞、全能细胞或宿主胚胎可来自任何大鼠品系,包括例如近交品系、杂交品系和远交品系。大鼠品系的实例包括ACI大鼠品系、Dark Agouti(DA)大鼠品系、Wistar大鼠品系、LEA大鼠品系、Sprague Dawley(SD)大鼠品系或Fischer大鼠品系,诸如FisherF344或Fisher F6。大鼠多能细胞、全能细胞或宿主胚胎还可从衍生自上述两种或更多种品系的混合的品系中获得。例如,大鼠多能细胞、全能细胞或宿主胚胎可衍生自选自DA品系和ACI品系的品系。ACI大鼠品系的特征在于具有黑野灰色,且腹部和足部为白色以及RT1av1单倍型。此类品系可获自多种来源,包括Harlan Laboratories。来自ACI大鼠的大鼠ES细胞系的实例是ACI.G1大鼠ES细胞。Dark Agouti(DA)大鼠品系的特征在于具有野灰色皮毛和RT1av1单倍型。此类大鼠可获自多种来源,包括Charles River和Harlan Laboratories。来自DA大鼠的大鼠ES细胞系的实例是DA.2B大鼠ES细胞系或DA.2C大鼠ES细胞系。例如,在US2014/0235933、US 2014/0310828和US2014/0309487中提供了大鼠品系的其他实例,所述参考中的每个出于所有目的以引用的方式整体并入本文。
例如,可通过在饲养细胞层上用培养基培养分离的大鼠ES细胞来获得种系可传递的大鼠ES细胞,所述培养基包含N2补充剂、B27补充剂、约50U/mL至约150U/mL白血病抑制因子(LIF)、以及由MEK抑制剂和GSK3抑制剂组成的抑制剂组合,其中所述饲养细胞层未被修饰以表达LIF,并且其中大鼠ES细胞:(i)已经被修饰以包含靶向遗传修饰,所述靶向遗传修饰包括包含选择标志物的异源多核苷酸向大鼠ES细胞的基因组中的至少一个插入,并且能够通过种系传递靶向遗传修饰;(ii)具有正常的核型;(iii)缺乏c-Myc表达;并且(iv)在培养中形成球形、自由漂浮的集落(参见例如,US 2014-0235933A1和US 2014-0310828 A1,所述参考中的每个以引用的方式整体并入)。例如,在Yamamoto等人(“Derivation of ratembryonic stem cells and generation of protease-activated receptor-2knockoutrats,”Transgenic Res.21:743-755,2012)和Kwamata和Ochiya(“Generation ofgenetically modified rats from embryonic stem cells,”Proc.Natl.Acad.Sci.USA107(32):14223-14228,2010)中提供了大鼠胚胎干细胞的衍生和靶向修饰的其他实例。
核移植技术也可用于产生非人动物。简而言之,用于核移植的方法包括以下步骤:(1)将卵母细胞去核;(2)分离将与去核卵母细胞组合的供体细胞或细胞核;(3)将细胞或细胞核插入去核卵母细胞中以形成重构细胞;(4)将重构细胞植入动物子宫中形成胚胎;和(5)使胚胎发育。在此类方法中,卵母细胞一般从死亡的动物中取出,尽管它们也可以从活体动物的输卵管和/或卵巢中分离。卵母细胞可在去核前在本领域普通技术人员已知的多种培养基中成熟。可以本领域普通技术人员众所周知的多种方式进行卵母细胞的去核。将供体细胞或细胞核插入去核卵母细胞中以形成重构胞通常是在融合前通过将供体细胞显微注射到透明带下来进行的。可通过在接触/融合平面上施加DC电脉冲(电融合)、通过将细胞暴露于促进融合的化学物质(诸如聚乙二醇)或通过灭活病毒(诸如仙台病毒)来诱导融合。重构细胞通常在细胞核供体和受体卵母细胞融合之前、期间和/或之后通过电学手段和/或非电学手段来激活。激活方法包括电脉冲、化学诱导的休克、精子穿透、增加卵母细胞中二价阳离子的水平以及降低卵母细胞中细胞蛋白的磷酸化(如通过激酶抑制剂)。激活的重构细胞或胚胎通常在本领域普通技术人员众所周知的培养基中培养,然后转移到动物的子宫中。参见例如,US20080092249、WO/1999/005266A2、US20040177390、WO/2008/017234A1和美国专利号7,612,250,所述参考中的每个以引用的方式并入本文。
提供了用于制备在其种系中包含一种或多种如本文所述的遗传修饰的非人动物的其他方法,其包括:(a)采用本文所述的各种方法在原核细胞中修饰非人动物的靶向基因组TARDBP基因座;(b)选择在靶向基因组基因座处包含遗传修饰的修饰的原核细胞;(c)从修饰的原核细胞的基因组中分离出遗传修饰的靶向载体;(d)将遗传修饰的靶向载体引入非人动物的多能细胞中以产生在靶向TARDBP基因组基因座处包含插入核酸的遗传修饰的多能细胞;(e)选择遗传修饰的多能细胞;(f)在前桑椹胚阶段将遗传修饰的多能细胞引入非人动物的宿主胚胎中;以及(g)将包含遗传修饰的多能细胞的宿主胚胎植入代孕母体中以产生衍生自遗传修饰的多能细胞的F0代。在此类方法中,靶向载体可包括大靶向载体。非人动物可以是非人哺乳动物、啮齿动物、小鼠、大鼠、仓鼠、猴、农业哺乳动物或家养哺乳动物。多能细胞可以是人ES细胞、非人ES细胞、啮齿动物ES细胞、小鼠ES细胞、大鼠ES细胞、仓鼠ES细胞、猴ES细胞、农业哺乳动物ES细胞或家养哺乳动物ES细胞。在其他实施方案中,多能细胞是非人细胞、哺乳动物细胞、人细胞、非人哺乳动物细胞、人多能细胞、人ES细胞、人成体干细胞、发育受限的人祖细胞、人iPS细胞、人细胞、啮齿动物细胞、大鼠细胞、小鼠细胞、仓鼠细胞。在一个实施方案中,靶向遗传修饰导致突变TARDBP基因,例如编码缺乏功能性结构域的突变体TDP-43多肽的突变TARDBP基因和/或包含敲除突变的突变TARDBP基因
在进一步的方法中,分离步骤(c)还包括(c1)线性化遗传修饰的靶向载体(即遗传修饰的LTVEC)。在更进一步的实施方案中,引入步骤(d)还包括(d1)将核酸酶剂引入多能细胞中以促进同源重组。在一个实施方案中,选择步骤(b)和/或(e)通过将如本文所述的选择剂施加于原核细胞或多能细胞来进行。在一个实施方案中,选择步骤(b)和/或(e)经由如本文所述的等位基因修饰(MOA)测定来进行。
在一些实施方案中,本文所述的靶基因组基因座的各种遗传修饰可使用
Figure BDA0003422664410000313
遗传工程技术,使用衍生自细菌人工染色体(BAC)DNA的LTVEC在细菌细胞中通过一系列同源重组反应(BHR)来进行(参见例如,美国专利号6,586,251和Valenzuela,D.M.等人(2003),Nature Biotechnology 21(6):652-659,所述专利和文献以引用的方式整体并入本文)。
在一些实施方案中,包含如本文所述的各种遗传修饰的靶向多能和/或全能细胞用作插入供体细胞并经由
Figure BDA0003422664410000314
方法被引入来自对应生物体(例如8细胞期小鼠胚胎)的前桑椹胚阶段胚胎中(参见例如,US 7,576,259、US 7,659,442、US 7,294,754和US 2008-0078000 A1,所述全部专利以引用的方式整体并入本文)。将包含遗传修饰的多能和/或全能细胞的非人动物胚胎孵育至囊胚阶段,然后植入代孕母体中以产生F0代。在一些实施方案中,将包含如本文所述的各种遗传修饰的靶向哺乳动物ES细胞引入囊胚阶段胚胎中。可经由如本文所述的等位基因修饰(MOA)测定来鉴定带有遗传修饰的基因组基因座(即TARDBP基因座)的非人动物。将所得的衍生自遗传修饰的多能和/或全能细胞的F0代非人动物与野生型非人动物杂交以获得F1代后代。在用特定引物和/或探针进行基因分型后,将对于遗传修饰的基因组基因座杂合的F1非人动物彼此杂交以产生对于遗传修饰的基因组基因座纯合的F2代非人动物后代。
在一个实施方案中,提供了一种用于制备包含突变TARDBP基因的细胞的方法。此方法包括:(a)使多能细胞与靶向构建体接触,所述靶向构建体包含突变TARDBP基因或其被5'和3'同源臂侧接的突变部分;其中所述靶向构建体与细胞基因组中的TARDBP基因座进行同源重组以形成修饰的多能细胞。制备非人动物的方法还包括(b)将修饰的多能细胞引入到宿主胚胎中;(c)在代孕母体中孕育宿主胚胎,其中所述代孕母体产生包含修饰的TARDBP基因座的后代,其中所述遗传修饰导致缺乏功能性结构域的突变体TDP-43多肽。
在一些实施方案中,包含突变TARDBP基因的细胞可通过修饰ES细胞以包含突变TARDB基因并在分化培养基中体外培养ES细胞来制备。在一些实施方案中,体外培养ES细胞包括将ES细胞分化成原始外胚层细胞或胚胎干细胞衍生的运动神经元(ESMN)。
细胞和动物
本文公开的细胞(其可包含在非人动物组织或非人动物内)可以是包含如本文公开的突变TARDBP基因的任何类型的细胞。细胞可包含突变的非人动物TARDBP基因(例如,非人动物的突变TARDBP基因)或突变的人TARDBP基因。
细胞可包含编码突变体TDP-43多肽的突变的TARDBP基因,其中所述突变体TDP-43多肽缺乏功能性结构域,并且其中所述细胞表达突变体TDP-43多肽。例如,细胞可包含编码缺乏功能性结构域的突变体TDP-43多肽的突变TARDBP基因,所述功能性结构域包括核定位信号(NLS)、RNA识别基序1(RRM1)、RNA识别基序2(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)或它们的组合。细胞可包含突变TARDBP基因,其编码由于以下一项或多项而缺乏功能性结构域的突变体TDP-43多肽:(a)NLS中氨基酸的点突变(例如,K82A、K83A、R84A、K95A、K97A、K98A或它们的组合),(b)RRM1中氨基酸的点突变(例如F147L和/或F149L),(c)RRM2中氨基酸的点突变(F194L和/或F229L),(d)核输出信号的至少一部分的缺失(例如,在野生型TDP-43蛋白的位置239和250处及其之间的氨基酸的缺失),和(e)朊病毒样结构域的至少一部分的缺失(例如,在野生型TDP-43多肽的位置274和414处及其之间的氨基酸的缺失)。细胞可包含编码突变体TDP-43多肽的突变TARDBP基因,所述突变体TDP-43多肽包含以下突变:K82A、K83A、R84A、K95A、K97A和K98A,其中所述突变体TDP-43多肽缺乏功能性NLS。细胞可包含编码突变体TDP-43多肽的突变TARDBP基因,所述突变体TDP-43多肽包含在野生型TDP-43多肽的位置274至414位处的氨基酸之间并包括所述位置处的氨基酸的缺失,其中突变体TDP-43多肽缺乏功能性PLD。细胞可包含编码突变体TDP-43多肽的突变TARDBP基因,所述突变体TDP-43多肽包含点突变F147L和F149L,其中所述突变体TDP-43多肽缺乏功能性RRM1。细胞可包含编码突变体TDP-43多肽的突变TARDBP基因,所述TDP-43突变多肽包含点突变F194L和F229L,其中所述突变体多肽缺乏功能性RRM2。细胞可包含编码突变体TDP-43多肽的突变TARDBP基因,所述突变体TDP-43多肽包含在野生型TDP-43多肽的位置239和250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号的缺失,其中突变体TDP-43多肽缺乏功能性E。
细胞可包含突变TARDBP基因,其包含敲除突变,例如条件性敲除突变、TARDBP基因的整个编码序列的缺失等。细胞可包含突变TARDBP基因,其包含条件性敲除突变,例如,突变TARDBP基因可包含位点特异性重组识别序列,例如loxp序列。细胞可包含突变TARDBP基因,其包含侧接包含TDP-43编码序列的外显子(例如外显子3)的loxp序列。细胞可包含突变TARDBP基因,其包含loxp序列并且缺乏TDP-43编码序列,例如外显子3。细胞可包含突变TARDBP基因,其缺乏整个TDP-43编码序列,例如包含缺失TDP-43多肽的整个编码序列的突变TARDBP基因。
在一些实施方案中,细胞可包含突变TARDBP基因,其插入在内源性TARDBP基因座处,例如,在其种系基因组中。在一些实施方案中,细胞包含突变TARDBP基因,例如包含敲除突变的突变TARDBP基因和/或编码突变体TDP-43多肽的突变TARDBP基因,其在内源性TARDBP基因座处替换内源性TARDBP基因。在一些实施方案中,突变TARDBP基因与内源性TARDBP启动子和/或调控元件可操作地连接。
对于突变TARDBP基因,细胞可以是杂合的或纯合的。二倍体生物具有两个等位基因,在一对同源染色体的每个遗传基因座处都有一个等位基因。每一对等位基因表示特定遗传基因座的基因型。如果在特定基因座处存在两个相同的等位基因,则基因型被描述为纯合的,并且如果两个等位基因不同,则基因型被描述为杂合的。
细胞可包含(i)在内源性TARDBP基因座处内源性TARDBP基因被编码突变体TDP-43多肽的突变的TARDBP基因替换,和(ii)在同源染色体的其他内源性TARDPP基因座处的包含敲除突变的突变TARDBP基因。
包含突变TARDBP基因的细胞可表达由其编码的突变体TDP-43多肽。包含突变TARDBP基因并表达由其编码的突变体TDP-43多肽的细胞可表达或不表达野生型TDB-43多肽。
包含突变TARDBP基因的细胞可表达由其编码的突变体TDP-43多肽,并且特征可在于以下一项或多项:(i)突变TARDBP基因的mRNA转录物水平与对照细胞中野生型TARDBP基因的mRNA转录物水平的水平相当,(ii)与对照细胞中野生型TDP-43多肽的水平相比,突变体TDP-43多肽的水平增加,(iii)发现突变体TDP-43多肽在细胞的细胞质中的浓度高于细胞核中的浓度,(iv)突变体TDP-43多肽与野生型TDP-43多肽相比表现出增加的不溶性,(v)包含突变体TDP43多肽的细胞质聚集体,(vi)与表达野生型TDP-43的细胞相比,基因的隐藏外显子的剪接增加,(vii)缺乏编码TDP-43 PLD的序列的可变剪接的TDP-43 mRNA的水平降低。
细胞可在体外培养,可在离体或体内进行检查。例如,细胞可以在动物体内。
细胞可以是真核细胞,其包括例如真菌细胞(例如酵母)、植物细胞、动物细胞、哺乳动物细胞、非人哺乳动物细胞和人细胞。术语“动物”包括动物界的任何成员,包括例如哺乳动物、鱼类、爬行动物、两栖动物、鸟类和蠕虫。哺乳动物细胞可以是例如非人哺乳动物细胞、啮齿动物细胞、大鼠细胞、小鼠细胞或仓鼠细胞。其他非人哺乳动物包括例如非人灵长类动物、猴、猿、猩猩、猫、狗、兔、马、公牛、鹿、野牛、牲畜(例如牛物种,诸如母牛、阉牛等;羊物种,诸如绵羊、山羊等;以及猪物种,诸如猪和公猪)。鸟类包括例如鸡、火鸡、鸵鸟、鹅、鸭等。还包括家养动物和农业动物。术语“非人”不包括人类。在一些实施方案中:动物可以是人或非人动物,包括但不限于小鼠、大鼠、兔、狗、猫、猪以及非人灵长类动物,包括但不限于猴和黑猩猩。在一些实施方案中,非人动物细胞是啮齿动物细胞,例如大鼠细胞或小鼠细胞。
非人动物可来自任何遗传背景。例如,合适的小鼠可来自129品系、C57BL/6品系、129和C57BL/6的混合、BALB/c品系或Swiss Webster品系。129品系的实例包括129P1、129P2、129P3、129X1、129S1(例如129S1/SV、129S1/Svlm)、129S2、129S4、129S5、129S9/SvEvH、129S6(129/SvEvTac)、129S7、129S8、129T1和129T2。参见例如Festing等人(1999)Mammalian Genome 10:836,所述文献出于所有目的以引用的方式整体并入本文。C57BL品系的实例包括C57BL/A、C57BL/An、C57BL/GrFa、C57BL/Kal_wN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola。合适的小鼠还可来自上述129品系和上述C57BL/6品系的混合(例如,50%129和50%C57BL/6)。同样,合适的小鼠可来自上述129品系的混合或上述BL/6品系的混合(例如,129S6(129/SvEvTac)品系)。
类似地,大鼠可来自任何大鼠品系,包括例如ACI大鼠品系、Dark Agouti(DA)大鼠品系、Wistar大鼠品系、LEA大鼠品系、Sprague Dawley(SD)大鼠品系或Fischer大鼠品系,诸如Fisher F344或Fisher F6。大鼠还可从衍生自上述两种或更多种品系的混合的品系获得。例如,合适的大鼠可来自DA品系或ACI品系。ACI大鼠品系的特征在于具有黑野灰色,且腹部和足部为白色以及RT1av1单倍型。此类品系可获自多种来源,包括HarlanLaboratories。Dark Agouti(DA)大鼠品系的特征在于具有野灰色皮毛和RT1av1单倍型。此类大鼠可获自多种来源,包括Charles River和Harlan Laboratories。一些合适的大鼠可来自近交大鼠品系。参见例如,US 2014/0235933,所述专利出于所有目的以引用的方式整体并入本文。
细胞还可以是任何类型的未分化或分化状态。例如,细胞可以是全能细胞、多能细胞(例如人多能细胞或非人多能细胞,诸如小鼠胚胎干(ES)细胞或大鼠ES细胞),或非多能细胞。全能细胞包括可产生任何细胞类型的未分化细胞,并且多能细胞包括具有发育成多于一种分化细胞类型的能力的未分化细胞。此类多能和/或全能细胞可以是例如ES细胞或类ES细胞,诸如诱导的多能干(iPS)细胞。ES细胞包括胚胎衍生的全能或多能细胞,其能够在引入胚胎中之后有利于发育胚胎的任何组织。ES细胞可衍生自囊胚的内细胞团,并且能够分化成三个脊椎动物胚层(内胚层、外胚层和中胚层)中的任一个的细胞。
细胞还可衍生自ES细胞。例如,细胞可以是神经元细胞(例如,ES细胞衍生的运动神经元(ESMN))、原始外胚层样细胞、胚状体细胞等。
本文提供的细胞还可以是生殖细胞(例如,精子或卵母细胞)。细胞可以是有丝分裂感受态细胞或有丝分裂无活性细胞、减数分裂感受态细胞或减数分裂无活性细胞。类似地,细胞还可以是原代体细胞或不是原代体细胞的细胞。体细胞包括不是配子、生殖细胞、配子体或未分化干细胞的任何细胞。
本文提供的合适的细胞还包括原代细胞。原代细胞包括直接从生物体、器官或组织分离而来的细胞或细胞的培养物。原代细胞包括既不是转化也不是永生的细胞。它们包括从生物体、器官或组织获得的先前未在组织培养物中传代或先前已在组织培养物中传代但是不能够无限在组织培养物中传代的任何细胞。
本文提供的其他合适的细胞包括永生化细胞。永生化细胞包括来自多细胞生物体的细胞,它们通常不会无限增殖,但由于突变或改变,已经避开了正常的细胞衰老,反而可以继续进行分裂。此类突变或改变可天然地发生或有意地进行诱导。多个类型的永生化细胞是众所周知的。永生化或原代细胞包括通常用于培养或用于表达重组基因或蛋白质的细胞。
本文提供的细胞还包括单细胞阶段胚胎(即受精卵母细胞或受精卵)。此类单细胞阶段胚胎可来自任何遗传背景(例如,对于小鼠的BALB/c、C57BL/6、129或它们的组合),可以是新鲜的或冷冻的,并且可衍生自自然育繁育或体外受精。
采用表达突变体TDP-43多肽的系统的方法
包含突变TARDBP基因并表达如本文所述的由其编码的缺乏功能性结构域的突变体TDP-43多肽的细胞和非人动物(以及包含此类细胞的组织或动物)提供了用于研究TDP-43的结构域功能和/或TDP-43蛋白病的模型。例如,包含突变TARDBP基因并表达由其编码的缺乏功能性结构域的突变体TDP-43多肽的细胞或非人动物可表现出TDP-43蛋白病的表型特征。在一些实施方案中,例如(a)胚胎干细胞衍生的运动神经元(ESMN),其包含突变TARDBP基因并表达由其编码的缺乏功能性结构域的突变体TDP-43多肽和/或(b)从非人类动物中分离的,其在内源性TARDBP基因座处包含用突变TARDBP基因替换内源性TARDBP基因并由其表达突变体TDP-43多肽的细胞的特征可在于以下一项或多项:(i)突变TARDBP基因的mRNA转录物水平与对照细胞中野生型TARDBP基因的mRNA转录物水平相当,(ii)与对照细胞中野生型TDP-43多肽的水平相比,突变体TDP-43多肽的水平增加,(iii)发现突变体TDP-43多肽在细胞的细胞质中的浓度高于细胞核中的浓度,(iv)突变体TDP-43多肽与野生型TDP-43多肽相比表现出增加的不溶性,(v)包含突变体TDP 43多肽的细胞质聚集体,(vi)与表达野生型TDP-43的细胞相比,基因的隐藏外显子的剪接增加,(vii)缺乏编码TDP-43 PLD的序列的可变剪接的TDP-43 mRNA的水平降低。
因此,包含突变TARDBP基因并表达如本文所述的由其编码的缺乏功能性结构域的突变体TDP-43多肽的细胞(以及包含此类细胞的组织或动物)还提供了用于鉴定用于治疗、预防和/或抑制TDP-43蛋白病(例如,突变体TDP-43多肽的细胞质积累)的一种或多种症状的治疗候选剂和/或恢复野生型TDP-43多肽的生物学功能(例如,阻遏隐藏外显子剪接和/或增加可变剪接的TDP-43 mRNA的水平)。在一些实施方案中,通过使包含突变TARDBP基因并表达由其编码的缺乏功能性结构域的突变体TDP-43多肽的细胞与治疗候选剂接触来确定治疗剂的作用。接触可在体外进行。接触可包括向动物施用治疗候选剂。
在一些实施方案中,进行测定包括确定对与药物接触的细胞或动物的表型和/或基因型的作用。在一些实施方式中,进行测定包括确定药物的批次间变异性(在一些实施方案中,进行测定包括确定对与所施用的药物接触的本文所述的细胞或动物的作用与对照细胞或动物(例如,表达野生型TDP-43)的作用之间的差异)。
可在非人动物中(或在从其分离而来的细胞中和/或使用从其分离而来的细胞)测量以评估药物的药代动力学特性的示例性参数包括但不限于凝集、自噬、细胞分裂、细胞死亡、补体-介导的溶血、DNA完整性、药物特异性抗体滴度、药物代谢、基因表达阵列、代谢活性、线粒体活性、氧化应激、吞噬作用、蛋白质生物合成、蛋白质降解、蛋白质分泌、应激反应、靶组织药物浓度、非靶组织药物浓度、转录活性等。
选择性减少全长TDP-43 mRNA的寡核苷酸
图11A示出了全长TDP-43前体mRNA,以及发生在其3'末端的正常(上图)和可变(下图)剪接事件。如图所示,外显子6编码由正常剪接事件形成的全长TDP-43蛋白中的朊病毒样结构域(PLD),其编码序列终止于PLD的末端。两个新的外显子(7和8)由从外显子6内至少三个可变5'剪接位点之一至下游可变3'剪接位点(例如与新外显子7相邻)的可变剪接事件形成。有证据证明从可变外显子7至可变外显子8的第二可变剪接事件。
在小鼠中,本文所述的外显子6内或开始处的可变5'剪接位点被映射至以下位置:(a)4号染色体:148,618,647;(b)4号染色体:148,618,665;和(c)4号染色体:148,618,674。外显子7中的可变3'剪接位点被映射至位置4号染色体:148,617,705。从外显子7至外显子8的第二可变剪接事件发生在从4号染色体:148,617,566至4号染色体:148,616,844。技术人员将能够确定其他TARDBP基因(例如人TARDBP基因)中类似的可变5'和3'剪接位点。
从外显子6内的可变5'剪接位点至下游可变3'剪接位点的可变剪接预测会产生一种mRNA,其中的大部分PLD编码序列被编码缺乏PLD的TDP-43多肽的序列替换。例如,来自(a)4号染色体:148,618,647;(b)4号染色体:148,618,665;和(c)4号染色体:148,618,674至4号染色体:148,617,705(以及人TARDBP基因中的任何对应位置)中任一项的可变剪接可产生一种mRNA,其中的大部分PLD编码序列被可变mRNA替换,所述可变mRNA预测会编码截短形式的缺乏PLD的TDP-43,其中所述PLD被18个氨基酸替换。此第二可变剪接事件不会产生任何新形式的TDP-43蛋白质,因为开放阅读框在外显子7 5'-剪接位点上游的外显子7处停止。
观察到缺乏PLD的TDP-43可支持活力,尤其是在运动神经元中,并且在表达ΔPLD或ΔNLS突变的TARDBP基因的细胞中这种可变剪接的TDP-43 mRNA水平连同其ALS样表型减少,表明这种可变剪接的TDP-43 mRNA及其翻译的截短产物不会导致TDP-43蛋白病,并且可针对TDP-43蛋白病具有保护作用。被设计成消除编码含有PLD的蛋白质形式的TDP-43 mRNA同工型或使其失活的siRNA、反义寡核苷酸和/或CRISPR/Cas9系统的应用可耗尽易于发生病理性聚集的TDP-43变体,同时保留产生截短的不含PLD的TDP-43蛋白的可变剪接mRNA。TDP-43的截短形式可对病理性聚集具有抗性,同时仍支持细胞生命,尤其是运动神经元的活力。
因此,治疗策略将由以下组成:寻找仅靶向包含编码PLD的序列的那些TDP-43mRNA序列(例如包含由在外显子6内的可变剪接位点之后的基因组序列编码的序列的那些mRNA)的活性反义寡核苷酸(ASO)或siRNA。作为一个非限制性实例,ASO或siRNA可靶向那些包含由在编码导致PLD结构域剪掉的可变5'剪接位点的密码子之后的TARDBP基因转录的序列的mRNA。被设计成靶向TDP-43 mRNA的此区域的ASO或siRNA将仅识别编码包含PLD的TDP-43多肽的全长TDP-43 mRNA,同时保留编码截短的和潜在受保护的缺乏PLD的TDP-43多肽的可变剪接的TDP-43 mRNA。换句话说,此类ASO或siRNA不应能够识别可变剪接的TDP-43mRNA或增强其降解。ASO或siRNA可靶向编码TDP-43多肽的氨基酸287-414的TDP-43 mRNA序列,或外显子7的3'可变剪接位点上游的任何3'非翻译区。ASO可通过RNA酶H介导的切割(例如经由-5-10-5间隔体)促进所述mRNA的降解。siRNA可通过RNA干扰促进mRNA降解和/或蛋白质合成。
另一种治疗策略将是应用CRISPR/Cas系统选择性地靶向和缺失跨越TARDBP基因的外显子6内的可变5'剪接位点和下游3'剪接位点(例如外显子7处)的基因组序列。以此方式,仅编码截短的缺乏PLD的TDP-43多肽的mRNA可被转录。
A.反义寡核苷酸和siRNA
靶向前体mRNA内的序列的反义寡核苷酸(ASO)和小干扰RNA(siRNA)可增强不需要的同工型的降解。如本文所设计,ASO或siRNA可以用于破坏编码PLD的TDP-43 mRNA,同时保留可变剪接的TDP-43 mRNA。为了仅降低全长TDP-43 mRNA的水平,ASO或siRNA可靶向包含外显子6内的可变5'剪接位点至(ii)下游可变3'剪接位点之间的序列的TDP-43 mRNA,例如,包含编码TDP-43多肽的氨基酸287-414的序列和/或可变剪接位点上游的任何3'非翻译区的TDP-43 mRNA。参见,图11A。在一些实施方案中,外显子6内的可变5'剪接位点与选自由以下组成的组的TARDBP基因组位置相关:(a)小鼠4号染色体:148,618,647;(b)小鼠4号染色体:148,618,665;(c)小鼠4号染色体:148,618,674,和(d)人TARDBP基因中的任何对应位置。在一些实施方案中,下游可变3'剪接位点与小鼠4号染色体:148,617,705或人TARDBP基因中的对应位置相关。
靶向编码PLD的TDP-43 mRNA序列的反义寡核苷酸或siRNA可具有以模式或基序排列的化学修饰的亚基,以赋予所述反义寡核苷酸以下特性,诸如增强的抑制活性、增加的对靶核酸的结合亲和力、或对体内核酸酶降解的抗性。
反义寡核苷酸通常含有至少一个被修饰以便赋予增加的对核酸酶降解的抗性、增加的细胞吸收、增加的对靶核酸的结合亲和力和/或增加的抑制活性的区域。反义寡核苷酸的第二区域可任选充当细胞核酸内切酶RNA酶H的底物,所述RNA酶H切割RNA:DNA双链体的RNA链。
在某些实施方案中,反义寡核苷酸是均一的糖修饰的寡核苷酸。反义寡核苷酸可包含间隔体基序。在间隔体中,具有多个支持RNA酶H切割的核苷酸的内部区域位于具有多个在化学上与内部区域的核苷不同的核苷酸的外部区域之间。在具有间隔体基序的反义寡核苷酸的情况下,间隔区段一般充当核酸内切酶切割的底物,而翼区段包含修饰的核苷。在某些实施方案中,间隔体的区域由包含每个不同区域的糖部分的类型来区分。在一些实施方案中,用于区分间隔体区域的糖部分的类型可包括β-D-核糖核苷、β-D-脱氧核糖核苷、2'-修饰的核苷(此类2'-修饰的核苷可包括2'-MOE和2'-O--CH3等)和双环糖修饰的核苷。在某些实施方案中,翼可包括若干修饰的糖部分,包括例如2'-MOE。在某些实施方案中,翼可包括若干修饰的和未修饰的糖部分。在某些实施方案中,翼可包括2'-MOE核苷和2'-脱氧核糖核苷的各种组合。
每个不同区域可包含均一的糖部分、变异或交替的糖部分。翼-间隔-翼基序经常被描述为“X-Y-Z”,其中“X”表示5'翼的长度,“Y”表示间隔的长度,并且“Z”表示3'翼的长度。“X”和“Z”可包含均一的、变异或交替的糖部分。在某些实施方案中,“X”和“Y”可包括一种或多种2'-脱氧核糖核苷。“Y”可包括2'-脱氧核糖核苷。如本文所用,描述为“X-Y-Z”的间隔体具有一定构型以使得所述间隔定位成紧邻5'翼和3'翼中的每一个。因此,在5'翼与间隔之间,或间隔与3'翼之间不存在间插核苷酸。本文所述的反义化合物中的任一种均可具有间隔体基序。在某些实施方案中,“X”与“Z”相同;在其他实施方案中,它们不同。在某些实施方案中,Y介于8与15个核苷之间。X、Y或Z可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个或更多个核苷中的任一个。因此,本文所述的间隔体包括但不限于例如5-10-5、5-10-4、4-10-4、4-10-3、3-10-3、2-10-2、5-9-5、5-9-4、4-9-5、5-8-5、5-8-4、4-8-5、5-7-5、4-7-5、5-7-4或4-7-4。
靶向编码PLD的TDP-43 mRNA序列的反义寡核苷酸可具有5-10-5间隔体基序。
靶向编码PLD的TDP-43 mRNA序列的反义寡核苷酸可包含间隔变窄的基序。靶向TDP-43 mRNA的间隔变窄的反义寡核苷酸可具有9、8、7或6个2'-脱氧核苷酸的间隔区段,所述间隔区段定位成紧邻5、4、3、2或1个化学修饰的核苷的翼区段并位于它们之间。化学修饰的核苷可包含双环糖。双环糖可包含选自以下的4'至2'桥:4'-(CH2)n-O-2'桥,其中n是1或2;和4'-CH2-O--CH2-2'。双环糖可包含4'-CH(CH3)-O-2'桥。化学修饰可包含非双环2'-修饰的糖部分,例如2'-O-甲基乙基或2'-O-甲基。在一些实施方案中,反义寡核苷酸包含靶向可变5'与3'剪接位点之间的TDP-43 mRNA序列的间隔体基序,其中所述可变5'剪接位点在外显子6内,例如,其中所述可变5'剪接位点位点与选自由以下组成的组的TARDBP基因组位置相关:(a)小鼠4号染色体:148,618,647;(b)小鼠4号染色体:148,618,665;(c)小鼠4号染色体:148,618,674,和(d)人TARDBP基因中的任何对应位置,并且其中所述可变3'剪接点与4号染色体:148,617,705的TARDBP基因组位置相关。在一些实施方案中,siRNA包含靶向可变5'与3'剪接位点之间的TDP-43 mRNA序列的序列,其中所述可变5'剪接位点在外显子6内,例如,其中所述可变5'剪接位点位点与选自由以下组成的组的TARDBP基因组位置相关(a)小鼠4号染色体:148,618,647;(b)小鼠4号染色体:148,618,665;(c)小鼠4号染色体:148,618,674,和(d)人TARDBP基因中的任何对应位置,并且其中所述可变3'剪接点与4号染色体:148,617,705的TARDBP基因组位置相关。
可均一修饰靶向编码PLD的TDP-43 mRNA序列的反义寡核苷酸或siRNA。在某些实施方案中,每个核苷都是化学修饰的。在某些实施方案中,化学修饰包含非双环2'-修饰的糖部分。在某些实施方案中,2'-修饰的糖部分包含2'-O-甲氧基乙基。在某些实施方案中,2'-修饰的糖部分包含2'-O-甲基。
ASO或siRNA还可共价连接至一个或多个增强所得ASO或siRNA的活性、细胞分布或细胞摄取的部分或缀合物。典型缀合物基团包括胆固醇部分和脂质部分。另外的缀合物基团包括碳水化合物、磷脂、生物素、啡嗪、叶酸、啡啶、蒽醌、吖啶、荧光素、若丹明、香豆素和染料。
ASO或siRNA还可被修饰成具有一个或多个一般连接至一个或两个末端的稳定基团。稳定基团中包括帽结构。这些末端修饰保护具有末端核酸的ASO或siRNA免于外切核酸酶降解,并且可有助于细胞内的递送和/或定位。所述帽可存在于5'末端(5'帽)或3'末端(3'帽),或者可存在于两个末端上。帽结构是众所周知的并且包括例如反向脱氧无碱基帽。
ASO或siRNA可以是适用于结合靶核酸(例如,TDP-43前体mRNA)并具有期望作用的任何长度。例如,ASO的长度可以是约12至约30、约12至约24、约13至约23、约14至约22、约15至约21、约16至约20、约17至约19、或约18个核苷。作为另一个实例,ASO可以是约8至约80、约12至约50、约15至约30、约18至约24、约19至约22、或约20个连接的核苷。可选地,ASO的长度可以是约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30、约31、约32、约33、约34、约35、约36、约37、约38、约39、约40、约41、约42、约43、约44、约45、约46、约47、约48、约49、约50、约51、约52、约53、约54、约55、约56、约57、约58、约59、约60、约61、约62、约63、约64、约65、约66、约67、约68、约69、约70、约71、约72、约73、约74、约75、约76、约77、约78、约79或约80个连接的核苷。例如,ASO可由约15、约16、约17、约18、约19、约20、约21、约22、约23、约24或约25个连接的核苷组成。在一个具体实例中,ASO可以是约15至约25个连接的核苷。
ASO或siRNA可与靶核酸(例如,TDP-43前体mRNA,例如,编码PLD的mRNA序列)互补和/或特异性杂交。当ASO的足够数量的核碱基能够与靶核酸的对应核碱基氢键合时,ASO和靶核酸彼此互补,从而产生所期望的作用。可特异性杂交是指ASO在ASO与靶核酸之间具有足够程度的互补性以诱导所期望的作用,同时在期望特异性结合的条件(例如,在生理条件下)下对非靶核酸表现出最小作用或没有作用。
一些ASO或siRNA与TDP-43前体mRNA的等长部分至少约70%、至少约75%、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%互补。可选地,ASO可与TDP-43前体mRNA的等长部分约100%互补。可使用常规方法确定ASO与靶核酸的互补性百分比。例如,其中ASO的20个核碱基中有18个核碱基与靶区域互补并且因此会特异性杂交的ASO,将表示90%互补性。可使用众所周知的BLAST程序(基本局部比对搜索工具)和PowerBLAST程序常规确定ASO与靶核酸区域的互补性百分比(参见例如,Altschul等人(1990)J.Mol.Biol.215:403 410和Zhang和Madden(1997)Genome Res.7:649-656)。同源性、序列同一性或互补性百分比可通过例如Gap程序(Wisconsin序列分析包,用于Unix的版本8,Genetics Computer Group,UniversityResearch Park,Madison Wis.)使用默认设置来确定,所述程序使用Smith和Waterman算法(Adv.Appl.Math.,1981,2,482489)。
ASO或siRNA与TDP-43前体mRNA之间的非互补核碱基可以是包容性的,前提是所述ASO或siRNA仍然能够与靶核酸特异性杂交。而且,ASO或siRNA可在TDP-43前体mRNA的一个或多个区段上杂交,以使得间插区段或相邻区段不参与杂交事件(例如环结构、错配或发夹结构)。非互补核碱基的位置可能位于ASO或siRNA的5'末端或3'末端。可选地,所述一个或多个非互补核碱基可位于ASO或siRNA的内部位置。当存在两个或更多个非互补核碱基时,它们可以是连续的(即连接的)或非连续的。
B.缺失编码TDP-43 PLD的基因组序列
如本文所示,尽管仅表达缺乏功能性PLD的突变体TDP-43多肽,但细胞仍然有活力。本文还描述了成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关(Cas)系统,或CRISPR/Cas系统的一个或多个组分,其可以用于从细胞(例如胚胎干细胞)中缺失如本文所述的内源性TARDBP基因座处的蛋白样结构域(或其部分)。CRISPR/Cas系统可从细胞(例如胚胎干细胞)中缺失位于或靠近外显子6的短形式的5'剪接位点处和位于或靠近外显子7的3'剪接位点处的基因组序列。此类组分包括例如Cas蛋白和/或指导RNA(gRNA),所述gRNA可包括两个单独的RNA分子;例如,靶向RNA(例如CRISPR RNA(crRNA)和激活RNA(例如tracrRNA);或单指导RNA(例如单分子gRNA(sgRNA))。在一些实施方案中,CRISPR/Cas系统包含Cas9蛋白和至少一种gRNA,其中所述gRNA识别位于或靠近TARDBP基因组位置处的序列,所述基因组位置选自由以下组成的组:(a)4号染色体:148,618,647;(b)4号染色体:148,618,665;(c)4号染色体:148,618,674,(d)4号染色体:148,617,705和它们的组合。
CRISPR/Cas系统包括转录物和其他参与Cas基因表达或引导其活动的元件。CRISPR/Cas系统可以是例如I型系统、II型系统或III型系统。可选地,CRISPR/Cas系统可以是V型系统(例如,V-A亚型或V-B亚型)。在如本文所述的内源性TARDBP基因座处的编码TDP-43朊病毒样结构域(或其部分)的序列、或5'可变剪接点(例如,编码氨基酸288的序列)和3'可变剪接点(例如,与可变外显子7相邻)之间的序列,可通过利用CRISPR复合物(包含与Cas蛋白复合的指导RNA(gRNA))进行核酸的定点切割来缺失。
如本文所述的CRISPR/Cas系可统包含Cas蛋白(例如,Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1或Csx12)、Cas10、Casl0d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、Cu1966及其同源物或修饰型式)和/或一种或多种靶向gRNA识别序列的指导RNA(gRNA)。如本文所述的CRISPR/Cas系统还可包含至少一种表达构建体,其包含编码Cas蛋白的核酸(例如,其能够可操作地连接至启动子)和/或编码gRNA的DNA。
Cas蛋白对TARDBP基因的位点特异性结合和切割可发生在由以下两者确定的位置处:(i)gRNA与靶DNA之间的碱基配对互补性;以及(ii)靶DNA中被称作前间区序列邻近基序(PAM)的短基序。PAM可侧接指导RNA识别序列。任选地,指导RNA识别序列可被PAM在3'末端上侧接。可选地,指导RNA识别序列可被PAM在5'末端上侧接。例如,Cas蛋白的切割位点可以在PAM序列上游或下游约1个至约10个或约2个至约5个碱基对(例如3个碱基对)处。在一些情况下(例如当使用来自酿脓链球菌(S.pyogenes)的Cas9或密切相关的Cas9时),非互补链的PAM序列可以是5'-N1GG-3',其中N1是任何DNA核苷酸并且紧邻靶DNA的非互补链的指导RNA识别序列的3'。因而,互补链的PAM序列将是5'-CCN2-3',其中N2是任何DNA核苷酸并且紧邻靶DNA的互补链的指导RNA识别序列的5'。在一些此类情况下,N1和N2可以是互补的,并且N1-N2碱基对可以是任何碱基对(例如,N1=C且N2=G;N1=G且N2=C;N1=A且N2=T;或N1=T,且N2=A)。在来自金黄色葡萄球菌(S.aureus)的Cas9的情况下,PAM可以是NNGRRT或NNGRR,其中N可以是A、G、C或T,并且R可以是G或A。
如本文所公开,可以任何形式提供指导RNA。在一些实施方案中,gRNA可以RNA的形式提供,作为两个分子(单独的crRNA和tracrRNA)或作为一个分子(sgRNA),并且任选地以与Cas蛋白的复合物的形式提供。gRNA也可以编码gRNA的DNA的形式提供。在一些实施方案中,编码gRNA的DNA可编码单个RNA分子(sgRNA)或单独的RNA分子(例如单独的crRNA和tracrRNA)(其中单独的RNA分子可作为一个DNA分子提供,或作为分别编码crRNA和tracrRNA的单独的DNA分子提供)。
在一个实施方案中,如本文所述的CRISPR/Cas系统包含Cas9蛋白或衍生自II型CRISPR/Cas系统的Cas9的蛋白质和/或至少一个gRNA,其中所述至少一个gRNA由编码crRNA和/或tracrRNA的DNA编码。
可通过使细胞与Cas蛋白和一种或多种与靶基因组基因座内的一个或多个指导RNA识别序列杂交的指导RNA接触来产生靶向的遗传修饰。所述一个或多个指导RNA中的至少一个可与一个或多个指导RNA识别序列中的至少一个形成复合物并且可将Cas蛋白指导至所述一个或多个指导RNA识别序列中的至少一个,并且Cas蛋白可切割一个或多个指导RNA识别序列中的至少一个内的靶基因组基因座。由Cas蛋白引起的切割可产生双链断裂或单链断裂(例如,如果Cas蛋白是切口酶)。然后由双链断裂或单链断裂产生的末端序列可进行重组。
C.用于引入寡核苷酸的方法
本文提供了多种方法和组合物以允许将寡核苷酸引入细胞中。用于将寡核苷酸引入各种细胞类型中的方法是已知的,并且包括例如稳定转染方法、瞬时转染方法和病毒介导的方法。
转染方案以及用于将寡核苷酸引入细胞中的方案可以变化。非限制性转染方法包括基于化学的转染方法,其使用脂质体;纳米粒子;磷酸钙(Graham等人(1973)Virology 52(2):456–467,Bacchetti等人(1977)Proc.Natl.Acad.Sci.U.S.A.74(4):1590–1594,和Kriegler,M(1991).Transfer and Expression:A Laboratory Manual.New York:W.H.Freeman and Company.第96–97页);树枝状聚合物;或阳离子聚合物,诸如DEAE-葡聚糖或聚乙烯亚胺。非化学方法包括电穿孔、超音波穿孔和光学转染。基于粒子的转染包括使用基因枪或磁体辅助转染(Bertram(2006)Current Pharmaceutical Biotechnology 7,277–28)。还可使用病毒方法进行转染。
将寡核苷酸引入细胞中还可通过电穿孔、通过胞质内注射、通过病毒转染、通过腺病毒、通过腺相关病毒、通过慢病毒、通过逆转录病毒、通过转染、通过脂质介导的转染或通过核转染来介导。核转染是一种改进的电穿孔技术,它使得核酸底物不仅能够被递送到细胞质中,而且还能够通过核膜并进入细胞核中。另外,在本文公开的方法中使用核转染通常比常规电穿孔需要少得多的细胞(例如,与通过常规电穿孔需要7百万个细胞相比,核转染仅需要约2百万个细胞)。在一个实例中,使用
Figure BDA0003422664410000491
NUCLEOFECTORTM系统进行核转染。
将寡核苷酸引入细胞(例如,受精卵)中还可通过显微注射来完成。在受精卵(即单细胞阶段胚胎)中,显微注射可注射到母本和/或父本原核中或注射到细胞质中。如果显微注射仅注射到一个原核中,则父本原核由于其尺寸更大而是优选的。用于进行显微注射的方法是众所周知的。参见例如,Nagy等人(Nagy A,Gertsenstein M,Vintersten K,Behringer R.,2003,Manipulating the Mouse Embryo,Cold Spring Harbor,New York:Cold Spring Harbor Laboratory Press);另参见Meyer等人(2010)Proc.Natl.Acad.Sci.USA 107:15022-15026和Meyer等人(2012)Proc.Natl.Acad.Sci.USA109:9354-9359。
用于将寡核苷酸引入细胞中的其他方法可包括例如载体递送、粒子介导的递送、外泌体介导的递送、脂质纳米粒子介导的递送、细胞穿透肽介导的递送或可植入装置介导的递送。作为具体实例,可将寡核苷酸在载剂中引入细胞或非人类动物中,所述载剂诸如聚(乳酸)(PLA)微球、聚(D,L-乳酸-共乙醇酸)(PLGA)微球、脂质体、胶束、反胶束、脂质螺旋物和脂质微管。
寡核苷酸的引入还可通过病毒介导的递送来完成,诸如AAV介导的递送或慢病毒介导的递送。其他示例性病毒/病毒载体包括逆转录病毒、腺病毒、牛痘病毒、痘病毒和单纯疱疹病毒。病毒可感染分裂细胞、非分裂细胞或分裂细胞和非分裂细胞两者。病毒可整合到宿主基因组中,或者可选地不整合到宿主基因组中。此类病毒还可被工程化成降低免疫力。病毒可以是有复制能力的或可以是复制缺陷的(例如,在额外轮次病毒粒子复制和/或包装所必需的一个或多个基因中存在缺陷)。病毒可引起瞬时表达、长期表达(例如,至少1周、2周、1个月、2个月或3个月)或永久表达。示例性病毒滴度(例如,AAV滴度)包括1012、1013、1014、1015和1016个载体基因组/mL。
ssDNA AAV基因组由两个开放阅读框Rep和Cap组成,其被两个反向末端重复序列侧接使得允许合成互补的DNA链。当构建AAV转移质粒时,将转基因置于两个ITR之间,并且Rep和Cap可以反式提供。除了Rep和Cap,AAV还需要一个含有来自腺病毒的基因的辅助质粒。这些基因(E4、E2a和VA)介导AAV复制。例如,可将转移质粒、Rep/Cap和辅助质粒转染到含有腺病毒基因E1+的HEK293细胞中以产生感染性AAV颗粒。可选地,可将Rep、Cap和腺病毒辅助基因组合成单个质粒。类似的包装细胞和方法可用于其他病毒,诸如逆转录病毒。
已鉴定出多种AAV血清型。这些血清型在它们感染的细胞类型(即它们的趋性)方面不同,从而允许优先转导特定细胞类型。CNS组织的血清型包括AAV1、AAV2、AAV4、AAV5、AAV8和AAV9。心脏组织的血清型包括AAV1、AAV8和AAV9。肾组织的血清型包括AAV2。肺组织的血清型包括AAV4、AAV5、AAV6和AAV9。胰腺组织的血清型包括AAV8。感光细胞的血清型包括AAV2、AAV5和AAV8。视网膜色素上皮组织的血清型包括AAV1、AAV2、AAV4、AAV5和AAV8。骨骼肌组织的血清型包括AAV1、AAV6、AAV7、AAV8和AAV9。肝组织的血清型包括AAV7、AAV8和AAV9,尤其是AAV8。
趋性可通过假型包装进一步细化,所述假型包装是混合不同病毒血清型的衣壳和基因组。例如,AAV2/5表示含有包装在血清型5的衣壳中的血清型2的基因组的病毒。使用经假型包装的病毒可提高转导效率,以及改变趋性。衍生自不同血清型的混合衣壳也可用于改变病毒趋性。例如,AAV-DJ含有来自八种血清型的混合衣壳,并在体内广泛的细胞类型中展示出高感染性。AAV-DJ8是另一个实例,它展示出AAV-DJ的特性,但具有增强的大脑吸收。AAV血清型还可通过突变进行修饰。AAV2突变修饰的实例包括Y444F、Y500F、Y730F和S662V。AAV3突变修饰的实例包括Y705F、Y731F和T492V。AAV6突变修饰的实例包括S663V和T492V。其他经假型包装的/修饰的AAV变体包括AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5、AAV8.2和AAV/SASTG。
为了加速转基因表达,可使用自补AAV(scAAV)变体。由于AAV依赖于细胞的DNA复制机制来合成AAV单链DNA基因组的互补链,因此转基因表达可能会被延迟。为了解决这种延迟,可使用含有能够在感染时自发退火的互补序列的scAAV,从而消除对宿主细胞DNA合成的需要。然而,还可使用单链AAV(ssAAV)载体。
寡核苷酸的引入还可通过脂质纳米粒子(LNP)介导的递送来完成。脂质制剂可保护生物分子免于降解,同时改善它们的细胞吸收。脂质纳米粒子是包含通过分子间作用力彼此物理缔合的多个脂质分子的颗粒。这些脂质纳米粒子包括微球(包括单层和多层囊泡,例如脂质体)、乳液中的分散相、胶束或悬浮液中的内相。此类脂质纳米粒子可用于封装一种或多种用于递送的寡核苷酸。含有阳离子脂质的制剂可用于递送聚阴离子,诸如核酸。可包括的其他脂质是中性脂质(即不带电或两性离子脂质)、阴离子脂质、增强转染的辅助脂质和增加纳米粒子在体内存在的时间长度的隐形脂质。合适的阳离子脂质、中性脂质、阴离子脂质、辅助脂质和隐形脂质的实例可在WO 2016/010840 A1中找到,所述专利出于所有目的以引用的方式整体并入本文。
体内施用可通过任何合适的途径进行,包括例如胃肠外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌肉内。全身施用方式包括例如口服和胃肠外途径。胃肠外途径的实例包括静脉内、动脉内、骨内、肌肉内、皮内、皮下、鼻内和腹膜内途径。一个具体的实例是静脉输注。鼻腔滴注和玻璃体内注射是其他具体的实例。局部施用方式包括例如鞘内、脑室内、脑实质内(例如,局部实质内递送至纹状体(例如,进入尾状核或进入壳核)、大脑皮层、中央前回、海马体(例如,进入齿状回或CA3区)、颞叶皮层、杏仁核、额叶皮层、丘脑、小脑、髓质、下丘脑、顶盖、被盖或黑质)、眼内、眶内、结膜下、玻璃体内、视网膜下和经巩膜途径。与全身施用(例如静脉内)时相比,当局部施用(例如,脑实质内或玻璃体内)时,显著较少量的组分(与全身方法相比)即可发挥作用。局部施用方式还可以降低或消除在全身施用治疗有效量的组分时会发生的潜在毒副作用的发生率。
在细胞培养中用于促进试剂(例如反义寡核苷酸)摄取的一种常用方法涉及使用阳离子脂质转染核酸。将阳离子脂质与带负电荷的核酸混合得到复合物,所述复合物可穿过细胞膜并将活性核酸释放到细胞的细胞质中。将试剂(例如反义寡核苷酸)电穿孔到细胞中也是可能的。这种方法对于不易被脂质转染的细胞系非常有效和有用。
如果细胞在体内(例如在动物中),则可通过任何合适的手段向动物施用。例如,施用可包括胃肠外施用途径,诸如腹膜内、静脉内和皮下。胃肠外施用意指通过注射或输注来施用。胃肠外施用包括皮下施用、静脉内施用、肌肉内施用、动脉内施用、腹膜内施用或颅内施用(例如鞘内或脑室内施用)。
在一些方法中,施用是通过使得试剂被引入到达神经元或神经系统的手段。这可例如通过外周递送或通过直接递送至神经系统来实现。参见例如,Evers等人(2015)Adv.Drug Deliv.Res.87:90-103,所述文献出于所有目的以引用的方式整体并入本文。
为了使试剂(例如反义寡核苷酸)到达神经系统,它们首先必须穿过由血脑屏障或血脊髓屏障组成的血管屏障。可用于穿过血管屏障的一种机制是受体介导的内吞作用。另一种可使用的机制是基于细胞穿透肽(CPP)的递送系统。不同的CPP使用不同的细胞转位途径,这取决于细胞类型和递送物。例如,用富含精氨酸的CPP标记的全身递送的反义寡核苷酸能够穿过血脑屏障。可使用的另一种递送机制是外泌体,它是已知通过蛋白质和核酸的转移介导细胞之间的通讯的胞外囊泡。例如,用衍生自狂犬病病毒糖蛋白(RVG)的短病毒肽转导的外泌体的IV注射可导致穿过血脑屏障并递送至大脑。
还可使用通过直接输注到脑脊液中来绕过血管屏障的技术。例如,试剂(例如反义寡核苷酸)可被输注到脑室内(ICV),在这之后所述试剂(例如反义寡核苷酸)将必须通过排列在脑室系统内的室管膜细胞层以进入脑实质。鞘内(IT)递送意指将试剂(例如反义寡核苷酸)递送至脊髓的蛛网膜下腔中。从这里开始,试剂(例如反义寡核苷酸)将必须通过软脑膜进入脑实质。试剂(例如反义寡核苷酸)可通过连接至植入型药盒的出液导管进行ICT或IT递送。药物可注入药盒中并直接递送至CSF。鼻内施用是可使用的可选的递送途径。
本发明的范围由所附权利要求限定,并且不受本文所述的具体实施方式的限制;阅读本公开的本领域技术人员将意识到可等效于这样描述的实施方案或以其他方式在权利要求的范围内的各种修改。一般来说,除非另外明确指定,否则术语与其在本领域中理解的含义一致。本说明书中引用的参考文献或其相关部分以引用的方式整体并入本文。
在权利要求中使用诸如“第一”、“第二”、“第三”等序数术语来修改权利要求要素本身并不意味着一个权利要求要素相对于另一权利要求要素的任何优先权、优先级或顺序或执行方法的动作的时间顺序,而仅用作将具有特定名称的一个权利要求要素与具有相同名称的另一个要素(只针对序数术语的使用)区分开来的标记以区分权利要求要素。
除非明确作相反的指定,否则在说明书和权利要求中的冠词“一个/种(a/an)”应理解为包括复数指代对象。除非明确作相反的指定或另外从上下文明显看出,否则如果一个、多于一个或所有组成员存在于给定产品或方法中、被用于给定产品或方法中或以其他方式与给定产品或方法相关,则认为在组的一个或多个成员之间包括“或”的权利要求或描述得到了满足。本发明包括其中所述组中只有一个成员存在于给定产品或方法中、被用于给定产品或方法中或以其他方式与给定产品或方法相关的实施方案。本发明还包括其中多于一个或全部的组成员存在于给定产品或方法中、被用于给定产品或方法中或以其他方与给定的产品或方法相关的实施方案。此外,应理解,除非另外指定或除非对于本领域普通技术人员来说显然会出现矛盾或不一致,否则本发明涵盖所有变化、组合和排列,其中来自一个或多个所列权利要求的一个或多个限制、要素、条款、描述性术语等依赖于相同基础权利要求(或相关的任何其他权利要求)的另一权利要求中。在要素以清单形式(例如以马库什组(Markush group)或类似形式)呈现时,应理解,还公开了所述要素的每一个子组,并且任何一个或多个要素可从所述组中被去除。应理解,一般而言,在本发明或本发明的方面被称为包括特定要素、特征等的情况下,本发明的实施方案或本发明的方面由或基本上由此类要素、特征等组成。出于简单的目的,这些实施方案并未在每一种情况下在本文中用如此多的词来具体陈述。还应理解,本发明的任何实施方案或方面都可明确地被权利要求排除在外,无论在说明书中是否叙述了特定的排除。
“对照”包括“对照”的本领域理解的含义,作为比较结果的标准。通常,使用对照以便通过分离变量来增强实验的完整性,从而得到关于这些变量的结论。在一些实施方案中,对照是与测试反应或测定同时进行以提供比较物的反应或测定。“对照”还包括“对照动物”。“对照动物”可具有如本文所述的修饰、与本文所述不同的修饰或无修饰(即,野生型动物)。在一个实验中,应用了“测试”(即,变量被测试)。在第二实验中,没有应用“对照”(变量被测试)。在一些实施方案中,对照是历史对照(即,先前进行的测试或测定,或先前已知的量或结果)。在一些实施方案中,对照是或包括印刷的或以其他方式保存的记录。对照可以是阳性对照或阴性对照。
“确定”、“测量”、“评价”、“评估”、“测定”和“分析”包括任何形式的测量并且包括确定要素是否存在。这些术语包括定量和/或定性确定两者。测定可以是相对的或绝对的。“测定存在”可以是确定某物的存在量和/或确定它是否存在。
本文可互换使用的术语“核酸”和“多核苷酸”包括任何长度的核苷酸的聚合形式,包括核糖核苷酸、脱氧核糖核苷酸或其类似物或修饰型式。它们包括单链、双链和多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂合体以及包含嘌呤碱基、嘧啶碱基或其他天然、化学修饰、生物化学修饰、非天然或衍生化的核苷酸碱基的聚合物。
本文可互换使用的术语“蛋白质”、“多肽”和“肽”包括任何长度的氨基酸的聚合形式,包括编码和非编码的氨基酸和化学或生物化学修饰或衍生化的氨基酸。所述术语还包括已被修饰的聚合物,诸如具有修饰肽骨架的多肽。术语“结构域”是指具有特定功能或结构的蛋白质或多肽的任何部分。除非另有说明,否则本文提及的任何结构域均指TDP-43结构域。
术语“野生型”包括具有在正常(与突变、患病、改变等相比)状态或情形下发现的结构和/或活性的实体。野生型基因和多肽通常以多种不同形式(例如等位基因)存在。
术语“内源性”是指在细胞或动物内发现或天然存在的定位、核酸或氨基酸序列。例如,非人动物的内源性TARDBP序列是指天然存在于非人动物的内源性TARDBP基因座处的野生型TARDBP序列。
术语“基因座”是指基因(或重要序列)、DNA序列、多肽编码序列或位置在生物体基因组染色体上的特定定位。例如,“TARDBP基因座”可以指TARDBP基因、TARDBP DNA序列、TARDBP 2编码序列或TARDBP位置在已被鉴定为此类序列所在的生物体基因组染色体上的特定定位。“TARDBP基因座”可包含TARDBP基因的调控元件,包括例如增强子、启动子、5'和/或3'非翻译区(UTR)或它们的组合。
术语“基因”是指染色体中编码产物(例如,RNA产物和/或多肽产物)并包括被非编码内含子中断的编码区和位于5'和3'末端的编码区附近的序列的DNA序列,使得所述基因对应于全长mRNA(包括5’和3'非翻译序列)。基因的其他非编码序列包括调控序列(例如,启动子、增强子和转录因子结合位点)、聚腺苷酸化信号、内部核糖体进入位点、沉默子、绝缘序列和基质附着区。这些序列可靠近基因的编码区(例如,在10kb内)或在远处的位点,并且它们影响基因的转录和翻译的水平或速率。
术语“等位基因”是指基因的变体形式。一些基因具有多种不同的形式,它们位于染色体上相同的位置或遗传基因座处。二倍体生物具体有两个等位基因,每个等位基因位于同源染色体的内源基因座处。每一对等位基因表示特定遗传基因座的基因型。如果在特定基因座处存在两个相同的等位基因,则基因型被描述为纯合的,并且如果两个等位基因不同,则基因型被描述为杂合的。
“可操作地连接”包括并置,其中所述组分处于允许其以预期的方式起作用的关系中。“可操作地连接”至编码序列的控制序列是以使得在与控制序列相容的条件下实现编码序列的表达的方式连接。“可操作地连接”的序列包括与所关注的基因邻接的表达控制序列以及以反式或隔开一定距离起作用以控制所关注的基因的表达控制序列两者。术语“表达控制序列”包括影响与其连接的编码序列的表达和加工所必需的多核苷酸序列。“表达控制序列”包括:适当的转录起始、终止、启动子和增强子序列;高效的RNA加工信号,诸如剪接和聚腺苷酸化信号;稳定细胞质mRNA的序列;提高翻译效率的序列(即Kozak共有序列);增强蛋白质稳定性的序列;以及在期望时增强蛋白质分泌的序列。此类控制序列的性质因宿主生物体而不同。例如,在原核生物中,此类控制序列一般包括启动子、核糖体结合位点和转录终止序列,而在真核生物中,此类控制序列通常包括启动子和转录终止序列。术语“控制序列”意图包括其存在对于表达和加工而言是必需的组分,并且还可包括另外的其存在是有利的组分,例如前导序列和融合伴侶序列。
“表型”包括一种性状,或由细胞或生物体展示出的一类或一组性状。在一些实施方案中,特定表型可与特定等位基因或基因型相关。在一些实施方案中,表型可以是离散的;在一些实施方案中,表型可以是连续的。表型可包括细胞的活力或细胞适应性。表型可包括蛋白质(例如突变体TDP-43多肽)的表达水平、细胞定位和/或溶解度/稳定性特征,所述表型中的每一种可使用众所周知的方法(诸如蛋白质印迹分析,荧光原位杂交、定性RT-PCR等)来确定。
“启动子”是DNA的调控区域,其通常包含能够引导RNA聚合酶II在特定多核苷酸序列的适当转录起始位点处启动RNA合成的TATA盒。启动子可另外包含影响转录起始速率的其他区域。本文公开的启动子序列调节可操作连接的多核苷酸的转录。启动子可在本文公开的细胞类型(例如,真核细胞、非人哺乳动物细胞、人细胞、啮齿动物细胞、多能细胞、单细胞阶段胚胎、分化细胞或它们的组合)中的一种或多种中具有活性。启动子可以是例如组成型活性启动子、条件启动子、诱导型启动子、时间受限型启动子(例如,发育调控型启动子)或空间受限型启动子(例如,细胞特异性或组织特异性启动子)。启动子的实例可在例如WO2013/176772中找到,所述专利出于所有目的以引用的方式整体并入本文。
“参考”包括与所关注的剂、细胞、动物、队列、个体、群体、样品、序列或值进行比较的标准或对照剂、细胞、动物、队列、个体、群体、样品、序列或值。在一些实施方案中,参考剂、细胞、动物、队列、个体、群体、样品、序列或值的测试和/或确定与所关注的剂、细胞、动物、队列、个体、群体、样品、序列或值的测试或确定基本上同时进行。在一些实施方案中,参考剂、细胞、动物、队列、个体、群体、样品、序列或值是任选地在有形介质中体现的历史参考。在一些实施方案中,参考可以指对照。“参考”还包括“参考细胞”。“参考细胞”可具有如本文所述的修饰、与本文所述不同的修饰或无修饰(即,野生型细胞)。通常,如本领域技术人员将理解的,在与用于确定或表征所关注的剂、细胞、动物(例如,哺乳动物)、队列、个体、群体、样品、序列或值的条件相当的条件下确定或表征参考剂、动物、队列、个体、群体、样品、序列或值。
术语“变体”是指与参考核苷酸序列不同(例如,相差一个核苷酸)的核苷酸序列或与参考氨基酸序列不同(例如,相差一个氨基酸)的蛋白质序列,但它们保留了参考序列的生物学功能。在一些实施方案中,由于遗传密码的简并性和/或保守密码子/氨基酸取代,变体与参考序列不同。
在两个多核苷酸或多肽序列的情形下,“序列同一性”或“同一性”指的是当在指定的比较窗口上进行比对以达到最大对应时,两个序列中相同的残基。当关于蛋白质使用序列同一性百分比时,不相同的残基位置常常因保守氨基酸取代而不同,其中氨基酸残基被具有类似化学特性(例如,电荷或疏水性)的其他氨基酸残基取代,并且因此不改变分子的功能特性。当序列的不同之处在于保守取代时,序列同一性百分比可向上调整以针对取代的保守性质加以校正。因此类保守取代而不同的序列被认为具有“序列相似性”或“相似性”。进行这种调整的手段是众所周知的。通常,这涉及将保守取代计为部分错配而非完全错配,从而增加序列同一性百分比。因此,例如,在相同氨基酸的得分为1,而非保守取代的得分为零的情况下,保守取代的得分介于零与1之间。保守取代的得分例如,如在程序PC/GENE(Intelligenetics,Mountain View,California)中实现的那样计算。
“序列同一性百分比”包括通过在比较窗口内比较两个最佳比对序列(最大数量的完美匹配残基)而确定的值,其中比较窗口中的多核苷酸序列部分与参考序列(不包含添加或缺失)相比可包含添加或缺失(即间隔),以对这两个序列进行最佳比对。所述百分比是通过以下来计算:确定这两个序列中存在相同核酸碱基或氨基酸残基的位置的数量以得到匹配位置的数量,用匹配位置的数量除以比较窗口中位置的总数,并且将结果乘以100以得到序列同一性百分比。除非另有说明(例如,较短序列包括连接的异源序列),比较窗口是被比较的两个序列中较短序列的全长。
除非另有说明,否则序列同一性/相似性值包括使用GAP第10版,使用以下参数获得的值:核苷酸序列的%同一性和%相似性使用50的GAP权重和3的长度权重、以及nwsgapdna.cmp得分矩阵;氨基酸序列的%同一性和%相似性使用8的GAP权重和2的长度权重、以及BLOSUM62得分矩阵;或其任何等同程序。“等同程序”包括对于所考虑的任何两个序列,当与由GAP第10版产生的对应比对相比时,产生具有相同的核苷酸或氨基酸残基匹配和相同的序列同一性百分比的比对的任何序列比较程序。
术语“保守氨基酸取代”是指用具有类似大小、电荷或极性的不同氨基酸取代通常存在于序列中的氨基酸。保守取代的实例包括用非极性(疏水性)残基(诸如异亮氨酸、缬氨酸或亮氨酸)取代另一个非极性残基。同样,保守取代的实例包括用一个极性(亲水性)残基取代另一个,诸如精氨酸与赖氨酸之间、谷氨酰胺与天冬酰胺之间或甘氨酸与丝氨酸之间的取代。另外,用碱性残基诸如赖氨酸、精氨酸或组氨酸取代另一个碱性残基或用一个酸性残基诸如天冬氨酸或谷氨酸取代另一个酸性残基是保守取代的另外的实例。非保守取代的实例包括用非极性(疏水性)氨基酸残基诸如异亮氨酸、缬氨酸、亮氨酸、丙氨酸或蛋氨酸取代极性(亲水性)残基诸如半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸,和/或用极性残基取代非极性残基。下面的表1总结了典型的氨基酸分类。
表1.氨基酸分类。
Figure BDA0003422664410000601
术语“体外”包括人工环境和在人工环境(例如试管)内发生的过程或反应。术语“体内”包括天然环境(例如细胞或生物体或身体)和在天然环境内发生的过程或反应。术语“离体”包括已经从个体的体内取出的细胞和在此类细胞内发生的过程或反应。
非限制性示例性实施方案包括以下。
实施方案1.一种非人动物细胞,其包含编码突变体TDP-43多肽的突变TARDBP基因,
其中所述突变体TDP-43多肽缺乏在野生型TDP-43多肽中发现的功能性结构域,并且
其中所述非人动物或非人动物细胞表达突变体TDP-43多肽,
任选地其中所述野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ IDNO:5所陈述的序列。
实施方案2.如实施方案1所述的非人动物细胞,其中所述突变体TDP-43多肽缺乏包括核定位信号(NLS)、RNA识别基序1(RRM1)、RNA识别基序2(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)或它们的组合的功能性结构域。
实施方案3.如实施方案1或实施方案2所述的非人动物细胞,其中所述非人动物细胞是胚胎干(ES)细胞、胚状体或胚胎干细胞衍生的运动神经元(ESMN)。
实施方案4.如前述实施方案中任一项所述的非人动物细胞,其中所述突变TARDBP基因是非人动物的突变TARDBP基因。
实施方案5.如实施方案1-3中任一项所述的非人动物细胞,其中所述突变TARDBP基因是突变人TARDBP基因。
实施方案6.如前述实施方案中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽由于以下一项或多项而缺乏功能性结构域:
(a)NLS中氨基酸的点突变,
(b)RRM1中氨基酸的点突变,
(c)RRM2中氨基酸的点突变,
(d)核输出信号的至少一部分的缺失,以及
(e)朊病毒样结构域的至少一部分的缺失。
实施方案7.如实施方案6所述的非人动物细胞,其中
(a)NLS中氨基酸的所述点突变包括K82A、K83A、R84A、K95A、K97A、K98A或它们的组合,
(b)RRM1中的所述点突变包括F147L和/或F149L,
(c)RRM2中的所述点突变包括F194L和/或F229L,
(d)核输出信号缺失的至少一部分的所述缺失包括在野生型TDP-43多肽的位置239和250处及其之间的氨基酸的缺失,以及
(e)朊病毒样结构域的至少一部分的所述缺失包括在野生型TDP-43多肽的位置274和414处及其之间的氨基酸的缺失。
实施方案8.如前述实施方案中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽包含K82A、K83A、R84A、K95A、K97A和K98A。
实施方案9.如前述实施方案中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽缺乏野生型多肽的位置274至414处的氨基酸之间并包括所述位置处的氨基酸的朊病毒样结构域。
实施方案10.如前述实施方案中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽包含F147L和F149L。
实施方案11.如前述实施方案中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽包含F194L和F229L。
实施方案12.如前述实施方案中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽缺乏位置239和250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号。
实施方案13.如前述实施方案中任一项所述的非人动物细胞,其中编码突变体TDP-43多肽的所述突变TARDBP基因替换内源性TARDBP基因座处的内源性TARDBP基因。
实施方案14.如实施方案13所述的非人动物细胞,其中所述非人动物细胞对于编码突变体TDP-43多肽的所述突变TARDBP基因是杂合的。
实施方案15.如实施方案13所述的非人动物细胞,其中所述非人动物细胞对于编码突变体TDP-43多肽的所述突变TARDBP基因是纯合的。
实施方案16.如实施方案1-14中任一项所述的非人动物细胞,其中所述非人动物细胞还包含含有敲除突变的TARDBP基因。
实施方案17.如实施方案16所述的非人动物细胞,其中所述敲除突变包括条件性敲除突变。
实施方案18.如实施方案16或实施方案17所述的非人动物细胞,其中所述敲除突变包含位点特异性重组识别序列。
实施方案19.如实施方案16-18中任一项所述的非人动物细胞,其中所述敲除突变包含loxp序列。
实施方案20.如实施方案19所述的非人动物细胞,其中所述loxp序列侧接包含敲除突变的TARDBP基因的外显子3。
实施方案21.如实施方案16所述的非人动物细胞,其中所述敲除突变包括TDP-43肽的整个编码序列的缺失。
实施方案22.如实施方案16-21中任一项所述的非人动物细胞,其中所述非人动物细胞对于所述修饰的TARDBP基因座是杂合的并且包含
(i)在一条染色体的内源性TARDBP基因座处,内源性TARDBP基因被编码突变体TDP-43多肽的所述突变TARDBP基因替换,以及
(ii)在另一条同源染色体的所述内源性TARDBP基因座处,包含所述敲除突变的TARDBP基因或野生型TARDBP基因。
实施方案23.如前述实施方案中任一项所述的非人动物细胞,其中所述非人动物细胞不表达野生型TDP-43多肽。
实施方案24.如实施方案1-22中任一项所述的非人动物细胞,其中所述非人动物细胞表达野生型TDP-43多肽。
实施方案25.如前述实施方案中任一项所述的非人动物细胞,其包含:
(i)与对照细胞中野生型TARDBP基因的mRNA转录水平相当的所述突变TARDBP基因的mRNA转录水平,
(ii)与对照细胞中野生型TDP-43多肽的水平相比,增加的所述突变体TDP-43多肽的水平,
(iii)在例如运动神经元的细胞质中发现的比在细胞核中更高浓度的突变体TDP-43多肽,
(iv)与野生型TDP-43多肽相比具有增加的不溶性的突变体TDP-43多肽,
(v)包含所述突变体TDP-43多肽的细胞质聚集体,
(vi)增加的隐藏外显子的剪接,和/或
(vii)降低的可变剪接的TDP-43形式的水平。
实施方案26.一种非人动物细胞,其包含(i)在一条染色体的内源性TARDBP基因座处,所述TARDBP基因的条件性敲除突变,以及(ii)在另一条同源染色体的所述内源性TARDBP基因座处,所述整个TARDBP编码序列的缺失。
实施方案27.如前述实施方案中任一项所述的非人动物细胞,其中所述细胞是胚胎干(ES)细胞、原始外胚层细胞或衍生自运动神经元的运动神经元(ESMN)。
实施方案28.如前述实施方案中任一项所述的非人动物细胞,其中所述非人动物细胞是啮齿动物细胞。
实施方案29.如前述实施方案中任一项所述的非人动物细胞,其中所述非人动物细胞是大鼠细胞。
实施方案30.如实施方案1-28中任一项所述的非人动物细胞,其中所述非人动物细胞是小鼠细胞。
实施方案31.如前述实施方案中任一项所述的非人动物细胞,其中所述非人动物细胞在体外培养。
实施方案32.一种非人动物组织,其包含前述实施方案中任一项所述的非人动物细胞。
实施方案33.一种组合物,其包含前述实施方案中任一项所述的非人动物细胞或组织。
实施方案34.一种制备表达突变体TDP-43多肽的非人动物或非人动物细胞的方法,其包括修饰所述非人动物或非人动物细胞的基因组以包含编码所述突变体TDP-43多肽的突变TARDBP基因,其中所述突变体TDP-43多肽与野生型TDP-43相比缺乏功能性结构域,任选地其中所述野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。
实施方案35.如实施方案34所述的方法,其中修饰包括用编码所述突变体TDP-43多肽的所述突变TARDBP基因替换内源性TARDBP基因。
实施方案36.如实施方案34或实施方案35所述的方法,其中修饰还包括用包含敲除突变的TARDBP基因替换内源性TARDBP基因。
实施方案37.如实施方案36所述的方法,其中所述敲除突变包括条件性敲除突变。
实施方案38.如实施方案37所述的方法,其还包括在消除包含敲除突变的所述TARDBP基因的表达的条件下培养所述细胞。
实施方案39.一种鉴定用于治疗疾病的治疗候选物的方法,所述方法包括
(a)使实施方案1-31中任一项所述的非人动物细胞或组织或实施方案32所述的组合物与所述候选剂接触,
(b)评价所述非人细胞或组织的表型和/或TDP-43生物活性,以及
(c)鉴定使非人细胞或组织恢复与表达野生型TDP-43多肽的对照细胞或组织相当的表型和/或TDP-43生物活性的所述候选剂。
实施方案40.一种评价TDP-43结构域的生物学功能的方法,其包括
(a)修饰胚胎干(ES)细胞以包含编码突变体TDP-43多肽的突变TARDBP基因,所述突变体TDP-43多肽缺乏选自由以下组成的组的功能性结构域:核定位信号(NLS)、第一RNA识别基序(RRM1)、第一RNA识别基序(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)和它们的组合,
(b)任选地在体外分化所述修饰的ES细胞和/或从所述修饰的ES细胞获得遗传修饰的非人动物,以及
(c)评价所述遗传修饰的ES细胞、由其衍生的原始外胚层、由其衍生的运动神经元或由其衍生的非人动物的表型和/或TDP-43生物活性。
实施方案41.如实施方案39或实施方案40所述的方法,其中所述表型通过细胞培养、荧光原位杂交、蛋白质印迹分析或它们的组合来评价。
实施方案42.如实施方案39-41中任一项所述的方法,其中评价表型包括测量所述遗传修饰的ES细胞、由其衍生的原始外胚层、由其衍生的运动神经元或由其衍生的非人动物的活力。
实施方案43.如实施方案39-42中任一项所述的方法,其中所述评价表型包括确定所述突变体TDP-43多肽的细胞定位。
实施方案44.如实施方案39-43中任一项所述的方法,其中评价所述突变体TDP-43多肽的生物活性包括测量受TDP-43调控的包含隐藏外显子的基因的剪接产物。
实施方案45.如实施方案44所述的方法,其中受TDP-43调控的包含隐藏外显子的所述基因包括Crem、Fyxd2、Clf1。
实施方案46.如实施方案39-45中任一项所述的方法,其中评价所述突变体TDP-43多肽的生物活性包括测量可变剪接的TDP-43的水平。
实施方案47.一种反义寡核苷酸,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43 mRNA序列的间隔体基序,
任选地其中所述TDP-mRNA包含外显子6内的可变5'剪接位点与下游可变3'剪接位点之间的序列,
任选地其中所述可变5'剪接位点与选自由以下组成的组的TARDBP基因组位置相关:(a)小鼠4号染色体:148,618,647;(b)小鼠4号染色体:148,618,665;(c)小鼠4号染色体:148,618,674,和(d)人TARDBP基因中的任何对应位置,且/或其中所述可变3’剪接点与4号染色体:148,617,705的TARDBP基因组位置相关。
实施方案48.一种siRNA,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43 mRNA序列的序列,
任选地其中所述TDP-mRNA序列位于外显子6内的可变5'剪接位点与下游可变3'剪接位点之间,
任选地其中所述可变5'剪接位点与选自由以下组成的组的TARDBP基因组位置相关:(a)小鼠4号染色体:148,618,647;(b)小鼠4号染色体:148,618,665;(c)小鼠4号染色体:148,618,674,和(d)人TARDBP基因中的任何对应位置,且/或其中所述可变3’剪接点与4号染色体:148,617,705的TARDBP基因组位置相关。
实施方案49.一种CRISPR/Cas系统,其包含Cas9蛋白和至少一种gRNA,其中所述gRNA识别位于或靠近编码可变剪接位点的序列,所述序列产生编码截短的缺乏PLD的TDP-43多肽的可变mRNA,
任选地其中所述可变剪接位点包括外显子6内的可变5'剪接位点和下游可变3'剪接位点,
任选地其中所述可变5'剪接位点与选自由以下组成的组的TARDBP基因组位置相关:(a)小鼠4号染色体:148,618,647;(b)小鼠4号染色体:148,618,665;(c)小鼠4号染色体:148,618,674,和(d)人TARDBP基因中的任何对应位置,且/或其中所述可变3’剪接点与4号染色体:148,617,705的TARDBP基因组位置相关。
实施方案50.一种非人动物,其包含实施方案2所述的胚胎干细胞。
实施方案51.一种非人动物,其包含编码突变体TDP-43多肽的突变TARDBP基因,
其中与野生型TDP-43多肽相比,所述突变体TDP-43多肽缺乏功能性结构域,并且
其中所述非人动物表达所述突变体TDP-43多肽,
任选地其中所述野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ IDNO:5所陈述的序列。
实施方案52.如实施方案51所述的非人动物,其中所述突变体TDP-43多肽缺乏包括核定位信号(NLS)、RNA识别基序1(RRM1)、RNA识别基序2(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)或它们的组合的功能性结构域。
实施方案53.如实施方案51或实施方案52所述的非人动物,其中所述突变TARDBP基因是所述非人动物的突变TARDBP基因。
实施方案54.如实施方案51-53中任一项所述的非人动物,其中所述突变TARDBP基因是突变人TARDBP基因。
实施方案55.如实施方案51-54中任一项所述的非人动物,其中所述突变体TDP-43多肽由于以下一项或多项而缺乏功能性结构域:
(a)NLS中氨基酸的点突变,
(b)RRM1中氨基酸的点突变,
(c)RRM2中氨基酸的点突变,
(d)核输出信号的至少一部分的缺失,以及
(e)朊病毒样结构域的至少一部分的缺失。
实施方案56.如实施方案55所述的非人动物,其中
(a)NLS中氨基酸的所述点突变包括K82A、K83A、R84A、K95A、K97A、K98A或它们的组合,
(b)RRM1中的所述点突变包括F147L和/或F149L,
(c)RRM2中的所述点突变包括F194L和/或F229L,
(d)核输出信号缺失的至少一部分的所述缺失包括在野生型TDP-43多肽的位置239和250处及其之间的氨基酸的缺失,以及
(e)朊病毒样结构域的至少一部分的所述缺失包括在野生型TDP-43多肽的位置274和414处及其之间的氨基酸的缺失。
实施方案57.如实施方案51-56中任一项所述的非人动物,其中所述突变体TDP-43多肽包含K82A、K83A、R84A、K95A、K97A和K98A。
实施方案58.如实施方案51-57中任一项所述的非人动物,其中所述突变体TDP-43多肽缺乏野生型多肽的位置274至414处的氨基酸之间并包括所述位置处的氨基酸的朊病毒样结构域。
实施方案59.如实施方案51-58中任一项所述的非人动物,其中所述突变体TDP-43多肽包含F147L和F149L。
实施方案60.如实施方案51-59中任一项所述的非人动物,其中所述突变体TDP-43多肽包含F194L和F229L。
实施方案61.如实施方案51-60中任一项所述的非人动物,其中所述突变体TDP-43多肽缺乏位置239和250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号。
实施方案62.如实施方案51-61中任一项所述的非人动物,其中编码突变体TDP-43多肽的所述突变TARDBP基因替换内源性TARDBP基因座处的内源性TARDBP基因。
实施方案63.如实施方案62所述的非人动物,其中所述非人动物对于编码突变体TDP-43多肽的所述突变TARDBP基因是杂合的。
实施方案64.如实施方案51-63中任一项所述的非人动物,其中所述非人动物还包含含有敲除突变的TARDBP基因。
实施方案65.如实施方案64所述的非人动物,其中所述敲除突变包括条件性敲除突变。
实施方案66.如实施方案64或实施方案65所述的非人动物,其中所述敲除突变包含位点特异性重组识别序列。
实施方案67.如实施方案64-66中任一项所述的非人动物,其中所述敲除突变包含loxp序列。
实施方案68.如实施方案67所述的非人动物,其中所述loxp序列侧接包含敲除突变的TARDBP基因的外显子3。
实施方案69.如实施方案64所述的非人动物,其中所述敲除突变包括TDP-43肽的整个编码序列的缺失。
实施方案70.如实施方案64-69中任一项所述的非人动物,其中所述非人动物对于所述修饰的TARDBP基因座是杂合的并且包含
(i)在一条染色体的内源性TARDBP基因座处,内源性TARDBP基因被编码突变体TDP-43多肽的所述突变TARDBP基因替换,以及
(ii)在另一条同源染色体的所述内源性TARDBP基因座处,包含所述敲除突变的TARDBP基因或野生型TARDBP基因。
实施方案71.如实施方案50-70中任一项所述的非人动物,其中所述非人动物表达野生型TDP-43多肽。
实施方案72.如实施方案50-71中任一项所述的非人动物,其包含:
(i)与对照动物中野生型TARDBP基因的mRNA转录水平相当的所述突变TARDBP基因的mRNA转录水平,
(ii)与对照动物中野生型TDP-43多肽的水平相比,增加的所述突变体TDP-43多肽的水平,
(iii)在例如运动神经元的细胞质中发现的比在细胞核中更高浓度的突变体TDP-43多肽,
(iv)与野生型TDP-43多肽相比具有增加的不溶性的突变体TDP-43多肽,
(v)包含所述突变体TDP-43多肽的细胞质聚集体,
(vi)增加的隐藏外显子的剪接,
(vii)降低的可变剪接的TDP-43形式的水平,
(viii)主要由快肌(诸如胫前肌肉)构成的肌肉组织的去神经支配和/或
(ix)主要由慢肌(诸如肋间肌肉)构成的肌肉组织的正常神经支配。
实施方案73.一种非人动物,其包含在内源性TARDBP基因座处的包含条件性敲除突变的TARDBP基因,以及在同源染色体的另一个内源性TARDBP基因座处的包含整个TARDBP编码序列缺失的TARDBP基因。
实施方案74.如实施方案50-73中任一项所述的非人动物,其中所述非人动物是啮齿动物。
实施方案75.如实施方案50-74中任一项所述的非人动物,其中所述非人动物是大鼠。
实施方案76.如实施方案50-74中任一项所述的非人动物,其中所述非人动物是小鼠。
实施方案77.一种鉴定用于治疗疾病的治疗候选物的方法,所述方法包括
(a)使实施方案50-76中任一项所述的非人动物与所述候选剂接触,
(b)评价所述非人动物的表型和/或TDP-43生物活性,以及
(c)鉴定使所述非人恢复表型和/或TDP-43生物活性的所述候选剂。
实施方案78.一种突变体TDP-43多肽,其包含如SEQ ID NO:1、3或5所陈述的序列,所述序列经修饰以包含以下一项或多项:
(a)NLS中氨基酸的点突变,
(b)RRM1中氨基酸的点突变,
(c)RRM2中氨基酸的点突变,
(d)核输出信号的至少一部分的缺失,以及
(e)朊病毒样结构域的至少一部分的缺失。
实施方案79.如实施方案78所述的突变体TDP-43多肽,其中
(a)NLS中氨基酸的所述点突变包括K82A、K83A、R84A、K95A、K97A、K98A或它们的组合,
(b)RRM1中的所述点突变包括F147L和/或F149L,
(c)RRM2中的所述点突变包括F194L和/或F229L,
(d)核输出信号缺失的至少一部分的所述缺失包括在野生型TDP-43多肽的位置239和250处及其之间的氨基酸的缺失,以及
(e)朊病毒样结构域的至少一部分的所述缺失包括在野生型TDP-43多肽的位置274和414处及其之间的氨基酸的缺失。
实施方案80.如实施方案78或实施方案79所述的突变体TDP-43多肽,其包含K82A突变、K83A突变、R84A突变、K95A突变、K97A突变和/或K98A突变。
实施方案81.如实施方案78-80中任一项所述的突变体TDP-43多肽,其包含在野生型多肽的位置274至414处的氨基酸之间并包括所述位置处的氨基酸的朊病毒样结构域的缺失。
实施方案82.如实施方案78-81中任一项所述的突变体TDP-43多肽,其中所述突变体TDP-43多肽包含F147L突变和/或F149L突变。
实施方案83.如实施方案78-82中任一项所述的突变体TDP-43多肽,其中所述突变体TDP-43多肽包含F194L突变和/或F229L突变。
实施方案84.如实施方案78-83中任一项所述的突变体TDP-43多肽,其中所述突变体TDP-43多肽缺乏位置239和250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号。
实施方案85.一种核酸,其包含编码实施方案78-84中任一项所述的突变体TDP-43多肽的核酸序列。
实施方案86.如实施方案85所述的核酸,其还包含从5'至3':5'同源臂、编码所述突变体TDP-43多肽的所述核酸序列和3'同源臂,其中所述核酸在啮齿动物细胞中经历同源重组。
实施方案87.如实施方案86所述的核酸,其中所述5'和3'同源臂与大鼠序列同源,使得所述核酸在内源性大鼠TARDBP基因座处经历同源重组并且编码所述突变体TDP-43多肽的所述核酸序列替换所述内源性TARDBP编码序列。
实施方案88.如实施方案86所述的核酸,其中所述5'和3'同源臂与小鼠序列同源,使得所述核酸在内源性小鼠TARDBP基因座处经历同源重组并且编码所述突变体TDP-43多肽的所述核酸序列替换所述内源性TARDBP编码序列。
实施方案89.一种在细胞中选择性减少编码包含PLD的TDP-43多肽的TDP-43 mRNA同时保留编码截短的缺乏PLD的TDP-43的可变TDP-43 mRNA的方法,所述方法包括向细胞中引入:
(i)一种反义寡核苷酸,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43 mRNA序列的间隔体基序,
(ii)一种siRNA,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43 mRNA序列的序列,和/或
(iii)一种CRISPR/Cas系统,其包含Cas9蛋白和至少一种gRNA,其中所述gRNA识别位于或靠近编码可变剪接位点的序列,所述序列产生编码截短的缺乏PLD的TDP-43多肽的可变mRNA。
实施方案90.如实施方案89所述的方法,其中:
(i)所述反义寡核苷酸是实施方案47所述的ASO,
(ii)所述siRNA是实施方案48所述的siRNA,且/或
(iii)所述CRISPR/Cas系统是实施方案49所述的CRISPR/Cas系统。
实施方案91.如实施方案89或实施方案90所述的方法,其中所述细胞在体内。
序列说明
Figure BDA0003422664410000761
Figure BDA0003422664410000771
实施例
以下实施例仅仅出于说明性目的提供,并且不意图限制本发明的范围。
实施例1:表达突变TARDBP基因的胚胎干细胞的产生
由于TDP-43对活力至关重要,因此可产生包含第一内源性TDP-43等位基因上的条件性敲除和另一个第二内源性TDP-43等位基因上的突变的胚胎干(ES)细胞,使得来自第一内源性等位基因的野生型TDP-43维持ES细胞的活力直到条件激活,所述激活后可确定由第二等位基因表达的突变体TDP-43多肽的作用。
为了评价各种TDP-43结构域发挥的生物学、生化和/或致病作用,小鼠ES细胞经修饰以包含:(i)在内源性TARDBP基因座处的条件性敲除突变,和(ii)在同源染色体上的另一个TARDBP基因座处的编码突变体TDP-43多肽的突变TARDBP基因,所述突变体TDP-43多肽中的五个结构域—核定位信号(NLS)、RNA识别基序1(RRM1)、RNA识别基序2(RRM2)、推定的输出信号(E)或朊病毒样结构域(PLD)—之一要么以预测会消除其功能的方式被改变,要么被缺失。参见图3。含有突变TARDBP基因并表达缺乏功能性NLS、RRM1、RRM2、E或PLD的突变体TDP-43多肽的细胞的(1)表型和(2)突变体TDP-43多肽的生物活性分别如实施例2和3所述进行分析。
条件性等位基因是基于先前发表的工作设计的,所述工作表明TDP-43外显子3的缺失不产生功能性蛋白质。Chiang等人(2010)Proc Natl Acad Sci USA 107:16320-324。内源性小鼠TARDBP基因的外显子3侧接loxp位点。在Cre介导的重组后,基因组坐标chr4:147995844-147996841的缺失受到影响。如本文所述,用突变TARDBP基因进一步修饰包含侧接loxP的外显子3的ES细胞。作为对照,还产生了小鼠ES细胞,其经修饰具有在一个等位基因上的条件性敲除突变,以及在另一个等位基因上的从第二外显子的起始密码子到终止密码子(基因组坐标chr4:147992370-147999471)的缺失。
实施例2:表达突变TARDBP基因的细胞的表型分析
实施例1中产生的胚胎干(ES)细胞、由其衍生的原始外胚层或由其衍生的运动神经元(ESMN)的表型通过评价所述细胞的生存力以及所述突变体TDP-43多肽的定位和稳定性来分析。
值得注意的是,表达缺乏功能性NLS或功能性PLD的突变体TDP-43多肽的ES细胞是有活力的;尽管表达缺乏功能性PLD的突变体TDP-43多肽的细胞似乎适应性降低。图4。表达缺乏功能性RRM1或RRM2的突变体TDP-43多肽的ES细胞和ESMN均没有活力。图4和图5。
缺乏功能性NLS的突变体TDP-43多肽在ESMN中从细胞核重新分布到细胞质,并且突变体TDP-43在许多ALS病理的大型聚集样内含物中积累。图6至图8。缺乏功能性NLS导致突变体TDP-43多肽在细胞质中大量聚集,伴随核染色消失。图7至图8。缺乏功能性PLD的突变体TDP-43多肽也重新分布到ESMN的细胞质中,并在点状内含物中积累,这些内含物似乎比缺乏功能性NLS的突变体TDP-43多肽产生的那些内含物丰度更低且在性质上有所不同。图6至图8。尽管保留了核染色,但PLD的缺失导致突变体TDP-43多肽最大程度的错误定位到细胞质。图7至图8。
缺乏功能性NLS或PLD的突变体TDP-43多肽表现出增加的突变体TDP-44的溶解度。图9A。与野生型TDP-43多肽相比,缺乏功能性E或RRM1的突变体TDP-43多肽的溶解度没有变化。图9A。尽管任一突变体TDP-43多肽的mRNA表达水平均没有差异,但观察到缺乏功能性NLS、PLD或RRM1的突变体TDP-43多肽的蛋白质水平增加。图9B。由于这些突变体TDP-43多肽的mRNA表达水平与野生型TDP-43的表达水平相当,蛋白质水平增加可能是由于突变体TDP-43多肽的稳定性增加。图9C。
用于分析表达缺乏功能性结构域的突变体TDP-43多肽的细胞的表型的材料和方法如下所述。
细胞培养
通过培养中的分化来测试作为细胞表达的蛋白质的唯一形式的突变体TDP-43蛋白支持胚胎干(ES)细胞和由其衍生的运动神经元(ESMN)的活力的能力。ES细胞在胚胎干细胞培养基(ESM;DMEM+15%胎牛血清+青霉素/链霉素+谷氨酰胺+非必需氨基酸+核苷+β-巯基乙醇+丙酮酸钠+LIF)中培养2天,在此期间培养基每天更换。在胰蛋白酶消化前1小时,将ES培养基替换为7mL ADFNK培养基(高级DMEM/F12+神经基础培养基+10%基因敲除血清+青霉素/链霉素+谷氨酰胺+β-巯基乙醇)。抽出ADFNK培养基,用0.05%胰蛋白酶-EDTA对ESC进行胰蛋白酶消化。将沉淀细胞重新悬浮在12mL的ADFNK中,并在悬浮液中生长两天。将细胞在补充有视黄酸(RA)、平滑激动剂和嘌呤吗啡(purmorphamine)的ADFNK中再培养4天以获得肢体样运动神经元(ESMN)。将分离的运动神经元在胚胎干细胞衍生的运动神经元培养基(ESMN;神经基础培养基+2%马血清+B27+谷氨酰胺+青霉素/链霉素+β-巯基乙醇+10ng/mLGDNF、BDNF、CNTF)中铺板和成熟。在ES细胞阶段(图4、图6至图9)或铺板后七天(图5),使用经由电穿孔传递送的cre重组酶激活条件性敲除等位基因。
突变体TDP-43多肽的胞内定位
使用识别TDP-43多肽的N末端的抗体(α-TDP-43 N末端)和识别TDP-43多肽的C末端朊病毒样结构域的抗体(α-TDP-43 C-末端)(Proteintech,Rosemont,IL)分析TDP-43突变体的胞内定位。通过将ES细胞衍生的MN在补充有蛋白酶和磷酸酶抑制剂(Roche)的冰冷裂解缓冲液(10mM KCl、10mM Tris-HCl、pH 7.4、1mM MgCl2、1mM DTT、0.01%NP-40)中在冰上孵育10分钟来制备可溶性细胞质蛋白提取物。然后将细胞通过27号注射器传代五次。在4℃下以4000rpm离心5分钟后,收集包含可溶性细胞质提取物的蛋白质上清液。通过将沉淀物重新悬浮在等体积的补充有蛋白酶和磷酸酶的RBS-100缓冲液(10mM Tris-HCl pH 7.4、2.5mM MgCl2、100mM NaCl、0.1%NP-40)中来制备不溶性核内蛋白提取物。将等体积的2XSDS样品缓冲液加入到每个级分中,并且将样品加热至90℃。然后将等体积的每个级分加载到14%SDS凝胶上并在225V下电泳50min,随后使用α-TDP-43-N末端抗体或α-TDP-43-C末端抗体对TDP-43进行蛋白质印迹,所述两种抗体的后者不会识别PLD缺失突变体。使用ImageJ进行光密度测定。图6B。使用GraphPad for Prism绘制细胞质/细胞核TDP-43的比率并进行统计分析。图6B;图9B,右图。
荧光原位杂交(FISH)
将ES细胞衍生的MN铺板在聚鸟氨酸/层粘连蛋白包被的盖玻片上并培养7天。将盖玻片在冰冷的4%PFA中浸泡固定15分钟,并在1x PBS中洗涤。用在含有0.2%Triton X-100(TBS-T)的Tris缓冲盐水(pH 7.4)中稀释的5%正常驴血清封闭细胞,并在稀释于含有5%的正常驴血清的TBS-T的第一抗血清(TDP-43 C末端和MAP2)中在4℃下孵育过夜。用TBS-T洗涤后,将细胞与偶联至Alexa 488和568的物种特异性二抗(1:1,000;LifeTechnologies,Carlsbad,CA,USA)在室温下孵育1小时。用TBS-T洗涤后,将染色的组织盖玻片安装在Flouromount(Southern Biotech,Birmingham,AL,USA)的显微镜载玻片上,并使用Leica 710LSM共聚焦显微镜以40倍放大率成像。图7和图8。
突变体TDP-43多肽的溶解度
这个方案改编自Jo等人(2014)Nature Communications 5:3496。含有50mM N-乙基马来酰亚胺(NEM)、1mM NaF、1mM Na3VO4、1mM PMSF和抑蛋白酶肽、亮抑酶肽和胃酶抑素各10ug/ml)的500ul冰冷可溶性缓冲液(0.1M MES(pH 7)、1mM EDTA、0.5mM MgSO4、1M蔗糖)。将细胞通过21号针头进行3-5次传代,然后通过23号针头进行3-5次传代。然后从每个样品中收集等体积的匀浆,并在4℃下以50,000x g离心20min,并且将剩余部分在-80℃下储存。去除上清液,并且将每个沉淀物重新悬浮在含有1%N-月桂酰肌氨酸(Sarkosyl)和蛋白酶抑制剂(1mM PMSF、50mM NEM和抑蛋白酶肽、亮抑酶肽和胃酶抑素各10ug/ml)的700ulRAB缓冲液(100mM MES(pH 6.8)、10%蔗糖、2mM EGTA、0.5mM MgSO4、500mM NaCl、1mMMgCl2、10mM NaH2PO4、20mM NaF)中,在室温下涡旋1min,然后在4℃下翻转式旋转孵育过夜。然后将样品在12℃下以200,000xg离心30min,并且收集上清液作为肌氨酰可溶性级分。将沉淀物重新悬浮在700ul RAB缓冲液中,并通过26号针头传代3-5次以完全分散沉淀物,从而产生肌氨酰不溶性级分。然后将等量份的肌氨酰可溶性和不溶性级分等分,并且向每个中加入等体积的2X SDS样品缓冲液。将样品加热至90℃。然后将等体积的每个级分加载到14%SDS凝胶上并在225V下电泳50min,随后对TDP-43进行蛋白质印迹。使用ImageJ进行光密度测定。图9A。使用GraphPad for Prism绘制可溶性:不溶性TDP-43的比率并进行统计分析。图9A。
突变体TDP-43多肽的表达水平
TDP-43突变体的表达水平通过如本文所述的蛋白质印迹分析进行分析。本实施例中的信使RNA水平通过定量聚合酶链反应进行。
提取每个样品的总RNA并使用跨越正常外显子4和外显子5连接点的引物和检测小鼠TDP-43基因座区域的探针来进行逆转录。使用现成试剂盒的探针和引物进行DROSHA的qPCR。
具体而言,如实施例1中所述,从胚胎干细胞衍生的运动神经元(ESMN)中分离RNA。
根据制造商的方案(Zymo Research),使用Direct-zol RNA Miniprep plus试剂盒分离总RNA。根据制造商的方案(Invitrogen),使用Turbo无DNA试剂盒用DNA酶处理总RNA,并稀释至20ng/μL。使用Quantitect Probe RT-PCR试剂盒(Qiagen)在一步反应中进行逆转录(RT)和PCR。qRT-PCR反应含有2μL RNA和8μL混合液,所述混合液含有RT-PCR Master混合液、ROX染料、RT混合液和20X基因特异性引物-探针混合液,最终体积为10μL。
除非另有说明,否则最终引物和探针浓度分别为0.5μM和0.25μM。在ViiATM7实时PCR检测系统(ThermoFisher)上进行qRT-PCR。PCR反应一式四份以RT步骤45℃10min,随后是95℃10min以及2步循环95℃5s、60℃30s在光学384孔板中进行45个循环。分析(Pan测定)中使用的引物和探针的序列在下表2中提供。
Figure BDA0003422664410000821
突变体TDP-43多肽的稳定性
2天后分离ES细胞集落并在ADFNK培养基中培养。在第2天更换培养基并补充视黄酸(100nM至2μM)(Sigma)和Sonic hedgehog(Shh-N;300nM)(Curis Inc.),并且将胚体(EB)培养4天。第4天,将胚状体用放线菌酮(100μg/ml)处理以阻断新的蛋白质合成。每4h更换一次培养基,并加入新鲜的放线菌酮。在指定的时间点收集细胞裂解物,并通过使用TDP-43和GAPDH抗体进行免疫印迹分析。图9C。
实施例3:TDP-43突变体对TDP-43生物活性的分析
隐藏外显子通常具有富含GU的TDP-43结合位点,并且TDP-43已经证明可阻遏隐藏外显子的识别,从而促进正常剪接。TDP-43的丧失导致受调控基因的正常mRNA和蛋白质水平的丧失。TDP-43还结合至其自身转录物的3'末端作为负反馈自动调节性环,以保持TDP-43水平。通过评价突变体TDP-43多肽继续阻遏隐藏外显子剪接和/或参与其自动调节性环的能力来测试缺乏功能性结构域的生物活性突变体TDP-43多肽。
分析了野生型TARDBP基因或编码缺乏功能性RRM1、NLS或PLD的突变体TDP-43多肽的突变TARDBP基因的ESMN杂合子的包含隐藏外显子的三个基因的表达产物,已知所述基因的剪接受野生型TDP-43的阻遏:Crem、Fyxd2和Clf1。图10。在所有表达缺乏功能性RRM1、NLS或PLD的突变体TDP-43多肽的ESMN中都观察到了正常剪接的Crem、Fyxd2和Clf1产物,并且发现正常剪接产物的量与表达野生型TDP-43多肽的ESMN相当。图10。然而,与表达野生型TDP-43多肽的ESMN相比,在表达缺乏功能性RRM1、NLS或PLD的突变体TDP-43多肽的ESMN中,隐藏外显子的剪接增加。图10。这项数据表明,缺乏功能性RRM1、NLS或PLD的突变体TDP-43多肽无法阻遏Crem、Fyxd2和Clf1基因的隐藏外显子剪接。图10。
分析了野生型TARDBP基因或编码缺乏功能性NLS、RRM1、RRM2、E或PLD的突变体TDP-43多肽的突变TARDBP基因的ESMN杂合子的可变剪接的TDP-43 mRNA的水平。图11B。与表达野生型TDP-43多肽的对照ESMN相比,表达缺乏功能性NLS、RRM1、E或PLD的突变体TDP-43多肽的ESMN表现出降低水平的可变剪接的TDP-43 mRNA。图11B。表达缺乏功能性E的突变体TDP-43多肽的ESMN表现出相当水平的可变剪接的TDP-43 mRNA。图11B。这项数据与实施例2中提供的数据相结合,表明表达缺乏功能性NLS或PLD的TDP-43突变体的ESMN表现出ALS表型(图5),表明旨在降低正常剪接的TDP-43 mRNA水平同时保留可变剪接的TDP-43 mRNA的策略可对TDP-43相关病理有治疗作用。
用于分析表达缺乏功能性结构域的突变体TDP-43多肽的细胞的表型的材料和方法如下所述。
定量聚合酶链反应
提取来自每个样品的总RNA并使用侧接剪接区域的引物和检测询问基因座(Crem、Fxyd2、Clf1、TDP-43)区域的探针进行逆转录。询问Crem、Fxyd2和Clfl基因的可检测区域包括那些跨越每个询问基因的正常和隐藏外显子小鼠序列连接点的区域。询问TDP-43区域的可检测区域包括那些跨越可变剪接区域的区域。使用现成试剂盒的探针和引物进行DROSHA的qPCR。
具体而言,从如实施例2所述分化的胚胎干细胞衍生的运动神经元(ESMN)分离RNA。根据制造商的方案(Zymo Research),使用Direct-zol RNA Miniprep plus试剂盒分离总RNA。根据制造商的方案(Invitrogen),使用Turbo无DNA试剂盒用DNA酶处理总RNA,并稀释至20ng/μL。使用Quantitect Probe RT-PCR试剂盒(Qiagen)在一步反应中进行逆转录(RT)和PCR。qRT-PCR反应含有2μL RNA和8μL混合液,所述混合液含有RT-PCR Master混合液、ROX染料、RT混合液和20X基因特异性引物-探针混合液,最终体积为10μL。
除非另有说明,否则最终引物和探针浓度分别为0.5μM和0.25μM。在ViiATM7实时PCR检测系统(ThermoFisher)上进行qRT-PCR。PCR反应一式四份以RT步骤45℃10min,随后是95℃10min以及2步循环95℃5s、60℃30s在光学384孔板中进行50个循环。
使用包含如SEQ ID NO:14和SEQ ID NO:15所陈述的核苷酸序列的引物和包含如SEQ ID NO:16所陈述的核苷酸序列的引物,进行用于评价从Crem的外显子1至外显子2的生产性Crem剪接的qRT-PCR。Crem的外显子1至隐藏外显子的剪接用包含如SEQ ID NO:17和SEQ ID NO:18所陈述的核苷酸序列的引物和包含如SEQ ID NO:19所陈述的核苷酸序列的引物进行评价。Crem的隐藏外显子至外显子2的剪接用包含如SEQ ID NO:20和SEQ ID NO:21所陈述的核苷酸序列的引物和包含如SEQ ID NO:22所陈述的核苷酸序列的引物进行评价。
使用包含如SEQ ID NO:23和SEQ ID NO:24所陈述的核苷酸序列的引物和包含如SEQ ID NO:25所陈述的核苷酸序列的引物,进行用于评价从Fyxd2的外显子3至外显子4的生产性Fyxd2剪接的qRT-PCR。Fyxd2的外显子3至隐藏外显子的剪接用包含如SEQ ID NO:26和SEQ ID NO:27所陈述的核苷酸序列的引物和包含如SEQ ID NO:28所陈述的核苷酸序列的引物进行评价。Fyxd2的隐藏外显子至外显子4的剪接用包含如SEQ ID NO:29和SEQ IDNO:30所陈述的核苷酸序列的引物和包含如SEQ ID NO:31所陈述的核苷酸序列的引物进行评价。
使用包含如SEQ ID NO:32和SEQ ID NO:33所陈述的核苷酸序列的引物和包含如SEQ ID NO:34所陈述的核苷酸序列的引物,进行对生产性Crlf1剪接产物的qRT-PCR。Crlf1的外显子1至隐藏外显子的剪接用包含如SEQ ID NO:35和SEQ ID NO:36所陈述的核苷酸序列的引物和包含如SEQ ID NO:37所陈述的核苷酸序列的引物进行评价。Crlf1的隐藏外显子至外显子2的剪接用包含如SEQ ID NO:38和SEQ ID NO:39所陈述的核苷酸序列的引物和包含如SEQ ID NO:40所陈述的核苷酸序列的引物进行评价。
使用包含如SEQ ID NO:41和SEQ ID NO:42所陈述的核苷酸序列的引物和包含如SEQ ID NO:43所陈述的核苷酸序列的引物,进行对缺乏编码PLD结构域的序列的可变剪接的TDP-43 mRNA评价。
本实施例的每个qPCR分析(正常和隐藏剪接)中使用的引物和探针的序列在下表3中提供。
表3
Figure BDA0003422664410000861
Figure BDA0003422664410000871
实施例4:表达突变TDP-43蛋白的小鼠的产生
尽管TDP-43的缺失会导致胚胎死亡,但仅由内源性TARDBP基因座表达突变体ΔNLS TDP-43基因或突变体ΔPLD TDP-43基因的胚胎干细胞是有活力的,并且可在体外分化成运动神经元。这项数据提出了一种可能性,即由内源性TARDBP基因座表达缺乏功能性结构域的突变体TDP-43多肽的胚胎干细胞可以是有活力的,并且可用于创建TDP-43蛋白病的动物模型。例如,此类胚胎干细胞可以用于产生表达缺乏功能性结构域的突变体TDP-43蛋白的非人动物,例如小鼠,以检查TDP-43结构域在正常和病理生物学过程中的作用。
为了产生表达缺乏功能性NLS或PLD结构域的突变体TDP-43蛋白的胚胎或动物,使用
Figure BDA0003422664410000872
方法(Dechiara,T.M.,(2009),Methods Mol Biol 530:311-324;Poueymirou等人(2007),Nat.Bio technol.25:91-99),其中包含以下的靶向ES细胞
(i)在内源性TARDBP基因座处,包含条件性侧接loxP的外显子3(loxP-Ex3-loxP)的TARDBP基因、Cre介导的侧接loxP的外显子3缺失后的无效等位基因(-)、NLS中的敲除突变(ΔNLS)、朊病毒样结构域的缺失(ΔPLD)或野生型TARDBP基因(WT),参见图3A,以及
(ii)在同源染色体上的另一个TARDBP基因座处,野生型(WT)TARDBP基因或在Cre介导的侧接loxP的外显子3缺失后的无效等位基因(-)被注射到未压实的8细胞阶段SwissWebster胚胎中。检查受精后胚胎的活力,并评估产生活产F0代小鼠的能力。
与之前的实验一致,缺乏功能性TDP-43蛋白(TDP-43-/-)的胚胎没有活力并且不能存活超过E3.5(图12)阶段。类似地,仅表达缺乏功能性NLS的TDP-43蛋白(TDP-43ΔNLS/-)或仅表达缺乏功能性PLD的TDP-43蛋白(TDP-43ΔPLD/-)的胚胎没有活力,尽管此类胚胎存活时间更长(图12)。由TARDPB基因座的一个等位基因表达野生型TDP-43蛋白拯救了由同源染色体上的另一个等位基因表达缺乏功能性NLS的TDP-43蛋白(TDP-43ΔNLS/-)或缺乏功能性PLD的TDP-43蛋白(TDP-43ΔPLD/-)的胚胎(图12)。
由注射有ES细胞的8细胞阶段的Swiss Webster胚胎中成功产生活产F0代小鼠,所述ES细胞包含
(i)在内源性TARDBP基因座处,野生型基因(WT)、包含cre介导的侧接loxP的外显子3缺失的TARDBP基因(-)、侧接loxP的外显子3(loxP-Ex3-loxP)、NLS中的敲除突变(ΔNLS)、朊病毒样结构域的缺失(ΔPLD),参见图3A,以及
(iii)在同源染色体上的另一个TARDBP基因座处,野生型(WT)TARDBP基因。
实施例4:表达缺乏功能性结构域的突变TDP-43多肽的小鼠的表型分析
通过评价TDP-43多肽在从动物分离而来的脊髓组织或运动神经元中的定位、磷酸化状态和溶解度来分析实施例3中产生的动物的表型。另外,还确定了动物肌肉的去神经支配或神经支配。
衍生自16周龄小鼠脊髓的运动神经元的细胞质和细胞核级分通过蛋白质印迹分析评价如下:(1)识别野生型TDP-43蛋白N末端并因此结合野生型TDP-43、ΔNLS TDP-43和ΔPLD TDP-43的抗体,(2)识别野生型TDP-43蛋白的C末端并因此结合野生型TDP-43和ΔNLS TDP-43,但不结合ΔPLD TDP-4的抗体,或(3)识别其磷酸化形式的TDP-43的抗体。
如图13A至图13C所示,野生型和ΔNLS突变体TDP-43蛋白在预期大小为约43Kd时被检测到,而ΔPLD突变体在预期大小为约30Kd时被检测到。与实施例2中分析的ESMN类似,即使存在野生型TDP-43蛋白,缺乏功能性NLS或PLD的突变体TDP-43多肽也从脊髓组织中的细胞核重新分布到细胞质。图13A。在衍生自表达突变体ΔNLS或ΔPLD多肽的小鼠脊髓的运动神经元的细胞质中检测到约43Kd的磷酸化TDP-43多肽,但在仅表达野生型TDP-43多肽的小鼠中未检测到。图13B。在所有检查的样品中,运动神经元的细胞核中的任何磷酸化TDP-43仍然无法检测到。图13B。由于磷酸化位点在氨基酸位置409/410处,因此没有检测到缺乏功能性PLD的磷酸化TDP-43多肽也就不足为奇了。图13B。表达包含NLS结构域中的功能性突变的ΔNLS突变体TDP-43蛋白的16周龄小鼠脊髓的运动神经元表现出总体上增加的不溶性TDP-43蛋白水平。图13C。TDP-43蛋白在表达ΔPLD突变体TDP-43蛋白的小鼠中的溶解度似乎没有增加。ΔPLD突变体似乎是可溶的,因为在不溶性级分中没有检测到ΔPLD突变体。图13C。
表达包含ΔNLS结构域中的功能性突变的ΔNLS突变体TDP-43蛋白或缺乏功能性PLD的ΔPLD TDP-43突变蛋白的小鼠运动神经元的一个子集表现出广泛的细胞质TDP-43聚集。图14。与表达缺乏功能性NLS的突变体TDP-43多肽的小鼠相比,在表达ΔPLD突变体蛋白的小鼠的运动神经元中检测到细胞质聚集的频率较低。图14。
由于去神经支配是ALS中最早出现的病理特征之一,因此分析了主要包含快肌纤维(胫骨前肌)或慢肌纤维(肋间肌肉)的肌肉的去神经支配。TDP-43的错误定位导致部分神经支配的终板(*)和主要包含快肌纤维而不是慢肌纤维的肌肉的去神经支配(箭头)。图15A至图15B。
本文所示的数据表明本文所述的动物可以是ALS的有价值的疾病模型。在典型的ALS患者中,远端快速疲劳(FF)运动单位是最早受影响的,并且可以在运动神经元丧失之前观察到肌肉的神经源性变化。类似地,骨骼肌去神经支配也发生在最广泛使用的“ALS”模型SOD1 G93A小鼠的运动神经元丧失之前,其中FF运动单位早期和优先参与。相比之下,主要由慢纤维支配的近端肌肉(诸如肋间肌肉和隔膜)通常直到最后都没有受到影响—并且这些肌肉的去神经支配是致命的。随着疾病的进展,预期会出现肋间肌肉的去神经支配。
下面描述了用于分析表达(a)缺乏功能性NLS或PLD的突变体TDP-43多肽和(b)野生型TDP-43多肽两者的小鼠的表型的材料和方法。
突变体TDP-43多肽的胞内定位和磷酸化检测
使用识别TDP-43多肽的N末端的抗体(α-TDP-43 N末端)和识别TDP-43多肽的C末端朊病毒样结构域的抗体(α-TDP-43 C-末端)(Proteintech,Rosemont,IL)分析TDP-43突变体的胞内定位。通过将全脊髓组织在补充有蛋白酶和磷酸酶抑制剂(Roche)的冰冷裂解缓冲液(10mM KCl、10mM Tris-HCl、pH 7.4、1mM MgCl2、1mM DTT、0.01%NP-40)中在冰上孵育10分钟来制备可溶性细胞质蛋白提取物。然后将细胞通过27号注射器传代五次。在4℃下以4000rpm离心5分钟后,收集包含可溶性细胞质提取物的蛋白质上清液。通过将沉淀物重新悬浮在等体积的补充有蛋白酶和磷酸酶的RBS-100缓冲液(10mM Tris-HCl pH 7.4、2.5mM MgCl2、100mM NaCl、0.1%NP-40)中来制备不溶性核内蛋白提取物。将等体积的2XSDS样品缓冲液加入到每个级分中,并且将样品加热至90℃。然后将等体积的每个级分加载到14%SDS凝胶上并在225V下电泳50min,随后使用α-TDP-43 N末端抗体(图13A)、α-TDP-43-C末端抗体(图13A),或检测TDP-43在氨基酸409/410处的磷酸化的α-磷酸TDP-43抗体(图13B)(Cosmo Bio USA;目录号CAC-TIP-PTD-M01)对TDP-43进行蛋白质印迹。α-TDP-43-C末端抗体和α-磷酸TDP-43抗体都不能识别PLD缺失突变体。使用ImageJ进行光密度测定。(图13A和13B)使用GraphPad for Prism绘制细胞质/细胞核TDP-43的比率并进行统计分析。(图13A,下图)。
荧光原位杂交(FISH)
从脊柱中分离脊髓,在4%PFA中浸泡固定过夜(或FUS免疫染色1小时),并在1xPBS中洗涤。将脊髓段嵌入4%低熔点琼脂糖(Promega)中,并且使用振动切片机(Leica VT1000S)切割连续横切面(70μm)并将其加工呈自由浮动。自由浮动的脊髓切片用稀释于含有0.2%Triton X-100(TBS-T)的Tris缓冲盐水(pH 7.4)的5%正常驴血清封闭,并在稀释于含有5%正常驴血清的TBS-T的第一抗血清中在室温下孵育过夜。使用的一抗是:ChAT(1:250)EMD Millpore Cat AB144P;TDP-43(1:10,000)Proteintech 10782-2-AP和NeuN(1:500)EMD Millipore MAB377。用TBS-T洗涤后,将组织切片与偶联至Alexa 488、555、647(1:1,000;Life Technologies,Carlsbad,CA,USA)、Cy3或Cy5(稀释度1:500;JacksonImmunoresearch Labs,West Grove,PA,USA)的物种特异性二抗在室温下孵育4小时。用TBS-T洗涤后,将染色的组织切片安装在Flouromount G(Southern Biotech,Birmingham,AL,USA)的显微镜载玻片上,并使用LSM 510共聚焦显微镜以40倍放大率和1.5倍变焦成像。(图14)
突变体TDP-43多肽的溶解度
这个方案改编自Jo等人(2014)Nature Communications 5:3496。含有50mM N-乙基马来酰亚胺(NEM)、1mM NaF、1mM Na3VO4、1mM PMSF和抑蛋白酶肽、亮抑酶肽和胃酶抑素各10ug/ml)的500ul冰冷可溶性缓冲液(0.1M MES(pH 7)、1mM EDTA、0.5mM MgSO4、1M蔗糖)。将来自16周龄小鼠的脊髓组织中的细胞由通过21号针头进行的3-5次传代、随后通过23号针头进行的3-5传代而裂解。然后从每个样品中收集等体积的匀浆,并在4℃下以50,000x g离心20min,并且将剩余部分在-80℃下储存。去除上清液,并且将每个沉淀物重新悬浮在含有1%N-月桂酰肌氨酸(Sarkosyl)和蛋白酶抑制剂(1mM PMSF、50mM NEM和抑蛋白酶肽、亮抑酶肽和胃酶抑素各10ug/ml)的700ul RAB缓冲液(100mM MES(pH 6.8)、10%蔗糖、2mM EGTA、0.5mM MgSO4、500mM NaCl、1mM MgCl2、10mM NaH2PO4、20mM NaF)中,在室温下涡旋1min,然后在4℃下翻转式旋转孵育过夜。然后将样品在12℃下以200,000x g离心30min,并且收集上清液作为肌氨酰可溶性级分。将沉淀物重新悬浮在700ul RAB缓冲液中,并通过26号针头传代3-5次以完全分散沉淀物,从而产生肌氨酰不溶性级分。然后将等量份的肌氨酰可溶性和不溶性级分等分,并且向每个中加入等体积的2X SDS样品缓冲液。将样品加热至90℃。然后将等体积的每个级分加载到14%SDS凝胶上并在225V下电泳50min,随后对TDP-43进行蛋白质印迹。使用ImageJ进行光密度测定。(图13C)使用GraphPad for Prism绘制可溶性:不溶性TDP-43的比率并进行统计分析。(图13C)。
去神经研究
对于肌肉分析,将胫骨前肌(TA)和肋间肌肉进行解剖,通过浸入4%PFA后固定2小时,并在1x磷酸盐缓冲盐水,pH 7.4(PBS)中洗涤。然后将肌肉在蔗糖梯度(含10%-20%-30%蔗糖的0.1M磷酸盐缓冲液,pH 7.4)中平衡,嵌入O.C.T.化合物(Sakura,Torrance,CA)并在-20℃下冷冻。使用冷冻切片机(Leica CM 3050S)切割连续切片(30μm厚)。将肌肉冷冻切片(30μm)用抗突触素(invitrogen)的抗体染色以鉴定突触前末端,并用Alexa 488缀合的α-BTX(Invitrogen)染色以检测突触后乙酰胆碱受体。使用Zeiss Pascal LSM 510共聚焦显微镜使用x10和x40物镜获取图像。通过将VAChT与α-BTX信号之间的重叠区域总数(神经支配终板总数)除以α-BTX信号区域数(终板总数)来确定百分比(%)NMJ神经支配。
序列表
<110> 瑞泽恩制药公司(REGENERON PHARMACEUTICALS, INC.)
阿尔蒂·夏尔马-康宁(SHARMA-KANNING, AARTI)
大卫·弗伦杜威 (FRENDEWEY, DAVID)
布莱恩·扎姆布罗维兹(ZAMBROWICZ, BRIAN)
<120> tdp-43蛋白病的建模
<130> 10312WO01
<150> 62/867,785
<151> 2019-06-27
<160> 43
<170> PatentIn version 3.5
<210> 1
<211> 414
<212> PRT
<213> NP_663531 -野生型小鼠TDP-43 (NP_663531 - Wildtype mouse TDP-43)
<400> 1
Met Ser Glu Tyr Ile Arg Val Thr Glu Asp Glu Asn Asp Glu Pro Ile
1 5 10 15
Glu Ile Pro Ser Glu Asp Asp Gly Thr Val Leu Leu Ser Thr Val Thr
20 25 30
Ala Gln Phe Pro Gly Ala Cys Gly Leu Arg Tyr Arg Asn Pro Val Ser
35 40 45
Gln Cys Met Arg Gly Val Arg Leu Val Glu Gly Ile Leu His Ala Pro
50 55 60
Asp Ala Gly Trp Gly Asn Leu Val Tyr Val Val Asn Tyr Pro Lys Asp
65 70 75 80
Asn Lys Arg Lys Met Asp Glu Thr Asp Ala Ser Ser Ala Val Lys Val
85 90 95
Lys Arg Ala Val Gln Lys Thr Ser Asp Leu Ile Val Leu Gly Leu Pro
100 105 110
Trp Lys Thr Thr Glu Gln Asp Leu Lys Asp Tyr Phe Ser Thr Phe Gly
115 120 125
Glu Val Leu Met Val Gln Val Lys Lys Asp Leu Lys Thr Gly His Ser
130 135 140
Lys Gly Phe Gly Phe Val Arg Phe Thr Glu Tyr Glu Thr Gln Val Lys
145 150 155 160
Val Met Ser Gln Arg His Met Ile Asp Gly Arg Trp Cys Asp Cys Lys
165 170 175
Leu Pro Asn Ser Lys Gln Ser Pro Asp Glu Pro Leu Arg Ser Arg Lys
180 185 190
Val Phe Val Gly Arg Cys Thr Glu Asp Met Thr Ala Glu Glu Leu Gln
195 200 205
Gln Phe Phe Cys Gln Tyr Gly Glu Val Val Asp Val Phe Ile Pro Lys
210 215 220
Pro Phe Arg Ala Phe Ala Phe Val Thr Phe Ala Asp Asp Lys Val Ala
225 230 235 240
Gln Ser Leu Cys Gly Glu Asp Leu Ile Ile Lys Gly Ile Ser Val His
245 250 255
Ile Ser Asn Ala Glu Pro Lys His Asn Ser Asn Arg Gln Leu Glu Arg
260 265 270
Ser Gly Arg Phe Gly Gly Asn Pro Gly Gly Phe Gly Asn Gln Gly Gly
275 280 285
Phe Gly Asn Ser Arg Gly Gly Gly Ala Gly Leu Gly Asn Asn Gln Gly
290 295 300
Gly Asn Met Gly Gly Gly Met Asn Phe Gly Ala Phe Ser Ile Asn Pro
305 310 315 320
Ala Met Met Ala Ala Ala Gln Ala Ala Leu Gln Ser Ser Trp Gly Met
325 330 335
Met Gly Met Leu Ala Ser Gln Gln Asn Gln Ser Gly Pro Ser Gly Asn
340 345 350
Asn Gln Ser Gln Gly Ser Met Gln Arg Glu Pro Asn Gln Ala Phe Gly
355 360 365
Ser Gly Asn Asn Ser Tyr Ser Gly Ser Asn Ser Gly Ala Pro Leu Gly
370 375 380
Trp Gly Ser Ala Ser Asn Ala Gly Ser Gly Ser Gly Phe Asn Gly Gly
385 390 395 400
Phe Gly Ser Ser Met Asp Ser Lys Ser Ser Gly Trp Gly Met
405 410
<210> 2
<211> 7454
<212> DNA
<213> NM_145556.4 - 野生型小鼠TARDBP编码序列(NM_145556.4 - Wildtype mouseTARDBP coding sequence)
<400> 2
ctcggaaggc cgagtggccg ttctgtcctt catctgtcag tttttcagac ccagctgttt 60
tcattgttgc gtttctttac ttttttctat acgccgaaga gcctgctagc atccgagcct 120
ctgggaggag agagcgcctg tggcttccct cggagagcgc ccctcctgca gggaagccag 180
tgggagaggc cgaaggcggg cgagggcggg aggcggccct agcgccattt tgtgggcacg 240
gagcggtagc gcggctgttg tcggattcct tcccgtctgt gcttcctcct tgtgcttcct 300
agcagtggcc tagcggagat ttaagcaaag atgtctgaat atattcgggt aacagaagat 360
gagaacgatg aacccattga aataccatca gaagacgatg ggacggtgtt gctgtccaca 420
gttacagccc agtttccagg ggcatgcggc ctgcgctacc ggaatcccgt gtctcagtgt 480
atgagaggag tccgactggt ggaaggaatt ctgcatgccc cagatgctgg ctggggcaat 540
ctggtatatg ttgtcaacta tcccaaagat aacaaaagga aaatggatga gacagatgct 600
tcctctgcag tgaaagtgaa aagagcagtc cagaaaacat ctgacctcat agtgttgggt 660
ctcccctgga aaacaactga gcaggatctg aaagactatt tcagtacttt tggagaggtt 720
cttatggttc aggtcaagaa agatcttaaa actggtcact cgaaagggtt tggctttgtt 780
cgatttacag aatatgaaac ccaagtgaaa gtaatgtcac aacgacatat gatagatggg 840
cgatggtgtg actgtaaact tcccaactct aagcaaagcc cagacgagcc tttgagaagc 900
agaaaggtgt ttgttggacg ttgtacagag gacatgactg ctgaagagct tcagcagttt 960
ttctgtcagt atggagaagt ggtagatgtc ttcattccca aaccattcag agcttttgcc 1020
ttcgtcacct ttgcagatga taaggttgcc cagtctcttt gtggagagga tttgatcatt 1080
aaaggaatca gcgtgcatat atccaatgct gaacctaagc ataatagcaa tagacagtta 1140
gaaagaagtg gaagatttgg tggtaatcca ggtggctttg ggaatcaggg tgggtttggt 1200
aacagtagag ggggtggagc tggcttggga aataaccagg gtggtaatat gggtggaggg 1260
atgaactttg gtgcttttag cattaaccca gcgatgatgg ctgcggctca ggcagcgttg 1320
cagagcagtt ggggtatgat gggcatgtta gccagccagc agaaccagtc gggcccatct 1380
gggaataacc aaagccaggg cagcatgcag agggaaccaa atcaggcttt tggttctgga 1440
aataattcct acagtggttc taattctggt gccccccttg gttgggggtc agcatcaaat 1500
gcaggatcgg gcagtggttt taatgggggc tttggctcga gcatggattc taagtcttct 1560
ggctggggaa tgtaggtggt ggggggtggt tagtaggttg gttattaggt taggtagatt 1620
tagaatggtg ggattcaaat ttttctaaac tcatggtaag tatattgtaa aatacatatg 1680
tactaaaatt ttcagattgg tttgttcagt gtggagtata ttcagcagta tttttgacat 1740
ttttctttag aaaaaaagag gggaaagcta aatgaatttt ataagttttg ttatataaag 1800
ggttaaaata ctgagtgggt gaaagtgaac tgctgtttgc ctaattggta aaccaacact 1860
acaattgatc tcagaaggtt tctctgtaat attctatcat tgaaattgtt aatgaattct 1920
ttgcatgttc agagtagaaa ccattggtta gaactacatt cttttctcct tattttaatt 1980
tgaatcccac cctatgaatt ttttccttag gaaaatctcc atttgggaga tcatgatgtc 2040
atggtgtttg attcttttgg ttttgttttt aacacttgtc ttccttcata tacgaaagta 2100
caatatgaag ccttcattta atctctgcag ttcatctcat ttcaaatgtt tatggaagaa 2160
gcacttcatt gaaagtagtg ctgtaaatat tctgccatag gaatacttct gtctacatgc 2220
tttctcatcc aagaattcgt catcacgctg cacaggctgc gtctttgacg gtgggtgttc 2280
catttttatc cgctactctt tatttcatgg agtcgtatca acgctatgaa cgcaaggctg 2340
tgatatggaa ccagaaggct gtttgaactt ttgaaacctt gtgtgggatt gatggtggtg 2400
ccgaggcatg aaaggctagt atgagcgaga aaaggagagc gcgtgcagag acttggtggt 2460
ggaaaatgga tattttttaa cttggagaga tgtgtcactc aatcctgtgg ctttggtgag 2520
agagtgtgca gagagcaatg atagcaaata acgtacgaat gttttacatc aaaggacatc 2580
cacatcagtt ggaagacttt gagttttgtt cttaggaaac ccactttagt tgaatgtgtt 2640
aagtgaaata cttgtacttc cctccccctc tgtcaactgc tgtgaatgct gtatggtgtg 2700
tgttctcctc tgttactgat ctggaagtgt gggaacgtga actgaagctg atgggctgcg 2760
aacatggact gagcttgtgg tgtgctttgc aggagaactt ggaagcagag ttcaccagtg 2820
agctcaggtg tctcaaagaa gggtggaagt tctcatgtct gttagctatt cataagaatg 2880
ctgtttgctg cagttctgtg tcctgtgctt ggatgctttt ttataagagt tgtcattgtt 2940
ggaaattctt aaataaaact gatttaaata atatgtgtct ttgttttgca gccctgaatg 3000
caaagaattc atagcagtta attccccttt ttgacccttt tgagatggaa ctttcataaa 3060
gtttcttggc agtagtttat tttgcttcaa ataaacttat ttgaaaagtt gtctcaagtc 3120
aaatggattc atcacctgtc atgcattgac acctgatacc cagacttaat tgctatttgt 3180
tcttgcattg tccaaagtga aagtttttct ttggtttgtt tttaatttag tttttcttaa 3240
gtctgggtga ccgcacctaa aatggtaagc agttaccctc tggcttgttc tgagtgcctc 3300
tgtgcatttg attttctatt tacatgctgt ataaatctcc actggggaat catgccttct 3360
aaaaatattt gggagagggc aaaagagttg atttctaatg ctttgtagca gagcatatca 3420
atgggaaaga aggttaagca cctttctgtt tgggatttga aaagtggaat taattgcaat 3480
agggatgaag tagaagaaac caagaaacca tgtgcctgaa atacattaag aagcctgatt 3540
gatagcttta agaactagta gggtgggttg tcttacctgt ggcagtctta agtgaggtag 3600
gcttttgccc tcctgaatgt gggggttatg tagtgatgaa tatgctcaca aaatcagatt 3660
agactgtcaa tgcattgtta atgtaaaagc aataatacat tgattattgt acttttcctg 3720
taactactga gaccggaggc gctccttttc taactggaag aatgggacag tttttgtgtt 3780
ggtagttttt cctaatgccc ttacctaaat agattatgat aaataggttt gtcattttgc 3840
aagttgcgtg ttttaaaatt ttatatccgt tagagacttg ttatgaacac attgtttcat 3900
tatacagtat cctctgtaaa aggatcgtga gttattgtaa gtttttttct ctgcatctaa 3960
ccctgcatga tttccaaacc ctgtgcatct gaattttgca ttttagcact gtttgcactg 4020
ttactcagca gcagtaacat ggtaacatta aaatggtttt cggggacctc caaagacggc 4080
caggagtcct ggggtaagtt acttgtcaat ggcatggttt tgatcccttt tttacacttg 4140
ttaaagactt actggtcata gaagtctttc agtgttgatc agccttttaa catgtttatg 4200
gatgacatag ctgtagttag ttacttgccg taaatgaggt tttagaaata aactacttgg 4260
caaagatttg gttttgaaag tctggtcatc aaaacgcgtt cattccttag aaataatgaa 4320
gaacaactct ttgaaccaca gttgaataaa aggttttctt gccaccaaca gtttagtgtc 4380
tggagtctta ctggaagaaa aaaaaattct atatcatgac aatgctagaa aagttaaggt 4440
gacttatgtg ggaagatgca atatagcatt ttcatccttt aaaatttgag tctccaggtg 4500
ggtgtggtgg cccatgcttt taatcccaga attggtgtaa atgagttgta ggccagctat 4560
ttccccatct tgaggcaccc tgtcttgcct tgttggaaga gccagttaaa atcaaacatg 4620
acctttaagg tcagcatctt agcagaagag cagtttattt caggataact tactgttttt 4680
gatacataag caaatgactg taccttgtac agttacggtt gacttccctg agcccaacgc 4740
tcacctaaga aaagtgggct gggtatagtg aaacacctgt taaggttttt ggaatgattt 4800
gctaaattgc ccttgtaaag ggtaaaatgc tgtttcgtgt tctttttatc tgacaatttg 4860
gtgaatctgg tagaacatgc ctatatccca atattctgga atggacttgg tgttaattta 4920
atagctgatc taatgtgaag gtcacacacc tgctttccgc ttaccttcca aaaggtattc 4980
tggaaccact cagaagttac tcagaaagta agagcacttt ctgagctcat taagaccaaa 5040
tctacacact agacacaaca agccctttgt tggccagaaa tggaaacagc cagtataaaa 5100
taagtagatt gtagggaatc aaatacaact tgttttttct gtgttggggg ttggccaagc 5160
actgttaaac acaaatcaaa gctgatattg gcaagtgttt ggacctgtaa caatctcacc 5220
tgctctgatt ttggggtagg ctgtcattct taggtttgtt actaagcttc ccaggtactt 5280
ggcgatatga ggaacaatga ttggacgatg caaattagaa attacttatt atgttctcaa 5340
tccagggaat atagttgatg acttttgtgt agaccccata ctggtctgcc gccccacaat 5400
taatggaacc ccaggaaact attcctccca caaaccatcg ctgtgtctca ttatctagaa 5460
acactaatgc ccccccactg tcacctctgc agctgtcctt gccaccagtc tctaagccag 5520
cacagagcat gttagcgctt actcttactc ctggatagag cttttcatac acggcggtac 5580
atttttggtg gtcagcaatt ggtatgtcca caaacattag gtttctagca agaagcccct 5640
tctgggttaa cccccagcca gccacagttc cagtgaagtc tgttctcatt aaggatgcag 5700
cttcttttcg cggtaggcaa acaggcatga tgcttccgtt gattgtgact ttgttcttga 5760
gtttaatcaa tgctatatca ttgtcaaaac cagcaccgtg agtgtagcct tcatgtataa 5820
agatttcctc gggccaggct tgagtgtaat gaggtgagag ccttttgagg atgcccattc 5880
ggatgttcag ggaggacgct gccattcttt tctcatatac agcatgagcg gctgttagga 5940
cccaattgtc atgtataagt gcacctgctg ctgctgtagt ttgacccagc aacaagactt 6000
gccaaggaaa gtcaccaggc tttgcaggct gccctccaac tatgcgtcct cctatagtgt 6060
gtgtggacag cccacaaact gagggataaa aaacaagtat ttaatgccct acaaattgat 6120
aggcatcctc cctgttgagt gaggctattt aagtttttgt ttagcctgct cacctccttg 6180
taaagatcag taagagatct cagagattgt tttgctgaaa gagaacagca tgagggagtc 6240
tggacaggac ttgtgtgcag gaggacatga cactacttag aggccaaaga caaccccctc 6300
accacaccct gagctgcttg tttttctctt tttgggctct ctgggaattc tgggaaagca 6360
ggaactatga tttacaaagt ttctgttgtc tttaaatgta agactctaaa ttacaatgtt 6420
gcagcaatag ccaaagtgct tctggttcaa aaattggtaa ttttggtctg gtggagccct 6480
ccaaacactt ttaccgttct ttgcaaactg agggctcagg aatgcaacac atgttcttta 6540
ttgtggttgt gcactttgat taaaacttgg aagccgcatg tcagccaaat acaaggctag 6600
aaaactaatt taaaccagct aacacggggg taatgagtgt attattacct ttcaattaaa 6660
aaaaaagcac tctcaactgt tgttggagcc aattctggta aagaaattta agtactatta 6720
aaaggcaaat tgcattaatg tttaaaaatc ttgatgtcgt tgaaaacaat tgcttaggga 6780
aataatgaag ttattagctt tggggtttaa tagcattttt acagagaaga aaagtaacaa 6840
gagttcttgg ttataaatgt ataaacggtt tgagataatt taagaaatca tttaattttt 6900
tatgcttgcc tagttataag gtcaaaaaca atcaagtgca tgatgcacct agcttccgtg 6960
tggaagggga aatgtgagca cactgttggg aaacactaag ctccagcctc agccaagtgc 7020
tgagctttct gcctccccag ccagaccctg cctattgtct gccagctact ctgtcagcta 7080
tgaatctctt ttataaatgg cgtccattac caggctcaca aaccgggggg agtttttctc 7140
ctttggagct cgtccagaat ccatcagcct cacacacata tttacctgca agtcattgga 7200
aaagcaaaaa tgtttagctg tagttgtcat ttgcttgaat aaccccttga aaaatgttga 7260
ttcttgagca tctgtggtgg ggagaggtgt gtgaataacc attttacatg atttcataaa 7320
taggtgtctg cattaccatg tttgcttgca aagtggaaac cttttagatg tgtaacttga 7380
atatgtatca agatctcaag tgcttaatga taaggttttg acttgttaaa ttaaaccatt 7440
tggaatatat tgtg 7454
<210> 3
<211> 285
<212> PRT
<213> NP_001011979 - 野生型大鼠TDP-43 (NP_001011979 - Wildtype rat TDP-43)
<400> 3
Met Ser Glu Tyr Ile Arg Val Thr Glu Asp Glu Asn Asp Glu Pro Ile
1 5 10 15
Glu Ile Pro Ser Glu Asp Asp Gly Thr Val Leu Leu Ser Thr Val Thr
20 25 30
Ala Gln Phe Pro Gly Ala Cys Gly Leu Arg Tyr Arg Asn Pro Val Ser
35 40 45
Gln Cys Met Arg Gly Val Arg Leu Val Glu Gly Ile Leu His Ala Pro
50 55 60
Asp Ala Gly Trp Gly Asn Leu Val Tyr Val Val Asn Tyr Pro Lys Asp
65 70 75 80
Asn Lys Arg Lys Met Asp Glu Ala Asp Ala Ser Ser Ala Val Lys Val
85 90 95
Lys Arg Ala Val Gln Lys Thr Ser Asp Leu Ile Val Leu Gly Leu Pro
100 105 110
Trp Lys Thr Thr Glu Gln Asp Leu Lys Asp Tyr Phe Ser Thr Phe Gly
115 120 125
Glu Val Leu Met Val Gln Val Lys Lys Asp Leu Lys Thr Gly His Ser
130 135 140
Lys Gly Phe Gly Phe Val Arg Phe Thr Glu Tyr Glu Thr Gln Val Lys
145 150 155 160
Val Met Ser Gln Arg His Met Ile Asp Gly Arg Trp Cys Asp Cys Lys
165 170 175
Leu Pro Asn Ser Lys Gln Ser Pro Asp Glu Pro Leu Arg Ser Arg Lys
180 185 190
Val Phe Val Gly Arg Cys Thr Glu Asp Met Thr Ala Glu Glu Leu Gln
195 200 205
Gln Phe Phe Cys Gln Tyr Gly Glu Val Val Asp Val Phe Ile Pro Lys
210 215 220
Pro Phe Arg Ala Phe Ala Phe Val Thr Phe Ala Asp Asp Lys Val Ala
225 230 235 240
Gln Ser Leu Cys Gly Glu Asp Leu Ile Ile Lys Gly Ile Ser Val His
245 250 255
Ile Ser Asn Ala Glu Pro Lys His Asn Ser Asn Arg Gln Leu Glu Arg
260 265 270
Ser Gly Arg Phe Gly Gly Lys Ser Pro Phe Gly Arg Ser
275 280 285
<210> 4
<211> 2040
<212> DNA
<213> NM_001011979.2 - 野生型大鼠TARDBP编码序列(NM_001011979.2 - Wildtyperat TARDBP coding sequence)
<400> 4
ttttgtgggc acgaagcggt agctcggctg ttgttgggtt cctttccgtc ttcgatcctt 60
cgttgtgctt cctagcagcg gcccagtgga gatttaagca aagatgtctg aatatattcg 120
ggtaacagaa gatgagaatg atgagcccat tgaaatacca tcagaagacg atgggacagt 180
gttgctgtcc acagttacag cccagtttcc aggggcgtgt ggcctgcgct accggaatcc 240
agtgtctcag tgtatgagag gtgtccgact ggtggaagga attctgcatg ccccagatgc 300
tggctggggc aatctggtct atgttgtcaa ctatcccaaa gataacaaaa ggaaaatgga 360
tgaggcggat gcttcctctg cagtgaaagt gaaaagagca gtccagaaga catctgacct 420
catagtgttg ggtctcccct ggaaaacaac agagcaggac ctaaaagact acttcagtac 480
ttttggagag gttcttatgg ttcaggtcaa gaaagatctt aaaactggtc actcaaaagg 540
gtttggcttt gttcgattta cggaatatga aactcaagtg aaagtaatgt cacagcgaca 600
tatgatagat gggcgatggt gtgactgtaa acttccaaat tctaagcaaa gcccagacga 660
gcctttgaga agcagaaagg tgtttgttgg acgttgtaca gaggacatga ctgctgaaga 720
gcttcagcag ttcttctgtc agtatggaga agtggtagat gtcttcattc ccaaaccatt 780
cagagctttt gcctttgtta cctttgcaga tgataaggtt gcccagtctc tttgtggaga 840
ggacttgatc attaaaggaa tcagcgtgca tatatccaat gctgaaccta agcataatag 900
caatagacag ttagaaagaa gtggaagatt tggtggaaaa tctccatttg ggagatcatg 960
atgtcatggt gtttggttct tttggttttg tttttaacac ttgtcttcct tcatatacga 1020
aagtacaata tgaagccttc atttaatctc tgcagttcat ctcatttcaa atgtttatgg 1080
aagaagcact tcattgaaag tagtgctgta aatattctgc cataggaata cttctgtcta 1140
catgctttct catccaagaa ttcgtcatca cgctgcacag gctgcgtctt tgacggtggg 1200
tgttccattt ttatccgcta ctctttattt catggaatcg tatcaacgct atgaacgcaa 1260
ggctgtgata tggaaccaga aggctgtttg aacttttgaa accttgtgtg ggattgatgg 1320
tggtgccgag gcatgaaagg ctagtatgag cgagaaaagg agagagcgcg tgcagagact 1380
tggtggtgga aaatggatat tttttaactt ggagagatgt gtccctcaat cctgtggctt 1440
tggtgcgaga gtgtgcagag agcaatgata gcagataact aacgtacgag tgtttctgca 1500
tcagaggaca tccacgtctg ttggaagact ttgagttttg ttcttaggaa acccacagta 1560
gctgaatgtg ttaagtgaaa tacttgtact tccctcccct ctgtcaactg ctgtgaatgc 1620
tgtatggtgt gtgttctcct ctgttactga tctggaagtg tgggaacgtg aactgaagct 1680
gatgggctgc gaacatggac tgagcttgtg gtgtgctttg caggagaact tggaagcaga 1740
gttcaccagt gagctcaggt gtctcaaaga agggtggaag ttctcatgtc tgttagctat 1800
tcataagaat gctgtttgct gcagttctgt gtcctgtgct tggatgcttt ttataagagt 1860
tgtcattgtt ggaaattctt aaataaaact gatttaaata atatgtgtct ttgttttgca 1920
gccctgaatg caaagaattc atagcagtta attccccttt ttgacccttt tgagatggaa 1980
ctttcataaa gtttcttggc agtagtttat tttgcttcaa ataaacttat ttgaaaagtt 2040
<210> 5
<211> 414
<212> PRT
<213> NP_031401.1 - 野生型人 TDP-43 (NP_031401.1 - Wildtype human TDP-43)
<400> 5
Met Ser Glu Tyr Ile Arg Val Thr Glu Asp Glu Asn Asp Glu Pro Ile
1 5 10 15
Glu Ile Pro Ser Glu Asp Asp Gly Thr Val Leu Leu Ser Thr Val Thr
20 25 30
Ala Gln Phe Pro Gly Ala Cys Gly Leu Arg Tyr Arg Asn Pro Val Ser
35 40 45
Gln Cys Met Arg Gly Val Arg Leu Val Glu Gly Ile Leu His Ala Pro
50 55 60
Asp Ala Gly Trp Gly Asn Leu Val Tyr Val Val Asn Tyr Pro Lys Asp
65 70 75 80
Asn Lys Arg Lys Met Asp Glu Thr Asp Ala Ser Ser Ala Val Lys Val
85 90 95
Lys Arg Ala Val Gln Lys Thr Ser Asp Leu Ile Val Leu Gly Leu Pro
100 105 110
Trp Lys Thr Thr Glu Gln Asp Leu Lys Glu Tyr Phe Ser Thr Phe Gly
115 120 125
Glu Val Leu Met Val Gln Val Lys Lys Asp Leu Lys Thr Gly His Ser
130 135 140
Lys Gly Phe Gly Phe Val Arg Phe Thr Glu Tyr Glu Thr Gln Val Lys
145 150 155 160
Val Met Ser Gln Arg His Met Ile Asp Gly Arg Trp Cys Asp Cys Lys
165 170 175
Leu Pro Asn Ser Lys Gln Ser Gln Asp Glu Pro Leu Arg Ser Arg Lys
180 185 190
Val Phe Val Gly Arg Cys Thr Glu Asp Met Thr Glu Asp Glu Leu Arg
195 200 205
Glu Phe Phe Ser Gln Tyr Gly Asp Val Met Asp Val Phe Ile Pro Lys
210 215 220
Pro Phe Arg Ala Phe Ala Phe Val Thr Phe Ala Asp Asp Gln Ile Ala
225 230 235 240
Gln Ser Leu Cys Gly Glu Asp Leu Ile Ile Lys Gly Ile Ser Val His
245 250 255
Ile Ser Asn Ala Glu Pro Lys His Asn Ser Asn Arg Gln Leu Glu Arg
260 265 270
Ser Gly Arg Phe Gly Gly Asn Pro Gly Gly Phe Gly Asn Gln Gly Gly
275 280 285
Phe Gly Asn Ser Arg Gly Gly Gly Ala Gly Leu Gly Asn Asn Gln Gly
290 295 300
Ser Asn Met Gly Gly Gly Met Asn Phe Gly Ala Phe Ser Ile Asn Pro
305 310 315 320
Ala Met Met Ala Ala Ala Gln Ala Ala Leu Gln Ser Ser Trp Gly Met
325 330 335
Met Gly Met Leu Ala Ser Gln Gln Asn Gln Ser Gly Pro Ser Gly Asn
340 345 350
Asn Gln Asn Gln Gly Asn Met Gln Arg Glu Pro Asn Gln Ala Phe Gly
355 360 365
Ser Gly Asn Asn Ser Tyr Ser Gly Ser Asn Ser Gly Ala Ala Ile Gly
370 375 380
Trp Gly Ser Ala Ser Asn Ala Gly Ser Gly Ser Gly Phe Asn Gly Gly
385 390 395 400
Phe Gly Ser Ser Met Asp Ser Lys Ser Ser Gly Trp Gly Met
405 410
<210> 6
<211> 4185
<212> DNA
<213> NM_007375.3 - 野生型人TARDBP编码序列(NM_007375.3 - Wildtype humanTARDBP coding sequence)
<400> 6
attttgtggg agcgaagcgg tggctgggct gcgcttgggt ccgtcgctgc ttcggtgtcc 60
ctgtcgggct tcccagcagc ggcctagcgg gaaaagtaaa agatgtctga atatattcgg 120
gtaaccgaag atgagaacga tgagcccatt gaaataccat cggaagacga tgggacggtg 180
ctgctctcca cggttacagc ccagtttcca ggggcgtgtg ggcttcgcta caggaatcca 240
gtgtctcagt gtatgagagg tgtccggctg gtagaaggaa ttctgcatgc cccagatgct 300
ggctggggaa atctggtgta tgttgtcaac tatccaaaag ataacaaaag aaaaatggat 360
gagacagatg cttcatcagc agtgaaagtg aaaagagcag tccagaaaac atccgattta 420
atagtgttgg gtctcccatg gaaaacaacc gaacaggacc tgaaagagta ttttagtacc 480
tttggagaag ttcttatggt gcaggtcaag aaagatctta agactggtca ttcaaagggg 540
tttggctttg ttcgttttac ggaatatgaa acacaagtga aagtaatgtc acagcgacat 600
atgatagatg gacgatggtg tgactgcaaa cttcctaatt ctaagcaaag ccaagatgag 660
cctttgagaa gcagaaaagt gtttgtgggg cgctgtacag aggacatgac tgaggatgag 720
ctgcgggagt tcttctctca gtacggggat gtgatggatg tcttcatccc caagccattc 780
agggcctttg cctttgttac atttgcagat gatcagattg cgcagtctct ttgtggagag 840
gacttgatca ttaaaggaat cagcgttcat atatccaatg ccgaacctaa gcacaatagc 900
aatagacagt tagaaagaag tggaagattt ggtggtaatc caggtggctt tgggaatcag 960
ggtggatttg gtaatagcag agggggtgga gctggtttgg gaaacaatca aggtagtaat 1020
atgggtggtg ggatgaactt tggtgcgttc agcattaatc cagccatgat ggctgccgcc 1080
caggcagcac tacagagcag ttggggtatg atgggcatgt tagccagcca gcagaaccag 1140
tcaggcccat cgggtaataa ccaaaaccaa ggcaacatgc agagggagcc aaaccaggcc 1200
ttcggttctg gaaataactc ttatagtggc tctaattctg gtgcagcaat tggttgggga 1260
tcagcatcca atgcagggtc gggcagtggt tttaatggag gctttggctc aagcatggat 1320
tctaagtctt ctggctgggg aatgtagaca gtggggttgt ggttggttgg tatagaatgg 1380
tgggaattca aatttttcta aactcatggt aagtatattg taaaatacat atgtactaag 1440
aattttcaaa attggtttgt tcagtgtgga gtatattcag cagtattttt gacatttttc 1500
tttagaaaaa ggaagagcta aaggaatttt ataagttttg ttacatgaaa ggttgaaata 1560
ttgagtggtt gaaagtgaac tgctgtttgc ctgattggta aaccaacaca ctacaattga 1620
tatcaaaagg tttctcctgt aatattttat ccctggactt gtcaagtgaa ttctttgcat 1680
gttcaaaacg gaaaccattg attagaacta cattctttac cccttgtttt aatttgaacc 1740
ccaccatatg gatttttttc cttaagaaaa tctcctttta ggagatcatg gtgtcacagt 1800
gtttggttct tttgttttgt tttttaacac ttgtctcccc tcatacacaa aagtacaata 1860
tgaagccttc atttaatctc tgcagttcat ctcatttcaa atgtttatgg aagaagcact 1920
tcattgaaag tagtgctgta aatattctgc cataggaata ctgtctacat gctttctcat 1980
tcaagaattc gtcatcacgc atcacaggcc gcgtctttga cggtgggtgt cccattttta 2040
tccgctactc tttatttcat ggagtcgtat caacgctatg aacgcaaggc tgtgatatgg 2100
aaccagaagg ctgtctgaac ttttgaaacc ttgtgtggga ttgatggtgg tgccgaggca 2160
tgaaaggcta gtatgagcga gaaaaggaga gagcgcgtgc agagacttgg tggtgcataa 2220
tggatatttt ttaacttggc gagatgtgtc tctcaatcct gtggctttgg tgagagagtg 2280
tgcagagagc aatgatagca aataatgtac gaatgttttt tgcattcaaa ggacatccac 2340
atctgttgga agacttttaa gtgagttttt gttcttagat aacccacatt agatgaatgt 2400
gttaagtgaa atgatacttg tactccccct acccctttgt caactgctgt gaatgctgta 2460
tggtgtgtgt tctcttctgt tactgatatg taagtgtggc aatgtgaact gaagctgatg 2520
ggctgagaac atggactgag cttgtggtgt gctttgcagg aggacttgaa gcagagttca 2580
ccagtgagct caggtgtctc aaagaagggt ggaagttcta atgtctgtta gctacccata 2640
agaatgctgt ttgctgcagt tctgtgtcct gtgcttggat gctttttata agagttgtca 2700
ttgttggaaa ttcttaaata aaactgattt aaataatatg tgtctttgtt ttgcagccct 2760
gaatgcaaag aattcatagc agttaattcc ccttttttga cccttttgag atggaacttt 2820
cataaagttt cttggcagta gtttattttg cttcaaataa acttatttga aaagttgtct 2880
caagtcaaat ggattcatca cctgtcatgc attgacacct gatacccaga cttaattggt 2940
atttgttctt gcattggcca aagtgaaaat tttttttttt cttttgaaat ctagttttga 3000
ataagtctgg gtgaccgcac ctaaaatggt aagcagtacc ctccggcttt ttcttagtgc 3060
ctctgtgcat ttgggtgatg ttctatttac atggcctgtg taaatctcca ttgggaagtc 3120
atgccttcta aaaagattct tatttggggg agtgggcaaa atgttgatta ttttctaatg 3180
ctttgtagca aagcatatca attgaaaagg gaatatcagc accttcctag tttgggattt 3240
gaaaagtgga attaattgca gtagggataa agtagaagaa accacaaatt atcttgtgcc 3300
tgaaatccat taagaggcct gatagcttta agaattaggg tgggttgtct gtctggaagt 3360
gttaagtgga atgggctttg tcctccagga ggtgggggaa tgtggtaaca ttgaatacag 3420
ttgaataaaa tcgcttacaa aactcacact ctcacaatgc attgttaagt atgtaaaagc 3480
aataacattg attctctgtt gtactttttt gtaactaatt ctgtgagagt tgagctcatt 3540
ttctagttgg aagaatgtga tatttgttgt gttggtagtt tacctaatgc ccttacctaa 3600
ttagattatg ataaataggt ttgtcatttt gcaagttaca taaacattta tcaatgaagt 3660
catcctttag acttgtaatc gccacattgt ttcattattc agtttcctct gtaaagggat 3720
cttgagttgt tttaattttt tttttctgca tctgaatctg catgatttcc aaaccctgta 3780
ccatctgaat tttgcatttt agcacttgca ctattactca gcagcagtaa catggtaaca 3840
cttaaaatgg tactcgggga cctccaaaga ctaaactgac aagccttcaa ggagcccagg 3900
ggtaagttaa cttgtcaacg gcatggttta atcccttctt tacacttgtg taaatttcag 3960
ttactggtca tagaaggctt tcaatgttga gtggcctttt attaacatgt ttatggtact 4020
gcatagatac gggtatttat tttaccctaa gaagattttg aagtttaaaa gtacttaaac 4080
tatttggcaa agatttgttt ttaaaaatct atttggtcaa tctaaatgca ttcattctaa 4140
aaaatttttt gaaccagata aataaaattt ttttttgaca ccaca 4185
<210> 7
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> RRM1 RNP2共有序列
<400> 7
Leu Ile Val Leu Gly Leu
1 5
<210> 8
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> RRM1 RNP1共有序列
<400> 8
Lys Gly Phe Gly Phe Val Arg Phe
1 5
<210> 9
<211> 6
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> RRM2 RNP2共有序列
<400> 9
Val Phe Val Gly Arg Cys
1 5
<210> 10
<211> 7
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> RRM2 RNP1共有序列
<400> 10
Arg Ala Phe Ala Phe Val Thr
1 5
<210> 11
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> TDP-43 Ex3-Ex4测定正向引物
<400> 11
tgtgactgta aacttcccaa ct 22
<210> 12
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> TDP-43 Ex3-Ex4测定反向引物
<400> 12
ctcttcagca gtcatgtcct c 21
<210> 13
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> TDP-43 Ex3-Ex4探针
<400> 13
aagcccagac gagcctttga gaag 24
<210> 14
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crem Ex1-Ex2测定正向引物
<400> 14
tggctgtaac tggagatgaa ac 22
<210> 15
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crem Ex1-Ex2测定反向引物
<400> 15
ccttgtggca aagcagtagt a 21
<210> 16
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crem Ex1-Ex2探针
<400> 16
acatgccaac ttaccagatc cgagc 25
<210> 17
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crem Ex1-隐藏测定正向引物
<400> 17
tggctgtaac tggagatgaa ac 22
<210> 18
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crem Ex1-隐藏测定反向引物
<400> 18
ggaagagaag caactcctca aa 22
<210> 19
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crem Ex1-隐藏探针
<400> 19
acacacacac acacacacac acac 24
<210> 20
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crem 隐藏-Ex2测定正向引物
<400> 20
catgggttcc aaaggatcaa ac 22
<210> 21
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crem隐藏-Ex2测定反向引物
<400> 21
tgtggcaaag cagtagtagg 20
<210> 22
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crem隐藏-Ex2探针
<400> 22
acatgccaac ttaccagatc cgagc 25
<210> 23
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Fyxd2Ex3-Ex4测定正向引物
<400> 23
actatgaaac cgtccgcaaa 20
<210> 24
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Fyxed Ex3-Ex4测定反向引物
<400> 24
cccacagcgg aaccttt 17
<210> 25
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Fyxed Ex3-Ex4探针
<400> 25
cgtgggcctc ctcatcattc tcag 24
<210> 26
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Fyxed Ex3-隐藏测定正向引物
<400> 26
actatgaaac cgtccgcaaa 20
<210> 27
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Fyxed Ex3-隐藏测定反向引物
<400> 27
cctctttgct tcaccaaatg tc 22
<210> 28
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Fyxed Ex3-隐藏探针
<400> 28
cgtgggcctc ctcatcattc tcag 24
<210> 29
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Fyxed 隐藏-Ex4测定正向引物
<400> 29
ttctggaatt cccacacact c 21
<210> 30
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Fyxed 隐藏-Ex4assay Reverse Primer
<400> 30
cccacagcgg aaccttt 17
<210> 31
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Fyxed 隐藏-Ex4探针
<400> 31
ctctgaatga aagctgggct cttgga 26
<210> 32
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crlf1 Ex1-Ex2测定正向引物
<400> 32
ctgtcctcgc tgtggtc 17
<210> 33
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crlf1 Ex1-Ex2测定反向引物
<400> 33
ggaggagccg atgagaag 18
<210> 34
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crlf1 Ex1-Ex2探针
<400> 34
tctgttgctc tgtgtcctcg gg 22
<210> 35
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crlf1 Ex1-隐藏测定正向引物
<400> 35
gtcgcctctg ttgctctg 18
<210> 36
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crlf1 Ex1-隐藏测定反向引物
<400> 36
tccatccatt catccatcca tc 22
<210> 37
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crlf1 Ex1-隐藏探针
<400> 37
acctcagttc ctggcatatt g 21
<210> 38
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crlf1 隐藏-Ex2测定正向引物
<400> 38
gagacctcag agaactgaat gg 22
<210> 39
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crlf1 隐藏-Ex2测定反向引物
<400> 39
ccaggtgtgt ctccatgtat ag 22
<210> 40
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Crlf1 隐藏-Ex2探针
<400> 40
ttctcatcgg ctcctccctg caag 24
<210> 41
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> TDP-43 Ex6-Ex7测定正向引物
<400> 41
gctgaaccta agcataatag caatag 26
<210> 42
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> TDP-43 Ex6-Ex7测定反向引物
<400> 42
ggatgagaaa gcatgtagac ag 22
<210> 43
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> TDP-43 Ex6-Ex7探针
<400> 43
tggaagaagc acttcattga aagtagtgc 29
权利要求书(按照条约第19条的修改)
1.一种非人动物细胞,其包含编码突变体TDP-43多肽的突变TARDBP基因,
其中所述突变体TDP-43多肽缺乏在野生型TDP-43多肽中发现的功能性结构域,其包括核定位信号(NLS)、RNA识别基序1(RRM1)、RNA识别基序2(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)或它们的组合,并且
其中所述非人动物细胞表达所述突变体TDP-43多肽,
任选地其中所述野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。
2.如权利要求1所述的非人动物细胞,其中所述非人动物细胞是胚胎干(ES)细胞、胚状体或胚胎干细胞衍生的运动神经元(ESMN)。
3.如权利要求1或权利要求2所述的非人动物细胞,其中所述突变TARDBP基因是所述非人动物的突变TARDBP基因。
4.如权利要求1-2中任一项所述的非人动物细胞,其中所述突变TARDBP基因是突变人TARDBP基因。
5.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽由于以下一项或多项而缺乏功能性结构域:
(a)NLS中氨基酸的点突变,
(b)RRM1中氨基酸的点突变,
(c)RRM2中氨基酸的点突变,
(d)核输出信号的至少一部分的缺失,以及
(e)朊病毒样结构域的至少一部分的缺失。
6.如权利要求5所述的非人动物细胞,其中
(a)NLS中氨基酸的所述点突变包括K82A、K83A、R84A、K95A、K97A、K98A或它们的组合,
(b)RRM1中的所述点突变包括F147L和/或F149L,
(c)RRM2中的所述点突变包括F194L和/或F229L,
(d)核输出信号缺失的至少一部分的所述缺失包括在野生型TDP-43多肽的位置239和250处及其之间的氨基酸的缺失,以及
(e)朊病毒样结构域的至少一部分的所述缺失包括在野生型TDP-43多肽的位置274和414处及其之间的氨基酸的缺失。
7.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽包含K82A、K83A、R84A、K95A、K97A和K98A。
8.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽缺乏野生型多肽的位置274至414处的氨基酸之间并包括所述位置处的氨基酸的朊病毒样结构域。
9.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽包含F147L和F149L。
10.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽包含F194L和F229L。
11.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽缺乏位置239和250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号。
12.如前述权利要求中任一项所述的非人动物细胞,其中编码突变体TDP-43多肽的所述突变TARDBP基因替换内源性TARDBP基因座处的内源性TARDBP基因。
13.如权利要求13所述的非人动物细胞,其中所述非人动物细胞对于编码突变体TDP-43多肽的所述突变TARDBP基因是杂合的。
14.如权利要求13所述的非人动物细胞,其中所述非人动物细胞对于编码突变体TDP-43多肽的所述突变TARDBP基因是纯合的。
15.如权利要求1-13中任一项所述的非人动物细胞,其中所述非人动物细胞还包含含有敲除突变的TARDBP基因。
16.如权利要求16所述的非人动物细胞,其中所述敲除突变包括条件性敲除突变。
17.如权利要求15或权利要求16所述的非人动物细胞,其中所述敲除突变包含位点特异性重组识别序列。
18.如权利要求15-17中任一项所述的非人动物细胞,其中所述敲除突变包含loxp序列。
19.如权利要求18所述的非人动物细胞,其中所述loxp序列侧接包含敲除突变的所述TARDBP基因的外显子3。
20.如权利要求16所述的非人动物细胞,其中所述敲除突变包括TDP-43肽的整个编码序列的缺失。
21.如权利要求15-20中任一项所述的非人动物细胞,其中所述非人动物细胞对于所述修饰的TARDBP基因座是杂合的并且包含
(i)在一条染色体的内源性TARDBP基因座处,内源性TARDBP基因被编码突变体TDP-43多肽的所述突变TARDBP基因替换,以及
(ii)在另一条同源染色体的所述内源性TARDBP基因座处,包含所述敲除突变的TARDBP基因或野生型TARDBP基因。
22.如前述权利要求中任一项所述的非人动物细胞,其中所述非人动物细胞不表达野生型TDP-43多肽。
23.如权利要求1-21中任一项所述的非人动物细胞,其中所述非人动物细胞表达野生型TDP-43多肽。
24.如前述前述权利中任一项所述的非人动物细胞,其包含:
(i)与对照细胞中野生型TARDBP基因的mRNA转录水平相当的所述突变TARDBP基因的mRNA转录水平,
(ii)与对照细胞中野生型TDP-43多肽的水平相比,增加的所述突变体TDP-43多肽的水平,
(iii)在例如运动神经元的细胞质中发现的比在细胞核中更高浓度的突变体TDP-43多肽,
(iv)与野生型TDP-43多肽相比具有增加的不溶性的突变体TDP-43多肽,
(v)包含所述突变体TDP-43多肽的细胞质聚集体,
(vi)增加的隐藏外显子的剪接,和/或
(vii)降低的可变剪接的TDP-43形式的水平。
25.一种非人动物细胞,其包含
(i)在一条染色体的内源性TARDBP基因座处,所述TARDBP基因的条件性敲除突变,和
(ii)在另一条同源染色体的所述内源性TARDBP基因座处,所述整个TARDBP编码序列的缺失。
26.如前述权利要求中任一项所述的非人动物细胞,其中所述细胞是胚胎干(ES)细胞、原始外胚层细胞或胚胎干细胞衍生的运动神经元(ESMN)。
27.如前述权利要求中任一项所述的非人动物细胞,其中所述非人动物细胞是啮齿动物细胞。
28.如前述权利要求中任一项所述的非人动物细胞,其中所述非人动物细胞是大鼠细胞。
29.如权利要求1-27中任一项所述的非人动物细胞,其中所述非人动物细胞是小鼠细胞。
30.如前述权利要求中任一项所述的非人动物细胞,其中所述非人动物细胞在体外培养。
31.一种非人动物组织,其包含前述权利要求中任一项所述的非人动物细胞。
32.一种组合物,其包含前述权利要求中任一项所述的非人动物细胞或组织。
33.一种制备表达突变体TDP-43多肽的非人动物或非人动物细胞的方法,其包括修饰所述非人动物或非人动物细胞的基因组以包含编码所述突变体TDP-43多肽的突变TARDBP基因,其中所述突变体TDP-43多肽与野生型TDP-43相比缺乏功能性结构域,任选地其中所述野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。
34.如权利要求33所述的方法,其中修饰包括用编码所述突变体TDP-43多肽的所述突变TARDBP基因替换内源性TARDBP基因。
35.如权利要求33或权利要求34所述的方法,其中修饰还包括用包含敲除突变的TARDBP基因替换内源性TARDBP基因。
36.如权利要求35所述的方法,其中所述敲除突变包括条件性敲除突变。
37.如权利要求36所述的方法,其还包括在消除包含敲除突变的所述TARDBP基因的表达的条件下培养所述细胞。
38.一种鉴定用于治疗疾病的治疗候选物的方法,所述方法包括
(a)使权利要求1-31中任一项所述的非人动物细胞或组织或权利要求32所述的组合物与所述候选剂接触,
(b)评价所述非人细胞或组织的表型和/或TDP-43生物活性,以及
(c)鉴定使非人细胞或组织恢复与表达野生型TDP-43多肽的对照细胞或组织相当的表型和/或TDP-43生物活性的所述候选剂。
39.一种评价TDP-43结构域的生物学功能的方法,其包括
(a)修饰胚胎干(ES)细胞以包含编码突变体TDP-43多肽的突变TARDBP基因,所述突变体TDP-43多肽缺乏选自由以下组成的组的功能性结构域:核定位信号(NLS)、第一RNA识别基序(RRM1)、第一RNA识别基序(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)和它们的组合,
(b)任选地在体外分化所述修饰的ES细胞和/或从所述修饰的ES细胞获得遗传修饰的非人动物,以及
(c)评价所述遗传修饰的ES细胞、由其衍生的原始外胚层、由其衍生的运动神经元或由其衍生的非人动物的表型和/或TDP-43生物活性。
40.如权利要求38或权利要求39所述的方法,其中所述表型通过细胞培养、荧光原位杂交、蛋白质印迹分析或它们的组合来评价。
41.如权利要求38-40中任一项所述的方法,其中评价表型包括测量所述遗传修饰的ES细胞、由其衍生的原始外胚层、由其衍生的运动神经元或由其衍生的非人动物的活力。
42.如权利要求38-41中任一项所述的方法,其中所述评价表型包括确定所述突变体TDP-43多肽的细胞定位。
43.如权利要求38-42中任一项所述的方法,其中评价所述突变体TDP-43多肽的生物活性包括测量受TDP-43调控的包含隐藏外显子的基因的剪接产物。
44.如权利要求43所述的方法,其中受TDP-43调控的包含隐藏外显子的所述基因包括Crem、Fyxd2、Clf1。
45.如权利要求38-44中任一项所述的方法,其中评价所述突变体TDP-43多肽的生物活性包括测量可变剪接的TDP-43的水平。
46.一种反义寡核苷酸,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43 mRNA序列的间隔体基序。
47.一种siRNA,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43 mRNA序列的序列。
48.一种CRISPR/Cas系统,其包含Cas9蛋白和至少一种gRNA,其中所述gRNA识别位于或靠近编码可变剪接位点的序列,所述序列产生编码截短的缺乏PLD的TDP-43多肽的可变mRNA。
49.一种非人动物,其包含权利要求2所述的胚胎干细胞。
50.一种非人动物,其包含编码突变体TDP-43多肽的突变TARDBP基因,
其中所述突变体TDP-43多肽缺乏在野生型TDP-43多肽中发现的功能性结构域,其包括核定位信号(NLS)、RNA识别基序1(RRM1)、RNA识别基序2(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)或它们的组合,并且,
任选地其中所述野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。
51.如权利要求50所述的非人动物,其中所述突变TARDBP基因是所述非人动物的突变TARDBP基因。
52.如权利要求50或权利要求51所述的非人动物,其中所述突变TARDBP基因是突变人TARDBP基因。
53.如权利要求50-52中任一项所述的非人动物,其中所述突变体TDP-43多肽由于以下一项或多项而缺乏功能性结构域:
(a)NLS中氨基酸的点突变,
(b)RRM1中氨基酸的点突变,
(c)RRM2中氨基酸的点突变,
(d)核输出信号的至少一部分的缺失,以及
(e)朊病毒样结构域的至少一部分的缺失。
54.如权利要求53所述的非人动物,其中
(a)NLS中氨基酸的所述点突变包括K82A、K83A、R84A、K95A、K97A、K98A或它们的组合,
(b)RRM1中的所述点突变包括F147L和/或F149L,
(c)RRM2中的所述点突变包括F194L和/或F229L,
(d)核输出信号缺失的至少一部分的所述缺失包括在野生型TDP-43多肽的位置239和250处及其之间的氨基酸的缺失,以及
(e)朊病毒样结构域的至少一部分的所述缺失包括在野生型TDP-43多肽的位置274和414处及其之间的氨基酸的缺失。
55.如权利要求50-54中任一项所述的非人动物,其中所述突变体TDP-43多肽包含K82A、K83A、R84A、K95A、K97A和K98A。
56.如权利要求50-55中任一项所述的非人动物,其中所述突变体TDP-43多肽缺乏野生型多肽的位置274至414处的氨基酸之间并包括所述位置处的氨基酸的朊病毒样结构域。
57.如权利要求50-56中任一项所述的非人动物,其中所述突变体TDP-43多肽包含F147L和F149L。
58.如权利要求50-57中任一项所述的非人动物,其中所述突变体TDP-43多肽包含F194L和F229L。
59.如权利要求50-58中任一项所述的非人动物,其中所述突变体TDP-43多肽缺乏位置239和250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号。
60.如权利要求50-59中任一项所述的非人动物,其中编码突变体TDP-43多肽的所述突变TARDBP基因替换内源性TARDBP基因座处的内源性TARDBP基因。
61.如权利要求60所述的非人动物,其中所述非人动物对于编码突变体TDP-43多肽的所述突变TARDBP基因是杂合的。
62.如权利要求50-61中任一项所述的非人动物,其中所述非人动物还包含含有敲除突变的TARDBP基因。
63.如权利要求62所述的非人动物,其中所述敲除突变包括条件性敲除突变。
64.如权利要求62或权利要求63所述的非人动物,其中所述敲除突变包含位点特异性重组识别序列。
65.如权利要求62-64中任一项所述的非人动物,其中所述敲除突变包含loxp序列。
66.如权利要求65所述的非人动物,其中所述loxp序列侧接包含敲除突变的TARDBP基因的外显子3。
67.如权利要求62所述的非人动物,其中所述敲除突变包括TDP-43肽的整个编码序列的缺失。
68.如权利要求62-67中任一项所述的非人动物,其中所述非人动物对于所述修饰的TARDBP基因座是杂合的并且包含
(i)在一条染色体的内源性TARDBP基因座处,内源性TARDBP基因被编码突变体TDP-43多肽的所述突变TARDBP基因替换,以及
(ii)在另一条同源染色体的所述内源性TARDBP基因座处,包含所述敲除突变的TARDBP基因或野生型TARDBP基因。
69.如权利要求49-68中任一项所述的非人动物,其中所述非人动物表达野生型TDP-43多肽。
70.如权利要求49-69中任一项所述的非人动物,其包含:
(i)与对照动物中野生型TARDBP基因的mRNA转录水平相当的所述突变TARDBP基因的mRNA转录水平,
(ii)与对照动物中野生型TDP-43多肽的水平相比,增加的所述突变体TDP-43多肽的水平,
(iii)在例如运动神经元的细胞质中发现的比在细胞核中更高浓度的突变体TDP-43多肽,
(iv)与野生型TDP-43多肽相比具有增加的不溶性的突变体TDP-43多肽,
(v)包含所述突变体TDP-43多肽的细胞质聚集体,
(vi)增加的隐藏外显子的剪接,
(vii)降低的可变剪接的TDP-43形式的水平,
(viii)主要由快肌(诸如胫前肌肉)构成的肌肉组织的去神经支配和/或
(ix)主要由慢肌(诸如肋间肌肉)构成的肌肉组织的正常神经支配。
71.一种非人动物,其包含(i)在一条染色体的内源性TARDBP基因座处,所述TARDBP基因的条件性敲除突变,以及(ii)在另一条同源染色体的所述内源性TARDBP基因座处,所述整个TARDBP编码序列的缺失。
72.如权利要求49-71中任一项所述的非人动物,其中所述非人动物是啮齿动物。
73.如权利要求49-72中任一项所述的非人动物,其中所述非人动物是大鼠。
74.如权利要求49-72中任一项所述的非人动物,其中所述非人动物是小鼠。
75.一种鉴定用于治疗疾病的治疗候选物的方法,所述方法包括
(a)使权利要求49-74中任一项所述的非人动物与所述候选剂接触,
(b)评价所述非人动物的表型和/或TDP-43生物活性,以及
(c)鉴定使所述非人恢复表型和/或TDP-43生物活性的所述候选剂。
76.一种突变体TDP-43多肽,其包含如SEQ ID NO:1、3或5所陈述的序列,所述序列经修饰以包含以下一项或多项:
(a)NLS中氨基酸的点突变,
(b)RRM1中氨基酸的点突变,
(c)RRM2中氨基酸的点突变,
(d)核输出信号的至少一部分的缺失,以及
(e)朊病毒样结构域的至少一部分的缺失。
77.如权利要求76所述的突变体TDP-43多肽,其中
(a)NLS中氨基酸的所述点突变包括K82A、K83A、R84A、K95A、K97A、K98A或它们的组合,
(b)RRM1中的所述点突变包括F147L和/或F149L,
(c)RRM2中的所述点突变包括F194L和/或F229L,
(d)核输出信号缺失的至少一部分的所述缺失包括在野生型TDP-43多肽的位置239和250处及其之间的氨基酸的缺失,以及
(e)朊病毒样结构域的至少一部分的所述缺失包括在野生型TDP-43多肽的位置274和414处及其之间的氨基酸的缺失。
78.如权利要求76或权利要求77所述的突变体TDP-43多肽,其包含K82A突变、K83A突变、R84A突变、K95A突变、K97A突变和/或K98A突变。
79.如权利要求76-78中任一项所述的突变体TDP-43多肽,其包含在野生型多肽的位置274至414处的氨基酸之间并包括所述位置处的氨基酸的朊病毒样结构域的缺失。
80.如权利要求76-79中任一项所述的突变体TDP-43多肽,其中所述突变体TDP-43多肽包含F147L突变和/或F149L突变。
81.如权利要求76-80中任一项所述的突变体TDP-43多肽,其中所述突变体TDP-43多肽包含F194L突变和/或F229L突变。
82.如权利要求76-81中任一项所述的突变体TDP-43多肽,其中所述突变体TDP-43多肽缺乏位置239和250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号。
83.一种核酸,其包含编码权利要求76-82中任一项所述的突变体TDP-43多肽的核酸序列。
84.如权利要求83所述的核酸,其还包含从5'至3':5'同源臂、编码所述突变体TDP-43多肽的所述核酸序列和3'同源臂,其中所述核酸在啮齿动物细胞中经历同源重组。
85.如权利要求84所述的核酸,其中所述5'和3'同源臂与大鼠序列同源,使得所述核酸在内源性大鼠TARDBP基因座处经历同源重组并且编码所述突变体TDP-43多肽的所述核酸序列替换所述内源性TARDBP编码序列。
86.如权利要求84所述的核酸,其中所述5'和3'同源臂与小鼠序列同源,使得所述核酸在内源性小鼠TARDBP基因座处经历同源重组并且编码所述突变体TDP-43多肽的所述核酸序列替换所述内源性TARDBP编码序列。
87.一种在细胞中选择性减少编码包含PLD的TDP-43多肽的TDP-43 mRNA同时保留编码截短的缺乏PLD的TDP-43的可变TDP-43 mRNA的方法,所述方法包括向细胞中引入:
(i)一种反义寡核苷酸,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43 mRNA序列的间隔体基序,
(ii)一种siRNA,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43 mRNA序列的序列,和/或
(iii)一种CRISPR/Cas系统,其包含Cas9蛋白和至少一种gRNA,其中所述gRNA识别位于或靠近编码可变剪接位点的序列,所述序列产生编码截短的缺乏PLD的TDP-43多肽的可变mRNA。
88.一种表达突变体TDP-43的非人动物、一种制备非人动物的方法、一种用于在所述制备非人动物的方法中使用的核酸、用于在所述制备非人动物的方法中使用的细胞、如此制备的所述非人动物的用途、以及衍生自所述非人动物的细胞和/或表达突变体TDP-43多肽的细胞、突变体TDP-43多肽和编码突变体多肽的核酸、反义寡核苷酸或siRNA、CRISPR/Cas系统,其特征在于任何实施方案或任何适用的权利要求类别,例如,专利申请中最初描述、公开或说明的主题所涵盖的产品、过程或用途。

Claims (88)

1.一种非人动物细胞,其包含编码突变体TDP-43多肽的突变TARDBP基因,
其中所述突变体TDP-43多肽缺乏在野生型TDP-43多肽中发现的功能性结构域,其包括核定位信号(NLS)、RNA识别基序1(RRM1)、RNA识别基序2(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)或它们的组合,并且
其中所述非人动物细胞表达所述突变体TDP-43多肽,
任选地其中所述野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。
2.如权利要求1所述的非人动物细胞,其中所述非人动物细胞是胚胎干(ES)细胞、胚状体或胚胎干细胞衍生的运动神经元(ESMN)。
3.如权利要求1或权利要求2所述的非人动物细胞,其中所述突变TARDBP基因是所述非人动物的突变TARDBP基因。
4.如权利要求1-2中任一项所述的非人动物细胞,其中所述突变TARDBP基因是突变人TARDBP基因。
5.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽由于以下一项或多项而缺乏功能性结构域:
(a)NLS中氨基酸的点突变,
(b)RRM1中氨基酸的点突变,
(c)RRM2中氨基酸的点突变,
(d)核输出信号的至少一部分的缺失,以及
(e)朊病毒样结构域的至少一部分的缺失。
6.如权利要求5所述的非人动物细胞,其中
(a)NLS中氨基酸的所述点突变包括K82A、K83A、R84A、K95A、K97A、K98A或它们的组合,
(b)RRM1中的所述点突变包括F147L和/或F149L,
(c)RRM2中的所述点突变包括F194L和/或F229L,
(d)核输出信号缺失的至少一部分的所述缺失包括在野生型TDP-43多肽的位置239和250处及其之间的氨基酸的缺失,以及
(e)朊病毒样结构域的至少一部分的所述缺失包括在野生型TDP-43多肽的位置274和414处及其之间的氨基酸的缺失。
7.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽包含K82A、K83A、R84A、K95A、K97A和K98A。
8.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽缺乏野生型多肽的位置274至414处的氨基酸之间并包括所述位置处的氨基酸的朊病毒样结构域。
9.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽包含F147L和F149L。
10.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽包含F194L和F229L。
11.如前述权利要求中任一项所述的非人动物细胞,其中所述突变体TDP-43多肽缺乏位置239和250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号。
12.如前述权利要求中任一项所述的非人动物细胞,其中编码突变体TDP-43多肽的所述突变TARDBP基因替换内源性TARDBP基因座处的内源性TARDBP基因。
13.如权利要求13所述的非人动物细胞,其中所述非人动物细胞对于编码突变体TDP-43多肽的所述突变TARDBP基因是杂合的。
14.如权利要求13所述的非人动物细胞,其中所述非人动物细胞对于编码突变体TDP-43多肽的所述突变TARDBP基因是纯合的。
15.如权利要求1-13中任一项所述的非人动物细胞,其中所述非人动物细胞还包含含有敲除突变的TARDBP基因。
16.如权利要求16所述的非人动物细胞,其中所述敲除突变包括条件性敲除突变。
17.如权利要求15或权利要求16所述的非人动物细胞,其中所述敲除突变包含位点特异性重组识别序列。
18.如权利要求15-17中任一项所述的非人动物细胞,其中所述敲除突变包含loxp序列。
19.如权利要求18所述的非人动物细胞,其中所述loxp序列侧接包含敲除突变的所述TARDBP基因的外显子3。
20.如权利要求16所述的非人动物细胞,其中所述敲除突变包括TDP-43肽的整个编码序列的缺失。
21.如权利要求15-20中任一项所述的非人动物细胞,其中所述非人动物细胞对于所述修饰的TARDBP基因座是杂合的并且包含
(i)在一条染色体的内源性TARDBP基因座处,内源性TARDBP基因被编码突变体TDP-43多肽的所述突变TARDBP基因替换,以及
(ii)在另一条同源染色体的所述内源性TARDBP基因座处,包含所述敲除突变的TARDBP基因或野生型TARDBP基因。
22.如前述权利要求中任一项所述的非人动物细胞,其中所述非人动物细胞不表达野生型TDP-43多肽。
23.如权利要求1-21中任一项所述的非人动物细胞,其中所述非人动物细胞表达野生型TDP-43多肽。
24.如前述前述权利中任一项所述的非人动物细胞,其包含:
(i)与对照细胞中野生型TARDBP基因的mRNA转录水平相当的所述突变TARDBP基因的mRNA转录水平,
(ii)与对照细胞中野生型TDP-43多肽的水平相比,增加的所述突变体TDP-43多肽的水平,
(iii)在例如运动神经元的细胞质中发现的比在细胞核中更高浓度的突变体TDP-43多肽,
(iv)与野生型TDP-43多肽相比具有增加的不溶性的突变体TDP-43多肽,
(v)包含所述突变体TDP-43多肽的细胞质聚集体,
(vi)增加的隐藏外显子的剪接,和/或
(vii)降低的可变剪接的TDP-43形式的水平。
25.一种非人动物细胞,其包含
(i)在一条染色体的内源性TARDBP基因座处,所述TARDBP基因的条件性敲除突变,和
(ii)在另一条同源染色体的所述内源性TARDBP基因座处,所述整个TARDBP编码序列的缺失。
26.如前述权利要求中任一项所述的非人动物细胞,其中所述细胞是胚胎干(ES)细胞、原始外胚层细胞或衍生自运动神经元的运动神经元(ESMN)。
27.如前述权利要求中任一项所述的非人动物细胞,其中所述非人动物细胞是啮齿动物细胞。
28.如前述权利要求中任一项所述的非人动物细胞,其中所述非人动物细胞是大鼠细胞。
29.如权利要求1-27中任一项所述的非人动物细胞,其中所述非人动物细胞是小鼠细胞。
30.如前述权利要求中任一项所述的非人动物细胞,其中所述非人动物细胞在体外培养。
31.一种非人动物组织,其包含前述权利要求中任一项所述的非人动物细胞。
32.一种组合物,其包含前述权利要求中任一项所述的非人动物细胞或组织。
33.一种制备表达突变体TDP-43多肽的非人动物或非人动物细胞的方法,其包括修饰所述非人动物或非人动物细胞的基因组以包含编码所述突变体TDP-43多肽的突变TARDBP基因,其中所述突变体TDP-43多肽与野生型TDP-43相比缺乏功能性结构域,任选地其中所述野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。
34.如权利要求33所述的方法,其中修饰包括用编码所述突变体TDP-43多肽的所述突变TARDBP基因替换内源性TARDBP基因。
35.如权利要求33或权利要求34所述的方法,其中修饰还包括用包含敲除突变的TARDBP基因替换内源性TARDBP基因。
36.如权利要求35所述的方法,其中所述敲除突变包括条件性敲除突变。
37.如权利要求36所述的方法,其还包括在消除包含敲除突变的所述TARDBP基因的表达的条件下培养所述细胞。
38.一种鉴定用于治疗疾病的治疗候选物的方法,所述方法包括
(a)使权利要求1-31中任一项所述的非人动物细胞或组织或权利要求32所述的组合物与所述候选剂接触,
(b)评价所述非人细胞或组织的表型和/或TDP-43生物活性,以及
(c)鉴定使非人细胞或组织恢复与表达野生型TDP-43多肽的对照细胞或组织相当的表型和/或TDP-43生物活性的所述候选剂。
39.一种评价TDP-43结构域的生物学功能的方法,其包括
(a)修饰胚胎干(ES)细胞以包含编码突变体TDP-43多肽的突变TARDBP基因,所述突变体TDP-43多肽缺乏选自由以下组成的组的功能性结构域:核定位信号(NLS)、第一RNA识别基序(RRM1)、第一RNA识别基序(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)和它们的组合,
(b)任选地在体外分化所述修饰的ES细胞和/或从所述修饰的ES细胞获得遗传修饰的非人动物,以及
(c)评价所述遗传修饰的ES细胞、由其衍生的原始外胚层、由其衍生的运动神经元或由其衍生的非人动物的表型和/或TDP-43生物活性。
40.如权利要求38或权利要求39所述的方法,其中所述表型通过细胞培养、荧光原位杂交、蛋白质印迹分析或它们的组合来评价。
41.如权利要求38-40中任一项所述的方法,其中评价表型包括测量所述遗传修饰的ES细胞、由其衍生的原始外胚层、由其衍生的运动神经元或由其衍生的非人动物的活力。
42.如权利要求38-41中任一项所述的方法,其中所述评价表型包括确定所述突变体TDP-43多肽的细胞定位。
43.如权利要求38-42中任一项所述的方法,其中评价所述突变体TDP-43多肽的生物活性包括测量受TDP-43调控的包含隐藏外显子的基因的剪接产物。
44.如权利要求43所述的方法,其中受TDP-43调控的包含隐藏外显子的所述基因包括Crem、Fyxd2、Clf1。
45.如权利要求38-44中任一项所述的方法,其中评价所述突变体TDP-43多肽的生物活性包括测量可变剪接的TDP-43的水平。
46.一种反义寡核苷酸,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43mRNA序列的间隔体基序。
47.一种siRNA,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43mRNA序列的序列。
48.一种CRISPR/Cas系统,其包含Cas9蛋白和至少一种gRNA,其中所述gRNA识别位于或靠近编码可变剪接位点的序列,所述序列产生编码截短的缺乏PLD的TDP-43多肽的可变mRNA。
49.一种非人动物,其包含权利要求2所述的胚胎干细胞。
50.一种非人动物,其包含编码突变体TDP-43多肽的突变TARDBP基因,
其中所述突变体TDP-43多肽缺乏在野生型TDP-43多肽中发现的功能性结构域,其包括核定位信号(NLS)、RNA识别基序1(RRM1)、RNA识别基序2(RRM2)、推定的核输出信号(E)、朊病毒样结构域(PLD)或它们的组合,并且,
任选地其中所述野生型TDP-43多肽包含如SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5所陈述的序列。
51.如权利要求50所述的非人动物,其中所述突变TARDBP基因是所述非人动物的突变TARDBP基因。
52.如权利要求50或权利要求51所述的非人动物,其中所述突变TARDBP基因是突变人TARDBP基因。
53.如权利要求50-52中任一项所述的非人动物,其中所述突变体TDP-43多肽由于以下一项或多项而缺乏功能性结构域:
(a)NLS中氨基酸的点突变,
(b)RRM1中氨基酸的点突变,
(c)RRM2中氨基酸的点突变,
(d)核输出信号的至少一部分的缺失,以及
(e)朊病毒样结构域的至少一部分的缺失。
54.如权利要求53所述的非人动物,其中
(a)NLS中氨基酸的所述点突变包括K82A、K83A、R84A、K95A、K97A、K98A或它们的组合,
(b)RRM1中的所述点突变包括F147L和/或F149L,
(c)RRM2中的所述点突变包括F194L和/或F229L,
(d)核输出信号缺失的至少一部分的所述缺失包括在野生型TDP-43多肽的位置239和250处及其之间的氨基酸的缺失,以及
(e)朊病毒样结构域的至少一部分的所述缺失包括在野生型TDP-43多肽的位置274和414处及其之间的氨基酸的缺失。
55.如权利要求50-54中任一项所述的非人动物,其中所述突变体TDP-43多肽包含K82A、K83A、R84A、K95A、K97A和K98A。
56.如权利要求50-55中任一项所述的非人动物,其中所述突变体TDP-43多肽缺乏野生型多肽的位置274至414处的氨基酸之间并包括所述位置处的氨基酸的朊病毒样结构域。
57.如权利要求50-56中任一项所述的非人动物,其中所述突变体TDP-43多肽包含F147L和F149L。
58.如权利要求50-57中任一项所述的非人动物,其中所述突变体TDP-43多肽包含F194L和F229L。
59.如权利要求50-58中任一项所述的非人动物,其中所述突变体TDP-43多肽缺乏位置239和250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号。
60.如权利要求50-59中任一项所述的非人动物,其中编码突变体TDP-43多肽的所述突变TARDBP基因替换内源性TARDBP基因座处的内源性TARDBP基因。
61.如权利要求60所述的非人动物,其中所述非人动物对于编码突变体TDP-43多肽的所述突变TARDBP基因是杂合的。
62.如权利要求50-61中任一项所述的非人动物,其中所述非人动物还包含含有敲除突变的TARDBP基因。
63.如权利要求62所述的非人动物,其中所述敲除突变包括条件性敲除突变。
64.如权利要求62或权利要求63所述的非人动物,其中所述敲除突变包含位点特异性重组识别序列。
65.如权利要求62-64中任一项所述的非人动物,其中所述敲除突变包含loxp序列。
66.如权利要求65所述的非人动物,其中所述loxp序列侧接包含敲除突变的TARDBP基因的外显子3。
67.如权利要求62所述的非人动物,其中所述敲除突变包括TDP-43肽的整个编码序列的缺失。
68.如权利要求62-67中任一项所述的非人动物,其中所述非人动物对于所述修饰的TARDBP基因座是杂合的并且包含
(i)在一条染色体的内源性TARDBP基因座处,内源性TARDBP基因被编码突变体TDP-43多肽的所述突变TARDBP基因替换,以及
(ii)在另一条同源染色体的所述内源性TARDBP基因座处,包含所述敲除突变的TARDBP基因或野生型TARDBP基因。
69.如权利要求49-68中任一项所述的非人动物,其中所述非人动物表达野生型TDP-43多肽。
70.如权利要求49-69中任一项所述的非人动物,其包含:
(i)与对照动物中野生型TARDBP基因的mRNA转录水平相当的所述突变TARDBP基因的mRNA转录水平,
(ii)与对照动物中野生型TDP-43多肽的水平相比,增加的所述突变体TDP-43多肽的水平,
(iii)在例如运动神经元的细胞质中发现的比在细胞核中更高浓度的突变体TDP-43多肽,
(iv)与野生型TDP-43多肽相比具有增加的不溶性的突变体TDP-43多肽,
(v)包含所述突变体TDP-43多肽的细胞质聚集体,
(vi)增加的隐藏外显子的剪接,
(vii)降低的可变剪接的TDP-43形式的水平,
(viii)主要由快肌(诸如胫前肌肉)构成的肌肉组织的去神经支配和/或
(ix)主要由慢肌(诸如肋间肌肉)构成的肌肉组织的正常神经支配。
71.一种非人动物,其包含(i)在一条染色体的内源性TARDBP基因座处,所述TARDBP基因的条件性敲除突变,以及(ii)在另一条同源染色体的所述内源性TARDBP基因座处,所述整个TARDBP编码序列的缺失。
72.如权利要求49-71中任一项所述的非人动物,其中所述非人动物是啮齿动物。
73.如权利要求49-72中任一项所述的非人动物,其中所述非人动物是大鼠。
74.如权利要求49-72中任一项所述的非人动物,其中所述非人动物是小鼠。
75.一种鉴定用于治疗疾病的治疗候选物的方法,所述方法包括
(a)使权利要求49-74中任一项所述的非人动物与所述候选剂接触,
(b)评价所述非人动物的表型和/或TDP-43生物活性,以及
(c)鉴定使所述非人恢复表型和/或TDP-43生物活性的所述候选剂。
76.一种突变体TDP-43多肽,其包含如SEQ ID NO:1、3或5所陈述的序列,所述序列经修饰以包含以下一项或多项:
(a)NLS中氨基酸的点突变,
(b)RRM1中氨基酸的点突变,
(c)RRM2中氨基酸的点突变,
(d)核输出信号的至少一部分的缺失,以及
(e)朊病毒样结构域的至少一部分的缺失。
77.如权利要求76所述的突变体TDP-43多肽,其中
(a)NLS中氨基酸的所述点突变包括K82A、K83A、R84A、K95A、K97A、K98A或它们的组合,
(b)RRM1中的所述点突变包括F147L和/或F149L,
(c)RRM2中的所述点突变包括F194L和/或F229L,
(d)核输出信号缺失的至少一部分的所述缺失包括在野生型TDP-43多肽的位置239和250处及其之间的氨基酸的缺失,以及
(e)朊病毒样结构域的至少一部分的所述缺失包括在野生型TDP-43多肽的位置274和414处及其之间的氨基酸的缺失。
78.如权利要求76或权利要求77所述的突变体TDP-43多肽,其包含K82A突变、K83A突变、R84A突变、K95A突变、K97A突变和/或K98A突变。
79.如权利要求76-78中任一项所述的突变体TDP-43多肽,其包含在野生型多肽的位置274至414处的氨基酸之间并包括所述位置处的氨基酸的朊病毒样结构域的缺失。
80.如权利要求76-79中任一项所述的突变体TDP-43多肽,其中所述突变体TDP-43多肽包含F147L突变和/或F149L突变。
81.如权利要求76-80中任一项所述的突变体TDP-43多肽,其中所述突变体TDP-43多肽包含F194L突变和/或F229L突变。
82.如权利要求76-81中任一项所述的突变体TDP-43多肽,其中所述突变体TDP-43多肽缺乏位置239和250处的氨基酸之间并包括所述位置处的氨基酸的核输出信号。
83.一种核酸,其包含编码权利要求76-82中任一项所述的突变体TDP-43多肽的核酸序列。
84.如权利要求83所述的核酸,其还包含从5'至3':5'同源臂、编码所述突变体TDP-43多肽的所述核酸序列和3'同源臂,其中所述核酸在啮齿动物细胞中经历同源重组。
85.如权利要求84所述的核酸,其中所述5'和3'同源臂与大鼠序列同源,使得所述核酸在内源性大鼠TARDBP基因座处经历同源重组并且编码所述突变体TDP-43多肽的所述核酸序列替换所述内源性TARDBP编码序列。
86.如权利要求84所述的核酸,其中所述5'和3'同源臂与小鼠序列同源,使得所述核酸在内源性小鼠TARDBP基因座处经历同源重组并且编码所述突变体TDP-43多肽的所述核酸序列替换所述内源性TARDBP编码序列。
87.一种在细胞中选择性减少编码包含PLD的TDP-43多肽的TDP-43mRNA同时保留编码截短的缺乏PLD的TDP-43的可变TDP-43mRNA的方法,所述方法包括向细胞中引入:
(i)一种反义寡核苷酸,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43mRNA序列的间隔体基序,
(ii)一种siRNA,其包含靶向编码TDP-43多肽的PLD和/或包含外显子6下游和外显子7上游的非翻译序列的TDP-43mRNA序列的序列,和/或
(iii)一种CRISPR/Cas系统,其包含Cas9蛋白和至少一种gRNA,其中所述gRNA识别位于或靠近编码可变剪接位点的序列,所述序列产生编码截短的缺乏PLD的TDP-43多肽的可变mRNA。
88.一种表达突变体TDP-43的非人动物、一种制备非人动物的方法、一种用于在所述制备非人动物的方法中使用的核酸、用于在所述制备非人动物的方法中使用的细胞、如此制备的所述非人动物的用途、以及衍生自所述非人动物的细胞和/或表达突变体TDP-43多肽的细胞、突变体TDP-43多肽和编码突变体多肽的核酸、反义寡核苷酸或siRNA、CRISPR/Cas系统,其特征在于任何实施方案或任何适用的权利要求类别,例如,专利申请中最初描述、公开或说明的主题所涵盖的产品、过程或用途。
CN202080045369.8A 2019-06-27 2020-06-26 Tdp-43蛋白病的建模 Pending CN114008193A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962867785P 2019-06-27 2019-06-27
US62/867,785 2019-06-27
PCT/US2020/039877 WO2020264339A1 (en) 2019-06-27 2020-06-26 Modeling tdp-43 proteinopathy

Publications (1)

Publication Number Publication Date
CN114008193A true CN114008193A (zh) 2022-02-01

Family

ID=71662360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080045369.8A Pending CN114008193A (zh) 2019-06-27 2020-06-26 Tdp-43蛋白病的建模

Country Status (8)

Country Link
US (1) US20200404890A1 (zh)
EP (1) EP3990475A1 (zh)
JP (1) JP2022539517A (zh)
KR (1) KR20220024134A (zh)
CN (1) CN114008193A (zh)
AU (1) AU2020302081A1 (zh)
CA (2) CA3139469A1 (zh)
WO (1) WO2020264339A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116144658A (zh) * 2022-12-19 2023-05-23 神济昌华(北京)生物科技有限公司 用于构建神经退行性动物模型的sgRNA及其应用
CN114903010B (zh) * 2022-05-19 2024-06-07 暨南大学 神经退行性疾病模型的构建方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023235677A1 (en) 2022-05-31 2023-12-07 Regeneron Pharmaceuticals, Inc. Animal model of tdp-43 proteinopathy

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110321179A1 (en) * 2010-06-24 2011-12-29 Academia Sinica Non-human animal model for amyotrophic lateral sclerosis (als) with loss-of-tdp-43 function
US20180372756A1 (en) * 2015-06-17 2018-12-27 The Johns Hopkins University Tdp-43 in degenerative disease
WO2019013141A1 (ja) * 2017-07-10 2019-01-17 国立大学法人大阪大学 Tdp-43の発現量を調節するアンチセンスオリゴヌクレオチド及びその用途

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999005266A2 (en) 1997-07-26 1999-02-04 Wisconsin Alumni Research Foundation Trans-species nuclear transfer
US6586251B2 (en) 2000-10-31 2003-07-01 Regeneron Pharmaceuticals, Inc. Methods of modifying eukaryotic cells
AUPR451401A0 (en) 2001-04-20 2001-05-24 Monash University A method of nuclear transfer
US7612250B2 (en) 2002-07-29 2009-11-03 Trustees Of Tufts College Nuclear transfer embryo formation method
PT1802193E (pt) 2004-10-19 2014-06-23 Regeneron Pharma Método para gerar um murganho homozigótico para uma modificação genética
CN101117633B (zh) 2006-08-03 2011-07-20 上海交通大学附属儿童医院 一种细胞核移植方法
PE20150336A1 (es) 2012-05-25 2015-03-25 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn
WO2013180214A1 (ja) * 2012-05-31 2013-12-05 学校法人慶應義塾 筋萎縮性側索硬化症および/または前頭側頭葉変性症のモデルマウス
ES2904803T3 (es) 2013-02-20 2022-04-06 Regeneron Pharma Modificación genética de ratas
PT3456831T (pt) 2013-04-16 2021-09-10 Regeneron Pharma Modificação alvejada do genoma de rato
WO2016010840A1 (en) 2014-07-16 2016-01-21 Novartis Ag Method of encapsulating a nucleic acid in a lipid nanoparticle host

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110321179A1 (en) * 2010-06-24 2011-12-29 Academia Sinica Non-human animal model for amyotrophic lateral sclerosis (als) with loss-of-tdp-43 function
US20180372756A1 (en) * 2015-06-17 2018-12-27 The Johns Hopkins University Tdp-43 in degenerative disease
WO2019013141A1 (ja) * 2017-07-10 2019-01-17 国立大学法人大阪大学 Tdp-43の発現量を調節するアンチセンスオリゴヌクレオチド及びその用途

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AKIHIDE KOYAMA等: "Increased cytoplasmic TARDBP mRNA in affected spinal motor neurons in ALS caused by abnormal autoregulation of TDP-43", NUCLEIC ACIDS RESEARCH, vol. 44, no. 12, 2 June 2016 (2016-06-02), pages 1 *
M. J. WINTON等: "Disturbance of Nuclear and Cytoplasmic TAR DNA-binding Protein (TDP-43) Induces Disease-like Redistribution, Sequestration, and Aggregate Formation", JOURNAL OF BIOLOGICAL CHEMISTRY, vol. 283, no. 19, 1 January 2008 (2008-01-01), pages 13302 *
SARAH Y. EBSTEIN等: "Mutant TDP-43 Causes Early-Stage Dose-Dependent Motor Neuron Degeneration in a TARDBP Knockin Mouse Model of ALS", CELL REPORTS, vol. 26, no. 2, 8 January 2019 (2019-01-08), pages 365, XP055727595, DOI: 10.1016/j.celrep.2018.12.045 *
YOUHNA M AYALA等: "TDP-43 regulates its mRNA levels through a negative feedback loop", THE EMBO JOURNAL, 3 December 2010 (2010-12-03), pages 278 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114903010B (zh) * 2022-05-19 2024-06-07 暨南大学 神经退行性疾病模型的构建方法
CN116144658A (zh) * 2022-12-19 2023-05-23 神济昌华(北京)生物科技有限公司 用于构建神经退行性动物模型的sgRNA及其应用
CN116144658B (zh) * 2022-12-19 2023-08-08 神济昌华(北京)生物科技有限公司 用于构建神经退行性动物模型的sgRNA及其应用

Also Published As

Publication number Publication date
WO2020264339A9 (en) 2021-02-04
CA3139469A1 (en) 2020-12-30
KR20220024134A (ko) 2022-03-03
CA3217237A1 (en) 2020-12-30
US20200404890A1 (en) 2020-12-31
EP3990475A1 (en) 2022-05-04
WO2020264339A1 (en) 2020-12-30
WO2020264339A4 (en) 2021-05-06
JP2022539517A (ja) 2022-09-12
AU2020302081A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
US11866794B2 (en) Cas-ready mouse embryonic stem cells and mice and uses thereof
US11519004B2 (en) Transcription modulation in animals using CRISPR/Cas systems
KR102544051B1 (ko) 인간화된 ttr 유전자좌를 포함하는 비인간 동물 및 사용 방법
US20210261985A1 (en) Methods and compositions for assessing crispr/cas-mediated disruption or excision and crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
US20240076613A1 (en) Models of tauopathy
AU2024202293A1 (en) Nuclease-mediated repeat expansion
KR20220016869A (ko) 베타-슬립 돌연변이를 갖는 인간화 ttr 좌위를 포함하는 비-인간 동물 및 사용 방법
US20190032156A1 (en) Methods and compositions for assessing crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo
CN114008193A (zh) Tdp-43蛋白病的建模
RU2784927C1 (ru) Отличные от человека животные, включающие в себя гуманизированный ttr локус, и способы применения
WO2023235726A2 (en) Crispr interference therapeutics for c9orf72 repeat expansion disease
WO2023235677A1 (en) Animal model of tdp-43 proteinopathy
WO2024031053A1 (en) Aggregation-resistant variants of tdp-43
WO2023235725A2 (en) Crispr-based therapeutics for c9orf72 repeat expansion disease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination