CN109862785A - C9orf72基因座中具有六核苷酸重复扩增的非人类动物 - Google Patents
C9orf72基因座中具有六核苷酸重复扩增的非人类动物 Download PDFInfo
- Publication number
- CN109862785A CN109862785A CN201780060178.7A CN201780060178A CN109862785A CN 109862785 A CN109862785 A CN 109862785A CN 201780060178 A CN201780060178 A CN 201780060178A CN 109862785 A CN109862785 A CN 109862785A
- Authority
- CN
- China
- Prior art keywords
- sequence
- seq
- cell
- human animal
- hexanucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 241000282414 Homo sapiens Species 0.000 title claims abstract description 295
- 238000003199 nucleic acid amplification method Methods 0.000 title claims abstract description 185
- 230000003321 amplification Effects 0.000 title claims abstract description 184
- 238000000034 method Methods 0.000 claims abstract description 153
- 241001465754 Metazoa Species 0.000 claims abstract description 98
- 201000010099 disease Diseases 0.000 claims abstract description 51
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 51
- 241000283984 Rodentia Species 0.000 claims abstract description 49
- 210000004027 cell Anatomy 0.000 claims description 302
- 108090000623 proteins and genes Proteins 0.000 claims description 196
- 108020004414 DNA Proteins 0.000 claims description 181
- 101150014718 C9orf72 gene Proteins 0.000 claims description 180
- 102000043334 C9orf72 Human genes 0.000 claims description 173
- 108700030955 C9orf72 Proteins 0.000 claims description 173
- 150000007523 nucleic acids Chemical class 0.000 claims description 167
- 210000001671 embryonic stem cell Anatomy 0.000 claims description 150
- 102000039446 nucleic acids Human genes 0.000 claims description 147
- 108020004707 nucleic acids Proteins 0.000 claims description 147
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 81
- 230000014509 gene expression Effects 0.000 claims description 80
- 239000003814 drug Substances 0.000 claims description 77
- 238000004458 analytical method Methods 0.000 claims description 75
- 108020005004 Guide RNA Proteins 0.000 claims description 72
- 210000002161 motor neuron Anatomy 0.000 claims description 61
- 239000000523 sample Substances 0.000 claims description 58
- 210000001161 mammalian embryo Anatomy 0.000 claims description 53
- 102000004169 proteins and genes Human genes 0.000 claims description 53
- 208000024891 symptom Diseases 0.000 claims description 51
- 125000003729 nucleotide group Chemical group 0.000 claims description 48
- 238000003780 insertion Methods 0.000 claims description 47
- 230000037431 insertion Effects 0.000 claims description 47
- 239000002773 nucleotide Substances 0.000 claims description 47
- 238000012239 gene modification Methods 0.000 claims description 46
- 230000004048 modification Effects 0.000 claims description 43
- 238000012986 modification Methods 0.000 claims description 43
- 210000002569 neuron Anatomy 0.000 claims description 43
- 230000001965 increasing effect Effects 0.000 claims description 40
- 210000004958 brain cell Anatomy 0.000 claims description 33
- 230000003252 repetitive effect Effects 0.000 claims description 32
- 229940079593 drug Drugs 0.000 claims description 31
- 210000004413 cardiac myocyte Anatomy 0.000 claims description 28
- 108090000790 Enzymes Proteins 0.000 claims description 27
- 108020005544 Antisense RNA Proteins 0.000 claims description 26
- 108700024394 Exon Proteins 0.000 claims description 25
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 24
- 108010016626 Dipeptides Proteins 0.000 claims description 24
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 24
- 230000006798 recombination Effects 0.000 claims description 24
- 238000005215 recombination Methods 0.000 claims description 24
- 102000004190 Enzymes Human genes 0.000 claims description 23
- 238000005259 measurement Methods 0.000 claims description 23
- 239000003795 chemical substances by application Substances 0.000 claims description 22
- 239000003550 marker Substances 0.000 claims description 22
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 21
- 235000013601 eggs Nutrition 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 18
- 230000000694 effects Effects 0.000 claims description 18
- 210000001519 tissue Anatomy 0.000 claims description 16
- 239000002777 nucleoside Substances 0.000 claims description 12
- 125000003835 nucleoside group Chemical group 0.000 claims description 10
- 238000001514 detection method Methods 0.000 claims description 8
- 230000001580 bacterial effect Effects 0.000 claims description 6
- 238000000338 in vitro Methods 0.000 claims description 6
- 102000002322 Egg Proteins Human genes 0.000 claims description 5
- 108010000912 Egg Proteins Proteins 0.000 claims description 5
- 239000003184 complementary RNA Substances 0.000 claims description 4
- 238000001727 in vivo Methods 0.000 claims description 4
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 claims description 2
- 206010006514 bruxism Diseases 0.000 claims description 2
- 230000001054 cortical effect Effects 0.000 claims description 2
- 235000014103 egg white Nutrition 0.000 claims description 2
- 210000000969 egg white Anatomy 0.000 claims description 2
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 abstract description 32
- 201000011240 Frontotemporal dementia Diseases 0.000 abstract description 25
- 230000000626 neurodegenerative effect Effects 0.000 abstract description 5
- 206010056677 Nerve degeneration Diseases 0.000 abstract 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 104
- 230000008685 targeting Effects 0.000 description 88
- 108090000765 processed proteins & peptides Proteins 0.000 description 64
- 229920001184 polypeptide Polymers 0.000 description 58
- 102000004196 processed proteins & peptides Human genes 0.000 description 58
- 239000000047 product Substances 0.000 description 54
- 241000700159 Rattus Species 0.000 description 53
- 235000018102 proteins Nutrition 0.000 description 52
- 239000013598 vector Substances 0.000 description 48
- 108091079001 CRISPR RNA Proteins 0.000 description 29
- 108091033409 CRISPR Proteins 0.000 description 28
- 239000000203 mixture Substances 0.000 description 26
- 210000000130 stem cell Anatomy 0.000 description 25
- 108091033319 polynucleotide Proteins 0.000 description 21
- 102000040430 polynucleotide Human genes 0.000 description 21
- 239000002157 polynucleotide Substances 0.000 description 21
- 125000003275 alpha amino acid group Chemical group 0.000 description 19
- 235000001014 amino acid Nutrition 0.000 description 19
- 238000006467 substitution reaction Methods 0.000 description 19
- 239000002253 acid Substances 0.000 description 18
- 238000012360 testing method Methods 0.000 description 18
- 108700008625 Reporter Genes Proteins 0.000 description 17
- 230000006870 function Effects 0.000 description 17
- 108700028369 Alleles Proteins 0.000 description 16
- 229940024606 amino acid Drugs 0.000 description 16
- 150000001413 amino acids Chemical class 0.000 description 16
- 239000000126 substance Substances 0.000 description 16
- 230000014616 translation Effects 0.000 description 16
- 230000004913 activation Effects 0.000 description 15
- 230000007918 pathogenicity Effects 0.000 description 15
- 238000013519 translation Methods 0.000 description 15
- 238000002744 homologous recombination Methods 0.000 description 14
- 230000006801 homologous recombination Effects 0.000 description 14
- 238000004519 manufacturing process Methods 0.000 description 14
- 101100383813 Mus musculus C9orf72 gene Proteins 0.000 description 13
- 230000008859 change Effects 0.000 description 13
- 239000011521 glass Substances 0.000 description 13
- 238000010166 immunofluorescence Methods 0.000 description 13
- 208000015122 neurodegenerative disease Diseases 0.000 description 13
- 241000699660 Mus musculus Species 0.000 description 12
- 239000001963 growth medium Substances 0.000 description 12
- 238000007901 in situ hybridization Methods 0.000 description 12
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 12
- 238000010354 CRISPR gene editing Methods 0.000 description 11
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 11
- 101710163270 Nuclease Proteins 0.000 description 11
- 238000000520 microinjection Methods 0.000 description 11
- 210000004940 nucleus Anatomy 0.000 description 11
- 238000003753 real-time PCR Methods 0.000 description 11
- 238000001890 transfection Methods 0.000 description 11
- 241000699670 Mus sp. Species 0.000 description 10
- 210000004102 animal cell Anatomy 0.000 description 10
- 230000000692 anti-sense effect Effects 0.000 description 10
- 210000004556 brain Anatomy 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 10
- 230000001276 controlling effect Effects 0.000 description 10
- 210000000805 cytoplasm Anatomy 0.000 description 10
- 230000001419 dependent effect Effects 0.000 description 10
- 230000009261 transgenic effect Effects 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- KPENUVBHAKRDQR-GUBZILKMSA-N Cys-His-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPENUVBHAKRDQR-GUBZILKMSA-N 0.000 description 9
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 9
- 238000002105 Southern blotting Methods 0.000 description 9
- 230000006378 damage Effects 0.000 description 9
- 230000004927 fusion Effects 0.000 description 9
- 108010050848 glycylleucine Proteins 0.000 description 9
- 238000009396 hybridization Methods 0.000 description 9
- 230000033001 locomotion Effects 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 238000011160 research Methods 0.000 description 9
- 230000004044 response Effects 0.000 description 9
- 230000002441 reversible effect Effects 0.000 description 9
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 8
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 8
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000002265 prevention Effects 0.000 description 8
- 230000001105 regulatory effect Effects 0.000 description 8
- 238000012216 screening Methods 0.000 description 8
- 210000002966 serum Anatomy 0.000 description 8
- 229940124597 therapeutic agent Drugs 0.000 description 8
- 229930193140 Neomycin Natural products 0.000 description 7
- 238000010171 animal model Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 7
- 239000000872 buffer Substances 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 210000000472 morula Anatomy 0.000 description 7
- 210000003205 muscle Anatomy 0.000 description 7
- 229960004927 neomycin Drugs 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 6
- 108020003215 DNA Probes Proteins 0.000 description 6
- 239000003298 DNA probe Substances 0.000 description 6
- 208000012661 Dyskinesia Diseases 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 6
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- 241000699729 Muridae Species 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 108091081024 Start codon Proteins 0.000 description 6
- 241000218636 Thuja Species 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 6
- QGZKDVFQNNGYKY-UHFFFAOYSA-N ammonia Natural products N QGZKDVFQNNGYKY-UHFFFAOYSA-N 0.000 description 6
- 238000011161 development Methods 0.000 description 6
- 230000018109 developmental process Effects 0.000 description 6
- 230000004069 differentiation Effects 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 210000002950 fibroblast Anatomy 0.000 description 6
- 239000000499 gel Substances 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 230000010354 integration Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 108010077112 prolyl-proline Proteins 0.000 description 6
- 229950010131 puromycin Drugs 0.000 description 6
- 239000012925 reference material Substances 0.000 description 6
- 239000013074 reference sample Substances 0.000 description 6
- 238000000926 separation method Methods 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- QAPSNMNOIOSXSQ-YNEHKIRRSA-N 1-[(2r,4s,5r)-4-[tert-butyl(dimethyl)silyl]oxy-5-(hydroxymethyl)oxolan-2-yl]-5-methylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O[Si](C)(C)C(C)(C)C)C1 QAPSNMNOIOSXSQ-YNEHKIRRSA-N 0.000 description 5
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 5
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 5
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 5
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 5
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 5
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 5
- ISVACHFCVRKIDG-SRVKXCTJSA-N Arg-Val-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O ISVACHFCVRKIDG-SRVKXCTJSA-N 0.000 description 5
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 5
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 5
- TVVYVAUGRHNTGT-UGYAYLCHSA-N Asp-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O TVVYVAUGRHNTGT-UGYAYLCHSA-N 0.000 description 5
- VHQOCWWKXIOAQI-WDSKDSINSA-N Asp-Gln-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VHQOCWWKXIOAQI-WDSKDSINSA-N 0.000 description 5
- JUWZKMBALYLZCK-WHFBIAKZSA-N Asp-Gly-Asn Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O JUWZKMBALYLZCK-WHFBIAKZSA-N 0.000 description 5
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 5
- GGBQDSHTXKQSLP-NHCYSSNCSA-N Asp-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N GGBQDSHTXKQSLP-NHCYSSNCSA-N 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 5
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 5
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 5
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 5
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 5
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 5
- WZBLRQQCDYYRTD-SIXJUCDHSA-N His-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N WZBLRQQCDYYRTD-SIXJUCDHSA-N 0.000 description 5
- JGFWUKYIQAEYAH-DCAQKATOSA-N His-Ser-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JGFWUKYIQAEYAH-DCAQKATOSA-N 0.000 description 5
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 5
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 5
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 5
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 5
- CZWANIQKACCEKW-CYDGBPFRSA-N Ile-Pro-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)O)N CZWANIQKACCEKW-CYDGBPFRSA-N 0.000 description 5
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 5
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 5
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 5
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 5
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 5
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 5
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 5
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 5
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 5
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 5
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 5
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 5
- 101000687343 Mus musculus PR domain zinc finger protein 1 Proteins 0.000 description 5
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 5
- GRVMHFCZUIYNKQ-UFYCRDLUSA-N Phe-Phe-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O GRVMHFCZUIYNKQ-UFYCRDLUSA-N 0.000 description 5
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 5
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 5
- 108010091086 Recombinases Proteins 0.000 description 5
- 102000018120 Recombinases Human genes 0.000 description 5
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 5
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 5
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 5
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 5
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 5
- MHNHRNHJMXAVHZ-AAEUAGOBSA-N Trp-Asn-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N MHNHRNHJMXAVHZ-AAEUAGOBSA-N 0.000 description 5
- IQGJAHMZWBTRIF-UBHSHLNASA-N Trp-Asp-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N IQGJAHMZWBTRIF-UBHSHLNASA-N 0.000 description 5
- KCZGSXPFPNKGLE-WDSOQIARSA-N Trp-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N KCZGSXPFPNKGLE-WDSOQIARSA-N 0.000 description 5
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 5
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 108010008355 arginyl-glutamine Proteins 0.000 description 5
- 239000002775 capsule Substances 0.000 description 5
- 210000000349 chromosome Anatomy 0.000 description 5
- 238000010367 cloning Methods 0.000 description 5
- 238000005336 cracking Methods 0.000 description 5
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 5
- 229930182470 glycoside Natural products 0.000 description 5
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 5
- 108010090037 glycyl-alanyl-isoleucine Proteins 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 108010034529 leucyl-lysine Proteins 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 210000005036 nerve Anatomy 0.000 description 5
- 230000001537 neural effect Effects 0.000 description 5
- 238000007481 next generation sequencing Methods 0.000 description 5
- 108010073101 phenylalanylleucine Proteins 0.000 description 5
- 238000011084 recovery Methods 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 241000894007 species Species 0.000 description 5
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 4
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 4
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 4
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 4
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 4
- LRPZJPMQGKGHSG-XGEHTFHBSA-N Arg-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N)O LRPZJPMQGKGHSG-XGEHTFHBSA-N 0.000 description 4
- FOWOZYAWODIRFZ-JYJNAYRXSA-N Arg-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCN=C(N)N)N FOWOZYAWODIRFZ-JYJNAYRXSA-N 0.000 description 4
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 4
- XLZCLJRGGMBKLR-PCBIJLKTSA-N Asn-Ile-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XLZCLJRGGMBKLR-PCBIJLKTSA-N 0.000 description 4
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 4
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 4
- 241000699800 Cricetinae Species 0.000 description 4
- YUZPQIQWXLRFBW-ACZMJKKPSA-N Cys-Glu-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O YUZPQIQWXLRFBW-ACZMJKKPSA-N 0.000 description 4
- URDUGPGPLNXXES-WHFBIAKZSA-N Cys-Gly-Cys Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O URDUGPGPLNXXES-WHFBIAKZSA-N 0.000 description 4
- 206010059866 Drug resistance Diseases 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 108060002716 Exonuclease Proteins 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- LVRKAFPPFJRIOF-GARJFASQSA-N Gln-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N LVRKAFPPFJRIOF-GARJFASQSA-N 0.000 description 4
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 4
- JPHYJQHPILOKHC-ACZMJKKPSA-N Glu-Asp-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O JPHYJQHPILOKHC-ACZMJKKPSA-N 0.000 description 4
- GZWOBWMOMPFPCD-CIUDSAMLSA-N Glu-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N GZWOBWMOMPFPCD-CIUDSAMLSA-N 0.000 description 4
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 4
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 4
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 4
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 4
- LIXWIUAORXJNBH-QWRGUYRKSA-N Gly-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)CN LIXWIUAORXJNBH-QWRGUYRKSA-N 0.000 description 4
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 4
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 4
- JSLVAHYTAJJEQH-QWRGUYRKSA-N Gly-Ser-Phe Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JSLVAHYTAJJEQH-QWRGUYRKSA-N 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 4
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 4
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- WTJBVCUCLWFGAH-JUKXBJQTSA-N His-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WTJBVCUCLWFGAH-JUKXBJQTSA-N 0.000 description 4
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 4
- 102000018251 Hypoxanthine Phosphoribosyltransferase Human genes 0.000 description 4
- BGZIJZJBXRVBGJ-SXTJYALSSA-N Ile-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N BGZIJZJBXRVBGJ-SXTJYALSSA-N 0.000 description 4
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 4
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 4
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 4
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 4
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 4
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 4
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 4
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 4
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 4
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 4
- JVTYXRRFZCEPPK-RHYQMDGZSA-N Leu-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC(C)C)N)O JVTYXRRFZCEPPK-RHYQMDGZSA-N 0.000 description 4
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 4
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 4
- PDIDTSZKKFEDMB-UWVGGRQHSA-N Lys-Pro-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O PDIDTSZKKFEDMB-UWVGGRQHSA-N 0.000 description 4
- XYLSGAWRCZECIQ-JYJNAYRXSA-N Lys-Tyr-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 XYLSGAWRCZECIQ-JYJNAYRXSA-N 0.000 description 4
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 4
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 4
- 241001045988 Neogene Species 0.000 description 4
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 4
- 238000010222 PCR analysis Methods 0.000 description 4
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 4
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 4
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 4
- MHNBYYFXWDUGBW-RPTUDFQQSA-N Phe-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O MHNBYYFXWDUGBW-RPTUDFQQSA-N 0.000 description 4
- KUSYCSMTTHSZOA-DZKIICNBSA-N Phe-Val-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N KUSYCSMTTHSZOA-DZKIICNBSA-N 0.000 description 4
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 4
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 4
- SWRNSCMUXRLHCR-ULQDDVLXSA-N Pro-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 SWRNSCMUXRLHCR-ULQDDVLXSA-N 0.000 description 4
- 108010079005 RDV peptide Proteins 0.000 description 4
- 241000700157 Rattus norvegicus Species 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 4
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 4
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 4
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 4
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 4
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 4
- LLSLRQOEAFCZLW-NRPADANISA-N Ser-Val-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LLSLRQOEAFCZLW-NRPADANISA-N 0.000 description 4
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 4
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 4
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 4
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 4
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 4
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 4
- VGNLMPBYWWNQFS-ZEILLAHLSA-N Thr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O VGNLMPBYWWNQFS-ZEILLAHLSA-N 0.000 description 4
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 206010044565 Tremor Diseases 0.000 description 4
- HOJPPPKZWFRTHJ-PJODQICGSA-N Trp-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N HOJPPPKZWFRTHJ-PJODQICGSA-N 0.000 description 4
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 4
- OGNMURQZFMHFFD-NHCYSSNCSA-N Val-Asn-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N OGNMURQZFMHFFD-NHCYSSNCSA-N 0.000 description 4
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 4
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 4
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 4
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 4
- ILMVQSHENUZYIZ-JYJNAYRXSA-N Val-Met-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N ILMVQSHENUZYIZ-JYJNAYRXSA-N 0.000 description 4
- 208000027418 Wounds and injury Diseases 0.000 description 4
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010044940 alanylglutamine Proteins 0.000 description 4
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 4
- 229910021529 ammonia Inorganic materials 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 4
- 210000005013 brain tissue Anatomy 0.000 description 4
- 238000009395 breeding Methods 0.000 description 4
- 230000001488 breeding effect Effects 0.000 description 4
- 101150038500 cas9 gene Proteins 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 4
- 239000000975 dye Substances 0.000 description 4
- 210000002257 embryonic structure Anatomy 0.000 description 4
- 102000013165 exonuclease Human genes 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000005021 gait Effects 0.000 description 4
- 238000003198 gene knock in Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- 150000002338 glycosides Chemical class 0.000 description 4
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 4
- 108010074027 glycyl-seryl-phenylalanine Proteins 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 210000002064 heart cell Anatomy 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 101150066555 lacZ gene Proteins 0.000 description 4
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 4
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 108010017391 lysylvaline Proteins 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 101150091879 neo gene Proteins 0.000 description 4
- 210000000287 oocyte Anatomy 0.000 description 4
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 4
- 230000004962 physiological condition Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 108010053725 prolylvaline Proteins 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000011514 reflex Effects 0.000 description 4
- 238000010839 reverse transcription Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- 210000004291 uterus Anatomy 0.000 description 4
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 4
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 3
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 3
- 241000398985 Cricetidae Species 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 101100356230 Escherichia coli (strain K12) recT gene Proteins 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 3
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 3
- 101000911390 Homo sapiens Coagulation factor VIII Proteins 0.000 description 3
- TWPSALMCEHCIOY-YTFOTSKYSA-N Ile-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(=O)O)N TWPSALMCEHCIOY-YTFOTSKYSA-N 0.000 description 3
- 108010025815 Kanamycin Kinase Proteins 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- HUEBCHPSXSQUGN-GARJFASQSA-N Leu-Cys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N HUEBCHPSXSQUGN-GARJFASQSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 108091092724 Noncoding DNA Proteins 0.000 description 3
- 108091005461 Nucleic proteins Proteins 0.000 description 3
- 229930182555 Penicillin Natural products 0.000 description 3
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 3
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 3
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 241000282898 Sus scrofa Species 0.000 description 3
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 229960005305 adenosine Drugs 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 3
- 230000000680 avirulence Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000003766 bioinformatics method Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000009089 cytolysis Effects 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 238000004043 dyeing Methods 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 235000019441 ethanol Nutrition 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- 210000004602 germ cell Anatomy 0.000 description 3
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 3
- 210000002216 heart Anatomy 0.000 description 3
- 208000014674 injury Diseases 0.000 description 3
- 230000000116 mitigating effect Effects 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 210000000653 nervous system Anatomy 0.000 description 3
- 230000004770 neurodegeneration Effects 0.000 description 3
- 210000004681 ovum Anatomy 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 229940049954 penicillin Drugs 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 238000006116 polymerization reaction Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000005855 radiation Effects 0.000 description 3
- 239000013558 reference substance Substances 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 3
- 229960005322 streptomycin Drugs 0.000 description 3
- 238000011830 transgenic mouse model Methods 0.000 description 3
- 229940045145 uridine Drugs 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- CXNPLSGKWMLZPZ-GIFSMMMISA-N (2r,3r,6s)-3-[[(3s)-3-amino-5-[carbamimidoyl(methyl)amino]pentanoyl]amino]-6-(4-amino-2-oxopyrimidin-1-yl)-3,6-dihydro-2h-pyran-2-carboxylic acid Chemical compound O1[C@@H](C(O)=O)[C@H](NC(=O)C[C@@H](N)CCN(C)C(N)=N)C=C[C@H]1N1C(=O)N=C(N)C=C1 CXNPLSGKWMLZPZ-GIFSMMMISA-N 0.000 description 2
- 101150084750 1 gene Proteins 0.000 description 2
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 2
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 2
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 2
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 2
- YVTHEZNOKSAWRW-DCAQKATOSA-N Arg-Lys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O YVTHEZNOKSAWRW-DCAQKATOSA-N 0.000 description 2
- 239000004475 Arginine Chemical group 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 101100355997 Bacillus subtilis (strain 168) recA gene Proteins 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 238000011740 C57BL/6 mouse Methods 0.000 description 2
- 241000283707 Capra Species 0.000 description 2
- 108010051219 Cre recombinase Proteins 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 108091005941 EBFP Proteins 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 2
- 241000283074 Equus asinus Species 0.000 description 2
- 101100301301 Escherichia coli (strain K12) recE gene Proteins 0.000 description 2
- 208000001308 Fasciculation Diseases 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 241000699694 Gerbillinae Species 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 101000989501 Homo sapiens Guanine nucleotide exchange factor C9orf72 Proteins 0.000 description 2
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 2
- FFJQAEYLAQMGDL-MGHWNKPDSA-N Ile-Lys-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FFJQAEYLAQMGDL-MGHWNKPDSA-N 0.000 description 2
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical group NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 2
- FAELBUXXFQLUAX-AJNGGQMLSA-N Leu-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(C)C FAELBUXXFQLUAX-AJNGGQMLSA-N 0.000 description 2
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 2
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 2
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 2
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 241000711408 Murine respirovirus Species 0.000 description 2
- 241001452677 Ogataea methanolica Species 0.000 description 2
- 244000131316 Panax pseudoginseng Species 0.000 description 2
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 2
- 235000003140 Panax quinquefolius Nutrition 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 241000009328 Perro Species 0.000 description 2
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 2
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- DLRVVLDZNNYCBX-UHFFFAOYSA-N Polydextrose Polymers OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(O)O1 DLRVVLDZNNYCBX-UHFFFAOYSA-N 0.000 description 2
- 239000002202 Polyethylene glycol Substances 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- DCCGCVLVVSAJFK-NUMRIWBASA-N Thr-Asp-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O DCCGCVLVVSAJFK-NUMRIWBASA-N 0.000 description 2
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 2
- 102000006601 Thymidine Kinase Human genes 0.000 description 2
- 108020004440 Thymidine kinase Proteins 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 241000255993 Trichoplusia ni Species 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- XTDDIVQWDXMRJL-IHRRRGAJSA-N Val-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N XTDDIVQWDXMRJL-IHRRRGAJSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000545067 Venus Species 0.000 description 2
- 108700005077 Viral Genes Proteins 0.000 description 2
- 108010027570 Xanthine phosphoribosyltransferase Proteins 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 230000004520 agglutination Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Chemical group OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 210000001130 astrocyte Anatomy 0.000 description 2
- 102000015736 beta 2-Microglobulin Human genes 0.000 description 2
- 108010081355 beta 2-Microglobulin Proteins 0.000 description 2
- 102000005936 beta-Galactosidase Human genes 0.000 description 2
- 108010005774 beta-Galactosidase Proteins 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- CXNPLSGKWMLZPZ-UHFFFAOYSA-N blasticidin-S Natural products O1C(C(O)=O)C(NC(=O)CC(N)CCN(C)C(N)=N)C=CC1N1C(=O)N=C(N)C=C1 CXNPLSGKWMLZPZ-UHFFFAOYSA-N 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 210000000621 bronchi Anatomy 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 239000004568 cement Substances 0.000 description 2
- 150000005829 chemical entities Chemical class 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- -1 desoxyadenossine Chemical compound 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 229940000406 drug candidate Drugs 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 230000013020 embryo development Effects 0.000 description 2
- 210000002242 embryoid body Anatomy 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000007159 enucleation Effects 0.000 description 2
- 238000001976 enzyme digestion Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 238000011049 filling Methods 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 235000008434 ginseng Nutrition 0.000 description 2
- 230000005484 gravity Effects 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 102000045815 human C9orf72 Human genes 0.000 description 2
- 102000057593 human F8 Human genes 0.000 description 2
- 210000000688 human artificial chromosome Anatomy 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 208000027866 inflammatory disease Diseases 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000001361 intraarterial administration Methods 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 238000007913 intrathecal administration Methods 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 210000003734 kidney Anatomy 0.000 description 2
- 229940043355 kinase inhibitor Drugs 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 239000002609 medium Substances 0.000 description 2
- 235000013336 milk Nutrition 0.000 description 2
- 239000008267 milk Substances 0.000 description 2
- 210000004080 milk Anatomy 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 230000003387 muscular Effects 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 230000000926 neurological effect Effects 0.000 description 2
- 230000007171 neuropathology Effects 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 210000001672 ovary Anatomy 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 239000003757 phosphotransferase inhibitor Substances 0.000 description 2
- 210000002706 plastid Anatomy 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 230000001376 precipitating effect Effects 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000009822 protein phosphorylation Effects 0.000 description 2
- 108010045647 puromycin N-acetyltransferase Proteins 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 229940047431 recombinate Drugs 0.000 description 2
- 210000000664 rectum Anatomy 0.000 description 2
- 210000001525 retina Anatomy 0.000 description 2
- 229930002330 retinoic acid Natural products 0.000 description 2
- 238000013207 serial dilution Methods 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 230000005783 single-strand break Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- DAEPDZWVDSPTHF-UHFFFAOYSA-M sodium pyruvate Chemical compound [Na+].CC(=O)C([O-])=O DAEPDZWVDSPTHF-UHFFFAOYSA-M 0.000 description 2
- 238000010374 somatic cell nuclear transfer Methods 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 210000000278 spinal cord Anatomy 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 229960001727 tretinoin Drugs 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 210000001215 vagina Anatomy 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 229940075420 xanthine Drugs 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 description 1
- OJHZNMVJJKMFGX-RNWHKREASA-N (4r,4ar,7ar,12bs)-9-methoxy-3-methyl-1,2,4,4a,5,6,7a,13-octahydro-4,12-methanobenzofuro[3,2-e]isoquinoline-7-one;2,3-dihydroxybutanedioic acid Chemical group OC(=O)C(O)C(O)C(O)=O.O=C([C@@H]1O2)CC[C@H]3[C@]4([H])N(C)CC[C@]13C1=C2C(OC)=CC=C1C4 OJHZNMVJJKMFGX-RNWHKREASA-N 0.000 description 1
- PISWNSOQFZRVJK-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 PISWNSOQFZRVJK-XLPZGREQSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 1
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 description 1
- UEHOMUNTZPIBIL-UUOKFMHZSA-N 6-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7h-purin-8-one Chemical compound O=C1NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UEHOMUNTZPIBIL-UUOKFMHZSA-N 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- WOVKYSAHUYNSMH-UHFFFAOYSA-N BROMODEOXYURIDINE Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C(Br)=C1 WOVKYSAHUYNSMH-UHFFFAOYSA-N 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 102100027314 Beta-2-microglobulin Human genes 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 108010045123 Blasticidin-S deaminase Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 1
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 101100380241 Caenorhabditis elegans arx-2 gene Proteins 0.000 description 1
- 101100518995 Caenorhabditis elegans pax-3 gene Proteins 0.000 description 1
- 241000398949 Calomyscidae Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 241000282994 Cervidae Species 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 108010005939 Ciliary Neurotrophic Factor Proteins 0.000 description 1
- 102100031614 Ciliary neurotrophic factor Human genes 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 208000019505 Deglutition disease Diseases 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 101100364969 Dictyostelium discoideum scai gene Proteins 0.000 description 1
- 241001416488 Dipodidae Species 0.000 description 1
- 241001095404 Dipodoidea Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 241000702191 Escherichia virus P1 Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- 101150112014 Gapdh gene Proteins 0.000 description 1
- 101150007884 Gata6 gene Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700023863 Gene Components Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 1
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 1
- 241001416537 Gliridae Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 206010018910 Haemolysis Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101100383812 Homo sapiens C9orf72 gene Proteins 0.000 description 1
- 101000785712 Homo sapiens Zinc finger protein 282 Proteins 0.000 description 1
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 1
- 241000235789 Hyperoartia Species 0.000 description 1
- 101150002416 Igf2 gene Proteins 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical group OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical group NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 101150040658 LHX2 gene Proteins 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 1
- 240000000249 Morus alba Species 0.000 description 1
- 235000008708 Morus alba Nutrition 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000398750 Muroidea Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 101100518997 Mus musculus Pax3 gene Proteins 0.000 description 1
- 101100364971 Mus musculus Scai gene Proteins 0.000 description 1
- 101100367089 Mus musculus Suco gene Proteins 0.000 description 1
- 206010028293 Muscle contractions involuntary Diseases 0.000 description 1
- 206010056720 Muscle mass Diseases 0.000 description 1
- 206010028372 Muscular weakness Diseases 0.000 description 1
- 241000282341 Mustela putorius furo Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 241000398990 Nesomyidae Species 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 241000393460 Peromyscus nasutus Species 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 208000000609 Pick Disease of the Brain Diseases 0.000 description 1
- 208000024571 Pick disease Diseases 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 241001338313 Platacanthomyidae Species 0.000 description 1
- 229920001100 Polydextrose Polymers 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 101100383814 Rattus norvegicus C9orf72 gene Proteins 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 239000012722 SDS sample buffer Substances 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000398956 Spalacidae Species 0.000 description 1
- 208000005392 Spasm Diseases 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 102000019197 Superoxide Dismutase Human genes 0.000 description 1
- 108010012715 Superoxide dismutase Proteins 0.000 description 1
- 241000254223 Syntexis Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 101150044453 Y gene Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 102100026417 Zinc finger protein 282 Human genes 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 101150092805 actc1 gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000012574 advanced DMEM Substances 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000012867 alanine scanning Methods 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 238000003975 animal breeding Methods 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000004900 autophagic degradation Effects 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000003796 beauty Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 210000000625 blastula Anatomy 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000000133 brain stem Anatomy 0.000 description 1
- UDSAIICHUKSCKT-UHFFFAOYSA-N bromophenol blue Chemical compound C1=C(Br)C(O)=C(Br)C=C1C1(C=2C=C(Br)C(O)=C(Br)C=2)C2=CC=CC=C2S(=O)(=O)O1 UDSAIICHUKSCKT-UHFFFAOYSA-N 0.000 description 1
- 229950004398 broxuridine Drugs 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000007910 cell fusion Effects 0.000 description 1
- 210000002583 cell-derived microparticle Anatomy 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 210000003467 cheek Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000002591 computed tomography Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 210000003618 cortical neuron Anatomy 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 108010016290 deoxyribonucleoprotamine Proteins 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000009025 developmental regulation Effects 0.000 description 1
- 229960000633 dextran sulfate Drugs 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 229910003460 diamond Inorganic materials 0.000 description 1
- FFYPMLJYZAEMQB-UHFFFAOYSA-N diethyl pyrocarbonate Chemical compound CCOC(=O)OC(=O)OCC FFYPMLJYZAEMQB-UHFFFAOYSA-N 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000036267 drug metabolism Effects 0.000 description 1
- 239000002359 drug metabolite Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000032692 embryo implantation Effects 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001036 exonucleolytic effect Effects 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 210000001508 eye Anatomy 0.000 description 1
- 239000012894 fetal calf serum Substances 0.000 description 1
- 210000000630 fibrocyte Anatomy 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 229960000961 floxuridine Drugs 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 210000003194 forelimb Anatomy 0.000 description 1
- 210000001652 frontal lobe Anatomy 0.000 description 1
- 208000013967 frontotemporal dementia and/or amyotrophic lateral sclerosis 1 Diseases 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 101150003286 gata4 gene Proteins 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- WIGIZIANZCJQQY-RUCARUNLSA-N glimepiride Chemical compound O=C1C(CC)=C(C)CN1C(=O)NCCC1=CC=C(S(=O)(=O)NC(=O)N[C@@H]2CC[C@@H](C)CC2)C=C1 WIGIZIANZCJQQY-RUCARUNLSA-N 0.000 description 1
- 229960004346 glimepiride Drugs 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 208000035474 group of disease Diseases 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000008588 hemolysis Effects 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Chemical group OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000007489 histopathology method Methods 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 238000003119 immunoblot Methods 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 210000003000 inclusion body Anatomy 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010253 intravenous injection Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 101150115794 lhx5 gene Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 241001515942 marmosets Species 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000007659 motor function Effects 0.000 description 1
- 108700022574 mouse osteopotentia Proteins 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 230000036473 myasthenia Effects 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 230000002232 neuromuscular Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 210000000633 nuclear envelope Anatomy 0.000 description 1
- 238000001216 nucleic acid method Methods 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000036542 oxidative stress Effects 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- GJVFBWCTGUSGDD-UHFFFAOYSA-L pentamethonium bromide Chemical compound [Br-].[Br-].C[N+](C)(C)CCCCC[N+](C)(C)C GJVFBWCTGUSGDD-UHFFFAOYSA-L 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 210000000578 peripheral nerve Anatomy 0.000 description 1
- 210000001428 peripheral nervous system Anatomy 0.000 description 1
- 239000012466 permeate Substances 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 230000003285 pharmacodynamic effect Effects 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 210000004224 pleura Anatomy 0.000 description 1
- 239000001259 polydextrose Substances 0.000 description 1
- 229940035035 polydextrose Drugs 0.000 description 1
- 235000013856 polydextrose Nutrition 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 210000003240 portal vein Anatomy 0.000 description 1
- 230000036515 potency Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000004845 protein aggregation Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000029983 protein stabilization Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 238000007859 qualitative PCR Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 239000000718 radiation-protective agent Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 229910052594 sapphire Inorganic materials 0.000 description 1
- 239000010980 sapphire Substances 0.000 description 1
- 210000004116 schwann cell Anatomy 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000037152 sensory function Effects 0.000 description 1
- 210000000717 sertoli cell Anatomy 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 210000002356 skeleton Anatomy 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 229940054269 sodium pyruvate Drugs 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012453 sprague-dawley rat model Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 230000009182 swimming Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 210000003478 temporal lobe Anatomy 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- TUGDLVFMIQZYPA-UHFFFAOYSA-N tetracopper;tetrazinc Chemical compound [Cu+2].[Cu+2].[Cu+2].[Cu+2].[Zn+2].[Zn+2].[Zn+2].[Zn+2] TUGDLVFMIQZYPA-UHFFFAOYSA-N 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 238000011200 topical administration Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 239000003656 tris buffered saline Substances 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 150000003952 β-lactams Chemical class 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
- C12N15/625—DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0278—Knock-in vertebrates, e.g. humanised vertebrates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0618—Cells of the nervous system
- C12N5/0619—Neurons
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N5/00—Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
- C12N5/06—Animal cells or tissues; Human cells or tissues
- C12N5/0602—Vertebrate cells
- C12N5/0618—Cells of the nervous system
- C12N5/0623—Stem cells
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/072—Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
- A01K2267/0306—Animal model for genetic diseases
- A01K2267/0318—Animal model for neurodegenerative disease, e.g. non- Alzheimer's
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/30—Vector systems comprising sequences for excision in presence of a recombinase, e.g. loxP or FRT
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Neurology (AREA)
- Environmental Sciences (AREA)
- Neurosurgery (AREA)
- Veterinary Medicine (AREA)
- Mycology (AREA)
- Animal Behavior & Ethology (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Developmental Biology & Embryology (AREA)
- Medicinal Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
提供了一种非人类动物(例如啮齿动物)疾病模型,所述疾病与C9ORF72异源六核苷酸重复扩增序列有关,所述非人类动物的内源C9ORF72基因座包含异源六核苷酸重复(GGGGCC)。本文所公开的包含异源六核苷酸重复扩增序列的非人类动物可以进一步展现与一种或多种神经退化性病症(例如肌萎缩侧索硬化(ALS)和/或额颞痴呆(FTD)等)有关的特征和/或表型,所述异源六核苷酸重复扩增序列包含六核苷酸(GGGGCC)序列的至少一个情形,例如重复。还提供了鉴定治疗候选物的方法,所述治疗候选物可以用于预防、延迟或治疗一种或多种神经退化(例如肌萎缩侧索硬化(ALS,也称为楼格瑞病)和额颞痴呆(FTD))。
Description
相关申请的交叉引用
本申请要求2016年9月30日提交的美国临时申请第62/402,613号和2017年1月31日提交的美国临时申请第62/452,795号的权益,这些临时申请各自以全文引用的方式并入本文中。
序列表以引用的方式并入
序列表的正式副本与说明书以电子方式通过EFS网同时提交给作为受理局的美国专利商标局,所述序列表为ASCII格式化序列表,文件名为“2017-09-29-10267WO01-SEQ-LIST_ST25”,创建日期为2017年9月29日,并且大小为约94KB。这个ASCII格式化文件中所含的序列表是说明书的一部分并且以全文引用的方式并入本文中。
背景技术
神经退化性疾病是残疾和疾病的主要促成因素。确切地说,肌萎缩侧索硬化(ALS,也称为楼格瑞病(Gehrig's disease))和额颞痴呆(FTD)是以进行性神经元损失和/或死亡为特征的罕见神经系统病症。
尽管老龄化被视为神经退化性疾病的最大风险因素,但已经发现若干个基因组分。举例来说,铜锌超氧化物歧化酶(SOD1)基因突变长期以来与ALS有关。此外,C9ORF72基因非编码区内扩增的六核苷酸重复序列GGGGCC已与ALS和FTD均相关。当前,两种疾病均无法治愈,但一些疗法能够将寿命延长约3-5个月。
虽然各种实验动物模型广泛地用于大部分治疗剂的开发,但按照阐明已鉴定的基因组分据以引起疾病的精确分子机理的方式解决神经退化性和发炎疾病的任何模型即使存在,也是微乎其微,所述阐明继而可以揭露ALS(不仅仅是ALS)或具有类似临床表现的其他神经退化性疾病的潜在治疗模式。因此,基因突变引起神经退化性疾病的方式基本上仍然是未知的。理想的动物模型含有相同的基因组分并且代表人类疾病的类似特征。鉴于物种之间的遗传差异,因此对于开发出近似地再现人类神经退化性和/或发炎疾病的改进型动物模型存在高度未满足的需求。当然,此类改进型动物模型为开发有效的治疗和/或预防药剂提供了重大价值。
发明内容
本发明涵盖以下认知:期望对非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)进行工程改造,以允许改进的体内或体外系统鉴别和开发出能用于治疗神经退化性疾病、病症和病状的新型治疗剂和一些实施例中的治疗方案。在一些实施例中,如本文所述的体内或体外系统能够用于鉴别和开发出治疗与C9ORF72基因座(具体地说,所述基因座中的异源六核苷酸重复扩增序列)有关的疾病、病症和/或病状(例如神经退化性病症)的新型治疗剂。另外,包含插入C9ORF72基因座中的六核苷酸重复扩增序列的本文所述非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)是令人期望的,例如用于鉴别和开发出治疗剂靶向GGGGCC六核苷酸重复序列(SEQ ID NO:1)、由其衍生的产物,例如由其转录的有义或反义RNA、六核苷酸重复序列所编码的RAN翻译产物和/或二肽重复蛋白等。在一些实施例中,如本文所述的非人类动物和非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)分别提供改进的体内和体外系统(或模型)用于神经退化性疾病、病症和病状(例如ALS和/或FTD)。
本文所述的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其基因组中包含插入内源C9orf72基因座中的异源六核苷酸重复扩增序列,其中所述异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少一个重复。在一些实施例中,本文所述的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其生殖系基因组中包含插入内源C9orf72基因座中的异源六核苷酸重复扩增序列,其中所述异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少一个重复。在一些实施例中,异源六核苷酸扩增序列是非啮齿动物(例如非大鼠或非小鼠,例如人类)六核苷酸扩增序列,其包含阐述为SEQ ID NO:1的六核苷酸序列的至少一种情形,例如重复。在一些实施例中,(人类)异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的超过一个(优选邻接)重复。在一些实施例中,(人类)异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约三个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约五个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约十个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约十五个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约二十个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约三十个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQID NO:1的六核苷酸序列的至少约四十个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约五十个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约六十个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约七十个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约八十个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约九十个(优选邻接)重复。在一些实施例中,异源(人类)六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少约一百个(优选邻接)重复。在一些实施例中,非人类动物在其生殖系基因组中包含异源(人类)六核苷酸重复扩增序列。
在一些实施例中,异源(例如非啮齿动物、非大鼠、非小鼠和/或人类)六核苷酸重复扩增序列包含与阐述为SEQ ID NO:1的六核苷酸序列的至少一个(例如至少约三个、至少约五个、至少约十个、至少约十五个、至少约二十、至少约三十个、至少约四十个、至少约五十个、至少约六十个、至少约七十个、至少约八十个、至少约九十个或至少约一百个)(优选邻接)重复侧接的异源(例如非啮齿动物、非大鼠、非小鼠和/或人类)序列。因此,异源(例如非啮齿动物、非大鼠、非小鼠,和/或人类)六核苷酸重复扩增序列从5'到3'可以包含:第一异源六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸的一或多个(优选邻接)情形,和第二异源六核苷酸侧接序列。在一些实施例中,异源六核苷酸重复扩增序列与天然存在的基因组序列一致或基本上一致,所述天然存在的基因组序列包含第一异源六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的一或多个情形和第二异源六核苷酸侧接序列。天然存在的第一和/或第二异源六核苷酸侧接序列可以各自独立地具有例如至少4个碱基对的长度,例如至少10个碱基对的长度,例如至少20个碱基对的长度等。
在一些实施例中,异源人类六核苷酸扩增序列跨越(并且任选地涵盖)人类C9orf72基因的外显子1a和/或外显子1b的全部或一部分。在一些实施例中,第一异源六核苷酸侧接序列包含人类C9orf72基因的外显子1a的全部或一部分序列(阐述为SEQ ID NO:34)且/或第二异源六核苷酸侧接序列包含人类C9orf72基因的外显子1b的全部或一部分序列(阐述为SEQ ID NO:35)。在一些实施例中,第一异源六核苷酸侧接序列包含阐述为SEQID NO:36的序列或其一部分,且/或第二异源六核苷酸侧接序列包含阐述为SEQ ID NO:37的序列或其一部分。
示例性人类六核苷酸重复扩增序列阐述为SEQ ID NO:2(从5'到3'包含:包含阐述为SEQ ID NO:36的序列的第一异源六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的3个重复,和包含阐述为SEQ ID NO:37的序列的第二异源六核苷酸侧接序列)。另一示例性人类六核苷酸重复扩增序列阐述为SEQ ID NO:3(从5'到3'包含:包含阐述为SEQ IDNO:36的序列的第一异源六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的100个重复,和包含阐述为SEQ ID NO:37的序列的第二异源六核苷酸侧接序列)。因此,本文公开了非人类动物,例如啮齿动物,诸如大鼠或小鼠,其基因组在内源C9orf72基因座中包含阐述为SEQ ID NO:2的序列、SEQ ID NO:2的变异体、阐述为SEQ ID NO:3的序列,或SEQ IDNO:3的变异体。
在一些实施例中,非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其基因组中包含六核苷酸重复扩增序列,所述六核苷酸重复扩增序列包含SEQ ID NO:2变异体序列,所述变异体序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列(或其一部分,例如阐述为SEQ ID NO:34的序列)的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的一或两个邻接重复,和包含阐述为SEQ ID NO:37的序列(或其一部分,例如阐述为SEQ ID NO:35的序列)的第二人类六核苷酸侧接序列。在一些实施例中,如本文所述的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其基因组中包含六核苷酸重复扩增序列,所述六核苷酸重复扩增序列包含SEQ IDNO:3变异体序列,所述变异体序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列(或其一部分,例如阐述为SEQ ID NO:34的序列)的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的超过一个且小于100个邻接重复,和包含阐述为SEQ ID NO:37的序列(或其一部分,例如阐述为SEQ ID NO:35的序列)的第二人类六核苷酸侧接序列。在一些实施例中,非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含六核苷酸重复扩增序列,所述六核苷酸重复扩增序列包含SEQ ID NO:3变异体序列,所述变异体序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列(或其一部分,例如阐述为SEQ ID NO:34的序列)的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的36个邻接重复,和包含阐述为SEQ ID NO:37的序列(或其一部分,例如阐述为SEQ ID NO:35的序列)的第二人类六核苷酸侧接序列。在一些实施例中,如本文所述的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其基因组中包含六核苷酸重复扩增序列,所述六核苷酸重复扩增序列包含SEQ ID NO:3变异体序列,所述变异体序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列(或其一部分,例如阐述为SEQ ID NO:34的序列)的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的92个邻接重复,和包含阐述为SEQ ID NO:37的序列(或其一部分,例如阐述为SEQID NO:35的序列)的第二人类六核苷酸侧接序列。
在一些实施例中,如本文所公开的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)对于包含SEQID NO:2变异体序列的六核苷酸重复扩增序列来说是杂合的或纯合的,所述变异体序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列(或其一部分,例如阐述为SEQ ID NO:34的序列)的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的一或两个邻接重复,和包含阐述为SEQ ID NO:37的序列(或其一部分,例如阐述为SEQ ID NO:35的序列)的第二人类六核苷酸侧接序列。在一些实施例中,非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含六核苷酸重复扩增序列,所述六核苷酸重复扩增序列包含SEQ ID NO:3变异体序列,所述变异体序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列(或其一部分,例如阐述为SEQ ID NO:34的序列)的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的超过一个且小于100个邻接重复,和包含阐述为SEQ ID NO:37的序列(或其一部分,例如阐述为SEQ ID NO:35的序列)的第二人类六核苷酸侧接序列。在一些实施例中,非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含六核苷酸重复扩增序列,所述六核苷酸重复扩增序列包含SEQ ID NO:3变异体序列,所述变异体序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列(或其一部分,例如阐述为SEQ ID NO:34的序列)的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的36个邻接重复,和包含阐述为SEQ ID NO:37的序列(或其一部分,例如阐述为SEQ ID NO:35的序列)的第二人类六核苷酸侧接序列。在一些实施例中,非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含六核苷酸重复扩增序列,所述六核苷酸重复扩增序列包含SEQ ID NO:3变异体序列,所述变异体序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列(或其一部分,例如阐述为SEQ IDNO:34的序列)的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的92个邻接重复,和包含阐述为SEQ ID NO:37的序列(或其一部分,例如阐述为SEQ ID NO:35的序列)的第二人类六核苷酸侧接序列。
在一些实施例中,非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含内源C9orf72基因座的5'非翻译和/或非编码内源非人类序列被异源(人类)六核苷酸重复扩增序列置换。在一些实施例中,跨越内源非人类C9orf72基因座的内源外显子1(例如外显子1a和/或1b)与ATG起始密码子之间(并且任选地涵盖其至少一部分)的未翻译和/或非编码序列或其一部分被异源六核苷酸重复扩增序列置换。与异源(人类)六核苷酸扩增序列连接的其它序列(例如重组酶识别序列、抗药盒、报告基因等)也可以置换跨越(并且任选地涵盖)内源外显子1(例如外显子1a和/或外显子1b)与内源非人类C9orf72基因座的ATG起始密码子之间的非翻译和/或非编码序列,或其一部分。
因此,在一些实施例中,如本文中所公开的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)可以包含异源六核苷酸重复扩增序列(例如包含阐述为SEQ ID NO:1的六核苷酸序列的至少一个重复的六核苷酸重复扩增序列)对内源序列的杂合或纯合置换,所述内源序列(1)起始于内源外显子1的5'端、内部或3'端并且(2)终止于内源ATG起始密码子的5',或其一部分。在一些实施例中,如本文中所公开的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)可以包含异源六核苷酸重复扩增序列对内源序列的杂合或纯合置换,所述内源序列(i)起始于内源外显子1的5'端、内部或3'端并且(ii)终止于内源ATG起始密码子的5',或其一部分,所述异源六核苷酸重复扩增序列从5'到3'包含:包含阐述为SEQ ID NO:34的序列的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的至少一个情形,和包含阐述为SEQ ID NO:35的序列的第二人类六核苷酸侧接序列。在一些实施例中,如本文中所公开的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)可以包含异源六核苷酸重复扩增序列对内源序列的杂合或纯合置换,所述内源序列(ii)起始于内源外显子1的5'端、内部或3'端并且(ii)终止于内源ATG起始密码子的5',或其一部分,所述异源六核苷酸重复扩增序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的至少一个情形,和包含阐述为SEQ ID NO:37的序列的第二人类六核苷酸侧接序列。在一些实施例中,如本文中所公开的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)可以包含异源六核苷酸重复扩增序列对内源序列的杂合或纯合置换,所述内源序列(ii)起始于内源外显子1的5'端、内部或3'端并且(ii)终止于内源ATG起始密码子的5',或其一部分,所述异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:2的序列、其变异体、SEQ ID NO:3或其变异体。
在一些实施例中,本文所述的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的一或多个重复,且其中非人类动物或细胞展现以下特征中的一种或多种:(i)C9orf72 RNA有义和/或反义转录物的表达相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过定量PCR所评估;(ii)包含C9orf72 RNA有义和/或反义转录物的RNA团簇(RNA foci)的数目相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过荧光活化原位杂交所评估;(iii)二肽重复蛋白含量相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过免疫荧光所评估;或(iv)(i)-(iii)的任何组合。在一些实施例中,本文所述的非人类动物或细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的三个或更多个重复,且其中非人类动物或细胞展现以下特征中的一种或多种:(i)C9orf72 RNA有义和/或反义转录物的表达相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过定量PCR所评估;(ii)包含C9orf72 RNA有义和/或反义转录物的RNA团簇的数目相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过荧光活化原位杂交所评估;(iii)二肽重复蛋白含量相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过免疫荧光所评估;或(iv)(i)-(iii)的任何组合。在一些实施例中,本文所述的非人类动物或细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少三十个重复,且其中非人类动物或细胞展现以下特征中的一种或多种:(i)C9orf72 RNA有义和/或反义转录物的表达相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过定量PCR所评估;(ii)包含C9orf72 RNA有义和/或反义转录物的RNA团簇的数目相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过荧光活化原位杂交所评估;(iii)二肽重复蛋白含量相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过免疫荧光所评估;或(iv)(i)-(iii)的任何组合。在一些实施例中,本文所述的非人类动物或细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的九十或更多个重复,且其中非人类动物或细胞展现以下特征中的一种或多种:(i)C9orf72RNA有义和/或反义转录物的表达相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过定量PCR所评估;(ii)包含C9orf72 RNA有义和/或反义转录物的RNA团簇的数目相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过荧光活化原位杂交所评估;(iii)二肽重复蛋白含量相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过免疫荧光所评估;或(iv)(i)-(iii)的任何组合。在一些实施例中,本文所述的非人类动物或细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的九十二个重复,且其中非人类动物或细胞展现全部的以下三种特征:(i)C9orf72RNA有义和/或反义转录物的表达相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过定量PCR所评估;(ii)包含C9orf72 RNA有义和/或反义转录物的RNA团簇的数目相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过荧光活化原位杂交所评估,;和(iii)二肽重复蛋白含量相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过免疫荧光所评估。在一些实施例中,本文所述的非人类动物或细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其(生殖系)基因组中包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的超过九十个重复,且其中非人类动物或细胞展现全部的以下三种特征:(i)C9orf72 RNA有义和/或反义转录物的表达相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过定量PCR所评估;(ii)包含C9orf72 RNA有义和/或反义转录物的RNA团簇的数目相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过荧光活化原位杂交所评估,;和(iii)二肽重复蛋白含量相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过免疫荧光所评估。在一些实施例中,本文所述的非人类动物或细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其基因组中包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少92个重复,且其中非人类动物或细胞展现全部的以下三种特征:(i)C9orf72 RNA有义和/或反义转录物的表达相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过定量PCR所评估;(ii)包含C9orf72 RNA有义和/或反义转录物的RNA团簇的数目相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过荧光活化原位杂交所评估,;和(iii)二肽重复蛋白含量相较于包含野生型C9orf72基因座的对照动物或细胞增加,例如如通过免疫荧光所评估。
在一些实施例中,本文所述的非人类动物或细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其基因组中包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:的六核苷酸序列的重复1,且其中非人类动物或细胞的一种或多种以下特征与包含野生型C9orf72基因座的对照非人类动物或细胞无显著差异:(i)所比较的C9orf72RNA有义和/或反义转录物的量,例如如通过定量PCR所评估;(ii)包含C9orf72 RNA有义和/或反义转录物的RNA团簇的数目,例如如通过荧光活化原位杂交所评估;(iii)二肽重复蛋白的含量,例如如通过免疫荧光所评估;或(iv)(i)-(iii)的任何组合。在一些实施例中,本文所述的非人类动物或细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其基因组中包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的三个重复,且其中非人类动物或细胞的一种或多种以下特征与包含野生型C9orf72基因座的对照非人类动物或细胞无显著差异:(i)所比较的C9orf72 RNA有义和/或反义转录物的量,例如如通过定量PCR所评估;(ii)包含C9orf72 RNA有义和/或反义转录物的RNA团簇的数目,例如如通过荧光活化原位杂交所评估;(iii)二肽重复蛋白的含量,例如如通过免疫荧光所评估;或(iv)(i)-(iii)的任何组合。在一些实施例中,本文所述的非人类动物或细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、神经元细胞、肌肉细胞、心脏细胞)在其基因组中包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:的六核苷酸序列的三十个重复1,且其中非人类动物或细胞的一种或多种以下特征与包含野生型C9orf72基因座的对照非人类动物或细胞无显著差异:(i)所比较的C9orf72 RNA有义和/或反义转录物的量,例如如通过定量PCR所评估;(ii)包含C9orf72 RNA有义和/或反义转录物的RNA团簇的数目,例如如通过荧光活化原位杂交所评估;(iii)二肽重复蛋白的含量,例如如通过免疫荧光所评估;或(iv)(i)-(iii)的任何组合。
在一些实施例中,提供如本文所述的核酸构建体(或靶向构建体,或靶向载体)。
在一些实施例中,如本文所述的核酸构建体从5'到3'包含:5'非人类靶向臂,其包含与非人类(例如啮齿动物,例如小鼠或大鼠)C9ORF72基因座的5'部分同源的聚核苷酸;异源六核苷酸重复扩增序列,其包含阐述为SEQ ID NO:1的六核苷酸序列中的至少一个;第一重组酶识别位点;可操作地连接到可选标记物的第一启动子;第二重组酶识别位点;和3'非人类靶向臂,其包含与非人类(例如啮齿动物,例如小鼠或大鼠)C9ORF72基因座的3'部分同源的聚核苷酸。在一些实施例中,非人类(例如啮齿动物,例如小鼠或大鼠)C9ORF72基因座的5'部分包括非人类(例如啮齿动物,例如小鼠或大鼠)C9ORF72基因的外显子1上游的基因组序列。
在一些实施例中,重组酶识别位点包括loxP、lox511、lox2272、lox2372、lox66、lox71、loxM2、lox5171、FRT、FRT11、FRT71、attp、att、FRT、rox或其组合。在一些实施例中,构建体中包括重组酶基因,例如在诱导型启动子的控制下。重组酶基因可以选自由Cre、Flp(例如Flpe、Flpo)和Dre组成的组。在一些特定实施例中,第一和第二重组酶识别位点是lox(例如loxP)位点,并且重组酶基因编码Cre重组酶。
在一些实施例中,第一启动子选自以下组成的组:鱼精蛋白(Prot;例如Prot1或Prot5)、Blimp1、Blimp1(1kb片段)、Blimp1(2kb片段)、Gata6、Gata4、Igf2、Lhx2、Lhx5、hUB1、Em7和Pax3。在一些特定实施例中,第一启动子是hUB1启动子与Em7启动子的组合。
在一些实施例中,可选标记物选自由以下组成的组:新霉素磷酸转移酶(neor)、潮霉素B磷酸转移酶(hygr)、嘌呤霉素-N-乙酰基转移酶(puror)、杀稻瘟菌素S脱氨酶(bsrr)、黄嘌呤/鸟嘌呤磷酸核糖基转移酶(gpt),和单纯疱疹病毒胸苷激酶(HSV-tk)。在一些特定实施例中,可选标记物是neor。
在一些实施例中,核酸构建体包含阐述为SEQ ID NO:8的序列,所述序列从5'到3'包含:5'非人类(小鼠)靶向臂、包含阐述为SEQ ID NO:36的序列的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的三个重复、包含阐述为SEQ ID NO:37的序列的第二人类六核苷酸侧接序列、floxed抗药(neor)盒和3'非人类(小鼠)靶向臂。在一些实施例中,核酸构建体包含阐述为SEQ ID NO:9的序列,所述序列从5'到3'包含:5'非人类(小鼠)靶向臂、包含阐述为SEQ ID NO:36的序列的第一人类六核苷酸侧接序列、阐述为SEQ IDNO:1的六核苷酸序列的一百个重复、包含阐述为SEQ ID NO:37的序列的第二人类六核苷酸侧接序列、floxed抗药(neor)盒和3'非人类(小鼠)靶向臂。
在一些实施例中,提供了一种制备非人类动物或非人类动物细胞的方法,所述非人类动物或非人类动物细胞的基因组包含插入内源C9orf72基因座中的异源六核苷酸重复扩增序列,其中所述异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少一个重复,例如至少约3个重复,例如至少约30个重复,例如至少约90个重复,所述方法包含(a)将核酸序列,例如如本文所述的核酸构建体(例如包含阐述为SEQ ID NO:8的序列的核酸构建体或包含阐述为SEQ ID NO:9的序列的核酸构建体),引入非人类胚胎干细胞,以便将所述异源六核苷酸重复扩增序列插入内源C9ORF72基因座中,所述核酸包含与C9ORF72基因座同源的聚核苷酸;(b)从(a)获得经过基因修饰的非人类胚胎干细胞;以及任选地,(c)使用(b)的经过基因修饰的非人类胚胎干细胞产生非人类动物。在一些实施例中,制备本文所述非人类动物的方法进一步包含使(c)中产生的非人类动物繁殖以便创造所述插入为纯合的非人类动物的步骤。
在一些实施例中,提供了一种制备非人类动物的方法,所述非人类动物的基因组包含插入内源C9ORF72基因座中的异源六核苷酸重复扩增序列,所述异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少一个重复,所述方法包含修饰非人类动物的基因组,以使得其内源C9ORF72基因座中包含所插入的异源六核苷酸重复扩增序列,由此制备所述非人类动物。
在一些实施例中,提供的非人类动物能通过如本文所述的方法获得,利用如本文所述的方法产生或制得。在一些实施例中,如本文中所公开的非人类动物是使用包含阐述为SEQ ID NO:8的序列的核酸构建体产生。此类非人类动物包含异源核苷酸序列对起始于内源外显子1内部的约853bp内源C9orf72基因座的杂合或纯合置换,所述异源核苷酸序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列的第一人类六核苷酸侧接序列、阐述为SEQID NO:1的六核苷酸序列的一至三个重复、包含阐述为SEQ ID NO:37的序列的人类六核苷酸侧接序列,和floxed抗药(neor)盒,或neo基因切除后,lox重组识别序列。在一些实施例中,如本文中所公开的非人类动物是使用包含阐述为SEQ ID NO:9的序列的核酸构建体产生。此类非人类动物包含异源核苷酸序列对起始于内源外显子1内部的约853bp内源C9orf72基因座的杂合或纯合置换,所述异源核苷酸序列从5'到3'包含:包含阐述为SEQ IDNO:36的序列的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的一到一百(例如36或92)个重复、包含阐述为SEQ ID NO:37的序列的人类六核苷酸侧接序列,和floxed抗药(neor)盒,或neo基因切除后,lox重组识别序列。在一些实施例中,非人类动物包含阐述为SEQ ID NO:4的异源核苷酸序列(8026)、阐述为SEQ ID NO:5的异源核苷酸序列(8027)、阐述为SEQ ID NO:6的异源核苷酸序列(8028),或阐述为SEQ ID NO:7的异源核苷酸序列(8029),其中所述异源核苷酸序列任选地置换起始于内源外显子1内部的内源C9orf72基因座的约853bp非翻译和/或非编码序列。在一些实施例中,如本文中所公开的非人类动物是通过例如使得使用包含阐述为SEQ ID NO:8的序列的核酸构建体所创造的动物与使用包含阐述为SEQ ID NO:9的序列的核酸构建体所创造的动物一起繁殖而产生。此类动物可以包含(1)异源核苷酸序列对起始于内源外显子1内部的约853bp内源C9orf72基因座的杂合置换,所述异源核苷酸序列5'到3'包含:包含阐述为SEQ ID NO:36的序列的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的一至三个重复、包含阐述为SEQ ID NO:37的序列的人类六核苷酸侧接序列,和floxed抗药(neor)盒,或neo基因切除后,lox重组识别序列;以及(2)异源核苷酸序列对起始于内源外显子1内部的约853bp内源C9orf72基因座的杂合置换,所述异源核苷酸序列从5'到3'包含:包含阐述为SEQ ID NO:36的序列的第一人类六核苷酸侧接序列、阐述为SEQ ID NO:1的六核苷酸序列的一到一百(例如36或92)个重复、包含阐述为SEQ ID NO:37的序列的人类六核苷酸侧接序列,和floxed抗药(neor)盒,或neo基因切除后,lox重组酶识别序列。
在一些实施例中,提供了如本文所述的或如本文所述的方法制备的非人类动物的已分离非人类细胞或组织。在一些实施例中,已分离的细胞或组织包含如本文所述的C9ORF72基因座。在一些实施例中,细胞是神经元细胞或来自神经元谱系的细胞。在一些实施例中,提供永生化细胞系,其由如本文所述的非人类动物的已分离细胞制成。
在一些实施例中,提供了非人类胚胎干细胞,其基因组包含如本文所述的C9ORF72基因座。在一些实施例中,非人类胚胎干细胞是啮齿动物胚胎干细胞。在一些特定实施例中,啮齿动物胚胎干细胞是小鼠胚胎干细胞并且来自129品系、C57Bl品系或其混合物。在一些特定实施例中,啮齿动物胚胎干细胞是小鼠胚胎干细胞并且是129与C57BL品系的混合物。
本文中还描述了成簇的规律间隔的短回文重复序列(Clustered RegularlyInterspersed Short Palindromic Repeats,CRISPR)/CRISPR相关(Cas)系统,或CRISPR/Cas系统的一种或多种组分,其可以用于从细胞(例如胚胎干细胞)中缺失如本文所述的插入内源C9ORF72基因座中的异源六核苷酸重复扩增序列(或其一部分)。此类组分包括例如Cas蛋白和/或向导RNA(gRNA),所述gRNA可以包括两个单独的RNA分子;例如目标RNA(例如CRISPR RNA(crRNA)和活化因子RNA(例如tracrRNA);或单向导RNA(例如单分子gRNA(sgRNA))。
CRISPR/Cas系统包括转录物和涉及Cas基因表达或引导Cas基因活性的其它元件。CRISPR/Cas系统可以是例如I型、II型或III型系统。或者,CRISPR/Cas系统可以是V型系统(例如V-A亚型或V-B亚型)。如本文所述的插入内源C9ORF72基因座的异源六核苷酸重复扩增序列(或其一部分)可以通过使用用于定点裂解核酸的CRISPR复合物(包含与Cas蛋白复合的向导RNA(gRNA))来缺失。
如本文所述的CRISPR/Cas系统可以包含Cas蛋白(例如Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1或Csx12)、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、Cu1966,和其同源物或已修饰型式),和/或一或多个靶向gRNA识别序列的向导RNA(gRNA)。如本文所述的CRISPR/Cas系统可以进一步包含至少一个表达构建体,其包含编码Cas蛋白的核酸(例如,其可以操作地连接到启动子)和/或编码如本文所述的gRNA的DNA。
在一些实施例中,在SEQ ID NO:45或其一部分中发现gRNA识别序列,例如gRNA的靶向DNA的区段将结合(只要存在充分的结合条件)的靶核酸序列。Cas蛋白对SEQ ID NO:45的位点特异性结合和裂解能够发生的位置由以下决定:(i)gRNA与靶DNA之间的碱基配对互补性,以及(ii)靶DNA中的短基序,称为前间区序列邻近基序(protospacer adjacentmotif,PAM)。PAM能侧接向导RNA识别序列。任选地,向导RNA识别序列能够通过PAM侧接于3'端。或者,向导RNA识别序列能够通过PAM侧接于5'端。举例来说,Cas蛋白的裂解位点可以在PAM序列上游或下游的约1到约10个或约2至约5个碱基对(例如3个碱基对)。在一些情况下(例如当使用来自酿脓链球菌的Cas9或密切相关的Cas9时),非互补链的PAM序列可以是5'-N1GG-3',其中N1是任何DNA核苷酸并且紧靠着靶DNA的非互补链的向导RNA识别序列的3'。因此,互补链的PAM序列是5'-CCN2-3',其中N2是任何DNA核苷酸并且紧靠着靶DNA的互补链的向导RNA识别序列的5'。在一些此类情况下,N1和N2可以是互补的并且N1-N2碱基对可以是任何碱基对(例如N1=C且N2=G;N1=G且N2=C;N1=A且N2=T;或N1=T,且N2=A)。在Cas9来自金黄色葡萄球菌的情况下,PAM可以是NNGRRT或NNGRR,其中N可以是A、G、C或T,且R可以是G或A。在一些情况下(例如对于FnCpf1来说),PAM序列可以位于5'端上游并且具有序列5'-TTN-3'。在一些实施例中,gRNA识别序列起始于SEQ ID NO:45的位置190、196、274、899、905、1006或1068。
如本文所公开,可以任何形式提供向导RNA。在一些实施例中,gRNA可以RNA形式、作为两个分子(单独的crRNA和tracrRNA)或作为一个分子(sgRNA)提供,并且任选地以与Cas蛋白的复合物形式提供。gRNA还能够以编码gRNA的DNA形式提供。在一些实施例中,编码gRNA的DNA能够编码单一RNA分子(sgRNA)或单独的RNA分子(例如单独的crRNA和tracrRNA)(其中单独的RNA分子可以作为一个DNA分子提供,或作为分别编码crRNA和tracrRNA的单独DNA分子提供)。
在一个实施例中,如本文所述的CRISPR/Cas系统包含Cas9蛋白或由来自II型CRISPR/Cas系统的Cas9衍生的蛋白质和/或至少一个gRNA,其中至少一个gRNA是由编码crRNA和/或tracrRNA的DNA编码。在一些实施例中,编码crRNA的DNA包含选自由以下组成的组的序列:AGTACTGTGAGAGCAAGTAG(R)(SEQ ID NO:38)、
GCTCTCACAGTACTCGCTGA(SEQ ID NO:39)、
CCGCAGCCTGTAGCAAGCTC(SEQ ID NO:40)、
CGGCCGCTAGCGCGATCGCG(SEQ ID NO:41)、
ACGCCCCGCGATCGCGCTAG(R)(SEQ ID NO:42)、
TGGCGAGTGGGTGAGTGAGG(SEQ ID NO:43)、
GGAAGAGGCGCGGGTAGAAG(SEQ ID NO:44)、
GAGTACTGTGAGAGCAAGTAG(R)(SEQ ID NO:46)、
GCCGCAGCCTGTAGCAAGCTC(SEQ ID NO:47)、
GCGGCCGCTAGCGCGATCGCG(SEQ ID NO:48)、
GACGCCCCGCGATCGCGCTAG(R)(SEQ ID NO:49),和
GTGGCGAGTGGGTGAGTGAGG(SEQ ID NO:50)。在一个实施例中,本文所述的CRISPR/Cas系统包含至少七个crRNA编码序列的组合,其中所述七个crRNA编码序列中的每一个包含阐述为SEQ ID NO:38、39、40、41、42、43或44的序列。在一个实施例中,本文所述的CRISPR/Cas 9系统包括至少七个不同的crRNA编码序列的组合,其中所述七个crRNA编码序列中的每一个包括阐述为SEQ ID NO:46、39、47、48、49、50或44的序列。在一个实施例中,本文所述的CRISPR/Cas 9系统包含至少三个不同crRNA编码序列的组合,其各自包含阐述为SEQ ID NO:40、43或44的序列。在一个实施例中,本文所述的CRISPR/Cas 9系统包含至少三个不同crRNA编码序列的组合,其各自包括阐述为SEQ ID NO:47、50或44的序列。在一个实施例中,本文所述的CRISPR/Cas 9系统包含至少四个不同crRNA编码序列的组合,其各自包含阐述为SEQ ID NO:38、39、41或42的序列。在一个实施例中,本文所述的CRISPR/Cas 9系统包含至少四个不同crRNA编码序列的组合,其各自包含阐述为SEQ ID NO:46、39、48或49的序列。
在一些实施例中,本文所公开的gRNA是由编码tracrRNA的DNA编码。在一些实施例中,tracrRNA编码序列包含阐述为SEQ ID NO:63、64或65的序列。在一些实施例中,如本文所述的gRNA包含crRNA和tracrRNA。在一些实施例中,如本文中所公开的gRNA包含一个或多个crRNA(例如由包含阐述为SEQ ID NO:38、39、40、41、42、43、44、46、47、48、49或50的序列的DNA编码)和tracrRNA,例如包含阐述为SEQ ID NO:63、64或65的序列的DNA。在一些实施例中,编码gRNA的DNA能够编码单一RNA分子(sgRNA)或单独的RNA分子(例如单独的crRNA和tracrRNA)(其中单独的RNA分子可以作为一个DNA分子提供,或作为分别编码crRNA和tracrRNA的单独DNA分子提供)。
靶向基因修饰能够通过使细胞与Cas蛋白和一个或多个向导RNA接触来产生,所述向导RNA与靶基因组基因座内的一个或多个向导RNA识别序列杂交。所述一个或多个向导RNA中的至少一个能够与Cas蛋白形成复合物并且能够将Cas蛋白引向一个或多个向导RNA识别序列,并且Cas蛋白能够使所述一个或多个向导RNA识别序列中的至少一个内的靶基因组基因座裂解。Cas蛋白的裂解作用能够引起双链断裂或单链断裂(例如,如果Cas蛋白是切口酶)。通过双链断裂或单链断裂而产生的末端序列然后能够经历重组。
在一些实施例中,提供了非人类生殖细胞,其基因组包含如本文所述的C9ORF72基因座。在一些实施例中,非人类生殖细胞是啮齿动物生殖细胞。在一些特定实施例中,啮齿动物生殖细胞是小鼠生殖细胞并且来自129品系、C57Bl品系或其混合物。在一些特定实施例中,啮齿动物生殖细胞是小鼠生殖细胞并且是129品系与C57BL品系的混合物。
在一些实施例中,提供了如本文所述的非人类胚胎干细胞或生殖细胞用于制造经过基因修饰的非人类动物的用途。在一些特定实施例中,非人类胚胎干细胞或生殖细胞是小鼠胚胎干细胞或生殖细胞并且用于制造包含如本文所述的C9ORF72基因座的小鼠。在一些特定实施例中,非人类胚胎干细胞或生殖细胞是大鼠胚胎干细胞生殖细胞并且用于制造包含如本文所述的C9ORF72基因座的大鼠。
在一些实施例中,提供了包含非人类胚胎干细胞、由所述干细胞制得、获得或产生的非人类胚胎,所述干细胞包含如本文所述的C9ORF72基因座。在一些特定实施例中,非人类胚胎是啮齿动物胚胎;在一些实施例中,是小鼠胚胎;在一些实施例中,是大鼠胚胎。
在一些实施例中,提供了如本文所述的非人类胚胎用于制造经过基因修饰的非人类动物的用途。在一些特定实施例中,非人类胚胎是小鼠胚胎并且用于制造包含如本文所述的C9ORF72基因座的小鼠。在一些特定实施例中,非人类胚胎是小鼠胚胎并且用于制造包含如本文所述的C9ORF72基因座的大鼠。
在一些实施例中,提供了非人类动物的肌萎缩侧索硬化(ALS)或额颞痴呆(FTD)模型,所述非人类动物具有包含如本文中所公开的异源六核苷酸重复扩增序列的内源C9ORF72基因座。
在一些实施例中,提供了非人类动物的肌萎缩侧索硬化(ALS)或额颞痴呆(FTD)模型,其是通过将异源六核苷酸重复扩增序列插入内源C9ORF72基因座中而获得。
在一些实施例中,提供了一种鉴定用于治疗神经退化性疾病、病症或病状的治疗候选物的方法,所述方法包含(a)将候选药剂施用于基因组包含如本文所述经修饰的内源C9ORF72基因座的非人类动物或非人类动物细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、皮质细胞、神经元细胞、肌肉细胞、心脏细胞);(b)执行一种或多种分析,以确定所述候选药剂对与所述疾病、病症或病状有关的一种或多种征象、症状和/或病状是否具有调节作用(例如有义或反义C9orf72 RNA从C9orf72基因座转录增加、包含有义或反义C9orf72 RNA的细胞核和/或细胞质RNA团簇增加、RAN翻译产物(例如二肽重复蛋白)增加);以及(c)鉴定所述候选药剂作为治疗候选物对与所述疾病、病症或病状有关的一种或多种征象、症状和/或病状具有调节作用。在一些实施例中,所述疾病或病状选自由神经退化性疾病或病状组成的组。在一些实施例中,将候选药剂施用于如本文所述的非人类动物体内,且对投药之后从所述非人类动物分离出的包含脑细胞、皮质细胞、神经元细胞、肌肉细胞、心脏细胞或生殖细胞的组织进行一种或多种分析。在一些实施例中,将候选药剂施用于细胞(例如胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、皮质细胞、神经元细胞、肌肉细胞、心脏细胞),所述细胞包含如本文所述的位于C9orf72基因座的六核苷酸重复扩增序列,并且在体外进行分析。在一些实施例中,分析是定量聚合酶链反应(qPCR)以检测C9orf72基因产物,例如有义和反义C9orf72 RNA。在一些实施例中,qPCR可以使用引物和/或探针进行,所述引物和/或探针具有SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ IDNO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ IDNO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:80中所述的核苷酸序列,或其任何组合。在一些实施例中,所述分析是测量RNA团簇,所述RNA团簇包含C9orf72有义或反义RNA转录物,例如六核苷酸重复扩增序列的RNA转录物。在一些实施例中,所述分析是使用一个或多个探针测量RNA团簇,所述RNA团簇包含C9orf72有义或反义RNA转录物,例如六核苷酸重复扩增序列的RNA转录物,所述探针具有SEQ ID NO:81、SEQ IDNO:82、SEQ ID NO:83和/或SEQ ID NO:84中的任一个所述的核苷酸序列。在一些实施例中,所述分析是测量RAN翻译产物,例如所述分析是免疫荧光并且RAN翻译产物(例如二肽重复蛋白,例如聚GA二肽重复蛋白)是使用抗聚GA抗体测量。在一些实施例中,所述分析是测量C9orf72蛋白含量。
在一些实施例中,提供了如本文所述的非人类动物用于制造供治疗神经退化性疾病、病症或病状的药剂的用途。
在一些实施例中,神经退化性疾病、病症或病状是肌萎缩侧索硬化(ALS)。在一些实施例中,神经退化性疾病、病症或病状是额颞痴呆(FTD)。
在各种实施例中,如本文所述的一种或多种表是或相较于参考物或对照物而言。在一些实施例中,参考物或对照物包括非人类动物,其具有如本文所述的修饰、不同于如本文所述的修饰的修饰,或无修饰(例如野生型非人类动物)。含有包含阐述为SEQ ID NO:2、其变异体、SEQ ID NO:4、其变异体、或SEQ ID NO:5或其变异体的序列的异源六核苷酸重复扩增序列的非人类动物可以展现野生型表,例如可以在本文所述方法中用作参考或对照的非人类动物。
在各种实施例中,非人类动物就本文所述的C9orf72基因座来说是纯合的。在各种实施例中,非人类动物就本文所述的C9orf72基因座来说是杂合的。
在各种实施例中,本文所述的非人类动物是啮齿动物;在一些实施例中,是小鼠;在一些实施例中,是大鼠。
如本申请中所使用,术语“约”和“大约”等效使用。本申请中结合或不结合约/大约使用的任何数字皆意指涵盖相关领域中普通技术人员所了解的任何正常波动。
本文所提供的非人类动物、细胞和方法的其它特征、目标和优点在以下某些实施例的详细描述中显而易见。然而,应理解,尽管指出了某些实施例,但详细描述仅为了说明而非限制而给出。所属领域的技术人员从详细描述将显而易见属于本发明范围内的各种变化和修改。
附图说明
图1A在顶框中展示了三种已报告的小鼠C9orf72转录物同功异型物(V1、V2和V3)的示意性说明(不按比例)以及靶向策略的示意性说明(不按比例),所述靶向策略用于将跨越人类C9orf72基因的外显子1a和1b并且包含3或100个重复的两种人类异源六核苷酸重复扩增序列插入内源小鼠C9orf72基因座中。在图1A中,白色填充框表示小鼠外显子,白色对角线条纹框表示小鼠C9orf72基因座的非编码小鼠外显子。水平条纹框是人类C9orf72基因座的非编码外显子,且菱形表示六核苷酸重复。产生包含阐述为SEQ ID NO:2的序列的序列的第一靶向载体和包含阐述为SEQ ID NO:4的序列的第二靶向载体。第一靶向载体从5'到3'包括:小鼠RP23-434N2上游89Kb的小鼠同源臂:3110043021Rik基因且包含SEQ ID NO:6;阐述为SEQ ID NO:8的人类序列,其跨越人类C9orf72的非编码外显子1a和1b并且包括含有六核苷酸序列GGGGCC的三个重复的居间内含子;药物选择盒,其包含来自人类泛素1基因(hUb1)和细菌Em7基因的可操作地连接到新霉素磷酸转移酶抗性基因(neo-r)启动子,且侧接loxP位点);小鼠RP23-434N2下游86Kb的小鼠同源臂:3110043021Rik基因且包含SEQ IDNO:7。第二靶向载体从5'到3'包括:小鼠RP23-434N2上游89Kb的小鼠同源臂:3110043021Rik基因且包含SEQ ID NO:6;阐述为SEQ ID NO:9的人类序列,其跨越人类C9orf72的非编码外显子1a和1b且包括含有六核苷酸序列GGGGCC的100个重复的居间内含子;药物选择盒,其包含来自人类泛素1基因(hUb1)和细菌Em7基因的可操作地连接到新霉素磷酸转移酶抗性基因(neo-r)的启动子且侧接loxP位点);以及小鼠RP23-434N2下游86Kb的小鼠同源臂:3110043021Rik基因且包含SEQ ID NO:7。与第一或第二靶向载体进行同源重组后,约853bp的小鼠基因组区域,包括小鼠3110043021Rik的外显子1的一部分和内含子1的一部分,被包含跨越人类C9orf72非编码序列的外显子1a-1b的基因组序列的序列置换。图1B中描绘了抗药盒切除之前和之后的所得已修饰的小鼠C9orf72-HRE3基因座。图1C中描绘了抗药盒切除之前和之后的所得已修饰的小鼠C9orf72-HRE100基因座。在图1B和1C中,鼠类非编码区由对角条纹框表示,人类非编码外显子由水平条纹框表示,且小鼠编码外显子由白色框表示。图1B和1C的上图中还展示了DNA印迹分析所用的探针(竖直白色矩形)(SEQID NO:29)的大致位置。
图2A中展示了对基因组DNA进行DNA印迹分析的结果,所述基因组DNA从以下中分离:对照ES细胞克隆系;通过靶向载体所靶向的ES细胞克隆系,所述靶向载体包含含有六核苷酸序列的三个重复(8026)和药物盒切除之后(8027A-C4)的异源重复扩增序列;或通过靶向载体所靶向的ES细胞克隆系,所述靶向载体包含含有六核苷酸序列的100个重复(8028)和药物盒切除之后(8029A-A3、8029A-A6、8029B-A4、8029B-A10)的异源重复扩增序列。图2B展示了基因分型样品(n=6)的基因型结果,包括对照ES细胞纯系、8027A-C4克隆系、8029A-A3克隆系、8029A-A6克隆系、8029B-A4克隆系、8029B-A10克隆系,和从含有三个六核苷酸重复扩增序列的人类样品中获得的对照物(n=7)。
图3展示了人源化C9orf72-HREx(其中x≥1)、人源化区域和野生型(WT)C9orf72小鼠基因座的示意性说明(不按比例)。图3还展示了表1所述的定性PCR分析A、B、G、H和D中所用的5'-引物和3'-引物(白色箭头)和探针(填充矩形)的大致位置,以量化已修饰的C9orf72-HRE基因座(A、B、G、H)或已修饰的和野生型C9orf72基因座(D)的基因表达产物。在图3中,鼠类非编码区由对角条纹框表示,人类非编码外显子由水平条纹框表示,且小鼠编码外显子由白色框表示。图3中所描绘且表1中所述的引物和探针序列提供于表5中。
表1
图4提供的条形图展示了胚胎干细胞衍生的运动神经元(ESMN)、总脑组织或亲代胚胎干(ES)细胞对C9orf72基因座(y轴)的表达水平(如图3中所描绘的定性PCR分析A、B、G和H所测定),所述胚胎干细胞衍生的运动神经元、总脑组织或亲代胚胎干细胞对于野生型C9orf72基因座(对照)或已修饰的C9orf72基因座来说是杂合的(het)或纯合的(homo),相对于包含阐述为SEQ ID NO:1的六核苷酸序列的三个(3x)重复的已修饰C9orf72基因座是杂合的ESMN、脑或亲代ESC,纯合的已修饰C9orf72基因座分别包含阐述为SEQ ID NO:1的六核苷酸序列的三个(3x)、三十个(30x)或九十二个(92x)重复。所有ESMN和亲代ES细胞对于已修饰的C9orf72基因座来说是杂合的,而所有对照物对于野生型C9orf72基因座来说是纯合的。
图5A-5C提供的条形图展示了胚胎干细胞衍生的运动神经元(ESMN)、小鼠全脑或亲代胚胎干(ES)细胞的C9orf72基因产物的计数值差异(Δct;y轴)(通过定性PCR分析A(图5A)、分析B(图5B)或分析D(图5C)所检测,如图3中所描绘)以及GAPDH基因产物的计数值,所述胚胎干细胞衍生的运动神经元、小鼠全脑或亲代胚胎干(ES)细胞对于野生型C9orf72基因座(对照)或包含阐述为SEQ ID NO:1的六核苷酸序列的三个(3x)、三十个(30x)或九十二个(92x)重复的已修饰C9orf72基因座来说是杂合的(het)或纯合的(homo)。所有ESMN和亲代ES细胞对于已修饰的C9orf72基因座来说是杂合的,而所有对照物对于野生型C9orf72基因座来说是纯合的。
图6提供的条形图展示了从小鼠皮质、脑干、余脑(rem)、脊髓、肌肉、肝脏、心脏或肾脏分离出的组织中的C9orf72基因产物的计数值差异(Δct;y轴)(通过定性PCR分析B所检测,如图3中所描绘)以及β2-微球蛋白(B2M)基因产物的计数值,所述小鼠对于野生型C9orf72基因座(WT)或包含阐述为SEQ ID NO:1的六核苷酸序列的三个(3x)或九十二个(92x)重复的已修饰c9orf72基因座来说是杂合的(het)或纯合的(homo)。
图7展示了对胚胎干细胞衍生的运动神经元(ESMN)的溶胞物进行还原型SDS-PAGE分析的蛋白质印迹影像(顶图),所述胚胎干细胞衍生的运动神经元对于野生型C9orf72基因座(CTRL)来说是纯合的或对于包含阐述为SEQ ID NO:1的六核苷酸序列的三个(G4C23x)、三十个(G4C230x)或九十二个(G4C292x)重复的已修饰C9orf72基因座来说是杂合的,印迹为抗C9orf72抗体(顶图)或抗GAPDH抗体(底图)。还提供了相对于ESMN中的C9orf72蛋白质含量归一化的这些样品中的C9orf72蛋白质含量的条形图(底图)以及分子量标记,所述ESMN对于包含阐述为SEQ ID NO:1的六核苷酸序列的三个重复的已修饰C9orf72基因座来说是杂合的。
图8展示了对胚胎干细胞衍生的运动神经元的溶胞物进行还原型SDS-PAGE分析的蛋白质印迹影像(顶图),所述运动神经元对于包含阐述为SEQ ID NO:1的六核苷酸序列的三个(G4C23x)或九十二个(G4C292x)重复的已修饰C9orf72基因座来说是杂合的。含有0μg、1.25μg、2.5μg、5μg或10μg总蛋白的溶胞物用抗C9orf72抗体(已展示)或抗GAPDH抗体(资料未示出)浸渍印迹。还提供了相对于这些样品的GAPDH蛋白质含量归一化的这些样品中的C9orf72蛋白质含量的条形图(底图),以及分子量标记。
图9A和9B是对胚胎干细胞衍生的运动神经元(ESMN)进行荧光原位杂交(FISH)而获得的影像,所述运动神经元对于已修饰而包含阐述为SEQ ID NO:1的六核苷酸序列的三个(C9orf72G4C23x)、三十个(C9orf72G4C230x)或九十二个(C9orf72G4C292x)重复的C9orf72基因座来说是杂合的,并且被DNA(图9A)或LNA(图9B)探针染色,所述影像展示了SEQ IDNO:1中所述的六核苷酸重复序列的有义(图9A)或反义(图9B)转录物在ESMN的细胞核和细胞质中的位置。箭头指向示例性染色RNA团簇。
图10提供了对胚胎干细胞衍生的运动神经元(ESMN)进行免疫荧光而获得的影像,所述运动神经元对于已修饰而包含阐述为SEQ ID NO:1的六核苷酸序列的三个(C9orf72G4C23x)或九十二个(C9orf72G4C292x)重复的C9orf72基因座来说是杂合的,所述影像展示了从SEQ ID NO:1中所述的六核苷酸重复序列的转录物翻译(通过RAN翻译,一种非AUG机理)的二肽重复蛋白(聚GA)在ESMN细胞核中的位置。箭头指向例示性染色的聚GA二肽重复蛋白。
图11展示了小鼠C9ORF72基因座的约1300bp的示意性说明(不按比例),所述基因座包含含有阐述为SEQ ID NO:1的六核苷酸序列的约92个重复的异源(人类)六核苷酸重复扩增,并且可以作为参考序列用于产生CRISPR/Cas系统以便缺失扩增序列。图11中还描绘了(1)用向下指向的箭头所描绘的六核苷酸序列的92个重复的大致位置;(2)可以被分别包含阐述为SEQ ID NO:38、SEQ ID NO:39和SEQ ID NO:40的序列的gRNA靶向的六核苷酸重复扩增序列上游三个位点处的起始位置(190、196和274);(3)可以被分别包含阐述为SEQ IDNO:41、SEQ ID NO:42、SEQ ID NO:43和SEQ ID NO:44的序列的gRNA靶向的六核苷酸重复扩增序列下游四个位点处的起始位置(899、905、1006和1068);和(4)正向(F-)和反向(R-)引物的大致位置,其可以用于确认所选细胞克隆系中的缺失。图11中所描绘的参考序列的核酸序列阐述为SEQ ID NO:45。
图12展示了可以用于CRISP/Cas系统中的示例性10,718bp表达构建体。表达构建体包含与N端核定位信号(NLS)和C端核定位信号融合的编码小鼠Cas9蛋白的核酸“小鼠optCas9”,融合蛋白在CAGG启动子的控制下表达。核酸上游是kozak序列,而核酸下游是牛生长激素聚腺苷酸化(bGHpA)尾。作为表达构建体的一部分,还展示了驱动编码绿色荧光蛋白(GFP)的核苷酸序列表达的EF1启动子,所述启动子与嘌呤霉素抗性基因融合,所述嘌呤霉素抗性基因可操作地连接到SV40聚腺苷酸化(SV40聚A)尾;复制起点(pMB1);和提供氨苄青霉素(Amp)抗性的β内酰胺酶基因。表达构建体允许将编码gRNA(例如crRNA)的DNA插入U6启动子与终止信号之间。图4中所描绘的表达构建体可以进一步在U6启动子的下游和终止信号的上游包含tracrRNA编码序列。此类tracrRNA编码序列的定位使得其可以在其插入后可操作地连接到例如crRNA。在一些实施例中,
tracrRNA编码序列包含
GTTGGAACCATTCAAAACAGCATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC(SEQ IDNO:63);
GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC(SEQ ID NO:64);
GTTTAAGAGCTATGCTGGAAACAGCATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGC(SEQ ID NO:65),或其一部分。
定义
本发明不限于本文所述的特定方法和实验条件,因为此类方法和条件可以改变。还应了解,本文所用的术语仅出于描述特定实施例的目的,而不希望具有限制性,原因是本发明的范围仅由权利要求书限定。
除非另外定义,否则本文所用的所有术语和短语都包括所述术语和短语已经在所属领域中获得的含义,除非使用所述术语或短语的上下文中明确指示或显而易见有相反的情形。尽管与本文中描述的那些方法和材料类似或等效的任何方法和材料均可用于实施或测试本发明,但现在描述特定的方法和材料。本文所提及的所有出版物都以引用的方式并入本文中。
“投药”包括将组合物施用于受检者或系统(例如细胞、器官、组织、生物体或其相关组分或一组组分)。所属领域的技术人员将了解,投药途径可以根据例如组成物正施用于的受试者或系统、组成物的性质、投药目的等而变化。举例来说,在某些实施例中,向动物受试者(例如向人类或啮齿动物)投药可以是支气管(包括通过支气管滴注)、颊内、肠内、皮间、动脉内、皮内、胃内、髓内、肌肉内、鼻内、腹膜内、鞘内、静脉内、脑室内、经粘膜、鼻、口、直肠、皮下、局部、气管(包括通过气管内滴注)、透皮、阴道和/或玻璃体。在一些实施例中,投药可能涉及间歇性给药。在一些实施例中,投药可能涉及连续给药(例如灌注)至少选定的时间段。
“改善”包括受试者状态的预防、减轻或缓和,或状态改善。改善包括(但不要求)疾病、病症或病状(例如放射损伤)的完全恢复或完全预防。
“大约”当应用于所关注的一个或多个值时,包括应用于类似于所述参考值的值。在某些实施例中,除非另有陈述或从上下文显而易见(除此数超出可能值的100%外),否则术语“大约”或“约”是指在任一方向上(大于或小于)处于所述参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小范围内的值范围。
“生物活性”包括在生物系统中、在体外或体内(例如在生物体中)具有活性的任何药剂的特征。举例来说,药剂当存在于生物体中时在所述生物体内具有生物学作用被视为具有生物活性。在蛋白质或多肽具有生物活性的特定实施例中,所述蛋白质或多肽的共有蛋白质或多肽的至少一种生物活性的一部分典型地称为“生物活性”部分。
“相当”包括两种或更多种药剂、实体、情形、条件集合等可能彼此不相同,但相似性足以允许其间的比较,以便可以基于所观察到的差异或相似性来合理地得出结论。所属领域的技术人员将理解,在上下文中,在任何既定情况下,两种或更多种此类药剂、实体、情形、条件集合等被视为相当需要何种程度的一致性。
当描述保守氨基酸取代时,“保守”包括氨基酸残基被侧链R基团具有相似化学特性(例如电荷或疏水性)的另一氨基酸残基取代。一般来说,保守氨基酸取代基本上不会改变所关注的蛋白质功能特性,例如受体结合到配体的能力。侧链具有相似化学特性的氨基酸组实例包括:脂族侧链,例如甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;脂族羟基侧链,例如丝氨酸和苏氨酸;含酰胺侧链,例如天冬酰胺和谷氨酰胺;芳香族侧链,例如苯丙氨酸、酪氨酸和色氨酸;碱性侧链,例如赖氨酸、精氨酸和组氨酸;酸性侧链,例如天冬氨酸和谷氨酸;以及含硫侧链,例如半胱氨酸和甲硫氨酸。保守氨基酸取代组包括例如缬氨酸/亮氨酸/异亮氨酸、苯丙氨酸/酪氨酸、赖氨酸/精氨酸、丙氨酸/氨酸、谷氨酸/天冬氨酸和天冬酰胺/谷氨酰胺。在一些实施例中,保守氨基酸取代可以是蛋白质中的任何原生残基被丙氨酸取代,如例如丙氨酸扫描突变诱发中所使用。在一些实施例中,产生的保守取代在PAM250对数似然度矩阵中具有正值,所述矩阵在Gonnet,G.H.等人,1992,《科学(Science)》256:1443-1445中公开。在一些实施例中,取代是中度保守取代,其中取代在PAM250对数似然度矩阵中具有非负值。
“对照”包括所述领域中所理解的“对照”含义,其为比较结果的标准。典型地,对照是用于增强实验的完整性,其通过孤立变量以便得出关于此类变量的结论。在一些实施例中,对照是与测试反应或分析同时进行的反应或分析,以提供比较。“对照”还包括“对照动物”。“对照动物”可以具有如本文所述的修饰、如本文所述的不同修饰或无修饰(即,野生型动物)。在一个实验中,应用“测试”(即,所测试的变量)。在第二实验中,作为“对照”,不应用所测试的变量。在一些实施例中,对照是历史对照(即,先前执行的测试或分析,或先前已知的量或结果)。在一些实施例中,对照是或包含印刷或以其它方式保存的记录。对照可以是阳性对照或阴性对照。
“破坏”包括与DNA分子(例如与内源同源序列,例如基因或基因座)发生同源重组事件的结果。在一些实施例中,破坏可以实现或代表DNA序列的插入、缺失、取代、置换、错义突变或框移,或其任何组合。插入可以包括整个基因或基因片段(例如外显子)的插入,其可以具有除内源序列之外的来源(例如异源序列)。在一些实施例中,破坏可以增强基因或基因产物(例如由基因编码的蛋白质)的表达和/或活性。在一些实施例中,破坏可以减少基因或基因产物的表达和/或活性。在一些实施例中,破坏可以改变基因或已编码基因产物(例如已编码蛋白质)的序列。在一些实施例中,破坏可以截断或分裂基因或已编码的基因产物(例如已编码的蛋白质)。在一些实施例中,破坏可以延长基因或已编码的基因产物。在一些此类实施例中,破坏可以实现融合蛋白的组装。在一些实施例中,破坏可以影响基因或基因产物的含量,而非活性。在一些实施例中,破坏可以影响基因或基因产物的活性,而非含量。在一些实施例中,破坏可以对基因或基因产物的含量无显著影响。在一些实施例中,破坏可以对基因或基因产物的活性无显著影响。在一些实施例中,破坏可以对基因或基因产物的含量或活性无显著影响。
“测定”、“测量”、“评价”、“评估”、“分析”和“分析”包括任何形式的测量,并且包括确定元件存在还是不存在。这些术语包括定量和/或定性测定。分析可以是相对的或绝对的。“分析的存在”可以是测定某物存在的量和/或确定其是否存在或是否不存在。
“内源基因座”或“内源基因”包括在引入如本文所述的破坏、缺失、置换、改变或修饰之前发现于亲代或参考生物体中的遗传基因座。在一些实施例中,内源基因座具有自然界中所发现的序列。在一些实施例中,内源基因座是野生型基因座。在一些实施例中,参考生物体为野生型生物体。在一些实施例中,参考生物为经工程改造的生物体。在一些实施例中,参考生物体是实验室培育的生物体(无论野生型还是工程改造过的)。
“内源启动子”包括与内源基因天然关联(例如在野生型生物体中)的启动子。
“基因”包括染色体中的DNA序列,其对产物(例如RNA产物和/或多肽产物)进行编码。在一些实施例中,基因包括编码序列(即,编码特定产物的序列)。在一些实施例中,基因包括非编码序列。在一些特定实施例中,基因可以包括编码(例如外显子)序列和非编码(例如内含子)序列。在一些实施例中,基因可以包括一个或多个调控序列(例如启动子、增强子等)和/或内含子序列,其可以例如控制基因表达的一个或多个方面(例如细胞类型特有的表达、诱导型表达等)。出于清楚起见,我们注意到,如本申请中所用,术语“基因”一般是指编码多肽的核酸的一部分;所述术语可以任选地涵盖调控序列,如所属领域的技术人员从上下文将清楚了解。这个定义不是希望排除术语“基因”应用于非蛋白质编码表达单元,而是阐明在大多数情况下,如本文中所使用的术语是指编码多肽的核酸。
“异源”包括来自不同来源的药剂或实体。举例来说,所述术语当结合存在于特定细胞或生物体中的多肽、核酸序列、基因或基因产物使用时,阐明相关的多肽、核酸序列、基因或基因产物:1)被人工进行工程改造;2)通过人工(例如通过基因工程)引入细胞或生物体(或其前体)中;和/或3)并非天然产生于或存在于相关的细胞或生物体(例如相关的细胞类型或生物体类型)中。“异源”还包括多肽、核酸序列、基因或基因产物通常存在于特定原生细胞或生物体中,但已经被修饰,例如通过突变或置于非天然关联和(在一些实施例中)非内源的调控元件(例如启动子)的控制下。
“宿主细胞”包括核酸或蛋白质已引入其中的细胞。所属领域的技术人员在阅读本公开之后将理解,此类术语不仅指特定的受试细胞,而且用于指此类细胞的后代。由于后续几代因突变或环境影响而可能出现某些修饰,因此此类后代实际上可能与亲代细胞不一致,但是仍然包括于短语“宿主细胞”的范围内。在一些实施例中,宿主细胞是或包含原核或真核细胞。一般来说,宿主细胞是适于接收和/或产生异源核酸或蛋白质的任何细胞,而与所述细胞被指定所属的生命界无关。示例性细胞包括原核生物和真核生物的细胞(单细胞或多细胞)、细菌细胞(例如大肠杆菌(Escherichia coli)、芽孢杆菌属(Bacillus spp.)、链霉菌属(Streptomyces spp.)等的菌株)、分枝杆菌细胞、真菌细胞、酵母细胞(例如酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、甲醇酵母(Pichia pastoris)、嗜甲醇毕赤酵母(Pichia methanolica)等)、植物细胞、昆虫细胞(例如SF-9、SF-21、杆状病毒感染的昆虫细胞、粉纹夜蛾(Trichoplusia ni)等)、非人类动物细胞、人类细胞,或细胞融合体,例如融合瘤或四源杂交瘤。在一些实施例中,细胞是人类、猴、猿、仓鼠、大鼠或小鼠细胞。在一些实施例中,细胞是真核细胞且选自以下细胞:CHO(例如CHO K1、DXB-11CHO、Veggie-CHO)、COS(例如COS-7)、视网膜细胞、Vero、CV1、肾脏(例如HEK293、293EBNA、MSR 293、MDCK、HaK、BHK)、HeLa、HepG2、WI38、MRC 5、Colo205、HB 8065、HL-60(例如BHK21)、Jurkat、Daudi、A431(表皮)、CV-1、U937、3T3、L细胞、C127细胞、Sp2/0、NS-0、MMT 060562、塞特利氏细胞(Sertoli cell)、BRL 3A细胞、HT1080细胞、骨髓瘤细胞、肿瘤细胞,和来源于前述细胞的细胞系。在一些实施例中,细胞包含一个或多个病毒基因,例如表达病毒基因的视网膜细胞(例如细胞)。在一些实施例中,宿主细胞是或包含已分离的细胞。在一些实施例中,宿主细胞是组织的一部分。在一些实施例中,宿主细胞是生物体的一部分。
比较序列时用的“一致性”包括如根据所属领域中已知的多种不同算法测定的一致性,所述算法能够用于测量核苷酸和/或氨基酸序列一致性。在一些实施例中,如本文所述的一致性是利用ClustalW v.1.83(慢)比对、采用开放空隙罚分10.0、延长空隙罚分0.1并且利用Gonnet相似性矩阵(MACVECTORTM 10.0.2,MacVector Inc.,2008)测定。
“改善”、“增加”、“排除”、或“减少”包括指定的值相对于基线测量结果,例如在治疗开始之前,同一个体(或动物)的测量结果,或在缺乏本文所述治疗的情况下,对照个体(或动物)或多个对照个体(或动物)的测量结果。
“分离”包括(1)已与最初产生时与其相关的至少一些组分分离(无论在自然界中和/或在实验环境中);和/或(2)通过人工设计、产生、制备和/或制造的物质和/或实体。已分离的物质和/或实体可以和最初与其相关的其它组分的约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或超过约99%分离。在一些实施例中,已分离的药剂具有约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或大于约99%纯度。在一些实施例中,一种物质如果其基本上不含其它组分,则是“纯的”。在一些实施例中,如所属领域的技术人员将理解,一种物质在已经与某些其它组分(例如一种或多种载剂或赋形剂(例如缓冲剂、溶剂、水等))合并之后仍然可以被视为“已分离的”或甚至“纯的”;在此类实施例中,所述物质的分离或纯度百分比的计算不包括此类载剂或赋形剂。仅举一例,在一些实施例中,存在于自然界中的生物聚合物(例如多肽或聚核苷酸)出现以下情况时被视为“已分离的”:a)凭借其衍生起源或来源与自然界中以原生状态伴随其的一些或全部组分无关联;b)其基本上不含相同物种的其它多肽或核酸,所述相同物种来自在自然界中产生其的物种;或c)被不是在自然界中产生其的物种的细胞或其它表达系统表达或以其它方式与其关联。因此,举例来说,在一些实施例中,化学合成或在细胞系统中合成的多肽被视为“已分离”的多肽,所述细胞系统不同于在自然界中产生其的细胞系统。或者或另外,在一些实施例中,已经历一种或多种提纯技术的多肽就其已经与a)在自然界中与其关联;和/或b)在最初产生时与其关联的其它组分分离来说可以被视为“已分离”的多肽。
“基因座(Locus)”或“基因座(Loci)”包括基因(或有效序列)、DNA序列、编码多肽的序列的特定位置,或生物体基因组染色体上的位置。举例来说,“C9ORF72基因座”可以指C9ORF72基因、C9ORF72DNA序列、编码C9ORF72的序列的特定位置,或已经鉴定此类序列存在于其中的生物体基因组染色体上的C9ORF72位置。C9ORF72基因座可以包含C9ORF72基因的调控元件,包括(但不限于)增强子、启动子、5'和/或3'UTR,或其组合。所属领域的技术人员将了解,在一些实施例中,染色体可以含有数百个或甚至数千个基因并且当在不同物种之间比较时展现相似基因座的物理共定位。此类基因座可以描述为已共享同线型。
“非人类动物”包括不是人的任何脊椎动物生物体。在一些实施例中,非人类动物是圆口类的鱼、硬骨鱼、软骨鱼(例如鲨鱼或鳐)、两栖动物、爬行动物、哺乳动物和鸟类。在一些实施例中,非人类哺乳动物是灵长类动物、山羊、绵羊、猪、狗、奶牛或啮齿动物。在一些实施例中,非人类动物是啮齿动物,例如大鼠或小鼠。
“核酸”包括并入或能够并入寡核苷酸链中的任何化合物和/或物质。在一些实施例中,“核酸”是通过磷酸二酯键并入或能够并入寡核苷酸链中的化合物和/或物质。如从上下文将清楚,在一些实施例中,“核酸”是指个别核酸残基(例如核苷酸和/或核苷);在一些实施例中,“核酸”是指包含个别核酸残基的寡核苷酸链。在一些实施例中,“核酸”是或包含RNA;在一些实施例中,“核酸”是或包含DNA。在一些实施例中,“核酸”是、包含一个或多个天然核酸残基或由一个或多个天然核酸残基组成。在一些实施例中,“核酸”是、包含一种或多种核酸类似物或由一种或多种核酸类似物组成。在一些实施例中,核酸类似物与“核酸”不同之处在于其不利用磷酸二酯主链。举例来说,在一些实施例中,“核酸”是、包含一个或多个“肽核酸”或由一个或多个“肽核酸”组成,所述肽核酸在所属领域中已知并且在主链中具有肽键而不是磷酸二酯键,被视为属于本发明的范围内。或者或另外,在一些实施例中,“核酸”具有一个或多个硫代磷酸酯和/或5'-N-亚磷酰胺键而非磷酸二酯键。在一些实施例中,“核酸”是、包含一个或多个天然核苷或由一个或多个天然核苷组成(例如腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)。在一些实施例中,“核酸”是、包含一个或多个核苷类似物或由一个或多个核苷类似物组成(例如2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-脱氮腺苷、7-脱氮鸟苷、8-氧代腺苷、8-氧代鸟苷、O(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、嵌入的碱基和其组合)。在一些实施例中,与天然核酸中的糖类相比,“核酸”包含一种或多种已修饰的糖(例如2'-氟核糖、核糖、2'-脱氧核苷、阿拉伯糖和己糖)。在一些实施例中,“核酸”具有编码功能基因产物(例如RNA或蛋白质)的核苷酸序列。在一些实施例中,“核酸”包括一个或多个内含子。在一些实施例中,“核酸”包括一个或多个外显子。在一些实施例中,“核酸”通过下述方式中的一种或多种来制备:从天然来源分离、通过基于互补模板的聚合进行的酶促合成(体内或体外)、在重组细胞或系统中进行的再生和化学合成。在一些实施例中,“核酸”具有至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000个或更多个残基的长度。在一些实施例中,“核酸”为单链的;在一些实施例中,“核酸”为双链的。在一些实施例中,“核酸”具有包含至少一个元件的核苷酸序列,所述元件编码多肽或是编码多肽的序列的补体。在一些实施例中,“核酸”具有酶促活性。
“可操作地连接”包括并置,其中所述组分的关系允许它们按它们的预定方式发挥功能。“可操作地连接”到编码序列的控制序列是按照使编码序列的表达在与控制序列相容的条件下实现的方式连接。"可操作地连接"序列包括与所关注基因邻接的表达控制序列和按照反式或在一定距离发挥作用以控制所关注基因的表达控制序列。术语“表达控制序列”包括影响与其相连的编码序列表达和加工所必需的聚核苷酸序列。“表达控制序列”包括适合的转录起始、终止、启动子和增强子序列;有效的RNA加工信号,例如剪接和聚腺苷酸化信号;使细胞质mRNA稳定的序列;增强翻译效率的序列(即Kozak共有序列);增强蛋白质稳定性的序列;以及需要时,增强蛋白分质泌的序列。此类控制序列的性质根据宿主生物体而异。举例来说,在原核生物中,此类控制序列通常包括启动子、核糖体结合位点和转录终止序列,而在真核生物中,此类控制序列典型地包括启动子和转录终止序列。术语"控制序列"旨在包括其存在对于表达和加工来说是必需的组分,并且还能够包括存在有利的其它组分,例如前导序列和融合搭配物序列。
“表型”包括性状,或者由细胞或生物体所显示的一类或一组性状。在一些实施例中,特定表型可能与特定等位基因或基因型相关。在一些实施例中,表型可以是离散的;在一些实施例中,表型可以是连续的。
“生理学条件”包括所属领域中已了解的含义,是指细胞或生物体据以存活和/或再生的条件。在一些实施例中,所述术语包括在自然界中对于生物体或细胞系统可能存在的外部或内部环境的条件。在一些实施例中,生理学条件是存在于人类或非人类动物体内的那些条件,尤其是存在于手术部位处和/或手术部位内的那些条件。生理学条件典型地包括例如20-40℃的温度范围、1个大气压、6-8的pH、1-20mM的葡萄糖浓度、大气水平的氧浓度,以及在地球上遇到的重力。在一些实施例中,将实验室条件操纵和/或维持在生理学条件下。在一些实施例中,生理学条件在生物体中遇到。
“多肽”包括任何聚合的氨基酸链。在一些实施例中,多肽具有自然界中存在的氨基酸序列。在一些实施例中,多肽具有自然界中不存在的氨基酸序列。在一些实施例中,多肽的氨基酸序列含有自然界中彼此分开存在的部分(即,来自两种或更多种不同生物体,例如人类和非人类部分)。在一些实施例中,多肽的氨基酸序列被工程改造,以便通过人工行为对其进行设计和/或制造。
“预防(Prevent)”或“预防(prevention)”疾病、病症和/或病状的发生,包括减少疾病、病症和/或病状发生的风险和/或延迟疾病、病症或病状的一个或多个特征或症状的发作。当疾病、病症或病状的发作已经被延迟预限定的时间段时,可以认为预防完成。
“参考物”包括与所关注的药剂、动物、群组、个体、群体、样品、序列或值比较所依据的标准或对照药剂、动物、群组、个体、群体、样品、序列或值。在一些实施例中,参考药剂、动物、群组、个体、群体、样品、序列或值的测试和/或测定基本上与所述药剂、动物、群组、个体、群体、样品、序列或值的测试或测定同时进行。在一些实施例中,参考药剂、动物、群组、个体、群体、样品、序列或值是任选地在有形媒体中体现的历史参考。在一些实施例中,参考可指对照。“参考”还包括“参考动物”。“参考动物”可以具有如本文所述的修饰、与本文所述不同的修饰或不具有修饰(即,野生型动物)。典型地,如所属领域的技术人员所理解,参考药剂、动物、群组、个体、群体、样品、序列或值是在与用于测定或表征所关注的药剂、动物(例如哺乳动物)、群组、个体、群体、样品、序列或值的条件相当的条件下测定或表征。
“响应”包括受试者病状由于治疗而发生或与治疗相关的任何有益的改变。此类改变病状的稳定(例如防止在缺乏治疗时会发生的恶化)、病状的症状改善和/或病状的治愈前景改良等。它可以指受试者的响应或神经元的响应。神经元或受试者响应可以根据多种多样的准则测量,包括临床准则和客观准则。检查受试者的运动系统可以包括检查力量、肌腱反射、浅表反射、肌肉块、协调、肌张力、移动异常、平稳性和步态中的一种或多种。用于评估响应的技术包括(但不限于)临床检查、拉伸屈曲(肌反射)、霍夫曼反射(Hoffmann'sreflex)和/或压力测试。用于评估对治疗的响应的方法和指导原则论述于Brodal,A.:与临床医学相关的神经解剖学(Neurological Anatomy in Relation to ClinicalMedicine),第2版,纽约,牛津大学出版社,1969;英国医学会(Medical Council of theU.K.):协助检查外周神经系统(Aids to the Examination of the Peripheral NervousSystem),Palo Alto,加利福尼亚州,Pendragon House,1978;Monrad-Krohn,G.H.,Refsum,S.:神经系统的临床检查(The Clinical Examination of the Nervous System)第12版,伦敦,H.K.Lewis&Co.,1964;以及Wolf,J.K.:节段型神经病学:检查和解释感觉和运动机能的指南(Segmental Neurology,A Guide to the Examination and Interpretation ofSensory and Motor Function),Baltimore,University Park Press,1981。可以任何适当方式选择确切响应准则,限制条件是当比较神经元和/或患者的群组时,待比较的群组是基于用于测定响应率的相同或类似准则来评估。所属领域的技术人员将能够选择适当准则。
如从上下文将理解,疾病、病症和/或病状的“风险”包含特定个体将产生疾病、病症和/或病状(例如放射损伤)的可能性。在一些实施例中,风险用百分比表示。在一些实施例中,风险是0、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90以及至多100%。在一些实施例中,风险是作为相对于与参考样品或一组参考样品有关的风险的风险表示。在一些实施例中,参考样品或一组参考样品具有已知的疾病、病症、病状和/或事件(例如放射损伤)的风险。在一些实施例中,参考样品或一组参考样品来自与特定个体相当的个体。在一些实施例中,相对风险是0、1、2、3、4、5、6、7、8、9、10或更大。
“基本上”包括展现所关注的特征或特性的总范围或程度或近似总范围或程度的定性条件。生物学领域的技术人员应理解生物学和化学现象很少(如果有的话)达到完全和/或进行到完全或者实现或避免绝对结果。因此,术语“基本上”在本文中用于捕获许多生物学和化学现象中所固有的潜在完全性缺乏。
“基本上同源”包括氨基酸或核酸序列之间的比较。如本领域普通技术人员将了解,如果两个序列在对应的位置上含有同源残基,则它们通常被认为是“基本上同源的”。同源残基可以是一致的残基。或者,同源残基可以是结构和/或功能特征适当相似的不一致残基。举例来说,如所属领域的技术人员众所周知,某些氨基酸典型地归类为“疏水性”或“亲水性”氨基酸,和/或具有“极性”或“非极性”侧链。一种氨基酸被同类型的另一种氨基酸取代通常可以被视为“同源”取代。典型的氨基酸分类汇总如下。
如所属领域中众所周知,氨基酸或核酸序列可以使用多种算法中的任意算法来进行比较,所述算法包括商业计算机程序中可获得的那些算法,例如用于核苷酸序列的BLASTN以及用于氨基酸序列的BLASTP、空隙BLAST和PSI-BLAST。示例性的此类程序描述于Altschul,S.F.等人,1990,分子生物学杂志(J.Mol.Biol.),215(3):403-410;Altschul,S.F.等人,1997,酶学方法(Methods in Enzymology);Altschul,S.F.等人,1997,核酸研究(Nucleic Acids Res.),25:3389-3402;Baxevanis,A.D.和B.F.F.Ouellette(编),生物信息学:分析基因和蛋白质的实务指南(Bioinformatics:A Practical Guide to theAnalysis of Genes and Proteins),Wiley,1998;以及Misener等人(编),生物信息学方法和方案(Bioinformatics Methods and Protocols)(分子生物学方法(Methods inMolecular Biology),第132卷),胡马纳出版社(Humana Press),1998。除鉴定同源序列之外,上述程序还典型地指出同源程度。在一些实施例中,如果两个序列的相应核苷酸的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多在相关的残基段上同源,那么这两个序列被认为是基本上同源的。在一些实施例中,相关段为整个序列。在一些实施例中,相关段具有至少9、10、11、12、13、14、15、16、17或更多个残基。在一些实施例中,相关段包括沿着整个序列的邻接残基。在一些实施例中,相关段包括沿着整个序列的不连续残基,例如通过多肽或其一部分的折叠构形而聚集在一起的不连续残基。在一些实施例中,相关段具有至少10、15、20、25、30、35、40、45、50或更多个残基。
“基本上一致”包括氨基酸或核酸序列之间的比较。如所属领域的技术人员将了解,如果两个序列在相应位置中含有一致残基,那么通常认为它们是“基本上一致的”。如所属领域中众所周知,可以使用多种算法中任一种来比较氨基酸或核酸序列,包括商业计算机程序中可获得的那些算法,例如用于核苷酸序列的BLASTN以及用于氨基酸序列的BLASTP、空隙BLAST和PSI-BLAST。示例性的此类程序描述于Altschul,S.F.等人,1990,分子生物学杂志,215(3):403-410;Altschul,S.F.等人,1997,酶学方法;Altschul,S.F.等人,1997,核酸研究,25:3389-3402;Baxevanis,A.D.和B.F.F.Ouellette(编),生物信息学:分析基因和蛋白质的实务指南,Wiley,1998;以及Misener等人(编),生物信息学方法和方案(分子生物学方法,第132卷),胡马纳出版社(Humana Press),1998。除鉴定一致序列之外,上述程序还典型地指出一致度。在一些实施例中,如果两个序列的相应残基中的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多在相关残基段上一致,那么认为其基本上一致。在一些实施例中,相关段为整个序列。在一些实施例中,相关段具有至少10、15、20、25、30、35、40、45、50或更多个残基。
“靶向载体”、“靶向构建体”或“核酸构建体”包括包含靶向区域的聚核苷酸分子。靶向区域包含与靶细胞、组织或动物中的序列一致或基本上一致并且能够通过同源重组使靶向构建体整合到细胞、组织或动物基因组内部的位置的序列。还包括使用位点特异性重组酶识别位点(例如loxP或Frt位点)靶向的靶向区域。在一些实施例中,如本文所述的靶向构建体进一步包含备受关注的核酸序列或基因(例如报告基因或同源或异源基因)、可选标记物、对照和或调控序列,以及编码重组酶或重组产生的蛋白质的其它核酸序列。在一些实施例中,靶向构建体可以完整或部分地包含所关注的基因,其中所关注的基因完整或部分地编码功能与内源序列所编码的蛋白质类似的多肽。在一些实施例中,靶向构筑体可以完整或部分地包含所关注的人源化基因,其中所关注的人源化基因完整或部分地编码功能与内源序列所编码的多肽类似的多肽。在一些实施例中,靶向构建体可以完整或部分地包含报告基因,其中所述报告基因编码使用所属领域中已知的技术容易鉴定和/或测量的多肽。
“转基因动物”、“转基因非人类动物”或“Tg+”包括任何非天然存在的非人类动物,其中非人类动物的一个或多个细胞完整或部分地含有编码所关注多肽的异源核酸和/或基因。在一些实施例中,异源核酸和/或基因通过引入前驱细胞中而直接或间接引入细胞中,这是借助于有意的遗传操纵,例如通过显微注射或通过重组病毒感染。术语遗传操纵不包括经典的育种技术,而是关于重组DNA分子的引入。这种分子可以整合到染色体中,或其可以是染色体外复制的DNA。术语“Tg+”包括对于异源核酸和/或基因来说为杂合或纯合的动物,和/或具有异源核酸和/或基因的单个或多个拷贝的动物。
“治疗(Treatment)”、“治疗(Treat)”或“治疗(Treating)”包括药物(例如治疗候选物)的任何施用部分或完全地缓解、改善、减轻、抑制、延迟特定疾病、病症和/或病状的发作、降低其严重程度,且/或减少特定疾病、病症和/或病状的一种或多种症状、特征和/或病因的发生。在一些实施例中,可以向未展现相关疾病、病症和/或病状的征象的受试者和/或仅展现疾病、病症和/或病状的早期征象的受试者施用此类疗法。或者或另外,在一些实施例中,可以向展现相关疾病、病症和/或病状的一种或多种已明确征象的受试者施用疗法。在一些实施例中,治疗可以针对已诊断患有相关疾病、病症和/或病状的受试者。在一些实施例中,治疗可以针对已知具有一种或多种易感因素的受试者,所述易感因素在统计学上与相关疾病、病症和/或病状的发展风险增加相关。
“变异体”包括与参考实体的结构明显一致、但相较于参考实体在结构上与参考实体差异在于一个或多个化学部分的存在或含量的实体。在许多实施例中,“变异体”在功能上也与其参考实体不同。一般来说,一种特定实体是否被正确视为参考实体的“变异体”是基于其与参考实体的结构一致的程度。如所属领域的技术人员将了解,任何生物学或化学参考实体具有某些特征性结构元件。根据定义,“变异体”是共享一个或多个此类特征性结构元件的不同化学实体。仅举几个例子,小分子可以具有特征性核心结构元件(例如巨环核心)和/或一个或多个特征性侧接部分,因此小分子的变异体是共享核心结构元件和特征性侧接部分、但其它侧接部分和/或存在于核心内部的键类型(单键相对于双键、E相对于Z等)不同的变异体,多肽的特征性序列元件可以包含在线性或三维空间中相对于彼此具有指定位置且/或促成特定生物功能的多个氨基酸,核酸的特征性序列元件可以包含在线性或三维空间中相对于彼此具有指定位置的多个核苷酸残基。举例来说,“变异型多肽”可以由于氨基酸序列中的一个或多个差异和/或共价连接到多肽主链的化学部分(例如碳水化合物、脂质等)中的一个或多个差异而不同于参考多肽。在一些实施例中,“变异型多肽”展示了与参考多肽至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%或99%的总体序列一致性。或者或另外,在一些实施例中,“变异型多肽”不与参考多肽共享至少一个特征性序列元件。在一些实施例中,参考多肽具有一种或多种生物活性。在一些实施例中,“变异型多肽”共享参考多肽的一种或多种生物活性。在一些实施例中,“变异型多肽”缺乏参考多肽的一种或多种生物活性。在一些实施例中,“变异型多肽”展示了一种或多种生物活性的水平相较于参考多肽降低。在许多实施例中,如果所关注多肽的氨基酸序列与亲本多肽的氨基酸序列一致、但在特定位置有少数序列变化,那么所关注多肽被视为亲本或参考多肽的“变异体”。典型地,相较于亲本,被取代的变异体残基少于20%、15%、10%、9%、8%、7%、6%、5%、4%、3%或2%。在一些实施例中,与亲代相比,“变异体”具有10、9、8、7、6、5、4、3、2或1个被取代的残基。通常,“变异体”具有极少数目(例如少于5个、4个、3个、2个或1个)个被取代的功能残基(即,参与特定生物学活性的残基)。此外,相较于亲代,“变异体”典型地具有不超过5、4、3、2或1个添加或缺失,并且通常不具有添加或缺失。此外,任何添加或缺失典型地少于约25、约20、约19、约18、约17、约16、约15、约14、约13、约10、约9、约8、约7、约6个,并且通常少于约5、约4、约3或约2个残基。在一些实施例中,亲本或参考多肽是在自然界中发现的多肽。如所属领域的技术人员将理解,所关注的特定多肽的多个变异体通常可以在自然界中发现,尤其当所关注的多肽是传染媒介物多肽时。在一些实施例中,非人类动物将包含用于靶向插入异源六核苷酸扩增序列的核酸构建体的变异体。作为非限制性实例,此类核酸构建体可以包含5'第一异源六核苷酸侧接序列、阐述为SEQID NO:1的六核苷酸序列的n个重复序列、3'第二异源六核苷酸侧接序列,以及任选地,抗药性报告基因,所述报告基因优选侧接重组酶识别序列。如实例1所示,靶向插入所产生的动物可以在内源基因座包含核酸构建体的变异体,例如其中变异体包含阐述为SEQ ID NO:1的六核苷酸序列的少于n个重复且/或缺乏抗药基因,参见例如图1B和1C。因此,本文所包括的序列的变异体包括与参考亲本序列基本上一致、但缺乏一个或多个重复和/或抗药基因的序列。
“载体”包括能够输送与其结合的另一核酸的核酸分子。在一些实施例中,载体能够使与其连接的核酸在宿主细胞(例如真核和/或原核细胞)中实现染色体外复制和/或表达。能够引导可操作地连接的基因表达的载体在本文中称为“表达载体”。
“野生型”包括具有如在自然界中、在“正常”(与突变、病变、改变等对比)状态或背景下发现的结构和/或活性的实体。所属领域的技术人员将了解,野生型基因和多肽通常以多种不同形式(例如等位基因)存在。
具体实施方式
提供了在内源C9ORF72基因座中插有异源六核苷酸重复扩增序列的非人类动物。在一些实施例中,本文所述的非人类动物对于如本文所述的已修饰C9ORF72基因座来说是杂合的。在一些实施例中,如本文所述的非人类动物包含第一已修饰C9orf72基因座和第二已修饰C9orf72基因座,其中所述第一和第二基因座是不同的。在一些实施例中,本文所述的非人类动物对于如本文所述的已修饰C9ORF72基因座来说是纯合的。在一些实施例中,本文所述的非人类动物由于存在异源六核苷酸重复扩增序列而产生ALS和/或FTD类似的疾病。
在下面的章节中详细地描述本发明的各个方面。章节的使用不意味着限制本发明。每一个章节可适用于本发明的任何方面。在本申请中,除非另外说明,否则“或”的使用意味着“和/或”。
C9ORF72
肌萎缩侧索硬化(ALS),也称为楼格瑞病,是最常见的成年发作型麻痹病症,其特征是上和/或下运动神经元损失。全美国发生ALS的个体多达20,000位,每年出现约5,000个新病例。额颞痴呆(FTD),最初称为皮克病(根据医师阿诺德·皮克(Arnold Pick)命名),是脑额叶或颞叶出现进行性细胞退化而引起的一组病症。据报道,FTD在所有痴呆病例中占10-15%。介于人类C9ORF72基因的(和任选地跨越)外显子1a与1b(两种非编码外显子)之间的六核苷酸重复扩增序列已经与ALS和FTD均相关(DeJesus-Hernandez,M.等人,2011,神经元(Neuron)72:245-256;Renton,A.E.等人,2011,神经元72:257-268;Majounie,E.等人,2012,柳叶刀·神经病学(Lancet Neurol.)11:323-330;Waite,A.J.等人,2014,老龄神经生物学(Neurobiol.Aging)35:1779.e5-1779.e13)。据估计,GGGGCC(SEQ ID NO:1)六核苷酸重复扩增序列在家族性和许多非家族性ALS病例中占约50%。其存在于约25%的家族性FTD病例和约8%的偶发例中。
已报告与C9ORF72中的六核苷酸重复扩增序列相关的许多病理学方面,例如RNA团簇的形成与重复长度相关、特定RNA结合蛋白的隔离,以及二肽重复蛋白的聚积和聚集(例如评述于Stepto,A.等人,2014,神经病理学报(Acta Neuropathol.)127:377-389;还参见Almeida,S.等人,2013,神经病理学报126:385-399;Bieniek,K.F.等人,2014,美国医学会杂志·神经病学(JAMA Neurol.)71(6):775-781;van Blitterswijk,M.等人,2014,神经变性分子学(Mol.Neurodegen.)9:38,第10页)。已产生的含有异源六核苷酸重复扩增序列(包含六核苷酸序列(GGGGCC;SEQ ID NO:1)的66个重复)的基因敲入小鼠在它们的神经元中展现RNA团簇和二肽蛋白聚集体。这些小鼠在6月龄时展示了皮质神经元损失并且展现了行为和运动缺陷(Chew,J等人,2015年5月14日,科学Pii:aaa9344)。然而,此类重复扩增引起疾病的机理(是否通过毒性功能丧失或获得)仍然不清楚。另外,六核苷酸重复扩增序列中较低数目个重复对ALS/FTD的贡献也未知。
尽管已报道C9ORF72可调控核内体运输(Farg,M.A.等人,2014,人类分子基因学(Human Mol.Gen.)23(13):3579-3595),但C9ORF72的许多细胞功能仍然未知。的确,C9ORF72是编码功能未知的未表征蛋白质的基因。尽管对周围C9ORF72缺乏了解,但是已经开发出ALS和/或FTD的若干动物模型,包括工程化细胞株(Roberson,E.D.,2012,神经学年鉴(Ann.Neurol.)72(6):837-849;Panda,S.K.等人,2013,遗传学(Genetics)195:703-715;Suzuki,N.等人,2013,自然·神经科学(Nature Neurosci)16(12):1725-1728;Xu,Z.等人,2013,美国国家科学院院刊(Proc.Nat.Acad.Sci.U.S.A.)110(19):7778-7783;Hukema,R.K.等人,2014,神经病理学通讯学报(Acta Neuropathol.Comm.)2:166,第4页)。使用含有异源六核苷酸重复扩增序列(包含80个GGGGCC重复,可操作地与荧光报告体连接并且受到四环素响应元件的控制)而无任何周围C9orf72序列的转基因小鼠品系的另一个报道证明神经元细胞质包涵体类似于ALS-FTD患者中所见的那些物质,这表明六核苷酸GGGGCC序列的重复扩增本身可能会导致疾病(Hukema,R.K.等人,2014,神经病理学通讯学报2:166,第4页)。这些小鼠已经用于确立CNS细胞的初始C9orf72表达谱并且对与重复扩增有关的作用机理提供了一些了解;然而,构建体设计能够影响所得转基因动物的表型(参见例如Muller,U.,1999,发育机理(Mech.Develop.)81:3-21)。举例来说,含有诱导型GGGGCC重复的转基因小鼠品系(Hukema,2014,同上)被设计为不含人类侧接序列,原因可能是此类周围序列被认为影响重复序列翻译的事实。因此,利用C9ORF72介导的生物学的此类体内系统对于治疗应用来说是不完整的。
C9ORF72和六核苷酸重复扩增序列
所属领域(例如Koppers等人,神经学年鉴(2015);78:426-438;Atkinson等人,神经病理学通讯学报(2015)3:59)中已报道了并且图1A中也描绘了小鼠C9ORF72转录物变异体。所报道的三种小鼠C9ORF72转录物变异体的基因组信息还可以在Ensembl网站、在ENSMUST00000108127(V1)、ENSMUST00000108126(V2)和ENSMUST00000084724(V3)名称下获得。表2中阐明了示例性非人类(例如啮齿动物)C9ORF72mRNA和氨基酸序列。对于mRNA序列来说,圆括号内所含的粗体字表示编码序列并且连续外显子在指出时用交替的小写字母和大写字母分开。对于氨基酸序列来说,成熟多肽序列在指出时用粗体。
人类C9ORF72转录物变异体在所属领域中已知。一种人类C9ORF72转录物变异体的中心和3'编码区缺乏多个外显子,并且其3'端外显子延伸超过变异体3中所用的剪接位点(参见下文),从而产生新颖的3'非翻译区(UTR)(相较于变异体3)。这种变异体编码的多肽明显较短并且其C端氨基酸不同于其它两种变异体所编码的氨基酸。这种变异体的mRNA和氨基酸序列分别可以GenBank寄存编号NM_145005.6和NP_659442.2找到,并且以引用的方式并入本文中。NM_145005.6和NP_659442.2的序列分别阐述为SEQ ID NO:10和SEQ ID NO:11。第二人类C9ORF72转录物变异体(2)的5'非翻译区(UTR)不同于变异体3。这种变异体的mRNA和氨基酸序列分别可以GenBank寄存编号NM_018325.4和NP_060795.1找到,并且以引用的方式并入本文中。NM_018325.4和NP_060795.1的序列分别阐述为SEQ ID NO:12和SEQID NO:13。第三人类C9ORF72转录物变异体(3)含有所报道的三种变异体中的最长序列并且编码更长的同功异型物。这种变异体的mRNA和氨基酸序列分别可以GenBank寄存编号NM_001256054.2和NP_001242983.1找到,并且以引用的方式并入本文中。NM_001256054.2和NP_001242983.1的序列分别阐述为SEQ ID NO:14和SEQ ID NO:15。变异体2和3编码相同的蛋白质。
六核苷酸重复扩增序列通常是包含包含阐述为SEQ ID NO:1的六核苷酸序列GGGGCC的至少一个情形(例如一个重复)的核苷酸序列。为了插入内源非人类内源非人类C9orf72基因座中的目的,异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少一个情形(重复)和优选超过一个情形(重复)并且可以与跨越(并且任选地包括)人类‘染色体9开放阅读框架72’(C9orf72)的非编码外显子1a和1b的基因组核酸序列或其一部分一致或基本上一致。异源六核苷酸扩增序列的非限制性实例包括阐述为SEQ IDNO:1、SEQ IDNO:2(包含GGGGCC六核苷酸序列的三个重复)和SEQ ID NO:3(包含GGGGCC六核苷酸序列的100个重复)的序列。
表2
---------------------------------------------------------------------
小家鼠C9orf72mRNA(NM_001081343;SEQ ID NO:16)
gtgtccggggcggggcggtcccggggcggggcccggagcgggctgcggttgcggtccctgcgccggcggtgaaggcgcagcagcggcgagtggCTATTGCAAGCGTTCGGATAATGTGAGACCTGGAATGCAGTGAGACCTGGGATGCAGGG(ATGTCGACTATCTGCCCCCCACCATCTCCTGCTGTTGCCAAGACAGAGATTGCTTTAAGTGGTGAATCACCCTTGTTGGCGGCTACCTTTGCTTACTGGGATAATATTCTTGGTCCTAGAGTAAGGCATATTTGGGCTCCAAAGACAGACCAAGTGCTTCTCAGTGATGGAGAAATAACTTTTCTTGCCAACCACACTCTAAATGGAGAAATTCTTCGAAATGCAGAGAGTGGGGCTATAGATGTAAAATTTTTTGTCTTATCTGAAAAAGGGGTAATTATTGTTTCATTAATCTTCGACGGAAACTGGAATGGAGATCGGAGCACTTATGGACTATCAATTATACTGCCGCAGACAGAGCTGAGCTTCTACCTCCCACTTCACAGAGTGTGTGTTGACAGGCTAACACACATTATTCGAAAAGGAAGAATATGGATGCATAAGgaaagacaagaaaatgtccagaaaattgtcttggaaggcacagagaggatggaagatcagGGTCAGAGTATCATTCCCATGCTTACTGGGGAAGTCATTCCTGTAATGGAGCTGCTTGCATCTATGAAATCCCACAGTGTTCCTGAAGACATTGATatagctgatacagtgctcaatgatgatgacattggtgacagctgtcacgaaggctttcttctcaaTGCCATCAGCTCACACCTGCAGACCTGTGGCTGTTCCGTTGTAGTTGGCAGCAGTGCAGAGAAAGTAAATAAGatagtaagaacgctgtgcctttttctgacaccagcagagaggaaatgctccaggctgtgtgaagcagaatcgtcctttaagtacgaatcgggactctttgtgcaaggcttgctaaagGATGCAACAGGCAGTTTTGTCCTACCCTTCCGGCAAGTTATGTATGCCCCGTACCCCACCACGCACATTGATGTGGATGTCAACACTGTCAAGCAGATGCCACCGTGTCATGAACATATTTATAATCAACGCAGATACATGAGGTCAGAGCTGACAGCCTTCTGGAGGGCAACTTCAGAAGAGGACATGGCGCAGGACACCATCATCTACACAGATGAGAGCTTCACTCCTGATTTgaatattttccaagatgtcttacacagagacactctagtgaaagccttcctggatcagGTCTTCCATTTGAAGCCTGGCCTGTCTCTCAGGAGTACTTTCCTTGCACAGTTCCTCCTCATTCTTCACAGAAAAGCCTTGACACTAATCAAGTACATCGAGGATGATACgcagaaggggaaaaagccctttaagtctcttcggaacctgaagatagatcttgatttaacagcagagggcgatcttaacataataatggctctagctgagaaaattaagccaggcctacactctttcatctttgggagacctttctacactagtgtacaagaacgtgatgttctaatgaccttttga)ccgtgtggtttgctgtgtctgtctcttcacagtcacacctgctgttacagtgtctcagcagtgtgtgggcacatccttcctcccgagtcctgctgcaggacagggtacactacacttgtcagtagaagtctgtacctgatgtcaggtgcatcgttacagtgaatgactcttcctagaatagatgtactcttttagggccttatgtttacaattatcctaagtactattgctgtcttttaaagatatgaatgatggaatatacacttgaccataactgctgattggttttttgttttgttttgtttgttttcttggaaacttatgattcctggtttacatgtaccacactgaaaccctcgttagctttacagataaagtgtgagttgacttcctgcccctctgtgttctgtggtatgtccgattacttctgccacagctaaacattagagcatttaaagtttgcagttcctcagaaaggaacttagtctgactacagattagttcttgagagaagacactgatagggcagagctgtaggtgaaatcagttgttagcccttcctttatagacgtagtccttcagattcggtctgtacagaaatgccgaggggtcatgcatgggccctgagtatcgtgacctgtgacaagttttttgttggtttattgtagttctgtcaaagaaagtggcatttgtttttataattgttgccaacttttaaggttaattttcattatttttgagccgaattaaaatgcgcacctcctgtgcctttcccaatcttggaaaatataatttcttggcagagggtcagatttcagggcccagtcactttcatctgaccaccctttgcacggctgccgtgtgcctggcttagattagaagtccttgttaagtatgtcagagtacattcgctgataagatctttgaagagcagggaagcgtcttgcctctttcctttggtttctgcctgtactctggtgtttcccgtgtcacctgcatcataggaacagcagagaaatctgacccagtgctatttttctaggtgctactatggcaaactcaagtggtctgtttctgttcctgtaacgttcgactatctcgctagctgtgaagtactgattagtggagttctgtgcaacagcagtgtaggagtatacacaaacacaaatatgtgtttctatttaaaactgtggacttagcataaaaagggagaatatatttattttttacaaaagggataaaaatgggccccgttcctcacccaccagatttagcgagaaaaagctttctattctgaaaggtcacggtggctttggcattacaaatcagaacaacacacactgaccatgatggcttgtgaactaactgcaaggcactccgtcatggtaagcgagtaggtcccacctcctagtgtgccgctcattgctttacacagtagaatcttatttgagtgctaattgttgtctttgctgctttactgtgttgttatagaaaatgtaagctgtacagtgaataagttattgaagcatgtgtaaacactgttatatatcttttctcctagatggggaattttgaataaaatacctttgaaattctgtgt
小家鼠C9orf72氨基酸(NP_001074812;SEQ ID NO:17)
MSTICPPPSPAVAKTEIALSGESPLLAATFAYWDNILGPRVRHIWAPKTDQVLLSDGEITFLANHTLNGEILRNAESGAIDVKFFVLSEKGVIIVSLIFDGNWNGDRSTYGLSIILPQTELSFYLPLHRVCVDRLTHIIRKGRIWMHKERQENVQKIVLEGTERMEDQGQSIIPMLTGEVIPVMELLASMKSHSVPEDIDIADTVLNDDDIGDSCHEGFLLNAISSHLQTCGCSVVVGSSAEKVNKIVRTLCLFLTPAERKCSRLCEAESSFKYESGLFVQGLLKDATGSFVLPFRQVMYAPYPTTHIDVDVNTVKQMPPCHEHIYNQRRYMRSELTAFWRATSEEDMAQDTIIYTDESFTPDLNIFQDVLHRDTLVKAFLDQVFHLKPGLSLRSTFLAQFLLILHRKALTLIKYIEDDTQKGKKPFKSLRNLKIDLDLTAEGDLNIIMALAEKIKPGLHSFIFGRPFYTSVQERDVLMTF
褐家鼠C9orf72mRNA(NM_001007702;SEQ ID NO:18)
CGTTTGTAGTGTCAGCCATCCCAATTGCCTGTTCCTTCTCTGTGGGAGTGGTGTCTAGACAGTCCAGGCAGGGTATGCTAGGCAGGTGCGTTTTGGTTGCCTCAGATCGCAACTTGACTCCATAACGGTGACCAAAGACAAAAGAAGGAAACCAGATTAAAAAGAACCGGACACAGACCCCTGCAGAATCTGGAGCGGCCGTGGTTGGGGGCGGGGCTACGACGGGGCGGACTCGGGGGCGTGGGAGGGCGGGGCCGGGGCGGGGCCCGGAGCCGGCTGCGGTTGCGGTCCCTGCGCCGGCGGTGAAGGCGCAGCGGCGGCGAGTGGCTATTGCAAGCGTTTGGATAATGTGAGACCTGGGATGCAGGG(ATGTCGACTATCTGCCCCCCACCATCTCCTGCTGTTGCCAAGACAGAGATTGCTTTAAGTGGTGAATCACCCTTGTTGGCGGCTACCTTTGCTTACTGGGATAATATTCTTGGTCCTAGAGTAAGGCACATTTGGGCTCCAAAGACAGACCAAGTACTCCTCAGTGATGGAGAAATCACTTTTCTTGCCAACCACACTCTGAATGGAGAAATTCTTCGGAATGCGGAGAGTGGGGCAATAGATGTAAAGTTTTTTGTCTTATCTGAAAAGGGCGTCATTATTGTTTCATTAATCTTCGACGGGAACTGGAACGGAGATCGGAGCACTTACGGACTATCAATTATACTGCCGCAGACGGAGCTGAGTTTCTACCTCCCACTGCACAGAGTGTGTGTTGACAGGCTAACGCACATCATTCGAAAAGGAAGGATATGGATGCACAAGGAAAGACAAGAAAATGTCCAGAAAATTGTCTTGGAAGGCACCGAGAGGATGGAAGATCAGGGTCAGAGTATCATCCCTATGCTTACTGGGGAGGTCATCCCTGTGATGGAGCTGCTTGCGTCTATGAGATCACACAGTGTTCCTGAAGACCTCGATATAGCTGATACAGTACTCAATGATGATGACATTGGTGACAGCTGTCATGAAGGCTTTCTTCTCAATGCCATCAGCTCACATCTGCAGACCTGCGGCTGTTCTGTGGTGGTAGGCAGCAGTGCAGAGAAAGTAAATAAGATAGTAAGAACACTGTGCCTTTTTCTGACACCAGCAGAGAGGAAGTGCTCCAGGCTGTGTGAAGCCGAATCGTCCTTTAAATACGAATCTGGACTCTTTGTACAAGGCTTGCTAAAGGATGCGACTGGCAGTTTTGTACTACCTTTCCGGCAAGTTATGTATGCCCCTTATCCCACCACACACATCGATGTGGATGTCAACACTGTCAAGCAGATGCCACCGTGTCATGAACATATTTATAATCAACGCAGATACATGAGGTCAGAGCTGACAGCCTTCTGGAGGGCAACTTCAGAAGAGGACATGGCTCAGGACACCATCATCTACACAGATGAGAGCTTCACTCCTGATTTGAATATTTTCCAAGATGTCTTACACAGAGACACTCTAGTGAAAGCCTTTCTGGATCAGGTCTTCCATTTGAAGCCTGGCCTGTCTCTCAGGAGTACTTTCCTTGCACAGTTCCTCCTCATTCTTCACAGAAAAGCCTTGACACTAATCAAGTACATAGAGGATGACACGCAGAAGGGGAAAAAGCCCTTTAAGTCTCTTCGGAACCTGAAGATAGATCTTGATTTAACAGCAGAGGGCGACCTTAACATAATAATGGCTCTAGCTGAGAAAATTAAGCCAGGCCTACACTCTTTCATCTTCGGGAGACCTTTCTACACTAGTGTCCAAGAACGTGATGTTCTAATGACTTTTTAA)ACATGTGGTTTGCTCCGTGTGTCTCATGACAGTCACACTTGCTGTTACAGTGTCTCAGCGCTTTGGACACATCCTTCCTCCAGGGTCCTGCCGCAGGACACGTTACACTACACTTGTCAGTAGAGGTCTGTACCAGATGTCAGGTACATCGTTGTAGTGAATGTCTCTTTTCCTAGACTAGATGTACCCTCGTAGGGACTTATGTTTACAACCCTCCTAAGTACTAGTGCTGTCTTGTAAGGATACGAATGAAGGGATGTAAACTTCACCACAACTGCTGGTTGGTTTTGTTGTTTTTGTTTTTTGAAACTTATAATTCATGGTTTACATGCATCACACTGAAACCCTAGTTAGCTTTTTACAGGTAAGCTGTGAGTTGACTGCCTGTCCCTGTGTTCTCTGGCCTGTACGATCTGTGGCGTGTAGGATCACTTTTGCAACAACTAAAAACTAAAGCACTTTGTTTGCAGTTCTACAGAAAGCAACTTAGTCTGTCTGCAGATTCGTTTTTGAAAGAAGACATGAGAAAGCGGAGTTTTAGGTGAAGTCAGTTGTTGGATCTTCCTTTATAGACTTAGTCCTTTAGATGTGGTCTGTATAGACATGCCCAACCATCATGCATGGGCACTGAATATCGTGAACTGTGGTATGCTTTTTGTTGGTTTATTGTACTTCTGTCAAAGAAAGTGGCATTGGTTTTTATAATTGTTGCCAAGTTTTAAGGTTAATTTTCATTATTTTTGAGCCAAATTAAAATGTGCACCTCCTGTGCCTTTCCCAATCTTGGAAAATATAATTTCTTGGCAGAAGGTCAGATTTCAGGGCCCAGTCACTTTCGTCTGACTTCCCTTTGCACAGTCCGCCATGGGCCTGGCTTAGAAGTTCTTGTAAACTATGCCAGAGAGTACATTCGCTGATAAAATCTTCTTTGCAGAGCAGGAGAGCTTCTTGCCTCTTTCCTTTCATTTCTGCCTGGACTTTGGTGTTCTCCACGTTCCCTGCATCCTAAGGACAGCAGGAGAACTCTGACCCCAGTGCTATTTCTCTAGGTGCTATTGTGGCAAACTCAAGCGGTCCGTCTCTGTCCCTGTAACGTTCGTACCTTGCTGGCTGTGAAGTACTGACTGGTAAAGCTCCGTGCTACAGCAGTGTAGGGTATACACAAACACAAGTAAGTGTTTTATTTAAAACTGTGGACTTAGCATAAAAAGGGAGACTATATTTATTTTTTACAAAAGGGATAAAAATGGAACCCTTTCCTCACCCACCAGATTTAGTCAGAAAAAAACATTCTATTCTGAAAGGTCACAGTGGTTTTGACATGACACATCAGAACAACGCACACTGTCCATGATGGCTTATGAACTCCAAGTCACTCCATCATGGTAAATGGGTAGATCCCTCCTTCTAGTGTGCCACACCATTGCTTCCCACAGTAGAATCTTATTTAAGTGCTAAGTGTTGTCTCTGCTGGTTTACTCTGTTGTTTTAGAGAATGTAAGTTGTATAGTGAATAAGTTATTGAAGCATGTGTAAACACTGTTATACATCTTTTCTCCTAGATGGGGAATTTGGAATAAAATACCTTTAAAATTCAAAAAAAAAAAAAAAAAAAAAAAA
褐家鼠C9orf72氨基酸(NP_001007703;SEQ ID NO:19)
MSTICPPPSPAVAKTEIALSGESPLLAATFAYWDNILGPRVRHIWAPKTDQVLLSDGEITFLANHTLNGEILRNAESGAIDVKFFVLSEKGVIIVSLIFDGNWNGDRSTYGLSIILPQTELSFYLPLHRVCVDRLTHIIRKGRIWMHKERQENVQKIVLEGTERMEDQGQSIIPMLTGEVIPVMELLASMRSHSVPEDLDIADTVLNDDDIGDSCHEGFLLNAISSHLQTCGCSVVVGSSAEKVNKIVRTLCLFLTPAERKCSRLCEAESSFKYESGLFVQGLLKDATGSFVLPFRQVMYAPYPTTHIDVDVNTVKQMPPCHEHIYNQRRYMRSELTAFWRATSEEDMAQDTIIYTDESFTPDLNIFQDVLHRDTLVKAFLDQVFHLKPGLSLRSTFLAQFLLILHRKALTLIKYIEDDTQKGKKPFKSLRNLKIDLDLTAEGDLNIIMALAEKIKPGLHSFIFGRPFYTSVQERDVLMTF
靶向C9ORF72的载体和C9ORF72基因座中插有异源六核苷酸重复扩增序列的非人类动物的产生
本文提供用于产生非人类动物的靶向载体或靶向构建体,所述非人类动物如本文所述在内源C9ORF72基因座中插有异源六核苷酸扩增序列。
A.大型靶向载体
在除单细胞阶段胚胎之外的细胞中,可以使用“大型靶向载体”或“LTVEC”作为靶向载体,包括包含同源臂的靶向载体,所述同源臂对应于并且来源于比希望在细胞中进行同源重组的其它方法典型使用的核酸序列更大的核酸序列。LTVEC还包括包含核酸插入序列的靶向载体,所述核酸插入序列具有比希望在细胞中进行同源重组的其它方法典型使用的核酸序列更大。举例来说,LTVEC使得修饰大基因座成为可能,所述大基因座由于它们的尺寸局限而无法被基于传统质体的靶向载体所容纳。举例来说,靶向基因座可以是(即,5'和3'同源臂可以对应于使用常规方法无法靶向的细胞基因座,或在缺乏核酸酶剂(例如Cas蛋白)诱导切口或双链断裂的情况下只能不正确地靶向或只能以明显较低效率靶向的细胞基因座。
靶向载体包括同源臂。如果靶向载体还包含核酸插入序列,那么同源臂可以侧接核酸插入序列。为了便于参考,同源臂在本文中称为5'和3'(即,上游和下游)同源臂。这个术语是指同源臂相对于外源修复模板内的核酸插入序列的相对位置。5'和3'同源臂对应于所关注的基因组区域内的区域,其在本文中分别称为“5'靶序列”和“3'靶序列”。
当这两个区域彼此共享足够水平的序列一致性以充当同源重组反应的底物时,同源臂和靶序列彼此“相对应”或“对应”。术语“同源”包括与对应序列一致或共享序列一致性的DNA序列。既定靶序列与外源修复模板中所发现的对应同源臂之间的序列一致性可以是允许同源重组发生的任何程度的序列一致性。举例来说,外源修复模板的同源臂(或其片段)与靶序列(或其片段)所共享的序列一致性的量可以是至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列一致性,以便序列经历同源重组。同源臂与对应靶序列之间的对应同源区域可以具有足以促进同源重组的任何长度。同源臂可以是对称的(每个长度尺寸大约相同),或它们可以是不对称的(一个长于另一个)。
同源臂可以对应于细胞原生基因座(例如靶向基因座)。或者,举例来说,其可以对应于整合到细胞基因组中的DNA异源或外源区段的区域,包括例如DNA的转基因、表达盒或异源或外源区域。或者,靶向载体的同源臂可以对应于酵母人工染色体(YAC)、细菌人工染色体(BAC)、人类人工染色体的区域,或适当宿主细胞中所含的任何其它工程化区域。再者,靶向载体的同源臂可以对应于或来源于BAC文库、粘质体文库或P1噬菌体文库的区域,或可以来源于合成DNA。
LTVEC的实例包括来源于细菌人工染色体(BAC)、人类人工染色体或酵母人工染色体(YAC)的载体。LTVEC和其制备方法的非限制性实例描述于例如美国专利第6,586,251号;第6,596,541号;和第7,105,348号;以及WO 2002/036789中,其中的每一者以全文引用的方式并入本文中用于所有目的。LTVEC可以呈线性形式或呈圆形形式。
LTVEC可以具有任何长度且典型地具有至少10kb的长度。举例来说,LTVEC可以是约50kb到约500kb、约50kb到约75kb、约75kb到约100kb、约100kb到约125kb、约125kb到约150kb、约150kb到约175kb、约175kb到约200kb、约200kb到约225kb、约225kb到约250kb、约250kb到约275kb、约275kb到约300kb、约300kb到约325kb、约325kb到约350kb、约350kb到约375kb、约375kb到约400kb、约400kb到约425kb、约425kb到约450kb、约450kb到约475kb,或约475kb到约500kb。或者,LTVEC可以是至少10kb、至少15kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少150kb、至少200kb、至少250kb、至少300kb、至少350kb、至少400kb、至少450kb,或至少500kb或更大。LTVEC尺寸可以太大,以便能够通过常规分析(例如DNA印迹法(southern blotting)和长程(例如1kb到5kb)PCR)筛选靶向事件。
5'同源臂和3'同源臂在LTVEC中的总和典型地是至少10kb。举例来说,5'同源臂可以在约5kb到约150kb范围内和/或3'同源臂可以在约5kb到约150kb范围内。每个同源臂可以是例如约5kb到约10kb、约10kb到约20kb、约20kb到约30kb、约30kb到约40kb、约40kb到约50kb、约50kb到约60kb、约60kb到约70kb、约70kb到约80kb、约80kb到约90kb、约90kb到约100kb、约100kb到约110kb、约110kb到约120kb、约120kb到约130kb、约130kb到约140kb、约140kb到约150kb、约150kb到约160kb、约160kb到约170kb、约170kb到约180kb、约180kb到约190kb,或约190kb到约200kb。5'同源臂和3'同源臂的总和可以是例如约10kb到约20kb、约20kb到约30kb、约30kb到约40kb、约40kb到约50kb、约50kb到约60kb、约60kb到约70kb、约70kb到约80kb、约80kb到约90kb、约90kb到约100kb、约100kb到约110kb、约110kb到约120kb、约120kb到约130kb、约130kb到约140kb、约140kb到约150kb、约150kb到约160kb、约160kb到约170kb、约170kb到约180kb、约180kb到约190kb、约190kb到约200kb、约200kb到约250kb、约250kb到约300kb、约300kb到约350kb,或约350kb到约400kb。或者,每个同源臂可以是至少5kb、至少10kb、至少15kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少110kb、至少120kb、至少130kb、至少140kb、至少150kb、至少160kb、至少170kb、至少180kb、至少190kb或至少200kb。同样,5'同源臂和3'同源臂的总和可以是至少10kb、至少15kb、至少20kb、至少30kb、至少40kb、至少50kb、至少60kb、至少70kb、至少80kb、至少90kb、至少100kb、至少110kb、至少120kb、至少130kb、至少140kb、至少150kb、至少160kb、至少170kb、至少180kb、至少190kb、至少200kb、至少250kb、至少300kb、至少350kb或至少400kb。
LTVEC可以包含核酸插入序列,所述核酸插入序列具有比希望在细胞中进行同源重组的其它方法典型使用的核酸序列更大的核酸序列。举例来说,LTVEC可以包含范围为约1kb到约5kb、约5kb到约10kb、约10kb到约20kb、约20kb到约40kb、约40kb到约60kb、约60kb到约80kb、约80kb到约100kb、约100kb到约150kb、约150kb到约200kb、约200kb到约250kb、约250kb到约300kb、约300kb到约350kb、约350kb到约400kb、约400kb到约450kb、约450kb到约500kb或更大的核酸插入序列。或者,核酸插入序列可以是至少1kb、至少5kb、至少10kb、至少20kb、至少30kb、至少40kb、至少60kb、至少80kb、至少100kb、至少150kb、至少200kb、至少250kb、至少300kb、至少350kb、至少400kb、至少450kb或至少500kb。
B.大型靶向载体的构建
用于构建本文所述的靶向载体的许多技术是所属领域的技术人员众所周知的标准分子生物学技术(参见例如Sambrook,J.,E.F.Fritsch和T.Maniatis.分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)第二版,第1、2和3卷,1989;现代分子生物学实验指南(Current Protocols in,Molecular Biology),Ausubel等人编,格林出版协会(Greene Publ.Assoc.),Wiley Interscience,NY)。可以使用所属领域中已知用于构建大型靶向载体的任何方法。
在一个实例中,用于构建大型靶向载体(LTVEC)的方法包含:(a)获得含有所关注基因或染色体基因座的大型基因组DNA克隆系;以及(b)将同源盒1和2附接到修饰盒以产生LTVEC。任选地,此类方法可以进一步包含验证每个LTVEC已经正确地进行工程改造。任选地,此类方法可以进一步包含提纯、制备和线性化LTVEC DNA以引入真核细胞中。此类方法进一步描述于US 2004/0018626、US 2013/0309670和WO 2013/163394中,其中的每一个以全文引用的方式并入本文中用于所有目的。
所关注的基因或基因座可以基于特定准则来选择,例如详细结构或功能数据,或它们可以在缺乏此类详细信息的情况下选择,因为通过各种基因组测序项目的努力,潜在的基因或基因片段变得可预测。不需要知道产生LTVEC的所关注基因或基因座的完整序列和基因结构。所需的唯一序列信息是约80-100个核苷酸,以便获得所关注的基因组克隆系以及产生用于制备LTVEC的同源盒,和制备供定量修饰等位基因(MOA)分析中使用的探针。
一旦已选择所关注的基因或基因座,就能获得含有这种基因或基因座的大基因组克隆系。这种克隆系能够按照若干中的任一种获得,包括(但不限于)通过标准杂交或PCR技术或通过所属领域的技术人员熟悉的任何其它方法筛选适合DNA文库(例如BAC、PAC、YAC或粘质体)。
同源盒标记用于从大克隆基因组片段产生LTVEC的细菌同源重组位点。同源盒是通常为双链且长度为至少40个核苷酸的短DNA区段,其与侧接待修饰区域的大克隆基因组片段内的区域同源。同源盒附接到修饰盒,以便修饰盒利用细菌中发生的同源重组置换待修饰的区域。利用细菌同源重组来产生靶向载体的技术可以在多种系统中进行(参见例如Yang等人(1997)自然·生物技术15:859-865;Muyrers等人(1999)核酸研究(NucleicAcids Res)27:1555-1557;Angrand等人(1999)核酸研究.27:e16;Narayanan等人(1999)基因疗法(Gene Ther).6:442-447;Yu等人(2000)美国国家科学院院刊97:5978-5983,其中的每一个以全文引用的方式并入本文中用于所有目的)。此类技术的一个实例是ET克隆(参见例如Zhang等人(1998)自然·遗传学(Nat.Genet.)20:123-128;Narayanan等人(1999)基因疗法.6:442-447,其中的每一个以全文引用的方式并入本文中用于所有目的)和这种技术的变化形式(参见例如Yu等人(2000)美国国家科学院院刊97:5978-5983,其以全文引用的方式并入本文中用于所有目的)。ET是指进行同源重组反应的recE和recT蛋白质。RecE是一种核酸外切酶,其修剪线性双链DNA5'到3'的一个链,从而得到具有3'单链突出端的线性双链片段。这个单链突出端被具有单链DNA(ssDNA)结合活性的recT蛋白质涂布。ET克隆是使用大肠杆菌瞬时表达recE和recT的大肠杆菌基因产物和细菌噬菌体λ(λ)蛋白质λgam进行。λgam蛋白质保护供体DNA片段以免被recBC核酸外切酶系统降解,并且优选在recBC+宿主(例如常用的大肠杆菌菌株DH10b)中进行高效的ET克隆。
LTVEC还能够通过DNA组装方法产生,例如体外DNA组装方法,包括Gibson DNA组装或Gibson DNA组装的变体。参见例如US 2015/0376628、US 2016/0115486、WO 2015/200334和US 2010/0035768,其中的每一个以全文引用的方式并入用于所有目的。
传统的核酸组装方法采用限制酶进行常规酶消化、克隆核酸和将核酸连接在一起的耗时步骤。当将较大片段或载体组装在一起时,这些方法变得更困难。然而,核酸酶(例如向导RNA和Cas9核酸酶)的可塑标靶特异性能够得到利用以将核酸转化成适用于快速组装反应的形式。参见例如US 2015/0376628、US 2016/0115486和WO 2015/200334,其中的每一个以全文引用的方式并入本文中用于所有目的。
具有重叠序列的任何所关注DNA分子可以通过此类方法组装,包括天然存在的DNA、克隆过的DNA分子、合成产生的DNA等。组装两种核酸包括连接两种核酸的链的任何方法。举例来说,组装包括连接消化过的核酸,以使得每种核酸的链粘接到另一个且延长,其中每个链充当延长另一个用的模板。
可以利用任何体外或体内DNA组装方法或快速组合方法组装核酸。举例来说,具有重叠末端的第一和第二核酸可以与连接酶、核酸外切酶、DNA聚合酶和核苷酸组合且在恒定温度(例如50℃)下培育。具体来说,T5核酸外切酶可以用于从dsDNA的5'端去除核苷酸,从而产生互补突出端。然后可以将互补单链DNA突出端粘接,使用DNA聚合酶填充空隙,并且使用Taq DNA连接酶在50℃下封闭所产生的切口。从而使共享重叠末端序列的两种核酸能够在一步等温反应中连接成共价封闭的分子。参见例如Gibson等人(2009)自然·方法(Nature Methods)6(5):343-345,其以全文引用的方式并入本文中用于所有目的。
定点核酸酶剂(例如向导RNA引导的Cas蛋白质)通过选择和操纵它们的核酸内切酶活性所产生的末端序列而使核酸实现快速且高效的组合。举例来说,DNA组装方法能够使第一聚核苷酸与特异性针对所期望靶点和核酸外切酶的核酸酶剂(例如gRNA-Cas复合物)组合。可以选择靶点,以便核酸酶使核酸裂解时,裂解产生的所得末端具有与和第一核酸组装在一起的第二核酸的末端(例如重叠末端)互补的区域。然后能够组装这些互补末端而产生单个组装的核酸。由于核酸酶剂(例如gRNA-Cas复合物)特异性针对个别靶点,因此所述方法能够按照精确定点的方式修饰核酸。通过选择特异性针对靶点的核酸酶剂(例如gRNA-Cas复合物)以使得在裂解时产生与第二核酸的末端序列互补的末端序列,能够利用等温组装来组装所得消化过的核酸。因此,通过选择产生重叠末端序列的核酸和核酸酶剂(例如gRNA-Cas复合物),能够利用快速组合方法组装核酸,从而按照快速并且高效的方式产生最终组装的核酸。或者,不具有互补末端的核酸可以通过经设计而具有与每种核酸互补的末端的接头寡核苷酸组装在一起。两个或更多个核酸可以通过使用接头寡核苷酸而无缝组装在一起,由此减少所得已组装核酸中的不必要序列。
然后可以验证LTVEC已正确工程化。举例来说,诊断型PCR可以用于验证通过将供体片段引入所关注的基因或染色体基因座中而产生的新接点。或者或另外,可以进行诊断性限制酶消化以确保细菌同源重组过程期间只有所期望的修饰已经引入LTVEC中。或者或另外,直接测序可以针对LTVEC进行,具体地说,针对跨越修饰位点的区域,以验证通过将供体片段引入所关注基因或染色体基因座中而产生的新接点。
在用于引入真核细胞中的LTVEC DNA的任何纯化和进一步制备之后,LTVEC优选以使得已修饰内源基因或染色体基因座DNA与长同源臂侧接的方式进行线性化。这可以通过使用仅很少消化的任何适合限制酶将LTVEC线性化、优选在载体主链中线性化来实现。适合限制酶的实例包括NotI、Pad、SfiI、SrfI、Swal、FseI等。限制酶的选择可以用实验方式确定(即,通过测试若干不同候选物稀有切割工具酶),或如果LTVEC序列已知,则通过分析序列并且基于所述分析选择适合的限制酶来确定。
C.C9orf72-HRE核酸构建体
DNA序列可以用于制备供基因敲入动物用的LTVEC(例如C9ORF72-HRE)。典型地,将包含六核苷酸扩增序列和/或可选标记物的聚核苷酸分子(例如插入核酸)插入载体(优选DNA载体)中,以便在适合的宿主细胞中复制聚核苷酸分子。
聚核苷酸分子(或插入核酸)包含希望整合到靶基因座中的DNA区段。在一些实施例中,插入核酸包含一个或多个所关注的聚核苷酸。在一些实施例中,插入核酸包含一个或多个表达盒。在一些特定实施例中,表达盒包含所关注的聚核苷酸、编码选择标记物和/或报导基因的聚核苷酸,以及在一些特定实施例中,影响表达的多个调控组件。几乎任何所关注的聚核苷酸可以容纳于插入核酸内且由此在靶基因组基因座整合。本文公开的方法能够使至少1、2、3、4、5、6个或更多个所关注聚核苷酸整合到靶向的C9ORF72基因组基因座中。
在一些实施例中,插入核酸中所含的所关注聚核苷酸编码报告体。在一些实施例中,所关注的聚核苷酸编码可选标记物。
在一些实施例中,所关注的聚核苷酸侧接或包含位点特异性重组位点(例如loxP、Frt等)。在一些特定实施例中,位点特异性重组位点侧接编码报告体的DNA区段和/或编码可选标记物的DNA区段。本文中描述所关注的示例性聚核苷酸,包括插入核酸中能够包含的选择标记物和报告基因。
所属领域中已知用于制备质体、DNA构建体和/或靶向载体和转化宿主生物体的各种方法。关于适用于原核细胞与真核细胞的其它表达系统,以及通用重组程序,参见分子克隆:实验室手册第2版,Sambrook, J.等人编,冷泉港实验室出版社(Cold Spring HarborLaboratory Press):1989。
如上文所述,表2中提供了示例性非人类(例如啮齿动物)C9ORF72核酸和氨基酸序列,用于构建供基因敲入动物用的靶向载体。还能够在GenBank数据库中找到其它非人类C9ORF72序列。如本文所公开的C9ORF72靶向载体包含异源六核苷酸重复扩增序列,和任选地一种或多种编码报告基因和/或可选标记物的序列,其侧接与靶区域(也称为“同源臂”)的侧接序列一致或基本上同源的序列,以便插入转基因非人类动物的基因组中。
仅举一个例子,插入起点可以设置于第一外显子(例如第一非编码外显子)的上游(5')、内部或下游(3'),以允许插入核酸可操作地连接到内源调控序列(例如启动子)。图1B和图1C中提供了一种用于靶向插入异源六核苷酸重复扩增序列的靶向策略。药物选择盒侧接loxP(LP)重组酶识别位点,所述重组酶识别位点允许Cre介导药物选择盒切除。这样尤其实现了选择盒的切除。因此,在表型分析之前,可以去除药物选择盒,仅留下异源六核苷酸重复扩增序列,并且在一些实施例中,留下重组酶识别位点的一个拷贝。
本文公开了适用于图1B和1C中所描绘的已修饰小鼠C9orf72等位基因的核酸构建体,其中所述核酸构建体包含SEQ ID NO:8和SEQ ID NO:9中所述的序列。SEQ ID NO:8从5'到3'包含:5'同源臂(SEQ ID NO:20)、跨越且包括人类C9orf72基因的外显子1a的一部分和外显子1b的全部的962bp人类序列(SEQ ID NO:2)、含有处于人类泛素1和/或Em7启动子控制下的新霉素抗性基因的floxed新霉素抗性盒(SEQ ID NO:21),和3'同源臂(SEQ ID NO:22)。SEQ ID NO:9从5'到3'包含:5'同源臂(SEQ ID NO:23)、跨越且包括人类C9orf72基因的外显子1a的一部分和外显子1b的全部的1261bp人类序列(SEQ ID NO:3)、含有处于人类泛素1和/或Em7启动子控制下的新霉素抗性基因的floxed新霉素抗性盒(SEQ ID NO:24),和3'同源臂(SEQ ID NO:25)。
如本文所述,异源六核苷酸重复扩增序列插入内源C9orf72基因座可以包含插入核酸对C9orf72基因座或其一部分的置换或插入/添加。在一些实施例中,插入核酸包含报告基因。在一些特定实施例中,报告基因定位成与内源C9orf72启动子可操作地连接。此类修饰允许内源C9orf72启动子驱动报告基因表达。或者,报告基因不定位成与内源C9orf72启动子可操作地连接。
多种报告基因(或可检测部分)可以用于本文所述的靶向载体。示例性报告基因包括例如β-半乳糖苷酶(所编码的lacZ基因)、绿色荧光蛋白(GFP)、增强型绿色荧光蛋白(eGFP)、MmGFP、蓝色荧光蛋白(BFP)、增强型蓝色荧光蛋白(eBFP)、mPlum、mCherry、tdTomato、mStrawberry、J-Red、DsRed、mOrange、mKO、mCitrine、Venus、YPet、黄色荧光蛋白(YFP)、增强型黄色荧光蛋白(eYFP)、Emerald、CyPet、青色荧光蛋白(CFP)、Cerulean、T-Sapphire、荧光素酶、碱性磷酸酶或其组合。本文所述的方法展现了利用lacZ报告基因编码β-半乳糖苷酶的用途来构建靶向载体,然而,所属领域的技术人员在阅读本公开后将理解,本文所述的非人类动物可以在缺乏报告基因的情况下或在所属领域中已知的任何报告基因存在下产生。
适当时,可以完整或部分地修饰编码报告体多肽的遗传物质或聚核苷酸序列的编码区,以包括为了在非人类动物中表达而最优化的密码子(例如参见美国专利第5,670,356号和第5,874,304号)。密码子最优化序列是合成序列,并且优选编码由非密码子最优化亲本聚核苷酸编码的一致多肽(或全长多肽的生物活性片段,其具有与全长多肽基本上相同的活性)。在一些实施例中,编码报告体多肽(例如lacZ)的遗传物质的编码区可以完整或部分地包括改变的序列以针对特定细胞类型(例如啮齿动物细胞)来最优化密码子使用。举例来说,为了在非人类动物的细胞中表达,可以将插入非人类动物(例如啮齿动物)基因组中的报告基因的密码子最优化。此类序列可以描述为密码子最优化序列。
提供了用于制备非人类动物的组合物和方法,所述非人类动物包含在如本文所述的内源C9ORF72基因座中插入异源六核苷酸重复扩张序列破坏,所述组合物和方法包括用于制造表达异源六核苷酸重复扩增序列(例如利用C9ORF72启动子,例如内源小鼠启动子,和C9ORF72调控序列,例如人类调控序列,例如外显子1a和1b中所发现)的非人类动物的组合物和方法。在一些实施例中,还提供了用于制造通过内源启动子和内源调控序列表达异源六核苷酸重复扩增序列的非人类动物的组合物和方法。方法包括将如本文所述的编码异源六核苷酸重复扩增序列的靶向载体插入非人类动物的基因组中,以便完整或部分地缺失C9ORF72基因座的非编码序列。在一些实施例中,本文所述的非人类动物包含含有如本文所述的靶向载体的内源C9ORF72基因座。
可以将本文所述的靶向载体引入ES细胞中并且筛选出C9orf72基因座中具有破坏的ES克隆系,如以下文献中所述:Frendewey,D.等人,2010,酶学方法(Methods Enzymol.)476:295-307。本文所公开的方法和组合物中可以使用多种宿主胚。举例来说,可以将具有靶向基因修饰的多能和/或分化全能细胞引入来自相应生物体的桑椹体前期胚(例如8细胞期胚)中。参见例如US 7,576,259、US 7,659,442、US 7,294,754和US 2008/0078000 A1,其全部以全文引用的方式并入本文中。在其它情况下,可以将供体ES细胞植入处于2细胞期、4细胞期、8细胞期、16细胞期、32细胞期或64细胞期的宿主胚中。宿主胚也可以是囊胚或可以是囊胚前胚、桑椹体前期胚、桑椹体期胚、非紧密桑椹体期胚,或紧密桑椹体期胚。
在一些实施例中,可以应用方法(Poueymirou,W.T.等人,2007,自然·生物技术25:91-99)将阳性ES细胞注射到8细胞胚中,以完全产生ES细胞衍生的F0代杂合小鼠,准备用于lacZ表达谱分析或繁殖到纯合性。实例1中提供了用于产生在C9orf72基因座具有破坏的非人类动物的示例性方法。
用于产生转基因非人类动物的方法(包括基因敲除和基因敲入)在所属领域中是众所周知的(参见例如基因靶向:实用方法(Gene Targeting:A Practical Approach),Joyner编,牛津大学出版社有限公司(Oxford University Press,Inc.)(2000))。举例来说,转基因啮齿动物的产生可以任选地包括破坏啮齿动物内源基因的基因座和将报告基因引入啮齿动物基因组,在一些实施例中,引入与啮齿动物内源基因相同的位置。
图1A(顶框)中提供了小鼠C9orf72的基因组组织的示意性说明(不按比例)。图1A(底框)中还提供了一种用异源六核苷酸重复扩增序列置换内源鼠类C9orf72基因座的非编码序列的示例性靶向策略。如图所示,跨越外显子1和ATG起始密码子之间的基因组DNA或其一部分被异源六核苷酸重复扩增序列和侧接位点特异性重组酶识别位点的药物选择盒置换。这种策略中使用的靶向载体可以任选地包括重组酶编码序列,所述重组酶编码序列可操作地连接到调控发育的启动子,以便重组酶在未分化细胞中表达。表3中提供了能够包括于本文所述的靶向载体中的示例性发育调控启动子。可以用于本文所述的靶向载体中的其它适合启动子包括美国专利第8,697,851号、第8,518,392号和第8,354,389号中所述的启动子;所有这些文献都以引用的方式并入本文中)。同源重组后,内源鼠类C9orf72基因座的非编码序列,例如从外显子1(或外显子1内部)跨越到外显子2的约800bp到1000bp,被靶向载体中所含的序列置换。可以去除药物选择盒,例如任选地按照发育依赖性方式去除,以便生殖系细胞的上述C9orf72基因座含有破坏的小鼠衍生的后代在发育期间从分化细胞中排出可选标记物(参见美国专利第8,697,851号、第8,518,392号和第8,354,389号,这些文献都以引用的方式并入本文中)。
表3
---------------------------------------------------------------------
Prot启动子(SEQ ID NO:26)
CCAGTAGCAGCACCCACGTCCACCTTCTGTCTAGTAATGTCCAACACCTCCCTCAGTCCAAACACTGCTCTGCATCCATGTGGCTCCCATTTATACCTGAAGCACTTGATGGGGCCTCAATGTTTTACTAGAGCCCACCCCCCTGCAACTCTGAGACCCTCTGGATTTGTCTGTCAGTGCCTCACTGGGGCGTTGGATAATTTCTTAAAAGGTCAAGTTCCCTCAGCAGCATTCTCTGAGCAGTCTGAAGATGTGTGCTTTTCACAGTTCAAATCCATGTGGCTGTTTCACCCACCTGCCTGGCCTTGGGTTATCTATCAGGACCTAGCCTAGAAGCAGGTGTGTGGCACTTAACACCTAAGCTGAGTGACTAACTGAACACTCAAGTGGATGCCATCTTTGTCACTTCTTGACTGTGACACAAGCAACTCCTGATGCCAAAGCCCTGCCCACCCCTCTCATGCCCATATTTGGACATGGTACAGGTCCTCACTGGCCATGGTCTGTGAGGTCCTGGTCCTCTTTGACTTCATAATTCCTAGGGGCCACTAGTATCTATAAGAGGAAGAGGGTGCTGGCTCCCAGGCCACAGCCCACAAAATTCCACCTGCTCACAGGTTGGCTGGCTCGACCCAGGTGGTGTCCCCTGCTCTGAGCCAGCTCCCGGCCAAGCCAGCACC
Blimp1启动子1kb(SEQ ID NO:27)
TGCCATCATCACAGGATGTCCTTCCTTCTCCAGAAGACAGACTGGGGCTGAAGGAAAAGCCGGCCAGGCTCAGAACGAGCCCCACTAATTACTGCCTCCAACAGCTTTCCACTCACTGCCCCCAGCCCAACATCCCCTTTTTAACTGGGAAGCATTCCTACTCTCCATTGTACGCACACGCTCGGAAGCCTGGCTGTGGGTTTGGGCATGAGAGGCAGGGACAACAAAACCAGTATATATGATTATAACTTTTTCCTGTTTCCCTATTTCCAAATGGTCGAAAGGAGGAAGTTAGGTCTACCTAAGCTGAATGTATTCAGTTAGCAGGAGAAATGAAATCCTATACGTTTAATACTAGAGGAGAACCGCCTTAGAATATTTATTTCATTGGCAATGACTCCAGGACTACACAGCGAAATTGTATTGCATGTGCTGCCAAAATACTTTAGCTCTTTCCTTCGAAGTACGTCGGATCCTGTAATTGAGACACCGAGTTTAGGTGACTAGGGTTTTCTTTTGAGGAGGAGTCCCCCACCCCGCCCCGCTCTGCCGCGACAGGAAGCTAGCGATCCGGAGGACTTAGAATACAATCGTAGTGTGGGTAAACATGGAGGGCAAGCGCCTGCAAAGGGAAGTAAGAAGATTCCCAGTCCTTGTTGAAATCCATTTGCAAACAGAGGAAGCTGCCGCGGGTCGCAGTCGGTGGGGGGAAGCCCTGAACCCCACGCTGCACGGCTGGGCTGGCCAGGTGCGGCCACGCCCCCATCGCGGCGGCTGGTAGGAGTGAATCAGACCGTCAGTATTGGTAAAGAAGTCTGCGGCAGGGCAGGGAGGGGGAAGAGTAGTCAGTCGCTCGCTCACTCGCTCGCTCGCACAGACACTGCTGCAGTGACACTCGGCCCTCCAGTGTCGCGGAGACGCAAGAGCAGCGCGCAGCACCTGTCCGCCCGGAGCGAGCCCGGCCCGCGGCCGTAGAAAAGGAGGGACCGCCGAGGTGCGCGTCAGTACTGCTCAGCCCGGCAGGGACGCGGGAGGATGTGGACTGGGTGGAC
Blimp1启动子2kb(SEQ ID NO:28)
GTGGTGCTGACTCAGCATCGGTTAATAAACCCTCTGCAGGAGGCTGGATTTCTTTTGTTTAATTATCACTTGGACCTTTCTGAGAACTCTTAAGAATTGTTCATTCGGGTTTTTTTGTTTTGTTTTGGTTTGGTTTTTTTGGGTTTTTTTTTTTTTTTTTTTTTTGGTTTTTGGAGACAGGGTTTCTCTGTATATAGCCCTGGCACAAGAGCAAGCTAACAGCCTGTTTCTTCTTGGTGCTAGCGCCCCCTCTGGCAGAAAATGAAATAACAGGTGGACCTACAACCCCCCCCCCCCCCCCCAGTGTATTCTACTCTTGTCCCCGGTATAAATTTGATTGTTCCGAACTACATAAATTGTAGAAGGATTTTTTAGATGCACATATCATTTTCTGTGATACCTTCCACACACCCCTCCCCCCCAAAAAAATTTTTCTGGGAAAGTTTCTTGAAAGGAAAACAGAAGAACAAGCCTGTCTTTATGATTGAGTTGGGCTTTTGTTTTGCTGTGTTTCATTTCTTCCTGTAAACAAATACTCAAATGTCCACTTCATTGTATGACTAAGTTGGTATCATTAGGTTGGGTCTGGGTGTGTGAATGTGGGTGTGGATCTGGATGTGGGTGGGTGTGTATGCCCCGTGTGTTTAGAATACTAGAAAAGATACCACATCGTAAACTTTTGGGAGAGATGATTTTTAAAAATGGGGGTGGGGGTGAGGGGAACCTGCGATGAGGCAAGCAAGATAAGGGGAAGACTTGAGTTTCTGTGATCTAAAAAGTCGCTGTGATGGGATGCTGGCTATAAATGGGCCCTTAGCAGCATTGTTTCTGTGAATTGGAGGATCCCTGCTGAAGGCAAAAGACCATTGAAGGAAGTACCGCATCTGGTTTGTTTTGTAATGAGAAGCAGGAATGCAAGGTCCACGCTCTTAATAATAAACAAACAGGACATTGTATGCCATCATCACAGGATGTCCTTCCTTCTCCAGAAGACAGACTGGGGCTGAAGGAAAAGCCGGCCAGGCTCAGAACGAGCCCCACTAATTACTGCCTCCAACAGCTTTCCACTCACTGCCCCCAGCCCAACATCCCCTTTTTAACTGGGAAGCATTCCTACTCTCCATTGTACGCACACGCTCGGAAGCCTGGCTGTGGGTTTGGGCATGAGAGGCAGGGACAACAAAACCAGTATATATGATTATAACTTTTTCCTGTTTCCCTATTTCCAAATGGTCGAAAGGAGGAAGTTAGGTCTACCTAAGCTGAATGTATTCAGTTAGCAGGAGAAATGAAATCCTATACGTTTAATACTAGAGGAGAACCGCCTTAGAATATTTATTTCATTGGCAATGACTCCAGGACTACACAGCGAAATTGTATTGCATGTGCTGCCAAAATACTTTAGCTCTTTCCTTCGAAGTACGTCGGATCCTGTAATTGAGACACCGAGTTTAGGTGACTAGGGTTTTCTTTTGAGGAGGAGTCCCCCACCCCGCCCCGCTCTGCCGCGACAGGAAGCTAGCGATCCGGAGGACTTAGAATACAATCGTAGTGTGGGTAAACATGGAGGGCAAGCGCCTGCAAAGGGAAGTAAGAAGATTCCCAGTCCTTGTTGAAATCCATTTGCAAACAGAGGAAGCTGCCGCGGGTCGCAGTCGGTGGGGGGAAGCCCTGAACCCCACGCTGCACGGCTGGGCTGGCCAGGTGCGGCCACGCCCCCATCGCGGCGGCTGGTAGGAGTGAATCAGACCGTCAGTATTGGTAAAGAAGTCTGCGGCAGGGCAGGGAGGGGGAAGAGTAGTCAGTCGCTCGCTCACTCGCTCGCTCGCACAGACACTGCTGCAGTGACACTCGGCCCTCCAGTGTCGCGGAGACGCAAGAGCAGCGCGCAGCACCTGTCCGCCCGGAGCGAGCCCGGCCCGCGGCCGTAGAAAAGGAGGGACCGCCGAGGTGCGCGTCAGTACTGCTCAGCCCGGCAGGGACGCGGGAGGATGTGGACTGGGTGGAC
D.将LTVEC引入细胞中
可以利用任何标准方法将LTVEC DNA引入真核细胞中。“引入”包括以序列可进入细胞内部的方式将核酸呈递给细胞。可以通过任何方式实现引入。
本文所提供的方法不取决于将核酸引入细胞中的特定方法,仅取决于核酸可进入至少一个细胞的内部。用于将核酸引入各种类型的细胞中的方法在所属领域中已知且包括例如稳定转染方法、瞬时转染方法和病毒介导方法。
转染方案以及用于将核酸引入细胞中的方案可以变化。非限制性转染方法包括使用脂质体的基于化学的转染方法;纳米颗粒;磷酸钙(参见例如Graham等人(1973)病毒学(Virology)52(2):456-67;Bacchetti等人(1977)美国国家科学院院刊74(4):1590-4;和Kriegler,M(1991).转移和表达:实验室手册(Transfer and Expression:A LaboratoryManual),纽约:W.H.Freeman and Company,第96-97页,所述文献各以全文引用的方式并入本文中);树枝状聚合物;或阳离子聚合物,例如DEAE-聚葡萄糖或聚乙烯亚胺。非化学方法包括电穿孔、声致穿孔和光学转染。基于颗粒的转染包括使用基因枪或磁铁辅助式转染(参见例如Bertram(2006)当代医药生物技术(Current Pharmaceutical Biotechnology)7,277-285,所述文献以全文引用的方式并入本文中)。病毒方法也可以用于转染。
将核酸引入细胞中也可以通过电穿孔、通过细胞质内注射、通过病毒感染、通过腺病毒、通过腺相关病毒、通过慢病毒、通过逆转录病毒、通过转染、通过脂质介导的转染或通过核转染来介导。核转染是一种改进的电穿孔技术,其不仅能够将核酸底物递送到细胞质,而且能够穿过核膜递送到核中。另外,在本文公开的方法中使用核转染需要的细胞典型地比常规电穿孔少得多(例如仅需约2百万,相比之下,常规电穿孔需7百万)。在一个实例中,核转染是使用 NUCLEOFECTORTM系统进行。
还可以通过显微注射来完成核酸向细胞(例如单细胞期胚)中的引入。在单细胞期胚中,可以显微注射到母本和/或父本原核中或显微注射到细胞质中。如果显微注射到仅一个原核中,则父本原核由于其尺寸较大而优选。mRNA优选显微注射到细胞质中(例如将mRNA直接递送到翻译机器中),而蛋白质或编码Cas蛋白的DNA优选显微注射到核/原核中。或者,显微注射可以通过注射到核/原核和细胞质中来进行;首先可以将针引入核/原核中并且可以注射第一数量,并且在从单细胞期胚中移出针的同时,可以向细胞质中注射第二数量。如果将核酸酶剂蛋白注射到细胞质中,则所述蛋白质优选包含核定位信号以确保递送到核/原核中。显微注射实施方法众所周知。参见例如Nagy等人,2003,操纵小鼠胚(Manipulatingthe Mouse Embryo),冷泉港(Cold Spring Harbor),纽约:冷泉港实验室出版社);Meyer等人(2010)美国国家科学院院刊107:15022-15026,和Meyer等人(2012)美国国家科学院院刊109:9354-9359,所述文献各以全文引用的方式并入本文中。
将核酸或蛋白质引入细胞中的其它方法可以包括例如载体递送、颗粒介导的递送、核外体介导的递送、脂质纳米颗粒介导的递送、细胞穿透肽介导的递送,或可植入装置介导的递送。
将核酸引入细胞中可以在一段时间内执行一次或多次。举例来说,所述引入可以在一段时间内执行至少两次、在一段时间内执行至少三次、在一段时间内执行至少四次、在一段时间内执行至少五次、在一段时间内执行至少六次、在一段时间内执行至少七次、在一段时间内执行至少八次、在一段时间内执行至少九次、在一段时间内执行至少十次、在一段时间内执行至少十一次、在一段时间内执行至少十二次、在一段时间内执行至少十三次、在一段时间内执行至少十四次、在一段时间内执行至少十五次、在一段时间内执行至少十六次、在一段时间内执行至少十七次、在一段时间内执行至少十八次、在一段时间内执行至少十九次,或在一段时间内执行至少二十次。
E.筛选和鉴定具有靶向基因修饰的细胞
可以通过暴露于选择剂来选择LTVEC已成功地引入其中的细胞,这取决于可选标记基因是否已经工程改造到LTVEC中。作为一个非限制性实例,如果可选标记物是新霉素磷酸转移酶(neo)基因(参见例如Beck等人(1982)基因(Gene)19:327-336,所述文献以全文引用的方式并入本文中用于所有目的),则可以在含G418培养基中选择已吸收LTVEC的细胞;不含有LTVEC的细胞将死亡,而已吸收LTVEC的细胞将存活(参见例如Santerre等人(1984)基因30:147-156,所述文献以全文引用的方式并入本文中用于所有目的)。此类选择标记物可以例如赋予抗生素(例如G418、潮霉素(hygromycin)、杀稻瘟菌素(blasticidin)、新霉素(neomycin)或嘌呤霉素(puromycin))抗性。此类选择标记物包括新霉素磷酸转移酶(neor)、潮霉素B磷酸转移酶(hygr)、嘌呤霉素-N-乙酰基转移酶(puror)和杀稻瘟菌素S脱氨酶(bsrr)。在仍其它实施例中,选择标记物可操作地连接到诱导型启动子,且选择标记物的表达对细胞有毒。此类选择标记物的非限制性实例包括黄嘌呤/鸟嘌呤磷酸核糖基转移酶(gpt)、次黄嘌呤-鸟嘌呤磷酸核糖转移酶(HGPRT)或单纯疱疹病毒胸苷激酶(HSV-TK)。
本文公开的方法可以进一步包含鉴定具有已修饰的基因组的细胞。可以利用各种方法鉴定具有靶向基因修饰(例如缺失或插入)的细胞。此类方法可以包含鉴定在靶基因座具有靶向基因修饰的单个细胞。
用于筛选靶向修饰的常规分析(例如长程PCR、桑格测序(Sanger sequencing)或DNA印迹)使所插入的靶向载体与靶基因座关联。举例来说,在长程PCR分析中,一个引物能够识别所插入DNA内的序列,而另一个引物识别所关注序列的超过靶向载体同源臂末端的基因组区域。然而,LTVEC由于它们的同源臂尺寸大而不允许通过此类常规分析来筛选。为了筛选LTVEC靶,可以使用等位基因修饰(MOA)分析,包括等位基因丢失(LOA)和等位基因获得(GOA)分析(参见例如US 2014/0178879和Frendewey等人(2010)酶学方法(MethodsEnzymol.)476:295-307,所述文献各以全文引用的方式并入本文中用于所有目的)。等位基因丢失(LOA)分析颠倒了常规筛选逻辑并且量化了突变所针对的原生基因座的拷贝数。在正确靶向的细胞克隆系中,LOA分析检测出两个原生等位基因中的一个(对于不处于X或Y染色体上的基因),另一个等位基因被靶向修饰破坏。相同原理可以作为等位基因获得(GOA)分析反向应用于量化所插入靶向载体的拷贝数。举例来说,GOA和LOA分析的组合使用揭示正确靶向的杂合克隆系已丢失原生靶基因的一个拷贝并且已获得抗药性基因或其它所插入标记物的一个拷贝。
作为一个实例,定量聚合酶链反应(qPCR)可以用作等位基因定量的方法,但能够可靠区分靶基因的零个、一个和两个拷贝之间差异或核酸插入序列的零个、一个和两个拷贝之间差异的任何方法可以用于开发MOA分析。举例来说,可以用于定量基因组DNA样品中的DNA模板的拷贝数,尤其通过与参考基因比较来定量(参见例如US 6,596,541,所述文献以全文引用的方式并入本文中用于所有目的)。参考基因是在与靶基因或基因座相同的基因组DNA中定量。因此,执行两次扩增(各使用其相应探针)。一个探针测定参考基因的“Ct”(阈值循环),而另一个探针测定靶向基因或基因座的通过成功靶向所置换的区域的Ct(即,LOA分析)。Ct是一种数量,其反映每个探针的起始DNA的量,即,较低丰度的序列需要更多的PCR循环来达到阈值循环。将模板序列的拷贝数减少一半用于反应将引起约一个Ct单位的增加。相较于来自非靶向细胞的DNA,其中靶基因或基因座中的一个等位基因已经通过同源重组被置换的细胞中发生的反应将引起标靶反应增加一个Ct,而参考基因的Ct未出现增加。在GOA分析中,另一个探针可以用于测定通过成功靶向而置换靶基因或基因座的核酸插入序列的Ct。
筛选步骤还可以包含臂特异性分析,它是用于区分核酸插入序列正确靶向插入靶基因组基因座与核酸插入序列随机转基因插入靶基因组基因座外部的基因组位置的分析。Arm特异性分析测定LTVEC同源臂中的DNA模板的拷贝数。参见例如US 2016/0177339、WO2016/100819、US 2016/0145646和WO 2016/081923,所述文献各以全文引用的方式并入本文中用于所有目的。其可以是适用于验证LTVEC正确靶向的增强型标准LOA和分析。举例来说,单独的LOA和GOA分析可能无法区分正确靶向的细胞克隆系与其中靶基因组基因座的缺失与LTVEC随机整合于基因组中其它地方的克隆系。由于靶细胞中的选择压力是基于选择盒,因此LTVEC随机转基因整合于基因组中的其它地方通常将包括选择盒和LTVEC的邻近区域,但可以排除LTVEC的较远侧区域。举例来说,如果LTVEC的一部分随机整合到基因组中,并且LTVEC包含长度约5kb或更长的核酸插入序列,其中选择盒邻近接于3'同源臂,那么在一些情况下,3'同源臂而非5'同源臂将与选择盒以转基因方式整合。或者,如果选择盒邻接于5'同源臂,那么在一些情况下,5'同源臂而非3'同源臂将与选择盒以转基因方式整合。举例来说,如果使用LOA和GOA分析评估LTVEC的靶向整合,并且GOA分析是利用针对LTVEC的选择盒或任何其它独特(非臂)区域的探针,那么靶基因组基因座处的杂合缺失与LTVEC随机转基因整合的组合得到的读出将与LTVEC杂合性靶向整合于靶基因组基因座处相同。为了验证LTVEC的正确靶向,臂特异性分析可以联合LOA和/或GOA分析使用。
适合的定量分析的其它实例包括荧光介导的原位杂交(FISH)、比较基因组杂交、等温DNA扩增、与固定探针的定量杂交、探针、分子信标探针,或ECLIPSETM探针技术(参见例如US 2005/0144655,所述文献以全文引用的方式并入本文中用于所有目的)。
还可以利用下一代测序(NGS)进行筛选,具体地说,在已经修饰的单细胞期胚中进行筛选。下一代测序也可以称为“NGS”或“大规模平行测序”或“高通量测序”。除MOA分析和滞留分析之外,此类NGS还可以用作筛选工具以界定靶向基因修饰的确切性质和检测鑲嵌症。鑲嵌症是指一位已从单一受精卵(即,接合子)发育的个体中存在两种或更多种具有不同基因型的细胞群。在本文公开的方法中,不必使用选择标记物筛选靶向克隆系。举例来说,可以依赖于本文所述的MOA和NGS分析而不使用选择盒。
F.制造经过基因修饰的非人类动物的方法
经过基因修饰的非人类动物可以使用本文公开的各种方法产生。用于产生经过基因修饰的生物体的任何适宜方法或方案,包括本文所述的方法,适于产生此类经过基因修饰的非人类动物。此类始于基因修饰多能细胞(例如胚胎干细胞(ES)细胞)的方法通常包含:(1)使用本文所述的方法修饰不是单细胞期胚的多能细胞的基因组;(2)鉴定或选择经过基因修饰的多能细胞;(3)将经过基因修饰的多能细胞引入宿主胚中;以及(4)将包含经过基因修饰的多能细胞的宿主胚植入代孕母亲中孕育。代孕母亲然后能够产生F0代非人类动物,所述非人类动物包含靶向基因修饰且能够通过生殖系传递靶向基因修饰。携带经过基因修饰的基因组基因座的动物可以通过如本文所述的等位基因修饰(MOA)分析来鉴定。可以将供体细胞引入任何阶段(例如囊胚期或桑椹体前期(即,4细胞期或8细胞期))的宿主胚中。产生能够通过所述生殖系传递所述基因修饰的后代。多能细胞可以是例如如本文在别处所论述的ES细胞(例如啮齿动物ES细胞、小鼠ES细胞,或大鼠ES细胞)。参见例如美国专利第7,294,754号,所述专利以全文引用的方式并入本文中用于所有目的。
或者,始于基因修饰单细胞期胚的此类方法通常包含:(1)使用本文所述方法修饰单细胞期胚的基因组;(2)鉴定或选择经过基因修饰的胚;以及(3)将经过基因修饰的胚植入代孕母亲中孕育。代孕母亲然后能够产生F0代非人类动物,所述非人类动物包含靶向基因修饰且能够通过生殖系传递靶向基因修饰。携带经过基因修饰的基因组基因座的动物可以通过如本文所述的等位基因修饰(MOA)分析来鉴定。
也可以利用核转移技术产生非人类哺乳动物。简单来说,核转移方法可以包括以下步骤:(1)将卵母细胞去核或提供去核的卵母细胞;(2)分离出或提供供体细胞或核以便与去核的卵母细胞组合;(3)将所述细胞或核插入去核的卵母细胞中以形成重建的细胞;(4)将重建的细胞植入非人类动物的子宫中以形成胚;以及(5)允许所述胚发育。在此类方法中,卵母细胞通常从已死亡的动物中回收,但它们也可以从活动物的输卵管和/或卵巢中分离出来。卵母细胞在去核之前可以在所属领域技术人员已知的多种培养基中成熟。卵母细胞的去核可以按照所属领域的技术人员众所周知的多种方式执行。将供体细胞或核插入去核的卵母细胞中以形成重建细胞可以是将供体细胞显微注射于透明带下再融合来实现。融合可以通过跨越接触/融合平面施加DC电脉冲(电融合)、通过使细胞暴露于促进融合的化学物质(例如聚乙二醇)或借助于灭活病毒(例如仙台病毒)来诱导。重建的细胞可以在核供体和接受者卵母细胞融合之前、期间和/或之后,通过电学和/或非电学方式活化。活化方法包括电脉冲、化学上诱导的休克、利用精子穿透、增加卵母细胞中的二价阳离子含量,和减少卵母细胞中的细胞蛋白质磷酸化(如通过激酶抑制剂)。活化的重建细胞或胚可以在所属领域的技术人员众所周知的培养基中培养,且然后转移到动物的子宫中。参见例如US2008/0092249、WO 1999/005266、US 2004/0177390、WO 2008/017234和美国专利第7,612,250号,所述文献各以全文引用的方式并入本文中用于所有目的。
本文提供的各种方法允许产生经过基因修饰的非人类F0动物,其中经过基因修饰的F0动物的细胞包含靶向基因修饰。应认识到,视用于产生F0动物的方法而定,具有靶向基因修饰的F0动物内的细胞数目将变化。通过例如方法将供体ES细胞引入来自相应生物体的桑椹体前期胚(例如8细胞期小鼠胚)允许F0动物的包含具有靶向基因修饰的细胞的细胞群百分比提高。参见例如US 2014/0331340、US 2008/0078001、US 2008/0028479、US 2006/0085866和WO 2006/044962,所述文献各以全文引用的方式并入本文中用于所有目的。举例来说,非人类F0动物的细胞比重的至少50%、60%、65%、70%、75%、85%、86%、87%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%可以包含具有靶向基因修饰的细胞群。另外,F0动物的至少一个或多个生殖细胞可以具有靶向基因修饰。
经过基因修饰的原源种非人类动物可以根据以下来鉴定:其基因组中的内源基因组C9ORF72序列的缺乏(所述序列被异源六核苷酸重复扩增序列置换),和/或异源六核苷酸重复扩增序列、抗药基因和/或报告体于非人类动物的组织或细胞中的存在(和/或表达)。然后可以利用转基因原源种非人类动物繁殖携有异源六核苷酸重复扩增序列的其它非人类动物,由此产生各自携有如本文所述的C9ORF72基因座的一个或多个拷贝的一系列非人类动物。
还可以产生含有所选系统的转基因非人类动物,所选系统能够调控或引导转基因的表达。示例性系统包括细菌噬菌体P1的Cre/loxP重组酶系统(参见例如Lakso,M.等人,1992,美国国家科学院院刊89:6232-6236)和酿酒酵母的FLP/Frt重组酶系统(O'Gorman,S.等人,1991,科学251:1351-1355)。此类动物可以通过构建“双重”转基因动物提供,例如通过使两种转基因动物配对,一种转基因动物含有编码异源六核苷酸重复扩增序列的转基因并且另一种含有编码重组酶(例如Cre重组酶)的转基因。
尽管本文中广泛论述的实施例是采用在小鼠的内源C9ORF72基因座中插入异源六核苷酸重复扩增序列,但还提供了在C9ORF72基因座中包含破坏的其它非人类动物。此类非人类动物包括可以经过基因修饰以置换如本文所公开的C9ORF72基因座的非编码序列的任何非人类动物,包括例如哺乳动物,例如小鼠、大鼠、兔、猪、牛(例如奶牛、公牛、水牛)、鹿、绵羊、山羊、鸡、猫、犬、雪貂、灵长类动物(例如狨猴、恒河猴)等。举例来说,对于适合的可基因修饰的ES细胞不容易获得的那些非人类动物来说,采用其它方法制造包含基因修饰的非人类动物。此类方法包括例如修饰非ES细胞基因组(例如成纤维细胞或诱导型多能细胞)以及采用体细胞核转移(SCNT)将经过基因修饰的基因组转移到适合的细胞,例如去核的卵母细胞,以及使修饰过的细胞(例如修饰过的卵母细胞)在非人类动物中、在适于形成胚的条件下孕育。
简单来说,核转移方法包括以下步骤:(1)将卵母细胞去核;(2)分离出供体细胞或核以便与去核的卵母细胞组合;(3)将所述细胞或核插入去核的卵母细胞中以形成重建的细胞;(4)将重建的细胞植入动物子宫中以形成胚;以及(5)允许所述胚发育。在此类方法中,卵母细胞通常从已死亡的动物中回收,但它们也可以从活动物的输卵管和/或卵巢中分离出来。卵母细胞在去核之前可以在所属领域的技术人员已知的多种培养基中成熟。卵母细胞的去核可以按照所属领域的技术人员已知的多种方式执行。将供体细胞或核插入去核的卵母细胞中以形成重建的细胞典型地是通过将供体细胞显微注射于透明带下再融合来达成。融合可以通过跨越接触/融合平面施加DC电脉冲(电融合)、通过使细胞暴露于促进融合的化学物质(例如聚乙二醇)或借助于灭活病毒(例如仙台病毒)来诱导。重建的细胞典型地在核供体和接受者卵母细胞融合之前、期间和/或之后,通过电学和/或非电学方式活化。活化方法包括电脉冲、化学上诱导的休克、利用精子穿透、增加卵母细胞中的二价阳离子含量,和减少卵母细胞中的细胞蛋白质磷酸化(如通过激酶抑制剂)。活化的重建细胞或胚典型地在所属领域的技术人员已知的培养基中培养,且然后转移到动物的子宫中。参见例如美国专利申请公开第2008-0092249 A1号、WO 1999/005266 A2、美国专利申请公开第2004-0177390 A1号、WO 2008/017234 Al,和美国专利第7,612,250号,所述文献各以引用的方式并入本文中。
修饰非人类动物基因组(例如猪、牛、啮齿动物、鸡等)的方法包括例如采用锌指核酸酶(ZFN)或转录活化因子样效应子核酸酶(TALEN)来修饰基因组,以使如本文所述的C9ORF72基因座中包括异源六核苷酸重复扩增序列的插入。
在一些实施例中,本文所述的非人类动物是哺乳动物。在一些实施例中,本文所述的非人类动物是小哺乳动物,例如跳鼠总科(Dipodoidea)或鼠总科(Muroidea)的小型哺乳动物。在一些实施例中,本文所述的经过基因修饰的动物是啮齿动物。在一些实施例中,本文所述的啮齿动物选自小鼠、大鼠和仓鼠。在一些实施例中,本文所述的啮齿动物选自鼠总科。在一些实施例中,本文所述的经过基因修饰的动物来自选自以下的科:丽仓鼠科(Calomyscidae)(例如小鼠样仓鼠)、仓鼠科(Cricetidae)(例如仓鼠、新世界大鼠和小鼠、田鼠)、鼠科(Muridae)(真小鼠和大鼠、沙鼠、棘鼠、冠鼠)、马岛鼠科(Nesomyidae)(攀鼠、岩鼠、具尾大鼠、马达加斯加大鼠(Malagasy rats)和小鼠)、刺睡鼠科(Platacanthomyidae)(例如多刺睡鼠)和鼹形鼠科(Spalacidae)(例如鼹鼠、竹鼠和鼢鼠)。在一些特定实施例中,本文所述的经过基因修饰的啮齿动物选自真小鼠或大鼠(鼠科)、沙鼠、棘鼠和冠鼠。在一些特定实施例中,本文所述的经过基因修饰的小鼠来自鼠科成员。在一些实施例中,本文所述的非人类动物是啮齿动物。在一些特定实施例中,本文所述的啮齿类动物选自小鼠和大鼠。在一些实施例中,本文所述的非人动物是小鼠。
在一些实施例中,本文所述的非人动物是啮齿动物,其是C57BL品系的小鼠,选自C57BL/A、C57BL/An、C57BL/GrFa、C57BL/KaLwN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola。在一些特定实施例中,本文所述的小鼠是129品系,其选自由以下组成的组:品系129P1、129P2、129P3、129X1、129S1(例如129S1/SV、129S1/SvIm)、129S2、129S4、129S5、129S9/SvEvH、129/SvJae、129S6(129/SvEvTac)、129S7、129S8、129T1、129T2(参见例如Festing等人,1999,哺乳动物基因组(Mammalian Genome)10:836;Auerbach,W.等人,2000,生物技术(Biotechniques)29(5):1024-1028,1030,1032)。在一些特定实施例中,本文所述的经过基因修饰的小鼠是前述129品系和前述C57BL/6品系的混合物。在一些特定实施例中,本文所述的小鼠是前述129品系的混合物,或前述BL/6品系的混合物。在一些特定实施例中,如本文所述的混合物中的129品系是129S6(129/SvEvTac)品系。在一些实施例中,本文所述的小鼠是BALB品系,例如BALB/c品系。在一些实施例中,本文所述的小鼠是BALB品系和另一种前述品系的混合物。
在一些实施例中,本文所述的非人类动物是大鼠。在一些特定实施例中,本文所述的大鼠选自韦斯大鼠(Wistar rat)、LEA品系、史泊格多利品系(Sprague Dawley strain)、费歇尔品系(Fischer strain)、F344、F6,和达克高替(Dark Agouti)。在一些特定实施例中,如本文所述的大鼠品系是两种或更多种品系的混合物,其选自由以下组成的组:韦斯、LEA、史泊格多利、费歇尔、F344、F6,和达克高替。
大鼠多能和/或分化全能细胞可以来自任何大鼠品系,包括例如ACI大鼠品系、达克高替(DA)大鼠品系、韦斯大鼠品系、LEA大鼠品系、史泊格多利(SD)大鼠品系,或费歇尔大鼠品系,例如费舍尔F344或费舍尔F6。大鼠多能和/或分化全能细胞也可以从来源于上述两种或更多种品系的混合物的品系中获得。举例来说,大鼠多能和/或分化全能细胞可以来自DA品系或ACI品系。ACI大鼠品系的特征是黑灰色,白色腹部和足部,以及RT1av1单倍型。此类品系获自多种来源,包括哈兰实验室(Harlan Laboratories)。来自ACI大鼠的大鼠ES细胞系的实例是ACI.G1大鼠ES细胞。深灰鼠(DA)大鼠品系的特征是具有鼠灰色皮毛和RT1av1单倍型。此类大鼠获自多种来源,包括查尔斯河(Charles River)和哈兰实验室。来自DA大鼠的大鼠ES细胞系的实例是DA.2B大鼠ES细胞系和DA.2C大鼠ES细胞系。在一些情况下,大鼠多能和/或分化全能细胞来自近交大鼠品系。参见例如U.S.2014/0235933 A1(2014年2月20日提交),所述文献以全文引用的方式并入本文中。
提供了包含在内源C9ORF72基因座中插有异源六核苷酸重复扩增序列的非人类动物。在一些实施例中,异源六核苷酸重复扩增序列的插入无病原性。在一些实施例中,插入异源六核苷酸重复扩增序列产生一种或多种如本文所述的表型,例如与ALS和/或FTD相关的表型。异源六核苷酸重复扩增序列的插入可以直接测量,例如通过测定阐述为SEQ IDNO:1的六核苷酸序列的情形(例如重复)在异源六核苷酸重复扩增序列中的大致数目,例如通过DNA印迹或聚合酶链反应基因分型反应。
采用非人类动物的方法,所述非人类动物在内源C9ORF72基因座中插有异源六核苷酸重复扩增序列
如本文所述的非人类动物为神经退化性疾病、病症和病状提供改进的动物模型。具体地说,本文所述的非人类动物提供了改进的动物模型,其转变为以上运动神经元症状和/或非运动神经元损失为特征的人类疾病,例如ALS和/或FTD。
如本文所述的非人类动物提供了改进的体内系统和生物材料来源(例如细胞),其包含且/或表达内源C9ORF72基因座中所插入的病原性异源六核苷酸重复扩增序列,并且适用于多种分析。在各种实施例中,本文所述的非人类动物可以用于开发治疗、预防且/或抑制与病原性异源六核苷酸重复扩增序列的表达和/或活性相关的一种或多种症状的治疗剂。在各种实施例中,本文所述的非人类动物是用于鉴定、筛选和/或开发候选治疗剂(例如抗体、gRNA(包含CRISPR RNA和tracRNA)和siRNA等),所述候选治疗剂结合病原性异源六核苷酸重复扩增序列或表达其产物(例如RAN翻译而产生)。在各种实施例中,本文所述的非人类动物是用于筛选和开发候选治疗剂(例如抗体、gRNA(包含CRISPR RNA和tracRNA)和siRNA等),所述候选治疗剂阻断病原性异源六核苷酸重复扩增序列或其表达产物(例如RAN翻译而产生)的活性。在各种实施例中,本文所述的非人类动物是用于测定病原性异源六核苷酸重复扩增序列或其表达产物(转录物)(例如RAN翻译而产生)的拮抗剂和/或促效剂在如本文所述的非人类动物中的结合特征曲线。在一些实施例中,本文所述的非人类动物是用于测定结合病原性异源六核苷酸重复扩增序列或其表达产物(例如RAN翻译而产生)的一种或多种候选治疗抗体的抗原决定基。
在各种实施例中,本文所述的非人类动物是用于测定靶向病原性异源六核苷酸重复扩增序列或其表达产物(例如RAN翻译而产生)的药物的药物动力学特征曲线。在各种实施例中,使本文所述的一种或多种非人类动物和一种或多种对照或参考非人类动物各自暴露于多种剂量(例如0.1mg/kg、0.2mg/kg、0.3mg/kg、0.4mg/kg、0.5mg/kg、1mg/kg、2mg/kg、3mg/kg、4mg/kg、5mg/mg、7.5mg/kg、10mg/kg、15mg/kg、20mg/kg、25mg/kg、30mg/kg、40mg/kg或50mg/kg或更大)的一种或多种候选药物,所述候选药物靶向病原性异源六核苷酸重复扩增序列或其表达产物(例如RAN翻译而产生)。候选治疗抗体可以通过任何所期望的投药途径给药,包括肠胃外和非肠胃外投药途径。肠胃外途径包括例如静脉内、动脉内、门静脉内、肌内、皮下、腹膜内、脊柱内、鞘内、脑室内、颅内、胸膜内或其它注射途径。非肠胃外途径包括例如口服、鼻、透皮、肺、直肠、颊内、阴道、眼途径。投药还可以通过连续输注、局部投药、从植入物(凝胶、膜等)持续释放,和/或静脉内注射进行。在不同时间点(例如0小时、6小时、1天、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天或多达30天或更多天),从非人类动物(人源化和对照)中分离出血液。可以使用获自如本文所述的非人类动物的样品进行各种分析以测定靶向病原性异源六核苷酸重复扩增序列或其表达产物(例如RAN翻译而产生)的所投药物的药物动力学特征曲线,包括(但不限于)总IgG、抗治疗抗体响应、凝集等。
在各种实施例中,如本文所述的非人类动物是用于测量阻断、调节和/或抑制病原性异源六核苷酸重复序列或其表达产物(例如重复相关非AUG(RAN)翻译而产生)的活性的治疗效果,和由于细胞变化而对基因表达的影响。在各种实施例中,使如本文所述的非人类动物或从其分离出的细胞暴露于靶向非人类动物的病原性异源六核苷酸重复扩增序列或其表达产物(例如RAN翻译而产生)的药物,并且随后过一段时间后,分析依赖于病原性异源六核苷酸重复扩增序列或其表达产物(例如RAN翻译而产生)的过程效应(或相互作用),例如RNA团簇形成、RAN翻译产物的蛋白质聚集、运动神经元和/或非运动神经元功能等。
如本文所述的非人类动物的细胞可以随时分离出来并且使用,或可以在培养中维持多代。在各种实施例中,使来自如本文所述的非人类动物的细胞永生化(例如,通过使用病毒)并且在培养中无限地维持(例如在连续培养中)。
本文所述的非人类动物为评估药物(例如,靶向病原性异源六核苷酸重复扩增序列或其表达产物(例如RAN翻译而产生)的药物)的药物动力学特性和/或功效提供了体内系统。在各种实施例中,药物可以递送到或施用于如本文所述的一种或多种非人类动物、来源于其或与其具有相同基因修饰的细胞,随后对非人类动物(或从其分离出的细胞)进行监测或进行一种或多种分析,以测定药物对非人类动物的影响。药物动力学特性包括(但不限于)动物如何将药物处理成各种代谢物(或检测一种或多种药物代谢物(包括(但不限于)毒性代谢物)的存在或不存在)、药物半衰期、投药之后的药物循环含量(例如血清药物浓度)、抗药物响应(例如抗药物抗体)、药物吸收和分布、投药途径、药物排出和/或清除途径。在一些实施例中,监测药物在本文所述的非人类动物中或通过使用本文所述的非人类动物来监测药物的药物动力学和药效学特性。
在一些实施例中,执行分析包括测定对药物所施用于的非人类动物的表型和/或基因型的影响。在一些实施例中,执行分析包括测定药物的批次间可变性。在一些实施例中,执行分析包括测定施用于本文所述的非人类动物与参考非人类动物的药物的作用之间的差异。在各种实施例中,参考非人类动物可以具有如本文所述的修饰,例如非病原性异源六核苷酸重复扩增序列的插入,或无修饰(即,野生型非人类动物)。
非人类动物(从其分离出的细胞和/或使用从其分离出的细胞)的可以测量的示例性参数(用于评估药物的药物动力学特性)包括(但不限于)凝集、自体吞噬、细胞分裂、细胞死亡、补体介导的溶血、DNA完整性、药物特异性抗体效价、药物代谢、基因表达阵列、代谢活性、线粒体活性、氧化应激、吞噬、蛋白质生物合成、蛋白质降解、蛋白质分泌、应激反应、靶组织药物浓度、非靶组织药物浓度、转录活性等等。在各种实施例中,本文所述的非人类动物用于确定药物(例如靶向病原性异源六核苷酸重复扩增序列或其表达产物(例如RAN翻译而产生))的医药学有效剂量。
实例
以下实例的提供是为了向所属领域的技术人员描述如何制备和使用本发明的方法和组合物,而非希望限制本发明人视为其发明的范围。除非另外指明,否则温度用摄氏度说明,且压力是或接近大气压。
实例1.将异源六核苷酸重复扩增序列插入非人类胚胎干细胞中的内源非人类C9ORF72基因座
这个实例说明将异源六核苷酸重复扩增序列靶向插入非人类动物(具体地说,啮齿动物)的胚胎干细胞中的C9orf72基因座。确切地说,这个实例具体描述了小鼠C9orf72基因座的非编码序列的一部分被异源人类六核苷酸重复扩增序列置换,所述六核苷酸重复扩增序列定位成与小鼠C9orf72启动子和/或人类调控元件可操作地连接,例如可以在人类C9orf72基因的外显子1a和/或1b中发现的那些人类调控元件。用于将异源六核苷酸重复扩增序列插入内源小鼠C9orf72基因座的C9orf72-HRE靶向载体如先前所述制得(参见例如美国专利第6,586,251号;Valenzuela等人,2003,自然·生物技术(Nature Biotech.)21(6):652-659;以及Adams,N.C.和N.W.Gale,于:哺乳动物和禽鸟转基因-新途径(Mammalian andAvian Transgenesis-New Approaches),Lois,S.P.a.C.编,Springer Verlag,BerlinHeidelberg,2006)。图1A底框中描绘了所得已修饰的C9orf72基因座。
简单地说,使用来自小鼠RP23BAC文库的细菌人工染色体(BAC)克隆系(Adams,D.J.等人,2005,基因组学(Genomics)86:753-758)产生包含SEQ ID NO:8或SEQ ID NO:9中所述的序列的靶向载体并且将其引入F1杂合体(129S6SvEvTac/C57BL6NTac)胚胎干细胞(ES)细胞中,随后在含有G418的选择培养基中培养。电穿孔之后第10天挑选耐药性群落且如此前所述根据正确靶向来筛选(Valenzuela等人,同上;Frendewey,D.等人,2010,酶学方法(Methods Enzymol.)476:295-307)。分析靶向ES细胞,以通过对C9orf72-HRE基因座进行的DNA印迹分析和/或扩增来测定存在于靶向小鼠ES细胞克隆系中的六核苷酸重复扩增的大致尺寸。
具体地说,进行DNA印迹分析以测定存在于靶向C9ORF72转基因小鼠ES细胞中的六核苷酸重复扩增的大致尺寸。从明胶涂布的96孔板的单一孔中生长的靶向小鼠ES克隆系中提取出基因组DNA。一旦ES细胞克隆系达到100%汇合,就用1xPBS洗涤细胞两次且在50uL溶解缓冲液(1M Tris pH 8.5、0.5M EDTA、20%SDS、5M NaCl和1mg/mL蛋白酶K)中、在37℃溶解隔夜。通过向每个孔中添加125uL冰冷的200标准酒精度的乙醇、随后在4℃培育隔夜而使DNA沉淀。沉淀的DNA用70%乙醇洗涤两次,风干并且再悬浮于30uL 0.5x TE pH 8.0中。
已提取的基因组DNA(gDNA)在37℃用HindII和ScaI消化整夜且在1%琼脂糖凝胶上进行尺寸分离。使电泳后的琼脂糖凝胶变性(1M NaCl,5%NaOH)且中和(1.5M NaCl、0.5MTris pH 7.5)。然后通过整夜的毛细管转移将已消化的gDNA转移到Hybond-N膜(Amersham)。
对应于人源化靶向载体内所含有的252bp XmaI片段(参见图2A)的探针
(5'-CCGGGGCGGGGCTGCGGTTGCGGTGCCTGCGCCCGCGGCGGCGGAGGCGCAGGCGGTGGCGAGTGGGTGAGTGAGGAGGCGGCATCCTGGCGGGTGGCTGTTTGGGGTTCGGCTGCCGGGAAGAGGCGCGGGTAGAAGCGGGGGCTCTCCTCAGAGCTCGACGCATTTTTACTTTCCCTCTCATTTCTCTGACCGAAGCTGGGTGTCGGGCTTTCGCCTCTAGCGACTGGTGGAATTGCCTGCATCCGGGCC-3';SEQ ID NO:29)
使用Prime-It II随机引物标记试剂盒(Agilent)用32P标记。变性的探针用ExpressHyb杂交溶液(Takara)稀释且与所制备的膜一起在65℃培育整夜。将放射自显影膜暴露于所探测的印迹72小时。
如图2B所示,将包含阐述为SEQ ID NO:4的序列的C9orf72-HRE-3靶向载体引入并且切除抗药盒之后,获得包含所插入的非病原性异源六核苷酸重复扩增序列的ES细胞克隆系(8027A-C4),所述异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的三个重复。在包含阐述为SEQ ID NO:6的序列的C9orf72-HRE-100靶向载体引入之后,获得至少两种ES细胞克隆系(8029A-A3和8029A-A6),其包含所插入的异源六核苷酸重复扩增序列,所述异源六核苷酸重复扩增序列是阐述为SEQ ID NO:7的序列的变异体并且包含阐述为SEQ ID NO:1的六核苷酸序列的约92个重复。C9orf72-HRE-100靶向载体(8028)引入并且抗药盒切除之后,还获得至少两种ES细胞克隆系(8029B-A6和8029B-A4),其包含所插入的异源六核苷酸重复扩增序列,所述异源六核苷酸重复扩增序列是阐述为SEQ ID NO:7的序列的变异体并且包含阐述为SEQ ID NO:1的六核苷酸序列的约30个重复。
还根据制造商说明书使用AmplideX PCR/CE C9ORF72试剂盒(Asuragen)确认阐述为SEQ ID NO:1的六核苷酸序列的情形在插入所述内源C9orf72ES细胞克隆系中的异源六核苷酸重复扩增序列中的数目。使用来自3X重复克隆系(8027A-C4)、2种个别92x重复克隆系(8029A-A3、8029A-A6)和2种30x重复克隆系(8029B-A4、8029B-A10)的已提纯的mESC基因组总DNA作为输入DNA。F1H4mESC基因组总DNA充当阴性对照组,且考瑞尔细胞储存库(Coriell Cell Repository)提纯的来自具有已知的C9ORF72六核苷酸扩增重复等位基因的患者的人类血细胞基因组DNA(样品ND11836(HRE基因型:8/已扩增)、ND14442(2/已扩增)、ND6769(13/44))充当阳性对照(考瑞尔医学研究所(Coriell Institute for MedicalResearch))。使用表4中的引物,在ABI 9700热循环仪(Thermo Fisher)上进行PCR。在使用POP-7聚合物(Thermo Fisher)和NuSieve琼脂糖凝胶(Lonza)的ABI 3500xL GenEscan上,通过毛细管电泳确定扩增子的尺寸。将2-log DNA梯状条带(新英格兰生物实验室(NewEngland BioLabs))分子量标记物装载于琼脂糖凝胶上用于比较,且色带通过SYBR金核酸染剂(Thermo Fisher)可视化。
表4
图2B证实插入小鼠ES细胞克隆系8027A-C4的内源C9orf72基因座中的异源六核苷酸重复扩增序列内部存在阐述为SEQ ID NO:1的六核苷酸序列的3个重复、插入小鼠ES细胞克隆系8029B-A9和8029B-A10的内源C9orf72基因座中的异源六核苷酸重复扩增序列内部存在阐述为SEQ ID NO:1的六核苷酸序列的约30个重复,且位于小鼠ES细胞克隆系8029A-A3和8029A-A6的内源C9orf72基因座处的异源六核苷酸重复扩增序列内部存在阐述为SEQID NO:1的六核苷酸序列的约92个重复。
实例2:产生胚胎干细胞衍生的运动神经元和非人类动物,其包含内源小鼠C9ORF72基因座处的异源六核苷酸重复扩增序列
胚胎干细胞衍生的运动神经元
将对于野生型C9orf72基因座来说是纯合(对照)或对于经过基因修饰而具有阐述为SEQ ID NO:1的六核苷酸序列的约3个重复(C9orf72HRE3 +/-)、30个重复(C9orf72HRE30 +/-)或92个重复((C9orf72HRE92 +/-)的C9orf72基因座来说是杂合的亲代胚胎干细胞(ESC)在胚胎干细胞培养基(ESM;DMEM+15%胎牛血清+青霉素/链霉素+谷氨酰胺+非必需氨基酸+核苷+β-巯基乙醇+丙酮酸钠+LIF)中培养2天,在此期间,培养基每天更换。ES培养基在胰蛋白酶消化之前的1小时,用7ml ADFNK培养基(Advanced DMEM/F12+神经基质培养基+10%基因敲除血清+青霉素/链霉素+谷氨酰胺+β-巯基乙醇)置换。抽出ADFNK培养基并且ESC用0.05%胰蛋白酶-EDTA进行胰蛋白酶处理。将集结的细胞再悬浮于12ml ADFNK中并且在悬浮液中生长两天。将细胞在补充有视黄酸(RA)和平滑化激动剂的ADFNK中再培养4天,以获得运动神经元(ESMN)。将解离的运动神经元接种于胚胎干细胞衍生的运动神经元培养基(ESMN;神经基质培养基+2%马血清+B27+谷氨酰胺+青霉素/链霉素+β-巯基乙醇+10ng/ml GDNF、BDNF、CNTF)中并且成熟。
非人类动物
使用方法(DeChiara,T.M.等人,2010,酶学方法(MethodsEnzymol.)476:285-294;Dechiara,T.M.,2009,分子生物学方法(Methods Mol.Biol.)530:311-324;Poueymirou等人,2007,自然·生物技术25:91-99),其中将靶向ES细胞注射到未紧密化的8细胞期Swiss Webster胚中,以产生对于C9orf72-HRE(3x或100x)插入来说是杂合的健康完全ES细胞衍生的F0代小鼠。使F0代杂合雄性与C57Bl6/NTac雌性杂交以产生F1杂合子,使所述杂合子互交以产生F2代C9orf72-HRE+/+、C9orf72-HRE+/-和野生型小鼠用于分子和表型分析。
实例3.对内源C9orf72基因座中具有异源六核苷酸重复扩增序列的运动神经元或脑组织进行的分析
最近,Liu等人(2017)细胞化学生物学(Cell Chem.Biol.)24:141-148使用定量聚合酶链反应(qPCR)和数字液滴聚合酶链反应(ddPCR)定量来自C9orf72基因座的有义和反义RNA转录物的拷贝数,所述基因座由从患有ALS的患者中分离出的人类成纤维细胞系或诱导型多能干细胞(iPSC)衍生的人类星形胶质细胞和运动神经元表达。Liu等人((2017)同上)检测到相比于来源于健康患者的成纤维细胞,患者来源的成纤维细胞中的有义内含子、反义和有义C9orf72转录物的数量显著更高。平均来说,每个患者来源的成纤维细胞中检测到C9orf72内含子和反义转录物的三个到四个拷贝以及C9orf72有义mRNA转录物的约15到20个拷贝。Liu等人(2017)同上。Liu等人((2017)等人,同上)展示出,相比之下,在非疾病成纤维细胞系中检测到一个或不到一个内含子和反义转录物,以及C9orf72有义mRNA转录物的5-10个拷贝。类似于成纤维细胞,患者来源的星形胶质细胞和神经元细胞中的内含子、反义和有义C9orf72转录物的表达高于健康对照者来源的星形胶质细胞和神经元细胞。Liu等人(2017)等人,同上。通过计算含有RNA团簇的细胞的百分比、每个细胞的团簇平均数和不同团簇数量在细胞间的分布,以及测定疾病或健康来源细胞中的C9orf72转录物数目,Liu等人((2017)等人,同上)提出疾病来源细胞中所发现的每个团簇是单一突变型C9orf72内含子或反义转录物,且另外,少量RNA分子可以对疾病具有相当大的影响。
在这个实例中,使用如上文所述的AmplideX PCR/CE C9ORF72试剂盒(Asuragen)确认F2动物中的六核苷酸重复尺寸在繁殖群落中的稳定性(数据未示出)。另外,检查小鼠胚胎干细胞衍生的运动神经元(ESMN)、脑组织和亲代胚胎干细胞中的RNA转录物,所述细胞包含野生型C9orf72基因座(对照)或经过基因修饰的包含阐述为SEQ ID NO:1的六核苷酸序列的三个、三十个或九十二个重复的C9orf72基因座。还评估亲代胚胎干细胞衍生的ESMN中的RNA团簇和二肽重复蛋白质含量,所述亲代胚胎干细胞包含野生型C9orf72基因座(对照)或经过基因修饰的包含阐述为SEQ ID NO:1的六核苷酸序列的三个、三十个或九十二个重复的C9orf72基因座。
材料和方法
定量聚合酶链反应
从每个样品中提取出总RNA且使用侧接各个区域的引物和检测已修饰的C9orf72-HRE基因座的那些区域的探针逆转录。可检测区域包括横跨小鼠和人类序列的连接点、单独的人类序列或单独的小鼠序列的那些区域。使用容易获得的试剂盒中的探针和引物对GAPDH或β2-微球蛋白执行QPCR。
具体地说,从胚胎干细胞衍生的运动神经元(ESMN)、亲代胚胎干细胞(ES)细胞或整个脑中分离出RNA,所述细胞或整个脑是从包含野生型(WT)C9orf72基因座(对照)或经过基因修饰的包含阐述为SEQ ID NO:1的六核苷酸序列的3、30或92个重复的C9orf72基因座的小鼠中分离
使用Direct-zol RNA Miniprep plus试剂盒,根据制造商方案(Zymo Research)分离出总RNA。约1μg总RNA在25℃下用脱氧核糖核酸酶I(ThermoFisher)处理15分钟。添加EDTA且混合物在65℃下培育10分钟。使用具有ds脱氧核糖核酸酶(ThermoFisher)的MaximaH Minus第一链cDNA合成试剂盒执行逆转录(RT)反应。脱氧核糖核酸酶I处理之后,添加10μL含有室温缓冲液、无规六聚物引物、dNTP、Maxima H minus酶混合物的室温混合物,使最终体积为20μL。室温反应混合物在25℃下培育10分钟,然后在50℃培育15分钟,然后在85℃下培育5分钟,以使酶失活。cDNA混合物用水稀释以达到100μL最终体积。
逆转录之后,使PCR反应溶液复原到8μL最终体积,其含有3μL cDNA和5μL PCR混合物、探针和基因特异性引物。除非另外指出,否则最终的引物和探针浓度分别是0.5μM和0.25μM。qPCR是在ViiATM 7实时PCR检测系统(ThermoFisher)上进行。PCR反应是在光学384孔板中四重复进行,95℃10分钟和95℃3秒、60℃30秒,45个循环。表5中提供了每次分析(A、B、F、G、H)中使用的引物和探针序列和SEQ ID NO。
表5
蛋白质印迹分析
收集分化的类胚胎体(EB)并且在SDS样品缓冲液(2%SDS、10%甘油、5%β-巯基乙醇、60mM TrisHCl pH 6.8、溴酚蓝)中均质化。使用RC DC蛋白质分析(BioRad)定量蛋白质提取物。提取物(10μg)在4-20%SDS-PAGE凝胶(ThermoFisher)上泳动且使用iBLOT转移单元(ThermoFisher)转移到硝酸纤维膜上。使用针对C9orf72和GAPDH的初级抗体(Millipore)探测免疫印迹。已结合的抗体如下检测:与和辣根过氧化酶(Abcam)结合的二级抗体一起培育,随后使用SuperSignal West Pico化学发光底物(Thermo Scientific)引起化学发光。使用全速蓝色敏感性医学X射线膜(Ewen Parker XRay Corporation),通过放射自显影来检测信号。使用ImageJ计算相对蛋白质含量。
用于检测RNA和翻译产物的荧光原位杂交法(FISH)和免疫荧光法(IF)
荧光原位杂交法(FISH)和免疫荧光法分别用于测定从阐述为SEQ ID NO:1的六核苷酸重复序列转录的RNA以及从其翻译的二肽重复蛋白在如实例3中所述产生的胚胎干细胞衍生运动神经元(ESMN)中的位置。简单地说,ESMN在四孔室载玻片(Lab-Tek II室载玻片系统,ThermoFisher Scientific)中生长并且用含4%PFA(Electron MicroscopySciences)的PBS固定。细胞然后用焦碳酸二乙酯(DEPC)、PBS/0.2%Triton X-100(FisherScientific,目录#BP151)渗透并且用DEPC-PBS洗涤,用LNA或DNA寡核苷酸阻断且染色以便检测RNA转录产物,或用抗聚GA抗体阻断且染色以便检测RAN翻译产物,如下文所述。染色之后,载玻片随后与适当的荧光染料一起培育,用Fluoromount G(Southern Biotech)固定且使用共聚焦显微镜目测。
有义或反义RNA转录产物的检测
载玻片在66℃(对于LNA探针)或55℃(对于DNA探针)下通过缓冲液预杂交30分钟,所述缓冲液由以下组成:50%甲酰胺(IBI Scientific,目录#IB72020)、DEPC 2×SSC[300mM氯化钠、30mM柠檬酸钠(pH 7.0)]、10%(w/v)硫酸葡聚糖(Sigma-Aldrich,目录#D8960)和DEPC 50mM磷酸钠(pH 7.0)。然后排出杂交缓冲液,且向每个载玻片中添加400μl含有40nM LNA探针混合物或200ng/ml DNA探针混合物的杂交缓冲液且在黑暗中、在66℃(对于LNA探针)或55℃(对于DNA探针)下培育3小时。与LNA探针一起培育的载玻片在室温下用DEPC 2×SSC/0.1%Tween 20(Fisher Scientific,目录号BP337)冲洗一次并且在65℃下用DEPC 0.1×SSC冲洗三次。与DNA探针一起培育的载玻片用含有40%甲酰胺的2×SSC洗涤三次且用PBS短暂洗涤一次。载玻片随后与1μg/mL DAPI(分子探针有限公司(MolecularProbes Inc.))一起培育。
下表6中提供了这个实例中所用的LNA和DNA寡核苷酸探针的序列和SEQ ID NO:以及探针的杂交条件。
表6
二肽重复蛋白产物的检测
渗透之后,载玻片用含有0.2%Triton X100(TBS-T)的Tris缓冲盐水(pH 7.4)中所稀释的5%正常驴血清阻断。载玻片在4℃下与含有5%正常驴血清的TBS-T中所稀释的针对聚GA的初级抗体(Millipore)一起培育整夜。用TBS-T洗涤3次之后,将载玻片与和Alexa488或555偶联的物种特异性二级抗体(1:1000于TBS-T中,ThermoFisher)和DAPI(1μg/ml)(分子探针有限公司)一起在室温下培育1小时。用TBS-T洗涤3次之后,载玻片用Fluoromount G(Southern Biotech)固定并且使用共聚焦显微镜目测。
结果
如图4、5和6所示,在C9orf72基因座包含阐述为SEQ ID NO:1的六核苷酸重复扩增序列的ESMN、全脑和神经元组织展示C9orf72mRNA转录物的表达增加。这种增加似乎与C9orf72基因座的外显子1a和1b之间存在的六核苷酸重复的数量相关。图6还表明,类似于从内源C9orf72基因座包含阐述为SEQ ID NO:1的异源六核苷酸序列的3个或92个重复的小鼠分离出的神经元组织和构成其的ESMN,内源C9orf72基因座包含阐述为SEQ ID NO:1的异源六核苷酸序列的3个或92个重复的小鼠的非神经元组织(例如肌肉和心脏)中的C9orf72表达也增强。另外,所述增强是人源化C9orf72等位基因所特有的;在杂合小鼠中,不含所述重复序列的小鼠C9orf72等位基因的表达未见增强(数据未示出)。
初步计算表明,具有阐述为SEQ ID NO:1的六核苷酸序列的三十个或九十二个重复的ESMN或脑细胞具有每个细胞约17个C9orf72mRNA拷贝,这符合Liu等人((2017)同上)的发现。阐述为SEQ ID NO:1的六核苷酸序列的重复数量增加还与C9orf72蛋白含量(图7和8)、有义和反义C9orf72 RNA团簇在核和细胞质中的聚积(图9A和9B)以及二肽重复蛋白(图10)的增加直接相关。本文所示的数据表明,阐述为SEQ ID NO:1的六核苷酸序列的重复数量在C9orf72基因座处的增加使得细胞展现与从诊断患有ALS的患者分离出的人类细胞类似的分子表型(例如RNA团簇的转录、聚积增加,和/或增加的二肽重复蛋白),并且支持本文所公开的非人类动物用作神经退化性疾病的疾病模型的用途。
实例4.内源C9orf72基因座中具有异源六核苷酸重复扩增序列的非人类动物的行为分析
这个实例描述了对本文所述的非人类动物(例如啮齿动物)关于ALS样症状(例如体重降低和/或显著运动异常)的行为分析,所述症状起因于异源六核苷酸重复扩增序列插入如实例1中所述的啮齿动物(例如小鼠)内源C9orf72基因座。
第8、18、37周(雌性)和第57-60周(雄性),对如上文所述在内源C9orf72基因座中插有病原性异源六核苷酸重复扩增序列的小鼠和/或对照小鼠(例如野生型小鼠或如上文所述在内源C9orf72基因座中插有非病原性异源六核苷酸重复扩增序列的小鼠)进行表型研究。体重测量两周一次,并且通过μCT扫描(动态60)来分析身体组成。利用标准24扫描来目测颈部脊椎区域的肿块。所有动物程序都依照Regeneron Pharmaceuticals机构动物护理和使用委员会批准的方案进行。
使用盲法主观评分分析来评估整体运动机能。使用旋杆、旷野运动和猫道测试来分析运动障碍。使用ALS治疗开发研究所(ALSTDI,Gill A等人,2009,PLoS One 4:e6489)开发的系统来度量运动障碍分数。在猫道测试期间,受试者行走跨越被照射的玻璃平台,同时摄像机从下方记录。报告每个动物的步态相关参数,例如步幅图案、个别爪摆动速度、站立持续时间和压力。这项测试是用于确定小鼠表型并且评估新颖化学实体对运动行为的影响。CatWalk XT是一种系统,其用于量化评估大鼠和小鼠的脚下跌落和步态。其用于在几乎任何种类的中枢神经、外周神经、肌肉或骨架异常的实验模型中评估啮齿动物的运动能力。
CatWalk步态分析:将动物放在Noldus CatWalk XT 10的跑道的起点,其中开放端位于其前方。小鼠自发地跑到跑道的末端以试图逃出。相机进行记录并且系统的软件测量足迹。对爪位异常的足迹进行分析。
旷野测试:将小鼠放在Kinder Scientific旷野系统中并且评估60分钟。所述设备使用红外光束和计算机软件来计算细微移动、X+Y移动、行进距离、直立事件数量、直立花费的时间和不活动时间。
旋杆:旋杆测试(IITC Life Science,Woodland Hills,CA)是测量小鼠从旋转梁掉落的潜伏期。旋杆是按照以1rpm开始并且在180秒内加速到15rpm的实验方案设定。然后,记录动物依循递增方案掉落的潜伏期。使用动物停留在梁上而不掉落的三次最长持续时间的平均值和最大值来评估掉落潜伏期。设法在梁上停留长于180秒的动物视为无症状的。
上运动神经元损伤表现为痉挛(即,僵硬)、反射增强、颤抖、动作迟缓和巴宾斯基征象(Babinski signs)。下运动神经元损伤表现为肌无力、消瘦、紧抱、足部卷曲和拖动,以及肌束震颤。延髓损伤表现为吞咽困难、发音不清和舌肌束震颤。从32周开始直到60周龄,还评估整体运动机能(在指定周的活动物百分比)。每周对小鼠称重,且使用盲法主观评分分析(如上文所述)执行整体运动功能的评估。对两组小鼠进行每周一次或每两个月一次的临床神经检查,查看它们运动障碍、它们后肢肌肉的震颤和僵硬。就运动障碍来说,使用零(无症状)到四(小鼠在侧向放置的30秒内无法使自身恢复直立)的盲法神经评分量表,如表7中所示。
表7
对于震颤和僵硬来说,使用具有零(无症状)到三(严重)的量表的评分系统。表8阐述在测试期间与动物的运动障碍、震颤和僵硬有关的评分方法。
表8
在另一实验中,使用握力测试检查小鼠。简单来说,握力是作为前肢的最大肌肉力量来度量神经肌肉功能,并且通过小鼠在连接到传感器的网格上施加的抓握来评估。所获得的全部握力值都相对于小鼠体重归一化。
在另一实验中,从约60周龄的对照小鼠和包含插入内源C9orf72基因座中的病原性异源六核苷酸重复扩增序列的小鼠收集腰部脊髓进行组织病理学分析。在测试组和对照组中,观察脊髓中的运动神经元总数,和运动神经元的平均细胞体面积。
通过将20周龄的对照小鼠和包含插入的病原性异源六核苷酸重复扩增序列的测试小鼠放在48℃、52℃或55℃下所维持的金属表面上来测试动物的热伤害感受(IITC,Woodland Hills,CA)。测量对热刺激出现响应的潜伏期,其定义为直到动物舔弹开的后爪所逝去的时间。小鼠停留在板上直到它们表现两种伤害防御行为中的任一种:舔后爪或摇后爪。
实例5.使用CRISPR/Cas9系统将非人类胚胎干细胞中的内源非人类C9ORF72基因座的异源六核苷酸重复扩增序列缺失
对参考六核苷酸重复扩增序列(包含阐述为SEQ ID NO:1的六核苷酸序列的至少一个、至少约三个、至少约五个、至少约十五个、至少约二十个、至少约三十个、至少约四十个、至少约五十个、至少约60个、至少约70个、至少约80个或至少约90个重复,优选邻接的重复)的潜在向导RNA(gRNA)序列进行分析且评分。合成编码潜在有效gRNA(例如crRNA和/或tracRNA)的DNA并且将其放置到表达构建体中,所述表达构建体还可以包含编码Cas蛋白的核酸。参见例如图12。用包含编码gRNA和/或Cas蛋白的DNA和抗药基因的表达构建体转染包含参考六核苷酸重复扩增序列的ES细胞。通过连续稀释获得抗药性克隆系,扩增用于分析且冷冻。从每种抗药性ES细胞克隆系中分离出DNA且通过PCR分析并且在琼脂糖凝胶上目测。提取正确尺寸的PCR产物且进一步测序以确认靶向六核苷酸重复扩增序列的缺失。
图11不按比例描绘非限制性示例性参考六核苷酸重复扩增序列,例如如在实例1产生的8029A-A6ES细胞中发现,例如具有阐述为SEQ ID NO:45的序列,并且其位置更有可能被gRNA成功地靶向。表9中提供了编码靶向图11中所描绘的位置的crRNA的DNA序列(其示例性序列作为SEQ ID NO:45提供),和各自的SEQ ID NO:。值得注意的是,阐述为SEQ IDNO:46-50的序列含有阐述为SEQ ID NO:45的参考六核苷酸重复扩增序列中未发现的初始鸟嘌呤,用于U6启动子存在下的最佳表达。
表9所设计的gRNA序列
制备(整合DNA技术)编码如表9中所阐述的crRNA的DNA并且将其插入与编码tracrRNA的DNA(例如包含阐述为SEQ ID NO:63的序列的DNA)可操作地连接的表达构建体中。使用表10中所述的载体筛选引物,通过聚合酶链反应来确认crRNA编码序列的成功连接,并且使用载体测序引物(也阐述于表10中),通过序列分析来确认gRNA(crRNA和tracrRNA)编码序列的序列。对包含处于U6启动子控制下的正确gRNA编码序列、编码cas9蛋白的核酸和嘌呤霉素抗性基因的表达构建体(图12)进行扩增且提纯。
表10
如实例1中获得且包含六核苷酸重复扩增序列的8029A-A6克隆系用表9中所述的crRNA(加上tracrRNA序列)、嘌呤霉素抗性基因和CRISPR/Cas9核酸内切酶基因的不同组合进行转染,所述六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的约92个重复(例如阐述为SEQ ID NO:45的参考序列)。在一种组合中,用CRISPR/Cas9系统转染ES细胞,所述CRISPR/Cas9系统靶向起始于SEQ ID NO:45的位置190、196、274、899、905、1006和1068的序列(例如包含编码cas9蛋白的核酸和/或gRNA插入序列的表达构建体,所述gRNA插入序列具有SEQ ID NO:39、44和46-50的序列。在第二种组合中,用CRISPR/Cas9系统转染ES细胞,所述CRISPR/Cas9系统靶向SEQ ID NO:45的位置196、1006和1067(例如包含编码cas9蛋白的核酸和/或编码gRNA插入序列的DNA的表达构建体,所述gRNA插入序列包含分别阐述为SEQ ID NO:39、50和44的序列)。在第三组合中,用gRNA插入序列转染ES细胞,所述gRNA插入序列靶向SEQ ID NO:45的位置196、272和1005和1067(例如包含编码cas9蛋白的核酸和/或gRNA插入序列的表达构建体,所述gRNA插入序列包含分别阐述为SEQ ID NO:39、47、50和44的序列)。
通过连续稀释来获得嘌呤霉素抗性ES克隆系,在培养基(500ml KO DMEM培养基、95ml热灭活FBS、12mL L-谷氨酰胺、6mL Penn-Step、6mL非必需氨基酸、1.2mL B-巯基乙醇)中培养,扩增用于分析,并且冷冻。使用血液和组织脱氧核糖核酸酶试剂盒,根据制造商方案(Qiagen)从各种克隆系中分离出DNA并且使用表10中所述的克隆筛选用的正向引物和筛选用的反向引物、通过PCR进行分析。通过琼脂糖凝胶电泳来目测PCR产物,并且提取出正确尺寸的PCR产物且进一步测序以确认靶向六核苷酸重复扩增序列的缺失。
在一百六十(160)种克隆系中,测试了一百种克隆系并且十一种(11)展现六核苷酸重复扩增序列的缺失,例如如300到700个碱基对的已扩增PCR产物所展现(数据未示出)。序列分析确认六核苷酸重复扩增序列缺失(数据未示出)。在所测试的三种组合中,靶向SEQID NO:45的位置196、1005和1067组合的CRISPR/Cas系统证实最有效地缺失六核苷酸重复扩增序列;这种组合产生十一种阳性克隆系中的十种。靶向SEQ ID NO:45的位置196、272、1005和1067组合的CRISPR/Cas系统提供一种克隆系。
等效物
在如此描述本发明的至少一个实施例的若干方面后,所属领域的技术人员应了解,所属领域的技术人员将容易想到各种更改、修改和改进。这些更改、修改以及改进希望是本公开的一部分,并且希望属于本发明的精神和范围内。因此,前述描述和附图只是为了举例且本发明通过以下权利要求书详细描述。
在权利要求书中使用如“第一”、“第二”、“第三”等序数术语修饰权利要求要素本身不意味着一个权利要求要素超过另一要素或执行方法动作的时序的优先权、优先级或排序,而是仅用作区分具有某一名称的一个权利要求要素与具有相同名称的另一要素的标记(除使用序数术语外)以区分权利要求要素。
除非明确相反地指出,否则说明书和权利要求书中的冠词“一个(a/an)”应该理解为包括复数个指示物。除非相反地指出或从上下文中显而易见,否则在群组中的一或多个成员之间包括“或”的权利要求或描述,视为满足给定产物或方法中存在、采用一个、超过一个或全部群组成员,或者与其有关。本发明包括群组中恰好一个成员存在于、用于给定产品或方法中或另外与其相关的实施例。本发明还包括超过一个或全部群组成员存在于、用于给定产品或方法中或另外与其相关的实施例。此外,应理解,除非另外指明或除非所属领域的技术人员明显知道将产生矛盾或不一致,否则本发明涵盖所有变型、组合和排列,其中来自一个或多个所列权利要求中的一个或多个限制、要素、条项、描述性用语等引入另一个依附于相同基本权利要求的权利要求(或相关的任何其它权利要求)中。在要素以列举方式呈现的情况下(例如马库什群组(Markush group)或类似格式),应理解,还公开了要素的每个亚群,并且可以从所述群组中去除任何要素。应理解,一般来说,在本发明或本发明的方面被称为包含具体要素、特征等时,本发明的或本发明的方面的某些实施例由所述要素、特征等组成或主要由所述要素、特征等组成。为了简单起见,那些实施例在本文中并不是在每种情况下都用这么多词语来具体描述。还应了解,本发明的任何实施例或方面可以从权利要求书明确排除,不管特定排除是否叙述于说明书中。
所属领域的技术人员将了解可归因于本文所述分析或其它过程中所得值的偏差或误差的典型标准。
本文中为了描述发明背景和提供关于其实施的其它细节而引用的出版物、网站和其它参考材料以引用的方式并入本文中。
序列表
<110> 瑞泽恩制药公司
大卫·赫斯林
洛葛仙妮·艾莉
家珍·萧
卡曼·维纳斯·莱
大卫·M.·巴伦苏埃拉
国春·龚
迈克尔·拉克鲁瓦-法利什
林恩·麦克唐纳
阿尔蒂·夏尔马
大辅·梶村
古斯塔沃·德罗格特
大卫·弗伦杜威
<120> C9ORF72基因座中具有六核苷酸重复扩增的非人类动物
<130> 017283.1366/10267WO01
<150> 62402613
<151> 2016-09-30
<150> 62452795
<151> 2017-01-31
<160> 84
<170> PatentIn版本3.5
<210> 1
<211> 6
<212> DNA
<213> 人工序列
<220>
<223> 异源六核苷酸序列
<400> 1
ggggcc 6
<210> 2
<211> 964
<212> DNA
<213> 智人
<400> 2
gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60
ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120
attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180
ggagtcgcgc gctatgcgat cgcggggccg gggccggggc cgcgatcgcg gggcgtggtc 240
ggggcgggcc cgggggcggg cccggggcgg ggctgcggtt gcggtgcctg cgcccgcggc 300
ggcggaggcg caggcggtgg cgagtgggtg agtgaggagg cggcatcctg gcgggtggct 360
gtttggggtt cggctgccgg gaagaggcgc gggtagaagc gggggctctc ctcagagctc 420
gacgcatttt tactttccct ctcatttctc tgaccgaagc tgggtgtcgg gctttcgcct 480
ctagcgactg gtggaattgc ctgcatccgg gccccgggct tcccggcggc ggcggcggcg 540
gcggcggcgc agggacaagg gatggggatc tggcctcttc cttgctttcc cgccctcagt 600
acccgagctg tctccttccc ggggacccgc tgggagcgct gccgctgcgg gctcgagaaa 660
agggagcctc gggtactgag aggcctcgcc tgggggaagg ccggagggtg ggcggcgcgc 720
ggcttctgcg gaccaagtcg gggttcgcta ggaacccgag acggtccctg ccggcgagga 780
gatcatgcgg gatgagatgg gggtgtggag acgcctgcac aatttcagcc caagcttcta 840
gagagtggtg atgacttgca tatgagggca gcaatgcaag tcggtgtgct ccccattctg 900
tgggacatga cctggttgct tcacagctcc gagatgacac agacttgctt aaaggaagtg 960
actc 964
<210> 3
<211> 1528
<212> DNA
<213> 智人
<400> 3
gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60
ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120
attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180
ggagtcgcgc gctatgcgat cgccgtctcg gggccggggc cggggccggg gccggggccg 240
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 300
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 360
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 420
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 480
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 540
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 600
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 660
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 720
gggccggggc cggggccggg gccggggccg gggccggggc cgagaccctc gagggccggc 780
cgctagcgcg atcgcggggc gtggtcgggg cgggcccggg ggcgggcccg gggcggggct 840
gcggttgcgg tgcctgcgcc cgcggcggcg gaggcgcagg cggtggcgag tgggtgagtg 900
aggaggcggc atcctggcgg gtggctgttt ggggttcggc tgccgggaag aggcgcgggt 960
agaagcgggg gctctcctca gagctcgacg catttttact ttccctctca tttctctgac 1020
cgaagctggg tgtcgggctt tcgcctctag cgactggtgg aattgcctgc atccgggccc 1080
cgggcttccc ggcggcggcg gcggcggcgg cggcgcaggg acaagggatg gggatctggc 1140
ctcttccttg ctttcccgcc ctcagtaccc gagctgtctc cttcccgggg acccgctggg 1200
agcgctgccg ctgcgggctc gagaaaaggg agcctcgggt actgagaggc ctcgcctggg 1260
ggaaggccgg agggtgggcg gcgcgcggct tctgcggacc aagtcggggt tcgctaggaa 1320
cccgagacgg tccctgccgg cgaggagatc atgcgggatg agatgggggt gtggagacgc 1380
ctgcacaatt tcagcccaag cttctagaga gtggtgatga cttgcatatg agggcagcaa 1440
tgcaagtcgg tgtgctcccc attctgtggg acatgacctg gttgcttcac agctccgaga 1500
tgacacagac ttgcttaaag gaagtgac 1528
<210> 4
<211> 3621
<212> DNA
<213> 人工序列
<220>
<223> 无同源臂的8026插入核酸
<400> 4
gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60
ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120
attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180
ggagtcgcgc gctatgcgat cgcggggccg gggccggggc cgcgatcgcg gggcgtggtc 240
ggggcgggcc cgggggcggg cccggggcgg ggctgcggtt gcggtgcctg cgcccgcggc 300
ggcggaggcg caggcggtgg cgagtgggtg agtgaggagg cggcatcctg gcgggtggct 360
gtttggggtt cggctgccgg gaagaggcgc gggtagaagc gggggctctc ctcagagctc 420
gacgcatttt tactttccct ctcatttctc tgaccgaagc tgggtgtcgg gctttcgcct 480
ctagcgactg gtggaattgc ctgcatccgg gccccgggct tcccggcggc ggcggcggcg 540
gcggcggcgc agggacaagg gatggggatc tggcctcttc cttgctttcc cgccctcagt 600
acccgagctg tctccttccc ggggacccgc tgggagcgct gccgctgcgg gctcgagaaa 660
agggagcctc gggtactgag aggcctcgcc tgggggaagg ccggagggtg ggcggcgcgc 720
ggcttctgcg gaccaagtcg gggttcgcta ggaacccgag acggtccctg ccggcgagga 780
gatcatgcgg gatgagatgg gggtgtggag acgcctgcac aatttcagcc caagcttcta 840
gagagtggtg atgacttgca tatgagggca gcaatgcaag tcggtgtgct ccccattctg 900
tgggacatga cctggttgct tcacagctcc gagatgacac agacttgctt aaaggaagtg 960
actcgagata acttcgtata atgtatgcta tacgaagtta tatgcatggc ctccgcgccg 1020
ggttttggcg cctcccgcgg gcgcccccct cctcacggcg agcgctgcca cgtcagacga 1080
agggcgcagc gagcgtcctg atccttccgc ccggacgctc aggacagcgg cccgctgctc 1140
ataagactcg gccttagaac cccagtatca gcagaaggac attttaggac gggacttggg 1200
tgactctagg gcactggttt tctttccaga gagcggaaca ggcgaggaaa agtagtccct 1260
tctcggcgat tctgcggagg gatctccgtg gggcggtgaa cgccgatgat tatataagga 1320
cgcgccgggt gtggcacagc tagttccgtc gcagccggga tttgggtcgc ggttcttgtt 1380
tgtggatcgc tgtgatcgtc acttggtgag tagcgggctg ctgggctggc cggggctttc 1440
gtggccgccg ggccgctcgg tgggacggaa gcgtgtggag agaccgccaa gggctgtagt 1500
ctgggtccgc gagcaaggtt gccctgaact gggggttggg gggagcgcag caaaatggcg 1560
gctgttcccg agtcttgaat ggaagacgct tgtgaggcgg gctgtgaggt cgttgaaaca 1620
aggtgggggg catggtgggc ggcaagaacc caaggtcttg aggccttcgc taatgcggga 1680
aagctcttat tcgggtgaga tgggctgggg caccatctgg ggaccctgac gtgaagtttg 1740
tcactgactg gagaactcgg tttgtcgtct gttgcggggg cggcagttat ggcggtgccg 1800
ttgggcagtg cacccgtacc tttgggagcg cgcgccctcg tcgtgtcgtg acgtcacccg 1860
ttctgttggc ttataatgca gggtggggcc acctgccggt aggtgtgcgg taggcttttc 1920
tccgtcgcag gacgcagggt tcgggcctag ggtaggctct cctgaatcga caggcgccgg 1980
acctctggtg aggggaggga taagtgaggc gtcagtttct ttggtcggtt ttatgtacct 2040
atcttcttaa gtagctgaag ctccggtttt gaactatgcg ctcggggttg gcgagtgtgt 2100
tttgtgaagt tttttaggca ccttttgaaa tgtaatcatt tgggtcaata tgtaattttc 2160
agtgttagac tagtaaattg tccgctaaat tctggccgtt tttggctttt ttgttagacg 2220
tgttgacaat taatcatcgg catagtatat cggcatagta taatacgaca aggtgaggaa 2280
ctaaaccatg ggatcggcca ttgaacaaga tggattgcac gcaggttctc cggccgcttg 2340
ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct ctgatgccgc 2400
cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg acctgtccgg 2460
tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca cgacgggcgt 2520
tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc tgctattggg 2580
cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga aagtatccat 2640
catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc cattcgacca 2700
ccaagcgaaa catcgcatcg agcgagcacg tactcggatg gaagccggtc ttgtcgatca 2760
ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg ccaggctcaa 2820
ggcgcgcatg cccgacggcg atgatctcgt cgtgacccat ggcgatgcct gcttgccgaa 2880
tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc tgggtgtggc 2940
ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc ttggcggcga 3000
atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc agcgcatcgc 3060
cttctatcgc cttcttgacg agttcttctg aggggatccg ctgtaagtct gcagaaattg 3120
atgatctatt aaacaataaa gatgtccact aaaatggaag tttttcctgt catactttgt 3180
taagaagggt gagaacagag tacctacatt ttgaatggaa ggattggagc tacgggggtg 3240
ggggtggggt gggattagat aaatgcctgc tctttactga aggctcttta ctattgcttt 3300
atgataatgt ttcatagttg gatatcataa tttaaacaag caaaaccaaa ttaagggcca 3360
gctcattcct cccactcatg atctatagat ctatagatct ctcgtgggat cattgttttt 3420
ctcttgattc ccactttgtg gttctaagta ctgtggtttc caaatgtgtc agtttcatag 3480
cctgaagaac gagatcagca gcctctgttc cacatacact tcattctcag tattgttttg 3540
ccaagttcta attccatcag acctcgacct gcagccccta gataacttcg tataatgtat 3600
gctatacgaa gttatgctag c 3621
<210> 5
<211> 1006
<212> DNA
<213> 人工序列
<220>
<223> 无同源臂且neo切除之后的8026插入核酸
<400> 5
gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60
ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120
attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180
ggagtcgcgc gctatgcgat cgcggggccg gggccggggc cgcgatcgcg gggcgtggtc 240
ggggcgggcc cgggggcggg cccggggcgg ggctgcggtt gcggtgcctg cgcccgcggc 300
ggcggaggcg caggcggtgg cgagtgggtg agtgaggagg cggcatcctg gcgggtggct 360
gtttggggtt cggctgccgg gaagaggcgc gggtagaagc gggggctctc ctcagagctc 420
gacgcatttt tactttccct ctcatttctc tgaccgaagc tgggtgtcgg gctttcgcct 480
ctagcgactg gtggaattgc ctgcatccgg gccccgggct tcccggcggc ggcggcggcg 540
gcggcggcgc agggacaagg gatggggatc tggcctcttc cttgctttcc cgccctcagt 600
acccgagctg tctccttccc ggggacccgc tgggagcgct gccgctgcgg gctcgagaaa 660
agggagcctc gggtactgag aggcctcgcc tgggggaagg ccggagggtg ggcggcgcgc 720
ggcttctgcg gaccaagtcg gggttcgcta ggaacccgag acggtccctg ccggcgagga 780
gatcatgcgg gatgagatgg gggtgtggag acgcctgcac aatttcagcc caagcttcta 840
gagagtggtg atgacttgca tatgagggca gcaatgcaag tcggtgtgct ccccattctg 900
tgggacatga cctggttgct tcacagctcc gagatgacac agacttgctt aaaggaagtg 960
actcgagata acttcgtata atgtatgcta tacgaagtta tgctag 1006
<210> 6
<211> 4180
<212> DNA
<213> 人工序列
<220>
<223> 无同源臂加neo盒的8026插入核酸
<400> 6
ggtctagcaa gagcaggtgt gggtttagga ggtgtgtgtt tttgtttttc ccaccctctc 60
tccccactac ttgctctcac agtactcgct gagggtgaac aagaaaagac ctgataaaga 120
ttaaccagaa gaaaacaagg agggaaacaa ccgcagcctg tagcaagctc tggaactcag 180
gagtcgcgcg ctatgcgatc gccgtctcgg ggccggggcc ggggccgggg ccggggccgg 240
ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 300
ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 360
ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 420
ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 480
ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 540
ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 600
ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 660
ggccggggcc ggggccgggg ccggggccgg ggccggggcc ggggccgggg ccggggccgg 720
ggccggggcc ggggccgggg ccggggccgg ggccggggcc gagaccctcg agggccggcc 780
gctagcgcga tcgcggggcg tggtcggggc gggcccgggg gcgggcccgg ggcggggctg 840
cggttgcggt gcctgcgccc gcggcggcgg aggcgcaggc ggtggcgagt gggtgagtga 900
ggaggcggca tcctggcggg tggctgtttg gggttcggct gccgggaaga ggcgcgggta 960
gaagcggggg ctctcctcag agctcgacgc atttttactt tccctctcat ttctctgacc 1020
gaagctgggt gtcgggcttt cgcctctagc gactggtgga attgcctgca tccgggcccc 1080
gggcttcccg gcggcggcgg cggcggcggc ggcgcaggga caagggatgg ggatctggcc 1140
tcttccttgc tttcccgccc tcagtacccg agctgtctcc ttcccgggga cccgctggga 1200
gcgctgccgc tgcgggctcg agaaaaggga gcctcgggta ctgagaggcc tcgcctgggg 1260
gaaggccgga gggtgggcgg cgcgcggctt ctgcggacca agtcggggtt cgctaggaac 1320
ccgagacggt ccctgccggc gaggagatca tgcgggatga gatgggggtg tggagacgcc 1380
tgcacaattt cagcccaagc ttctagagag tggtgatgac ttgcatatga gggcagcaat 1440
gcaagtcggt gtgctcccca ttctgtggga catgacctgg ttgcttcaca gctccgagat 1500
gacacagact tgcttaaagg aagtgactcg agataacttc gtataatgta tgctatacga 1560
agttatatgc atggcctccg cgccgggttt tggcgcctcc cgcgggcgcc cccctcctca 1620
cggcgagcgc tgccacgtca gacgaagggc gcagcgagcg tcctgatcct tccgcccgga 1680
cgctcaggac agcggcccgc tgctcataag actcggcctt agaaccccag tatcagcaga 1740
aggacatttt aggacgggac ttgggtgact ctagggcact ggttttcttt ccagagagcg 1800
gaacaggcga ggaaaagtag tcccttctcg gcgattctgc ggagggatct ccgtggggcg 1860
gtgaacgccg atgattatat aaggacgcgc cgggtgtggc acagctagtt ccgtcgcagc 1920
cgggatttgg gtcgcggttc ttgtttgtgg atcgctgtga tcgtcacttg gtgagtagcg 1980
ggctgctggg ctggccgggg ctttcgtggc cgccgggccg ctcggtggga cggaagcgtg 2040
tggagagacc gccaagggct gtagtctggg tccgcgagca aggttgccct gaactggggg 2100
ttggggggag cgcagcaaaa tggcggctgt tcccgagtct tgaatggaag acgcttgtga 2160
ggcgggctgt gaggtcgttg aaacaaggtg gggggcatgg tgggcggcaa gaacccaagg 2220
tcttgaggcc ttcgctaatg cgggaaagct cttattcggg tgagatgggc tggggcacca 2280
tctggggacc ctgacgtgaa gtttgtcact gactggagaa ctcggtttgt cgtctgttgc 2340
gggggcggca gttatggcgg tgccgttggg cagtgcaccc gtacctttgg gagcgcgcgc 2400
cctcgtcgtg tcgtgacgtc acccgttctg ttggcttata atgcagggtg gggccacctg 2460
ccggtaggtg tgcggtaggc ttttctccgt cgcaggacgc agggttcggg cctagggtag 2520
gctctcctga atcgacaggc gccggacctc tggtgagggg agggataagt gaggcgtcag 2580
tttctttggt cggttttatg tacctatctt cttaagtagc tgaagctccg gttttgaact 2640
atgcgctcgg ggttggcgag tgtgttttgt gaagtttttt aggcaccttt tgaaatgtaa 2700
tcatttgggt caatatgtaa ttttcagtgt tagactagta aattgtccgc taaattctgg 2760
ccgtttttgg cttttttgtt agacgtgttg acaattaatc atcggcatag tatatcggca 2820
tagtataata cgacaaggtg aggaactaaa ccatgggatc ggccattgaa caagatggat 2880
tgcacgcagg ttctccggcc gcttgggtgg agaggctatt cggctatgac tgggcacaac 2940
agacaatcgg ctgctctgat gccgccgtgt tccggctgtc agcgcagggg cgcccggttc 3000
tttttgtcaa gaccgacctg tccggtgccc tgaatgaact gcaggacgag gcagcgcggc 3060
tatcgtggct ggccacgacg ggcgttcctt gcgcagctgt gctcgacgtt gtcactgaag 3120
cgggaaggga ctggctgcta ttgggcgaag tgccggggca ggatctcctg tcatctcacc 3180
ttgctcctgc cgagaaagta tccatcatgg ctgatgcaat gcggcggctg catacgcttg 3240
atccggctac ctgcccattc gaccaccaag cgaaacatcg catcgagcga gcacgtactc 3300
ggatggaagc cggtcttgtc gatcaggatg atctggacga agagcatcag gggctcgcgc 3360
cagccgaact gttcgccagg ctcaaggcgc gcatgcccga cggcgatgat ctcgtcgtga 3420
cccatggcga tgcctgcttg ccgaatatca tggtggaaaa tggccgcttt tctggattca 3480
tcgactgtgg ccggctgggt gtggcggacc gctatcagga catagcgttg gctacccgtg 3540
atattgctga agagcttggc ggcgaatggg ctgaccgctt cctcgtgctt tacggtatcg 3600
ccgctcccga ttcgcagcgc atcgccttct atcgccttct tgacgagttc ttctgagggg 3660
atccgctgta agtctgcaga aattgatgat ctattaaaca ataaagatgt ccactaaaat 3720
ggaagttttt cctgtcatac tttgttaaga agggtgagaa cagagtacct acattttgaa 3780
tggaaggatt ggagctacgg gggtgggggt ggggtgggat tagataaatg cctgctcttt 3840
actgaaggct ctttactatt gctttatgat aatgtttcat agttggatat cataatttaa 3900
acaagcaaaa ccaaattaag ggccagctca ttcctcccac tcatgatcta tagatctata 3960
gatctctcgt gggatcattg tttttctctt gattcccact ttgtggttct aagtactgtg 4020
gtttccaaat gtgtcagttt catagcctga agaacgagat cagcagcctc tgttccacat 4080
acacttcatt ctcagtattg ttttgccaag ttctaattcc atcagacctc gacctgcagc 4140
ccctagataa cttcgtataa tgtatgctat acgaagttat 4180
<210> 7
<211> 1566
<212> DNA
<213> 人工序列
<220>
<223> neo切除之后并且无同源臂的含有lox位点的8028插入核酸
<400> 7
gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60
ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120
attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180
ggagtcgcgc gctatgcgat cgccgtctcg gggccggggc cggggccggg gccggggccg 240
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 300
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 360
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 420
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 480
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 540
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 600
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 660
gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg 720
gggccggggc cggggccggg gccggggccg gggccggggc cgagaccctc gagggccggc 780
cgctagcgcg atcgcggggc gtggtcgggg cgggcccggg ggcgggcccg gggcggggct 840
gcggttgcgg tgcctgcgcc cgcggcggcg gaggcgcagg cggtggcgag tgggtgagtg 900
aggaggcggc atcctggcgg gtggctgttt ggggttcggc tgccgggaag aggcgcgggt 960
agaagcgggg gctctcctca gagctcgacg catttttact ttccctctca tttctctgac 1020
cgaagctggg tgtcgggctt tcgcctctag cgactggtgg aattgcctgc atccgggccc 1080
cgggcttccc ggcggcggcg gcggcggcgg cggcgcaggg acaagggatg gggatctggc 1140
ctcttccttg ctttcccgcc ctcagtaccc gagctgtctc cttcccgggg acccgctggg 1200
agcgctgccg ctgcgggctc gagaaaaggg agcctcgggt actgagaggc ctcgcctggg 1260
ggaaggccgg agggtgggcg gcgcgcggct tctgcggacc aagtcggggt tcgctaggaa 1320
cccgagacgg tccctgccgg cgaggagatc atgcgggatg agatgggggt gtggagacgc 1380
ctgcacaatt tcagcccaag cttctagaga gtggtgatga cttgcatatg agggcagcaa 1440
tgcaagtcgg tgtgctcccc attctgtggg acatgacctg gttgcttcac agctccgaga 1500
tgacacagac ttgcttaaag gaagtgactc gagataactt cgtataatgt atgctatacg 1560
aagtta 1566
<210> 8
<211> 3821
<212> DNA
<213> 人工序列
<220>
<223> 具有同源臂和neo盒的8026靶向核酸
<400> 8
gaaccgcggc gcgtcaagca gagacgagtt ccgcccacgt gaaagatggc gtttgtagtg 60
acagccatcc caattgccct ttccttctag gtggaaagtg gggtctagca agagcaggtg 120
tgggtttagg aggtgtgtgt ttttgttttt cccaccctct ctccccacta cttgctctca 180
cagtactcgc tgagggtgaa caagaaaaga cctgataaag attaaccaga agaaaacaag 240
gagggaaaca accgcagcct gtagcaagct ctggaactca ggagtcgcgc gctatgcgat 300
cgcggggccg gggccggggc cgcgatcgcg gggcgtggtc ggggcgggcc cgggggcggg 360
cccggggcgg ggctgcggtt gcggtgcctg cgcccgcggc ggcggaggcg caggcggtgg 420
cgagtgggtg agtgaggagg cggcatcctg gcgggtggct gtttggggtt cggctgccgg 480
gaagaggcgc gggtagaagc gggggctctc ctcagagctc gacgcatttt tactttccct 540
ctcatttctc tgaccgaagc tgggtgtcgg gctttcgcct ctagcgactg gtggaattgc 600
ctgcatccgg gccccgggct tcccggcggc ggcggcggcg gcggcggcgc agggacaagg 660
gatggggatc tggcctcttc cttgctttcc cgccctcagt acccgagctg tctccttccc 720
ggggacccgc tgggagcgct gccgctgcgg gctcgagaaa agggagcctc gggtactgag 780
aggcctcgcc tgggggaagg ccggagggtg ggcggcgcgc ggcttctgcg gaccaagtcg 840
gggttcgcta ggaacccgag acggtccctg ccggcgagga gatcatgcgg gatgagatgg 900
gggtgtggag acgcctgcac aatttcagcc caagcttcta gagagtggtg atgacttgca 960
tatgagggca gcaatgcaag tcggtgtgct ccccattctg tgggacatga cctggttgct 1020
tcacagctcc gagatgacac agacttgctt aaaggaagtg actcgagata acttcgtata 1080
atgtatgcta tacgaagtta tatgcatggc ctccgcgccg ggttttggcg cctcccgcgg 1140
gcgcccccct cctcacggcg agcgctgcca cgtcagacga agggcgcagc gagcgtcctg 1200
atccttccgc ccggacgctc aggacagcgg cccgctgctc ataagactcg gccttagaac 1260
cccagtatca gcagaaggac attttaggac gggacttggg tgactctagg gcactggttt 1320
tctttccaga gagcggaaca ggcgaggaaa agtagtccct tctcggcgat tctgcggagg 1380
gatctccgtg gggcggtgaa cgccgatgat tatataagga cgcgccgggt gtggcacagc 1440
tagttccgtc gcagccggga tttgggtcgc ggttcttgtt tgtggatcgc tgtgatcgtc 1500
acttggtgag tagcgggctg ctgggctggc cggggctttc gtggccgccg ggccgctcgg 1560
tgggacggaa gcgtgtggag agaccgccaa gggctgtagt ctgggtccgc gagcaaggtt 1620
gccctgaact gggggttggg gggagcgcag caaaatggcg gctgttcccg agtcttgaat 1680
ggaagacgct tgtgaggcgg gctgtgaggt cgttgaaaca aggtgggggg catggtgggc 1740
ggcaagaacc caaggtcttg aggccttcgc taatgcggga aagctcttat tcgggtgaga 1800
tgggctgggg caccatctgg ggaccctgac gtgaagtttg tcactgactg gagaactcgg 1860
tttgtcgtct gttgcggggg cggcagttat ggcggtgccg ttgggcagtg cacccgtacc 1920
tttgggagcg cgcgccctcg tcgtgtcgtg acgtcacccg ttctgttggc ttataatgca 1980
gggtggggcc acctgccggt aggtgtgcgg taggcttttc tccgtcgcag gacgcagggt 2040
tcgggcctag ggtaggctct cctgaatcga caggcgccgg acctctggtg aggggaggga 2100
taagtgaggc gtcagtttct ttggtcggtt ttatgtacct atcttcttaa gtagctgaag 2160
ctccggtttt gaactatgcg ctcggggttg gcgagtgtgt tttgtgaagt tttttaggca 2220
ccttttgaaa tgtaatcatt tgggtcaata tgtaattttc agtgttagac tagtaaattg 2280
tccgctaaat tctggccgtt tttggctttt ttgttagacg tgttgacaat taatcatcgg 2340
catagtatat cggcatagta taatacgaca aggtgaggaa ctaaaccatg ggatcggcca 2400
ttgaacaaga tggattgcac gcaggttctc cggccgcttg ggtggagagg ctattcggct 2460
atgactgggc acaacagaca atcggctgct ctgatgccgc cgtgttccgg ctgtcagcgc 2520
aggggcgccc ggttcttttt gtcaagaccg acctgtccgg tgccctgaat gaactgcagg 2580
acgaggcagc gcggctatcg tggctggcca cgacgggcgt tccttgcgca gctgtgctcg 2640
acgttgtcac tgaagcggga agggactggc tgctattggg cgaagtgccg gggcaggatc 2700
tcctgtcatc tcaccttgct cctgccgaga aagtatccat catggctgat gcaatgcggc 2760
ggctgcatac gcttgatccg gctacctgcc cattcgacca ccaagcgaaa catcgcatcg 2820
agcgagcacg tactcggatg gaagccggtc ttgtcgatca ggatgatctg gacgaagagc 2880
atcaggggct cgcgccagcc gaactgttcg ccaggctcaa ggcgcgcatg cccgacggcg 2940
atgatctcgt cgtgacccat ggcgatgcct gcttgccgaa tatcatggtg gaaaatggcc 3000
gcttttctgg attcatcgac tgtggccggc tgggtgtggc ggaccgctat caggacatag 3060
cgttggctac ccgtgatatt gctgaagagc ttggcggcga atgggctgac cgcttcctcg 3120
tgctttacgg tatcgccgct cccgattcgc agcgcatcgc cttctatcgc cttcttgacg 3180
agttcttctg aggggatccg ctgtaagtct gcagaaattg atgatctatt aaacaataaa 3240
gatgtccact aaaatggaag tttttcctgt catactttgt taagaagggt gagaacagag 3300
tacctacatt ttgaatggaa ggattggagc tacgggggtg ggggtggggt gggattagat 3360
aaatgcctgc tctttactga aggctcttta ctattgcttt atgataatgt ttcatagttg 3420
gatatcataa tttaaacaag caaaaccaaa ttaagggcca gctcattcct cccactcatg 3480
atctatagat ctatagatct ctcgtgggat cattgttttt ctcttgattc ccactttgtg 3540
gttctaagta ctgtggtttc caaatgtgtc agtttcatag cctgaagaac gagatcagca 3600
gcctctgttc cacatacact tcattctcag tattgttttg ccaagttcta attccatcag 3660
acctcgacct gcagccccta gataacttcg tataatgtat gctatacgaa gttatgctag 3720
cattgtgact tgggcatcac ttgactgatg gtaatcagtt gcagagagag aagtgcactg 3780
attaagtctg tccacacagg gtctgtctgg ccaggagtgc a 3821
<210> 9
<211> 4387
<212> DNA
<213> 人工序列
<220>
<223> 具有同源臂、六核苷酸重复和neo盒的8026插入核酸
<400> 9
gaaccgcggc gcgtcaagca gagacgagtt ccgcccacgt gaaagatggc gtttgtagtg 60
acagccatcc caattgccct ttccttctag gtggaaagtg gggtctagca agagcaggtg 120
tgggtttagg aggtgtgtgt ttttgttttt cccaccctct ctccccacta cttgctctca 180
cagtactcgc tgagggtgaa caagaaaaga cctgataaag attaaccaga agaaaacaag 240
gagggaaaca accgcagcct gtagcaagct ctggaactca ggagtcgcgc gctatgcgat 300
cgccgtctcg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 360
gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 420
gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 480
gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 540
gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 600
gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 660
gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 720
gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 780
gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc cggggccggg 840
gccggggccg gggccggggc cgagaccctc gagggccggc cgctagcgcg atcgcggggc 900
gtggtcgggg cgggcccggg ggcgggcccg gggcggggct gcggttgcgg tgcctgcgcc 960
cgcggcggcg gaggcgcagg cggtggcgag tgggtgagtg aggaggcggc atcctggcgg 1020
gtggctgttt ggggttcggc tgccgggaag aggcgcgggt agaagcgggg gctctcctca 1080
gagctcgacg catttttact ttccctctca tttctctgac cgaagctggg tgtcgggctt 1140
tcgcctctag cgactggtgg aattgcctgc atccgggccc cgggcttccc ggcggcggcg 1200
gcggcggcgg cggcgcaggg acaagggatg gggatctggc ctcttccttg ctttcccgcc 1260
ctcagtaccc gagctgtctc cttcccgggg acccgctggg agcgctgccg ctgcgggctc 1320
gagaaaaggg agcctcgggt actgagaggc ctcgcctggg ggaaggccgg agggtgggcg 1380
gcgcgcggct tctgcggacc aagtcggggt tcgctaggaa cccgagacgg tccctgccgg 1440
cgaggagatc atgcgggatg agatgggggt gtggagacgc ctgcacaatt tcagcccaag 1500
cttctagaga gtggtgatga cttgcatatg agggcagcaa tgcaagtcgg tgtgctcccc 1560
attctgtggg acatgacctg gttgcttcac agctccgaga tgacacagac ttgcttaaag 1620
gaagtgactc gagataactt cgtataatgt atgctatacg aagttatatg catggcctcc 1680
gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg ctgccacgtc 1740
agacgaaggg cgcagcgagc gtcctgatcc ttccgcccgg acgctcagga cagcggcccg 1800
ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt taggacggga 1860
cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg aggaaaagta 1920
gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc gatgattata 1980
taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg ggtcgcggtt 2040
cttgtttgtg gatcgctgtg atcgtcactt ggtgagtagc gggctgctgg gctggccggg 2100
gctttcgtgg ccgccgggcc gctcggtggg acggaagcgt gtggagagac cgccaagggc 2160
tgtagtctgg gtccgcgagc aaggttgccc tgaactgggg gttgggggga gcgcagcaaa 2220
atggcggctg ttcccgagtc ttgaatggaa gacgcttgtg aggcgggctg tgaggtcgtt 2280
gaaacaaggt ggggggcatg gtgggcggca agaacccaag gtcttgaggc cttcgctaat 2340
gcgggaaagc tcttattcgg gtgagatggg ctggggcacc atctggggac cctgacgtga 2400
agtttgtcac tgactggaga actcggtttg tcgtctgttg cgggggcggc agttatggcg 2460
gtgccgttgg gcagtgcacc cgtacctttg ggagcgcgcg ccctcgtcgt gtcgtgacgt 2520
cacccgttct gttggcttat aatgcagggt ggggccacct gccggtaggt gtgcggtagg 2580
cttttctccg tcgcaggacg cagggttcgg gcctagggta ggctctcctg aatcgacagg 2640
cgccggacct ctggtgaggg gagggataag tgaggcgtca gtttctttgg tcggttttat 2700
gtacctatct tcttaagtag ctgaagctcc ggttttgaac tatgcgctcg gggttggcga 2760
gtgtgttttg tgaagttttt taggcacctt ttgaaatgta atcatttggg tcaatatgta 2820
attttcagtg ttagactagt aaattgtccg ctaaattctg gccgtttttg gcttttttgt 2880
tagacgtgtt gacaattaat catcggcata gtatatcggc atagtataat acgacaaggt 2940
gaggaactaa accatgggat cggccattga acaagatgga ttgcacgcag gttctccggc 3000
cgcttgggtg gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga 3060
tgccgccgtg ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct 3120
gtccggtgcc ctgaatgaac tgcaggacga ggcagcgcgg ctatcgtggc tggccacgac 3180
gggcgttcct tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct 3240
attgggcgaa gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt 3300
atccatcatg gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt 3360
cgaccaccaa gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt 3420
cgatcaggat gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag 3480
gctcaaggcg cgcatgcccg acggcgatga tctcgtcgtg acccatggcg atgcctgctt 3540
gccgaatatc atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg 3600
tgtggcggac cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg 3660
cggcgaatgg gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg 3720
catcgccttc tatcgccttc ttgacgagtt cttctgaggg gatccgctgt aagtctgcag 3780
aaattgatga tctattaaac aataaagatg tccactaaaa tggaagtttt tcctgtcata 3840
ctttgttaag aagggtgaga acagagtacc tacattttga atggaaggat tggagctacg 3900
ggggtggggg tggggtggga ttagataaat gcctgctctt tactgaaggc tctttactat 3960
tgctttatga taatgtttca tagttggata tcataattta aacaagcaaa accaaattaa 4020
gggccagctc attcctccca ctcatgatct atagatctat agatctctcg tgggatcatt 4080
gtttttctct tgattcccac tttgtggttc taagtactgt ggtttccaaa tgtgtcagtt 4140
tcatagcctg aagaacgaga tcagcagcct ctgttccaca tacacttcat tctcagtatt 4200
gttttgccaa gttctaattc catcagacct cgacctgcag cccctagata acttcgtata 4260
atgtatgcta tacgaagtta tgctagcatt gtgacttggg catcacttga ctgatggtaa 4320
tcagttgcag agagagaagt gcactgatta agtctgtcca cacagggtct gtctggccag 4380
gagtgca 4387
<210> 10
<211> 1957
<212> DNA
<213> 智人
<400> 10
acgtaaccta cggtgtcccg ctaggaaaga gaggtgcgtc aaacagcgac aagttccgcc 60
cacgtaaaag atgacgcttg atatctccgg agcatttgga taatgtgaca gttggaatgc 120
agtgatgtcg actctttgcc caccgccatc tccagctgtt gccaagacag agattgcttt 180
aagtggcaaa tcacctttat tagcagctac ttttgcttac tgggacaata ttcttggtcc 240
tagagtaagg cacatttggg ctccaaagac agaacaggta cttctcagtg atggagaaat 300
aacttttctt gccaaccaca ctctaaatgg agaaatcctt cgaaatgcag agagtggtgc 360
tatagatgta aagttttttg tcttgtctga aaagggagtg attattgttt cattaatctt 420
tgatggaaac tggaatgggg atcgcagcac atatggacta tcaattatac ttccacagac 480
agaacttagt ttctacctcc cacttcatag agtgtgtgtt gatagattaa cacatataat 540
ccggaaagga agaatatgga tgcataagga aagacaagaa aatgtccaga agattatctt 600
agaaggcaca gagagaatgg aagatcaggg tcagagtatt attccaatgc ttactggaga 660
agtgattcct gtaatggaac tgctttcatc tatgaaatca cacagtgttc ctgaagaaat 720
agatatagct gatacagtac tcaatgatga tgatattggt gacagctgtc atgaaggctt 780
tcttctcaag taagaatttt tcttttcata aaagctggat gaagcagata ccatcttatg 840
ctcacctatg acaagatttg gaagaaagaa aataacagac tgtctactta gattgttcta 900
gggacattac gtatttgaac tgttgcttaa atttgtgtta tttttcactc attatatttc 960
tatatatatt tggtgttatt ccatttgcta tttaaagaaa ccgagtttcc atcccagaca 1020
agaaatcatg gccccttgct tgattctggt ttcttgtttt acttctcatt aaagctaaca 1080
gaatcctttc atattaagtt gtactgtaga tgaacttaag ttatttaggc gtagaacaaa 1140
attattcata tttatactga tctttttcca tccagcagtg gagtttagta cttaagagtt 1200
tgtgccctta aaccagactc cctggattaa tgctgtgtac ccgtgggcaa ggtgcctgaa 1260
ttctctatac acctatttcc tcatctgtaa aatggcaata atagtaatag tacctaatgt 1320
gtagggttgt tataagcatt gagtaagata aataatataa agcacttaga acagtgcctg 1380
gaacataaaa acacttaata atagctcata gctaacattt cctatttaca tttcttctag 1440
aaatagccag tatttgttga gtgcctacat gttagttcct ttactagttg ctttacatgt 1500
attatcttat attctgtttt aaagtttctt cacagttaca gattttcatg aaattttact 1560
tttaataaaa gagaagtaaa agtataaagt attcactttt atgttcacag tcttttcctt 1620
taggctcatg atggagtatc agaggcatga gtgtgtttaa cctaagagcc ttaatggctt 1680
gaatcagaag cactttagtc ctgtatctgt tcagtgtcag cctttcatac atcattttaa 1740
atcccatttg actttaagta agtcacttaa tctctctaca tgtcaatttc ttcagctata 1800
aaatgatggt atttcaataa ataaatacat taattaaatg atattatact gactaattgg 1860
gctgttttaa ggctcaataa gaaaatttct gtgaaaggtc tctagaaaat gtaggttcct 1920
atacaaataa aagataacat tgtgcttata aaaaaaa 1957
<210> 11
<211> 222
<212> PRT
<213> 智人
<400> 11
Met Ser Thr Leu Cys Pro Pro Pro Ser Pro Ala Val Ala Lys Thr Glu
1 5 10 15
Ile Ala Leu Ser Gly Lys Ser Pro Leu Leu Ala Ala Thr Phe Ala Tyr
20 25 30
Trp Asp Asn Ile Leu Gly Pro Arg Val Arg His Ile Trp Ala Pro Lys
35 40 45
Thr Glu Gln Val Leu Leu Ser Asp Gly Glu Ile Thr Phe Leu Ala Asn
50 55 60
His Thr Leu Asn Gly Glu Ile Leu Arg Asn Ala Glu Ser Gly Ala Ile
65 70 75 80
Asp Val Lys Phe Phe Val Leu Ser Glu Lys Gly Val Ile Ile Val Ser
85 90 95
Leu Ile Phe Asp Gly Asn Trp Asn Gly Asp Arg Ser Thr Tyr Gly Leu
100 105 110
Ser Ile Ile Leu Pro Gln Thr Glu Leu Ser Phe Tyr Leu Pro Leu His
115 120 125
Arg Val Cys Val Asp Arg Leu Thr His Ile Ile Arg Lys Gly Arg Ile
130 135 140
Trp Met His Lys Glu Arg Gln Glu Asn Val Gln Lys Ile Ile Leu Glu
145 150 155 160
Gly Thr Glu Arg Met Glu Asp Gln Gly Gln Ser Ile Ile Pro Met Leu
165 170 175
Thr Gly Glu Val Ile Pro Val Met Glu Leu Leu Ser Ser Met Lys Ser
180 185 190
His Ser Val Pro Glu Glu Ile Asp Ile Ala Asp Thr Val Leu Asn Asp
195 200 205
Asp Asp Ile Gly Asp Ser Cys His Glu Gly Phe Leu Leu Lys
210 215 220
<210> 12
<211> 3261
<212> DNA
<213> 智人
<400> 12
gggcggggct gcggttgcgg tgcctgcgcc cgcggcggcg gaggcgcagg cggtggcgag 60
tggatatctc cggagcattt ggataatgtg acagttggaa tgcagtgatg tcgactcttt 120
gcccaccgcc atctccagct gttgccaaga cagagattgc tttaagtggc aaatcacctt 180
tattagcagc tacttttgct tactgggaca atattcttgg tcctagagta aggcacattt 240
gggctccaaa gacagaacag gtacttctca gtgatggaga aataactttt cttgccaacc 300
acactctaaa tggagaaatc cttcgaaatg cagagagtgg tgctatagat gtaaagtttt 360
ttgtcttgtc tgaaaaggga gtgattattg tttcattaat ctttgatgga aactggaatg 420
gggatcgcag cacatatgga ctatcaatta tacttccaca gacagaactt agtttctacc 480
tcccacttca tagagtgtgt gttgatagat taacacatat aatccggaaa ggaagaatat 540
ggatgcataa ggaaagacaa gaaaatgtcc agaagattat cttagaaggc acagagagaa 600
tggaagatca gggtcagagt attattccaa tgcttactgg agaagtgatt cctgtaatgg 660
aactgctttc atctatgaaa tcacacagtg ttcctgaaga aatagatata gctgatacag 720
tactcaatga tgatgatatt ggtgacagct gtcatgaagg ctttcttctc aatgccatca 780
gctcacactt gcaaacctgt ggctgttccg ttgtagtagg tagcagtgca gagaaagtaa 840
ataagatagt cagaacatta tgcctttttc tgactccagc agagagaaaa tgctccaggt 900
tatgtgaagc agaatcatca tttaaatatg agtcagggct ctttgtacaa ggcctgctaa 960
aggattcaac tggaagcttt gtgctgcctt tccggcaagt catgtatgct ccatatccca 1020
ccacacacat agatgtggat gtcaatactg tgaagcagat gccaccctgt catgaacata 1080
tttataatca gcgtagatac atgagatccg agctgacagc cttctggaga gccacttcag 1140
aagaagacat ggctcaggat acgatcatct acactgacga aagctttact cctgatttga 1200
atatttttca agatgtctta cacagagaca ctctagtgaa agccttcctg gatcaggtct 1260
ttcagctgaa acctggctta tctctcagaa gtactttcct tgcacagttt ctacttgtcc 1320
ttcacagaaa agccttgaca ctaataaaat atatagaaga cgatacgcag aagggaaaaa 1380
agccctttaa atctcttcgg aacctgaaga tagaccttga tttaacagca gagggcgatc 1440
ttaacataat aatggctctg gctgagaaaa ttaaaccagg cctacactct tttatctttg 1500
gaagaccttt ctacactagt gtgcaagaac gagatgttct aatgactttt taaatgtgta 1560
acttaataag cctattccat cacaatcatg atcgctggta aagtagctca gtggtgtggg 1620
gaaacgttcc cctggatcat actccagaat tctgctctca gcaattgcag ttaagtaagt 1680
tacactacag ttctcacaag agcctgtgag gggatgtcag gtgcatcatt acattgggtg 1740
tctcttttcc tagatttatg cttttgggat acagacctat gtttacaata taataaatat 1800
tattgctatc ttttaaagat ataataatag gatgtaaact tgaccacaac tactgttttt 1860
ttgaaataca tgattcatgg tttacatgtg tcaaggtgaa atctgagttg gcttttacag 1920
atagttgact ttctatcttt tggcattctt tggtgtgtag aattactgta atacttctgc 1980
aatcaactga aaactagagc ctttaaatga tttcaattcc acagaaagaa agtgagcttg 2040
aacataggat gagctttaga aagaaaattg atcaagcaga tgtttaattg gaattgatta 2100
ttagatccta ctttgtggat ttagtccctg ggattcagtc tgtagaaatg tctaatagtt 2160
ctctatagtc cttgttcctg gtgaaccaca gttagggtgt tttgtttatt ttattgttct 2220
tgctattgtt gatattctat gtagttgagc tctgtaaaag gaaattgtat tttatgtttt 2280
agtaattgtt gccaactttt taaattaatt ttcattattt ttgagccaaa ttgaaatgtg 2340
cacctcctgt gccttttttc tccttagaaa atctaattac ttggaacaag ttcagatttc 2400
actggtcagt cattttcatc ttgttttctt cttgctaagt cttaccatgt acctgctttg 2460
gcaatcattg caactctgag attataaaat gccttagaga atatactaac taataagatc 2520
tttttttcag aaacagaaaa tagttccttg agtacttcct tcttgcattt ctgcctatgt 2580
ttttgaagtt gttgctgttt gcctgcaata ggctataagg aatagcagga gaaattttac 2640
tgaagtgctg ttttcctagg tgctactttg gcagagctaa gttatctttt gttttcttaa 2700
tgcgtttgga ccattttgct ggctataaaa taactgatta atataattct aacacaatgt 2760
tgacattgta gttacacaaa cacaaataaa tattttattt aaaattctgg aagtaatata 2820
aaagggaaaa tatatttata agaaagggat aaaggtaata gagcccttct gccccccacc 2880
caccaaattt acacaacaaa atgacatgtt cgaatgtgaa aggtcataat agctttccca 2940
tcatgaatca gaaagatgtg gacagcttga tgttttagac aaccactgaa ctagatgact 3000
gttgtactgt agctcagtca tttaaaaaat atataaatac taccttgtag tgtcccatac 3060
tgtgtttttt acatggtaga ttcttattta agtgctaact ggttattttc tttggctggt 3120
ttattgtact gttatacaga atgtaagttg tacagtgaaa taagttatta aagcatgtgt 3180
aaacattgtt atatatcttt tctcctaaat ggagaatttt gaataaaata tatttgaaat 3240
tttaaaaaaa aaaaaaaaaa a 3261
<210> 13
<211> 481
<212> PRT
<213> 智人
<400> 13
Met Ser Thr Leu Cys Pro Pro Pro Ser Pro Ala Val Ala Lys Thr Glu
1 5 10 15
Ile Ala Leu Ser Gly Lys Ser Pro Leu Leu Ala Ala Thr Phe Ala Tyr
20 25 30
Trp Asp Asn Ile Leu Gly Pro Arg Val Arg His Ile Trp Ala Pro Lys
35 40 45
Thr Glu Gln Val Leu Leu Ser Asp Gly Glu Ile Thr Phe Leu Ala Asn
50 55 60
His Thr Leu Asn Gly Glu Ile Leu Arg Asn Ala Glu Ser Gly Ala Ile
65 70 75 80
Asp Val Lys Phe Phe Val Leu Ser Glu Lys Gly Val Ile Ile Val Ser
85 90 95
Leu Ile Phe Asp Gly Asn Trp Asn Gly Asp Arg Ser Thr Tyr Gly Leu
100 105 110
Ser Ile Ile Leu Pro Gln Thr Glu Leu Ser Phe Tyr Leu Pro Leu His
115 120 125
Arg Val Cys Val Asp Arg Leu Thr His Ile Ile Arg Lys Gly Arg Ile
130 135 140
Trp Met His Lys Glu Arg Gln Glu Asn Val Gln Lys Ile Ile Leu Glu
145 150 155 160
Gly Thr Glu Arg Met Glu Asp Gln Gly Gln Ser Ile Ile Pro Met Leu
165 170 175
Thr Gly Glu Val Ile Pro Val Met Glu Leu Leu Ser Ser Met Lys Ser
180 185 190
His Ser Val Pro Glu Glu Ile Asp Ile Ala Asp Thr Val Leu Asn Asp
195 200 205
Asp Asp Ile Gly Asp Ser Cys His Glu Gly Phe Leu Leu Asn Ala Ile
210 215 220
Ser Ser His Leu Gln Thr Cys Gly Cys Ser Val Val Val Gly Ser Ser
225 230 235 240
Ala Glu Lys Val Asn Lys Ile Val Arg Thr Leu Cys Leu Phe Leu Thr
245 250 255
Pro Ala Glu Arg Lys Cys Ser Arg Leu Cys Glu Ala Glu Ser Ser Phe
260 265 270
Lys Tyr Glu Ser Gly Leu Phe Val Gln Gly Leu Leu Lys Asp Ser Thr
275 280 285
Gly Ser Phe Val Leu Pro Phe Arg Gln Val Met Tyr Ala Pro Tyr Pro
290 295 300
Thr Thr His Ile Asp Val Asp Val Asn Thr Val Lys Gln Met Pro Pro
305 310 315 320
Cys His Glu His Ile Tyr Asn Gln Arg Arg Tyr Met Arg Ser Glu Leu
325 330 335
Thr Ala Phe Trp Arg Ala Thr Ser Glu Glu Asp Met Ala Gln Asp Thr
340 345 350
Ile Ile Tyr Thr Asp Glu Ser Phe Thr Pro Asp Leu Asn Ile Phe Gln
355 360 365
Asp Val Leu His Arg Asp Thr Leu Val Lys Ala Phe Leu Asp Gln Val
370 375 380
Phe Gln Leu Lys Pro Gly Leu Ser Leu Arg Ser Thr Phe Leu Ala Gln
385 390 395 400
Phe Leu Leu Val Leu His Arg Lys Ala Leu Thr Leu Ile Lys Tyr Ile
405 410 415
Glu Asp Asp Thr Gln Lys Gly Lys Lys Pro Phe Lys Ser Leu Arg Asn
420 425 430
Leu Lys Ile Asp Leu Asp Leu Thr Ala Glu Gly Asp Leu Asn Ile Ile
435 440 445
Met Ala Leu Ala Glu Lys Ile Lys Pro Gly Leu His Ser Phe Ile Phe
450 455 460
Gly Arg Pro Phe Tyr Thr Ser Val Gln Glu Arg Asp Val Leu Met Thr
465 470 475 480
Phe
<210> 14
<211> 3356
<212> DNA
<213> 智人
<400> 14
acgtaaccta cggtgtcccg ctaggaaaga gaggtgcgtc aaacagcgac aagttccgcc 60
cacgtaaaag atgacgcttg gtgtgtcagc cgtccctgct gcccggttgc ttctcttttg 120
ggggcggggt ctagcaagag caggtgtggg tttaggagat atctccggag catttggata 180
atgtgacagt tggaatgcag tgatgtcgac tctttgccca ccgccatctc cagctgttgc 240
caagacagag attgctttaa gtggcaaatc acctttatta gcagctactt ttgcttactg 300
ggacaatatt cttggtccta gagtaaggca catttgggct ccaaagacag aacaggtact 360
tctcagtgat ggagaaataa cttttcttgc caaccacact ctaaatggag aaatccttcg 420
aaatgcagag agtggtgcta tagatgtaaa gttttttgtc ttgtctgaaa agggagtgat 480
tattgtttca ttaatctttg atggaaactg gaatggggat cgcagcacat atggactatc 540
aattatactt ccacagacag aacttagttt ctacctccca cttcatagag tgtgtgttga 600
tagattaaca catataatcc ggaaaggaag aatatggatg cataaggaaa gacaagaaaa 660
tgtccagaag attatcttag aaggcacaga gagaatggaa gatcagggtc agagtattat 720
tccaatgctt actggagaag tgattcctgt aatggaactg ctttcatcta tgaaatcaca 780
cagtgttcct gaagaaatag atatagctga tacagtactc aatgatgatg atattggtga 840
cagctgtcat gaaggctttc ttctcaatgc catcagctca cacttgcaaa cctgtggctg 900
ttccgttgta gtaggtagca gtgcagagaa agtaaataag atagtcagaa cattatgcct 960
ttttctgact ccagcagaga gaaaatgctc caggttatgt gaagcagaat catcatttaa 1020
atatgagtca gggctctttg tacaaggcct gctaaaggat tcaactggaa gctttgtgct 1080
gcctttccgg caagtcatgt atgctccata tcccaccaca cacatagatg tggatgtcaa 1140
tactgtgaag cagatgccac cctgtcatga acatatttat aatcagcgta gatacatgag 1200
atccgagctg acagccttct ggagagccac ttcagaagaa gacatggctc aggatacgat 1260
catctacact gacgaaagct ttactcctga tttgaatatt tttcaagatg tcttacacag 1320
agacactcta gtgaaagcct tcctggatca ggtctttcag ctgaaacctg gcttatctct 1380
cagaagtact ttccttgcac agtttctact tgtccttcac agaaaagcct tgacactaat 1440
aaaatatata gaagacgata cgcagaaggg aaaaaagccc tttaaatctc ttcggaacct 1500
gaagatagac cttgatttaa cagcagaggg cgatcttaac ataataatgg ctctggctga 1560
gaaaattaaa ccaggcctac actcttttat ctttggaaga cctttctaca ctagtgtgca 1620
agaacgagat gttctaatga ctttttaaat gtgtaactta ataagcctat tccatcacaa 1680
tcatgatcgc tggtaaagta gctcagtggt gtggggaaac gttcccctgg atcatactcc 1740
agaattctgc tctcagcaat tgcagttaag taagttacac tacagttctc acaagagcct 1800
gtgaggggat gtcaggtgca tcattacatt gggtgtctct tttcctagat ttatgctttt 1860
gggatacaga cctatgttta caatataata aatattattg ctatctttta aagatataat 1920
aataggatgt aaacttgacc acaactactg tttttttgaa atacatgatt catggtttac 1980
atgtgtcaag gtgaaatctg agttggcttt tacagatagt tgactttcta tcttttggca 2040
ttctttggtg tgtagaatta ctgtaatact tctgcaatca actgaaaact agagccttta 2100
aatgatttca attccacaga aagaaagtga gcttgaacat aggatgagct ttagaaagaa 2160
aattgatcaa gcagatgttt aattggaatt gattattaga tcctactttg tggatttagt 2220
ccctgggatt cagtctgtag aaatgtctaa tagttctcta tagtccttgt tcctggtgaa 2280
ccacagttag ggtgttttgt ttattttatt gttcttgcta ttgttgatat tctatgtagt 2340
tgagctctgt aaaaggaaat tgtattttat gttttagtaa ttgttgccaa ctttttaaat 2400
taattttcat tatttttgag ccaaattgaa atgtgcacct cctgtgcctt ttttctcctt 2460
agaaaatcta attacttgga acaagttcag atttcactgg tcagtcattt tcatcttgtt 2520
ttcttcttgc taagtcttac catgtacctg ctttggcaat cattgcaact ctgagattat 2580
aaaatgcctt agagaatata ctaactaata agatcttttt ttcagaaaca gaaaatagtt 2640
ccttgagtac ttccttcttg catttctgcc tatgtttttg aagttgttgc tgtttgcctg 2700
caataggcta taaggaatag caggagaaat tttactgaag tgctgttttc ctaggtgcta 2760
ctttggcaga gctaagttat cttttgtttt cttaatgcgt ttggaccatt ttgctggcta 2820
taaaataact gattaatata attctaacac aatgttgaca ttgtagttac acaaacacaa 2880
ataaatattt tatttaaaat tctggaagta atataaaagg gaaaatatat ttataagaaa 2940
gggataaagg taatagagcc cttctgcccc ccacccacca aatttacaca acaaaatgac 3000
atgttcgaat gtgaaaggtc ataatagctt tcccatcatg aatcagaaag atgtggacag 3060
cttgatgttt tagacaacca ctgaactaga tgactgttgt actgtagctc agtcatttaa 3120
aaaatatata aatactacct tgtagtgtcc catactgtgt tttttacatg gtagattctt 3180
atttaagtgc taactggtta ttttctttgg ctggtttatt gtactgttat acagaatgta 3240
agttgtacag tgaaataagt tattaaagca tgtgtaaaca ttgttatata tcttttctcc 3300
taaatggaga attttgaata aaatatattt gaaattttaa aaaaaaaaaa aaaaaa 3356
<210> 15
<211> 481
<212> PRT
<213> 智人
<400> 15
Met Ser Thr Leu Cys Pro Pro Pro Ser Pro Ala Val Ala Lys Thr Glu
1 5 10 15
Ile Ala Leu Ser Gly Lys Ser Pro Leu Leu Ala Ala Thr Phe Ala Tyr
20 25 30
Trp Asp Asn Ile Leu Gly Pro Arg Val Arg His Ile Trp Ala Pro Lys
35 40 45
Thr Glu Gln Val Leu Leu Ser Asp Gly Glu Ile Thr Phe Leu Ala Asn
50 55 60
His Thr Leu Asn Gly Glu Ile Leu Arg Asn Ala Glu Ser Gly Ala Ile
65 70 75 80
Asp Val Lys Phe Phe Val Leu Ser Glu Lys Gly Val Ile Ile Val Ser
85 90 95
Leu Ile Phe Asp Gly Asn Trp Asn Gly Asp Arg Ser Thr Tyr Gly Leu
100 105 110
Ser Ile Ile Leu Pro Gln Thr Glu Leu Ser Phe Tyr Leu Pro Leu His
115 120 125
Arg Val Cys Val Asp Arg Leu Thr His Ile Ile Arg Lys Gly Arg Ile
130 135 140
Trp Met His Lys Glu Arg Gln Glu Asn Val Gln Lys Ile Ile Leu Glu
145 150 155 160
Gly Thr Glu Arg Met Glu Asp Gln Gly Gln Ser Ile Ile Pro Met Leu
165 170 175
Thr Gly Glu Val Ile Pro Val Met Glu Leu Leu Ser Ser Met Lys Ser
180 185 190
His Ser Val Pro Glu Glu Ile Asp Ile Ala Asp Thr Val Leu Asn Asp
195 200 205
Asp Asp Ile Gly Asp Ser Cys His Glu Gly Phe Leu Leu Asn Ala Ile
210 215 220
Ser Ser His Leu Gln Thr Cys Gly Cys Ser Val Val Val Gly Ser Ser
225 230 235 240
Ala Glu Lys Val Asn Lys Ile Val Arg Thr Leu Cys Leu Phe Leu Thr
245 250 255
Pro Ala Glu Arg Lys Cys Ser Arg Leu Cys Glu Ala Glu Ser Ser Phe
260 265 270
Lys Tyr Glu Ser Gly Leu Phe Val Gln Gly Leu Leu Lys Asp Ser Thr
275 280 285
Gly Ser Phe Val Leu Pro Phe Arg Gln Val Met Tyr Ala Pro Tyr Pro
290 295 300
Thr Thr His Ile Asp Val Asp Val Asn Thr Val Lys Gln Met Pro Pro
305 310 315 320
Cys His Glu His Ile Tyr Asn Gln Arg Arg Tyr Met Arg Ser Glu Leu
325 330 335
Thr Ala Phe Trp Arg Ala Thr Ser Glu Glu Asp Met Ala Gln Asp Thr
340 345 350
Ile Ile Tyr Thr Asp Glu Ser Phe Thr Pro Asp Leu Asn Ile Phe Gln
355 360 365
Asp Val Leu His Arg Asp Thr Leu Val Lys Ala Phe Leu Asp Gln Val
370 375 380
Phe Gln Leu Lys Pro Gly Leu Ser Leu Arg Ser Thr Phe Leu Ala Gln
385 390 395 400
Phe Leu Leu Val Leu His Arg Lys Ala Leu Thr Leu Ile Lys Tyr Ile
405 410 415
Glu Asp Asp Thr Gln Lys Gly Lys Lys Pro Phe Lys Ser Leu Arg Asn
420 425 430
Leu Lys Ile Asp Leu Asp Leu Thr Ala Glu Gly Asp Leu Asn Ile Ile
435 440 445
Met Ala Leu Ala Glu Lys Ile Lys Pro Gly Leu His Ser Phe Ile Phe
450 455 460
Gly Arg Pro Phe Tyr Thr Ser Val Gln Glu Arg Asp Val Leu Met Thr
465 470 475 480
Phe
<210> 16
<211> 3198
<212> DNA
<213> 小家鼠
<400> 16
gtgtccgggg cggggcggtc ccggggcggg gcccggagcg ggctgcggtt gcggtccctg 60
cgccggcggt gaaggcgcag cagcggcgag tggctattgc aagcgttcgg ataatgtgag 120
acctggaatg cagtgagacc tgggatgcag ggatgtcgac tatctgcccc ccaccatctc 180
ctgctgttgc caagacagag attgctttaa gtggtgaatc acccttgttg gcggctacct 240
ttgcttactg ggataatatt cttggtccta gagtaaggca tatttgggct ccaaagacag 300
accaagtgct tctcagtgat ggagaaataa cttttcttgc caaccacact ctaaatggag 360
aaattcttcg aaatgcagag agtggggcta tagatgtaaa attttttgtc ttatctgaaa 420
aaggggtaat tattgtttca ttaatcttcg acggaaactg gaatggagat cggagcactt 480
atggactatc aattatactg ccgcagacag agctgagctt ctacctccca cttcacagag 540
tgtgtgttga caggctaaca cacattattc gaaaaggaag aatatggatg cataaggaaa 600
gacaagaaaa tgtccagaaa attgtcttgg aaggcacaga gaggatggaa gatcagggtc 660
agagtatcat tcccatgctt actggggaag tcattcctgt aatggagctg cttgcatcta 720
tgaaatccca cagtgttcct gaagacattg atatagctga tacagtgctc aatgatgatg 780
acattggtga cagctgtcac gaaggctttc ttctcaatgc catcagctca cacctgcaga 840
cctgtggctg ttccgttgta gttggcagca gtgcagagaa agtaaataag atagtaagaa 900
cgctgtgcct ttttctgaca ccagcagaga ggaaatgctc caggctgtgt gaagcagaat 960
cgtcctttaa gtacgaatcg ggactctttg tgcaaggctt gctaaaggat gcaacaggca 1020
gttttgtcct acccttccgg caagttatgt atgccccgta ccccaccacg cacattgatg 1080
tggatgtcaa cactgtcaag cagatgccac cgtgtcatga acatatttat aatcaacgca 1140
gatacatgag gtcagagctg acagccttct ggagggcaac ttcagaagag gacatggcgc 1200
aggacaccat catctacaca gatgagagct tcactcctga tttgaatatt ttccaagatg 1260
tcttacacag agacactcta gtgaaagcct tcctggatca ggtcttccat ttgaagcctg 1320
gcctgtctct caggagtact ttccttgcac agttcctcct cattcttcac agaaaagcct 1380
tgacactaat caagtacatc gaggatgata cgcagaaggg gaaaaagccc tttaagtctc 1440
ttcggaacct gaagatagat cttgatttaa cagcagaggg cgatcttaac ataataatgg 1500
ctctagctga gaaaattaag ccaggcctac actctttcat ctttgggaga cctttctaca 1560
ctagtgtaca agaacgtgat gttctaatga ccttttgacc gtgtggtttg ctgtgtctgt 1620
ctcttcacag tcacacctgc tgttacagtg tctcagcagt gtgtgggcac atccttcctc 1680
ccgagtcctg ctgcaggaca gggtacacta cacttgtcag tagaagtctg tacctgatgt 1740
caggtgcatc gttacagtga atgactcttc ctagaataga tgtactcttt tagggcctta 1800
tgtttacaat tatcctaagt actattgctg tcttttaaag atatgaatga tggaatatac 1860
acttgaccat aactgctgat tggttttttg ttttgttttg tttgttttct tggaaactta 1920
tgattcctgg tttacatgta ccacactgaa accctcgtta gctttacaga taaagtgtga 1980
gttgacttcc tgcccctctg tgttctgtgg tatgtccgat tacttctgcc acagctaaac 2040
attagagcat ttaaagtttg cagttcctca gaaaggaact tagtctgact acagattagt 2100
tcttgagaga agacactgat agggcagagc tgtaggtgaa atcagttgtt agcccttcct 2160
ttatagacgt agtccttcag attcggtctg tacagaaatg ccgaggggtc atgcatgggc 2220
cctgagtatc gtgacctgtg acaagttttt tgttggttta ttgtagttct gtcaaagaaa 2280
gtggcatttg tttttataat tgttgccaac ttttaaggtt aattttcatt atttttgagc 2340
cgaattaaaa tgcgcacctc ctgtgccttt cccaatcttg gaaaatataa tttcttggca 2400
gagggtcaga tttcagggcc cagtcacttt catctgacca ccctttgcac ggctgccgtg 2460
tgcctggctt agattagaag tccttgttaa gtatgtcaga gtacattcgc tgataagatc 2520
tttgaagagc agggaagcgt cttgcctctt tcctttggtt tctgcctgta ctctggtgtt 2580
tcccgtgtca cctgcatcat aggaacagca gagaaatctg acccagtgct atttttctag 2640
gtgctactat ggcaaactca agtggtctgt ttctgttcct gtaacgttcg actatctcgc 2700
tagctgtgaa gtactgatta gtggagttct gtgcaacagc agtgtaggag tatacacaaa 2760
cacaaatatg tgtttctatt taaaactgtg gacttagcat aaaaagggag aatatattta 2820
ttttttacaa aagggataaa aatgggcccc gttcctcacc caccagattt agcgagaaaa 2880
agctttctat tctgaaaggt cacggtggct ttggcattac aaatcagaac aacacacact 2940
gaccatgatg gcttgtgaac taactgcaag gcactccgtc atggtaagcg agtaggtccc 3000
acctcctagt gtgccgctca ttgctttaca cagtagaatc ttatttgagt gctaattgtt 3060
gtctttgctg ctttactgtg ttgttataga aaatgtaagc tgtacagtga ataagttatt 3120
gaagcatgtg taaacactgt tatatatctt ttctcctaga tggggaattt tgaataaaat 3180
acctttgaaa ttctgtgt 3198
<210> 17
<211> 481
<212> PRT
<213> 小家鼠
<400> 17
Met Ser Thr Ile Cys Pro Pro Pro Ser Pro Ala Val Ala Lys Thr Glu
1 5 10 15
Ile Ala Leu Ser Gly Glu Ser Pro Leu Leu Ala Ala Thr Phe Ala Tyr
20 25 30
Trp Asp Asn Ile Leu Gly Pro Arg Val Arg His Ile Trp Ala Pro Lys
35 40 45
Thr Asp Gln Val Leu Leu Ser Asp Gly Glu Ile Thr Phe Leu Ala Asn
50 55 60
His Thr Leu Asn Gly Glu Ile Leu Arg Asn Ala Glu Ser Gly Ala Ile
65 70 75 80
Asp Val Lys Phe Phe Val Leu Ser Glu Lys Gly Val Ile Ile Val Ser
85 90 95
Leu Ile Phe Asp Gly Asn Trp Asn Gly Asp Arg Ser Thr Tyr Gly Leu
100 105 110
Ser Ile Ile Leu Pro Gln Thr Glu Leu Ser Phe Tyr Leu Pro Leu His
115 120 125
Arg Val Cys Val Asp Arg Leu Thr His Ile Ile Arg Lys Gly Arg Ile
130 135 140
Trp Met His Lys Glu Arg Gln Glu Asn Val Gln Lys Ile Val Leu Glu
145 150 155 160
Gly Thr Glu Arg Met Glu Asp Gln Gly Gln Ser Ile Ile Pro Met Leu
165 170 175
Thr Gly Glu Val Ile Pro Val Met Glu Leu Leu Ala Ser Met Lys Ser
180 185 190
His Ser Val Pro Glu Asp Ile Asp Ile Ala Asp Thr Val Leu Asn Asp
195 200 205
Asp Asp Ile Gly Asp Ser Cys His Glu Gly Phe Leu Leu Asn Ala Ile
210 215 220
Ser Ser His Leu Gln Thr Cys Gly Cys Ser Val Val Val Gly Ser Ser
225 230 235 240
Ala Glu Lys Val Asn Lys Ile Val Arg Thr Leu Cys Leu Phe Leu Thr
245 250 255
Pro Ala Glu Arg Lys Cys Ser Arg Leu Cys Glu Ala Glu Ser Ser Phe
260 265 270
Lys Tyr Glu Ser Gly Leu Phe Val Gln Gly Leu Leu Lys Asp Ala Thr
275 280 285
Gly Ser Phe Val Leu Pro Phe Arg Gln Val Met Tyr Ala Pro Tyr Pro
290 295 300
Thr Thr His Ile Asp Val Asp Val Asn Thr Val Lys Gln Met Pro Pro
305 310 315 320
Cys His Glu His Ile Tyr Asn Gln Arg Arg Tyr Met Arg Ser Glu Leu
325 330 335
Thr Ala Phe Trp Arg Ala Thr Ser Glu Glu Asp Met Ala Gln Asp Thr
340 345 350
Ile Ile Tyr Thr Asp Glu Ser Phe Thr Pro Asp Leu Asn Ile Phe Gln
355 360 365
Asp Val Leu His Arg Asp Thr Leu Val Lys Ala Phe Leu Asp Gln Val
370 375 380
Phe His Leu Lys Pro Gly Leu Ser Leu Arg Ser Thr Phe Leu Ala Gln
385 390 395 400
Phe Leu Leu Ile Leu His Arg Lys Ala Leu Thr Leu Ile Lys Tyr Ile
405 410 415
Glu Asp Asp Thr Gln Lys Gly Lys Lys Pro Phe Lys Ser Leu Arg Asn
420 425 430
Leu Lys Ile Asp Leu Asp Leu Thr Ala Glu Gly Asp Leu Asn Ile Ile
435 440 445
Met Ala Leu Ala Glu Lys Ile Lys Pro Gly Leu His Ser Phe Ile Phe
450 455 460
Gly Arg Pro Phe Tyr Thr Ser Val Gln Glu Arg Asp Val Leu Met Thr
465 470 475 480
Phe
<210> 18
<211> 3435
<212> DNA
<213> 褐家鼠
<400> 18
cgtttgtagt gtcagccatc ccaattgcct gttccttctc tgtgggagtg gtgtctagac 60
agtccaggca gggtatgcta ggcaggtgcg ttttggttgc ctcagatcgc aacttgactc 120
cataacggtg accaaagaca aaagaaggaa accagattaa aaagaaccgg acacagaccc 180
ctgcagaatc tggagcggcc gtggttgggg gcggggctac gacggggcgg actcgggggc 240
gtgggagggc ggggccgggg cggggcccgg agccggctgc ggttgcggtc cctgcgccgg 300
cggtgaaggc gcagcggcgg cgagtggcta ttgcaagcgt ttggataatg tgagacctgg 360
gatgcaggga tgtcgactat ctgcccccca ccatctcctg ctgttgccaa gacagagatt 420
gctttaagtg gtgaatcacc cttgttggcg gctacctttg cttactggga taatattctt 480
ggtcctagag taaggcacat ttgggctcca aagacagacc aagtactcct cagtgatgga 540
gaaatcactt ttcttgccaa ccacactctg aatggagaaa ttcttcggaa tgcggagagt 600
ggggcaatag atgtaaagtt ttttgtctta tctgaaaagg gcgtcattat tgtttcatta 660
atcttcgacg ggaactggaa cggagatcgg agcacttacg gactatcaat tatactgccg 720
cagacggagc tgagtttcta cctcccactg cacagagtgt gtgttgacag gctaacgcac 780
atcattcgaa aaggaaggat atggatgcac aaggaaagac aagaaaatgt ccagaaaatt 840
gtcttggaag gcaccgagag gatggaagat cagggtcaga gtatcatccc tatgcttact 900
ggggaggtca tccctgtgat ggagctgctt gcgtctatga gatcacacag tgttcctgaa 960
gacctcgata tagctgatac agtactcaat gatgatgaca ttggtgacag ctgtcatgaa 1020
ggctttcttc tcaatgccat cagctcacat ctgcagacct gcggctgttc tgtggtggta 1080
ggcagcagtg cagagaaagt aaataagata gtaagaacac tgtgcctttt tctgacacca 1140
gcagagagga agtgctccag gctgtgtgaa gccgaatcgt cctttaaata cgaatctgga 1200
ctctttgtac aaggcttgct aaaggatgcg actggcagtt ttgtactacc tttccggcaa 1260
gttatgtatg ccccttatcc caccacacac atcgatgtgg atgtcaacac tgtcaagcag 1320
atgccaccgt gtcatgaaca tatttataat caacgcagat acatgaggtc agagctgaca 1380
gccttctgga gggcaacttc agaagaggac atggctcagg acaccatcat ctacacagat 1440
gagagcttca ctcctgattt gaatattttc caagatgtct tacacagaga cactctagtg 1500
aaagcctttc tggatcaggt cttccatttg aagcctggcc tgtctctcag gagtactttc 1560
cttgcacagt tcctcctcat tcttcacaga aaagccttga cactaatcaa gtacatagag 1620
gatgacacgc agaaggggaa aaagcccttt aagtctcttc ggaacctgaa gatagatctt 1680
gatttaacag cagagggcga ccttaacata ataatggctc tagctgagaa aattaagcca 1740
ggcctacact ctttcatctt cgggagacct ttctacacta gtgtccaaga acgtgatgtt 1800
ctaatgactt tttaaacatg tggtttgctc cgtgtgtctc atgacagtca cacttgctgt 1860
tacagtgtct cagcgctttg gacacatcct tcctccaggg tcctgccgca ggacacgtta 1920
cactacactt gtcagtagag gtctgtacca gatgtcaggt acatcgttgt agtgaatgtc 1980
tcttttccta gactagatgt accctcgtag ggacttatgt ttacaaccct cctaagtact 2040
agtgctgtct tgtaaggata cgaatgaagg gatgtaaact tcaccacaac tgctggttgg 2100
ttttgttgtt tttgtttttt gaaacttata attcatggtt tacatgcatc acactgaaac 2160
cctagttagc tttttacagg taagctgtga gttgactgcc tgtccctgtg ttctctggcc 2220
tgtacgatct gtggcgtgta ggatcacttt tgcaacaact aaaaactaaa gcactttgtt 2280
tgcagttcta cagaaagcaa cttagtctgt ctgcagattc gtttttgaaa gaagacatga 2340
gaaagcggag ttttaggtga agtcagttgt tggatcttcc tttatagact tagtccttta 2400
gatgtggtct gtatagacat gcccaaccat catgcatggg cactgaatat cgtgaactgt 2460
ggtatgcttt ttgttggttt attgtacttc tgtcaaagaa agtggcattg gtttttataa 2520
ttgttgccaa gttttaaggt taattttcat tatttttgag ccaaattaaa atgtgcacct 2580
cctgtgcctt tcccaatctt ggaaaatata atttcttggc agaaggtcag atttcagggc 2640
ccagtcactt tcgtctgact tccctttgca cagtccgcca tgggcctggc ttagaagttc 2700
ttgtaaacta tgccagagag tacattcgct gataaaatct tctttgcaga gcaggagagc 2760
ttcttgcctc tttcctttca tttctgcctg gactttggtg ttctccacgt tccctgcatc 2820
ctaaggacag caggagaact ctgaccccag tgctatttct ctaggtgcta ttgtggcaaa 2880
ctcaagcggt ccgtctctgt ccctgtaacg ttcgtacctt gctggctgtg aagtactgac 2940
tggtaaagct ccgtgctaca gcagtgtagg gtatacacaa acacaagtaa gtgttttatt 3000
taaaactgtg gacttagcat aaaaagggag actatattta ttttttacaa aagggataaa 3060
aatggaaccc tttcctcacc caccagattt agtcagaaaa aaacattcta ttctgaaagg 3120
tcacagtggt tttgacatga cacatcagaa caacgcacac tgtccatgat ggcttatgaa 3180
ctccaagtca ctccatcatg gtaaatgggt agatccctcc ttctagtgtg ccacaccatt 3240
gcttcccaca gtagaatctt atttaagtgc taagtgttgt ctctgctggt ttactctgtt 3300
gttttagaga atgtaagttg tatagtgaat aagttattga agcatgtgta aacactgtta 3360
tacatctttt ctcctagatg gggaatttgg aataaaatac ctttaaaatt caaaaaaaaa 3420
aaaaaaaaaa aaaaa 3435
<210> 19
<211> 481
<212> PRT
<213> 褐家鼠
<400> 19
Met Ser Thr Ile Cys Pro Pro Pro Ser Pro Ala Val Ala Lys Thr Glu
1 5 10 15
Ile Ala Leu Ser Gly Glu Ser Pro Leu Leu Ala Ala Thr Phe Ala Tyr
20 25 30
Trp Asp Asn Ile Leu Gly Pro Arg Val Arg His Ile Trp Ala Pro Lys
35 40 45
Thr Asp Gln Val Leu Leu Ser Asp Gly Glu Ile Thr Phe Leu Ala Asn
50 55 60
His Thr Leu Asn Gly Glu Ile Leu Arg Asn Ala Glu Ser Gly Ala Ile
65 70 75 80
Asp Val Lys Phe Phe Val Leu Ser Glu Lys Gly Val Ile Ile Val Ser
85 90 95
Leu Ile Phe Asp Gly Asn Trp Asn Gly Asp Arg Ser Thr Tyr Gly Leu
100 105 110
Ser Ile Ile Leu Pro Gln Thr Glu Leu Ser Phe Tyr Leu Pro Leu His
115 120 125
Arg Val Cys Val Asp Arg Leu Thr His Ile Ile Arg Lys Gly Arg Ile
130 135 140
Trp Met His Lys Glu Arg Gln Glu Asn Val Gln Lys Ile Val Leu Glu
145 150 155 160
Gly Thr Glu Arg Met Glu Asp Gln Gly Gln Ser Ile Ile Pro Met Leu
165 170 175
Thr Gly Glu Val Ile Pro Val Met Glu Leu Leu Ala Ser Met Arg Ser
180 185 190
His Ser Val Pro Glu Asp Leu Asp Ile Ala Asp Thr Val Leu Asn Asp
195 200 205
Asp Asp Ile Gly Asp Ser Cys His Glu Gly Phe Leu Leu Asn Ala Ile
210 215 220
Ser Ser His Leu Gln Thr Cys Gly Cys Ser Val Val Val Gly Ser Ser
225 230 235 240
Ala Glu Lys Val Asn Lys Ile Val Arg Thr Leu Cys Leu Phe Leu Thr
245 250 255
Pro Ala Glu Arg Lys Cys Ser Arg Leu Cys Glu Ala Glu Ser Ser Phe
260 265 270
Lys Tyr Glu Ser Gly Leu Phe Val Gln Gly Leu Leu Lys Asp Ala Thr
275 280 285
Gly Ser Phe Val Leu Pro Phe Arg Gln Val Met Tyr Ala Pro Tyr Pro
290 295 300
Thr Thr His Ile Asp Val Asp Val Asn Thr Val Lys Gln Met Pro Pro
305 310 315 320
Cys His Glu His Ile Tyr Asn Gln Arg Arg Tyr Met Arg Ser Glu Leu
325 330 335
Thr Ala Phe Trp Arg Ala Thr Ser Glu Glu Asp Met Ala Gln Asp Thr
340 345 350
Ile Ile Tyr Thr Asp Glu Ser Phe Thr Pro Asp Leu Asn Ile Phe Gln
355 360 365
Asp Val Leu His Arg Asp Thr Leu Val Lys Ala Phe Leu Asp Gln Val
370 375 380
Phe His Leu Lys Pro Gly Leu Ser Leu Arg Ser Thr Phe Leu Ala Gln
385 390 395 400
Phe Leu Leu Ile Leu His Arg Lys Ala Leu Thr Leu Ile Lys Tyr Ile
405 410 415
Glu Asp Asp Thr Gln Lys Gly Lys Lys Pro Phe Lys Ser Leu Arg Asn
420 425 430
Leu Lys Ile Asp Leu Asp Leu Thr Ala Glu Gly Asp Leu Asn Ile Ile
435 440 445
Met Ala Leu Ala Glu Lys Ile Lys Pro Gly Leu His Ser Phe Ile Phe
450 455 460
Gly Arg Pro Phe Tyr Thr Ser Val Gln Glu Arg Asp Val Leu Met Thr
465 470 475 480
Phe
<210> 20
<211> 100
<212> DNA
<213> 小家鼠
<400> 20
gaaccgcggc gcgtcaagca gagacgagtt ccgcccacgt gaaagatggc gtttgtagtg 60
acagccatcc caattgccct ttccttctag gtggaaagtg 100
<210> 21
<211> 2648
<212> DNA
<213> 人工序列
<220>
<223> 含有8028加lox位点的floxed neo盒
<400> 21
ataacttcgt ataatgtatg ctatacgaag ttatatgcat ggcctccgcg ccgggttttg 60
gcgcctcccg cgggcgcccc cctcctcacg gcgagcgctg ccacgtcaga cgaagggcgc 120
agcgagcgtc ctgatccttc cgcccggacg ctcaggacag cggcccgctg ctcataagac 180
tcggccttag aaccccagta tcagcagaag gacattttag gacgggactt gggtgactct 240
agggcactgg ttttctttcc agagagcgga acaggcgagg aaaagtagtc ccttctcggc 300
gattctgcgg agggatctcc gtggggcggt gaacgccgat gattatataa ggacgcgccg 360
ggtgtggcac agctagttcc gtcgcagccg ggatttgggt cgcggttctt gtttgtggat 420
cgctgtgatc gtcacttggt gagtagcggg ctgctgggct ggccggggct ttcgtggccg 480
ccgggccgct cggtgggacg gaagcgtgtg gagagaccgc caagggctgt agtctgggtc 540
cgcgagcaag gttgccctga actgggggtt ggggggagcg cagcaaaatg gcggctgttc 600
ccgagtcttg aatggaagac gcttgtgagg cgggctgtga ggtcgttgaa acaaggtggg 660
gggcatggtg ggcggcaaga acccaaggtc ttgaggcctt cgctaatgcg ggaaagctct 720
tattcgggtg agatgggctg gggcaccatc tggggaccct gacgtgaagt ttgtcactga 780
ctggagaact cggtttgtcg tctgttgcgg gggcggcagt tatggcggtg ccgttgggca 840
gtgcacccgt acctttggga gcgcgcgccc tcgtcgtgtc gtgacgtcac ccgttctgtt 900
ggcttataat gcagggtggg gccacctgcc ggtaggtgtg cggtaggctt ttctccgtcg 960
caggacgcag ggttcgggcc tagggtaggc tctcctgaat cgacaggcgc cggacctctg 1020
gtgaggggag ggataagtga ggcgtcagtt tctttggtcg gttttatgta cctatcttct 1080
taagtagctg aagctccggt tttgaactat gcgctcgggg ttggcgagtg tgttttgtga 1140
agttttttag gcaccttttg aaatgtaatc atttgggtca atatgtaatt ttcagtgtta 1200
gactagtaaa ttgtccgcta aattctggcc gtttttggct tttttgttag acgtgttgac 1260
aattaatcat cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc 1320
atgggatcgg ccattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag 1380
aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc 1440
cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 1500
aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 1560
gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 1620
ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 1680
gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 1740
aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 1800
ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc 1860
atgcccgacg gcgatgatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 1920
gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 1980
tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct 2040
gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 2100
cgccttcttg acgagttctt ctgaggggat ccgctgtaag tctgcagaaa ttgatgatct 2160
attaaacaat aaagatgtcc actaaaatgg aagtttttcc tgtcatactt tgttaagaag 2220
ggtgagaaca gagtacctac attttgaatg gaaggattgg agctacgggg gtgggggtgg 2280
ggtgggatta gataaatgcc tgctctttac tgaaggctct ttactattgc tttatgataa 2340
tgtttcatag ttggatatca taatttaaac aagcaaaacc aaattaaggg ccagctcatt 2400
cctcccactc atgatctata gatctataga tctctcgtgg gatcattgtt tttctcttga 2460
ttcccacttt gtggttctaa gtactgtggt ttccaaatgt gtcagtttca tagcctgaag 2520
aacgagatca gcagcctctg ttccacatac acttcattct cagtattgtt ttgccaagtt 2580
ctaattccat cagacctcga cctgcagccc ctagataact tcgtataatg tatgctatac 2640
gaagttat 2648
<210> 22
<211> 100
<212> DNA
<213> 小家鼠
<400> 22
attgtgactt gggcatcact tgactgatgg taatcagttg cagagagaga agtgcactga 60
ttaagtctgt ccacacaggg tctgtctggc caggagtgca 100
<210> 23
<211> 100
<212> DNA
<213> 小家鼠
<400> 23
gaaccgcggc gcgtcaagca gagacgagtt ccgcccacgt gaaagatggc gtttgtagtg 60
acagccatcc caattgccct ttccttctag gtggaaagtg 100
<210> 24
<211> 2648
<212> DNA
<213> 人工序列
<220>
<223> 含有8028加lox位点的floxed盒
<400> 24
ataacttcgt ataatgtatg ctatacgaag ttatatgcat ggcctccgcg ccgggttttg 60
gcgcctcccg cgggcgcccc cctcctcacg gcgagcgctg ccacgtcaga cgaagggcgc 120
agcgagcgtc ctgatccttc cgcccggacg ctcaggacag cggcccgctg ctcataagac 180
tcggccttag aaccccagta tcagcagaag gacattttag gacgggactt gggtgactct 240
agggcactgg ttttctttcc agagagcgga acaggcgagg aaaagtagtc ccttctcggc 300
gattctgcgg agggatctcc gtggggcggt gaacgccgat gattatataa ggacgcgccg 360
ggtgtggcac agctagttcc gtcgcagccg ggatttgggt cgcggttctt gtttgtggat 420
cgctgtgatc gtcacttggt gagtagcggg ctgctgggct ggccggggct ttcgtggccg 480
ccgggccgct cggtgggacg gaagcgtgtg gagagaccgc caagggctgt agtctgggtc 540
cgcgagcaag gttgccctga actgggggtt ggggggagcg cagcaaaatg gcggctgttc 600
ccgagtcttg aatggaagac gcttgtgagg cgggctgtga ggtcgttgaa acaaggtggg 660
gggcatggtg ggcggcaaga acccaaggtc ttgaggcctt cgctaatgcg ggaaagctct 720
tattcgggtg agatgggctg gggcaccatc tggggaccct gacgtgaagt ttgtcactga 780
ctggagaact cggtttgtcg tctgttgcgg gggcggcagt tatggcggtg ccgttgggca 840
gtgcacccgt acctttggga gcgcgcgccc tcgtcgtgtc gtgacgtcac ccgttctgtt 900
ggcttataat gcagggtggg gccacctgcc ggtaggtgtg cggtaggctt ttctccgtcg 960
caggacgcag ggttcgggcc tagggtaggc tctcctgaat cgacaggcgc cggacctctg 1020
gtgaggggag ggataagtga ggcgtcagtt tctttggtcg gttttatgta cctatcttct 1080
taagtagctg aagctccggt tttgaactat gcgctcgggg ttggcgagtg tgttttgtga 1140
agttttttag gcaccttttg aaatgtaatc atttgggtca atatgtaatt ttcagtgtta 1200
gactagtaaa ttgtccgcta aattctggcc gtttttggct tttttgttag acgtgttgac 1260
aattaatcat cggcatagta tatcggcata gtataatacg acaaggtgag gaactaaacc 1320
atgggatcgg ccattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag 1380
aggctattcg gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc 1440
cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 1500
aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 1560
gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 1620
ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 1680
gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 1740
aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 1800
ctggacgaag agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc 1860
atgcccgacg gcgatgatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 1920
gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 1980
tatcaggaca tagcgttggc tacccgtgat attgctgaag agcttggcgg cgaatgggct 2040
gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat 2100
cgccttcttg acgagttctt ctgaggggat ccgctgtaag tctgcagaaa ttgatgatct 2160
attaaacaat aaagatgtcc actaaaatgg aagtttttcc tgtcatactt tgttaagaag 2220
ggtgagaaca gagtacctac attttgaatg gaaggattgg agctacgggg gtgggggtgg 2280
ggtgggatta gataaatgcc tgctctttac tgaaggctct ttactattgc tttatgataa 2340
tgtttcatag ttggatatca taatttaaac aagcaaaacc aaattaaggg ccagctcatt 2400
cctcccactc atgatctata gatctataga tctctcgtgg gatcattgtt tttctcttga 2460
ttcccacttt gtggttctaa gtactgtggt ttccaaatgt gtcagtttca tagcctgaag 2520
aacgagatca gcagcctctg ttccacatac acttcattct cagtattgtt ttgccaagtt 2580
ctaattccat cagacctcga cctgcagccc ctagataact tcgtataatg tatgctatac 2640
gaagttat 2648
<210> 25
<211> 100
<212> DNA
<213> 小家鼠
<400> 25
attgtgactt gggcatcact tgactgatgg taatcagttg cagagagaga agtgcactga 60
ttaagtctgt ccacacaggg tctgtctggc caggagtgca 100
<210> 26
<211> 680
<212> DNA
<213> 小家鼠
<400> 26
ccagtagcag cacccacgtc caccttctgt ctagtaatgt ccaacacctc cctcagtcca 60
aacactgctc tgcatccatg tggctcccat ttatacctga agcacttgat ggggcctcaa 120
tgttttacta gagcccaccc ccctgcaact ctgagaccct ctggatttgt ctgtcagtgc 180
ctcactgggg cgttggataa tttcttaaaa ggtcaagttc cctcagcagc attctctgag 240
cagtctgaag atgtgtgctt ttcacagttc aaatccatgt ggctgtttca cccacctgcc 300
tggccttggg ttatctatca ggacctagcc tagaagcagg tgtgtggcac ttaacaccta 360
agctgagtga ctaactgaac actcaagtgg atgccatctt tgtcacttct tgactgtgac 420
acaagcaact cctgatgcca aagccctgcc cacccctctc atgcccatat ttggacatgg 480
tacaggtcct cactggccat ggtctgtgag gtcctggtcc tctttgactt cataattcct 540
aggggccact agtatctata agaggaagag ggtgctggct cccaggccac agcccacaaa 600
attccacctg ctcacaggtt ggctggctcg acccaggtgg tgtcccctgc tctgagccag 660
ctcccggcca agccagcacc 680
<210> 27
<211> 1052
<212> DNA
<213> 小家鼠
<400> 27
tgccatcatc acaggatgtc cttccttctc cagaagacag actggggctg aaggaaaagc 60
cggccaggct cagaacgagc cccactaatt actgcctcca acagctttcc actcactgcc 120
cccagcccaa catccccttt ttaactggga agcattccta ctctccattg tacgcacacg 180
ctcggaagcc tggctgtggg tttgggcatg agaggcaggg acaacaaaac cagtatatat 240
gattataact ttttcctgtt tccctatttc caaatggtcg aaaggaggaa gttaggtcta 300
cctaagctga atgtattcag ttagcaggag aaatgaaatc ctatacgttt aatactagag 360
gagaaccgcc ttagaatatt tatttcattg gcaatgactc caggactaca cagcgaaatt 420
gtattgcatg tgctgccaaa atactttagc tctttccttc gaagtacgtc ggatcctgta 480
attgagacac cgagtttagg tgactagggt tttcttttga ggaggagtcc cccaccccgc 540
cccgctctgc cgcgacagga agctagcgat ccggaggact tagaatacaa tcgtagtgtg 600
ggtaaacatg gagggcaagc gcctgcaaag ggaagtaaga agattcccag tccttgttga 660
aatccatttg caaacagagg aagctgccgc gggtcgcagt cggtgggggg aagccctgaa 720
ccccacgctg cacggctggg ctggccaggt gcggccacgc ccccatcgcg gcggctggta 780
ggagtgaatc agaccgtcag tattggtaaa gaagtctgcg gcagggcagg gagggggaag 840
agtagtcagt cgctcgctca ctcgctcgct cgcacagaca ctgctgcagt gacactcggc 900
cctccagtgt cgcggagacg caagagcagc gcgcagcacc tgtccgcccg gagcgagccc 960
ggcccgcggc cgtagaaaag gagggaccgc cgaggtgcgc gtcagtactg ctcagcccgg 1020
cagggacgcg ggaggatgtg gactgggtgg ac 1052
<210> 28
<211> 2008
<212> DNA
<213> 小家鼠
<400> 28
gtggtgctga ctcagcatcg gttaataaac cctctgcagg aggctggatt tcttttgttt 60
aattatcact tggacctttc tgagaactct taagaattgt tcattcgggt ttttttgttt 120
tgttttggtt tggttttttt gggttttttt tttttttttt tttttggttt ttggagacag 180
ggtttctctg tatatagccc tggcacaaga gcaagctaac agcctgtttc ttcttggtgc 240
tagcgccccc tctggcagaa aatgaaataa caggtggacc tacaaccccc cccccccccc 300
ccagtgtatt ctactcttgt ccccggtata aatttgattg ttccgaacta cataaattgt 360
agaaggattt tttagatgca catatcattt tctgtgatac cttccacaca cccctccccc 420
ccaaaaaaat ttttctggga aagtttcttg aaaggaaaac agaagaacaa gcctgtcttt 480
atgattgagt tgggcttttg ttttgctgtg tttcatttct tcctgtaaac aaatactcaa 540
atgtccactt cattgtatga ctaagttggt atcattaggt tgggtctggg tgtgtgaatg 600
tgggtgtgga tctggatgtg ggtgggtgtg tatgccccgt gtgtttagaa tactagaaaa 660
gataccacat cgtaaacttt tgggagagat gatttttaaa aatgggggtg ggggtgaggg 720
gaacctgcga tgaggcaagc aagataaggg gaagacttga gtttctgtga tctaaaaagt 780
cgctgtgatg ggatgctggc tataaatggg cccttagcag cattgtttct gtgaattgga 840
ggatccctgc tgaaggcaaa agaccattga aggaagtacc gcatctggtt tgttttgtaa 900
tgagaagcag gaatgcaagg tccacgctct taataataaa caaacaggac attgtatgcc 960
atcatcacag gatgtccttc cttctccaga agacagactg gggctgaagg aaaagccggc 1020
caggctcaga acgagcccca ctaattactg cctccaacag ctttccactc actgccccca 1080
gcccaacatc ccctttttaa ctgggaagca ttcctactct ccattgtacg cacacgctcg 1140
gaagcctggc tgtgggtttg ggcatgagag gcagggacaa caaaaccagt atatatgatt 1200
ataacttttt cctgtttccc tatttccaaa tggtcgaaag gaggaagtta ggtctaccta 1260
agctgaatgt attcagttag caggagaaat gaaatcctat acgtttaata ctagaggaga 1320
accgccttag aatatttatt tcattggcaa tgactccagg actacacagc gaaattgtat 1380
tgcatgtgct gccaaaatac tttagctctt tccttcgaag tacgtcggat cctgtaattg 1440
agacaccgag tttaggtgac tagggttttc ttttgaggag gagtccccca ccccgccccg 1500
ctctgccgcg acaggaagct agcgatccgg aggacttaga atacaatcgt agtgtgggta 1560
aacatggagg gcaagcgcct gcaaagggaa gtaagaagat tcccagtcct tgttgaaatc 1620
catttgcaaa cagaggaagc tgccgcgggt cgcagtcggt ggggggaagc cctgaacccc 1680
acgctgcacg gctgggctgg ccaggtgcgg ccacgccccc atcgcggcgg ctggtaggag 1740
tgaatcagac cgtcagtatt ggtaaagaag tctgcggcag ggcagggagg gggaagagta 1800
gtcagtcgct cgctcactcg ctcgctcgca cagacactgc tgcagtgaca ctcggccctc 1860
cagtgtcgcg gagacgcaag agcagcgcgc agcacctgtc cgcccggagc gagcccggcc 1920
cgcggccgta gaaaaggagg gaccgccgag gtgcgcgtca gtactgctca gcccggcagg 1980
gacgcgggag gatgtggact gggtggac 2008
<210> 29
<211> 252
<212> DNA
<213> 人工序列
<220>
<223> DNA印迹探针
<400> 29
ccggggcggg gctgcggttg cggtgcctgc gcccgcggcg gcggaggcgc aggcggtggc 60
gagtgggtga gtgaggaggc ggcatcctgg cgggtggctg tttggggttc ggctgccggg 120
aagaggcgcg ggtagaagcg ggggctctcc tcagagctcg acgcattttt actttccctc 180
tcatttctct gaccgaagct gggtgtcggg ctttcgcctc tagcgactgg tggaattgcc 240
tgcatccggg cc 252
<210> 30
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> Asuragen2-正向引物
<400> 30
tgcgcctccg ccgccgcggg cgcaggcacc gcaaccgca 39
<210> 31
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> Asuragen2-反向引物
<400> 31
cgcagcctgt agcaagctct ggaactcagg agtcg 35
<210> 32
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> Asuragen 3-正向引物
<400> 32
atgcaggcaa ttccaccagt cgctagaggc gaaagc 36
<210> 33
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> Asuragen 3-反向引物
<400> 33
taaccagaag aaaacaagga gggaaacaac cgcagcctgt 40
<210> 34
<211> 158
<212> DNA
<213> 智人
<400> 34
acgtaaccta cggtgtcccg ctaggaaaga gaggtgcgtc aaacagcgac aagttccgcc 60
cacgtaaaag atgacgcttg gtgtgtcagc cgtccctgct gcccggttgc ttctcttttg 120
ggggcggggt ctagcaagag caggtgtggg tttaggag 158
<210> 35
<211> 487
<212> DNA
<213> 智人
<400> 35
tatctccgga gcatttggat aatgtgacag ttggaatgca gtgatgtcga ctctttgccc 60
accgccatct ccagctgttg ccaagacaga gattgcttta agtggcaaat cacctttatt 120
agcagctact tttgcttact gggacaatat tcttggtcct agagtaaggc acatttgggc 180
tccaaagaca gaacaggtac ttctcagtga tggagaaata acttttcttg ccaaccacac 240
tctaaatgga gaaatccttc gaaatgcaga gagtggtgct atagatgtaa agttttttgt 300
cttgtctgaa aagggagtga ttattgtttc attaatcttt gatggaaact ggaatgggga 360
tcgcagcaca tatggactat caattatact tccacagaca gaacttagtt tctacctccc 420
acttcataga gtgtgtgttg atagattaac acatataatc cggaaaggaa gaatatggat 480
gcataag 487
<210> 36
<211> 198
<212> DNA
<213> 智人
<400> 36
gggtctagca agagcaggtg tgggtttagg aggtgtgtgt ttttgttttt cccaccctct 60
ctccccacta cttgctctca cagtactcgc tgagggtgaa caagaaaaga cctgataaag 120
attaaccaga agaaaacaag gagggaaaca accgcagcct gtagcaagct ctggaactca 180
ggagtcgcgc gctatgcg 198
<210> 37
<211> 118
<212> DNA
<213> 智人
<400> 37
gcgatcgcgg ggcgtggtcg gggcgggccc gggggcgggc ccggggcggg gctgcggttg 60
cggtgcctgc gcccgcggcg gcggaggcgc aggcggtggc gagtgggtga gtgaggag 118
<210> 38
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 38
agtactgtga gagcaagtag 20
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 39
gctctcacag tactcgctga 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 40
ccgcagcctg tagcaagctc 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 41
cggccgctag cgcgatcgcg 20
<210> 42
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 42
acgccccgcg atcgcgctag 20
<210> 43
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 43
tggcgagtgg gtgagtgagg 20
<210> 44
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 44
ggaagaggcg cgggtagaag 20
<210> 45
<211> 1302
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 45
gaacttacgg agtcccacga gggaaccgcg gcgcgtcaag cagagacgag ttccgcccac 60
gtgaaagatg gcgtttgtag tgacagccat cccaattgcc ctttccttct aggtggaaag 120
tggggtctag caagagcagg tgtgggttta ggaggtgtgt gtttttgttt ttcccaccct 180
ctctccccac tacttgctct cacagtactc gctgagggtg aacaagaaaa gacctgataa 240
agattaacca gaagaaaaca aggagggaaa caaccgcagc ctgtagcaag ctctggaact 300
caggagtcgc gcgctatgcg atcgccgtct cggggccggg gccggggccg gggccggggc 360
cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 420
cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 480
cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 540
cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 600
cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 660
cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 720
cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 780
cggggccggg gccggggccg gggccggggc cggggccggg gccggggccg gggccggggc 840
cggggccggg gccggggccg gggccggggc cggggccggg gccgagaccc tcgagggccg 900
gccgctagcg cgatcgcggg gcgtggtcgg ggcgggcccg ggggcgggcc cggggcgggg 960
ctgcggttgc ggtgcctgcg cccgcggcgg cggaggcgca ggcggtgcga gtgggtgagt 1020
gaggaggcgg catcctggcg ggtggctgtt tggggttcgg ctgccgggaa gaggcgcggg 1080
tagaagcggg ggctctcctc agagctcgac gcatttttac tttccctctc atttctctga 1140
ccgaagctgg gtgtcgggct ttcgcctcta gcgactggtg gaattgcctg catccgggcc 1200
ccgggcttcc cggcggcggc ggcggcggcg gcggcgcagg gacaagggat ggggatctgg 1260
cctcttcctt gctttcccgc cctcagtacc cgagctgtct cc 1302
<210> 46
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 46
gagtactgtg agagcaagta g 21
<210> 47
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 47
gccgcagcct gtagcaagct c 21
<210> 48
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 48
gcggccgcta gcgcgatcgc g 21
<210> 49
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 49
gacgccccgc gatcgcgcta g 21
<210> 50
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 50
gtggcgagtg ggtgagtgag g 21
<210> 51
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 51
acaccgctct cacagtactc gctgag 26
<210> 52
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 52
acaccgccgc agcctgtagc aagctcg 27
<210> 53
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 53
acaccgagta ctgtgagagc aagtagg 27
<210> 54
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 54
acaccgacgc cccgcgatcg cgctagg 27
<210> 55
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 55
acaccgcggc cgctagcgcg atcgcgg 27
<210> 56
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 56
acaccgtggc gagtgggtga gtgaggg 27
<210> 57
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 57
acaccggaag aggcgcgggt agaagg 26
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 58
gacgcgttaa tgccaacttt 20
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 59
gagggcctat ttcccatgat 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 60
gacgcgttaa tgccaacttt 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 61
gaacttacgg agtcccacga 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 62
ggagacagct cgggtactga 20
<210> 63
<211> 82
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 63
gttggaacca ttcaaaacag catagcaagt taaaataagg ctagtccgtt atcaacttga 60
aaaagtggca ccgagtcggt gc 82
<210> 64
<211> 76
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 64
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgc 76
<210> 65
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> 合成
<400> 65
gtttaagagc tatgctggaa acagcatagc aagtttaaat aaggctagtc cgttatcaac 60
ttgaaaaagt ggcaccgagt cggtgc 86
<210> 66
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 66
catcccaatt gccctttcc 19
<210> 67
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 67
cccacacctg ctcttgctag a 21
<210> 68
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 68
tctaggtgga aagtggg 17
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 69
gagcaggtgt gggtttagga 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 70
ccaggtctca ctgcattcca 20
<210> 71
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 71
attgcaagcg ttcggataat gtgaga 26
<210> 72
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 72
gctgtcacga aggctttctt c 21
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 73
gcactgctgc caactacaac 20
<210> 74
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 74
tcaatgccat cagctcacac ctgc 24
<210> 75
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 75
aagaggcgcg ggtagaa 17
<210> 76
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 76
cagcttcggt cagagaaatg ag 22
<210> 77
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 77
ctctcctcag agctcgacgc attt 24
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物
<400> 78
ctgcacaatt tcagcccaag 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物
<400> 79
caggtcatgt cccacagaat 20
<210> 80
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 探针
<400> 80
catatgaggg cagcaatgca agtc 24
<210> 81
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 用于有义G4C2 RNA的LNA探针
<220>
<221> TYE563
<222> (1)..(1)
<400> 81
ccccggcccc ggcccc 16
<210> 82
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于反义G4C2 RNA的LNA探针
<220>
<221> TYE563
<222> (1)..(1)
<400> 82
ggggccgggg ccggggggcc cc 22
<210> 83
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 用于有义G4C2 RNA的DNA探针
<220>
<221> Cy3
<222> (18)..(18)
<400> 83
ccccggcccc ggccccgg 18
<210> 84
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> 用于反义G4C2 RNA的DNA探针
<220>
<221> Cy3
<222> (17)..(17)
<400> 84
ggggccgggg ccggggc 17
Claims (51)
1.一种非人类动物或非人类动物细胞,所述非人类动物或非人类动物细胞的基因组包含插入内源C9orf72基因座的异源六核苷酸重复扩增序列,其中所述异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少一个重复。
2.根据权利要求1所述的非人类动物或非人类动物细胞,其中所述异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的所述六核苷酸序列的至少三十个重复。
3.根据权利要求1或权利要求2所述的非人类动物或非人类动物细胞,其中所述六核苷酸重复扩增包含阐述为SEQ ID NO:1的所述六核苷酸序列的至少90个重复。
4.根据权利要求1到3中任一项所述的非人类动物或非人类动物细胞,其中所述非人类动物或非人类动物细胞展现(i)C9orf72转录物的表达相较于包含野生型C9orf72基因座的对照动物增加;(ii)RNA团簇数量相较于包含野生型C9orf72基因座的对照动物增加;(iii)二肽重复蛋白的含量相较于包含野生型C9orf72基因座的对照动物增加;或(iv)(i)-(iii)的任何组合。
5.根据前述权利要求中任一项所述的非人类动物或非人类动物细胞,其中所述异源六核苷酸重复扩增序列位于所述内源C9orf72基因座的第一非编码内源外显子与外显子2之间。
6.根据权利要求5所述的非人类动物或非人类动物细胞,其中所述内源C9orf72基因座包含阐述为SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7的核苷酸序列,或其变异体。
7.根据前述权利要求中任一项所述的非人类动物或非人类动物细胞,其中所述非人类动物是啮齿动物或所述非人类动物细胞是啮齿动物细胞。
8.根据权利要求7所述的非人类动物或非人类动物细胞,其中所述啮齿动物是大鼠或小鼠,或其中所述非人类动物细胞是大鼠细胞或小鼠细胞。
9.根据权利要求8所述的非人类动物或非人类动物细胞,其中所述非人类动物是小鼠或所述非人类动物细胞是小鼠细胞,其中所述异源六核苷酸重复扩增序列包含阐述为SEQID NO:1的所述六核苷酸序列的九十二个重复,且其中所述小鼠或小鼠细胞展现全部以下三个特征:(i)C9orf72转录物的表达相较于包含野生型C9orf72基因座的对照动物增加;(ii)RNA团簇数量相较于包含野生型C9orf72基因座的对照动物增加;和(iii)二肽重复蛋白的含量相较于包含野生型C9orf72基因座的对照动物增加。
10.根据前述权利要求中任一项所述的非人类动物或非人类动物细胞,其中所述非人类动物对于所述异源六核苷酸重复扩增序列来说是纯合的。
11.根据权利要求1到9中任一项所述的非人类动物或非人类动物细胞,其中所述非人类动物对于所述异源六核苷酸重复扩增序列来说是杂合的。
12.根据权利要求11所述的非人类动物或非人类动物细胞,其中所述异源六核苷酸重复扩增序列是第一异源六核苷酸扩增序列,其中所述非人类动物或非人类动物细胞对于第二异源六核苷酸重复扩增序列来说也是杂合的,并且其中所述第一扩增序列具有的重复数量与所述第二异源六核苷酸重复扩增序列不同。
13.根据权利要求12所述的非人类动物或非人类动物细胞,其中所述第一异源重复扩增序列包含阐述为SEQ ID NO:1的所述六核苷酸序列的一个至三个重复并且所述第二异源重复扩增序列包含阐述为SEQ ID NO:1的所述六核苷酸序列的四个到一百个重复。
14.根据前述权利要求中任一项所述的非人类动物或非人类动物细胞,其中所述非人类动物细胞是胚胎干细胞、胚胎干细胞衍生的运动神经元、脑细胞、皮层细胞、神经元细胞、肌肉细胞、心脏细胞或生殖细胞。
15.一种永生化细胞系或运动神经元,其衍生自权利要求14中的胚胎干细胞。
16.一种非人类动物胚胎干细胞,其基因组包含内源C9orf72基因座中的异源六核苷酸重复扩增序列,其中所述异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少一个重复。
17.一种非人类动物胚,其由根据权利要求16所述的胚胎干细胞产生。
18.一种制备非人类动物的方法,所述非人类动物的基因组包含六核苷酸序列,所述方法包含
修饰所述非人类动物的所述基因组,使得其内源C9orf72基因座中包含异源六核苷酸重复扩增序列,其中所述异源六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的所述六核苷酸序列的至少一个重复。
19.根据权利要求18所述的方法,其中所述修饰是通过包含以下的方法实现
(a)将包含插入核酸的核酸构建体引入非人类胚胎干细胞中,其中所述插入核酸从5'到3'包含(i)与所述C9orf72基因座的5'靶序列同源的5'同源臂;(ii)异源六核苷酸重复扩增序列;和(iii)与所述C9orf72基因座的5'靶序列同源的3'同源臂;
(b)从(a)获得经过基因修饰的啮齿动物胚胎干细胞;以及
(c)使用(b)的所述经过基因修饰的啮齿动物胚胎干细胞产生啮齿动物。
20.根据权利要求19所述的方法,其中所述插入核酸进一步包含介于所述5'与3'同源臂之间的编码一种或多种选择标记物的一种或多种基因。
21.根据权利要求19或20所述的方法,其中所述插入核酸进一步包含介于所述5'与3'同源臂之间的一个或多个位点特异性重组位点。
22.根据权利要求21所述的方法,其中所述插入核酸进一步包含介于所述5'与3'同源臂之间的重组酶基因和选择标记物基因,所述选择标记物基因侧接所述重组酶识别位点,所述重组酶识别位点经定向以引导切除。
23.根据权利要求19到22中任一项所述的方法,其中所述5'同源臂与所述内源C9orf72基因座的外显子1或其一部分一致或基本上一致。
24.根据权利要求23所述的方法,其中所述5'同源臂包含阐述为SEQ ID NO:20或SEQID NO:23的核苷酸序列。
25.根据权利要求19到24中任一项所述的方法,其中所述3'同源臂与所述内源C9orf72基因座的内含子1的至少一部分一致或基本上一致。
26.根据权利要求25所述的方法,其中所述3'同源臂包含阐述为SEQ ID NO:22或SEQID NO:25的核苷酸序列。
27.根据权利要求18到26中任一项所述的方法,其中所述插入核酸包含阐述为SEQ IDNO:2或SEQ ID NO:4的核酸序列。
28.根据权利要求18到26中任一项所述的方法,其中所述插入核酸包含阐述为SEQ IDNO:3或SEQ ID NO:6的核酸序列。
29.根据权利要求18到28中任一项所述的方法,其进一步包含使(c)中产生的所述啮齿动物繁殖的步骤,以便产生对于所述插入来说是纯合的啮齿动物。
30.根据权利要求18到29中任一项所述的方法,其中所述非人类动物是啮齿动物。
31.根据权利要求30所述的方法,其中所述啮齿动物是大鼠或小鼠。
32.一种非人类动物,其能利用根据权利要求18到31中任一项所述的方法获得。
33.一种鉴定治疗候选物的方法,所述治疗候选物用于治疗与六核苷酸重复扩增序列的存在有关的疾病或病状,所述方法包含
(a)向非人类动物或非人类动物细胞施用候选药剂,所述非人类动物或非人类动物细胞包含经过基因修饰以包含六核苷酸重复扩增序列的C9orf72基因座,所述六核苷酸重复扩增序列包含阐述为SEQ ID NO:1的六核苷酸序列的至少一个重复;
(b)进行一种或多种分析以确定所述候选药剂是否对与所述疾病或病状有关的一种或多种病征、症状和/或病状具有作用;以及
(c)将所述对与所述疾病或病状有关的所述一种或多种病征、症状和/或病状具有作用的候选药剂鉴定为所述治疗候选物。
34.根据权利要求33所述的方法,其中所述候选药剂是体内施用于非人类动物,并且任选地,在施用所述候选药剂之后,对从所述非人类动物中分离出的组织进行体外分析。
35.根据权利要求33所述的方法,其中所述候选药剂是体外施用于非人类胚胎干细胞衍生的运动神经元。
36.根据权利要求33到35中任一项所述的方法,其中所述分析是检测C9orf72基因产物的定量聚合酶链反应(qPCR)。
37.根据权利要求36所述的方法,其中使用引物和/或探针进行qPCR,所述引物和/或探针具有阐述为SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68、SEQ ID NO:69、SEQ ID NO:70、SEQ ID NO:71、SEQ ID NO:72、SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76、SEQ ID NO:77、SEQ ID NO:78、SEQ ID NO:79、SEQ ID NO:80的核苷酸序列,或其任何组合。
38.根据权利要求33到35中任一项所述的方法,其中所述分析是测量包含C9orf72有义或反义RNA转录物的RNA团簇。
39.根据权利要求38所述的方法,其中所述分析是使用一种或多种探针进行的荧光原位杂交法,所述一种或多种探针具有如SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:83和/或SEQ ID NO:84中的任一个所述的核苷酸序列。
40.根据权利要求33到35中任一项所述的方法,其中所述分析是测量聚GA二肽重复蛋白。
41.一种宿主细胞,其包含异源六核苷酸重复扩增序列。
42.根据权利要求41所述的宿主细胞,其中所述宿主细胞是细菌细胞。
43.一种包含Cas蛋白和/或一种或多种gRNA的CRISPR/Cas系统,其中所述一种或多种gRNA是由DNA编码,所述DNA包含选自由以下组成的组的序列:SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQ IDNO:45、SEQ ID NO:46、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:49、SEQ ID NO:50,和其组合。
44.根据权利要求43所述的CRISPR/Cas系统,其中所述一种或多种gRNA包含第一、第二和第三gRNA,其中所述第一gRNA是由包含阐述为SEQ ID NO:39的序列的DNA编码,其中所述第二gRNA是由包含阐述为SEQ ID NO:44的序列的DNA编码,且其中所述第三gRNA是由包含阐述为SEQ ID NO:50的序列的DNA编码。
45.根据权利要求44所述的CRISPR/Cas系统,其进一步包含由DNA编码的第四gRNA,所述DNA包含阐述为SEQ ID NO:47的序列。
46.根据权利要求45所述的CRISPR/Cas系统,其进一步包含第五、第六和第七gRNA,其中所述第五gRNA是由包含阐述为SEQ ID NO:46的序列的DNA编码,所述第六gRNA是由包含阐述为SEQ ID NO:48的序列的DNA编码,且所述第七gRNA是由包含阐述为SEQ ID NO:49的序列的DNA编码。
47.根据权利要求42到46中任一项所述的CRISPR/Cas系统,其中所述gRNA包含由DNA编码的tracrRNA,所述DNA包含阐述为SEQ ID NO:63、64或65的序列。
48.根据权利要求47所述的CRISPR/Cas系统,其中所述tracrRNA是由包含阐述为SEQID NO:63的序列的DNA编码。
49.根据权利要求47所述的CRISPR/Cas系统,其中所述tracrRNA是由包含阐述为SEQID NO:64的序列的DNA编码。
50.根据权利要求47所述的CRISPR/Cas系统,其中所述tracrRNA是由包含阐述为SEQID NO:65的序列的DNA编码。
51.根据权利要求43到50中任一项所述的CRISPR/Cas系统,其进一步包含表达构建体,其中所述表达构建体包含编码所述Cas蛋白的核酸和/或编码所述至少一种gRNA的DNA,且其中所述表达构建体任选地进一步包含抗药基因。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662402613P | 2016-09-30 | 2016-09-30 | |
US62/402,613 | 2016-09-30 | ||
US201762452795P | 2017-01-31 | 2017-01-31 | |
US62/452,795 | 2017-01-31 | ||
PCT/US2017/054551 WO2018064600A1 (en) | 2016-09-30 | 2017-09-29 | Non-human animals having a hexanucleotide repeat expansion in a c9orf72 locus |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109862785A true CN109862785A (zh) | 2019-06-07 |
CN109862785B CN109862785B (zh) | 2022-09-06 |
Family
ID=60201654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780060178.7A Active CN109862785B (zh) | 2016-09-30 | 2017-09-29 | C9orf72基因座中具有六核苷酸重复扩增的非人类动物 |
Country Status (12)
Country | Link |
---|---|
US (2) | US10781453B2 (zh) |
EP (1) | EP3518667A1 (zh) |
JP (2) | JP7026678B2 (zh) |
KR (2) | KR102527979B1 (zh) |
CN (1) | CN109862785B (zh) |
AU (1) | AU2017336100B2 (zh) |
CA (1) | CA3038548A1 (zh) |
IL (2) | IL265669B (zh) |
MX (2) | MX2019003745A (zh) |
RU (1) | RU2760877C2 (zh) |
SG (1) | SG10202102997UA (zh) |
WO (1) | WO2018064600A1 (zh) |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2020127664A (ru) | 2012-10-15 | 2020-09-17 | Ионис Фармасьютикалз, Инк. | Композиции для модуляции экспрессии гена c9orf72 |
WO2014062736A1 (en) | 2012-10-15 | 2014-04-24 | Isis Pharmaceuticals, Inc. | Methods for monitoring c9orf72 expression |
MY192689A (en) | 2013-10-11 | 2022-09-01 | Ionis Pharmaceuticals Inc | Compositions for modulating c9orf72 expression |
EP4410805A2 (en) | 2014-03-18 | 2024-08-07 | University of Massachusetts | Raav-based compositions and methods for treating amyotrophic lateral sclerosis |
US10285388B2 (en) | 2015-05-29 | 2019-05-14 | Regeneron Pharmaceuticals, Inc. | Non-human animals having a disruption in a C9ORF72 locus |
US11260073B2 (en) | 2015-11-02 | 2022-03-01 | Ionis Pharmaceuticals, Inc. | Compounds and methods for modulating C90RF72 |
MX2018007840A (es) * | 2015-12-23 | 2019-05-02 | Crispr Therapeutics Ag | Materiales y metodos para el tratamiento de la esclerosis lateral amiotrofica y/o la degeneracion lobar frontotemporal. |
CA3038548A1 (en) * | 2016-09-30 | 2018-04-05 | Regeneron Pharmaceuticals, Inc. | Non-human animals having a hexanucleotide repeat expansion in a c9orf72 locus |
US11859179B2 (en) | 2017-05-09 | 2024-01-02 | University Of Massachusetts | Methods of treating amyotrophic lateral sclerosis (ALS) |
AU2018338188A1 (en) | 2017-09-22 | 2020-04-02 | University Of Massachusetts | SOD1 dual expression vectors and uses thereof |
EP3701030A4 (en) * | 2017-10-23 | 2022-04-20 | Prevail Therapeutics, Inc. | GENE THERAPIES FOR NEURODEGENERATIVE DISEASES |
WO2019222354A1 (en) * | 2018-05-15 | 2019-11-21 | University Of Washington | Compositions and methods for reducing spliceopathy and treating rna dominance disorders |
CA3120799A1 (en) * | 2018-12-20 | 2020-06-25 | Regeneron Pharmaceuticals, Inc. | Nuclease-mediated repeat expansion |
EP3725536A1 (en) * | 2019-04-18 | 2020-10-21 | Thales Dis France SA | Security document with double verification lenses |
CN114072501A (zh) * | 2019-05-06 | 2022-02-18 | 马萨诸塞大学 | 抗c9orf72寡核苷酸及相关方法 |
KR20220115995A (ko) | 2019-12-13 | 2022-08-19 | 알닐람 파마슈티칼스 인코포레이티드 | 인간 염색체 9 개방 판독 프레임 72 (C9orf72) iRNA 제제 조성물 및 이의 사용 방법 |
WO2021127886A1 (en) * | 2019-12-23 | 2021-07-01 | Tsinghua University | DEVELOPMENT OF DUAL-gRNA APPROACH WITH UNDETECTABLE OFF-TARGET EFFECT TO CORRECT C9ORF72 REPEAT EXPANSION AND C9ORF72 PATHOLOGY |
JP2023520730A (ja) * | 2020-04-09 | 2023-05-18 | アソシエーション・アンスティトゥート・ドゥ・マイオロジー | 筋萎縮性側索硬化症を治療するためのアンチセンス配列 |
US20230381170A1 (en) * | 2020-10-20 | 2023-11-30 | University Of Florida Research Foundation, Incorporated | Method for treating als/ftd through degradation of rna repeat expansion |
AU2022283796A1 (en) | 2021-06-04 | 2023-11-09 | Alnylam Pharmaceuticals, Inc. | HUMAN CHROMOSOME 9 OPEN READING FRAME 72 (C9ORF72) iRNA AGENT COMPOSITIONS AND METHODS OF USE THEREOF |
EP4422627A1 (en) * | 2021-10-27 | 2024-09-04 | University Of Florida Research Foundation, Incorporated | Small molecule degradation methods for treating als/ftd |
WO2024044493A2 (en) * | 2022-08-22 | 2024-02-29 | The Johns Hopkins University | Treatment of repeat expansion disease |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5514545A (en) * | 1992-06-11 | 1996-05-07 | Trustees Of The University Of Pennsylvania | Method for characterizing single cells based on RNA amplification for diagnostics and therapeutics |
WO2013041577A1 (en) * | 2011-09-20 | 2013-03-28 | Vib Vzw | Methods for the diagnosis of amyotrophic lateral sclerosis and frontotemporal lobar degeneration |
US8697359B1 (en) * | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
US20140206102A1 (en) * | 2013-01-24 | 2014-07-24 | Mayo Foundation For Medical Education And Research | Methods and materials for detecting c9orf72 hexanucleotide repeat expansion positive frontotemporal lobar degeneration or c9orf72 hexanucleotide repeat expansion positive amyotrophic lateral sclerosis |
US20140310828A1 (en) * | 2013-04-16 | 2014-10-16 | Regeneron Pharmaceuticals, Inc. | Targeted modification of rat genome |
CN104968783A (zh) * | 2012-10-15 | 2015-10-07 | Isis制药公司 | 用于调节c9orf72表达的组合物 |
WO2016025692A1 (en) * | 2014-08-13 | 2016-02-18 | The Scripps Research Institute | Treatment of c9ftd/als by targeting rna expanded repeat sequences |
WO2016060919A1 (en) * | 2014-10-14 | 2016-04-21 | The Board Of Regents Of The University Of Texas System | Allele selective inhibition of mutant c9orf72 foci expression by duplex rnas targeting the expanded hexanucleotide repeat |
US20160108396A1 (en) * | 2014-08-15 | 2016-04-21 | Pfizer Inc. | Oligomers targeting hexanucleotide repeat expansion in human c9orf72 gene |
CN105916983A (zh) * | 2013-10-25 | 2016-08-31 | 塞勒克提斯公司 | 用于高效且特异性靶向包含高度重复基序的dna序列的稀有切割核酸内切酶的设计 |
US20160270377A1 (en) * | 2015-03-16 | 2016-09-22 | Regeneron Pharmaceuticals, Inc. | Non-human animal exhibiting diminished upper and lower motor neuron function and sensory perception |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5523226A (en) | 1993-05-14 | 1996-06-04 | Biotechnology Research And Development Corp. | Transgenic swine compositions and methods |
US5670356A (en) | 1994-12-12 | 1997-09-23 | Promega Corporation | Modified luciferase |
US5874304A (en) | 1996-01-18 | 1999-02-23 | University Of Florida Research Foundation, Inc. | Humanized green fluorescent protein genes and methods |
AU8587598A (en) | 1997-07-26 | 1999-02-16 | Wisconsin Alumni Research Foundation | Trans-species nuclear transfer |
US20050144655A1 (en) | 2000-10-31 | 2005-06-30 | Economides Aris N. | Methods of modifying eukaryotic cells |
US7105348B2 (en) | 2000-10-31 | 2006-09-12 | Regeneron Pharmaceuticals, Inc. | Methods of modifying eukaryotic cells |
US6596541B2 (en) | 2000-10-31 | 2003-07-22 | Regeneron Pharmaceuticals, Inc. | Methods of modifying eukaryotic cells |
US6586251B2 (en) * | 2000-10-31 | 2003-07-01 | Regeneron Pharmaceuticals, Inc. | Methods of modifying eukaryotic cells |
AUPR451401A0 (en) | 2001-04-20 | 2001-05-24 | Monash University | A method of nuclear transfer |
US7612250B2 (en) | 2002-07-29 | 2009-11-03 | Trustees Of Tufts College | Nuclear transfer embryo formation method |
ES2463476T3 (es) | 2004-10-19 | 2014-05-28 | Regeneron Pharmaceuticals, Inc. | Método para generar un ratón homocigótico para una modificación genética |
CN101117633B (zh) | 2006-08-03 | 2011-07-20 | 上海交通大学附属儿童医院 | 一种细胞核移植方法 |
DK3064599T3 (en) | 2008-02-15 | 2019-04-08 | Synthetic Genomics Inc | METHODS IN VITRO FOR COMBINING AND COMBINATORY CONSTRUCTION OF NUCLEIC ACID MOLECULES |
RU2425880C2 (ru) * | 2009-07-30 | 2011-08-10 | Учреждение Российской академии наук Институт общей генетики им. Н.И. Вавилова РАН | Способ получения трансгенных мышей |
NZ810903A (en) | 2009-08-14 | 2024-08-30 | Revivicor Inc | Multi-transgenic pigs for diabetes treatment |
US8518392B2 (en) | 2009-08-14 | 2013-08-27 | Regeneron Pharmaceuticals, Inc. | Promoter-regulated differentiation-dependent self-deleting cassette |
CA2846307C (en) | 2011-08-31 | 2020-03-10 | Hospital District Of Helsinki And Uusimaa | Method for diagnosing a neurodegenerative disease |
ES2683071T3 (es) | 2012-04-25 | 2018-09-24 | Regeneron Pharmaceuticals, Inc. | Direccionamiento mediado por nucleasas con grandes vectores de direccionamiento |
WO2014062736A1 (en) | 2012-10-15 | 2014-04-24 | Isis Pharmaceuticals, Inc. | Methods for monitoring c9orf72 expression |
ES2762326T5 (es) | 2012-10-15 | 2023-04-27 | Ionis Pharmaceuticals Inc | Métodos para modular la expresión de C9ORF72 |
JP6475172B2 (ja) | 2013-02-20 | 2019-02-27 | リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. | ラットの遺伝子組換え |
JP6628285B2 (ja) * | 2013-03-14 | 2020-01-08 | ユニバーシティ オブ フロリダ リサーチ ファンデーション インコーポレーティッド | Als関連ジアミノ酸リピート含有タンパク質 |
CA2932472A1 (en) | 2013-12-12 | 2015-06-18 | Massachusetts Institute Of Technology | Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders |
EP4410805A2 (en) * | 2014-03-18 | 2024-08-07 | University of Massachusetts | Raav-based compositions and methods for treating amyotrophic lateral sclerosis |
WO2015153760A2 (en) | 2014-04-01 | 2015-10-08 | Sangamo Biosciences, Inc. | Methods and compositions for prevention or treatment of a nervous system disorder |
CA2953499C (en) | 2014-06-23 | 2023-10-24 | Regeneron Pharmaceuticals, Inc. | Nuclease-mediated dna assembly |
US9902971B2 (en) | 2014-06-26 | 2018-02-27 | Regeneron Pharmaceuticals, Inc. | Methods for producing a mouse XY embryonic (ES) cell line capable of producing a fertile XY female mouse in an F0 generation |
SI3221457T1 (sl) | 2014-11-21 | 2019-08-30 | Regeneron Pharmaceuticals, Inc. | Postopki in sestavki za ciljno genetsko modifikacijo z uporabo vodilnih RNK v parih |
LT3850946T (lt) | 2014-12-05 | 2024-01-10 | Regeneron Pharmaceuticals, Inc. | Gyvūnai, išskyrus žmogų, turintys humanizuotą ląstelės diferenciacijos klasterio 47 geną |
WO2016100819A1 (en) | 2014-12-19 | 2016-06-23 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for targeted genetic modification through single-step multiple targeting |
WO2016112132A1 (en) | 2015-01-06 | 2016-07-14 | Ionis Pharmaceuticals, Inc. | Compositions for modulating expression of c9orf72 antisense transcript |
EP3289081B1 (en) | 2015-04-27 | 2019-03-27 | Genethon | Compositions and methods for the treatment of nucleotide repeat expansion disorders |
WO2016179112A1 (en) | 2015-05-01 | 2016-11-10 | Precision Biosciences, Inc. | Precise deletion of chromoscomal sequences in vivo and treatment of nucleotide repeat expansion disorders using engineered nucleases |
US10285388B2 (en) | 2015-05-29 | 2019-05-14 | Regeneron Pharmaceuticals, Inc. | Non-human animals having a disruption in a C9ORF72 locus |
EP3344756A4 (en) | 2015-09-02 | 2019-09-04 | University of Massachusetts | DETECTION OF LOCI OF GENES COMPRISING MATRIX REPETITIONS OF CRISPR AND / OR POLYCHROMATIC MONO-GUIDE RIBONUCLEIC ACIDS |
MX2018007840A (es) | 2015-12-23 | 2019-05-02 | Crispr Therapeutics Ag | Materiales y metodos para el tratamiento de la esclerosis lateral amiotrofica y/o la degeneracion lobar frontotemporal. |
US20190167814A1 (en) | 2016-04-14 | 2019-06-06 | Université de Lausanne | Treatment And/Or Prevention Of DNA-Triplet Repeat Diseases Or Disorders |
WO2018022480A1 (en) | 2016-07-25 | 2018-02-01 | Mayo Foundation For Medical Education And Research | Treating cancer |
CA3038548A1 (en) * | 2016-09-30 | 2018-04-05 | Regeneron Pharmaceuticals, Inc. | Non-human animals having a hexanucleotide repeat expansion in a c9orf72 locus |
US20190256868A1 (en) | 2016-10-28 | 2019-08-22 | Genethon | Compositions and methods for the treatment of myotonic dystrophy |
CN110234762A (zh) | 2016-10-28 | 2019-09-13 | 吉尼松公司 | 用于治疗肌强直性营养不良的组合物和方法 |
WO2018165541A1 (en) | 2017-03-10 | 2018-09-13 | The Board Of Regents Of The University Of Texas System | Treatment of fuchs' endothelial corneal dystrophy |
US11859179B2 (en) | 2017-05-09 | 2024-01-02 | University Of Massachusetts | Methods of treating amyotrophic lateral sclerosis (ALS) |
US20190167815A1 (en) | 2017-10-24 | 2019-06-06 | Sangamo Therapeutics, Inc. | Methods and compositions for the treatment of rare diseases |
-
2017
- 2017-09-29 CA CA3038548A patent/CA3038548A1/en active Pending
- 2017-09-29 EP EP17792229.1A patent/EP3518667A1/en active Pending
- 2017-09-29 US US15/721,517 patent/US10781453B2/en active Active
- 2017-09-29 KR KR1020217026697A patent/KR102527979B1/ko active IP Right Grant
- 2017-09-29 JP JP2019517273A patent/JP7026678B2/ja active Active
- 2017-09-29 AU AU2017336100A patent/AU2017336100B2/en active Active
- 2017-09-29 KR KR1020197011950A patent/KR102294755B1/ko active IP Right Grant
- 2017-09-29 WO PCT/US2017/054551 patent/WO2018064600A1/en active Application Filing
- 2017-09-29 RU RU2019108888A patent/RU2760877C2/ru active
- 2017-09-29 MX MX2019003745A patent/MX2019003745A/es unknown
- 2017-09-29 CN CN201780060178.7A patent/CN109862785B/zh active Active
- 2017-09-29 SG SG10202102997UA patent/SG10202102997UA/en unknown
-
2019
- 2019-03-27 IL IL265669A patent/IL265669B/en unknown
- 2019-03-29 MX MX2021003996A patent/MX2021003996A/es unknown
-
2020
- 2020-08-05 US US16/986,077 patent/US20200370054A1/en active Pending
- 2020-09-25 JP JP2020160492A patent/JP2020198894A/ja not_active Withdrawn
-
2021
- 2021-07-21 IL IL285014A patent/IL285014A/en unknown
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5514545A (en) * | 1992-06-11 | 1996-05-07 | Trustees Of The University Of Pennsylvania | Method for characterizing single cells based on RNA amplification for diagnostics and therapeutics |
WO2013041577A1 (en) * | 2011-09-20 | 2013-03-28 | Vib Vzw | Methods for the diagnosis of amyotrophic lateral sclerosis and frontotemporal lobar degeneration |
CN104968783A (zh) * | 2012-10-15 | 2015-10-07 | Isis制药公司 | 用于调节c9orf72表达的组合物 |
US8697359B1 (en) * | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
US20140206102A1 (en) * | 2013-01-24 | 2014-07-24 | Mayo Foundation For Medical Education And Research | Methods and materials for detecting c9orf72 hexanucleotide repeat expansion positive frontotemporal lobar degeneration or c9orf72 hexanucleotide repeat expansion positive amyotrophic lateral sclerosis |
US20140310828A1 (en) * | 2013-04-16 | 2014-10-16 | Regeneron Pharmaceuticals, Inc. | Targeted modification of rat genome |
CN105916983A (zh) * | 2013-10-25 | 2016-08-31 | 塞勒克提斯公司 | 用于高效且特异性靶向包含高度重复基序的dna序列的稀有切割核酸内切酶的设计 |
WO2016025692A1 (en) * | 2014-08-13 | 2016-02-18 | The Scripps Research Institute | Treatment of c9ftd/als by targeting rna expanded repeat sequences |
US20160108396A1 (en) * | 2014-08-15 | 2016-04-21 | Pfizer Inc. | Oligomers targeting hexanucleotide repeat expansion in human c9orf72 gene |
WO2016060919A1 (en) * | 2014-10-14 | 2016-04-21 | The Board Of Regents Of The University Of Texas System | Allele selective inhibition of mutant c9orf72 foci expression by duplex rnas targeting the expanded hexanucleotide repeat |
US20160270377A1 (en) * | 2015-03-16 | 2016-09-22 | Regeneron Pharmaceuticals, Inc. | Non-human animal exhibiting diminished upper and lower motor neuron function and sensory perception |
Non-Patent Citations (2)
Title |
---|
JEANNIE CHEW等: ""C90RF72 repeat expansions in mice cause TDP-43 pathology, neuronal loss, and behavioral deficits"", 《SCIENCE》 * |
王奥楠等: "C9orf72相关性肌萎缩侧索硬化的研究进展", 《北京医学》 * |
Also Published As
Publication number | Publication date |
---|---|
WO2018064600A1 (en) | 2018-04-05 |
JP7026678B2 (ja) | 2022-02-28 |
US20200370054A1 (en) | 2020-11-26 |
KR102294755B1 (ko) | 2021-08-31 |
RU2760877C2 (ru) | 2021-12-01 |
US20180094267A1 (en) | 2018-04-05 |
MX2019003745A (es) | 2019-12-11 |
CA3038548A1 (en) | 2018-04-05 |
JP2020198894A (ja) | 2020-12-17 |
AU2017336100A1 (en) | 2019-05-23 |
EP3518667A1 (en) | 2019-08-07 |
RU2019108888A3 (zh) | 2021-01-18 |
KR20190057104A (ko) | 2019-05-27 |
IL265669A (en) | 2019-05-30 |
JP2019530453A (ja) | 2019-10-24 |
MX2021003996A (es) | 2021-06-23 |
AU2017336100B2 (en) | 2023-11-30 |
CN109862785B (zh) | 2022-09-06 |
SG10202102997UA (en) | 2021-04-29 |
IL285014A (en) | 2021-08-31 |
US10781453B2 (en) | 2020-09-22 |
RU2019108888A (ru) | 2020-10-30 |
KR20210109649A (ko) | 2021-09-06 |
IL265669B (en) | 2021-08-31 |
KR102527979B1 (ko) | 2023-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109862785A (zh) | C9orf72基因座中具有六核苷酸重复扩增的非人类动物 | |
US20210105983A1 (en) | Genetically modified mouse whose genome comprises a humanized cd274 gene | |
KR102454546B1 (ko) | 인간화 림프구 활성화 유전자 3을 갖는 비인간 동물 | |
CN111163633B (zh) | 包含人源化ttr基因座的非人类动物及其使用方法 | |
JP7275043B2 (ja) | 増大したhATファミリートランスポゾン媒介遺伝子導入ならびに関連する組成物、システムおよび方法 | |
CN107205368A (zh) | 具有人源化分化簇47基因的非人动物 | |
JP2020532952A (ja) | Casトランスジェニックマウスの胚性幹細胞およびマウスならびにその使用 | |
KR20180131545A (ko) | 트랜스포존 시스템 및 사용 방법 | |
JP2021527427A (ja) | 強化されたhATファミリーのトランスポゾンが介在する遺伝子導入ならびに関連する組成物、システム、及び方法 | |
KR102709884B1 (ko) | 인간화된 trkb 유전자좌를 포함하는 비인간 동물 | |
CN113874510A (zh) | 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法 | |
CN108779159A (zh) | 具有经改造的angptl8基因的非人动物 | |
RU2800428C2 (ru) | НЕ ЯВЛЯЮЩИЕСЯ ЧЕЛОВЕКОМ ЖИВОТНЫЕ, СОДЕРЖАЩИЕ ГУМАНИЗИРОВАННЫЙ ЛОКУС TrkB | |
WO2023150798A1 (en) | Compositions and methods for defining optimal treatment timeframes in lysosomal disease | |
CN116670160A (zh) | Dlx2载体 | |
NZ727157B2 (en) | Non-human animals having a humanized programmed cell death 1 gene |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |