CN113939595A - 包括人源化白蛋白基因座的非人动物 - Google Patents
包括人源化白蛋白基因座的非人动物 Download PDFInfo
- Publication number
- CN113939595A CN113939595A CN202080038954.5A CN202080038954A CN113939595A CN 113939595 A CN113939595 A CN 113939595A CN 202080038954 A CN202080038954 A CN 202080038954A CN 113939595 A CN113939595 A CN 113939595A
- Authority
- CN
- China
- Prior art keywords
- albumin
- human
- human animal
- sequence
- locus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108010088751 Albumins Proteins 0.000 title claims abstract description 429
- 102000009027 Albumins Human genes 0.000 title claims abstract 81
- 241001465754 Metazoa Species 0.000 title abstract description 24
- 241000282414 Homo sapiens Species 0.000 claims abstract description 424
- 108091006905 Human Serum Albumin Proteins 0.000 claims abstract description 318
- 102000008100 Human Serum Albumin Human genes 0.000 claims abstract description 262
- 239000003795 chemical substances by application Substances 0.000 claims abstract description 229
- 230000008685 targeting Effects 0.000 claims abstract description 203
- 238000000034 method Methods 0.000 claims abstract description 179
- 101710163270 Nuclease Proteins 0.000 claims abstract description 150
- 210000004102 animal cell Anatomy 0.000 claims abstract description 56
- 238000001727 in vivo Methods 0.000 claims abstract description 24
- 108090000623 proteins and genes Proteins 0.000 claims description 393
- 150000007523 nucleic acids Chemical class 0.000 claims description 337
- 102000004169 proteins and genes Human genes 0.000 claims description 329
- 102000039446 nucleic acids Human genes 0.000 claims description 317
- 108020004707 nucleic acids Proteins 0.000 claims description 317
- 210000004027 cell Anatomy 0.000 claims description 283
- 108020005004 Guide RNA Proteins 0.000 claims description 221
- 108020004414 DNA Proteins 0.000 claims description 144
- 230000014509 gene expression Effects 0.000 claims description 74
- 108091033409 CRISPR Proteins 0.000 claims description 71
- 230000004048 modification Effects 0.000 claims description 53
- 238000012986 modification Methods 0.000 claims description 53
- 239000013598 vector Substances 0.000 claims description 50
- 230000000694 effects Effects 0.000 claims description 43
- 230000001404 mediated effect Effects 0.000 claims description 42
- 108091026890 Coding region Proteins 0.000 claims description 40
- 108020004999 messenger RNA Proteins 0.000 claims description 40
- 108010071390 Serum Albumin Proteins 0.000 claims description 33
- 102000007562 Serum Albumin Human genes 0.000 claims description 32
- 238000003780 insertion Methods 0.000 claims description 32
- 230000037431 insertion Effects 0.000 claims description 32
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 30
- 108700028369 Alleles Proteins 0.000 claims description 28
- 210000001161 mammalian embryo Anatomy 0.000 claims description 27
- 108020004705 Codon Proteins 0.000 claims description 24
- 210000004185 liver Anatomy 0.000 claims description 23
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 23
- 239000000203 mixture Substances 0.000 claims description 22
- 210000002966 serum Anatomy 0.000 claims description 18
- 238000012217 deletion Methods 0.000 claims description 16
- 102100022641 Coagulation factor IX Human genes 0.000 claims description 12
- 108010076282 Factor IX Proteins 0.000 claims description 12
- 230000037430 deletion Effects 0.000 claims description 12
- 238000010362 genome editing Methods 0.000 claims description 12
- 150000002632 lipids Chemical class 0.000 claims description 12
- 108700008625 Reporter Genes Proteins 0.000 claims description 9
- 210000002257 embryonic structure Anatomy 0.000 claims description 9
- 108091081024 Start codon Proteins 0.000 claims description 8
- 108091026898 Leader sequence (mRNA) Proteins 0.000 claims description 7
- 108091036066 Three prime untranslated region Proteins 0.000 claims description 7
- 238000004519 manufacturing process Methods 0.000 claims description 6
- 239000002105 nanoparticle Substances 0.000 claims description 6
- 241000124008 Mammalia Species 0.000 claims description 5
- 238000009472 formulation Methods 0.000 claims description 5
- 210000004602 germ cell Anatomy 0.000 claims description 5
- 241000702421 Dependoparvovirus Species 0.000 claims description 4
- 230000026279 RNA modification Effects 0.000 claims description 4
- 230000036961 partial effect Effects 0.000 claims description 4
- PGOHTUIFYSHAQG-LJSDBVFPSA-N (2S)-6-amino-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-4-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S,3R)-2-[[(2S)-5-amino-2-[[(2S)-2-[[(2S)-2-[[(2S,3R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-5-amino-2-[[(2S)-1-[(2S,3R)-2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-1-[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-amino-4-methylsulfanylbutanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-5-carbamimidamidopentanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]amino]acetyl]amino]-3-hydroxypropanoyl]amino]-4-methylpentanoyl]amino]-3-sulfanylpropanoyl]amino]-4-methylsulfanylbutanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-hydroxybutanoyl]pyrrolidine-2-carbonyl]amino]-5-oxopentanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-(1H-imidazol-5-yl)propanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxybutanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-5-carbamimidamidopentanoyl]amino]-5-oxopentanoyl]amino]-3-hydroxybutanoyl]amino]-3-hydroxypropanoyl]amino]-3-carboxypropanoyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]-5-oxopentanoyl]amino]-3-phenylpropanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoyl]amino]-4-oxobutanoyl]amino]-5-carbamimidamidopentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-4-carboxybutanoyl]amino]-5-oxopentanoyl]amino]hexanoic acid Chemical compound CSCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O PGOHTUIFYSHAQG-LJSDBVFPSA-N 0.000 claims description 3
- 108010000499 Thromboplastin Proteins 0.000 claims description 3
- 102000002262 Thromboplastin Human genes 0.000 claims description 3
- 229940046166 oligodeoxynucleotide Drugs 0.000 claims description 3
- 238000012032 thrombin generation assay Methods 0.000 claims description 3
- 238000012296 in situ hybridization assay Methods 0.000 claims 1
- 239000012634 fragment Substances 0.000 abstract description 25
- 102100027211 Albumin Human genes 0.000 description 348
- 235000018102 proteins Nutrition 0.000 description 299
- 102000053602 DNA Human genes 0.000 description 143
- 125000003729 nucleotide group Chemical group 0.000 description 121
- 239000002773 nucleotide Substances 0.000 description 120
- 230000000875 corresponding effect Effects 0.000 description 86
- 230000000295 complement effect Effects 0.000 description 81
- 238000003776 cleavage reaction Methods 0.000 description 44
- 230000007017 scission Effects 0.000 description 44
- 108091027967 Small hairpin RNA Proteins 0.000 description 39
- 210000001519 tissue Anatomy 0.000 description 39
- 108091028043 Nucleic acid sequence Proteins 0.000 description 37
- 235000001014 amino acid Nutrition 0.000 description 37
- 238000006467 substitution reaction Methods 0.000 description 35
- 150000001413 amino acids Chemical class 0.000 description 32
- 102000040430 polynucleotide Human genes 0.000 description 32
- 108091033319 polynucleotide Proteins 0.000 description 32
- 239000002157 polynucleotide Substances 0.000 description 32
- 241000700159 Rattus Species 0.000 description 31
- 229940024606 amino acid Drugs 0.000 description 31
- 230000005782 double-strand break Effects 0.000 description 31
- 108091028113 Trans-activating crRNA Proteins 0.000 description 26
- 230000006780 non-homologous end joining Effects 0.000 description 24
- 230000001105 regulatory effect Effects 0.000 description 24
- 241000699666 Mus <mouse, genus> Species 0.000 description 22
- 230000027455 binding Effects 0.000 description 22
- 108700024394 Exon Proteins 0.000 description 21
- 210000000056 organ Anatomy 0.000 description 21
- 230000035772 mutation Effects 0.000 description 20
- 241000699670 Mus sp. Species 0.000 description 18
- 241000700605 Viruses Species 0.000 description 16
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 16
- 108091006047 fluorescent proteins Proteins 0.000 description 16
- 102000034287 fluorescent proteins Human genes 0.000 description 16
- 102000004190 Enzymes Human genes 0.000 description 15
- 108090000790 Enzymes Proteins 0.000 description 15
- 108091092195 Intron Proteins 0.000 description 15
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 15
- 108091005461 Nucleic proteins Proteins 0.000 description 15
- 108700019146 Transgenes Proteins 0.000 description 15
- 229940088598 enzyme Drugs 0.000 description 15
- 238000002744 homologous recombination Methods 0.000 description 15
- 230000006801 homologous recombination Effects 0.000 description 15
- 210000004962 mammalian cell Anatomy 0.000 description 15
- 229920001184 polypeptide Polymers 0.000 description 15
- 102000004196 processed proteins & peptides Human genes 0.000 description 15
- 210000005260 human cell Anatomy 0.000 description 14
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 13
- 241000193996 Streptococcus pyogenes Species 0.000 description 13
- 230000001939 inductive effect Effects 0.000 description 13
- 239000000178 monomer Substances 0.000 description 13
- 238000010453 CRISPR/Cas method Methods 0.000 description 12
- 101000930477 Mus musculus Albumin Proteins 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 238000009396 hybridization Methods 0.000 description 12
- 238000011160 research Methods 0.000 description 12
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 11
- 230000004568 DNA-binding Effects 0.000 description 11
- 241000283984 Rodentia Species 0.000 description 11
- 238000001890 transfection Methods 0.000 description 11
- 108020004635 Complementary DNA Proteins 0.000 description 10
- 238000010804 cDNA synthesis Methods 0.000 description 10
- 239000002299 complementary DNA Substances 0.000 description 10
- 239000013612 plasmid Substances 0.000 description 10
- 108010054624 red fluorescent protein Proteins 0.000 description 10
- 101150058750 ALB gene Proteins 0.000 description 9
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 9
- 125000003275 alpha amino acid group Chemical group 0.000 description 9
- 210000004940 nucleus Anatomy 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 230000002441 reversible effect Effects 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 108020005345 3' Untranslated Regions Proteins 0.000 description 8
- 101100001390 Homo sapiens ALB gene Proteins 0.000 description 8
- 241001494479 Pecora Species 0.000 description 8
- 108010091086 Recombinases Proteins 0.000 description 8
- 102000018120 Recombinases Human genes 0.000 description 8
- 241000191043 Rhodobacter sphaeroides Species 0.000 description 8
- 238000010459 TALEN Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 8
- 210000003527 eukaryotic cell Anatomy 0.000 description 8
- 210000003494 hepatocyte Anatomy 0.000 description 8
- 238000000338 in vitro Methods 0.000 description 8
- 230000010354 integration Effects 0.000 description 8
- 230000008439 repair process Effects 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 7
- 241000193403 Clostridium Species 0.000 description 7
- 241000194032 Enterococcus faecalis Species 0.000 description 7
- 108010029485 Protein Isoforms Proteins 0.000 description 7
- 102000001708 Protein Isoforms Human genes 0.000 description 7
- 241000194017 Streptococcus Species 0.000 description 7
- 108700026226 TATA Box Proteins 0.000 description 7
- 230000002457 bidirectional effect Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 210000000349 chromosome Anatomy 0.000 description 7
- 210000000805 cytoplasm Anatomy 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 239000000758 substrate Substances 0.000 description 7
- 241000640374 Alicyclobacillus acidocaldarius Species 0.000 description 6
- 241000699800 Cricetinae Species 0.000 description 6
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 6
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 6
- 241000589601 Francisella Species 0.000 description 6
- 241000283973 Oryctolagus cuniculus Species 0.000 description 6
- -1 PRO0883 Proteins 0.000 description 6
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 230000003197 catalytic effect Effects 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 6
- 239000000693 micelle Substances 0.000 description 6
- 239000004005 microsphere Substances 0.000 description 6
- 230000010076 replication Effects 0.000 description 6
- 230000005783 single-strand break Effects 0.000 description 6
- 108020003589 5' Untranslated Regions Proteins 0.000 description 5
- 241000193830 Bacillus <bacterium> Species 0.000 description 5
- 241000283690 Bos taurus Species 0.000 description 5
- 238000011740 C57BL/6 mouse Methods 0.000 description 5
- 108091079001 CRISPR RNA Proteins 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 241000191967 Staphylococcus aureus Species 0.000 description 5
- 241000187747 Streptomyces Species 0.000 description 5
- 241000282887 Suidae Species 0.000 description 5
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 5
- 108091023045 Untranslated Region Proteins 0.000 description 5
- 235000004279 alanine Nutrition 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 238000002716 delivery method Methods 0.000 description 5
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 5
- 238000004520 electroporation Methods 0.000 description 5
- 108020001507 fusion proteins Proteins 0.000 description 5
- 102000037865 fusion proteins Human genes 0.000 description 5
- 230000000415 inactivating effect Effects 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 235000018977 lysine Nutrition 0.000 description 5
- 238000000520 microinjection Methods 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 230000003612 virological effect Effects 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 4
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 4
- 241000272517 Anseriformes Species 0.000 description 4
- 241000271566 Aves Species 0.000 description 4
- 241000589875 Campylobacter jejuni Species 0.000 description 4
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 4
- 108010053770 Deoxyribonucleases Proteins 0.000 description 4
- 102000016911 Deoxyribonucleases Human genes 0.000 description 4
- 102000004533 Endonucleases Human genes 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- 108010085220 Multiprotein Complexes Proteins 0.000 description 4
- 102000007474 Multiprotein Complexes Human genes 0.000 description 4
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 239000000074 antisense oligonucleotide Substances 0.000 description 4
- 238000012230 antisense oligonucleotides Methods 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 230000008827 biological function Effects 0.000 description 4
- 244000309464 bull Species 0.000 description 4
- 210000000234 capsid Anatomy 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 235000013601 eggs Nutrition 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000009368 gene silencing by RNA Effects 0.000 description 4
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 4
- 229960000027 human factor ix Drugs 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 238000004806 packaging method and process Methods 0.000 description 4
- 229920000747 poly(lactic acid) Polymers 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 230000010415 tropism Effects 0.000 description 4
- 239000013603 viral vector Substances 0.000 description 4
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 4
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 3
- 241000972680 Adeno-associated virus - 6 Species 0.000 description 3
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 241000282472 Canis lupus familiaris Species 0.000 description 3
- 241000283707 Capra Species 0.000 description 3
- 241000579895 Chlorostilbon Species 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- 108010051219 Cre recombinase Proteins 0.000 description 3
- 241000283086 Equidae Species 0.000 description 3
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 3
- 241000287828 Gallus gallus Species 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- 241001112693 Lachnospiraceae Species 0.000 description 3
- 108091022875 Microtubule Proteins 0.000 description 3
- 102000029749 Microtubule Human genes 0.000 description 3
- 101100434646 Mus musculus Alb gene Proteins 0.000 description 3
- 229930193140 Neomycin Natural products 0.000 description 3
- 241000187654 Nocardia Species 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 241000282405 Pongo abelii Species 0.000 description 3
- 241000605861 Prevotella Species 0.000 description 3
- 241000700584 Simplexvirus Species 0.000 description 3
- 241000589970 Spirochaetales Species 0.000 description 3
- 241000194020 Streptococcus thermophilus Species 0.000 description 3
- 239000004098 Tetracycline Substances 0.000 description 3
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 239000012190 activator Substances 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 230000004075 alteration Effects 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 102000025171 antigen binding proteins Human genes 0.000 description 3
- 108091000831 antigen binding proteins Proteins 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 235000013330 chicken meat Nutrition 0.000 description 3
- 229940105774 coagulation factor ix Drugs 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 235000018417 cysteine Nutrition 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 210000001671 embryonic stem cell Anatomy 0.000 description 3
- 229910052876 emerald Inorganic materials 0.000 description 3
- 239000010976 emerald Substances 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000001415 gene therapy Methods 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 3
- 238000011577 humanized mouse model Methods 0.000 description 3
- 238000005304 joining Methods 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000002844 melting Methods 0.000 description 3
- 230000008018 melting Effects 0.000 description 3
- 210000004688 microtubule Anatomy 0.000 description 3
- 210000003470 mitochondria Anatomy 0.000 description 3
- 230000000869 mutational effect Effects 0.000 description 3
- 229960004927 neomycin Drugs 0.000 description 3
- 230000000149 penetrating effect Effects 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 230000036470 plasma concentration Effects 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000028327 secretion Effects 0.000 description 3
- 239000004055 small Interfering RNA Substances 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 210000001082 somatic cell Anatomy 0.000 description 3
- 210000000130 stem cell Anatomy 0.000 description 3
- 229960002180 tetracycline Drugs 0.000 description 3
- 229930101283 tetracycline Natural products 0.000 description 3
- 235000019364 tetracycline Nutrition 0.000 description 3
- 150000003522 tetracyclines Chemical class 0.000 description 3
- 238000010361 transduction Methods 0.000 description 3
- 230000026683 transduction Effects 0.000 description 3
- 230000009261 transgenic effect Effects 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 229910052725 zinc Inorganic materials 0.000 description 3
- 239000011701 zinc Substances 0.000 description 3
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 2
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 2
- BZTDTCNHAFUJOG-UHFFFAOYSA-N 6-carboxyfluorescein Chemical compound C12=CC=C(O)C=C2OC2=CC(O)=CC=C2C11OC(=O)C2=CC=C(C(=O)O)C=C21 BZTDTCNHAFUJOG-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 241001290773 Acidiphilium acidophilum Species 0.000 description 2
- 241000605222 Acidithiobacillus ferrooxidans Species 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 241001164823 Adeno-associated virus - 7 Species 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 2
- 241000283726 Bison Species 0.000 description 2
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 2
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 108091005944 Cerulean Proteins 0.000 description 2
- 241000282994 Cervidae Species 0.000 description 2
- 241000206751 Chrysophyceae Species 0.000 description 2
- 235000005979 Citrus limon Nutrition 0.000 description 2
- 244000131522 Citrus pyriformis Species 0.000 description 2
- 241000193163 Clostridioides difficile Species 0.000 description 2
- 241000938605 Crocodylia Species 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 101150039948 F9 gene Proteins 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 241001272567 Hominoidea Species 0.000 description 2
- 101000823435 Homo sapiens Coagulation factor IX Proteins 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 241000179980 Microcoleus Species 0.000 description 2
- 241000588650 Neisseria meningitidis Species 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241000286209 Phasianidae Species 0.000 description 2
- 102000007584 Prealbumin Human genes 0.000 description 2
- 108010071690 Prealbumin Proteins 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 2
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 2
- 241000271567 Struthioniformes Species 0.000 description 2
- 102000002933 Thioredoxin Human genes 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 241000545067 Venus Species 0.000 description 2
- 230000002378 acidificating effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 210000004504 adult stem cell Anatomy 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 239000007857 degradation product Substances 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229960004222 factor ix Drugs 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 102000054766 genetic haplotypes Human genes 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000007901 in situ hybridization Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 244000144972 livestock Species 0.000 description 2
- 230000021121 meiosis Effects 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 230000009437 off-target effect Effects 0.000 description 2
- 210000000287 oocyte Anatomy 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 210000004738 parenchymal cell Anatomy 0.000 description 2
- 230000008775 paternal effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 230000003285 pharmacodynamic effect Effects 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 229910052594 sapphire Inorganic materials 0.000 description 2
- 239000010980 sapphire Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000004960 subcellular localization Effects 0.000 description 2
- 238000010381 tandem affinity purification Methods 0.000 description 2
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 210000005253 yeast cell Anatomy 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- ISMWWJGHELLJIL-JEDNCBNOSA-N (2s)-2-amino-3-(1h-imidazol-5-yl)propanoic acid;nickel Chemical compound [Ni].OC(=O)[C@@H](N)CC1=CNC=N1 ISMWWJGHELLJIL-JEDNCBNOSA-N 0.000 description 1
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 1
- UVBYMVOUBXYSFV-UHFFFAOYSA-N 1-methylpseudouridine Natural products O=C1NC(=O)N(C)C=C1C1C(O)C(O)C(CO)O1 UVBYMVOUBXYSFV-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- KQPKMEYBZUPZGK-UHFFFAOYSA-N 4-[(4-azido-2-nitroanilino)methyl]-5-(hydroxymethyl)-2-methylpyridin-3-ol Chemical compound CC1=NC=C(CO)C(CNC=2C(=CC(=CC=2)N=[N+]=[N-])[N+]([O-])=O)=C1O KQPKMEYBZUPZGK-UHFFFAOYSA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 1
- 241000589220 Acetobacter Species 0.000 description 1
- 241001135190 Acetohalobium Species 0.000 description 1
- 241000186426 Acidipropionibacterium acidipropionici Species 0.000 description 1
- 241000266272 Acidithiobacillus Species 0.000 description 1
- 241001464929 Acidithiobacillus caldus Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 1
- 241001136782 Alca Species 0.000 description 1
- 241001092085 Alchemilla Species 0.000 description 1
- 102000007698 Alcohol dehydrogenase Human genes 0.000 description 1
- 108010021809 Alcohol dehydrogenase Proteins 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 108010045123 Blasticidin-S deaminase Proteins 0.000 description 1
- 102000004506 Blood Proteins Human genes 0.000 description 1
- 108010017384 Blood Proteins Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 241001478240 Coccus Species 0.000 description 1
- 208000003322 Coinfection Diseases 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 244000033273 Dahlia variabilis Species 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101000889905 Enterobacteria phage RB3 Intron-associated endonuclease 3 Proteins 0.000 description 1
- 101000889904 Enterobacteria phage T4 Defective intron-associated endonuclease 3 Proteins 0.000 description 1
- 101000889900 Enterobacteria phage T4 Intron-associated endonuclease 1 Proteins 0.000 description 1
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108090000331 Firefly luciferases Proteins 0.000 description 1
- 241000589602 Francisella tularensis Species 0.000 description 1
- 229940123611 Genome editing Drugs 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- MAJYPBAJPNUFPV-BQBZGAKWSA-N His-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 MAJYPBAJPNUFPV-BQBZGAKWSA-N 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000693913 Homo sapiens Albumin Proteins 0.000 description 1
- 101000744174 Homo sapiens DNA-3-methyladenine glycosylase Proteins 0.000 description 1
- 101100012329 Homo sapiens F9 gene Proteins 0.000 description 1
- 101001111984 Homo sapiens N-acylneuraminate-9-phosphatase Proteins 0.000 description 1
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 1
- 102000018251 Hypoxanthine Phosphoribosyltransferase Human genes 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 241001300668 Jatropha integerrima Species 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241001134698 Lyngbya Species 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 102100025169 Max-binding protein MNT Human genes 0.000 description 1
- 241000699673 Mesocricetus auratus Species 0.000 description 1
- 108010063312 Metalloproteins Proteins 0.000 description 1
- 102000010750 Metalloproteins Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 241000588622 Moraxella bovis Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 101000823436 Mus musculus Coagulation factor IX Proteins 0.000 description 1
- 101100012330 Mus musculus F9 gene Proteins 0.000 description 1
- 101100451662 Mus musculus Prm1 gene Proteins 0.000 description 1
- 241000699669 Mus saxicola Species 0.000 description 1
- 102100023906 N-acylneuraminate-9-phosphatase Human genes 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 241000192497 Oscillatoria Species 0.000 description 1
- 241000192520 Oscillatoria sp. Species 0.000 description 1
- 101150049281 PRM1 gene Proteins 0.000 description 1
- 108010088535 Pep-1 peptide Proteins 0.000 description 1
- CXOFVDLJLONNDW-UHFFFAOYSA-N Phenytoin Chemical compound N1C(=O)NC(=O)C1(C=1C=CC=CC=1)C1=CC=CC=C1 CXOFVDLJLONNDW-UHFFFAOYSA-N 0.000 description 1
- 108091036407 Polyadenylation Proteins 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- 241001302521 Prevotella albensis Species 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 101000823432 Rattus norvegicus Coagulation factor IX Proteins 0.000 description 1
- 101100012334 Rattus norvegicus F9 gene Proteins 0.000 description 1
- 101100503586 Rattus norvegicus Furin gene Proteins 0.000 description 1
- 101001023863 Rattus norvegicus Glucocorticoid receptor Proteins 0.000 description 1
- 241000700161 Rattus rattus Species 0.000 description 1
- 241000191021 Rhodobacter sp. Species 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 108020004422 Riboswitch Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108010052160 Site-specific recombinase Proteins 0.000 description 1
- 241000736131 Sphingomonas Species 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 101710192266 Tegument protein VP22 Proteins 0.000 description 1
- 241000228178 Thermoascus Species 0.000 description 1
- 108090000190 Thrombin Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 108010027570 Xanthine phosphoribosyltransferase Proteins 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012082 adaptor molecule Substances 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- PPQRONHOSHZGFQ-LMVFSUKVSA-N aldehydo-D-ribose 5-phosphate Chemical group OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PPQRONHOSHZGFQ-LMVFSUKVSA-N 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000002459 blastocyst Anatomy 0.000 description 1
- 210000002449 bone cell Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 230000010094 cellular senescence Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 238000010382 chemical cross-linking Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 108010057988 ecdysone receptor Proteins 0.000 description 1
- 210000003981 ectoderm Anatomy 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 108010026638 endodeoxyribonuclease FokI Proteins 0.000 description 1
- 210000001900 endoderm Anatomy 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 210000003038 endothelium Anatomy 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 210000003999 epithelial cell of bile duct Anatomy 0.000 description 1
- 102000015694 estrogen receptors Human genes 0.000 description 1
- 108010038795 estrogen receptors Proteins 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 229940118764 francisella tularensis Drugs 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 210000000973 gametocyte Anatomy 0.000 description 1
- 210000001654 germ layer Anatomy 0.000 description 1
- 230000002518 glial effect Effects 0.000 description 1
- 125000000291 glutamic acid group Chemical class N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 235000013928 guanylic acid Nutrition 0.000 description 1
- 239000004226 guanylic acid Substances 0.000 description 1
- 210000002064 heart cell Anatomy 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 102000044814 human ALB Human genes 0.000 description 1
- 229940052349 human coagulation factor ix Drugs 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000015788 innate immune response Effects 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 210000003794 male germ cell Anatomy 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000003716 mesoderm Anatomy 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000025608 mitochondrion localization Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 210000004898 n-terminal fragment Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 210000000633 nuclear envelope Anatomy 0.000 description 1
- 125000000371 nucleobase group Chemical group 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- VYNDHICBIRRPFP-UHFFFAOYSA-N pacific blue Chemical compound FC1=C(O)C(F)=C2OC(=O)C(C(=O)O)=CC2=C1 VYNDHICBIRRPFP-UHFFFAOYSA-N 0.000 description 1
- 210000004923 pancreatic tissue Anatomy 0.000 description 1
- 235000012736 patent blue V Nutrition 0.000 description 1
- RGCLLPNLLBQHPF-HJWRWDBZSA-N phosphamidon Chemical compound CCN(CC)C(=O)C(\Cl)=C(/C)OP(=O)(OC)OC RGCLLPNLLBQHPF-HJWRWDBZSA-N 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- 210000000608 photoreceptor cell Anatomy 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 239000004626 polylactic acid Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 108010045647 puromycin N-acetyltransferase Proteins 0.000 description 1
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 1
- 210000005084 renal tissue Anatomy 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 210000003583 retinal pigment epithelium Anatomy 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 210000003935 rough endoplasmic reticulum Anatomy 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- 101150024821 tetO gene Proteins 0.000 description 1
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 1
- 229960004072 thrombin Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 230000001018 virulence Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K67/00—Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
- A01K67/027—New or modified breeds of vertebrates
- A01K67/0275—Genetically modified vertebrates, e.g. transgenic
- A01K67/0278—Knock-in vertebrates, e.g. humanised vertebrates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K49/00—Preparations for testing in vivo
- A61K49/0004—Screening or testing of compounds for diagnosis of disorders, assessment of conditions, e.g. renal clearance, gastric emptying, testing for diabetes, allergy, rheuma, pancreas functions
- A61K49/0008—Screening agents using (non-human) animal models or transgenic animal models or chimeric hosts, e.g. Alzheimer disease animal model, transgenic model for heart failure
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/76—Albumins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/76—Albumins
- C07K14/765—Serum albumin, e.g. HSA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2207/00—Modified animals
- A01K2207/15—Humanized animals
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/07—Animals genetically altered by homologous recombination
- A01K2217/072—Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2227/00—Animals characterised by species
- A01K2227/10—Mammal
- A01K2227/105—Murine
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2267/00—Animals characterised by purpose
- A01K2267/03—Animal model, e.g. for test or diseases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/8509—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic
- C12N2015/8527—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells for producing genetically modified animals, e.g. transgenic for producing animal models, e.g. for tests or diseases
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Veterinary Medicine (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Environmental Sciences (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Animal Behavior & Ethology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Animal Husbandry (AREA)
- Biodiversity & Conservation Biology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Microbiology (AREA)
- Public Health (AREA)
- Urology & Nephrology (AREA)
- Pathology (AREA)
- Endocrinology (AREA)
- Diabetes (AREA)
- Rheumatology (AREA)
- Epidemiology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
提供了包括人源化白蛋白(ALB)基因座的非人动物基因组、非人动物细胞和非人动物以及制备和使用此类非人动物基因组、非人动物细胞和非人动物的方法。包括人源化白蛋白基因座的非人动物细胞或非人动物表达人白蛋白或嵌合白蛋白,所述嵌合白蛋白的片段来自人白蛋白。提供了用于使用包括人源化白蛋白基因座的此类非人动物来评估如核酸酶药剂等被设计成靶向人白蛋白的人白蛋白靶向试剂的体内功效的方法。
Description
相关申请的交叉引用
本申请要求于2019年6月7日提交的美国申请第62/858,589号和于2019年10月17日提交的美国申请第62/916,666号的权益,所述美国申请中的每个美国申请出于所有目的通过引用整体并入本文。
序列表的引用通过EFS WEB作为文本文件提交
写入文件548157SEQLIST.txt中的序列表为158千字节,创建于2020年5月27日,并且特此通过引用并入。
背景技术
基因疗法是一种很有前景的用于若干种人疾病的治疗方法。关于基因疗法的一种方法是将转基因插入到基因组中的安全港基因座中。安全港基因座包含染色体基因座,在所述染色体基因座中,转基因或其它外源核酸插入物可以在所有所关注组织中稳定且可靠地表达,而不会明显改变细胞行为或表型。通常,安全港基因座是其中所插入基因序列的表达不受来自相邻基因的任何通读表达干扰的基因座。例如,安全港基因座可以包含染色体基因座,在所述染色体基因座中,外源DNA可以以可预测的方式整合和发挥作用,而不会对内源性基因结构或表达产生不利影响。安全港基因座可以包含基因外区域或基因内区域,例如非必需、可有可无或能够在没有明显表型结果的情况下破裂的基因内的基因座。
安全港基因座的实例是白蛋白。然而,仍然需要合适的非人动物,所述非人动物在体内提供人白蛋白靶向试剂在内源性白蛋白基因座处的真实人基因组DNA靶标的真实或紧密近似,由此能够测试此类药剂在活体动物中的功效和作用模式以及在人源化基因是存在的白蛋白的唯一版本的背景下的药代动力学和药效动力学研究。
发明内容
提供了包括人源化白蛋白(ALB)基因座的非人动物以及制备和使用此类非人动物的方法。还提供了包括人源化白蛋白(ALB)基因座的非人动物基因组或细胞。还提供了人源化白蛋白基因。
一方面,提供了包括人源化白蛋白(ALB)基因座的非人动物基因组、非人动物细胞或非人动物。此类非人动物基因组、非人动物细胞或非人动物可以在其基因组中包括人源化内源性白蛋白基因座,其中所述内源性白蛋白基因座的区段已经缺失并且被对应人白蛋白序列替代。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座编码包括人血清白蛋白肽的蛋白质。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座编码包括人白蛋白前肽的蛋白质。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座编码包括人白蛋白信号肽的蛋白质。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述内源性白蛋白基因座的包括编码序列和非编码序列两者的区域已经缺失并且被包括编码序列和非编码序列两者的对应人白蛋白序列替代。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座包括内源性白蛋白启动子,其中所述人白蛋白序列与所述内源性白蛋白启动子可操作地连接。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述内源性白蛋白基因座的至少一个内含子和至少一个外显子已经缺失并且被所述对应人白蛋白序列替代。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述内源性白蛋白基因座的整个白蛋白编码序列已经缺失并且被所述对应人白蛋白序列替代。任选地,所述内源性白蛋白基因座的从起始密码子到终止密码子的区域已经缺失并且被所述对应人白蛋白序列替代。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座包括人白蛋白3'非翻译区。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述内源性白蛋白5'非翻译区尚未缺失并且尚未被所述对应人白蛋白序列替代。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述内源性白蛋白基因座的从起始密码子到终止密码子的区域已经缺失并且被包括所述对应人白蛋白序列和人白蛋白3'非翻译区的人白蛋白序列替代,并且所述内源性白蛋白5'非翻译区尚未缺失并且尚未被所述对应人白蛋白序列替代,并且所述内源性白蛋白启动子尚未缺失并且尚未被所述对应人白蛋白序列替代。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座处的所述人白蛋白序列包括与SEQ ID NO:35中所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座编码包括与SEQ ID NO:5中所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列的蛋白质。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座包括编码序列,所述编码序列包括与SEQ ID NO:13中所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性基因座包括与SEQ ID NO:17或18中所示的序列至少90%、95%、96%、97%、98%、99%或100%相同的序列。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座处的所述人白蛋白序列包括与SEQ ID NO:35中所示的序列至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座编码包括与SEQ ID NO:5中所示的序列至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列的蛋白质。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座包括编码序列,所述编码序列包括与SEQ ID NO:13中所示的序列至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座包括与SEQ ID NO:17或18中所示的序列至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述人源化内源性白蛋白基因座不包括选择盒或报告基因。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述非人动物对于所述人源化内源性白蛋白基因座是纯合的。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述非人动物在其种系中包括所述人源化内源性白蛋白基因座。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述非人动物是哺乳动物。任选地,非人动物是大鼠或小鼠。任选地,非人动物是小鼠。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述非人动物的血清白蛋白水平为至少约10mg/mL。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述非人动物的血清白蛋白水平至少与包括野生型白蛋白基因座的对照非人动物的血清白蛋白水平一样高。
在一些此类非人动物基因组、非人动物细胞或非人动物中,所述基因组、细胞或动物对于所述人源化内源性白蛋白基因座是杂合的。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述基因组、细胞或动物对于所述人源化内源性白蛋白基因座是纯合的。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述基因组、细胞或动物进一步包括整合到所述非人动物的一个或多个细胞中的所述人源化内源性白蛋白基因座的至少一个等位基因中的外源性蛋白的编码序列。任选地,所述外源性蛋白的所述编码序列整合到所述人源化内源性白蛋白基因座(例如,在所述非人动物的所述一个或多个细胞中)的所述至少一个等位基因的内含子1中。在一些此类非人动物基因组、非人动物细胞或非人动物中,所述基因组、细胞或动物进一步包括不是所述内源性白蛋白基因座的灭活内源性基因座。任选地,所述非人动物基因组、非人动物细胞或非人动物进一步包括整合到所述人源化内源性白蛋白基因座(例如,在所述非人动物的一个或多个细胞中)的至少一个等位基因中的外源性蛋白的编码序列,其中所述外源性蛋白替代所述失活内源性基因座的功能。任选地,所述灭活内源性基因座是灭活F9基因座。
另一方面,提供了用于产生上述非人动物基因组、非人动物细胞或非人动物的靶向载体。此类靶向载体可以用于产生人源化内源性白蛋白基因座,其中所述内源性白蛋白基因座的区段已经缺失并且被对应人白蛋白序列替代,其中所述靶向载体包括插入核酸,所述插入核酸包括侧接有靶向所述内源性白蛋白基因座处的5'靶序列的5'同源臂和靶向所述内源性白蛋白基因座处的3'靶序列的3'同源臂的所述对应人白蛋白序列。
另一方面,提供了评估人白蛋白靶向试剂的体内活性的方法。一些此类方法包括:(a)向上述非人动物施用所述人白蛋白靶向试剂;以及(b)评估所述人白蛋白靶向试剂在所述非人动物中的活性。
在一些此类方法中,所述施用包括腺相关病毒(AAV)介导的递送、脂质纳米颗粒(LNP)介导的递送或流体动力学递送(HDD)。任选地,所述施用包括LNP介导的递送。任选地,LNP剂量介于约0.1mg/kg与约2mg/kg之间。在一些此类方法中,所述施用包括AAV8介导的递送。
在一些此类方法中,步骤(b)包括从所述非人动物中分离肝脏并且评估所述人白蛋白靶向试剂在所述肝脏中的活性。
在一些此类方法中,所述人白蛋白靶向试剂是基因组编辑药剂,并且所述评估包括评估对所述人源化内源性白蛋白基因座的修饰。任选地,所述评估包括测量所述人源化内源性白蛋白基因座内的插入或缺失的频率。
在一些此类方法中,所述评估包括测量由所述人源化内源性白蛋白基因座编码的白蛋白信使RNA的表达。在一些此类方法中,所述评估包括测量由所述人源化内源性白蛋白基因座编码的白蛋白的表达。任选地,评估所述白蛋白的表达包括测量所述白蛋白在所述非人动物中的血清水平。任选地,评估所述白蛋白的表达包括测量所述白蛋白在所述非人动物的所述肝脏中的表达。
在一些此类方法中,所述人白蛋白靶向试剂包括被设计成靶向人白蛋白基因的区域的核酸酶药剂。在一些此类方法中,所述人白蛋白靶向试剂包括核酸酶药剂或编码所述核酸酶药剂的核酸,其中所述核酸酶药剂被设计成靶向人白蛋白基因的区域。任选地,所述核酸酶药剂包括Cas蛋白和被设计成靶向所述人白蛋白基因中的向导RNA靶序列的向导RNA。任选地,所述向导RNA靶序列位于所述人白蛋白基因的内含子1中。任选地,Cas蛋白是Cas9蛋白。
在一些此类方法中,所述人白蛋白靶向试剂包括外源性供体核酸,其中所述外源性供体核酸被设计成靶向所述人白蛋白基因,并且任选地其中所述外源性供体核酸是通过AAV递送的。任选地,所述外源性供体核酸是单链寡脱氧核苷酸(ssODN)。任选地,所述外源性供体核酸能够通过非同源末端连接插入到人源化白蛋白基因座中。
在一些方法中,外源性供体核酸不包括同源臂。在一些方法中,所述外源性供体核酸包括插入核酸,所述插入核酸侧接有靶向所述人源化内源性白蛋白基因座处的5'靶序列的5'同源臂和靶向所述人源化内源性白蛋白基因座处的3'靶序列的3'同源臂。任选地,所述5'靶序列和所述3'靶序列中的每个靶序列包括所述人白蛋白基因的内含子1的区段。
在一些此类方法中,所述外源性供体核酸编码外源性蛋白。任选地,由已经被所述外源性供体核酸靶向的人源化内源性白蛋白基因座编码的蛋白质是包括与所述外源性蛋白融合的人白蛋白信号肽的异源蛋白。任选地,所述外源性蛋白是因子IX蛋白。任选地,所述评估包括测量所述因子IX蛋白在所述非人动物中的血清水平和/或包括评估活化部分凝血活酶时间或执行凝血酶生成测定。任选地,所述非人动物进一步包括灭活F9基因座,并且所述评估包括测量所述因子IX蛋白在所述非人动物中的血清水平和/或包括评估活化部分凝血活酶时间或执行凝血酶生成测定。任选地,所述人白蛋白靶向试剂包括(1)被设计成靶向人白蛋白基因的区域的核酸酶药剂;以及(2)外源性供体核酸,所述外源性供体核酸被设计成靶向所述人白蛋白基因,所述外源性供体核酸编码外源性蛋白,并且由已经被所述外源性供体核酸靶向的人源化内源性白蛋白基因座编码的蛋白质是包括与所述外源性蛋白融合的人白蛋白信号肽的异源蛋白。任选地,所述评估包括测量由所述外源性供体核酸编码的信使RNA的表达。任选地,所述评估包括测量所述外源性蛋白的表达。任选地,评估所述异源蛋白的表达包括测量所述异源蛋白在所述非人动物中的血清水平。任选地,评估所述异源蛋白的表达包括测量所述非人动物的所述肝脏中的表达。
另一方面,提供了优化人白蛋白靶向试剂的体内活性的方法。一些此类方法包括:(I)在第一非人动物中第一次在体内执行评估人白蛋白靶向试剂的活性的上述方法中的任何方法,所述第一非人动物在其基因组中包括人源化内源性白蛋白基因座;(II)改变变量并且在第二非人动物中用所改变变量第二次执行步骤(I)的方法,所述第二非人动物在其基因组中包括人源化内源性白蛋白基因座;以及(III)将步骤(I)中的所述人白蛋白靶向试剂的活性与步骤(II)中的所述人白蛋白靶向试剂的活性进行比较,并且选择产生较高活性的方法。
在一些此类方法中,步骤(II)中的所述所改变变量是将所述人白蛋白靶向试剂引入到所述非人动物中的递送方法。任选地,所述施用包括LNP介导的递送,并且步骤(II)中的所述所改变变量是LNP调配物。在一些此类方法中,步骤(II)中的所述所改变变量是将所述人白蛋白靶向试剂引入到所述非人动物中的施用途径。在一些此类方法中,步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人白蛋白靶向试剂的浓度或量。在一些此类方法中,步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人白蛋白靶向试剂的形式。在一些此类方法中,步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人白蛋白靶向试剂。
在一些此类方法中,所述人白蛋白靶向试剂包括Cas蛋白和被设计成靶向人白蛋白基因中的向导RNA靶序列的向导RNA。在一些此类方法中,所述人白蛋白靶向试剂包括Cas蛋白或编码所述Cas蛋白的核酸以及向导RNA或编码所述向导RNA的DNA,其中所述向导RNA被设计成靶向人白蛋白基因中的向导RNA靶序列。任选地,步骤(II)中的所述所改变变量是所述向导RNA序列或所述向导RNA靶序列。任选地,所述Cas蛋白和所述向导RNA各自以RNA的形式施用,并且步骤(II)中的所述所改变变量是Cas mRNA与向导RNA的比率。任选地,步骤(II)中的所述所改变变量是向导RNA修饰。任选地,所述人白蛋白靶向试剂包括编码所述Cas蛋白的信使RNA(mRNA)和所述向导RNA,并且步骤(II)中的所述所改变变量是Cas mRNA与向导RNA的比率。
在一些此类方法中,所述人白蛋白靶向试剂包括外源性供体核酸。任选地,步骤(II)中的所述所改变变量是外源性供体核酸的形式。任选地,所述外源性供体核酸包括插入核酸,所述插入核酸侧接有靶向所述人源化内源性白蛋白基因座处的5'靶序列的5'同源臂和靶向所述人源化内源性白蛋白基因座处的3'靶序列的3'同源臂,并且步骤(II)中的所述所改变变量是所述5'同源臂的序列或长度和/或所述3'同源臂的序列或长度。
另一方面,提供了制备上述非人动物中的任何非人动物的方法。一些此类方法包括:(a)向非人动物胚胎干(ES)细胞中引入:(i)靶向内源性白蛋白基因座中的靶序列的核酸酶药剂;以及(ii)靶向载体,所述靶向载体包括核酸插入物,所述核酸插入物包括侧接有对应于所述内源性白蛋白基因座中的5'靶序列的5'同源臂和对应于所述内源性白蛋白基因座中的3'靶序列的3'同源臂的所述人白蛋白序列,其中所述靶向载体与所述内源性白蛋白基因座重组以产生经基因修饰的非人ES细胞,所述经基因修饰的非人ES细胞在其基因组中包括包含所述人白蛋白序列的人源化内源性白蛋白基因座;(b)将基因修饰的非人ES细胞引入到非人动物宿主胚胎中;以及(c)在代孕母体中孕育所述非人动物宿主胚胎,其中所述代孕母体产生F0后代经基因修饰的非人动物,所述F0后代经基因修饰的非人动物在其基因组中包括包含所述人白蛋白序列的所述人源化内源性白蛋白基因座。另一方面,提供了制备上述非人动物中的任何非人动物的方法。一些此类方法包括:(a)向非人动物胚胎干(ES)细胞中引入:(i)核酸酶药剂或编码所述核酸酶药剂的核酸,其中所述核酸酶药剂靶向所述内源性白蛋白基因座中的靶序列;以及(ii)靶向载体,所述靶向载体包括核酸插入物,所述核酸插入物包括侧接有对应于所述内源性白蛋白基因座中的5'靶序列的5'同源臂和对应于所述内源性白蛋白基因座中的3'靶序列的3'同源臂的所述人白蛋白序列,其中所述靶向载体与所述内源性白蛋白基因座重组以产生经基因修饰的非人ES细胞,所述经基因修饰的非人ES细胞在其基因组中包括包含所述人白蛋白序列的人源化内源性白蛋白基因座;(b)将基因修饰的非人ES细胞引入到非人动物宿主胚胎中;以及(c)在代孕母体中孕育所述非人动物宿主胚胎,其中所述代孕母体产生F0后代经基因修饰的非人动物,所述F0后代经基因修饰的非人动物在其基因组中包括包含所述人白蛋白序列的所述人源化内源性白蛋白基因座。任选地,靶向载体是长度为至少10kb的大靶向载体,或者其中5'和3'同源臂的总长度为至少10kb。
一些此类方法包括:(a)将以下引入到非人动物单细胞期胚胎中:(i)靶向内源性白蛋白基因座中的靶序列的核酸酶药剂;以及(ii)靶向载体,所述包括核酸插入物,所述核酸插入物包括侧接有对应于所述内源性白蛋白基因座中的5'靶序列的5'同源臂和对应于所述内源性白蛋白基因座中的3'靶序列的3'同源臂的所述人白蛋白序列,其中所述靶向载体与所述内源性白蛋白基因座重组,以产生在其基因组中包括包含所述人白蛋白序列的人源化内源性白蛋白基因座的经基因修饰的非人单细胞期胚胎;(b)在代孕母体中孕育所述经基因修饰的非人动物单细胞期胚胎,以产生在其基因组中包括包含所述人白蛋白序列的所述人源化内源性白蛋白基因座的经基因修饰的F0代非人动物。一些此类方法包括:(a)将以下引入到非人动物单细胞期胚胎中:(i)核酸酶药剂或编码所述核酸酶药剂的核酸,其中所述核酸酶药剂靶向所述内源性白蛋白基因座中的靶序列;以及(ii)靶向载体,所述靶向载体包括核酸插入物,所述核酸插入物包括侧接有对应于所述内源性白蛋白基因座中的5'靶序列的5'同源臂和对应于所述内源性白蛋白基因座中的3'靶序列的3'同源臂的所述人白蛋白序列,其中所述靶向载体与所述内源性白蛋白基因座重组,以产生在其基因组中包括包含所述人白蛋白序列的人源化内源性白蛋白基因座的经基因修饰的非人单细胞期胚胎;(b)在代孕母体中孕育所述经基因修饰的非人动物单细胞期胚胎,以产生在其基因组中包括包含所述人白蛋白序列的所述人源化内源性白蛋白基因座的经基因修饰的F0代非人动物。
在一些此类方法中,核酸酶药剂包括Cas蛋白和向导RNA。任选地,Cas蛋白是Cas9蛋白。任选地,步骤(a)进一步包括引入靶向所述内源性白蛋白基因座内的第二靶序列的第二向导RNA。
在一些此类方法中,非人动物是小鼠或大鼠。任选地,非人动物是小鼠。
另一方面,提供了制备上述非人动物中的任何非人动物的方法。一些此类方法包括:(a)对多能性非人动物细胞的基因组进行修饰以包括所述人源化内源性白蛋白基因座;(b)鉴定或选择包括所述人源化内源性白蛋白基因座的经基因修饰的多能性非人动物细胞;(c)将所述经基因修饰的多能性非人动物细胞引入到非人动物宿主胚胎中;以及(d)在代孕母体中孕育所述非人动物宿主胚胎;一些此类方法包括:(a)对非人动物单细胞期胚胎的基因组进行修饰以包括所述人源化内源性白蛋白基因座;(b)选择包括所述人源化内源性白蛋白基因座的经基因修饰的非人动物单细胞期胚胎;以及(c)在代孕母体中孕育所述经基因修饰的非人动物单细胞期胚胎。
附图说明
图1A(未按比例)示出了具有新霉素选择盒(MAID 7626)的人源化小鼠白蛋白(Alb)基因座的示意图。接点A、B和C的序列分别示出于SEQ ID NO:19-21中。
图1B(未按比例)示出了在去除新霉素选择盒(MAID 7627)之后人源化小鼠白蛋白(Alb)基因座的示意图。接点A和D的序列分别示出于SEQ ID NO:19和22中。
图2(未按比例)示出了用于对小鼠白蛋白(Alb)基因座的人源化进行筛选的探针的位置。等位基因获得(GOA)探针包含7626hU和7626hD。等位基因丢失(LOA)探针包含7626mTU和7626mTD。
图3A和3B示出了小鼠(小鼠Alb)、人(人ALB)和人源化(7626HumInProt)白蛋白的比对。加框残基构成信号肽。虚线表示血清白蛋白肽序列。粗实线表示前肽序列。人源化白蛋白中的所有残基均由所引入人外显子编码。
图4示出了在血浆样品中来自人源化白蛋白小鼠(ALBhu/hu)和野生型(WT)小鼠的人白蛋白水平。使用所汇集正常人血浆(乔治金生物医学公司(George King-BiomedicalInc.))作为阳性对照。使用VelocImmune(VI)小鼠作为阴性对照。
图5示出了来自人源化白蛋白小鼠(ALBhu/hu)和野生型(WT)小鼠的血浆样品中的小鼠白蛋白水平。使用所汇集正常人血浆(乔治金生物医学公司)作为阴性对照。使用VI小鼠作为阳性对照。
图6A和6B示出了由人源化白蛋白小鼠中的AAV-hF9插入产生的人因子IX血浆水平。
图7示出了在用AAV-hF9供体和LNP-CRISPR/Cas9注射后第7周的人因子IX血浆水平相对于如通过BASESCOPETM所确定的hALB-hFIX mRNA为阳性的细胞的百分比进行作图。
图8示出了由ALBm/hu x F9-/-小鼠中的AAV-hF9插入产生的人因子IX血浆水平。
图9示出了在人和小鼠血浆样品中由ALBm/hu x F9-/-小鼠中的AAV-hF9插入产生的aPTT效应。
图10A和10B示出了TGA-EA曲线。图10A示出了人正常和因子IX缺乏性血浆样品的TGA-EA曲线。图10B示出了小鼠血浆的由ALBm/hu x F9-/-小鼠中的AAV-hF9插入产生的TGA-EA曲线。
图11示出了在小鼠血浆样品中由ALBm/hu x F9-/-小鼠中的AAV-hF9插入产生的凝血酶生成。
定义
本文可互换使用的术语“蛋白质”、“多肽”、和“肽”包含任何长度的聚合形式的氨基酸,包含编码氨基酸和非编码氨基酸以及以化学方式或生物化学方式修饰的氨基酸或以化学方式或生物化学方式衍生的氨基酸。这些术语还包含已经修饰的聚合物,如具有经修饰的肽骨架的多肽。术语“结构域”是指具有特定功能或结构的蛋白质或多肽的任何部分。
本文可互换使用的术语“核酸”和“多核苷酸”包含任何长度的聚合形式的核苷酸,包含核糖核苷酸、脱氧核糖核苷酸、或其类似物或经过修饰的版本。所述核苷酸包含单链、双链和多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂交体、和包括嘌呤碱基、嘧啶碱基或其它天然的、以化学方式修饰的、以生物化学方式修饰的、非天然的或衍生的核苷酸碱基的聚合物。
术语“基因组整合的”是指已被引入到细胞中使得核苷酸序列整合到细胞的基因组中的核酸。可以使用任何方案用于将核酸稳定地掺入到细胞的基因组中。
术语“靶向载体”是指可以通过同源重组、非同源末端连接介导的连结或任何其它重组方式引入到细胞基因组中的靶位置的重组核酸。
术语“病毒载体”是指包含至少一种病毒来源元素并包含足以或允许包装成病毒载体颗粒的元素的重组核酸。载体和/或颗粒可以用于在体外、离体或在体内将DNA、RNA或其它核酸转移到细胞中的目的。许多形式的病毒载体是已知的。
关于细胞、组织(例如,肝脏样品)、蛋白质和核酸的术语“分离的”包含相对于其它细菌、病毒、细胞或通常可能原位存在的其它组分而言相对纯化的细胞、组织(例如,肝脏样品)、蛋白质和核酸,直至并包含细胞、组织(例如,肝脏样品)、蛋白质和核酸的基本上纯的调配物。术语“分离的”还包含不具有天然存在的对应物、已经被化学合成并且因此基本上未被其它细胞、组织(例如,肝脏样品)、蛋白质和核酸污染或者已经从其天然伴随的大多数其它组分(例如,细胞组分)(例如,其它细胞蛋白、多核苷酸或细胞组分)中分离或纯化的细胞、组织(例如,肝脏样品)、蛋白质和核酸。
术语“野生型”包含具有在正常(与突变、患病、改变等相比)状态或情况下发现的结构和/或活性的实体。野生型基因和多肽通常以多种不同形式(例如,等位基因)存在。
术语“内源性序列”是指天然存在于细胞或非人动物内的核酸序列。例如,非人动物的内源性白蛋白序列是指天然存在于非人动物的白蛋白基因座处的天然白蛋白序列。
“外源”分子或序列包含通常不以所述形式或位置(例如,基因组基因座)存在于细胞中的分子或序列。正常存在包含关于细胞的特定发育期和环境条件的存在。例如,外源性分子或序列可以包含细胞内对应的内源性序列的突变版本(如内源性序列的人源化版本),或者可以包含与细胞内的内源性序列相对应但形式不同(即,不在染色体内)的序列。相比之下,“内源”分子或序列包含在特定环境条件下在特定发育期在特定细胞中通常以所述形式和位置存在的分子或序列。
当在核酸或蛋白质的上下文中使用时,术语“异源的”指示核酸或蛋白质包括在同一分子中并非天然地一起出现的至少两个区段。例如,当关于核酸的段或蛋白质的区段使用时,术语“异源的”指示核酸或蛋白质包括在自然界中未发现彼此处于相同关系(例如,连接在一起)的两个或更多个子序列。举例来说,核酸载体的“异源”区域是在自然界中未发现与其它分子缔合的另一个核酸分子内或与其附着的核酸区段。例如,核酸载体的异源区域可以包含侧接有在自然界中未发现与编码序列缔合的序列的编码序列。同样地,蛋白质的“异源”区域是在自然界中未发现与其它肽分子缔合的另一个肽分子(例如,融合蛋白或具有标签的蛋白质)内或与其附着的氨基酸的区段。相似地,核酸或蛋白质可以包括异源标记或异源分泌或定位序列。
“密码子优化”利用密码子的简并性,如指定氨基酸的三碱基对密码子组合的多样性所展示的,并且通常包含通过用宿主细胞的基因中更频繁或最频繁使用的密码子置换天然序列的至少一个密码子同时维持天然氨基酸序列来修饰核酸序列以在特定宿主细胞中增强表达的过程。例如,与天然存在的核酸序列相比,可以修饰对Cas9蛋白进行编码的核酸以置换在给定的原核或真核细胞中具有更高使用频率的密码子,包含细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞或任何其它宿主细胞。密码子使用表例如在“密码子使用数据库”处很容易获得。这些表可以通过多种方式进行修改。参见Nakamura等人(2000),《核酸研究(Nucleic Acids Research)》28:292,所述文献出于所有目的通过引用整体并入本文。也可获得用于在特定宿主中表达的特定序列的密码子优化的计算机算法(参见例如,《基因伪造(Gene Forge)》)。
术语“基因座”是指基因(或显著序列)、DNA序列、多肽编码序列或生物体的基因组的染色体上的位置的特异性定位。例如,“白蛋白基因座”或“Alb”可以指白蛋白(Alb)基因、白蛋白DNA序列、白蛋白编码序列的具体位置或白蛋白在已经被鉴定为这种序列所在的生物体基因组的染色体上位置。“白蛋白基因座”可以包括白蛋白基因的调控元件,包含例如增强子、启动子、5'和/或3'非翻译区(UTR)或其组合。
术语“基因”是指染色体中的对产物(例如,RNA产物和/或多肽产物)进行编码并且包含被非编码内含子中断的编码区和定位于5'末端和3'末端两者上的编码区附近而使得基因与全长mRNA(包含5'和3'非翻译序列)相对应的序列的DNA序列。术语“基因”还包含其它非编码序列,包含调节序列(例如,启动子、增强子和转录因子结合位点)、聚腺苷酸化信号、内部核糖体进入位点、沉默子、绝缘序列和基质附着区域。这些序列可以靠近基因的编码区(例如,在10kb内)或处于远处的位点,并且所述序列影响基因的转录和翻译的水平或速率。
术语“等位基因”是指基因的变体形式。一些基因具有多种不同的形式,所述基因定位于染色体上的相同位置或基因位点处。二倍体生物体在每个基因座处具有两个等位基因。每对等位基因表示特异性基因座的基因型。如果在特定基因座处有两个相同的等位基因,则基因型被描述为纯合的,如果两个等位基因不同,则基因型被描述为杂合的。
“启动子”是DNA的调控区,其通常包括能够引导RNA聚合酶II在特定多核苷酸序列的适当转录起始位点处起始RNA合成的TATA盒。启动子可以另外包括影响转录起始速率的其它区域。本文所公开的启动子序列调节可操作连接的多核苷酸的转录。启动子可以在本文所公开的细胞类型(例如,真核细胞、非人哺乳动物细胞、人细胞、啮齿动物细胞、多能性细胞、单细胞期胚胎、分化细胞或其组合)中的一种或多种细胞类型中具有活性。启动子可以是例如组成型活性启动子、条件型启动子、诱导型启动子、时间受限启动子(例如,受发育调控的启动子)或空间受限启动子(例如,细胞特异性或组织特异性启动子)。启动子的实例可以例如在WO 2013/176772中找到,所述文献出于所有目的通过引用整体并入本文。
诱导型启动子的实例包含例如化学调节启动子和物理调节启动子。化学调节启动子包含例如醇调节启动子(例如,醇脱氢酶(alcA)基因启动子)、四环素调节启动子(例如,四环素反应性启动子、四环素操纵子序列(tetO)、tet-On启动子或tet-Off启动子)、类固醇调节启动子(例如,大鼠糖皮质激素受体、雌激素受体启动子或蜕皮激素受体启动子)或金属调节启动子(例如,金属蛋白启动子)。物理调节启动子包含例如温度调节启动子(例如,热休克启动子)和光调节启动子(例如,光诱导型启动子或光抑制型启动子)。
组织特异性启动子可以是例如神经元特异性启动子、神经胶质特异性启动子、肌肉细胞特异性启动子、心脏细胞特异性启动子、肾细胞特异性启动子、骨细胞特异性启动子、内皮细胞特异性启动子或免疫细胞特异性启动子(例如,B细胞启动子或T细胞启动子)。
发育调节启动子包含例如仅在胚胎发育期或仅在成体细胞中具有活性的启动子。
“可操作的连接”或“可操作地连接”包含将两种或多种组分(例如启动子和另一种序列元件)并置使得两种组分正常发挥功能,并使得至少一种组分能够介导施加在至少一种其它组分上的功能。例如,如果启动子响应于存在或不存在一种或多种转录调控因子而控制编码序列的转录水平,则所述启动子可以与编码序列可操作地连接。可操作的连接可以包含这些彼此相邻或以反式作用的序列(例如,调控序列可以在一定距离处起作用以控制编码序列的转录)。
核酸的“互补性”意味着由于其核碱基团的取向,一条核酸链中的核苷酸序列与另一条相对核酸链上的序列形成氢键。DNA中的互补碱基通常是A与T和C与G。在RNA中,其通常是C与G和U与A。互补可以是完美的或者实质性的/足够的。两个核酸之间的完美互补意味着所述两个核酸可以形成双链体,其中双链体中的每个碱基都通过沃森-克里克配对(Watson-Crick pairing)与互补碱基键合。“基本上”或“足够”互补意味着一条链中的序列与相对链中的序列不完全和/或完全互补,但两条链上的碱基之间发生足够的键合以在一组杂交条件下形成稳定的杂合复合物(例如,盐浓度和温度)。此类条件可以通过使用序列和标准数学计算来预测杂交链的Tm(熔融温度),或通过使用常规方法的Tm经验测定来预测。Tm包含在两条核酸链之间形成的杂交复合物群变性50%(即,双链核酸分子群半解离成单链)时的温度。在低于Tm的温度下,有利于杂交复合物的形成,而在高于Tm的温度下,有利于杂交复合物中的链的熔融或分离。可以通过使用例如Tm=81.5+0.41(%G+C)来估计在1MNaCl水溶液中具有已知G+C含量的核酸的Tm,尽管其它已知的Tm计算考虑了核酸结构特性。
尽管碱基之间的错配是可能的,但是杂交要求所述两个核酸含有互补序列。适用于两种核酸之间的杂交的条件取决于核酸的长度和互补程度,这是众所周知的变量。两个核苷酸序列之间的互补程度越大,具有这些序列的核酸杂交体的解链温度(Tm)值就越大。对于具有较短互补段(例如,在35个或更少、30个或更少、25个或更少、22个或更少、20个或更少或18个或更少的核苷酸上互补)的核酸之间的杂交,错配位置变得尤为重要(参见Sambrook等人,同上,11.7-11.8)。通常,可杂交核酸的长度为至少约10个核苷酸。可杂交核酸的说明性最小长度包含至少约15个核苷酸、至少约20个核苷酸、至少约22个核苷酸、至少约25个核苷酸和至少约30个核苷酸。此外,可以根据如互补区的长度和互补程度等因素,根据需要调整温度和洗涤溶液盐浓度。
多核苷酸序列不需要与其靶核酸的序列100%互补才能特异性杂交。此外,多核苷酸可以在一个或多个段上杂交,使得插入或相邻段不参与杂交事件(例如,环结构或发夹结构)。多核苷酸(例如,gRNA)可以包括与其靶向的靶核酸序列内的靶区域的至少70%、至少80%、至少90%、至少95%、至少99%或100%的序列互补性。例如,其中20个核苷酸中的18个与靶区域互补并因此特异性杂交的gRNA将表示90%的互补性。在此实施例中,剩余的非互补核苷酸可以与互补核苷酸成簇或散布并且不需要彼此相邻或与互补核苷酸相邻。
可以使用默认设置,使用BLAST程序(基本局部比对搜索工具)和PowerBLAST程序(Altschul等人,(1990)《分子生物学杂志(J.Mol.Biol.)》215:403-410;Zhang和Madden(1997)《基因组研究(Genome Res.)》7:649-656,所述文献中的每个文献出于所有目的通过引用整体并入本文)或使用Gap程序(威斯康星州麦迪逊大学研究园(University ResearchPark,Madison Wis.),遗传学计算机组,Unix第8版,威斯康星序列分析包)来常规确定核酸内特定核酸序列段之间的互补性百分比,其使用史密斯-沃特曼(Smith and Waterman)算法(1981)《应用数学进展(Adv.Appl.Math.)》2:482-489,所述文献出于所有目的通过引用整体并入本文。
本文所提供的方法和组合物采用多种不同的组分。贯穿说明书的一些组分可以具有活性变体和片段。此类组分包含例如Cas蛋白、CRISPR RNA、tracrRNA和向导RNA。这些组分中的每个组分的生物活性在本文其它地方描述。术语“功能性”是指蛋白质或核酸(或其片段或变体)表现出生物活性或功能的先天能力。此类生物活性或功能可以包含例如Cas蛋白结合向导RNA和靶DNA序列的能力。与原始分子相比,功能性片段或变体的生物学功能可以相同或实际上可以改变(例如,关于其特异性或选择性或功效)但保留分子的基本生物学功能。
术语“变体”是指与群体中最普遍的序列不同的核苷酸序列(例如,相差一个核苷酸)或与群体中最普遍的序列不同的蛋白质序列(例如,相差一个氨基酸)。
当提及蛋白质时,术语“片段”意指比全长蛋白质更短或具有更少氨基酸的蛋白质。当提及核酸时,术语“片段”意指比全长核酸更短或具有更少核苷酸的核酸。当提及蛋白质片段时,片段可以是例如N端片段(即,去除蛋白质的C末端的一部分)、C端片段(即,去除蛋白质的N末端的一部分)或内部片段(即,去除蛋白质的N末端和C末端中的每个末端的一部分)。当提及核酸片段时,片段可以是例如5'片段(即,去除核酸的3'末端的一部分)、3'片段(即,去除核酸的5'末端的一部分)或内部片段(即,去除核酸的5'末端和3'末端中的每个末端的一部分)。
“序列同一性”或“同一性”在两个多核苷酸或多肽序列的上下文中是指当在指定的比较窗口上出于最大对应进行比对时两个序列中相同的残基。当提及蛋白质的序列同一性的百分比时,不相同的残基位置通常因保守性氨基酸取代而不同,其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的其它氨基酸残基取代,因此不改变分子的功能性质。当序列的保守性取代不同时,可以将百分比序列同一性向上调整以校正取代的保守性质。因此类保守性取代而不同的序列被视为具有“序列相似性”或“相似性。”用于进行这种调整的方法众所周知。通常,这涉及将保守性取代计为部分错配而不是完全错配,从而增加百分比序列同一性。因此,例如,当相同氨基酸的所得得分为1,非保守性取代的所得得分为零时,保守性取代的所得得分介于零与1之间。例如,通过在项目PC/GENE(加利福尼亚州山景城的Intelligenetics公司(Intelligenetics,Mountain View,California))中的实施方式计算保守性取代的得分。
“序列同一性百分比”包含通过在比较窗口上比较两个最佳比对序列测定的值(完全匹配残基的最大数量),其中在比较窗口中的多核苷酸序列部分与参考序列(不包括添加物或缺失部分)相比可以包括添加物或缺失部分(即缺口),以实现两个序列的最佳比对。通过测定在两个序列中出现相同核酸碱基或氨基酸残基的位置数计算百分比来得到匹配位置数,用匹配位置数除以比较窗口中的位置总数,并将结果乘以100以得到序列同一性的百分比。除非另有说明(例如,较短的序列包含连接的异源序列),否则所述比较窗口为两个所比较序列中较短序列的全长。
除非另有说明,否则序列同一性/相似性值包含使用以下参数使用第10版GAP获得的值:使用GAP权重50、长度权重3以及nwsgapdna.cmp得分矩阵的核苷酸序列的同一性百分比和相似性百分比;使用GAP权重8和长度权重2以及BLOSUM62得分矩阵的氨基酸序列的同一性百分比和相似性百分比;或其任何等效程序。“等效程序”包含当与第10版GAP生成的对应比对进行比较时针对所讨论的任何两个序列产生具有相同核苷酸或氨基酸残基匹配和相同百分比序列同一性的比对的任何序列比较程序。
术语“保守性氨基酸取代”是指用具有相似大小、电荷或极性的不同氨基酸取代序列中正常存在的氨基酸。保守性取代的实例包含用非极性(疏水性)残基(如异亮氨酸、缬氨酸或亮氨酸)取代另一种非极性残基。同样地,保守性取代的实例包含用一种极性(亲水性)残基取代另一种极性残基,如精氨酸与赖氨酸之间的极性残基、谷氨酰胺与天冬酰胺之间的极性残基或甘氨酸与丝氨酸之间的极性残基。另外,用碱性残基(如赖氨酸、精氨酸或组氨酸)取代另一种碱性残基或者用一种酸性残基(如天冬氨酸或谷氨酸)取代另一种酸性残基是保守性取代另外的实例。非保守性取代的实例包含用非极性(疏水性)氨基酸残基(如异亮氨酸、缬氨酸、亮氨酸、丙氨酸或甲硫氨酸)取代极性(亲水性)残基(如半胱氨酸、谷氨酰胺、谷氨酸或赖氨酸)和/或用极性残基取代非极性残基。典型的氨基酸分类总结如下表1。
表1:氨基酸分类。
“同源”序列(例如,核酸序列)包含与已知参考序列相同或基本上相似的序列,使得其例如与已知参考序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性。同源序列可以包含例如直系同源序列和旁系同源序列。例如,同源基因通常通过物种形成事件(直系同源基因)或基因复制事件(旁系同源基因)从共同的祖先DNA序列下降。“直系同源”基因包含不同物种中通过物种形成从共同祖先基因进化而来的基因。直系同源物通常在进化过程中保留相同的功能。“旁系同源”基因包含通过基因组内的复制相关的基因。旁系同源物可以在进化过程中进化出新的功能。
术语“体外(in vitro)”包含人工环境以及在人工环境(例如,试管或分离的细胞或细胞系)内发生的过程或反应。术语“体内(in vivo)”包含自然环境(例如,细胞、生物体或身体)以及在自然环境内发生的过程或反应。术语“离体(ex vivo)”包含已从个体体内去除的细胞以及在此类细胞内发生的过程或反应。
术语“报告基因”是指具有对基因产物(通常是酶)进行编码的序列的核酸,当包括与异源启动子和/或增强子元件可操作地连接的报告基因序列的构建体被引入到含有(或可以制成含有)启动子和/或增强子元件活化所必需的因子的细胞中时,所述序列可容易且可定量地测定。报告基因的实例包含但不限于对β-半乳糖苷酶(lacZ)进行编码的基因、细菌氯霉素乙酰转移酶(cat)基因、萤火虫荧光素酶基因、对β-葡萄糖醛酸酶(GUS)进行编码的基因和对荧光蛋白进行编码的基因。“报告蛋白”是指由报告基因编码的蛋白质。
如本文所使用的,术语“荧光报告蛋白”意指基于荧光可检测的报告蛋白,其中荧光可以直接来自报告蛋白、报告蛋白在荧光底物上的活性,或对与荧光标记的化合物结合具有亲和力的蛋白质。荧光蛋白的实例包含绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿(Emerald)、Azami绿、单体Azami绿、CopGFP、AceGFP和ZsGreenl)、黄色荧光蛋白(例如,YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP和ZsYellowl)、蓝色荧光蛋白(例如,BFP、eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色和T-天蓝色(T-sapphire))、青色荧光蛋白(例如CFP、eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl和Midoriishi-青色)、红色荧光蛋白(例如,RFP、mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry和Jred)、橙色荧光蛋白(例如,mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine和tdTomato),以及可以通过流式细胞术方法检测到细胞中存在的任何其它合适的荧光蛋白。
响应于双链断裂(DSB)的修复主要通过以下两个保守的DNA修复途径发生:同源重组(HR)和非同源末端连接(NHEJ)。参见Kasparek和Humphrey(2011)《细胞与发育生物学研讨会(Seminars in Cell&Dev.Biol.)》22:886-897,所述文献出于所有目的通过引用整体并入本文。同样地,由外源性供体核酸介导的靶核酸修复可以包含两个多核苷酸之间基因信息交换的任何过程。
术语“重组”包含两个多核苷酸之间的任何遗传信息交换过程,并且可以通过任何机制发生。重组可以通过同源定向修复(HDR)或同源重组(HR)发生。HDR或HR包含可能需要核苷酸序列同源性的核酸修复形式,使用“供体”分子作为模板来修复“靶”分子(即经历双链断裂的分子),并且导致将基因信息从供体转移到靶标。不希望受任何特定理论的束缚,这种转移可以涉及在断裂的靶与供体之间形成的异源双链DNA的错配校正和/或合成依赖性链退火(synthesis-dependent strand annealing),其中供体用于重新合成将成为靶的一部分的基因信息和/或相关过程。在一些情况下,供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的副本或者供体多核苷酸的副本的一部分被整合到靶DNA中。参见Wang等人(2013)《细胞(Cell)》153:910-918;Mandalos等人(2012)《公共科学图书馆·综合(PLOSONE)》7:e45768:1-9;以及Wang等人(2013)《自然生物技术(Nat Biotechnol.)》31:530-532,所述文献中的每个文献出于所有目的通过引用整体并入本文。
非同源末端连接(NHEJ)包含在不需要同源模板的情况下通过将断裂端直接彼此连接或与外源性序列连接来修复核酸中的双链断裂。通过NHEJ连接非连续序列通常会导致双链断裂位点附近的缺失、插入或易位。例如,NHEJ还可以通过断裂末端与外源性供体核酸的末端的直接连接(即,基于NHEJ的捕获)导致外源性供体核酸的靶向整合。当同源定向修复(HDR)途径不易使用时(例如,在非分裂细胞、原代细胞和执行基于同源性的DNA修复不佳的细胞中),此类NHEJ介导的靶向整合可以优选用于插入外源性供体核酸。另外,与同源定向修复相反,不需要关于侧接切割位点的序列同一性的大区域的知识,这在尝试靶向插入到具有基因组序列知识有限的基因组的生物体中时可能是有益的。整合可以通过连接外源性供体核酸与切割的基因组序列之间的平末端来进行,或者通过使用外源性供体核酸连接粘性末端(即,具有5'或3'突出端)来进行,所述外源性供体核酸侧接有与由切割的基因组序列中的核酸酶药剂产生的突出端相容的突出端。参见例如,US 2011/020722、WO 2014/033644、WO 2014/089290以及Maresca等人(2013),《基因组研究》23(3):539-546,所述文献中的每个文献出于所有目的通过引用整体并入本文。如果连接平末端,则可能需要切除靶标和/或供体以产生片段连接所需的微同源性区域,这可能会在靶序列中产生不想要的改变。
“包括(comprising)”或“包含(including)”一个或多个所列举的元件的组合物或方法可以包含其它未具体列举的元件。例如,“包括”或“包含”蛋白质的组合物可以单独含有蛋白质或与其它成分组合的蛋白质。过渡短语“基本上由……组成”意指权利要求的范围应被解释为涵盖权利要求中所列举的指定要素以及对要求保护的发明的基本和新颖特性没有实质性影响的那些要素。因此,当在本发明的权利要求中使用时,术语“基本上由……组成”不应被解释为等效于“包括”。
“任选的(optional)”或“任选地(optionally)”是指随后描述的事件或情况可能发生或可能不发生并且此描述包含其中所述事件或情况发生的实例以及其中所述事件或情况不发生的实例。
数值范围的指定包含所述范围内或定义所述范围的所有整数以及由所述范围内的整数定义的所有子范围。
除非从上下文中明显看出,否则术语“约”涵盖规定值的标准测量误差范围(例如,SEM)内的值。
术语“和/或”是指并且涵盖关联的所列项中的一个或多个所列项的任何和所有可能组合以及在以替代性方案(“或”)解释时组合的缺少。
术语“或”是指特定列表中的任何一个成员,并且还包含所述列表成员的任何组合。
除非上下文另外明确指明,否则本文中的单数形式“一个(a)”、“一种(an)”和“所述(the)”包含复数个提及物。例如,术语“蛋白质”或“至少一种蛋白质”可以包含多种蛋白质,包含其混合物。
统计学上显著意指p≤0.05。
具体实施方式
I.概述
本文公开了包括人源化白蛋白(ALB)基因座的非人动物基因组、非人动物细胞和非人动物以及使用此类非人动物细胞和非人动物的方法。包括人源化白蛋白基因座的非人动物细胞或非人动物表达人白蛋白或包括人白蛋白的一个或多个片段的嵌合白蛋白。此类非人动物细胞和非人动物可以用于在体外、离体或体内评估人白蛋白靶向药剂(例如,CRISPR/Cas9基因组编辑药剂)的递送或功效,并且可以用于在体外、离体或体内优化此类药剂的功效递送的方法中。
在本文所公开的非人动物细胞和非人动物中的一些非人动物细胞和非人动物中,人白蛋白基因组DNA中的大部分或全部被插入到对应直系同源非人动物白蛋白基因座中。在本文所公开的一些非人动物细胞和非人动物中,大多数或所有非人动物白蛋白基因组DNA被对应直系同源人白蛋白基因组DNA逐一替代。与具有cDNA插入的非人动物相比,当保持内含子-外显子结构和剪接机制时,表达水平应该更高,因为保守的调控元件更有可能保持完整,并且经过RNA加工的剪接转录物比cDNA更稳定。相反,将人白蛋白cDNA插入到非人动物白蛋白基因座中将消除保守的调控元件,如包含在非人动物白蛋白的第一外显子和内含子内的调控元件。用对应直系同源人基因组序列替代非人动物基因组序列或者在对应直系同源非人白蛋白基因座中插入人白蛋白基因组序列更有可能导致转基因从内源性白蛋白基因座忠实表达。相似地,在随机基因组基因座而非内源性非人动物白蛋白基因座处具有人白蛋白编码序列的转基因插入的转基因非人动物将不会准确地反映白蛋白表达的内源性调节。通过用对应直系同源人基因组DNA逐一替代大部分或全部非人动物基因组DNA或将人白蛋白基因组序列插入对应直系同源非人白蛋白基因座中产生的人源化白蛋白等位基因将提供人白蛋白靶向试剂(例如,被设计成靶向人白蛋白的CRISPR/Cas9试剂)的真实人靶标或真实人靶标的近似靶标,由此能够测试此类药剂在活体动物中的功效和作用模式以及在人源化蛋白质和人源化基因是存在的白蛋白的唯一版本的背景下的药物代谢动力学和药效动力学研究。
II.包括人源化白蛋白(ALB)基因座的非人动物
本文所公开的非人动物基因组、非人动物细胞和非人动物包括人源化白蛋白(ALB)基因座。包括人源化白蛋白基因座的细胞或非人动物表达人白蛋白或部分人源化嵌合白蛋白,其中天然白蛋白的一个或多个片段已经被来自人白蛋白的对应片段替代。本文还公开了人源化非人动物白蛋白基因,在所述人源化非人动物白蛋白基因中所述非人白蛋白基因的区段已经缺失并且被对应人白蛋白序列替代。
本文所公开的非人动物基因组、非人动物细胞和非人动物可以进一步包括不是白蛋白基因座的灭活(敲除)内源性基因。此类非人动物基因组、非人动物细胞和非人动物可以用于例如筛选基因疗法试剂(例如,转基因),用于插入到人源化白蛋白基因座中以替代失活内源性基因。插入到人源化白蛋白基因座中以替代失活内源性基因可以例如拯救敲除。在一个具体实例中,本文所公开的非人动物基因组、非人动物细胞和非人动物可以进一步包括灭活(敲除)内源性F9基因(编码凝结因子IX)。灭活(敲除)内源性F9基因是不表达任何凝血因子IX(也称为克雷司马斯因子(Christmas factor)、血浆凝血活酶组分或PTC)的基因。野生型人凝血因子IX蛋白已经被指定为UniProt登录号P00740,并且人F9基因已经被指定为GeneID2158。野生型小鼠凝血因子IX蛋白已经被指定为UniProt登录号P16294,并且小鼠F9基因已经被指定为GeneID14071。野生型大鼠凝血因子IX蛋白已经被指定为UniProt登录号P16296,并且大鼠F9基因已经被指定为GeneID24946。
本文所公开的非人动物基因组、非人动物细胞和非人动物可以进一步包括整合到人源化白蛋白基因座的至少一个等位基因(例如,在非人动物的一个或多个细胞中,如在非人动物的一个或多个肝细胞中)中的外源性蛋白的编码序列。编码序列可以整合到例如人源化白蛋白基因座的内含子1、内含子12或内含子13中。在一些情况下,在将外源性蛋白的编码序列整合到人源化白蛋白基因座的至少一个等位基因中(例如,在非人动物的一个或多个细胞中,如在非人动物的一个或多个肝细胞中)之后,将来自人源化白蛋白基因座的人白蛋白的表达维持在同一水平。在一个实例中,非人动物基因组、细胞或动物进一步包括不是白蛋白基因座的灭活(敲除)内源性基因,并且外源性蛋白替代灭活内源性基因的功能(例如,拯救敲除)。在一个具体实例中,外源性蛋白是凝血因子IX(例如,人凝血因子IX)。
A.白蛋白
本文所述的细胞和非人动物包括人源化白蛋白(ALB)基因座。白蛋白由ALB基因(也称为白蛋白、血清白蛋白、PRO0883、PRO0903、HSA、GIG20、GIG42、PRO1708、PRO2044、PRO2619、PRO2675和UNQ696/PRO1341)编码。白蛋白作为前白蛋白在肝脏中合成,所述前白蛋白具有在新生蛋白从粗糙内质网释放之前被去除的N端肽。产物前白蛋白进而在高尔基体囊泡(Golgi vesicle)中被切割以产生所分泌白蛋白(血清白蛋白)。人血清白蛋白是在人血液中发现的血清白蛋白。人血清白蛋白是人血浆中最丰富的蛋白质;人血清白蛋白构成约一半的血清蛋白。人血清白蛋白在肝脏中产生。人血清白蛋白可溶于水和单体。白蛋白转运激素、脂肪酸和其它化合物、缓冲pH,并且保持膨胀压,以及其它功能。血清中的人白蛋白浓度通常为大约35-50g/L(3.5-5.0g/dL)。白蛋白具有大约20天的血清半衰期。白蛋白的分子量为66.5kDa。
白蛋白被认为是基因组安全港基因座,因为其非常高的表达水平和用于基因递送和体内编辑的肝脏相对于其它组织的易处理性。安全港基因座包含染色体基因座,在所述染色体基因座中,转基因或其它外源核酸插入物可以在所有所关注组织中稳定且可靠地表达,而不会明显改变细胞行为或表型。通常,安全港基因座是其中所插入基因序列的表达不受来自相邻基因的任何通读表达干扰的基因座。例如,安全港基因座可以包含染色体基因座,在所述染色体基因座中,外源DNA可以以可预测的方式整合和发挥作用,而不会对内源性基因结构或表达产生不利影响。安全港基因座可以包含基因外区域或基因内区域,例如非必需、可有可无或能够在没有明显表型结果的情况下破裂的基因内的基因座。
白蛋白基因结构适用于将转基因靶向到内含子序列中,因为其第一外显子对从最终蛋白质产物中切割出来的分泌肽(信号肽)进行编码。例如,承载剪接受体的无启动子盒和治疗性转基因的整合将支持许多不同蛋白质的表达和分泌。
人ALB在4号染色体上映射到人4q13.3(NCBI RefSeq基因ID 213;组装GRCh38.p12(GCF_000001405.38);位置NC_000004.12(73404239..73421484(+)))。据报道,基因具有15个外显子。其中,所述外显子中有14个外显子是编码外显子,并且外显子15是作为3'非翻译区(UTR)的一部分的非编码外显子。野生型人白蛋白的UniProt登录号被分配为P02768。至少三种同种型(P02768-1至P02768-3)是已知的。一种同种型的序列P02768-1(与NCBI登录号NP_000468.1相同)示出于SEQ ID NO:5中。编码标准同种型的mRNA(cDNA)被指定为NCBI登录号NM_000477.7并且示出于SEQ ID NO:37中。示例性编码序列(CDS)被指定为CCDSIDCCDS3555.1并且示出于SEQ ID NO:13中。SEQ ID NO:5中所示的全长人白蛋白具有609个氨基酸,包含信号肽(氨基酸1-18)、前肽(氨基酸19-24)和血清白蛋白(氨基酸25-609)。这些结构域之间的描述如UniProt中所指定的。提及人白蛋白包含标准(野生型)形式以及所有等位基因形式和同种型。任何其它形式的人白蛋白具有针对与野生型形式最大比对而进行编号的氨基酸,经比对的氨基酸被指定为同一编号。
小鼠Alb在5号染色体上映射到小鼠5E1;544.7cM(NCBI RefSeq基因ID 11657;组装GRCm38.p4(GCF_000001635.24);位置NC_000071.6(90,460,870..90,476,602(+)))。据报道,基因具有15个外显子。其中,所述外显子中有14个外显子是编码外显子,并且外显子15是作为3'非翻译区(UTR)的一部分的非编码外显子。野生型小鼠白蛋白的UniProt登录号被指定为P07724。小鼠白蛋白的序列(与NCBI登录号NP_033784.2相同)示出于SEQ ID NO:1中。编码标准同种型的示例性mRNA(cDNA)同种型被指定为NCBI登录号NM_009654.4并且示出于SEQ ID NO:36中。示例性编码序列(CDS)(CCDS ID CCDS19412.1)示出于SEQ ID NO:9中。SEQ ID NO:1中所示的标准全长小鼠白蛋白具有608个氨基酸,包含信号肽(氨基酸1-18)、前肽(氨基酸19-24)和血清白蛋白(氨基酸25-608)。这些结构域之间的描述如UniProt中所指定的。提及小鼠白蛋白包含标准(野生型)形式以及所有等位基因形式和同种型。任何其它形式的小鼠白蛋白具有针对与野生型形式最大比对而进行编号的氨基酸,经比对的氨基酸被指定为同一编号。
许多其它非人动物的白蛋白序列也是已知的。这些非人动物包含例如牛(UniProt登录号:P02769;NCBI RefSeq基因ID:280717)、大鼠(UniProt登录号:P02770;NCBI RefSeq基因ID:24186)、鸡(UniProt登录号:P19121)、苏门达腊猩猩(Sumatran orangutan)(UniProt登录号:Q5NVH5;NCBI RefSeq基因ID:100174145)、马(UniProt登录号:P35747;NCBI RefSeq基因ID:100034206)、猫(UniProt登录号:P49064;NCBI RefSeq基因ID:448843)、兔(UniProt登录号:P49065;NCBI RefSeq基因ID:100009195)、狗(UniProt登录号:P49822;NCBI RefSeq基因ID:403550)、猪(UniProt登录号:P08835;NCBI RefSeq基因ID:396960)、蒙古沙鼠(UniProt登录号:O35090)、猕猴(UniProt登录号:Q28522;NCBIRefSeq基因ID:704892)、驴(UniProt登录号:Q5XLE4;NCBI RefSeq基因ID:106835108)、绵羊(UniProt登录号:P14639;NCBI RefSeq基因ID:443393)、美国牛蛙(UniProt登录号:P21847)、金仓鼠(UniProt登录号:A6YF56;NCBI RefSeq基因ID:101837229)和山羊(UniProt登录号:P85295)。
B.人源化白蛋白基因座
人源化白蛋白基因座是内源性白蛋白基因座的区段已经缺失并且被直系同源人白蛋白序列替代的白蛋白基因座。人源化白蛋白基因座可以是整个白蛋白基因被对应直系同源人白蛋白序列替代的白蛋白基因座,或者人源化白蛋白基因座可以是其中仅一部分白蛋白基因被对应直系同源人白蛋白序列(即,人源化)替代的白蛋白基因座。例如,内源性白蛋白基因座处的整个白蛋白编码序列可以缺失并且被对应人白蛋白序列替代。对应于内源性白蛋白序列的特定区段的人白蛋白序列是指当人白蛋白和内源性白蛋白进行最佳比对时人白蛋白的与内源性白蛋白序列的特定区段进行比对的区域。最佳比对是指最大数量的完全匹配的残基。对应直系同源人序列可以包括例如互补DNA(cDNA)或基因组DNA。任选地,对应直系同源人白蛋白序列被修饰成基于非人动物中的密码子使用而进行密码子优化。替代或插入(即,人源化)区可以包含编码区,如外显子、非编码区,如内含子、非翻译区或调控区(例如,启动子、增强子或转录阻遏因子结合元件)或其任何组合。举例来说,对应于人白蛋白基因的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或所有15个外显子的外显子可以是人源化的。例如,对应于人白蛋白基因的所有外显子(即,外显子1-15)的外显子可以是人源化的。作为另一个实例,对应于人白蛋白基因的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有14个编码外显子的外显子可以是人源化的。例如,对应于人白蛋白基因的所有编码外显子(即,外显子1-14)的外显子可以是人源化的。同样地,对应于人白蛋白基因的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个或所有14个内含子的内含子可以是人源化的或可以保持内源性。例如,对应于人白蛋白基因的所有内含子(即,内含子1-14)的内含子可以是人源化的。同样地,对应于人白蛋白基因的编码外显子之间的内含子中的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或所有13个内含子的内含子可以是人源化的或可以保持内源性。例如,对应于人白蛋白基因的编码外显子(即,内含子1-13)之间的所有内含子的内含子可以是人源化的。包含调控序列的侧接非翻译区也可以是人源化的或保持内源性。例如,5'非翻译区(UTR)、3'UTR或5'UTR和3'UTR两者可以是人源化的,或者5'UTR、3'UTR或5'UTR和3'UTR两者可以保持内源性。可以插入人5'和3'UTR之一或两者,和/或可以缺失内源性5'和3'UTR之一或两者。在具体实例中,5'UTR和3'UTR两者均保持内源性。在另一个具体实例中,5'UTR保持内源性,并且3'UTR是人源化的。根据直系同源序列替代的程度,如启动子等调控序列可以是内源性的或由替代的人直系同源序列提供。例如,人源化白蛋白基因座可以包含内源性非人动物白蛋白启动子(即,人白蛋白序列可以与内源性非人动物启动子可操作地连接)。
编码信号肽、前肽或血清白蛋白的一个或多个或所有区域可以是人源化的,或者一个或多个这种区域可以保持内源性。小鼠白蛋白信号肽、前肽和血清白蛋白的示例性编码序列分别示出于SEQ ID NO:10-12中。人白蛋白信号肽、前肽和血清白蛋白的示例性编码序列分别示出于SEQ ID NO:14-16中。
例如,白蛋白基因座的编码信号肽的全部或部分区域可以是人源化的,和/或白蛋白基因座的编码前肽的全部或部分区域可以是人源化的,和/或白蛋白基因座的编码血清白蛋白的全部或部分区域可以是人源化的。可替代地或另外地,白蛋白基因座的编码信号肽的全部或部分区域可以保持内源性,和/或白蛋白基因座的编码前肽的全部或部分区域可以保持内源性,和/或白蛋白基因座的编码血清白蛋白的全部或部分区域可以保持内源性。在一个实例中,白蛋白基因座的编码信号肽、前肽和血清白蛋白的全部或部分区域是人源化的。任选地,白蛋白基因座的人源化区域的CDS包括与SEQ ID NO:13(或其简并物)至少85%、90%、95%、96%、97%、98%、99%、或100%相同的序列、基本上由其组成或由其组成。任选地,白蛋白基因座的人源化区域的CDS包括与SEQ ID NO:13(或其简并物)至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。任选地,白蛋白基因座的人源化区域包括与SEQ ID NO:35至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。任选地,白蛋白基因座的人源化区域包括与SEQ ID NO:35至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。任选地,人源化白蛋白基因座编码包括与SEQ ID NO:5至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。任选地,人源化白蛋白基因座编码蛋白质,所述蛋白质包括与SEQ ID NO:5至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。任选地,人源化白蛋白基因座包括与SEQ ID NO:17或18至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。任选地,人源化白蛋白基因座包括与SEQ ID NO:17或18至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。
由人源化白蛋白基因座编码的白蛋白可以包括来自人白蛋白的一个或多个结构域和/或来自内源性(即,天然)白蛋白的一个或多个结构域。小鼠白蛋白信号肽、前肽和血清白蛋白的示例性氨基酸序列分别示出于SEQ ID NO:2-4中。人白蛋白信号肽、前肽和血清白蛋白的示例性氨基酸序列分别示出于SEQ ID NO:6-8中。
白蛋白可以包括人白蛋白信号肽、人白蛋白前肽和人血清白蛋白中的一种或多种或全部。可替代地或另外地,白蛋白可以包括来自内源性(即,天然)非人动物白蛋白的一个或多个结构域。例如,白蛋白可以包括来自内源性(即,天然)非人动物白蛋白的信号肽和/或来自内源性(即,天然)非人动物白蛋白的前肽和/或来自内源性(即,天然)非人动物白蛋白的血清白蛋白和/或。举例来说,白蛋白可以包括人信号肽、前肽和血清白蛋白。
嵌合白蛋白中的来自人白蛋白的结构域可以由完全人源化序列(即,编码所述结构域的整个序列被直系同源人白蛋白序列替代)编码或可以由部分人源化序列(即,编码所述结构域的序列中的一些序列被直系同源人白蛋白序列替代,并且编码所述结构域的其余内源性(即,天然)序列编码与直系同源人白蛋白序列相同的氨基酸,使得经编码的结构域与人白蛋白中的所述结构域相同)编码。同样地,嵌合蛋白中的来自内源性白蛋白的结构域可以由完全内源性序列(即,编码所述结构域的整个序列是内源性白蛋白序列)编码或者可以由部分人源化序列(即,编码所述结构域的序列中的一些序列被直系同源人白蛋白序列替代,但直系同源人白蛋白序列编码与经替代的内源性白蛋白序列相同的氨基酸,使得经编码的结构域与内源性白蛋白中的所述结构域相同)编码。
举例来说,由人源化白蛋白基因座编码的白蛋白可以包括人白蛋白信号肽。任选地,人白蛋白信号肽包括与SEQ ID NO:6至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。任选地,人白蛋白信号肽包括与SEQ IDNO:6至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。举例来说,由人源化白蛋白基因座编码的白蛋白可以包括人白蛋白前肽。任选地,人白蛋白前肽包括与SEQ ID NO:7至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。任选地,人白蛋白前肽包括与SEQ ID NO:7至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。举例来说,由人源化白蛋白基因座编码的白蛋白可以包括人血清白蛋白。任选地,人血清白蛋白包括与SEQ ID NO:8至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。任选地,人血清白蛋白包括与SEQ ID NO:8至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。例如,由人源化白蛋白基因座编码的白蛋白可以包括与SEQ ID NO:5至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。例如,由人源化白蛋白基因座编码的白蛋白可以包括与SEQ ID NO:5至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。任选地,由人源化白蛋白基因座编码的白蛋白CDS可以包括与SEQ ID NO:13(或其简并物)至少85%、90%、95%、96%、97%、98%、99%或100%相同的序列、基本上由其组成或由其组成。任选地,由人源化白蛋白基因座编码的白蛋白CDS可以包括与SEQ ID NO:13(或其简并物)至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同的序列、基本上由其组成或由其组成。
人源化白蛋白可以保持天然白蛋白和/或人白蛋白的活性。
任选地,人源化白蛋白基因座可以包括其它元件。此类元件的实例可以包含选择盒、报告基因、重组酶识别位点或其它元件。可替代地,人源化白蛋白基因座可以缺少其它元件(例如,可以缺少选择标志物或选择盒)。合适的报告基因和报告蛋白的实例在本文其它地方公开。合适的选择标志物的实例包含新霉素磷酸转移酶(neor)、潮霉素B磷酸转移酶(hygr)、嘌呤霉素-N-乙酰转移酶(puror)、杀稻瘟素S脱氨酶(bsrr)、黄嘌呤/鸟嘌呤磷酸核糖转移酶(gpt)和单纯疱疹病毒胸苷激酶(HSV-k)。重组酶的实例包含Cre、Flp和Dre重组酶。Cre重组酶基因的一个实例是Crei,其中两个对Cre重组酶进行编码的外显子被内含子隔开,以防止其在原核细胞中表达。此类重组酶可以进一步包括用于促进定位到核(例如,NLS-Crei)的核定位信号。重组酶识别位点包含由位点特异性重组酶识别并且可以用作重组事件的底物的核苷酸序列。重组酶识别位点的实例包含FRT、FRT11、FRT71、attp、att、rox和lox位点,如loxP、lox511、lox2272、lox66、lox71、loxM2和lox5171。
如报告基因或选择盒等其它元件可以是侧接有重组酶识别位点的自缺失盒。参见例如US8,697,851和US 2013/0312129,所述文献中的每个文献出于所有目的通过引用整体并入本文。举例来说,自删除盒可以包括与小鼠Prm1启动子可操作地连接的Crei基因(包括对Cre重组酶进行编码的由内含子分开的两个外显子)和与人泛素启动子可操作地连接的新霉素抗性基因。通过采用Prm1启动子,可以在F0动物的雄性生殖细胞中特异性地缺失自缺失盒。对选择标志物进行编码的多核苷酸可以与在被靶向的细胞中具有活性的启动子可操作地连接。启动子的实例在本文其它地方描述。作为另一个具体实例,自缺失选择盒可以包括与一个或多个启动子(例如,人泛素和EM7启动子两者)可操作地连接的潮霉素抗性基因编码序列,接着是聚腺苷酸化信号,接着是与一个或多个启动子(例如,mPrm1启动子)可操作地连接的Crei编码序列,接着是另一个聚腺苷酸化信号,其中整个盒侧接有loxP位点。
人源化白蛋白基因座还可以是条件等位基因。例如,条件等位基因可以是多功能等位基因,如US 2011/0104799中所述,所述文献出于所有目的通过引用整体并入本文。例如,条件等位基因可以包括:(a)相对于基因转录在有义取向上的启动序列;(b)在有义或反义取向上的药物选择盒(DSC);(c)在反义取向上的所关注核苷酸序列(NSI);以及(d)在相反取向上的条件反转模块(COIN,其利用外显子分裂内含子和可逆基因捕获样模块)。参见例如US 2011/0104799。条件等位基因可以进一步包括可重组单元,所述可重组单元在暴露于第一重组酶后重组以形成条件等位基因,所述条件等位基因(i)缺少启动序列和DSC;以及(ii)含有有义取向上的NSI和反义取向上的COIN。参见例如US 2011/0104799。
一种示例性人源化白蛋白基因座(例如,人源化小鼠白蛋白基因座)是从起始密码子到终止密码子的区域被对应人序列替代的人源化白蛋白基因座。参见图1A和1B以及SEQID NO:17和18。在具体实例中,从ATG起始密码子到终止密码子(即,编码外显子1-14)的区域可以从非人动物(例如,小鼠)白蛋白(Alb)基因座缺失,并且人白蛋白(ALB)的从ATG起始密码子到终止密码子下游约100bp的对应区域可以被插入来代替所缺失的内源性区域。
C.包括人源化白蛋白(ALB)基因座的非人动物基因组、非人动物细胞和非人动物
提供了包括如本文其它地方描述的人源化白蛋白(ALB)基因座的非人动物基因组、非人动物细胞和非人动物。基因组、细胞或非人动物可以是雄性或雌性。基因组、细胞或非人动物对于人源化白蛋白基因座可以是杂合的也可以是纯合的。二倍体生物体在每个基因座处具有两个等位基因。每对等位基因表示特异性基因座的基因型。如果在特定基因座处有两个相同的等位基因,则基因型被描述为纯合的,如果两个等位基因不同,则基因型被描述为杂合的。包括人源化白蛋白基因座的非人动物可以在其种系中包括人源化内源性白蛋白基因座。
本文所提供的非人动物基因组或细胞可以是例如包括白蛋白基因座或与人白蛋白基因座同源或直系同源的基因组基因座的任何非人动物基因组或细胞。基因组可以来自真核细胞或者细胞可以是真核细胞,所述真核细胞包含例如真菌细胞(例如,酵母)、植物细胞、动物细胞、哺乳动物细胞、非人哺乳动物细胞和人细胞。术语“动物”包含动物界的任何成员,包含例如哺乳动物、鱼类、爬行动物、两栖动物、鸟类和蠕虫。哺乳动物细胞可以是例如非人哺乳动物细胞、啮齿动物细胞、大鼠细胞、小鼠细胞或仓鼠细胞。其它非人哺乳动物包含例如非人灵长类动物、猴子、猿、猩猩、猫、狗、兔、马、公牛、鹿、野牛、家畜(例如,牛种,如奶牛、公牛等;绵羊种,如绵羊、山羊等;以及猪物种,如猪和野猪)。鸟类包含例如鸡、火鸡、鸵鸟、鹅、鸭等。还包含家养动物和农业动物。术语“非人”不包含人。
细胞也可以呈任何类型的未分化或分化状态。例如,细胞可以是全能细胞、多能性细胞(例如,人多能性细胞或非人多能性细胞,如小鼠胚胎干(ES)细胞或大鼠ES细胞)或非多能性细胞。全能细胞包含可以产生任何细胞类型的未分化细胞,并且多能性细胞包含具有发育成超过一种分化细胞类型的能力的未分化细胞。此类多能和/或全能细胞可以是例如ES细胞或ES样细胞,如诱导多能干(iPS)细胞。ES细胞包含在引入到胚胎中时能够对发育胚胎的任何组织做出贡献的胚胎源性全能或多能性细胞。ES细胞可以源自囊胚的内细胞团,并且能够分化成三种脊椎动物胚层(内胚层、外胚层和中胚层)中的任何层的细胞。
本文所提供的细胞还可以是生殖细胞(例如,精子或卵母细胞)。细胞可以是有丝分裂感受态细胞或有丝分裂非活性细胞、减数分裂感受态细胞或减数分裂非活性细胞。相似地,细胞还可以是初生体细胞或不是初生体细胞的细胞。体细胞包含任何不是配子、生殖细胞、配子母细胞或未分化干细胞的细胞。例如,细胞可以是肝细胞(liver cell),如成肝细胞或肝细胞(hepatocyte)。
本文所提供的合适的细胞还包含原代细胞。原代细胞包含直接从生物体、器官或组织中分离的细胞或细胞培养物。原代细胞包含既不转化也不永生的细胞。所述原代细胞包含从生物体、器官或组织中获得的任何细胞,所述细胞先前未在组织培养物中进行传代,或者先前已经在组织培养物中进行传代但不能无限期地在组织培养中进行传代。此类细胞可以通过常规技术分离并且包含例如肝细胞。
本文所提供的其它合适的细胞包含永生化细胞。永生化细胞包含来自多细胞生物体的细胞,其通常不会无限增殖但由于突变或改变而逃避正常细胞衰老并且替代地可以继续进行分裂。此类突变或改变可以天然存在或有意诱导。永生化细胞系的具体实例是HepG2人肝癌细胞系。多种类型的永生化细胞是众所周知的。永生化或原代细胞包含通常用于培养或表达重组基因或蛋白质的细胞。
本文所提供的细胞还包含单细胞期胚胎(即,受精的卵母细胞或受精卵)。此类单细胞期胚胎可以来自任何基因背景(例如,对于小鼠,BALB/c、C57BL/6、129或其组合)、可以是新鲜的或冷冻的并且可以源自自然育种或体外受精。
本文所提供的细胞可以是正常的、健康的细胞,或者可以是患病或携带突变体的细胞。
包括如本文所述的人源化白蛋白基因座的非人动物可以通过本文其它地方所述的方法制备。术语“动物”包含动物界的任何成员,包含例如哺乳动物、鱼类、爬行动物、两栖动物、鸟类和蠕虫。在具体实例中,非人动物是非人哺乳动物。非人哺乳动物包含例如非人灵长类动物、猴子、猿、猩猩、猫、狗、马、公牛、鹿、野牛、绵羊、兔、啮齿动物(例如,小鼠、大鼠、仓鼠和豚鼠)和家畜(例如,牛物种,如奶牛和食用公牛;羊物种,如绵羊和山羊;以及猪物种,如猪和野猪)。鸟类包含例如鸡、火鸡、鸵鸟、鹅和鸭。还包含家养动物和农业动物。术语“非人动物”不包含人。优选的非人动物包含例如啮齿动物,如小鼠和大鼠。
非人动物可以来自任何基因背景。例如,合适的小鼠可以来自129品系、C57BL/6品系、129和C57BL/6的混合、BALB/c品系或Swiss Webster品系。129品系的实例包含129P1、129P2、129P3、129X1、129S1(例如,129S1/SV,129S1/Svlm)、129S2、129S4、129S5、129S9/SvEvH、129S6(129/SvEvTac)、129S7、129S8、129T1和129T2。参见例如,Festing等人(1999),《哺乳动物基因组(Mammalian Genome)》10:836,所述文献出于所有目的通过引用整体并入本文。C57BL品系的实例包含C57BL/A、C57BL/An、C57BL/GrFa、C57BL/Kal_wN、C57BL/6、C57BL/6J、C57BL/6ByJ、C57BL/6NJ、C57BL/10、C57BL/10ScSn、C57BL/10Cr和C57BL/Ola。合适的小鼠还可以来自上述129品系和上述C57BL/6品系的混合(例如,50%129和50%C57BL/6)。同样地,合适的小鼠可以来自上述129品系的混合或上述BL/6品系的混合(例如,129S6(129/SvEvTac)品系)。
相似地,大鼠可以来自任何大鼠品系,包含例如ACI大鼠品系、黑刺鼠(DA)大鼠品系、威斯塔(Wistar)大鼠品系、LEA大鼠品系、斯泼累格多雷(Sprague Dawley,SD)大鼠品系或费舍尔(Fischer)大鼠品系,如费舍尔F344或费舍尔F6。大鼠还可以从源自上述两种或更多种品系的混合品系中获得。例如,合适的大鼠可以来自DA品系或ACI品系。ACI大鼠品系的特征在于具有腹部和足部呈白色的黑刺鼠以及RT1av1单倍型。此类品系可从多种来源获得,包含哈兰实验室(Harlan Laboratories)。黑刺鼠(DA)大鼠品系的特征在于具有刺鼠皮毛和RT1av1单倍型。此类大鼠可从多种来源获得,包含查尔斯河和哈兰实验室(Charles Riverand Harlan Laboratories)。一些合适的大鼠可以来自近交大鼠品系。参见例如US2014/0235933,所述文献出于所有目的通过引用整体并入本文。
包括人源化白蛋白基因座(例如,纯合的人源化白蛋白基因座)的非人动物(例如,小鼠或大鼠)可以从人源化白蛋白基因座表达白蛋白,使得血清白蛋白水平(例如,血清人白蛋白水平)与对照野生型非人动物中的血清白蛋白水平相当。在一个实例中,包括人源化白蛋白基因座(例如,纯合的人源化白蛋白基因座)的非人动物的血清白蛋白水平(例如,血清人白蛋白水平)可以是对照野生型非人动物中的血清白蛋白水平的至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或至少约100%。在另一个实例中,包括人源化白蛋白基因座(例如,纯合的人源化白蛋白基因座)的非人动物的血清白蛋白水平(例如,血清人白蛋白水平)可以至少与对照野生型非人动物中的血清白蛋白水平一样高。在另一个实例中,包括人源化白蛋白基因座(例如,纯合的人源化白蛋白基因座)的非人动物的血清白蛋白水平(例如,血清人白蛋白水平)可以高于对照野生型非人动物中的血清白蛋白水平。例如,包括人源化白蛋白基因座(例如,纯合的人源化白蛋白基因座)的非人动物的血清白蛋白水平(例如,血清人白蛋白水平)可以为至少约1mg/mL、至少约2mg/mL、至少约3mg/mL、至少约4mg/mL、至少约5mg/mL、至少约6mg/mL、至少约7mg/mL、至少约8mg/mL、至少约9mg/mL、至少约10mg/mL、至少约11mg/mL、至少约12mg/mL、至少约13mg/mL、至少约14mg/mL或至少约15mg/mL。在更具体的实例中,包括人源化白蛋白基因座(例如,纯合的人源化白蛋白基因座)的非人动物可以是小鼠,并且所述非人动物的血清白蛋白水平(例如,血清人白蛋白水平)可以为至少约1mg/mL、至少约2mg/mL、至少约3mg/mL、至少约4mg/mL、至少约5mg/mL、至少约6mg/mL、至少约7mg/mL、至少约8mg/mL、至少约9mg/mL、至少约10mg/mL、至少约11mg/mL、至少约12mg/mL、至少约13mg/mL、至少约14mg/mL或至少约15mg/mL。在具体实例中,包括人源化白蛋白基因座(例如,纯合的人源化白蛋白基因座)的非人动物(例如,小鼠)的血清白蛋白水平(例如,血清人白蛋白水平)可以介于约10mg/mL与约15mg/mL之间。在任何以上实例中,由人源化白蛋白基因座编码的白蛋白可以包括例如人白蛋白信号肽。例如,在一个实例中,所述内源性白蛋白基因座的整个白蛋白编码序列已经缺失并且被所述对应人白蛋白序列替代,或者所述内源性白蛋白基因座的从起始密码子到终止密码子的区域已经缺失并且被所述对应人白蛋白序列替代。
III.使用包括人源化白蛋白基因座的非人动物用于在体内或离体评估人白蛋白靶向试剂的功效的方法
提供了用于使用包括如本文其它地方描述的人源化白蛋白基因座的非人动物在体内或离体评估或优化人白蛋白靶向试剂(例如,治疗分子或复合物)的递送或功效的各种方法。因为非人动物包括人源化白蛋白基因座,所以非人动物将更准确地反映人白蛋白靶向试剂的功效。此类非人动物对于测试被设计成靶向人白蛋白基因的基因组编辑试剂是特别有用的,因为本文公开的非人动物包括人源化内源性白蛋白基因座而不是在随机基因组基因座处转基因插入人白蛋白序列,并且人源化内源性白蛋白基因座可以包括来自编码区和非编码区两者的直系同源人基因组白蛋白序列而不是人工cDNA序列。
A.在体内或离体测试人白蛋白靶向试剂的功效的方法
提供了用于使用包括如本文其它地方描述的人源化白蛋白基因座的非人动物评估人白蛋白靶向试剂的体内递送或功效的各种方法。此类方法可以包括:(a)向非人动物中引入人白蛋白靶向试剂(即,向非人动物施用人白蛋白靶向试剂);以及(b)评估人白蛋白靶向试剂的活性。
人白蛋白靶向试剂可以是靶向人白蛋白基因座(人白蛋白基因)、人白蛋白mRNA或人白蛋白的任何生物或化学药剂。人白蛋白靶向试剂的实例在本文其它地方公开,并且包含例如基因组编辑药剂。例如,人白蛋白靶向试剂可以是白蛋白靶向核酸(例如,CRISPR/Cas向导RNA、短发夹RNA(shRNA)或小干扰RNA(siRNA))或对白蛋白靶向蛋白(例如,Cas蛋白,如Cas9、ZFN或TALEN)进行编码的核酸。可替代地,人白蛋白靶向试剂可以是白蛋白靶向抗体或抗原结合蛋白或靶向人白蛋白的任何其它大分子或小分子。在一个实例中,人白蛋白靶向试剂是基因组编辑药剂,如核酸酶药剂和/或外源性供体核酸(例如,靶向载体)。在具体实例中,基因组编辑药剂可以靶向人白蛋白基因的内含子1、内含子12或内含子13。例如,基因组编辑药剂可以靶向人白蛋白基因的内含子1。
此类人白蛋白靶向试剂可以通过如本文其它地方更详细地公开的任何递送方法(例如,AAV、LNP或HDD)以及通过任何施用途径来施用。在本文其它地方更详细地公开了递送治疗复合物和分子的方式以及施用途径。在特定方法中,试剂通过AAV介导的递送进行递送。例如,AAV8可以用于靶向肝脏。在其它特定方法中,试剂通过LNP介导的递送进行递送。在其它特定方法中,试剂通过流体动力学递送(HDD)进行递送。剂量可以是任何合适的剂量。例如,在试剂(例如,Cas9 mRNA和gRNA)通过LNP介导的递送进行递送的一些方法中,剂量可以在约0.01mg/kg与约10mg/kg之间、约0.01和约5mg/kg、约0.01mg/kg与约4mg/kg之间、约0.01mg/kg与约3mg/kg之间、约0.01mg/kg与约2mg/kg之间、约0.01mg/kg与约1mg/kg、约0.1mg/kg与约10mg/kg之间、约0.1mg/kg与约6mg/kg之间、约0.1mg/kg与约5mg/kg之间、约0.1mg/kg与约4mg/kg之间、约0.1mg/kg与约3mg/kg之间、约0.1mg/kg与约2mg/kg之间、约0.1mg/kg与约1mg/kg之间、约0.3mg/kg与约10mg/kg之间、约0.3mg/kg与约6mg/kg之间、约0.3mg/kg与约5mg/kg之间、约0.3mg/kg与约4mg/kg之间、约0.3mg/kg与约3mg/kg之间、约0.3mg/kg与约2mg/kg之间、约0.3mg/kg与约1mg/kg之间、约0.1mg/kg、约0.3mg/kg、约1mg/kg、约2mg/kg或约3mg/kg。在具体实例中,剂量介于约0.1mg/kg与约6mg/kg之间;介于约0.1mg/kg与约3mg/kg之间或介于约0.1mg/kg与约2mg/kg之间。
用于评估人白蛋白靶向试剂的活性的方法是众所周知的并且在本文其它地方提供。对活性的评估可以是在如本文其它地方公开的任何细胞类型、任何组织类型或任何器官类型中进行。在一些方法中,对活性的评估是在肝细胞中进行。如果白蛋白靶向试剂是基因组编辑试剂(例如,核酸酶药剂),则此类方法可以包括评估人源化白蛋白基因座的修饰。举例来说,评估可以包括测量人源化白蛋白基因座处的非同源末端连接(NHEJ)活性。这可以包括例如测量人源化白蛋白基因座内的插入或缺失的频率。例如,评估可以包括对从非人动物中分离出的一个或多个细胞中的人源化白蛋白基因座进行测序(例如,下一代测序)。评估可以包括从非人动物中分离靶器官或组织(例如,肝脏)或组织以及评估靶器官或组织中人源化白蛋白基因座的修饰。评估还可以包括评估靶器官或组织内两种或更多种不同细胞类型中人源化白蛋白基因座的修饰。相似地,评估可以包括从非人动物中分离非靶器官或组织(例如,两个或更多个非靶器官或组织)以及评估非靶器官或组织中人源化白蛋白基因座的修饰。
此类方法还可以包括测量由人源化白蛋白基因座产生的mRNA的表达水平,或通过测量由人源化白蛋白基因座编码的蛋白质的表达水平。例如,可以测量特定细胞、组织或器官类型(例如,肝脏)中的蛋白质水平,或者可以测量血清中的分泌水平。用于评估从人源化白蛋白基因座表达的白蛋白mRNA或蛋白质的表达的方法在本文其它地方提供并且是众所周知的。举例来说,BASESCOPETMRNA原位杂交(ISH)测定可以用于例如定量细胞特异性编辑的转录物。
在一些方法中,所述人白蛋白靶向试剂包括外源性供体核酸(例如,靶向载体)。此类外源性供体核酸可以编码不由野生型内源性白蛋白基因座编码或表达的外源性蛋白(例如,可以包括编码外源性蛋白的插入核酸)。在一个实例中,外源性蛋白可以是异源蛋白,所述异源蛋白包括与未由野生型内源性白蛋白基因座编码或表达的蛋白质融合的人白蛋白信号肽。在一个实例中,一旦外源性供体核酸整合到人源化白蛋白基因座中,由所述外源性供体核酸编码的外源性蛋白就可以是异源蛋白,所述异源蛋白包括与未由野生型内源性白蛋白基因座编码或表达的蛋白质融合的人白蛋白信号肽。在一些方法中,评估可以包括测量由外源性供体核酸编码的信使RNA的表达。评估还可以包括测量外源性蛋白的表达。例如,可以在非人动物的肝脏中测量外源性蛋白的表达,或者可以测量外源性蛋白的血清水平。
在一些方法中,包括如本文其它地方描述的人源化白蛋白基因座的非人动物进一步包括不是白蛋白基因座的灭活(敲除)内源性基因,并且任选地人白蛋白靶向试剂包括编码外源性蛋白的外源性供体核酸(例如,靶向载体)以替代灭活内源性基因的功能。在具体实例中,灭活内源性基因是F9,并且外源性蛋白是凝血因子IX(例如,人凝血因子IX)。
在一些方法中,所述人白蛋白靶向试剂包括(1)被设计成靶向人白蛋白基因的区域的核酸酶药剂;以及(2)外源性供体核酸,其中所述外源性供体核酸被设计成靶向人白蛋白基因。外源性供体核酸可以例如编码外源性蛋白,任选地其中由已经被所述外源性供体核酸靶向的人源化内源性白蛋白基因座编码的蛋白质是包括与所述外源性蛋白融合的人白蛋白信号肽的异源蛋白。
作为一个具体实例,如果人白蛋白靶向试剂是基因组编辑试剂(例如,核酸酶药剂),则可以(例如,在肝细胞中)评估人源化白蛋白基因座处的百分比编辑(例如,在PCR反应中从裂解细胞池中读取的序列的总数中观察到的插入或缺失总数)。
以上提供的用于评估体内活性的各种方法还可以用于评估如本文其它地方描述的人白蛋白靶向试剂的离体活性。
在一些方法中,人白蛋白靶向试剂是靶向人白蛋白基因的核酸酶药剂,如CRISPR/Cas核酸酶药剂。此类方法可以包括,例如:(a)向非人动物中引入被设计成切割人白蛋白基因的核酸酶药剂(例如,如Cas9等Cas蛋白和被设计成靶向人白蛋白基因中的向导RNA靶序列的向导RNA);以及(b)评估人源化白蛋白基因座的修饰。
例如,在CRISPR/Cas核酸酶的情况下,当向导RNA与Cas蛋白形成复合物并且将Cas蛋白引导到人源化白蛋白基因座,并且Cas/向导RNA复合物切割向导RNA靶序列,从而触发细胞的修复(例如,如果不存在供体序列,则通过非同源末端连接(NHEJ)触发)时,人源化白蛋白基因座的修饰将被诱导。
任选地,可以引入两个或更多个向导RNA,各自被设计成靶向人白蛋白基因内的不同向导RNA靶序列。例如,两个向导RNA可以设计成切除两个向导RNA靶序列之间的基因组序列。当第一向导RNA与Cas蛋白形成复合物并且将Cas蛋白引导到人源化白蛋白基因座,第二向导RNA与Cas蛋白形成复合物并且将Cas蛋白引导到人源化白蛋白基因座,第一Cas/向导RNA复合物切割第一向导RNA靶序列,并且第二Cas/向导RNA复合物切割第二向导RNA靶序列,从而导致间插序列的切除时,人源化白蛋白基因座的修饰将被诱导。
另外或可替代地,还将能够与人白蛋白基因重组并对其进行修饰的外源性供体核酸(例如,靶向载体)引入到非人动物中。任选地,核酸酶药剂或Cas蛋白可以栓系到如本文其它地方描述的外源性供体核酸。例如,当向导RNA与Cas蛋白形成复合物并且将Cas蛋白引导到人源化白蛋白基因座,Cas/向导RNA复合物切割向导RNA靶序列,并且人源化白蛋白基因座与外源性供体核酸重组以修饰人源化白蛋白基因座时,人源化白蛋白基因座的修饰将被诱导。外源性供体核酸可以例如通过同源定向修复(HDR)或通过NHEJ介导的插入与人源化白蛋白基因座重组。可以使用任何类型的外源性供体核酸,其实例在本文其它地方提供。
在一些方法中,所述人白蛋白靶向试剂包括外源性供体核酸(例如,靶向载体)。此类外源性供体核酸可以编码不由野生型内源性白蛋白基因座编码或表达的外源性蛋白(例如,可以包括编码外源性蛋白的插入核酸)。在一个实例中,外源性蛋白可以是异源蛋白,所述异源蛋白包括与未由野生型内源性白蛋白基因座编码或表达的蛋白质融合的人白蛋白信号肽。例如,外源性供体核酸可以是包括剪接受体的无启动子盒,并且外源性供体核酸可以靶向人白蛋白的第一内含子。
B.在体内或离体优化人白蛋白靶向试剂的递送或功效的方法
提供了用于优化人白蛋白靶向试剂向细胞或非人动物的递送或优化人白蛋白靶向试剂的体内活性或功效的各种方法。此类方法可以包括,例如:(a)在包括人源化白蛋白基因座的第一非人动物或第一细胞中第一次执行测试如上所述的人白蛋白靶向试剂的功效的方法;(b)改变变量并用所改变变量在包括人源化白蛋白基因座的第二非人动物(即,相同物种的)或第二细胞中第二次执行所述方法;以及(c)将步骤(a)中的人白蛋白靶向试剂的活性与步骤(b)中的人白蛋白靶向试剂的活性进行比较,并且选择产生较高活性的方法。
本文其它地方公开了测量人白蛋白靶向试剂的递送、功效或活性的方法。例如,此类方法可以包括测量人源化白蛋白基因座的修饰。根据非人动物或细胞内的期望效果,人源化白蛋白基因座的更有效的修饰可以意指不同的事情。例如,人源化白蛋白基因座的更有效的修饰可以意指较高修饰水平、较高精度、较高一致性或较高特异性中的一个或多个或全部。人源化白蛋白基因座的较高修饰水平(即,较高功效)是指在特定靶细胞类型内、在特定靶组织内或在特定靶器官(例如,肝脏)内靶向更高百分比的细胞。较高精度是指人源化白蛋白基因座的更精确的修饰(例如,更高百分比的靶向细胞具有相同的修饰或具有期望的修饰而没有额外的非预期插入和缺失(例如,NHEJ插入缺失))。较高一致性是指在多于一种类型的细胞、组织或器官被靶向的情况下,不同类型的靶向细胞、组织或器官之间的人源化白蛋白基因座的更一致的修饰(例如,肝脏内更多数量的细胞类型的修饰)。如果靶向特定器官,则更高的一致性也可以指在器官(例如,肝脏)内的所有位置中更一致的修饰。更高的特异性可以指对于所靶向的基因组基因座或基因座的更高的特异性、对于所靶向的细胞类型的更高的特异性、对于所靶向的组织类型的更高的特异性或者对于所靶向的器官的更高的特异性。例如,增加的基因组基因座特异性是指脱靶基因组基因座的修饰较少(例如,代替或除了靶基因组基因座的修饰之外,在非预期的脱靶基因组基因座处具有修饰的靶向细胞的百分比较低)。同样地,增加的细胞类型、组织或器官类型特异性是指在靶向特定的细胞类型、组织类型或器官类型的情况下(例如,当靶向特定器官(例如,肝脏)时,器官或组织中不是预期靶标的细胞的修饰较少),脱靶细胞类型、组织类型或器官类型的修饰较少。
被改变的变量可以是任何参数。举例来说,所改变变量可以是包装或递送方法,通过所述包装或递送方法将一种或多种人白蛋白靶向试剂引入到细胞或非人动物中。如LNP、HDD和AAV等递送方法的实例在本文其它地方进行了公开。例如,所改变变量可以是AAV血清型。相似地,施用可以包括LNP介导的递送,并且所改变变量可以是LNP调配物。作为另一个实例,所改变变量可以是用于将一种或多种人白蛋白靶向试剂引入到细胞或非人动物中的施用途径。如静脉内、玻璃体内、实质内和鼻内滴注等施用途径的实例在本文其它地方公开。
作为另一个实例,所改变变量可以是所引入的一种或多种人白蛋白靶向试剂的浓度或量。作为另一个实例,所改变变量可以是相对于所引入的另一种人白蛋白靶向试剂(例如,向导RNA、Cas蛋白或外源性供体核酸)的浓度或量的所引入的一种人白蛋白靶向试剂(例如,向导RNA、Cas蛋白或外源性供体核酸)的浓度或量。
作为另一个实例,所改变变量可以是相对于评估试剂的活性或功效的定时的引入一种或多种人白蛋白靶向试剂的定时。作为另一个实例,所改变变量可以是引入一种或多种人白蛋白靶向试剂的次数或频率。作为另一个实例,所改变变量可以是相对于所引入的另一种人白蛋白靶向试剂(例如,向导RNA、Cas蛋白或外源性供体核酸)的引入定时的所引入的一种人白蛋白靶向试剂(例如,向导RNA、Cas蛋白或外源性供体核酸)的引入定时。
作为另一个实例,所改变变量可以是引入一种或多种人白蛋白靶向试剂的形式。例如,向导RNA可以以DNA的形式或以RNA的形式引入。Cas蛋白(例如,Cas9)可以以DNA的形式、以RNA的形式或以蛋白质的形式(例如,与向导RNA复合)引入。外源性供体核酸可以是DNA、RNA、单链的、双链的、线状的、环状的等。相似地,为了稳定性,组分中的每个组分可以包括各种修饰组合,以减少脱靶效应、促进递送等。
作为另一个实例,所改变变量可以是所引入的一种或多种人白蛋白靶向试剂。例如,如果人白蛋白靶向试剂包括向导RNA,则所改变变量可以是引入具有不同序列的不同向导RNA(例如,靶向不同的向导RNA靶序列)。同样地,如果人白蛋白靶向试剂包括Cas蛋白,则所改变变量可以是引入不同的Cas蛋白(例如,引入具有不同序列的不同Cas蛋白,或具有不同序列(例如,经密码子优化的)但编码同一Cas蛋白氨基酸序列的核酸)。同样地,如果人白蛋白靶向试剂包括外源性供体核酸,则所改变变量可以是引入具有不同序列的不同外源性供体核酸(例如,不同的插入核酸或不同的同源臂(例如,更长或更短的同源臂或靶向人白蛋白基因的不同区域的同源臂))。
在具体实例中,所述人白蛋白靶向试剂包括Cas蛋白和被设计成靶向人白蛋白基因中的向导RNA靶序列的向导RNA。在此类方法中,所改变变量可以是向导RNA序列和/或向导RNA靶序列。在一些此类方法中,Cas蛋白和向导RNA可以各自以RNA的形式施用,并且改变的变量可以是Cas mRNA与向导RNA的比率(例如,在LNP调配物中)。在一些此类方法中,改变的变量可以是向导RNA修饰(例如,将具有修饰的向导RNA与没有修饰的向导RNA进行比较)。
C.人白蛋白靶向试剂
人白蛋白靶向试剂可以是靶向人白蛋白基因、人白蛋白mRNA或人白蛋白的任何试剂。例如,人白蛋白靶向试剂可以是基因组编辑试剂,如切割人白蛋白基因内的靶序列和/或与人白蛋白基因重组的外源性供体序列的核酸酶药剂,人白蛋白靶向试剂可以是靶向人白蛋白mRNA的反义寡核苷酸,人白蛋白靶向试剂可以是靶向人白蛋白表位的抗原结合蛋白,或者人白蛋白靶向试剂可以是靶向人白蛋白的小分子。本文公开的方法中的人白蛋白靶向试剂可以是已知的人白蛋白靶向试剂,可以是推定的白蛋白靶向试剂(例如,被设计用于靶向人白蛋白的候选试剂),或可以是针对人白蛋白靶向活性进行筛选的试剂。
(1)靶向人白蛋白基因的核酸酶药剂
人白蛋白靶向试剂可以是基因组编辑试剂,如切割人白蛋白基因内的靶序列的核酸酶药剂。核酸酶靶序列包含由核酸酶药剂诱导切口或双链断裂的DNA序列。核酸酶药剂的靶序列可以是细胞内源的(或自然的),或者靶序列可以是细胞外源的。细胞外源性靶序列并非天然存在于细胞的基因组中。靶序列还可以对于期望定位在靶基因座处的所关注的多核苷酸是外源的。在一些情况下,靶序列在宿主细胞的基因组中仅存在一次。在具体实例中,核酸酶靶序列可以位于人白蛋白基因的内含子1、内含子12或内含子13中。例如,核酸酶靶序列可以位于人白蛋白基因的内含子1中。
靶序列的长度可以变化,并且包含例如对于锌指核酸酶(ZFN)对约30-36bp(即,对于每个ZFN约15-18bp)、对于转录激活因子样效应物核酸酶(TALEN)约36bp或对于CRISPR/Cas9向导RNA约20bp的靶序列。
可以在本文所公开的方法和组合物中使用在期望靶序列处诱导切口或双链断裂的任何核酸酶药剂。可以采用天然存在的或天然的核酸酶药剂,只要所述核酸酶药剂在期望的靶序列中诱导切口或双链断裂即可。可替代地,可以采用经修饰的或工程化核酸酶药剂。“工程化核酸酶药剂”包含从其天然形式工程化(进行修饰或源自所述天然形式)以特异性地识别和诱导期望的靶序列中的切口或双链断裂的核酸酶。因此,工程化核酸酶药剂可以源自天然的、天然存在的核酸酶药剂,或者可以人工产生或合成。工程化核酸酶可以在例如靶序列中诱导切口或双链断裂,其中靶序列不是由天然(非工程化或未经修饰的)核酸酶药剂识别的序列。核酸酶药剂的修饰可以少至蛋白质切割剂中的一个氨基酸或核酸切割剂中的一个核苷酸。在靶序列或其它DNA中产生切口或双链断裂在本文中可以被称为“切割(cutting)”或“切割(cleaving)”靶序列或其它DNA。
还提供了例示性靶序列的活性变体和片段。此类活性变体可以包括与给定的靶序列具有至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中活性变体保留生物活性并且因此能够以序列特异性方式被核酸酶药剂识别和切割。由核酸酶药剂测量靶序列双链断裂的测定是众所周知的。参见例如Frendewey等人(2010),《酶学方法(Methods in Enzymology)》476:295-307,所述文献出于所有目的通过引用整体并入本文。
核酸酶药剂的靶序列可以定位在白蛋白基因座中或附近的任何位置。靶序列可以定位在白蛋白基因的编码区内,或者在影响基因表达的调控区内。核酸酶药剂的靶序列可以定位在内含子、外显子、启动子、增强子、调控区或任何非蛋白质编码区中。
一种类型的核酸酶药剂是转录激活因子样效应物核酸酶(TALEN)。TAL效应物核酸酶是一类序列特异性核酸酶,其可以用于在原核或真核生物基因组中的具体靶序列处使双链断裂。通过将自然或工程化转录激活子样(TAL)效应物或其功能部分与例如FokI等核酸内切酶的催化结构域融合来产生TAL效应物核酸酶。独特的模块化TAL效应子DNA结合结构域允许设计具有潜在任何给定DNA识别特异性的蛋白质。因此,TAL效应子核酸酶的DNA结合结构域可以被工程化以识别特定的DNA靶位点,并且因此用于在期望的靶序列处进行双链断裂。参见WO 2010/079430;Morbitzer等人(2010),《美国国家科学院院刊(PNAS)》10.1073/pnas.1013133107;Scholze和Boch(2010),《毒力(Virulence)》1:428-432;Christian等人,《基因学(Genetics)》(2010)186:757-761;Li等人(2010),《核酸研究》(2010)doi:10.1093/nar/gkq704;以及Miller等人(2011),《自然生物技术》29:143-148,所述文献中的每个文献通过引用整体并入本文。
合适的TAL核酸酶的实例和用于制备合适的TAL核酸酶的方法公开于例如US2011/0239315 A1、US 2011/0269234 A1、US 2011/0145940 A1、US 2003/0232410 A1、US2005/0208489 A1、US 2005/0026157 A1、US 2005/0064474 A1、US 2006/0188987 A1和US2006/0063231 A1中,所述文献中的每个文献通过引用整体并入本文。在各个实施例中,TAL效应物核酸酶被工程化为在例如所关注的基因座或所关注的基因组基因座中的靶核酸序列中或附近切断,其中靶核酸序列位于将由靶向载体修饰的序列处或附近。适合与本文所提供的各种方法和组合物一起使用的TAL核酸酶包含那些专门设计成在将由如本文所述的靶向载体修饰的靶核酸序列处或附近结合的核酸酶。
在一些TALEN中,TALEN的每个单体包括通过两个高变残基识别单个碱基对的33-35个TAL重复序列。在一些TALEN中,核酸酶药剂是包括与如FokI核酸内切酶等独立核酸酶可操作地连接的基于TAL重复序列的DNA结合结构域的嵌合蛋白。例如,核酸酶药剂可以包括第一基于TAL重复序列的DNA结合结构域和第二基于TAL重复序列的DNA结合结构域,其中第一和第二基于TAL重复序列的DNA结合结构域中的每一个与FokI核酸酶可操作地连接,其中第一和第二基于TAL重复序列的DNA结合结构域识别由不同长度(12-20bp)的间隔子序列分开的靶DNA序列的每条链中的两个连续靶DNA序列,并且其中FokI核酸酶亚基二聚化以产生使靶序列上的双链断裂的活性核酸酶。
在本文所公开的各种方法和组合物中采用的核酸酶药剂可以进一步包括锌指核酸酶(ZFN)。在一些ZFN中,ZFN的每个单体包括3个或更多个基于锌指的DNA结合结构域,其中每个基于锌指的DNA结合结构域与3bp亚位点结合。在其它ZFN中,ZFN是包括基于锌指的DNA结合结构域的嵌合蛋白,所述结合结构域与如FokI核酸内切酶等独立的核酸酶可操作地连接。例如,核酸酶药剂可以包括第一ZFN和第二ZFN,其中第一ZFN和第二ZFN各自与FokI核酸酶亚基可操作地连接,其中第一ZFN和第二ZFN识别由约5-7bp间隔子分开的靶DNA序列中的每条链中的两个连续靶DNA序列,并且其中FokI核酸酶亚基二聚化以产生使双链断裂的活性核酸酶。参见例如,US20060246567;US20080182332;US20020081614;US20030021776;WO/2002/057308A2;US20130123484;US20100291048;WO/2011/017293A2;以及Gaj等人(2013),《生物技术趋势(Trends in Biotechnology)》31(7):397-405,所述文献中的每个文献通过引用并入本文。
另一种类型的核酸酶药剂是工程化大范围核酸酶。大范围核酸酶基于保守序列基序分类为四个家族,这些家族是LAGLIDADG、GIY-YIG、H-N-H和His-Cys盒家族。这些基序参与金属离子的配位和磷酸二酯键的水解。大范围核酸酶因其长的靶序列以及在其DNA底物中耐受一些序列多态性而著称。大范围核酸酶结构域、结构和功能是已知的,参见例如Guhan和Muniyappa(2003),《生物化学与分子生物学评论(Crit Rev Biochem Mol Biol)》38:199-248;Lucas等人,(2001)《核酸研究》29:960-9;Jurica和Stoddard,(1999),《细胞分子生命科学(Cell Mol Life Sci)》55:1304-26;Stoddard,(2006),《生物物理学季评(QRev Biophys)》38:49-95;以及Moure等人,(2002),《自然结构生物学(Nat Struct Biol)》9:764。在一些实例中,使用天然存在的变体和/或工程化衍生的大范围核酸酶。用于修饰动力学、辅因子相互作用、表达、最佳条件和/或靶序列特异性和筛选活性的方法是已知的。参见例如,Epinat等人,(2003)《核酸研究》31:2952-62Chevalier等人,(2002),《分子细胞》10:895-905;Gimble等人,(2003)《分子生物学(Mol Biol)》334:993-1008;Seligman等人,(2002)《核酸研究》30:3870-9;Sussman等人,(2004)《分子生物学杂志》342:31-41;Rosen等人,(2006)《核酸研究》34:4791-800;Chames等人,(2005)《核酸研究》33:e178;Smith等人,(2006)《核酸研究》34:e149;Gruen等人,(2002)《核酸研究》30:e29;Chen和Zhao,(2005)《核酸研究》33:e154;WO2005105989;WO2003078619;WO2006097854;WO2006097853;WO2006097784;和WO2004031346,所述文献中的每个文献通过引用整体并入本文。
可以使用任何大范围核酸酶,包含例如I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、PI-PspI、F-SceI、F-SceII、F-SuvI、F-TevI、F-TevII、I-AmaI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I-NaaI、I-NanI、I-NcIIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp6803I、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、I-UarAP、I-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-MtuI、PI-MtuHIP PI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、PI-TliII或其任何活性变体或片段。
大范围核酸酶可以识别例如12个到40个碱基对的双链DNA序列。在一些情况下,大范围核酸酶识别基因组中一个完美匹配的靶序列。
一些大范围核酸酶是归巢核酸酶。归巢核酸酶的一种类型是归巢核酸酶的LAGLIDADG家族,包含例如I-SceI、I-CreI和I-Dmol。
核酸酶药剂可以进一步包括如以下更详细地描述的CRISPR/Cas系统。
还提供了核酸酶药剂(即,工程化核酸酶药剂)的活性变体和片段。此类活性变体可以包括与天然核酸酶药剂具有至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中活性变体保留在期望的靶序列处切割的能力并因此保留切口或双链断裂诱导活性。例如,本文所描述的核酸酶药剂中的任何核酸酶药剂都可以从天然核酸内切酶序列进行修饰,并被设计成在未被天然核酸酶药剂识别的靶序列处识别和诱导切口或双链断裂。因此,一些工程化核酸酶具有特异性以在不同于对应的天然核酸酶药剂靶序列的靶序列处诱导切口或双链断裂。对切口或双链断裂诱导活性的测定是已知的,并且通常测量内切核酸酶对含有靶序列的DNA底物的总体活性和特异性。
核酸酶药剂可以通过任何已知方式引入到细胞或非人动物中。对核酸酶药剂进行编码的多肽可以被直接引入到细胞或非人动物中。可替代地,对核酸酶药剂进行编码的多核苷酸可以被引入到细胞或非人动物中。当引入对核酸酶药剂进行编码的多核苷酸时,核酸酶药剂可以在细胞内瞬时地、有条件地或组成性地表达。对核酸酶药剂进行编码的多核苷酸可以包含在表达盒中并且与条件启动子、诱导型启动子、组成型启动子或组织特异性启动子可操作地连接。启动子的实例在本文其它地方进一步详细讨论。可替代地,核酸酶药剂可以作为对核酸酶药剂进行编码的mRNA被引入到细胞中。
对核酸酶药剂进行编码的多核苷酸可以稳定地整合在细胞的基因组中,并且与在细胞中有活性的启动子可操作地连接。可替代地,对核酸酶药剂进行编码的多核苷酸可以在靶向载体中。
当通过引入对核酸酶药剂进行编码的多核苷酸向细胞提供核酸酶药剂时,可以修饰这种对核酸酶药剂进行编码的多核苷酸以取代与对核酸酶药剂进行编码的天然存在的多核苷酸序列相比在所关注的细胞中具有更高使用频率的密码子。例如,与天然存在的多核苷酸序列相比,可以修饰对核酸酶药剂进行编码的多核苷酸以取代在给定的所关注真核细胞中具有更高使用频率的密码子,包含人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它所关注的宿主细胞。
(2)靶向人白蛋白基因的CRISPR/Cas系统
特定类型的人白蛋白靶向试剂可以是靶向人白蛋白基因的成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关(Cas)系统。CRISPR/Cas系统包含转录本和涉及Cas基因表达或引导其活性的其它元件。CRISPR/Cas系统可以是例如I型、II型、III型系统或V型系统(例如,V-A亚型或V-B亚型)。在本文公开的组合物和方法中使用的CRISPR/Cas系统可以是非天然存在的。“非天然存在的”系统包含表明涉及人工的任何事物,如系统的一种或多种组分从其自然存在的状态改变或突变,至少基本上不含所述组分在自然界中与其天然相关的至少一种其它组分或与所述组分不与其天然相关的至少一种其它组分相关。例如,一些CRISPR/Cas系统采用包括非天然一起存在的gRNA和Cas蛋白的非天然存在的CRISPR复合物,采用非天然存在的Cas蛋白,或者采用非天然存在的gRNA。
Cas蛋白以及对Cas蛋白进行编码的多核苷酸。Cas蛋白通常包括至少一个可以与向导RNA(gRNA)相互作用的RNA识别或结合结构域。Cas蛋白还可以包括核酸酶结构域(例如,DNase结构域或RNase结构域)、DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域、二聚化结构域和其它结构域。一些此类结构域(例如,DNase结构域)可以来自天然Cas蛋白。可以添加其它此类结构域以制备经修饰的Cas蛋白。核酸酶结构域对核酸切割具有催化活性,所述核酸切割包含核酸分子的共价键的断裂。切割可以产生平末端或交错末端,并且其可以是单链或双链的。例如,野生型Cas9蛋白通常将产生钝性切割产物。可替代地,野生型Cpf1蛋白(例如,FnCpf1)可以产生具有5核苷酸5'突出端的切割产物,其中切割发生在非靶向链上的PAM序列的第18个碱基对之后和靶向链上的第23个碱基之后。Cas蛋白可以具有完整的切割活性以在靶基因组基因座处产生双链断裂(例如,具有平末端的双链断裂),或者其可以是在靶基因组基因座处产生单链断裂的切口酶。
Cas蛋白的实例包含Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1或Csx12)、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966以及其同源物或经修饰的版本。
示例性Cas蛋白是Cas9蛋白或源自Cas9蛋白的蛋白。Cas9蛋白来自II型CRISPR/Cas系统,并且通常共享具有保守结构的四个关键基序。基序1、2和4是类似RuvC的基序,并且基序3是HNH基序。示例性Cas9蛋白来自酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcus thermophilus)、链球菌(Streptococcus sp.)、金黄色葡萄球菌(Staphylococcus aureus)、达松维尔拟诺卡氏菌(Nocardiopsisdassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿产色链霉菌(Streptomycesviridochromogenes)、绿产色链霉菌(Streptomyces viridochromogenes)、链孢囊菌(Streptosporangiumroseum)、链孢囊菌(Streptosporangiumroseum)、酸热脂环酸杆菌(Alicyclobacillus acidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、硒化芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacteriumsibiricum)、德氏乳酸杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、海洋微颤菌(Microscilla marina)、伯克氏菌目细菌(Burkholderiales bacterium)、食萘极地单胞菌(Polaromonasnaphthalenivorans)、极地单胞菌(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaerawatsonii)、蓝丝菌(Cyanothecesp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻(Synechococcus sp.)、阿拉伯糖醋酸杆菌(Acetohalobiumarabaticum)、德根斯产氨菌(Ammonifexdegensii)、热解纤维素菌(Caldicelulosiruptorbecscii)、候选金矿菌(CandidatusDesulforudis)、肉毒杆菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、丙酸降解菌(Pelotomaculumthermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacilluscaldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillusferrooxidans)、异色变色菌(Allochromatiumvinosum)、海杆菌(Marinobactersp.)、嗜盐亚硝化球菌(Nitrosococcushalophilus)、沃森亚硝化球菌(Nitrosococcuswatsoni)、嗜盐假交替单胞菌(Pseudoalteromonashaloplanktis)、雷氏纤线杆菌(Ktedonobacterracemifer)、伊芙氏甲烷盐菌(Methanohalobiumevestigatum)、鱼腥藻(Anabaenavariabilis)、泡沫节球藻(Nodulariaspumigena)、念珠藻(Nostoc sp.)、节旋藻(Arthrospira maxima)、盘状节旋藻(Arthrospira platensis)、节旋藻(Arthrospira sp.)、鞘丝藻(Lyngbya sp.)、原型微鞘藻(Microcoleuschthonoplastes)、颤蓝细菌(Oscillatoria sp.)、运动石袍菌(Petrotogamobilis)、非洲栖热腔菌(Thermosipho africanus)、深海阿卡罗虎尾草(Acaryochloris marina)、脑膜炎奈瑟氏菌(Neisseria meningitidis)或空肠弯曲杆菌(Campylobacter jejuni)。Cas9家族成员的另外实例在WO 2014/131833中进行描述,所述文献出于所有目的通过引用整体并入本文。来自酿脓链球菌的Cas9(SpCas9)(指定SwissProt登录号Q99ZW2)是示例性Cas9蛋白。来自金黄色葡萄球菌的Cas9(SaCas9)(指定UniProt登录号J7RUA5)是另一示例性Cas9蛋白。来自空肠弯曲杆菌的Cas9(CjCas9)(指定UniProt登录号Q0P897)是另一种示例性Cas9蛋白。参见例如,Kim等人(2017),《自然通讯(Nat.Comm.)》8:14500,所述文献出于所有目的通过引用整体并入本文。SaCas9小于SpCas9,并且CjCas9小于SaCas9和SpCas9两者。示例性Cas9蛋白序列可以包括SEQ ID NO:38、基本上由其组成或由其组成。编码Cas9蛋白的示例性DNA可以包括SEQ ID NO:39、基本上由其组成或由其组成。
Cas蛋白的另一个实例是Cpf1(来自普雷沃氏菌(Prevotella)和弗朗西斯氏菌(Francisella)1的CRISPR)蛋白。Cpf1是含有与Cas9的对应结构域同源的RuvC样核酸酶结构域以及与特征性富含精氨酸的Cas9簇的对应物的大蛋白质(约1300个氨基酸)。然而,Cpf1缺乏Cas9蛋白中存在的HNH核酸酶结构域,并且RuvC样结构域在Cpf1序列中是连续的,而Cas9则相反,其含有包含HNH结构域的长插入物。参见例如,Zetsche等人(2015),《细胞》163(3):759-771,所述文献出于所有目的通过引用整体并入本文。示例性Cpf1蛋白来自土拉弗朗西斯菌(Francisellatularensis)1、土拉弗朗西丝菌新凶手亚种(Francisellatularensis subsp.novicida)、易北河普雷沃氏菌(Prevotellaalbensis)、毛螺菌科细菌(Lachnospiraceae bacterium)MC20171、解蛋白丁酸弧菌(Butyrivibrioproteoclasticus)、异域菌门细菌(Peregrinibacteria bacterium)GW2011_GWA2_33_10、俭菌超门细菌(Parcubacteria bacterium)GW2011_GWC2_44_17、史密斯氏菌属(Smithella sp.)SCADC、氨基酸球菌属(Acidaminococcus sp.)BV3L6、毛螺菌科细菌(Lachnospiraceae bacterium)MA2020、候选白蚁甲烷支原体(CandidatusMethanoplasmatermitum)、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉氏菌(Moraxella bovoculi)237、稻田氏钩端螺旋体(Leptospira inadai)、毛螺菌科细菌(Lachnospiraceae bacterium)ND2006、狗口腔卟啉单胞菌(Porphyromonascrevioricanis)3、解糖胨普雷沃氏菌(Prevotelladisiens)和猕猴卟啉单胞菌(Porphyromonasmacacae)。来自新凶手弗朗西丝氏菌(Francisellanovicida)U112的Cpf1(FnCpf1;指定UniProt登录号A0Q7Q2)是示例性Cpf1蛋白。
Cas蛋白可以是野生型蛋白(即,自然界中存在的那些蛋白)、经修饰的Cas蛋白(即,Cas蛋白变体)或野生型或经修饰的Cas蛋白的片段。就野生型或经修饰的Cas蛋白的催化活性而言,Cas蛋白也可以是活性变体或片段。就催化活性而言,活性变体或片段可以包括与野生型或经修饰的Cas蛋白或其部分具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中活性变体保留在期望的切割位点处切割的能力,并因此保留切口诱导或双链断裂诱导活性。对切口诱导或双链断裂诱导活性的测定是已知的,并且通常测量Cas蛋白对含有切割位点的DNA底物的总体活性和特异性。
可以修饰Cas蛋白以增加或减少核酸结合亲和力、核酸结合特异性和酶活性中的一种或多种。也可以修饰Cas蛋白以改变蛋白质的任何其它活性或性质,如稳定性。例如,可以修饰、缺失或灭活Cas蛋白的一个或多个核酸酶结构域,或者可以截短Cas蛋白以去除对蛋白质功能不是必需的结构域或优化(例如,增强或减少)Cas蛋白的活性或性质。
经修饰的Cas蛋白的一个实例是经修饰的SpCas9-HF1蛋白,其是具有设计成减少非特异性DNA接触的改变(N497A/R661A/Q695A/Q926A)的酿脓链球菌Cas9的高保真变体。参见例如Kleinstiver等人,(2016)《自然(Nature)》529(7587):490-495,所述文献出于所有目的通过引用整体并入本文。经修饰Cas蛋白的另一个实例是被设计成减少脱靶效应的经修饰的eSpCas9变体(K848A/K1003A/R1060A)。参见例如,Slaymaker等人(2016),《科学(Science)》351(6268):84-88,所述文献出于所有目的通过引用整体并入本文。其它SpCas9变体包含K855A和K810A/K1003A/R1060A。
Cas蛋白可以包括至少一个核酸酶结构域,如DNase结构域。例如,野生型Cpf1蛋白通常包括切割靶DNA的两条链的RuvC样结构域,其可能呈二聚体构型。Cas蛋白还可以包括至少两个核酸酶结构域,如DNase结构域。例如,野生型Cas9蛋白通常包括RuvC样核酸酶结构域和HNH样核酸酶结构域。RuvC结构域和HNH结构域可以各自切割双链DNA的不同的链以在DNA中产生双链断裂。参见例如,Jinek等人(2012),《科学》337:816-821,所述文献出于所有目的通过引用整体并入本文。
核酸酶结构域中的一个或多个或所有核酸酶结构域可以缺失或突变,使得其不再具有功能或具有降低的核酸酶活性。例如,如果Cas9蛋白中的核酸酶结构域之一进行缺失或突变,则所得Cas9蛋白可以被称为切口酶,并且可以在双链靶DNA内产生单链断裂,但不会产生双链断裂(即,其可以切割互补链或非互补链,但不能同时切割两者)。如果核酸酶结构域中的两者进行缺失或突变,则所得Cas蛋白(例如,Cas9)切割双链DNA的两条链的能力将降低(例如,核酸酶无效或核酸酶失活Cas蛋白,或催化死亡的Cas蛋白(dCas))。将Cas9转化为切口酶的突变的实例是来自酿脓链球菌的Cas9的RuvC结构域中的D10A(在Cas9的位置10处天冬氨酸转化为丙氨酸)突变。同样地,来自酿脓链球菌的Cas9的HNH结构域中的H939A(在氨基酸位置839处组氨酸到丙氨酸)、H840A(在氨基酸位置840处组氨酸到丙氨酸)或N863A(在氨基酸位置N863处天冬酰胺到丙氨酸)可以将Cas9转化为切口酶。将Cas9转化为切口酶的突变的其它实例包含来自嗜热链球菌的Cas9的对应突变。参见例如,Sapranauskas等人(2011),《核酸研究》39:9275-9282和WO 2013/141680,所述文献中的每个文献出于所有目的通过引用整体并入本文。可以使用如定点诱变、PCR介导的诱变或总基因合成等方法产生此类突变。产生切口酶的其它突变实例可以在例如WO 2013/176772和WO2013/142578中找到,所述文献中的每个文献出于所有目的通过引用整体并入本文。如果Cas蛋白中的全部核酸酶结构域都进行缺失或突变(例如,Cas9蛋白中的两个核酸酶结构域都进行缺失或突变),则所得Cas蛋白(例如,Cas9)切割双链DNA的两条链的能力将降低(例如,核酸酶无效或核酸酶失活Cas蛋白)。一个具体实例是D10A/H840A酿脓链球菌Cas9双突变体或者当与酿脓链球菌Cas9最佳比对时来自另一物种的Cas9中的对应双突变体。另一个具体实例是D10A/N863A酿脓链球菌Cas9双突变体或者当与酿脓链球菌Cas9最佳比对时来自另一物种的Cas9中的对应双突变体。
金黄色葡萄球菌Cas9蛋白的催化结构域中的失活突变的实例也是已知的。例如,金黄色葡萄球菌Cas9酶(SaCas9)可以包括用于产生核酸酶失活Cas蛋白的位置N580处的取代(例如,N580A取代)和位置D10处的取代(例如,D10A取代)。参见例如,WO 2016/106236,所述文献出于所有目的通过引用整体并入本文。
Cpf1蛋白的催化结构域中的失活突变的实例也是已知的。参考来自新凶手弗朗西丝氏菌U112(FnCpf1)、氨基酸球菌BV3L6(AsCpf1)、毛螺科菌ND2006(LbCpf1)和牛眼莫拉氏菌237(MbCpf1 Cpf1)的Cpf1蛋白,此类突变可以包含AsCpf1的位置908、993或1263处或Cpf1直系同源物中的对应位置处,或LbCpf1的位置832、925、947或1180或Cpf1直系同源物中的对应位置处的突变。此类突变可以包含例如AsCpf1的突变D908A、E993A和D1263A或Cpf1直系同源物中的对应突变或LbCpf1的D832A、E925A、D947A和D1180A或Cpf1直系同源物中的对应突变中的一种或多种突变。参见例如US 2016/0208243,所述文献出于所有目的通过引用整体并入本文。
Cas蛋白(例如,核酸酶活性Cas蛋白或核酸酶失活Cas蛋白)也可以作为融合蛋白可操作地连接到异源多肽。例如,Cas蛋白可以与切割结构域或表观遗传修饰结构域融合。参见WO 2014/089290,所述文献出于所有目的通过引用整体并入本文。Cas蛋白也可以与异源多肽融合,提供增加或减少的稳定性。融合结构域或异源多肽可以定位于N端、C端或Cas蛋白内部。
举例来说,Cas蛋白可以与提供亚细胞定位的一种或多种异源多肽融合。此类异源多肽可以包含例如一种或多种核定位信号(NLS),如用于靶向细胞核的单分SV40 NLS和/或双分α-输入蛋白NLS、用于靶向线粒体的线粒体定位信号、ER保留信号等。参见例如,Lange等人(2007),《生物化学杂志(J.Biol.Chem.)》282:5101-5105,所述文献出于所有目的通过引用整体并入本文。此类亚细胞定位信号可以定位于N端、C端或Cas蛋白内的任何位置。NLS可以包括碱性氨基酸段,并且可以是单分序列或二分序列。任选地,Cas蛋白可以包括两个或更多个NLS,包含N端处的NLS(例如,α-输入蛋白NLS或单分NLS)和C端处的NLS(例如,SV40NLS或双分NLS)。Cas蛋白还可以包括N端处的两个或更多个NLS和/或C端处的两个或更多个NLS。
Cas蛋白也可以与细胞穿透性结构域或蛋白质转导结构域可操作地连接。例如,细胞穿透性结构域可以源自HIV-1TAT蛋白、来自人乙型肝炎病毒的TLM细胞穿透基序、MPG、Pep-1、VP22、来自单纯疱疹病毒的细胞穿透性肽或聚精氨酸肽序列。参见例如WO2014/089290和WO 2013/176772,所述文献中的每个文献出于所有目的通过引用整体并入本文。细胞穿透性结构域可以定位于N端、C端或Cas蛋白内的任何位置。
Cas蛋白也可以与异源多肽可操作地连接以便于进行追踪或纯化,如荧光蛋白、纯化标签或表位标签。荧光蛋白的实例包含绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、eGFP、祖母绿、Azami绿、单体Azami绿、CopGFP、AceGFP、ZsGreenl)、黄色荧光蛋白(例如,YFP、eYFP、柠檬黄、Venus、YPet、PhiYFP、ZsYellowl)、蓝色荧光蛋白(例如,eBFP、eBFP2、石青、mKalamal、GFPuv、天蓝色、T-天蓝色(T-sapphire))、青色荧光蛋白(例如,eCFP、蔚蓝色(Cerulean)、CyPet、AmCyanl、Midoriishi-青色)、红色荧光蛋白(例如,mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRedl、AsRed2、eqFP611、mRaspberry、mStrawberry、Jred)、橙色荧光蛋白(例如,mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine、tdTomato)和任何其它合适的荧光蛋白。标签的实例包含谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、血凝素(HA)、nus、Softag1、Softag3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、组氨酸(His)、生物素羧基载体蛋白(BCCP)和钙调蛋白。
Cas蛋白还可以栓系到外源性供体核酸或经标记的核酸。这种栓系(即,物理连接)可以通过共价相互作用或非共价相互作用来实现,并且栓系可以是直接的(例如,通过直接融合或化学缀合,这可以通过蛋白质上的半胱氨酸或赖氨酸残基的修饰或内含子修饰来实现),或者可以通过如链霉亲和素或适配子等一个或多个中间连接子或衔接子分子来实现。参见例如,Pierce等人(2005),《药物化学短评(Mini Rev.Med.Chem.)》5(1):41-55;Duckworth等人(2007),《德国应用化学会刊(Angew.Chem.Int.Ed.Engl.)》46(46):8819-8822;Schaeffer和Dixon(2009),《澳大利亚化学杂志(Australian J.Chem.)》62(10):1328-1332;Goodman等人(2009),《生物化学(Chembiochem.)》10(9):1551-1557;以及Khatwani等人(2012)《生物有机化学与医药化学(Bioorg.Med.Chem.)》20(14):4532-4539,所述文献中的每个文献出于所有目的通过引用整体并入本文。用于合成蛋白质-核酸缀合物的非共价策略包含生物素-链霉亲和素和镍-组氨酸方法。可以通过使用多种化学反应连接适当功能化的核酸和蛋白质来合成共价蛋白质-核酸缀合物。这些化学反应中的一些化学反应涉及将寡核苷酸直接附着到蛋白质表面上的氨基酸残基(例如,赖氨酸胺或半胱氨酸硫醇),而其它更复杂的方案需要蛋白质的翻译后修饰或者催化或反应蛋白结构域的参与。用于蛋白质与核酸共价附着的方法可以包含例如寡核苷酸与蛋白质赖氨酸或半胱氨酸残基的化学交联、表达的蛋白质连接、化学酶法和光适体的使用。外源性供体核酸或标记的核酸可以栓系到Cas蛋白内的C端、N端或内部区域。在一个实例中,外源性供体核酸或标记的核酸拴系到Cas蛋白的C端或N端。同样地,Cas蛋白可以栓系到外源性供体核酸或标记的核酸的5'末端、3'末端或内部区域。也就是说,外源性供体核酸或标记的核酸可以以任何取向和极性拴系。例如,Cas蛋白可以栓系到外源性供体核酸或标记的核酸的5'末端或3'末端。
Cas蛋白可以以任何形式提供。例如,Cas蛋白可以以蛋白质的形式提供,如与gRNA复合的Cas蛋白。可替代地,可以以对Cas蛋白进行编码的核酸形式提供Cas蛋白,如RNA(例如,信使RNA(mRNA))或DNA。任选地,可以对编码Cas蛋白的核酸进行密码子优化以在特定细胞或生物体中有效翻译成蛋白质。例如,与天然存在的多核苷酸序列相比,可以修饰对Cas蛋白进行编码的核酸以取代在细菌细胞、酵母细胞、人细胞、非人细胞、哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它所关注宿主细胞中具有更高使用频率的密码子。当对Cas蛋白进行编码的核酸被引入到细胞中时,Cas蛋白可以在细胞中进行瞬时、条件性或组成性表达。
作为mRNA提供的Cas蛋白可以被修饰用于改进的稳定性和/或免疫原性性质。可以对mRNA内的一种或多种核苷进行修饰。对mRNA核碱基进行化学修饰的实例包含假尿苷、1-甲基-假尿苷和5-甲基-胞苷。例如,可以使用含有N1-甲基假尿苷的加帽和聚腺苷酸化CasmRNA。同样地,Cas mRNA可以通过使用同义密码子对尿苷进行缺失来修饰。
对Cas蛋白进行编码的核酸可以稳定地整合在细胞的基因组中,并且与在细胞中有活性的启动子可操作地连接。可替代地,对Cas蛋白进行编码的核酸可以与表达构建体中的启动子可操作地连接。表达构建体包含能够引导基因或其它所关注核酸序列(例如,Cas基因)的表达并且可以将此类所关注核酸序列转移到靶细胞的任何核酸构建体。例如,对Cas蛋白进行编码的核酸可以在包括核酸插入物的靶向载体和/或包括对gRNA进行编码的DNA的载体中。可替代地,其可以在与包括核酸插入物的靶向载体分离和/或与包括对gRNA进行编码的DNA的载体分离的载体或质粒中。可以在表达构建体中使用的启动子包含例如在真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能性细胞、胚胎干(ES)细胞或受精卵中的一个或多个中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。任选地,启动子可以是在一个方向上驱动Cas蛋白的表达并且在另一个方向上驱动向导RNA的表达的双向启动子。此类双向启动子可以由以下组成:(1)含有3个外部控制元件:远侧序列元件(DSE)、近侧端序列元件(PSE)和TATA框的完整的、常规的、单向的Pol III启动子;(2)包含在相反取向上与DSE的5'端融合PSE和TATA盒的第二基本Pol III启动子。例如,在H1启动子中,DSE邻近PSE和TATA框,并且可以通过产生杂合启动子使启动子双向化,其中通过源自U6启动子的附加PSE和TATA盒来控制反向转录。参见例如US 2016/0074535,所述文献出于所有目的通过引用整体并入本文。使用双向启动子同时表达对Cas蛋白和向导RNA进行编码的基因允许生成紧凑表达盒以促进递送。
向导RNA:“向导RNA”或“gRNA”是与Cas蛋白(例如,Cas9蛋白)结合并将Cas蛋白靶向靶DNA内的特定位置的RNA分子。向导RNA可以包括两个区段:“DNA靶向区段”和“蛋白质结合区段”。“区段”包含分子的一部分或区域,如RNA中的连续核苷酸段。一些gRNA,如Cas9的那些,可以包括两个单独的RNA分子:“激活因子RNA”(例如,tracrRNA)和“靶向因子RNA”(例如,CRISPR RNA或crRNA)。其它gRNA是单个RNA分子(单个RNA多核苷酸),所述单个RNA分子也可以被称为“单分子gRNA”、“单向导RNA”或“sgRNA”。参见例如WO 2013/176772、WO 2014/065596、WO 2014/089290、WO 2014/093622、WO 2014/099750、WO 2013/142578和WO 2014/131833,所述文献中的每个文献出于所有目的通过引用整体并入本文。例如,对于Cas9,单向导RNA可以包括(例如,通过连接子)与tracrRNA融合的crRNA。例如,对于Cpf1,仅需要一个crRNA来实现与靶序列的结合和/或切割。术语“向导RNA”和“gRNA”包含双分子(即,模块化)gRNA和单分子gRNA两者。
示例性双分子gRNA包括crRNA样(“CRISPR RNA”或“靶向因子RNA”或“crRNA”或“crRNA重复序列”)分子和对应的tracrRNA样(“反式作用CRISPR RNA”或“激活因子RNA”或“tracrRNA”)分子。crRNA包括gRNA的DNA靶向区段(单链)和形成gRNA的蛋白质结合段的dsRNA双链体的一半的核苷酸段(即,crRNA尾部)两者。定位在DNA靶向区段下游(3')的crRNA尾部的实例包括GUUUUAGAGCUAUGCU(SEQ ID NO:40)、基本上由其组成或由其组成。本文所公开的DNA靶向区段中的任何区段都可以与SEQ ID NO:40的5'末端连接以形成crRNA。
对应的tracrRNA(激活因子RNA)包括形成gRNA的蛋白质结合区段的dsRNA双链体的另一半的核苷酸段。crRNA的核苷酸段与tracrRNA的核苷酸段互补并且与其杂交,以形成gRNA的蛋白质结合结构域的dsRNA双链体。因此,每个crRNA可以被视为具有对应的tracrRNA。tracrRNA序列的实例包括AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:41)、基本上由其组成或由其组成。
在需要crRNA和tracrRNA两者的系统中,crRNA和对应的tracrRNA杂交以形成gRNA。在仅需要crRNA的系统中,crRNA可以是gRNA。crRNA另外提供与靶DNA的互补链杂交的单链DNA靶向区段。如果用于细胞内的修饰,则给定的crRNA或tracrRNA分子的确切序列可以被设计成对将使用RNA分子的物种具有特异性。参见例如,Mali等人(2013),《科学》339:823-826;Jinek等人(2012),《科学》337:816-821;Hwang等人(2013),《自然生物技术》31:227-229;Jiang等人(2013),《自然生物技术》31:233-239;以及Cong等人(2013),《科学》339:819-823,所述文献中的每个文献出于所有目的通过引用整体并入本文。
给定gRNA的DNA靶向区段(crRNA)包括与靶DNA的互补链上的序列互补的核苷酸序列,如下文更详细地描述的。gRNA的DNA靶向区段通过杂交(即,碱基配对)以序列特异性方式与靶DNA相互作用。因此,DNA靶向区段的核苷酸序列可以不同,并且测定gRNA和靶DNA将与其相互作用的靶DNA内的定位。可以修饰主题gRNA的DNA靶向区段以与靶DNA内的任何期望序列杂交。天然存在的crRNA因CRISPR/Cas系统和生物体而不同,但通常含有长度为21到72个核苷酸的侧接有长度为21到46个核苷酸的两个直接重复序列(DR)的靶向区段(参见例如,WO 2014/131833,所述文献出于所有目的通过引用整体并入本文)。在酿脓链球菌的情况下,DR的长度为36个核苷酸,并且靶向区段的长度为30个核苷酸。定位于3'的DR与对应的tracrRNA互补并杂交,后者进而与Cas蛋白结合。
DNA靶向区段的长度可以例如为至少约12个、15个、17个、18个、19个、20个、25个、30个、35个或40个核苷酸。此类DNA靶向区段的长度例如可以为约12个到约100个、约12个到约80个、约12个到约50个、约12个到约40个、约12个到约30个、约12个到约25个或约12个到约20个核苷酸。例如,DNA靶向区段可以为约15个到约25个核苷酸(例如,约17个到约20个核苷酸或约17个、18个、19个或20个核苷酸)。参见例如US 2016/0024523,所述文献出于所有目的通过引用整体并入本文。对于来自酿脓链球菌的Cas9,典型的DNA靶向区段的长度介于16与20个核苷酸之间或长度介于17与20个核苷酸之间。对于来自金黄色葡萄球菌的Cas9,典型的DNA靶向区段的长度介于21与23个核苷酸之间。对于Cpf1,典型的DNA靶向区段的长度为至少16个核苷酸或长度为至少18个核苷酸。
TracrRNA可以呈任何形式(例如,全长tracrRNA或活性部分tracrRNA)并具有不同长度。TracrRNA可以包含初级转录本或经处理的形式。例如,tracrRNA(作为单向导RNA的一部分或作为作为双分子gRNA的一部分的单独分子)可以包括野生型tracrRNA序列(例如,野生型tracrRNA序列的约或超过约20、26、32、45、48、54、63、67、85或更多个核苷酸)、基本上由其组成或由其组成。来自酿脓链球菌的野生型tracrRNA序列的实例包含171核苷酸、89核苷酸、75核苷酸和65核苷酸版本。参见例如,Deltcheva等人(2011),《自然》471:602-607;WO2014/093661,所述文献中的每个文献出于所有目的通过引用整体并入本文。单向导RNA(sgRNA)内的tracrRNA的实例包含在+48、+54、+67和+85版本的sgRNA中发现的tracrRNA区段,其中“+n”表示在sgRNA中包含野生型tracrRNA的至多+n个核苷酸。参见US 8,697,359,所述文献出于所有目的通过引用整体并入本文。
向导RNA的DNA靶向区段与靶DNA的互补链之间的互补性百分比可以为至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%或100%)。DNA靶向区段与靶DNA的互补链之间的互补性百分比在约20个连续核苷酸上可以为至少60%。举例来说,DNA靶向区段与靶DNA的互补链之间的互补性百分比在靶DNA的互补链的5'末端处的14个连续核苷酸上可以为100%,并且在剩余部分上低至0%。在此类情况下,DNA靶向区段可以被视为长度为14个核苷酸。作为另一个实例,DNA靶向区段与靶DNA的互补链之间的互补性百分比在靶DNA的互补链的5'末端处的七个连续核苷酸上可以为100%,并且在剩余部分上低至0%。在此类情况下,DNA靶向区段可以被视为长度为7个核苷酸。在一些向导RNA中,DNA靶向区段内的至少17个核苷酸与靶DNA的互补链互补。例如,DNA靶向区段的长度可以为20个核苷酸,并且可以包括与靶DNA的互补链的1个、2个或3个错配。在一个实例中,错配不与对应于前间区序列邻近基序(PAM)序列的互补链的区域(即,PAM序列的反向补体)邻近(例如,错配位于向导RNA的DNA靶向区段的5'端,或者错配与对应于PAM序列的互补链的区域相距至少2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个或19个碱基对)。
gRNA的蛋白质结合区段可以包括彼此互补的两个核苷酸段。蛋白质结合区段的互补核苷酸杂交形成双链RNA双链体(dsRNA)。主题gRNA的蛋白质结合区段与Cas蛋白相互作用,并且gRNA通过DNA靶向区段将结合的Cas蛋白引导到靶DNA内的特异性核苷酸序列。
单向导RNA可以包括与支架序列(即,向导RNA的蛋白质结合序列或Cas结合序列)连接的DNA靶向区段。例如,此类向导RNA可以具有5'DNA靶向区段和3'支架序列。示例性支架序列包括以下、基本上由其组成或由其组成:GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU(版本1;SEQ ID NO:42);GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本2;SEQ ID NO:43);GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本3;SEQ ID NO:44);和GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(版本4;SEQ ID NO:45)。靶向任何向导RNA靶序列的向导RNA可以包含例如与向导RNA的3'末端上的示例性向导RNA支架序列中的任何序列融合的向导RNA的5'末端上的DNA靶向区段。也就是说,本文所公开的DNA靶向区段中的任何区段可以与SEQ ID NO:42-45中的任一项的5'端连接以形成单个向导RNA(嵌合向导RNA)。如本文其它地方所公开的向导RNA版本1、2、3和4是指分别与支架版本1、2、3和4连接的DNA靶向区段(即,向导序列或向导)。
向导RNA可以包含提供另外的期望特征的修饰或序列(例如,经修饰或经调控的稳定性;亚细胞靶向;用荧光标记追踪;蛋白质或蛋白质复合物的结合位点;等等)。此类修饰的实例包含例如5'帽(例如,7-甲基鸟苷酸帽(m7G));3'聚腺苷酸化尾部(即,3'poly(A)尾部);核糖开关序列(例如,以允许调控稳定性和/或调控蛋白质和/或蛋白质复合物的可及性);稳定性控制序列;形成dsRNA双链体(即,发夹)的序列;将RNA靶向亚细胞位置(例如,细胞核、线粒体、叶绿体等)的修饰或序列;提供用于追踪的修饰或序列(例如,与荧光分子直接缀合、与促进荧光检测的部分缀合、允许荧光检测的序列等);为蛋白质(例如,作用于DNA的蛋白质,包含DNA甲基转移酶、DNA去甲基化酶、组蛋白乙酰转移酶、组蛋白去乙酰化酶等)提供结合位点的修饰或序列;和其组合。修饰的其它实例包含工程化茎环双链体结构、工程化凸起区、茎环双链体结构的工程化发夹3'或其任何组合。参见例如US 2015/0376586,所述文献出于所有目的通过引用整体并入本文。凸起可以是由crRNA样区域和最小tracrRNA样区域构成的双链体内的核苷酸的未配对区域。凸起在双链体的一侧可以包括未配对的5'-XXXY-3',其中X是任何嘌呤,并且Y可以包括可以与相对链上的核苷酸形成摇摆对的核苷酸;并且在双链体的另一侧包括未配对核苷酸区。
未经修饰的核酸可能易于降解。外源性核酸也可以诱导先天免疫应答。修饰可以有助于引入稳定性并降低免疫原性。向导RNA可以包括经修饰的核苷和经修饰的核苷酸,包含例如以下中的一种或多种:(1)磷酸二酯骨架键中的非连接磷酸氧中的一个或两个和/或连接磷酸氧中的一个或多个的改变或替代;(2)核糖成分的改变或替代,如核糖上的2'羟基的改变或替代;(3)用脱磷连接子替代磷酸部分;(4)天然存在的核碱基的修饰或替代;(5)核糖磷酸骨架的替代或修饰;(6)寡核苷酸3'末端或5'末端的修饰(例如,末端磷酸基团的去除、修饰或替代或部分的缀合);以及(7)糖的修饰。其它可能的向导RNA修饰包含尿嘧啶或聚尿嘧啶束的修饰或替代。参见例如WO 2015/048577和US 2016/0237455,所述文献中的每个文献出于所有目的通过引用整体并入本文。可以对Cas编码核酸,如Cas mRNA进行相似的修饰。
举例来说,向导RNA的5'或3'末端处的核苷酸可以包含硫代磷酸酯键(例如,碱基可以具有经修饰的磷酸酯基,所述经修饰的磷酸酯基是硫代磷酸酯基)。例如,向导RNA可以包含向导RNA的5'或3'末端处的2、3或4个末端核苷酸之间的硫代磷酸酯键。作为另一个实例,向导RNA的5'和/或3'末端的核苷酸可以具有2'-O-甲基修饰。例如,向导RNA可以包含向导RNA的5'和/或3'末端(例如,5'末端)的2、3或4个端核苷酸处的2'-O-甲基修饰。参见例如WO 2017/173054 A1和Finn等人(2018),《细胞报告(Cell Reports)》22:1-9,所述文献中的每个文献出于所有目的通过引用整体并入本文。在一个具体实例中,向导RNA在前三个5'和3'端RNA残基处包括2'-O-甲基类似物和3'硫代磷酸酯核苷酸间键。在另一个具体实例中,向导RNA被修饰使得所有不与Cas9蛋白相互作用的2'OH基团被2'-O-甲基类似物置换,并且与Cas9的相互作用最小的向导RNA的尾部区用5'和3'硫代磷酸酯核苷酸间键修饰。参见例如,Yin等人(2017),《自然生物技术》35(12):1179-1187,所述文献出于所有目的通过引用整体并入本文。经修饰的向导RNA的其它实例在例如WO 2018/107028 A1中提供,所述文献出于所有目的通过引用整体并入本文。
可以以任何形式提供向导RNA。例如,gRNA可以以RNA的形式提供,作为两个分子(单独的crRNA和tracrRNA)或作为一个分子(sgRNA),并且任选地以与Cas蛋白的复合物的形式提供。gRNA也可以以对gRNA进行编码的DNA的形式提供。对gRNA进行编码的DNA可以编码单个RNA分子(sgRNA)或单独的RNA分子(例如,单独的crRNA和tracrRNA)。在后一种情况下,对gRNA进行编码的DNA可以作为一个DNA分子或作为分别对crRNA和tracrRNA进行编码的单独DNA分子提供。
当gRNA以DNA的形式提供时,gRNA可以在细胞中瞬时、有条件或组成型表达。对gRNA进行编码的DNA可以稳定地整合到细胞的基因组中,并且与在细胞中具有活性的启动子可操作地连接。可替代地,对gRNA进行编码的DNA可以与表达构建体中的启动子可操作地连接。例如,对gRNA进行编码的DNA可以处于包括异源核酸如对Cas蛋白进行编码的核酸的载体中。可替代地,对gRNA进行编码的DNA可以处于与包括对Cas蛋白进行编码的核酸的载体分开的载体或质粒中。可以用于此类表达构建体的启动子包含例如在真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能性细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导的多能干(iPS)细胞或单细胞期胚胎中的一种或多种中有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。此类启动子也可以是例如双向启动子。合适启动子的具体实例包含RNA聚合酶III启动子,如人U6启动子、大鼠U6聚合酶III启动子或小鼠U6聚合酶III启动子。
可替代地,可以通过各种其它方法制备gRNA。例如,可以使用例如T7 RNA聚合酶通过体外转录制备gRNA(参见例如,WO 2014/089290和WO 2014/065596,所述文献中的每个文献出于所有目的通过引用整体并入本文)。向导RNA也可以是通过化学合成制备的合成产生的分子。
向导RNA(或对向导RNA进行编码的核酸)可以在包括一个或多个向导RNA(例如,1个、2个、3个、4个或更多个向导RNA)和增加向导RNA稳定性(例如,延长在给定储存条件(例如,-20℃、4℃或环境温度)下降解产物保持在阈值以下的时间,如低于起始核酸或蛋白质重量的0.5%;或增加体内稳定性)的载体的组合物中。此类载体的非限制性实例包含聚(乳酸)(PLA)微球、聚(D,L-乳酸-共乙醇酸)(PLGA)微球、质脂体、胶束、反胶束、脂质螺旋体和脂质微管。此类组合物可以进一步包括Cas蛋白,如Cas9蛋白,或对Cas蛋白进行编码的核酸。
向导RNA靶序列:用于向导RNA的靶DNA包含存在于DNA中的核酸序列,gRNA的DNA靶向区段将与其结合,前提是存在足够的结合条件。合适的DNA/RNA结合条件包含细胞中通常存在的生理条件。其它合适的DNA/RNA结合条件(例如,无细胞系统中的条件)是本领域已知的(参见例如,《分子克隆:实验室手册》,第3版(Sambrook等人,海港实验室出版社(HarborLaboratory Press)2001),所述文献出于所有目的通过引用整体并入本文)。与gRNA互补并杂交的靶DNA的链可以被称为“互补链”,并且与“互补链”互补(并且因此不与Cas蛋白或gRNA互补)的靶DNA的链可以称为“非互补链”或“模板链”。
靶DNA包含向导RNA所杂交的互补链上的序列和非互补链上的对应序列(例如,邻近原型间隔子邻近基序(PAM))。如本文所使用的,术语“向导RNA靶序列”具体指非互补链上的与向导RNA在互补链上与其杂交的序列相对应(即,其反向补体)的序列。即,向导RNA靶序列是指非互补链上的与PAM相邻(例如,在Cas9的情况下,PAM的上游或5')的序列。向导RNA靶序列等同于向导RNA的DNA靶向区段,但具有胸腺嘧啶而不是尿嘧啶。举例来说,SpCas9酶的向导RNA靶序列可以指非互补链上的5'-NGG-3'PAM上游的序列。向导RNA被设计成与靶DNA的互补链互补,其中向导RNA的DNA靶向区段与靶DNA的互补链之间的杂交促进了CRISPR复合物的形成。不一定需要完全互补,条件是存在足够的互补性来引起杂交并促进CRISPR复合物的形成。如果向导RNA在本文中被称为靶向向导RNA靶序列,则意味着向导RNA与靶DNA的互补链序列杂交,所述互补链序列是非互补链上的向导RNA靶序列的反向补体。
靶DNA或向导RNA靶序列可以包括任何多核苷酸,并且可以定位于例如细胞的细胞核或细胞质中或者细胞的细胞器如线粒体或叶绿体内。靶DNA或向导RNA靶序列可以是细胞内源性或外源性的任何核酸序列。向导RNA靶序列可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调节序列)或者可以包含两者。在具体实例中,向导RNA靶序列可以位于人白蛋白基因的内含子1、内含子12或内含子13中。例如,向导RNA靶序列可以位于人白蛋白基因的内含子1中。
Cas蛋白对靶DNA的位点特异性结合和切割可以发生在由(i)向导RNA与靶DNA的互补链之间的碱基配对互补性和(ii)靶DNA的非互补链中的短基序(被称为原型间隔子相邻基序(PAM))两者测定的定位处。PAM可以侧接向导RNA靶序列。任选地,向导RNA靶序列可以在3'末端上侧接PAM(例如,对于Cas9)。可替代地,向导RNA靶序列可以在5'末端上侧接PAM(例如,对于Cpf1)。例如,Cas蛋白的切割位点可以在PAM序列上游或下游(例如,在向导RNA靶序列内)约1到约10或约2到约5个碱基对(例如,3个碱基对)。在SpCas9的情况下,PAM序列(即,非互补链上)可以是5'-N1GG-3',其中N1是任何DNA核苷酸,并且其中PAM紧接着靶DNA的非互补链上的向导RNA靶序列的3'。因此,对应于互补链上的PAM的序列(即,反向补体)将是5'-CCN2-3',其中N2是任何DNA核苷酸并且是紧接着向导RNA的DNA靶向区段在靶DNA的互补链上与其杂交的序列的5'。在一些此类情况下,N1和N2可以是互补的,并且N1-N2碱基对可以是任何碱基对(例如,N1=C并且N2=G;N1=G并且N2=C;N1=A并且N2=T;或N1=T并且N2=A)。在来自金黄色葡萄球菌的Cas9的情况下,PAM可以是NNGRRT或NNGRR,其中N可以A、G、C或T,并且R可以是G或A。在来自空肠弯曲杆菌的Cas9的情况下,PAM可以是例如NNNNACAC或NNNNRYAC,其中N可以是A、G、C或T,并且R可以是G或A。在一些情况下(例如,对于FnCpf1),PAM序列可以位于5'末端上游并且具有序列5'-TTN-3'。
向导RNA靶序列的实例是紧接在SpCas9蛋白识别的NGG基序之前的20个核苷酸的DNA序列。例如,向导RNA靶序列加PAM的两个实例是GN19NGG(SEQ ID NO:46)或N20NGG(SEQID NO:47)。参见例如,WO 2014/165825,所述文献出于所有目的通过引用整体并入本文。5'末端处的鸟嘌呤可以促进细胞中RNA聚合酶的转录。向导RNA靶序列加PAM的其它实例可以包含5'末端处的两个鸟嘌呤核苷酸(例如,GGN20NGG;SEQ ID NO:48)以促进体外T7聚合酶的高效转录。参见例如,WO 2014/065596,所述文献出于所有目的通过引用整体并入本文。其它向导RNA靶序列加PAM可以具有4-22个核苷酸长度的SEQ ID NO:46-48,包含5'G或GG和3'GG或NGG。又其它向导RNA靶序列PAM可以具有长度为14与20个核苷酸之间的SEQ ID NO:46-48。
与靶DNA杂交的CRISPR复合物的形成可以导致在对应于向导RNA靶序列(即,靶DNA的非互补链上的向导RNA靶序列和互补链上的向导RNA与其杂交的反向补体)的区域内或附近的靶DNA的一条或两条链的切割。例如,切割位点可以处于向导RNA靶序列内(例如,处于相对于PAM序列的所定义的定位处)。“切割位点”包含Cas蛋白产生单链断裂或双链断裂的靶DNA的位置。切割位点可以仅在双链DNA的一条链上(例如,当使用切口酶时)或在两条链上。切割位点可以在两条链上的相同位置处(产生平端;例如,Cas9))或可以在每条链上的不同位点处(产生交错末端(即,突出端);例如,Cpf1)。例如,可以通过使用两种Cas蛋白产生交错末端,其中每一种在不同链的不同切割位点处产生单链断裂,从而产生双链断裂。例如,第一切口酶可以在双链DNA(dsDNA)的第一条链上产生单链断裂,并且第二切口酶可以在dsDNA的第二条链上产生单链断裂,使得产生突出序列。在一些情况下,第一链上的切口酶的向导RNA靶序列或切割位点与第二链上的切口酶的向导RNA靶序列或切割位点相隔至少2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、40个、50个、75个、100个、250个、500个或1,000个碱基对。
(3)靶向人白蛋白基因的外源性供体核酸
本文所公开的方法和组合物可以利用外源性供体核酸来在用核酸酶药剂切割人源化白蛋白基因座后或独立于用核酸酶药剂切割人源化白蛋白基因座而修饰人源化白蛋白基因座。在使用核酸酶药剂的此类方法中,核酸酶药剂蛋白质切割人源化白蛋白基因座以产生单链断裂(切口)或双链断裂,并且外源性供体核酸通过非同源末端连接(NHEJ)介导的连接或通过同源定向修复事件重组人源化白蛋白基因座。任选地,用外源性供体核酸进行修复去除或破坏了核酸酶靶序列,使得已经靶向的等位基因不能被核酸酶药剂重新靶向。
外源性供体核酸可以靶向人白蛋白基因中的任何序列。一些外源性供体核酸包括同源臂。其它外源性供体核酸不包括同源臂。外源性供体核酸可以能够通过同源定向修复插入到人源化白蛋白基因座中,和/或外源性供体核酸可以能够通过非同源末端连接插入到人源化白蛋白基因座中。在一个实例中,外源性供体核酸(例如,靶向载体)可以靶向人白蛋白基因的内含子1、内含子12或内含子13。例如,外源性供体核酸可以靶向人白蛋白基因的内含子1。
外源性供体核酸可以包括脱氧核糖核酸(DNA)或核糖核酸(RNA),其可以是单链或双链的,并且其可以呈线性或环状形式。例如,外源性供体核酸可以是单链寡脱氧核苷酸(ssODN)。参见例如Yoshimi等人(2016)《自然通讯》7:10431,所述文献出于所有目的通过引用整体并入本文。外源性供体核酸可以是裸核酸或者可以通过如AAV等病毒递送。在具体实例中,外源性供体核酸可以通过AAV递送并且能够通过非同源末端连接插入到人源化白蛋白基因座中(例如,外源性供体核酸可以是不包括同源臂的核酸)。
示例性外源性供体核酸的长度在约50个核苷酸到约5kb之间、约50个核苷酸到约3kb之间或约50个到约1,000个核苷酸之间。其它示例性外源性供体核酸的长度在约40个到约200个核苷酸之间。例如,外源性供体核酸的长度可以在约50-60、60-70、70-80、80-90、90-100、100-110、110-120、120-130、130-140、140-150、150-160、160-170、170-180、180-190或190-200个核苷酸之间。可替代地,外源性供体核酸的长度可以在约50-100、100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900或900-1000个核苷酸之间。可替代地,外源性供体核酸的长度可以在约1-1.5、1.5-2、2-2.5、2.5-3、3-3.5、3.5-4、4-4.5或4.5-5kb之间。可替代地,外源性供体核酸的长度可以例如不超过5kb、4.5kb、4kb、3.5kb、3kb、2.5kb、2kb、1.5kb、1kb、900个核苷酸、800个核苷酸、700个核苷酸、600个核苷酸、500个核苷酸、400个核苷酸、300个核苷酸、200个核苷酸、100个核苷酸或50个核苷酸。外源性供体核酸(例如,靶向载体)也可以更长。
在一个实例中,外源性供体核酸是长度在约80个核苷酸与约200个核苷酸之间的ssODN。在另一个实例中,外源性供体核酸是长度在约80个核苷酸与约3kb之间的ssODN。此类ssODN可以具有例如各自长度在约40个核苷酸与约60个核苷酸之间的同源臂。此类ssODN还可以具有例如各自长度在约30个核苷酸与100个核苷酸之间的同源臂。同源臂可以是对称的(例如,长度为各自40个核苷酸或各自60个核苷酸),或者其可以是不对称的(例如,一个同源臂的长度为36个核苷酸,并且一个同源臂的长度为91个核苷酸)。
外源性供体核酸可以包含提供另外的期望特征的修饰或序列(例如,经修饰的或经调控的稳定性;用荧光标记跟踪或检测;蛋白质或蛋白质复合物的结合位点等)。外源性供体核酸可以包括一种或多种荧光标记、纯化标签、表位标签或其组合。例如,外源性供体核酸可以包括一个或多个荧光标记(例如,荧光蛋白或其它荧光团或染料),如至少1个、至少2个、至少3个、至少4个或至少5个荧光标记。示例性荧光标记包含荧光团,如荧光素(例如,6-羧基荧光素(6-FAM))、德克萨斯红(Texas Red)、HEX、Cy3、Cy5、Cy5.5、太平洋蓝、5-(和-6)-羧基四甲基罗丹明(TAMRA)和Cy7。多种荧光染料可商购获得,用于标记寡核苷酸(例如,来自整合DNA技术公司(Integrated DNA Technologies))。此类荧光标记(例如,内部荧光标记)可以用于例如检测已经直接整合到经切割的靶核酸中的外源性供体核酸,所述经切割的靶核酸具有与外源性供体核酸的端相容的突出端。标签或标记可以位于外源性供体核酸的5'末端、3'末端或内部。例如,外源性供体核酸可以在5'末端与来自整合DNA技术公司(5')的IR700荧光团缀合。
外源性供体核酸还可以包括核酸插入物,所述核酸插入物包含待整合在人源化白蛋白基因座处的DNA区段。核酸插入物在人源化白蛋白基因座处的整合可能会导致所关注核酸序列到人源化白蛋白基因座的添加,所关注核酸序列在人源化白蛋白基因座处的缺失或所关注核酸序列在人源化白蛋白基因座处的替代(即,缺失和插入)。一些外源性供体核酸被设计成在人源化白蛋白基因座处插入核酸插入物而在人源化白蛋白基因座处没有任何对应的缺失。其它外源性供体核酸被设计成在人源化白蛋白基因座处缺失所关注核酸序列而无需核酸插入物的任何对应的插入。又其它外源性供体核酸被设计成在人源化白蛋白基因座处缺失所关注核酸序列并用核酸插入物将其替代。
在人源化白蛋白基因座处被缺失和/或替代的核酸插入物或对应的核酸可以具有各种长度。在人源化白蛋白基因座处被缺失和/或替代的示例性核酸插入物或对应的核酸的长度在约1个核苷酸到约5kb之间或在约1个核苷酸到约1,000个核苷酸之间。例如,在人源化白蛋白基因座处被缺失和/或替代的核酸插入物或对应的核酸的长度在约1-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-110、110-120、120-130、130-140、140-150、150-160、160-170、170-180、180-190或190-120个核苷酸之间。同样地,在人源化白蛋白基因座处被缺失和/或替代的核酸插入物或对应的核酸的长度在1-100、100-200、200-300、300-400、400-500、500-600、600-700、700-800、800-900或900-1000个核苷酸之间。同样地,在人源化白蛋白基因座处被缺失和/或替代的核酸插入物或对应的核酸的长度在约1-1.5、1.5-2、2-2.5、2.5-3、3-3.5、3.5-4、4-4.5或4.5-5kb之间或更长。
核酸插入物可以包括与旨在用于替代的序列中的所有或部分序列同源或直系同源的序列。例如,核酸插入物可以包括与在人源化白蛋白基因座处旨在用于替代的序列相比包括一个或多个点突变(例如,1个、2个、3个、4个、5个或更多个)的序列。任选地,此类点突变可能导致经编码的多肽中的保守氨基酸取代(例如,用谷氨酸[Glu,E]取代天冬氨酸[Asp,D])。
一些外源性供体核酸可以编码不由野生型内源性白蛋白基因座编码或表达的外源性蛋白(例如,可以包括编码外源性蛋白的插入核酸)。在一个实例中,由外源性供体核酸靶向的人源化白蛋白基因座可以编码异源蛋白,所述异源蛋白包括与未由野生型内源性白蛋白基因座编码或表达的蛋白质融合的人白蛋白信号肽。例如,外源性供体核酸可以是包括剪接受体的无启动子盒,并且外源性供体核酸可以靶向人白蛋白的第一内含子。
用于非同源末端连接介导的插入的供体核酸:一些外源性供体核酸能够通过非同源末端连接插入到人源化白蛋白基因座中。在一些情况下,此类外源性供体核酸不包括同源臂。例如,此类外源性供体核酸可以在用核酸酶药剂切割后插入到平端双链断裂中。在具体实例中,外源性供体核酸可以通过AAV递送并且能够通过非同源末端连接插入到人源化白蛋白基因座中(例如,外源性供体核酸可以是不包括同源臂的核酸)。在具体实例中,外源性供体核酸可以通过同源非依赖性靶向整合插入。例如,待插入到人源化白蛋白基因座中的外源性供体核酸中的插入序列可以在每一侧上侧接有用于核酸酶药剂的靶位点(例如,与人源化白蛋白基因座中相同的靶位点,并且相同的核酸酶药剂用于切割人源化白蛋白基因座中的靶位点)。核酸酶药剂然后可以切割侧接插入序列的靶位点。在具体实例中,外源性供体核酸通过AAV介导的递送进行递送,并且侧接插入序列的靶位点的切割可以去除AAV的反向末端重复序列(ITR)。在一些方法中,如果插入序列以正确的取向插入到人源化白蛋白基因座中,则人源化白蛋白基因座中的靶位点(例如,包含侧接原型间隔子邻近基序的gRNA靶序列)不再存在,但如果插入序列以相反的取向插入到人源化白蛋白基因座中,则所述靶位点被重整。这可以帮助确保插入序列以正确的表达取向插入。
其它外源性供体核酸可以在5'末端和/或3'末端处具有与由核酸酶介导的切割在人源化白蛋白基因座处产生的一个或多个突出端互补的短单链区域。这些突出端也可以被称为5'和3'同源臂。例如,一些外源性供体核酸在5'末端和/或3'末端处具有与由核酸酶介导的切割在人源化白蛋白基因座的5'和/或3'靶序列处产生的一个或多个突出端互补的短单链区域。一些此类外源性供体核酸仅在5'末端或仅在3'末端处具有互补区。例如,一些此类外源性供体核酸仅在与人源化白蛋白基因座的5'靶序列处产生的突出端互补的5'末端处或者仅在与人源化白蛋白基因座的3'靶序列处产生的突出端互补的3'末端处具有互补区。其它此类外源性供体核酸在5'和3'末端两者处都有互补区域。例如,其它此类外源性供体核酸在5'和3'末端两者处都有由核酸酶介导的切割在人源化白蛋白基因座处产生的例如分别与第一突出端和第二突出端互补的互补区。例如,如果外源性供体核酸是双链的,则单链互补区可以从供体核酸的顶部链的5'末端和供体核酸的底部链的5'末端延伸,从而在每端产生5'突出端。可替代地,单链互补区可以从供体核酸的顶部链的3'末端和模板的底部链的3'末端延伸,从而产生3'突出端。
互补区可以具有足以促进外源性供体核酸与靶核酸之间的连接的任何长度。示例性互补区的长度在约1个到约5个核苷酸之间、在约1个到约25个核苷酸之间或在约5个到约150个核苷酸之间。例如,互补区的长度可以为至少约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个或25个核苷酸。可替代地,互补区的长度可以为约5-10、10-20、20-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-110、110-120、120-130、130-140或140-150个核苷酸或更长。
此类互补区可以与由两对切口酶产生的突出端互补。通过使用切割相反的DNA链以产生第一双链断裂的第一切口酶和第二切口酶以及切割相反的DNA链以产生第二双链断裂的第三切口酶和第四切口酶,可以产生具有交错端的两个双链断裂。例如,Cas蛋白可以用于切割与第一、第二、第三和第四向导RNA对应的第一、第二、第三和第四向导RNA靶序列。第一和第二向导RNA靶序列可以被定位成产生第一切割位点,使得第一和第二切口酶在第一和第二DNA链上产生的切口产生双链断裂(即,第一切割位点包括第一和第二向导RNA靶序列内的切口)。同样地,第三和第四向导RNA靶序列可以被定位成产生第二切割位点,使得第三和第四切口酶在第一和第二DNA链上产生的切口产生双链断裂(即,第二切割位点包括第三和第四向导RNA靶序列内的切口)。优选地,第一和第二向导RNA靶序列和/或第三和第四向导RNA靶序列内的切口可以是产生突出端的偏移切口。偏移窗口可以为例如至少约5bp、10bp、20bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp或更多。参见Ran等人(2013),《细胞》154:1380-1389;Mali等人(2013)《自然生物技术》31:833-838;以及Shen等人(2014),《自然方法(Nat.Methods)》11:399-404,所述文献中的每个文献出于所有目的通过引用整体并入本文。在这种情况下,双链外源性供体核酸可以被设计成具有单链互补区,所述单链互补区与由第一和第二向导RNA靶序列内的切口以及第三和第四向导RNA靶序列内的切口产生的突出端互补。然后此类外源性供体核酸可以通过非同源末端连接介导的连接插入。
用于通过同源定向修复插入的供体核酸:一些外源性供体核酸包括同源臂。如果外源性供体核酸还包括核酸插入物,则同源臂可以侧接核酸插入物。为了便于参考,同源臂在本文中被称为5'和3'(即,上游和下游)同源臂。此术语涉及同源臂与外源性供体核酸内的核酸插入物的相对位置。5'和3'同源臂对应于人源化白蛋白基因座内的区域,所述区域在本文中分别被称为“5'靶序列”和“3'靶序列”。
当同源臂和靶序列彼此共享足够水平的序列同一性时,则这两个区域彼此“对应(correspond或corresponding)”以充当同源重组反应的底物。术语“同源性”包含与对应序列相同或共享序列同一性的DNA序列。给定靶序列与外源性供体核酸中存在的对应同源臂之间的序列同一性可以是允许发生同源重组的任何程度的序列同一性。例如,外源性供体核酸(或其片段)的同源臂与靶序列(或其片段)所共享的序列同一性的量可以是至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,使得序列经历同源重组。此外,同源臂与对应的靶序列之间对应的同源区域可以具有足以促进同源重组的任何长度。示例性同源臂的长度在约25个核苷酸到约2.5kb之间、约25个核苷酸到约1.5kb之间或约25个到约500个核苷酸之间。例如,给定同源臂(或同源臂中的每个同源臂)和/或对应的靶序列可以包括长度在约25-30、30-40、40-50、50-60、60-70、70-80、80-90、90-100、100-150、150-200、200-250、250-300、300-350、350-400、400-450或450-500个核苷酸之间的对应同源区域,使得同源臂具有足以与靶核酸内对应的靶序列经历同源重组的同源性。可替代地,给定的同源臂(或同源臂中的每个同源臂)和/或对应的靶序列包括的对应的同源区的长度可以介于约0.5kb到约1kb之间、约1kb到约1.5kb之间、约1.5kb到约2kb之间或约2kb到约2.5kb之间。例如,同源臂各自的长度可以为约750个核苷酸。同源臂可以是对称的(每个长度的大小大约相同),或者可以是不对称的(一个比另一个长)。
当核酸酶药剂与外源性供体核酸组合使用时,5'和3'靶序列优选地定位在足够接近核酸酶切割位点的位置(例如,在足够接近核酸酶靶序列的位置内),以在核酸酶切割位点处的单链断裂(切口)或双链断裂后促进靶序列与同源臂之间同源重组事件的发生。术语“核酸酶切割位点”包含由核酸酶药剂(例如,与向导RNA复合的Cas9蛋白)在其中产生切口或双链断裂的DNA序列。靶基因座内对应于外源性供体核酸的5'和3'同源臂的靶序列“定位在足够接近”核酸酶切割位点的位置,如果这样的距离是为了在核酸酶切割位点处的单链断裂或双链断裂后促进5'和3'靶序列与同源臂之间同源重组事件的发生。因此,对应于外源性供体核酸的5'和/或3'同源臂的靶序列可以例如在给定核酸酶切割位点的至少1个核苷酸内,或在给定核酸酶切割位点的至少10个核苷酸到约1,000个核苷酸内。举例来说,核酸酶切割位点可以紧邻靶序列的至少一个或两个靶序列。
对应于外源性供体核酸的同源臂和核酸酶切割位点的靶序列的空间关系可以变化。例如,靶序列可以定位到核酸酶切割位点的5',靶序列可以定位到核酸酶切割位点的3',或者靶序列可以侧接核酸酶切割位点。
(4)其它人白蛋白靶向试剂
还可以使用本文所公开的非人动物对任何其它已知或假定的人白蛋白靶向试剂的活性进行评估。相似地,可以使用本文所公开的非人动物针对人白蛋白靶向活性筛选任何其它分子。
其它人白蛋白靶向试剂的实例包含通过RNA干扰(RNAi)起作用的反义寡核苷酸(例如,siRNA或shRNA)。反义寡核苷酸(ASO)或反义RNA是短的合成核苷酸段,所述核苷酸段被设计成通过与编码靶向蛋白的RNA选择性地结合来阻止靶向蛋白的表达并且由此阻止翻译。这些化合物通过充分表征的沃森-克里克碱基配对(杂交)以高亲和力和选择性与RNA结合。RNA干扰(RNAi)是一种用于控制基因表达的内源性细胞机制,其中与RNA诱导的沉默复合物(RISC)结合的小干扰RNA(siRNA)介导靶信使RNA(mRNA)的切割。
其它人白蛋白靶向试剂包含被设计成特异性地结合人白蛋白表位的抗体或抗原结合蛋白。其它人白蛋白靶向试剂包含小分子试剂。
D.向非人动物或细胞施用人白蛋白靶向试剂
本文所公开的方法可以包括向非人动物或细胞中引入各种分子(例如,人白蛋白靶向试剂,如治疗分子或复合物),包含例如核酸、蛋白质、核酸-蛋白质复合物或蛋白质复合物。“引入”包含以进入细胞内部或非人动物内的细胞内部的方式向细胞或非人动物呈递分子(例如,核酸或蛋白质)。引入可以通过任何方式完成,并且可以以任何组合同时或顺序地将组分中的两种或更多种组分(例如,组分中的两种组分或组分中的全部组分)引入到细胞或非人动物中。例如,可以在引入向导RNA之前将Cas蛋白引入到细胞或非人动物中,或者可以在引入向导RNA之后将其引入。作为另一个实例,可以在引入Cas蛋白和向导RNA前引入外源性供体核酸,或者可以在引入Cas蛋白和向导RNA后引入外源性供体核酸(例如,外源性供体核酸可以在引入Cas蛋白和向导RNA之前或之后约1小时、2小时、3小时、4小时、8小时、12小时、24小时、36小时、48小时或72小时施用)。参见例如US 2015/0240263和US 2015/0110762,所述文献中的每个文献出于所有目的通过引用整体并入本文。另外,可以通过相同的递送方法或不同的递送方法将组分中的两种或更多种组分引入到细胞或非人动物中。相似地,可以通过相同的施用途径或不同的施用途径将组分中的两种或更多种组分引入到非人动物中。
在一些方法中,CRISPR/Cas系统的组分被引入到非人动物或细胞中。可以将向导RNA以RNA的形式(例如,体外转录的RNA)或对向导RNA进行编码的DNA的形式引入到非人动物或细胞中。当以DNA的形式引入时,对向导RNA进行编码的DNA可以与在非人动物的细胞中具有活性的启动子可操作地连接。例如,向导RNA可以通过AAV递送,并在U6启动子下在体内表达。此类DNA可以在一种或多种表达构建体中。例如,此类表达构建体可以是单个核酸分子的组分。可替代地,其可以在两个或多个核酸分子之间以任何组合分离(即,对一种或多种CRISPR RNA进行编码的DNA和对一种或多种tracrRNA进行编码的DNA可以是单独的核酸分子的组分)。
同样地,Cas蛋白可以以任何形式提供。例如,Cas蛋白可以以蛋白质的形式提供,如与gRNA复合的Cas蛋白。可替代地,可以以对Cas蛋白进行编码的核酸形式提供Cas蛋白,如RNA(例如,信使RNA(mRNA))或DNA。任选地,可以对编码Cas蛋白的核酸进行密码子优化以在特定细胞或生物体中有效翻译成蛋白质。例如,可以修饰对Cas蛋白进行编码的核酸以取代与天然存在的多核苷酸序列相比在哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞或任何其它所关注宿主细胞中具有更高使用频率的密码子。当对Cas蛋白进行编码的核酸被引入到非人动物中时,Cas蛋白可以在非人动物的细胞中瞬时地、有条件地或组成性地表达。
对Cas蛋白或向导RNA进行编码的核酸可以与表达构建体中的启动子可操作地连接。表达构建体包含能够引导基因或其它所关注核酸序列(例如,Cas基因)的表达并且可以将此类所关注核酸序列转移到靶细胞的任何核酸构建体。例如,对Cas蛋白进行编码的核酸可以在包括编码一种或多种gRNA的DNA的载体中。可替代地,其可以在与包括对一种或多种gRNA进行编码的DNA的载体分离的载体或质粒中。可以用于表达构建体的合适的启动子包含例如在真核细胞、人细胞、非人细胞、哺乳动物细胞、非人哺乳动物细胞、啮齿动物细胞、小鼠细胞、大鼠细胞、仓鼠细胞、兔细胞、多能性细胞、胚胎干(ES)细胞、成体干细胞、发育受限的祖细胞、诱导多能干(iPS)细胞或单细胞期胚胎中的一个或多个中具有活性的启动子。此类启动子可以是例如条件启动子、诱导型启动子、组成型启动子或组织特异性启动子。任选地,启动子可以是在一个方向上驱动Cas蛋白的表达并且在另一个方向上驱动向导RNA的表达的双向启动子。此类双向启动子可以由以下组成:(1)含有3个外部控制元件:远侧序列元件(DSE)、近侧端序列元件(PSE)和TATA框的完整的、常规的、单向的Pol III启动子;(2)包含在相反取向上与DSE的5'端融合PSE和TATA盒的第二基本Pol III启动子。例如,在H1启动子中,DSE邻近PSE和TATA框,并且可以通过产生杂合启动子使启动子双向化,其中通过源自U6启动子的附加PSE和TATA盒来控制反向转录。参见例如US 2016/0074535,所述文献出于所有目的通过引用整体并入本文。使用双向启动子同时表达对Cas蛋白和向导RNA进行编码的基因允许生成紧凑表达盒以促进递送。
引入到非人动物或细胞中的分子(例如,Cas蛋白或向导RNA)可以在包括增加所引入分子的稳定性(例如,延长在给定储存条件(例如,-20℃、4℃或环境温度)下降解产物保持在阈值以下的时间,如低于起始核酸或蛋白质重量的0.5%;或增加体内稳定性)的载体的组合物中。此类载体的非限制性实例包含聚乳酸(PLA)微球体、聚(D,L-乳酸-乙醇酸共聚物)(PLGA)微球体、脂质体、胶束、反胶束、脂质螺旋体和脂质微管。
本文提供了允许将分子(例如,核酸或蛋白质)引入到细胞或非人动物中的多种方法和组合物。用于将分子引入到各种细胞类型中的方法是已知的,并且包含例如稳定转染方法、瞬时转染方法和病毒介导的方法。
转染方案以及用于将分子引入到细胞中的方案可能会有所不同。非限制性转染方法包含使用以下的基于化学的转染方法:脂质体;纳米颗粒;磷酸钙(Graham等人(1973),《病毒学(Virology)》52(2):456–67;Bacchetti等人(1977),《美国国家科学院院刊》74(4):1590-4;以及Kriegler,M(1991),《转移和表达:实验室手册(Transfer and Expression:ALaboratory Manual.)》纽约:W.H.弗里曼出版社(W.H.Freeman and Company),第96-97页);树枝状聚合物;或阳离子聚合物,如DEAE葡聚糖或聚乙烯亚胺。非化学方法包含电穿孔、声穿孔和光转染。基于颗粒的转染包含使用基因枪或磁体辅助的转染(Bertram(2006)《当今药物生物技术(Current Pharmaceutical Biotechnology)》7,277-28)。病毒方法也可以用于转染。
也可以通过电穿孔、胞质内注射、病毒感染、腺病毒、腺相关病毒、慢病毒、逆转录病毒、转染、脂质介导的转染或核转染来介导将分子(例如,核酸或蛋白质)引入到细胞中。核转染是使核酸底物不仅能够被递送到细胞质,而且能够通过核膜进入到细胞核中的改善的电穿孔技术。另外,在本文公开的方法中使用核转染通常需要比常规电穿孔少得多的细胞(例如,与常规电穿孔的700万相比,仅约200万)。在一个实例中,使用NUCLEOFECTORTM系统进行核转染。
将分子(例如,核酸或蛋白质)引入到细胞(例如,受精卵)中还可以通过显微注射来完成。在受精卵(即,单细胞期胚胎)中,显微注射可以注入到母本和/或父本原核或细胞质中。如果显微注射仅注入到一个原核,则优选父本原核,因为其尺寸较大。优选将mRNA显微注射到细胞质中(例如,将mRNA直接递送到翻译机器),而优选将Cas蛋白或对Cas蛋白或RNA进行编码的多核苷酸显微注射到细胞核/原核中。可替代地,可以通过注射到细胞核/前核和细胞质两者中来进行显微注射:可以首先将针引入到细胞核/前核中并且注射第一量,并且在将针从单细胞期胚胎中去除时,可以将第二量注射到细胞质中。如果Cas蛋白被注射到细胞质中,则Cas蛋白优选地包括用于确保递送到细胞核/原核的核定位信号。用于进行显微注射的方法是众所周知的。参见例如,Nagy等人(Nagy A、Gertsenstein M、VinterstenK、Behringer R.,2003,《操纵小鼠胚胎(Manipulating the Mouse Embryo)》.纽约冷泉港:冷泉港实验室出版社);还参见Meyer等人(2010),《美国国家科学院院刊》107:15022-15026和Meyer等人(2012),《美国国家科学院院刊》109:9354-9359。
用于将分子(核酸或蛋白质)引入到细胞或非人动物中的其它方法可以包含例如载体递送、颗粒介导的递送、外泌体介导的递送、脂质纳米颗粒介导的递送、细胞穿透性肽介导的递送或可植入装置介导的递送。作为具体实例,可以将核酸或蛋白质以如聚(乳酸)(PLA)微球体、聚(D,L-乳酸-乙醇酸共聚物)(PLGA)微球体、脂质体、胶束、反胶束、脂质螺旋体或脂质微管等载体引入到细胞或非人动物中。向非人动物递送的一些具体实例包含流体动力学递送、病毒介导的递送(例如,腺相关病毒(AAV)介导的递送)和脂质纳米颗粒介导的递送。
将核酸和蛋白质引入到细胞或非人动物中可以通过流体动力递送(HDD)来完成。对于到实质细胞的基因递送,只需要通过选定的血管注射必需的DNA序列,从而消除与当前病毒和合成载体相关的安全问题。当注入到血流中时,DNA能够到达血液可及的不同组织中的细胞。流体动力递送采用将大量溶液快速注射到循环中不可压缩的血液中所产生的力来解决阻止大的和不可透过膜的化合物进入实质细胞的内皮和细胞膜的物理屏障问题。除了递送DNA外,此方法还可用于RNA、蛋白质和其它小化合物在体内的高效细胞内递送。参见例如,Bonamassa等人(2011),《药学研究(Pharm.Res.)》28(4):694-701,所述文献出于所有目的通过引用整体并入本文。
核酸的引入也可以通过病毒介导的递送来完成,如AAV介导的递送或慢病毒介导的递送。其它示例性病毒/病毒性载体包含逆转录病毒、腺病毒、牛痘病毒、痘病毒和单纯疱疹病毒。病毒可以感染分裂细胞、非分裂细胞或分裂细胞和非分裂细胞两者。病毒可以整合到宿主基因组中,或者可替代地不整合到宿主基因组中。此类病毒还可以被工程化为具有降低的免疫力。病毒可能具有复制能力,也可能具有复制缺陷(例如,在另外轮次的病毒粒子复制和/或包装所必需的一个或多个基因中存在缺陷)。病毒可以引起瞬时表达、长期表达(例如,至少1周、2周、1个月、2个月或3个月)或永久表达(例如,Cas9和/或gRNA)。示例性病毒滴度(例如,AAV滴度)包含1012、1013、1014、1015和1016个载体基因组/毫升。
ssDNA AAV基因组由两个开放阅读框Rep和Cap组成,其侧接有允许合成互补DNA链的两个反向末端重复序列。当构建AAV转移质粒时,转基因放置在两个ITR之间,并且Rep和Cap可以反式提供。除了Rep和Cap之外,AAV还可能需要含有腺病毒基因的辅助质粒。这些基因(E4、E2a和VA)介导AAV复制。例如,转移质粒、Rep/Cap和辅助质粒可以转染到含有腺病毒基因E1+的HEK293细胞中,以产生感染性AAV颗粒。可替代地,将Rep、Cap和腺病毒辅助基因可以组合成单个质粒。相似的包装细胞和方法可以用于其它病毒,如逆转录病毒。
已经鉴定了AAV的多种血清型。这些血清型在其感染的细胞类型(即,其趋向性)方面不同,允许优先转导特定细胞类型。CNS组织的血清型包含AAV1、AAV2、AAV4、AAV5、AAV8和AAV9。心脏组织的血清型包含AAV1、AAV8和AAV9。肾组织的血清型包含AAV2。肺组织的血清型包含AAV4、AAV5、AAV6和AAV9。胰腺组织的血清型包含AAV8。感光细胞的血清型包含AAV2、AAV5和AAV8。视网膜色素上皮组织的血清型包含AAV1、AAV2、AAV4、AAV5和AAV8。骨骼肌组织的血清型包含AAV1、AAV6、AAV7、AAV8和AAV9。肝组织的血清型包含AAV7、AAV8和AAV9,并且特别是AAV8。
趋向性可以通过假型进一步细化,所述假型即混合来自不同病毒血清型的衣壳和基因组。例如,AAV2/5指示包装在来自血清型5的衣壳中的含有血清型2基因组的病毒。使用假型病毒可以提高转导效率以及改变趋向性。源自不同血清型的杂交衣壳也可以用于改变病毒趋向性。例如,AAV-DJ含有来自八种血清型的杂交衣壳,并在广泛的体内细胞类型中表现出高感染性。AAV-DJ8是显示AAV-DJ性质的另一个实例,但具有增强的脑摄取。AAV血清型还可以通过突变进行修饰。AAV2突变修饰的实例包含Y444F、Y500F、Y730F和S662V。AAV3突变修饰的实例包含Y705F、Y731F和T492V。AAV6突变修饰的实例包含S663V和T492V。其它假型的/经修饰的AAV变体包含AAV2/1、AAV2/6、AAV2/7、AAV2/8、AAV2/9、AAV2.5、AAV8.2和AAV/SASTG。
为了加速转基因表达,可以使用自身互补型AAV(scAAV)变体。由于AAV依赖于细胞的DNA复制机制来合成AAV单链DNA基因组的互补链,因此转基因表达可能会延迟。为了解决这种延迟问题,可以使用含有能够在感染后自发退火的互补序列的scAAV,从而消除对宿主细胞DNA合成的需要。然而,也可以使用单链AAV(ssAAV)载体。
为了提高包装能力,可以将较长的转基因在两个AAV转移质粒之间拆分,第一个具有3'剪接供体并且第二个具有5'剪接受体。在细胞共感染后,这些病毒形成多联体,拼接在一起,并且全长转基因可以被表达。虽然这允许更长的转基因表达,但表达效率较低。用于增加容量的相似方法利用同源重组。例如,转基因可以在两个转移质粒之间分开但是具大量的序列重叠,使得共表达诱导全长转基因的同源重组和表达。
核酸和蛋白质的引入也可以通过脂质纳米颗粒(LNP)介导的递送来完成。例如,LNP介导的递送可以用于递送Cas mRNA和向导RNA的组合或Cas蛋白和向导RNA的组合。通过此类方法递送导致瞬时Cas表达,并且可生物降解脂质提高清除率、提高耐受性并降低免疫原性。脂质调配物可以保护生物分子免于降解,同时改善其细胞摄取。脂质纳米颗粒是包括通过分子间力彼此物理相关的多个脂质分子的颗粒。这些颗粒包含微球体(包含单层和多层囊泡,例如,脂质体)、乳液中的分散相、胶束或悬浮液中的内相。此类脂质纳米颗粒可以用于封装一个或多个核酸或蛋白质以供递送。含有阳离子脂质的调配物可用于递送如核酸等聚阴离子。其它可以包含在内的脂质是中性脂质(即,不带电荷或两性离子脂质)、阴离子脂质、增强转染的辅助脂质和增加纳米颗粒可以在体内存在的时间长度的隐形脂质。合适的阳离子脂质、中性脂质、阴离子脂质、辅助脂质和隐形脂质的实例可以在WO 2016/010840A1中找到,所述文献出于所有目的通过引用整体并入本文。示例性脂质纳米颗粒可以包括阳离子脂质和一种或多种其它组分。在一个实例中,其它组分可以包括如胆固醇等辅助脂质。在另一个实例中,其它组分可以包括如胆固醇等辅助脂质和如DSPC等中性脂质。在另一个实例中,其它组分可以包括如胆固醇等辅助脂质、如DSPC等任选的中性脂质以及如S010、S024、S027、S031或S033等隐形脂质。
LNP可以含有以下中的一种或多种或全部:(i)用于封装和用于内体逃逸的脂质;(ii)用于稳定的中性脂质;(iii)用于稳定的辅助脂质;(iv)隐形脂质。参见例如,Finn等人(2018),《细胞报告》22:1-9和WO 2017/173054 A1,所述文献中的每个文献出于所有目的通过引用整体并入本文。在某些LNP中,负荷物可以包含向导RNA或对向导RNA进行编码的核酸。在某些LNP中,负荷物可以包含对如Cas9等Cas核酸酶进行编码的mRNA以及向导RNA或对向导RNA进行编码的核酸。
用于包封和内体逃逸的脂质可以是阳离子脂质。脂质还可以是可生物降解脂质,如可生物降解可电离脂质。合适的脂质的一个实例是脂质A或LP01,即(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八-9,12-二烯酸酯,也被称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八-9,12-二烯酸酯。参见例如,Finn等人(2018),《细胞报告》22:1-9和WO 2017/173054 A1,所述文献中的每个文献出于所有目的通过引用整体并入本文。合适的脂质的另一个实例是脂质B,即((5-((二甲氨基)甲基)-1,3-亚苯基)双(氧))双(辛烷-8,1-二基)双(癸酸酯),也被称为((5-((二甲氨基)甲基)-1,3-亚苯基)双(氧基))双(辛烷-8,1-二基)双(癸酸酯)。合适的脂质的另一个实例是脂质C,即2-((4-(((3-(二甲氨基)丙氧基)羰基)氧基)十六酰基)氧基)丙烷-1,3-二基(9Z,9'Z,12Z,12'Z)-双(十八-9,12-二烯酸酯)。合适的脂质的另一个实例是脂质D,即3-(((3-(二甲氨基)丙氧基)羰基)氧基)-13-(辛酰氧基)十三烷基3-辛基十一烷酸酯。其它合适的脂质包含三十七-6,9,28,31-四烯-19-基4-(二甲氨基)丁酸酯(也被称为Dlin-MC3-DMA(MC3))。
适用于本文所述的LNP的一些此类脂质在体内是可生物降解的。例如,包括此类脂质的LNP包含在8小时、10小时、12小时、24小时或48小时或3天、4天、5天、6天、7天或10天内从血浆中清除脂质的至少75%的那些。作为另一个实例,LNP的至少50%在8小时、10小时、12小时、24小时或48小时或3天、4天、5天、6天、7天或10天内从血浆中清除。
根据其所在的介质的pH,此类脂质可以是可电离的。例如,在微酸性介质中,脂质可以被质子化并且因此带正电荷。相反,在弱碱性介质中,例如在pH大约为7.35的血液中,脂质可能不会被质子化并且因此不带电荷。在一些实施例中,脂质可以在至少约9、9.5或10的pH下质子化。这种脂质带电荷的能力与其固有pKa有关。例如,脂质的pKa可以独立地处于约5.8到约6.2的范围内。
中性脂质起到稳定和改善LNP的加工的作用。合适的中性脂质的实例包含各种中性、不带电荷或两性离子脂质。适用于本公开的中性磷脂的实例包含但不限于5-十七烷基苯-1,3-二醇(间苯二酚)、二棕榈酰磷脂酰胆碱(DPPC)、二硬脂酰磷脂酰胆碱(DSPC)、磷酸胆碱(DOPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、磷脂酰胆碱(PLPC)、1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(DAPC)、磷脂酰乙醇胺(PE)、卵磷脂酰胆碱(EPC)、二月桂酰磷脂酰胆碱(DLPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、1-肉豆蔻酰-2-棕榈酰磷脂酰胆碱(MPPC)、1-棕榈酰-2-肉豆蔻酰磷脂酰胆碱(PMPC)、1-棕榈酰-2-硬脂酰磷脂酰胆碱(PSPC)、1,2-二花生酰-sn-甘油-3-磷酸胆碱(DBPC)、1-硬脂酰-2-棕榈酰磷脂酰胆碱(SPPC)、1,2-二二十碳烯酰-sn-甘油-3-磷酸胆碱(DEPC)、棕榈酰油酰磷脂酰胆碱(POPC)、溶血磷脂酰胆碱、二油酰磷脂酰乙醇胺(DOPE)、二亚油酰磷脂酰胆碱二硬脂酰磷脂酰乙醇胺(DSPE)、二肉豆蔻酰磷脂酰乙醇胺(DMPE)、二棕榈酰磷脂酰乙醇胺(DPPE)、棕榈酰油酰磷脂酰乙醇胺(POPE)、溶血磷脂酰乙醇胺和其组合。例如,中性磷脂可以选自由二硬脂酰磷脂酰胆碱(DSPC)和二肉豆蔻酰磷脂酰乙醇胺(DMPE)组成的组。
辅助脂质包含增强转染的脂质。辅助脂质增强转染的机制可以包含增强颗粒稳定性。在某些情况下,辅助脂质可以增强膜融合性。辅助脂质包含类固醇、甾醇和烷基间苯二酚。合适的辅助脂质的实例包含胆固醇、5-十七烷基间苯二酚和胆固醇半琥珀酸酯。在一个实例中,辅助脂质可以是胆固醇或胆固醇半琥珀酸酯。
隐形脂质包含改变纳米颗粒在体内可以存在的时间长度的脂质。隐形脂质可以通过例如减少颗粒聚集和控制粒度来帮助调配过程。隐形脂质可以调节LNP的药代动力学性质。合适的隐形脂质包含具有连接到脂质部分的亲水性头部基团的脂质。
隐形脂质的亲水性头部基团可以包括例如选自基于PEG(有时称为聚(环氧乙烷))、聚(噁唑啉)、聚(乙烯醇)、聚(甘油)、聚(N-乙烯吡咯烷酮)、聚氨基酸和聚N-(2-羟丙基)甲基丙烯酰胺的聚合物的聚合物部分。术语PEG意指任何聚乙二醇或其它聚亚烷基醚聚合物。在某些LNP调配物中,PEG是PEG-2K,也被称为PEG 2000,其平均分子量为约2,000道尔顿。参见例如WO 2017/173054 A1,所述文献出于所有目的通过引用整体并入本文。
隐形脂质的脂质部分可以衍生自例如二酰基甘油或二烷基甘酰胺,其包含包括二烷基甘油或二烷基甘酰胺基团的那些,所述二烷基甘油或二烷基甘酰胺基团具有独立地包括约C4到约C40个饱和或不饱和碳原子的烷基链长度,其中链可以包括一个或多个官能团,例如酰胺或酯。二酰基甘油或二烷基甘酰胺基团可以进一步包括一个或多个经取代的烷基。
举例来说,隐形脂质可以选自PEG-二月桂酸甘油酯、PEG-二肉豆蔻酰甘油(PEG-DMG)、PEG-二棕榈酰甘油、PEG-二硬脂酰甘油(PEG-DSPE)、PEG-二月桂甘酰胺、PEG-二肉豆蔻甘酰胺、PEG-二棕榈酰甘酰胺和PEG-二硬脂酰甘酰胺、PEG-胆固醇(l-[8'-(胆甾-5-en-3[β]-氧基)甲酰胺基-3',6'-二氧杂辛基]氨甲酰基-[ω]-甲基-聚(乙二醇)、PEG-DMB(3,4-二十四烷基苄基-[ω]-甲基-聚(乙二醇)醚)、1,2-二肉豆蔻酰-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG)、1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE)、1,2-二硬脂酰-sn-甘油、甲氧基聚乙烯乙二醇(PEG2k-DSG)、聚(乙二醇)-2000-二甲基丙烯酸酯(PEG2k-DMA)和1,2-二硬脂氧基丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一个特定实例中,隐形脂质可以是PEG2k-DMG。
LNP可以包括调配物中组分脂质的不同的相应摩尔比。CCD脂质的mol-%可以为例如约30mol-%到约60mol-%、约35mol-%到约55mol-%、约40mol-%到约50mol-%、约42mol-%到约47mol-%或约45%。辅助脂质的mol-%可以为例如约30mol-%到约60mol-%、约35mol-%到约55mol-%、约40mol-%到约50mol-%、约41mol-%到约46mol-%或约44mol-%。中性脂质的mol-%可以为例如约1mol-%到约20mol-%、约5mol-%到约15mol-%、约7mol-%到约12mol-%或约9mol-%。隐形脂质的mol-%可以为例如约1mol-%到约10mol-%、约1mol-%到约5mol-%、约1mol-%到约3mol-%、约2mol-%或约1mol-%。
LNP在可生物降解脂质(N)的带正电荷的胺基团与待封装的核酸的带负电荷的磷酸基团(P)之间可以具有不同的比率。这可以由等式N/P在数学上表示。例如,N/P比率可以为约0.5到约100、约1到约50、约1到约25、约1到约10、约1到约7、约3到约5、约4到约5、约4、约4.5或约5。N/P比率也可以是约4到约7或约4.5到约6。在具体实例中,N/P比率可以为4.5或者可以为6。
在一些LNP中,货物可以包括Cas mRNA和gRNA。Cas mRNA和gRNA的比率可以不同。例如,LNP调配物的Cas mRNA与gRNA核酸的比率的范围可以为约25:1到约1:25、约10:1到约1:10、约5:1到约1:5或为约1:1。可替代地,LNP调配物的Cas mRNA与gRNA核酸的比率可以为约1:1到约1:5或约10:1。可替代地,LNP调配物的Cas mRNA与gRNA核酸的比率可以为约1:10、25:1、10:1、5:1、3:1、1:1、1:3、1:5、1:10或1:25。可替代地,LNP调配物可以包含约1:1到约1:2的Cas mRNA与gRNA核酸的比率。在具体实例中,Cas mRNA与gRNA的比率可以为约1:1或约1:2。
在一些LNP中,货物可以包括外源性供体核酸和gRNA。外源性供体核酸和gRNA的比率可以不同。例如,LNP调配物的外源性供体核酸与gRNA核酸的比率的范围可以为约25:1到约1:25、约10:1到约1:10、约5:1到约1:5或为约1:1。可替代地,LNP调配物的外源性供体核酸与gRNA核酸的比率可以为约1:1到约1:5、约5:1到约1:1、约10:1或为约1:10。可替代地,LNP调配物的外源性供体核酸与gRNA核酸的比率可以为约1:10、25:1、10:1、5:1、3:1、1:1、1:3、1:5、1:10或1:25。
合适的LNP的具体实例的氮磷(N/P)比率为4.5,并且含有摩尔比为45:44:9:2的可生物降解阳离子脂质、胆固醇、DSPC和PEG2k-DMG。生物可降解阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八-9,12-二烯酸酯,也被称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八-9,12-二烯酸酯。参见例如,Finn等人(2018),《细胞报告》22:1-9,所述文献出于所有目的通过引用整体并入本文。Cas9 mRNA与向导RNA的重量比可以为1:1。合适的LNP的另一个具体实例含有摩尔比为50:38.5:10:1.5的Dlin-MC3-DMA(MC3)、胆固醇、DSPC和PEG-DMG。
合适的LNP的另一个具体实例的氮磷(N/P)比为6,并且含有摩尔比为50:38:9:3的生物可降解阳离子脂质、胆固醇、DSPC和PEG2k-DMG。生物可降解阳离子脂质可以是(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基十八-9,12-二烯酸酯,也被称为3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙氨基)丙氧基)羰基)氧基)甲基)丙基(9Z,12Z)-十八-9,12-二烯酸酯。Cas9 mRNA与向导RNA的重量比可以为1:2。
可以选择降低免疫原性的递送方式。例如,Cas蛋白和gRNA可以通过不同的模式(例如,双模式递送)进行递送。这些不同的模式可以赋予受试者递送的分子(例如,Cas或核酸编码、gRNA或核酸编码或外源性供体核酸/修复模板)不同的药效学或药代动力学性质。例如,不同的模式会导致不同的组织分布、不同的半衰期或不同的时间分布。一些递送模式(例如,通过自主复制或基因组整合来递送在细胞中持续存在的核酸载体)导致分子的表达和存在更持久,而其它递送模式是瞬时的且不太持久(例如,RNA或蛋白质的递送)。以更瞬时的方式递送Cas蛋白例如作为mRNA或蛋白质可以确保Cas/gRNA复合物仅在短时间段内存在和具有活性,并且可以降低由MHC分子在细胞表面上展示的来自细菌来源的Cas酶的肽引起的免疫原性。此类瞬时递送还可以减少脱靶修饰的可能性。
体内施用可以通过任何合适的途径,包含例如肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌肉内施用。全身施用方式包含例如口服和肠胃外途径。肠胃外途径的实例包含静脉内、动脉内、骨内、肌肉内、皮内、皮下、鼻内和腹膜内途径。具体的实例是静脉输液。鼻滴注和玻璃体内注射是其它具体实例。局部施用方式包含例如鞘内、脑室内、脑实质内(例如,局部脑实质内递送到纹状体(例如,进入尾状核或进入壳核种)、大脑皮层、中央前回、海马体(例如,进入齿状回或CA3区域)、颞叶皮层、杏仁核、额叶皮层、丘脑、小脑、髓质、下丘脑、顶盖、被盖或黑质)、眼内、眶内、结膜下、玻璃体内、视网膜下和经巩膜途径。与全身施用(例如,静脉内)相比,当局部施用(例如,脑实质内或玻璃体内)时,显著更少量的组分(与全身方法相比)可以发挥作用。局部施用方式还可以降低或消除当全身施用治疗有效量的组分时可能发生的潜在毒副作用的发生率。
体内施用可以通过任何合适的途径,包含例如肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌肉内施用。具体的实例是静脉输液。可以使用一种或多种生理学和药学上可接受的载体、稀释剂、赋形剂或助剂来调配包括向导RNA和/或Cas蛋白(或编码向导RNA和/或Cas蛋白的核酸)的组合物。调配物可以取决于所选择的施用途径。术语“药学上可接受的”意指载体、稀释剂、赋形剂或助剂与调配物的其它成分相容并且对其接受者基本上无害。
施用频率和剂量数可以取决于外源性供体核酸、向导RNA或Cas蛋白(或编码向导RNA或Cas蛋白的核酸)的半衰期和施用途径等因素。将核酸或蛋白质引入到细胞或非人动物中可以在一段时间内执行一次或多次。例如,引入可以按以下频率执行:一段时间内至少两次、一段时间内至少三次、一段时间内至少四次、一段时间内至少五次、一段时间内至少六次、一段时间内至少七次、一段时间内至少八次、一段时间内至少九次、一段时间内至少十次、至少十一次、一段时间内至少十二次、一段时间内至少十三次、一段时间内至少十四次、一段时间内至少十五次、一段时间内至少十六次、一段时间内至少十七次、一段时间内至少十八次、一段时间内至少十九次或一段时间内至少二十次。
E.在体内或离体测量人白蛋白靶向试剂的递送、活性或功效
本文所公开的方法可以进一步包括检测或测量人白蛋白靶向试剂的活性。例如,如果人白蛋白靶向试剂是基因组编辑试剂(例如,被设计成靶向人白蛋白基因座的CRISPR/Cas),则测量可以包括评估人源化白蛋白基因座进行修饰。
可以使用各种方法来鉴定具有靶向基因修饰的细胞。筛选可以包括用于评估亲本染色体的等位基因修饰(MOA)的定量测定。参见例如,US 2004/0018626;US 2014/0178879;US 2016/0145646;WO 2016/081923;以及Frendewey等人(2010),《酶学方法》476:295-307,所述文献中的每个文献出于所有目的通过引用整体并入本文。例如,定量测定可以通过定量PCR进行,如实时PCR(qPCR)。实时PCR可以利用识别靶基因座的第一引物组和识别非靶向参考基因座的第二引物组。引物组可以包括识别扩增序列的荧光探针。合适的定量测定的其它实例包含荧光介导的原位杂交(FISH)、比较基因组杂交、等温DNA扩增、与固定化探针的定量杂交、探针、分子信标探针或ECLIPSETM探针技术(参见例如US2005/0144655,所述文献出于所有目的通过引用整体并入本文)。
下一代测序(NGS)也可以用于筛选。下一代测序也可以被称为“NGS”或“大规模平行测序”或“高通量测序”。除了MOA测定外,NGS还可以用作筛选工具,用于定义靶向基因修饰的确切性质以及其是否在细胞类型或组织类型或器官类型上保持一致。
评估对非人动物中的人源化白蛋白基因座的修饰可以在来自任何组织或器官的任何细胞类型中进行。例如,评估可以在来自同一组织或器官的多种细胞类型中进行,或者在来自组织或器官内的多个位置的细胞中进行。这可以提供关于靶向靶组织或器官内的哪些细胞类型或者人白蛋白靶向试剂到达组织或器官的哪些部分的信息。作为另一个实例,评估可以在多种类型的组织或多个器官中进行。在靶向特定组织、器官或细胞类型的方法中,这可以提供关于靶向所述组织或器官的有效性以及其它组织或器官中是否存在脱靶效应的信息。
如果试剂被设计成使人源化白蛋白基因座失活、影响人源化白蛋白基因座的表达、阻止人源化白蛋白mRNA的翻译或清除人源化白蛋白,则测量可以包括评估人源化白蛋白mRNA或蛋白质表达。这种测量可以在肝脏内或肝脏内的特定细胞类型或区域内进行,或者这种测量可以涉及测量所分泌的人源化白蛋白的血清水平。
如果试剂是编码未由野生型内源性白蛋白基因座编码或表达的外源性蛋白的外源性供体核酸,则测量可以包括评估由外源性供体核酸编码的mRNA的表达或评估外源性蛋白的表达。这种测量可以在肝脏内或肝脏内的特定细胞类型或区域内进行,或者这种测量可以涉及测量所分泌的外源性蛋白的血清水平。在具体实例中,所述外源性蛋白是因子IX蛋白。任选地,所述评估包括测量所述因子IX蛋白在所述非人动物中的血清水平和/或包括评估活化部分凝血活酶时间或执行凝血酶生成测定。任选地,所述非人动物进一步包括失活F9基因座,并且所述评估包括测量所述因子IX蛋白在非人动物中的血清水平和/或包括评估活化部分凝血活酶时间(aPTT)或执行凝血酶生成测定(TGA)。在实例中更详细地描述了这些测定。
可以使用的测定的一个实例是BASESCOPETMRNA原位杂交(ISH)测定,这是一种可以在完整的固定组织的情况下对细胞特异性编辑的转录物,包含单核苷酸变化进行定量的方法。BASESCOPETMRNA ISH测定可以在基因编辑的表征中补充NGS和qPCR。虽然NGS/qPCR可以提供野生型和编辑序列的定量平均值,但其不提供有关组织内经编辑的细胞的异质性或百分比的信息。BASESCOPETMISH测定可以提供整个组织的景观图并以单细胞分辨率对野生型与经编辑的转录物进行定量,其中可以定量靶组织中含有经编辑的mRNA转录物的细胞的实际数量。BASESCOPETM测定使用配对寡核苷酸(“ZZ”)探针在无非特异性背景的情况下放大信号,从而实现单分子RNA检测。然而,BASESCOPETM探针设计和信号放大系统利用ZZ探针实现单分子RNA检测,并且可以差异地检测完整固定组织中的单核苷酸编辑和突变。
可以通过任何已知方式评估人源化白蛋白或外源性蛋白的产生和分泌。例如,表达可以使用已知测定通过测量非人动物的肝脏中经编码的mRNA的水平或非人动物的肝脏中经编码的蛋白质的水平来评估。人源化白蛋白或外源性蛋白的分泌可以通过使用已知测定测量经编码的人源化白蛋白或外源性蛋白在非人动物中的血浆水平或血清水平来评估。
IV.制备包括人源化白蛋白基因座的非人动物的方法
提供了用于制备包括如本文其它地方描述的人源化白蛋白(ALB)基因座的非人动物基因组、非人动物细胞和非人动物的各种方法。用于产生经基因修饰的生物体的任何方便的方法或方案都适用于产生这种经基因修饰的非人动物。参见例如,Cho等人(2009),《当代细胞生物学实验指南(Current Protocols in Cell Biology)》42:19.11:19.11.1–19.11.22和Gama Sosa等人(2010)《大脑结构与功能(Brain Struct.Funct.)》214(2-3):91-109,所述文献中的每个文献出于所有目的通过引用整体并入本文。此类经基因修饰的非人动物可以例如通过在靶向白蛋白基因座处的基因敲入来产生。
例如,产生包括人源化白蛋白基因座的非人动物的方法可以包括:(1)对多能性细胞的基因组进行修饰以包括所述人源化白蛋白基因座;(2)鉴定或选择包括人源化白蛋白基因座的经基因修饰的多能性细胞;(3)将经基因修饰的多能性细胞引入到非人动物宿主胚胎中;以及(4)将宿主胚胎植入代孕母体中并在其中孕育。例如,产生包括人源化白蛋白基因座的非人动物的方法可以包括:(1)对多能性细胞的基因组进行修饰以包括所述人源化白蛋白基因座;(2)鉴定或选择包括人源化白蛋白基因座的经基因修饰的多能性细胞;(3)将经基因修饰的多能性细胞引入到非人动物宿主胚胎中;以及(4)在代孕母体中孕育宿主胚胎。任选地,包括经修饰的多能性细胞(例如,非人ES细胞)的宿主胚胎可以在植入到代孕母体中并在其中孕育以产生F0非人动物之前进行温育,直到胚泡期为止。代孕母体然后可以产生包括人源化白蛋白基因座的F0代非人动物。
所述方法可以进一步包括鉴定具有经修饰的靶基因组基因座的细胞或动物。可以使用各种方法来鉴定具有靶向基因修饰的细胞和动物。
修饰基因组的步骤可以例如利用外源性供体核酸(例如,靶向载体)对白蛋白基因座进行修饰以包括本文所公开的人源化白蛋白基因座。举例来说,靶向载体可以用于在内源性白蛋白基因座(例如,内源性非人动物白蛋白基因座)处产生人源化白蛋白基因,其中靶向载体包括靶向内源性白蛋白基因座处的5'靶序列的5'同源臂和靶向内源性白蛋白基因座处的3'靶序列的3'同源臂。外源性供体核酸还可以包括核酸插入物,所述核酸插入物包含待整合到白蛋白基因座中的DNA区段。核酸插入物在白蛋白基因座中的整合可能会导致所关注核酸序列在白蛋白基因座中的添加、所关注核酸序列在白蛋白基因座中的缺失或所关注核酸序列在白蛋白基因座中的替代(即,缺失和插入)。同源臂可以侧接包括人白蛋白序列的插入核酸,以产生人源化白蛋白基因座(例如,用于缺失内源性白蛋白基因座的区段并且被直系同源人白蛋白序列替代)。
外源性供体核酸可以用于非同源末端连接介导的插入或同源重组。外源性供体核酸可以包括脱氧核糖核酸(DNA)或核糖核酸(RNA),其可以是单链或双链的,并且其可以呈线性或环状形式。例如,修复模板可以是单链寡脱氧核苷酸(ssODN)。
外源性供体核酸还可以包括在非靶向内源性白蛋白基因座处不存在的异源序列。例如,外源性供体核酸可以包括选择盒,如侧接有重组酶识别位点的选择盒。
一些外源性供体核酸包括同源臂。如果外源性供体核酸还包括核酸插入物,则同源臂可以侧接核酸插入物。为了便于参考,同源臂在本文中被称为5'和3'(即,上游和下游)同源臂。此术语涉及同源臂与外源性供体核酸内的核酸插入物的相对位置。5'和3'同源臂对应于白蛋白基因座内的区域,所述区域在本文中分别被称为“5'靶序列”和“3'靶序列”。
当同源臂和靶序列彼此共享足够水平的序列同一性时,则这两个区域彼此“对应(correspond或corresponding)”以充当同源重组反应的底物。术语“同源性”包含与对应序列相同或共享序列同一性的DNA序列。给定靶序列与外源性供体核酸中存在的对应同源臂之间的序列同一性可以是允许发生同源重组的任何程度的序列同一性。例如,外源性供体核酸(或其片段)的同源臂与靶序列(或其片段)所共享的序列同一性的量可以是至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,使得序列经历同源重组。此外,同源臂与对应的靶序列之间对应的同源区域可以具有足以促进同源重组的任何长度。在一些靶向载体中,内源性白蛋白基因座中的预期突变包含在侧接有同源臂的插入核酸中。
在除单细胞期胚胎之外的细胞中,外源性供体核酸可以是包含靶向载体的“大靶向载体”或“LTVEC”,所述靶向载体包括同源臂,所述同源臂对应于并源自比用于在细胞中执行同源重组的其它方法通常使用的核酸序列更大的核酸序列。LTVEC还包含包括核酸插入物的靶向载体,所述核酸插入物的核酸序列大于旨在在细胞中进行同源重组的其它方法通常所使用的核酸序列。例如,LTVEC可以对由于其大小限制而无法由传统的基于质粒的靶向载体容纳的大基因座进行修饰。例如,在不存在由核酸酶药剂(例如,Cas蛋白)诱导的切口或双链断裂的情况下,靶向基因座可以是(即,5'和3'同源臂可以对应于)使用常规方法不可靶向或只能错误靶向或仅以显著低效率靶向的细胞的基因座。LTVEC可以是任何长度,并且通常长度为至少10kb。LTVEC中5'同源臂和3'同源臂的总长度通常至少为10kb。
筛选步骤可以包括例如用于评估亲本染色体的等位基因(MOA)的修饰的定量测定。例如,定量测定可以通过定量PCR进行,如实时PCR(qPCR)。实时PCR可以利用识别靶基因座的第一引物组和识别非靶向参考基因座的第二引物组。引物组可以包括识别扩增序列的荧光探针。
合适的定量测定的其它实例包含荧光介导的原位杂交(FISH)、比较基因组杂交、等温DNA扩增、与固定化探针的定量杂交、探针、分子信标探针或ECLIPSETM探针技术(参见例如US 2005/0144655,所述文献出于所有目的通过引用整体并入本文)。
合适的多能性细胞的实例是胚胎干(ES)细胞(例如,小鼠ES细胞或大鼠ES细胞)。经修饰的多能性细胞可以例如通过以下方式重组产生:(a)将包括插入核酸的一种或多种外源性供体核酸(例如,靶向载体)引入到细胞中,所述插入核酸侧接有例如对应于5'和3'靶位点的5'和3'同源臂,其中所述插入核酸包括人白蛋白序列以产生人源化白蛋白基因座;以及(b)鉴定在其基因组中包括整合在内源性白蛋白基因座处的插入核酸的至少一个细胞(即,鉴定包括人源化白蛋白基因座的至少一个细胞)。经修饰的多能性细胞可以例如通过以下方式重组产生:(a)将包括插入核酸的一种或多种靶向载体引入到细胞中,所述插入核酸侧接有对应于5'和3'靶位点的5'和3'同源臂,其中所述插入核酸包括人源化白蛋白基因座;以及(b)鉴定在其基因组中包括在靶基因组基因座处整合的插入核酸的至少一个细胞。
可替代地,经修饰的多能性细胞可以通过以下方式产生:(a)将以下引入到细胞中:(i)核酸酶药剂,其中核酸酶药剂在内源性白蛋白基因座内的靶位点处诱导切口或双链断裂;以及(ii)任选地包括插入核酸的一种或多种外源性供体核酸(例如,靶向载体),所述插入核酸侧接有例如对应于定位在足够接近核酸酶靶位点的5'和3'靶位点的5'和3'同源臂,其中所述插入核酸包括人白蛋白序列以产生人源化白蛋白基因座;以及(c)鉴定在其基因组中包括整合在内源性白蛋白基因座处的插入核酸的至少一个细胞(即,鉴定包括人源化白蛋白基因座的至少一个细胞)。可替代地,经修饰的多能性细胞可以通过以下方式产生:(a)将以下引入到细胞中:(i)核酸酶药剂或编码所述核酸酶药剂的核酸,其中所述核酸酶药剂在内源性白蛋白基因座内的靶位点处诱导切口或双链断裂;以及(ii)任选地包括插入核酸的一种或多种外源性供体核酸(例如,靶向载体),所述插入核酸侧接有例如对应于定位在足够接近核酸酶靶位点的5'和3'靶位点的5'和3'同源臂,其中所述插入核酸包括人白蛋白序列以产生人源化白蛋白基因座;以及(c)鉴定在其基因组中包括整合在内源性白蛋白基因座处的插入核酸的至少一个细胞(即,鉴定包括人源化白蛋白基因座的至少一个细胞)。可替代地,经修饰的多能性细胞可以通过以下方式产生:(a)将以下引入到细胞中:(i)核酸酶药剂,其中所述核酸酶药剂在靶基因组基因座内的识别位点处诱导切口或双链断裂;以及(ii)包括插入核酸的一种或多种靶向载体,所述插入核酸侧接有对应于定位在足够接近识别位点的5'和3'靶位点的5'和3'同源臂,其中所述插入核酸包括人源化白蛋白基因座;以及(c)鉴定在靶基因组基因座处包括修饰(例如,插入核酸的整合)的至少一个细胞。可以使用任何诱导切口或双链断裂进入期望识别位点的核酸酶药剂。可替代地,经修饰的多能性细胞可以通过以下方式产生:(a)将以下引入到细胞中:(i)核酸酶药剂或编码所述核酸酶药剂的核酸,其中所述核酸酶药剂在靶基因组基因座内的识别位点处诱导切口或双链断裂;以及(ii)包括插入核酸的一种或多种靶向载体,所述插入核酸侧接有对应于定位在足够接近识别位点的5'和3'靶位点的5'和3'同源臂,其中所述插入核酸包括人源化白蛋白基因座;以及(c)鉴定在靶基因组基因座处包括修饰(例如,插入核酸的整合)的至少一个细胞。可以使用任何诱导切口或双链断裂进入期望识别位点的核酸酶药剂。合适的核酸酶的实例包含转录激活因子样效应物核酸酶(TALEN)、锌指核酸酶(ZFN)、大范围核酸酶和成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关(Cas)系统(例如,CRISPR/Cas9系统)或此类系统(例如,CRISPR/Cas9)的组分。参见例如US 2013/0309670和US 2015/0159175,所述文献中的每个文献出于所有目的通过引用整体并入本文。
供体细胞可以在任何阶段引入到宿主胚胎中,如胚泡期或桑椹胚前期(即,4细胞期或8细胞期)。产生能够通过种系传递基因修饰的后代。参见例如美国专利第7,294,754号,所述文献出于所有目的通过引用整体并入本文。
可替代地,产生本文其它地方描述的非人动物的方法可以包括:(1)使用上述用于修饰多能性细胞的方法对单细胞期胚胎的基因组进行修饰以包括所述人源化白蛋白基因座;(2)选择经基因修饰的胚胎;以及(3)将经基因修饰的胚胎植入到代孕母体中并在其中孕育。可替代地,产生本文其它地方描述的非人动物的方法可以包括:(1)使用上述用于修饰多能性细胞的方法对单细胞期胚胎的基因组进行修饰以包括所述人源化白蛋白基因座;(2)选择经基因修饰的胚胎;(3)在代孕母体中孕育基因修饰的胚胎。产生能够通过种系传递基因修饰的后代。
核转移技术还可以用于产生非人哺乳动物。简而言之,用于核转移的方法可以包括以下步骤:(1)去除卵母细胞的核或提供去核卵母细胞;(2)分离或提供要与去核卵母细胞结合的供体细胞或细胞核;(3)将细胞或细胞核插入到去核卵母细胞中以形成重组细胞;(4)将重组细胞植入到动物的子宫中以形成胚胎;以及(5)允许胚胎发育。在此类方法中,卵母细胞通常从死亡动物身上取得,但卵母细胞也可以从活体动物的输卵管和/或卵巢中分离出来。在去核前,卵母细胞可以在各种众所周知的培养基中成熟。可以以多种众所周知的方式执行卵母细胞的去核。可以通过在融合前在透明带下显微注射供体细胞来将供体细胞或细胞核插入到去核卵母细胞中以形成重组细胞。可以通过在接触/融合平面上施加DC电脉冲(电融合)、通过将细胞暴露于如聚乙二醇等促进融合的化学物质或通过如仙台病毒等灭活病毒的方式来诱导融合。在核供体和受体卵母细胞融合之前、期间和/或之后,可以通过电气方式和/或非电气方式来活化重组细胞。活化方法包含电脉冲、化学诱发的休克、精子渗透、增加卵母细胞中二价阳离子的水平以及减少卵母细胞中细胞蛋白质的磷酸化(如通过激酶抑制剂的方式)。活化的重组细胞或胚胎可以在众所周知的培养基中培养,并且然后转移到动物的子宫中。参见例如US 2008/0092249、WO 1999/005266、US 2004/0177390、WO 2008/017234和美国专利第7,612,250号,所述文献中的每个文献出于所有目的通过引用整体并入本文。
本文所提供的各种方法允许产生经基因修饰的非人F0动物,其中经基因修饰的F0动物的细胞包括人源化白蛋白基因座。应认识到,根据用于产生F0动物的方法,F0动物内的具有人源化白蛋白基因座的细胞数量将有所不同。通过例如方法将供体ES细胞引入到来自对应生物体(例如,8细胞期小鼠胚胎)的桑椹胚前期胚胎中允许更大百分比的F0动物的细胞群包括具有包括靶向基因修饰的所关注核苷酸序列的细胞。例如,非人F0动物的细胞贡献的至少50%、60%、65%、70%、75%、85%、86%、87%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%可以包括具有靶向修饰的细胞群。
经基因修饰的F0动物的细胞对于人源化白蛋白基因座可以是杂合的,或者对于人源化白蛋白基因座可以是纯合的。
出于所有目的,上文或下文引用的所有专利申请、网站、其它出版物、登录号等都通过引用整体并入,其程度如同每个单独的项目被单独并且具体地指出通过引用的方式并入。如果序列的不同版本与不同时间的登录号相关联,则意指在本申请的有效提交日期与登录号相关联的版本。有效提交日期是指实际提交日期或提及登记号的优先权申请的提交日期(在适用情况下)中较早的日期。同样地,如果出版物、网站等的不同版本在不同时间发布,除非另有说明,否则指在申请的有效提交日期最近发布的版本。除非另外具体说明,否则本发明的任何特征、步骤、元件、实施例或方面都可以与任何其它特征、步骤、元件、实施例或方面结合使用。尽管为了清楚和理解起见,已通过图解和实例方式详细地对本发明进行了描述,但显而易见的是,可以在所附权利要求的范围内进行某些改变和修改。
序列简要说明
使用核苷酸碱基的标准字母缩写和氨基酸的三字母代码示出随附序列表中列出的核苷酸和氨基酸序列。核苷酸序列遵循从序列的5'末端开始并且向前(即,在每行中从左到右)到达3'末端的标准惯例。每个核苷酸序列仅示出一条链,但任何提及的显示链均应理解为包含互补链。当提供对氨基酸序列进行编码的核苷酸序列时,应当理解的是还提供了其对相同氨基酸序列进行编码的密码子简并变体。氨基酸序列遵循从序列的氨基端开始并且向前(即,在每行中从左到右)到达羧基端的标准惯例。
表2:序列描述。
实例
实例1:包括人源化白蛋白(ALB)基因座的小鼠的产生
产生包括包含20kb的小鼠白蛋白(Alb)基因座(来自bMQ-127G8)的5'同源臂和包含127kb的小鼠白蛋白(Alb)基因座(来自bMQ-127G8)的3'同源臂的大靶向载体(LTVEC),以用17.3kb(17,335bp)的对应人白蛋白序列(ALB)(来自RP11-31P12)替代来自小鼠白蛋白(Alb)基因的14.4kb(14,376bp)的区域。表3中提供了关于小鼠和人白蛋白的信息。使用基因工程技术通过细菌同源重组(BHR)反应产生和使用来源于细菌人工染色体(BAC)DNA的大靶向载体(LTVEC)描述于例如US 6,586,251和Valenzuela等人(2003)《自然生物技术》21(6):652-659,所述文献中的每个文献出于所有目的通过引用整体并入本文。通过体外组装方法产生LTVEC描述于例如US 2015/0376628和WO 2015/200334,所述文献中的每个文献出于所有目的通过引用整体并入本文。
表3:小鼠和人白蛋白(ALB)。
具体地,从ATG起始密码子到终止密码子(即,编码外显子1-14)的区域从小鼠白蛋白(Alb)基因座缺失。人白蛋白(ALB)的从ATG起始密码子到终止密码子下游100bp的对应区域被插入来代替所缺失的小鼠区域。将loxP-mPrm1-Crei-pA-hUb1-em7-Neo-pA-loxP盒(4,766bp)插入到人3'UTR的下游,其中在3'UTR之后且刚好在所述盒之前具有约100bp的3'人序列的缓冲序列。这是MAID 7626等位基因。参见图1A。在盒缺失之后,loxP和克隆位点(38bp)保留在人3'UTR的下游,其中在3'UTR之后且刚好在剩余loxP位点之前具有100bp的3'人序列的缓冲序列。这是MAID 7627等位基因。参见图1B。
小鼠白蛋白信号肽、前肽和血清白蛋白的序列分别示出于SEQ ID NO:2-4中,其中对应的编码序列分别示出于SEQ ID NO:10-12中。人白蛋白信号肽、前肽和血清白蛋白的序列分别示出于SEQ ID NO:6-8中,其中对应的编码序列分别示出于SEQ ID NO:14-16中。预期的经编码的人源化白蛋白与人白蛋白相同。参见图1A和1B。图3A-3B中提供了小鼠和人白蛋白与人源化白蛋白的比对。小鼠和人Alb/ALB编码序列分别示出于SEQ ID NO:9和13中。小鼠和人白蛋白序列分别示出于SEQ ID NO:1和5中。预期的人源化ALB编码序列和预期的人源化白蛋白的序列分别示出于SEQ ID NO:13和5中。
为了产生突变等位基因,上述大靶向载体被引入到F1H4小鼠胚胎干细胞中。F1H4小鼠ES细胞源自通过将雌性C57BL/6NTac小鼠与雄性12956/SvEvTac小鼠杂交产生的杂交胚胎。参见例如US 2015-0376651和WO 2015/200805,所述文献中的每个文献出于所有目的通过引用整体并入本文。抗生素选择后,挑取菌落,扩增,并且通过进行筛选。参见图2。执行等位基因丢失测定以检测内源小鼠等位基因的丢失,并且使用表4中所示的引物和探针执行等位基因获得测定以检测人源化等位基因的获得。
表4:筛选测定。
包含等位基因失去(LOA)和等位基因获得(GOA)测定的等位基因修饰(MOA)测定描述于例如US 2014/0178879;US 2016/0145646;WO 2016/081923;以及Frendewey等人(2010),《酶学方法》476:295-307中,所述文献中的每个文献出于所有目的通过引用整体并入本文。等位基因丢失(LOA)测定颠覆了常规筛选逻辑并且定量了突变所涉及的天然基因座的基因组DNA样品中的拷贝数。在正确靶向的杂合细胞克隆中,LOA测定检测到两个天然等位基因中的一个等位基因(对于不在X或Y染色体上的基因),另一个等位基因被靶向修饰破坏。可以反向应用相同的原理作为等位基因获得(GOA)测定,以定量基因组DNA样品中所插入的靶向载体的拷贝数。
使用方法从经修饰的ES细胞中产生F0小鼠。具体地,使用方法将包括通过上述MOA测定选择的上述人源化白蛋白基因座的小鼠ES细胞克隆注射到8细胞期胚胎中。参见例如,US 7,576,259;US 7,659,442;US 7,294,754;US 2008/0078000;以及Poueymirou等人(2007),《自然生物技术》25(1):91-99,所述文献中的每个文献出于所有目的通过引用整体并入本文。在方法中,通过激光辅助注射将靶向小鼠胚胎干(ES)细胞注射到桑椹前期胚胎,例如八细胞期胚胎中,这有效地产生完全ES细胞源性的F0代小鼠。在方法中,将经注射的桑椹前期胚胎培养至胚泡期,并且将胚泡期胚胎引入到代孕母体中并且在所述代孕母体中孕育,以产生F0代小鼠。当以对于靶向修饰纯合的小鼠ES细胞克隆开始时,产生对于靶向修饰纯合的F0小鼠。当以对于靶向修饰杂合的小鼠ES细胞克隆开始时,可以进行随后的育种以产生对于靶向修饰纯合的小鼠。
实例2:包括人源化白蛋白(ALB)基因座的小鼠的验证
为了验证人源化白蛋白小鼠,使用人和小鼠血清白蛋白ELISA试剂盒(分别为Abcam ab179887和ab207620)测量血浆样品中的小鼠和人白蛋白水平。用于验证的人源化小鼠是F1小鼠,其中自缺失选择盒是自缺失的。在正常人血浆和人源化白蛋白小鼠血浆样品中检测到人白蛋白,但在野生型(WT)小鼠或VelocImmune(VI)小鼠血浆样品中未检测到人白蛋白。参见图4。在野生型小鼠血浆样品和VI小鼠血浆样品中检测到小鼠白蛋白,但在人源化白蛋白小鼠血浆样品中未检测到小鼠白蛋白。参见图5。具体地,所汇集正常人血浆(购自乔治金生物医学公司)具有约30-40mg/mL的人白蛋白。人源化白蛋白小鼠血浆具有约10-15mg/mL的人白蛋白,但小鼠白蛋白是不可检测的。正常VI和WT小鼠血浆具有约7-13mg/mL的小鼠白蛋白。
实例3:包括靶向人白蛋白进行F9插入的人源化白蛋白(ALB)基因座–向导RNA的小鼠的验证
为了进一步验证人源化白蛋白小鼠,使用人源化白蛋白小鼠来评估CRISPR/Cas9技术将F9转基因整合到白蛋白基因座中的使用。具体地,测试了经整合的人F9 Padua变体(hF9-R338L)在纯合人源化白蛋白小鼠中的整合和表达。针对人白蛋白基因座的内含子1设计了各种向导RNA。使用ALBhu/hu小鼠建立两个单独的小鼠实验以筛选总共11个向导RNA,每个向导RNA靶向人白蛋白基因座的第一内含子。在实验的第0天,对所有小鼠进行称重并且通过尾部静脉进行注射。在第1、3、4和6周通过尾部出血收集血液,并且分离血浆。在第7周终止小鼠生命。通过腔静脉收集血液,并且分离血浆。也解剖肝脏和脾脏。表5中提供了这些向导RNA的向导序列(DNA靶向区段)。
表5:人白蛋白gRNA序列和染色体坐标。
向导ID | 向导序列 | 人基因组坐标(hg38) | SEQ ID NO: |
G009844 | GAGCAACCUCACUCUUGUCU | chr4:73405113-73405133 | 49 |
G009852 | UGCAUUUGUUUCAAAAUAUU | chr4:73404999-73405019 | 50 |
G009857 | AUUUAUGAGAUCAACAGCAC | chr4:73404761-73404781 | 51 |
G009859 | UUAAAUAAAGCAUAGUGCAA | chr4:73404727-73404747 | 52 |
G009860 | UAAAGCAUAGUGCAAUGGAU | chr4:73404722-73404742 | 53 |
G009874 | UAAUAAAAUUCAAACAUCCU | chr4:73404561-73404581 | 54 |
G012752 | UGACUGAAACUUCACAGAAU | chr4:73404664-73404684 | 55 |
G012753 | GACUGAAACUUCACAGAAUA | chr4:73404665-73404685 | 56 |
G012761 | AGUGCAAUGGAUAGGUCUUU | chr4:73404714-73404734 | 57 |
G012764 | CCUCACUCUUGUCUGGGCAA | chr4:73405107-73405127 | 58 |
G012765 | ACCUCACUCUUGUCUGGGCA | chr4:73405108-73405128 | 59 |
G012766 | UGAGCAACCUCACUCUUGUC | chr4:73405114-73405134 | 60 |
在第一个实验中,分别测试包括Cas9 mRNA和以下六种向导RNA中的每一种的LNP:G009852、G009859、G009860、G009864、G009874和G012764。将LNP稀释到0.3mg/kg(使用30克的平均重量)并且以每只小鼠3E11病毒基因组的剂量与包装有双向hF9插入模板(SEQ IDNO:63;ITR-剪接受体-hF9(外显子2-8)-bGH-SV40polyA-经密码子优化的hF9-pLac-pMB-剪接受体-Kan抗性)的AAV8共注射。每组注射五只12到14周龄的ALBhu/hu雄性小鼠。向来自同一群组的五只小鼠注射包装有与hF9可操作地连接的CAGG启动子(SEQ ID NO:64;CAGG-ITR-hF9-WPRE-bGH-ITR-pLac-pMB-Amp抗性)的AAV8,这导致hF9的游离基因表达(以每只小鼠3E11病毒基因组)。存在三组阴性对照组,其中每组三只小鼠,分别向所述三组阴性对照组注射单独的缓冲液、单独的包装有双向hF9插入模板的AAV8或单独的LNP-G009874。
在第二个实验中,分别测试包括Cas9 mRNA和以下六种向导RNA中的每一种的LNP:G009860、G012764、G009844、G009857、G012752、G012753和G012761。将LNP稀释到0.3mg/kg(使用40克的平均重量)并且以每只小鼠3E11病毒基因组的剂量与包装有双向hF9插入模板(SEQ ID NO:63)的AAV8共注射。每组注射五只30周龄的ALBhu/hu雄性小鼠。向来自同一群组的五只小鼠注射包装有与hF9可操作地连接的CAGG启动子(SEQ ID NO:64)的AAV8,这导致hF9的游离基因表达(以每只小鼠3E11病毒基因组)。存在三组阴性对照组,其中每组三只小鼠,分别向所述三组阴性对照组注射单独的缓冲液、单独的包装有双向hF9插入模板的AAV8或单独的LNP-G009874。
为了分析,进行ELISA以测量在每个时间点在小鼠中循环的hFIX水平。人因子IXELISA试剂盒(ab188393)用于此目的,并且所有板均利用来自乔治金生物医学公司的人所汇集正常血浆作为阳性测定对照运行。图6A和6B中示出了注射后第6周,每组中的血浆样品中的人因子IX表达水平。与体外插入数据一致,当使用向导RNA G009852时,未检测到低至无因子IX血清水平。与人白蛋白中缺乏相邻PAM序列一致,当使用向导RNA G009864时,无法检测到因子IX血清水平。G009864的向导序列(DNA靶向区段)是UACUUUGCACUUUCCUUAGU(SEQID NO:61),并且所述向导序列靶向食蟹猴基因组坐标(mf5)chr5:61199187-61199207。针对若干其它向导RNA,包含G009857、G009859、G009860、G009874和G0012764,观察到血清中的因子IX表达。
将脾脏和所有肝脏的左侧叶的一部分提交用于下一代测序(NGS)分析。在用AAV-hF9供体和LNP-CRISPR/Cas9注射后第7周,使用NGS来评估在人源化白蛋白基因座处具有插入/缺失(indel)的肝细胞的百分比。与人白蛋白中缺乏相邻PAM序列一致,当使用向导RNAG009864时,无法在肝脏中检测到编辑。针对使用向导RNA G009859、G009860、G009874和G012764(数据未示出)的组,观察到肝脏中的编辑。
将剩余肝脏在10%中性缓冲福尔马林中固定24小时,并且然后转移到70%乙醇中。从单独叶中切下四到五个样品并将其运送到HistoWisz,并且进行加工并包埋在石蜡块中。然后从每个石蜡块切下五微米的切片,并且使用通用BASESCOPETM程序和由高级细胞诊断公司(Advanced Cell Diagnostics)提供的试剂以及定制设计的探针在Ventana UltraDiscovery(Roche)上进行BASESCOPETM,当实现成功整合和转录时,所述定制设计的探针靶向在来自ALBhu/hu白蛋白基因座的第一内含子的人白蛋白信号序列与hF9转基因之间形成的独特mRNA接点。然后使用HALO成像软件(印迪卡实验室公司(Indica Labs))来定量每个样品中的阳性细胞的百分比。然后将每只动物的多个叶上的阳性细胞百分比的平均值与第7周血清中的hFIX水平相关。图7和表6中示出了结果。第7周血清水平和hALB-hFIX mRNA的阳性细胞%密切相关(r=0.89;R2=0.79)。
表6:第7周的hFIX和BASESCOPETM数据。
实例4:在F9 KO小鼠中包括人源化白蛋白(ALB)基因座-F9插入的小鼠的验证
为了进一步验证人源化白蛋白小鼠,将人源化白蛋白小鼠与F9敲除小鼠杂交以产生ALBm/hu x F9-/-小鼠(对于白蛋白基因座的人源化是杂合的并且对于F9敲除是纯合的),这些小鼠有待用于评估CRISPR/Cas9技术将F9转基因整合到白蛋白基因座中的使用。
然后使用人源化白蛋白F9 KO小鼠来测试将人F9 Padua变体(hF9-R338L)转基因插入到人源化白蛋白基因座的内含子1中。在实验的第0天,对所有小鼠进行称重并且通过尾部静脉进行注射。在第1周和第3周通过尾部出血收集血液,并且分离血浆。在第4周终止小鼠生命。通过腔静脉收集血液,并且分离血浆。也解剖肝脏和脾脏。
分别测试包括Cas9 mRNA和以下两种向导RNA的LNP:G009860(靶向人白蛋白基因座的第一内含子)和G000666(靶向小鼠白蛋白基因座的第一内含子)。表5中提供了G009860的向导序列(DNA靶向区段)。G000666的向导序列是CACUCUUGUCUGUGGAAACA(SEQ ID NO:62),并且所述向导序列靶向小鼠基因组坐标(mm10)chr5:90461709-90461729。将G009860稀释到0.3mg/kg,并且将G000666稀释到1.0mg/kg(使用31.2克的平均重量),并且将两者以每只小鼠3E11病毒基因组的剂量与包装有双向hF9插入模板(SEQ ID NO:63)的AAV8共注射。每组注射五只ALBms/huxF9-/-雄性小鼠(16周龄)。向来自同一群组的五只小鼠注射包装有与hF9可操作地连接的CAGG启动子(SEQ ID NO:64)的AAV8,这导致hF9的游离基因表达(以每只小鼠3E11病毒基因组)。存在六只阴性对照动物,其中每组一只小鼠注射单独的缓冲液或单独的包装有双向hF9插入模板的AAV8,并且每组两只小鼠分别以0.3mg/kg和1.0mg/kg注射单独的LNP-G009860或LNP-G000666。
为了分析,进行ELISA以测量在每个时间点在小鼠中循环的hFIX水平。人因子IXELISA试剂盒(ab188393)用于此目的,并且所有板均利用来自乔治金生物医学公司的人所汇集正常血浆作为阳性测定对照运行。将脾脏和所有肝脏的左侧叶的一部分提交用于NGS分析。
图8和表7示出了在注射后第1、2和4周,每组中的血浆样品中的人因子IX表达水平。另外,表7中示出了显示在肝脏和脾脏中的白蛋白基因座处的插入和缺失(indel)水平的NGS结果。如图8和表7所示,在第1、3和4周,在经处理的Alb+/hu/F9-/-小鼠的血浆中检测到hFIX,其中ELISA显示在第1、3和4周时表达值为0.5-10μg/mL。
表7:人FIX血浆水平和NGS结果。
将剩余肝脏在10%中性缓冲福尔马林中固定24小时,并且然后转移到70%乙醇中。从单独叶中切下四到五个样品并将其运送到HistoWiz,并且进行加工并包埋在石蜡块中。然后从每个石蜡块切下五微米的切片,使用通用BASESCOPETM程序和由高级细胞诊断公司提供的试剂以及定制设计的探针在Ventana Ultra Discovery(Roche)上通过BASESCOPETM进行分析,当实现成功整合和转录时,所述定制设计的探针靶向来自ALBms/hu小鼠中的每个相应白蛋白基因座的第一内含子的人或小鼠白蛋白信号序列与hF9转基因之间形成的独特mRNA接点。使用HALO成像软件(印迪卡实验室公司)来定量每个样品中的阳性细胞的百分比。
接下来,通过活化部分凝血活酶时间(aPTT)和凝血酶生成测定(TGA),使用终血来评估功能性凝结活性。活化部分凝血活酶时间(aPTT)是内在途径凝血活性在血浆中的临床测量结果。通过添加鞣花酸或高岭土诱导血浆凝结,所述鞣花酸或高岭土两者均会激活凝结的内在途径(称为接触途径)中的凝血因子XII,一旦凝血酶被激活,随后就会导致从纤维蛋白原产生纤维蛋白。aPTT测定提供了对个体产生凝块的能力的估计,并且可以使用此信息来确定出血或血栓形成的风险。为了测试aPTT,使用具有机电凝块检测方法(基于粘度的检测系统)的半自动台式系统(DiagnosticaStagoSTart4)来评估血浆中的凝血。向每个装有钢球的比色皿中添加50μL柠檬酸化血浆并且在37℃下温育5分钟,并且然后在37℃下通过添加50μL鞣花酸(终浓度为30μM)触发凝血,持续300秒。在通过向每个比色皿中添加50μL的0.025M氯化钙(终浓度为8mM)最终激活凝血之后,钢球开始在这两个驱动线圈之间来回振荡。球的移动是通过接收器线圈检测的。纤维蛋白的产生增加了血浆粘度直到球停止移动,这被记录为凝血时间。所测量的唯一参数是凝血时间。一式两份地进行试验。
凝血酶生成测定(TGA)是对活化血浆中的凝血酶生成的动力学的非临床评估。凝血酶生成是凝结的基本过程,因为凝血酶负责其它凝结因子的激活以及另外的凝血酶的增殖(通过FXI激活),以将纤维蛋白原转化为纤维蛋白。凝血酶生成测定提供了对个体生成凝血酶的能力的估计,并且可以使用此信息来确定出血或血栓形成的风险。为了进行TGA,使用校准的自动凝血酶描记图在分光光度计(ThrombinographTM,赛默飞世尔科技公司(Thermo Scientific))中评估凝血酶生成水平。对于高通量实验,使用96孔板(Immulon IIHB)。向每个孔中添加55μL的柠檬酸化血浆(针对小鼠血浆,用盐水稀释4x),并且在37℃下温育30分钟。凝血酶生成通过在37℃下添加15μL的2μM鞣花酸(终浓度为0.33μM)持续45分钟而触发。在将15μL的具有16mM CaCl2(FluCa;Thrombinoscope BV)的荧光底物自动注射进每个孔中之后确定凝血酶生成。荧光底物与所生成的凝血酶反应,所述所生成的凝血酶在460nm下每33秒在血浆中连续测量,持续90分钟。荧光强度与凝血酶的蛋白水解活性成比例。在追踪中测量的主要参数是滞后时间、凝血酶生成峰值、凝血酶生成峰值时间和内源性凝血酶电位(ETP)。滞后时间提供了对血浆中的凝血酶的初始检测所需时间的估计。峰值是在激活后在给定时间产生的凝血酶的最大量。凝血酶生成峰值时间是从凝血级联反应开始到凝血酶生成峰值的时间。ETP是在所测量的60分钟期间产生的凝血酶总量。一式两份地进行试验。
如图9和表8所示,使用小鼠白蛋白gRNA或人白蛋白gRNA插入hF9转基因在aPTT测定中显示出恢复的凝血功能。盐水、仅AAV和仅LNP阴性对照样品显示出45-60秒的延长的aPTT时间。阳性对照CAGG和测试样品(AAV8+LNP)更接近28-34秒的正常人aPTT。
表8:aPTT和TGA-EA。
样品编号 | I.V.注射 | 第4周F9μg/mL | 平均aPTT(秒) | TGA-EA峰值(nM) |
1 | PBS | BLD | 40.2 | 11.13 |
18 | 仅AAV | BLD | 62.5 | -1 |
2 | 仅LNP G000666 | BLD | 53.9 | -1 |
4 | 仅LNP G000666 | BLD | 65.0 | 2.45 |
19 | 仅LNP G009860 | BLD | 34.1 | 42.83 |
20 | 仅LNP G009860 | BLD | 56.7 | 18.07 |
10 | AAV+CAGG F9 | 117.74 | 41.1 | 42.65 |
14 | AAV+CAGG F9 | 100.95 | 34.1 | 49.96 |
15 | AAV+CAGG F9 | 107.26 | 42.2 | 49.49 |
16 | AAV+CAGG F9 | 116.24 | 37.9 | 44.46 |
17 | AAV+CAGG F9 | 124.15 | 44.1 | 38.02 |
5 | AAV+G000666 | 8.79 | 31.3 | 72.11 |
6 | AAV+G000666 | 10.29 | 32.6 | 90.14 |
7 | AAV+G000666 | 3.01 | 33.5 | 58.33 |
8 | AAV+G000666 | 无样品 | 不适用 | 不适用 |
9 | AAV+G000666 | 7.23 | 25.9 | 67.23 |
11 | AAV+G009860 | 0.86 | 36.8 | 56.92 |
12 | AAV+G009860 | 0.47 | 37.7 | 45.16 |
13 | AAV+G009860 | 0.93 | 35.3 | 60.45 |
21 | AAV+G009860 | 0.59 | 36.1 | 47.44 |
22 | AAV+G009860 | 2.37 | >300 | 试管中的凝块 |
如图10A、10B和11以及表8所示,在TGA-EA分析中使用小鼠白蛋白gRNA或人白蛋白gRNA插入hF9转基因显示凝血酶生成增加。与阴性对照样品相比,阳性对照CAGG和AAV8+LNP中的凝血酶浓度更高。
总之,在第1、3和4周,在Alb+/hu/F9-/-小鼠的血浆中检测到hFIX,并且发现所表达的hFIX-R338L是功能性的,因为在TGA测定中产生凝血酶,并且aPTT凝血时间得到改善。
序列表
<110> 瑞泽恩制药公司(Regeneron Pharmaceuticals, Inc.)
<120> 包括人源化白蛋白基因座的非人动物
<130> 057766/548157
<150> US 62/858,589
<151> 2019-06-07
<150> US 62/916,666
<151> 2019-10-17
<160> 64
<170> PatentIn版本3.5
<210> 1
<211> 608
<212> PRT
<213> 小家鼠(Mus musculus)
<220>
<221> MISC_FEATURE
<222> (1)..(18)
<223> 信号肽
<220>
<221> MISC_FEATURE
<222> (19)..(24)
<223> 前肽
<220>
<221> MISC_FEATURE
<222> (25)..(608)
<223> 血清白蛋白
<400> 1
Met Lys Trp Val Thr Phe Leu Leu Leu Leu Phe Val Ser Gly Ser Ala
1 5 10 15
Phe Ser Arg Gly Val Phe Arg Arg Glu Ala His Lys Ser Glu Ile Ala
20 25 30
His Arg Tyr Asn Asp Leu Gly Glu Gln His Phe Lys Gly Leu Val Leu
35 40 45
Ile Ala Phe Ser Gln Tyr Leu Gln Lys Cys Ser Tyr Asp Glu His Ala
50 55 60
Lys Leu Val Gln Glu Val Thr Asp Phe Ala Lys Thr Cys Val Ala Asp
65 70 75 80
Glu Ser Ala Ala Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp
85 90 95
Lys Leu Cys Ala Ile Pro Asn Leu Arg Glu Asn Tyr Gly Glu Leu Ala
100 105 110
Asp Cys Cys Thr Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln
115 120 125
His Lys Asp Asp Asn Pro Ser Leu Pro Pro Phe Glu Arg Pro Glu Ala
130 135 140
Glu Ala Met Cys Thr Ser Phe Lys Glu Asn Pro Thr Thr Phe Met Gly
145 150 155 160
His Tyr Leu His Glu Val Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro
165 170 175
Glu Leu Leu Tyr Tyr Ala Glu Gln Tyr Asn Glu Ile Leu Thr Gln Cys
180 185 190
Cys Ala Glu Ala Asp Lys Glu Ser Cys Leu Thr Pro Lys Leu Asp Gly
195 200 205
Val Lys Glu Lys Ala Leu Val Ser Ser Val Arg Gln Arg Met Lys Cys
210 215 220
Ser Ser Met Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val
225 230 235 240
Ala Arg Leu Ser Gln Thr Phe Pro Asn Ala Asp Phe Ala Glu Ile Thr
245 250 255
Lys Leu Ala Thr Asp Leu Thr Lys Val Asn Lys Glu Cys Cys His Gly
260 265 270
Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Glu Leu Ala Lys Tyr Met
275 280 285
Cys Glu Asn Gln Ala Thr Ile Ser Ser Lys Leu Gln Thr Cys Cys Asp
290 295 300
Lys Pro Leu Leu Lys Lys Ala His Cys Leu Ser Glu Val Glu His Asp
305 310 315 320
Thr Met Pro Ala Asp Leu Pro Ala Ile Ala Ala Asp Phe Val Glu Asp
325 330 335
Gln Glu Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly
340 345 350
Thr Phe Leu Tyr Glu Tyr Ser Arg Arg His Pro Asp Tyr Ser Val Ser
355 360 365
Leu Leu Leu Arg Leu Ala Lys Lys Tyr Glu Ala Thr Leu Glu Lys Cys
370 375 380
Cys Ala Glu Ala Asn Pro Pro Ala Cys Tyr Gly Thr Val Leu Ala Glu
385 390 395 400
Phe Gln Pro Leu Val Glu Glu Pro Lys Asn Leu Val Lys Thr Asn Cys
405 410 415
Asp Leu Tyr Glu Lys Leu Gly Glu Tyr Gly Phe Gln Asn Ala Ile Leu
420 425 430
Val Arg Tyr Thr Gln Lys Ala Pro Gln Val Ser Thr Pro Thr Leu Val
435 440 445
Glu Ala Ala Arg Asn Leu Gly Arg Val Gly Thr Lys Cys Cys Thr Leu
450 455 460
Pro Glu Asp Gln Arg Leu Pro Cys Val Glu Asp Tyr Leu Ser Ala Ile
465 470 475 480
Leu Asn Arg Val Cys Leu Leu His Glu Lys Thr Pro Val Ser Glu His
485 490 495
Val Thr Lys Cys Cys Ser Gly Ser Leu Val Glu Arg Arg Pro Cys Phe
500 505 510
Ser Ala Leu Thr Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Lys Ala
515 520 525
Glu Thr Phe Thr Phe His Ser Asp Ile Cys Thr Leu Pro Glu Lys Glu
530 535 540
Lys Gln Ile Lys Lys Gln Thr Ala Leu Ala Glu Leu Val Lys His Lys
545 550 555 560
Pro Lys Ala Thr Ala Glu Gln Leu Lys Thr Val Met Asp Asp Phe Ala
565 570 575
Gln Phe Leu Asp Thr Cys Cys Lys Ala Ala Asp Lys Asp Thr Cys Phe
580 585 590
Ser Thr Glu Gly Pro Asn Leu Val Thr Arg Cys Lys Asp Ala Leu Ala
595 600 605
<210> 2
<211> 18
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 2
Met Lys Trp Val Thr Phe Leu Leu Leu Leu Phe Val Ser Gly Ser Ala
1 5 10 15
Phe Ser
<210> 3
<211> 6
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 3
Arg Gly Val Phe Arg Arg
1 5
<210> 4
<211> 584
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 4
Glu Ala His Lys Ser Glu Ile Ala His Arg Tyr Asn Asp Leu Gly Glu
1 5 10 15
Gln His Phe Lys Gly Leu Val Leu Ile Ala Phe Ser Gln Tyr Leu Gln
20 25 30
Lys Cys Ser Tyr Asp Glu His Ala Lys Leu Val Gln Glu Val Thr Asp
35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Ala Asn Cys Asp Lys
50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Ala Ile Pro Asn Leu
65 70 75 80
Arg Glu Asn Tyr Gly Glu Leu Ala Asp Cys Cys Thr Lys Gln Glu Pro
85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Ser Leu
100 105 110
Pro Pro Phe Glu Arg Pro Glu Ala Glu Ala Met Cys Thr Ser Phe Lys
115 120 125
Glu Asn Pro Thr Thr Phe Met Gly His Tyr Leu His Glu Val Ala Arg
130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Tyr Tyr Ala Glu Gln
145 150 155 160
Tyr Asn Glu Ile Leu Thr Gln Cys Cys Ala Glu Ala Asp Lys Glu Ser
165 170 175
Cys Leu Thr Pro Lys Leu Asp Gly Val Lys Glu Lys Ala Leu Val Ser
180 185 190
Ser Val Arg Gln Arg Met Lys Cys Ser Ser Met Gln Lys Phe Gly Glu
195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Thr Phe Pro
210 215 220
Asn Ala Asp Phe Ala Glu Ile Thr Lys Leu Ala Thr Asp Leu Thr Lys
225 230 235 240
Val Asn Lys Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255
Arg Ala Glu Leu Ala Lys Tyr Met Cys Glu Asn Gln Ala Thr Ile Ser
260 265 270
Ser Lys Leu Gln Thr Cys Cys Asp Lys Pro Leu Leu Lys Lys Ala His
275 280 285
Cys Leu Ser Glu Val Glu His Asp Thr Met Pro Ala Asp Leu Pro Ala
290 295 300
Ile Ala Ala Asp Phe Val Glu Asp Gln Glu Val Cys Lys Asn Tyr Ala
305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Thr Phe Leu Tyr Glu Tyr Ser Arg
325 330 335
Arg His Pro Asp Tyr Ser Val Ser Leu Leu Leu Arg Leu Ala Lys Lys
340 345 350
Tyr Glu Ala Thr Leu Glu Lys Cys Cys Ala Glu Ala Asn Pro Pro Ala
355 360 365
Cys Tyr Gly Thr Val Leu Ala Glu Phe Gln Pro Leu Val Glu Glu Pro
370 375 380
Lys Asn Leu Val Lys Thr Asn Cys Asp Leu Tyr Glu Lys Leu Gly Glu
385 390 395 400
Tyr Gly Phe Gln Asn Ala Ile Leu Val Arg Tyr Thr Gln Lys Ala Pro
405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Ala Ala Arg Asn Leu Gly Arg
420 425 430
Val Gly Thr Lys Cys Cys Thr Leu Pro Glu Asp Gln Arg Leu Pro Cys
435 440 445
Val Glu Asp Tyr Leu Ser Ala Ile Leu Asn Arg Val Cys Leu Leu His
450 455 460
Glu Lys Thr Pro Val Ser Glu His Val Thr Lys Cys Cys Ser Gly Ser
465 470 475 480
Leu Val Glu Arg Arg Pro Cys Phe Ser Ala Leu Thr Val Asp Glu Thr
485 490 495
Tyr Val Pro Lys Glu Phe Lys Ala Glu Thr Phe Thr Phe His Ser Asp
500 505 510
Ile Cys Thr Leu Pro Glu Lys Glu Lys Gln Ile Lys Lys Gln Thr Ala
515 520 525
Leu Ala Glu Leu Val Lys His Lys Pro Lys Ala Thr Ala Glu Gln Leu
530 535 540
Lys Thr Val Met Asp Asp Phe Ala Gln Phe Leu Asp Thr Cys Cys Lys
545 550 555 560
Ala Ala Asp Lys Asp Thr Cys Phe Ser Thr Glu Gly Pro Asn Leu Val
565 570 575
Thr Arg Cys Lys Asp Ala Leu Ala
580
<210> 5
<211> 609
<212> PRT
<213> 智人(Homo sapiens)
<220>
<221> MISC_FEATURE
<222> (1)..(18)
<223> 信号肽
<220>
<221> MISC_FEATURE
<222> (19)..(24)
<223> 前肽
<220>
<221> MISC_FEATURE
<222> (25)..(609)
<223> 血清白蛋白
<400> 5
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala
20 25 30
His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu
35 40 45
Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val
50 55 60
Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp
65 70 75 80
Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp
85 90 95
Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala
100 105 110
Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln
115 120 125
His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val
130 135 140
Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys
145 150 155 160
Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro
165 170 175
Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys
180 185 190
Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu
195 200 205
Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys
210 215 220
Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val
225 230 235 240
Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser
245 250 255
Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly
260 265 270
Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile
275 280 285
Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu
290 295 300
Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp
305 310 315 320
Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser
325 330 335
Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly
340 345 350
Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val
355 360 365
Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys
370 375 380
Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu
385 390 395 400
Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys
405 410 415
Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu
420 425 430
Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val
435 440 445
Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His
450 455 460
Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val
465 470 475 480
Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg
485 490 495
Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe
500 505 510
Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala
515 520 525
Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu
530 535 540
Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys
545 550 555 560
Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala
565 570 575
Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe
580 585 590
Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly
595 600 605
Leu
<210> 6
<211> 18
<212> PRT
<213> 智人(Homo sapiens)
<400> 6
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser
<210> 7
<211> 6
<212> PRT
<213> 智人(Homo sapiens)
<400> 7
Arg Gly Val Phe Arg Arg
1 5
<210> 8
<211> 585
<212> PRT
<213> 智人(Homo sapiens)
<400> 8
Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu
1 5 10 15
Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln
20 25 30
Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu
35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys
50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu
65 70 75 80
Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro
85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu
100 105 110
Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His
115 120 125
Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg
130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg
145 150 155 160
Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala
165 170 175
Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser
180 185 190
Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu
195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro
210 215 220
Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys
225 230 235 240
Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255
Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser
260 265 270
Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His
275 280 285
Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser
290 295 300
Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala
305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg
325 330 335
Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr
340 345 350
Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu
355 360 365
Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro
370 375 380
Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu
385 390 395 400
Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro
405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys
420 425 430
Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys
435 440 445
Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His
450 455 460
Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser
465 470 475 480
Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr
485 490 495
Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp
500 505 510
Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala
515 520 525
Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu
530 535 540
Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys
545 550 555 560
Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val
565 570 575
Ala Ala Ser Gln Ala Ala Leu Gly Leu
580 585
<210> 9
<211> 1827
<212> DNA
<213> 小家鼠(Mus musculus)
<220>
<221> misc_feature
<222> (1)..(72)
<223> 信号肽
<220>
<221> misc_feature
<222> (73)..(90)
<223> 前肽
<220>
<221> misc_feature
<222> (91)..(1824)
<223> 血清白蛋白
<400> 9
atgaagtggg taacctttct cctcctcctc ttcgtctccg gctctgcttt ttccaggggt 60
gtgtttcgcc gagaagcaca caagagtgag atcgcccatc ggtataatga tttgggagaa 120
caacatttca aaggcctagt cctgattgcc ttttcccagt atctccagaa atgctcatac 180
gatgagcatg ccaaattagt gcaggaagta acagactttg caaagacgtg tgttgccgat 240
gagtctgccg ccaactgtga caaatccctt cacactcttt ttggagataa gttgtgtgcc 300
attccaaacc tccgtgaaaa ctatggtgaa ctggctgact gctgtacaaa acaagagccc 360
gaaagaaacg aatgtttcct gcaacacaaa gatgacaacc ccagcctgcc accatttgaa 420
aggccagagg ctgaggccat gtgcacctcc tttaaggaaa acccaaccac ctttatggga 480
cactatttgc atgaagttgc cagaagacat ccttatttct atgccccaga acttctttac 540
tatgctgagc agtacaatga gattctgacc cagtgttgtg cagaggctga caaggaaagc 600
tgcctgaccc cgaagcttga tggtgtgaag gagaaagcat tggtctcatc tgtccgtcag 660
agaatgaagt gctccagtat gcagaagttt ggagagagag cttttaaagc atgggcagta 720
gctcgtctga gccagacatt ccccaatgct gactttgcag aaatcaccaa attggcaaca 780
gacctgacca aagtcaacaa ggagtgctgc catggtgacc tgctggaatg cgcagatgac 840
agggcggaac ttgccaagta catgtgtgaa aaccaggcga ctatctccag caaactgcag 900
acttgctgcg ataaaccact gttgaagaaa gcccactgtc ttagtgaggt ggagcatgac 960
accatgcctg ctgatctgcc tgccattgct gctgattttg ttgaggacca ggaagtgtgc 1020
aagaactatg ctgaggccaa ggatgtcttc ctgggcacgt tcttgtatga atattcaaga 1080
agacaccctg attactctgt atccctgttg ctgagacttg ctaagaaata tgaagccact 1140
ctggaaaagt gctgcgctga agccaatcct cccgcatgct acggcacagt gcttgctgaa 1200
tttcagcctc ttgtagaaga gcctaagaac ttggtcaaaa ccaactgtga tctttacgag 1260
aagcttggag aatatggatt ccaaaatgcc attctagttc gctacaccca gaaagcacct 1320
caggtgtcaa ccccaactct cgtggaggct gcaagaaacc taggaagagt gggcaccaag 1380
tgttgtacac ttcctgaaga tcagagactg ccttgtgtgg aagactatct gtctgcaatc 1440
ctgaaccgtg tgtgtctgct gcatgagaag accccagtga gtgagcatgt taccaagtgc 1500
tgtagtggat ccctggtgga aaggcggcca tgcttctctg ctctgacagt tgatgaaaca 1560
tatgtcccca aagagtttaa agctgagacc ttcaccttcc actctgatat ctgcacactt 1620
ccagagaagg agaagcagat taagaaacaa acggctcttg ctgagctggt gaagcacaag 1680
cccaaggcta cagcggagca actgaagact gtcatggatg actttgcaca gttcctggat 1740
acatgttgca aggctgctga caaggacacc tgcttctcga ctgagggtcc aaaccttgtc 1800
actagatgca aagacgcctt agcctaa 1827
<210> 10
<211> 72
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 10
atgaagtggg taacctttct cctcctcctc ttcgtctccg gctctgcttt ttccaggggt 60
gtgtttcgcc ga 72
<210> 11
<211> 18
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 11
gaagcacaca agagtgag 18
<210> 12
<211> 1734
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 12
atcgcccatc ggtataatga tttgggagaa caacatttca aaggcctagt cctgattgcc 60
ttttcccagt atctccagaa atgctcatac gatgagcatg ccaaattagt gcaggaagta 120
acagactttg caaagacgtg tgttgccgat gagtctgccg ccaactgtga caaatccctt 180
cacactcttt ttggagataa gttgtgtgcc attccaaacc tccgtgaaaa ctatggtgaa 240
ctggctgact gctgtacaaa acaagagccc gaaagaaacg aatgtttcct gcaacacaaa 300
gatgacaacc ccagcctgcc accatttgaa aggccagagg ctgaggccat gtgcacctcc 360
tttaaggaaa acccaaccac ctttatggga cactatttgc atgaagttgc cagaagacat 420
ccttatttct atgccccaga acttctttac tatgctgagc agtacaatga gattctgacc 480
cagtgttgtg cagaggctga caaggaaagc tgcctgaccc cgaagcttga tggtgtgaag 540
gagaaagcat tggtctcatc tgtccgtcag agaatgaagt gctccagtat gcagaagttt 600
ggagagagag cttttaaagc atgggcagta gctcgtctga gccagacatt ccccaatgct 660
gactttgcag aaatcaccaa attggcaaca gacctgacca aagtcaacaa ggagtgctgc 720
catggtgacc tgctggaatg cgcagatgac agggcggaac ttgccaagta catgtgtgaa 780
aaccaggcga ctatctccag caaactgcag acttgctgcg ataaaccact gttgaagaaa 840
gcccactgtc ttagtgaggt ggagcatgac accatgcctg ctgatctgcc tgccattgct 900
gctgattttg ttgaggacca ggaagtgtgc aagaactatg ctgaggccaa ggatgtcttc 960
ctgggcacgt tcttgtatga atattcaaga agacaccctg attactctgt atccctgttg 1020
ctgagacttg ctaagaaata tgaagccact ctggaaaagt gctgcgctga agccaatcct 1080
cccgcatgct acggcacagt gcttgctgaa tttcagcctc ttgtagaaga gcctaagaac 1140
ttggtcaaaa ccaactgtga tctttacgag aagcttggag aatatggatt ccaaaatgcc 1200
attctagttc gctacaccca gaaagcacct caggtgtcaa ccccaactct cgtggaggct 1260
gcaagaaacc taggaagagt gggcaccaag tgttgtacac ttcctgaaga tcagagactg 1320
ccttgtgtgg aagactatct gtctgcaatc ctgaaccgtg tgtgtctgct gcatgagaag 1380
accccagtga gtgagcatgt taccaagtgc tgtagtggat ccctggtgga aaggcggcca 1440
tgcttctctg ctctgacagt tgatgaaaca tatgtcccca aagagtttaa agctgagacc 1500
ttcaccttcc actctgatat ctgcacactt ccagagaagg agaagcagat taagaaacaa 1560
acggctcttg ctgagctggt gaagcacaag cccaaggcta cagcggagca actgaagact 1620
gtcatggatg actttgcaca gttcctggat acatgttgca aggctgctga caaggacacc 1680
tgcttctcga ctgagggtcc aaaccttgtc actagatgca aagacgcctt agcc 1734
<210> 13
<211> 1830
<212> DNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(72)
<223> 信号肽
<220>
<221> misc_feature
<222> (73)..(90)
<223> 前肽
<220>
<221> misc_feature
<222> (91)..(1827)
<223> 血清白蛋白
<400> 13
atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttccaggggt 60
gtgtttcgtc gagatgcaca caagagtgag gttgctcatc ggtttaaaga tttgggagaa 120
gaaaatttca aagccttggt gttgattgcc tttgctcagt atcttcagca gtgtccattt 180
gaagatcatg taaaattagt gaatgaagta actgaatttg caaaaacatg tgttgctgat 240
gagtcagctg aaaattgtga caaatcactt catacccttt ttggagacaa attatgcaca 300
gttgcaactc ttcgtgaaac ctatggtgaa atggctgact gctgtgcaaa acaagaacct 360
gagagaaatg aatgcttctt gcaacacaaa gatgacaacc caaacctccc ccgattggtg 420
agaccagagg ttgatgtgat gtgcactgct tttcatgaca atgaagagac atttttgaaa 480
aaatacttat atgaaattgc cagaagacat ccttactttt atgccccgga actccttttc 540
tttgctaaaa ggtataaagc tgcttttaca gaatgttgcc aagctgctga taaagctgcc 600
tgcctgttgc caaagctcga tgaacttcgg gatgaaggga aggcttcgtc tgccaaacag 660
agactcaagt gtgccagtct ccaaaaattt ggagaaagag ctttcaaagc atgggcagta 720
gctcgcctga gccagagatt tcccaaagct gagtttgcag aagtttccaa gttagtgaca 780
gatcttacca aagtccacac ggaatgctgc catggagatc tgcttgaatg tgctgatgac 840
agggcggacc ttgccaagta tatctgtgaa aatcaagatt cgatctccag taaactgaag 900
gaatgctgtg aaaaacctct gttggaaaaa tcccactgca ttgccgaagt ggaaaatgat 960
gagatgcctg ctgacttgcc ttcattagct gctgattttg ttgaaagtaa ggatgtttgc 1020
aaaaactatg ctgaggcaaa ggatgtcttc ctgggcatgt ttttgtatga atatgcaaga 1080
aggcatcctg attactctgt cgtgctgctg ctgagacttg ccaagacata tgaaaccact 1140
ctagagaagt gctgtgccgc tgcagatcct catgaatgct atgccaaagt gttcgatgaa 1200
tttaaacctc ttgtggaaga gcctcagaat ttaatcaaac aaaattgtga gctttttgag 1260
cagcttggag agtacaaatt ccagaatgcg ctattagttc gttacaccaa gaaagtaccc 1320
caagtgtcaa ctccaactct tgtagaggtc tcaagaaacc taggaaaagt gggcagcaaa 1380
tgttgtaaac atcctgaagc aaaaagaatg ccctgtgcag aagactatct atccgtggtc 1440
ctgaaccagt tatgtgtgtt gcatgagaaa acgccagtaa gtgacagagt caccaaatgc 1500
tgcacagaat ccttggtgaa caggcgacca tgcttttcag ctctggaagt cgatgaaaca 1560
tacgttccca aagagtttaa tgctgaaaca ttcaccttcc atgcagatat atgcacactt 1620
tctgagaagg agagacaaat caagaaacaa actgcacttg ttgagctcgt gaaacacaag 1680
cccaaggcaa caaaagagca actgaaagct gttatggatg atttcgcagc ttttgtagag 1740
aagtgctgca aggctgacga taaggagacc tgctttgccg aggagggtaa aaaacttgtt 1800
gctgcaagtc aagctgcctt aggcttataa 1830
<210> 14
<211> 72
<212> DNA
<213> 智人(Homo sapiens)
<400> 14
atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttccaggggt 60
gtgtttcgtc ga 72
<210> 15
<211> 18
<212> DNA
<213> 智人(Homo sapiens)
<400> 15
gatgcacaca agagtgag 18
<210> 16
<211> 1737
<212> DNA
<213> 智人(Homo sapiens)
<400> 16
gttgctcatc ggtttaaaga tttgggagaa gaaaatttca aagccttggt gttgattgcc 60
tttgctcagt atcttcagca gtgtccattt gaagatcatg taaaattagt gaatgaagta 120
actgaatttg caaaaacatg tgttgctgat gagtcagctg aaaattgtga caaatcactt 180
catacccttt ttggagacaa attatgcaca gttgcaactc ttcgtgaaac ctatggtgaa 240
atggctgact gctgtgcaaa acaagaacct gagagaaatg aatgcttctt gcaacacaaa 300
gatgacaacc caaacctccc ccgattggtg agaccagagg ttgatgtgat gtgcactgct 360
tttcatgaca atgaagagac atttttgaaa aaatacttat atgaaattgc cagaagacat 420
ccttactttt atgccccgga actccttttc tttgctaaaa ggtataaagc tgcttttaca 480
gaatgttgcc aagctgctga taaagctgcc tgcctgttgc caaagctcga tgaacttcgg 540
gatgaaggga aggcttcgtc tgccaaacag agactcaagt gtgccagtct ccaaaaattt 600
ggagaaagag ctttcaaagc atgggcagta gctcgcctga gccagagatt tcccaaagct 660
gagtttgcag aagtttccaa gttagtgaca gatcttacca aagtccacac ggaatgctgc 720
catggagatc tgcttgaatg tgctgatgac agggcggacc ttgccaagta tatctgtgaa 780
aatcaagatt cgatctccag taaactgaag gaatgctgtg aaaaacctct gttggaaaaa 840
tcccactgca ttgccgaagt ggaaaatgat gagatgcctg ctgacttgcc ttcattagct 900
gctgattttg ttgaaagtaa ggatgtttgc aaaaactatg ctgaggcaaa ggatgtcttc 960
ctgggcatgt ttttgtatga atatgcaaga aggcatcctg attactctgt cgtgctgctg 1020
ctgagacttg ccaagacata tgaaaccact ctagagaagt gctgtgccgc tgcagatcct 1080
catgaatgct atgccaaagt gttcgatgaa tttaaacctc ttgtggaaga gcctcagaat 1140
ttaatcaaac aaaattgtga gctttttgag cagcttggag agtacaaatt ccagaatgcg 1200
ctattagttc gttacaccaa gaaagtaccc caagtgtcaa ctccaactct tgtagaggtc 1260
tcaagaaacc taggaaaagt gggcagcaaa tgttgtaaac atcctgaagc aaaaagaatg 1320
ccctgtgcag aagactatct atccgtggtc ctgaaccagt tatgtgtgtt gcatgagaaa 1380
acgccagtaa gtgacagagt caccaaatgc tgcacagaat ccttggtgaa caggcgacca 1440
tgcttttcag ctctggaagt cgatgaaaca tacgttccca aagagtttaa tgctgaaaca 1500
ttcaccttcc atgcagatat atgcacactt tctgagaagg agagacaaat caagaaacaa 1560
actgcacttg ttgagctcgt gaaacacaag cccaaggcaa caaaagagca actgaaagct 1620
gttatggatg atttcgcagc ttttgtagag aagtgctgca aggctgacga taaggagacc 1680
tgctttgccg aggagggtaa aaaacttgtt gctgcaagtc aagctgcctt aggctta 1737
<210> 17
<211> 23484
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(46)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (47)..(17381)
<223> 人序列
<220>
<221> misc_feature
<222> (17382)..(17387)
<223> XhoI
<220>
<221> misc_feature
<222> (17388)..(17421)
<223> LoxP
<220>
<221> misc_feature
<222> (17422)..(18108)
<223> Prm1
<220>
<221> misc_feature
<222> (18109)..(19249)
<223> Crei
<220>
<221> misc_feature
<222> (19250)..(19545)
<223> SV40 PolyA
<220>
<221> misc_feature
<222> (19546)..(20758)
<223> hUbi
<220>
<221> misc_feature
<222> (20759)..(20825)
<223> em7
<220>
<221> misc_feature
<222> (20826)..(21629)
<223> Neo
<220>
<221> misc_feature
<222> (21630)..(22119)
<223> PGK PolyA
<220>
<221> misc_feature
<222> (22120)..(22153)
<223> LoxP
<220>
<221> misc_feature
<222> (22160)..(22185)
<223> I-CeuI
<220>
<221> misc_feature
<222> (22186)..(22191)
<223> NheI
<220>
<221> misc_feature
<222> (22192)..(23484)
<223> 小鼠序列
<400> 17
tgcacacaga tcacctttcc tatcaacccc actagcctct ggcaaaatga agtgggtaac 60
ctttatttcc cttctttttc tctttagctc ggcttattcc aggggtgtgt ttcgtcgaga 120
tgcacgtaag aaatccattt ttctattgtt caacttttat tctattttcc cagtaaaata 180
aagttttagt aaactctgca tctttaaaga attattttgg catttatttc taaaatggca 240
tagtattttg tatttgtgaa gtcttacaag gttatcttat taataaaatt caaacatcct 300
aggtaaaaaa aaaaaaaggt cagaattgtt tagtgactgt aattttcttt tgcgcactaa 360
ggaaagtgca aagtaactta gagtgactga aacttcacag aatagggttg aagattgaat 420
tcataactat cccaaagacc tatccattgc actatgcttt atttaaaaac cacaaaacct 480
gtgctgttga tctcataaat agaacttgta tttatattta ttttcatttt agtctgtctt 540
cttggttgct gttgatagac actaaaagag tattagatat tatctaagtt tgaatataag 600
gctataaata tttaataatt tttaaaatag tattcttggt aattgaatta ttcttctgtt 660
taaaggcaga agaaataatt gaacatcatc ctgagttttt ctgtaggaat cagagcccaa 720
tattttgaaa caaatgcata atctaagtca aatggaaaga aatataaaaa gtaacattat 780
tacttcttgt tttcttcagt atttaacaat cctttttttt cttcccttgc ccagacaaga 840
gtgaggttgc tcatcggttt aaagatttgg gagaagaaaa tttcaaagcc ttgtaagtta 900
aaatattgat gaatcaaatt taatgtttct aatagtgttg tttattattc taaagtgctt 960
atatttcctt gtcatcaggg ttcagattct aaaacagtgc tgcctcgtag agttttctgc 1020
gttgaggaag atattctgta tctgggctat ccaataaggt agtcactggt cacatggcta 1080
ttgagtactt caaatatgac aagtgcaact gagaaacaaa aacttaaatt gtatttaatt 1140
gtagttaatt tgaatgtata tagtcacatg tggctaatgg ctactgtatt ggacagtaca 1200
gctctggaac ttgcttggtg gaaaggactt taatataggt ttcctttggt ggcttaccca 1260
ctaaatcttc tttacatagc aagcattcct gtgcttagtt gggaatattt aatttttttt 1320
tttttttaag acagggtctc gctctgtcgc ccaggctgga gtgcagtggc gcaatctcgg 1380
ctcactgcaa actccgcctc ccgggttcac gccattctcc tgcctcagcc tcccgagtag 1440
ctgggactac aggcgcccgc catcacgccc ggctaatctt ttgtattttt agtagagatg 1500
gggtttcacc gtgtgccagg atggtctcaa tctcctgaca tcgtgatctg cccacctcgg 1560
cctcccaaag tgctgggatt acaggagtga gccaccgcgc ccggcctatt taaatgtttt 1620
ttaatctagt aaaaaatgag aaaattgttt ttttaaaagt ctacctaatc ctacaggcta 1680
attaaagacg tgtgtgggga tcaggtgcgg tggttcacac ctgtaatccc agcactttgg 1740
aaggctgatg caggaggatt gcttgagccc aggagttcaa gaccagcctg ggcaagtctc 1800
tttaaaaaaa acaaaacaaa caaacaaaaa aattaggcat ggtggcacat gcctgtagtc 1860
ctagctactt aggaggctga cgtaggagga tcgtttggac ctgagaggtc aaggctacag 1920
tgagccatga ttgtgccact gcactccagc ctgggtgaca gagtgagact ctgtctcaaa 1980
aaagaaaaag gaaatctgtg gggtttgttt tagttttaag taattctaag gactttaaaa 2040
atgcctagtc ttgacaatta gatctatttg gcatacaatt tgcttgctta atctatgtgt 2100
gtgcatagat ctactgacac acgcatacat ataaacatta gggaactacc attctctttg 2160
cgtaggaagc cacatatgcc tatctaggcc tcagatcata cctgatatga ataggctttc 2220
tggataatgg tgaagaagat gtataaaaga tagaacctat acccatacat gatttgttct 2280
ctagcgtagc aacctgttac atattaaagt tttattatac tacatttttc tacatccttt 2340
gtttcagggt gttgattgcc tttgctcagt atcttcagca gtgtccattt gaagatcatg 2400
taaaattagt gaatgaagta actgaatttg caaaaacatg tgttgctgat gagtcagctg 2460
aaaattgtga caaatcactt gtaagtacat tctaattgtg gagattcttt cttctgtttg 2520
aagtaatccc aagcatttca aaggaatttt ttttaagttt tctcaattat tattaagtgt 2580
cctgatttgt aagaaacact aaaaagttgc tcatagactg ataagccatt gtttcttttg 2640
tgatagagat gctttagcta tgtccacagt tttaaaatca tttctttatt gagaccaaac 2700
acaacagtca tggtgtattt aaatggcaat ttgtcattta taaacacctc tttttaaaat 2760
ttgaggtttg gtttcttttt gtagaggcta atagggatat gatagcatgt atttatttat 2820
ttatttatct tattttatta tagtaagaac ccttaacatg agatctaccc tgttatattt 2880
ttaagtgtac aatccattat tgttaactac gggtacactg ttgtatagct tactcatctt 2940
gctgtattaa aactttgtgc ccattgatta gtaacccctc gtttcgtcct cccccagcca 3000
ctggcaacca gcattatact ctttgattct atgagtttga ctactttagc taccttatat 3060
aagtggtatt atgtactgtt tatcttttta tgactgactt atttccctta gcatagtgca 3120
ttcaaagtcc aaccatgttg ttgcctattg cagaatttcc ttcttttcaa ggctgaataa 3180
tattccagtg catgtgtgta ccacattttc tttatccatt aatttgttga ttgatagaca 3240
tttaggttgg ttttctacat cttgactatc atgaatagtg ttgcaatgaa cacaggagag 3300
ctactatctc ttagagatga tatcatggtt tttatcatca gaaaacaccc actgatttct 3360
atgctaattt tgttacctgg gtggaataat agtacagcta tatattcctc attttagata 3420
tctttgtatt tctacataca ataaaaaagc agagtactta gtcatgttga agaactttaa 3480
acttttagta tttccagatc aatcttcaaa acaaggacag gtttatcttt ctctcaccac 3540
tcaatctata tatacctctt gtgggcaagg ccagttttta tcactggagc ctttcccctt 3600
tttattatgt acctctccct cacagcagag tcaggacttt aactttacac aatactatgg 3660
ctctacatat gaaatcttaa aaatacataa aaattaataa attctgtcta gagtagtata 3720
ttttccctgg ggttacagtt actttcataa taaaaattag agataaggaa aggactcatt 3780
tattggaaag tgattttagg taacatttct ggaagaaaaa tgtctatatc ttaatagtca 3840
cttaatatat gatggattgt gttactcctc agttttcaat ggcatatact aaaacatggc 3900
cctctaaaaa gggggcaaat gaaatgagaa actctctgaa tgtttttctc ccctaggtga 3960
attcacctgc tgcttagaag cttattttct cttgatttct gttataatga ttgctcttac 4020
cctttagttt taagtttcaa aataggagtc atataacttt ccttaaagct attgactgtc 4080
tttttgtcct gttttattca ccatgagtta tagtgtgaca gttaattctt atgaaaatta 4140
tatagagatg gttaaatcat cagaaactgt aaacctcgat tgggagggga agcggatttt 4200
taaatgattt cctgaccaag cttaaccagt atattaaatc ctttgtactg ttctttggct 4260
ataaagaaaa aaggtactgt ccagcaactg aaacctgctt tcttccattt agcataccct 4320
ttttggagac aaattatgca cagttgcaac tcttcgtgaa acctatggtg aaatggctga 4380
ctgctgtgca aaacaagaac ctgagagaaa tgaatgcttc ttgcaacaca aagatgacaa 4440
cccaaacctc ccccgattgg tgagaccaga ggttgatgtg atgtgcactg cttttcatga 4500
caatgaagag acatttttga aaaagtaagt aatcagatgt ttatagttca aaattaaaaa 4560
gcatggagta actccatagg ccaacactct ataaaaatta ccataacaaa aatattttca 4620
acattaagac ttggaagttt tgttatgatg attttttaaa gaagtagtat ttgataccac 4680
aaaattctac acagcaaaaa atatgatcaa agatattttg aagtttattg aaacaggata 4740
caatctttct gaaaaattta agatagacaa attatttaat gtattacgaa gatatgtata 4800
tatggttgtt ataattgatt tcgttttagt cagcaacatt atattgccaa aatttaacca 4860
tttatgcaca cacacacaca cacacacaca cttaaccctt ttttccacat acttaaagaa 4920
tgacagagac aagaccatca tgtgcaaatt gagcttaatt ggttaattag atatctttgg 4980
aatttggagg ttctggggag aatgtcgatt acaattattt ctgtaatatt gtctgctata 5040
gaaaagtgac tgtttttctt tttcaaaatt tagatactta tatgaaattg ccagaagaca 5100
tccttacttt tatgccccgg aactcctttt ctttgctaaa aggtataaag ctgcttttac 5160
agaatgttgc caagctgctg ataaagctgc ctgcctgttg ccaaaggtat tatgcaaaag 5220
aatagaaaaa aagagttcat tatccaacct gattttgtcc attttgtggc tagatttagg 5280
gaacctgagt gtctgataca aactttccga catggtcaaa aaagccttcc ttttatctgt 5340
cttgaaaatc tttcatcttt gaaggcctac actctcgttt cttcttttaa gatttgccaa 5400
tgatgatctg tcagaggtaa tcactgtgca tgtgtttaaa gatttcacca ctttttatgg 5460
tggtgatcac tatagtgaaa tactgaaact tgtttgtcaa attgcacagc aaggggccac 5520
agttcttgtt tatcttttca tgataatttt tagtagggag ggaattcaaa gtagagaatt 5580
ttactgcatc tagatgcctg agttcatgca ttcattccat aaatatatat tatggaatgc 5640
tttattttct tttctgagga gtttactgat gttggtggag gagagactga aatgaattat 5700
acacaaaatt taaaaattag caaaattgca gcccctggga tattagcgta ctctttctct 5760
gacttttctc ccacttttaa ggctcttttt cctggcaatg tttccagttg gtttctaact 5820
acatagggaa ttccgctgtg accagaatga tcgaatgatc tttccttttc ttagagagca 5880
aaatcattat tcgctaaagg gagtacttgg gaatttaggc ataaattatg ccttcaaaat 5940
ttaatttggc acagtctcat ctgagcttat ggaggggtgt ttcatgtaga atttttcttc 6000
taattttcat caaattattc ctttttgtag ctcgatgaac ttcgggatga agggaaggct 6060
tcgtctgcca aacagagact caagtgtgcc agtctccaaa aatttggaga aagagctttc 6120
aaagcatggt aaatactttt aaacatagtt ggcatcttta taacgatgta aatgataatg 6180
cttcagtgac aaattgtaca tttttatgta ttttgcaaag tgctgtcaaa tacatttctt 6240
tggttgtcta acaggtagaa ctctaataga ggtaaaaatc agaatatcaa tgacaatttg 6300
acattatttt taatcttttc ttttctaaat agttgaataa tttagaggac gctgtccttt 6360
ttgtcctaaa aaaagggaca gatatttaag ttctatttat ttataaaatc ttggactctt 6420
attctaatgg ttcattattt ttatagagct gtaggcatgg ttctttattt aattttttaa 6480
agttattttt aatttttgtg gatacagagt aggtatacat atttacgggg tatatgagat 6540
attttgatat aagtatacaa catatataat ccctttattt aattttatct tccccccaat 6600
gatctaaaac tatttgcttg tccttttatg tcttatagtt aaattcagtc accaactaag 6660
ttgaagttac ttcttatttt tgcatagctc cagctctgat cttcatctca tgtttttgcc 6720
tgagcctctg ttttcatatt acttagttgg ttctgggagc atactttaat agccgagtca 6780
agaaaaatac tagctgcccc gtcacccaca ctcctcacct gctagtcaac agcaaatcaa 6840
cacaacagga aataaaatga aaataataga cattatgcat gctctctaga aactgtcaat 6900
tgaactgtat ttgctcatca ttcctaccat ctacaccacc aaaatcaacc aaatttatga 6960
aaaaaaacag ccccaacata aaattataca cagataaaca ggctatgatt ggttttggga 7020
aagaagtcac ctttacctga tttaggcaac tgtgaaatga ctagagaatg aagaaaatta 7080
gacgtttaca tcttgtcata gagtttgaag atagtgctgg atctttcttt ttataagtaa 7140
gatcaataaa aactccctca ttctgtagaa gttatgattt cttttctaag agacctttag 7200
aagtcagaaa aaatgtgttt caattgagaa aaaagataac tggagtttgt gtagtacttc 7260
ccagattata aaatgctttt gtatgtatta tctaatttaa tcctcaaaac ttcttcaatt 7320
tagcatgttg tcatgacact gcagaggctg aagctcagag aggctgagcc ctctgctaac 7380
aagtcctact gctaacaagt gataaagcca gagctggaag tcacatctgg actccaaacc 7440
tgatgcttct cagcctgttg ccccttttag agttcctttt taatttctgc ttttatgact 7500
tgctagattt ctacctacca cacacactct taaatggata attctgccct aaggataagt 7560
gattaccatt tggttcagaa ctagaactaa tgaattttaa aaattatttc tgtatgtcca 7620
ttttgaattt tcttatgaga aatagtattt gcctagtgtt ttcatataaa atatcgcatg 7680
ataataccat tttgattggc gattttcttt ttagggcagt agctcgcctg agccagagat 7740
ttcccaaagc tgagtttgca gaagtttcca agttagtgac agatcttacc aaagtccaca 7800
cggaatgctg ccatggagat ctgcttgaat gtgctgatga cagggtaaag agtcgtcgat 7860
atgctttttg gtagcttgca tgctcaagtt ggtagaatgg atgcgtttgg tatcattggt 7920
gatagctgac agtgggttga gattgtcttc tgtgctttcg tctgtcctat cttcaatctt 7980
tccctgccta tggtggtggt acctttctgt ttttaacctg gctataaatt accagataaa 8040
cccattcact gatttgtaac tcctttcagt catgctctaa ctgtaaatga aggcttaaac 8100
tgaagtagaa cagttacaag gttttacttg gcagaacatc ttgcaaggta gatgtctaag 8160
aagatttttt tttctttttt taagacagag tttcgctctt gtttcccagg ctggggtgca 8220
atggtgtgat cttggctcag cgcaacctct gcctcctggg ttcaagtgat tctcatgcct 8280
cagcctccca agtagctggg attacaggca tgcgccacca cacctggcta attttgtatt 8340
tttagtagag gcggggtttc accatattgt ccagactggt ctcgaactcc tgacctcagg 8400
tgatccaccc gccttggcct cccaaagtgc tgggattaca ggcatgagcc accttgccca 8460
gcctaagaag attttttgag ggaggtaggt ggacttggag aaggtcacta cttgaagaga 8520
tttttggaaa tgatgtattt ttcttctcta tattccttcc cttaattaac tctgtttgtt 8580
agatgtgcaa atatttggaa tgatatctct tttctcaaaa cttataatat tttctttctc 8640
cctttcttca agattaaact tatgggcaaa tactagaatc ctaatctctc atggcacttt 8700
ctggaaaatt taaggcggtt attttatata tgtaagcagg gcctatgact atgatcttga 8760
ctcatttttc aaaaatcttc tatattttat ttagttattt ggtttcaaaa ggcctgcact 8820
taattttggg ggattatttg gaaaaacagc attgagtttt aatgaaaaaa acttaaatgc 8880
cctaacagta gaaacataaa attaataaat aactgagctg agcacctgct actgattagt 8940
ctattttaat taagtgggaa tgtttttgta gtcctatcta catctccagg tttaggagca 9000
aacagagtat gttcatagaa ggaatatgtg tatggtctta gaatacaatg aatatgttct 9060
gccaacttaa taaaggtctg aggagaaagt gtagcaatgt caattcgtgt tgaacaattt 9120
ccaccaactt acttataggc ggaccttgcc aagtatatct gtgaaaatca agattcgatc 9180
tccagtaaac tgaaggaatg ctgtgaaaaa cctctgttgg aaaaatccca ctgcattgcc 9240
gaagtggaaa atgatgagat gcctgctgac ttgccttcat tagctgctga ttttgttgaa 9300
agtaaggatg tttgcaaaaa ctatgctgag gcaaaggatg tcttcctggg catgtaagta 9360
gataagaaat tattctttta tagctttggc atgacctcac aacttaggag gatagcctag 9420
gcttttctgt ggagttgcta caatttccct gctgcccaga atgtttcttc atccttccct 9480
ttcccaggct ttaacaattt ttgaaatagt taattagttg aatacattgt cataaaataa 9540
tacatgttca tggcaaagct caacattcct tactccttag gggtatttct gaaaatacgt 9600
ctagaaacat tttgtgtata tataaattat gtatacttca gtcattcatt ccaagtgtat 9660
ttcttgaaca tctataatat atgtgtgtga ctatgtattg cctgtctatc taactaatct 9720
aatctaatct agtctatcta tctaatctat gcaatgatag caaagaagta taaaaagaaa 9780
tatagagtct gacaccaggt gctttatatt tggtgaaaag accagaagtt cagtataatg 9840
gcaatatggt aggcaactca attacaaaat aaatgtttac atattgtcag aagttgtggt 9900
gataaactgc atttttgttg ttggattatg ataatgcact aaataatatt tcctaaaatt 9960
atgtacccta caagatttca ctcatacaga gaagaaagag aatattttaa gaacatatct 10020
ctgcccatct atttatcaga atccttttga gatgtagttt aaatcaaaca aaatgttaat 10080
aaaaataaca agtatcattc atcaaagact tcatatgtgc caagcagtgt gtgctttgtg 10140
tagattatgt catatagttc tcataatcca ccttccgaga cagatactat ttattttttg 10200
agacagagtt ttactcttgt tgcccaggct ggagtgcaat ggtgccatct cggctcacca 10260
caacctccgc ctcccaggtt caagcgattc tcctgcctca gcctcctggg attacaggca 10320
tgcaccacca tgcctggcta attttgtatt tttagtagag atggggtttc accatgttgg 10380
tcagactggt ctcaaactcc tgacctctgg tgatatgcct gcctcagcct cctaaagtgc 10440
tgggattaca ggcatgagcc actgtgccca gccgacagat actattatta tttccattct 10500
accgagaagg agactaaggc tctgatcatt taaataagtt gcctaaggtg atgcagtgat 10560
ataagtagca gagctaggaa ttgagccttg gtaactttaa ctctggaccc caagtcctta 10620
gctactaagc tttactgcat ggggtttagt caaattaaga cttttggaat atgagttact 10680
tttgagatta gctttgtgat attttttgtg ctcatttgtc caacaaagtc tattttattt 10740
tcatcttaat taggtttttg tatgaatatg caagaaggca tcctgattac tctgtcgtgc 10800
tgctgctgag acttgccaag acatatgaaa ccactctaga gaagtgctgt gccgctgcag 10860
atcctcatga atgctatgcc aaagtggtag gtttattgtt ggaaaaaaat gtagttcttt 10920
gactgatgat tccaataatg agaaagaaaa ataatgcaag aatgtaaaat gatatacagt 10980
gcaatttaga tcttttcttg agatggtttc aattctggaa tcttaaacat gaaagaaaaa 11040
gtagccttag aatgattaac aaaatttaga ctagttagaa tagaaagatc tgaatagagc 11100
aatctctaaa aaattttgat ctttttttct ctttttcaca atcctgagaa caaaaaaaaa 11160
ttaaatttaa atgttaatta gaagatattt aacttagatg taaagtgagt taacctgatt 11220
ccaggattaa tcaagtacta gaattagtat cttatggcaa attatagaac ctatcccttt 11280
agaatatttt caaatctttt tgaggatgtt taggaatagt tttacaagaa attaagttag 11340
gagaggaaat ctgttctgga ggatttttag ggttcccact agcatatgta atggtttctg 11400
aactattcag aatcagagaa aactcatttt tcctgctttc aagaagctac tgtatgccag 11460
gcaccatgca caaacaatga ccaacgtaaa atctctcatt ttggagagcc tggaatctaa 11520
ctggaaaggt gaactaataa taataatatg tacaatcata gccatcattt attaaacttt 11580
tattatatgc aaggcactgt ttaatttcat tagcttacct ggtttacaga gcagctctat 11640
gagatgagtg ccatctttgc ccctatttta gggataagga ttctgaaatg tggagatggt 11700
aagtaaaatt gcacaactga agaatgagtt acatgacttg gctcaaatac tggtcattga 11760
actccagagc ctgaatattc ttaaccactt acatgatgca agctcaccaa ataaatagtt 11820
cgaatgtatt gtgacagagc ggcattgata ttcatctatt catgtggctt tgagtaggaa 11880
gaagaaagga tatcattctg accagagggg tgaaaaacaa cctgcatctg atcctgaggc 11940
ataatactat taacacaatt cttttatgtt tcagttcgat gaatttaaac ctcttgtgga 12000
agagcctcag aatttaatca aacaaaattg tgagcttttt gagcagcttg gagagtacaa 12060
attccagaat gcgtaagtaa tttttattga ctgatttttt ttatcaattt gtaattattt 12120
aagacttaat atatgagcca cctagcatag aacttttaag aatgaaaata cattgcatat 12180
ttctaatcac tctttgtcaa gaaagatagg agaggagaga taaaatagtt gatggggtgg 12240
agaggtctat atttgaatgt agtctaaaaa ttgttctctt aagattggaa gtatgtaggc 12300
tgggagggta aataccaaat cttggtatat cagaactgag catgtccctt gaaggttaag 12360
aaatagttaa tgggcaaata gagcatggca atattttgta gagcagcaag tagtaggcct 12420
tgaatagatg tcgctcaaaa agtaatatgt aagctgaaca caaaaatgta acaaatgaat 12480
ttagatacat atttgaatat taaattcagg ttgtttggga gatgcaccta gtctttgatg 12540
gttaaacctt tccctccata gaagagacag agacagaatg gcttgctgga ctaatgtccc 12600
aattcaatag agtcttatct atgaaggtta aaaacaagaa gagacatatt atacagtaga 12660
tatttattgt gtggctcata cacatggtgc tcttctgatt atggatttta gagataataa 12720
cagtgaacaa gacatagttt ctttcctcga gtagattaaa gtcatacatt gacttttaat 12780
ggtgactggc attcttaata catgattatt atatattagg taccatgtca gattaattat 12840
aatactttac tacttttaat ttaacccttg aactatccct attgagtcag atatatttcc 12900
ttccattttc tacttgtatc tttcaagttt agcatatgct gatacatatg aagctctctc 12960
caggttttat tgaaagaaga aattaataaa tttattaatg tcactgaatt aggcaactca 13020
ctttcccaag attatgcaag tggtacaggt ggaactcaaa gccaagttta actagttgtt 13080
caggagaatg ttttctaccc tccactaacc cactactctg cagatggaga taatatgatg 13140
aatggaacat agcaacatct tagttgattc cggccaagtg ttctctgttt tatctactat 13200
gttagacagt ttcttgcctt gctgaaaaca catgacttct ttttttcagg ctattagttc 13260
gttacaccaa gaaagtaccc caagtgtcaa ctccaactct tgtagaggtc tcaagaaacc 13320
taggaaaagt gggcagcaaa tgttgtaaac atcctgaagc aaaaagaatg ccctgtgcag 13380
aagactatgt gagtctttaa aaaaatataa taaattaata atgaaaaaat tttaccttta 13440
gatattgata atgctagctt tcataagcag aaggaagtaa tgtgtgtgtg tgcatgtttg 13500
tgtgcatgtg tgtgtgcatg cacgtgtgtg tatgtgtgat attggcagtc aaggccccga 13560
ggatgataat tttttttttt tttttgagac ggagtctcgc tttgttgtcc aggctggagt 13620
gcagtggtgc catctcggct cactgcaacc tccgcctccc aggttcaagc cattctcctg 13680
cctcagcctc ccaagtagct gggactacag gtgcatgcca ccatgcctgg ctaatttttt 13740
gtatttttag tagaaaattt tcagcttcac ctcttttgaa tttctgctct cctgcctgtt 13800
ctttagctat ccgtggtcct gaaccagtta tgtgtgttgc atgagaaaac gccagtaagt 13860
gacagagtca ccaaatgctg cacagaatcc ttggtgaaca ggcgaccatg cttttcagct 13920
ctggaagtcg atgaaacata cgttcccaaa gagtttaatg ctgaaacatt caccttccat 13980
gcagatatat gcacactttc tgagaaggag agacaaatca agaaacaaac gtgaggagta 14040
tttcattact gcatgtgttt gtagtcttga tagcaagaac tgtcaattca agctagcaac 14100
tttttcctga agtagtgatt atatttctta gaggaaagta ttggagtgtt gcccttatta 14160
tgctgataag agtacccaga ataaaatgaa taacttttta aagacaaaat cctctgttat 14220
aatattgcta aaattattca gagtaatatt gtggattaaa gccacaatag aataacatgt 14280
taggccatat tcagtagaaa aagatgaaca attaactgat aaatttgtgc acatggcaaa 14340
ttagttaatg ggaaccatag gagaatttat ttctagatgt aaataattat tttaagtttg 14400
ccctatggtg gccccacaca tgagacaaac ccccaagatg tgacttttga gaatgagact 14460
tggataaaaa acatgtagaa atgcaagccc tgaagctcaa ctccctattg ctatcacagg 14520
ggttataatt gcataaaatt tagctataga aagttgctgt catctcttgt gggctgtaat 14580
catcgtctag gcttaagagt aatattgcaa aacctgtcat gcccacacaa atctctccct 14640
ggcattgttg tctttgcaga tgtcagtgaa agagaaccag cagctcccat gagtttggat 14700
agccttattt tctatagcct ccccactatt agctttgaag ggagcaaagt ttaagaacca 14760
aatataaagt ttctcatctt tatagatgag aaaaatttta aataaagtcc aagataatta 14820
aatttttaag gatcattttt agctctttaa tagcaataaa actcaatatg acataatatg 14880
gcacttccaa aatctgaata atatataatt gcaatgacat acttcttttc agagatttac 14940
tgaaaagaaa tttgttgaca ctacataacg tgatgagtgg tttatactga ttgtttcagt 15000
tggtcttccc accaactcca tgaaagtgga ttttattatc ctcatcatgc agatgagaat 15060
attgagactt atagcggtat gcctgagccc caaagtactc agagttgcct ggctccaaga 15120
tttataatct taaatgatgg gactaccatc cttactctct ccatttttct atacgtgagt 15180
aatgtttttt ctgttttttt tttttctttt tccattcaaa ctcagtgcac ttgttgagct 15240
cgtgaaacac aagcccaagg caacaaaaga gcaactgaaa gctgttatgg atgatttcgc 15300
agcttttgta gagaagtgct gcaaggctga cgataaggag acctgctttg ccgaggaggt 15360
actacagttc tcttcatttt aatatgtcca gtattcattt ttgcatgttt ggttaggcta 15420
gggcttaggg atttatatat caaaggaggc tttgtacatg tgggacaggg atcttatttt 15480
acaaacaatt gtcttacaaa atgaataaaa cagcactttg tttttatctc ctgctctatt 15540
gtgccatact gttaaatgtt tataatgcct gttctgtttc caaatttgtg atgcttatga 15600
atattaatag gaatatttgt aaggcctgaa atattttgat catgaaatca aaacattaat 15660
ttatttaaac atttacttga aatgtggtgg tttgtgattt agttgatttt ataggctagt 15720
gggagaattt acattcaaat gtctaaatca cttaaaattg ccctttatgg cctgacagta 15780
actttttttt attcatttgg ggacaactat gtccgtgagc ttccgtccag agattatagt 15840
agtaaattgt aattaaagga tatgatgcac gtgaaatcac tttgcaatca tcaatagctt 15900
cataaatgtt aattttgtat cctaatagta atgctaatat tttcctaaca tctgtcatgt 15960
ctttgtgttc agggtaaaaa acttgttgct gcaagtcaag ctgccttagg cttataacat 16020
cacatttaaa agcatctcag gtaactatat tttgaatttt ttaaaaaagt aactataata 16080
gttattatta aaatagcaaa gattgaccat ttccaagagc catatagacc agcaccgacc 16140
actattctaa actatttatg tatgtaaata ttagctttta aaattctcaa aatagttgct 16200
gagttgggaa ccactattat ttctattttg tagatgagaa aatgaagata aacatcaaag 16260
catagattaa gtaattttcc aaagggtcaa aattcaaaat tgaaaccaaa gtttcagtgt 16320
tgcccattgt cctgttctga cttatatgat gcggtacaca gagccatcca agtaagtgat 16380
ggctcagcag tggaatactc tgggaattag gctgaaccac atgaaagagt gctttatagg 16440
gcaaaaacag ttgaatatca gtgatttcac atggttcaac ctaatagttc aactcatcct 16500
ttccattgga gaatatgatg gatctacctt ctgtgaactt tatagtgaag aatctgctat 16560
tacatttcca atttgtcaac atgctgagct ttaataggac ttatcttctt atgacaacat 16620
ttattggtgt gtccccttgc ctagcccaac agaagaattc agcagccgta agtctaggac 16680
aggcttaaat tgttttcact ggtgtaaatt gcagaaagat gatctaagta atttggcatt 16740
tattttaata ggtttgaaaa acacatgcca ttttacaaat aagacttata tttgtccttt 16800
tgtttttcag cctaccatga gaataagaga aagaaaatga agatcaaaag cttattcatc 16860
tgtttttctt tttcgttggt gtaaagccaa caccctgtct aaaaaacata aatttcttta 16920
atcattttgc ctcttttctc tgtgcttcaa ttaataaaaa atggaaagaa tctaatagag 16980
tggtacagca ctgttatttt tcaaagatgt gttgctatcc tgaaaattct gtaggttctg 17040
tggaagttcc agtgttctct cttattccac ttcggtagag gatttctagt ttcttgtggg 17100
ctaattaaat aaatcattaa tactcttcta agttatggat tataaacatt caaaataata 17160
ttttgacatt atgataattc tgaataaaag aacaaaaacc atggtatagg taaggaatat 17220
aaaacatggc ttttacctta gaaaaaacaa ttctaaaatt catatggaat caaaaaagag 17280
cctgcagaac caaagtaaga ctaagcaaaa agaacaaatt acctgatttc aaactacact 17340
ataaggccat agtcaccgaa acagcaaggt actggtataa actcgagata acttcgtata 17400
atgtatgcta tacgaagtta tatgcatgcc agtagcagca cccacgtcca ccttctgtct 17460
agtaatgtcc aacacctccc tcagtccaaa cactgctctg catccatgtg gctcccattt 17520
atacctgaag cacttgatgg ggcctcaatg ttttactaga gcccaccccc ctgcaactct 17580
gagaccctct ggatttgtct gtcagtgcct cactggggcg ttggataatt tcttaaaagg 17640
tcaagttccc tcagcagcat tctctgagca gtctgaagat gtgtgctttt cacagttcaa 17700
atccatgtgg ctgtttcacc cacctgcctg gccttgggtt atctatcagg acctagccta 17760
gaagcaggtg tgtggcactt aacacctaag ctgagtgact aactgaacac tcaagtggat 17820
gccatctttg tcacttcttg actgtgacac aagcaactcc tgatgccaaa gccctgccca 17880
cccctctcat gcccatattt ggacatggta caggtcctca ctggccatgg tctgtgaggt 17940
cctggtcctc tttgacttca taattcctag gggccactag tatctataag aggaagaggg 18000
tgctggctcc caggccacag cccacaaaat tccacctgct cacaggttgg ctggctcgac 18060
ccaggtggtg tcccctgctc tgagccagct cccggccaag ccagcaccat gggaaccccc 18120
aagaagaaga ggaaggtgcg taccgattta aattccaatt tactgaccgt acaccaaaat 18180
ttgcctgcat taccggtcga tgcaacgagt gatgaggttc gcaagaacct gatggacatg 18240
ttcagggatc gccaggcgtt ttctgagcat acctggaaaa tgcttctgtc cgtttgccgg 18300
tcgtgggcgg catggtgcaa gttgaataac cggaaatggt ttcccgcaga acctgaagat 18360
gttcgcgatt atcttctata tcttcaggcg cgcggtctgg cagtaaaaac tatccagcaa 18420
catttgggcc agctaaacat gcttcatcgt cggtccgggc tgccacgacc aagtgacagc 18480
aatgctgttt cactggttat gcggcggatc cgaaaagaaa acgttgatgc cggtgaacgt 18540
gcaaaacagg taaatataaa atttttaagt gtataatgat gttaaactac tgattctaat 18600
tgtttgtgta ttttaggctc tagcgttcga acgcactgat ttcgaccagg ttcgttcact 18660
catggaaaat agcgatcgct gccaggatat acgtaatctg gcatttctgg ggattgctta 18720
taacaccctg ttacgtatag ccgaaattgc caggatcagg gttaaagata tctcacgtac 18780
tgacggtggg agaatgttaa tccatattgg cagaacgaaa acgctggtta gcaccgcagg 18840
tgtagagaag gcacttagcc tgggggtaac taaactggtc gagcgatgga tttccgtctc 18900
tggtgtagct gatgatccga ataactacct gttttgccgg gtcagaaaaa atggtgttgc 18960
cgcgccatct gccaccagcc agctatcaac tcgcgccctg gaagggattt ttgaagcaac 19020
tcatcgattg atttacggcg ctaaggatga ctctggtcag agatacctgg cctggtctgg 19080
acacagtgcc cgtgtcggag ccgcgcgaga tatggcccgc gctggagttt caataccgga 19140
gatcatgcaa gctggtggct ggaccaatgt aaatattgtc atgaactata tccgtaacct 19200
ggatagtgaa acaggggcaa tggtgcgcct gctggaagat ggcgattagg cggccggccg 19260
ctaatcagcc ataccacatt tgtagaggtt ttacttgctt taaaaaacct cccacacctc 19320
cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct 19380
tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 19440
ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctggatcccc 19500
cggctagagt ttaaacacta gaactagtgg atcccccggg atcatggcct ccgcgccggg 19560
ttttggcgcc tcccgcgggc gcccccctcc tcacggcgag cgctgccacg tcagacgaag 19620
ggcgcagcga gcgtcctgat ccttccgccc ggacgctcag gacagcggcc cgctgctcat 19680
aagactcggc cttagaaccc cagtatcagc agaaggacat tttaggacgg gacttgggtg 19740
actctagggc actggttttc tttccagaga gcggaacagg cgaggaaaag tagtcccttc 19800
tcggcgattc tgcggaggga tctccgtggg gcggtgaacg ccgatgatta tataaggacg 19860
cgccgggtgt ggcacagcta gttccgtcgc agccgggatt tgggtcgcgg ttcttgtttg 19920
tggatcgctg tgatcgtcac ttggtgagta gcgggctgct gggctggccg gggctttcgt 19980
ggccgccggg ccgctcggtg ggacggaagc gtgtggagag accgccaagg gctgtagtct 20040
gggtccgcga gcaaggttgc cctgaactgg gggttggggg gagcgcagca aaatggcggc 20100
tgttcccgag tcttgaatgg aagacgcttg tgaggcgggc tgtgaggtcg ttgaaacaag 20160
gtggggggca tggtgggcgg caagaaccca aggtcttgag gccttcgcta atgcgggaaa 20220
gctcttattc gggtgagatg ggctggggca ccatctgggg accctgacgt gaagtttgtc 20280
actgactgga gaactcggtt tgtcgtctgt tgcgggggcg gcagttatgg cggtgccgtt 20340
gggcagtgca cccgtacctt tgggagcgcg cgccctcgtc gtgtcgtgac gtcacccgtt 20400
ctgttggctt ataatgcagg gtggggccac ctgccggtag gtgtgcggta ggcttttctc 20460
cgtcgcagga cgcagggttc gggcctaggg taggctctcc tgaatcgaca ggcgccggac 20520
ctctggtgag gggagggata agtgaggcgt cagtttcttt ggtcggtttt atgtacctat 20580
cttcttaagt agctgaagct ccggttttga actatgcgct cggggttggc gagtgtgttt 20640
tgtgaagttt tttaggcacc ttttgaaatg taatcatttg ggtcaatatg taattttcag 20700
tgttagacta gtaaattgtc cgctaaattc tggccgtttt tggctttttt gttagacgtg 20760
ttgacaatta atcatcggca tagtatatcg gcatagtata atacgacaag gtgaggaact 20820
aaaccatggg atcggccatt gaacaagatg gattgcacgc aggttctccg gccgcttggg 20880
tggagaggct attcggctat gactgggcac aacagacaat cggctgctct gatgccgccg 20940
tgttccggct gtcagcgcag gggcgcccgg ttctttttgt caagaccgac ctgtccggtg 21000
ccctgaatga actgcaggac gaggcagcgc ggctatcgtg gctggccacg acgggcgttc 21060
cttgcgcagc tgtgctcgac gttgtcactg aagcgggaag ggactggctg ctattgggcg 21120
aagtgccggg gcaggatctc ctgtcatctc accttgctcc tgccgagaaa gtatccatca 21180
tggctgatgc aatgcggcgg ctgcatacgc ttgatccggc tacctgccca ttcgaccacc 21240
aagcgaaaca tcgcatcgag cgagcacgta ctcggatgga agccggtctt gtcgatcagg 21300
atgatctgga cgaagagcat caggggctcg cgccagccga actgttcgcc aggctcaagg 21360
cgcgcatgcc cgacggcgat gatctcgtcg tgacccatgg cgatgcctgc ttgccgaata 21420
tcatggtgga aaatggccgc ttttctggat tcatcgactg tggccggctg ggtgtggcgg 21480
accgctatca ggacatagcg ttggctaccc gtgatattgc tgaagagctt ggcggcgaat 21540
gggctgaccg cttcctcgtg ctttacggta tcgccgctcc cgattcgcag cgcatcgcct 21600
tctatcgcct tcttgacgag ttcttctgag gggatccgct gtaagtctgc agaaattgat 21660
gatctattaa acaataaaga tgtccactaa aatggaagtt tttcctgtca tactttgtta 21720
agaagggtga gaacagagta cctacatttt gaatggaagg attggagcta cgggggtggg 21780
ggtggggtgg gattagataa atgcctgctc tttactgaag gctctttact attgctttat 21840
gataatgttt catagttgga tatcataatt taaacaagca aaaccaaatt aagggccagc 21900
tcattcctcc cactcatgat ctatagatct atagatctct cgtgggatca ttgtttttct 21960
cttgattccc actttgtggt tctaagtact gtggtttcca aatgtgtcag tttcatagcc 22020
tgaagaacga gatcagcagc ctctgttcca catacacttc attctcagta ttgttttgcc 22080
aagttctaat tccatcagac ctcgacctgc agcccctaga taacttcgta taatgtatgc 22140
tatacgaagt tatgctaggt aactataacg gtcctaaggt agcgagctag cacacatcac 22200
aaccacaacc ttctcaggta actatacttg ggacttaaaa aacataatca taatcatttt 22260
tcctaaaacg atcaagactg ataaccattt gacaagagcc atacagacaa gcaccagctg 22320
gcactcttag gtcttcacgt atggtcatca gtttgggttc catttgtaga taagaaactg 22380
aacatataaa ggtctaggtt aatgcaattt acacaaaagg agaccaaacc agggagagaa 22440
ggaaccaaaa ttaaaaattc aaaccagagc aaaggagtta gccctggttt tgctctgact 22500
tacatgaacc actatgtgga gtcctccatg ttagcctagt caagcttatc ctctggatga 22560
agttgaaacc atatgaagga atatttgggg ggtgggtcaa aacagttgtg tatcaatgat 22620
tccatgtggt ttgacccaat cattctgtga atccatttca acagaagata caacgggttc 22680
tgtttcataa taagtgatcc acttccaaat ttctgatgtg ccccatgcta agctttaaca 22740
gaatttatct tcttatgaca aagcagcctc ctttgaaaat atagccaact gcacacagct 22800
atgttgatca attttgttta taatcttgca gaagagaatt ttttaaaata gggcaataat 22860
ggaaggcttt ggcaaaaaaa ttgtttctcc atatgaaaac aaaaaactta tttttttatt 22920
caagcaaaga acctatagac ataaggctat ttcaaaatta tttcagtttt agaaagaatt 22980
gaaagttttg tagcattctg agaagacagc tttcatttgt aatcataggt aatatgtagg 23040
tcctcagaaa tggtgagacc cctgactttg acacttgggg actctgaggg accagtgatg 23100
aagagggcac aacttatatc acacatgcac gagttggggt gagagggtgt cacaacatct 23160
atcagtgtgt catctgccca ccaagtaaca gatgtcagct aagactaggt catgtgtagg 23220
ctgtctacac cagtgaaaat cgcaaaaaga atctaagaaa ttccacattt ctagaaaata 23280
ggtttggaaa ccgtattcca ttttacaaag gacacttaca tttctctttt tgttttccag 23340
gctaccctga gaaaaaaaga catgaagact caggactcat cttttctgtt ggtgtaaaat 23400
caacacccta aggaacacaa atttctttaa acatttgact tcttgtctct gtgctgcaat 23460
taataaaaaa tggaaagaat ctac 23484
<210> 18
<211> 17768
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(46)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (47)..(17381)
<223> 人序列
<220>
<221> misc_feature
<222> (17382)..(17387)
<223> XhoI
<220>
<221> misc_feature
<222> (17388)..(17421)
<223> LoxP
<220>
<221> misc_feature
<222> (17428)..(17453)
<223> I-CeuI
<220>
<221> misc_feature
<222> (17454)..(17459)
<223> NheI
<220>
<221> misc_feature
<222> (17460)..(17768)
<223> 小鼠序列
<400> 18
tgcacacaga tcacctttcc tatcaacccc actagcctct ggcaaaatga agtgggtaac 60
ctttatttcc cttctttttc tctttagctc ggcttattcc aggggtgtgt ttcgtcgaga 120
tgcacgtaag aaatccattt ttctattgtt caacttttat tctattttcc cagtaaaata 180
aagttttagt aaactctgca tctttaaaga attattttgg catttatttc taaaatggca 240
tagtattttg tatttgtgaa gtcttacaag gttatcttat taataaaatt caaacatcct 300
aggtaaaaaa aaaaaaaggt cagaattgtt tagtgactgt aattttcttt tgcgcactaa 360
ggaaagtgca aagtaactta gagtgactga aacttcacag aatagggttg aagattgaat 420
tcataactat cccaaagacc tatccattgc actatgcttt atttaaaaac cacaaaacct 480
gtgctgttga tctcataaat agaacttgta tttatattta ttttcatttt agtctgtctt 540
cttggttgct gttgatagac actaaaagag tattagatat tatctaagtt tgaatataag 600
gctataaata tttaataatt tttaaaatag tattcttggt aattgaatta ttcttctgtt 660
taaaggcaga agaaataatt gaacatcatc ctgagttttt ctgtaggaat cagagcccaa 720
tattttgaaa caaatgcata atctaagtca aatggaaaga aatataaaaa gtaacattat 780
tacttcttgt tttcttcagt atttaacaat cctttttttt cttcccttgc ccagacaaga 840
gtgaggttgc tcatcggttt aaagatttgg gagaagaaaa tttcaaagcc ttgtaagtta 900
aaatattgat gaatcaaatt taatgtttct aatagtgttg tttattattc taaagtgctt 960
atatttcctt gtcatcaggg ttcagattct aaaacagtgc tgcctcgtag agttttctgc 1020
gttgaggaag atattctgta tctgggctat ccaataaggt agtcactggt cacatggcta 1080
ttgagtactt caaatatgac aagtgcaact gagaaacaaa aacttaaatt gtatttaatt 1140
gtagttaatt tgaatgtata tagtcacatg tggctaatgg ctactgtatt ggacagtaca 1200
gctctggaac ttgcttggtg gaaaggactt taatataggt ttcctttggt ggcttaccca 1260
ctaaatcttc tttacatagc aagcattcct gtgcttagtt gggaatattt aatttttttt 1320
tttttttaag acagggtctc gctctgtcgc ccaggctgga gtgcagtggc gcaatctcgg 1380
ctcactgcaa actccgcctc ccgggttcac gccattctcc tgcctcagcc tcccgagtag 1440
ctgggactac aggcgcccgc catcacgccc ggctaatctt ttgtattttt agtagagatg 1500
gggtttcacc gtgtgccagg atggtctcaa tctcctgaca tcgtgatctg cccacctcgg 1560
cctcccaaag tgctgggatt acaggagtga gccaccgcgc ccggcctatt taaatgtttt 1620
ttaatctagt aaaaaatgag aaaattgttt ttttaaaagt ctacctaatc ctacaggcta 1680
attaaagacg tgtgtgggga tcaggtgcgg tggttcacac ctgtaatccc agcactttgg 1740
aaggctgatg caggaggatt gcttgagccc aggagttcaa gaccagcctg ggcaagtctc 1800
tttaaaaaaa acaaaacaaa caaacaaaaa aattaggcat ggtggcacat gcctgtagtc 1860
ctagctactt aggaggctga cgtaggagga tcgtttggac ctgagaggtc aaggctacag 1920
tgagccatga ttgtgccact gcactccagc ctgggtgaca gagtgagact ctgtctcaaa 1980
aaagaaaaag gaaatctgtg gggtttgttt tagttttaag taattctaag gactttaaaa 2040
atgcctagtc ttgacaatta gatctatttg gcatacaatt tgcttgctta atctatgtgt 2100
gtgcatagat ctactgacac acgcatacat ataaacatta gggaactacc attctctttg 2160
cgtaggaagc cacatatgcc tatctaggcc tcagatcata cctgatatga ataggctttc 2220
tggataatgg tgaagaagat gtataaaaga tagaacctat acccatacat gatttgttct 2280
ctagcgtagc aacctgttac atattaaagt tttattatac tacatttttc tacatccttt 2340
gtttcagggt gttgattgcc tttgctcagt atcttcagca gtgtccattt gaagatcatg 2400
taaaattagt gaatgaagta actgaatttg caaaaacatg tgttgctgat gagtcagctg 2460
aaaattgtga caaatcactt gtaagtacat tctaattgtg gagattcttt cttctgtttg 2520
aagtaatccc aagcatttca aaggaatttt ttttaagttt tctcaattat tattaagtgt 2580
cctgatttgt aagaaacact aaaaagttgc tcatagactg ataagccatt gtttcttttg 2640
tgatagagat gctttagcta tgtccacagt tttaaaatca tttctttatt gagaccaaac 2700
acaacagtca tggtgtattt aaatggcaat ttgtcattta taaacacctc tttttaaaat 2760
ttgaggtttg gtttcttttt gtagaggcta atagggatat gatagcatgt atttatttat 2820
ttatttatct tattttatta tagtaagaac ccttaacatg agatctaccc tgttatattt 2880
ttaagtgtac aatccattat tgttaactac gggtacactg ttgtatagct tactcatctt 2940
gctgtattaa aactttgtgc ccattgatta gtaacccctc gtttcgtcct cccccagcca 3000
ctggcaacca gcattatact ctttgattct atgagtttga ctactttagc taccttatat 3060
aagtggtatt atgtactgtt tatcttttta tgactgactt atttccctta gcatagtgca 3120
ttcaaagtcc aaccatgttg ttgcctattg cagaatttcc ttcttttcaa ggctgaataa 3180
tattccagtg catgtgtgta ccacattttc tttatccatt aatttgttga ttgatagaca 3240
tttaggttgg ttttctacat cttgactatc atgaatagtg ttgcaatgaa cacaggagag 3300
ctactatctc ttagagatga tatcatggtt tttatcatca gaaaacaccc actgatttct 3360
atgctaattt tgttacctgg gtggaataat agtacagcta tatattcctc attttagata 3420
tctttgtatt tctacataca ataaaaaagc agagtactta gtcatgttga agaactttaa 3480
acttttagta tttccagatc aatcttcaaa acaaggacag gtttatcttt ctctcaccac 3540
tcaatctata tatacctctt gtgggcaagg ccagttttta tcactggagc ctttcccctt 3600
tttattatgt acctctccct cacagcagag tcaggacttt aactttacac aatactatgg 3660
ctctacatat gaaatcttaa aaatacataa aaattaataa attctgtcta gagtagtata 3720
ttttccctgg ggttacagtt actttcataa taaaaattag agataaggaa aggactcatt 3780
tattggaaag tgattttagg taacatttct ggaagaaaaa tgtctatatc ttaatagtca 3840
cttaatatat gatggattgt gttactcctc agttttcaat ggcatatact aaaacatggc 3900
cctctaaaaa gggggcaaat gaaatgagaa actctctgaa tgtttttctc ccctaggtga 3960
attcacctgc tgcttagaag cttattttct cttgatttct gttataatga ttgctcttac 4020
cctttagttt taagtttcaa aataggagtc atataacttt ccttaaagct attgactgtc 4080
tttttgtcct gttttattca ccatgagtta tagtgtgaca gttaattctt atgaaaatta 4140
tatagagatg gttaaatcat cagaaactgt aaacctcgat tgggagggga agcggatttt 4200
taaatgattt cctgaccaag cttaaccagt atattaaatc ctttgtactg ttctttggct 4260
ataaagaaaa aaggtactgt ccagcaactg aaacctgctt tcttccattt agcataccct 4320
ttttggagac aaattatgca cagttgcaac tcttcgtgaa acctatggtg aaatggctga 4380
ctgctgtgca aaacaagaac ctgagagaaa tgaatgcttc ttgcaacaca aagatgacaa 4440
cccaaacctc ccccgattgg tgagaccaga ggttgatgtg atgtgcactg cttttcatga 4500
caatgaagag acatttttga aaaagtaagt aatcagatgt ttatagttca aaattaaaaa 4560
gcatggagta actccatagg ccaacactct ataaaaatta ccataacaaa aatattttca 4620
acattaagac ttggaagttt tgttatgatg attttttaaa gaagtagtat ttgataccac 4680
aaaattctac acagcaaaaa atatgatcaa agatattttg aagtttattg aaacaggata 4740
caatctttct gaaaaattta agatagacaa attatttaat gtattacgaa gatatgtata 4800
tatggttgtt ataattgatt tcgttttagt cagcaacatt atattgccaa aatttaacca 4860
tttatgcaca cacacacaca cacacacaca cttaaccctt ttttccacat acttaaagaa 4920
tgacagagac aagaccatca tgtgcaaatt gagcttaatt ggttaattag atatctttgg 4980
aatttggagg ttctggggag aatgtcgatt acaattattt ctgtaatatt gtctgctata 5040
gaaaagtgac tgtttttctt tttcaaaatt tagatactta tatgaaattg ccagaagaca 5100
tccttacttt tatgccccgg aactcctttt ctttgctaaa aggtataaag ctgcttttac 5160
agaatgttgc caagctgctg ataaagctgc ctgcctgttg ccaaaggtat tatgcaaaag 5220
aatagaaaaa aagagttcat tatccaacct gattttgtcc attttgtggc tagatttagg 5280
gaacctgagt gtctgataca aactttccga catggtcaaa aaagccttcc ttttatctgt 5340
cttgaaaatc tttcatcttt gaaggcctac actctcgttt cttcttttaa gatttgccaa 5400
tgatgatctg tcagaggtaa tcactgtgca tgtgtttaaa gatttcacca ctttttatgg 5460
tggtgatcac tatagtgaaa tactgaaact tgtttgtcaa attgcacagc aaggggccac 5520
agttcttgtt tatcttttca tgataatttt tagtagggag ggaattcaaa gtagagaatt 5580
ttactgcatc tagatgcctg agttcatgca ttcattccat aaatatatat tatggaatgc 5640
tttattttct tttctgagga gtttactgat gttggtggag gagagactga aatgaattat 5700
acacaaaatt taaaaattag caaaattgca gcccctggga tattagcgta ctctttctct 5760
gacttttctc ccacttttaa ggctcttttt cctggcaatg tttccagttg gtttctaact 5820
acatagggaa ttccgctgtg accagaatga tcgaatgatc tttccttttc ttagagagca 5880
aaatcattat tcgctaaagg gagtacttgg gaatttaggc ataaattatg ccttcaaaat 5940
ttaatttggc acagtctcat ctgagcttat ggaggggtgt ttcatgtaga atttttcttc 6000
taattttcat caaattattc ctttttgtag ctcgatgaac ttcgggatga agggaaggct 6060
tcgtctgcca aacagagact caagtgtgcc agtctccaaa aatttggaga aagagctttc 6120
aaagcatggt aaatactttt aaacatagtt ggcatcttta taacgatgta aatgataatg 6180
cttcagtgac aaattgtaca tttttatgta ttttgcaaag tgctgtcaaa tacatttctt 6240
tggttgtcta acaggtagaa ctctaataga ggtaaaaatc agaatatcaa tgacaatttg 6300
acattatttt taatcttttc ttttctaaat agttgaataa tttagaggac gctgtccttt 6360
ttgtcctaaa aaaagggaca gatatttaag ttctatttat ttataaaatc ttggactctt 6420
attctaatgg ttcattattt ttatagagct gtaggcatgg ttctttattt aattttttaa 6480
agttattttt aatttttgtg gatacagagt aggtatacat atttacgggg tatatgagat 6540
attttgatat aagtatacaa catatataat ccctttattt aattttatct tccccccaat 6600
gatctaaaac tatttgcttg tccttttatg tcttatagtt aaattcagtc accaactaag 6660
ttgaagttac ttcttatttt tgcatagctc cagctctgat cttcatctca tgtttttgcc 6720
tgagcctctg ttttcatatt acttagttgg ttctgggagc atactttaat agccgagtca 6780
agaaaaatac tagctgcccc gtcacccaca ctcctcacct gctagtcaac agcaaatcaa 6840
cacaacagga aataaaatga aaataataga cattatgcat gctctctaga aactgtcaat 6900
tgaactgtat ttgctcatca ttcctaccat ctacaccacc aaaatcaacc aaatttatga 6960
aaaaaaacag ccccaacata aaattataca cagataaaca ggctatgatt ggttttggga 7020
aagaagtcac ctttacctga tttaggcaac tgtgaaatga ctagagaatg aagaaaatta 7080
gacgtttaca tcttgtcata gagtttgaag atagtgctgg atctttcttt ttataagtaa 7140
gatcaataaa aactccctca ttctgtagaa gttatgattt cttttctaag agacctttag 7200
aagtcagaaa aaatgtgttt caattgagaa aaaagataac tggagtttgt gtagtacttc 7260
ccagattata aaatgctttt gtatgtatta tctaatttaa tcctcaaaac ttcttcaatt 7320
tagcatgttg tcatgacact gcagaggctg aagctcagag aggctgagcc ctctgctaac 7380
aagtcctact gctaacaagt gataaagcca gagctggaag tcacatctgg actccaaacc 7440
tgatgcttct cagcctgttg ccccttttag agttcctttt taatttctgc ttttatgact 7500
tgctagattt ctacctacca cacacactct taaatggata attctgccct aaggataagt 7560
gattaccatt tggttcagaa ctagaactaa tgaattttaa aaattatttc tgtatgtcca 7620
ttttgaattt tcttatgaga aatagtattt gcctagtgtt ttcatataaa atatcgcatg 7680
ataataccat tttgattggc gattttcttt ttagggcagt agctcgcctg agccagagat 7740
ttcccaaagc tgagtttgca gaagtttcca agttagtgac agatcttacc aaagtccaca 7800
cggaatgctg ccatggagat ctgcttgaat gtgctgatga cagggtaaag agtcgtcgat 7860
atgctttttg gtagcttgca tgctcaagtt ggtagaatgg atgcgtttgg tatcattggt 7920
gatagctgac agtgggttga gattgtcttc tgtgctttcg tctgtcctat cttcaatctt 7980
tccctgccta tggtggtggt acctttctgt ttttaacctg gctataaatt accagataaa 8040
cccattcact gatttgtaac tcctttcagt catgctctaa ctgtaaatga aggcttaaac 8100
tgaagtagaa cagttacaag gttttacttg gcagaacatc ttgcaaggta gatgtctaag 8160
aagatttttt tttctttttt taagacagag tttcgctctt gtttcccagg ctggggtgca 8220
atggtgtgat cttggctcag cgcaacctct gcctcctggg ttcaagtgat tctcatgcct 8280
cagcctccca agtagctggg attacaggca tgcgccacca cacctggcta attttgtatt 8340
tttagtagag gcggggtttc accatattgt ccagactggt ctcgaactcc tgacctcagg 8400
tgatccaccc gccttggcct cccaaagtgc tgggattaca ggcatgagcc accttgccca 8460
gcctaagaag attttttgag ggaggtaggt ggacttggag aaggtcacta cttgaagaga 8520
tttttggaaa tgatgtattt ttcttctcta tattccttcc cttaattaac tctgtttgtt 8580
agatgtgcaa atatttggaa tgatatctct tttctcaaaa cttataatat tttctttctc 8640
cctttcttca agattaaact tatgggcaaa tactagaatc ctaatctctc atggcacttt 8700
ctggaaaatt taaggcggtt attttatata tgtaagcagg gcctatgact atgatcttga 8760
ctcatttttc aaaaatcttc tatattttat ttagttattt ggtttcaaaa ggcctgcact 8820
taattttggg ggattatttg gaaaaacagc attgagtttt aatgaaaaaa acttaaatgc 8880
cctaacagta gaaacataaa attaataaat aactgagctg agcacctgct actgattagt 8940
ctattttaat taagtgggaa tgtttttgta gtcctatcta catctccagg tttaggagca 9000
aacagagtat gttcatagaa ggaatatgtg tatggtctta gaatacaatg aatatgttct 9060
gccaacttaa taaaggtctg aggagaaagt gtagcaatgt caattcgtgt tgaacaattt 9120
ccaccaactt acttataggc ggaccttgcc aagtatatct gtgaaaatca agattcgatc 9180
tccagtaaac tgaaggaatg ctgtgaaaaa cctctgttgg aaaaatccca ctgcattgcc 9240
gaagtggaaa atgatgagat gcctgctgac ttgccttcat tagctgctga ttttgttgaa 9300
agtaaggatg tttgcaaaaa ctatgctgag gcaaaggatg tcttcctggg catgtaagta 9360
gataagaaat tattctttta tagctttggc atgacctcac aacttaggag gatagcctag 9420
gcttttctgt ggagttgcta caatttccct gctgcccaga atgtttcttc atccttccct 9480
ttcccaggct ttaacaattt ttgaaatagt taattagttg aatacattgt cataaaataa 9540
tacatgttca tggcaaagct caacattcct tactccttag gggtatttct gaaaatacgt 9600
ctagaaacat tttgtgtata tataaattat gtatacttca gtcattcatt ccaagtgtat 9660
ttcttgaaca tctataatat atgtgtgtga ctatgtattg cctgtctatc taactaatct 9720
aatctaatct agtctatcta tctaatctat gcaatgatag caaagaagta taaaaagaaa 9780
tatagagtct gacaccaggt gctttatatt tggtgaaaag accagaagtt cagtataatg 9840
gcaatatggt aggcaactca attacaaaat aaatgtttac atattgtcag aagttgtggt 9900
gataaactgc atttttgttg ttggattatg ataatgcact aaataatatt tcctaaaatt 9960
atgtacccta caagatttca ctcatacaga gaagaaagag aatattttaa gaacatatct 10020
ctgcccatct atttatcaga atccttttga gatgtagttt aaatcaaaca aaatgttaat 10080
aaaaataaca agtatcattc atcaaagact tcatatgtgc caagcagtgt gtgctttgtg 10140
tagattatgt catatagttc tcataatcca ccttccgaga cagatactat ttattttttg 10200
agacagagtt ttactcttgt tgcccaggct ggagtgcaat ggtgccatct cggctcacca 10260
caacctccgc ctcccaggtt caagcgattc tcctgcctca gcctcctggg attacaggca 10320
tgcaccacca tgcctggcta attttgtatt tttagtagag atggggtttc accatgttgg 10380
tcagactggt ctcaaactcc tgacctctgg tgatatgcct gcctcagcct cctaaagtgc 10440
tgggattaca ggcatgagcc actgtgccca gccgacagat actattatta tttccattct 10500
accgagaagg agactaaggc tctgatcatt taaataagtt gcctaaggtg atgcagtgat 10560
ataagtagca gagctaggaa ttgagccttg gtaactttaa ctctggaccc caagtcctta 10620
gctactaagc tttactgcat ggggtttagt caaattaaga cttttggaat atgagttact 10680
tttgagatta gctttgtgat attttttgtg ctcatttgtc caacaaagtc tattttattt 10740
tcatcttaat taggtttttg tatgaatatg caagaaggca tcctgattac tctgtcgtgc 10800
tgctgctgag acttgccaag acatatgaaa ccactctaga gaagtgctgt gccgctgcag 10860
atcctcatga atgctatgcc aaagtggtag gtttattgtt ggaaaaaaat gtagttcttt 10920
gactgatgat tccaataatg agaaagaaaa ataatgcaag aatgtaaaat gatatacagt 10980
gcaatttaga tcttttcttg agatggtttc aattctggaa tcttaaacat gaaagaaaaa 11040
gtagccttag aatgattaac aaaatttaga ctagttagaa tagaaagatc tgaatagagc 11100
aatctctaaa aaattttgat ctttttttct ctttttcaca atcctgagaa caaaaaaaaa 11160
ttaaatttaa atgttaatta gaagatattt aacttagatg taaagtgagt taacctgatt 11220
ccaggattaa tcaagtacta gaattagtat cttatggcaa attatagaac ctatcccttt 11280
agaatatttt caaatctttt tgaggatgtt taggaatagt tttacaagaa attaagttag 11340
gagaggaaat ctgttctgga ggatttttag ggttcccact agcatatgta atggtttctg 11400
aactattcag aatcagagaa aactcatttt tcctgctttc aagaagctac tgtatgccag 11460
gcaccatgca caaacaatga ccaacgtaaa atctctcatt ttggagagcc tggaatctaa 11520
ctggaaaggt gaactaataa taataatatg tacaatcata gccatcattt attaaacttt 11580
tattatatgc aaggcactgt ttaatttcat tagcttacct ggtttacaga gcagctctat 11640
gagatgagtg ccatctttgc ccctatttta gggataagga ttctgaaatg tggagatggt 11700
aagtaaaatt gcacaactga agaatgagtt acatgacttg gctcaaatac tggtcattga 11760
actccagagc ctgaatattc ttaaccactt acatgatgca agctcaccaa ataaatagtt 11820
cgaatgtatt gtgacagagc ggcattgata ttcatctatt catgtggctt tgagtaggaa 11880
gaagaaagga tatcattctg accagagggg tgaaaaacaa cctgcatctg atcctgaggc 11940
ataatactat taacacaatt cttttatgtt tcagttcgat gaatttaaac ctcttgtgga 12000
agagcctcag aatttaatca aacaaaattg tgagcttttt gagcagcttg gagagtacaa 12060
attccagaat gcgtaagtaa tttttattga ctgatttttt ttatcaattt gtaattattt 12120
aagacttaat atatgagcca cctagcatag aacttttaag aatgaaaata cattgcatat 12180
ttctaatcac tctttgtcaa gaaagatagg agaggagaga taaaatagtt gatggggtgg 12240
agaggtctat atttgaatgt agtctaaaaa ttgttctctt aagattggaa gtatgtaggc 12300
tgggagggta aataccaaat cttggtatat cagaactgag catgtccctt gaaggttaag 12360
aaatagttaa tgggcaaata gagcatggca atattttgta gagcagcaag tagtaggcct 12420
tgaatagatg tcgctcaaaa agtaatatgt aagctgaaca caaaaatgta acaaatgaat 12480
ttagatacat atttgaatat taaattcagg ttgtttggga gatgcaccta gtctttgatg 12540
gttaaacctt tccctccata gaagagacag agacagaatg gcttgctgga ctaatgtccc 12600
aattcaatag agtcttatct atgaaggtta aaaacaagaa gagacatatt atacagtaga 12660
tatttattgt gtggctcata cacatggtgc tcttctgatt atggatttta gagataataa 12720
cagtgaacaa gacatagttt ctttcctcga gtagattaaa gtcatacatt gacttttaat 12780
ggtgactggc attcttaata catgattatt atatattagg taccatgtca gattaattat 12840
aatactttac tacttttaat ttaacccttg aactatccct attgagtcag atatatttcc 12900
ttccattttc tacttgtatc tttcaagttt agcatatgct gatacatatg aagctctctc 12960
caggttttat tgaaagaaga aattaataaa tttattaatg tcactgaatt aggcaactca 13020
ctttcccaag attatgcaag tggtacaggt ggaactcaaa gccaagttta actagttgtt 13080
caggagaatg ttttctaccc tccactaacc cactactctg cagatggaga taatatgatg 13140
aatggaacat agcaacatct tagttgattc cggccaagtg ttctctgttt tatctactat 13200
gttagacagt ttcttgcctt gctgaaaaca catgacttct ttttttcagg ctattagttc 13260
gttacaccaa gaaagtaccc caagtgtcaa ctccaactct tgtagaggtc tcaagaaacc 13320
taggaaaagt gggcagcaaa tgttgtaaac atcctgaagc aaaaagaatg ccctgtgcag 13380
aagactatgt gagtctttaa aaaaatataa taaattaata atgaaaaaat tttaccttta 13440
gatattgata atgctagctt tcataagcag aaggaagtaa tgtgtgtgtg tgcatgtttg 13500
tgtgcatgtg tgtgtgcatg cacgtgtgtg tatgtgtgat attggcagtc aaggccccga 13560
ggatgataat tttttttttt tttttgagac ggagtctcgc tttgttgtcc aggctggagt 13620
gcagtggtgc catctcggct cactgcaacc tccgcctccc aggttcaagc cattctcctg 13680
cctcagcctc ccaagtagct gggactacag gtgcatgcca ccatgcctgg ctaatttttt 13740
gtatttttag tagaaaattt tcagcttcac ctcttttgaa tttctgctct cctgcctgtt 13800
ctttagctat ccgtggtcct gaaccagtta tgtgtgttgc atgagaaaac gccagtaagt 13860
gacagagtca ccaaatgctg cacagaatcc ttggtgaaca ggcgaccatg cttttcagct 13920
ctggaagtcg atgaaacata cgttcccaaa gagtttaatg ctgaaacatt caccttccat 13980
gcagatatat gcacactttc tgagaaggag agacaaatca agaaacaaac gtgaggagta 14040
tttcattact gcatgtgttt gtagtcttga tagcaagaac tgtcaattca agctagcaac 14100
tttttcctga agtagtgatt atatttctta gaggaaagta ttggagtgtt gcccttatta 14160
tgctgataag agtacccaga ataaaatgaa taacttttta aagacaaaat cctctgttat 14220
aatattgcta aaattattca gagtaatatt gtggattaaa gccacaatag aataacatgt 14280
taggccatat tcagtagaaa aagatgaaca attaactgat aaatttgtgc acatggcaaa 14340
ttagttaatg ggaaccatag gagaatttat ttctagatgt aaataattat tttaagtttg 14400
ccctatggtg gccccacaca tgagacaaac ccccaagatg tgacttttga gaatgagact 14460
tggataaaaa acatgtagaa atgcaagccc tgaagctcaa ctccctattg ctatcacagg 14520
ggttataatt gcataaaatt tagctataga aagttgctgt catctcttgt gggctgtaat 14580
catcgtctag gcttaagagt aatattgcaa aacctgtcat gcccacacaa atctctccct 14640
ggcattgttg tctttgcaga tgtcagtgaa agagaaccag cagctcccat gagtttggat 14700
agccttattt tctatagcct ccccactatt agctttgaag ggagcaaagt ttaagaacca 14760
aatataaagt ttctcatctt tatagatgag aaaaatttta aataaagtcc aagataatta 14820
aatttttaag gatcattttt agctctttaa tagcaataaa actcaatatg acataatatg 14880
gcacttccaa aatctgaata atatataatt gcaatgacat acttcttttc agagatttac 14940
tgaaaagaaa tttgttgaca ctacataacg tgatgagtgg tttatactga ttgtttcagt 15000
tggtcttccc accaactcca tgaaagtgga ttttattatc ctcatcatgc agatgagaat 15060
attgagactt atagcggtat gcctgagccc caaagtactc agagttgcct ggctccaaga 15120
tttataatct taaatgatgg gactaccatc cttactctct ccatttttct atacgtgagt 15180
aatgtttttt ctgttttttt tttttctttt tccattcaaa ctcagtgcac ttgttgagct 15240
cgtgaaacac aagcccaagg caacaaaaga gcaactgaaa gctgttatgg atgatttcgc 15300
agcttttgta gagaagtgct gcaaggctga cgataaggag acctgctttg ccgaggaggt 15360
actacagttc tcttcatttt aatatgtcca gtattcattt ttgcatgttt ggttaggcta 15420
gggcttaggg atttatatat caaaggaggc tttgtacatg tgggacaggg atcttatttt 15480
acaaacaatt gtcttacaaa atgaataaaa cagcactttg tttttatctc ctgctctatt 15540
gtgccatact gttaaatgtt tataatgcct gttctgtttc caaatttgtg atgcttatga 15600
atattaatag gaatatttgt aaggcctgaa atattttgat catgaaatca aaacattaat 15660
ttatttaaac atttacttga aatgtggtgg tttgtgattt agttgatttt ataggctagt 15720
gggagaattt acattcaaat gtctaaatca cttaaaattg ccctttatgg cctgacagta 15780
actttttttt attcatttgg ggacaactat gtccgtgagc ttccgtccag agattatagt 15840
agtaaattgt aattaaagga tatgatgcac gtgaaatcac tttgcaatca tcaatagctt 15900
cataaatgtt aattttgtat cctaatagta atgctaatat tttcctaaca tctgtcatgt 15960
ctttgtgttc agggtaaaaa acttgttgct gcaagtcaag ctgccttagg cttataacat 16020
cacatttaaa agcatctcag gtaactatat tttgaatttt ttaaaaaagt aactataata 16080
gttattatta aaatagcaaa gattgaccat ttccaagagc catatagacc agcaccgacc 16140
actattctaa actatttatg tatgtaaata ttagctttta aaattctcaa aatagttgct 16200
gagttgggaa ccactattat ttctattttg tagatgagaa aatgaagata aacatcaaag 16260
catagattaa gtaattttcc aaagggtcaa aattcaaaat tgaaaccaaa gtttcagtgt 16320
tgcccattgt cctgttctga cttatatgat gcggtacaca gagccatcca agtaagtgat 16380
ggctcagcag tggaatactc tgggaattag gctgaaccac atgaaagagt gctttatagg 16440
gcaaaaacag ttgaatatca gtgatttcac atggttcaac ctaatagttc aactcatcct 16500
ttccattgga gaatatgatg gatctacctt ctgtgaactt tatagtgaag aatctgctat 16560
tacatttcca atttgtcaac atgctgagct ttaataggac ttatcttctt atgacaacat 16620
ttattggtgt gtccccttgc ctagcccaac agaagaattc agcagccgta agtctaggac 16680
aggcttaaat tgttttcact ggtgtaaatt gcagaaagat gatctaagta atttggcatt 16740
tattttaata ggtttgaaaa acacatgcca ttttacaaat aagacttata tttgtccttt 16800
tgtttttcag cctaccatga gaataagaga aagaaaatga agatcaaaag cttattcatc 16860
tgtttttctt tttcgttggt gtaaagccaa caccctgtct aaaaaacata aatttcttta 16920
atcattttgc ctcttttctc tgtgcttcaa ttaataaaaa atggaaagaa tctaatagag 16980
tggtacagca ctgttatttt tcaaagatgt gttgctatcc tgaaaattct gtaggttctg 17040
tggaagttcc agtgttctct cttattccac ttcggtagag gatttctagt ttcttgtggg 17100
ctaattaaat aaatcattaa tactcttcta agttatggat tataaacatt caaaataata 17160
ttttgacatt atgataattc tgaataaaag aacaaaaacc atggtatagg taaggaatat 17220
aaaacatggc ttttacctta gaaaaaacaa ttctaaaatt catatggaat caaaaaagag 17280
cctgcagaac caaagtaaga ctaagcaaaa agaacaaatt acctgatttc aaactacact 17340
ataaggccat agtcaccgaa acagcaaggt actggtataa actcgagata acttcgtata 17400
atgtatgcta tacgaagtta tgctaggtaa ctataacggt cctaaggtag cgagctagca 17460
cacatcacaa ccacaacctt ctcaggtaac tatacttggg acttaaaaaa cataatcata 17520
atcatttttc ctaaaacgat caagactgat aaccatttga caagagccat acagacaagc 17580
accagctggc actcttaggt cttcacgtat ggtcatcagt ttgggttcca tttgtagata 17640
agaaactgaa catataaagg tctaggttaa tgcaatttac acaaaaggag accaaaccag 17700
ggagagaagg aaccaaaatt aaaaattcaa accagagcaa aggagttagc cctggttttg 17760
ctctgact 17768
<210> 19
<211> 120
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(60)
<223> 小鼠序列
<220>
<221> misc_feature
<222> (61)..(120)
<223> 人序列
<400> 19
agagcgagtc tttctgcaca cagatcacct ttcctatcaa ccccactagc ctctggcaaa 60
atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttccaggggt 120
<210> 20
<211> 160
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(60)
<223> 人序列
<220>
<221> misc_feature
<222> (61)..(66)
<223> XhoI
<220>
<221> misc_feature
<222> (67)..(100)
<223> LoxP
<220>
<221> misc_feature
<222> (101)..(160)
<223> 盒
<400> 20
cctgatttca aactacacta taaggccata gtcaccgaaa cagcaaggta ctggtataaa 60
ctcgagataa cttcgtataa tgtatgctat acgaagttat atgcatgcca gtagcagcac 120
ccacgtccac cttctgtcta gtaatgtcca acacctccct 160
<210> 21
<211> 192
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(60)
<223> 盒
<220>
<221> misc_feature
<222> (61)..(94)
<223> LoxP
<220>
<221> misc_feature
<222> (101)..(126)
<223> I-CeuI
<220>
<221> misc_feature
<222> (127)..(132)
<223> NheI
<220>
<221> misc_feature
<222> (133)..(192)
<223> 小鼠序列
<400> 21
cattctcagt attgttttgc caagttctaa ttccatcaga cctcgacctg cagcccctag 60
ataacttcgt ataatgtatg ctatacgaag ttatgctagg taactataac ggtcctaagg 120
tagcgagcta gcacacatca caaccacaac cttctcaggt aactatactt gggacttaaa 180
aaacataatc at 192
<210> 22
<211> 198
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(60)
<223> 人序列
<220>
<221> misc_feature
<222> (61)..(66)
<223> XhoI
<220>
<221> misc_feature
<222> (67)..(100)
<223> LoxP
<220>
<221> misc_feature
<222> (107)..(132)
<223> I-CeuI
<220>
<221> misc_feature
<222> (133)..(138)
<223> NheI
<220>
<221> misc_feature
<222> (139)..(198)
<223> 小鼠序列
<400> 22
cctgatttca aactacacta taaggccata gtcaccgaaa cagcaaggta ctggtataaa 60
ctcgagataa cttcgtataa tgtatgctat acgaagttat gctaggtaac tataacggtc 120
ctaaggtagc gagctagcac acatcacaac cacaaccttc tcaggtaact atacttggga 180
cttaaaaaac ataatcat 198
<210> 23
<211> 29
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 23
gtaaccttta tttcccttct ttttctctt 29
<210> 24
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 24
agctcggctt attc 14
<210> 25
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 25
cgtgcatctc gacgaaacac 20
<210> 26
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 26
gcagaaccaa agtaagacta agcaaa 26
<210> 27
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 27
agaacaaatt acctgatttc 20
<210> 28
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 28
tgtttcggtg actatggcct tat 23
<210> 29
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 29
gccgagaagc acgtaagagt tt 22
<210> 30
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 30
atgttttttc atctctgctt gt 22
<210> 31
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 31
aataccaggc ttccattact agaaaaa 27
<210> 32
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 32
ccctcccatg gcctaacaac 20
<210> 33
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 33
ttgggcacaa cagatgtcag agagc 25
<210> 34
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 34
acgtgccttg cattgctta 19
<210> 35
<211> 17335
<212> DNA
<213> 智人(Homo sapiens)
<400> 35
atgaagtggg taacctttat ttcccttctt tttctcttta gctcggctta ttccaggggt 60
gtgtttcgtc gagatgcacg taagaaatcc atttttctat tgttcaactt ttattctatt 120
ttcccagtaa aataaagttt tagtaaactc tgcatcttta aagaattatt ttggcattta 180
tttctaaaat ggcatagtat tttgtatttg tgaagtctta caaggttatc ttattaataa 240
aattcaaaca tcctaggtaa aaaaaaaaaa aggtcagaat tgtttagtga ctgtaatttt 300
cttttgcgca ctaaggaaag tgcaaagtaa cttagagtga ctgaaacttc acagaatagg 360
gttgaagatt gaattcataa ctatcccaaa gacctatcca ttgcactatg ctttatttaa 420
aaaccacaaa acctgtgctg ttgatctcat aaatagaact tgtatttata tttattttca 480
ttttagtctg tcttcttggt tgctgttgat agacactaaa agagtattag atattatcta 540
agtttgaata taaggctata aatatttaat aatttttaaa atagtattct tggtaattga 600
attattcttc tgtttaaagg cagaagaaat aattgaacat catcctgagt ttttctgtag 660
gaatcagagc ccaatatttt gaaacaaatg cataatctaa gtcaaatgga aagaaatata 720
aaaagtaaca ttattacttc ttgttttctt cagtatttaa caatcctttt ttttcttccc 780
ttgcccagac aagagtgagg ttgctcatcg gtttaaagat ttgggagaag aaaatttcaa 840
agccttgtaa gttaaaatat tgatgaatca aatttaatgt ttctaatagt gttgtttatt 900
attctaaagt gcttatattt ccttgtcatc agggttcaga ttctaaaaca gtgctgcctc 960
gtagagtttt ctgcgttgag gaagatattc tgtatctggg ctatccaata aggtagtcac 1020
tggtcacatg gctattgagt acttcaaata tgacaagtgc aactgagaaa caaaaactta 1080
aattgtattt aattgtagtt aatttgaatg tatatagtca catgtggcta atggctactg 1140
tattggacag tacagctctg gaacttgctt ggtggaaagg actttaatat aggtttcctt 1200
tggtggctta cccactaaat cttctttaca tagcaagcat tcctgtgctt agttgggaat 1260
atttaatttt tttttttttt taagacaggg tctcgctctg tcgcccaggc tggagtgcag 1320
tggcgcaatc tcggctcact gcaaactccg cctcccgggt tcacgccatt ctcctgcctc 1380
agcctcccga gtagctggga ctacaggcgc ccgccatcac gcccggctaa tcttttgtat 1440
ttttagtaga gatggggttt caccgtgtgc caggatggtc tcaatctcct gacatcgtga 1500
tctgcccacc tcggcctccc aaagtgctgg gattacagga gtgagccacc gcgcccggcc 1560
tatttaaatg ttttttaatc tagtaaaaaa tgagaaaatt gtttttttaa aagtctacct 1620
aatcctacag gctaattaaa gacgtgtgtg gggatcaggt gcggtggttc acacctgtaa 1680
tcccagcact ttggaaggct gatgcaggag gattgcttga gcccaggagt tcaagaccag 1740
cctgggcaag tctctttaaa aaaaacaaaa caaacaaaca aaaaaattag gcatggtggc 1800
acatgcctgt agtcctagct acttaggagg ctgacgtagg aggatcgttt ggacctgaga 1860
ggtcaaggct acagtgagcc atgattgtgc cactgcactc cagcctgggt gacagagtga 1920
gactctgtct caaaaaagaa aaaggaaatc tgtggggttt gttttagttt taagtaattc 1980
taaggacttt aaaaatgcct agtcttgaca attagatcta tttggcatac aatttgcttg 2040
cttaatctat gtgtgtgcat agatctactg acacacgcat acatataaac attagggaac 2100
taccattctc tttgcgtagg aagccacata tgcctatcta ggcctcagat catacctgat 2160
atgaataggc tttctggata atggtgaaga agatgtataa aagatagaac ctatacccat 2220
acatgatttg ttctctagcg tagcaacctg ttacatatta aagttttatt atactacatt 2280
tttctacatc ctttgtttca gggtgttgat tgcctttgct cagtatcttc agcagtgtcc 2340
atttgaagat catgtaaaat tagtgaatga agtaactgaa tttgcaaaaa catgtgttgc 2400
tgatgagtca gctgaaaatt gtgacaaatc acttgtaagt acattctaat tgtggagatt 2460
ctttcttctg tttgaagtaa tcccaagcat ttcaaaggaa ttttttttaa gttttctcaa 2520
ttattattaa gtgtcctgat ttgtaagaaa cactaaaaag ttgctcatag actgataagc 2580
cattgtttct tttgtgatag agatgcttta gctatgtcca cagttttaaa atcatttctt 2640
tattgagacc aaacacaaca gtcatggtgt atttaaatgg caatttgtca tttataaaca 2700
cctcttttta aaatttgagg tttggtttct ttttgtagag gctaataggg atatgatagc 2760
atgtatttat ttatttattt atcttatttt attatagtaa gaacccttaa catgagatct 2820
accctgttat atttttaagt gtacaatcca ttattgttaa ctacgggtac actgttgtat 2880
agcttactca tcttgctgta ttaaaacttt gtgcccattg attagtaacc cctcgtttcg 2940
tcctccccca gccactggca accagcatta tactctttga ttctatgagt ttgactactt 3000
tagctacctt atataagtgg tattatgtac tgtttatctt tttatgactg acttatttcc 3060
cttagcatag tgcattcaaa gtccaaccat gttgttgcct attgcagaat ttccttcttt 3120
tcaaggctga ataatattcc agtgcatgtg tgtaccacat tttctttatc cattaatttg 3180
ttgattgata gacatttagg ttggttttct acatcttgac tatcatgaat agtgttgcaa 3240
tgaacacagg agagctacta tctcttagag atgatatcat ggtttttatc atcagaaaac 3300
acccactgat ttctatgcta attttgttac ctgggtggaa taatagtaca gctatatatt 3360
cctcatttta gatatctttg tatttctaca tacaataaaa aagcagagta cttagtcatg 3420
ttgaagaact ttaaactttt agtatttcca gatcaatctt caaaacaagg acaggtttat 3480
ctttctctca ccactcaatc tatatatacc tcttgtgggc aaggccagtt tttatcactg 3540
gagcctttcc cctttttatt atgtacctct ccctcacagc agagtcagga ctttaacttt 3600
acacaatact atggctctac atatgaaatc ttaaaaatac ataaaaatta ataaattctg 3660
tctagagtag tatattttcc ctggggttac agttactttc ataataaaaa ttagagataa 3720
ggaaaggact catttattgg aaagtgattt taggtaacat ttctggaaga aaaatgtcta 3780
tatcttaata gtcacttaat atatgatgga ttgtgttact cctcagtttt caatggcata 3840
tactaaaaca tggccctcta aaaagggggc aaatgaaatg agaaactctc tgaatgtttt 3900
tctcccctag gtgaattcac ctgctgctta gaagcttatt ttctcttgat ttctgttata 3960
atgattgctc ttacccttta gttttaagtt tcaaaatagg agtcatataa ctttccttaa 4020
agctattgac tgtctttttg tcctgtttta ttcaccatga gttatagtgt gacagttaat 4080
tcttatgaaa attatataga gatggttaaa tcatcagaaa ctgtaaacct cgattgggag 4140
gggaagcgga tttttaaatg atttcctgac caagcttaac cagtatatta aatcctttgt 4200
actgttcttt ggctataaag aaaaaaggta ctgtccagca actgaaacct gctttcttcc 4260
atttagcata ccctttttgg agacaaatta tgcacagttg caactcttcg tgaaacctat 4320
ggtgaaatgg ctgactgctg tgcaaaacaa gaacctgaga gaaatgaatg cttcttgcaa 4380
cacaaagatg acaacccaaa cctcccccga ttggtgagac cagaggttga tgtgatgtgc 4440
actgcttttc atgacaatga agagacattt ttgaaaaagt aagtaatcag atgtttatag 4500
ttcaaaatta aaaagcatgg agtaactcca taggccaaca ctctataaaa attaccataa 4560
caaaaatatt ttcaacatta agacttggaa gttttgttat gatgattttt taaagaagta 4620
gtatttgata ccacaaaatt ctacacagca aaaaatatga tcaaagatat tttgaagttt 4680
attgaaacag gatacaatct ttctgaaaaa tttaagatag acaaattatt taatgtatta 4740
cgaagatatg tatatatggt tgttataatt gatttcgttt tagtcagcaa cattatattg 4800
ccaaaattta accatttatg cacacacaca cacacacaca cacacttaac ccttttttcc 4860
acatacttaa agaatgacag agacaagacc atcatgtgca aattgagctt aattggttaa 4920
ttagatatct ttggaatttg gaggttctgg ggagaatgtc gattacaatt atttctgtaa 4980
tattgtctgc tatagaaaag tgactgtttt tctttttcaa aatttagata cttatatgaa 5040
attgccagaa gacatcctta cttttatgcc ccggaactcc ttttctttgc taaaaggtat 5100
aaagctgctt ttacagaatg ttgccaagct gctgataaag ctgcctgcct gttgccaaag 5160
gtattatgca aaagaataga aaaaaagagt tcattatcca acctgatttt gtccattttg 5220
tggctagatt tagggaacct gagtgtctga tacaaacttt ccgacatggt caaaaaagcc 5280
ttccttttat ctgtcttgaa aatctttcat ctttgaaggc ctacactctc gtttcttctt 5340
ttaagatttg ccaatgatga tctgtcagag gtaatcactg tgcatgtgtt taaagatttc 5400
accacttttt atggtggtga tcactatagt gaaatactga aacttgtttg tcaaattgca 5460
cagcaagggg ccacagttct tgtttatctt ttcatgataa tttttagtag ggagggaatt 5520
caaagtagag aattttactg catctagatg cctgagttca tgcattcatt ccataaatat 5580
atattatgga atgctttatt ttcttttctg aggagtttac tgatgttggt ggaggagaga 5640
ctgaaatgaa ttatacacaa aatttaaaaa ttagcaaaat tgcagcccct gggatattag 5700
cgtactcttt ctctgacttt tctcccactt ttaaggctct ttttcctggc aatgtttcca 5760
gttggtttct aactacatag ggaattccgc tgtgaccaga atgatcgaat gatctttcct 5820
tttcttagag agcaaaatca ttattcgcta aagggagtac ttgggaattt aggcataaat 5880
tatgccttca aaatttaatt tggcacagtc tcatctgagc ttatggaggg gtgtttcatg 5940
tagaattttt cttctaattt tcatcaaatt attccttttt gtagctcgat gaacttcggg 6000
atgaagggaa ggcttcgtct gccaaacaga gactcaagtg tgccagtctc caaaaatttg 6060
gagaaagagc tttcaaagca tggtaaatac ttttaaacat agttggcatc tttataacga 6120
tgtaaatgat aatgcttcag tgacaaattg tacattttta tgtattttgc aaagtgctgt 6180
caaatacatt tctttggttg tctaacaggt agaactctaa tagaggtaaa aatcagaata 6240
tcaatgacaa tttgacatta tttttaatct tttcttttct aaatagttga ataatttaga 6300
ggacgctgtc ctttttgtcc taaaaaaagg gacagatatt taagttctat ttatttataa 6360
aatcttggac tcttattcta atggttcatt atttttatag agctgtaggc atggttcttt 6420
atttaatttt ttaaagttat ttttaatttt tgtggataca gagtaggtat acatatttac 6480
ggggtatatg agatattttg atataagtat acaacatata taatcccttt atttaatttt 6540
atcttccccc caatgatcta aaactatttg cttgtccttt tatgtcttat agttaaattc 6600
agtcaccaac taagttgaag ttacttctta tttttgcata gctccagctc tgatcttcat 6660
ctcatgtttt tgcctgagcc tctgttttca tattacttag ttggttctgg gagcatactt 6720
taatagccga gtcaagaaaa atactagctg ccccgtcacc cacactcctc acctgctagt 6780
caacagcaaa tcaacacaac aggaaataaa atgaaaataa tagacattat gcatgctctc 6840
tagaaactgt caattgaact gtatttgctc atcattccta ccatctacac caccaaaatc 6900
aaccaaattt atgaaaaaaa acagccccaa cataaaatta tacacagata aacaggctat 6960
gattggtttt gggaaagaag tcacctttac ctgatttagg caactgtgaa atgactagag 7020
aatgaagaaa attagacgtt tacatcttgt catagagttt gaagatagtg ctggatcttt 7080
ctttttataa gtaagatcaa taaaaactcc ctcattctgt agaagttatg atttcttttc 7140
taagagacct ttagaagtca gaaaaaatgt gtttcaattg agaaaaaaga taactggagt 7200
ttgtgtagta cttcccagat tataaaatgc ttttgtatgt attatctaat ttaatcctca 7260
aaacttcttc aatttagcat gttgtcatga cactgcagag gctgaagctc agagaggctg 7320
agccctctgc taacaagtcc tactgctaac aagtgataaa gccagagctg gaagtcacat 7380
ctggactcca aacctgatgc ttctcagcct gttgcccctt ttagagttcc tttttaattt 7440
ctgcttttat gacttgctag atttctacct accacacaca ctcttaaatg gataattctg 7500
ccctaaggat aagtgattac catttggttc agaactagaa ctaatgaatt ttaaaaatta 7560
tttctgtatg tccattttga attttcttat gagaaatagt atttgcctag tgttttcata 7620
taaaatatcg catgataata ccattttgat tggcgatttt ctttttaggg cagtagctcg 7680
cctgagccag agatttccca aagctgagtt tgcagaagtt tccaagttag tgacagatct 7740
taccaaagtc cacacggaat gctgccatgg agatctgctt gaatgtgctg atgacagggt 7800
aaagagtcgt cgatatgctt tttggtagct tgcatgctca agttggtaga atggatgcgt 7860
ttggtatcat tggtgatagc tgacagtggg ttgagattgt cttctgtgct ttcgtctgtc 7920
ctatcttcaa tctttccctg cctatggtgg tggtaccttt ctgtttttaa cctggctata 7980
aattaccaga taaacccatt cactgatttg taactccttt cagtcatgct ctaactgtaa 8040
atgaaggctt aaactgaagt agaacagtta caaggtttta cttggcagaa catcttgcaa 8100
ggtagatgtc taagaagatt tttttttctt tttttaagac agagtttcgc tcttgtttcc 8160
caggctgggg tgcaatggtg tgatcttggc tcagcgcaac ctctgcctcc tgggttcaag 8220
tgattctcat gcctcagcct cccaagtagc tgggattaca ggcatgcgcc accacacctg 8280
gctaattttg tatttttagt agaggcgggg tttcaccata ttgtccagac tggtctcgaa 8340
ctcctgacct caggtgatcc acccgccttg gcctcccaaa gtgctgggat tacaggcatg 8400
agccaccttg cccagcctaa gaagattttt tgagggaggt aggtggactt ggagaaggtc 8460
actacttgaa gagatttttg gaaatgatgt atttttcttc tctatattcc ttcccttaat 8520
taactctgtt tgttagatgt gcaaatattt ggaatgatat ctcttttctc aaaacttata 8580
atattttctt tctccctttc ttcaagatta aacttatggg caaatactag aatcctaatc 8640
tctcatggca ctttctggaa aatttaaggc ggttatttta tatatgtaag cagggcctat 8700
gactatgatc ttgactcatt tttcaaaaat cttctatatt ttatttagtt atttggtttc 8760
aaaaggcctg cacttaattt tgggggatta tttggaaaaa cagcattgag ttttaatgaa 8820
aaaaacttaa atgccctaac agtagaaaca taaaattaat aaataactga gctgagcacc 8880
tgctactgat tagtctattt taattaagtg ggaatgtttt tgtagtccta tctacatctc 8940
caggtttagg agcaaacaga gtatgttcat agaaggaata tgtgtatggt cttagaatac 9000
aatgaatatg ttctgccaac ttaataaagg tctgaggaga aagtgtagca atgtcaattc 9060
gtgttgaaca atttccacca acttacttat aggcggacct tgccaagtat atctgtgaaa 9120
atcaagattc gatctccagt aaactgaagg aatgctgtga aaaacctctg ttggaaaaat 9180
cccactgcat tgccgaagtg gaaaatgatg agatgcctgc tgacttgcct tcattagctg 9240
ctgattttgt tgaaagtaag gatgtttgca aaaactatgc tgaggcaaag gatgtcttcc 9300
tgggcatgta agtagataag aaattattct tttatagctt tggcatgacc tcacaactta 9360
ggaggatagc ctaggctttt ctgtggagtt gctacaattt ccctgctgcc cagaatgttt 9420
cttcatcctt ccctttccca ggctttaaca atttttgaaa tagttaatta gttgaataca 9480
ttgtcataaa ataatacatg ttcatggcaa agctcaacat tccttactcc ttaggggtat 9540
ttctgaaaat acgtctagaa acattttgtg tatatataaa ttatgtatac ttcagtcatt 9600
cattccaagt gtatttcttg aacatctata atatatgtgt gtgactatgt attgcctgtc 9660
tatctaacta atctaatcta atctagtcta tctatctaat ctatgcaatg atagcaaaga 9720
agtataaaaa gaaatataga gtctgacacc aggtgcttta tatttggtga aaagaccaga 9780
agttcagtat aatggcaata tggtaggcaa ctcaattaca aaataaatgt ttacatattg 9840
tcagaagttg tggtgataaa ctgcattttt gttgttggat tatgataatg cactaaataa 9900
tatttcctaa aattatgtac cctacaagat ttcactcata cagagaagaa agagaatatt 9960
ttaagaacat atctctgccc atctatttat cagaatcctt ttgagatgta gtttaaatca 10020
aacaaaatgt taataaaaat aacaagtatc attcatcaaa gacttcatat gtgccaagca 10080
gtgtgtgctt tgtgtagatt atgtcatata gttctcataa tccaccttcc gagacagata 10140
ctatttattt tttgagacag agttttactc ttgttgccca ggctggagtg caatggtgcc 10200
atctcggctc accacaacct ccgcctccca ggttcaagcg attctcctgc ctcagcctcc 10260
tgggattaca ggcatgcacc accatgcctg gctaattttg tatttttagt agagatgggg 10320
tttcaccatg ttggtcagac tggtctcaaa ctcctgacct ctggtgatat gcctgcctca 10380
gcctcctaaa gtgctgggat tacaggcatg agccactgtg cccagccgac agatactatt 10440
attatttcca ttctaccgag aaggagacta aggctctgat catttaaata agttgcctaa 10500
ggtgatgcag tgatataagt agcagagcta ggaattgagc cttggtaact ttaactctgg 10560
accccaagtc cttagctact aagctttact gcatggggtt tagtcaaatt aagacttttg 10620
gaatatgagt tacttttgag attagctttg tgatattttt tgtgctcatt tgtccaacaa 10680
agtctatttt attttcatct taattaggtt tttgtatgaa tatgcaagaa ggcatcctga 10740
ttactctgtc gtgctgctgc tgagacttgc caagacatat gaaaccactc tagagaagtg 10800
ctgtgccgct gcagatcctc atgaatgcta tgccaaagtg gtaggtttat tgttggaaaa 10860
aaatgtagtt ctttgactga tgattccaat aatgagaaag aaaaataatg caagaatgta 10920
aaatgatata cagtgcaatt tagatctttt cttgagatgg tttcaattct ggaatcttaa 10980
acatgaaaga aaaagtagcc ttagaatgat taacaaaatt tagactagtt agaatagaaa 11040
gatctgaata gagcaatctc taaaaaattt tgatcttttt ttctcttttt cacaatcctg 11100
agaacaaaaa aaaattaaat ttaaatgtta attagaagat atttaactta gatgtaaagt 11160
gagttaacct gattccagga ttaatcaagt actagaatta gtatcttatg gcaaattata 11220
gaacctatcc ctttagaata ttttcaaatc tttttgagga tgtttaggaa tagttttaca 11280
agaaattaag ttaggagagg aaatctgttc tggaggattt ttagggttcc cactagcata 11340
tgtaatggtt tctgaactat tcagaatcag agaaaactca tttttcctgc tttcaagaag 11400
ctactgtatg ccaggcacca tgcacaaaca atgaccaacg taaaatctct cattttggag 11460
agcctggaat ctaactggaa aggtgaacta ataataataa tatgtacaat catagccatc 11520
atttattaaa cttttattat atgcaaggca ctgtttaatt tcattagctt acctggttta 11580
cagagcagct ctatgagatg agtgccatct ttgcccctat tttagggata aggattctga 11640
aatgtggaga tggtaagtaa aattgcacaa ctgaagaatg agttacatga cttggctcaa 11700
atactggtca ttgaactcca gagcctgaat attcttaacc acttacatga tgcaagctca 11760
ccaaataaat agttcgaatg tattgtgaca gagcggcatt gatattcatc tattcatgtg 11820
gctttgagta ggaagaagaa aggatatcat tctgaccaga ggggtgaaaa acaacctgca 11880
tctgatcctg aggcataata ctattaacac aattctttta tgtttcagtt cgatgaattt 11940
aaacctcttg tggaagagcc tcagaattta atcaaacaaa attgtgagct ttttgagcag 12000
cttggagagt acaaattcca gaatgcgtaa gtaattttta ttgactgatt ttttttatca 12060
atttgtaatt atttaagact taatatatga gccacctagc atagaacttt taagaatgaa 12120
aatacattgc atatttctaa tcactctttg tcaagaaaga taggagagga gagataaaat 12180
agttgatggg gtggagaggt ctatatttga atgtagtcta aaaattgttc tcttaagatt 12240
ggaagtatgt aggctgggag ggtaaatacc aaatcttggt atatcagaac tgagcatgtc 12300
ccttgaaggt taagaaatag ttaatgggca aatagagcat ggcaatattt tgtagagcag 12360
caagtagtag gccttgaata gatgtcgctc aaaaagtaat atgtaagctg aacacaaaaa 12420
tgtaacaaat gaatttagat acatatttga atattaaatt caggttgttt gggagatgca 12480
cctagtcttt gatggttaaa cctttccctc catagaagag acagagacag aatggcttgc 12540
tggactaatg tcccaattca atagagtctt atctatgaag gttaaaaaca agaagagaca 12600
tattatacag tagatattta ttgtgtggct catacacatg gtgctcttct gattatggat 12660
tttagagata ataacagtga acaagacata gtttctttcc tcgagtagat taaagtcata 12720
cattgacttt taatggtgac tggcattctt aatacatgat tattatatat taggtaccat 12780
gtcagattaa ttataatact ttactacttt taatttaacc cttgaactat ccctattgag 12840
tcagatatat ttccttccat tttctacttg tatctttcaa gtttagcata tgctgataca 12900
tatgaagctc tctccaggtt ttattgaaag aagaaattaa taaatttatt aatgtcactg 12960
aattaggcaa ctcactttcc caagattatg caagtggtac aggtggaact caaagccaag 13020
tttaactagt tgttcaggag aatgttttct accctccact aacccactac tctgcagatg 13080
gagataatat gatgaatgga acatagcaac atcttagttg attccggcca agtgttctct 13140
gttttatcta ctatgttaga cagtttcttg ccttgctgaa aacacatgac ttcttttttt 13200
caggctatta gttcgttaca ccaagaaagt accccaagtg tcaactccaa ctcttgtaga 13260
ggtctcaaga aacctaggaa aagtgggcag caaatgttgt aaacatcctg aagcaaaaag 13320
aatgccctgt gcagaagact atgtgagtct ttaaaaaaat ataataaatt aataatgaaa 13380
aaattttacc tttagatatt gataatgcta gctttcataa gcagaaggaa gtaatgtgtg 13440
tgtgtgcatg tttgtgtgca tgtgtgtgtg catgcacgtg tgtgtatgtg tgatattggc 13500
agtcaaggcc ccgaggatga taattttttt tttttttttg agacggagtc tcgctttgtt 13560
gtccaggctg gagtgcagtg gtgccatctc ggctcactgc aacctccgcc tcccaggttc 13620
aagccattct cctgcctcag cctcccaagt agctgggact acaggtgcat gccaccatgc 13680
ctggctaatt ttttgtattt ttagtagaaa attttcagct tcacctcttt tgaatttctg 13740
ctctcctgcc tgttctttag ctatccgtgg tcctgaacca gttatgtgtg ttgcatgaga 13800
aaacgccagt aagtgacaga gtcaccaaat gctgcacaga atccttggtg aacaggcgac 13860
catgcttttc agctctggaa gtcgatgaaa catacgttcc caaagagttt aatgctgaaa 13920
cattcacctt ccatgcagat atatgcacac tttctgagaa ggagagacaa atcaagaaac 13980
aaacgtgagg agtatttcat tactgcatgt gtttgtagtc ttgatagcaa gaactgtcaa 14040
ttcaagctag caactttttc ctgaagtagt gattatattt cttagaggaa agtattggag 14100
tgttgccctt attatgctga taagagtacc cagaataaaa tgaataactt tttaaagaca 14160
aaatcctctg ttataatatt gctaaaatta ttcagagtaa tattgtggat taaagccaca 14220
atagaataac atgttaggcc atattcagta gaaaaagatg aacaattaac tgataaattt 14280
gtgcacatgg caaattagtt aatgggaacc ataggagaat ttatttctag atgtaaataa 14340
ttattttaag tttgccctat ggtggcccca cacatgagac aaacccccaa gatgtgactt 14400
ttgagaatga gacttggata aaaaacatgt agaaatgcaa gccctgaagc tcaactccct 14460
attgctatca caggggttat aattgcataa aatttagcta tagaaagttg ctgtcatctc 14520
ttgtgggctg taatcatcgt ctaggcttaa gagtaatatt gcaaaacctg tcatgcccac 14580
acaaatctct ccctggcatt gttgtctttg cagatgtcag tgaaagagaa ccagcagctc 14640
ccatgagttt ggatagcctt attttctata gcctccccac tattagcttt gaagggagca 14700
aagtttaaga accaaatata aagtttctca tctttataga tgagaaaaat tttaaataaa 14760
gtccaagata attaaatttt taaggatcat ttttagctct ttaatagcaa taaaactcaa 14820
tatgacataa tatggcactt ccaaaatctg aataatatat aattgcaatg acatacttct 14880
tttcagagat ttactgaaaa gaaatttgtt gacactacat aacgtgatga gtggtttata 14940
ctgattgttt cagttggtct tcccaccaac tccatgaaag tggattttat tatcctcatc 15000
atgcagatga gaatattgag acttatagcg gtatgcctga gccccaaagt actcagagtt 15060
gcctggctcc aagatttata atcttaaatg atgggactac catccttact ctctccattt 15120
ttctatacgt gagtaatgtt ttttctgttt tttttttttc tttttccatt caaactcagt 15180
gcacttgttg agctcgtgaa acacaagccc aaggcaacaa aagagcaact gaaagctgtt 15240
atggatgatt tcgcagcttt tgtagagaag tgctgcaagg ctgacgataa ggagacctgc 15300
tttgccgagg aggtactaca gttctcttca ttttaatatg tccagtattc atttttgcat 15360
gtttggttag gctagggctt agggatttat atatcaaagg aggctttgta catgtgggac 15420
agggatctta ttttacaaac aattgtctta caaaatgaat aaaacagcac tttgttttta 15480
tctcctgctc tattgtgcca tactgttaaa tgtttataat gcctgttctg tttccaaatt 15540
tgtgatgctt atgaatatta ataggaatat ttgtaaggcc tgaaatattt tgatcatgaa 15600
atcaaaacat taatttattt aaacatttac ttgaaatgtg gtggtttgtg atttagttga 15660
ttttataggc tagtgggaga atttacattc aaatgtctaa atcacttaaa attgcccttt 15720
atggcctgac agtaactttt ttttattcat ttggggacaa ctatgtccgt gagcttccgt 15780
ccagagatta tagtagtaaa ttgtaattaa aggatatgat gcacgtgaaa tcactttgca 15840
atcatcaata gcttcataaa tgttaatttt gtatcctaat agtaatgcta atattttcct 15900
aacatctgtc atgtctttgt gttcagggta aaaaacttgt tgctgcaagt caagctgcct 15960
taggcttata acatcacatt taaaagcatc tcaggtaact atattttgaa ttttttaaaa 16020
aagtaactat aatagttatt attaaaatag caaagattga ccatttccaa gagccatata 16080
gaccagcacc gaccactatt ctaaactatt tatgtatgta aatattagct tttaaaattc 16140
tcaaaatagt tgctgagttg ggaaccacta ttatttctat tttgtagatg agaaaatgaa 16200
gataaacatc aaagcataga ttaagtaatt ttccaaaggg tcaaaattca aaattgaaac 16260
caaagtttca gtgttgccca ttgtcctgtt ctgacttata tgatgcggta cacagagcca 16320
tccaagtaag tgatggctca gcagtggaat actctgggaa ttaggctgaa ccacatgaaa 16380
gagtgcttta tagggcaaaa acagttgaat atcagtgatt tcacatggtt caacctaata 16440
gttcaactca tcctttccat tggagaatat gatggatcta ccttctgtga actttatagt 16500
gaagaatctg ctattacatt tccaatttgt caacatgctg agctttaata ggacttatct 16560
tcttatgaca acatttattg gtgtgtcccc ttgcctagcc caacagaaga attcagcagc 16620
cgtaagtcta ggacaggctt aaattgtttt cactggtgta aattgcagaa agatgatcta 16680
agtaatttgg catttatttt aataggtttg aaaaacacat gccattttac aaataagact 16740
tatatttgtc cttttgtttt tcagcctacc atgagaataa gagaaagaaa atgaagatca 16800
aaagcttatt catctgtttt tctttttcgt tggtgtaaag ccaacaccct gtctaaaaaa 16860
cataaatttc tttaatcatt ttgcctcttt tctctgtgct tcaattaata aaaaatggaa 16920
agaatctaat agagtggtac agcactgtta tttttcaaag atgtgttgct atcctgaaaa 16980
ttctgtaggt tctgtggaag ttccagtgtt ctctcttatt ccacttcggt agaggatttc 17040
tagtttcttg tgggctaatt aaataaatca ttaatactct tctaagttat ggattataaa 17100
cattcaaaat aatattttga cattatgata attctgaata aaagaacaaa aaccatggta 17160
taggtaagga atataaaaca tggcttttac cttagaaaaa acaattctaa aattcatatg 17220
gaatcaaaaa agagcctgca gaaccaaagt aagactaagc aaaaagaaca aattacctga 17280
tttcaaacta cactataagg ccatagtcac cgaaacagca aggtactggt ataaa 17335
<210> 36
<211> 2076
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 36
atattagagc gagtctttct gcacacagat cacctttcct atcaacccca ctagcctctg 60
gcaaaatgaa gtgggtaacc tttctcctcc tcctcttcgt ctccggctct gctttttcca 120
ggggtgtgtt tcgccgagaa gcacacaaga gtgagatcgc ccatcggtat aatgatttgg 180
gagaacaaca tttcaaaggc ctagtcctga ttgccttttc ccagtatctc cagaaatgct 240
catacgatga gcatgccaaa ttagtgcagg aagtaacaga ctttgcaaag acgtgtgttg 300
ccgatgagtc tgccgccaac tgtgacaaat cccttcacac tctttttgga gataagttgt 360
gtgccattcc aaacctccgt gaaaactatg gtgaactggc tgactgctgt acaaaacaag 420
agcccgaaag aaacgaatgt ttcctgcaac acaaagatga caaccccagc ctgccaccat 480
ttgaaaggcc agaggctgag gccatgtgca cctcctttaa ggaaaaccca accaccttta 540
tgggacacta tttgcatgaa gttgccagaa gacatcctta tttctatgcc ccagaacttc 600
tttactatgc tgagcagtac aatgagattc tgacccagtg ttgtgcagag gctgacaagg 660
aaagctgcct gaccccgaag cttgatggtg tgaaggagaa agcattggtc tcatctgtcc 720
gtcagagaat gaagtgctcc agtatgcaga agtttggaga gagagctttt aaagcatggg 780
cagtagctcg tctgagccag acattcccca atgctgactt tgcagaaatc accaaattgg 840
caacagacct gaccaaagtc aacaaggagt gctgccatgg tgacctgctg gaatgcgcag 900
atgacagggc ggaacttgcc aagtacatgt gtgaaaacca ggcgactatc tccagcaaac 960
tgcagacttg ctgcgataaa ccactgttga agaaagccca ctgtcttagt gaggtggagc 1020
atgacaccat gcctgctgat ctgcctgcca ttgctgctga ttttgttgag gaccaggaag 1080
tgtgcaagaa ctatgctgag gccaaggatg tcttcctggg cacgttcttg tatgaatatt 1140
caagaagaca ccctgattac tctgtatccc tgttgctgag acttgctaag aaatatgaag 1200
ccactctgga aaagtgctgc gctgaagcca atcctcccgc atgctacggc acagtgcttg 1260
ctgaatttca gcctcttgta gaagagccta agaacttggt caaaaccaac tgtgatcttt 1320
acgagaagct tggagaatat ggattccaaa atgccattct agttcgctac acccagaaag 1380
cacctcaggt gtcaacccca actctcgtgg aggctgcaag aaacctagga agagtgggca 1440
ccaagtgttg tacacttcct gaagatcaga gactgccttg tgtggaagac tatctgtctg 1500
caatcctgaa ccgtgtgtgt ctgctgcatg agaagacccc agtgagtgag catgttacca 1560
agtgctgtag tggatccctg gtggaaaggc ggccatgctt ctctgctctg acagttgatg 1620
aaacatatgt ccccaaagag tttaaagctg agaccttcac cttccactct gatatctgca 1680
cacttccaga gaaggagaag cagattaaga aacaaacggc tcttgctgag ctggtgaagc 1740
acaagcccaa ggctacagcg gagcaactga agactgtcat ggatgacttt gcacagttcc 1800
tggatacatg ttgcaaggct gctgacaagg acacctgctt ctcgactgag ggtccaaacc 1860
ttgtcactag atgcaaagac gccttagcct aaacacatca caaccacaac cttctcaggc 1920
taccctgaga aaaaaagaca tgaagactca ggactcatct tttctgttgg tgtaaaatca 1980
acaccctaag gaacacaaat ttctttaaac atttgacttc ttgtctctgt gctgcaatta 2040
ataaaaaatg gaaagaatct aaaaaaaaaa aaaaaa 2076
<210> 37
<211> 2285
<212> DNA
<213> 智人(Homo sapiens)
<400> 37
ctagcttttc tcttctgtca accccacacg cctttggcac aatgaagtgg gtaaccttta 60
tttcccttct ttttctcttt agctcggctt attccagggg tgtgtttcgt cgagatgcac 120
acaagagtga ggttgctcat cggtttaaag atttgggaga agaaaatttc aaagccttgg 180
tgttgattgc ctttgctcag tatcttcagc agtgtccatt tgaagatcat gtaaaattag 240
tgaatgaagt aactgaattt gcaaaaacat gtgttgctga tgagtcagct gaaaattgtg 300
acaaatcact tcataccctt tttggagaca aattatgcac agttgcaact cttcgtgaaa 360
cctatggtga aatggctgac tgctgtgcaa aacaagaacc tgagagaaat gaatgcttct 420
tgcaacacaa agatgacaac ccaaacctcc cccgattggt gagaccagag gttgatgtga 480
tgtgcactgc ttttcatgac aatgaagaga catttttgaa aaaatactta tatgaaattg 540
ccagaagaca tccttacttt tatgccccgg aactcctttt ctttgctaaa aggtataaag 600
ctgcttttac agaatgttgc caagctgctg ataaagctgc ctgcctgttg ccaaagctcg 660
atgaacttcg ggatgaaggg aaggcttcgt ctgccaaaca gagactcaag tgtgccagtc 720
tccaaaaatt tggagaaaga gctttcaaag catgggcagt agctcgcctg agccagagat 780
ttcccaaagc tgagtttgca gaagtttcca agttagtgac agatcttacc aaagtccaca 840
cggaatgctg ccatggagat ctgcttgaat gtgctgatga cagggcggac cttgccaagt 900
atatctgtga aaatcaagat tcgatctcca gtaaactgaa ggaatgctgt gaaaaacctc 960
tgttggaaaa atcccactgc attgccgaag tggaaaatga tgagatgcct gctgacttgc 1020
cttcattagc tgctgatttt gttgaaagta aggatgtttg caaaaactat gctgaggcaa 1080
aggatgtctt cctgggcatg tttttgtatg aatatgcaag aaggcatcct gattactctg 1140
tcgtgctgct gctgagactt gccaagacat atgaaaccac tctagagaag tgctgtgccg 1200
ctgcagatcc tcatgaatgc tatgccaaag tgttcgatga atttaaacct cttgtggaag 1260
agcctcagaa tttaatcaaa caaaattgtg agctttttga gcagcttgga gagtacaaat 1320
tccagaatgc gctattagtt cgttacacca agaaagtacc ccaagtgtca actccaactc 1380
ttgtagaggt ctcaagaaac ctaggaaaag tgggcagcaa atgttgtaaa catcctgaag 1440
caaaaagaat gccctgtgca gaagactatc tatccgtggt cctgaaccag ttatgtgtgt 1500
tgcatgagaa aacgccagta agtgacagag tcaccaaatg ctgcacagaa tccttggtga 1560
acaggcgacc atgcttttca gctctggaag tcgatgaaac atacgttccc aaagagttta 1620
atgctgaaac attcaccttc catgcagata tatgcacact ttctgagaag gagagacaaa 1680
tcaagaaaca aactgcactt gttgagctcg tgaaacacaa gcccaaggca acaaaagagc 1740
aactgaaagc tgttatggat gatttcgcag cttttgtaga gaagtgctgc aaggctgacg 1800
ataaggagac ctgctttgcc gaggagggta aaaaacttgt tgctgcaagt caagctgcct 1860
taggcttata acatcacatt taaaagcatc tcagcctacc atgagaataa gagaaagaaa 1920
atgaagatca aaagcttatt catctgtttt tctttttcgt tggtgtaaag ccaacaccct 1980
gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct tcaattaata 2040
aaaaatggaa agaatctaat agagtggtac agcactgtta tttttcaaag atgtgttgct 2100
atcctgaaaa ttctgtaggt tctgtggaag ttccagtgtt ctctcttatt ccacttcggt 2160
agaggatttc tagtttcttg tgggctaatt aaataaatca ttaatactct tctaagttat 2220
ggattataaa cattcaaaat aatattttga cattatgata attctgaata aaagaacaaa 2280
aacca 2285
<210> 38
<211> 1391
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> MISC_FEATURE
<222> (4)..(10)
<223> 5' NLS
<220>
<221> MISC_FEATURE
<222> (1376)..(1391)
<223> 3' NLS
<400> 38
Met Asp Lys Pro Lys Lys Lys Arg Lys Val Lys Tyr Ser Ile Gly Leu
1 5 10 15
Asp Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
20 25 30
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
35 40 45
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
50 55 60
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
65 70 75 80
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
85 90 95
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
100 105 110
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
115 120 125
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
130 135 140
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
145 150 155 160
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
165 170 175
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
180 185 190
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
195 200 205
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
210 215 220
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
225 230 235 240
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
245 250 255
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
260 265 270
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
275 280 285
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
290 295 300
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
305 310 315 320
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
325 330 335
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
340 345 350
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
355 360 365
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
370 375 380
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
385 390 395 400
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
405 410 415
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
420 425 430
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
435 440 445
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
450 455 460
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
465 470 475 480
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
485 490 495
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
500 505 510
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
515 520 525
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
530 535 540
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
545 550 555 560
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
565 570 575
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
580 585 590
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
595 600 605
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
610 615 620
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
625 630 635 640
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
645 650 655
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
660 665 670
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
675 680 685
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
690 695 700
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
705 710 715 720
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
725 730 735
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
740 745 750
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
755 760 765
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
770 775 780
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
785 790 795 800
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
805 810 815
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
820 825 830
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile
835 840 845
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
850 855 860
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
865 870 875 880
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
885 890 895
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
900 905 910
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
915 920 925
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser
930 935 940
Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
945 950 955 960
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
965 970 975
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
980 985 990
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr
995 1000 1005
Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr
1010 1015 1020
Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys
1025 1030 1035
Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe
1040 1045 1050
Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro
1055 1060 1065
Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys
1070 1075 1080
Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln
1085 1090 1095
Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser
1100 1105 1110
Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala
1115 1120 1125
Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser
1130 1135 1140
Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys
1145 1150 1155
Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile
1160 1165 1170
Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe
1175 1180 1185
Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile
1190 1195 1200
Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys
1205 1210 1215
Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu
1220 1225 1230
Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His
1235 1240 1245
Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln
1250 1255 1260
Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu
1265 1270 1275
Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn
1280 1285 1290
Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro
1295 1300 1305
Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr
1310 1315 1320
Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile
1325 1330 1335
Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr
1340 1345 1350
Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp
1355 1360 1365
Leu Ser Gln Leu Gly Gly Asp Lys Arg Pro Ala Ala Thr Lys Lys
1370 1375 1380
Ala Gly Gln Ala Lys Lys Lys Lys
1385 1390
<210> 39
<211> 4176
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(3)
<223> 起始密码子
<220>
<221> misc_feature
<222> (10)..(30)
<223> 5' NLS
<220>
<221> misc_feature
<222> (4126)..(4173)
<223> 3' NLS
<220>
<221> misc_feature
<222> (4174)..(4176)
<223> 终止密码子
<400> 39
atggacaagc ccaagaaaaa gcggaaagtg aagtacagca tcggcctgga catcggcacc 60
aactctgtgg gctgggccgt gatcaccgac gagtacaagg tgcccagcaa gaaattcaag 120
gtgctgggca acaccgacag gcacagcatc aagaagaacc tgatcggcgc cctgctgttc 180
gacagcggcg aaacagccga ggccaccaga ctgaagagaa ccgccagaag aagatacacc 240
aggcggaaga acaggatctg ctatctgcaa gagatcttca gcaacgagat ggccaaggtg 300
gacgacagct tcttccacag actggaagag tccttcctgg tggaagagga caagaagcac 360
gagagacacc ccatcttcgg caacatcgtg gacgaggtgg cctaccacga gaagtacccc 420
accatctacc acctgagaaa gaaactggtg gacagcaccg acaaggccga cctgagactg 480
atctacctgg ccctggccca catgatcaag ttcagaggcc acttcctgat cgagggcgac 540
ctgaaccccg acaacagcga cgtggacaag ctgttcatcc agctggtgca gacctacaac 600
cagctgttcg aggaaaaccc catcaacgcc agcggcgtgg acgccaaggc tatcctgtct 660
gccagactga gcaagagcag aaggctggaa aatctgatcg cccagctgcc cggcgagaag 720
aagaacggcc tgttcggcaa cctgattgcc ctgagcctgg gcctgacccc caacttcaag 780
agcaacttcg acctggccga ggatgccaaa ctgcagctga gcaaggacac ctacgacgac 840
gacctggaca acctgctggc ccagatcggc gaccagtacg ccgacctgtt cctggccgcc 900
aagaacctgt ctgacgccat cctgctgagc gacatcctga gagtgaacac cgagatcacc 960
aaggcccccc tgagcgcctc tatgatcaag agatacgacg agcaccacca ggacctgacc 1020
ctgctgaaag ctctcgtgcg gcagcagctg cctgagaagt acaaagaaat cttcttcgac 1080
cagagcaaga acggctacgc cggctacatc gatggcggcg ctagccagga agagttctac 1140
aagttcatca agcccatcct ggaaaagatg gacggcaccg aggaactgct cgtgaagctg 1200
aacagagagg acctgctgag aaagcagaga accttcgaca acggcagcat cccccaccag 1260
atccacctgg gagagctgca cgctatcctg agaaggcagg aagattttta cccattcctg 1320
aaggacaacc gggaaaagat cgagaagatc ctgaccttca ggatccccta ctacgtgggc 1380
cccctggcca gaggcaacag cagattcgcc tggatgacca gaaagagcga ggaaaccatc 1440
accccctgga acttcgagga agtggtggac aagggcgcca gcgcccagag cttcatcgag 1500
agaatgacaa acttcgataa gaacctgccc aacgagaagg tgctgcccaa gcacagcctg 1560
ctgtacgagt acttcaccgt gtacaacgag ctgaccaaag tgaaatacgt gaccgaggga 1620
atgagaaagc ccgccttcct gagcggcgag cagaaaaagg ccatcgtgga cctgctgttc 1680
aagaccaaca gaaaagtgac cgtgaagcag ctgaaagagg actacttcaa gaaaatcgag 1740
tgcttcgact ccgtggaaat ctccggcgtg gaagatagat tcaacgcctc cctgggcaca 1800
taccacgatc tgctgaaaat tatcaaggac aaggacttcc tggataacga agagaacgag 1860
gacattctgg aagatatcgt gctgaccctg acactgtttg aggaccgcga gatgatcgag 1920
gaaaggctga aaacctacgc tcacctgttc gacgacaaag tgatgaagca gctgaagaga 1980
aggcggtaca ccggctgggg caggctgagc agaaagctga tcaacggcat cagagacaag 2040
cagagcggca agacaatcct ggatttcctg aagtccgacg gcttcgccaa ccggaacttc 2100
atgcagctga tccacgacga cagcctgaca ttcaaagagg acatccagaa agcccaggtg 2160
tccggccagg gcgactctct gcacgagcat atcgctaacc tggccggcag ccccgctatc 2220
aagaagggca tcctgcagac agtgaaggtg gtggacgagc tcgtgaaagt gatgggcaga 2280
cacaagcccg agaacatcgt gatcgagatg gctagagaga accagaccac ccagaaggga 2340
cagaagaact cccgcgagag gatgaagaga atcgaagagg gcatcaaaga gctgggcagc 2400
cagatcctga aagaacaccc cgtggaaaac acccagctgc agaacgagaa gctgtacctg 2460
tactacctgc agaatggccg ggatatgtac gtggaccagg aactggacat caacagactg 2520
tccgactacg atgtggacca tatcgtgcct cagagctttc tgaaggacga ctccatcgat 2580
aacaaagtgc tgactcggag cgacaagaac agaggcaaga gcgacaacgt gccctccgaa 2640
gaggtcgtga agaagatgaa gaactactgg cgacagctgc tgaacgccaa gctgattacc 2700
cagaggaagt tcgataacct gaccaaggcc gagagaggcg gcctgagcga gctggataag 2760
gccggcttca tcaagaggca gctggtggaa accagacaga tcacaaagca cgtggcacag 2820
atcctggact cccggatgaa cactaagtac gacgaaaacg ataagctgat ccgggaagtg 2880
aaagtgatca ccctgaagtc caagctggtg tccgatttcc ggaaggattt ccagttttac 2940
aaagtgcgcg agatcaacaa ctaccaccac gcccacgacg cctacctgaa cgccgtcgtg 3000
ggaaccgccc tgatcaaaaa gtaccctaag ctggaaagcg agttcgtgta cggcgactac 3060
aaggtgtacg acgtgcggaa gatgatcgcc aagagcgagc aggaaatcgg caaggctacc 3120
gccaagtact tcttctacag caacatcatg aactttttca agaccgaaat caccctggcc 3180
aacggcgaga tcagaaagcg ccctctgatc gagacaaacg gcgaaaccgg ggagatcgtg 3240
tgggataagg gcagagactt cgccacagtg cgaaaggtgc tgagcatgcc ccaagtgaat 3300
atcgtgaaaa agaccgaggt gcagacaggc ggcttcagca aagagtctat cctgcccaag 3360
aggaacagcg acaagctgat cgccagaaag aaggactggg accccaagaa gtacggcggc 3420
ttcgacagcc ctaccgtggc ctactctgtg ctggtggtgg ctaaggtgga aaagggcaag 3480
tccaagaaac tgaagagtgt gaaagagctg ctggggatca ccatcatgga aagaagcagc 3540
tttgagaaga accctatcga ctttctggaa gccaagggct acaaagaagt gaaaaaggac 3600
ctgatcatca agctgcctaa gtactccctg ttcgagctgg aaaacggcag aaagagaatg 3660
ctggcctctg ccggcgaact gcagaaggga aacgagctgg ccctgcctag caaatatgtg 3720
aacttcctgt acctggcctc ccactatgag aagctgaagg gcagccctga ggacaacgaa 3780
cagaaacagc tgtttgtgga acagcataag cactacctgg acgagatcat cgagcagatc 3840
agcgagttct ccaagagagt gatcctggcc gacgccaatc tggacaaggt gctgtctgcc 3900
tacaacaagc acagggacaa gcctatcaga gagcaggccg agaatatcat ccacctgttc 3960
accctgacaa acctgggcgc tcctgccgcc ttcaagtact ttgacaccac catcgaccgg 4020
aagaggtaca ccagcaccaa agaggtgctg gacgccaccc tgatccacca gagcatcacc 4080
ggcctgtacg agacaagaat cgacctgtct cagctgggag gcgacaagag acctgccgcc 4140
actaagaagg ccggacaggc caaaaagaag aagtga 4176
<210> 40
<211> 16
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 40
guuuuagagc uaugcu 16
<210> 41
<211> 67
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 41
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugcuuu 67
<210> 42
<211> 77
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 42
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugcu 77
<210> 43
<211> 82
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 43
guuggaacca uucaaaacag cauagcaagu uaaaauaagg cuaguccguu aucaacuuga 60
aaaaguggca ccgagucggu gc 82
<210> 44
<211> 76
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 44
guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc cguuaucaac uugaaaaagu 60
ggcaccgagu cggugc 76
<210> 45
<211> 86
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 45
guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60
uugaaaaagu ggcaccgagu cggugc 86
<210> 46
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (2)..(21)
<223> n是a、c、g或t
<400> 46
gnnnnnnnnn nnnnnnnnnn ngg 23
<210> 47
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (1)..(21)
<223> n是a、c、g或t
<400> 47
nnnnnnnnnn nnnnnnnnnn ngg 23
<210> 48
<211> 25
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<220>
<221> misc_feature
<222> (3)..(23)
<223> n是a、c、g或t
<400> 48
ggnnnnnnnn nnnnnnnnnn nnngg 25
<210> 49
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 49
gagcaaccuc acucuugucu 20
<210> 50
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 50
ugcauuuguu ucaaaauauu 20
<210> 51
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 51
auuuaugaga ucaacagcac 20
<210> 52
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 52
uuaaauaaag cauagugcaa 20
<210> 53
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 53
uaaagcauag ugcaauggau 20
<210> 54
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 54
uaauaaaauu caaacauccu 20
<210> 55
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 55
ugacugaaac uucacagaau 20
<210> 56
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 56
gacugaaacu ucacagaaua 20
<210> 57
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 57
agugcaaugg auaggucuuu 20
<210> 58
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 58
ccucacucuu gucugggcaa 20
<210> 59
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 59
accucacucu ugucugggca 20
<210> 60
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 60
ugagcaaccu cacucuuguc 20
<210> 61
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 61
uacuuugcac uuuccuuagu 20
<210> 62
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 62
cacucuuguc uguggaaaca 20
<210> 63
<211> 6150
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 63
aacacccctt gtattactgt ttatgtaagc agacagtttt attgttcatg atgatatatt 60
tttatcttgt gcaatgtaac atcagagatt ttgagacacg ggccagagct gcatcgcgcg 120
tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg 180
tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg 240
gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat 300
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc 360
attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 420
gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 480
gtcacgacgt tgtaaaacga cggccagaga attcgagctc ggtacctcgc gaatacatct 540
agataggaac ccctagtgat ggagttggcc actccctctc tgcgcgctcg ctcgctcact 600
gaggccgccc gggcaaagcc cgggcgtcgg gcgacctttg gtcgcccggc ctcagtgagc 660
gagcgagcgc gcagagaggg agtggccaaa gatctcttag gtcagtgaag agaagaacaa 720
aaagcagcat attacagtta gttgtcttca tcaatcttta aatatgttgt gtggtttttc 780
tctccctgtt tccacagttt ttcttgatca tgaaaacgcc aacaaaattc tgaatcggcc 840
aaagaggtat aattcaggta aattggaaga gtttgttcaa gggaaccttg agagagaatg 900
tatggaagaa aagtgtagtt ttgaagaagc acgagaagtt tttgaaaaca ctgaaagaac 960
aactgaattt tggaagcagt atgttgatgg agatcagtgt gagtccaatc catgtttaaa 1020
tggcggcagt tgcaaggatg acattaattc ctatgaatgt tggtgtccct ttggatttga 1080
aggaaagaac tgtgaattag atgtaacatg taacattaag aatggcagat gcgagcagtt 1140
ttgtaaaaat agtgctgata acaaggtggt ttgctcctgt actgagggat atcgacttgc 1200
agaaaaccag aagtcctgtg aaccagcagt gccatttcca tgtggaagag tttctgtttc 1260
acaaacttct aagctcaccc gtgctgagac tgtttttcct gatgtggact atgtaaattc 1320
tactgaagct gaaaccattt tggataacat cactcaaagc acccaatcat ttaatgactt 1380
cactcgggtt gttggtggag aagatgccaa accaggtcaa ttcccttggc aggttgtttt 1440
gaatggtaaa gttgatgcat tctgtggagg ctctatcgtt aatgaaaaat ggattgtaac 1500
tgctgcccac tgtgttgaaa ctggtgttaa aattacagtt gtcgcaggtg aacataatat 1560
tgaggagaca gaacatacag agcaaaagcg aaatgtgatt cgaattattc ctcaccacaa 1620
ctacaatgca gctattaata agtacaacca tgacattgcc cttctggaac tggacgaacc 1680
cttagtgcta aacagctacg ttacacctat ttgcattgct gacaaggaat acacgaacat 1740
cttcctcaaa tttggatctg gctatgtaag tggctgggga agagtcttcc acaaagggag 1800
atcagcttta gttcttcagt accttagagt tccacttgtt gaccgagcca catgtcttct 1860
atctacaaag ttcaccatct ataacaacat gttctgtgct ggcttccatg aaggaggtag 1920
agattcatgt caaggagata gtgggggacc ccatgttact gaagtggaag ggaccagttt 1980
cttaactgga attattagct ggggtgaaga gtgtgcaatg aaaggcaaat atggaatata 2040
taccaaggta tcccggtatg tcaactggat taaggaaaaa acaaagctca cttaacctcg 2100
actgtgcctt ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc 2160
ctggaaggtg ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt 2220
ctgagtaggt gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat 2280
tgggaagaca atagcaggca tgctggggat gcggtgggct ctatggcttc tgaggcggaa 2340
agaaccagct ggggctctag ggggtatccc caaaaaacct cccacacctc cccctgaacc 2400
tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt 2460
acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 2520
gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgttaggtg agcttagtct 2580
tttcttttat ccaattcacg tagcgagaga ccttcgtata gatgccatat ttccccttca 2640
tcgcacattc ctccccccaa cttattatcc cggtcaagaa acttgttcct tcgacttcag 2700
tgacgtgtgg tccacctgaa tcaccttggc atgagtcgcg accgccctcg tgaaacccag 2760
cacaaaacat gttattgtaa atcgtaaatt tcgtggacag aagacaggtc gctctatcga 2820
ccaacgggac gcgcaaatat tgcagaacga gggctgatcg acctttgtgg aagacccgcc 2880
cccacccact cacatatccg ctcccaaatt tcaagaagat atttgtatat tctttatcgg 2940
ctatacaaat cggggtaaca taggagttaa gtacgagtgg ctcgtccagc tccaggaggg 3000
ctatatcatg gttgtacttg tttatagcgg cattataatt gtgatggggt atgatcctga 3060
taacattcct tttctgttca gtatgctcag tttcttcaat gttgtgttcg ccagccacga 3120
ccgtaatctt aacccccgtc tcgacacagt gtgcggccgt tacaatccac ttttcattga 3180
ctatggagcc cccacaaaac gcgtcgactt ttccgttgag caccacctgc catggaaatt 3240
ggccaggttt agcgtcctcg cccccgacaa ccctagtaaa gtcattaaat gactgtgtgg 3300
attgtgttat attatcaaga atcgtttcgg cttcagtaga gttaacgtag tccacatcgg 3360
gaaaaactgt ctcggccctt gtcaactttg atgtctggga cacacttacc cgaccgcacg 3420
ggaagggcac cgccggttca cagctctttt gattctcagc gagccggtag ccctcagtgc 3480
aactacacac aactttgttg tcggcggaat ttttacagaa ttgctcgcat cgtccatttt 3540
taatgttgca ggtgacgtcc aactcgcagt tttttccttc aaaaccaaaa gggcaccaac 3600
actcgtagga atttatatcg tctttacaac tccccccatt cagacatgga ttagattcgc 3660
attggtcccc atcgacatat tgcttccaga actcagtggt ccgttctgta ttctcaaaca 3720
cctcgcgcgc ttcttcaaaa ctgcattttt cctccataca ctctcgctcc aagttccctt 3780
gcacgaattc ttcaagcttt cctgagttat accttttagg ccggttaagt atcttattcg 3840
cgttttcgtg gtccagaaaa actgtggaaa cagggagaga aaaaccacac aacatattta 3900
aagattgatg aagacaacta actgtaatat gctgcttttt gttcttctct tcactgacct 3960
aagagatcta ggaaccccta gtgatggagt tggccactcc ctctctgcgc gctcgctcgc 4020
tcactgaggc cgcccgggca aagcccgggc gtcgggcgac ctttggtcgc ccggcctcag 4080
tgagcgagcg agcgcgcaga gagggagtgg ccaaactcgg atcccgggcc cgtcgactgc 4140
agaggcctgc atgcaagcgt ggtgtaatca tggtcatagc tgtttcctgt gtgaaattgt 4200
tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 4260
gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg 4320
ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg 4380
cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 4440
cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 4500
aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 4560
gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 4620
tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 4680
agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 4740
ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 4800
taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 4860
gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 4920
gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 4980
ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat ctgcgctctg 5040
ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 5100
gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 5160
caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 5220
taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 5280
aaatgaagtt ttaaatcaag cccaatctga ataatgttac aaccaattaa ccaattctga 5340
ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 5400
accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 5460
taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 5520
tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 5580
tgaatccggt gagaatggca aaagtttatg catttctttc cagacttgtt caacaggcca 5640
gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 5700
cgcctgagcg agacgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 5760
atgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 5820
ttcttctaat acctggaatg ctgtttttcc ggggatcgca gtggtgagta accatgcatc 5880
atcaggagta cggataaaat gcttgatggt cggaagaggc ataaattccg tcagccagtt 5940
tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 6000
caactctggc gcatcgggct tcccatacaa gcgatagatt gtcgcacctg attgcccgac 6060
attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 6120
cctcgacgtt tcccgttgaa tatggctcat 6150
<210> 64
<211> 6901
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 合成
<400> 64
gaggcccttt cgtctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct 60
cccggagacg gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg 120
cgcgtcagcg ggtgttggcg ggtgtcgggg ctggcttaac tatgcggcat cagagcagat 180
tgtactgaga gtgcaccata tgcggtgtga aataccgcac agatgcgtaa ggagaaaata 240
ccgcatcagg cgccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg 300
ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg 360
ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattcgagct 420
cggtacccct gcaggcagct gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc 480
gggcgtcggg cgacctttgg tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga 540
gtggccaact ccatcactag gggttcctcg ggcaaagcca cgcgtactag ttattaatag 600
taatcaatta cggggtcatt agttcatagc ccatatatgg agttccgcgt tacataactt 660
acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaataatg 720
acgtatgttc ccatagtaac gccaataggg actttccatt gacgtcaatg ggtggagtat 780
ttacggtaaa ctgcccactt ggcagtacat caagtgtatc atatgccaag tacgccccct 840
attgacgtca atgacggtaa atggcccgcc tggcattatg cccagtacat gaccttatgg 900
gactttccta cttggcagta catctacgta ttagtcatcg ctattaccat ggtcgaggtg 960
agccccacgt tctgcttcac tctccccatc tcccccccct ccccaccccc aattttgtat 1020
ttatttattt tttaattatt ttgtgcagcg atgggggcgg gggggggggg ggggcgcgcg 1080
ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg tgcggcggca 1140
gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg 1200
ccctataaaa agcgaagcgc gcggcgggcg gggagtcgct gcgacgctgc cttcgccccg 1260
tgccccgctc cgccgccgcc tcgcgccgcc cgccccggct ctgactgacc gcgttactcc 1320
cacaggtgag cgggcgggac ggcccttctc ctccgggctg taattagcgc ttggtttaat 1380
gacggcttgt ttcttttctg tggctgcgtg aaagccttga ggggctccgg gagggccctt 1440
tgtgcggggg gagcggctcg gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt 1500
gcggctccgc gctgcccggc ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc 1560
tccgcagtgt gcgcgagggg agcgcggccg ggggcggtgc cccgcggtgc ggggggggct 1620
gcgaggggaa caaaggctgc gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg 1680
gcgcgtcggt cgggctgcaa ccccccctgc acccccctcc ccgagttgct gagcacggcc 1740
cggcttcggg tgcggggctc cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg 1800
ggtggcggca ggtgggggtg ccgggcgggg cggggccgcc tcgggccggg gagggctcgg 1860
gggaggggcg cggcggcccc cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc 1920
attgcctttt atggtaatcg tgcgagaggg cgcagggact tcctttgtcc caaatctgtg 1980
cggagccgaa atctgggagg cgccgccgca ccccctctag cgggcgcggg gcgaagcggt 2040
gcggcgccgg caggaaggaa atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc 2100
cccttctccc tctccagcct cggggctgtc cgcgggggga cggctgcctt cgggggggac 2160
ggggcagggc ggggttcggc ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc 2220
atgttcatgc cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt 2280
ctcatcattt tggcaaagaa ttcctcgaga tgcagcgcgt gaacatgatc atggcagaat 2340
caccaggcct catcaccatc tgccttttag gatatctact cagtgctgaa tgtacagttt 2400
ttcttgatca tgaaaacgcc aacaaaattc tgaatcggcc aaagaggtat aattcaggta 2460
aattggaaga gtttgttcaa gggaaccttg agagagaatg tatggaagaa aagtgtagtt 2520
ttgaagaagc acgagaagtt tttgaaaaca ctgaaagaac aactgaattt tggaagcagt 2580
atgttgatgg agatcagtgt gagtccaatc catgtttaaa tggcggcagt tgcaaggatg 2640
acattaattc ctatgaatgt tggtgtccct ttggatttga aggaaagaac tgtgaattag 2700
atgtaacatg taacattaag aatggcagat gcgagcagtt ttgtaaaaat agtgctgata 2760
acaaggtggt ttgctcctgt actgagggat atcgacttgc agaaaaccag aagtcctgtg 2820
aaccagcagt gccatttcca tgtggaagag tttctgtttc acaaacttct aagctcaccc 2880
gtgctgagac tgtttttcct gatgtggact atgtaaattc tactgaagct gaaaccattt 2940
tggataacat cactcaaagc acccaatcat ttaatgactt cactcgggtt gttggtggag 3000
aagatgccaa accaggtcaa ttcccttggc aggttgtttt gaatggtaaa gttgatgcat 3060
tctgtggagg ctctatcgtt aatgaaaaat ggattgtaac tgctgcccac tgtgttgaaa 3120
ctggtgttaa aattacagtt gtcgcaggtg aacataatat tgaggagaca gaacatacag 3180
agcaaaagcg aaatgtgatt cgaattattc ctcaccacaa ctacaatgca gctattaata 3240
agtacaacca tgacattgcc cttctggaac tggacgaacc cttagtgcta aacagctacg 3300
ttacacctat ttgcattgct gacaaggaat acacgaacat cttcctcaaa tttggatctg 3360
gctatgtaag tggctgggga agagtcttcc acaaagggag atcagcttta gttcttcagt 3420
accttagagt tccacttgtt gaccgagcca catgtcttcg atctacaaag ttcaccatct 3480
ataacaacat gttctgtgct ggcttccatg aaggaggtag agattcatgt caaggagata 3540
gtgggggacc ccatgttact gaagtggaag ggaccagttt cttaactgga attattagct 3600
ggggtgaaga gtgtgcaatg aaaggcaaat atggaatata taccaaggta tcccggtatg 3660
tcaactggat taaggaaaaa acaaagctca cttaagcggc cgcgtttaaa ctcaacctct 3720
ggattacaaa atttgtgaaa gattgactgg tattcttaac tatgttgctc cttttacgct 3780
atgtggatac gctgctttaa tgcctttgta tcatgctatt gcttcccgta tggctttcat 3840
tttctcctcc ttgtataaat cctggttgct gtctctttat gaggagttgt ggcccgttgt 3900
caggcaacgt ggcgtggtgt gcactgtgtt tgctgacgca acccccactg gttggggcat 3960
tgccaccacc tgtcagctcc tttccgggac tttcgctttc cccctcccta ttgccacggc 4020
ggaactcatc gccgcctgcc ttgcccgctg ctggacaggg gctcggctgt tgggcactga 4080
caattccgtg gtgttgtcgg ggaaatcatc gtcctttcct tggctgctcg cctgtgttgc 4140
cacctggatt ctgcgcggga cgtccttctg ctacgtccct tcggccctca atccagcgga 4200
ccttccttcc cgcggcctgc tgccggctct gcggcctctt ccgcgtcttc gccttcgccc 4260
tcagacgagt cggatctccc tttgggccgc ctccccgcag aattcctgca gctagttgcc 4320
agccatctgt tgtttgcccc tcccccgtgc cttccttgac cctggaaggt gccactccca 4380
ctgtcctttc ctaataaaat gaggaaattg catcgcattg tctgagtagg tgtcattcta 4440
ttctgggggg tggggtgggg caggacagca agggggagga ttgggaagac aatagcaggc 4500
atgctgggga tgcggtgggc tctatggggt aaccaggaac ccctagtgat ggagttggcc 4560
actccctctc tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc 4620
ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc gcagctgcct gcaggaagct 4680
tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac 4740
acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac 4800
tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc 4860
tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg 4920
cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc 4980
actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt 5040
gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc 5100
ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa 5160
acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc 5220
ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg 5280
cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc 5340
tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc 5400
gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca 5460
ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact 5520
acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg 5580
gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt 5640
ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct 5700
tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga 5760
gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa 5820
tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac 5880
ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga 5940
taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc 6000
cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca 6060
gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta 6120
gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg 6180
tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc 6240
gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg 6300
ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt 6360
ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt 6420
cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata 6480
ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc 6540
gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac 6600
ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa 6660
ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct 6720
tcctttttca atattattga agcatttatc agggttattg tctcatgagc ggatacatat 6780
ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc 6840
cacctgacgt ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca 6900
c 6901
Claims (87)
1.一种非人动物,其在其基因组中包括人源化内源性白蛋白基因座,其中所述内源性白蛋白基因座的区段已经缺失并且被对应人白蛋白序列替代。
2.根据权利要求1所述的非人动物,其中所述人源化内源性白蛋白基因座编码包括人血清白蛋白肽的蛋白质。
3.根据权利要求1或2所述的非人动物,其中所述人源化内源性白蛋白基因座编码包括人白蛋白前肽的蛋白质。
4.根据前述权利要求中任一项所述的非人动物,其中所述人源化内源性白蛋白基因座编码包括人白蛋白信号肽的蛋白质。
5.根据前述权利要求中任一项所述的非人动物,其中所述内源性白蛋白基因座的包括编码序列和非编码序列两者的区域已经缺失并且被包括编码序列和非编码序列两者的对应人白蛋白序列替代。
6.根据前述权利要求中任一项所述的非人动物,其中所述人源化内源性白蛋白基因座包括内源性白蛋白启动子,其中所述人白蛋白序列与所述内源性白蛋白启动子可操作地连接。
7.根据前述权利要求中任一项所述的非人动物,其中所述内源性白蛋白基因座的至少一个内含子和至少一个外显子已经缺失并且被所述对应人白蛋白序列替代。
8.根据前述权利要求中任一项所述的非人动物,其中所述内源性白蛋白基因座的整个白蛋白编码序列已经缺失并且被所述对应人白蛋白序列替代。
9.根据权利要求8所述的非人动物,其中所述内源性白蛋白基因座的从起始密码子到终止密码子的区域已经缺失并且被所述对应人白蛋白序列替代。
10.根据前述权利要求中任一项所述的非人动物,其中所述人源化内源性白蛋白基因座包括人白蛋白3'非翻译区。
11.根据前述权利要求中任一项所述的非人动物,其中内源性白蛋白5'非翻译区尚未缺失并且尚未被所述对应人白蛋白序列替代。
12.根据前述权利要求中任一项所述的非人动物,其中所述内源性白蛋白基因座的从所述起始密码子到所述终止密码子的所述区域已经缺失并且被包括所述对应人白蛋白序列和人白蛋白3'非翻译区的人白蛋白序列替代,并且
其中所述内源性白蛋白5'非翻译区尚未缺失并且尚未被所述对应人白蛋白序列替代,并且
其中所述内源性白蛋白启动子尚未缺失并且尚未被所述对应人白蛋白序列替代。
13.根据前述权利要求中任一项所述的非人动物,其中:
(i)所述人源化内源性白蛋白基因座处的所述人白蛋白序列包括与SEQ ID NO:35中所示的序列至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的序列;或
(ii)所述人源化内源性白蛋白基因座编码包括与SEQ ID NO:5中所示的序列至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少100%相同的序列的蛋白质;
(iii)所述人源化内源性白蛋白基因座包括编码序列,所述编码序列包括与SEQ IDNO:13中所示的序列至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的序列;或
(iv)所述人源化内源性白蛋白基因座包括与SEQ ID NO:17或18中所示的序列至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%相同的序列。
14.根据前述权利要求中任一项所述的非人动物,其中所述人源化内源性白蛋白基因座不包括选择盒或报告基因。
15.根据前述权利要求中任一项所述的非人动物,其中所述非人动物对于所述人源化内源性白蛋白基因座是纯合的。
16.根据前述权利要求中任一项所述的非人动物,其中所述非人动物在其种系中包括所述人源化内源性白蛋白基因座。
17.根据前述权利要求中任一项所述的非人动物,其中所述非人动物是哺乳动物。
18.根据权利要求17所述的非人动物,其中所述非人动物是大鼠或小鼠。
19.根据权利要求18所述的非人动物,其中所述非人动物是小鼠。
20.根据前述权利要求中任一项所述的非人动物,其中所述非人动物对于所述人源化内源性白蛋白基因座是纯合的。
21.根据权利要求1到19中任一项所述的非人动物,其中所述非人动物对于所述人源化内源性白蛋白基因座是杂合的。
22.根据前述权利要求中任一项所述的非人动物,其中所述非人动物的血清白蛋白水平为至少约10mg/mL。
23.根据前述权利要求中任一项所述的非人动物,其中所述非人动物的血清白蛋白水平至少与包括野生型白蛋白基因座的对照非人动物的血清白蛋白水平一样高。
24.根据前述权利要求中任一项所述的非人动物,其中所述非人动物进一步包括整合到所述非人动物的一个或多个细胞中的所述人源化内源性白蛋白基因座的至少一个等位基因中的外源性蛋白的编码序列。
25.根据权利要求24所述的非人动物,其中所述外源性蛋白的所述编码序列整合到所述非人动物的所述一个或多个细胞中的所述人源化内源性白蛋白基因座的所述至少一个等位基因的内含子1中。
26.根据前述权利要求中任一项所述的非人动物,其中所述非人动物进一步包括不是所述内源性白蛋白基因座的灭活内源性基因座。
27.根据权利要求26所述的非人动物,其中所述非人动物进一步包括整合到所述非人动物的一个或多个细胞中的所述人源化内源性白蛋白基因座的至少一个等位基因中的外源性蛋白的编码序列,其中所述外源性蛋白替代所述灭活内源性基因座的功能。
28.根据权利要求26或27所述的非人动物,其中所述灭活内源性基因座是灭活F9基因座。
29.一种非人动物细胞,其在其基因组中包括人源化内源性白蛋白基因座,其中所述内源性白蛋白基因座的区段已经缺失并且被对应人白蛋白序列替代。
30.一种非人动物基因组,其包括人源化内源性白蛋白基因座,其中所述内源性白蛋白基因座的区段已经缺失并且被对应人白蛋白序列替代。
31.一种人源化非人动物白蛋白基因,其中所述非人白蛋白基因的区段已经缺失并且被对应人白蛋白序列替代。
32.一种用于产生人源化内源性白蛋白基因座的靶向载体,其中所述内源性白蛋白基因座的区段已经缺失并且被对应人白蛋白序列替代,其中所述靶向载体包括插入核酸,所述插入核酸包括侧接有靶向所述内源性白蛋白基因座处的5'靶序列的5'同源臂和靶向所述内源性白蛋白基因座处的3'靶序列的3'同源臂的所述对应人白蛋白序列。
33.一种评估人白蛋白靶向试剂的体内活性的方法,所述方法包括:
(a)向根据权利要求1到28中任一项所述的非人动物施用所述人白蛋白靶向试剂;以及
(b)评估所述人白蛋白靶向试剂在所述非人动物中的活性。
34.根据权利要求33所述的方法,其中所述施用包括腺相关病毒(AAV)介导的递送、脂质纳米颗粒(LNP)介导的递送或流体动力学递送(HDD)。
35.根据权利要求34所述的方法,其中所述施用包括LNP介导的递送。
36.根据权利要求35所述的方法,其中LNP剂量介于约0.1mg/kg与约2mg/kg之间。
37.根据权利要求34所述的方法,其中所述施用包括AAV8介导的递送。
38.根据权利要求33到37中任一项所述的方法,其中步骤(b)包括从所述非人动物中分离肝脏并且评估所述人白蛋白靶向试剂在所述肝脏中的活性。
39.根据权利要求33到38中任一项所述的方法,其中所述人白蛋白靶向试剂是基因组编辑药剂,并且所述评估包括评估对所述人源化内源性白蛋白基因座的修饰。
40.根据权利要求39所述的方法,其中所述评估包括测量所述人源化内源性白蛋白基因座内的插入或缺失的频率。
41.根据权利要求33到40中任一项所述的方法,其中所述评估包括测量由所述人源化内源性白蛋白基因座编码的白蛋白信使RNA的表达。
42.根据权利要求33到41中任一项所述的方法,其中所述评估包括测量由所述人源化内源性白蛋白基因座编码的白蛋白的表达。
43.根据权利要求42所述的方法,其中评估所述白蛋白的表达包括测量所述白蛋白在所述非人动物中的血清水平。
44.根据权利要求42所述的方法,其中评估所述白蛋白的表达包括测量所述白蛋白在所述非人动物的所述肝脏中的表达。
45.根据权利要求33到43中任一项所述的方法,其中所述人白蛋白靶向试剂包括核酸酶药剂或编码所述核酸酶药剂的核酸,其中所述核酸酶药剂被设计成靶向人白蛋白基因的区域。
46.根据权利要求45所述的方法,其中所述核酸酶药剂包括Cas蛋白和被设计成靶向所述人白蛋白基因中的向导RNA靶序列的向导RNA。
47.根据权利要求46所述的方法,其中所述向导RNA靶序列位于所述人白蛋白基因的内含子1中。
48.根据权利要求46或47所述的方法,其中所述Cas蛋白是Cas9蛋白。
49.根据权利要求33到48中任一项所述的方法,其中所述人白蛋白靶向试剂包括外源性供体核酸,其中所述外源性供体核酸被设计成靶向所述人白蛋白基因,并且任选地其中所述外源性供体核酸是通过AAV递送的。
50.根据权利要求49所述的方法,其中所述外源性供体核酸是单链寡脱氧核苷酸(ssODN)。
51.根据权利要求49或50所述的方法,其中所述外源性供体核酸不包括同源臂。
52.根据权利要求49或50所述的方法,其中所述外源性供体核酸包括插入核酸,所述插入核酸侧接有靶向所述人源化内源性白蛋白基因座处的5'靶序列的5'同源臂和靶向所述人源化内源性白蛋白基因座处的3'靶序列的3'同源臂。
53.根据权利要求52所述的方法,其中所述5'靶序列和所述3'靶序列中的每个靶序列包括所述人白蛋白基因的内含子1的区段。
54.根据权利要求49到53中任一项所述的方法,其中所述外源性供体核酸编码外源性蛋白。
55.根据权利要求54所述的方法,其中由已经被所述外源性供体核酸靶向的人源化内源性白蛋白基因座编码的蛋白质是包括与所述外源性蛋白融合的人白蛋白信号肽的异源蛋白。
56.根据权利要求54或55所述的方法,其中所述外源性蛋白是因子IX蛋白。
57.根据权利要求56所述的方法,其中所述评估包括测量所述因子IX蛋白在所述非人动物中的血清水平和/或包括评估活化部分凝血活酶时间或执行凝血酶生成测定。
58.根据权利要求33到57中任一项所述的方法,其中所述人白蛋白靶向试剂包括(1)被设计成靶向人白蛋白基因的区域的核酸酶药剂;以及(2)外源性供体核酸,
其中所述外源性供体核酸被设计成靶向所述人白蛋白基因,
其中所述外源性供体核酸编码外源性蛋白,并且
其中由已经被所述外源性供体核酸靶向的人源化内源性白蛋白基因座编码的蛋白质是包括与所述外源性蛋白融合的人白蛋白信号肽的异源蛋白。
59.根据权利要求54到58中任一项所述的方法,其中所述评估包括测量由所述外源性供体核酸编码的信使RNA的表达。
60.根据权利要求59所述的方法,其中所述评估包括用于以单细胞分辨率对由所述外源性供体核酸编码的所述信使RNA的表达进行定量的原位杂交测定。
61.根据权利要求59或60所述的方法,其中所述评估包括测量由所述外源性供体核酸编码的所述信使RNA在来自所述非人动物的所述肝脏的多个叶中的表达。
62.根据权利要求54到61中任一项所述的方法,其中所述评估包括测量所述外源性蛋白的表达。
63.根据权利要求62所述的方法,其中评估所述异源蛋白的表达包括测量所述异源蛋白在所述非人动物中的血清水平。
64.根据权利要求62所述的方法,其中评估所述异源蛋白的表达包括测量所述非人动物的所述肝脏中的表达。
65.一种优化人白蛋白靶向试剂的体内活性的方法,所述方法包括:
(I)在第一非人动物中第一次执行根据权利要求33到64中任一项所述的方法,所述非人动物在其基因组中包括人源化内源性白蛋白基因座;
(II)改变变量并且在第二非人动物中用所改变变量第二次执行步骤(I)的方法,所述第二非人动物在其基因组中包括人源化内源性白蛋白基因座;以及
(III)将步骤(I)中的所述人白蛋白靶向试剂的活性与步骤(II)中的所述人白蛋白靶向试剂的活性进行比较,并且选择产生较高活性的方法。
66.根据权利要求65所述的方法,其中步骤(II)中的所述所改变变量是将所述人白蛋白靶向试剂引入到所述非人动物中的递送方法。
67.根据权利要求66所述的方法,其中所述施用包括LNP介导的递送,并且步骤(II)中的所述所改变变量是LNP调配物。
68.根据权利要求65所述的方法,其中步骤(II)中的所述所改变变量是将所述人白蛋白靶向试剂引入到所述非人动物中的施用途径。
69.根据权利要求65所述的方法,其中步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人白蛋白靶向试剂的浓度或量。
70.根据权利要求65所述的方法,其中步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人白蛋白靶向试剂的形式。
71.根据权利要求65所述的方法,其中步骤(II)中的所述所改变变量是引入到所述非人动物中的所述人白蛋白靶向试剂。
72.根据权利要求65所述的方法,其中所述人白蛋白靶向试剂包括Cas蛋白或编码所述Cas蛋白的核酸以及向导RNA或编码所述向导RNA的DNA,其中所述向导RNA被设计成靶向人白蛋白基因中的向导RNA靶序列。
73.根据权利要求72所述的方法,其中步骤(II)中的所述所改变变量是所述向导RNA序列或所述向导RNA靶序列。
74.根据权利要求72所述的方法,其中所述人白蛋白靶向试剂包括编码所述Cas蛋白的信使RNA(mRNA)和所述向导RNA,并且步骤(II)中的所述所改变变量是Cas mRNA与向导RNA的比率。
75.根据权利要求72所述的方法,其中步骤(II)中的所述所改变变量是向导RNA修饰。
76.根据权利要求65所述的方法,其中所述人白蛋白靶向试剂包括外源性供体核酸。
77.根据权利要求76所述的方法,其中步骤(II)中的所述所改变变量是外源性供体核酸的形式。
78.根据权利要求76所述的方法,其中所述外源性供体核酸包括插入核酸,所述插入核酸侧接有靶向所述人源化内源性白蛋白基因座处的5'靶序列的5'同源臂和靶向所述人源化内源性白蛋白基因座处的3'靶序列的3'同源臂,并且步骤(II)中的所述所改变变量是所述5'同源臂的序列或长度和/或所述3'同源臂的序列或长度。
79.一种制备根据权利要求1到28中任一项所述的非人动物的方法,所述方法包括:
(a)将以下引入到非人动物胚胎干(ES)细胞中:
(i)核酸酶药剂或编码所述核酸酶药剂的核酸,其中所述核酸酶药剂靶向所述内源性白蛋白基因座中的靶序列;以及
(ii)靶向载体,所述靶向载体包括核酸插入物,所述核酸插入物包括侧接有对应于所述内源性白蛋白基因座中的5'靶序列的5'同源臂和对应于所述内源性白蛋白基因座中的3'靶序列的3'同源臂的所述人白蛋白序列,
其中所述靶向载体与所述内源性白蛋白基因座重组以产生经基因修饰的非人ES细胞,所述经基因修饰的非人ES细胞在其基因组中包括包含所述人白蛋白序列的所述人源化内源性白蛋白基因座;
(b)将所述经基因修饰的非人ES细胞引入到非人动物宿主胚胎中;以及
(c)在代孕母体中孕育所述非人动物宿主胚胎,其中所述代孕母体产生F0后代经基因修饰的非人动物,所述F0后代经基因修饰的非人动物在其基因组中包括包含所述人白蛋白序列的所述人源化内源性白蛋白基因座。
80.根据权利要求79所述的方法,其中所述靶向载体是长度为至少10kb的大靶向载体,或者其中所述5'同源臂和所述3'同源臂的总长度为至少10kb。
81.一种制备根据权利要求1到28中任一项所述的非人动物的方法,所述方法包括:
(a)将以下引入到非人动物单细胞期胚胎中:
(i)核酸酶药剂或编码所述核酸酶药剂的核酸,其中所述核酸酶药剂靶向所述内源性白蛋白基因座中的靶序列;以及
(ii)靶向载体,所述靶向载体包括核酸插入物,所述核酸插入物包括侧接有对应于所述内源性白蛋白基因座中的5'靶序列的5'同源臂和对应于所述内源性白蛋白基因座中的3'靶序列的3'同源臂的所述人白蛋白序列,
其中所述靶向载体与所述内源性白蛋白基因座重组以产生经基因修饰的非人单细胞期胚胎,所述经基因修饰的非人单细胞期胚胎在其基因组中包括包含所述人白蛋白序列的所述人源化内源性白蛋白基因座;
(b)在代孕母体中孕育所述经基因修饰的非人动物单细胞期胚胎以产生经基因修饰的F0代非人动物,所述经基因修饰的F0代非人动物在其基因组中包括包含所述人白蛋白序列的所述人源化内源性白蛋白基因座。
82.根据权利要求79到81中任一项所述的方法,其中所述核酸酶药剂包括Cas蛋白和向导RNA。
83.根据权利要求82所述的方法,其中所述Cas蛋白是Cas9蛋白。
84.根据权利要求82所述的方法,其中步骤(a)进一步包括引入靶向所述内源性白蛋白基因座内的第二靶序列的第二向导RNA。
85.根据权利要求79到84中任一项所述的方法,其中所述非人动物是小鼠或大鼠。
86.根据权利要求85所述的方法,其中所述非人动物是小鼠。
87.一种制备根据权利要求1到28中任一项所述的非人动物的方法,所述方法包括:
(I)(a)对多能性非人动物细胞的基因组进行修饰以包括所述人源化内源性白蛋白基因座;
(b)鉴定或选择包括所述人源化内源性白蛋白基因座的经基因修饰的多能性非人动物细胞;
(c)将所述经基因修饰的多能性非人动物细胞引入到非人动物宿主胚胎中;以及
(d)在代孕母体中孕育所述非人动物宿主胚胎;或
(II)(a)对非人动物单细胞期胚胎的基因组进行修饰以包括所述人源化内源性白蛋白基因座;
(b)选择包括所述人源化内源性白蛋白基因座的经基因修饰的非人动物单细胞期胚胎;以及
(c)在代孕母体中孕育所述经基因修饰的非人动物单细胞期胚胎。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962858589P | 2019-06-07 | 2019-06-07 | |
US62/858,589 | 2019-06-07 | ||
US201962916666P | 2019-10-17 | 2019-10-17 | |
US62/916,666 | 2019-10-17 | ||
PCT/US2020/036412 WO2020247812A1 (en) | 2019-06-07 | 2020-06-05 | Non-human animals comprising a humanized albumin locus |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113939595A true CN113939595A (zh) | 2022-01-14 |
Family
ID=71899847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080038954.5A Pending CN113939595A (zh) | 2019-06-07 | 2020-06-05 | 包括人源化白蛋白基因座的非人动物 |
Country Status (13)
Country | Link |
---|---|
US (2) | US11622547B2 (zh) |
EP (1) | EP3796776A1 (zh) |
JP (1) | JP2022534560A (zh) |
KR (1) | KR20220017939A (zh) |
CN (1) | CN113939595A (zh) |
AU (1) | AU2020289581A1 (zh) |
BR (1) | BR112021022722A2 (zh) |
CA (1) | CA3137764A1 (zh) |
IL (1) | IL288606B1 (zh) |
MX (1) | MX2021015122A (zh) |
SG (1) | SG11202111256XA (zh) |
TW (1) | TW202112229A (zh) |
WO (1) | WO2020247812A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2018338790B2 (en) | 2017-09-29 | 2022-09-15 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized TTR locus and methods of use |
CN114206108B (zh) | 2019-04-04 | 2023-09-29 | 瑞泽恩制药公司 | 包括人源化凝血因子12基因座的非人动物 |
WO2020247452A1 (en) | 2019-06-04 | 2020-12-10 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized ttr locus with a beta-slip mutation and methods of use |
SG11202111256XA (en) | 2019-06-07 | 2021-11-29 | Regeneron Pharma | Non-human animals comprising a humanized albumin locus |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1518596A (zh) * | 2001-04-18 | 2004-08-04 | �����ɷ� | 用于药理学和毒理学研究的转基因非人动物 |
Family Cites Families (150)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5523226A (en) | 1993-05-14 | 1996-06-04 | Biotechnology Research And Development Corp. | Transgenic swine compositions and methods |
WO1999005266A2 (en) | 1997-07-26 | 1999-02-04 | Wisconsin Alumni Research Foundation | Trans-species nuclear transfer |
US6599692B1 (en) | 1999-09-14 | 2003-07-29 | Sangamo Bioscience, Inc. | Functional genomics using zinc finger proteins |
US20030104526A1 (en) | 1999-03-24 | 2003-06-05 | Qiang Liu | Position dependent recognition of GNN nucleotide triplets by zinc fingers |
US6586251B2 (en) | 2000-10-31 | 2003-07-01 | Regeneron Pharmaceuticals, Inc. | Methods of modifying eukaryotic cells |
US6596541B2 (en) | 2000-10-31 | 2003-07-22 | Regeneron Pharmaceuticals, Inc. | Methods of modifying eukaryotic cells |
US20050144655A1 (en) | 2000-10-31 | 2005-06-30 | Economides Aris N. | Methods of modifying eukaryotic cells |
US7026462B2 (en) | 2000-12-07 | 2006-04-11 | Sangamo Biosciences, Inc. | Regulation of angiogenesis with zinc finger proteins |
AU2002225187A1 (en) | 2001-01-22 | 2002-07-30 | Sangamo Biosciences, Inc. | Zinc finger polypeptides and their use |
DK1353941T3 (da) | 2001-01-22 | 2013-06-17 | Sangamo Biosciences Inc | Modificerede zinkfingerbindingsproteiner |
AUPR451401A0 (en) | 2001-04-20 | 2001-05-24 | Monash University | A method of nuclear transfer |
EP1476547B1 (en) | 2002-01-23 | 2006-12-06 | The University of Utah Research Foundation | Targeted chromosomal mutagenesis using zinc finger nucleases |
CA2479153C (en) | 2002-03-15 | 2015-06-02 | Cellectis | Hybrid and single chain meganucleases and use thereof |
ATE531796T1 (de) | 2002-03-21 | 2011-11-15 | Sangamo Biosciences Inc | Verfahren und zusammensetzungen zur verwendung von zinkfinger-endonukleasen zur verbesserung der homologen rekombination |
US7612250B2 (en) | 2002-07-29 | 2009-11-03 | Trustees Of Tufts College | Nuclear transfer embryo formation method |
EP2806025B1 (en) | 2002-09-05 | 2019-04-03 | California Institute of Technology | Use of zinc finger nucleases to stimulate gene targeting |
WO2004031346A2 (en) | 2002-09-06 | 2004-04-15 | Fred Hutchinson Cancer Research Center | Methods and compositions concerning designed highly-specific nucleic acid binding proteins |
US8409861B2 (en) | 2003-08-08 | 2013-04-02 | Sangamo Biosciences, Inc. | Targeted deletion of cellular DNA sequences |
US7888121B2 (en) | 2003-08-08 | 2011-02-15 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
EP1591521A1 (en) | 2004-04-30 | 2005-11-02 | Cellectis | I-Dmo I derivatives with enhanced activity at 37 degrees C and use thereof |
US20060063231A1 (en) | 2004-09-16 | 2006-03-23 | Sangamo Biosciences, Inc. | Compositions and methods for protein production |
PL1802193T3 (pl) | 2004-10-19 | 2014-09-30 | Regeneron Pharma | Sposób wytwarzania myszy homozygotycznej pod względem modyfikacji genetycznej |
ATE466933T1 (de) | 2005-03-15 | 2010-05-15 | Cellectis | I-crei-meganuklease-varianten mit modifizierter spezifität sowie verfahren zu ihrer herstellung und verwendung |
WO2006097784A1 (en) | 2005-03-15 | 2006-09-21 | Cellectis | I-crei meganuclease variants with modified specificity, method of preparation and uses thereof |
CN101117633B (zh) | 2006-08-03 | 2011-07-20 | 上海交通大学附属儿童医院 | 一种细胞核移植方法 |
PT2415872T (pt) | 2006-12-14 | 2016-07-07 | Sangamo Biosciences Inc | Proteínas com dedos de zinco não canónicas optimizadas |
CN102037594A (zh) | 2008-04-11 | 2011-04-27 | Utc电力公司 | 燃料电池和具有歧管贮槽的双极板 |
US20110239315A1 (en) | 2009-01-12 | 2011-09-29 | Ulla Bonas | Modular dna-binding domains and methods of use |
EP2206723A1 (en) | 2009-01-12 | 2010-07-14 | Bonas, Ulla | Modular DNA-binding domains |
JP5932632B2 (ja) | 2009-03-20 | 2016-06-15 | サンガモ バイオサイエンシーズ, インコーポレイテッド | 改変された亜鉛フィンガータンパク質を使用したcxcr4の修飾 |
US8772008B2 (en) | 2009-05-18 | 2014-07-08 | Sangamo Biosciences, Inc. | Methods and compositions for increasing nuclease activity |
US20120178647A1 (en) | 2009-08-03 | 2012-07-12 | The General Hospital Corporation | Engineering of zinc finger arrays by context-dependent assembly |
WO2011020014A1 (en) | 2009-08-14 | 2011-02-17 | Regeneron Pharmaceuticals, Inc. | Promoter-regulated differentiation-dependent self-deleting cassette |
DK3417701T3 (da) | 2009-10-06 | 2022-03-14 | Regeneron Pharma | Genmodificerede mus og indpodning |
PT3147362T (pt) | 2009-10-29 | 2019-04-02 | Regeneron Pharma | Alelos multifuncionais |
PL2816112T3 (pl) | 2009-12-10 | 2019-03-29 | Regents Of The University Of Minnesota | Modyfikacja DNA za pośrednictwem efektorów TAL |
EP4233537A3 (en) | 2011-02-15 | 2023-09-13 | Regeneron Pharmaceuticals, Inc. | Humanized m-csf mice and uses thereof |
ES2774491T3 (es) | 2011-06-07 | 2020-07-21 | Wisconsin Alumni Res Found | Terapia génica con insulina basada en hepatocitos para la diabetes |
ES2961613T3 (es) | 2011-09-21 | 2024-03-12 | Sangamo Therapeutics Inc | Métodos y composiciones para la regulación de la expresión transgénica |
MY164836A (en) | 2011-10-28 | 2018-01-30 | Regeneron Pharma | Genetically modified major histocompatibility complex mice |
CN108866101A (zh) | 2011-10-28 | 2018-11-23 | 瑞泽恩制药公司 | 人源化il-6和il-6受体 |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
EP2839013B1 (en) | 2012-04-18 | 2020-08-26 | The Board of Trustees of the Leland Stanford Junior University | Non-disruptive gene targeting |
PL2847335T3 (pl) | 2012-04-25 | 2019-01-31 | Regeneron Pharmaceuticals, Inc. | Celowanie dużymi wektorami do celowania wspomagane nukleazą |
DE202013012241U1 (de) | 2012-05-25 | 2016-01-18 | Emmanuelle Charpentier | Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription |
US8962913B2 (en) | 2012-06-18 | 2015-02-24 | Regeneron Pharmaceuticals, Inc. | Humanized IL-7 rodents |
HUE051612T2 (hu) | 2012-07-11 | 2021-03-01 | Sangamo Therapeutics Inc | Eljárások és készítmények lizoszomális tárolási betegségek kezelésére |
US10648001B2 (en) | 2012-07-11 | 2020-05-12 | Sangamo Therapeutics, Inc. | Method of treating mucopolysaccharidosis type I or II |
WO2014033644A2 (en) | 2012-08-28 | 2014-03-06 | Novartis Ag | Methods of nuclease-based genetic engineering |
ES2926021T3 (es) | 2012-10-23 | 2022-10-21 | Toolgen Inc | Composición para escindir un ADN objetivo que comprende un ARN guía específico para el ADN objetivo y ácido nucleico codificador de proteína Cas o proteína Cas, y uso de la misma |
RU2673156C2 (ru) | 2012-11-05 | 2018-11-22 | Ридженерон Фармасьютикалз, Инк. | Генетически модифицированные не относящиеся к человеческому роду животные и способы их применения |
WO2014089212A1 (en) | 2012-12-05 | 2014-06-12 | Sangamo Biosciences, Inc. | Methods and compositions for regulation of metabolic disorders |
PL2928496T3 (pl) | 2012-12-06 | 2020-04-30 | Sigma-Aldrich Co. Llc | Modyfikacja i regulacja genomu w oparciu o CRISPR |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
BR112015013784A2 (pt) | 2012-12-12 | 2017-07-11 | Massachusetts Inst Technology | aplicação, manipulação e otimização de sistemas, métodos e composições para manipulação de sequência e aplicações terapêuticas |
RU2699523C2 (ru) | 2012-12-17 | 2019-09-05 | Президент Энд Фэллоуз Оф Харвард Коллидж | Рнк-направляемая инженерия генома человека |
CA2900992C (en) | 2013-02-20 | 2023-02-28 | Regeneron Pharmaceuticals, Inc. | Genetic modification of rats |
US20150342163A1 (en) | 2013-02-22 | 2015-12-03 | Regeneron Pharmaceuticals, Inc. | Genetically modified major histocompatibility complex mice |
US10154658B2 (en) | 2013-02-22 | 2018-12-18 | Regeneron Pharmaceuticals, Inc. | Genetically modified major histocompatibility complex mice |
WO2014131833A1 (en) | 2013-02-27 | 2014-09-04 | Helmholtz Zentrum München Deutsches Forschungszentrum Für Gesundheit Und Umwelt (Gmbh) | Gene editing in the oocyte by cas9 nucleases |
KR102210322B1 (ko) | 2013-03-15 | 2021-02-01 | 더 제너럴 하스피탈 코포레이션 | Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도 |
CN105518146B (zh) | 2013-04-04 | 2022-07-15 | 哈佛学院校长同事会 | 利用CRISPR/Cas系统的基因组编辑的治疗性用途 |
AU2014253942B9 (en) | 2013-04-16 | 2020-08-13 | Regeneron Pharmaceuticals, Inc. | Targeted modification of rat genome |
WO2014182700A1 (en) | 2013-05-10 | 2014-11-13 | Sangamo Biosciences, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering |
CN116083487A (zh) | 2013-05-15 | 2023-05-09 | 桑格摩生物治疗股份有限公司 | 用于治疗遗传病状的方法和组合物 |
CN107995927B (zh) | 2013-06-17 | 2021-07-30 | 布罗德研究所有限公司 | 用于肝靶向和治疗的crispr-cas系统、载体和组合物的递送与用途 |
ES2959333T3 (es) | 2013-09-23 | 2024-02-23 | Regeneron Pharma | Animales no humanos que tienen un gen humanizado de la proteína reguladora de señales |
WO2015048577A2 (en) | 2013-09-27 | 2015-04-02 | Editas Medicine, Inc. | Crispr-related methods and compositions |
DK3138397T3 (en) | 2013-10-15 | 2019-04-15 | Regeneron Pharma | Humanized IL-15 animals |
CN116836957A (zh) | 2013-10-17 | 2023-10-03 | 桑格摩生物科学股份有限公司 | 用于核酸酶介导的基因组工程改造的递送方法和组合物 |
EP3757116A1 (en) | 2013-12-09 | 2020-12-30 | Sangamo Therapeutics, Inc. | Methods and compositions for genome engineering |
RU2725520C2 (ru) | 2013-12-11 | 2020-07-02 | Регенерон Фармасьютикалс, Инк. | Способы и композиции для направленной модификации генома |
JP2017501149A (ja) | 2013-12-12 | 2017-01-12 | ザ・ブロード・インスティテュート・インコーポレイテッド | 粒子送達構成成分を用いた障害及び疾患の標的化のためのcrispr−cas系及び組成物の送達、使用及び治療適用 |
EP3110454B1 (en) | 2014-02-24 | 2020-11-18 | Sangamo Therapeutics, Inc. | Methods and compositions for nuclease-mediated targeted integration |
US10612041B2 (en) | 2014-03-21 | 2020-04-07 | The Board Of Trustees Of The Leland Stanford Junior University | Genome editing without nucleases |
MX2016014504A (es) | 2014-05-05 | 2017-05-23 | Regeneron Pharma | Animales c5 y c3 humanizados. |
NO2785538T3 (zh) | 2014-05-07 | 2018-08-04 | ||
AU2015264427B2 (en) | 2014-05-19 | 2021-09-23 | Institute For Research In Biomedicine (Irb) | Genetically modified non-human animals expressing human EPO |
EP3155116A4 (en) | 2014-06-10 | 2017-12-27 | Massachusetts Institute Of Technology | Method for gene editing |
EA039693B1 (ru) | 2014-06-16 | 2022-02-28 | Дзе Джонс Хопкинс Юниверсити | Композиции и способы для экспрессии рнк-проводников crispr с использованием промотора h1 |
EP3354732B1 (en) | 2014-06-23 | 2020-01-08 | Regeneron Pharmaceuticals, Inc. | Nuclease-mediated dna assembly |
US20150376587A1 (en) | 2014-06-25 | 2015-12-31 | Caribou Biosciences, Inc. | RNA Modification to Engineer Cas9 Activity |
SG11201610633QA (en) | 2014-06-26 | 2017-01-27 | Regeneron Pharma | Methods and compositions for targeted genetic modifications and methods of use |
US10342761B2 (en) | 2014-07-16 | 2019-07-09 | Novartis Ag | Method of encapsulating a nucleic acid in a lipid nanoparticle host |
CN107072184A (zh) | 2014-09-19 | 2017-08-18 | 瑞泽恩制药公司 | 嵌合抗原受体 |
KR102531016B1 (ko) | 2014-11-21 | 2023-05-10 | 리제너론 파마슈티칼스 인코포레이티드 | 쌍 형성된 가이드 rna를 사용하는 표적화된 유전자 변형을 위한 방법 및 조성물 |
WO2016106236A1 (en) | 2014-12-23 | 2016-06-30 | The Broad Institute Inc. | Rna-targeting system |
EP4248744A3 (en) | 2015-04-06 | 2023-12-27 | Regeneron Pharmaceuticals, Inc. | Humanized t cell mediated immune responses in non-human animals |
US10626393B2 (en) | 2015-06-04 | 2020-04-21 | Arbutus Biopharma Corporation | Delivering CRISPR therapeutics with lipid nanoparticles |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
WO2017011519A1 (en) | 2015-07-13 | 2017-01-19 | Sangamo Biosciences, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering |
EP3159407A1 (en) | 2015-10-23 | 2017-04-26 | Silence Therapeutics (London) Ltd | Guide rnas, methods and uses |
BR112018008519A2 (pt) | 2015-10-28 | 2018-11-06 | Sangamo Therapeutics Inc | construtos específicos de fígado, cassetes de expressão de fator viii e métodos de uso dos mesmos |
CN109328231A (zh) | 2015-11-06 | 2019-02-12 | 克里斯普治疗股份公司 | 用于治疗1a型糖原贮积病的材料和方法 |
BR112018010158A2 (pt) | 2015-11-20 | 2018-11-21 | Regeneron Pharma | roedor, polipeptídeo lag-3 humanizado, célula ou tecido, célula-tronco embrionária e embrião de roedor, métodos para produzir um roedor, para avaliar a eficácia antitumoral e as propriedades farmacocinéticas de uma droga |
JP6976249B2 (ja) | 2015-11-23 | 2021-12-08 | サンガモ セラピューティクス, インコーポレイテッド | 免疫を工学操作するための方法および組成物 |
WO2017093804A2 (en) | 2015-12-01 | 2017-06-08 | Crispr Therapeutics Ag | Materials and methods for treatment of alpha-1 antitrypsin deficiency |
BR112018012894A2 (pt) | 2015-12-23 | 2018-12-04 | Crispr Therapeutics Ag | materiais e métodos para tratamento de esclerose lateral amiotrófica e/ou degeneração lobular frontotemporal |
WO2017134529A1 (en) | 2016-02-02 | 2017-08-10 | Crispr Therapeutics Ag | Materials and methods for treatment of severe combined immunodeficiency (scid) or omenn syndrome |
CN108779159B (zh) | 2016-02-04 | 2022-12-30 | 瑞泽恩制药公司 | 具有经改造的angptl8基因的非人动物 |
EP3416689B1 (en) | 2016-02-18 | 2023-01-18 | CRISPR Therapeutics AG | Materials and methods for treatment of severe combined immunodeficiency (scid) or omenn syndrome |
EP3429632B1 (en) | 2016-03-16 | 2023-01-04 | CRISPR Therapeutics AG | Materials and methods for treatment of hereditary haemochromatosis |
KR102617874B1 (ko) | 2016-03-30 | 2023-12-22 | 인텔리아 테라퓨틱스, 인크. | Crispr/cas 성분을 위한 지질 나노입자 제제 |
US10767175B2 (en) | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
EP3478829A1 (en) | 2016-06-29 | 2019-05-08 | Crispr Therapeutics AG | Materials and methods for treatment of myotonic dystrophy type 1 (dm1) and other related disorders |
WO2018007871A1 (en) | 2016-07-08 | 2018-01-11 | Crispr Therapeutics Ag | Materials and methods for treatment of transthyretin amyloidosis |
CA3030587A1 (en) | 2016-07-15 | 2018-01-18 | Salk Institute For Biological Studies | Methods and compositions for genome editing in non-dividing cells |
US11219695B2 (en) | 2016-10-20 | 2022-01-11 | Sangamo Therapeutics, Inc. | Methods and compositions for the treatment of Fabry disease |
IL267024B2 (en) | 2016-12-08 | 2023-12-01 | Intellia Therapeutics Inc | Adapted leader RNAs for genomic editing |
CA3045122A1 (en) | 2016-12-09 | 2018-06-14 | Sangamo Therapeutics, Inc. | Delivery of target specific nucleases |
WO2018126087A1 (en) | 2016-12-29 | 2018-07-05 | Applied Stemcell, Inc. | Gene editing method using virus |
EP3585899A1 (en) | 2017-02-22 | 2020-01-01 | CRISPR Therapeutics AG | Materials and methods for treatment of primary hyperoxaluria type 1 (ph1) and other alanine-glyoxylate aminotransferase (agxt) gene related conditions or disorders |
CA3054167A1 (en) | 2017-02-27 | 2018-08-30 | Regeneron Pharmaceuticals, Inc. | Humanized model of kidney and liver disorders |
JP7123982B2 (ja) | 2017-06-15 | 2022-08-23 | ツールゲン インコーポレイテッド | 肝臓において目的のタンパク質を発現するためのプラットフォーム |
CN111032867A (zh) | 2017-06-16 | 2020-04-17 | 应用干细胞有限公司 | 具有提高的敲入效率的基因编辑方法 |
AU2018338790B2 (en) | 2017-09-29 | 2022-09-15 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized TTR locus and methods of use |
KR20200067190A (ko) | 2017-10-17 | 2020-06-11 | 크리스퍼 테라퓨틱스 아게 | A형 혈우병을 위한 유전자 편집용 조성물 및 방법 |
WO2019102381A1 (en) | 2017-11-21 | 2019-05-31 | Casebia Therapeutics Llp | Materials and methods for treatment of autosomal dominant retinitis pigmentosa |
AU2018378672A1 (en) | 2017-12-06 | 2020-07-09 | Generation Bio Co. | Gene editing using a modified closed-ended dna (ceDNA) |
WO2019118875A1 (en) | 2017-12-15 | 2019-06-20 | Ou Li | Crispr-mediated genome editing with vectors |
CN111886341A (zh) | 2018-01-05 | 2020-11-03 | 香港中文大学 | 使用crispr的高效体内敲入 |
CA3088180A1 (en) | 2018-01-12 | 2019-07-18 | Crispr Therapeutics Ag | Compositions and methods for gene editing by targeting transferrin |
EP3752616A1 (en) | 2018-02-16 | 2020-12-23 | CRISPR Therapeutics AG | Compositions and methods for gene editing by targeting fibrinogen-alpha |
IL314733A (en) | 2018-03-26 | 2024-10-01 | Regeneron Pharma | Humanized rodents for testing therapeutic agents |
US11690921B2 (en) | 2018-05-18 | 2023-07-04 | Sangamo Therapeutics, Inc. | Delivery of target specific nucleases |
BR112020024731A2 (pt) | 2018-06-08 | 2021-03-23 | Intellia Therapeutics, Inc. | rnas guias modificados para edição de gene |
GB2596224B (en) | 2018-06-19 | 2022-09-07 | Univ Texas | Lipid nanoparticle compositions for delivery of mRNA and long nucleic acids |
US20220306699A1 (en) | 2018-06-27 | 2022-09-29 | Altius Institute For Biomedical Sciences | Nucleic Acid Binding Domains and Methods of Use Thereof |
EP3814370A4 (en) | 2018-06-27 | 2022-06-22 | Altius Institute For Biomedical Sciences | NUCLEASES FOR GENOMIC EDITING |
US20210371847A1 (en) | 2018-06-27 | 2021-12-02 | Altius Institute For Biomedical Sciences | Gapped And Tunable Repeat Units For Use In Genome Editing And Gene Regulation Compositions |
SG11202011284RA (en) | 2018-07-16 | 2020-12-30 | Regeneron Pharma | Non-human animal models of ditra disease and uses thereof |
EP3833755A4 (en) | 2018-08-10 | 2022-05-25 | Logicbio Therapeutics, Inc. | DISRUPTIVE GENE THERAPY FOR THE TREATMENT OF MMA |
US20220001030A1 (en) | 2018-10-15 | 2022-01-06 | Fondazione Telethon | Genome editing methods and constructs |
CA3116885A1 (en) | 2018-10-17 | 2020-04-23 | Crispr Therapeutics Ag | Compositions and methods for delivering transgenes |
KR20210102882A (ko) | 2018-10-18 | 2021-08-20 | 인텔리아 테라퓨틱스, 인크. | 핵산 구조체 및 사용 방법 |
JP2022512731A (ja) | 2018-10-18 | 2022-02-07 | インテリア セラピューティクス,インコーポレーテッド | 第ix因子を発現するための組成物及び方法 |
AU2019361203A1 (en) | 2018-10-18 | 2021-05-27 | Intellia Therapeutics, Inc. | Compositions and methods for transgene expression from an albumin locus |
SG11202103735TA (en) | 2018-10-18 | 2021-05-28 | Intellia Therapeutics Inc | Compositions and methods for treating alpha-1 antitrypsin deficiencey |
EP3887513A2 (en) | 2018-11-28 | 2021-10-06 | CRISPR Therapeutics AG | Optimized mrna encoding cas9 for use in lnps |
AU2020221340A1 (en) | 2019-02-15 | 2021-09-16 | Bayer Healthcare Llc | Gene editing for hemophilia A with improved Factor VIII expression |
SG11202108451VA (en) | 2019-04-03 | 2021-09-29 | Regeneron Pharma | Methods and compositions for insertion of antibody coding sequences into a safe harbor locus |
CN114206108B (zh) | 2019-04-04 | 2023-09-29 | 瑞泽恩制药公司 | 包括人源化凝血因子12基因座的非人动物 |
US11702644B2 (en) | 2019-04-11 | 2023-07-18 | California Institute Of Technology | Methods and compositions for in vivo gene editing based cell-type-specific cellular engineering |
WO2020241679A1 (ja) | 2019-05-30 | 2020-12-03 | 国立大学法人北海道大学 | 脂質ナノ粒子 |
WO2020247452A1 (en) | 2019-06-04 | 2020-12-10 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized ttr locus with a beta-slip mutation and methods of use |
SG11202111256XA (en) | 2019-06-07 | 2021-11-29 | Regeneron Pharma | Non-human animals comprising a humanized albumin locus |
US20230416776A1 (en) | 2019-10-08 | 2023-12-28 | Regents Of The University Of Minnesota | Crispr-mediated human genome editing with vectors |
WO2021083073A1 (zh) | 2019-10-31 | 2021-05-06 | 华东师范大学 | 一种基于肝细胞Alb基因的疾病治疗的产品 |
CN115715203A (zh) | 2020-05-06 | 2023-02-24 | 塞勒克提斯公司 | 对细胞进行基因修饰以递送治疗性蛋白质的方法 |
-
2020
- 2020-06-05 SG SG11202111256XA patent/SG11202111256XA/en unknown
- 2020-06-05 JP JP2021568885A patent/JP2022534560A/ja active Pending
- 2020-06-05 IL IL288606A patent/IL288606B1/en unknown
- 2020-06-05 US US16/894,302 patent/US11622547B2/en active Active
- 2020-06-05 BR BR112021022722A patent/BR112021022722A2/pt unknown
- 2020-06-05 WO PCT/US2020/036412 patent/WO2020247812A1/en unknown
- 2020-06-05 AU AU2020289581A patent/AU2020289581A1/en active Pending
- 2020-06-05 EP EP20750423.4A patent/EP3796776A1/en active Pending
- 2020-06-05 CN CN202080038954.5A patent/CN113939595A/zh active Pending
- 2020-06-05 CA CA3137764A patent/CA3137764A1/en active Pending
- 2020-06-05 TW TW109119042A patent/TW202112229A/zh unknown
- 2020-06-05 MX MX2021015122A patent/MX2021015122A/es unknown
- 2020-06-05 KR KR1020217041966A patent/KR20220017939A/ko not_active Application Discontinuation
-
2023
- 2023-02-27 US US18/175,010 patent/US20230232797A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1518596A (zh) * | 2001-04-18 | 2004-08-04 | �����ɷ� | 用于药理学和毒理学研究的转基因非人动物 |
Non-Patent Citations (2)
Title |
---|
DORTHE VIUFF ET AL: "Generation of a double transgenic humanized neonatal Fc receptor (FcRn)/albumin mouse to study the pharmacokinetics of albumin-linked drugs", JOURNAL OF CONTROLLED RELEASE, vol. 223, 14 December 2015 (2015-12-14), pages 1 * |
JIN PENG ET AL: "Production of Human Albumin in Pigs Through CRISPR/Cas9- Mediated Knockin of Human cDNA into Swine Albumin Locus in the Zygotes", SCIENTIFIC REPORTS, vol. 5, no. 1, 12 November 2015 (2015-11-12), pages 4 - 5 * |
Also Published As
Publication number | Publication date |
---|---|
US20230232797A1 (en) | 2023-07-27 |
TW202112229A (zh) | 2021-04-01 |
JP2022534560A (ja) | 2022-08-02 |
SG11202111256XA (en) | 2021-11-29 |
WO2020247812A1 (en) | 2020-12-10 |
IL288606A (en) | 2022-02-01 |
KR20220017939A (ko) | 2022-02-14 |
CA3137764A1 (en) | 2020-12-10 |
AU2020289581A1 (en) | 2021-11-18 |
BR112021022722A2 (pt) | 2022-01-04 |
US11622547B2 (en) | 2023-04-11 |
IL288606B1 (en) | 2024-08-01 |
MX2021015122A (es) | 2022-04-06 |
EP3796776A1 (en) | 2021-03-31 |
US20200383304A1 (en) | 2020-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111885915B (zh) | 使用crispr/cas系统对动物进行转录调制 | |
CN111163633B (zh) | 包含人源化ttr基因座的非人类动物及其使用方法 | |
KR20230019843A (ko) | 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물 | |
KR20210143230A (ko) | 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물 | |
CN110891420B (zh) | Cas转基因小鼠胚胎干细胞和小鼠及其应用 | |
US20210261985A1 (en) | Methods and compositions for assessing crispr/cas-mediated disruption or excision and crispr/cas-induced recombination with an exogenous donor nucleic acid in vivo | |
CN113939595A (zh) | 包括人源化白蛋白基因座的非人动物 | |
AU2020253532B2 (en) | Non-human animals comprising a humanized coagulation factor 12 locus | |
CN113874510A (zh) | 包括具有β滑移突变的人源化TTR基因座的非人动物和使用方法 | |
KR20220097414A (ko) | X-연관 연소 망막층간분리 치료법을 위한 crispr 및 aav 전략 | |
KR20200032117A (ko) | 생체 내에서 외인성 공여체 핵산과의 CRISPR/Cas-유도된 재조합의 평가 | |
RU2815514C2 (ru) | Животные, отличные от человека, содержащие гуманизированный локус альбумина | |
US20230081547A1 (en) | Non-human animals comprising a humanized klkb1 locus and methods of use | |
RU2784927C1 (ru) | Отличные от человека животные, включающие в себя гуманизированный ttr локус, и способы применения | |
CN117043324A (zh) | 用于治疗先天性肌营养不良的治疗性lama2载荷 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |