TW202300649A - Dna修飾酶及活性片段及其變體及使用方法 - Google Patents
Dna修飾酶及活性片段及其變體及使用方法 Download PDFInfo
- Publication number
- TW202300649A TW202300649A TW111110606A TW111110606A TW202300649A TW 202300649 A TW202300649 A TW 202300649A TW 111110606 A TW111110606 A TW 111110606A TW 111110606 A TW111110606 A TW 111110606A TW 202300649 A TW202300649 A TW 202300649A
- Authority
- TW
- Taiwan
- Prior art keywords
- rgn
- fusion protein
- sequence
- seq
- deaminase
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 185
- 239000012634 fragment Substances 0.000 title description 39
- 102000004190 Enzymes Human genes 0.000 title description 23
- 108090000790 Enzymes Proteins 0.000 title description 23
- 108020001507 fusion proteins Proteins 0.000 claims abstract description 470
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 470
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 369
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 353
- 229920001184 polypeptide Polymers 0.000 claims abstract description 352
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 211
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 198
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 198
- 230000004568 DNA-binding Effects 0.000 claims abstract description 186
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 163
- 101710163270 Nuclease Proteins 0.000 claims abstract description 103
- 239000013598 vector Substances 0.000 claims abstract description 59
- 210000004027 cell Anatomy 0.000 claims description 345
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 240
- 125000003729 nucleotide group Chemical group 0.000 claims description 197
- 239000002773 nucleotide Substances 0.000 claims description 195
- 108090000623 proteins and genes Proteins 0.000 claims description 187
- 102000040430 polynucleotide Human genes 0.000 claims description 131
- 108091033319 polynucleotide Proteins 0.000 claims description 131
- 239000002157 polynucleotide Substances 0.000 claims description 131
- 108020004414 DNA Proteins 0.000 claims description 128
- 230000035772 mutation Effects 0.000 claims description 113
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 112
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 102
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 102
- 102000004169 proteins and genes Human genes 0.000 claims description 98
- 201000010099 disease Diseases 0.000 claims description 90
- 102000053602 DNA Human genes 0.000 claims description 85
- 230000014509 gene expression Effects 0.000 claims description 60
- 108010080611 Cytosine Deaminase Proteins 0.000 claims description 57
- 102000000311 Cytosine Deaminase Human genes 0.000 claims description 57
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 55
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 55
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 48
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 48
- 230000000694 effects Effects 0.000 claims description 48
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 47
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 42
- 230000001364 causal effect Effects 0.000 claims description 32
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 31
- 238000000338 in vitro Methods 0.000 claims description 31
- 150000001413 amino acids Chemical class 0.000 claims description 28
- 229940035893 uracil Drugs 0.000 claims description 27
- 238000010459 TALEN Methods 0.000 claims description 26
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 26
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 23
- 239000008194 pharmaceutical composition Substances 0.000 claims description 23
- 239000011701 zinc Substances 0.000 claims description 23
- 229910052725 zinc Inorganic materials 0.000 claims description 23
- 230000004927 fusion Effects 0.000 claims description 22
- 238000011282 treatment Methods 0.000 claims description 22
- 239000003937 drug carrier Substances 0.000 claims description 21
- 230000004048 modification Effects 0.000 claims description 18
- 238000012986 modification Methods 0.000 claims description 18
- 230000000087 stabilizing effect Effects 0.000 claims description 18
- 239000003814 drug Substances 0.000 claims description 15
- 238000004519 manufacturing process Methods 0.000 claims description 15
- 230000002829 reductive effect Effects 0.000 claims description 15
- 238000012937 correction Methods 0.000 claims description 11
- 229940079593 drug Drugs 0.000 claims description 11
- 208000009869 Neu-Laxova syndrome Diseases 0.000 claims description 10
- 238000012258 culturing Methods 0.000 claims description 10
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 10
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 9
- 108091028664 Ribonucleotide Proteins 0.000 claims description 8
- 230000002068 genetic effect Effects 0.000 claims description 8
- 239000002336 ribonucleotide Substances 0.000 claims description 8
- 210000004102 animal cell Anatomy 0.000 claims description 5
- 208000028782 Hereditary disease Diseases 0.000 claims description 4
- 208000026350 Inborn Genetic disease Diseases 0.000 claims description 4
- 208000024556 Mendelian disease Diseases 0.000 claims description 4
- 108020004485 Nonsense Codon Proteins 0.000 claims description 4
- 208000016361 genetic disease Diseases 0.000 claims description 3
- 230000037434 nonsense mutation Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 abstract description 36
- 241000196324 Embryophyta Species 0.000 description 92
- 235000018102 proteins Nutrition 0.000 description 87
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 49
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 42
- 235000001014 amino acid Nutrition 0.000 description 34
- 125000000539 amino acid group Chemical group 0.000 description 27
- 238000006481 deamination reaction Methods 0.000 description 23
- 210000001519 tissue Anatomy 0.000 description 23
- 230000009615 deamination Effects 0.000 description 22
- 238000012217 deletion Methods 0.000 description 22
- 230000037430 deletion Effects 0.000 description 22
- 208000035475 disorder Diseases 0.000 description 22
- 229940104302 cytosine Drugs 0.000 description 20
- 210000004962 mammalian cell Anatomy 0.000 description 20
- 108091079001 CRISPR RNA Proteins 0.000 description 19
- 230000003612 virological effect Effects 0.000 description 18
- 241000238631 Hexapoda Species 0.000 description 17
- 210000000130 stem cell Anatomy 0.000 description 17
- 230000027455 binding Effects 0.000 description 16
- 210000005260 human cell Anatomy 0.000 description 16
- 210000002865 immune cell Anatomy 0.000 description 16
- 208000024891 symptom Diseases 0.000 description 16
- 241000282414 Homo sapiens Species 0.000 description 15
- 210000003463 organelle Anatomy 0.000 description 15
- 239000000047 product Substances 0.000 description 15
- 238000006467 substitution reaction Methods 0.000 description 15
- 230000000295 complement effect Effects 0.000 description 14
- 238000009396 hybridization Methods 0.000 description 14
- 125000006850 spacer group Chemical group 0.000 description 14
- 230000009466 transformation Effects 0.000 description 14
- 108091033409 CRISPR Proteins 0.000 description 13
- 108091026890 Coding region Proteins 0.000 description 13
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 13
- 230000008685 targeting Effects 0.000 description 12
- 210000004899 c-terminal region Anatomy 0.000 description 11
- 238000001727 in vivo Methods 0.000 description 11
- 210000001161 mammalian embryo Anatomy 0.000 description 11
- 230000001404 mediated effect Effects 0.000 description 11
- 241000271566 Aves Species 0.000 description 10
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 10
- 241000700605 Viruses Species 0.000 description 10
- 238000003776 cleavage reaction Methods 0.000 description 10
- 230000001105 regulatory effect Effects 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 241000894007 species Species 0.000 description 10
- 108700028369 Alleles Proteins 0.000 description 9
- 238000010362 genome editing Methods 0.000 description 9
- 238000004806 packaging method and process Methods 0.000 description 9
- 210000002706 plastid Anatomy 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 8
- 241000124008 Mammalia Species 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 8
- 108020004682 Single-Stranded DNA Proteins 0.000 description 8
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 239000013607 AAV vector Substances 0.000 description 7
- 241000702421 Dependoparvovirus Species 0.000 description 7
- 241000193996 Streptococcus pyogenes Species 0.000 description 7
- 240000008042 Zea mays Species 0.000 description 7
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 7
- 239000004480 active ingredient Substances 0.000 description 7
- 238000003556 assay Methods 0.000 description 7
- 230000009977 dual effect Effects 0.000 description 7
- 239000012636 effector Substances 0.000 description 7
- 210000002257 embryonic structure Anatomy 0.000 description 7
- 238000001415 gene therapy Methods 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 230000000670 limiting effect Effects 0.000 description 7
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 230000035897 transcription Effects 0.000 description 7
- 241000701161 unidentified adenovirus Species 0.000 description 7
- 239000013603 viral vector Substances 0.000 description 7
- 108020004705 Codon Proteins 0.000 description 6
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 6
- 240000007594 Oryza sativa Species 0.000 description 6
- 235000007164 Oryza sativa Nutrition 0.000 description 6
- 240000003768 Solanum lycopersicum Species 0.000 description 6
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 6
- 102100037111 Uracil-DNA glycosylase Human genes 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 230000002538 fungal effect Effects 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- -1 or RNA molecules (eg Proteins 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- 230000006798 recombination Effects 0.000 description 6
- 238000005215 recombination Methods 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 230000001177 retroviral effect Effects 0.000 description 6
- 235000009566 rice Nutrition 0.000 description 6
- 150000003839 salts Chemical class 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 230000002103 transcriptional effect Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 230000009261 transgenic effect Effects 0.000 description 6
- 108010052875 Adenine deaminase Proteins 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 244000062793 Sorghum vulgare Species 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000004520 electroporation Methods 0.000 description 5
- 238000012239 gene modification Methods 0.000 description 5
- 230000005017 genetic modification Effects 0.000 description 5
- 235000013617 genetically modified food Nutrition 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 230000009149 molecular binding Effects 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 230000000149 penetrating effect Effects 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 4
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 4
- 241000283690 Bos taurus Species 0.000 description 4
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 4
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 241000283707 Capra Species 0.000 description 4
- 235000002566 Capsicum Nutrition 0.000 description 4
- 241000701489 Cauliflower mosaic virus Species 0.000 description 4
- 241000282693 Cercopithecidae Species 0.000 description 4
- 108010019670 Chimeric Antigen Receptors Proteins 0.000 description 4
- 229920000742 Cotton Polymers 0.000 description 4
- 244000241257 Cucumis melo Species 0.000 description 4
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- 235000010469 Glycine max Nutrition 0.000 description 4
- 244000068988 Glycine max Species 0.000 description 4
- 241000219146 Gossypium Species 0.000 description 4
- 102000029812 HNH nuclease Human genes 0.000 description 4
- 108060003760 HNH nuclease Proteins 0.000 description 4
- 244000020551 Helianthus annuus Species 0.000 description 4
- 235000003222 Helianthus annuus Nutrition 0.000 description 4
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 4
- 235000007340 Hordeum vulgare Nutrition 0.000 description 4
- 240000005979 Hordeum vulgare Species 0.000 description 4
- 241000208125 Nicotiana Species 0.000 description 4
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 4
- 208000014060 Niemann-Pick disease Diseases 0.000 description 4
- 239000006002 Pepper Substances 0.000 description 4
- 235000016761 Piper aduncum Nutrition 0.000 description 4
- 240000003889 Piper guineense Species 0.000 description 4
- 235000017804 Piper guineense Nutrition 0.000 description 4
- 235000008184 Piper nigrum Nutrition 0.000 description 4
- 241000700159 Rattus Species 0.000 description 4
- 240000000111 Saccharum officinarum Species 0.000 description 4
- 235000007201 Saccharum officinarum Nutrition 0.000 description 4
- 235000002595 Solanum tuberosum Nutrition 0.000 description 4
- 244000061456 Solanum tuberosum Species 0.000 description 4
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 4
- 235000021536 Sugar beet Nutrition 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 108700019146 Transgenes Proteins 0.000 description 4
- 241000209140 Triticum Species 0.000 description 4
- 235000021307 Triticum Nutrition 0.000 description 4
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 230000009418 agronomic effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000033590 base-excision repair Effects 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 238000001638 lipofection Methods 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 235000009973 maize Nutrition 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 102200041370 rs80358259 Human genes 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 235000013311 vegetables Nutrition 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 3
- 241000589158 Agrobacterium Species 0.000 description 3
- WVDDGKGOMKODPV-UHFFFAOYSA-N Benzyl alcohol Chemical compound OCC1=CC=CC=C1 WVDDGKGOMKODPV-UHFFFAOYSA-N 0.000 description 3
- 108700004991 Cas12a Proteins 0.000 description 3
- 241000699800 Cricetinae Species 0.000 description 3
- 241000938605 Crocodylia Species 0.000 description 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- 241000209510 Liliopsida Species 0.000 description 3
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 3
- 102100029565 NPC intracellular cholesterol transporter 1 Human genes 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 241001494479 Pecora Species 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 3
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 3
- 241000282898 Sus scrofa Species 0.000 description 3
- 210000001744 T-lymphocyte Anatomy 0.000 description 3
- 102000002933 Thioredoxin Human genes 0.000 description 3
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 3
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N aspartic acid group Chemical group N[C@@H](CC(=O)O)C(=O)O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- 230000008238 biochemical pathway Effects 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 239000013592 cell lysate Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 3
- 241001233957 eudicotyledons Species 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 230000009395 genetic defect Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 230000000415 inactivating effect Effects 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 230000004807 localization Effects 0.000 description 3
- 230000006780 non-homologous end joining Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 108060008226 thioredoxin Proteins 0.000 description 3
- 229940094937 thioredoxin Drugs 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 2
- 244000144725 Amygdalus communis Species 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 235000017060 Arachis glabrata Nutrition 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 description 2
- 235000018262 Arachis monticola Nutrition 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- 235000007319 Avena orientalis Nutrition 0.000 description 2
- 244000075850 Avena orientalis Species 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 2
- 240000002791 Brassica napus Species 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 2
- 244000188595 Brassica sinapistrum Species 0.000 description 2
- 235000004936 Bromus mango Nutrition 0.000 description 2
- 102000000584 Calmodulin Human genes 0.000 description 2
- 108010041952 Calmodulin Proteins 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 235000007516 Chrysanthemum Nutrition 0.000 description 2
- 240000005250 Chrysanthemum indicum Species 0.000 description 2
- 241000207199 Citrus Species 0.000 description 2
- 235000013162 Cocos nucifera Nutrition 0.000 description 2
- 244000060011 Cocos nucifera Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 240000007154 Coffea arabica Species 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- 240000008067 Cucumis sativus Species 0.000 description 2
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 2
- 238000010442 DNA editing Methods 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 2
- 240000006497 Dianthus caryophyllus Species 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 241000702463 Geminiviridae Species 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 235000005206 Hibiscus Nutrition 0.000 description 2
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 2
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101001124388 Homo sapiens NPC intracellular cholesterol transporter 1 Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- 235000014486 Hydrangea macrophylla Nutrition 0.000 description 2
- 241001091442 Hydrangeaceae Species 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 102100034349 Integrase Human genes 0.000 description 2
- 235000002678 Ipomoea batatas Nutrition 0.000 description 2
- 244000017020 Ipomoea batatas Species 0.000 description 2
- 108010025815 Kanamycin Kinase Proteins 0.000 description 2
- 241000588748 Klebsiella Species 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 240000008415 Lactuca sativa Species 0.000 description 2
- 241000208467 Macadamia Species 0.000 description 2
- 240000007228 Mangifera indica Species 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 240000003183 Manihot esculenta Species 0.000 description 2
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 2
- 240000004658 Medicago sativa Species 0.000 description 2
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 240000005561 Musa balbisiana Species 0.000 description 2
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 2
- 241000204031 Mycoplasma Species 0.000 description 2
- 244000230712 Narcissus tazetta Species 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 244000025272 Persea americana Species 0.000 description 2
- 235000008673 Persea americana Nutrition 0.000 description 2
- 240000007377 Petunia x hybrida Species 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 235000010582 Pisum sativum Nutrition 0.000 description 2
- 240000004713 Pisum sativum Species 0.000 description 2
- 241000282405 Pongo abelii Species 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 241000508269 Psidium Species 0.000 description 2
- 102000014450 RNA Polymerase III Human genes 0.000 description 2
- 108010078067 RNA Polymerase III Proteins 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 241000589180 Rhizobium Species 0.000 description 2
- 241000208422 Rhododendron Species 0.000 description 2
- 235000004789 Rosa xanthina Nutrition 0.000 description 2
- 241000109329 Rosa xanthina Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 241000607768 Shigella Species 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 2
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 2
- 235000019764 Soybean Meal Nutrition 0.000 description 2
- 235000009184 Spondias indica Nutrition 0.000 description 2
- 241000187747 Streptomyces Species 0.000 description 2
- 244000299461 Theobroma cacao Species 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 2
- 241000723873 Tobacco mosaic virus Species 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 241000722921 Tulipa gesneriana Species 0.000 description 2
- 241000607598 Vibrio Species 0.000 description 2
- 240000004922 Vigna radiata Species 0.000 description 2
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 2
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 2
- 241000607734 Yersinia <bacteria> Species 0.000 description 2
- 241000607479 Yersinia pestis Species 0.000 description 2
- 238000010521 absorption reaction Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 210000005006 adaptive immune system Anatomy 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 230000000735 allogeneic effect Effects 0.000 description 2
- 235000020224 almond Nutrition 0.000 description 2
- 230000001668 ameliorated effect Effects 0.000 description 2
- 150000001408 amides Chemical group 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 210000003719 b-lymphocyte Anatomy 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 235000020226 cashew nut Nutrition 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 239000012707 chemical precursor Substances 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- OSASVXMJTNOKOY-UHFFFAOYSA-N chlorobutanol Chemical compound CC(C)(O)C(Cl)(Cl)Cl OSASVXMJTNOKOY-UHFFFAOYSA-N 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 235000020971 citrus fruits Nutrition 0.000 description 2
- 235000016213 coffee Nutrition 0.000 description 2
- 235000013353 coffee beverage Nutrition 0.000 description 2
- 244000038559 crop plants Species 0.000 description 2
- 210000004443 dendritic cell Anatomy 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 2
- 208000016097 disease of metabolism Diseases 0.000 description 2
- 239000002552 dosage form Substances 0.000 description 2
- 230000003828 downregulation Effects 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 125000004030 farnesyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 238000010448 genetic screening Methods 0.000 description 2
- 235000003869 genetically modified organism Nutrition 0.000 description 2
- 150000002339 glycosphingolipids Chemical class 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 230000003394 haemopoietic effect Effects 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 238000002744 homologous recombination Methods 0.000 description 2
- 230000006801 homologous recombination Effects 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 108010002685 hygromycin-B kinase Proteins 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 210000005007 innate immune system Anatomy 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 230000010534 mechanism of action Effects 0.000 description 2
- 208000030159 metabolic disease Diseases 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 210000001616 monocyte Anatomy 0.000 description 2
- 239000003471 mutagenic agent Substances 0.000 description 2
- 231100000707 mutagenic chemical Toxicity 0.000 description 2
- 101150049361 npc-1 gene Proteins 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 235000020232 peanut Nutrition 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 210000001778 pluripotent stem cell Anatomy 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920001223 polyethylene glycol Polymers 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 239000004455 soybean meal Substances 0.000 description 2
- 210000004158 stalk cell Anatomy 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000010381 tandem affinity purification Methods 0.000 description 2
- 235000013616 tea Nutrition 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- GETQZCLCWQTVFV-UHFFFAOYSA-N trimethylamine Chemical compound CN(C)C GETQZCLCWQTVFV-UHFFFAOYSA-N 0.000 description 2
- 238000012056 up-stream process Methods 0.000 description 2
- 210000005167 vascular cell Anatomy 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- QBYIENPQHBMVBV-HFEGYEGKSA-N (2R)-2-hydroxy-2-phenylacetic acid Chemical compound O[C@@H](C(O)=O)c1ccccc1.O[C@@H](C(O)=O)c1ccccc1 QBYIENPQHBMVBV-HFEGYEGKSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 229940087195 2,4-dichlorophenoxyacetate Drugs 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical class O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- KQPKMEYBZUPZGK-UHFFFAOYSA-N 4-[(4-azido-2-nitroanilino)methyl]-5-(hydroxymethyl)-2-methylpyridin-3-ol Chemical compound CC1=NC=C(CO)C(CNC=2C(=CC(=CC=2)N=[N+]=[N-])[N+]([O-])=O)=C1O KQPKMEYBZUPZGK-UHFFFAOYSA-N 0.000 description 1
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 1
- 208000035657 Abasia Diseases 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102100032157 Adenylate cyclase type 10 Human genes 0.000 description 1
- 101150021974 Adh1 gene Proteins 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 108010011170 Ala-Trp-Arg-His-Pro-Gln-Phe-Gly-Gly Proteins 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 241000208223 Anacardiaceae Species 0.000 description 1
- 244000226021 Anacardium occidentale Species 0.000 description 1
- 241000272525 Anas platyrhynchos Species 0.000 description 1
- 241000272814 Anser sp. Species 0.000 description 1
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 description 1
- 241000225551 Bean golden yellow mosaic virus Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 241000219198 Brassica Species 0.000 description 1
- 241000220243 Brassica sp. Species 0.000 description 1
- 102100027310 Bromodomain adjacent to zinc finger domain protein 1A Human genes 0.000 description 1
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 description 1
- 229920000049 Carbon (fiber) Polymers 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 241000219172 Caricaceae Species 0.000 description 1
- 208000015879 Cerebellar disease Diseases 0.000 description 1
- 108091028075 Circular RNA Proteins 0.000 description 1
- 208000028698 Cognitive impairment Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 208000019505 Deglutition disease Diseases 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101000889900 Enterobacteria phage T4 Intron-associated endonuclease 1 Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 102100029880 Glycodelin Human genes 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 241000224421 Heterolobosea Species 0.000 description 1
- 101000775498 Homo sapiens Adenylate cyclase type 10 Proteins 0.000 description 1
- 101000937778 Homo sapiens Bromodomain adjacent to zinc finger domain protein 1A Proteins 0.000 description 1
- 101000843809 Homo sapiens Hydroxycarboxylic acid receptor 2 Proteins 0.000 description 1
- 101001057159 Homo sapiens Melanoma-associated antigen C3 Proteins 0.000 description 1
- 101001111984 Homo sapiens N-acylneuraminate-9-phosphatase Proteins 0.000 description 1
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 1
- 101001074035 Homo sapiens Zinc finger protein GLI2 Proteins 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 206010021118 Hypotonia Diseases 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 101710203526 Integrase Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 101710105047 Lipoprotein B Proteins 0.000 description 1
- 208000019693 Lung disease Diseases 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 241000495102 Maize mosaic nucleorhabdovirus Species 0.000 description 1
- 241000702489 Maize streak virus Species 0.000 description 1
- 101100409013 Mesembryanthemum crystallinum PPD gene Proteins 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 101000981253 Mus musculus GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 208000007379 Muscle Hypotonia Diseases 0.000 description 1
- 102100023906 N-acylneuraminate-9-phosphatase Human genes 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 241000207836 Olea <angiosperm> Species 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- IWYDHOAUDWTVEP-UHFFFAOYSA-N R-2-phenyl-2-hydroxyacetic acid Natural products OC(=O)C(O)C1=CC=CC=C1 IWYDHOAUDWTVEP-UHFFFAOYSA-N 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 101100170553 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DLD2 gene Proteins 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 108091061750 Signal recognition particle RNA Proteins 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 1
- 102100033138 Tyrosine-protein phosphatase non-receptor type 22 Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 102100035558 Zinc finger protein GLI2 Human genes 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 235000011114 ammonium hydroxide Nutrition 0.000 description 1
- 210000003001 amoeba Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 235000019445 benzyl alcohol Nutrition 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Natural products N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 235000011116 calcium hydroxide Nutrition 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 125000000837 carbohydrate group Chemical group 0.000 description 1
- 239000004917 carbon fiber Substances 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 150000005829 chemical entities Chemical class 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 229960004926 chlorobutanol Drugs 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 208000010877 cognitive disease Diseases 0.000 description 1
- 230000008645 cold stress Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 108010032220 cyclomaltodextrinase Proteins 0.000 description 1
- 230000007711 cytoplasmic localization Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000007857 degradation product Substances 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- UGMCXQCYOVCMTB-UHFFFAOYSA-K dihydroxy(stearato)aluminium Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[Al](O)O UGMCXQCYOVCMTB-UHFFFAOYSA-K 0.000 description 1
- 239000002270 dispersing agent Substances 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000004945 emulsification Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- 230000005713 exacerbation Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 230000003631 expected effect Effects 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 125000005313 fatty acid group Chemical group 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 229940093915 gynecological organic acid Drugs 0.000 description 1
- 230000008642 heat stress Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 210000005119 human aortic smooth muscle cell Anatomy 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- TWXDDNPPQUTEOV-UHFFFAOYSA-N hydron;n-methyl-1-phenylpropan-2-amine;chloride Chemical compound Cl.CNC(C)CC1=CC=CC=C1 TWXDDNPPQUTEOV-UHFFFAOYSA-N 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 150000007529 inorganic bases Chemical class 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 235000014413 iron hydroxide Nutrition 0.000 description 1
- NCNCGGDMXMBVIA-UHFFFAOYSA-L iron(ii) hydroxide Chemical class [OH-].[OH-].[Fe+2] NCNCGGDMXMBVIA-UHFFFAOYSA-L 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- JJWLVOIRVHMVIS-UHFFFAOYSA-N isopropylamine Chemical compound CC(C)N JJWLVOIRVHMVIS-UHFFFAOYSA-N 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 210000001985 kidney epithelial cell Anatomy 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 208000019423 liver disease Diseases 0.000 description 1
- 231100000053 low toxicity Toxicity 0.000 description 1
- 230000017156 mRNA modification Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 229960002510 mandelic acid Drugs 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 1
- LXCFILQKKLGQFO-UHFFFAOYSA-N methylparaben Chemical class COC(=O)C1=CC=C(O)C=C1 LXCFILQKKLGQFO-UHFFFAOYSA-N 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 150000007522 mineralic acids Chemical class 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 230000025608 mitochondrion localization Effects 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 230000007971 neurological deficit Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 239000000346 nonvolatile oil Substances 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 101150107867 npc-2 gene Proteins 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 150000007524 organic acids Chemical class 0.000 description 1
- 235000005985 organic acids Nutrition 0.000 description 1
- 150000007530 organic bases Chemical class 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 150000002989 phenols Chemical class 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 210000000608 photoreceptor cell Anatomy 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 230000025540 plastid localization Effects 0.000 description 1
- 229920002704 polyhistidine Polymers 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 235000011118 potassium hydroxide Nutrition 0.000 description 1
- 101150063097 ppdK gene Proteins 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- MFDFERRIHVXMIY-UHFFFAOYSA-N procaine Chemical compound CCN(CC)CCOC(=O)C1=CC=C(N)C=C1 MFDFERRIHVXMIY-UHFFFAOYSA-N 0.000 description 1
- 229960004919 procaine Drugs 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002062 proliferating effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000008132 psychomotor development Effects 0.000 description 1
- 238000010379 pull-down assay Methods 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000009834 selective interaction Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 238000012868 site-directed mutagenesis technique Methods 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 235000011121 sodium hydroxide Nutrition 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000005063 solubilization Methods 0.000 description 1
- 230000007928 solubilization Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 239000011975 tartaric acid Substances 0.000 description 1
- 235000002906 tartaric acid Nutrition 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 230000001228 trophic effect Effects 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 238000001419 two-dimensional polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000008215 water for injection Substances 0.000 description 1
- 239000000080 wetting agent Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04001—Cytosine deaminase (3.5.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
- C12N9/80—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in linear amides (3.5.1)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
提供了包括用於核酸的靶向編輯的去胺酶多肽的組成物及方法。組成物包括去胺酶多肽。亦提供了包括DNA結合多肽及本發明的去胺酶的融合蛋白。融合蛋白包括與去胺酶融合(可選地於複合物中用引導RNA)的RNA引導的核酸酶。組成物亦包括編碼去胺酶或融合蛋白的核酸分子。亦提供了包括編碼去胺酶或融合蛋白的核酸分子的載體及宿主細胞。
Description
相關申請案之交叉引用
本申請案主張2021年3月22日提出的第63/164,273號美國臨時申請案的優先權,該臨時申請案藉由引用整體地被併入本文。
本發明涉及分子生物學及基因編輯領域。
靶向基因體編輯或修飾正迅速成為基礎及應用研究的重要工具。最初的方法涉及例如大範圍核酸酶(meganuclease)、鋅指融合蛋白或TALEN之類的工程核酸酶,需要產生具有對每一種特定標的序列專一的工程化、可編程、序列專一的DNA結合域的嵌合核酸酶。RNA引導的核酸酶(例如,規律間隔短迴文重複序列簇(Clustered Regularly Interspaced Short Palindromic Repeats)(CRISPR)-關聯(Cas)的細菌系統的CRISPR-Cas蛋白)藉由將核酸酶與引導RNA(引導RNA與特定標的序列專一性雜合)複合而允許靶向特定序列。相較於為每一個標的序列產生嵌合核酸酶,產生標的專一性引導RNA的成本更低且更有效。這種RNA引導的核酸酶可用於經由序列特定的雙股斷裂的引入來編輯基因體,該斷裂經由易錯的非同源末端連接(NHEJ)被修復,以在特定基因體位置(specific genomic location)引入突變。
另外,RGN有用於所靶向的DNA編輯方法。允許專一性修飾引入基因體DNA的核酸序列的靶向編輯(例如,靶向剪切)使非常細微差異的方法能夠研究基因功能及基因表現。RGN亦可被用於產生嵌合蛋白,嵌合蛋白使用與例如去胺酶之類的DNA修飾酶結合的RGN的RNA引導的活性,用於靶向的鹼基編輯。靶向編輯可被部署,以用於靶向人的基因疾病或用於引入作物基因體中農藝學上有益的突變。基因體編輯工具的發展對基於基因編輯的哺乳動物治療及農業生物技術提供新方法。
提供了用於修飾標的DNA分子的組成物及方法。組成物可用於修飾所關注的標的DNA分子。所提供的組成物包括去胺酶多肽。亦提供了包括核酸分子結合多肽(例如,DNA結合多肽)及去胺酶多肽的融合蛋白、以及包括核糖核蛋白複合物,核糖核蛋白複合物包括RNA引導的核酸酶及去胺酶多肽的融合蛋白及核糖核酸。所提供的組成物亦包括編碼去胺酶多肽或融合蛋白的核酸分子、以及包括核酸分子的載體及宿主細胞。本文揭露的方法制定為用於結合所關注的標的DNA分子內的所關注的標的序列及修飾所關注的標的DNA分子。
於第一態樣中,本揭露內容提供一種多肽,包括從由以下者組成的群組選出的胺基酸序列:a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列;其中該多肽具有去胺酶活性。
於上述態樣的一些實施方式中,多肽包括對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。在一些實施方式中,多肽包括對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性的胺基酸序列。在一些實施方式中,多肽被分離。
於另一個態樣中,本揭露內容提供一種包括編碼去胺酶多肽的多核苷酸的核酸分子,其中去胺酶由從由以下者組成的群組選出的核苷酸序列編碼:a)對SEQ ID NO:114-119中的任一者具有至少80%序列一致性的核苷酸序列;b)對SEQ ID NO:109、111及113中的任一者具有至少95%序列一致性的核苷酸序列;c)編碼對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列的核苷酸序列;及d)編碼對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列的核苷酸序列。
於上述態樣的一些實施方式中,去胺酶由對SEQ ID NO:114-119中的任一者具有至少90%序列一致性的核苷酸序列編碼。於一些實施方式中,去胺酶由對SEQ ID NO:114-119中的任一者具有至少95%序列一致性的核苷酸序列編碼。於一些實施方式中,去胺酶由對SEQ ID NO:109、111及113-119中的任一者具有100%序列一致性的核苷酸序列編碼。於一些實施方式中,去胺酶多肽具有對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,去胺酶多肽具有對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性的胺基酸序列。
於上述態樣的一些實施方式中,核酸分子進一步包括可操作地連結至多核苷酸的異源啟動子。於一些實施方式中,核酸分子被分離。
於另一個態樣中,本揭露內容提供一種包括上文描述的核酸分子的載體。
於另一個態樣中,本揭露內容提供一種包括上文描述的核酸分子或載體的細胞。於一些實施方式中,細胞為原核細胞。於一些實施方式中,細胞為真核細胞。於一些實施方式中,真核細胞為哺乳動物細胞。於一些實施方式中,哺乳動物細胞為人細胞。於一些實施方式中,人細胞為免疫細胞。於一些實施方式中,免疫細胞為幹細胞。於一些實施方式中,幹細胞為經誘導的富潛能幹細胞。於一些實施方式中,真核細胞為昆蟲或禽類細胞。於一些實施方式中,真核細胞為真菌細胞。於一些實施方式中,真核細胞為植物細胞。
於另一個態樣中,本揭露內容提供一種包括上文描述的植物細胞的植物或種子。
於另一個態樣中,本揭露內容提供一種包括藥學上可接受的載體及實施方式11的多肽、核酸分子、載體、或上文描述的細胞的醫藥組成物。於一些實施方式中,藥學上可接受的載體與多肽或核酸分子異源。於一些實施方式中,藥學上可接受的載體不是天然存在的。
於另一個態樣中,本揭露內容提供一種製造去胺酶的方法,該方法包括在去胺酶被表現的條件下,培養上文描述的細胞。
於另一個態樣中,本揭露內容提供一種用於製造去胺酶的方法,該方法包括將上文描述的核酸分子或載體引入細胞內;以及,在去胺酶被表現的條件下,培養細胞。
於上述態樣的一些實施方式中,該方法進一步包括純化去胺酶。
於另一個態樣中,本揭露內容提供一種融合蛋白,融合蛋白包括DNA結合多肽及具有從由以下者組成的群組選出的胺基酸序列的去胺酶:a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。於一些實施方式中,去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。於一些實施方式中,去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
於上述態樣的一些實施方式中,去胺酶為胞嘧啶去胺酶。於一些實施方式中,DNA結合多肽為大範圍核酸酶、鋅指融合蛋白或TALEN;或大範圍核酸酶、鋅指融合蛋白或TALEN的變異體,其中核酸酶活性已被降低或抑制。
於上述態樣的一些實施方式中,DNA結合多肽為RNA引導的DNA結合多肽。於一些實施方式中,RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)多肽。於一些實施方式中,RGN為II型或V型CRISPR-Cas多肽。於一些實施方式中,RGN為RGN切口酶。於一些實施方式中,RGN切口酶具有不活化的RuvC域。於一些實施方式中,RGN為核酸酶不活化的RGN。於一些實施方式中,RGN具有對表1中的RGN序列中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,RGN具有對表1中的RGN序列中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,RGN具有表1中的RGN序列中的任一者的胺基酸序列。於一些實施方式中,RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,RGN具有SEQ ID NO:74、82、87、106及107中的任一者的胺基酸序列。
於上述態樣的一些實施方式中,RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,RGN切口酶具有的胺基酸序列具有SEQ ID NO:75及88-98中的任一者。
於上述態樣的一些實施方式中,融合蛋白進一步包括至少一個核定位訊號(NLS)。於一些實施方式中,去胺酶與DNA結合多肽的胺基端融合。於一些實施方式中,去胺酶與DNA結合多肽的羧基端融合。於一些實施方式中,融合蛋白進一步包括在DNA結合多肽與去胺酶之間的連結子序列。於一些實施方式中,連結子序列具有如SEQ ID NO:78或79所示的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白進一步包括尿嘧啶穩定蛋白(USP)。於一些實施方式中,USP具有如SEQ ID NO:81所示的序列。於一些實施方式中,融合蛋白進一步包括在USP與去胺酶或DNA結合多肽之間的連結子序列。於一些實施方式中,在USP與去胺酶或DNA結合多肽之間的連結子序列具有如SEQ ID NO:120所示的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白具有SEQ ID NO:67、68、146及147中的任一者的胺基酸序列。
於另一個態樣中,本揭露內容提供一種包括編碼融合蛋白的多核苷酸的核酸分子,該融合蛋白包括DNA結合多肽及去胺酶,其中去胺酶由從由以下者組成的群組選出的核苷酸序列編碼:a)對SEQ ID NO:114-119中的任一者具有至少80%序列一致性的核苷酸序列;b)對SEQ ID NO:109、111及113中的任一者具有至少95%序列一致性的核苷酸序列;c)編碼對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列的核苷酸序列;及d)編碼對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列的核苷酸序列。
於上述態樣的一些實施方式中,由對SEQ ID NO:114-119中的任一者具有至少90%序列一致性的核苷酸序列編碼去胺酶。於一些實施方式中,由對SEQ ID NO:114-119中的任一者具有至少95%序列一致性的核苷酸序列編碼去胺酶。於一些實施方式中,去胺酶核苷酸序列對SEQ ID NO:109、111及113-119中的任一者具有100%序列一致性。於一些實施方式中,去胺酶核苷酸序列編碼對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,去胺酶核苷酸序列編碼對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性的胺基酸序列。
於上述態樣的一些實施方式中,去胺酶為胞嘧啶去胺酶。於一些實施方式中,DNA結合多肽為大範圍核酸酶、鋅指融合蛋白或TALEN;或大範圍核酸酶、鋅指融合蛋白或TALEN的變異體,其中核酸酶活性已被降低或抑制。
於上述態樣的一些實施方式中,DNA結合多肽為RNA引導的DNA結合多肽。於一些實施方式中,RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)多肽。於一些實施方式中,RGN為II型或V型CRISPR-Cas多肽。於一些實施方式中,RGN為RGN切口酶。於一些實施方式中,RGN切口酶具有不活化的RuvC域。於一些實施方式中,RGN為核酸酶不活化的RGN。
於上述態樣的一些實施方式中,RGN具有對表1中的RGN序列中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,RGN具有對表1中的RGN序列中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,RGN具有表1中的RGN序列中的任一者的胺基酸序列。於一些實施方式中,RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,RGN具有SEQ ID NO:74、82、87、106及107中的任一者的胺基酸序列。
於上述態樣的一些實施方式中,RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,RGN切口酶具有胺基酸序列,該胺基酸序列具有SEQ ID NO:75及88-98中的任一者。
於上述態樣的一些實施方式中,編碼融合蛋白的多核苷酸於其5'端處可操作地連結至啟動子。於一些實施方式中,編碼融合蛋白的多核苷酸於其3'端處可操作地連結至終止子。於一些實施方式中,融合蛋白包括一或多個核定位訊號。
於上述態樣的一些實施方式中,融合蛋白針對於真核細胞中的表現而被密碼子最佳化。於一些實施方式中,融合蛋白針對於原核細胞中的表現而被密碼子最佳化。於一些實施方式中,去胺酶與DNA結合多肽的胺基端融合。於一些實施方式中,去胺酶與DNA結合多肽的羧基端融合。
於上述態樣的一些實施方式中,融合蛋白進一步包括在DNA結合多肽與去胺酶之間的連結子序列。於一些實施方式中,連結子序列具有如SEQ ID NO:78或79所示的胺基酸序列。於一些實施方式中,融合蛋白進一步包括尿嘧啶穩定蛋白(USP)。於一些實施方式中,USP具有如SEQ ID NO:81所示的序列。於一些實施方式中,融合蛋白進一步包括在USP與去胺酶或DNA結合多肽之間的連結子序列。於一些實施方式中,在USP與去胺酶或DNA結合多肽之間的連結子序列具有如SEQ ID NO:120所示的胺基酸序列。於一些實施方式中,融合蛋白具有SEQ ID NO:67、68、146及147中的任一者所示的胺基酸序列。
於另一個態樣中,本揭露內容提供一種包括上文描述的核酸分子的載體。於一些實施方式中,載體進一步包括編碼能夠與標的序列雜合的引導RNA(gRNA)的至少一個核苷酸序列。於一些實施方式中,gRNA為單引導RNA。於一些實施方式中,gRNA為雙引導RNA。
於另一個態樣中,本揭露內容提供一種包括上文描述的融合蛋白的細胞。於一些實施方式中,細胞進一步包括引導RNA。於一些實施方式中,gRNA為單引導RNA。於一些實施方式中,gRNA為雙引導RNA。
於另一個態樣中,本揭露內容提供一種包括上文描述的核酸分子或載體的細胞。
於上述態樣的一些實施方式中,細胞為原核細胞。於上述態樣的一些實施方式中,細胞為真核細胞。於一些實施方式中,真核細胞為哺乳動物細胞。於一些實施方式中,哺乳動物細胞為人細胞。於一些實施方式中,人細胞為免疫細胞。於一些實施方式中,免疫細胞為幹細胞。於一些實施方式中,幹細胞為經誘導的富潛能幹細胞。於一些實施方式中,真核細胞為昆蟲或禽類細胞。於一些實施方式中,真核細胞為真菌細胞。於一些實施方式中,真核細胞為植物細胞。
於另一個態樣中,本揭露內容提供一種包括上文描述的細胞的植物或種子。
於另一個態樣中,本揭露內容提供一種包括藥學上可接受的載體及上文描述的融合蛋白、核酸分子、載體、或細胞的醫藥組成物。
於另一個態樣中,本揭露內容提供一種用於製造融合蛋白的方法,包括在融合蛋白被表現的條件下,培養上文描述的細胞。
於另一個態樣中,本揭露內容提供一種用於製造融合蛋白的方法,包括將上文描述的核酸分子或載體引入細胞內;以及,在融合蛋白被表現的條件下,培養該細胞。
於上述態樣的一些實施方式中,該方法進一步包括純化融合蛋白。
於另一個態樣中,本揭露內容提供一種用於製造RGN融合核糖核蛋白複合物的方法,包括將上文描述的核酸分子及包括:編碼引導RNA的表現卡匣的核酸分子、或上文描述的載體引入細胞內;以及,在融合蛋白及gRNA被表現且形成RGN融合核糖核蛋白複合物的條件下,培養該細胞。於一些實施方式中,該方法進一步包括純化RGN融合核糖核蛋白複合物。
於另一個態樣中,本揭露內容提供一種用於修飾包括標的DNA序列的標的DNA分子的系統,其中該系統包括:a)融合蛋白或編碼融合蛋白的核酸序列,其中融合蛋白包括RNA引導的核酸酶多肽(RGN)及去胺酶,其中去胺酶具有從以下者組成的群組選出的胺基酸序列:i)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及ii)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列;及b)能夠與標的DNA序列雜合的一或多個引導RNA、或編碼一或多個引導RNA(gRNA)的一或多個核苷酸序列;及其中一或多個引導RNA能夠與融合蛋白形成複合物,以便將融合蛋白導向至與標的DNA序列結合且修飾標的DNA分子。
於上述態樣的一些實施方式中,去胺酶具有對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,去胺酶具有對SEQ ID NO:2、4及6-12中至少一者具有100%序列一致性的胺基酸序列。於一些實施方式中,編碼一或多個引導RNA的核苷酸序列和編碼融合蛋白的核苷酸序列中至少一者可操作地連結至啟動子。
於上述態樣的一些實施方式中,標的DNA序列為真核標的DNA序列。於一些實施方式中,標的DNA序列被定位為與由RGN辨識的前間隔序列鄰近模體(protospacer adjacent motif,PAM)相鄰。
於上述態樣的一些實施方式中,標的DNA分子在細胞內。於一些實施方式中,細胞為真核細胞。於一些實施方式中,真核細胞為植物細胞。於一些實施方式中,真核細胞為哺乳動物細胞。於一些實施方式中,哺乳動物細胞為人細胞。於一些實施方式中,人細胞為免疫細胞。於一些實施方式中,免疫細胞為幹細胞。於一些實施方式中,幹細胞為經誘導的富潛能幹細胞。於一些實施方式中,真核細胞為昆蟲細胞。於一些實施方式中,細胞為原核細胞。
於上述態樣的一些實施方式中,融合蛋白的RGN為II型或V型CRISPR-Cas多肽。於一些實施方式中,融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有表1中的RGN序列中的任一者的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有SEQ ID NO:74、82、87、106及107中的任一者的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白的RGN為RGN切口酶。於一些實施方式中,RGN切口酶具有不活化的RuvC域。於一些實施方式中,RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,RGN切口酶為SEQ ID NO:75及88-98中的任一者。於一些實施方式中,融合蛋白的RGN為核酸酶不活化的RGN。
於上述態樣的一些實施方式中,融合蛋白包括一或多個核定位訊號。於一些實施方式中,去胺酶與DNA結合多肽的胺基端融合。於一些實施方式中,去胺酶與DNA結合多肽的羧基端融合。於一些實施方式中,融合蛋白進一步包括在DNA結合多肽與去胺酶之間的連結子序列。於一些實施方式中,連結子序列具有如SEQ ID NO:78或79所示的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白進一步包括尿嘧啶穩定蛋白(USP)。於一些實施方式中,USP具有如SEQ ID NO:81所示的序列。於一些實施方式中,融合蛋白進一步包括在USP與去胺酶或DNA結合多肽之間的連結子序列。於一些實施方式中,在USP與去胺酶或DNA結合多肽之間的連結子序列具有如SEQ ID NO:120所示的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白具有SEQ ID NO:67、68、146及147中任一者所示的胺基酸序列。於一些實施方式中,融合蛋白針對於真核細胞中的表現而被密碼子最佳化。於一些實施方式中,編碼一或多個引導RNA的核苷酸序列及編碼融合蛋白的核苷酸序列被定位於一個載體上。
於另一個態樣中,本揭露內容提供一種核糖核蛋白複合物,該核糖核蛋白複合物包括上文描述的系統的至少一個引導RNA和融合蛋白。
於另一個態樣中,本揭露內容提供一種包括上文描述的系統或核糖核蛋白複合物的細胞。於一些實施方式中,細胞為原核細胞。於一些實施方式中,細胞為真核細胞。於一些實施方式中,真核細胞為哺乳動物細胞。於一些實施方式中,哺乳動物細胞為人細胞。於一些實施方式中,人細胞為免疫細胞。於一些實施方式中,免疫細胞為幹細胞。於一些實施方式中,幹細胞為經誘導的富潛能幹細胞。於一些實施方式中,真核細胞為昆蟲或禽類細胞。於一些實施方式中,真核細胞為真菌細胞。於一些實施方式中,真核細胞為植物細胞。
於另一個態樣中,本揭露內容提供一種包括上文描述的植物細胞的植物或種子。
於另一個態樣中,本揭露內容提供一種醫藥組成物,該醫藥組成物包括藥學上可接受的載體及上文描述的系統、核糖核蛋白複合物或細胞。
於另一個態樣中,本揭露內容提供一種用於修飾包括標的DNA序列的標的DNA分子的方法,其中該方法包括將上文描述的系統或核糖核蛋白複合物遞送至標的DNA分子或包括標的DNA分子的細胞。
於上述態樣的一些實施方式中,經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C>N突變,其中N為A、G或T。於一些實施方式中,經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C>T突變。於一些實施方式中,經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C> G突變。
於另一個態樣中,本揭露內容提供一種用於修飾包括標的序列的標的DNA分子的方法,其中該方法包括:a)在適合形成RGN去胺酶核糖核苷酸複合物的條件下,藉由結合以下者以在體外組裝RGN去胺酶核糖核苷酸複合物:i)能夠與標的DNA序列雜合的一或多個引導RNA;及ii)包括RNA引導的核酸酶多肽(RGN)及至少一個去胺酶的融合蛋白,其中去胺酶具有從由以下者組成的群組選出的胺基酸序列:I)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及II)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列;及b)使標的DNA分子或包括標的DNA分子的細胞與在體外組裝的RGN去胺酶核糖核苷酸複合物接觸;其中一或多個引導RNA與標的DNA序列雜合,從而將融合蛋白導向至與標的DNA序列結合,且發生標的DNA分子的修飾。
於上述態樣的一些實施方式中,去胺酶具有對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,去胺酶具有對SEQ ID NO:2、4及6-12中至少一者具有100%序列一致性的胺基酸序列。
於一些實施方式中,經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C>N突變,其中N為A、G或T。於一些實施方式中,經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C>T突變。於一些實施方式中,經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C> G突變。
於上述態樣的一些實施方式中,融合蛋白的RGN為II型或V型CRISPR-Cas多肽。於一些實施方式中,融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有表1中的RGN序列中的任一者的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有SEQ ID NO:74、82、87、106及107中的任一者的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白的RGN為RGN切口酶。於一些實施方式中,RGN切口酶具有不活化的RuvC域。於一些實施方式中,RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,RGN切口酶為SEQ ID NO:75及88-98中的任一者。於一些實施方式中,融合蛋白的RGN為核酸酶不活化的RGN。
於上述態樣的一些實施方式中,融合蛋白包括一或多個核定位訊號。於一些實施方式中,去胺酶與DNA結合多肽的胺基端融合。於一些實施方式中,去胺酶與DNA結合多肽的羧基端融合。於一些實施方式中,融合蛋白進一步包括在DNA結合多肽與去胺酶之間的連結子序列。於一些實施方式中,連結子序列具有如SEQ ID NO:78或79所示的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白進一步包括尿嘧啶穩定蛋白(USP)。於一些實施方式中,USP具有如SEQ ID NO:81所示的序列。於一些實施方式中,融合蛋白進一步包括在USP與去胺酶或DNA結合多肽之間的連結子序列。於一些實施方式中,在USP與去胺酶或DNA結合多肽之間的連結子序列具有如SEQ ID NO:120所示的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白具有如SEQ ID NO:67、68、146及147中的任一者所示的胺基酸序列。於一些實施方式中,標的DNA序列為真核標的DNA序列。於一些實施方式中,標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
於上述態樣的一些實施方式中,標的DNA分子在細胞內。於一些實施方式中,細胞為真核細胞。於一些實施方式中,真核細胞為植物細胞。於一些實施方式中,真核細胞為哺乳動物細胞。於一些實施方式中,哺乳動物細胞為人細胞。於一些實施方式中,人細胞為免疫細胞。於一些實施方式中,免疫細胞為幹細胞。於一些實施方式中,幹細胞為經誘導的富潛能幹細胞。於一些實施方式中,真核細胞為昆蟲細胞。於一些實施方式中,細胞為原核細胞。
於上述態樣的一些實施方式中,該方法進一步包括選擇包括經修飾的DNA分子的細胞。
於另一個態樣中,根據上文描述的方法,本揭露內容提供一種包括經修飾的標的DNA序列的細胞。於一些實施方式中,細胞為真核細胞。於一些實施方式中,真核細胞為哺乳動物細胞。於一些實施方式中,哺乳動物細胞為人細胞。於一些實施方式中,人細胞為免疫細胞。於一些實施方式中,免疫細胞為幹細胞。於一些實施方式中,幹細胞為經誘導的富潛能幹細胞。於一些實施方式中,真核細胞為昆蟲細胞。於一些實施方式中,細胞為原核細胞。於一些實施方式中,真核細胞為植物細胞。
於另一個態樣中,本揭露內容提供一種包括上文描述的細胞的植物或種子。
於另一個態樣中,本揭露內容提供一種包括上文描述的細胞和藥學上可接受的載體的醫藥組成物。
於另一個態樣中,本揭露內容提供一種用針對基因遺傳性疾病的因果突變中的更正以產生經基因修飾的細胞的方法,該方法包括將以下者引入細胞內:a)融合蛋白或編碼融合蛋白的多核苷酸,其中融合蛋白包括RNA引導的核酸酶多肽(RGN)及去胺酶,其中去胺酶具有從由以下者組成的群組選出的胺基酸序列:i)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及ii)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列;及b)能夠與標的DNA序列雜合的一或多個引導RNA(gRNA)或編碼gRNA的多核苷酸;藉以,融合蛋白及gRNA靶向因果突變的基因體位置以及修飾基因體序列以去除該因果突變。
於上述態樣的一些實施方式中,編碼融合蛋白的多核苷酸可操作地被連結至在細胞中具活性的啟動子。於一些實施方式中,編碼gRNA的多核苷酸可操作地被連結至在細胞中具活性的啟動子。
於上述態樣的一些實施方式中,去胺酶具有對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,去胺酶具有對SEQ ID NO:2、4及6-12具有100%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN為II型或V型CRISPR-Cas多肽。
於上述態樣的一些實施方式中,融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,融合蛋白的RGN具有表1中的RGN序列中的任一者的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白的RGN為RGN切口酶。於一些實施方式中,RGN切口酶具有不活化的RuvC域。於一些實施方式中,RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的胺基酸序列。於一些實施方式中,RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少95%序列一致性的胺基酸序列。於一些實施方式中,RGN切口酶為SEQ ID NO:75及88-98中的任一者。於一些實施方式中,融合蛋白的RGN為核酸酶不活化的RGN。
於上述態樣的一些實施方式中,融合蛋白包括一或多個核定位訊號。於一些實施方式中,去胺酶與DNA結合多肽的胺基端融合。於一些實施方式中,去胺酶與DNA結合多肽的羧基端融合。於一些實施方式中,融合蛋白進一步包括在DNA結合多肽與去胺酶之間的連結子序列。於一些實施方式中,連結子序列具有如SEQ ID NO:78或79所示的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白進一步包括尿嘧啶穩定蛋白(USP)。於一些實施方式中,USP具有如SEQ ID NO:81所示的序列。於一些實施方式中,融合蛋白進一步包括在USP與去胺酶或DNA結合多肽之間的連結子序列。於一些實施方式中,在USP與去胺酶或DNA結合多肽之間的連結子序列具有如SEQ ID NO:120所示的胺基酸序列。
於上述態樣的一些實施方式中,融合蛋白具有SEQ ID NO:67、68、146及147中的任一者所示的胺基酸序列。於一些實施方式中,基因體修飾包括將至少一個核苷酸的C>T突變引入標的DNA序列內。於一些實施方式中,基因體修飾包括將至少一個核苷酸的C>G突變引入標的DNA序列內。
於上述態樣的一些實施方式中,細胞為動物細胞。於一些實施方式中,動物細胞為哺乳動物細胞。於一些實施方式中,細胞為從狗、貓、小鼠、大鼠、兔、馬、綿羊、山羊、牛、豬或人取得的。
於上述態樣的一些實施方式中,因果突變的更正包括更正無意義突變。於一些實施方式中,基因遺傳性疾病為列於表23中的疾病。於一些實施方式中,gRNA進一步包括靶向SEQ ID NO:122-144中任一者的間隔序列或其補體。
於另一個態樣中,本揭露內容提供一種包括以下者的組成物:a)包括DNA結合多肽和胞嘧啶去胺酶的融合蛋白或編碼融合蛋白的核酸分子;及b)第二胞嘧啶去胺酶或編碼第二去胺酶的核酸分子,其中第二去胺酶具有從由以下者組成的群組選出的胺基酸序列:i)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及ii)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
於上述態樣的一些實施方式中,第二胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。於一些實施方式中,第二胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
於上述態樣的一些實施方式中,第一胞嘧啶去胺酶具有從由以下者組成的群組選出的胺基酸序列:a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。於一些實施方式中,第一胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。於一些實施方式中,第一胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
於上述態樣的一些實施方式中,DNA結合多肽為大範圍核酸酶、鋅指融合蛋白或TALEN;或大範圍核酸酶、鋅指融合蛋白或TALEN的變異體,其中核酸酶活性已被降低或抑制。於一些實施方式中,DNA結合多肽為RNA引導的DNA結合多肽。於一些實施方式中,RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)多肽。
於上述態樣的一些實施方式中,RGN為RGN切口酶。於一些實施方式中,RGN為核酸酶不活化的RGN。
於另一個態樣中,本揭露內容提供一種包括編碼融合蛋白的核酸分子和編碼第二胞嘧啶去胺酶的核酸分子的載體,其中融合蛋白包括DNA結合多肽和第一胞嘧啶去胺酶,且其中第二胞嘧啶去胺酶具有從由以下者組成的群組選出的胺基酸序列:a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
於上述態樣的一些實施方式中,第二胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。於一些實施方式中,第二胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
於上述態樣的一些實施方式中,第一胞嘧啶去胺酶具有從由以下者組成的群組選出的胺基酸序列:a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
於上述態樣的一些實施方式中,第一胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。於一些實施方式中,第一胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。於一些實施方式中,DNA結合多肽為大範圍核酸酶、鋅指融合蛋白或TALEN;或大範圍核酸酶、鋅指融合蛋白或TALEN的變異體,其中核酸酶活性已被降低或抑制。於一些實施方式中,DNA結合多肽為RNA引導的DNA結合多肽。於一些實施方式中,RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)多肽。
於上述態樣的一些實施方式中,RGN為RGN切口酶。於一些實施方式中,RGN為核酸酶不活化的RGN。
於另一個態樣中,本揭露內容提供一種包括上文描述的載體的細胞。
於另一個態樣中,本揭露內容提供一種包括以下者的細胞:a)包括DNA結合多肽和第一胞嘧啶去胺酶的融合蛋白;或編碼該融合蛋白的核酸分子;及b)第二胞嘧啶去胺酶或編碼第二胞嘧啶去胺酶的核酸分子,其中第二胞嘧啶去胺酶具有從由以下者組成的群組選出的胺基酸序列:i)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及ii)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
於上述態樣的一些實施方式中,第二胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。於一些實施方式中,第二胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
於上述態樣的一些實施方式中,第一胞嘧啶去胺酶具有從由以下者組成的群組選出的胺基酸序列:a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。於一些實施方式中,第一胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。於一些實施方式中,第一胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。於一些實施方式中,DNA結合多肽為大範圍核酸酶、鋅指融合蛋白或TALEN;或大範圍核酸酶、鋅指融合蛋白或TALEN的變異體,其中核酸酶活性已被降低或抑制。於一些實施方式中,DNA結合多肽為RNA引導的DNA結合多肽。
於上述態樣的一些實施方式中,RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)多肽。於一些實施方式中,RGN為RGN切口酶。於一些實施方式中,RGN為核酸酶不活化的RGN。
於另一個態樣中,本揭露內容提供一種包括藥學上可接受的載體及上文描述的組成物、載體或細胞的醫藥組成物。
於另一個態樣中,本揭露內容提供一種用於治療疾病的方法,其中該方法包括對需要治療的個體投予本文描述的融合蛋白、核酸分子、載體、細胞、系統、核糖核蛋白複合物、組成物或醫藥組成物。
於上述態樣的一些實施方式中,疾病與因果突變關聯,且醫藥組成物更正因果突變。於一些實施方式中,疾病為列於表23中的疾病。
於另一個態樣中,本揭露內容提供一種本文描述的融合蛋白、核酸分子、載體、細胞、系統、核糖核蛋白複合物或組成物用於治療個體的疾病的用途。
於上述態樣的一些實施方式中,疾病與因果突變關聯,且治療包括更正因果突變。於一些實施方式中,疾病為列於表23中的疾病。
於另一個態樣中,本揭露內容提供一種融合蛋白、核酸分子、載體、細胞、系統、核糖核蛋白複合物或組成物用於製造有用於治療疾病的藥物的用途。於一些實施方式中,疾病與因果突變關聯,且有效量的藥物更正因果突變。於一些實施方式中,疾病為列於表23中的疾病。
受益於前述描述中呈現的教導的、本發明所屬領域中具有通常知識者將想到本文中闡述的本發明的許多修改及其他實施方式。因此,應該理解,本發明不限於所揭露的具體實施方式,並且修飾以及其他實施方式預期被包括在所附申請專利範圍的範圍內。雖然本文採用特定術語,但這些術語僅以一般性及描述性意義使用,而非出於限制性目的。
I .概述
此揭露內容提供胞嘧啶去胺酶及包括核酸分子結合多肽(例如,DNA結合多肽)及去胺酶多肽的融合蛋白。於某些實施方式中,DNA結合多肽為序列專一性DNA結合多肽,因為DNA結合多肽以比與隨機化背景序列的結合頻率高的頻率與標的序列結合。於一些實施方式中,DNA結合多肽為或取得自大範圍核酸酶、鋅指融合蛋白或TALEN。於一些實施方式中,融合蛋白包括RNA引導的DNA結合多肽及去胺酶多肽。於一些實施方式中,RNA引導的DNA結合多肽為RNA引導的核酸酶,例如,與引導RNA(亦稱為gRNA)結合的CRISPR-Cas(例如,Cas9)多肽,而引導RNA又經由股雜合結合標的核酸序列。
本文揭露的去胺酶多肽可將舉例而言例如胞嘧啶之類的核鹼基去胺。去胺酶將核鹼基去胺可在各自殘基處導致點突變,在本文中被稱為“核酸編輯”或“鹼基編輯”。因此,包括RNA引導的核酸酶(RGN)多肽及去胺酶的融合蛋白可用於核酸序列的靶向編輯。
該等融合蛋白有用於DNA的體外靶向編輯,例如,有用於基因修飾細胞的產生。這些基因修飾細胞可為植物細胞或動物細胞。此類融合蛋白亦可有用於靶向突變的引入,例如,用於在例如從個體獲得的、隨後被重新引入同一或另一個個體的細胞中離體地更正哺乳動物細胞中的基因缺陷;及用於靶向突變的引入,例如,基因缺陷的更正或哺乳動物個體中的疾病關聯基因中的去活化突變的引入。此類融合蛋白亦可有用於植物細胞中的靶向突變的引入,例如,用於有益的或農藝學上有價值的性狀或對偶基因的引入。
術語“蛋白質”、“胜肽”及“多肽”在本文中可被互換地使用、並指藉由胜肽(醯胺)鍵被連結在一起的胺基酸殘基的聚合物。該術語指任何大小、結構或功能的蛋白質、胜肽或多肽。通常情況下,蛋白質、胜肽或多肽將為至少三個胺基酸的長度。蛋白質、胜肽或多肽可指個別蛋白質或蛋白質的集合。例如,藉由添加例如碳水化合物基團、羥基基團、磷酸鹽基團、法尼基(farnesyl)基團、異法尼基基團、脂肪酸基團、用於共軛、官能化、或其他修飾等等的連結子的化學實體,蛋白質、胜肽或多肽中的一或多個胺基酸可被修飾。蛋白質、胜肽或多肽亦可為單一分子,或可為多分子複合物。蛋白質、胜肽或多肽可剛好為天然存在的蛋白或多肽的片斷。蛋白質、胜肽或多肽可為天然存在的、重組體或合成物、或其任意組合。
本文中提供的任何蛋白質可藉由本領域中已知的任何方法形生。例如,本文提供的任何蛋白質可經由重組體蛋白質表現及純化產生,這特別適合於包括胜肽連結子的融合蛋白。重組體蛋白質表現及純化的方法是熟知的、且包括Green及Sambrook,
Molecular Cloning: A Laboratory Manual(
4thed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (2012))描述的那些內容,其整體內容藉由引用而被併入本文。
II. 去胺酶
術語“去胺酶”指催化去胺反應的酶。本發明的去胺酶為核鹼基去胺酶,及術語“去胺酶”及“核鹼基去胺酶”在本文中被可互換地使用。去胺酶可為天然存在的去胺酶酶或其活性片段或變異體。去胺酶可在例如ssDNA或ssRNA之類的單股核酸上或例如dsDNA或dsRNA的雙股核酸上是活化的。於一些實施方式中,去胺酶只能對ssDNA去胺,而對dsDNA沒有作用。
目前所揭露的方法及組成物包括胞嘧啶去胺酶,胞嘧啶去胺酶催化胞嘧啶、胞苷或去氧胞苷至尿嘧啶的水解去胺。可對DNA或RNA進行胞嘧啶去胺,且通常情況下,可對單股核酸分子進行胞嘧啶去胺。於進一步實施方式中,胞嘧啶去胺酶為脂蛋白元B mRNA編輯複合物(APOBEC)家族去胺酶。於一些實施方式中,去胺酶為APOBECl家族去胺酶。於一些實施方式中,胞嘧啶去胺酶為活化誘導的胞苷去胺酶(AID)。於一些實施方式中,去胺酶為ACF1/ASE去胺酶。基於此揭露內容,附加的適合的去胺酶酵素對於本領域中的通常知識者是顯而易見的。包括DNA結合多肽和胞嘧啶去胺酶的融合蛋白於本文中被稱為“C鹼基編輯器”、“胞嘧啶鹼基編輯器”或“CBE”。CBE可將胞嘧啶轉化為尿嘧啶,接著,尿嘧啶經由DNA複製或修復被轉化為胸腺嘧啶。於一些實施方式中,CBE將胞嘧啶轉化為鳥嘌呤或將胞嘧啶轉化為腺嘌呤。在不受任何理論及作用機制的約束的情況下,可以相信藉由胞嘧啶鹼基編輯器而從胞嘧啶至鳥嘌呤或腺嘌呤的轉化是因為在尿嘧啶殘基的鹼基切除修復期間胞嘧啶轉化為尿嘧啶的去胺、及尿嘧啶DNA糖基化酶的後續活性。
於一些實施方式中,目前所揭露的胞嘧啶去胺酶與腺嘌呤去胺酶組合地被使用。於一些實施方式中,腺嘌呤去胺酶為ADAT家族去胺酶或其變異體。腺嘌呤、腺苷或去氧腺苷的去胺產出肌苷,肌苷藉由聚合酶被處理為鳥嘌呤。迄今為止,尚不知天然存在的對DNA中的腺嘌呤去胺的腺嘌呤去胺酶。已採用若干方法來演化及最佳化對哺乳動物細胞中的DNA分子有活性、作用於tRNA(ADAT)蛋白上的腺嘌呤去胺酶(Gaudelli等人,2017; Koblan, L. W.等人,2018,
Nat Biotechnol 36,843-846;Richter, M. F.等人,2020,
Nat Biotechnol,doi:10.1038/s41587-020-0562-8,上述的每一者藉由引用整體地被併入本文)。一種此類的方法使用細菌選擇測定,其中只有經由A:T>G:C轉化有能力活化抗生素抗性的細胞能夠生存。於一些實施方式中,包括目前所揭露的胞嘧啶去胺酶的目前所揭露的組成物及方法進一步包括2020年9月11日申請的第63/077,089號及2021年2月5日申請的第63/146,840號美國臨時專利申請案以及2021年9月10日申請的第PCT/US2021/049853號PCT國際申請案闡述的腺嘌呤去胺酶,上述每一者藉由引用被整體地併入本文。
本發明與自經由細菌去胺酶的截斷產生的胞嘧啶去胺酶及細菌辨識的胞嘧啶去胺酶多肽有關。胞嘧啶去胺酶目前被揭露且如SEQ ID NO:2、4及6-12所示。本發明的去胺酶可被用於DNA或RNA分子的編輯。於一些實施方式中,本發明的去胺酶可被用於ssDNA或ssRNA分子的編輯。本文描述的胞嘧啶去胺酶單獨地用作去胺酶或用作融合蛋白中的組成。包括DNA靶向多肽及胞嘧啶去胺酶多肽的融合蛋白在本文中被稱為“基於C的編輯器”、“胞嘧啶鹼基編輯器”或“CBE”,且可被用於核酸序列的靶向編輯。
“鹼基編輯器”為包括DNA靶向多肽(例如,RGN)及去胺酶的融合蛋白。胞嘧啶鹼基編輯器(CBE)包括DNA靶向蛋白(例如,RGN)及胞嘧啶去胺酶。CBE經由胞嘧啶的去胺而作用於DNA標的分子上的尿嘧啶中。然後,尿嘧啶隨後經由DNA複製或修復而被轉化為胸腺嘧啶。於一些實施方式中,本揭露內容的胞嘧啶去胺酶或其活性變異體或片段將C>N突變引入DNA分子中,其中N為A、G或T。於一些實施方式中,本揭露內容的胞嘧啶去胺酶或包括其的融合蛋白將C>T突變引入DNA分子中。於一些實施方式中,本揭露內容的胞嘧啶去胺酶或包括其的融合蛋白將C>G突變引入DNA分子中。
於去胺酶已經由與DNA結合多肽的融合而被靶向至核酸分子的特定區域的那些實施方式中,可使用本領域中已知的任一方法(包括聚合酶連鎖反應(PCR)、限制片段長度多型性(RFLP)或DNA定序)測量DNA結合多肽結合至的標的序列內的或與該標的序列相鄰的胞嘧啶的突變率。
目前所揭露的去胺酶或其保持去胺酶活性的活性變異體或片段可被引入細胞中,為去胺酶DNA結合多肽融合的部分(part)、及/或可與DNA結合多肽去胺酶融合共表現,以提高將期望C>N(其中N為A、T或G)(例如,C>T或C>G)突變引入標的DNA分子中的效率。目前所揭露的去胺酶具有SEQ ID NO:2、4及6-12中任一者的胺基酸序列或其保持去胺酶活性的變異體或片段。於一些實施方式中,去胺酶具有對SEQ ID NO:2、4及6-12中的任一者的胺基酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%一致性的胺基酸序列。於特定實施方式中,去胺酶包括對SEQ ID NO:2及7-12中的任一者具有至少80%序列一致性的胺基酸序列。於一些實施方式中,去胺酶包括對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
III. 核酸分子結合多肽
本揭露內容的一些態樣提供包括核酸分子結合多肽及去胺酶多肽的融合蛋白。 儘管本發明考量了與RNA分子的結合及RNA分子的靶向編輯,但於一些實施方式中,融合蛋白的核酸分子結合多肽為DNA結合多肽。此類融合蛋白有用於DNA在體外、離體地或體內的靶向編輯。這些融合蛋白在哺乳動物細胞中具活性及有用於DNA分子的靶向編輯。
如本文中使用的術語“融合蛋白”指包括來自至少二個不同蛋白的蛋白域的雜合多肽。融合蛋白可包括一個以上的不同域,例如,DNA結合域及去胺酶。於一些實施方式中,融合蛋白在與核酸(例如,RNA)的複合物中或與核酸(例如,RNA)關聯。
於一些實施方式中,目前所揭露的融合蛋白包括DNA結合多肽。如本文中使用的術語“DNA結合多肽”指能夠與DNA結合的任何多肽。於某些實施方式中,目前所揭露的融合蛋白的DNA結合多肽部分與雙股DNA結合。於特定實施方式中,DNA結合多肽以序列專一性方式與DNA結合。如本文中使用的術語“序列專一性”或“序列專一性方式”指與特定核苷酸序列的選擇性交互作用。
當二個多核苷酸序列在嚴格條件下彼此雜合時,可認為該二個多核苷酸序列實質上互補。同樣地,如果DNA結合多肽在嚴格條件下與其序列結合,則認為DNA結合多肽以序列專一性方式結合至特定標的序列。“嚴格條件”或“嚴格雜合條件”旨在指二個多核苷酸序列(或多肽結合至其專一性標的序列)彼此結合的可偵測程度高於其他序列(例如,至少比背景高2倍)的條件。嚴格條件為序列相依的、且在不同環境下將會不同。通常情況下,嚴格條件將是這樣的條件,其中:在pH 7.0至8.3,鹽類濃度小於約1.5 M Na離子,通常情況下約0.01至1.0 M Na離子濃度(或其它鹽類),且針對短序列(例如,10至50個核苷酸),溫度為至少30 ℃,而針對長序列(例如,大於50個核苷酸),溫度為至少60 ℃。利用添加例如甲醯胺的去穩定劑亦可達到嚴格條件。範例性的低嚴格條件包括在37℃下與30至35%甲醯胺、1 M NaCl、1%SDS(十二烷基硫酸鈉)的緩衝溶液的雜合及在50至55℃下以1X至2X SSC(20X SSC = 3.0 M NaCl/0.3 M檸檬酸三鈉)洗滌。範例性的中等嚴格條件包括在37℃下於40至45%甲醯胺、1.0 M NaCl、1% SDS中雜合及在55至60℃下以0.5X至1X SSC洗滌。範例性的高嚴格條件包括在37℃下於50%甲醯胺、1 M NaCl、1% SDS中雜合及在60至65℃下以0.1X SSC洗滌。可選地,洗滌緩衝液可包括約0.1%至約1%的SDS。雜合持續時間一般而言小於約24小時,通常約4至約12小時。洗滌時間的持續時間至少為足以達到平衡的時間長度。
Tm為50%的互補標的序列與完全匹配的序列雜合的溫度(於所界定的離子強度和pH下)。對於DNA-DNA雜合體,Tm可以由Meinkoth和Wahl (1984) Anal. Biochem. 138:267-284中的等式:Tm = 81.5℃ + 16.6 (log M) + 0.41 (%GC) - 0.61 (甲醯胺% (% form)) - 500/L大致估計;其中M為單價陽離子的莫耳濃度,%GC為鳥苷和胞嘧啶核苷酸於該DNA中的百分比,%form為甲醯胺於雜合溶液中的百分比,及L為鹼基對中的雜合體的長度。一般而言,嚴格條件被選擇為比在所界定的離子強度和pH下的特定序列及其補體的熱熔點(Tm)低約5℃。然而,極度嚴格條件可採用在比該熱熔點(Tm)低1、2、3或4℃下的雜合及/或洗滌;中等嚴格條件可採用在比該熱熔點(Tm)低6、7、8、9或10℃的溫度下的雜合及/或洗滌;低嚴格條件可採用在比該熱熔點(Tm)低11、12、13、14、15或20℃的溫度下的雜合及/或洗滌。本領域具有通常知識者將明白,使用該等式、雜合及洗滌組成物以及期望的Tm,雜合及/或洗滌溶液的嚴格性的變化被固有地描述了。核酸雜合的廣泛指南可在Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology—Hybridization with Nucleic Acid Probes, Part I, Chapter 2 (Elsevier,New York);及Ausubel等人eds. (1995) Current Protocols in Molecular Biology,Chapter 2 (Greene Publishing and Wiley-Interscience,New York)中得到。參見Sambrook等人(1989) Molecular Cloning:A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York)。
於某些實施方式中,序列專一性DNA結合多肽是RNA引導的DNA結合多肽(RGDBP)。如本文中使用的術語“RNA引導的DNA結合多肽”及“RGDBP”指經由關聯RNA分子與標的DNA序列的雜合能夠結合至DNA的多肽。
於一些實施方式中,融合蛋白的DNA結合多肽是核酸酶,例如,序列專一性核酸酶。如本文中使用的術語“核酸酶”指催化核酸分子中的核苷酸之間的磷酸二酯鍵的剪切的酶。於一些實施方式中,DNA結合多肽是核酸內切酶,其能夠剪切核酸分子內的核苷酸之間的磷酸二酯鍵,而於某些實施方式中,DNA結合多肽是核酸外切酶,其能夠剪切核酸分子的任一端(5'或3')處的核苷酸。於一些實施方式中,序列專一性核酸酶從由大範圍核酸酶、鋅指核酸酶、TAL效應子DNA結合域核酸酶融合蛋白(TALEN)及RNA引導的核酸酶(RGN)或其變異體組成的群組選出,其中核酸酶活性已被降低或抑制。
如本文中使用的術語“大範圍核酸酶”或“歸巢核酸內切酶”指將雙股DNA內的12至40 bp長度的辨識位點結合的內切酶。大範圍核酸酶的非限制性實例是屬於包括保留胺基酸模體LAGLIDADG(SEQ ID NO:85)的LAGLIDADG家族。術語“大範圍核酸酶”可指二聚或單鏈大範圍核酸酶。
如本文中使用的術語“鋅指核酸酶”或“ZFN”指包括鋅指DNA結合域及核酸酶域的嵌合蛋白。
如本文中使用的術語“TAL效應子DNA結合域核酸酶融合蛋白”或“TALEN”指包括TAL效應子DNA結合域及核酸酶域的嵌合蛋白。
於某些實施方式中,DNA結合多肽是能夠在雙股DNA分子內產生單股區域的DNA結合多肽。單股區域的實例是R環內包括的單股環,該R環為包括單股DNA區域的三股核酸結構,該單股DNA區域被形成於由互補股與單股RNA或DNA分子的雜合導致的雙股DNA分子內。R環的單股區域內的或與其相鄰的胞嘧啶可藉由對單股核酸(例如,ssDNA)具活性的胞嘧啶去胺酶而被去胺。於這些實施方式中的一些實施方式中,能夠在雙股DNA分子內產生R環的DNA結合多肽是RNA引導的DNA結合多肽或RGN核酸酶。如本文中使用的術語“RNA引導的核酸酶”或“RGN”指具有核酸酶活性的RNA引導的DNA結合多肽。RGN是所考慮的「RNA引導」,因為引導RNA與RNA引導的核酸酶形成複合物,以將RNA引導的核酸酶導向至與標的序列結合,並且於一些實施方式中,在標的序列處引入單股或雙股斷裂。
於某些實施方式中,RGN為切口酶或核酸酶不活化的RGN。術語“RGN多肽”涵蓋僅剪切標的核苷酸序列的單股的RGN多肽,在本文中被稱為切口酶。此類RGN具有單一功能核酸酶域。RGN切口酶可為天然存在的切口酶、或可為RGN蛋白,其天然地剪切在一或多個核酸酶域內已經突變的雙股核酸分子的二股,使得這些突變域的核酸酶活性被降低或消除,以變成切口酶。
於一些實施方式中,融合蛋白的切口酶RGN包括使RGN僅能夠剪切核酸雙螺旋的非鹼基編輯的標的股(包括PAM且與gRNA鹼基配對的股)的突變(例如,D10A突變,其中胺基酸編號是基於SEQ ID NO:99所示的
釀膿鏈球菌Cas9)。包括D10A突變或等效突變的切口酶具有不活化的RuvC核酸酶域且剪切靶向股。D10A切口酶不能剪切DNA的非靶向股,亦即,想要鹼基編輯的股。於這些實施方式中,RGN使標的股有切口,而互補的非標的股由去胺酶修飾。使用經修飾非標的股作為模板,細胞的DNA修復機制可修復有切口的標的股,從而將突變引入DNA中。
因此,於一些實施方式中,切口酶包括不活化的RuvC域。RuvC域具有RNase H折疊結構(參見,例如,Nishimasu等人(2014) Cell 156(5):935-949,其藉由引用整體地被併入)。RGN的RuvC域常常是分段型RuvC域,其在線性胺基酸序列中包括二或多個非相鄰區域。例如,釀膿鏈球菌Cas9的RuvC域包括SEQ ID NO:99的胺基酸殘基1-59、718-769及909-1098。不活化其核酸酶活性的RuvC域內的突變的非限制性實例是D10A突變,該D10A突變使分段型RuvC核酸酶域中的第一天冬胺酸殘基突變。本申請揭露所描述的RGN的若干D10A切口酶變異體或同源切口酶變異體,其中RuvC域不活化。nAPG07433.1及nAPG08290.1(分別如SEQ ID NO:75及88所示的)為分別如SEQ ID NO:44及87所示的APG07433.1及APG08290.1的切口酶變異體,且其被描述於WO 2019/236566中(其藉由引用整體地被併入本文)。nAPG07433.1-del及nAPG08290.1-del(分別如SEQ ID NO:97及98所示的)分別為APG07433.1及APG08290.1的缺失突變,且被描述於2021年9月11日申請的第63/077,089號和2021年2月8日申請的第63/146,840號美國臨時申請案以及2021年9月10日申請的第PCT/US2021/049853號PCT國際申請案中。nAPG00969(如SEQ ID NO:89所示的)及nAPG09748(如SEQ ID NO:90所示的)分別為APG00969及APG09748的切口酶變異體,其被描述於WO 2020/139783中(其藉由引用整體地被併入本文)。nAPG06646(如SEQ ID NO:91所示)及nAPG09882(如SEQ ID NO:92所示)分別為APG06646及APG09882的切口酶變異體,其被描述於PCT公開號WO 2021/030344中(其藉由引用整體地被併入本文)。nAPG03850、nAPG07553、nAPG055886及nAPG01604分別如SEQ ID NO:93-96所示,且為APG03850、APG07553、APG055886及APG01604的切口酶變異體,其被描述於第63/014,970號及第第63/077,211號未決的美國臨時申請案以及PCT公開號WO 2021/21702中(上述每一者藉由引用整體地被併入本文)。
於一些實施方式中,融合蛋白的切口酶RGN包括突變(例如,H840A突變,其中胺基酸編號基於如SEQ ID NO:99所示的
釀膿鏈球菌Cas9序列),其使RGN能夠僅剪切核酸雙股螺旋的鹼基編輯的非標的股(不包括PAM及與gRNA不鹼基配對的股)。於此等實施方式中的一些實施方式中,核酸酶包括不活化的HNH核酸酶域。RGN的HNH核酸酶域具有ββα金屬折疊(參見,例如,Nishimasu等人2014)。例如,
釀膿鏈球菌Cas9的HNH核酸酶域包括如SEQ ID NO:99所示的胺基酸殘基775-908。不活化其核酸酶活性的HNH域內的突變的非限制性實例為使HNH核酸酶域的第一組胺酸突變的H840A突變。具有不活化的HNH域的去胺酶作用於非標的股上。
用於不活化RGN的RuvC及/或HNH域的方法為本領域中已知的,且一般而言包括使分段型RuvC域內的第一天冬胺酸及/或HNH域的第一組胺酸突變。通常情況下,天冬胺酸殘基或組胺酸殘基被突變為丙胺酸。RuvC域內的、可被突變為不活化該域的核酸酶活性的其他胺基酸殘基包括Glu762、His983及Asp986(通常情況下為丙胺酸),其中胺基酸編號是基於如SEQ ID NO:99所示的
釀膿鏈球菌Cas9序列。HNH域內、可被突變的其他胺基酸殘基包括D839及N863(通常情況下為丙胺酸),其中胺基酸編號基於如SEQ ID NO:99所示的
釀膿鏈球菌Cas9序列。
於一些實施方式中,融合蛋白的RGN為為無核酸酶活性的。如本文中使用的被突變而變成核酸酶不活化的或“無”核酸酶活性的RGN蛋白可被稱為RNA引導的DNA結合多肽或核酸酶不活化的RGN或無核酸酶活性的RGN。產生核酸酶不活化的RGN的方法為為本領域中已知的,且一般而言包括使RGN的唯一核酸酶域或所有核酸酶域突變,以使(多個)核酸酶域不活化。於RGN僅包括單一核酸酶域(例如,RuvC域)的那些實施方式中,核酸酶不活化的變異體將在RuvC內具有導致RuvC核酸酶域不活化的至少一個突變。於RGN包括多於一個核酸酶域(例如RuvC及HNH域)的那些實施方式中,RuvC及HNH域中的每一者內的至少一個突變使兩個核酸酶域不活化。
一個範例性的適合的核酸酶不活化的RGN為D10A/H840A Cas9突變體(參見,例如,Qi等人,
Cell. 2013; 152(5): 1173-83,其整體內容藉由引用而被併入本文)。另外,其他已知的RNA引導的核酸酶(RGN)的適合的核酸酶不活化的變異體可被測定(例如,美國專利公開號2019/0367949(其整體內容藉由引用而被併入本文)所揭露的RGN APG08290.1或RGN APG07433.1的核酸酶不活化的變異體、或如SEQ ID NO: 83所示的dAPG09298)。
其他另外的範例性的適合的核酸酶不活化的RGN變異體包括但不限於D10A/D839A/H840A及D10A/D839A/H840A/N863A突變體域(參見,例如,Mali等人,
Nature Biotechnology. 2013; 31(9): 833-838,其整體內容藉由引用而被併入本文)。
基於本揭露內容及本領域中的知識,被突變為切口酶或不活化的核酸酶的附加的適合的RGN蛋白對於本領域中具有通常知識者是明顯的(例如舉例而言PCT公開號WO 2019/236566所揭露的RGN,其藉由引用整體地被併入)且在此揭露內容的範圍內。
於一些實施方式中,保持切口酶活性的RGN切口酶包括對SEQ ID NO:75及88-98中的任一者具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%一致性的胺基酸序列。
本領域中用於將突變引入胺基酸序列(例如PCR介導的誘變及定點誘變(site-directed mutagenesis))內的任何已知方法可被用於產生切口酶或無核酸酶活性的RGN。參見,例如,第2014/0068797號美國公開及第9,790,490號美國專利;其每一者藉由引用整體地被併入本文。
RNA引導的核酸酶(RGN)允許在基因體內的單一位點的靶向操作,且在基因靶向的背景下有用於治療及研究應用。在各種生物體(包括哺乳動物)中,藉由刺激非同源端連結或同源重組,RNA引導的核酸酶已被用於基因體工程。RGN包括CRISPR-Cas蛋白,其是藉由引導RNA(gRNA)作為成簇規律間隔的短迴文重複序列(CRISPR)RNA引導的核酸酶系統或其活性變異體或片段的部分而被導向至標的序列的RNA引導的核酸酶。
此揭露內容的一些態樣提供融合蛋白,該融合蛋白包括RNA引導的DNA結合多肽及去胺酶多肽(具體地說,胞嘧啶去胺酶多肽)。於一些實施方式中,RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)。於進一步實施方式中,RNA引導的核酸酶為天然存在的CRISPR-Cas蛋白或其活性變異體或片段。CRISPR-Cas系統被分類為1類或2類系統。2類系統包括單一效應子核酸酶、且包括II、V及VI型。1類及2類系統被細分為型(I、II、III、IV、V、VI型),而且一些型被進一步細分為子型(例如,II-A型、II-B型、II-C型、V-A型、V-B型)。
於某些實施方式中,RGN為天然存在的II型CRISPR-Cas蛋白或其活性變異體或片段。如本文中使用的術語“II型CRISPR-Cas蛋白”、“II型CRISPR-Cas效應子蛋白”或“II型RNA引導的核酸酶”指需要反式活化的RNA(tracrRNA)且包括二個核酸酶域(亦即,RuvC及HNH),每一個核酸酶域負責剪切雙股DNA分子的單股。於一些實施方式中,本發明提供一種融合蛋白,其包括與Cas9蛋白(例如
釀膿鏈球菌Cas9(SpCas9)或SpCas9切口酶)融合的目前所揭露的去胺酶,其序列分別如SEQ ID NO:99及100所示、且被描述於第10,000,772號及第8,697,359號美國專利中,這些美國專利中任一者藉由引用整體地被併入本文。於一些實施方式中,本發明提供一種融合蛋白,其包括與
嗜熱鏈球菌Cas9(StCas9)或StCas9切口酶融合的目前所揭露的去胺酶,其序列分別如SEQ ID NO:101及102所示、且被揭露於第10,113,167號美國專利中,該美國專利藉由引用整體地被併入本文。於一些實施方式中,本發明提供一種融合蛋白,其包括與
金黃色葡萄球菌Cas9(SaCas9)或SaCas9切口酶融合的目前所揭露的去胺酶,其序列分別如SEQ ID NO:103及104所示、且被揭露於第9,752,132號美國專利中,該美國專利藉由引用整體地被併入本文。
於一些實施方式中,CRISPR-Cas蛋白是天然存在的V型CRISPR-Cas蛋白或其活性變異體或片段。如本文中使用的術語“V型CRISPR-Cas蛋白”、“V型CRISPR-Cas效應子蛋白”或“V型RNA引導的核酸酶”指剪切dsDNA且包括單RuvC核酸酶域或分段型RuvC核酸酶域並且缺少HNH域的RGN(Zetsche等人2015,
Celldoi:10.1016/j.cell.2015.09.038;Shmakov等人2017,
Nat Rev Microbioldoi:10.1038/nrmicro.2016.184;Yan等人2018,
Sciencedoi:10.1126/science.aav7271;Harrington等人2018,
Sciencedoi:10.1126/science.aav4294)。於一些實施方式中,目前所揭露的融合蛋白包括Cas12(例如,Cas12a)。應該指出,Cas12a亦被稱為Cpf1、且不需要tracrRNA,雖然例如Cas12b之類的其他V型CRISPR-Cas蛋白確實需要tracrRNA。大多數V型效應子亦可靶向ssDNA(單股DNA),而常常沒有PAM要求(Zetsche等人2015;Yan等人2018;Harrington等人2018)。術語“V型CRISPR-Cas蛋白”及“V型RGN”涵蓋包括分段型RuvC核酸酶域的唯一RGN,例如,2019年12月30日申請的第62/955,014號及2020年7月29日申請的第63/058,169號美國臨時申請案以及2020年12月28日申請的PCT國際申請案PCT/US2020/067138所揭露的那些,這些申請案中的每一者的內容藉由引用整體地被併入本文。於一些實施方式中,本發明提供一種融合蛋白,該融合蛋白包括與
法朗西斯菌(Francisella novicida)Cas12a(FnCas12a)(其序列如SEQ ID NO:105所示且被揭露於第9,790,490號美國專利中,該美國專利藉由引用整體地併入本文)或第9,790,490號美國專利中揭露的FnCas12a的核酸酶不活化的突變體中的任一者融合的目前所揭露的去胺酶。
於一些實施方式中,CRISPR-Cas蛋白是天然存在的VI型CRISPR-Cas蛋白或其活性變異體或片段。如本文中使用的術語“VI型CRISPR-Cas蛋白”、“VI型CRISPR-Cas效應子蛋白”或“VI型RGN”指不要求tracrRNA且包括剪切RNA的HEPN域的二個CRISPR-Cas效應子蛋白。於一些實施方式中,本發明提供一種包括與Cas13融合的目前所揭露的去胺酶的融合蛋白。
於特定實施方式中,目前所揭露的融合蛋白包括列於表1中的RGN或切口酶或其無核酸酶活性的變異體。可與表1的每一個RGN一起使用的引導RNA序列(crRNA重複及tracrRNA序列)以及共通PAM序列亦被提供。於某些實施方式中,融合蛋白包括對表1中所列的胺基酸序列中的任一者具有80%與99%之間或更高(包括但不限於約或高於約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高)序列一致性的表1中所列的RGN的活性變異體(能夠以RNA引導的方式與核酸分子結合的活性變異體)。於特定實施方式中,融合蛋白包括對表1中揭露的RGN胺基酸序列具有80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列一致性的RGN。於其他實施方式中,融合蛋白包括列於表1中的RGN的片段,例如可相差少至1-15個胺基酸殘基、少至1-10個(例如,6-10個)、少至5個、少至4個、少至3個、少至2個或少至1個胺基酸殘基的片段。於具體實施方式中,RGN包括N端或C端截斷,該截斷可至少包括從多肽的N端或C端缺失5、10、15、20、25、30、35、40、45、50、55、60個或更多個胺基酸。於一些實施方式中,RGN包括內部缺失,該內部缺失可至少包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60個或更多個胺基酸的缺失。
表1. RNA引導的核酸酶的非限制性實例
* ND:未測定
RGN 名稱 | RGN SEQ ID NO: | crRNA 重複序列 | tracrRNA | PAM | |
APG05083.1 | 149 | 150 | 151 | 152 | |
APG07433.1 | 74 | 153 | 154 | 152 | |
APG07513.1 | 155 | 156 | 157 | 152 | |
APG08290.1 | 87 | 158 | 159 | 160 | |
APG05459.1 | 161 | 162 | 163 | 164 | |
APG04583.1 | 165 | 166 | 167 | 168 | |
APG01688.1 | 169 | 170 | 171 | 172 | |
APG00969 | 173 | 174 | 175 | 176 | |
APG03128 | 177 | 178 | 179 | 180 | |
APG09748 | 181 | 182 | 183 | 184 | |
APG00771 | 185 | 186 | 187 | 188 | |
APG02789 | 189 | 190 | 191 | 192 | |
APG09106 | 193 | 194 | 195 | 184 | |
APG05733.1 | 196 | 197 | 198 | 199 | |
APG06207.1 | 200 | 201 | 202 | 203 | |
APG01647.1 | 204 | 205 | 206 | 207 | |
APG08032.1 | 208 | 209 | 210 | 211 | |
APG05712.1 | 212 | 213 | 214 | 215 | |
APG01658.1 | 216 | 217 | 218 | 219 | |
APG06498.1 | 220 | 221 | 222 | 223 | |
APG09106.1 | 224 | 225 | 226 | 227 | |
APG09882.1 | 228 | 229 | 230 | 231 | |
APG02675.1 | 232 | 233 | 234 | 203 | |
APG01405.1 | 235 | 236 | 237 | 238 | |
APG06250.1 | 239 | 240 | 241 | 242 | |
APG06877.1 | 243 | 244 | 245 | 199 | |
APG09053.1 | 246 | 247 | 248 | 249 | |
APG04293.1 | 250 | 251 | 252 | 253 | |
APG01308.1 | 254 | 255 | 256 | 257 | |
APG06646.1 | 258 | 259 | 260 | 253 | |
APG09624 | 261 | 262 | 263 | ND | |
APG05405 | 264 | 265 | 266 | ND | |
APG06622 | 267 | 268 | 269 | 270 | |
APG02787 | 271 | 272 | 273 | 274 | |
APG06248 | 275 | 276 | 277 | 278 | |
APG06007 | 279 | 280 | 281 | 282 | |
APG02874 | 283 | 284 | 285 | 286 | |
APG03850 | 287 | 288 | 289 | 290 | |
APG07553 | 291 | 292 | 293 | 294 | |
APG03031 | 295 | 296 | 297 | 286 | |
APG09208 | 298 | 299 | 300 | 301 | |
APG05586 | 302 | 303 | 304 | 305 | |
APG08770 | 306 | 307 | 308 | 305 | |
APG08167 | 309 | 310 | 311 | 312 | |
APG01604 | 313 | 314 | 315 | 312 | |
APG03021 | 316 | 317 | 318 | 319 | |
APG06015 | 320 | 321 | 322 | 323 | |
APG09344 | 324 | 325 | 326 | 327 | |
APG07991 | 328 | 329 | 330 | 331 | |
APG01868 | 332 | 333 | 334 | 331 | |
APG02998 | 335 | 336 | 337 | 331 | |
APG09298 | 82 | 303 | 304 | 305 | |
APG06251 | 338 | 303 | 304 | 305 | |
APG03066 | 339 | 303 | 304 | 305 | |
APG01560 | 340 | 303 | 304 | 305 | |
APG02777 | 341 | 303 | 304 | 305 | |
APG05761 | 342 | 303 | 304 | 305 | |
APG02479 | 343 | 303 | 304 | 305 | |
APG08385 | 344 | 303 | 304 | 305 | |
APG09217 | 345 | 303 | 304 | 305 | |
APG06657 | 346 | 303 | 304 | 305 | |
APG05586 | 347 | 303 | 304 | 305 | |
APG07433.1缺失變異體 | 106 | 153 | 154 | 152 | |
APG08290.1缺失變異體 | 107 | 158 | 159 | 160 |
術語“引導RNA”指核苷酸序列,該核苷酸序列與標的核苷酸序列具有足夠互補性,以與標的序列雜合且將關聯RGN的序列專一性結合導向至標的核苷酸序列。對於CRISPR-Cas RGN,分別引導RNA為一或多個RNA分子(一般而言,一或二個),其可與RGN結合且引導RGN以與特定標的核苷酸序列結合,且在RGN具有切口酶或核酸酶活性的那些範例中,還剪切標的核苷酸序列。引導RNA包括CRISPR RNA(crRNA)且於一些實施方式中,包括反式活化CRISPR RNA(tracrRNA)。於一些實施方式中,引導RNA的一部分(portion)包括DNA核苷酸。於某些實施方式中,引導RNA包括非天然存在的人工核苷酸類似物或一或多個核苷酸被化學修飾。
CRISPR RNA包括間隔序列及CRISPR重複序列。“間隔序列”為與所關注的標的核苷酸序列直接雜合的核苷酸序列。間隔序列被工程化為與所關注的標的序列完全地或部分地互補。於各種實施方式中,間隔序列包括約8個核苷酸至約30個核苷酸或更多個核苷酸。例如,間隔序列的長度可為約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。於一些實施方式中,間隔序列的長度為8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個核苷酸。於一些實施方式中,間隔序列的長度為約10至約26個核苷酸,或長度為約12至約30個核苷酸。於特定實施方式中,間隔序列的長度為約30個核苷酸。於一些實施方式中,間隔序列的長度為30個核苷酸。於一些實施方式中,當使用適合的比對(alighment)演算法進行最佳比對時,間隔序列與其對應的標的序列之間的互補性程度在50%與99%之間或更高,包括但不限於約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。於特定實施方式中,當使用適合的比對演算法進行最佳比對時,間隔序列與其對應的標的序列之間的互補性程度為50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。於特定實施方式中,間隔序列不含使用本領域中已知的任何適合的多核苷酸折疊演算法可預測的二次結構,多核苷酸折疊演算法包括但不限於mFold(參見,例如,Zuker及Stiegler(1981)
Nucleic Acids Res. 9:133-148)及RNAfold(參見,例如,Gruber等人(2008)
Cell106(1):23-24)。
CRISPR RNA重複序列包括核苷酸序列,該核苷酸序列或者獨自地或者與雜合tracrRNA配合形成由RGN分子辨識的結構。於各種實施方式中,CRISPR RNA重複序列包括約8個核苷酸至約30個核苷酸或更多個核苷酸。於特定實施方式中,CRISPR RNA重複序列包括8個核苷酸至30個核苷酸或更多個核苷酸。例如,CRISPR重複序列的長度可為約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。於特定實施方式中,CRISPR重複序列的長度為8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個核苷酸。於一些實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA序列之間的互補性程度為50%與99%之間或更高,包括但不限於約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。於特定實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA序列之間的互補性程度為50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。
於一些實施方式中,引導RNA進一步包括tracrRNA分子。反式活化的CRISPR RNA或tracrRNA分子包括核苷酸序列,該核苷酸序列包括具有與crRNA的CRISPR重複序列雜合的足夠互補性的區域,其在本文中被稱為抗重複區域(anti-repeat region)。於一些實施方式中,tracrRNA分子進一步包括具有二次結構(例如,莖-環)的區域,或在與其對應的crRNA雜合時形成二次結構。於特定實施方式中,與CRISPR重複序列完全地或部分地互補的tracrRNA的區域在分子的5'端,且該tracrRNA的3'端包括二次結構。此二次結構區域一般而言包括被發現與該抗重複序列相鄰、包括融合連接(nexus)髮夾的數個髮夾結構。該tracrRNA的3'端處常常存在端髮夾,其結構及數量可變,但常常包括富含GC的Rho獨立轉錄終止子髮夾,其後是3'端處的一串U。參見,例如,Briner等人(2014)
Molecular Cell56:333-339、Briner及Barrangou(2016)
Cold Spring Harb Protoc;doi:10.1101/pdb.top090902及美國公開號2017/0275648,上述每一者藉由引用整體地被併入本文。
於各種實施方式中,與CRISPR重複序列完全地或部分地互補的tracrRNA的抗重複區域包括約6個核苷酸至約30個核苷酸或更多個核苷酸。例如,tracrRNA抗重複序列與CRISPR重複序列之間的鹼基配對區域的長度可為約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。於特定實施方式中,tracrRNA抗重複序列與CRISPR重複序列之間的鹼基配對區域的長度可為6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多個核苷酸。於特定實施方式中,與CRISPR重複序列完全地或部分地互補的tracrRNA的抗重複區域的長度為約10個核苷酸。於特定實施方式中,與CRISPR重複序列完全地或部分地互補的tracrRNA的抗重複區域的長度為10個核苷酸。於一些實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA抗重複序列之間的互補性程度在約50%與約99%之間,包括但不限於約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更高。於特定實施方式中,當使用適合的比對演算法進行最佳比對時,CRISPR重複序列與其對應的tracrRNA抗重複序列之間的互補性程度為50%、60%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高。
於各種實施方式中,整個tracrRNA包括約60個核苷酸至多於約210個核苷酸。於特定實施方式中,整個tracrRNA包括60個核苷酸至多於210個核苷酸。例如,tracrRNA的長度可為約60、約65、約70、約75、約80、約85、約90、約95、約100、約105、約110、約115、約120、約125、約130、約135、約140、約150、約160、約170、約180、約190、約200、約210或更多個核苷酸。於特定實施方式中,tracrRNA的長度為60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、150、160、170、180、190、200、210或更多個核苷酸。於特定實施方式中,tracrRNA的長度為約100至約210個核苷酸,長度為包括約95、約96、約97、約98、約99、約100、約105、約106、約107、約108、約109及約100個核苷酸。於特定實施方式中,tracrRNA的長度為100至110個核苷酸,長度為包括95、96、97、98、99、100、105、106、107、108、109及110核苷酸。
引導RNA與RNA引導的DNA結合多肽或RNA引導的核酸酶形成複合物,以將RNA引導的核酸酶導向至與標的序列結合。如果引導RNA與RGN複合,則所結合的RGN在標的序列處引入單股或雙股斷裂。在標的序列已被剪切後,斷裂可以被修復,使得標的序列的DNA序列在修復過程期間被修飾。本文提供了使用(被連結至去胺酶的、是不活化的核酸酶或切口酶的)RNA引導的核酸酶的突變型變異體修飾宿主細胞的DNA中的標的序列的方法。核酸酶活性非活化的或被顯著降低的RNA引導的核酸酶的突變型變異體可被稱為RNA引導的DNA結合多肽,因為該多肽能夠結合至而不一定剪切標的序列。只能剪切雙股核酸分子的單股的RNA引導的核酸酶在本文中被稱為切口酶。
標的核苷酸序列由RNA引導的DNA結合多肽結合、且與關聯於RGDBP的引導RNA雜合。如果RGDBP擁有核酸酶活性(亦即,為RGN)(涵蓋為切口酶的活性),則標的序列隨後可被剪切。
引導RNA可為單引導RNA或雙引導RNA系統。單引導RNA包括單RNA分子上的crRNA及可選地tracrRNA,而雙引導RNA系統包括存在於二個相異RNA分子上的crRNA及tracrRNA,其經由crRNA的CRISPR重複序列的至少一部分及可與crRNA的CRISPR重複序列完全地或部分地互補的tracrRNA的至少一部分而彼此雜合。於引導RNA為單引導RNA的那些實施方式中的一些實施方式中,crRNA以及可選地tracrRNA是由連結子核苷酸序列分開。
一般來說,為避免二次結構於連結子核苷酸序列的核苷酸內的形成或避免包括連結子核苷酸序列的核苷酸的二次結構的形成,連結子核苷酸序列為不包括互補鹼基的連結子核苷酸序列。於一些實施方式中,crRNA與tracrRNA之間的連結子核苷酸序列的長度為至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12個或更多個核苷酸。於特定實施方式中,crRNA與tracrRNA之間的連結子核苷酸序列的長度為3、4、5、6、7、8、9、10、11、12個或更多個核苷酸。於特定實施方式中,單引導RNA的連結子核苷酸序列的長度為至少4個核苷酸。於特定實施方式中,單引導RNA的連結子核苷酸序列的長度為4個核苷酸。
於某些實施方式中,引導RNA可作為RNA分子而被引入標的細胞、胞器或胚胎中。引導RNA可以在體外被轉錄或被化學合成。於一些實施方式中,將編碼引導RNA的核苷酸序列引入細胞、胞器或胚胎中。於一些實施方式中,編碼引導RNA的核苷酸序列可操作地被連結至啟動子(例如,RNA聚合酶III啟動子)。該啟動子可為天然啟動子或與引導RNA編碼的核苷酸序列異源。於一些實施方式中,啟動子從2021年6月11日申請的第63/209,660號美國臨時申請案揭露的啟動子中的任一者選出,該美國臨時申請案藉由引用整體地被併入本文,該啟動子包括SEQ ID NO:348-357或其活性變異體或片段,該啟動子包括對SEQ ID NO:348-357中的任一者具有至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或更高序列一致性的啟動子。
於各種實施方式中,如本文所述,引導RNA可作為核糖核蛋白複合物而被引入標的細胞、胞器或胚胎中,其中引導RNA與RNA引導的核酸酶多肽結合。
引導RNA經由引導RNA與標的核苷酸序列的雜合而將關聯RNA引導的核酸酶導向至所關注的特定標的核苷酸序列。標的核苷酸序列可包括DNA、RNA或二者的組合,且可為單股或雙股的。標的核苷酸序列可為基因體DNA(亦即,染色體DNA)、質體DNA或RNA分子(例如,信使RNA、核醣體RNA、轉移RNA、微RNA、小干擾RNA)。標的核苷酸序列可在體外或在細胞中藉由RNA引導的DNA結合多肽被結合(而於一些實施方式中,被剪切)。由RGDBP靶向的染色體序列可為核、質體或粒線體染色體序列。於一些實施方式中,標的核苷酸序列於標的基因體中係唯一的。
於一些實施方式中,標的核苷酸序列與前間隔序列鄰近模體(PAM)相鄰。PAM一般而言在距標的核苷酸序列約1至約10個核苷酸內,包括距標的核苷酸序列約1、約2、約3、約4、約5、約6、約7、約8、約9或約10個核苷酸。於特定實施方式中,PAM在距標的核苷酸序列1至10個核苷酸內,包括距標的核苷酸序列1、2、3、4、5、6、7、8、9或10個核苷酸。除非另有陳述,PAM與標的核苷酸序列緊鄰、或在其5'或3'端。於一些實施方式中,PAM為標的序列的3'。一般而言,PAM是約2-6個核苷酸的共通序列,但於特定實施方式中,PAM的長度可為1、2、3、4、5、6、7、8、9或更多個核苷酸。
PAM限制給定的RGDBP或RGN可靶向哪些序列,因為其PAM需要靠近標的核苷酸序列。在辨識其對應的PAM序列時,RGN可剪切特定剪切位點處的標的核苷酸序列。如本文所使用的,剪切位點是由標的核苷酸序列內的二個特定核苷酸組成,其之間的核苷酸序列由RGN剪切。剪切位點可包括在5'或3'方向上自PAM起的第1和第2、第2和第3、第3和第4、第4和第5、第5和第6、第7和第8、或第8和第9個核苷酸。因為RGN可剪切標的核苷酸序列,導致交錯的端,所以,於一些實施方式中,基於多核苷酸的正(+)股上的二個核苷酸距PAM的距離及該多核苷酸的負(-)股上的二個核苷酸距該PAM的距離來界定該剪切位點。
RGDBP及RGN可被用於將融合多肽、多核苷酸或小分子有效載荷遞送至特定基因體位置。
在其中DNA結合多肽包括大範圍核酸酶的那些實施方式中,標的序列可包括由四個鹼基對分開的一對反向9鹼基對“半位點”。在單鏈大範圍核酸酶的情況中,蛋白質的N端域接觸第一半位點,及蛋白質的C端域接觸第二半位點。由大範圍核酸酶的剪切產生四個鹼基對3'突出部。於DNA結合多肽包括緊密TALEN的那些實施方式中,辨識序列包括由I-TevI域辨識的第一CNNNGN序列、其後為長度為非專一性間隔子4-16鹼基對、其後為由TAL效應子域(此序列通常情況下具有5' T鹼基)辨識的長度為16-22 bp的第二序列。於DNA結合多肽包括鋅指的那些實施方式中,典型地,DNA結合域辨識包括由2-10個鹼基對分開的一對九個鹼基對“半位點”,且由核酸酶的剪切建立可變長度(往往四個鹼基對)的鈍端或5'突出部。
IV. 融合蛋白
於一些實施方式中,DNA結合多肽(例如,核酸酶不活化的或切口酶RGN)可操作地被連結至本發明的去胺酶。於一些實施方式中,與本發明的去胺酶融合的DNA結合多肽(例如,核酸酶不活化的RGN或切口酶RGN)可被靶向至核酸分子(亦即,標的核酸分子)的特定位置(於一些實施方式中,為特定基因體基因座),以改變期望序列的表現。於一些實施方式中,融合蛋白與標的序列的結合導致核鹼基去胺,導致從一種核鹼基轉化為另一種核鹼基。於一些實施方式中,此融合蛋白與標的序列的結合導致與標的序列相鄰的核鹼基去胺。使用目前所揭露的組成物及方法被去胺且被突變的與標的序列相鄰的核鹼基可為自標的核酸分子內的標的序列(藉由gRNA結合的)的5'或3'端的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個鹼基對。此揭露內容的一些態樣提供融合蛋白,該融合蛋白包括:(i)DNA結合多肽(例如,核酸酶不活化的或切口酶RGN多肽);(ii)去胺酶多肽;及可選地(iii)第二去胺酶。第二去胺酶可為與第一去胺酶相同的去胺酶、或可為不同去胺酶。於一些實施方式中,第一及第二去胺酶二者是本發明的胞嘧啶去胺酶。
本揭露內容提供各種組態的融合蛋白。於一些實施方式中,去胺酶多肽與DNA結合多肽(例如,RGN多肽)的N端融合。於一些實施方式中,去胺酶多肽與DNA結合多肽(例如,RGN多肽)的C端融合。
於一些實施方式中,去胺酶與DNA結合多肽(例如,RNA引導的DNA結合多肽)經由胜肽連結子彼此融合。去胺酶與DNA結合多肽(例如,RNA引導的DNA結合多肽)之間的連結子可確定融合蛋白的編輯窗,從而增加去胺酶專一性及減少去靶突變。各種連結子長度及變通性可被採用,範圍自形式(GGGGS)
n 及(G)
n的非常彈性連結子至形式(EAAAK)
n 及(XP)
n 的較剛性連結子,以實現針對特定應用的去胺酶活性最佳長度及剛性。如本文所使用的術語「連結子」指連結二個分子或部分(例如,核酸酶的結合域及剪切域)的化學基團或分子。於一些實施方式中,連結子連結RNA引導的核酸酶與去胺酶。於一些實施方式中,連結子連結無活性或不活化的RGN與去胺酶。於進一步實施方式中,連結子連結二個去胺酶。於一些實施方式中,連結子連結RNA引導的核酸酶與USP。於一些實施方式中,連結子連結去胺酶與USP。於某些實施方式中,連結子連結RNA引導的核酸酶-去胺酶融合與USP。通常,連結子位於二個基團、分子或其他部分之間或側邊有二個基團、分子或其他部分,且經由共價鍵而被連接到每一者,因此連接該二者。於一些實施方式中,連結子為胺基酸或複數個胺基酸(例如,胜肽或蛋白質)。於一些實施方式中,連結子為有機分子、基團、聚合物或化學部分。於一些實施方式中,連結子的長度為3-100個胺基酸,例如,長度為3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200個胺基酸。亦考量了更長或更短的連結子。於一些實施方式中,較佳地,較短的連結子降低融合蛋白或其編碼序列的總大小或長度。
於一些實施方式中,連結子包括(GGGGS)
n 、(G)
n 、(EAAAK)
n 或(XP)
n 模體或這些中的任一者的組合,其中n獨立地為1與30之間的整數。於一些實施方式中,
n獨立地為1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30或其任一組合(如果存在多於一個連結子或多於一個連結子模體)。附加的適合的連結子模體及連結子組態對於本領域中具有通常知識者是明顯的。於一些實施方式中,適合的連結子模體及組態包括Chen等人,2013(
Adv Drug Deliv Rev. 65(10):1357-69,其整體內容藉由引用而被併入本文)描述的連結子模體及組態。附加的適合的連結子序列對於本領域中具有通常知識者是明顯的。於一些實施方式中,連結子序列包括如SEQ ID NO:78或79所示的胺基酸序列。
於一些範例中,細胞尿嘧啶DNA糖基化酶(UDG)辨識由胞嘧啶的去胺得到的U:G異源雙鏈DNA、且可催化從DNA移除尿嘧啶,以留下無鹼基位點,從而起始鹼基切除修復,以U:G對至C:G對的返轉為最常見結果,雖然C>G或C>A突變以及插入或缺失(Indel)的形成亦為已知的。為了防止或減小由尿嘧啶DNA糖基化酶進行的使胞嘧啶鹼基編輯器產生的尿嘧啶返轉至胞嘧啶的鹼基切除修復,於一些實施方式中,胞嘧啶鹼基編輯器融合蛋白進一步包括尿嘧啶穩定多肽(uracil stabilizing polypeptide,USP)(例如尿嘧啶DNA糖基化酶抑制劑(UGI))或USP2。
如本文中使用的術語“尿嘧啶穩定蛋白”、“尿嘧啶穩定多肽”及“USP”指具有尿嘧啶穩定活性的多肽。如本文中使用的術語“尿嘧啶穩定活性”指與在不存在分子(例如,尿嘧啶穩定多肽)的情況下,與突變率相較,分子(例如,多肽)增加由胞嘧啶去胺酶實現的至少一個胞苷、去氧胞苷或胞嘧啶與核酸分子中的胸苷、去氧胸苷或胸腺嘧啶的突變率的能力。在不受理論及作用機制的約束下,可以相信USP可藉由使經由胞苷、去氧胞苷、或胞嘧啶鹼基的去胺已產生的單股DNA中的尿嘧啶的存在保持足夠長的期間,以允許複製,從而發生且引入期望的C>T而起作用。經由尿嘧啶DNA糖基化酶、鹼基切除修復路徑或誤配修復機制的抑制,尿嘧啶穩定活性可發生。
可與目前所揭露的胞嘧啶去胺酶及包括目前所揭露的胞嘧啶去胺酶及DNA結合多肽的融合蛋白融合的USP的非限制性實例包括尿嘧啶DNA糖基化酶抑制劑(UGI),其實例如SEQ ID NO:86所示且為PCT公開號WO 2021/217002(其藉由引用整體地被併入本文)所揭露的USP中任一者,包括本文中如SEQ ID NO:81所示的USP2。
於一些實施方式中,去胺酶DBD融合蛋白包括為野生型USP的USP或其活性片段或變異體。例如,於一些實施方式中,去胺酶DBD融合蛋白包括有包括SEQ ID NO:81或86的USP或其活性片段或變異體。於一些實施方式中,USP片段包括包有括如SEQ ID NO:81或86所示的胺基酸序列的至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%的胺基酸序列。於一些實施方式中,去胺酶DBD融合蛋白包括對如SEQ ID NO:81或86所示的USP具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或更高序列一致性的USP。
附加的適合的USP序列為本領域中具有通常知識者已知、且包括例如Wang等人,1989. J. Biol. Chem. 264: 1163-1171;Lundquist等人,1997. J. Biol. Chem. 272:21408-21419;Ravishankar等人,1998. Nucleic Acids Res. 26:4880-4887;及Putnam等人,1999. J. Mol. Biol. 287:331-346(1999)公開的USP序列,每一者的整體內容藉由引用而被併入本文。
於一些實施方式中,連結子連結去胺酶DBD融合蛋白與USP。於一些實施方式中,連結子連結去胺酶與USP。於一些實施方式中,連結USP與去胺酶或去胺酶DBD融合蛋白的連結子為胺基酸或複數個胺基酸(例如,胜肽或蛋白質)。於一些實施方式中,連結子為有機分子、基團、聚合物或化學部分。於一些實施方式中,連結子的長度為3-100個胺基酸,例如,長度為3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150或150-200個胺基酸。亦考量了更長或更短的連結子。於一些實施方式中,較佳地,較短的連結子降低融合蛋白或其編碼序列的總大小或長度。於特定實施方式中,連結USP與去胺酶或去胺酶DBD融合蛋白的連結子具有如SEQ ID NO:120所示的序列。
於一些實施方式中,本文提供的範例性融合蛋白的一般構型包括結構:[NH
2]-[去胺酶]-[DBP]-[COOH];[NH
2]-[DBP]-[去胺酶]-[COOH];[NH
2]-[DBP]-[去胺酶]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[DBP]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[去胺酶]-[DBP]-[COOH];[NH
2]-[去胺酶]-[DBP]-[USP]-[COOH];[NH
2]-[DBP]-[去胺酶]-[USP]-[COOH];[NH
2]-[USP]-[去胺酶]-[DBP]-[COOH];[NH
2]-[USP]-[DBP]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[USP]-[DBP]-[COOH];或[NH
2]-[DBP]-[USP]-[去胺酶]-[COOH],其中DBP為DNA結合多肽,USP為尿嘧啶穩定多肽,NH
2為融合蛋白的N端,及COOH為融合蛋白的C端。於一些實施方式中,融合蛋白包括多於二個去胺酶多肽。
於某些實施方式中,本文提供的範例性融合蛋白的一般構型包括結構:[NH
2]-[去胺酶]-[RGN]-[COOH];[NH
2]-[RGN]-[去胺酶]-[COOH];[NH
2]-[RGN]-[去胺酶]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[RGN]-[去胺酶]-[COOH];或[NH
2]-[去胺酶]-[去胺酶]-[RGN]-[COOH];[NH
2]-[去胺酶]-[RGN]-[USP]-[COOH];[NH
2]-[RGN]-[去胺酶]-[USP]-[COOH];[NH
2]-[USP]-[去胺酶]-[RGN]-[COOH];[NH
2]-[USP]-[RGN]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[USP]-[RGN]-[COOH];或[NH
2]-[RGN]-[USP]-[去胺酶]-[COOH],其中RGN為RNA引導的核酸酶,USP為尿嘧啶穩定多肽,NH
2為融合蛋白的N端,及COOH為融合蛋白的C端。於一些實施方式中,融合蛋白包括多於二個去胺酶多肽。
於一些實施方式中,融合蛋白包括結構:[NH
2]-[去胺酶]-[核酸酶不活化的RGN]-[COOH];[NH
2]-[去胺酶]-[去胺酶]-[核酸酶不活化的RGN]-[COOH];[NH
2]-[核酸酶不活化的RGN]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[核酸酶不活化的RGN]-[去胺酶]-[COOH];[NH
2]-[核酸酶不活化的RGN]-[去胺酶]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[核酸酶不活化的RGN]-[USP]-[COOH];[NH
2]-[核酸酶不活化的RGN]-[去胺酶]-[USP]-[COOH];[NH
2]-[USP]-[去胺酶]-[核酸酶不活化的RGN]-[COOH];[NH
2]-[USP]-[核酸酶不活化的RGN]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[USP]-[核酸酶不活化的RGN]-[COOH];或[NH
2]-[核酸酶不活化的RGN]-[USP]-[去胺酶]-[COOH]。應該明白,“核酸酶不活化的RGN”代表包括任一CRISPR-Cas蛋白的任一RGN,其已突變為核酸酶不活化的。於一些實施方式中,融合蛋白包括多於二個去胺酶多肽。
於一些實施方式中,融合蛋白包括結構:[NH
2]-[去胺酶]-[RGN切口酶]-[COOH];[NH
2]-[去胺酶]-[去胺酶]-[RGN切口酶]-[COOH];[NH
2]-[RGN切口酶]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[RGN切口酶]-[去胺酶]-[COOH];或[NH
2]-[RGN切口酶]-[去胺酶]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[RGN切口酶]-[USP]-[COOH];[NH
2]-[RGN切口酶]-[去胺酶]-[USP]-[COOH];[NH
2]-[USP]-[去胺酶]-[RGN切口酶]-[COOH];[NH
2]-[USP]-[RGN切口酶]-[去胺酶]-[COOH];[NH
2]-[去胺酶]-[USP]-[RGN切口酶]-[COOH];或[NH
2]-[RGN切口酶]-[USP]-[去胺酶]-[COOH]。應該明白,“RGN切口酶”代表包括任一CRISPR-Cas蛋白的任一RGN,其為已突變為活化的切口酶。
於一些實施方式中,上述一般構型中使用的“-”表明可選連結子序列的存在。於一些實施方式中,本文提供的融合蛋白不包括連結子序列。於一些實施方式中,存在可選連結子序列中的至少一者。
可存在的其他範例性特徵為定位序列(例如,核定位序列、細胞質定位序列)、輸出序列(例如,核輸出序列)、或其他定位序列以及有用於融合蛋白的溶解、純化或偵測的序列標籤。本文提供的適合的定位訊號序列及蛋白序列標籤包括但不限於:生物素羧基載體蛋白(BCCP)標籤、myc標籤、鈣調蛋白標籤、FLAG標籤(例如,3XFLAG標籤)、血球凝集素(HA)標籤、聚組胺酸標籤(亦被稱為組胺酸標籤或His標籤)、麥芽糖結合蛋白(MBP)標籤、nus標籤、麩胱甘肽-S-轉移酶(GST)標籤、綠色螢光蛋白(GFP)標籤、硫氧化還原蛋白標籤、S標籤、Softag(例如,Softag 1、Softag 3)、streptag、生物素接合酶標籤、FlAsH標籤、V5標籤及SBP標籤。附加的適合的序列對於本領域中具有通常知識者是明顯的。
於某些實施方式中,目前所揭露的融合蛋白包括促進融合蛋白的細胞攝取的至少一個細胞穿透域。細胞穿透域為本領域中已知的且一般而言包括:數段帶正電荷的胺基酸殘基(亦即,聚陽離子細胞穿透域)、交替極性的胺基酸殘基及非極性胺基酸殘基(亦即,兩親性細胞穿透域)或疏水性胺基酸殘基(亦即,疏水性細胞穿透域)(
參見,
例如,Milletti F.(2012)
Drug Discov Today17:850-860)。細胞穿透域的非限制性實例為來自人免疫缺陷病毒1的反式活化轉錄活化子(TAT)。
於一些實施方式中,本文提供的去胺酶或融合蛋白進一步包括核定位序列(NLS)。核定位訊號、質體定位訊號、粒線體定位訊號、雙靶向定位訊號、及/或細胞穿透域可被安置於融合蛋白的胺基端(N端)、羧基端(C端)或內部位置中。
於一些實施方式中,NLS與融合蛋白或去胺酶的N端融合。於一些實施方式中,NLS與融合蛋白或去胺酶的C端融合。於一些實施方式中,NLS與融合蛋白的去胺酶的N端融合。於一些實施方式中,NLS與融合蛋白的去胺酶的C端融合。於一些實施方式中,NLS與融合蛋白的DNA結合多肽(例如,RGN多肽)的N端融合。於一些實施方式中,NLS與融合蛋白的DNA結合多肽(例如,RGN多肽)的C端融合。於一些實施方式中,NLS與融合蛋白的去胺酶多肽的N端融合。於一些實施方式中,NLS與融合蛋白的去胺酶多肽的C端融合。於一些實施方式中,NLS經由一或多個連結子(包括但不限於SEQ ID NO:148)而與融合蛋白融合。於一些實施方式中,NLS不經由連結子而與融合蛋白融合。於一些實施方式中,NLS包括本文提供的或引用的NLS序列中的任一者的胺基酸序列。於一些實施方式中,NLS包括如SEQ ID NO:76或SEQ ID NO:80所示的胺基酸序列。於一些實施方式中,融合蛋白或去胺酶於其N端上包括SEQ ID NO:76及於其C端上包括SEQ ID NO:80。
於一些實施方式中,如本文提供的融合蛋白包括去胺酶的全長序列,例如,SEQ ID NO:2、4及6-12中的任一者。然而,於一些實施方式中,如本文提供的融合蛋白不包括去胺酶的全長序列,而僅包括其片段。例如,於一些實施方式中,本文提供的融合蛋白進一步包括DNA結合多肽(例如,RNA引導的DNA結合)域及去胺酶域。
於一些實施方式中,本發明的融合蛋白包括DNA結合多肽(例如,RGN)及去胺酶,其中去胺酶具有對SEQ ID NO:2、4及6-12中的任一者具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%一致性的胺基酸序列。此種融合蛋白的實例被描述於本文的實例小節中。
於一些實施方式中,融合蛋白包括一個去胺酶多肽。於一些實施方式中,融合蛋白包括直接地或經由胜肽連結子可操作地連結的至少二個去胺酶多肽。於一些實施方式中,融合蛋白包括一個去胺酶多肽, 且第二去胺酶多肽與融合蛋白共表現。
本文亦提供了核糖核蛋白複合物,該核糖核蛋白複合物包括融合蛋白(包括去胺酶及RGDBP)及引導RNA(為單引導或為雙引導RNA)(亦被統稱為gRNA)。
V. 編碼去胺酶、融合蛋白及 / 或 gRNA 的核苷酸
本揭露內容提供編碼目前所揭露的去胺酶多肽的多核苷酸(SEQ ID NO:109、111及113-119)。本揭露內容進一步提供編碼融合蛋白的多核苷酸,該融合蛋白包括去胺酶及DNA結合多肽(例如,大範圍核酸酶、鋅指融合蛋白或TALEN)。本揭露內容進一步提供編碼融合蛋白的多核苷酸,該融合蛋白包括去胺酶域及RNA引導的DNA結合多肽。此種RNA引導的DNA結合多肽可為RGN或RGN變異體。蛋白質變異體可為核酸酶不活化的或切口酶。RGN可為CRISPR-Cas蛋白或其活性變異體或片段。SEQ ID NO:74及75分別為RGN及切口酶RGN變異體的非限制性實例。CRISPR-Cas核酸酶的實例為本領域中熟知的,且類似的對應突變可建立亦為切口酶或為核酸酶不活化的突變型變異體。
本發明的實施方式提供一種編碼融合蛋白的多核苷酸,該融合蛋白包括RGDBP及本文描述的去胺酶(SEQ ID NO:2、4及6-12、或其變異體)。於一些實施方式中,第二多核苷酸編碼用於靶向至所關注的核苷酸序列而由RGDBP要求的引導RNA。於一些實施方式中,引導RNA及融合蛋白由相同多核苷酸編碼。
術語「多核苷酸」的使用不旨在將本揭露內容局限於包括DNA的多核苷酸,但可考量此種DNA多核苷酸。本領域中具有通常知識者將認識到多核苷酸可包括核糖核苷酸(RNA)(例如,mRNA)、及核糖核苷酸與去氧核糖核苷酸的組合。此種去氧核糖核苷酸和核糖核苷酸包括天然存在的分子及合成類似物二者。本文揭露的多核苷酸亦涵蓋序列的所有形式,包括但不限於單股形式、雙股形式、莖環結構、環狀形式(例如,包括環狀RNA)、及類似者。
本發明的實施方式為包括對SEQ ID NO:109、111及113-119中的任一者具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%一致性的序列的核酸分子,其中核酸分子編碼具有胞嘧啶去胺酶活性的去胺酶。核酸分子可進一步包括異源啟動子或終止子。核酸分子可編碼融合蛋白、可選地第二去胺酶及可選地USP,其中經編碼的去胺酶可操作地被連結至DNA結合多肽。於一些實施方式中,核酸分子編碼融合蛋白、可選地第二去胺酶及可選地USP,其中經編碼的去胺酶可操作地被連結至RGN。
於一些實施方式中,包括編碼本發明的去胺酶的多核苷酸的核酸分子可針對於所關注的生物體中的表現而被密碼子最佳化。“密碼子最佳化的”編碼序列為使其密碼子使用頻率設計成模擬較佳密碼子使用頻率或特定宿主細胞的轉錄條件的多核苷酸編碼序列。由於核酸層次上的一或多個密碼子的改變使得轉譯的胺基酸序列未被改變,所以特定宿主細胞或生物體中的表現被增強。核酸分子可以全部或部分地被密碼子最佳化。密碼子表和提供大範圍生物體的偏好資訊的其他參考文獻在本領域中是可得的(
參見,
例如,Campbell及Gowri(1990)
Plant Physiol. 92:1-11,有關植物較佳密碼子使用的討論)。本領域中用於合成植物較佳基因的方法是可得的。參見,例如,第5,380,831號和第5,436,391號美國專利及Murray等人(1989)
Nucleic Acids Res. 17:477-498,彼等藉由引用而被併入本文。
於一些實施方式中,編碼本文描述的去胺酶、融合蛋白、及/或gRNA的多核苷酸可在表現卡匣中被提供,以用於在體外表現或在所關注的細胞、胞器、胚胎或生物體中表現。卡匣可包括5'和3'調節序列,該5'和3'調節序列可操作地連結至編碼本文提供的允許多核苷酸表現的去胺酶及/或融合蛋白(包括去胺酶、RNA引導的DNA結合多肽及可選地第二去胺酶)及/或gRNA的多核苷酸。卡匣可附加地含有至少一種額外基因或基因元素,以共轉形至生物體內。倘若包括額外基因或元素,則該組成可操作地被連結。術語“可操作地連結”旨在指二或多個元素之間的功能性連結。例如,啟動子與所關注的編碼區域(例如,對去胺酶、RNA引導的DNA結合多肽、及/或gRNA編碼的區域)之間的可操作地連結為允許所關注的編碼區域表現的功能性連結。可操作地連結的元素可為連續的或非連續的。當用於指二個蛋白質編碼區域的連結時,藉由可操作地被連結意指編碼區域在相同的讀框中。於一些實施方式中,附加的(多個)基因或(多個)元素被提供於多個表現卡匣上。例如,單獨地或為融合蛋白的組成來編碼目前所揭露的去胺酶的核苷酸序列可存在於一個表現卡匣上,而編碼gRNA的核苷酸序列可在各別表現卡匣上。另一個實例可具有在第一表現卡匣上單獨地編碼目前所揭露的去胺酶的核苷酸序列、編碼包括去胺酶的融合蛋白的第二表現卡匣、及在第三表現卡匣上編碼gRNA的核苷酸序列。此種表現卡匣被提供有複數個限制性位點及/或重組位點,以使多核苷酸的插入受調節區域的轉錄調節。亦可存在包括可選擇的標記基因的表現卡匣。
表現卡匣於5'-3'轉錄方向上可包括:轉錄(而於一些實施方式中,轉譯)起始區域(亦即,啟動子)、本發明的去胺酶編碼多核苷酸、及於所關注的生物體中起作用的轉錄(而於一些實施方式中,轉譯)終止區域(亦即,終止區域)。本發明的啟動子能夠在宿主細胞中導向或驅動編碼序列的表現。調節區域(例如,啟動子、轉錄調節區域、及轉譯終止區域)可與宿主細胞或彼此為內源的或異源的。如本文所使用的關於序列的“異源”為源自外來物種的序列,或者,如果來自相同物種,則為藉由蓄意的人為干預從其在組成物及/或基因體基因座中的天然形式實質上被修飾的序列。如本文所使用的,嵌合基因包括可操作地被連結至轉錄起始區域的編碼序列,該轉錄起始區域與編碼序列是異源的。
合宜的終止區域可從
根癌農桿菌(
A. tumefaciens)的Ti質體獲得,例如,章魚肉鹼(octopine)合成酶及胭脂鹼(nopaline)合成酶終止區域。亦參見Guerineau等人(1991)
Mol. Gen. Genet. 262:141-144;Proudfoot(1991)
Cell64:671-674;Sanfacon等人(1991)
Genes Dev. 5:141-149;Mogen等人(1990)
Plant Cell2:1261-1272;Munroe等人(1990)
Gene91:151-158;Ballas等人(1989)
Nucleic Acids Res. 17:7891-7903;及Joshi等人(1987)
Nucleic Acids Res. 15:9627-9639。
附加的調節訊號包括但不限於:轉錄起始開始位點(transcriptional initiation start site)、操作子、活化子、增強子、其他調節元素、核醣體結合位點、起始密碼子、終止訊號、及類似者。參見,例如,第5,039,523號及第4,853,331號美國專利;EPO 0480762A2;Sambrook等人(1992),Molecular Cloning:A Laboratory Manual, ed. Maniatis等人(冷泉港實驗室出版社,冷泉港,紐約(Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.)),後稱“Sambrook 11”;Davis等人編輯(1980)Advanced Bacterial Genetics(冷泉港實驗室出版社),冷泉港,紐約((Cold Spring Harbor Laboratory Press), Cold Spring Harbor, N.Y.)及其中引用的參考文獻。
在製備表現卡匣時,可操作各種DNA片段,以便在適宜的取向上及恰當的情況下於適宜的讀框中對DNA序列進行提供。為此,可以採用轉接子或連結子來連結DNA片段,或者可涉及其他操作以對合宜的限制位點、去除多餘的DNA、去除限制位點或類似者進行提供。為此目的,可涉及體外誘變、引子修復、限制、貼合(annealing)、重新置換(例如,轉換)及置換(transversion)。
很多啟動子可被用於本發明的實施。可基於期望結果來選擇啟動子。核酸可與構成型、誘導型、生長階段特定、細胞類型特定、組織較佳、組織特定的啟動子或其他啟動子結合,用於所關注的生物體中的表現。參見,例如,WO 99/43838中及第8,575,425號;第7,790,846號;第8,147,856號;第8,586832號;第7,772,369號;第7,534,939號;第6,072,050號;第5,659,026號;第5,608,149號;第5,608,144號;第5,604,121號;第5,569,597號;第5,466,785號;第5,399,680號;第5,268,463號;第5,608,142號;及第6,177,611號美國專利中所示的啟動子;其藉由引用而被併入本文。
對於在植物中的表現,構成型啟動子亦包括CaMV 35S啟動子(Odell等人(1985)
Nature313:810-812);水稻肌動蛋白(rice actin)(McElroy等人(1990)
Plant Cell2:163-171);泛蛋白(Christensen等人(1989)
Plant Mol. Biol. 12:619-632及Christensen等人(1992)
Plant Mol. Biol. 18:675-689);pEMU(Last等人(1991)
Theor. Appl. Genet. 81:581-588);及MAS(Velten等人(1984)
EMBO J. 3:2723-2730)。
誘導型啟動子的實例為:可由缺氧或寒逆境誘導的Adh1啟動子、可由熱逆境誘導的Hsp70啟動子、可由光誘導的PPDK啟動子及PEP羧化酶(pepcarboxylase)啟動子。同樣有用的為化學誘導的啟動子,例如,安全劑誘導的In2-2啟動子(第5,364,780號美國專利)、生長素誘導的且是營養層特定的但在癒合組織中亦有活性的Axig1啟動子(PCT US01/22169)、類固醇反應性啟動子(參見,例如,Schena等人(1991)
Proc. Natl. Acad. Sci.
USA88:10421-10425及McNellis等人(1998)
Plant J. 14(2):247-257中的雌激素誘導的ERE啟動子和糖皮質激素誘導型啟動子)、及四環素誘導型和四環素阻抑型啟動子(參見,例如,Gatz等人(1991)
Mol. Gen. Genet. 227:229-237及第5,814,618號和第5,789,156號美國專利),其藉由引用而被併入本文。
於一些實施方式中,可運用組織特定或組織較佳的啟動子來靶向特定組織內的表現構築體的表現。於某些實施方式中,組織特定或組織較佳的啟動子在植物組織中是有活性的。在植物中受發育控制的啟動子的實例包括例如葉、根、果實、種子或花之類的某些組織中較佳地起動轉錄的啟動子。“組織特定”啟動子為僅在某些組織中起動轉錄的啟動子。與基因的構成型表現不同,組織特定表現是數種水準的基因調節相互作用的結果。就其本身而言,來自同源或密切相關的植物物種的啟動子可較佳地用於在特定組織中實現轉殖基因的有效且可靠的表現。於一些實施方式中,表現包括組織較佳的啟動子。“組織較佳的”啟動子為較佳地在、但不一定完全在或僅在某些組織中起動轉錄的啟動子。
於一些實施方式中,編碼本文描述的去胺酶的核酸分子包括細胞類型特定啟動子。“細胞類型特定”啟動子為主要在一或多個器官中的某些細胞類型中驅動表現的啟動子。例如,其中在植物中起作用的細胞類型特定啟動子可為主要活性的植物細胞的一些實例包括BETL細胞、根、葉中的維管細胞、柄細胞及莖細胞。核酸分子還可包括細胞類型較佳的啟動子。“細胞類型較佳的”啟動子為主要驅動大部分在、但不一定完全在或僅在一或多個器官中的某些細胞類型中的表現的啟動子。例如,其中在植物中起作用的細胞類型較佳的啟動子可具較佳活性的植物細胞的一些實例包括BETL細胞、根、葉中的維管細胞、柄細胞及莖細胞。
於一些實施方式中,編碼去胺酶、融合蛋白及/或gRNA的核酸序列可與例如由用於體外mRNA合成的噬菌體RNA聚合酶辨識的啟動子序列可操作地連結。於此類實施方式中,體外轉錄的RNA可被純化,以用於本文描述的方法。例如,啟動子序列可為T7、T3或SP6啟動子序列、或T7、T3或SP6啟動子序列的變異體。於此類實施方式中,所表現的蛋白及/或RNA可被純化,以用於本文描述的基因體修飾方法。
於某些實施方式中,編碼去胺酶、融合蛋白及/或gRNA的多核苷酸被連結至多腺苷酸化訊號(例如,SV40 polyA訊號及在植物中起作用的其他訊號)及/或至少一個轉錄終止序列。於一些實施方式中,編碼去胺酶或融合蛋白的序列被連結至編碼至少一個核定位訊號、至少一個細胞穿透域及/或能夠將蛋白質運輸至特定亞細胞位置的至少一個訊號胜肽的(多個)序列,如本文中別處所描述的。
於一些實施方式中,編碼去胺酶、融合蛋白及/或gRNA的多核苷酸存在於載體或多個載體中。“載體”指用於將核酸轉移、遞送或引入宿主細胞內的多核苷酸組成物。適合的載體包括質體載體、噬菌粒、黏接質體(cosmid)、人工/微型染色體、轉位子及病毒載體(例如,慢病毒載體、腺相關病毒載體、桿狀病毒載體)。於一些實施方式中,載體包括附加的表現控制序列(例如,增強子序列、Kozak序列、多腺苷酸化序列、轉錄終止序列)、選擇性標記序列(例如,抗生素抗性基因)、複製起點及類似者。附加的資訊可在“Current Protocols in Molecular Biology”Ausubel等人、John Wiley & Sons,紐約,2003;或“Molecular Cloning:A Laboratory Manual”Sambrook & Russell,冷泉港出版社(Cold Spring Harbor Press), Cold Spring Harbor, N.Y., 第3版, 2001中找到。
於一些實施方式中,載體包括用於經轉形的細胞(transformed cell)的選擇的選擇性標記基因。對於經轉形的細胞或組織的選擇運用選擇性標記基因。標記基因包括:編碼抗生素抗性的基因,例如編碼新黴素磷酸轉移酶II(NEO)和潮黴素磷酸轉移酶(HPT)的基因;及對例如草銨膦(glufosinate ammonium)、溴苯腈、咪唑啉酮及2,4-二氯苯氧乙酸鹽(2,4-d)之類的除草性化合物賦予抗性的基因。
於一些實施方式中,包括編碼包括例如RGN之類的RNA引導的DNA結合多肽的融合蛋白的序列的表現卡匣或載體進一步包括編碼gRNA的序列。於一些實施方式中,編碼gRNA的(多個)序列可操作地被連結至至少一個轉錄控制序列,用於gRNA於所關注的生物體或宿主細胞中的表現。例如,編碼gRNA的多核苷酸可可操作地被連結至藉由RNA聚合酶III(Pol III)辨識的啟動子序列。適合的Pol III啟動子的實例包括但不限於哺乳動物U6、U3、H1及7SL RNA啟動子及水稻U6及U3啟動子。
如所指示的,包括編碼去胺酶、融合蛋白、及/或gRNA的核苷酸序列的表現構築體可被用於轉形所關注的生物體。用於轉形的方法涉及將核苷酸構築體引入所關注的生物體內。藉由“引入”旨在將核苷酸構築體引至宿主細胞,藉此使得構築體進入宿主細胞內部。本發明的方法不需要一種將核苷酸構築體引至宿主生物體,只是核苷酸構築體進入宿主生物體的至少一個細胞內部的特定方法。於一些實施方式中,編碼去胺酶或融合蛋白的mRNA被引入宿主細胞內。於融合蛋白包括RGDBP的一些實施方式中,編碼融合蛋白的mRNA被引入細胞內,及gRNA被引入細胞內。宿主細胞可為真核細胞或原核細胞。於特定實施方式中,真核宿主細胞為植物細胞、哺乳動物細胞或昆蟲細胞。用於將核苷酸構築體引入植物及其他宿主細胞內的方法為本領域中已知,其包括但不限於:穩定轉形方法、瞬時轉形方法及病毒介導方法。
此等方法得到經轉形的生物體(transformed organism),例如植物,包括:整株植物及植物器官(例如,葉、莖、根等)、種子、植物細胞、繁殖體、胚胎及其後代。植物細胞可被分化,或可不被分化(例如,癒合組織、懸浮培養細胞、原生質體、葉細胞、根細胞、韌皮部細胞、花粉)。
“基因轉殖生物體”或“經轉形的生物體”或“經穩定轉形的”生物體或細胞或組織指已併入或整合了編碼本發明的去胺酶的多核苷酸的生物體。應該認識到,其他外源或內源核酸序列或DNA片段亦可被併入宿主細胞內。
農桿菌及基因槍介導的轉形仍然為用於植物細胞的轉形而主要採用的二種方法。然而,宿主細胞的轉形可藉由感染、轉染、顯微注射、電穿孔、顯微投影(microprojection)、基因槍或粒子轟擊、電穿孔、二氧化矽/碳纖維、超音波介導的、PEG介導的、磷酸鈣共沉澱、聚陽離子DMSO技術、DEAE葡聚醣(dextran)程序、及病毒介導的、脂質體介導的及類似者實行。編碼去胺酶、融合蛋白、及/或gRNA的多核苷酸的病毒介導的引入包括反轉錄病毒、慢病毒、腺病毒、及腺相關病毒介導的引入及表現,及花椰菜嵌紋病毒(例如,花椰菜嵌紋病毒(cauliflower mosaic virus))、雙生病毒(例如,豆科金色黃花葉嵌紋病毒(bean golden yellow mosaic virus)或玉蜀黍條班病毒(maize streak virus))、及RNA植物病毒(例如,煙草嵌紋病毒)的使用。
轉形操作流程以及用於將多肽或多核苷酸序列引入植物內的操作流程可隨針對轉形所靶向的宿主細胞的類型(例如,單子葉植物或雙子葉植物細胞)而不同。用於轉形的方法為本領域中已知、且包括第8,575,425號、第7,692,068號、第8,802,934號、第7,541,517號美國專利中闡述的那些方法,這些專利中的每一者藉由引用而被併入本文。亦參見Rakoczy-Trojanowska, M.(2002)
Cell Mol Biol Lett. 7:849-858;Jones等人(2005)
Plant Methods1:5;Rivera等人(2012)
Physics of Life Reviews9:308-345;Bartlett等人(2008)
Plant Methods4:1-12;Bates, G.W.(1999)
Methods in Molecular Biology111:359-366;Binns及Thomashow(1988),
Microbiology42:575-606中的
Annual Reviews;Christou, P.(1992)
The Plant Journal2:275-281;Christou, P.(1995)
Euphytica85:13-27;Tzfira等人(2004)
TRENDS in Genetics20:375-383;Yao等人(2006)
Journal of Experimental Botany57:3737-3746;Zupan及Zambryski(1995)
Plant Physiology107:1041-1047;Jones等人(2005)
Plant Methods1:5。
轉形可導致核酸至細胞中的穩定或瞬時引入。“穩定轉形”旨在表示被引入宿主細胞中的核苷酸構築體整合至該宿主細胞的基因體中、且能夠被其後代遺傳。“瞬時轉形”旨在表示多核苷酸被引入宿主細胞中而不整合至宿主細胞的基因體中。
用於葉綠體轉形的方法為本領域中已知。參見,例如,Svab等人(1990)
Proc. Nail. Acad. Sci. USA87:8526-8530;Svab及Maliga (1993)
Proc. Natl. Acad. Sci. USA90:913-917;Svab及Maliga(1993)
EMBO J. 12:601-606。該方法取決於含有選擇性標記的DNA的粒子槍遞送及經由同源重組而將DNA靶向至質體基因體。另外,質體轉形可藉由核編碼的及質體導向的RNA聚合酶的組織較佳表現來轉活化(transactivation)緘默質體攜帶的轉殖基因來完成。McBride等人(1994)在
Proc. Natl. Acad. Sci. USA91:7301-7305已報導了此系統。
已經被轉形的細胞可按照傳統方式生長成基因轉殖生物體,例如,植物。參見,例如,McCormick等人(1986)
Plant Cell Reports5:81-84。然後,可以使這些植物生長,且用相同的經轉形的品系(transformed strain)或不同品系授粉,且辨識出具有去胺酶或融合蛋白多核苷酸的所得雜合體。可生長二代或多代以確保穩定維持並遺傳去胺酶或融合蛋白多核苷酸、以及接著收穫種子以確保去胺酶或融合蛋白多核苷酸的存在。以此方式,本發明提供具有穩定地併入其基因體中的本發明的核苷酸構築體(例如,本發明的表現卡匣)的經轉形的種子(亦稱為“基因轉殖種子”)。
於一些實施方式中,可將已經轉形的細胞引入生物體中。此等細胞可源自生物體,其中細胞以離體方法被轉形。
本文提供的序列可被用於任何植物物種的轉形,包括但不限於單子葉植物及雙子葉植物。所關注的植物的實例包括但不限於:玉蜀黍(玉米)、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥、及油菜、蕓苔屬物種(Brassica sp.)、苜蓿、黑麥、小米、紅花、花生、甘藷、木薯、咖啡、椰子、鳳梨、柑橘樹、可可、茶、香蕉、鱷梨、無花果、番石榴、芒果、橄欖、木瓜、腰果、澳洲胡桃、杏仁、燕麥、蔬菜、觀賞植物及針葉樹。
蔬菜包括但不限於:番茄、萵苣、綠豆、皇帝豆、豌豆、及例如胡瓜(cucumber)、網紋甜瓜(cantaloupe)及洋香瓜(musk melon)之類的黃瓜(Curcumis)屬的成員。觀賞植物包括但不限於:杜鵑花、繡球花、芙蓉、玫瑰、鬱金香、水仙、矮牽牛、康乃馨、猩猩木及菊花。較佳地,本發明的植物為農作物(例如,玉米、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥、油菜等)。
如本文所使用的術語“植物”包括:植物細胞、植物原生質體、植物可再生所自的植物細胞組織培養物、植物癒傷組織、植物塊、及在植物或植物的例如胚胎、花粉、胚珠、種子、葉子、花、枝、果實、仁、穗、玉米穗軸、殼、莖、根、根尖、花藥及類似者之類的部分中是完整的植物細胞。穀物旨在表達出於種植或繁殖物種之外的目的而由商業種植者生產的成熟種子。再生植物的子代、變異體及突變體亦包括於本發明的範圍內,前提條件是此等部分包括所引入的多核苷酸。進一步提供了保持了本文揭露的序列的經處理的植物產品或副產物,例如,包括豆粕。
於一些實施方式中,編碼去胺酶、融合蛋白及/或gRNA的多核苷酸被用於轉形任何真核物種,包括但不限於:動物(例如,哺乳動物、昆蟲、魚類、鳥類、及爬蟲類物)、真菌、變形蟲、藻類、及酵母。於一些實施方式中,編碼去胺酶、融合蛋白及/或gRNA的多核苷酸被用於轉形任何原核物種,包括但不限於:古生菌和細菌(例如,
芽孢桿菌屬(Bacillus spp.)、
克雷伯氏菌屬(Klebsiella spp.)、
鏈黴菌屬(Streptomyces spp.)、
根瘤菌屬(Rhizobium spp.)、
埃希氏菌屬(Escherichia spp.)、
假單胞菌屬(Pseudomonas spp.)、
沙門氏菌屬(Salmonella spp.)、
志賀氏桿菌屬(Shigella spp.)、
弧菌屬(Vibrio spp.)、
耶爾森菌屬(Yersinia spp.)、
支原體菌屬(Mycoplasma spp.)、
農桿菌屬(Agrobacterium)、
乳酸乳桿菌屬(Lactobacillus spp.)。
於一些實施方式中,傳統的基於病毒和非病毒的基因轉移方法被用於將核酸引入哺乳動物細胞或標的組織中。此種方法可被用於將編碼本發明的去胺酶或融合蛋白及可選地gRNA的核酸投予培養中的細胞或宿主生物體中的細胞。非病毒載體遞送系統包括:DNA質體、RNA(例如,本文描述的載體的轉錄本)、裸核酸、及與例如脂質體之類的遞送載子複合的核酸。病毒載體遞送系統包括DNA及RNA病毒,其在遞送至細胞後具有附加型或整合的基因體。非限制性實例包括運用花椰菜嵌紋病毒(例如,花椰菜嵌紋病毒)、雙生病毒(例如,豆科金色黃花葉嵌紋病毒或玉蜀黍條班病毒)、及RNA植物病毒(例如,煙草嵌紋病毒)的載體。有關基因療法程序的綜述,參見Anderson,
Science256:808- 813 (1992);Nabel & Feigner,
TIBTECH11:211-217 (1993);Mitani & Caskey,
TIBTECH11:162-166 (1993);Dillon,
TIBTECH11:167-175 (1993);Miller,
Nature357:455-460 (1992);Van Brunt,
Biotechnology6(10):1149-1154 (1988);Vigne,
Restorative Neurology and Neuroscience8:35-36 (1995);Kremer & Perricaudet,
British Medical Bulletin51(1):31-44 (1995);Haddada等人,in Current Topics in Microbiology and Immunology, Doerfler及Bohm(編者)(1995);及Yu等人,
Gene Therapy1:13-26 (1994)。
核酸的非病毒遞送方法包括脂質體轉染、
農桿菌介導的轉形、核轉染、顯微注射、基因槍(biolistics)、病毒體、脂質體、免疫脂質體、聚陽離子或脂質:核酸共軛物、裸DNA、人工病毒粒子、及DNA的試劑增強攝取。例如,第5,049,386號、第4,946,787號及第4,897,355號美國專利中描述了脂質體轉染,且脂質體轉染試劑是市售的(例如,Transfectam ™及Lipofectin™)。適合用於多核苷酸的有效受體辨識脂質體轉染(receptor-recognition lipofection)的陽離子及中性脂質包括Feigner的WO 91/17424;WO 91/16024中的那些陽離子和中性脂質。遞送可為至細胞(例如,在體外或離體地投予)或標的組織(例如,體內投予)。例如免疫脂質複合物之類的包括靶向的脂質體的脂質:核酸複合物的製備為本領域中具有通常知識者所熟知(參見,例如,Crystal,
Science270:404-410(1995);Blaese等人,
Cancer Gene Ther. 2:291- 297(1995);Behr等人,
Bioconjugate Chem. 5:382-389(1994);Remy等人,
Bioconjugate Chem. 5:647-654(1994);Gao等人,
Gene Therapy2:710-722(1995);Ahmad等人,
Cancer Res. 52:4817-4820(1992);第4,186,183號、第4,217,344號、第4,235,871號、第4,261,975號、第4,485,054號、第4,501,728號、第4,774,085號、第4,837,028號及第4,946,787號美國專利)。
使用基於RNA或DNA病毒的系統來遞送核酸利用高度進化的過程將病毒靶向至體內的特定細胞且將病毒載荷運輸至細胞核。病毒載體可被直接投予患者(體內),或者該病毒載體可被用於體外處理細胞,並且可選地將經修飾的細胞投予患者(離體)。傳統的基於病毒的系統可包括用於基因轉移的反轉錄病毒、慢病毒、腺病毒、腺相關及單純皰疹病毒載體。用反轉錄病毒、慢病毒、及腺相關病毒基因轉移方法,在宿主基因體中的整合是可能的,常常導致所插入的轉殖基因的長期表現。另外,在許多不同細胞類型及標的組織中已經觀察到高轉導效率。
反轉錄病毒的向性可藉由併入外來套膜蛋白而被改變,從而擴展標的細胞的潛在標的族群。慢病毒載體為能夠轉導或感染非分裂細胞並且通常產生高病毒力價的反轉錄病毒載體。因此,反轉錄病毒基因轉移系統的選擇將依賴於標的組織。反轉錄病毒載體由順式作用長端重複序列構成,該順式作用長端重複序列具有達到6-10 kb外來序列的包裝能力。最小順式作用LTR足夠用於載體的複製及包裝,然後,使用其將治療基因整合至標的細胞中,以提供永久轉殖基因表現。廣泛使用的反轉錄病毒載體包括:基於小鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猿猴免疫不全病毒(SIV)、人免疫不全病毒(HIV)、及其組合的那些載體(參見,例如,Buchscher等人,
J. Viral. 66:2731-2739(1992);Johann等人,
J. Viral. 66:1635-1640(1992);Sommnerfelt等人,
Viral.176:58-59(1990);Wilson等人,
J. Viral. 63:2374-2378(1989);Miller 等人,
J. Viral. 65:2220-2224(1991);PCT/US94/05700)。
在瞬時表現較佳的應用中,可使用基於腺病毒的系統。基於腺病毒的載體在許多細胞類型中能夠有非常高的轉導效率,且不需要細胞分裂。使用這樣的載體,已經獲得了高力價及高表現水準。此載體可在相對簡單的系統中被大量產生。腺相關病毒(“AAV”)載體亦可例如在核酸及胜肽的體外生產中、以及在體內和離體基因療法程序中利用目標核酸轉導細胞(參見,例如,West 等人,
Virology160:38-47(1987);第4,797,368號美國專利;WO 93/24641;Katin,
Human Gene Therapy5:793-801(1994);Muzyczka,
J. Clin. Invest. 94:1351(1994))。重組AAV載體的構築被描述於許多出版物中,包括第5,173,414號美國專利;Tratschin等人,
Mol. Cell. Biol. 5:3251-3260(1985);Tratschin等人,
Mol. Cell. Biol. 4:2072-2081(1984);Hermonat & Muzyczka,
PNAS81:6466-6470(1984);及Samulski等人,
J. Viral. 63:03822-3828(1989)。包裝細胞通常用於形成能夠感染宿主細胞的病毒顆粒。此種細胞包括包裝腺病毒的293細胞及包裝反轉錄病毒的ψJ2細胞或PA317細胞。
基因療法中使用的病毒載體通常藉由產生將核酸載體包裝於病毒顆粒內的細胞株而被產生。該載體通常含有用於包裝且隨後整合至宿主內所需的最小病毒序列,其他病毒序列由用於要表現的(多個)多核苷酸的表現卡匣替代。缺失的病毒功能通常由該包裝細胞株以反式提供。例如,基因療法中使用的AAV載體通常僅具有包裝及整合至宿主基因體中所需的來自AAV基因體的ITR序列。病毒DNA被包裝於細胞株中,該細胞株含有編碼其他AAV基因(即,rep和cap)但缺少ITR序列的輔助質體(helper plasmid)。
亦可用腺病毒作為輔助體來感染細胞株。輔助病毒促進AAV載體的複製及來自輔助質體的AAV基因的表現。由於缺少ITR序列,因此輔助質體沒有被大量包裝。腺病毒的污染可藉由例如熱處理來降低,腺病毒對熱處理比對AAV更敏感。用於將核酸遞送至細胞的其他方法為本領域中具有通常知識者已知的。參見,例如,US20030087817,其藉由引用而被併入本文。
理想的是,本發明的RGN去胺酶融合蛋白的編碼序列及用於融合蛋白靶向的對應引導RNA可全部被包裝於單AAV載體中。一般而言,所接受的AAV載體的大小限制為4.7 kb,但是可考量較大的大小,但代價是減低的包裝效率。為確保融合蛋白及其對應引導RNA二者的表現卡匣可裝進AAV載體中,可使用RGN的新穎活性缺失變異體(例如,如SEQ ID NO:97、98、106及107所示的那些)或去胺酶的活性缺失變異體,例如,本文描述的如SEQ ID NO:2、4及6所示的那些。除了使胺基酸序列縮短且因此使融合蛋白的RGN及/或去胺酶的編碼序列縮短,連結RGN與去胺酶的胜肽連結子亦可被縮短。USP(如果存在)及連接USP與RGN去胺酶融合蛋白的連結子可被縮短。最後,經由缺失分析以確定對將起作用的每一者要求的最小大小,例如啟動子、增強子及/或終止子的基因元素亦可被工程化。本發明亦教導經由體內AAV載體遞送將該融合蛋白用於靶向的鹼基編輯的方法。
於一些實施方式中,用本文描述的一或多個載體暫時地或非暫時地轉染宿主細胞。於一些實施方式中,細胞在其天然存在於個體中時被轉染。於一些實施方式中,被轉染的細胞取自個體。
於一些實施方式中,被轉染的細胞為真核細胞。於一些實施方式中,真核細胞為動物細胞(例如,哺乳動物、昆蟲、魚類、鳥類、及爬蟲類物)。於一些實施方式中,被轉染的細胞為人細胞。於一些實施方式中,被轉染的細胞為造血源的細胞,例如,免疫細胞(亦即,先天性或適應性免疫系統的細胞),包括但不限於:B細胞、T細胞、自然殺手(NK)細胞、富潛能幹細胞、經誘導的富潛能幹細胞、嵌合抗原受體T(CAR-T)細胞、單核細胞、巨噬細胞、及樹突細胞。
於一些實施方式中,細胞取得自取自個體的細胞,例如細胞株。於一些實施方式中,細胞或細胞株為原核的。於一些實施方式中,細胞或細胞株為真核的。於進一步實施方式中,細胞或細胞株為取得自昆蟲、禽類、植物或真菌物種。於一些實施方式中,細胞或細胞株可為哺乳動物,舉例而言,例如,人、猴、小鼠、牛、豬、山羊、倉鼠、大鼠、貓或狗。用於組織培養的多種細胞株為本領域中已知。細胞株的實例包括但不限於:C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLaS3、Huhl、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TFl、CTLL-2、CIR、Rat6、CVI、RPTE、AlO、T24、182、A375、ARH-77、Calul、SW480、SW620、SKOV3、SK-UT、CaCo2、P388Dl、SEM-K2、WEHI- 231、HB56、TIB55、lurkat、145.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4. COS、COS-1、COS-6、COS-M6A、BS-C-1猴腎上皮細胞、BALB/3T3小鼠胚胎纖維母細胞、3T3 Swiss、3T3-Ll、132-d5人胎兒纖維母細胞;10.1小鼠纖維母細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-I細胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10Tl/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-Kl、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L235010、CORL23/ R23、COS-7、COV-434、CML Tl、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalclc7、HL-60、HMEC、HT-29、lurkat、lY細胞、K562細胞、Ku812、KCL22、KGl、KYOl、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-l0A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/ 0.2R、MONO-MAC 6、MTD-lA、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞株、Peer、PNT-lA/ PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THPl細胞株、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR、及其基因轉殖品種。細胞株可從本領域中具有通常知識者已知的多種來源獲得(參見,例如,美國典型菌種保存中心(American Type Culture Collection)(ATCC)(馬納沙斯,VA.))。
於一些實施方式中,用本文描述的一或多個載體轉染的細胞被用於建立包括一或多個載體取得序列(vector-derived sequence)的新細胞株。於一些實施方式中,用本發明的融合蛋白及可選地gRNA或用本發明的核糖核蛋白複合物暫時轉染的並經由融合蛋白或核糖核蛋白複合物的活性修飾的細胞被用於建立包括含有修飾但缺少任何其他外源序列的細胞的新細胞株。於一些實施方式中,用本文描述的一或多個載體暫時或非暫時轉染的細胞或自此種細胞取得的細胞株被用於估定一或多個測試化合物。
於一些實施方式中,本文描述的一或多個載體被用於產生非人的基因轉殖動物或基因轉殖植物。於一些實施方式中,基因轉殖動物為昆蟲。於進一步實施方式中,昆蟲為害,例如,蚊子或蜱。於一些實施方式中,昆蟲為植物害蟲,例如,玉蜀黍根蟲或秋季行軍蟲(fall armyworm)。於一些實施方式中,基因轉殖動物為鳥類,例如,雞、火雞、鵝或鴨。於一些實施方式中,基因轉殖動物為哺乳動物,例如,人,小鼠、大鼠、倉鼠、猴、猿、兔子、豬、牛、馬、山羊、羊、貓或狗。
VI. 多肽及多核苷酸的變異體及片段
本揭露內容提供對DNA分子有活性的其核酸序列如SEQ ID NO:2、4及6-12所示的胞嘧啶去胺酶、其活性變異體或片段、及編碼其的多核苷酸。
儘管與所關注的多核苷酸或多肽相較下可改變變異體或片段的活性,但變異體和片段應保持所關注的多核苷酸或多肽的功能性。例如,當與所關注的多核苷酸或多肽相較時,變異體或片段可具有增加的活性、降低的活性、不同的活性譜或活性的任何其他改變。
如果具有胞嘧啶去胺酶活性的本發明的去胺酶的片段及變異體為進一步包括DNA結合多肽或其片段的融合蛋白的部分,則它們保持該活性。
術語“片段”指本發明的多核苷酸或多肽序列的一部分。“片段”或“生物活性部分”包括多核苷酸,該多核苷酸包括足夠數量的連續核苷酸,以保持生物活性(亦即,對核酸的去胺酶活性)。“片段”或“生物活性部分”包括多肽,該多肽包括足夠數量的連續胺基酸殘基,以保持生物活性。本文揭露的去胺酶的片段包括因於替代的下游開始位點的使用而比全長序列短的那些序列。於一些實施方式中,去胺酶的生物活性部分可為包括例如SEQ ID NO:2、4及6-12中的任一者的10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160或更多個連續胺基酸殘基的多肽,或其變異體。此等生物活性部分可藉由重組技術而被製備且針對活性而被評估。
一般來說,「變異體」旨在意指基本上相似的序列。對於多核苷酸,變異體包括於天然多核苷酸內的一或多個內部分點處的一或多個核苷酸的缺失及/或添加及/或於天然多核苷酸中的一或多個位點處的一或多個核苷酸的取代。如本文所使用的「天然」或「野生型」多核苷酸或多肽分別包括天然存在的核苷酸序列或胺基酸序列。對於多核苷酸,保留(conservative)變異體包括因為遺傳密碼的簡併性(degeneracy)而編碼所關注基因的天然胺基酸序列的那些序列。例如可使用眾所周知的分子生物學技術來鑑定(例如,利用聚合酶連鎖反應(PCR)和雜交技術)的天然存在的對偶基因變異體如以下概述。變異體多核苷酸亦包括合成取得的多核苷酸,例如藉由使用定點誘變產生的但其仍然編碼所關注的多肽或多核苷酸的那些多核苷酸。一般而言,本文揭露的特定多核苷酸的變異體對如藉由本文別處描述的序列比對程式及參數所確定的那個特定多核苷酸具有至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更高序列一致性。
本文揭露的特定多核苷酸(亦即,參考多核苷酸)的變異體亦可藉由比較由變異體多核苷酸編碼的多肽與由參考多核苷酸編碼的多肽之間的序列一致性百分比來評估。可使用本文別處描述的序列比對程式及參數來計算任何二個多肽之間的序列一致性百分比。當藉由比較本文揭露的任何給定的多核苷酸對所編碼的兩個多肽共同的序列一致性百分比來評估本文揭露的任何給定的多核苷酸對時,該二個經編碼的多肽之間的序列一致性百分比為至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更高的一致性。
於特定實施方式中,目前所揭露的多核苷酸編碼胞嘧啶去胺酶,該胞嘧啶去胺酶包括對SEQ ID NO:2、4及6-12中的任一者的胺基酸序列具有至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或更高的一致性的胺基酸序列。
本發明的胞嘧啶去胺酶的生物活性變異體可相差少至1-15個胺基酸殘基、少至1-10個(例如,6-10個)、少至5個、少至4個、少至3個、少至2個或少至1個胺基酸殘基。於具體實施方式中,多肽包括N端或C端截斷,該截斷可至少包括從多肽的N端或C端缺失5、10、15、20、25、30、35、40、45、50、55、60個或更多個胺基酸。於一些實施方式中,多肽包括內部缺失,該內部缺失可至少包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60個或更多個胺基酸的缺失。
於一些實施方式中,SEQ ID NO:2的生物活性多肽變異體不包括SEQ ID NO:1的胺基酸殘基1-12或195-230。於某些實施方式中,SEQ ID NO:4的生物活性變異體不包括SEQ ID NO:3的胺基酸殘基1-12或198-201。於特定實施方式中,SEQ ID NO:6的生物活性變異體不包括SEQ ID NO:5的胺基酸殘基1-15。於某些實施方式中,去胺酶具有對SEQ ID NO:2具有至少90%序列一致性的胺基酸序列而不包括SEQ ID NO:1的胺基酸殘基1-12或195-230。於一些實施方式中,去胺酶具有對SEQ ID NO:4具有至少95%序列一致性的胺基酸序列而不包括SEQ ID NO:3的胺基酸殘基1-12或198-201。於一些實施方式中,去胺酶具有對SEQ ID NO:6具有至少95%序列一致性的胺基酸序列而不包括SEQ ID NO:5的胺基酸殘基1-15。
應該認識到,可對本文提供的去胺酶進行修飾,從而建立變異體蛋白及多核苷酸。人為設計的變化可經由定點誘變技術的應用而被引入。於一些實施方式中,在結構上及/或功能上與本文揭露的序列有關的天然的、未知的或尚未鑑定的多核苷酸及/或多肽亦可被認為落入本發明的範圍內。可在不改變為胞嘧啶去胺酶的多肽的功能的非保留區域中進行保留式胺基酸取代。於一些實施方式中,可進行改良去胺酶的胞嘧啶去胺酶的活性的修飾。
變異體多核苷酸和蛋白質亦涵蓋源自例如DNA混排(DNA shuffling)的誘變及重組發生(recombinogenic)程序取得的序列及蛋白質。用此種程序,操縱本文揭露的一或多個不同去胺酶(例如,SEQ ID NO:2、4及6-12),以建立具有期望特性的新胞嘧啶去胺酶。以這種方式,重組多核苷酸庫是自包括序列區域的有關序列多核苷酸的族群產生的,該序列區域具有實質的序列一致性且可在體外或體內同源重組。例如,使用這種方法,編碼所關注域的序列模體可在本文提供的去胺酶序列與其他後續辨識的去胺酶基因之間混排,以獲得對具有所關注的改良特性(例如在酵素的情況中,增加的K
m)的蛋白質編碼的新基因。此種DNA混排的策略為本領域已知的。例如,參見Stemmer(1994)
Proc. Natl. Acad. Sci. USA91:10747-10751;Stemmer(1994)
Nature370:389-391;Crameri 等人(1997)
Nature Biotech. 15:436-438;Moore等人(1997)
J. Mol. Biol. 272:336-347;Zhang等人
( 1997 )P
roc. Natl. Acad. Sci. USA94:4504-4509;Crameri等人(1998)
Nature391:288-291;以及第5,605,793號及第5,837,458號美國專利。“經混排的”核酸為藉由混排程序(例如本文闡述的任何混排程序)產生的核酸。經混排的核酸為藉由例如以人工方式及可選地遞迴方式(物理地或虛擬地)重組二或多個核酸(或字符串)而產生的。一般而言,混排過程中使用一或多個篩選步驟來辨識所關注的核酸;這個篩選步驟可在任何重組步驟之前或之後進行。在一些(但不是全部)混排實施方式中,期望在選擇之前進行多輪重組,以增加要篩選的池的多樣性。可選地,重組及選擇的整個過程遞迴地重複。根據上下文,混排可指重組及選擇的整個過程,或者替代地,可僅指該整個過程的重組部分。
如本文在二個多核苷酸或多肽序列的上下文中使用的“序列一致性”或“一致性”是指二個序列中的殘基,當在指定的比較窗上比對已獲得最大對應性時,它們為相同的。當使用序列一致性百分比來表示蛋白質時,應該認識到,不同的殘基位置通常因保留式胺基酸取代而不同,其中胺基酸殘基被具有類似化學性質(例如,電荷或疏水性)的其他胺基酸殘基取代,且因此不改變分子的功能性質。當序列在保留式取代方面不同時,可向上調整序列一致性百分比,以校正取代的保留性質。藉有此種保留式取代而不同的序列被稱為具有“序列相似性”或“相似性”。用於進行這個調整的手段為本領域中具有通常知識者熟知的。通常,這涉及將保留式取代計為部分誤配而非完全誤配,從而增加序列一致性百分比。因此,例如,當相同胺基酸的平分為1,而對非保留式取代的評分為零時,對保留式取代的評分為0與1之間的計分。例如,如在程式PC/GENE(Intelligenetics,Mountain View,California)中所實施的那樣,計算保留式取代的計分。
如本文所使用的“序列一致性百分比”是指藉由在比較窗上比較二個最佳比對的序列所確定的值,其中與兩個序列的最佳比對的參考序列(不包括添加或缺失)相比,比較窗中的多核苷酸序列的部分可包括添加或缺失(亦即,缺口)。藉由確定在二個序列中出現相同核酸鹼基或胺基酸殘基的位置的數目來求得匹配位置的數目;將匹配位置的數目除以比較窗中的位置總數;及將該結果乘以100,求得序列一致性百分比,來計算該百分比。
除非另有說明,否則本文提供的序列一致性/相似性值是指使用利用以下參數的GAP版本10獲得的值:使用GAP權重50及長度權重3以及nwsgapdna.cmp計分矩陣的核苷酸序列的%一致性及%相似性;使用GAP權重8及長度權重2以及BLOSUM62計分矩陣的胺基酸序列的%一致性及%相似性;或其任何等效程式。“等效程式”是指:對於所涉及的任何二個序列,當與GAP版本10產生的對應比對相較時,產生具有一致的核苷酸或胺基酸殘基匹配及一致的序列一致性百分比的比對的任何序列比較程式。
當為了進行相似性計分而使用所界定的胺基酸取代矩陣(例如,BLOSUM62)、缺口存在罰分(gap existence penalty)及缺口延伸罰分(gap extension penalty)比對二個序列而達到那個序列對可能的最高分數時,二個序列被“最佳比對”。胺基酸取代矩陣及其在量化二個序列之間的相似性中的使用是本領域所熟知的,且被描述於例如Dayhoff等人(1978)“A model of evolutionary change in proteins(蛋白質中的演化變遷模型)”中;“Atlas of Protein Sequence and Structure(蛋白質序列及結構圖集)”,卷5, 補充3(M. O. Dayhoff編輯),第345-352頁;Natl. Biomed. Res. Found.,Washington, D.C.;及Henikoff等人(1992)
Proc. Natl. Acad. Sci. USA89:10915-10919中。BLOSUM62矩陣常常被用作序列比對操作流程中的預設計分取代矩陣。缺口存在罰分是針對單胺基酸缺口在其中一個比對序列中的引入而實施的,而缺口延伸罰分是針對被插入已經打開的缺口內的每一個另外的空胺基酸位置而實施的。藉由比對開始和結束的每個序列的胺基酸位置、以及任選地藉由在一個或兩個序列中插入一個或多個間隔來達到最高可能計分來定義比對。儘管可以手動完成最佳比對和計分,但是該過程可藉由使用電腦實施的比對演算法(例如Altschul等人在(1997)
Nucleic Acids Res. 25:3389-3402中所述、並在美國國家生物技術資訊中心網站(www.ncbi.nlm.nih.gov)上向公眾開放的間隔的BLAST 2.0)促進了該流程。可以使用例如經由www.ncbi.nlm.nih.gov可得的和Altschul等人在(1997)
Nucleic Acids Res. 25:3389-3402中描述的PSI-BLAST來準備包括多重比對的最佳比對。
關於與參考序列最佳比對的胺基酸序列,胺基酸殘基“對應於” 在比對中的參考序列中殘基與之配對的位置。該“位置”由數字標示,該數字基於其相對於N端的位置依序辨識參考序列中的每一個胺基酸。由於在確定最佳比對時必須考慮的缺失、插入、截斷、融合等,所以,通常藉由簡單地從N端開始計數即可確定的測試序列中的胺基酸殘基數目,不必與參考序列中其對應位置的數目相同。例如,在所比對的測試序列中存在缺失的情況中,將不存在與的參考序列中缺失位點的位置對應的胺基酸。在所比對的參考序列中有插入的情況下,該插入將不對應於參考序列中的任何胺基酸位置。在截斷或融合的情況中,參考序列或所比對的序列中可存在不對應於對應序列中的任何胺基酸的胺基酸段(stretch)。
VII. 抗體
亦涵蓋針對去胺酶、融合蛋白、或包括本發明的去胺酶的核糖核蛋白(包括具有如SEQ ID NO:2、4及6-12中的任一者所示的胺基酸序列的那些去胺酶、融合蛋白或核糖核蛋白或其活性變異體或片段)的抗體。產生抗體的方法為本領域所熟知的(參見,例如,Harlow及Lane(1988)抗體:實驗室手冊(Antibodies:A Laboratory Manual),冷泉港實驗室,冷泉港,紐約(Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.);及第4,196,265號美國專利)。這些抗體可被用於套組中,以用於去胺酶或融合蛋白或包括本文描述的去胺酶的核糖核蛋白的檢測及分離。因此,本揭露內容提供包括專一性結合至本文描述的多肽或核糖核蛋白的抗體的套組,該多肽或核糖核蛋白包括例如包括對SEQ ID NO:2、4及6-12中的任一者具有至少85%一致性的序列的多肽。
VIII. 用於結合及 / 或修飾所關注的標的序列的系統和核糖核蛋白複合物及其製造方法
本揭露內容提供一種靶向至核酸序列且修飾標的核酸序列的系統。於一些實施方式中,例如RGN的RNA引導的DNA結合多肽及gRNA負責將核糖核蛋白複合物靶向至所關注的核酸序列;融合至RGDBP的去胺酶多肽負責從C>N修飾所靶向的核酸序列。於一些實施方式中,去胺酶轉化C>T。於一些實施方式中,去胺酶轉化C>G。引導RNA與所關注的標的序列雜合、且亦與RNA引導的DNA結合多肽形成複合物,從而將RNA引導的DNA結合多肽導向至與標的序列結合。RNA引導的DNA結合多肽是亦包括本文描述的去胺酶的融合蛋白的部分。於一些實施方式中,RNA引導的DNA結合多肽為RGN,例如,Cas9。RNA引導的DNA結合多肽的其他實例包括RGN,例如,國際專利申請公開號WO 2019/236566及WO 2020/139783描述的那些RGN,這些專利申請案的每一者藉由引用整體地併入。於一些實施方式中,RNA引導的DNA結合多肽為II型CRISPR-Cas多肽或其活性變異體或片段。於一些實施方式中,RNA引導的DNA結合多肽為V型CRISPR-Cas多肽或其活性變異體或片段。於一些實施方式中,RNA引導的DNA結合多肽為VI型CRISPR-Cas多肽。於一些實施方式中,融合蛋白的DNA結合多肽不要求RNA引導,例如,鋅指核酸酶、TALEN或大範圍核酸酶多肽。於一些實施方式中,已部分地或完全地不活化DNA結合多肽的核酸酶活性。於進一步實施方式中,RNA引導的DNA結合多肽包括RGN的胺基酸序列(舉例而言,例如APG07433.1(SEQ ID NO:74))或其活性變異體或片段(例如,切口酶nAPG07433.1(SEQ ID NO:75)或其他切口酶RGN變異體(SEQ ID NO:75及88-98)。
於一些實施方式中,本文提供的用於結合及修飾所關注的標的序列的系統為核糖核蛋白複合物,其為與至少一個蛋白質結合的RNA的至少一個分子。本文提供的核糖核蛋白複合物包括為RNA組成的至少一個引導RNA及包括作為蛋白質組成的本發明的去胺酶和RNA引導的DNA結合多肽的融合蛋白。於一些實施方式中,核糖核蛋白複合物是從已用編碼融合蛋白及引導RNA的多核苷酸轉形且在允許融合蛋白及引導RNA表現的條件下培養的細胞或生物體純化。
提供用於製造去胺酶、融合蛋白或融合蛋白核糖核蛋白複合物的方法。此類方法包括:在去胺酶或融合蛋白(及於一些實施方式中,引導RNA)被表現的條件下,培養包括編碼去胺酶、融合蛋白的核苷酸序列及於一些實施方式中編碼引導RNA的核苷酸序列的細胞。然後,可從所培養的細胞的溶胞產物純化去胺酶、融合蛋白或融合核糖核蛋白。
用於從生物樣本的溶胞產物純化去胺酶、融合蛋白或融合核糖核蛋白複合物的方法為本領域已知的(例如,粒徑篩析及/或親和性層析法、2D-PAGE、HPLC、反相層析法、免疫沉澱法)。於特定方法中,去胺酶或融合蛋白為重組地產生的且包括有助於其純化的純化標籤,其包括但不限於:麩胱甘肽-S-轉移酶(GST)、幾丁質結合蛋白(CBP)、麥芽糖結合蛋白、硫氧化還原蛋白(TRX)、聚(NANP)、串聯親和純化(TAP)標籤、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、生物素羧基載體蛋白(BCCP)及鈣調蛋白。一般而言,所標記的去胺酶、融合蛋白或融合核糖核蛋白複合物是使用免疫沉澱法或本領域已知的其他類似方法純化的。
“分離的”或“純化的”多肽或其生物活性部分實質上或基本上不含在其天然存在的環境中發現的、正常情況下與多肽相伴或交互作用的組成。因此,當藉由重組技術被生產時,分離的或純化的多肽實質上不含其他細胞物質或培養基,或當被化學合成時,實質上不含化學前驅物或其他化學品。實質上不含細胞物質的蛋白質包括具有少於30%、少於20%、少於10%、少於5%或少於1%(以乾重計)的污染蛋白質的蛋白質製劑。當重組地產生本發明的蛋白質或其生物活性部分時,最佳培養基呈現少於30%、少於20%、少於10%、少於5%或少於1%(以乾重計)的化學前驅物或所關注的非蛋白質化學品。
本文所提供的用於結合及/或剪切所關注的標的序列的特定方法涉及體外組裝的核糖核蛋白複合物的用途。核糖核蛋白複合物的體外組裝可使用本領域已知的方法執行,其中在允許RGDBP多肽或包括其的融合蛋白與引導RNA結合的條件下使RGDBP多肽或包括其的融合蛋白與引導RNA接觸。如本文中所使用的“接觸(contact、contacting、contacted)”指在適合進行期望反應的條件下將期望反應的組成放在一起。RGDBP多肽或包括其的融合蛋可從生物樣本、細胞溶胞產物或培養基純化、經由體外轉譯被產生、或被化學合成。引導RNA可從生物樣本、細胞溶胞產物或培養基中純化、在體外被轉譯、或被化學合成。可使RGDBP多肽或包括其的融合蛋白及引導RNA在溶液(例如,緩衝鹽溶液)中接觸以允許核糖核蛋白複合物的體外組裝。
IX. 修飾標的序列的方法
本揭露內容提供用於修飾所關注的標的核酸分子(例如,標的DNA分子)的方法。該方法包括向標的序列或包括標的序列的細胞、胞器或胚胎遞送包括DNA結合多肽及本發明的至少一個去胺酶的融合蛋白或編碼該融合蛋白的多核苷酸。於某些實施方式中,該方法包括向標的序列或包括標的序列的細胞、胞器或胚胎遞送包括至少一個引導RNA或編碼該至少一個引導RNA的多核苷酸、以及包括本發明的至少一個去胺酶及RNA引導的DNA結合多肽的至少一個融合蛋白或編碼該至少一個融合蛋白的多核苷酸的系統。於一些實施方式中,融合蛋白包括SEQ ID NO:2、4及6-12的胺基酸序列中的任一者或其活性變異體或片段。
於一些實施方式中,該些方法包括使DNA分子與:(a)包括去胺酶及RNA引導的DNA結合多肽的融合蛋白,舉例而言,例如,核酸酶不活化的或切口酶RGN;及(b)將(a)的融合蛋白靶向至DNA分子的標的核苷酸序列的gRNA接觸;其中DNA分子以有效量且在適合核鹼基去胺的條件下與融合蛋白及gRNA接觸。於一些實施方式中,標的DNA分子包括與疾病或病症關聯的序列,且其中核鹼基的去胺導致與疾病或病症無關聯的序列。於一些實施方式中,疾病或病症影響動物。於進一步實施方式中,疾病或病症影響哺乳動物,例如,人、牛、馬、狗、貓、山羊、羊、豬、猴、大鼠、小鼠或倉鼠。於一些實施方式中,標的DNA序列駐留於農作物的對偶基因中,其中所關注的性狀的特定對偶基因導致具有較低農藝價值的植物。核鹼基的去胺導致改良性狀並增加植物的農藝價值的對偶基因。
於方法包括遞送編碼引導RNA及/或融合蛋白的多核苷酸的那些實施方式中,細胞或胚胎可接著在引導RNA及/或融合蛋白被表現的條件下被培養。於各種實施方式中,該方法包括使標的序列與包括gRNA及融合蛋白(包括本發明的去胺酶及RNA引導的DNA結合多肽)的核糖核蛋白複合物接觸。於某些實施方式中,該方法包括將本發明的核糖核蛋白複合物引入包括標的序列的細胞、胞器或胚胎內。本發明的核糖核蛋白複合物可為已自生物樣本被純化、重組地產生且隨後純化或如本文所描述的體外組裝的核糖核蛋白複合物。於與標的序列或細胞、胞器或胚胎接觸的核糖核蛋白複合物已經在體外被組裝的那些實施方式中,該方法可進一步包括在與標的序列、細胞、胞器或胚胎接觸之前複合物的體外組裝。
可使用本領域中已知的、包括但不限於電穿孔的任何方法將本發明的經純化的或體外組裝的核糖核蛋白複合物引入細胞、胞器或胚胎內。於一些實施方式中,使用本領域中已知的任何方法(例如,電穿孔)將包括本發明的去胺酶及RNA引導的DNA結合多肽的融合蛋白、以及編碼或包括引導RNA的多核苷酸引入細胞、胞器或胚胎中。
在遞送至標的序列或包括標的序列的細胞、胞器或胚胎、或與標的序列或包括標的序列的細胞、胞器或胚胎接觸時,引導RNA將融合蛋白導向至以序列專一性方式與標的序列結合。標的序列隨後可經由融合蛋白的去胺酶而被修飾。於一些實施方式中,此融合蛋白與標的序列的結合導致與標的序列相鄰的核苷酸的修飾。與標的序列相鄰的、由去胺酶修飾的核苷酸可為自標的序列的5’或3’端的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個鹼基對。包括本發明的去胺酶及RNA引導的DNA結合多肽的融合蛋白可將所靶向的C>N突變引入所靶向的DNA分子中。於一些實施方式中,融合蛋白可將所靶向的C>T突變引入所靶向的DNA分子中。於一些實施方式中,融合蛋白可將所靶向的C>G突變引入所靶向的DNA分子中。
測量融合蛋白與標的序列的結合的方法為本領域已知的,且包括:染色質免疫沉澱測定法、凝膠遷移率移位測定法、DNA下拉測定法、報導子(reporter)測定法、微量盤捕獲及偵測測定法。同樣地,測量標的序列的剪切或修飾的方法為本領域已知的,且包括體外或體內剪切測定法,其中在將或未將適合的標籤(例如,放射性同位素、螢光物質)附接至標的序列以促進降解產物的偵測下,使用PCR、定序或凝膠電泳來確認剪切。於一些實施方式中,使用切口觸發的指數擴增反應(nicking triggered exponential amplification reaction)(NTEXPAR)測定法(參見,例如,Zhang等人(2016)
Chem. Sci.7:4951-4957)。可使用Surveyor測定法來評估體內剪切(Guschin等人(2010)
Methods Mol Biol649:247-256)。
於一些實施方式中,方法涉及與多於一個的引導RNA複合的融合蛋白的部分的RNA結合的DNA引導多肽的使用。多於一個的引導RNA可靶向單基因的不同區域、或可靶向多個基因。這樣多靶向賦能融合蛋白的去胺酶修飾核酸,從而將多個突變引入所關注的標的核酸分子(例如,基因體)中。
於方法涉及例如切口酶RGN(亦即,僅能夠剪切雙股多核苷酸中的單股,例如nAPG07433.1(SEQ ID NO:75或SEQ ID NO:88-98))之類的RNA引導的核酸酶(RGN)的使用的那些實施方式中,該方法可包括引入靶向相同的或重疊的標的序列且剪切多核苷酸的不同股的二個不同RGN或RGN變異體。例如,可將僅剪切雙股多核苷酸的正(+)股的RGN切口酶與僅剪切雙股多核苷酸的負(-)股的第二RGN切口酶一起引入。於一些實施方式中,提供二個不同融合蛋白,其中每一個融合蛋白包括具有不同PAM辨識序列的不同RGN,使得可靶向較大多樣性的核苷酸序列以用於突變。
本領域中具有通常知識者將理解,目前揭露的任一方法可被用於靶向單標的序列或多個標的序列。因此,這些方法包括與可靶向單基因及/或多個基因內的多個相異序列的多個相異的引導RNA組合地使用包括單RNA引導的DNA結合多肽的融合蛋白。然後,融合蛋白的去胺酶將突變引至所靶向的序列的每一者處。本文亦涵蓋與多個相異的RNA引導的DNA結合多肽組合地引入多個相異的引導RNA的方法。此等RNA引導的DNA結合多肽可為多個RGN或RGN變異體。此等引導RNA及引導RNA/融合蛋白系統可靶向單基因及/或多個基因內的多個相異序列。
於一些實施方式中,包括RNA引導的DNA結合多肽及本發明的去胺酶多肽的融合蛋白可被用於在所靶向的基因中或所關注的基因的所靶向的區域中產生突變。於一些實施方式中,本發明的融合蛋白可被用於所靶向的基因的或所關注的所靶向的基因的區域的飽和誘變,隨後是高通量正向遺傳篩選(high-throughput forward genetic screening),以辨識新突變及/或表現型。於一些實施方式中,本文描述的融合蛋白可被用於在所靶向的基因體位置中產生突變,其可包括或可不包括編碼DNA序列。藉由上面描述的所靶向的誘變產生的細胞株的庫亦可有用於研究基因功能或基因表現。
X. 標的多核苷酸
於一個態樣中,本發明提供修飾真核細胞中的標的多核苷酸的方法,其可為在體內、離體地或在體外。於一些實施方式中,該方法包括從人或非人動物或植物(包括微藻類)中取樣細胞或細胞群;及修飾該細胞或該些細胞。培養可以在離體的任何階段發生。甚至可以將該細胞或該些細胞重新引入非人動物或植物(包括微藻類)中。
使用自然變異性,植物育種者結合了大多數有用的基因以獲得例如產量、品質、均勻性、耐寒性以及對害蟲的抗性的可期望品質。這些可期望品質亦包括生長、日長偏好、溫度要求、花或生殖發育的起始日期、脂肪酸含量、抗蟲性、抗病性、線蟲抗性、真菌抗性、除草劑抗性、對各種環境因素(包括乾旱、熱、潮濕、寒冷、風及包括高鹽度的不利土壤條件)的耐受性。這些有用基因的來源包括本地或外來品種、原生種(heirloom variety)、野生植物近源種、及例如以誘變劑處理植物材料的誘導突變。使用本發明,向植物育種者提供誘導突變的新工具。據此,本領域中具有通常知識者可採用本發明以誘導有用基因的增加,同時比先前的誘變劑更精確,且依此加速並改良植物育種計劃。
本發明的去胺酶或融合蛋白的標的多核苷酸可為對真核細胞是內源或外源的任何多核苷酸。例如,標的多核苷酸可為存在於真核細胞的細胞核中的多核苷酸。於一些實施方式中,標的多核苷酸為編碼基因產物(例如,蛋白質)的序列或非編碼序列(例如,調節多核苷酸或垃圾DNA(junk DNA))。於一些實施方式中,本發明的融合蛋白的標的序列與PAM(前間隔序列鄰近模體)關聯;也就是說,RNA引導的DNA結合多肽辨識的短序列。PAM的精確序列和長度要求隨所使用的RNA引導的DNA結合多肽而不同,但PAM通常是與前間隔序列(也就是說,標的序列)相鄰的2-5個鹼基對序列。
本發明的融合蛋白的標的多核苷酸可包括許多與疾病關聯的基因及多核苷酸以及與傳訊生化路徑關聯的基因及多核苷酸。標的多核苷酸的實例包括與傳訊生化路徑關聯的序列,例如,與傳訊生化路徑關聯的基因或多核苷酸。標的多核苷酸的實例包括與疾病關聯的基因或多核苷酸。“與疾病關聯的”基因或多核苷酸指與非疾病控制組的組織或細胞相較下,在從患病組織取得的細胞中以異常水準或以異常形式產生轉錄或轉譯產物的任何基因或多核苷酸。其可為一種變得以異常高水準表現的基因;其可為一種變得以異常低水準表現的基因,其中改變的表現與疾病的發生及/或進展相關。與疾病關聯的基因亦指是疾病病因的直接原因或與引起疾病病因的基因具有連鎖不平衡(例如因果突變)的突變或遺傳變異的基因。轉錄或轉譯產物可為已知的或未知的,且可進一步處於正常或異常水準。
使用目前揭露的方法及組成物可靶向的疾病關聯基因的非限制性實例被提供於表23中。於一些實施方式中,所靶向的疾病關聯基因為表23揭露的具有T>C或G>C突變的那些基因。與疾病關聯的基因及多核苷酸的其他實例可從全球資訊網上找到的約翰•霍普金斯大學(馬里蘭州巴爾的摩)麥考斯克–納森斯遺傳醫學研究所(McKusick-Nathans Institute of Genetic Medicine)和美國國家醫學圖書館(馬里蘭州貝塞斯達)(National Library of Medicine(Bethesda, Md.))國家生物技術資訊中心(National Center for Biotechnology Information)找到。
於一些實施方式中,該些方法包括使包括標的DNA序列的DNA分子與本發明的DNA結合多肽去胺酶融合蛋白接觸,其中DNA分子以有效量且在適合核鹼基去胺的條件下與融合蛋白接觸。於某些實施方式中,該些方法包括使包括標的DNA序列的DNA分子與:(a)本發明的RGN去胺酶融合蛋白;及(b)將(a)的融合蛋白靶向至DNA股的標的核苷酸序列的gRNA接觸;其中DNA分子以有效量且在適合核鹼基去胺的條件下與融合蛋白和gRNA接觸。於一些實施方式中,標的DNA序列包括與疾病或病症關聯的序列,且其中核鹼基的去胺導致與疾病或病症無關聯的序列。於一些實施方式中,標的DNA序列存在於農作物的對偶基因中,其中所關注的性狀的特定對偶基因導致較低農藝價值的植物。核鹼基的去胺導致改良性狀並增加植物的農藝價值的對偶基因。
於一些實施方式中,標的DNA序列包括與疾病或病症關聯的T>C或G>C點突變,且其中突變體C鹼基的去胺導致與疾病或病症無關聯的序列。於一些實施方式中,去胺崩更正了與疾病或病症關聯的序列中的點突變。
於一些實施方式中,與疾病或病症關聯的序列編碼蛋白質,且去胺將終止密碼子(stop codon)引入與疾病或病症關聯的序列中,導致經編碼的蛋白質的截斷。於一些實施方式中,接觸是在易患有、患有或診斷患有疾病或病症的個體體內進行。於一些實施方式中,疾病或病症為與基因體中的點突變或單鹼基突變關聯的疾病。於一些實施方式中,疾病為基因疾病、癌症、代謝疾病或溶體儲積症。
XI. 醫藥組成物及治療方法
本文提供為需要治療的個體治療疾病的方法。該方法包括對需要治療的個體投予有效量的目前揭露的融合蛋白或編碼該融合蛋白的多核苷酸、目前揭露的gRNA或編碼該gRNA的多核苷酸、目前揭露的融合蛋白系統、或由這些組成物中的任一者修飾的或包括這些組成物中的任一者的細胞。
於一些實施方式中,治療包括藉由對需要治療的個體投予目前揭露的融合蛋白、gRNA、或目前揭露的融合蛋白系統、或編碼該融合蛋白、gRNA、或目前揭露的融合蛋白系統的(多個)多核苷酸的體內基因編輯。於一些實施方式中,治療包括其中細胞被用目前揭露的融合蛋白、gRNA、或目前揭露的融合蛋白系統或編碼該融合蛋白、gRNA、或目前揭露的融合蛋白系統的(多個)多核苷酸進行體外基因修飾的體外基因編輯、以及接著將經修飾的細胞投予個體。於一些實施方式中,經基因修飾的細胞源自接著被投予經修飾的細胞的個體,並且所移植的細胞在本文中被稱為自體的。於一些實施方式中,經基因修飾的細胞源自與被投予經修飾的細胞的個體(亦即,受體)屬相同物種的不同個體(亦即,供體),並且所移植的細胞在本文中被稱為異體的。於本文描述的一些實例中,細胞在對需要治療的個體投予之前可先於培養中被擴大。
於一些實施方式中,要用目前揭露的組成物治療的疾病為可用免疫療法(例如,用嵌合抗原受體(CAR)T細胞)治療的疾病。此等疾病包括但不限於癌症。
於一些實施方式中,標的核鹼基的去胺導致基因缺陷的更正或導致引起基因產物功能喪失的點突變的更正。於一些實施方式中,基因缺陷與疾病或病症(例如,溶體儲積症症或代謝疾病(舉例而言,例如I型糖尿病))關聯。因此,於一些實施方式中,要用目前揭露的組成物治療的疾病與被突變的序列(亦即,該序列為對於疾病或病症是因果的或為對於與疾病或病症關聯的症狀是因果的)關聯,以便治療疾病或病症、或與疾病或病症關聯的症狀的降低。
於一些實施方式中,要用目前揭露的組成物治療的疾病與因果突變關聯。如本文使用的「因果突變」指對個體中疾病或病症的嚴重程度或出現有貢獻的基因體中的特定核苷酸、多個核苷酸或核苷酸序列。因果突變的更正導致由疾病或病症引起的至少一個症狀改良。於一些實施方式中,因果突變的更正引致由疾病或病症導致的至少一個症狀改良。於一些實施方式中,因果突變與本文揭露的去胺酶融合的RGDBP(例如,RGN)所辨識的PAM位點相鄰。因果突變可用包括RGDBP(例如,RGN)及目前揭露的去胺酶的融合多肽來更正。與因果突變關聯的疾病的非限制性實例包括:囊腫纖維化、尼曼-匹克二氏病、剪接位點破裂引起的疾病、及列於表23中的疾病。疾病關聯基因及突變的另外的非限制性實例可從在全球資訊網上取得的約翰•霍普金斯大學(麻省巴爾的摩)麥考斯克–納森斯遺傳醫學研究所(McKusick-Nathans Institute of Genetic Medicine, Johns Hopkins University(Baltimore, Md.))和美國國家醫學圖書館(麻省貝塞斯達)的國家生物技術資訊中心(National Center for Biotechnology Information, National Library of Medicine(Bethesda, Md.))取得。
於一些實施方式中,本文提供的方法被用於將去活化點突變引入對與疾病或病症關聯的基因產物進行編碼的基因或對偶基因中。例如,於一些實施方式中,本文提供採用融合蛋白將去活化點突變引入致癌基因(例如,在增生性疾病的治療中)中的方法。於一些實施方式中,去活化突變可在編碼序列中產生過早終止密碼子,這導致經截斷的基因產物(例如,缺少全長蛋白的功能的經截斷的蛋白)的表現。於一些實施方式中,本文提供的方法的目的為經由基因體編輯來恢復功能不良性基因的功能。本文提供的融合蛋白可對例如藉由在人細胞培養中更正疾病關聯突變的體外基於基因編輯的人療法有效。本領域中具有通常知識者應該明白,本文提供的融合蛋白(例如,包括RNA引導的DNA結合多肽及去胺酶多肽的融合蛋白)可被用於更正任何單點T>C或G>C突變。突變體C至T或G的去胺導致突變的更正。
如本文中使用的“治療(treatment)”或“治療(treating)”、或“緩和”或“改善”可被互換地使用。此等術語指用於獲得有益或期望結果的方法,該有益結果或期望結果包括但不限於治療性益處及/或預防性益處。藉由治療性益處意味著對治療中的一或多個疾病、病況或症狀之中的任何治療相關改良或對治療中的一或多個疾病、病況或症狀之上的效益。對於預防性益處,該組成物可被投予處於特定疾病、病症或症狀的發展風險中的個體、或被投予報告疾病的一或多個生理症狀的個體,即使該疾病、病症或症狀可能尚未呈現徵兆。
術語“有效量”或“治療有效量”指足以實現有益或期望結果的藥劑量。治療有效量可取決於如下的一或多者而變化:被治療的個體及疾病病症、個體的重量及年齡、疾病病症的嚴重性、投予方式及類似者,本領域中具有通常知識者可容易地對此做出確定。特定劑量可取決於如下一或多者而變化:所選的特定藥劑、將要遵循的給藥方案、是否與其他化合物組合地投予、投予時機、及輸送其的遞送系統。
術語“投予”指藉由導致所引入的活性成分至少部分地定位於期望位點(例如,受傷或修復的位點)處的方法或途徑,將活性成分置於個體內,使得產生(多個)期望效果。於細胞被投予的那些實施方式中,可藉由導致遞送至個體中的期望位置的任何適當途徑投予細胞,其中至少一部分所移植細胞或該細胞的組成維持存活。投予個體後,細胞的存活期可短至幾小時(例如,二十四小時)、至幾天、至長至若干年、甚或患者的生命期,亦即,長期植入。例如,於本文描述的一些態樣中,有效量的光受體細胞或視網膜前驅細胞是經由系統性的投予途徑(例如腹膜內或靜脈內途徑)投予。
於一些實施方式中,投予包括藉由病毒遞送的投予。於一些實施方式中,投予包括藉由電穿孔的投予。於一些實施方式中,投予包括藉由奈米粒子遞送的投予。於一些實施方式中,投予包括藉由脂質體遞送的投予。投予的任何有效途徑均可被用於投予本文描述的藥學組合物的有效量。於一些實施方式中,投予包括藉由從以下者組成的群組選出的方法的投予:靜脈內地、皮下地、肌肉內地、口服地、經直腸地、藉由氣溶膠、非經口地、經眼地、經肺地、經皮地、經陰道地、經耳地、經鼻地、及藉由外部投予、或其任意組合。於一些實施方式中,對於細胞的遞送,使用藉由注射或灌注的投予。
如本文中使用的,術語“個體”指期望對其進行診斷、治療或治療的任何個體。於一些實施方式中,個體為動物。於一些實施方式中,個體為哺乳動物。於一些實施方式中,個體為人類。
治療效能可由熟練的臨床醫師決定。然而,如果疾病或病症的徵象或症狀中的任何一者或全部是以有益方式被改變(例如,減少至少10%)、或其他臨床上接受的疾病的症狀或標記被改良或改善,則治療被認為“有效治療”。亦可藉由個體未發生由住院確定的惡化、或不需要醫藥介入(例如,疾病的進展被終止或至少被減慢)來測量功效。測量這些指標的方法為本領域中具有通常知識者已知的。治療包括:(1)抑制疾病,例如,遏止或減慢症狀的進展;或(2)減緩疾病,例如,引起症狀消退;及(3)預防或降低症狀發展的可能性。
提供了醫藥組成物,該醫藥組成物包括:目前揭露的RGN多肽或編碼該RGN多肽的多核苷酸、目前揭露的gRNA或編碼該gRNA的多核苷酸、目前揭露的去胺酶或編碼該去胺酶的多核苷酸、目前揭露的融合蛋白、目前揭露的系統(例如,包括融合蛋白的那些系統)、或包括RGN多肽或RGN編碼多核苷酸、gRNA或gRNA編碼多核苷酸、融合蛋白編碼多核苷酸、或該系統中的任一者的細胞及藥學上可接受的載體。
如本文使用的「藥學上可接受的載體」指對生物體不會引起顯著刺激且不消除活性成分(例如,去胺酶或融合蛋白或編碼該去胺酶或融合蛋白的核酸分子)的活性及特性的材料。載體必須具有足夠高的純度及足夠低的毒性,以使彼等適合投予正被治療的個體。載體可為惰性的,或可擁有醫藥功效。於一些實施方式中,藥學上可接受的載體包括適合對人或其他脊椎動物投予的一或多個相容固體或液體填充劑、稀釋劑或封裝物質。於一些實施方式中,醫藥組成物包括不為天然存在的藥學上可接受的載體。於一些實施方式中,未發現該藥學上可接受的載體在本質上與該活性成分在一起且因此它們為異源的。
目前揭露的方法中使用的醫藥組成物可由提供適合轉移、遞送、耐受性及類似者的合適載體、賦形劑、及其他藥劑調配。眾多恰當調配物為本領域中通常知識者已知的。參見,例如,Remington,The Science and Practice of Pharmacy (21st ed. 2005)。非限制性實例包括:無菌稀釋劑,例如,注射用水、食鹽水溶液、不揮發性油、聚乙二醇、甘油、丙二醇或其他合成溶劑);抗菌劑,例如,苯甲醇或對羥苯甲酸甲酯;抗氧化劑,例如,抗壞血酸或亞硫酸氫鈉;螯合劑,例如,乙二胺四乙酸;緩衝液,例如,醋酸鹽、檸檬酸鹽或磷酸鹽;以及用於滲壓性調節的藥劑,例如,氯化鈉或葡萄糖。靜脈內地投予的特定載體為生理食鹽水或磷酸鹽緩衝鹽水(PBS)。經口或非口服使用的醫藥組成物可被製備為適合供給某個劑量的活性成分的單位劑量的劑型。此類單位劑量的劑型例如包括錠劑、丸劑、膠囊、注射劑(安瓿)、栓劑等。這些組成物亦可含有包括保存劑、潤濕劑、乳化劑、及分散劑的佐劑。藉由各種抗菌劑及抗真菌劑(例如,對羥苯甲酸酯、氯丁醇、酚、山梨酸、及類似者)可確保防止微生物的作用。亦可期望包括等滲劑,例如,糖、氯化鈉及類似物。藉由使用延遲吸收的藥劑(例如,單硬脂酸鋁(aluminum monostearate)及明膠)可引起可注射藥品劑型的延長吸收。
於包括或以目前揭露的RGN、gRNA、去胺酶、融合蛋白、系統(包含包括融合蛋白的那些)或編碼該RGN、gRNA、去胺酶、融合蛋白、系統的多核苷酸的細胞被投予個體的一些實施方式中,該細胞與藥學上可接受的載體一起作為懸浮劑被投予。本領域中具有通常知識者將認識到將被用於細胞組成物中的藥學上可接受的載體將不包括實質上干擾將被遞送至個體的細胞的存活率的量的緩衝液、化合物、冷凍保存藥劑、保存劑或其他藥劑。包括細胞的調配物可包括例如允許細胞膜保持完整性的滲透壓緩衝液、以及可選地在投予時保持細胞存活率或增強植入的營養劑。此類調配物及懸浮劑為本領域中具有通常知識者已知的、及/或可使用例行實驗被調適成與本文描述的細胞一起使用。
細胞組成物亦可被乳化為或呈現為脂質體組成物,前提條件為乳化程序不會不利地影響細胞存活率。細胞及任何其他活性成分可以與藥學上可接受且與活性成分相容的賦形劑、且以適合在本文描述的治療方法中使用的量混合。
於細胞組成物中包括的額外藥劑可包括其內的組成的藥學上可接受的鹽。藥學上可接受的鹽包括與舉例而言例如鹽酸或磷酸之類的無機酸、或與例如醋酸、酒石酸、苯乙醇酸及類似者的有機酸形成的酸加成鹽(與多肽的自由胺基基團形成)。與自由羧基基團形成的鹽亦可衍生自舉例而言例如鈉、鉀、銨、鈣或鐵的氫氧化物之類的無機鹼、及例如異丙胺、三甲胺、2-乙胺乙醇、組胺酸、普魯卡因及類似者的有機鹼。
使用鹼基編輯修飾因果突變
使用依賴於本發明的RGN去胺酶融合蛋白的方法可更正的基因遺傳性疾病的實例是C型尼曼-匹克二氏病。尼曼-匹克二氏病(NPC)為由NPC1或NPC2基因(NPC1基因的序列如SEQ ID NO:121所示)中的突變引起的體染色體隱性溶素體儲積症(autosomal recessive lysosomal storage disorder),其導致膽固醇和醣神經鞘脂質(GSL)的異常累積。有NPC的患者通常情況下在4與7歲之間逐漸出現症狀。主要症狀包括肝及肺病、低張症、吞嚥困難、精神運動性發育延遲、小腦性失調症、進行性認知障礙、失智、及其他神經功能不良。與幼年神經疾病肇始關聯的常見變異體為外顯子21中的NM_000271.5(NPC1):c.3182T>C (p.Ile1061Thr),其是用胞嘧啶鹼基編輯可更正的。本發明亦揭露將本發明的融合蛋白引導至靶向各種疾病的因果突變的潛在標的序列,包括已知引起C型尼曼-匹克二氏病的外顯子21中的NM_000271.5(NPC1):c.3182T>C (p.I1061T)突變。
XII. 包括多核苷酸基因修飾的細胞
本文提供了包括已使用由如本文描述的融合蛋白(可選地用gRNA)介導的過程修飾的所關注的標的核酸分子的細胞及生物體。於一些實施方式中,融合蛋白包括去胺酶多肽、或其活性變異體或片段,去胺酶多肽包括SEQ ID NO:2、4及6-12中的任一者的胺基酸序列。於一些實施方式中,融合蛋白包括胞嘧啶去胺酶,該胞嘧啶去胺酶包括對SEQ ID NO:2、4及6-12中的任一者具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%一致性的胺基酸序列。於一些實施方式中,融合蛋白包括去胺酶及DNA結合多肽(例如,RNA引導的DNA結合多肽)。於進一步實施方式中,融合蛋白包括去胺酶及RGN或其變異體,舉例而言,例如APG07433.1(SEQ ID NO:74)或其切口酶變異體nAPG07433.1(SEQ ID NO:75)。於一些實施方式中,融合蛋白包括去胺酶及Cas9或其變異體,舉例而言,例如dCas9或切口酶Cas9。於一些實施方式中,融合蛋白包括II型CRISPR-Cas多肽的核酸酶不活化的或切口酶變異體。於一些實施方式中,融合蛋白包括V型CRISPR-Cas多肽的核酸酶不活化的或切口酶變異體。於一些實施方式中,融合蛋白包括VI型CRISPR-Cas多肽的核酸酶不活化的或切口酶變異體。
經修飾的細胞可為真核的(例如,哺乳動物、植物、昆蟲、禽類細胞)或原核的。亦提供包括至少一個核苷酸序列的胞器及胚胎,該核苷酸序列已藉由運用如本文描述的融合蛋白的過程被修飾。經基因修飾的細胞、生物體、胞器及胚胎對於經修飾的核苷酸序列可為異型接合的或同型接合的。藉由融合蛋白的去胺酶域引入的(多個)突變可導致改變的蛋白質產物或整合的序列的表現、或改變的表現(向上調節或向下調節)、不活化。於(多個)突變導致基因不活化或非功能性蛋白質產物表現的那些範例中,經基因修飾的細胞、生物體、胞器或胚胎被稱為“剔除(knock out)”。該剔除表現型可為缺失突變(亦即,至少一個核苷酸的缺失)、插入突變(亦即,至少一個核苷酸的插入)、或無意義突變(亦即,至少一個核苷酸的取代,使得終止密碼子被引入)的結果。
於一些實施方式中,藉由融合蛋白的去胺酶引入的(多個)突變導致變異體蛋白質產物的產生。所表現的變異體蛋白質產物可具有至少一個胺基酸取代及/或至少一個胺基酸的添加或缺失。當與野生型蛋白質相較時,變異體蛋白質產物可呈現出經修飾的特徵或活性,包括但不限於改變的酶活性或受質專一性。
於一些實施方式中,藉由融合蛋白的去胺酶引入的(多個)突變導致改變的蛋白質表現模式。作為非限制性實例,控制蛋白質產物表現的調節區域中的(多個)突變可導致蛋白質產物過度表現或向下調節或改變的組織或時間表現模式。
已經被修飾的細胞可按照傳統方式生長成生物體,例如,植物。參見,例如,McCormick等人(1986)
Plant Cell Reports5:81-84。然後,可使這些植物生長,且用相同修飾品系或不同品系授粉,且所得雜交種具有基因修飾。本發明提供基因修飾種子。再生植物的子代、變異體及突變體亦包括於本發明的範圍內,前提條件是這些部分包括基因修飾。進一步提供了保持了基因修飾的經加工的植物產物或副產物,例如包括豆粕。
本文提供的方法可被用於任何植物物種的修飾,包括但不限於單子葉植物及雙子葉植物。所關注的植物的實例包括但不限於:玉蜀黍(玉米)、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥、及油菜、蕓苔屬物種、苜蓿、黑麥、小米、紅花、花生、甘藷、木薯、咖啡、椰子、鳳梨、柑橘樹、可可、茶、香蕉、鱷梨、無花果、番石榴、芒果、橄欖、木瓜、腰果、澳洲胡桃、杏仁、燕麥、蔬菜、觀賞植物以及針葉樹。
蔬菜包括但不限於:番茄、萵苣、綠豆、皇帝豆、豌豆、及例如胡瓜、網紋甜瓜及洋香瓜的黃瓜屬的成員。觀賞植物包括但不限於:杜鵑花、繡球花、芙蓉、玫瑰、鬱金香、水仙、矮牽牛、康乃馨、猩猩木及菊花。較佳地,本發明的植物為農作物(例如,玉米、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、水稻、大豆、甜菜、甘蔗、煙草、大麥、油菜等)。
本文提供的方法亦可被用於基因修飾任何原核物種,包括但不限於:古生菌及細菌(例如,
芽孢桿菌屬、克雷伯氏菌屬、鏈黴菌屬、根瘤菌屬、埃希氏菌屬、假單胞菌屬、沙門氏菌屬、志賀氏桿菌屬、弧菌屬、耶爾森菌屬、支原體菌屬、農桿菌屬、乳酸乳桿菌屬)。
本文提供的方法可被用於基因修飾任何真核物種或來自於其的細胞,包括但不限於:動物(例如,哺乳動物、昆蟲、魚類、鳥類、及爬蟲類物)、真菌、變形蟲、藻類、及酵母。於一些實施方式中,目前揭露的方法修飾的細胞包括造血源的細胞,例如,免疫細胞(亦即,先天性或適應性免疫系統的細胞),包括但不限於:B細胞、T細胞、自然殺手(NK)細胞、富潛能幹細胞、經誘導的富潛能幹細胞、嵌合抗原受體T(CAR-T)細胞、單核細胞、巨噬細胞、及樹突細胞。
已經修飾的細胞可被引入生物體內。在自體細胞移植的情況中,這些細胞可源自相同生物體(例如,人),其中該細胞以離體方法被修飾。於一些實施方式中,在異體細胞移植的情況中,該細胞源自相同物種中的另一個生物體(例如,另一個人)。
XIII. 套組
此揭露的一些態樣提供包括本發明的去胺酶的套組。於某些實施方式中,本揭露內容提供包括融合蛋白的套組,該融合蛋白包括本發明的去胺酶及DNA結合多肽(例如,RNA引導的DNA結合多肽,例如,RGN多肽,例如,核酸酶不活化的或切口酶RGN)以及可選地在DNA結合多肽域與去胺酶之間的連結子。此外,於一些實施方式中,套組包括適合的試劑、緩衝液、及/或使用融合蛋白例如在體外或體內進行DNA或RNA編輯的說明。於一些實施方式中,套組包括關於用於核苷酸序列靶向編輯的適合的gRNA的設計及使用的說明。
冠詞“一(a)”及“一(an)”在本文中用於指冠詞的一或多於一個(亦即,至少一個)的語法對象。作為實例,“一多肽”表達一或多個多肽。
說明書中提及的所有出版物及專利申請案暗示本揭露內容所屬領域中具有通常知識者的層次。所有出版物及專利申請案藉由引用被併入本文,如同每一個單獨出版物或專利申請案被具體且單獨地指示藉由引用而被併入本文。
雖然為了清楚理解的目的已經作為示例及實例頗詳細地描述了前述發明,但顯然可在所附申請專利範圍的範圍內實踐某些改變及修改。
非限制性實施方式包括:
1. 一種多肽,包括從由以下者組成的群組選出的胺基酸序列:
a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及
b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列;
其中該多肽具有去胺酶活性。
2.一種分離的多肽,包括從由以下者組成的群組選出的胺基酸序列:
a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;及
b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列;
其中該多肽具有去胺酶活性。
3. 如實施方式1或2的多肽,包括對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。
4. 如實施方式1或2的多肽,包括對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性的胺基酸序列。
5.一種核酸分子,包括編碼去胺酶多肽的多核苷酸,其中該去胺酶由從由以下者組成的群組選出的核苷酸序列編碼:
a)對SEQ ID NO:114-119中的任一者具有至少80%序列一致性的核苷酸序列;
b)對SEQ ID NO:109、111及113中的任一者具有至少95%序列一致性的核苷酸序列;
c)編碼對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列的核苷酸序列;以及
d)編碼對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列的核苷酸序列。
6.一種分離的核酸分子,包括編碼去胺酶多肽的多核苷酸,其中該去胺酶由從由以下者組成的群組選出的核苷酸序列編碼:
a)對SEQ ID NO:114-119中的任一者具有至少80%序列一致性的核苷酸序列;
b)對SEQ ID NO:109、111及113中的任一者具有至少95%序列一致性的核苷酸序列;
c)編碼對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列的核苷酸序列;以及
d)編碼對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列的核苷酸序列。
7. 如實施方式5或6的核酸分子,其中該去胺酶由對SEQ ID NO:114-119中的任一者具有至少90%序列一致性的核苷酸序列編碼。
8. 如實施方式5或6的核酸分子,其中該去胺酶由對SEQ ID NO:114-119中的任一者具有至少95%序列一致性的核苷酸序列編碼。
9. 如實施方式5或6的核酸分子,其中該去胺酶由對SEQ ID NO:109、111及113-119中的任一者具有100%序列一致性的核苷酸序列編碼。
10. 如實施方式5或6的核酸分子,其中該去胺酶多肽具有對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。
11. 如實施方式5或6的核酸分子,其中該去胺酶多肽具有對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性的胺基酸序列。
12. 如實施方式5-11中任一實施方式的核酸分子,其中該核酸分子進一步包括可操作地連結至該多核苷酸的異源啟動子。
13.一種載體,包括實施方式5-11中任一實施方式的該核酸分子。
14.一種細胞,包括實施方式5-12中任一實施方式的該核酸分子或實施方式13的該載體。
15. 如實施方式14的細胞,其中該細胞為原核細胞。
16. 如實施方式14的細胞,其中該細胞為真核細胞。
17. 如實施方式16的細胞,其中該真核細胞為哺乳動物細胞。
18. 如實施方式17的細胞,其中該哺乳動物細胞為人細胞。
19. 如實施方式18的細胞,其中該人細胞為免疫細胞。
20. 如實施方式19的細胞,其中該免疫細胞為幹細胞。
21. 如實施方式20的細胞,其中該幹細胞為經誘導的富潛能幹細胞。
22. 如實施方式16的細胞,其中該真核細胞為昆蟲或禽類細胞。
23. 如實施方式16的細胞,其中真核細胞為真菌細胞。
24. 如實施方式16的細胞,其中該真核細胞為植物細胞。
25. 一種植物,包括實施方式24的細胞。
26.一種種子,包括實施方式24的細胞。
27.一種醫藥組成物,包括藥學上可接受的載體及實施方式1-4中任一實施方式的多肽、實施方式5-12中任一實施方式的核酸分子、實施方式13的載體或實施方式14-24中任一實施方式的細胞。
28. 如實施方式27的醫藥組成物,其中該藥學上可接受的載體與該多肽或該核酸分子異源。
29. 如實施方式27或28的醫藥組成物,其中該藥學上可接受的載體不是天然存在的。
30.一種用於製造去胺酶的方法,該方法包括:在去胺酶被表現的條件下,培養實施方式14-24中任一實施方式的細胞。
31.一種用於製造去胺酶的方法,該方法包括將實施方式5-12中任一實施方式的核酸分子或實施方式13的載體引入細胞中及在去胺酶被表現的條件下培養細胞。
32. 如實施方式30或31的方法,進一步包括純化該去胺酶。
33.一種融合蛋白,包括DNA結合多肽及具有從由以下者組成的群組選出的胺基酸序列的去胺酶:
a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;以及
b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
34. 如實施方式33的融合蛋白,其中該去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。
35. 如實施方式33的融合蛋白,其中該去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
36. 如實施方式33-35中任一實施方式的融合蛋白,其中該去胺酶為胞嘧啶去胺酶。
37. 如實施方式33-36中任一實施方式的融合蛋白,其中該DNA結合多肽為大範圍核酸酶、鋅指融合蛋白或TALEN;或大範圍核酸酶、鋅指融合蛋白或TALEN的變異體,其中核酸酶活性已被降低或抑制。
38. 如實施方式33-36中任一實施方式的融合蛋白,其中該DNA結合多肽為RNA引導的DNA結合多肽。
39. 如實施方式38的融合蛋白,其中該RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)多肽。
40. 如實施方式39的融合蛋白,其中該RGN為II型CRISPR-Cas多肽。
41. 如實施方式39的融合蛋白,其中該RGN為V型CRISPR-Cas多肽。
42. 如實施方式39-41中任一實施方式的融合蛋白,其中該RGN為RGN切口酶。
43. 如實施方式42的融合蛋白,其中該RGN切口酶具有不活化的RuvC域。
44. 如實施方式39-41中任一實施方式的融合蛋白,其中該RGN為核酸酶不活化的RGN。
45. 如實施方式39的融合蛋白,其中該RGN具有對表1中的RGN序列中的任一者具有至少90%序列一致性的胺基酸序列。
46. 如實施方式39的融合蛋白,其中該RGN具有對表1中的RGN序列中的任一者具有至少95%序列一致性的胺基酸序列。
47. 如實施方式39的融合蛋白,其中該RGN具有表1中的RGN序列中的任一者的胺基酸序列。
48. 如實施方式39的融合蛋白,其中該RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的胺基酸序列。
49. 如實施方式39的融合蛋白,其中該RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少95%序列一致性的胺基酸序列。
50. 如實施方式39的融合蛋白,其中該RGN具有SEQ ID NO:74、82、87、106及107中的任一者的胺基酸序列。
51. 如實施方式42的融合蛋白,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的胺基酸序列。
52. 如實施方式42的融合蛋白,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少95%序列一致性的胺基酸序列。
53. 如實施方式42的融合蛋白,其中該RGN切口酶具有SEQ ID NO:75及88-98中的任一者的胺基酸序列。
54. 如實施方式33-53中任一實施方式的融合蛋白,其中該融合蛋白進一步包括至少一個核定位訊號(NLS)。
55. 如實施方式33-54中任一實施方式的融合蛋白,其中該去胺酶與DNA結合多肽的胺基端融合。
56. 如實施方式33-54中任一實施方式的融合蛋白,其中該去胺酶與DNA結合多肽的羧基端融合。
57. 如實施方式33-56中任一實施方式的融合蛋白,其中該融合蛋白進一步包括在該DNA結合多肽與該去胺酶之間的連結子序列。
58. 如實施方式57的融合蛋白,其中該連結子序列具有如SEQ ID NO:78或79所示的胺基酸序列。
59. 如實施方式33-58中任一實施方式的融合蛋白,其中該融合蛋白進一步包括尿嘧啶穩定蛋白(USP)。
60. 如實施方式59的融合蛋白,其中該USP具有如SEQ ID NO:81所示的序列。
61. 如實施方式59或60的融合蛋白,其中該融合蛋白進一步包括在該USP與該去胺酶或該DNA結合多肽之間的連結子序列。
62. 如實施方式61的融合蛋白,其中在該USP與該去胺酶或該DNA結合多肽之間的該連結子序列具有如SEQ ID NO:120所示的胺基酸序列。
63. 如實施方式33的融合蛋白,其中該融合蛋白具有SEQ ID NO:67、68、146及147中的任一者的胺基酸序列。
64. 一種核酸分子,包括編碼融合蛋白的多核苷酸,該融合蛋白包括DNA結合多肽及去胺酶,其中去胺酶由從由以下者組成的群組選出的核苷酸序列編碼:
a)對SEQ ID NO:114-119中的任一者具有至少80%序列一致性的核苷酸序列;
b)對SEQ ID NO:109、111及113中的任一者具有至少95%序列一致性的核苷酸序列;
c)編碼對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列的核苷酸序列;以及
d)編碼對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列的核苷酸序列。
65. 如實施方式64的核酸分子,其中該去胺酶由對SEQ ID NO:114-119中的任一者具有至少90%序列一致性的核苷酸序列編碼。
66. 如實施方式64的核酸分子,其中該去胺酶由對SEQ ID NO:114-119中的任一者具有至少95%序列一致性的核苷酸序列編碼。
67. 如實施方式64的核酸分子,其中該去胺酶核苷酸序列對SEQ ID NO:109、111及113-119中的任一者具有100%序列一致性。
68. 如實施方式64的核酸分子,其中該去胺酶核苷酸序列編碼對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。
69. 如實施方式64的核酸分子,其中該去胺酶核苷酸序列編碼對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性的胺基酸序列。
70. 如實施方式64-69中任一實施方式的核酸分子,其中該去胺酶為胞嘧啶去胺酶。
71. 如實施方式64-70中任一實施方式的核酸分子,其中該DNA結合多肽為大範圍核酸酶、鋅指融合蛋白或TALEN;或大範圍核酸酶、鋅指融合蛋白或TALEN的變異體,其中該核酸酶活性已被降低或抑制。
72. 如實施方式64-70中任一實施方式的核酸分子,其中該DNA結合多肽為RNA引導的DNA結合多肽。
73. 如實施方式72的核酸分子,其中該RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)多肽。
74. 如實施方式73的核酸分子,其中該RGN為II型CRISPR-Cas多肽。
75. 如實施方式73的核酸分子,其中該RGN為V型CRISPR-Cas多肽。
76. 如實施方式73-75中任一實施方式的核酸分子,其中該RGN為RGN切口酶。
77. 如實施方式76的核酸分子,其中該RGN切口酶具有不活化的RuvC域。
78. 如實施方式73-77中任一實施方式的核酸分子,其中該RGN為核酸酶不活化的RGN。
79. 如實施方式73的核酸分子,其中該RGN具有對表1中的RGN序列中的任一者具有至少90%序列一致性的胺基酸序列。
80. 如實施方式73的核酸分子,其中該RGN具有對表1中的RGN序列中的任一者具有至少95%序列一致性的胺基酸序列。
81. 如實施方式73的核酸分子,其中該RGN具有表1中的RGN序列中的任一者的胺基酸序列。
82. 如實施方式73的核酸分子,其中該RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的胺基酸序列。
83. 如實施方式73的核酸分子,其中該RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少95%序列一致性的胺基酸序列。
84. 如實施方式73的核酸分子,其中該RGN具有SEQ ID NO:74、82、87、106及107中的任一者的胺基酸序列。
85. 如實施方式76的核酸分子,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的胺基酸序列。
86. 如實施方式76的核酸分子,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少95%序列一致性的胺基酸序列。
87. 如實施方式76的核酸分子,其中該RGN切口酶具有SEQ ID NO:75及88-98中的任一者的胺基酸序列。
88. 如實施方式64-87中任一實施方式的核酸分子,其中編碼融合蛋白的多核苷酸於其5'端處可操作地連結至啟動子。
89. 如實施方式64-88中任一實施方式的核酸分子,其中編碼融合蛋白的多核苷酸於其3'端處可操作地連結至終止子。
90. 如實施方式64-89中任一實施方式的核酸分子,其中該融合蛋白包括一或多個核定位訊號。
91. 如實施方式64-90中任一實施方式的核酸分子,其中該融合蛋白針對於真核細胞中的表現而被密碼子最佳化。
92. 如實施方式64-90中任一實施方式的核酸分子,其中該融合蛋白針對於原核細胞中的表現而被密碼子最佳化。
93. 如實施方式64-92中任一實施方式的核酸分子,其中該去胺酶與DNA結合多肽的胺基端融合。
94. 如實施方式64-92中任一實施方式的核酸分子,其中該去胺酶與DNA結合多肽的羧基端融合。
95. 如實施方式64-94中任一實施方式的核酸分子,其中該融合蛋白進一步包括在該DNA結合多肽與該去胺酶之間的連結子序列。
96. 如實施方式95的核酸分子,其中該連結子序列具有如SEQ ID NO:78或79所示的胺基酸序列。
97. 如實施方式64-96中任一實施方式的核酸分子,其中該融合蛋白進一步包括尿嘧啶穩定蛋白(USP)。
98. 如實施方式97的核酸分子,其中該USP具有如SEQ ID NO:81所示的序列。
99. 如實施方式97或98的核酸分子,其中該融合蛋白進一步包括在該USP與該去胺酶或該DNA結合多肽之間的連結子序列。
100. 如實施方式99的核酸分子,其中在該USP與該去胺酶或該DNA結合多肽之間的該連結子序列具有如SEQ ID NO:120所示的胺基酸序列。
101. 如實施方式64的核酸分子,其中該融合蛋白具有SEQ ID NO:67、68、146及147中的任一者所示的胺基酸序列。
102. 一種載體,包括實施方式64-101中任一實施方式的核酸分子。
103. 如實施方式102的載體,進一步包括編碼能夠與標的序列雜合的引導RNA(gRNA)的至少一個核苷酸序列。
104. 如實施方式103的載體,其中該gRNA為單引導RNA。
105. 如實施方式103的載體,其中該gRNA為雙引導RNA。
106. 一種包括實施方式33-63中任一實施方式的融合蛋白的細胞。
107. 如實施方式106的細胞,其中該細胞進一步包括引導RNA(gRNA)。
108. 如實施方式107的細胞,其中該gRNA為單引導RNA。
109. 如實施方式107的細胞,其中該gRNA為雙引導RNA。
110. 一種包括實施方式64-101中任一實施方式的核酸分子的細胞。
111. 一種包括實施方式102-105中任一實施方式的載體的細胞。
112. 如實施方式106-111中任一實施方式的細胞,其中該細胞為原核細胞。
113. 如實施方式106-111中任一實施方式的細胞,其中該細胞為真核細胞。
114. 如實施方式113的細胞,其中該真核細胞為哺乳動物細胞。
115. 如實施方式114的細胞,其中該哺乳動物細胞為人細胞。
116. 如實施方式115的細胞,其中該人細胞為免疫細胞。
117. 如實施方式116的細胞,其中該免疫細胞為幹細胞。
118. 如實施方式117的細胞,其中該幹細胞為經誘導的富潛能幹細胞。
119. 如實施方式113的細胞,其中該真核細胞為昆蟲或禽類細胞。
120. 如實施方式113的細胞,其中該真核細胞為真菌細胞。
121. 如實施方式113的細胞,其中該真核細胞為植物細胞。
122. 一種包括實施方式121的細胞的植物。
123. 一種包括實施方式121的細胞的種子。
124. 一種醫藥組成物,包括藥學上可接受的載體及實施方式33-63中任一實施方式的融合蛋白、實施方式64-101中任一實施方式的核酸分子、實施方式102-105中任一實施方式的載體、或實施方式114-118中任一實施方式的細胞。
125. 一種用於製造融合蛋白的方法,包括:在融合蛋白被表現的條件下,培養實施方式106-121中任一實施方式的細胞。
126. 一種用於製造融合蛋白的方法,包括:將實施方式64-101中任一實施方式的核酸分子或實施方式102-105中任一實施方式的載體引入細胞中;以及,在融合蛋白被表現的條件下,培養該細胞。
127. 如實施方式125或126的方法,進一步包括純化該融合蛋白。
128. 一種用於製造RGN融合核糖核蛋白複合物的方法,包括:將實施方式72-87中任一實施方式的核酸分子及包括編碼引導RNA(gRNA)的表現卡匣的核酸分子、或實施方式103-105中任一實施方式的載體引入細胞中;以及,在融合蛋白及gRNA被表現且形成RGN融合核糖核蛋白複合物的條件下,培養該細胞。
129. 如實施方式128的方法,進一步包括純化該RGN融合核糖核蛋白複合物。
130. 一種用於修飾包括標的DNA序列的標的DNA分子的系統,該系統包括:
a)融合蛋白或編碼該融合蛋白的核酸序列,其中該融合蛋白包括RNA引導的核酸酶多肽(RGN)及去胺酶,其中該去胺酶具有從以下者組成的群組選出的胺基酸序列:
i)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;以及
ii)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列;以及
b)能夠與該標的DNA序列雜合的一或多個引導RNA或編碼該一或多個引導RNA(gRNA)的一或多個核苷酸序列;以及
其中一或多個引導RNA能夠與融合蛋白形成複合物,以便將該融合蛋白導向至與該標的DNA序列結合及修飾該標的DNA分子。
131. 如實施方式130的系統,其中該去胺酶具有對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。
132. 如實施方式130的系統,其中該去胺酶具有對SEQ ID NO:2、4及6-12中至少一者具有100%序列一致性的胺基酸序列。
133. 如實施方式130-132中任一實施方式的系統,其中編碼一或多個引導RNA的該核苷酸序列和編碼融合蛋白的該核苷酸序列中至少一者可操作地連結至啟動子。
134. 如實施方式130-133中任一實施方式的系統,其中該標的DNA序列為真核標的DNA序列。
135. 如實施方式130-134中任一實施方式的系統,其中該標的DNA序列被定位為與由RGN辨識的前間隔序列鄰近模體(PAM)相鄰。
136. 如實施方式130-135中任一實施方式的系統,其中該標的DNA分子在細胞內。
137. 如實施方式136的系統,其中該細胞為真核細胞。
138. 如實施方式137的系統,其中該真核細胞為植物細胞。
139. 如實施方式137的系統,其中該真核細胞為哺乳動物細胞。
140. 如實施方式139的系統,其中該哺乳動物細胞為人細胞。
141. 如實施方式140的系統,其中該人細胞為免疫細胞。
142. 如實施方式141的系統,其中該免疫細胞為幹細胞。
143. 如實施方式142的系統,其中該幹細胞為經誘導的富潛能幹細胞。
144. 如實施方式137的系統,其中該真核細胞為昆蟲細胞。
145. 如實施方式136的系統,其中該細胞為原核細胞。
146. 如實施方式130-145中任一實施方式的系統,其中該融合蛋白的RGN為II型CRISPR-Cas多肽。
147. 如實施方式130-145中任一實施方式的系統,其中該融合蛋白的RGN為V型CRISPR-Cas多肽。
148. 如實施方式130-145中任一實施方式的系統,其中該融合蛋白的RGN具有對表1中的RGN序列中任一者具有至少90%序列一致性的胺基酸序列。
149. 如實施方式130-145中任一實施方式的系統,其中該融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少95%序列一致性的胺基酸序列。
150. 如實施方式130-145中任一實施方式的系統,其中該融合蛋白的RGN具有表1中的RGN序列中的任一者的胺基酸序列。
151. 如實施方式130-145中任一實施方式的系統,其中該融合蛋白的RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的胺基酸序列。
152. 如實施方式130-145中任一實施方式的系統,其中該融合蛋白的RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少95%序列一致性的胺基酸序列。
153. 如實施方式130-145中任一實施方式的系統,其中該融合蛋白的RGN具有SEQ ID NO:74、82、87、106及107中的任一者的胺基酸序列。
154. 如實施方式130-145中任一實施方式的系統,其中該融合蛋白的RGN為RGN切口酶。
155. 如實施方式154的系統,其中該RGN切口酶具有不活化的RuvC域。
156. 如實施方式154或155的系統,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的胺基酸序列。
157. 如實施方式154或155的系統,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少95%序列一致性的胺基酸序列。
158. 如實施方式154或155的系統,其中該RGN切口酶為SEQ ID NO:75及88-98中的任一者。
159. 如實施方式130-145中任一實施方式的系統,其中該融合蛋白的RGN為核酸酶不活化的RGN。
160. 如實施方式130-159中任一實施方式的系統,其中該融合蛋白包括一或多個核定位訊號。
161. 如實施方式130-160中任一實施方式的系統,其中該去胺酶與DNA結合多肽的胺基端融合。
162. 如實施方式130-160中任一實施方式的系統,其中該去胺酶與DNA結合多肽的羧基端融合。
163. 如實施方式130-162中任一實施方式的系統,其中該融合蛋白進一步包括在該DNA結合多肽與該去胺酶之間的連結子序列。
164. 如實施方式163的系統,其中該連結子序列具有如SEQ ID NO:78或79所示的胺基酸序列。
165. 如實施方式130-164中任一實施方式的系統,其中該融合蛋白進一步包括尿嘧啶穩定蛋白(USP)。
166. 如實施方式165的系統,其中該USP具有如SEQ ID NO:81所示的序列。
167. 如實施方式165或166的系統,其中該融合蛋白進一步包括在該USP與該去胺酶或該DNA結合多肽之間的連結子序列。
168. 如實施方式167的系統,其中在該USP與該去胺酶或該DNA結合多肽之間的該連結子序列具有如SEQ ID NO:120所示的胺基酸序列。
169. 如實施方式130的系統,其中該融合蛋白具有SEQ ID NO:67、68、146及147中的任一者所示的胺基酸序列。
170. 如實施方式130-169中任一實施方式的系統,其中該融合蛋白針對於真核細胞中的表現而被密碼子最佳化。
171. 如實施方式130-170中任一實施方式的系統,其中編碼一或多個引導RNA的核苷酸序列及編碼融合蛋白的核苷酸序列被定位於一個載體上。
172. 一種核糖核蛋白複合物,包括實施方式130-171中任一實施方式的系統的該至少一個引導RNA和該融合蛋白。
173. 一種細胞,包括實施方式130-171中任一實施方式的系統或實施方式172的核糖核蛋白複合物。
174. 如實施方式173的細胞,其中該細胞為原核細胞。
175. 如實施方式173的細胞,其中該細胞為真核細胞。
176. 如實施方式175的細胞,其中該真核細胞為哺乳動物細胞。
177. 如實施方式176的細胞,其中該哺乳動物細胞為人細胞。
178. 如實施方式177的細胞,其中該人細胞為免疫細胞。
179. 如實施方式178的細胞,其中該免疫細胞為幹細胞。
180. 如實施方式179的細胞,其中該幹細胞為經誘導的富潛能幹細胞。
181. 如實施方式175的細胞,其中該真核細胞為昆蟲或禽類細胞。
182. 如實施方式175的細胞,其中該真核細胞為真菌細胞。
183. 如實施方式175的細胞,其中該真核細胞為植物細胞。
184. 一種包括實施方式183的細胞的植物。
185. 一種包括實施方式183的細胞的種子。
186. 一種醫藥組成物,包括藥學上可接受的載體及實施方式130-171中任一實施方式的系統、實施方式172的核糖核蛋白複合物、或實施方式175-180中任一實施方式的細胞。
187. 一種用於修飾包括標的DNA序列的標的DNA分子的方法,該方法包括將根據實施方式130-171中任一實施方式的系統或如請求項172的核糖核蛋白複合物遞送至該標的DNA分子或包括該標的DNA分子的細胞。
188. 如實施方式187的方法,其中該經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C>N突變,其中N為A、G或T。
189. 如實施方式188的方法,其中該經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C>T突變。
190. 如實施方式188的方法,其中該經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C> G突變。
191. 一種用於修飾包括標的序列的標的DNA分子的方法,該方法包括:
a)在適合形成RGN去胺酶核糖核苷酸複合物的條件下,藉由結合以下者以在體外組裝RGN去胺酶核糖核苷酸複合物:
i)能夠與標的DNA序列雜合的一或多個引導RNA;以及
ii)包括RNA引導的核酸酶多肽(RGN)及至少一個去胺酶的融合蛋白,其中該去胺酶具有從由以下者組成的群組選出的胺基酸序列:
I)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;以及
II)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列;以及
b)使該標的DNA分子或包括該標的DNA分子的細胞與在體外組裝的RGN去胺酶核糖核苷酸複合物接觸;
其中該一或多個引導RNA與標的DNA序列雜合,從而將該融合蛋白導向至與該標的DNA序列結合,且發生標的DNA分子的修飾。
192. 如實施方式191的方法,其中該去胺酶具有對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。
193. 如實施方式191的方法,其中該去胺酶具有對SEQ ID NO:2、4及6-12中的至少一者具有100%序列一致性的胺基酸序列。
194. 如實施方式191-193中任一實施方式的方法,其中該經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C>N突變,其中N為A、G或T。
195. 如實施方式194的方法,其中該經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C>T突變。
196. 如實施方式194的方法,其中該經修飾的標的DNA分子包括標的DNA分子內的至少一個核苷酸的C> G突變。
197. 如實施方式191-196中任一實施方式的方法,其中該融合蛋白的RGN為II型CRISPR-Cas多肽。
198. 如實施方式191-196中任一實施方式的方法,其中該融合蛋白的RGN為V型CRISPR-Cas多肽。
199. 如實施方式191-198中任一實施方式的方法,其中該融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少90%序列一致性的胺基酸序列。
200. 如實施方式191-198中任一實施方式的方法,其中該融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少95%序列一致性的胺基酸序列。
201. 如實施方式191-198中任一實施方式的方法,其中該融合蛋白的RGN具有表1中的RGN序列中的任一者的胺基酸序列。
202. 如實施方式191-198中任一實施方式的方法,其中該融合蛋白的RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的胺基酸序列。
203. 如實施方式191-198中任一實施方式的方法,其中該融合蛋白的RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少95%序列一致性的胺基酸序列。
204. 如實施方式191-198中任一實施方式的方法,其中該融合蛋白的RGN具有SEQ ID NO:74、82、87、106及107中的任一者的胺基酸序列。
205. 如實施方式191-198中任一實施方式的方法,其中該融合蛋白的RGN為RGN切口酶。
206. 如實施方式205的方法,其中該RGN切口酶具有不活化的RuvC域。
207. 如實施方式205或206的方法,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的胺基酸序列。
208. 如實施方式205或206的方法,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少95%序列一致性的胺基酸序列。
209. 如實施方式205或206的方法,其中該RGN切口酶為SEQ ID NO:75及88-98中的任一者。
210. 如實施方式191-198中任一實施方式的方法,其中該融合蛋白的RGN為核酸酶不活化的RGN。
211. 如實施方式191-210中任一實施方式的方法,其中該融合蛋白包括一或多個核定位訊號。
212. 如實施方式191-211中任一實施方式的方法,其中該去胺酶與DNA結合多肽的胺基端融合。
213. 如實施方式191-211中任一實施方式的方法,其中該去胺酶與DNA結合多肽的羧基端融合。
214. 如實施方式191-213中任一實施方式的方法,其中該融合蛋白進一步包括在該DNA結合多肽與該去胺酶之間的連結子序列。
215. 如實施方式214的方法,其中該連結子序列具有如SEQ ID NO:78或79所示的胺基酸序列。
216. 如實施方式191-215中任一實施方式的方法,其中該融合蛋白進一步包括尿嘧啶穩定蛋白(USP)。
217. 如實施方式216的方法,其中該USP具有如SEQ ID NO:81所示的序列。
218. 如實施方式216或217的方法,其中該融合蛋白進一步包括在該USP與該去胺酶或該DNA結合多肽之間的連結子序列。
219. 如實施方式218的方法,其中在該USP與該去胺酶或該DNA結合多肽之間的該連結子序列具有如SEQ ID NO:120所示的胺基酸序列。
220. 如實施方式191的方法,其中該融合蛋白具有如SEQ ID NO:67、68、146及147中的任一者所示的胺基酸序列。
221. 如實施方式191-220中任一實施方式的方法,其中該標的DNA序列為真核標的DNA序列。
222. 如實施方式191-221中任一實施方式的方法,其中該標的DNA序列被定位為與前間隔序列鄰近模體(PAM)相鄰。
223. 如實施方式191-222中任一實施方式的方法,其中該標的DNA分子在細胞內。
224. 如實施方式223的方法,其中該細胞為真核細胞。
225. 如實施方式224的方法,其中該真核細胞為植物細胞。
226. 如實施方式224的方法,其中該真核細胞為哺乳動物細胞。
227. 如實施方式226的方法,其中該哺乳動物細胞為人細胞。
228. 如實施方式227的方法,其中該人細胞為免疫細胞。
229. 如實施方式228的方法,其中該免疫細胞為幹細胞。
230. 如實施方式229的方法,其中該幹細胞為經誘導的富潛能幹細胞。
231. 如實施方式224的方法,其中該真核細胞為昆蟲細胞。
232. 如實施方式223的方法,其中該細胞為原核細胞。
233. 如實施方式223-232中任一實施方式的方法,進一步包括選擇包括該經修飾的DNA分子的細胞。
234. 一種細胞,包括根據實施方式233的方法的經修飾的標的DNA序列。
235. 如實施方式234的細胞,其中該細胞為真核細胞。
236. 如實施方式235的細胞,其中該真核細胞為植物細胞。
237. 一種植物,包括實施方式236的細胞。
238. 一種種子,包括實施方式236的細胞。
239. 如實施方式235的細胞,其中該真核細胞為哺乳動物細胞。
240. 如實施方式239的細胞,其中該哺乳動物細胞為人細胞。
241. 如實施方式240的細胞,其中該人細胞為免疫細胞。
242. 如實施方式241的細胞,其中該免疫細胞為幹細胞。
243. 如實施方式242的細胞,其中該幹細胞為經誘導的富潛能幹細胞。
244. 如實施方式235的細胞,其中該真核細胞為昆蟲細胞。
245. 如實施方式234的細胞,其中該細胞為原核細胞。
246. 一種醫藥組成物,包括實施方式239-243中任一實施方式的細胞和藥學上可接受的載體。
247. 一種用針對基因遺傳性疾病的因果突變中的更正來產生經基因修飾的細胞的方法,該方法包括將以下者引入細胞中:
a)融合蛋白或編碼該融合蛋白的多核苷酸,其中該融合蛋白包括RNA引導的核酸酶多肽(RGN)及去胺酶,其中去胺酶具有從由以下者組成的群組選出的胺基酸序列:
i)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;以及
ii)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列;以及
b)能夠與標的DNA序列雜合的一或多個引導RNA(gRNA)或編碼該gRNA的多核苷酸,
藉以,融合蛋白及gRNA靶向因果突變的基因體位置以及修飾基因體序列以去除該因果突變。
248. 如實施方式247的方法,其中編碼融合蛋白的該多核苷酸可操作地被連結至在該細胞中具活性的啟動子。
249. 如實施方式247或248的方法,其中編碼gRNA的該多核苷酸可操作地被連結至在細胞中具活性的啟動子。
250. 如實施方式247-249中任一實施方式的方法,其中該去胺酶具有對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性的胺基酸序列。
251. 如實施方式247-249中任一實施方式的方法,其中該去胺酶具有對SEQ ID NO:2、4及6-12具有100%序列一致性的胺基酸序列。
252. 如實施方式247-251中任一實施方式的方法,其中該融合蛋白的RGN為II型CRISPR-Cas多肽。
253. 如實施方式247-251中任一實施方式的方法,其中該融合蛋白的RGN為V型CRISPR-Cas多肽。
254. 如實施方式247-253中任一實施方式的方法,其中該融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少90%序列一致性的胺基酸序列。
255. 如實施方式247-253中任一實施方式的方法,其中該融合蛋白的RGN具有對表1中的RGN序列中的任一者具有至少95%序列一致性的胺基酸序列。
256. 如實施方式247-253中任一實施方式的方法,其中該融合蛋白的RGN具有表1中的RGN序列中的任一者的胺基酸序列。
257. 如實施方式247-253中任一實施方式的方法,其中該融合蛋白的RGN為RGN切口酶。
258. 如實施方式257的方法,其中該RGN切口酶具有不活化的RuvC域。
259. 如實施方式257或258的方法,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的胺基酸序列。
260. 如實施方式257或258的方法,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少95%序列一致性的胺基酸序列。
261. 如實施方式257或258的方法,其中該RGN切口酶為SEQ ID NO:75及88-98中的任一者。
262. 如實施方式247-253中任一實施方式的方法,其中該融合蛋白的RGN為核酸酶不活化的RGN。
263. 如實施方式247-262中任一實施方式的方法,其中該融合蛋白包括一或多個核定位訊號。
264. 如實施方式247-263中任一實施方式的方法,其中該去胺酶與DNA結合多肽的胺基端融合。
265. 如實施方式247-263中任一實施方式的方法,其中該去胺酶與DNA結合多肽的羧基端融合。
266. 如實施方式247-265中任一實施方式的方法,其中該融合蛋白進一步包括在該DNA結合多肽與該去胺酶之間的連結子序列。
267. 如實施方式266的方法,其中該連結子序列具有如SEQ ID NO:78或79所示的胺基酸序列。
268. 如實施方式247-267中任一實施方式的方法,其中該融合蛋白進一步包括尿嘧啶穩定蛋白(USP)。
269. 如實施方式268的方法,其中該USP具有如SEQ ID NO:81所示的序列。
270. 如實施方式268或269的方法,其中該融合蛋白進一步包括在該USP與該去胺酶或該DNA結合多肽之間的連結子序列。
271. 如實施方式270的方法,其中在該USP與該去胺酶或該DNA結合多肽之間的該連結子序列具有如SEQ ID NO:120所示的胺基酸序列。
272. 如實施方式247-249中任一實施方式的方法,其中該融合蛋白具有SEQ ID NO:67、68、146及147中的任一者所示的胺基酸序列。
273. 如實施方式247-272中任一實施方式的方法,其中該基因體修飾包括將至少一個核苷酸的C>T突變引入標的DNA序列內。
274. 如實施方式247-272中任一實施方式的方法,其中該基因體修飾包括將至少一個核苷酸的C>G突變引入標的DNA序列內。
275. 如實施方式247-274中任一實施方式的方法,其中該細胞為動物細胞。
276. 如實施方式275的方法,其中該動物細胞為哺乳動物細胞。
277. 如實施方式276的方法,其中該細胞從狗、貓、小鼠、大鼠、兔、馬、綿羊、山羊、牛、豬或人取得。
278. 如實施方式247-277中任一實施方式的方法,其中該因果突變的更正包括更正無意義突變。
279. 如實施方式247-278中任一實施方式的方法,其中該基因遺傳性疾病為列於表23中的疾病。
280. 如實施方式279的方法,其中該gRNA進一步包括靶向SEQ ID NO:122-144中的任一者的間隔序列或其補體。
281. 一種組成物,包括:
a)包括DNA結合多肽和胞嘧啶去胺酶的融合蛋白或編碼該融合蛋白的核酸分子;以及
b)第二胞嘧啶去胺酶或編碼第二去胺酶的核酸分子,其中第二去胺酶具有從由以下者組成的群組選出的胺基酸序列:
i)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;以及
ii)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
282. 如實施方式281的組成物,其中該第二胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。
283. 如實施方式281的組成物,其中該第二胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
284. 如實施方式281-283中任一實施方式的組成物,其中第一胞嘧啶去胺酶具有從由以下者組成的群組選出的胺基酸序列:
a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;以及
b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
285. 如實施方式281-284中任一實施方式的組成物,其中第一胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。
286. 如實施方式281-284中任一實施方式的組成物,其中第一胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
287. 如實施方式281-286中任一實施方式的組成物,其中DNA結合多肽為大範圍核酸酶、鋅指融合蛋白或TALEN;或大範圍核酸酶、鋅指融合蛋白或TALEN的變異體,其中核酸酶活性已被降低或抑制。
288. 如實施方式281-286中任一實施方式的組成物,其中DNA結合多肽為RNA引導的DNA結合多肽。
289. 如實施方式288的組成物,其中該RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)多肽。
290. 如實施方式289的組成物,其中該RGN為RGN切口酶。
291. 如實施方式289的組成物,其中該RGN為核酸酶不活化的RGN。
292. 一種載體,包括編碼融合蛋白的核酸分子及編碼第二胞嘧啶去胺酶的核酸分子,其中該融合蛋白包括DNA結合多肽和第一胞嘧啶去胺酶,及其中該第二胞嘧啶去胺酶具有從由以下者組成的群組選出的胺基酸序列:
a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;以及
b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
293. 如實施方式292的載體,其中該第二胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。
294. 如實施方式292的載體,其中該第二胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
295. 如實施方式292-294中任一實施方式的載體,其中該第一胞嘧啶去胺酶具有從由以下者組成的群組選出的胺基酸序列:
a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;以及
b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
296. 如實施方式292-294中任一實施方式的載體,其中該第一胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。
297. 如實施方式292-294中任一實施方式的載體,其中該第一胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
298. 如實施方式292-297中任一實施方式的載體,其中該DNA結合多肽為大範圍核酸酶、鋅指融合蛋白或TALEN;或大範圍核酸酶、鋅指融合蛋白或TALEN的變異體,其中核酸酶活性已被降低或抑制。
299. 如實施方式292-297中任一實施方式的載體,其中該DNA結合多肽為RNA引導的DNA結合多肽。
300. 如實施方式299的載體,其中該RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)多肽。
301. 如實施方式300的載體,其中該RGN為RGN切口酶。
302. 如實施方式300的載體,其中該RGN為核酸酶不活化的RGN。
303. 一種細胞,包括實施方式292-302中任一實施方式的載體。
304. 一種細胞,包括:
a)包括DNA結合多肽和第一胞嘧啶去胺酶的融合蛋白;或編碼該融合蛋白的核酸分子;以及
b)第二胞嘧啶去胺酶或編碼該第二胞嘧啶去胺酶的核酸分子,其中該第二胞嘧啶去胺酶具有從由以下者組成的群組選出的胺基酸序列:
i)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;以及
ii)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
305. 如實施方式304的細胞,其中該第二胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。
306. 如實施方式304的細胞,其中該第二胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
307. 如實施方式304-306中任一實施方式的細胞,其中該第一胞嘧啶去胺酶具有從由以下者組成的群組選出的胺基酸序列:
a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的胺基酸序列;以及
b)對SEQ ID NO:4或6具有至少95%序列一致性的胺基酸序列。
308. 如實施方式304-306中任一實施方式的細胞,其中該第一胞嘧啶去胺酶對SEQ ID NO:2及7-12中的任一者具有至少95%序列一致性。
309. 如實施方式304-306中任一實施方式的細胞,其中該第一胞嘧啶去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
310. 如實施方式304-309中任一實施方式的細胞,其中該DNA結合多肽為大範圍核酸酶、鋅指融合蛋白或TALEN;或大範圍核酸酶、鋅指融合蛋白或TALEN的變異體,其中核酸酶活性已被降低或抑制。
311. 如實施方式304-309中任一實施方式的細胞,其中該DNA結合多肽為RNA引導的DNA結合多肽。
312. 如實施方式311的細胞,其中該RNA引導的DNA結合多肽為RNA引導的核酸酶(RGN)多肽。
313. 如實施方式312的細胞,其中該RGN為RGN切口酶。
314. 如實施方式312的細胞,其中該RGN為核酸酶不活化的RGN。
315. 一種醫藥組成物,包括藥學上可接受的載體及實施方式281-291中任一實施方式的組成物、實施方式292-302中任一實施方式的載體、或實施方式303-314中任一實施方式的細胞。
316. 一種用於治療疾病的方法,該方法包括對需要治療的個體投予實施方式33-63中任一實施方式的融合蛋白、實施方式64-101中任一實施方式的核酸分子、實施方式102-105及292-302中任一實施方式的載體、實施方式113-118、239-243及303-314中任一實施方式的細胞、實施方式130-171中任一實施方式的系統、實施方式172的核糖核蛋白複合物、實施方式281-291中任一實施方式的組成物、或實施方式124、186、246及315中任一實施方式的醫藥組成物。
317. 如實施方式316的方法,其中該疾病與因果突變關聯,且該醫藥組成物更正該因果突變。
318. 如實施方式316或317的方法,其中該疾病為列於表23中的疾病。
319. 一種實施方式33-63中任一實施方式的融合蛋白、實施方式64-101中任一實施方式的核酸分子、實施方式102-105及292-302中任一實施方式的載體、實施方式113-118、239-243及303-314中任一實施方式的細胞、實施方式130-171中任一實施方式的系統、實施方式172的核糖核蛋白複合物、或實施方式281-291中任一實施方式的組成物用於治療個體中的疾病的用途。
320. 如實施方式319的用途,其中該疾病與因果突變關聯,且該治療包括更正該因果突變。
321. 如實施方式319或320的用途,其中該疾病為列於表23中的疾病。
322. 一種實施方式33-63中任一實施方式的融合蛋白、實施方式64-101中任一實施方式的核酸分子、實施方式102-105及292-302中任一實施方式的載體、實施方式113-118、239-243及303-314中任一實施方式的細胞、實施方式130-171中任一實施方式的系統、實施方式172的核糖核蛋白複合物、或實施方式281-291中任一實施方式的組成物用於製造有用於治療疾病的藥物的用途。
323. 如實施方式322的用途,其中該疾病與因果突變關聯,且有效量的該藥物更正該因果突變。
324. 如實施方式322或323的用途,其中該疾病為列於表23中的疾病。
提供以下實例為示例而非為限制。
實驗
實例 1 :在哺乳動物細胞中C
鹼基編輯的證明
SEQ ID NO:1、3及5所示的去胺酶從兩端被截斷,且經截斷的去胺酶如SEQ ID NO:2、4及6所示。從細菌取得的胞嘧啶去胺酶如SEQ ID NO:7-12所示。
表2:去胺酶序列
去胺酶 | SEQ ID |
APG09980 | 1 |
APG09980.1 | 2 |
APG05840 | 3 |
APG05840.1 | 4 |
APG00868 | 5 |
APG00868.1 | 6 |
APG30125 | 7 |
APG30126 | 8 |
APG30127 | 9 |
APG30128 | 10 |
APG30129 | 11 |
APG30130 | 12 |
為確定表2的去胺酶是否能夠在哺乳動物細胞中進行胞嘧啶鹼基編輯,使每一個去胺酶與RGN切口酶可操作地融合,以產生融合蛋白。預測將RGN APG07433.1(SEQ ID NO:74;於PCT公開號WO 2019/236566描述的,藉由引用而被併入本文)的RuvC域去活化的殘基被辨識,且RGN被修飾為切口酶變異體(nAPG07433.1;SEQ ID NO: 75)。RGN的切口酶變異體在本文中被稱為“nRGN”。應該明白,RGN的任何切口酶變異體可被用於產生本發明的融合蛋白。
去胺酶及針對於哺乳動物表現而被密碼子最佳化的nRGN核苷酸序列被合成為具有N端核定位標籤的融合蛋白,且被選殖至pTwist CMV (Twist Biosciences)表現質體中。每一個融合蛋白包括:於胺基端處開始,SV40 NLS(SEQ ID NO: 76)於C端末側處可操作地連結至3X FLAG標籤(SEQ ID NO: 77),其於C端末側處可操作地連結至去胺酶,其於C端末側處可操作地連結至胜肽連結子(L16或L32;其分別地如SEQ ID NO:78或79所示),其於C端末側處可操作地連結至nRGN(例如,nAPG07433.1,其為SEQ ID NO:75),最後,其於C端末側處可操作地連結至核質素(nucleoplasmin)NLS(SEQ ID NO: 80)。表3顯示所產生的及針對活性測試的融合蛋白。所有融合蛋白包括至少一個NLS及3X FLAG標籤,如上所述。表3中的APG05840.1-nAPG07433.1-USP2融合蛋白進一步包括在nRGN與核質素NLS之間的尿嘧啶穩定蛋白USP2(如SEQ ID NO: 81所示)。這個融合蛋白亦包括於nAPG07433.1與USP2之間具有如SEQ ID NO:120所示的序列的胜肽連結子。
表3:具有N端SV40 NLS, 3X FLAG標籤及C端核質素NLS的融合蛋白
融合蛋白 | SEQ ID |
APG09980-L16- nAPG07433.1 | 13 |
APG09980.1-L16- nAPG07433.1 | 14 |
APG05840-L16- nAPG07433.1 | 15 |
APG05840.1-L16- nAPG07433.1 | 16 |
APG00868-L16- nAPG07433.1 | 17 |
APG00868.1-L16- nAPG07433.1 | 18 |
APG30125- nAPG07433.1 | 19 |
APG30126- nAPG07433.1 | 20 |
APG30127- nAPG07433.1 | 21 |
APG30128- nAPG07433.1 | 22 |
APG30129- nAPG07433.1 | 23 |
APG05840.1-nAPG07433.1-USP2 | 24 |
APG30130-nAPG07433.1 | 145 |
亦產生包括編碼sgRNA的表現卡匣的表現質體。表4中指出了人的基因體標的序列及用於將融合蛋白引導至基因體標的的sgRNA序列。
表4:引導RNA序列
sgRNA ID | 標的序列 | sgRNA 序列 | 用於擴增的正向引子 | 用於擴增的反向引子 |
SGN000169 | 25 | 34 | 43 | 52 |
SGN000173 | 26 | 35 | 44 | 53 |
SGN000929 | 27 | 36 | 45 | 54 |
SGN001101 | 28 | 37 | 46 | 55 |
SGN000927 | 29 | 38 | 47 | 56 |
SGN000143 | 30 | 39 | 48 | 57 |
SGN000186 | 31 | 40 | 49 | 58 |
SGN000194 | 32 | 41 | 50 | 59 |
SGN000930 | 33 | 42 | 51 | 60 |
於24孔盤中,使用Lipofectamine 2000試劑(Life Technologies),以75-90%融合率,將500 ng質體(其包括的表現卡匣包括對於表3中顯示的每一個融合蛋白的編碼序列)及500 ng的質體(其包括編碼表4中顯示的sgRNA的表現卡匣)共轉染為HEK293FT細胞。然後,細胞在37° C下培養72小時。然後,在培養之後,按照製造商的操作流程,使用NucleoSpin 96 Tissue(Macherey-Nagel)萃取基因體DNA。使用表4中的引子,所靶向的基因體位點側翼的基因體區域被PCR擴增;以及按照製造商的操作流程,使用ZR-96 DNA清潔與濃縮器(Zymo Research)純化產物。經純化的PCR產物被送至Illumina MiSeq(2 x 250)上進行下一代定序。對於特定胞嘧啶突變的INDEL形成或引入,分析結果。
表5顯示針對表3中的融合蛋白與表4中的引導RNA的每一個組合的所有胞嘧啶鹼基編輯。表6-11顯示用於選擇範例性樣本的特定核苷酸突變概況。標的序列內的每一個核苷酸的位置被確定。例如,“C17”指示標的序列的位置17處的胞嘧啶。於標的序列中每一個核苷酸的位置由對最接近PAM的標的序列中的第一核苷酸編號而被確定為位置1,且位置編號在3'方向上隨著離開PAM序列而增加。表6-11亦顯示胞嘧啶以什麼速率被改變成哪種核苷酸。例如,表6顯示對於APG30127-nAPG07433.1融合蛋白,位置17處的胞嘧啶以0.2%的比率被突變為胸苷。
表5:所測試的每一個胞嘧啶去胺酶與連結子組合的鹼基編輯率的估計值
表6:使用去胺酶APG30127及引導SGN000930的C>N編輯率
構築體 | 標的 | % 突變的讀數 |
APG09980_L16_nAPG07433.1 | SGN001101 | 29.18% |
APG09980_L16_ nAPG07433.1 | SGN000929 | 24.48% |
APG09980_L16_ nAPG07433.1 | SGN000169 | 24.79% |
APG09980_L16_ nAPG07433.1 | SGN000173 | 17.71% |
APG09980_L16_ nAPG07433.1 | SGN000143 | 11.20% |
APG09980_L16_ nAPG07433.1 | SGN000930 | 25.25% |
APG09980.1_L16_ nAPG07433.1 | SGN001101 | 30.52% |
APG09980.1_L16_ nAPG07433.1 | SGN000929 | 25.95% |
APG09980.1_L16_ nAPG07433.1 | SGN000169 | 24.05% |
APG09980.1_L16_ nAPG07433.1 | SGN000173 | 22.25% |
APG09980.1_L16_ nAPG07433.1 | SGN000143 | 9.70% |
APG09980.1_L16_ nAPG07433.1 | SGN000930 | 23.80% |
APG05840_L16_ nAPG07433.1 | SGN001101 | 24.30% |
APG05840_L16_ nAPG07433.1 | SGN000929 | 27.67% |
APG05840_L16_ nAPG07433.1 | SGN000169 | 20.53% |
APG05840_L16_ nAPG07433.1 | SGN000173 | 11.38% |
APG05840_L16_ nAPG07433.1 | SGN000143 | 15.13% |
APG05840_L16_ nAPG07433.1 | SGN000930 | 22.38% |
APG05840.1_L16_ nAPG07433.1 | SGN001101 | 23.83% |
APG05840.1_L16_ nAPG07433.1 | SGN000929 | 22.34% |
APG05840.1_L16_ nAPG07433.1 | SGN000169 | 30.22% |
APG05840.1_L16_ nAPG07433.1 | SGN000173 | 20.44% |
APG05840.1_L16_ nAPG07433.1 | SGN000143 | 10.97% |
APG05840.1_L16_ nAPG07433.1 | SGN000930 | 22.22% |
APG05840.1-L16- nAPG07433.1-USP2 | SGN001101 | 12.67% |
APG05840.1-L16- nAPG07433.1-USP2 | SGN000929 | 11.14% |
APG05840.1-L16- nAPG07433.1-USP2 | SGN000169 | 22.56% |
APG05840.1-L16- nAPG07433.1-USP2 | SGN000173 | 11.36% |
APG05840.1-L16- nAPG07433.1-USP2 | SGN000930 | 13.11% |
APG05840.1-L16- nAPG07433.1-USP2 | SGN000143 | 6.25% |
APG00868_L16_ nAPG07433.1 | SGN001101 | 24.40% |
APG00868_L16_ nAPG07433.1 | SGN000929 | 20.62% |
APG00868_L16_ nAPG07433.1 | SGN000169 | 16.36% |
APG00868_L16_ nAPG07433.1 | SGN000173 | 13.22% |
APG00868_L16_ nAPG07433.1 | SGN000143 | 8.36% |
APG00868_L16_ nAPG07433.1 | SGN000930 | 14.86% |
APG00868.1_L16_ nAPG07433.1 | SGN001101 | 20.36% |
APG00868.1_L16_ nAPG07433.1 | SGN000929 | 14.64% |
APG00868.1_L16_ nAPG07433.1 | SGN000169 | 22.39% |
APG00868.1_L16_ nAPG07433.1 | SGN000173 | 18.37% |
APG00868.1_L16_ nAPG07433.1 | SGN000143 | 6.33% |
APG00868.1_L16_ nAPG07433.1 | SGN000930 | 12.29% |
APG30125-L32-nAPG07433.1 | SGN001101 | 2.72% |
APG30125-L32-nAPG07433.1 | SGN000929 | 7.39% |
APG30125-L32-nAPG07433.1 | SGN000169 | 6.89% |
APG30125-L32-nAPG07433.1 | SGN000173 | 3.54% |
APG30125-L32-nAPG07433.1 | SGN000930 | 6.32% |
APG30125-L32-nAPG07433.1 | SGN000143 | 0% |
APG30126-L32-nAPG07433.1 | SGN000930 | 1.38% |
APG30126-L32-nAPG07433.1 | SGN000143 | 0% |
APG30126-L32-nAPG07433.1 | SGN000186 | 0% |
APG30126-L32-nAPG07433.1 | SGN000194 | 0% |
APG30126-L32-nAPG07433.1 | SGN000927 | 0% |
APG30126-L32-nAPG07433.1 | SGN000139 | 0% |
APG30127-L32-nAPG07433.1 | SGN000930 | 6.22% |
APG30127-L32-nAPG07433.1 | SGN000143 | 2.46% |
APG30127-L32-nAPG07433.1 | SGN000186 | 14.26% |
APG30127-L32-nAPG07433.1 | SGN000194 | 9.53% |
APG30127-L32-nAPG07433.1 | SGN000927 | 3.26% |
APG30127-L32-nAPG07433.1 | SGN000139 | 0.00% |
APG30128-L32-nAPG07433.1 | SGN000930 | 2.03% |
APG30128-L32-nAPG07433.1 | SGN000143 | 0.00% |
APG30128-L32-nAPG07433.1 | SGN000186 | 0.00% |
APG30128-L32-nAPG07433.1 | SGN000194 | 0.00% |
APG30128-L32-nAPG07433.1 | SGN000927 | 0.00% |
APG30128-L32-nAPG07433.1 | SGN000139 | 0.00% |
APG30129-L32-nAPG07433.1 | SGN000930 | 3.47% |
APG30129-L32-nAPG07433.1 | SGN000143 | 2.02% |
APG30129-L32-nAPG07433.1 | SGN000186 | 11.40% |
APG30129-L32-nAPG07433.1 | SGN000194 | 5.92% |
APG30129-L32-nAPG07433.1 | SGN000927 | 0.00% |
APG30129-L32-nAPG07433.1 | SGN000139 | 0.00% |
APG30130-L32-nAPG07433.1 | SGN000930 | 3.14% |
APG30130-L32-nAPG07433.1 | SGN000143 | 0.00% |
APG30130-L32-nAPG07433.1 | SGN000186 | 2.78% |
APG30130-L32-nAPG07433.1 | SGN000194 | 3.29% |
APG30130-L32-nAPG07433.1 | SGN000927 | 0.00% |
SGN000930 | ||||
C17 | C19 | C22 | ||
APG30127 | A | 0 | 0 | 0 |
G | 5.3 | 0.4 | 0 | |
T | 0.2 | 0.4 | 0.2 |
APG30127顯示位置C17處的主要C>G轉換
表7:使用去胺酶APG30127及引導SGN000186的C>N編輯率
SGN000186 | |||||||||||
C10 | C12 | C17 | C23 | C24 | C29 | C3 | C4 | C5 | C7 | ||
APG30127 | A | 0.2 | 0 | 0.5 | 0.1 | 0 | 0 | 0 | 0 | 0 | 0.1 |
G | 0.1 | 0 | 0.6 | 0 | 0.1 | 0.2 | 0 | 0 | 0 | 0 | |
T | 1.6 | 3.3 | 2 | 0.1 | 0 | 0.2 | 0.1 | 0.1 | 0 | 0 |
APG30127顯示包括C10、C12及C17的多個位置處的C>T轉換。在位置C17處,亦存在C>G及C>A轉換。
表8:使用去胺酶APG30129及引導SGN000186的C>N編輯率
SGN000186 | |||||||||||
C10 | C12 | C17 | C23 | C24 | C29 | C3 | C4 | C5 | C7 | ||
APG30129 | A | 0.1 | 0 | 0.3 | 0.1 | 0.2 | 0.2 | 0 | 0 | 0 | 0 |
G | 0.2 | 0.2 | 0.5 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | |
T | 1.1 | 3.5 | 1.2 | 0.1 | 0 | 0.1 | 0 | 0 | 0.2 | 0.3 |
APG30129顯示位置C10、C12及C17處的C>T轉化
表9:使用去胺酶APG30125及引導SGN000186的C>N編輯率
SGN000186 | |||||||||||
C10 | C12 | C17 | C23 | C24 | C29 | C3 | C4 | C5 | C7 | ||
APG30125 | A | 0.4 | 0.1 | 0.3 | 0 | 0 | 0.1 | 0 | 0 | 0 | 0 |
G | 0.2 | 0 | 0.1 | 0 | 0 | 0.1 | 0 | 0 | 0 | 0 | |
T | 1 | 2.9 | 1.3 | 0.2 | 0.1 | 0.2 | 0 | 0 | 0.1 | 0 |
APG30125顯示位置C10、C12及C17處的C>T轉換。在除APG30129及APG30127以外的所有位置處存在較少的C>G及C>A轉換。
表10:使用去胺酶APG05840.1-L16- nAPG07433.1-USP2及引導SGN000169的C>N編輯率
SGN000169 | |||||||||||
C4 | C9 | C13 | C15 | C18 | C20 | C23 | C26 | C27 | C29 | ||
APG05840.1-L16- nAPG07433.1-USP2 | A | 0 | 0 | 0.1 | 0.2 | 0.1 | 0.1 | 0 | 0.2 | 0 | 0 |
G | 0 | 0 | 0.1 | 0.8 | 0 | 0 | 0 | 0 | 0 | 0 | |
T | 0 | 5.3 | 16.3 | 20.2 | 2.1 | 11.3 | 7.4 | 0 | 0 | 0 |
用16胺基酸連結子(L16)及尿嘧啶穩定蛋白(USP2)測試經截斷的APG05840(APG05840.1)。這個構築體顯示出在標的SGN000169中的若干個位置(包括C9、C13、C15、C20及C23)處的高水準的特定C>T編輯。這證明經縮短的去胺酶及較短的連結子仍可被用於產生位點特定單核苷酸編輯。
表11:使用去胺酶APG05840.1-L16- nAPG07433.1-USP2及引導SGN000173的C>N編輯率
SGN000173 | ||||||||||||
C1 | C3 | C4 | C7 | C8 | C10 | C11 | C17 | C2 | C20 | C29 | ||
APG05840.1-L16- nAPG07433.1-USP2 | A | 0 | 0 | 0 | 0 | 0.1 | 0 | 0 | 0.3 | 0 | 0 | 0 |
G | 0 | 0 | 0 | 0 | 0 | 0.1 | 0.1 | 0 | 0 | 0 | 0 | |
T | 0 | 0 | 0 | 3.4 | 6.4 | 5 | 1.9 | 9.3 | 0 | 0.7 | 0 |
用16胺基酸連結子(L16)及尿嘧啶穩定蛋白(USP2)測試經截斷的APG05840(APG05840.1)。這個構築體在標的SGN000173中的若干個位置(包括C7、C8、C10及C17)處顯示高水準的特定C>T編輯。
實例 2 :去靶的 RGN 獨立的胞嘧啶去胺酶驅動作用測定
為了藉由胞嘧啶去胺酶確定ssDNA上是否存在突變作用,進行RGN獨立的去靶突變測定。預測將RGN APG09298(SEQ ID NO:82所示的;PCT公開號WO 2021/217002描述的,其藉由引用而整體地被併入本文)的RuvC域去活化的殘基被辨識,且RGN被修飾為無活性變異體(dAPG09298;SEQ ID NO:83)。
針對表現而被密碼子最佳化的dRGN核苷酸序列被合成為具有N端核定位標籤的融合蛋白,且被選殖至pTwist CMV (Twist Biosciences)表現質體中。這個dRGN融合蛋白包括:於胺基端處開始,SV40 NLS(SEQ ID NO: 76)於C端末側處可操作地連結至3X FLAG標籤(SEQ ID NO:77),其於C端末側處可操作地連結至dRGN(例如,dAPG09298,其為SEQ ID NO:83),最後,其於C端末側處可操作地連結至核質素NLS(SEQ ID NO:80),以製造NLS-dAPG09298-NLS(SEQ ID NO: 84)。這個構築體被用於在R環中在與正被胞嘧啶去胺酶鹼基編輯器編輯的標的序列無關的位置處建立ssDNA。
亦產生包括編碼sgRNA的表現卡匣的表現質體。於表4中指出了人的基因體標的序列及用於將融合蛋白引導至基因體標的的sgRNA序列。
表12:去靶引導RNA序列
sgRNA ID | 標的序列 | sgRNA 序列 | 用於擴增的正向引子 | 用於擴增的反向引子 |
SGN001165 | 61 | 62 | 63 | 64 |
於24孔盤中,使用Lipofectamine 2000試劑(Life Technologies),以75-90%融合率,將500 ng質體(其包括的表現卡匣包括對於表3中顯示的融合蛋白的編碼序列)以及500 ng質體(其包括編碼表4中顯示的sgRNA的表現卡匣)以及500 ng的質體(其包括的表現卡匣包括NLS-dAPG09298-NLS的編碼序列)以及500 ng的質體(其包括編碼表12中顯示的dAPG09298的sgRNA的表現卡匣)被共轉染為HEK293FT細胞。然後,細胞在37° C下培養72小時。然後,在培養之後,按照製造商的操作流程,使用NucleoSpin 96 Tissue(Macherey-Nagel)萃取基因體DNA。使用表4或表12中的引子,所靶向的基因體位點側翼的基因體區域被PCR擴增;以及按照製造商的操作流程,使用ZR-96 DNA清潔與濃縮器(Zymo Research)純化產物。經純化的PCR產物被送至Illumina MiSeq(2 x 250)上進行下一代定序。針對INDEL形成或特定胞嘧啶突變,分析結果。中靶(on-target)結果為藉由表4中的擴增子辨識的那些。RGN獨立的去靶結果為藉由表12中的擴增子辨識的那些。
表13:用APG05840- nAPG07433.1-USP2的去胺酶驅動的RGN獨立的去靶效果
% 標的位點處的突變讀數 | % 去胺酶驅動效果的去靶位點處的突變讀數 (SGN001165) | |
SGN001101 | 19.7% | 0.99% |
SGN000929 | 24% | 0% |
SGN000169 | 25% | 0% |
SGN000173 | 18.24% | 0% |
SGN000930 | 20.24% | 0% |
SGN000143 | 18.13% | 0% |
每一個樣本的預定中靶位點顯示胞嘧啶特定突變的高水準。在6個樣本中的5個樣本中,dAPG09298在SGN001165處結合的去靶位點顯示無突變讀數。所測試的一個標的在去靶位置處顯示低突變率,具有突變的讀數的0.99%。這些可以是RGN獨立的去胺酶驅動的突變效果,但亦可為定序錯誤,因為樣本的低比率。
實例 3 : C>G 鹼基編輯在哺乳動物細胞中的證明
這些研究評估去胺酶及RGN彼此於融合蛋白中的取向是否影響所得的C鹼基編輯器進行的鹼基編輯的類型。
預測將RGN APG07433.1(SEQ ID NO: 74;PCT公開號WO 2019/236566,其藉由引用而被併入本文)的RuvC域去活化的殘基被辨識,且RGN被修飾為切口酶變異體(nAPG07433.1;SEQ ID NO:75)。
去胺酶(APG09980及APG05840;分別如SEQ ID NO:1及3所示)及針對於表現而被密碼子最佳化的nAPG07433.1核苷酸序列被合成為具有N端核定位標籤的融合蛋白,且被選殖至pTwist CMV (Twist Biosciences)表現質體中。每一個融合蛋白包括:於胺基端處開始,SV40 NLS(SEQ ID NO: 76)於C端末側處可操作地連結至3X FLAG標籤(SEQ ID NO:77),其於C端末側處可操作地連結至由胜肽連結子(SEQ ID NO:79)連接的nRGN去胺酶(去胺酶nRGN-USP2、或去胺酶nRGN融合蛋白),最後,其於C端末側處可操作地連結至核質素NLS(SEQ ID NO:80)。表14顯示被產生且被測試活性的融合蛋白。所有融合蛋白包括至少一個NLS及3X FLAG標籤,如上所述。表14中的APG09980-nAPG07433.1-USP2及APG05840.1-nAPG07433.1-USP2融合蛋白進一步包括nRGN與核質素NLS之間的尿嘧啶穩定蛋白USP2(如SEQ ID NO: 81所示)。APG09980-nAPG07433.1-USP2及APG05840.1-nAPG07433.1-USP2融合蛋白亦包括nAPG07433.1與USP2之間具有如SEQ ID NO: 120所示序列的胜肽連結子。
表14:具有N端SV40 NLS、3X FLAG標籤及C端核質素NLS的融合蛋白序列
融合蛋白 | SEQ ID |
nAPG07433.1-APG09980 | 65 |
nAPG07433.1-APG05840 | 66 |
APG09980-nAPG07433.1-USP2 | 67 |
APG05840-nAPG07433.1-USP2 | 68 |
APG05840-nAPG07433.1 | 69 |
亦產生。表15亦指出包括編碼sgRNA的表現卡匣的表現質體人的基因體標的序列及用於將融合蛋白引導至基因體標的的sgRNA序列。
表15:引導RNA序列
sgRNA ID | 標的序列 | sgRNA 序列 | 用於擴增的正向引子 | 用於擴增的反向引子 |
SGN000930 | 33 | 42 | 51 | 60 |
SGN000928 | 70 | 71 | 72 | 73 |
於24孔盤中,使用Lipofectamine 2000試劑(Life Technologies),以75-90%融合率,將500 ng質體(其包括的表現卡匣包括對於表14中顯示的融合蛋白的編碼序列)以及500 ng質體(其包括編碼表15中顯示的sgRNA的表現卡匣)共轉染為HEK293FT細胞。然後,細胞在37° C下被培養72小時。然後,在培養之後,按照製造商的操作流程,使用NucleoSpin 96 Tissue(Macherey-Nagel)萃取基因體DNA。使用表15中的引子,所靶向的基因體位點側翼的基因體區域被PCR擴增;以及按照製造商的操作流程,使用ZR-96 DNA清潔與濃縮器(Zymo Research)純化產物。經純化的PCR產物被送至Illumina MiSeq(2 x 250)上進行下一代定序。對於INDEL形成或特定胞嘧啶突變,分析結果。
表16-20顯示針對來自表14的融合蛋白與來自表15的引導RNA的每一個組合的胞嘧啶鹼基編輯。標的序列內的每一個核苷酸的位置被確定。例如,“C16”表明標的序列的位置16處的胞嘧啶。於標的序列中每一個核苷酸的位置藉由對最接近PAM的標的序列中的第一核苷酸編號而被確定為位置1,且位置數目在3'方向上隨著離開PAM序列而增加。表16-20亦顯示胞嘧啶以什麼速率被改變成哪種核苷酸。例如,表16顯示對於APG05840-nAPG07433.1-USP2融合蛋白,位置16處的胞嘧啶以11%的比率被突變為胸苷。
表16:使用去胺酶APG05840及引導SGN000928的C>N編輯率
SGN000928 | |||||||||||
C2 | C3 | C4 | C7 | C11 | C16 | C18 | C21 | C24 | C27 | ||
APG05840- nAPG07433.1-USP2 | A | 0 | 0 | 0 | 0 | 0.1 | 0.4 | 0.2 | 0.1 | 0 | 0 |
G | 0 | 0 | 0 | 0 | 0.4 | 1.4 | 0 | 0.6 | 0 | 0 | |
T | 0 | 0 | 0 | 0.8 | 3.3 | 11 | 2.1 | 11 | 0.3 | 2.2 |
在全構築體APG05840- nAPG07433.1-USP2中的N端上去胺酶的取向中,高水準的特定C>T轉化在SGN000928中的位置C16及C21處是明顯的。
表17:使用去胺酶APG05840及引導SGN000930的C>N編輯率
SGN000930 | ||||
C17 | C19 | C22 | ||
APG05840- nAPG07433.1-USP2 | A | 0 | 0 | 0 |
G | 4.9 | 0 | 0 | |
T | 17 | 2.8 | 6.9 |
在全構築體APG05840- nAPG07433.1-USP2中的N端上去胺酶取的向中,高水準的特定C>T轉化在SGN000930中的位置C17及C22處是明顯的。一些C>G在位置17處是明顯的。
表18:使用去胺酶APG05840及引導SGN000928的C>N編輯率
SGN000928 | |||||||||||
C2 | C3 | C4 | C7 | C11 | C16 | C18 | C21 | C24 | C27 | ||
nAPG07433.1-APG05840 | A | 0 | 0 | 0 | 0 | 0.1 | 0.5 | 0 | 0.2 | 0 | 0 |
G | 0 | 0 | 0 | 0 | 0.3 | 15 | 0 | 0 | 0 | 0 | |
T | 0 | 0 | 0 | 0 | 0.1 | 0.9 | 0 | 0.2 | 0 | 0 |
當被繫至切口酶的去胺酶的取向被反向且該去胺酶被繫至C端時,主要編輯結果為標的SGN000928中的位置C16處的C>G轉化。與N端結構相較,非常小的C>T轉化是明顯的。
表19:使用去胺酶APG05840及引導SGN000930的C>N編輯率
SGN000930 | ||||
C17 | C19 | C22 | ||
nAPG07433.1-APG05840 | A | 0.1 | 0 | 0 |
G | 17.5 | 0 | 0 | |
T | 0.8 | 0 | 0 |
當去胺酶被繫至切口酶的C端時,主要編輯結果為於標的SGN000930中的位置C17處的C>G轉化。
表20:使用去胺酶APG09980及引導SGN000930的C>N編輯率
SGN000930 | ||||
C17 | C19 | C22 | ||
nAPG07433.1-APG09980 | A | 0.2 | 0 | 0 |
G | 13 | 0 | 0 | |
T | 0.6 | 0 | 0 |
使用第二去胺酶模組APG09980,當被繫至切口酶的C端時,相同趨勢是明顯的,主要突變結果為位置C17處的C>G轉化。
表21:使用去胺酶APG05840及引導SGN000930的C>N編輯率
SGN000930 | ||||
C17 | C19 | C22 | ||
APG05840- nAPG07433.1 | A | 0.3 | 0.4 | 1.55 |
G | 29.4 | 0.3 | 0.35 | |
T | 2 | 1.85 | 3.2 |
當APG05840被繫至nAPG07433.1的N端時,主要突變結果為具有引導SGN000930的位置C17中的C>G轉化。
表22:鹼基編輯樣本中的整個突變及缺失率
構築體 | SGN | 突變讀數的 % | 具有缺失的讀數的 % |
APG09980- nAPG07433.1 | SGN000930 | 21.42 | 2.09 |
nAPG07433.1-APG09980 | SGN000930 | 18.38 | 0 |
APG09980- nAPG07433.1-USP2 | SGN000930 | 21.505 | 0.313 |
APG05840- nAPG07433.1 | SGN000930 | 18.735 | 0 |
APG05840- nAPG07433.1-USP2 | SGN000930 | 22.595 | 0.355 |
SGN000928 | 19.24 | 1.87 | |
nAPG07433.1-APG05840 | SGN000930 | 17.475 | 0.285 |
SGN000928 | 20.9 | 0.39 |
這個表中的資料是多個編輯實驗的平均值。突變的讀數的百分比是每一個樣本中的鹼基編輯率的估計值。具有缺失的讀數的百分比估計樣本中的缺失率。在具有及不具有USP下,與N端融合相較,APG09980至nAPG07433.1的C端融合具有較低的缺失率。
APG05840-nAPG07433.1-USP2主要顯示在引導SGN000930的位置C17處及SGN000928中的C16及C21處的C>T轉化。nAPG07433.1-APG09980及nAPG07433.1-APG05840主要顯示在這些相同位置處的C>G突變。所有構築體顯示在相同窗中的編輯。
實例 4 :用於因果疾病突變的更正的靶向鹼基編輯
臨床變異體資料庫從經由全球資訊網在NCBI ClinVar網站上找到的NCBI ClinVar資料庫獲得。自此清單中辨識致病性單核苷酸多型性(SNP)。使用基因體基因座資訊,辨識與每一個SNP重疊且圍繞每一個SNP的區域中的CRISPR標的。與RGN(舉例而言,例如APG07433.1或其變異體)組合地使用鹼基編輯可更正從而靶向因果突變的SNP中的選中者被列於表23中。在下面的表23中,僅列出每一種疾病的一個別名。“RS#”對應於NCBI網站上的SNP資料庫中的RS寄存編號。“名稱”列含有基因基因座辨識符、基因名稱、基因中的突變位置、及突變導致的變化。
表23:鹼基編輯的疾病標的
實驗 5 :基因編輯活性在植物細胞中的證實
適應症 | RS# | 名稱 | RGN APG07433.1 的潛在標的序列 (SEQ ID NO) |
急性神經元性高歇氏病 | 1064651 | NM_000157.3(GBA):c.1342G>C (p.Asp448His) | 122 |
阿爾發第一型抗胰蛋白酶缺乏症 | 28931569 | NM_001127701.1(SERPINA1):c.194T>C (p.Leu65Pro) | 123 |
11型肌肉萎縮性脊髓側索硬化症 | 121908287 | NM_014845.5(FIG4):c.122T>C (p.Ile41Thr) | 124 |
運動失調毛細管擴張症候群 | 587781558 | NM_000051.3(ATM):c.2921+1G>A,NM_000051.3(ATM):c.2921+1G>T,NM_000051.3(ATM):c.2921+1G>C | 125 |
生物素酶缺乏症 | 28934601 | NM_000060.4(BTD):c.755A>G (p.Asp252Gly) | 126 |
I型碳水化合物缺乏醣蛋白症候群 | 80338709 | NM_000303.2(PMM2):c.722G>C (p.Cys241Ser) | 127 |
先天性肌強直 | 80356696 | NM_000083.2(CLCN1):c.1655A>G (p.Gln552Arg) | 128 |
1型Cowden氏症候群 | 1114167621 | NM_000314.6(PTEN):c.210-1G>A,NM_000314.6(PTEN):c.210-1G>C,NM_000314.6(PTEN):c.210-1G>T | 129 |
囊腫纖化症 | 75096551 | NM_000492.3(CFTR):c.2988+1G>A,NM_000492.3(CFTR):c.2988+1G>C | 130 |
多巴胺乙型羥化酶缺乏 | 74853476 | NM_000787.3(DBH):c.339+2T>C | 131 |
家族性高膽固醇血症 | 121908031 | NM_000527.4(LDLR):c.2043C>A (p.Cys681Ter),NM_000527.4(LDLR):c.2043C>G (p.Cys681Trp) | 132 |
家族性地中海型發熱病 | 28940579 | NM_000243.2(MEFV):c.2177T>C (p.Val726Ala) | 133 |
戊二酸性尿 | 199999619 | NM_000159.3(GCDH):c.1244-2A>C,NM_000159.3(GCDH):c.1244-2A>G | 134 |
2型包涵體肌病 | 779694939 | NM_001128227.2(GNE):c.740T>C (p.Val247Ala) | 135 |
LCHAD缺乏 | 137852769 | NM_000182.4(HADHA):c.1528G>C (p.Glu510Gln) | 136 |
Long QT症候群 | 267607277 | NM_006888.5(CALM1):c.293A>G (p.Asn98Ser) | 137 |
I型黏多糖病 | 199801029 | NM_000203.4(IDUA):c.979G>C (p.Ala327Pro) | 138 |
尼曼-匹克二氏病 | 80358259 | NM_000271.4(NPC1):c.3182T>C (p.Ile1061Thr) | 139 |
Pendred症候群 | 111033313 | NM_000441.1(SLC26A4):c.919-2A>G | 140 |
初代家族性肥厚性心肌症 | 727505017 | NM_002880.3(RAF1):c.769T>C (p.Ser257Pro) | 141 |
吡哆醇相依性癲癇 | 121912707 | NM_001182.4(ALDH7A1):c.1279G>C (p.Glu427Gln) | 142 |
Shwachman症候群 | 113993993 | NM_016038.2(SBDS):c.258+2T>C | 143 |
威爾森氏病 | 201738967 | NM_000053.3(ATP7B):c.122A>G (p.Asn41Ser) | 144 |
使用自Li等人,2013 (
Nat. Biotech.31:688-691)調適的操作流程,在植物細胞中證實本發明的RGN去胺酶融合蛋白的鹼基編輯活性。簡言之,使用PEG介導的轉形,將包括能夠在植物細胞中表現可操作地連結至SV40核定位訊號(SEQ ID NO: 76)的RGN去胺酶融合蛋白的表現卡匣及編碼靶向植物PDS基因中位於恰當PAM序列側翼的一或多個位點的引導RNA的第二表現卡匣的表現載體引入
本塞姆氏煙草(Nicotiana benthamiana)葉肉原生質體(mesophyll protoplast)內。經轉形的原生質體在黑暗中被培養至多36小時。使用DNeasy Plant Mini Kit (Qiagen),使基因體DNA與原生質體分離。位於RGN標的位點側翼的基因體區域被PCR擴增,產物被純化,及在Illumina MiSeq上使用下一代定序,分析經純化的PCR產物。通常情況下,每擴增子產生100,000個250 bp的配對端讀數(2×100,000個讀數 )。使用CRISPResso(Pinello等人,2016,
Nature Biotech,34:695-697)分析讀數,以計算編輯率。對於特定胞嘧啶突變的INDEL形成或引入,分析輸出比對。
表24:應用的序列
SEQ ID NO | 序列的描述 | 序列 |
1 | APG09980 | MAAGPAPEARSLMDEQTFLDNFNNLKYPRKTYLCYEVELLVGENHIPLDDYKGFVHNEGFDMGLERCHAELIFLERMASWNLDTELRYRITVFISWSPCPECADELVKFLRENRHVNLRIFAARIYDWYQGYEAGLRALKAAGAEVAMMTLHEFEYCWNNFVDHQQDEDTPFPPWDNLVARSEELSQRLEGILQPSVLVFCWPSQVSVTAAHSDIMSQASRAWEKRRDPP |
2 | APG09980.1 | MDEQTFLDNFNNLKYPRKTYLCYEVELLVGENHIPLDDYKGFVHNEGFDMGLERCHAELIFLERMASWNLDTELRYRITVFISWSPCPECADELVKFLRENRHVNLRIFAARIYDWYQGYEAGLRALKAAGAEVAMMTLHEFEYCWNNFVDHQQDEDTPFPPWDNLVARSEELSQRLEGILQ |
3 | APG05840 | MEASPASRPRPLMDPHMFTGNFTNNPRVFGLHQTYLCYEVKRQGPDGTRDLMNEQRDFLCNQAKNHFSGSEDHHAERCFLDRIPSWQLDPAQTYRVTCFISWSPCFSCAQEVAEFLHENPHVNLRIFAARIYDYLPRYEEGLQMLQNAGAQVSIMTSEEFGHCWDTFVDRQGHPFQPWEGLDEHSQALSGRLQAILQNQGN |
4 | APG05840.1 | MDPHMFTGNFTNNPRVFGLHQTYLCYEVKRQGPDGTRDLMNEQRDFLCNQAKNHFSGSEDHHAERCFLDRIPSWQLDPAQTYRVTCFISWSPCFSCAQEVAEFLHENPHVNLRIFAARIYDYLPRYEEGLQMLQNAGAQVSIMTSEEFGHCWDTFVDRQGHPFQPWEGLDEHSQALSGRLQAILQ |
5 | APG00868 | MEPWRPSPRNPMDRIDPNTFRFHFPNLLYASGRKLCYLCFQVETGDYFSCDDSDRGVFRNKVHPWARCHAEQCFLSWFRDQYPCRDEYYNVTWFLSWSPCPTCAEEVVEFLEEYRNLTLSIFTSRLYYFYHPNYQQGLRKLWDAGVQLDIMSCDDFEHCWDNFVDHKGMRFQRRNLLKDYDFLAAELQEILR |
6 | APG00868.1 | MDPNTFRFHFPNLLYASGRKLCYLCFQVETGDYFSCDDSDRGVFRNKVHPWARCHAEQCFLSWFRDQYPCRDEYYNVTWFLSWSPCPTCAEEVVEFLEEYRNLTLSIFTSRLYYFYHPNYQQGLRKLWDAGVQLDIMSCDDFEHCWDNFVDHKGMRFQRRNLLKDYDFLAAELQEILR |
7 | APG30125 | MINLVQTPYDLNSGYPIVRRTLEDKKKLVKHEGFGPESCCATIEYTLRGNSRYAFGNSQMQVEMPPNIYAHNWVKLHGEMTALVAAIRRIERVDSTSAVLPITSAYIELRPCEASCLPALHNMLPDNITVYFSFLHPTQVDQWKQSARALCA |
8 | APG30126 | MPVLIKVPYDINSANGVVQACLRKKREVVQSKDNGGITGIGAGSCCSFVVYMKHGGDVDNVFGNSRIRIPFKVNGIEIANACAHGELTALWNAIADEPSIPTILAMYIEMSPCTKCQSALDNLLQPGQEIYYSFDHPGEVKAWQAAAKHLCA |
9 | APG30127 | MIKTEYSLSSGYPIVRRTLEDKKNLVKQPGFGPESCCAVVQYRLRGNIRYAFGNSRMQISMPPGIYTHNWVRLHGEMAALVAAINRIERYSTDDVIPITAAYIELRPCEANCMQALRNILPEDACVYYSFDHPTQVDEWKLRANELCS |
10 | APG30128 | MIKTEYTLRSGYPIVRRTLENKKNLVKQPGFGPESCCAVVEYRLRGNIRYAFGNSRMQVSVPPGIYTNNWVRLHGEMAALVAAIERIERFSSDDVIPITAAYIELRPCEANCMQALHNILPENANVYYSFDHPTQVEEWKLRAHELC |
11 | APG30129 | MIKTEYALNSGYPIVRRTLEDKKKLVKQPGFGPESCCAVVEYRLRGNIRYAFGNSQMHVSMPPGIYTHNWVKLHGEMAALVAAINRIERFSTDDVIPITGAYIELRPCEANCLQALHNILPEDANVYYSFDHPTQLDEWKLRAHELC |
12 | APG30130 | MIQLVQAEYSIKSGYPIVRRTLEDKKKLIEKPGFGPESCCATIEYQLRGSTRYAFGNSQMKMEMPPDIYTHNWVKLHAEMAALVAAIRRIERFDADKEQVPITNVYIELRPCEANCMQALQNILPDGTTVYYSFLHPTEVEEWKRSA |
13 | NLS-3X FLAG標籤-APG09980-L16-nAPG07433.1-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMAAGPAPEARSLMDEQTFLDNFNNLKYPRKTYLCYEVELLVGENHIPLDDYKGFVHNEGFDMGLERCHAELIFLERMASWNLDTELRYRITVFISWSPCPECADELVKFLRENRHVNLRIFAARIYDWYQGYEAGLRALKAAGAEVAMMTLHEFEYCWNNFVDHQQDEDTPFPPWDNLVARSEELSQRLEGILQPSVLVFCWPSQVSVTAAHSDIMSQASRAWEKRRDPPSGSETPGTSESATPESMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHKRPAATKKAGQAKKKK |
14 | NLS-3XFLAG標籤-APG09980.1-L16- nAPG07433.1-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMDEQTFLDNFNNLKYPRKTYLCYEVELLVGENHIPLDDYKGFVHNEGFDMGLERCHAELIFLERMASWNLDTELRYRITVFISWSPCPECADELVKFLRENRHVNLRIFAARIYDWYQGYEAGLRALKAAGAEVAMMTLHEFEYCWNNFVDHQQDEDTPFPPWDNLVARSEELSQRLEGILQSGSETPGTSESATPESMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHKRPAATKKAGQAKKKK |
15 | NLS-3XFLAG標籤-APG05840-L16- nAPG07433.1-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMEASPASRPRPLMDPHMFTGNFTNNPRVFGLHQTYLCYEVKRQGPDGTRDLMNEQRDFLCNQAKNHFSGSEDHHAERCFLDRIPSWQLDPAQTYRVTCFISWSPCFSCAQEVAEFLHENPHVNLRIFAARIYDYLPRYEEGLQMLQNAGAQVSIMTSEEFGHCWDTFVDRQGHPFQPWEGLDEHSQALSGRLQAILQNQGNSGSETPGTSESATPESMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHKRPAATKKAGQAKKKK |
16 | NLS-3XFLAG標籤-APG05840.1-L16- nAPG07433.1-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMDPHMFTGNFTNNPRVFGLHQTYLCYEVKRQGPDGTRDLMNEQRDFLCNQAKNHFSGSEDHHAERCFLDRIPSWQLDPAQTYRVTCFISWSPCFSCAQEVAEFLHENPHVNLRIFAARIYDYLPRYEEGLQMLQNAGAQVSIMTSEEFGHCWDTFVDRQGHPFQPWEGLDEHSQALSGRLQAILQSGSETPGTSESATPESMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHKRPAATKKAGQAKKKK |
17 | NLS-3XFLAG標籤-APG00868-L16- nAPG07433.1-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMEPWRPSPRNPMDRIDPNTFRFHFPNLLYASGRKLCYLCFQVETGDYFSCDDSDRGVFRNKVHPWARCHAEQCFLSWFRDQYPCRDEYYNVTWFLSWSPCPTCAEEVVEFLEEYRNLTLSIFTSRLYYFYHPNYQQGLRKLWDAGVQLDIMSCDDFEHCWDNFVDHKGMRFQRRNLLKDYDFLAAELQEILRSGSETPGTSESATPESMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHKRPAATKKAGQAKKKK |
18 | NLS-3XFLAG標籤-APG00868.1-L16- nAPG07433.1-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMDPNTFRFHFPNLLYASGRKLCYLCFQVETGDYFSCDDSDRGVFRNKVHPWARCHAEQCFLSWFRDQYPCRDEYYNVTWFLSWSPCPTCAEEVVEFLEEYRNLTLSIFTSRLYYFYHPNYQQGLRKLWDAGVQLDIMSCDDFEHCWDNFVDHKGMRFQRRNLLKDYDFLAAELQEILRSGSETPGTSESATPESMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHKRPAATKKAGQAKKKK |
19 | NLS-3X FLAG標籤-APG30125-L32 nAPG07433.1-連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMINLVQTPYDLNSGYPIVRRTLEDKKKLVKHEGFGPESCCATIEYTLRGNSRYAFGNSQMQVEMPPNIYAHNWVKLHGEMTALVAAIRRIERVDSTSAVLPITSAYIELRPCEASCLPALHNMLPDNITVYFSFLHPTQVDQWKQSARALCASGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSKRPAATKKAGQAKKKK |
20 | NLS-3XFLAG標籤-APG30126-L32- nAPG07433.1-連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMPVLIKVPYDINSANGVVQACLRKKREVVQSKDNGGITGIGAGSCCSFVVYMKHGGDVDNVFGNSRIRIPFKVNGIEIANACAHGELTALWNAIADEPSIPTILAMYIEMSPCTKCQSALDNLLQPGQEIYYSFDHPGEVKAWQAAAKHLCASGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSKRPAATKKAGQAKKKK |
21 | NLS-3XFLAG標籤-APG30127-L32-nAPG07433.1-連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMIKTEYSLSSGYPIVRRTLEDKKNLVKQPGFGPESCCAVVQYRLRGNIRYAFGNSRMQISMPPGIYTHNWVRLHGEMAALVAAINRIERYSTDDVIPITAAYIELRPCEANCMQALRNILPEDACVYYSFDHPTQVDEWKLRANELCSSGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSKRPAATKKAGQAKKKK |
22 | NLS-3XFLAG標籤-APG30128-L32- nAPG07433.1-連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMIKTEYTLRSGYPIVRRTLENKKNLVKQPGFGPESCCAVVEYRLRGNIRYAFGNSRMQVSVPPGIYTNNWVRLHGEMAALVAAIERIERFSSDDVIPITAAYIELRPCEANCMQALHNILPENANVYYSFDHPTQVEEWKLRAHELCSGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSKRPAATKKAGQAKKKK |
23 | NLS-3XFLAG標籤-APG30129-L32 nAPG07433.1-連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMIKTEYALNSGYPIVRRTLEDKKKLVKQPGFGPESCCAVVEYRLRGNIRYAFGNSQMHVSMPPGIYTHNWVKLHGEMAALVAAINRIERFSTDDVIPITGAYIELRPCEANCLQALHNILPEDANVYYSFDHPTQLDEWKLRAHELCSGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSKRPAATKKAGQAKKKK |
24 | NLS-3XFLAG標籤-APG05840.1-L16-nAPG07433.1連結子-USP2-連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMDPHMFTGNFTNNPRVFGLHQTYLCYEVKRQGPDGTRDLMNEQRDFLCNQAKNHFSGSEDHHAERCFLDRIPSWQLDPAQTYRVTCFISWSPCFSCAQEVAEFLHENPHVNLRIFAARIYDYLPRYEEGLQMLQNAGAQVSIMTSEEFGHCWDTFVDRQGHPFQPWEGLDEHSQALSGRLQAILQSGSETPGTSESATPESMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSGGSGGSMKTTTQELKQYITRLFQLSNNETWECEALEEAAENILPERFINNSLLAHLTLNTYTYYNDELHELSIYPFLMYANDQLISIGYLDHFDMDFLYLTDTKNTIIDERHLLKQGENNHESGGSKRPAATKKAGQAKKKK |
25 | SGN000169標的序列 | CACATCTCGAGCAAGACGTT |
26 | SGN000173標的序列 | CTTCTATAGCCTCCTTCCCC |
27 | SGN000929標的序列 | ATCTGGAGGGAACTTACAGCATATG |
28 | SGN001101標的序列 | ATATTTTCTTTAATGGTGCCAGGCA |
29 | SGN000927標的序列 | GGCCAAAATCCAGCTGCCTTCCTTG |
30 | SGN000143標的序列 | CATGGCAGTACATTAGAGCA |
31 | SGN000186標的序列 | GGACAGTGCGCATCTCCCTG |
32 | SGN000194標的序列 | GCCGCACAGCATTCAGGTCG |
33 | SGN000930標的序列 | GAACAACTCAAATGGAAATGAATAT |
34 | SGN000169 | CACATCTCGAGCAAGACGTTGTCATAGTTCCATTAAAGCCAAAAGTGGCTTTGATGTTTCTATGATAAGGGTTTCGACCCGTGGCGTCGGGGATCGCCTGCCCATTGAAATGGGCTTCTCCCCATTTATT |
35 | SGN000173 | CTTCTATAGCCTCCTTCCCCGTCATAGTTCCATTAAAGCCAAAAGTGGCTTTGATGTTTCTATGATAAGGGTTTCGACCCGTGGCGTCGGGGATCGCCTGCCCATTGAAATGGGCTTCTCCCCATTTATT |
36 | SGN000929 | ATCTGGAGGGAACTTACAGCATATGGTCATAGTTCCATGAAAGCCAAAAGTGGCTTTGATGTTTCTATGATAAGGGTTTCGGCCCGTGGCGTCGGGGATCGCCTGCCCATTCCGATGGGCTTCTCCCCATTTATT |
37 | SGN001101 | ATATTTTCTTTAATGGTGCCAGGCAGTCATAGTTCCATTAAAGCCAAAAGTGGCTTTGATGTTTCTATGATAAGGGTTTCGACCCGTGGCGTCGGGGATCGCCTGCCCATTGAAATGGGCTTCTCCCCAT |
38 | SGN000927 | GGCCAAAATCCAGCTGCCTTCCTTGGTCATAGTTCCATGAAAGCCAAAAGTGGCTTTGATGTTTCTATGATAAGGGTTTCGGCCCGTGGCGTCGGGGATCGCCTGCCCATTCCGATGGGCTTCTCCCCATTTATT |
39 | SGN000143 | CATGGCAGTACATTAGAGCAGTCATAGTTCCATTAAAGCCAAAAGTGGCTTTGATGTTTCTATGATAAGGGTTTCGACCCGTGGCGTCGGGGATCGCCTGCCCATTGAAATGGGCTTCTCCCCATTTATT |
40 | SGN000186 | GGACAGTGCGCATCTCCCTGGTCATAGTTCCATTAAAGCCAAAAGTGGCTTTGATGTTTCTATGATAAGGGTTTCGACCCGTGGCGTCGGGGATCGCCTGCCCATTGAAATGGGCTTCTCCCCATTTATT |
41 | SGN000194 | GCCGCACAGCATTCAGGTCGGTCATAGTTCCATTAAAGCCAAAAGTGGCTTTGATGTTTCTATGATAAGGGTTTCGACCCGTGGCGTCGGGGATCGCCTGCCCATTGAAATGGGCTTCTCCCCATTTATT |
42 | SGN000930 | GAACAACTCAAATGGAAATGAATATGTCATAGTTCCATGAAAGCCAAAAGTGGCTTTGATGTTTCTATGATAAGGGTTTCGGCCCGTGGCGTCGGGGATCGCCTGCCCATTCCGATGGGCTTCTCCCCATTTATT |
43 | SGN000169正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGTTCACTCCAGCCTCAACAT |
44 | SGN000173正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGCAGTATAACTGGCCAGCCT |
45 | SGN000929正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGAATGAAGCCAGGCAAGAGCA |
46 | SGN001101正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGTGCATAGCAGAGTACCTGAAAC |
47 | SGN000927正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGACCCGGCCTGCTTTTCTTAA |
48 | SGN000143正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGACATTTGACGAGCAGCGAA |
49 | SGN000186正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGTGGCCCCTATGTGGAGATCA |
50 | SGN000194正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGATGACATTCAGGCCACAGTG |
51 | SGN000930正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGACAGCCAAGAGGTTTTGCC |
52 | SGN000169反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGTAATCCAGCAGGTCAGCAA |
53 | SGN000173 反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGTCAGTTGAGGAGTTCAGCTTAA |
54 | SGN000929 反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCTGTGCAAACCCAGGCTAGA |
55 | SGN001101 反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCATGCTTTGATGACGCTTCTG |
56 | SGN000927 反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGCAGCGAGGCATACATAGT |
57 | SGN000143 反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGCCCCTGGAGAGGTTTTAA |
58 | SGN000186 反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGCAGAGCTCAGCCTCATAG |
59 | SGN000194 反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCTTCCTCCTATTCAGGCCCA |
60 | SGN000930 反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCTGTCCCTTGCAGCTTCTGT |
61 | SGN001165標的序列 | GGGGGTCGGGGCTCGCGGCG |
62 | SGN001165 | GGGGGTCGGGGCTCGCGGCGGTTATTGTACTCTCAATAAaaagTTATTGAGAATCTACAATAATAAGGCATCTTGCCGAATTTACCGCCCTACATATGTAGGGCGGTTTT |
63 | SGN001165正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGCAAAGTGAGTGACCTGCTT |
64 | SGN001165反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGAGCTAGCACTTCTCGCG |
65 | NLS-3XFLAG標籤-nAPG07433.1-L32-APG09980-連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSSGGSSGSETPGTSESATPESSGGSSGGSMAAGPAPEARSLMDEQTFLDNFNNLKYPRKTYLCYEVELLVGENHIPLDDYKGFVHNEGFDMGLERCHAELIFLERMASWNLDTELRYRITVFISWSPCPECADELVKFLRENRHVNLRIFAARIYDWYQGYEAGLRALKAAGAEVAMMTLHEFEYCWNNFVDHQQDEDTPFPPWDNLVARSEELSQRLEGILQPSVLVFCWPSQVSVTAAHSDIMSQASRAWEKRRDPPSGGSKRPAATKKAGQAKKKK |
66 | NLS-3XFLAG標籤-nAPG07433.1-L32-APG05840-連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSSGGSSGSETPGTSESATPESSGGSSGGSMEASPASRPRPLMDPHMFTGNFTNNPRVFGLHQTYLCYEVKRQGPDGTRDLMNEQRDFLCNQAKNHFSGSEDHHAERCFLDRIPSWQLDPAQTYRVTCFISWSPCFSCAQEVAEFLHENPHVNLRIFAARIYDYLPRYEEGLQMLQNAGAQVSIMTSEEFGHCWDTFVDRQGHPFQPWEGLDEHSQALSGRLQAILQNQGNSGGSKRPAATKKAGQAKKKK |
67 | NLS-3XFLAG標籤-APG09980-L32-nAPG07433.1連結子-USP2-連結子r-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMAAGPAPEARSLMDEQTFLDNFNNLKYPRKTYLCYEVELLVGENHIPLDDYKGFVHNEGFDMGLERCHAELIFLERMASWNLDTELRYRITVFISWSPCPECADELVKFLRENRHVNLRIFAARIYDWYQGYEAGLRALKAAGAEVAMMTLHEFEYCWNNFVDHQQDEDTPFPPWDNLVARSEELSQRLEGILQPSVLVFCWPSQVSVTAAHSDIMSQASRAWEKRRDPPSGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSGGSGGSMKTTTQELKQYITRLFQLSNNETWECEALEEAAENILPERFINNSLLAHLTLNTYTYYNDELHELSIYPFLMYANDQLISIGYLDHFDMDFLYLTDTKNTIIDERHLLKQGENNHESGGSKRPAATKKAGQAKKKK |
68 | NLS-3XFLAG標籤-APG05840-L32-nAPG07433.1-連結子-USP2-連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMEASPASRPRPLMDPHMFTGNFTNNPRVFGLHQTYLCYEVKRQGPDGTRDLMNEQRDFLCNQAKNHFSGSEDHHAERCFLDRIPSWQLDPAQTYRVTCFISWSPCFSCAQEVAEFLHENPHVNLRIFAARIYDYLPRYEEGLQMLQNAGAQVSIMTSEEFGHCWDTFVDRQGHPFQPWEGLDEHSQALSGRLQAILQNQGNSGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSGGSGGSMKTTTQELKQYITRLFQLSNNETWECEALEEAAENILPERFINNSLLAHLTLNTYTYYNDELHELSIYPFLMYANDQLISIGYLDHFDMDFLYLTDTKNTIIDERHLLKQGENNHESGGSKRPAATKKAGQAKKKK |
69 | NLS-3XFLAG標籤-APG05840-L32-nAPG07433.1連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMEASPASRPRPLMDPHMFTGNFTNNPRVFGLHQTYLCYEVKRQGPDGTRDLMNEQRDFLCNQAKNHFSGSEDHHAERCFLDRIPSWQLDPAQTYRVTCFISWSPCFSCAQEVAEFLHENPHVNLRIFAARIYDYLPRYEEGLQMLQNAGAQVSIMTSEEFGHCWDTFVDRQGHPFQPWEGLDEHSQALSGRLQAILQNQGNSGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSKRPAATKKAGQAKKKK |
70 | SGN000928標的序列 | GCTTCTACTCTTGGCTTACAACCCA |
71 | SGN000928 | GCTTCTACTCTTGGCTTACAACCCAGTCATAGTTCCATGAAAGCCAAAAGTGGCTTTGATGTTTCTATGATAAGGGTTTCGGCCCGTGGCGTCGGGGATCGCCTGCCCATTCCGATGGGCTTCTCCCCATTTATT |
72 | SGN000928正向引子 | TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGACCCGGCCTGCTTTTCTTAA |
73 | SGN000928反向引子 | GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGCAGCGAGGCATACATAGT |
74 | APG07433.1 | MRELDYRIGLDIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRVRKETRRNFH |
75 | nAPG07433.1 | MRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFH |
76 | SV40 NLS | PKKKRKV |
77 | 3X FLAG標籤 | DYKDHDGDYKDHDIDYKDDDDK |
78 | L16 | SGSETPGTSESATPES |
79 | L32 | SGGSSGGSSGSETPGTSESATPESSGGSSGGS |
80 | 核質素NLS | KRPAATKKAGQAKKKK |
81 | USP2 | MKTTTQELKQYITRLFQLSNNETWECEALEEAAENILPERFINNSLLAHLTLNTYTYYNDELHELSIYPFLMYANDQLISIGYLDHFDMDFLYLTDTKNTIIDERHLLKQGENNHE |
82 | APG09298 | MYSIGLDLGISSVGWSVIDEETGKIVDLGIRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVSAYADELATILKTQQALYPNELTDDWIALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPTQKEFILTELMTKEFARFGVNDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAESGIDLATLPTETIDCLAKVLTLNTEREGVENTLAFELPELAEPVKLLVLDRYKELSQSVSTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKADVRKRYSDYKKLPTKEVLTEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESCPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGNKLRKFNTDILGKKHHLSYEKEPKNIIK |
83 | dAPG09298 | MYSIGLALGISSVGWSVIDEETGKIVDLGIRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVSAYADELATILKTQQALYPNELTDDWIALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPTQKEFILTELMTKEFARFGVNDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAESGIDLATLPTETIDCLAKVLTLNTEREGVENTLAFELPELAEPVKLLVLDRYKELSQSVSTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKADVRKRYSDYKKLPTKEVLTEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDAIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESCPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGNKLRKFNTDILGKKHHLSYEKEPKNIIK |
84 | NLS-3XFLAG標籤-dAPG09298-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMYSIGLALGISSVGWSVIDEETGKIVDLGIRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVSAYADELATILKTQQALYPNELTDDWIALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPTQKEFILTELMTKEFARFGVNDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAESGIDLATLPTETIDCLAKVLTLNTEREGVENTLAFELPELAEPVKLLVLDRYKELSQSVSTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKADVRKRYSDYKKLPTKEVLTEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDAIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESCPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGNKLRKFNTDILGKKHHLSYEKEPKNIIKKRPAATKKAGQAKKKK |
85 | LAGLIDADG大範圍核酸酶家族保留模體 | LAGLIDADG |
86 | Uracil DNA糖基化酶抑制劑 | TNLSDHEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML |
87 | APG08290.1 | MSELDYRIGLDIGTNSIGWGVIELFWNKDRERYEKVRIVDKGVRMFDKAEIPNKGASLAEPRRIARSSRRRLNRKSQRKKEIRNLLVQHGMITQEELDLLYPLSKKSIDIWDIRLDGLDRLLNHLEWARLLIHLAQRRGFKSNRKSELKDAETGKVLSSIQVNEKRLFLYRTVGEMWIKDAEFSKYDRRRNSPNEYVFSVSRADLEKEIVTLFEAQRKFQSSYASKNLQETYLQIWAHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTQEQKEIILDKMFQRTDYYKKKTIPEVSYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEIKKVVANYAERTNEAFSTLDYDAIAYALTVYKTDKDIRSYLKKSNNLSKRCYDDQLIEELFTLSYTKFGHLSFKAINHVLPIMQEGRTYQEAIHQLGYDTTNLKKENRSMFLPLIPDEITNPIVKRAITQARKVVNAIIRRYGSPNSVHIELARELSKSHDERKKIMTAHDENYKKNKGAISILIENGILNPTGYDIVRYKLWKEQGERCAYSLKEIPPDTFFNELKKERNGSPILEVDHILPYSQSFIDSYHNKVLVYSDENRNKGNRIPYTYFLETNKDWEAFERYVRSNKLFSKKKREYLLKKTYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEVEVNLRKKRVQTVNGVITAHLRKRWGLEKNRQETYLHHAMDAIIVACTDHHMVTRITEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSSDYIFVSRMPKRSVTGAAHDQTIRRKGGIDKKGKTIIIKRVRLKDIKFDENGDFKMVGKEQDLATYEAIKQRYLEHRKNSKKAFETPLYKPSKKGTGNLIKRVKIEGQTKAFVREVNGGVAQNSDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVKSGKGYEQWLTLDNSFTFKSSLYPYDLVRLVKGNEDRFLYFGTLDIDSDRLNFKDVNKPSKQNEYRYSLKTIENLEKYEVGVLGDLRLVKQETRRIFNR |
88 | nAPG08290.1 | MSELDYRIGLAIGTNSIGWGVIELFWNKDRERYEKVRIVDKGVRMFDKAEIPNKGASLAEPRRIARSSRRRLNRKSQRKKEIRNLLVQHGMITQEELDLLYPLSKKSIDIWDIRLDGLDRLLNHLEWARLLIHLAQRRGFKSNRKSELKDAETGKVLSSIQVNEKRLFLYRTVGEMWIKDAEFSKYDRRRNSPNEYVFSVSRADLEKEIVTLFEAQRKFQSSYASKNLQETYLQIWAHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTQEQKEIILDKMFQRTDYYKKKTIPEVSYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEIKKVVANYAERTNEAFSTLDYDAIAYALTVYKTDKDIRSYLKKSNNLSKRCYDDQLIEELFTLSYTKFGHLSFKAINHVLPIMQEGRTYQEAIHQLGYDTTNLKKENRSMFLPLIPDEITNPIVKRAITQARKVVNAIIRRYGSPNSVHIELARELSKSHDERKKIMTAHDENYKKNKGAISILIENGILNPTGYDIVRYKLWKEQGERCAYSLKEIPPDTFFNELKKERNGSPILEVDHILPYSQSFIDSYHNKVLVYSDENRNKGNRIPYTYFLETNKDWEAFERYVRSNKLFSKKKREYLLKKTYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEVEVNLRKKRVQTVNGVITAHLRKRWGLEKNRQETYLHHAMDAIIVACTDHHMVTRITEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSSDYIFVSRMPKRSVTGAAHDQTIRRKGGIDKKGKTIIIKRVRLKDIKFDENGDFKMVGKEQDLATYEAIKQRYLEHRKNSKKAFETPLYKPSKKGTGNLIKRVKIEGQTKAFVREVNGGVAQNSDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVKSGKGYEQWLTLDNSFTFKSSLYPYDLVRLVKGNEDRFLYFGTLDIDSDRLNFKDVNKPSKQNEYRYSLKTIENLEKYEVGVLGDLRLVKQETRRIFNR |
89 | nAPG00969 | MKQTSYSLGLAIGIASVGYGLIDNDENIVDAGVRLFPEANSKNNDGRRKSRGSKRLIRRKRHRIARVKHLLKESGIDVSYENTVLTNPYEIRCKGLTLPLTNHELSIALLHLAKRRGVHNVKSMDQEKVKGNELSTKEQLTINDNLLEEKFICELQLERLNKEGIVRSHSNRFKTADYIKEIKNLLETQAKQNTLVTEEFIEKYIEIFSGRRKYYEGPGGESKYGWKGDIEKWYEGLMGKCTYFPKELRCVKHAYSAALFNLLNDLNNLSINREEDTKLSQYEKEQIIEKIFKVRKTPTLTQIAKLLKVDPTNIKGFRTKANGTPDFLSIKIYHDLKGIIDDKQLLDDIAFLDNVAQILTVWQDSQSIQEKLKTLNKNLDDKTIKEISELKKYTQTHSLSLKLINVLLPELWETTKNQMTILSELKLKPRKIDLHNCNEIPVNMINDLIVSPVVRRSLTQSIEMINQIIKDYGHPREIVIELAREKNSEEKKNFIKSLNEKNKQINDEVIEKLNASNHRDNKGMFNKVKLWILQDGHCLYSLKPIRLEDLLNNPNHYEIDHIIPKSVSFDDSMSNKVLVYQIENSKKGNRTPYQYLTSADKTITYEKFKANITQLAKSNHKISKKKLDYLLEERDINRFHIKKEFINRNLVDTRYATRSLINLLKYYFSEKDINVKVKSINGSFTDYLRKLWNFPKDREFYHKHHAEDALIIAMANKIFTTRKIFKEQNSVFSDEQILDGEVTNILSDDQFQAEFTEKFYKVQAIKKYDKYKYSHRVDKKPNRQLFDDTLYSTREFEGEEYYIGKIKDIYNLKDKRLKKIFTKSPEKILMYQHDSQTFKKLKQIMRSYEDEVNPLAKYHKETGEYLRKECKKGNGPIVKSLKYRVTKLGVHKDITHKYENSKNKVVILSLKPFRMDVFKENGVYKFITIRYCDLKETVNSYTISEHLYKAKLKAKDIKSMDSFKWSFYKNDLLEYNGELCTFKGVNDDKKNKIEVNWVEKNFAIYAEKKNLKSKQLVKSITKSTVKSLLKYTTDILGNRYPVRNEKLKLMIRKQTFRGDL |
90 | nAPG09748 | MAIRSIKLKLKTRTGPEAQNLRKGIWRTHRLLNEGVAYYMKMLLLFRQESTGGQTKKELQEELVRHIREQQQKNRADKNTQALPLDKAFAALRQLYELLVPSSIGQSGDAQIISRKFLSPLVDPNSEGGKGTSKAGAKPTWQKKKEANDPTWEQDYEKWKKRREEDPTASVITTLEEYGIRPIFPLYTNTVADIAWLPLQSNQFVRTWDRDMLQQAIERLLSWESWNKRVQEEYSKLQEKMTQLNEQLEGGQEWISLLEQYEEQREQELIENMTAANDKYRITKRQMKGWNELYEQWSTVLPNASHEQYREALKRVQQRLRGRFGDAHFFQYLMKEEHHLIWKGNPQRIHYFVARNELKKRLEEAKQNATMTLPDARKHPLWVRFDARGGNLQDYYLTAEADNPRSRRFVTFSQLIWPNESGWMEKQDVEVELALSKQFYQQVTLQKNDKGKQEIEFKDKGSGSTFSGHLGGAKLQLERGDLEKEEKDFEGGEIGSVYLNIVIDFEPLQEVKNGRLQSPYGQVLQLVRRPNEFPKVTTYKSEELVEWIKSSTKDSAGVESLESGFRVMSIALGLRTAAATSIFSVEESNDANAAGFSYWIEGTPLVAVHKRSYMLKLPGEQVEKQVREKRDERQDQQRRVRFQIRILSQVIRMAKKQNRERADELDHLSQALEKQKSLLDQTDRTFWNGIVCDLTDALREKEGGWEQAVVQIHRKAEEHVGKVVQAWRKRFDADERKGIAGLSMWSIEELDSLRKLLISWSRRTRNPREINCFEQGHTSHQRLLTHIQNVKEDRLKQLSHAIVMTALGYVYDEKKLEWFAKYPACQVILFENLSQYRSNMDRSTKENSTLMKWAHRSIPKYVHMQAEPYGIQIGDVRAEYSSRFHAKTGTPGIRCKMVSGHDLQGRRFENLQKRLISEQFLTEEQVKQLRPGDIVPDDSGEWFMTLSDGSEGKEVVFLQADINAAQNLQKRFWQRYNELFKVSCRVLIRGEEEYLIPKTKSVQAKLGKGLFVKKTDTVMKDVYVWDSQAKLKGKTTFTEESESPEQLEDFQEIIEEAEEAKGTYRTLFRDPSGVFFPEFVWSTQKDFWSEVKRRLYGKLRERFLMKTR |
91 | nAPG06646 | MRYSIGLAIGTTSIGNAVINKDLQRFEHLGVRIFDAAENPKDGSSLSAPRRLARSSRRRLRRRKHRVERTKQLLINKGLLTKTQVKNLYNSKNINLDIWDIRVSGIDRKLFNNEFARVLIHFSKNRGFKSNRKSELKEDDNGAILSAVKENRELMDEKGYRTIAEMLVSDEKYEGTKRNKGGDYSHVVARSDIENEICLLFQKQREYGHPFATEENEEAFLSIWSSQRPFSTKDDIVKKIGNCTLEPKEKRAPKSTYTFERFRALDKLNRLRILSTTAPSRPLTNEERKSILSSLFSKKEVKYKELRKLLKLTDDQRFNEIYYSPDETIEKTENRTFLSLESQYKIKKIIEKTESKNMQSSYHPIDYDTIGYALTVFKDDKDIQHYLQNSYIDSKGKAIPNMANREYNLELIEELLGLSFAKFGHLSLKALNNILPYMEEGEPYHIACEMASYQFSQRLSKEKHRLLPPIPVDEIPNPVVVRALTQVRKVLNSIIKKYGPPSDIYIELAREMSKPFKERKSLEREFNENRQINEKAKAHISELYRIPNDPRPHDILKFKLWNEQNGICPYSLKPISIEYLFNIGYAEVDHIIPYSRSFDDSNGNKVLVLTRENQNKLNRTPYEWFGHEENRWEDFVSFIRTMKVGKKKKNMLLKKNFDEEQEEQILSRNLNDTRYITRYIKSFIEDNLEFRTEENKEQYVHTVNGAYTSLMRKRWGLNKDRRGNDLHHAVDAAIIAVSLPFKNKVNAYFKRQETGLSKLLNNKKDIFPEPWRNFIKELEARMIQDPEKMKRALESLELETYGEIFLNKLKPIFVSRMPKHSIKGQIHEETIRRVRGFTEEGFLVTVKKTRLDQIPFDKNGDFPMYGKETDIKTYMAIKQRYLEYGQDKQKAFAVPLRKPSKNPKNAPIVRSVKIEGKANRVVMLDDKAAADNASIVRTEVFRHKKTGEYYLTPVYVADILSNKIPDRLITIKKSYSDWDRITDEHEYLFSLYNNDLVKIILPKEKETKKYTGGNHLWQEGFFYFKGVDSSNAGIKIINHLNSFEARIGTKRLIAFEKYQVNPLGEINKVHGEKRPGELLNKEEIKENRKNIS |
92 | nAPG09882 | MYSIGLALGISSVGWSVIDERTGNVIDLGIRLFSAKNSEKNLERRTNRGGRRLIRRKTNRLKDAKKILAAVGFYEDKSLKNSCPYQLRVKGLTEPLSKGEIYKVTLHILKKRGISYLDEDDTEAAKESQDYKEQVRENAQLLTKYTPGQIQLQRLKENNRVKTGINAQGNYQLNVFKVSAYANELATILKTQQAFYPNELTDDWIALFVQPGIAEEAGLIYRKRPYYHGPGNEANNSPYGRWSDFKKTGQPATNIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEIPLSPEQKEYILAELMTKEFTRFGVNDVVKLLGVKKERLSGWRLDKKGKPEIHTLKGYRNWRKIFAESGIDLATLPTETIDCLAKVLTLNTEREGIENTLAFELSELAESVKLLVLDRYKELSQSVSTQAWHRFSLKTLHLLIPELMNATSEQNTLLEQFQLKSDVRKRYSEYKKLPTKDVLTEIYNPTVNKTVSQAFKVIDALLVKYGKEQIRYITIEMPRDDNEEDEKKRIKELHAKNSQRKNDSQSYFMQKSGWSQEKFQTTIQKNRRFLAKLLYYYEQDGICAYTGLSISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSKANQVKGQQTPYDAWMDGSFKKINGKFSNWDDYQKWVESCHFSHKKENNLLETRNIFDSEQVEKFLARNLNDTRYASRLVLNTLQSFFANQETKVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVKEETGEKVMREIDFETGEIVDEMSYREFKKSKKYERKTYQVKWPNFREQLKPVNLHPRIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKQKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKDLDEKTYERLLSIAETTPDFQEVEEKNGKVKRVKRSPFAVYCEENDIPAIRKYAKKNNGPLIRSLKYYDGKLNKHINITKDSQGRPVEKTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGKYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQCYDVRFYNFQSANSINFKGLEQEMMPAENQFKQKPYNNGAINLNIAKYGKEGKKLRKFNTDILGKKHYLYYEKEPKNIIK |
93 | nAPG03850 | MKYVLGLAIGIASCGWAVINQEKHRIEDLGVRIFDKAENPKDGKSLATPRRDARSTRRTLRRKKHRMQRIKILLVKHGLLSKTEIDHLYESATEIDVWYLRLNALERRLNPKEFARVLIHLAKRRGFKSNRKETTLSENGQILENISENLQIMEQQNYRTVGEMILKDKKFENHKRNKDGTYIGTVTRQQLKEEIQMIFNAQRLYKNDYATEEFESSYLEIWASQRPYASKDQIEKMIGYCTLEPKEKRVPKASWSFQYFVALQTINNLRLINKDRIEELSFEEKNQIMNLALEKSIVKYIDIRKLLSIPNEFHFNNLLYSADTVDTAVENKKCIEFKEYHSINKLYKQIYGKSVPNLLPIDYDTIACGLTIFKDDKDILAYLQNKYVNAKGKPISNLAKKTYDDTFIQALLTLNFSKMGHLSFKALKNIIPFLEEGLSYDKACEKAGYNFKGTSHAEKTKYLPVIPQNTNPVVHRALSQTRKVINAIIKKYGSPSAIHIETARELSKTFQERKEIDSMYQDNSKKNEHAIHKLKELGLINPSGINIVKFKLWNEQDGRCMYSGKYIEPHRLFEEGYTEVDHILPYSRSLDDSYNNKALTLGIENQRKGNKTPYEYIGKTSIWHEFETRVQSNKRINKKKQQKLLLQYFSYTREQEFIKRNLNDTRYATIYLSTLIQQHLIFSESSRKKKVHTVSGIITSHLRSRWGFNKDRKEGHIHHALDAVIVAVTSDHMIQRVTKYYKLKELNRNLQAKRMQFPEPWEGFRLELEARISPNTQQYLKRILFKNYADVNLSEIKPIFVSRMPKRSITGELHQETIRKLIGYNEKGKVLTAIKTKLEDIPFDANGDFPMYGKETDLYTYNAIKERYLSHKKDKRKSFQDPLYKPTKSGEIGPLIKSIKIMDTRTIVNPVNQGKGVVYNSKIARTDVFKKDEKYYLIPIYTIDLLKNILPQKAITAGKGYEDWTTIDPSFTFLFSLFPNDLIQIVPSKNKTIKARTTVSKKEVLLPSLTGYFKGVHSGTAGITVETHDGSVIANVGSKQLLLFEKYQVDVLGHYTKIKEEKRIGMVI |
94 | nAPG07553 | MQYVLGLAIGIASCGWAVINQEKERIEDLGVRIFDKAENPKDGKSLAAPRRDARSTRRTLRRKKHRMQRIKILLVKHGLLSQTELDHLYESATEVDVWNLRLDAIERKLNPKEFTRVLIHLAKRRGFKSNSKETTLSENGQILESISENQQIMEQKNYKTIGEMILKDKKFENHKRNKDGTYIGTVTRQQLQDEIQIIFNAQRLYKNNYATKEFESSYLEIWASQRPYASKDQIEKMIGYCTLEQKEKRVPRASWSFQYFVALHTINNLRLISKDRIEELSFKEKKQIMNLALEKPIVKYIDIRKLLSIPNELHFNSLLYSADTVDTTVENRKCIELKEYHSINKVYKQIYGKNALNLLPIDYDTIAYGLTIFKDDKDILEHLKNKYVNAKGKPINNLAKKTYDDTFIQALLTLNFSKMGHLSFKALKNIIPFLEEGLSYDKACEKAGYNFKGTSYTEQTKYLPVIPQNTNPVVHRALSQTKKVINAIIKKYGSPNAIHIETARELSKTFQERKEIDSMYQDNSKKNEHAIHKLKELGNINPSGINIVKFKLWNEQDGKCMYSGKYIEPHRLFEEGYTEVDHILPYSRSLDDSYNNKTLTLGIENQRKGNKTPYEYMGNTSIWDEYEIRVQSNKKINKKKQQKLLLQHFSYAREQEFIERNLNDTRYATIYLSSLIQQHLIFSESSRKKKVHTVSGIITSHLRSRWGFNKDRKEGHIHHALDAVIVAVTSDHMIQRVTKYYKLKELNRNLQAKRMPFPEPWEGFRLELEARISPNTQQYLKGLRFKNYADVNLCEIKPIFVSKMPKRSITGELHQETIRKFIGYNEKGKVLTAIKTKLEDIPFDANGDFPMYGKETDLYTYNSIKERYLSHKKDKRKSFQEPLYKPTKSGGIGPLIKSIKIMDTRTIVNPVNQGKGVVYNSKIARTDVFKKDDKYYLIPIYTIDLMKNILPQKAITAGKGYEDWITIDHSFTFLFSLFPNDLIKIVPSKNKEIKARSTSSKKEILLPSLIGYFKSVHSGTAGITVESHDGRFIANVGSKQLLLFEKYQVDVLGHYTKIKEEKRIGMATCNDNKKSTAFGSL |
95 | nAPG055886 | MYSIGLALGISSVGWSVIDEETGKIVDLGVRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVSAYADELATILKTQQALYPNELTDDWIALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPEQKEFILTELMTKEFARFGVNDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEAGIDLATLPTETIDCLAKVLTLNTEREGVENTLAFELPELAEPVKSLVLDHYKELSQSISTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAGVRKRYSDYKKLPTKEVLAEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESRPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGKKLRKFNTDILGKKHHLSYEKEPKNIIK |
96 | nAPG01604 | MVTKYILGLAIGITSVGYGIINYEDKTIIDAGVRLFPEANVENNEGRRSKRGARRLKRRRIHRLDRIKQLLSEYNLVDLDNIPQSPSPYEIRVKGLREELSKDELVIALLHIAKRRGIHNVEAVDETQDEGNELSTKEQLAKNNNLLKDKYVCELLLERLKDGKVRGEKNRFKTTDIIKEVKQLLETQKEAHQLDDDFINRYIDLIETRREYFEGPGKGSPFGWGGDLKKWYETLMGHCTYFPNELRSVKYSYSADLFNALNDLNNLVIQREGNSKLEYHEKYHIIENVFKQKKKPTLKQIANEIGVSPDDIKGFRINKSGKETFTEFKLYHDLKKVLIDQSILENVQLLDQIAEILTIYQDKESIINELNQLSEIINEQDKESISNLSGYNGTHRLSLKCINLVIEELWHTSRNQMEIFTYLNIKPKKIDLAKTNKIPKNMIDEFILSPVVKRTFGQAINVINKVIEKYGVPEDIIIELARESNSKDKQKFINSLQKKNETTRKRINEIIGQYGNQNAKRLVEKIRLHDEQEGKCLYSLESIPLEDLINNPQYYEVDHIIPRSVSFDNSYQNKVLVKQTENSKKSNRTPYQYFNSGETKLSYNQFKQHVLNLSKSKDRISKKKKEYLLEERDINKYEVQKEFINRNLVDTRYATRELTNYLKAYFSANDMDVKVKTINGSFTDYLRKVWKFKKERNHGYKHHAEDALIIANADFLFKENKKLKKANAILEQPSLDNGKSDATVENDNEYVETFSIPKQVNDIKEFRDFKFSHRVDKKPNRQLINDTLYSTRKIENHTFIVSPITNIYSKDNDELKKKFNKNPEKFLMYQHDPKTFEKLEVIMKQYANEKNPLAKYHEETGEYLTKYSKKNNGPIVKTIKVLGDKVGKHLDVTHKYKYSNSKIVKKTINPYRFDVYLTDKGYKFITISYLDVLKKDNYYYILKEKYEELKIKKSISDTDQFIGSFYYNDLIKINDQIFKVVGVNNDLLNRIELDLLDISYKEYCKINNIKTNRIIKGITKKITNIEKFSTDVLGNLYKAHSNHPQLIFKQRD |
97 | nAPG07433.1-缺失變異體 | MRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNEPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFH |
98 | nAPG08290.1-缺失變異體 | MSELDYRIGLAIGTNSIGWGVIELFWNKDRERYEKVRIVDKGVRMFDKAEIPNKGASLAEPRRIARSSRRRLNRKSQRKKEIRNLLVQHGMITQEELDLLYPLSKKSIDIWDIRLDGLDRLLNHLEWARLLIHLAQRRGFKSNRKSELKDAETGKVLSSIQVNEKRLFLYRTVGEMWIKDAEFSKYDRRRNSPNEYVFSVSRADLEKEIVTLFEAQRKFQSSYASKNLQETYLQIWAHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTQEQKEIILDKMFQRTDYYKKKTIPEVSYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEIKKVVANYAERTNEAFSTLDYDAIAYALTVYKTDKDIRSYLKKSNNLSKRCYDDQLIEELFTLSYTKFGHLSFKAINHVLPIMQEGRTYQEAIHQLGYDTTNLKKENRSMFLPLIPDEITNPIVKRAITQARKVVNAIIRRYGSPNSVHIELARELSKSHDERKKIMTAHDENYKKNKGAISILIENGILNPTGYDIVRYKLWKEQGERCAYSLKEIPPDTFFNEPILEVDHILPYSQSFIDSYHNKVLVYSDENRNKGNRIPYTYFLETNKDWEAFERYVRSNKLFSKKKREYLLKKTYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEVEVNLRKKRVQTVNGVITAHLRKRWGLEKNRQETYLHHAMDAIIVACTDHHMVTRITEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSSDYIFVSRMPKRSVTGAAHDQTIRRKGGIDKKGKTIIIKRVRLKDIKFDENGDFKMVGKEQDLATYEAIKQRYLEHRKNSKKAFETPLYKPSKKGTGNLIKRVKIEGQTKAFVREVNGGVAQNSDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVKSGKGYEQWLTLDNSFTFKSSLYPYDLVRLVKGNEDRFLYFGTLDIDSDRLNFKDVNKPSKQNEYRYSLKTIENLEKYEVGVLGDLRLVKQETRRIFNR |
99 | 釀膿鏈球菌Cas9 | MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKLKGLGNTDRHGIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKVDLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDATLLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLAKLNREDLLRKQRTFDNGSIPYQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSDILKEYPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKVGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVRVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKDPIDFLEAKGYKEVRKDLIIKLPK YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD |
100 | 釀膿鏈球菌Cas9 D10A切口酶 | MDKKYSIGLAIGTNSVGWAVITDDYKVPSKKLKGLGNTDRHGIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKVDLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDATLLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLAKLNREDLLRKQRTFDNGSIPYQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSDILKEYPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKVGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVRVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKDPIDFLEAKGYKEVRKDLIIKLPK YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD |
101 | 嗜熱鏈球菌Cas9 | MTKPYSIGLDIGTNSVGWAVTTDNYKVPSKKMKVLGNTSKKYIKKNLLGVLLFDSGITAEGRRLKRTARRRYTRRRNRILYLQEIFSTEMATLDDAFFQRLDDSFLVPDDKRDSKYPIFGNLVEEKAYHDEFPTIYHLRKYLADSTKKADLRLVYLALAHMIKYRGHFLIEGEFNSKNNDIQKNFQDFLDTYNAIFESDLSLENSKQLEEIVKDKISKLEKKDRILKLFPGEKNSGIFSEFLKLIVGNQADFRKCFNLDEKASLHFSKESYDEDLETLLGYIGDDYSDVFLKAKKLYDAILLSGFLTVTDNETEAPLSSAMIKRYNEHKEDLALLKEYIRNISLKTYNEVFKDDTKNGYAGYIDGKTNQEDFYVYLKKLLAEFEGADYFLEKIDREDFLRKQRTFDNGSIPYQIHLQEMRAILDKQAKFYPFLAKNKERIEKILTFRIPYYVGPLARGNSDFAWSIRKRNEKITPWNFEDVIDKESSAEAFINRMTSFDLYLPEEKVLPKHSLLYETFNVYNELTKVRFIAESMRDYQFLDSKQKKDIVRLYFKDKRKVTDKDIIEYLHAIYGYDGIELKGIEKQFNSSLSTYHDLLNIINDKEFLDDSSNEAIIEEIIHTLTIFEDREMIKQRLSKFENIFDKSVLKKLSRRHYTGWGKLSAKLINGIRDEKSGNTILDYLIDDGISNRNFMQLIHDDALSFKKKIQKAQIIGDEDKGNIKEVVKSLPGSPAIKKGILQSIKIVDELVKVMGGRKPESIVVEMARENQYTNQGKSNSQQRLKRLEKSLKELGSKILKENIPAKLSKIDNNALQNDRLYLYYLQNGKDMYTGDDLDIDRL SNYDIDHIIPQAFLKDNSIDNKVLVSSASNRGKSDDVPSLEVVKKRKTFWYQLLKSKLISQRKFDNLTKAERGGLSPEDKAGFIQRQLVETRQITKHVARLLDEKFNNKKDENNRAVRTVKIITLKSTLVSQFRKDFELYKVREINDFHHAHDAYLNAVVASALLKKYPKLEPEFVYGDYPKYNSFRERKSATEKVYFYSNIMNIFKKSISLADGRVIERPLIEVNEETGESVWNKESDLATVRRVLSYPQVNVVKKVEEQNHGLDRGKPKGLFNANLSSKPKPNSNENLVGAKEYLDPKKYGGYAGISNSFTVLVKGTIEKGAKKKITNVLEFQGISILDRINYRKDKLNFLLEKGYKDIELIIELPKYSLFELSDGSRRMLASILSTNNKRGEIHKGNQIFLSQKFVKLLYHAKRISNTINENHRKYVENHKKEFEELFYYILEFNENYVGAKKNGKLLNSAFQSWQNHSIDELCSSFIGPTGSERKGLFELTSRGSAADFEFLGVKIPRYRDYTPSSLLKDATLIHQSVTGLYETRIDLAKLGEG |
102 | 嗜熱鏈球菌Cas9 D10A切口酶 | MTKPYSIGLAIGTNSVGWAVTTDNYKVPSKKMKVLGNTSKKYIKKNLLGVLLFDSGITAEGRRLKRTARRRYTRRRNRILYLQEIFSTEMATLDDAFFQRLDDSFLVPDDKRDSKYPIFGNLVEEKAYHDEFPTIYHLRKYLADSTKKADLRLVYLALAHMIKYRGHFLIEGEFNSKNNDIQKNFQDFLDTYNAIFESDLSLENSKQLEEIVKDKISKLEKKDRILKLFPGEKNSGIFSEFLKLIVGNQADFRKCFNLDEKASLHFSKESYDEDLETLLGYIGDDYSDVFLKAKKLYDAILLSGFLTVTDNETEAPLSSAMIKRYNEHKEDLALLKEYIRNISLKTYNEVFKDDTKNGYAGYIDGKTNQEDFYVYLKKLLAEFEGADYFLEKIDREDFLRKQRTFDNGSIPYQIHLQEMRAILDKQAKFYPFLAKNKERIEKILTFRIPYYVGPLARGNSDFAWSIRKRNEKITPWNFEDVIDKESSAEAFINRMTSFDLYLPEEKVLPKHSLLYETFNVYNELTKVRFIAESMRDYQFLDSKQKKDIVRLYFKDKRKVTDKDIIEYLHAIYGYDGIELKGIEKQFNSSLSTYHDLLNIINDKEFLDDSSNEAIIEEIIHTLTIFEDREMIKQRLSKFENIFDKSVLKKLSRRHYTGWGKLSAKLINGIRDEKSGNTILDYLIDDGISNRNFMQLIHDDALSFKKKIQKAQIIGDEDKGNIKEVVKSLPGSPAIKKGILQSIKIVDELVKVMGGRKPESIVVEMARENQYTNQGKSNSQQRLKRLEKSLKELGSKILKENIPAKLSKIDNNALQNDRLYLYYLQNGKDMYTGDDLDIDRL SNYDIDHIIPQAFLKDNSIDNKVLVSSASNRGKSDDVPSLEVVKKRKTFWYQLLKSKLISQRKFDNLTKAERGGLSPEDKAGFIQRQLVETRQITKHVARLLDEKFNNKKDENNRAVRTVKIITLKSTLVSQFRKDFELYKVREINDFHHAHDAYLNAVVASALLKKYPKLEPEFVYGDYPKYNSFRERKSATEKVYFYSNIMNIFKKSISLADGRVIERPLIEVNEETGESVWNKESDLATVRRVLSYPQVNVVKKVEEQNHGLDRGKPKGLFNANLSSKPKPNSNENLVGAKEYLDPKKYGGYAGISNSFTVLVKGTIEKGAKKKITNVLEFQGISILDRINYRKDKLNFLLEKGYKDIELIIELPKYSLFELSDGSRRMLASILSTNNKRGEIHKGNQIFLSQKFVKLLYHAKRISNTINENHRKYVENHKKEFEELFYYILEFNENYVGAKKNGKLLNSAFQSWQNHSIDELCSSFIGPTGSERKGLFELTSRGSAADFEFLGVKIPRYRDYTPSSLLKDATLIHQSVTGLYETRIDLAKLGEG |
103 | 金黃色葡萄球菌Cas9 | MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD |
104 | 金黃色葡萄球菌Cas9 D10A切口酶 | MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD |
105 | 新澤西弗朗西斯菌Cas12a | MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNS IDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN |
106 | APG07433.1缺失變異體 | MRELDYRIGLDIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNEPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFH |
107 | APG08290.1缺失變異體 | MSELDYRIGLDIGTNSIGWGVIELFWNKDRERYEKVRIVDKGVRMFDKAEIPNKGASLAEPRRIARSSRRRLNRKSQRKKEIRNLLVQHGMITQEELDLLYPLSKKSIDIWDIRLDGLDRLLNHLEWARLLIHLAQRRGFKSNRKSELKDAETGKVLSSIQVNEKRLFLYRTVGEMWIKDAEFSKYDRRRNSPNEYVFSVSRADLEKEIVTLFEAQRKFQSSYASKNLQETYLQIWAHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTQEQKEIILDKMFQRTDYYKKKTIPEVSYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEIKKVVANYAERTNEAFSTLDYDAIAYALTVYKTDKDIRSYLKKSNNLSKRCYDDQLIEELFTLSYTKFGHLSFKAINHVLPIMQEGRTYQEAIHQLGYDTTNLKKENRSMFLPLIPDEITNPIVKRAITQARKVVNAIIRRYGSPNSVHIELARELSKSHDERKKIMTAHDENYKKNKGAISILIENGILNPTGYDIVRYKLWKEQGERCAYSLKEIPPDTFFNEPILEVDHILPYSQSFIDSYHNKVLVYSDENRNKGNRIPYTYFLETNKDWEAFERYVRSNKLFSKKKREYLLKKTYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEVEVNLRKKRVQTVNGVITAHLRKRWGLEKNRQETYLHHAMDAIIVACTDHHMVTRITEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSSDYIFVSRMPKRSVTGAAHDQTIRRKGGIDKKGKTIIIKRVRLKDIKFDENGDFKMVGKEQDLATYEAIKQRYLEHRKNSKKAFETPLYKPSKKGTGNLIKRVKIEGQTKAFVREVNGGVAQNSDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVKSGKGYEQWLTLDNSFTFKSSLYPYDLVRLVKGNEDRFLYFGTLDIDSDRLNFKDVNKPSKQNEYRYSLKTIENLEKYEVGVLGDLRLVKQETRRIFNR |
108 | APG09980哺乳動物密碼子最佳化序列 | ATGGCCGCTGGACCTGCCCCTGAAGCCAGAAGCCTGATGGACGAGCAGACCTTCCTGGATAACTTCAACAACCTGAAGTACCCCAGAAAGACCTACCTGTGCTACGAGGTGGAACTGCTGGTGGGCGAGAACCACATCCCTCTGGACGACTACAAGGGCTTCGTGCACAACGAGGGCTTTGATATGGGCCTGGAACGGTGCCACGCCGAGCTGATCTTCCTGGAAAGAATGGCCTCTTGGAATCTGGACACCGAGCTGAGATACCGGATCACCGTGTTCATCTCTTGGTCCCCATGTCCTGAGTGCGCCGACGAGCTGGTTAAGTTCCTGCGGGAAAATAGACACGTGAACCTGAGAATCTTTGCCGCTAGAATCTACGACTGGTATCAGGGCTACGAGGCCGGCCTGCGGGCCCTGAAAGCCGCCGGAGCCGAAGTGGCCATGATGACCCTGCACGAGTTCGAGTACTGCTGGAACAACTTCGTGGACCACCAGCAGGACGAAGATACACCTTTCCCCCCCTGGGACAACCTGGTCGCCAGATCCGAGGAACTGAGCCAGAGACTGGAAGGCATCCTGCAGCCTAGCGTGCTGGTGTTCTGCTGGCCTAGCCAAGTGTCCGTGACCGCCGCCCACAGCGACATCATGAGCCAGGCCTCTAGAGCCTGGGAGAAGCGGCGGGACCCCCCC |
109 | APG09980.1哺乳動物密碼子最佳化序列 | ATGGACGAGCAGACCTTCCTGGATAACTTCAACAACCTGAAGTACCCCAGAAAGACCTACCTGTGCTACGAGGTGGAACTGCTGGTGGGCGAGAACCACATCCCTCTGGACGACTACAAGGGCTTCGTGCACAACGAGGGCTTTGATATGGGCCTGGAACGGTGCCACGCCGAGCTGATCTTCCTGGAAAGAATGGCCTCTTGGAATCTGGACACCGAGCTGAGATACCGGATCACCGTGTTCATCTCTTGGTCCCCATGTCCTGAGTGCGCCGACGAGCTGGTTAAGTTCCTGCGGGAAAATAGACACGTGAACCTGAGAATCTTTGCCGCTAGAATCTACGACTGGTATCAGGGCTACGAGGCCGGCCTGCGGGCCCTGAAAGCCGCCGGAGCCGAAGTGGCCATGATGACCCTGCACGAGTTCGAGTACTGCTGGAACAACTTCGTGGACCACCAGCAGGACGAAGATACACCTTTCCCCCCCTGGGACAACCTGGTCGCCAGATCCGAGGAACTGAGCCAGAGACTGGAAGGCATCCTGCAG |
110 | APG05840哺乳動物密碼子最佳化序列 | ATGGAAGCCAGCCCTGCCTCTAGACCCAGACCTCTGATGGACCCCCACATGTTCACCGGCAACTTCACCAACAACCCTAGAGTGTTCGGCCTGCACCAGACATACCTGTGTTACGAGGTGAAGCGGCAGGGTCCTGACGGCACAAGAGACCTGATGAACGAGCAGAGAGATTTCCTGTGCAACCAGGCCAAGAACCACTTCAGCGGCAGCGAAGATCACCACGCCGAGCGGTGCTTCCTGGACCGGATACCTAGCTGGCAACTGGACCCTGCTCAAACATACAGAGTGACCTGTTTTATCTCTTGGTCCCCGTGCTTTAGCTGCGCCCAGGAGGTGGCCGAGTTCCTGCACGAGAACCCCCACGTGAACCTGAGAATCTTCGCCGCTAGAATCTACGACTACCTGCCTAGATACGAGGAAGGACTGCAGATGCTGCAGAACGCCGGCGCCCAGGTGTCCATCATGACCAGCGAGGAATTCGGCCACTGCTGGGACACCTTCGTGGACAGACAGGGACACCCCTTCCAGCCTTGGGAGGGCCTGGACGAGCACAGCCAGGCCCTGAGCGGCAGACTGCAGGCTATCCTGCAAAACCAGGGCAAT |
111 | APG05840.1哺乳動物密碼子最佳化序列 | ATGGACCCCCACATGTTCACCGGCAACTTCACCAACAACCCTAGAGTGTTCGGCCTGCACCAGACATACCTGTGTTACGAGGTGAAGCGGCAGGGTCCTGACGGCACAAGAGACCTGATGAACGAGCAGAGAGATTTCCTGTGCAACCAGGCCAAGAACCACTTCAGCGGCAGCGAAGATCACCACGCCGAGCGGTGCTTCCTGGACCGGATACCTAGCTGGCAACTGGACCCTGCTCAAACATACAGAGTGACCTGTTTTATCTCTTGGTCCCCGTGCTTTAGCTGCGCCCAGGAGGTGGCCGAGTTCCTGCACGAGAACCCCCACGTGAACCTGAGAATCTTCGCCGCTAGAATCTACGACTACCTGCCTAGATACGAGGAAGGACTGCAGATGCTGCAGAACGCCGGCGCCCAGGTGTCCATCATGACCAGCGAGGAATTCGGCCACTGCTGGGACACCTTCGTGGACAGACAGGGACACCCCTTCCAGCCTTGGGAGGGCCTGGACGAGCACAGCCAGGCCCTGAGCGGCAGACTGCAGGCTATCCTGCAA |
112 | APG00868哺乳動物密碼子最佳化序列 | ATGGAACCTTGGCGGCCTAGCCCTAGAAACCCTATGGACAGAATCGACCCCAACACCTTCCGATTTCACTTCCCCAACCTGCTGTACGCCAGCGGAAGAAAGCTGTGCTACCTGTGTTTTCAGGTGGAGACAGGCGACTACTTCTCTTGCGACGACAGCGACCGGGGCGTGTTCAGAAACAAGGTGCACCCCTGGGCCAGATGCCACGCCGAGCAGTGCTTCCTGAGCTGGTTCCGGGACCAGTACCCCTGCAGAGATGAGTACTACAACGTGACCTGGTTTCTGAGCTGGTCCCCTTGTCCTACATGCGCCGAGGAAGTGGTGGAATTCCTGGAAGAGTATAGAAATCTGACCCTGTCTATCTTCACCAGCAGACTGTACTACTTCTACCACCCTAACTACCAGCAGGGCCTGCGGAAGCTGTGGGATGCCGGCGTGCAACTGGACATCATGAGCTGTGATGATTTCGAGCACTGCTGGGACAACTTCGTGGACCACAAGGGCATGAGATTCCAAAGAAGAAACCTGCTGAAGGACTACGACTTCCTGGCCGCTGAGCTGCAGGAGATCCTGAGA |
113 | APG00868.1哺乳動物密碼子最佳化序列 | ATGGACCCCAACACCTTCCGATTTCACTTCCCCAACCTGCTGTACGCCAGCGGAAGAAAGCTGTGCTACCTGTGTTTTCAGGTGGAGACAGGCGACTACTTCTCTTGCGACGACAGCGACCGGGGCGTGTTCAGAAACAAGGTGCACCCCTGGGCCAGATGCCACGCCGAGCAGTGCTTCCTGAGCTGGTTCCGGGACCAGTACCCCTGCAGAGATGAGTACTACAACGTGACCTGGTTTCTGAGCTGGTCCCCTTGTCCTACATGCGCCGAGGAAGTGGTGGAATTCCTGGAAGAGTATAGAAATCTGACCCTGTCTATCTTCACCAGCAGACTGTACTACTTCTACCACCCTAACTACCAGCAGGGCCTGCGGAAGCTGTGGGATGCCGGCGTGCAACTGGACATCATGAGCTGTGATGATTTCGAGCACTGCTGGGACAACTTCGTGGACCACAAGGGCATGAGATTCCAAAGAAGAAACCTGCTGAAGGACTACGACTTCCTGGCCGCTGAGCTGCAGGAGATCCTGAGA |
114 | APG30125哺乳動物密碼子最佳化序列 | ATGATCAACCTGGTCCAGACCCCTTACGACCTGAACTCCGGCTACCCCATCGTGCGGAGAACACTGGAAGATAAGAAGAAACTGGTGAAGCACGAGGGCTTCGGCCCCGAGAGCTGCTGCGCCACCATCGAGTACACCCTGCGGGGCAACAGCAGATACGCCTTTGGAAATTCTCAGATGCAGGTGGAAATGCCTCCAAACATCTACGCCCACAATTGGGTTAAGCTGCATGGCGAGATGACCGCCCTGGTGGCCGCTATCAGGCGGATCGAGAGAGTGGACAGCACATCCGCCGTGCTGCCTATCACCAGCGCTTATATCGAGCTGAGACCTTGTGAAGCCTCTTGCCTGCCTGCTCTCCACAACATGCTGCCCGACAACATTACAGTGTACTTCAGCTTCCTGCATCCTACCCAAGTGGATCAGTGGAAGCAGAGCGCCAGAGCCCTGTGCGCC |
115 | APG30126哺乳動物密碼子最佳化序列 | ATGATCAACCTGGTGCAAACCCCTTACAACCTGCGGAGCGGCTACCCCATCGTGCGGAGAACACTGGAAGATAAGAAAAAACTGGTCAAGCAGGACGGCTTTGGACCTGAGAGCTGCTGCGCCACCGTGGAATACACCCTGAGAGGCAATTCTAGATACGCCTTCGGCAACAGCCAGATGCGGATTGAAATGCCTCCTGACATCTACACAAACAACTGGGTGAAGCTGCATGGCGAGATGGCCGCCCTGATCGCCGCTATCAGAAGAATCGAGAAGTCCGGAAATGGCGACGAGCAGCTGCCTATCACCAGCGTGTATATCGAGCTGCGCCCATGTGAAGCCAACTGCATGCAGGCCCTGCAGAACATCCTGCCCGACAACACCACAGTGTACTTCAGCTTCCTGCATCCTGATCAGGTGGACGAGTGGAAGCAATCTGCCAGAGCCCTCTGTGCT |
116 | APG30127哺乳動物密碼子最佳化序列 | ATGATCAAGACCGAGTACTCTCTGAGCAGCGGCTACCCCATCGTGCGGAGAACCCTGGAAGATAAGAAAAACCTGGTCAAGCAGCCTGGATTTGGCCCTGAGAGCTGCTGCGCCGTGGTGCAATACAGACTGAGAGGCAATATCAGATACGCCTTCGGCAACAGCAGAATGCAAATCAGCATGCCTCCAGGCATCTACACCCACAACTGGGTGCGGCTGCATGGCGAGATGGCCGCTCTGGTGGCCGCCATCAACAGAATCGAGCGGTACTCTACAGACGACGTGATCCCTATTACAGCCGCTTATATCGAACTCCGCCCCTGTGAAGCCAATTGCATGCAGGCCCTGCGGAACATCCTGCCTGAAGATGCTTGTGTGTACTACTCCTTCGACCACCCCACCCAGGTGGACGAGTGGAAGCTGAGAGCCAACGAGCTGTGTAGC |
117 | APG30128哺乳動物密碼子最佳化序列 | ATGATCCAGCTCGTGCAAGCTGAATACAGCATCAAGTCCGGCTACCCCATCGTGCGGAGAACACTGGAAGATAAGAAAAAGCTGATTGAGAAGCCCGGCTTCGGCCCTGAGAGCTGCTGCGCTACCATCGAATATCAGCTGCGGGGATCTACAAGATACGCCTTTGGCAACAGCCAGATGAAAATGGAAATGCCTCCAGACATCTACACCCACAACTGGGTCAAGCTGCATGCCGAGATGGCCGCTCTGGTGGCCGCCATCAGAAGAATCGAGAGATTCGACGCCGACAAGGAACAGGTGCCTATCACAAACGTGTACATCGAGCTGAGACCTTGCGAGGCCAATTGCATGCAGGCCCTGCAGAACATCCTGCCTGATGGCACCACCGTGTACTACAGCTTCCTGCATCCTACCGAGGTGGAAGAGTGGAAGCGGAGCGCCCACGAGCTGTGT |
118 | APG30129哺乳動物密碼子最佳化序列 | ATGATCAAGACCGAGTACGCCCTGAACTCTGGCTACCCCATTGTGCGGAGAACCCTGGAAGATAAGAAGAAACTGGTGAAACAACCTGGCTTCGGACCTGAGAGCTGCTGCGCCGTGGTGGAATATAGACTGAGAGGCAACATCCGGTACGCTTTTGGAAACAGCCAGATGCACGTGTCCATGCCTCCAGGCATCTACACACACAACTGGGTGAAGCTGCATGGCGAGATGGCCGCTCTGGTCGCCGCTATCAACAGAATCGAGAGATTCAGCACCGACGACGTGATCCCCATCACCGGCGCCTACATCGAGCTGCGCCCCTGTGAAGCCAATTGTCTGCAGGCCCTCCATAATATCCTGCCTGAAGATGCCAACGTGTACTACAGCTTCGACCACCCTACACAGCTGGACGAGTGGAAGCTGCGGGCCCACGAGCTGTGC |
119 | APG30130哺乳動物密碼子最佳化序列 | ATGATCAAGACCGAGTACACCCTCAGATCTGGCTACCCTATCGTGCGGAGAACCCTGGAAAACAAGAAAAACCTGGTGAAGCAGCCTGGATTCGGCCCTGAGAGCTGCTGCGCCGTGGTGGAATATAGACTGCGCGGAAATATCCGGTACGCCTTTGGCAACAGCAGAATGCAGGTGTCCGTGCCCCCCGGCATCTACACCAACAACTGGGTGCGGCTGCATGGCGAGATGGCCGCTCTGGTCGCCGCTATCGAAAGAATCGAGAGATTCAGCAGCGACGATGTGATCCCCATTACAGCCGCCTACATCGAGCTGAGACCATGTGAAGCTAATTGCATGCAAGCCCTGCATAACATCCTGCCTGAGAACGCCAACGTGTACTACAGCTTCGACCATCCTACACAGGTTGAGGAATGGAAGCTGCGGGCCCACGAGCTGTGC |
120 | nRGN與USP之間的胜肽連結子 | SGGSGGSGGS |
121 | NPC1基因序列 | CTTCCTGACCGGCGCGCGCAGCCTGCTGCCGCGGTCAGCGCCTGCTCCTGCTCCTCCGCTCCTCCTGCGCGGGGTGCTGAAACAGCCCGGGGAAGTAGAGCCGCCTCCGGGGAGCCCAACCAGCCGAACGCCGCCGGCGTCAGCAGCCTTGCGCGGCCACAGCATGACCGCTCGCGGCCTGGCCCTTGGCCTCCTCCTGCTGCTACTGTGTCCAGCGCAGGTGAGCGGTCGCCGGCCACCGGGACGCCCTGTGGGGACGTGGCGGGGCCGAGAGCCGGGGAAGGCGACGGGCCCAGCGACGGCTCAGGCCCGGGTCCTGGGGAAGTTGGTCTGGCGATGGAGAGCTCGGAGGTTCCTCACTTGTCCTGTTTCTGTCTCCGGCCACGCTCTCTTTCCTGTGGTCTGGAAGAGGGTGGCAGTGGGGGCTTGGGTGACCTGTTCTGAGCTTGTTCCATCTGTGGTCACCTAATTTCTCTGTGTAGGATGTGGCACCAGAAGAAGGGAGGAAAGTGGGTAGAGTGGGATAGGGACACTACTTGCTTTTTAAAAAATTCTGCTACATGCGCACGAACTCCAAAATTTAGGAGCTCTAACCACTTTATTTCCTCTTCTCATCACCTGAGGATGGAGGTGGAAGCAGAGGTAAAGAGACACAAACTTCCTCAAGCACCCGGTGAAACTGCCTTGAGTACTTGACATAAGTCAGCTTGGTCTTCTAAAGAGGGCAGGTTACTTTTCATCAACTCCTTTTTACACCTCAGGACACTGAGACTCACAGGGCGGTATTGAATTTCCCCTTGTCACTATTAGCCAGCGACAGGATGGGGCCTGGAACTCGGTGTCCTGCTGACTCCTTCTGGGGGCTTTTGCTTGGTTTAATAGCTTTGGGAAAGAGCACCTCAGTATTTGTGTGTCTGTAGTTTCCTCTTTTAAAACTGGAGTGGGGCAGTGTCACGCTGTGACTCGTTAAACCAAATCAGGATGAGAGTGCCTCCGGGGAATTGTGTCCTTGTGCACATTAACGCCCCTCACATAGGTGTGGCGTCAATAGGAAGTGGTGAATCAGGGGAGAGGGGGTTCCGTGGACTAGAAAAAACTCTCCTTCGACTTCTATTTAGTTCTCAGAAGGGGATAGGTGATGTTGATCCAATAATGGACTAAGAGCCAGGAGAAGGGCTCCGCGGGAGGATCTCTTGAGCTCAGCAGTTCAAGACCAGCCGGGGCAACATGGTGAAACACCGTCTTAAAAACATTTTGTTTTTCTTTTCATTGTTGAGGTTGAGGCTGCTGTGAGCTGTGATCACGCCGGTGTACTCCAGCCTGGGCAACAGAGCAAGACCCTGTGTCAAAACAAAAAAGAGAGAGAAATAAATAATAGCAATTATGTGCCGTAGAGAAAATGTGGCTATTCTGTTTCCCTAGAGTTTTTTAAAATTTATTTTTAAAATTTATTTATTTTAGAGACAGGTTCTTGCTCTGTTGCCCAGGCGTGGGGGCAGTGTCGCCATCATAGCTCACTGCAGCCTGGAACTCCTGGCCTCAAGCAGTCCTTCCACCTTGGCCTCCCAAAGCACTGGGATTATTGTGAGCACCACTCCTGGCCCCTCCTAGAGTTTTAGATCAGGACCTTAAATAGGCTTCCCTTTTTTTTGGAGACAGAGTCTCTGTTGCCCAGTCTGGAGTGTAGTGGCGCAATCTCGGCTCACTGCAACCTCTGCCTCCTGGATTCAAGCAATTCTGGTGCCTCAGCCTCCCAGGTAGCTAGGATTACAGGTGCCCACCACCACGCCCAGCTAATTTTTGTATTTTCCGTGGAGATGGGGTTTCACCGTGTTGGTCAGGCTGGTCTCGAAATCCTGACCTCTAGCGATCCGCCCTCCTCTTTTGGGGATTACAGGTGTGAGCCACCTCGCCCAGCCAGGCTTCACATTATTAAGTAGCCATCTCTTAAGTATTTTTTAAATCTCAAGTACCCAAGGCTGATGGCCAATGAGTGCTTCTTTTATGACATTTGGGATAGGTCAGAGGTTTGTTGTAAGTCTCTTGCAAAAATGCCTGGAGGCCTTTTCAAGGTCTGTAAACCTTAACTGGAAATAATCCTATTATTATTTTAAAAATTCCTCATGTCTGAAAGCTTTCAGTGCACCTGAACAGATTGGGGTGGAGCCATGAAGCCAAACAGATTGGGAGAGAGAGTGTGTCTGCTTTTAGAATTCGTACCGATGATAGCAGCTCATTAGCTTCAGTCTGAGCGCTAGTAGAGTTCTATCATGGAATTATGGACTAGTTGTCCTGTGTAAGATCTGAAATACATGTTGGGGGGATTTTTGCTTTTTCTTAATGTTCAATATGTACAGATGATGTAATAACATTACTAGACTGCCTTGTTTTTAAAACCCTGTAGTCATCTAAAAACTATATGCAGTTTTGAGACATAGCCTTTATTTTTCCCGGCTGTAATTTTGGTAAGCTTTATCTTGAGGGACTTGGAACATAGAGAAGCCTGGGTAGAAATTAAGCATTAAAATGGCTTTTCCTCAGAAGACTGGGAATGGTTAATCTTTTGACCTGTGAGTGATTAAGAACAACCATCTGAAATTGGAATGACTGTGGGAAATCTTTCCCCATCTTTCCCACTCCTTGACTGATGCTGTGATCAGAAATTTTACTAACATAAGTAATCAAGGGGAAAATGAGATTTTTTTAAATTTGAGCCAGTGGGCAGAGGGAAAAGGACTCGCTGAATAGGCCTTTGTATTCCTCCAGTGTTTGTTATATTACCCAGAACAAAGAATCACTCTGGTCATGAAGACAGTGTGCTCTCTCTTTCCTGGGTAACCCTCCACTCCTAAAAGGGATGCAGTATTCTAAGCATGGCAGATTACCTACAGCGGAAGCCTGGATCAGTCATCTCTGATCTCGGGTGCCCCTTTCTGCCCTTTGACCTCCAGCTCTGTGAAGGGCATCAGCTCTCCAGTCAAATTGAACTGCTTGCTAGCAAAATCCTGCCCATCTTCCAGGGCCCCATTTCACATGCTACATTATCTACGACATTCTTGTCCTGTTCCCCTAACTAGAATGCCTTCCCTCTGAAGTTCTGAATCTTTATTTAAACTGCTGCAACAGCATTTGCTGCCTCATTAAAAGACCTTGGTGTGGGTCTTGACTCTTCTCTGTTCCCAAGAGTGATCTTGGGTAAGCCAGTTATCCTCTGGAGCCTCAGTTTCCTCCTCTGTAAAATTGGATTAACTGTGCCAACTATGCTTGTGAAAGACAAATATTTCCTAATTGAACTACCGAATTGCAGGCTCCTTAAGAGCAATAACTGTTGCTCTCCAATATCATCTACAAATGTGGCCAGGACACTTGACTTGGGACTCTTTTTTTTTTTTTTTTTTTTGAAACAGGGTCTTGCACTGTCCCCCAGGCTGAAGTGTAGTGGTTTGATTGTGGCTCACTGAAGTGTTGACCCTGGGCTCAAGCTATCCTTCCACCTCAGCCTCCCACGTAGCTGGGACTGCAGGTGCATGCCACCATGCCCAACTAATTTTTAAATTTTTTGTAGACACAAGGTCTTGCTGTGTTGCCCAAGGTGGTCTTGAATTCCTGGGCTGGAGATCCTCCCACCTTGGCCTCCCAAAGTGCTGGGATTACAAGCATGAGCCACCGTGCTGGCCCTGGAATCTTTTTTTTTTTTTTTCAAGACCAGGTCTTACTTTGGTTGCCCAGGCTGGAGCGCAGTGGCACGATCTTGGCTCACTACAGCCTCGACCTCCCGGGCTCAGGTGATTCTCCCACATCAAGCCTCCCGAGTAGCTGGGACTATAGGTGTGCACCATCATGCCCTGCTAATTTTTTGTATTTTTAGTAGAGAAGGGGTTTTGCCAGCTTGCCCAGGCTGGTCTCGAACTCCTGAGCTCAAGTGATACCATCCACCTCCGCCTCCCAAAGTGCTGGGATTACAGGTGTGAGCCACCATGCCTGGCCCACTGGGATTCTTTGATCATAAGATATTTGGGCCTTGAAATGGATTTTGGGGAGAGACTTAGAAACTAGTGGCAATCAAAATTGGATTTGCAGTTGGTTTCTAGGTGATGGCAGTGATCAGCTGCGGCCAGCCAGGTTTTTCTTCATCTGGACTGTGCCTCTCACTTTCAAATTTTTGGAACATTTGCTTTGGCAGCAAAACTTTTAAAAAACCAACTCTCTCTGGTGCAGGTGTTCTGTTGGAGGATTTGAGAGAAGCTTTAAAATTTTATCTTATTACTGTCCCTTGCTTAGGTCACAAGAGGAGCTCAAAATAATTTCATAAACATGAATTGGCTTCCCTAGACACAACAAAGGATAAGATCAAAAGAATTAACCCATTTAAAAAAATCAGTCTAGGCTGGTCCTAAGGTAGTGTGTTATCAATTGATCAAAGTCAGTTACAGATCGAACTCCTTGATCTACTCTTTCCTCCTGCTCACTACTGCACTTGACTAGTCCAAAACAATAAGTAAGTAGTAAAAAAAAGAAAAAAAGTCCGTCTATACACTGTAAAGTGCTGTGTAAATGTTCATAATTACTATCACTGTCTTCTTCATAGTTGATGGGGGGAAGGCTGGATACATAAAAAAATGGTAATACAGTAAGAAGTGCTCAGATAAGAATAAAGATAAAATGTTATGGAGAGTCCATTTTTGAGCTGAGCTATGGAGGATGAATTAATGTATCAGGTGGACAAGAGGAAAACTAGAGAAAATAGTCGGGAGAGTTGCCTAATTGTTGCCCTAAACTATTGAACTGTTCACTTGAAAAGGGTGAATTTTATGGTATGTAAATTACATGAGTAAAGCTCTTAAAAAAATTTGCAGGGTGCTATATACTAGATTACATAAGACTAGAGACAAAAGCTACCCAAATTTTGCATAGTACTCCATTGCTATCACATCCGATCTTGTTTTATCCTCACAGAGCCCCTTTAAGGTAGGTGTAATGCTGTTTTTCCTATTTTATAGATGCAGACATCAAGGGTCAAATTTGTCCCAAGGTCACATAGCTAGTAGATGGCACATTGGGTGCTTCAACTGCCATCTTCTGACTTCTGTGCCCTAGTTTTTTGAAATTCAAGGCTAGATTATTGGTGTTTAGCAAGCTTAATTGAATGGGTGTTCAGCAGATATTCCACTTGGTTAGTAGAGCAGTCTCATTCAAGGCCTGGTTCCGTCCCCAGTGTGGCTCTTCCAGTAGTCCGTAATAGATCAGGAATGGGTTTAGCCTGCTGGCCTGACCCCTGATTCAGTCACCACACTGTGAACATTCCATAGGGAAAAAACTGCAGACAGTGTATACTGGCACCCACTTTCATAGTTTTGTTTTAGTTTTGTGGCTCCTAAATGTCTAAGACTAACTAGTAATATGACCTTGGGTGAGTCACATAAAAAACCAGAAGCTAAAGGGGTTATCTGTAAAACGAAGAGTTGGACTAGCTGAGCACACCTAGCACTCAAAATATATGACTTAAACACCCACATGCAGGCAGGCCTGGTGCACACACAAATTATCCTTTGTTATGTAGATACGTTCATGCCAGGTTGGCTATAAAACACTTCCAGAGATTTCCGTCAATAGAAGTCAGACCAGCCCGGCAGCCTCCACCCTAAATGCCCTGCCATATTTGTTTGGTCTGCCTCCCTGACTCCAAAGAAGCAGCAGGCAGCTTAATCTCTGGACAGGATTCTTCATGCCACTCCCTCCACTCCAGCCTGTGTTGTCCTGACTGGCCAGGCCAGCCTCTGCTCTCTGGAGAAGCAATGAGGTAGGGAAGTTAACCAGCAAGCCCCTCTCCTCCATCGCCTCACTGGAGCTTGAGCTGGGTATCTCTCCATGTTTTGCCATTAGCTTTACCCATCCAGGACAGGGGCACAAGTGTTGGTGCCAAGCCCTGCACTCCCAGCTCTGGTGGATGGCCAAGTCCTACCCTGGGGTTGAGGACTGTCAGTGATACTGAGTAAGGGAGTCATTGCTTGACAACTGCCTAGAGAGATACTTTAAAAGATAGGAATGGGAGGCATTATTTCTACAAGTGAACAAGTTTATATTGAAGGAACACTTGTATAGGATCATCATGGATGGGACAGTTCATCTCCAGTGCATTCTCCAATTCTGAGGATACATCACTGCACAAACTGGACTAGAGTTTAAATGGTACAGAAGCTGGGGGTAGGGGAGGCAGGAGGACAAGGGGGATGGGTGGAGAATGCTTAACTTGGTGTTCAAAATCATGTTATTTATGAGCCATGTGACCTCAGAGTATCTTTGAGCCTGAGTTCACTTACCTGTAAAATTCTGCTGTGCTACTGCATAGAGTATCTGAGAAAATGAGGCATGCAGTCGATGTTTGGTATTTTTGTTTCATTTATTTATTTTACTGCCATGCCTCGAGAACAATAGATGTTCAGTAAGTATTTGAATATGTTAGTTAATGCTTTAGGATTTCCTAAAGGCAGTGGAATAGAATTCTCACTGAGTTCAGAGCTTTTCTGATAATAATGTGTGCTTATGGAGCTCCTGAATGGGGTCCAATTTAGCAGTTGCTATAGTTGCTGAGATATAGCACAAGGGGCATTTTTTTTTTTTTTAGATGGAGTCTCTCTCTGTTACCCAGGCTGGAGTGCAGCGGTGCGATCTCAGCTTACTGCAACCTCCGCCTCCCGGGTTCACGCCATTCTCCTGTCTCAGCCTGTAGCTGGGACTACAGGCACCTGCCACCATGCCCGGCTAATTTTTTGTATTTTTAGTAGAGACGGGGTTTCACTGTGTTAGGCAGGATGGTCTCGATCTCCTGACCTCGTGATCTGCCCACCTCGGCCTCCCAAAGTGCTGGGATTACAGGCATGAGCCACTGCACCTGGCCTAGAAGGGGCTTTTTTTTAACCTTTCCTGAACTGTTCCTATCGTTGAAAGAAGCTTCCCTATCCAGTCATTTTCTTAGTAATTAAACTCTAGAGCATGTTGTGAAATATCCATATGATCTAACCTTTAAAAATAGAAACTCTTTAGCTGTGTAACTACTAAATTCTGGGTAGAAGCCAAAACAATCAGCACTTCTCATTTCTGAACTTAGATAATCCAGTTGTACTCCCTCAGCTCATTGTGAGTTTTGACAAGTTCTGCATCCATGAACACCAGATGTAATACAATAGGGAATTTCAAAGGAAGGATTACACACCTAGGCTCTGCCCTCTAGGATTTTACCGTCTTACAAGGGAGTTGAGACAAAAGTGAGAAAATACTCTGGCAACTTCTCCCAACATCACAACTTTGCAATTCTCATAAATTTTGCTTGATCCTAGGGCATGACCAAGGCAGAGGCAGGCAGGTCCTACTTCATGTGGGAGAGAAGGAAGGAAGGGTAGGCAGTTAGAGTGATAGGTTTGGAATACTGTAGAAAGGAGAGTGGGCAGAGCCAGAGTGAGGTGTCTGAAGCTTGTCGCACAGGCAGTGGGAAGGGTGGGTTGGAGGTTTCTGAGCACCAGAAAACTTTGAGCATTGTTCCGGAAGAGGCAAGCGGCAGGCATCTGCACCAGAGACACTGCCGGGTCCGAGTGAGGGCAGGAGGCTGCACGAGGGAGCCTCCCTGGGAGTGAGCGATAGGTTCGCTATGGGAGGTGGGTTCGAAAGGTGCCTGAGATTTTCATTTGAAACTCTGTTGAAGAGGAATTGGCAATAGAGGAGGAAATACAAATAGAGGAAAGATTGGTTTCGTCTTAAGCACTGAGGCTGTTGGGCAGCTAGTGGAAAGTGCTGCTGGAGAGAAGCTGGAGATCACTGAAGCTGAGAGAGGGGTTTGTGGATATAATTAGAGCAGTGTTTCTAGGGAGGTGCAGGTGAAGGGACTGAGAGAGAGATGAGGTTAAAAACACAGAAGAGAAAGAGATGGAGGTGTGGAGGCCCCTGAGGTGGAGCAGCTGCAGAGGCAGGCCTGGGGGCCAGGAGGCTGGCTCTCCACTTTCAGCTGTTGGTGAGAAGGGAGTGAAGGCTGAGCAGCTCCCATTGTGCAGCTGTTGAGTGCACAGGTGCTCGTGCTCTTGCACACGGTGGGGTTTGGGGAGGGTGTGATGCTACAGGGAGGACTTTCATGATGCAGCTGATTCTCTTTTATTGAGAGTCTGTTTCTGGAGTCACCTGCTCTGTTTTGAATCCTGGCTTTGCCACTGTGACCTTGGACAAGTTGTTTAGCCTCAGTGCCTTCGTTTCTGCATCTGTAAAAGGGGTATAATAACGCCTCCCTCATCAAACTGTTGTAGGATTAATTGGGTTAACATATTGAGAGGTGACAGCGTGCTGGCAGTCCTCAGAGCCCTTGCTTGCTCTCGGCACCTCCCCTGCCTGGGCTCCCACTTTGGTGGCATTTGAGGAGCCCTTCAGTCCCCCACTGCACTGTGGGAGCCCCTTTCTGGGCTGGCCAAGGCCGGAGCCCACTCCCTCAGCTTGCAGGGAGGTGTGGAGGGAGAGACACGAGCAGGAACCGGGGCTGTGTGCGGCACTTGCGGGCCAGCTGGAGTTCCGGGTGGGCGTGGGCTTGGTGGGCCCCACACTCGGAGCAGCCAGCCAGCCCTGCTGGCCCCGGGCAATGGGGGACTTAGCACCCGGGCCAGTGGCTGCAGAGGGTGTACTGGGTCCCCCCAGCAGTGCCGGCCCACCGGCGCTGCGCTCGATTTCTCGCTGGGCCTTGGCTGCCTTCCCACGGGGCAGGGCTCGGGACCTGCAGCCCGCCATGCCAGAGCCTCCCACCCCCTCCGTGGCCTCCTGTGCAGCCTGAGCCTCCCCGACGAGCGCCACCCCCTGCTCCACGGCGCCCAGTCCCATCGACCACCCAAGGGCTGAGGAATGCAGGCGCACGGCGCAGGACTGGCAGGCAGCTCCACCTGCAGCCCCGGTGCGGGATCCACTAGGTGAAGCCAGCTGGGCTTCTGAGTCTGGTGGGGACGTGGAGAGTCTTTATATCTAGCTCAGGGATTGTAAATACACCAATCAGCACCCTGTGTTTAGCTCAAGGTTTGTGAGTGCACCAATCAACACTCTGTATCTAGCTGCTCTGGTGAGGACGTGGAGAACCTTTATGTCTAGCTCAAGGATTGTAAATACACCAATCAGCACCCTGTGTTTAGCTCAAGGTTTGTGAGTGCACCAATCGACACTCTAGCTGCTCTGGTGAGGACGTGGAGAACCTTTATGTCTAGCTCAAGGATTGTAAATACACCAATCGGCACTCTGTATCTAGCTCAAGGTTTGTAAACACACCAATCAGCACCCTGTGTTTAGCTCAAGGTTTGTGAGTGCACCAGTCGACACTCTGTATCTAGCTGCTCTGGTGGGGCCTTGGAGAACCTGTGTGTGGAAACTCTGTATCTAACTAATCTGATGGGGACGTGGAGAACCTTTGTATCTAGCTCAGGGATTATAAACGCACCAATCAGCACCCTGACAAAACAGGCCACTCGGCTCTACCAATCAGCAGGATGTGGGTGGGGCCAGATAAAAGAATAAAAGCAGGCTGCCCAAGCCAGCATTAGCAACCCGCCCGGGTCCTCTTCCATGCTGTGGAAGCGTTGTTCTTTCGCTCTTTGCAATAAATCTTGCTACTGCTCACTCTTTGGGTCCACACTGCTTTTATGAGCTGTAACACTCACCGCGAAGATCTGCAGCTTCACTCCTGAGCCCAGCGAGACCACGAGCCCACTGGGAGGAACGAACAACTCCAGACGCGCTGCCTTAAGAGCTGTAACACTCACCGCGAAGGTCTGCAGCTTCACTCCTGAGCCAGCGAGATCACGAACCCACCAGAAGGAAGAAACTCCGAAAACATCTGAACATCAGAAGGGACAGATTCCAGACGCGCCACCTTAAGAGCTGTAACGCTCACCGCCAGGGTCCGCGGCTTCATTCTTGAAGTCAGTGAGACCAAGAACCCACCAATTCCGGACACAATGTGAAGAGCATTTAAAATAGTGCCTAAGCCTAGGACACCGCCAGTGCTTTGTAAGTCTTTGGGTCCTGCTGGCTTAGGTTGCTTCTTTCGGCAGGATGACTTTTTTTTTGAGACCAGTTTTCACTTTGTTGTCCAGGCTGGAGTGCAGAGGTGCTATCTCAGCTCACTGCAGCCTCAACCTCCTGGGTTCAAGCTGATCTTCCCAGCTCAGCCTCCGGAGTAGCTGGGACTATGGGCATGTGCCACTAGGCTCGGCTAATTTTTGGCTGTTGTTGTTTTTGTTTGTTTTGTTTTTTTGTTTGTTTTTTGAGACAGTTTAGCTCTTGTTGCCCAGGCTGGAGTGTAATGGCACAATCTTGGCTCACCACAACCTCCGCCTCTCGGGTTCAAGCAATTCTCTTGCCTCAGCCTCCTAAGTAGCTGGGATTACAGGCATGCACCCCCCACACCTGGCTAATTTTGTATTTTCAGTAGAGACAGGGTTTCTCCATGTCGGTCAGGCTGGTCTCGAACTCCTGACCTCAGGTGATTCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGGTGTGAGCCACCGTGCCCGGCCTGTTGTTGTTGTTGTTTTTAAGAGACAGGGTTTCACTGTGTTGCCCAGGCTGGTCTCAAACTCCTGGGCTCAAGCGACCCACCTGCCTTGGCTTCCCAAAGTGCTGGGATTATAGGCGTGAGCCACCACTTCCAGCCAGGATGACTTTTTTTTTTTTTTTTTTTTTTTTTTTGGTCTTCTCTGCTGTGTCTCTAGAAGATGACCTTTTGAGAAGCAAACCTGAATGTTGATTCAAGCCCAAATTTCCTGGGCTCAGGTGTTAATTTTTTAAGTCTTTGGAACCTCTTTGCCGAGGTCTCAAGCAGGTAGAAGACATTAATAATAATTCCTTATATTTGATTGCGTGGTGCTCTGTAGTTTACTGAGTACTTACTATATATGTACAGATAGGCCCTTATTTGATCTTCACAGGAACCTGTGAGGTAGGCAGAGCTTATGAGCTTCATTTCCCAGGTAGGAAAACTCCTACGTGGTTACGTAACCTGCTCCAGGTGTGATCCCAGGTGCAATCCAGCTCAACAAGCACACTGAGCCTCAGGAGCTCTTGGGATCAGAACCCAGGACTCGATCCCACTCCGTGCCGCCTTCTCACCCACCCCTCTTCCACCAAGTGGGTGGAAATAGCACTTGCTTTGAAATAAGTAACGAATGATCTTTGTGAAAAGGAACCTAAACAGCAGTGGGCCATCTTTATTCACATCTATAGTACCAAGTGCTGAGTAAGGGGATTTTAGACTCCAGACACCCGTCCTGTTTGTCAGGCCAGAGCTGCAGTGTGTTGACTGCACATCTGTCTCTTGTCACTCCTGCTCCTGTGGGTAACCAGCCAGAGTGCCCCTGAGGCAGAGACAGGCCAATCCCTGGAGAGTTCTGCGAGGTCTAGGGAAGAGTTCTTTGTATTTAAAATTTCATGTGAACTTCAGCAGTTTCCTCTGCCTCTGTAGTCAGCTTTTGCCTTTTCAAACTTTAGTTAGATGGATAATGACTTTTACTCATTAGGACTTTTTTCCATTAGTTGGAAACCCAGAGTTGCAATACGTTTCTTTTTTCCTTAGAATCACCGGGTTTATGGGAATAACAATTGGGATTCTCTTTATATAAAAATAGTGGTGGAATCTTGGCACAGGGTTCATATGTGGCTTTGTTGAAGGCTTGTTGTCACTTCCTTATTTGTATAATTTCCCTCCTTTGTGGCCTAAACATGACTTTCAAAGAGTCAAGAGGAGTTAAGTCCTAATTTTTATTTTAGAACATCTGAAAAATGAATTCAGAGAAAAGTGATATTGATGCCTTGGATTTCCCCACACATACAAATCCCAATCTCCTGCTGACTTTTTCTCATGTTTTTGGGCTTCAGGGACTGTTGTGGGATTTGTATTTTGATACTGAAGGACCAACACAGACTGACTTAGCTTCTTGCCTGTGTGCAGGTCATGTGCCACTGTCACTGGAGAGAATTTCATGTTGTGACTTCTGTTCAGATTTGTTTTTTTTTTATGGCTTTCCCATCAGGGTTCTTGGGAGCCATGGCTGCTTCTTGATATCTTCTGTTTCCCTGTAGAACAGACGATTGCAGGCCCGGGGCCCTGGCAAGCTGGGCCCTCTGTGGCTTTCTGAGTCCATTGTGAGGCAGAGGATCAGGTGCGTTTTGGGCAGCAGCCTTCAGAGCAAGGCACTGACCTGATGATTCACACTGACCCCTCCCCTCCGCTGAATTTTCTGACAACCTTGTGACTCTCACATGGGAAATGTGAGTGGTTTTTGAGAAATCTTTACATAAGAGGTTTTAAAATTTTCTTTTGAGATTGCCTCGGTGTTTTTCCTTAAAGTTAGCACATTCTTTGCTTTCTACTTCAGCCTCAAGGACAGGAAGTTCATTCTCGCTCTTTACATTGGGGTGTTGATGTTTGTGGTTTTGTTGTTTTGTTCTTCATGTTACTCATGATGTATTGATATTAATTAACCTAAATACATATGGAAATATTCTTTCATTACTTAGAGCTTATATAGTTCCTGGTGCAGATGTGCAAAAATAGTGCTTTAGTAATTGCTAAGTCACTATCTTGCTTTTCTCTCTACTGTGATTGAGTATTTCTTACATGGAACTATAGCTTCCTCTTATCAACAAATAAGCAGGAAATAGAAATTATGTAAATAAGCAATTTCCATTACCTACTTCACTGACTTGACAAATAGGCATTTGGTCTGCTTTAATTAATATTTTTCAAAATGTTAAGTGCCTGTTGCTGTTACTTAATTTTGCAGGTAGCATTGGAAGTTTCTGTGATTGTACTTGAGTGGGCACTTCTTGTTGAAATTTACCATTGAGACCCTGGTAACACTGAAGTTTGTGTTGACTTTCTGTAGGTGTTTTCACAGTCCTGTGTTTGGTATGGAGAGTGTGGAATTGCATATGGGGACAAGAGGTACAATTGCGAATATTCTGGCCCACCAAAACCATTGCCAAAGGATGGATATGACTTAGTGCAGGTAAGTTCATTATCTTAGGCACTGGGAACACAAAATGCTGATCACAAGATCCTCTGTAATTATTCCTTAAATGTTATTGCAGGGTGGAGGTGGAGATGAGACTAACAGGCTTAAGTCTTATCCCGGACTCTCAAACTCTAACCTGTGGCATACAGTGCAGAGAAAGAACACCGTAACTCCAAAGGCTTAATTTTTCAGGGGCTGACTTTATACCTCTCATAAAGTTTCCCAATAGCAGGTTGCTATTTAGAGACTGACCTTGGTACTTCGTATGTTGCCCTTGCAGCATCTGCAAAATATATTAGAAGTTAGCTGGTTTTGATTCCTAGATTTCAGGACTCAAATGGACTCTGTTGCTAAGTGGCTTTGACGTCCTTGTCCCCTGGTCATTTCAGTGTTTTCTCTGTGTTCCACTGAGAGCCTGTGAATTTTGGCTGCTACCAGGATTCTGATTCCTGTTCTTTTTTTACCATCCTGTGATACACAGGGATATTAGAACTGGAAAAATCATGTGAAAAGCCTGGTTTTAGAGGCTTAAAGTAATCAAAAGTCAAGTCGACATGATAACAGAGTTCCTAGGCTCACTTGTTCGTTTCTTTTCTGTTTTTGAGACAGAAGGAGCCTTGCTCTTTTATCCTGGCTGAAGGCTAGAGTGCAGTGGCACAATCACGGCTCACTGTGTCCTCGACCTCCTGAGCTCAAGCAATCTCTCAACTCAGCGTCCCAAGTAGCTGGGACTACAGGCACATGCCACAACCCCTGGCTAATTTTTTAAAAATTTGGGGAGATGGGGCTTCACCATGTTGCCTAGCCTGGTCTCAAACTCCTAGGCTCAAGCAATCCACCCTCCTCAGCCTTCCTAAGTACTGGGAGTACAGGCATGAGCCACAGTACCTGTCCTCACTTGCTGCTTTCATCATAATTATTAAAGGTTTCAACTTTCCCTGGAATTACTAATAGAAATAGTAAGTAGCACTCTGGTTGAATTGAATCAAACAAACAAAAAACCCTAAGAAGACATAAAATGATTGTCAGGAGAGGAGAGAAAGCTTCCAAATAAAAAGAAAATTAGAAACATCTCTACTTGTGAATAAATAGTAAATGTGTAGCCTTTTAAAATAATTCTATAATAACTTTGCAAATACAGGATGTGTCTTACCCTTTTGTACTTCAAAAGGATTACATGAATGAATGTGTCTTAGTTCACTGAGGAATGTTGACCTTACTCTAACTGTTGCCTACTCCCGTGTCTGTGCTCTTTCACCTGAAAGGAACTCTGTCCAGGATTCTTCTTTGGCAATGTCAGTCTCTGTTGTGATGTTCGGCAGCTTCAGACACTAAAAGACAACCTGCAGCTGCCTCTACAGTTTCTGTCCAGGTAGGTTCTGCTGGGGAAACAGAACAACTGGGCTGTAGATACTTGTGAACTGGTAATGCTCAGCTTTCCATTTATTCTTTGTTTACATATTTTTATTTATTATATGTCTATATTATATGTATATTATATATTTATACATATATGTATACATGTAAAGTAGGTGAATATATATTTATGTATTAAAAATACATGTATGTATAATGTGTATGCATGCGTGTGTGTATAATAGAGACAGAGTCTCACTCTGCTGCCCAGGCTAGAGTGCAGTGGTTTGTGGTGTGATCACAGCTCACTGCAGCTTAAACTTCCTAGGCTCCAGTGATTGTTCTACCTTAGCCTCCTGAGTAGCTAGGACTACAGGCATGCACTACCATGTCTAGCTAATTTTATTTATGTTTTTCTTTATTTTTTTTTTTTTTTGAGACAGACTCTTGCTCTGTCACCGAGGCTGGAGTACAGTGGCATGATCTCAGCTTACTGCAACCTCCTCCCGGGTTCAAGCGATTCTCCTGCCTCAGCCTCCCCAGTAGCTGGGACTGCAGGCACATGCCACCACACCTAGCTAAGTTTTATATTTTTAGTAGAGGTGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAAGTCATCTACCCGCCTCAGCCTGGTTATTACAGGCTGGGATTACAGGCATGAGCCACTGCACCTAGCCTAATTTTTATTTTTTTCTAGAGATGAGGGTCTCACTATGTTGGCCAGGCCTGGTCTCAAATGATCCTCCCACCTTAGCCTCCCAGAGTGCTGGATTATAGGTGTGAACCACAGTTCCCAGCCAGTTTTTTTTTTTTTTTAAAGTCAGTTTTTGTTTTGTTTTAAGAAAGCACTCTTACAATTTGTCAGAAATAAAGAGAAAAACAATAATTACCAGACTTGGTTCACTTCCCAGTTGCATTCAGAGTTGATGCTTGGTTTCCTCTGCGATGTTCTCACCCTGCAGGGTGTCTGCACTGCGGCCAGGCTCCTTTCAAACTTGAGCTGTGCACTGTGGGGAAGAGAGGTTCCTAGGGGTCCTGCTCAGGTGCCTGGCCTGAGACTCTCATCATGCAGTCCTTCCTCTCCCCCCATGCTTTGCTTTGCACATCATTCTTGTCCCTCCCTCTGGTGAAGGGTTGTGATAGAGTCAGGTCCTCAGTAGAGCCGGCCTCGGGGAGCTGTTAAAAATTTTGTTCTGCTGTAGCTGGCTGGTTTTGTCAAACTTAGTTTTTTATCTGTTCTGTTGGCTATGACCCTGAGCAGTGAAAAAGGGCTTGGTAATAGATGTTCTTCTCTAGGCCTAGCCAGCAATTCTCAAATATGCAAAAGAGCAAGCTGGTAGTGGTCTTTAGAACAGCAGATTGTGGTATCTTTCTAAATTTTTCAGACTTCAGCACACTGATAAAGATGTTTGGGAAGCAAATATTAAAAAGGGAAAATGCTTCTCTGCACAAATATCACTGCAGGTGGTGATAGGGCACAAGTTGGCTTCCAGTGAAGAAATTCTGCTTCTTACCAAAAGTTAACAATAGAGAATGGAAAACCACCACTAAATTGTTTTTTCAGAACAACAAAAGTTGAGGCTGTAATTGGGCCAGCATATCCTATGAAAGGCTTGTGAACATTGATGGAACCAAATTGGAGCCTTGTACACTCAGTCAAAACACATTTATTTAGGATCCACCGTAGGTGAGGCATTATGGACATACGGACATAAACATAAAAAGATAGCCAACCTTTCTCCATATTATCAGAGGTACCAAAGCTTGATTTATAATAGCAAACAGGAGAAACAACCTGATATTTGGAAAAATATACAGCTGTCAAAATTAGTGATTGTGGGCATTAAATGTAGTAACATGGAAAAGGTTTGAAAACTGTGTACCCCAAGAGTGATTCCTATTAGAATAATACAATTGTGGTTTCTGGCTTTGTTGCAGTAAAGCAGTGGGGCTCCTGAAAGAAAGAGAGTCTGTGCTTCTCTGTCTCCTTCACTAGAACAGAGACTCTTGAAGGCCAGGACACACTTTTTTCATTCTTTGTCTTACATGGTCACTGGGACTGAATCGGAGTCTAAAGTAATCTTGATTGCAAGAATGCAAGTCTAATGAAACAGCTTTTGCAAGTAACAGTGGACCAAAGGGAAAAGAGAGCTCTTTTATCATGTAACAAGTCAACATTAGGAGCTTAAACTTTGAACCTGAAGGATAGCAGGCAGCTTATGGTTCTTGTGCAGTTGTGTGCTCCTGAAGTGCATGCAGCCAGAGAACAACATTGCTGTTCTCTATCTTTACAAACCATGGGGATTTCTCCTTGTGTTTCAGGAGGGCCTAGTGATTTTCCGGGGCTTGAAAGAAAACCTTTCAATAGGTTATAAGATGAAGATTCTCATAATTCTCATTATTTTATTTTCTTCTTAATCAAAACTGTCAGCTGGTGCAGCGCTCATGTCGATAATCCCAGCACTTTGGAAGGCCAAGGCAGGAGGGTTGCTTGAGTTTAGGAGTTTGAGACCATCCTGGGCAACACAGACCCACATCTCTACAAAAACATTTTAAAAATTAGCCAGGTGTGGTGGTGTGCACCTGTAGTCCTAGCTACTTGGGAGGCTGAGGTGGGAGGATTGCTTGAGCCTAGGAGCTCAAGGTTACAGTGAGCTGTGATCACACCACTGCACTCAGCCTGGGCGACAAAGTGAGACCCTTTCTCAAAAAATAATAATAATTGTCTTCCTGATGCTCCAAAGTCCCTTTACTCTAGGTCAGAGAATGTATGTCTCTAAATTATAAAGTGCAGAATTCAGAGAAGCATCTCTCTCTTTTTGAAATTATAATTGGACACAATAAATGCAGAAAGTAATTAGGGCATTTTTTAAAGGTGTGCCTTTATTTTAACATGAAGTTTTAAGTTTAGAATTGCTGGTTTTTAATATGTTCTCTTGGTAATTTGTCACTTTACAGTAAGTTTAAAATATTCTTTGTCTATTTAAAATCGTTCTTGCTGGCCCTATTATGTGTGAGATCATGCAGAATATAATTTACTTTTCCTTTAGATGTCCATCCTGTTTTTATAACCTACTGAACCTGTTTTGTGAGCTGACATGTAGCCCTCGACAGAGTCAGTTTTTGAATGTTACAGCTACTGAAGATTATGTTGATCCTGTTACAAACCAGACGAAAACAAATGTGAAAGAGTTACAATACTACGTCGGACAGAGTTTTGCCAATGGTAAGTAAACTTTTAATTATTCCTCTTTTACAGCTGGCATCAGGACAGCAGAGCAAATTGTTCCTTTTAGTTGTCCTGTCAACTCTGGAAAATCACAATTTTCAGTTCCATTGGCCAGGAAATAAGAGTTGTTGCTTTGCTTGTATCCTAGGACTTGAACTGCAACGAATATAAAAATCTCCTTAAAGCGCTTGCTTTAACTCCCCCTAACTTTAACTTCCCACATGGAAAATTTTAGTATGTGCAAGTTTGCATCCATACACTTCAGTAACCATTGGATCTTTGACTCTAACAGACATGAGTTGTGTAATGTCATAAATTACTGCAAGACTGAGAAGATAGAACTGTTAATAGTTGGCAGAGAAGAGGTCATGACTTGCAAGAATCAGATCACCATAAAGGAAAGTCAGCAGGTCTAACAGATAGCAGAAATGATCCCCCAGCATTGACCAACATACAACATTTAATTATAATGACAAAGTAAAAAGGTAACAAAAAAATTCCATAGAAAAAAGGTCTCATTCACAAAAGCAACAAAAAATAAGGCACTTAGGAATCCAAAAGATGTGACATACAAGGCAACCTGACTGAATGGAGAGAGGTCATTTTGTCCAGAAACAGAAGCCTGCATGTATGGAAAGTGGATGTGTAACACGTGTGTCATTACAAATCATTGAGAGAAAAGGTGGGCTAGTTGATAAATGAGATGAGAAAATAGATTATATTTATCTAATTTTAATTTTTACAGAAAATAAAAAAATCAATTGTGTAGATTAAAAATCCCAATTGGAAAGTTTTAGAAGTAAATATGGAAAGATTTCTAGACAGGAGAGGAAAAGCAGAAACCATAAGAAAAATATTTATGAATATAAACAACTGTTATCTAGAGCAGACAGCGAAATGCAAATTTGAACAGTAAACTACCATTTCACACCTCATCAGCTTGGCACAAATTAAAAAGTTGGTCAATTTCAACTGTGGGTGAAAATGTGAAGCAATAGGAATACTAATGTACTCCACCACTTACAACCATAATTTGGTACAATCGTTTCAAAACTACTTGAAAAACAACTTTGCAGTACGTAGTAAGTTGAAGCTAACCCTCCTCCCAGAAATTTCACTTATAGATGCCTGCCTTAGAGAAACTCTAAATGCATATAAACCTGGAGACCCATATAAGAACACCCACTGTAACACTATTGTGATTGTGAAAAATTGAAGACCTCAAGAACGAGAAGACAAGACACAGACTGGGAGAAAGTATTTGCAAAAGACATGTTAGTAAGGACTGTTATTCAAAATATACAAATAACTCCTAAAACTCAATAAGAAAGCAAACAGCCCAATTGAAAAATGGACAAAACAACCTGAACAGATACCTCACCAAAGAAGGCATACAGTGGTAAATAAGTACATGAGAAGAGATGCTCAACATTATGTCATTAGAGAATTACAAATTAAAACAACGAGATACCACTACACATCTATTAGAATGGCAAAAATTCAAGACGCTTTCAACACCAAATGCTGGCAATGAGCTCTCATTCATTGATGGTGGGAGTACAAAACGGTACAGCCACCTTGGAAGATAATTTAGCGGTTTCTTACAAAACTAATCATACTCCTTGGTATTTACCCAAATGAGTTAAAAATGTGTCTACCCCAAAACCTGCACGTGGATATTTGTAGCAGCTTTGTCCATAAGTGCCAAAACTTGTAAGCCACCAAGATTTCTCTCAGTAGGTGAATGGGTAAATAAACTGCTACATCCACACAGTGGAATATTATTTGGTGCTAAAAAGCCATGAAAATTCAGTGCTATCAAGCCATGAAAGTACATGGATGAACCTTAAATCCTATTACTAAGCAAAGCCAATCTGAAAAGACTACTCACTATGATTCCACTATATGACGTTCTACAAAAGGCAAAACCGTGGAGACAGTAAAAAGTCAGTGATTGCCATGGGTTAGGAGAGAGGAAGGCATAAGTAGAGCACAGAAGATTTTTAGGTGGTGAAAATACTCTATATGATACTATAATGGTGGTTACATGTTTATATGACATTTTGAAACAAAAGTACTACATACTTAAAACAAGTACACAAACATGCATGGGAAGGATAAACATCAAATTCAGGATTGTGTTTACCTTAGGGAAGGGGCTACTGTCAGGGAGGGGTAATTGGGGAGCTTCAACTGAATCTATAGAGTGTGTGTGTGTGTGTAAGTATTTTATTTTTTGGAAGAGACGGGCCTCACTGTGTTGGTGAGGCTGGTCTTGAACTCCTGGCCTTAAGTGATCCTCCTGCCTCGGCCTGCCAAAGTGTTGGGACTGTAGGTGTGAGCCACCACACCTGGCCTATAGTGCATTATTATTTTTATTTAGTTTTTAAATTATGCCATAGCCAGTTGTTCTGAATAGTGCAGTACTACAAAACAGAGTCAAGGTCTCATGCTGTCACCCAGGCTGGAATACAGTGATGCAATCATGGCTCACTGCAGCCTCAACCTCCTAGGTTCAAGTAGTCCCCCTGGGTAGTTGGAACCACAGGCATATGCTACCACACCTAGCTAATTAAAAACAAATTTTTTTTTGTAGAGATAGGGTCTTGCTTTTTTGCCCAGGCTGGCCTCAAACTCCTGGCCTCAGGAGATCTTCCCACAGTGCTGGGATTACAGGTGTGAGTCACTGCACCTGGCCGAGTCCATTATTTTTTTAATGTTGAGGCAAATGTTGTGAAATGGTATGACTGATAGTTAACTGGGTAATGAGGAAATGAGAATTGTATTATTCTCCATGTGTTTTGTATGCTTGAAACATAAAATAAAACCTGAAAACCAAATGGTGAGCTGGAAGATACGAGGGAATTACTCAGAAAACAGCATACAGATACAAAGACCTATAAATCATTAAAGAAATGACATATAACATGAGAAGCTCCAGAGAGTTGGGGAGAGACAATAATAATCAAAGGGATAATGAGGATTTTCCAGAGTGGATAAGGGATGAACCCTGAGAACTTAGAGAAAATTCAGCATACAAAAATCAGTTGTATTTCTGTACACTTGCAATGGACAATCTCAAAGTGAAAATAAAACAATTCCATTTACTTTAGTATGGGAAATACTTAGGAGTAACTATAACAGAAGGCAAAACACTTTAAAGAACAGCCGGGTGCAGTGGCTCACACCTGTAATCCAAGCACTTTGGAAGGCCGAGGCAGGCAGATCACAAGGTCAAGAGATTGAGATCATCCTGGCCAACATGGTGAAACCCCATCTCTACTAAAAATATAAAAATTAGCTGGGCGTGGTGGCGCTCGCTTGTAATGCCAGCTACTTGGGAGGCTGAGGCATGAGAATCACTTGAACCTGGGACGCGGTGGTTGCAGGAGCTGAAATTGTGCCACTGCACTCCAGCCTGGCTGACAGAGCGAGACTCCATCTCAAAAAAAGAAAAACAGAAAAAACACACTAAAGAACATTATTCAGCGAAATTAACGAGGATCTAAATAAATGGAAAGACATTCCATGTTTATCAATCAAAAGACTTAATATTGTTTAGATATCAGTATTCTCCAAATTGTTTTATAGATTCAGGGCAATCTCTGTTATAATCCCAACTGACTTCTTTGTGGAAATTGACAAGCTGATTCTGAAATTCACATAGAAGTTTGAGGGACTTAGAATAGTAAAACAACCCTGAAAAAAGAACAAAATAGGAAGACTCACACTTCTCAGTTTCAAAACTAAGCAATGGAAATCAAGACAGTGGTACTGGAATAAAGATAGACATATAGATCAATGGAATATAACTGAGAATAAATAATATATCTATGGTCAACTGATTTTTGACAAGGGTGCCAGGGCCATTCAATGAGAAAAGAATACTCTTCATCAAATGGTGCTGCAATAACTGGATACACACATGCAAAAATAAATAAATAATAATGAAATTGGGCCCTACTTCACACCATATGTTAAAGAAATTAACTCAAAGTGGATCGAAGACCTAAATGTAAGAGCTAAAAACTATAAAACAATAAAACATAGGGATTAATTTGCATGGCCTCATATTTGGCACTTGATTCTTAAATATGACACCAAAAACAAGAGCAATAACAGAAGAAAAGATTAATTGGACTTCATTAAAATAAAAAAGTTTGTATTTCAGAGGACGCCATCAAGAAAAGACAAGAAGGCCGGGCACAGTGACTCACACCTGTTATCCCAGCAGTTCGGGTGGCTGAGGCAGGAGGATTGCTTGAGCCCGGGAGTTCAAGACCAGCCTGGGTGACAAAGTGAGACCCTGTGTCTACAAAAAATAATTAGCCAGGCATGGTGGCATGTACCTGTGGTCCCAGCCACATGGTTATCTGAGGCAGGAAGATTGCTTGAGCCTAAGGAGGCTGCACTAAGTACCTCGCACTCCAGCCTGGGTGACAGAGTGAGACTCTGTCTCAAAAAAAAGGACAAGAATATATTTGCAAATTGTATATTTGATAAGGGACTTGTATCTAGAATACATAAAGAACTCTTGGCCGGGCGCTGTGGCTCATGCCTGTAATCCCAGCACTTTGGGGGGCCAAGGCGGGTGGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGGCCAACATGGTGAAACCCTGTCTCTACTAAAATAGAAAAATTAGCCAGGTGTGGTGATGTGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGAATTGCTTCAGCCTGGGAAGTGGAGGTTGCAGTGAGCTGAGATCACACCATTGGACTCCAGCCTGAGGGACAGAGACTCCATCTCCAAAAAAAAAAAAAAAAAACTCTTACTACTCAATGATAAATAAATAACCCAATTTAAAATGGCAAAAGATCTGAATAGAGTAGACATTTCTCTAAGGAAGATATACAAATGACCAACAAGCACATGAGAGATGCTCAATACTATGAGTCATCAGGGAAATACAAATCAAAACCACAATGAGATACCACTTCACACCCACCAGGATGGCTAGAATCAAAGTCACATAACAAGAAGTGTTGACAAGGCTGTGGAAAATAGGAACCTTTATTAAAAAGAAATCCAAAAACCAAAAACAGCTGGGCACAGTGGCTCATGCCTATAATCCAGCACTTCGGACGGCCAAGGCAGGTGGATCACCTTAGCTCAGGAGTTTGAGACCAGCCTGGGCAGCATGGTGAAACTCCATCTCTACAAAAACTTAGCTGGGTATGGTGGTGCACATCTGTAGTCCCAGCTACTTGAGAGGCTGAAGTGGGAGGATCACTTGAGCCTGAGGGGCAGAGGTTGCCAGTGAGCTGAGATCACACCACTGCACTCCAATCTGTGTGACAGAGTGAGACCCCACTTTGGAAAACAGTTTGGCAGTTCCTGAAACAAACATAGAACTACCATATGACCCATCAGTTCCACTCACAAGACGAAAGTATAGGTCAACACAAAAACTTATACACAAATGCTTCTAGCAGCATTACTGATAATAGCCAAACTGTGGAAACAACTCAGATATTTATCACCTGATATATGGATAAACAAAACATATGTCCTTGCAATGAAATGTTGTTCGGCCGTAAAAAGAAATGAAGTATTGATACATGCCACAATATGCATGAACCTTGAGAACATTATGCTAAATGAAAGAAGCCGGTCATGAAAGACCACATATTATATGATTGGATTTATGTGAACTGTCTGAAATAGTCAGATAAATAGAGACAGTTCAGTGGTTGCTTAGGGCTTAGGGAAGTAGGGAGGTAGTTGTGCATAGCTAGAATACAGGATTTCTTTTGAGGTGATGAAAATGTTATAAAATTGACTATGGTGATAGTTGCATATATCTATGAATATGCTAAACTCCATTAAATTATATAGTTTAAGGGGGTAAATTGTAAATTACATGTAATTATATTGTAAATTATATAGCGCCACCACACCTGGCTAATTTTTTTTTATTTTTTTATTTTTTGTAGAGACGGGGTTTTGCCATATTGCCCAGGCTGGTCTGGACCTCCTGAGCTCTGGCAGTCCACCCACCAGGGCCTCCCAAATTACTGGGATTAAAGGTGTGCATAACCACCCCTGGCCCAAAGACAAATATCTTAAAAGCAAATAGAGACAAGACACAAATCACCTTAAGACAATGATAATTGGAGATTTTCTTACCAGCCATGATAGAGCCTGGAAGGCAATGGAATAATCTGTTGAGAATTCTGAGGGAGATGACTGTCACCCTAGTTAACCTGTCTTTCCAGAACAAGGGTAAAACAAAATGAATGTGTAAGCATCTCCTTGAAGATTAGGGAAAGAAGATCCTGGGAAGTTTCTAGCAAGCAGAGACTGGTAAATGAGAATCGACAGTACAGGACCCATTCCAGCTATTTTCTTAGGTGTAATACACTGATACTATCCTTATATAATGTGTTGTGTGTATGTGTAAGAAAATAAAATCCAAAAAGATAACAGTATTAGGGGTTTTTTTTGTTTTTTTTTTTTGTTTTTTTGTGATGGAGTCTTGCTCTGTCACCCACGCTGGAGTGCAGTGGCGCAATCTTGGCTCACTTCAAGCTCTGCCTCCCGGGTTCATGCCATTCTCCCGCCTCAGCCTCCCGAGTAGCTGGGACTACAGGCGTCCGCCACCACGCCCGGCTAATTTTTTGTATTTTCAGTAGAGATGGGGTTTCACTGTGTTAGCCAGGTTGGTCTCCATCTCCTGACCTGGTGGTCCGCCCACCTCGGCCTCCCAGAGTGCTGGAATTACAGGTGTGAGCCACCGTGCCCGGCCAACAGTATTAGGTTTATTGACACGTGACCTCTGCTCTAAAACCAGTTTTCCAAGTAAGTTCCATAATTCTCTGGCTGTGTAGCTTCCTGCGGCAGAGGTTTTCTGGAACCAGCTTTGTTAACTGAAGAAGTACTGAGGCTCTTAGCTGCGTCTTCCTGGGCCTTGGTATACTCTTCTATATAGTGGGGATTTGACTTCTCCAAGCTGTTGTGAGAGCTATGAGATAACGTGTGCCTTTCCCTTTCCTGTCTGTTTTTTACTTTTAAGTTACTTGGAATCGGGCCTCCATATTATTTGCAGGGTGATAAGCCAATTTAAAGGGAATCTCTGTTCGTGCCCTTAGTTAGTGTTTGCTGTCCAGCATTCCAGCATGGTGCATATGGAGTTCGTGTTTCCCTTCAAGAGGCCTTTTGTAAGATCTTGCCTCGTGAATTACAGCAAGCATCTTGTCTCCTTTTTCCTTTGGGTTTCCTCTTCTAGCAATGTACAATGCCTGCCGGGATGTGGAGGCCCCCTCAAGTAATGACAAGGCCCTGGGACTCCTGTGTGGGAAGGACGCTGACGCCTGTAATGCCACCAACTGGATTGAATACATGTTCAATAAGGACAATGGACAGGCACCTTTTACCATCACTCCTGTGTTTTCAGGTAGGTATAAAGATTCCAAGTTTGGTGTGTTTATGATATTGTTTTAAAGCCAAGGAACTGGCTGGGCACAGTGGCTCACCAGTGCTTGGGGAGACTGAGGCAAGAGAATTGCTTAAGACCAGGAGTTCCAGACCAGCCTGGGCAATGTAGTGAGGCCCCATCTCTATGAAAGAATTAAACATTAGCCAGGTGTGGTGGCATGCATCTGTAGTCCCAGCTACTTGGGAGGCTGAGGCAGGAGGATTGCGTGGGTCCAGGAGTTCAAGGCTGCAGTGAGTTACGATCATCCCATTGTACTCCAACCTTGGTGAGGGCAAAGCCCTGTCTCTCCATGAATGAATGAATGAATCTTAGTTGAGGAAGCATAATCTACAATAGGAAGATAAACACATTCAGGTAACTAGTTCATAGTTTCTCCCAGTAAGAGAGGTAACTGGTACATTTATCCTGCTGTGGCTAATTTAGGGGGTGCTGGGAGTGGGAATGGAGGAGGAAATGAATTGCCTTCAGGCATTGCTGTCATAATTGAAAGAATAAGCAGTTAAAAAGGGGGTGGGAGGCAGCTTTTCTAGAGCTCTGCTATAGTATTAGCTCCTGAGAATGGAGATGGGACATGATTGAAGGGTTGCCTTGGTATGTGGTGTACTTGGAGGATTCCTCTATCAGTGACAAACCCCTACGCGCAAGTTTATTGAGGTAACTTAAAATTCCATAGGACGAAGCAGCAAAACATAATTTAATTAAACTAAAACCTCCAATTCTTTTTCTTCTTTCAGTTGTTTTATGTATTTCAGTGGGCTTTTCTTTGAGTTTAAGTATAATACAAAATTTTGGATGTTTTTAATTGAGATTTGTACTCAACACAATTCCTTTCTGTAGATTTTCCAGTCCATGGGATGGAGCCCATGAACAATGCCACCAAAGGCTGTGACGAGTCTGTGGATGAGGTCACAGCACCATGTAGCTGCCAAGACTGCTCTATTGTCTGTGGCCCCAAGCCCCAGCCCCCACCTCCTCCTGCTCCCTGGACGATCCTTGGCTTGGACGCCATGTATGTCATCATGTGGATCACCTACATGGCGTTTTTGCTTGTGTTTTTTGGAGCATTTTTTGCAGTGTGGTGCTACAGGTAAGCAGTTTTGTTTGTCATCCAGGGCAAAAAGAGCAAAATTGCCCACTGGCACTTTGAGCTTTCATTTGTCAGAGCTTGGTTACTTAGGACAAGAAACAAATACCTCCATGAATACCATTGCATGGATTATTGTGTCCTACAGCTATTCTATAGTAAACCATCAAAGTTCTGTTTAACACTGCAACATCTGAAATGAATTTTACTGATTTATTCAAAATGATGTGTGATTTAAAGCACTGTGCATTAGCCACTGATTCTTTTTTTTTTTGGAGACTGAGTCTCACTCTTGTCGCCCAGGCTGAAGTGCAGTGGTGTGATCTCAGCTCACTGCAACCTCCACCTCCCAGGTTTAAGCAATTCCCCTGCATCAGCCTCCTGAGTAGCTGGGATTACAGGCATCCGCCACCATGCCTGCATGCCTGACTAATTTTTGTATTTTTAGTAGAGACGGGGTTTCACCGTGTTGGCCAGGCTGATCTCCAACTCCTGACCTCAGGTGATCTGCCCGCCTTGGCCTCCCAGAGTGCTGGGATTACAGGAGTAAGCCACCGTGCCCAGCCGGCCACTCATTCTTTAGAAAGTCAGAGTCAAGGCCAGGCTCAGTGGCTCACACCTGTAATCCCAGCACTTTAGGAGGCCAAGGCAGGAGAATCATGAGGTCAGGAGTCCATTGCAAACAGCCCTGGCGACAGTGCGAGACTGTGTCTCACCAAAAAAAAAAAAAAAAAAAAAAAAGTCAGAGTCAAATGAGCGAAATCAGATTCAAATCTAATTAAATGGAGTACTATAGTCCTTTTAGATATTTGCATCTTAATTTAGGACAGTACTTTTTTTACTTTTTATTTTGAAATAATTGTAGACTTAACCAAAAAGTTGCAAAATGGTAGAATTTATGTGTATCCTTAACCCAGTTTCCCCGATGATACAACTTACATAACTCATAGTACATCTAGAACTAGAAATACCATTTGACCCAGCCATCCCATTACTGGGTATATACCCAAAGGATTATAAATCATGCTGCTATAAAGACACATGCACACGTATGTTTATAGCGGCACTATTCACAATAGCAAAGACTTGGAACCAACCTAAATGTCCAACAACGATAGACTGGATTAAGAAAATGTGGCACATACACACCATGGAATACTCTGCAGCCATAAAAAATGATGAGTTCATGTCCTTTGTAGGGACTTGGATGAAACTGGAAACCATCATTCTCAGCAAAATATCGCAAGGACAAAAAACCAAACACCGCATGTTCTCACTCATAGGTGGGAATTGAACAATGAGAACACATGGACACAGGAAGGGGAACGTCACACACCGGGGACTGTTGTGGGGTGGGGGCCTGGGGGAGGGATAGCATTAGGAGATATACCTAATGCTAAATGACGAGTTAATGGGTACAACACATCAACATGGCACACGTACACATACGTAACAAACCTGCACGTTGTGCACATGCACCCTAAAACTTAAAGTATAATAATAATTAAAAAAAAAACTCATAGTACAATGATCAAAACCACGACCATGCCATTATTATTACATTATTATTAGCTAAACCAGAGATCTTAATCAGATTTCACCAGCTTTTTCTCTAATGCCCTTCCCTGTTTCAAGGTCCCATATTACATTTTTGTGTTTTATGAGTCCCCTCTAATCTGTGACAGAAAGTTCCTCAGTCTTTCCTTTTCTGGCCTTAACACTCTTGATGATACTGGTCAGGTATTTTGTAGCATGTCCTTCCATTTGGCTTTATCTGGTATTTTCTCATGATGAGATTGAAATAAGGTGTTTTGACAAGTACATCACAGAAGTCATGTTATGTCTTTCTCGGTGCATCATGTCAGGGATCCCTGATGTTGATGCGTCTCTTTCCTGGTGATGTTAACCTTGATCACTTGCTCAAGGTGATGTCTGCTGGCTATCTCCACTGTGAAGTTACTGCTTTTCCCTTCGTAATTGATAAATATCTTGGGGGAAGATGCTTTGAGACTATACTAATATTTTGTTCCTCCTGAAACTCAACCACTGATTTTAGCATTCATTGTTGGGTCTTGTCTGCAACAGTTATAACTAAGGTGTTTGCCTGATAGTGATTTTTTTCTCTTTCCCTCTCTTCCTCTGCATTTACTAACTGGACTTCTGTACAGAAAGCTATCCCTTCTCCCTCATTTATTTACTCAGTTATTTACATCATGGACTTTTAATTCTGTGGGTTGTATCCAACACTGTCATTTATCTTGTTACTCAAAGTTTTCCACTTTGGGCCATTGGGAGTGCCTTCTGGCTGGCTTCTGTGTTCTTACATACACCTCCCATCCCCAGCTTTATCTTACATATTCCCTGTCCCTGCCCTGCAAGGAGCTCTGGTTCCTTTTATTGGAGAATGGTATGTAGAAACGAAGATCTGGGCACTAGGTATGCTCATTGCTGCTGGAAAGAGTAGCATGTTTTTGTTTGTTTGTTTGTTTTTTTGAGATGGAGTCTTGCTCTGTCACCAGGCTGGAATGCAGTGGCGCGATCTCAGCTCACTGCAACCACCGCCTCCCTGGTTCAAGCAGTTCTCCTGCCTCAGCCTCCCAAGGCACGTGCCACCACACCCAGCTAACCTTTTTGTATTTTTAGTAGAGACAGGGTTTCACCATGTTGGCCAGGTTGGTCTCGATCTCTTGACCTCGTGATCCCGCCCACCTTGGCCTCCCAAAGTGCTGGGTTTACAGGCGTGAGCCACCGCGCCTAGCCCAGTAGTGTGTTTTTAAAGGACCTAAAAGTTTTAAATAAAATGAGGGCCACAAGGTGAAATTATCCTTTATTAATTGTTCTCTTAACATCTTCTTAAATTTTCTCCTGAGACTGGTGAGCAGAGGGACCCAGAGCAAGGGGACTTAGGGGAAAGAAGGCAGTAATTAGGGAGGAGGAGGCCAGGAGGAGGAAGAAAGCATTTCATGGGATTACAGGAATGTCCCAAAAACAACCTCACTGTGATGAAGTCCACTAATGCTATTTCTTCACTTCTGTTTTTCAGAAAACGGTATTTTGTCTCCGAGTACACTCCCATCGATAGCAATATAGCTTTTTCTGTTAATGCAAGTGACAAAGGTAGGCATATTTGTCCATGAATAAAAGGGTTCAGATGATGCTGTCTGTCATGAGAGCATTCGTTTCCTCAGTGGGGTTGCAGCAGTGGGTGAGGTGGTGTGCCAGTGCCGAGGACACGGCTGCGACCAAGGCAGACATGGTCCTTGCCTTTGTGGCCCTACCATCTAGTCAGGGTGGCACAGCAGAACCAAGTAATTAATCATAGCTGGGGAGGCGCGAAAGCAGCAGGACAAGAGTGGGAATAGCAGGGCAGGGTTGAACCTCACCCTTCAGAGGCTCCTGTGTCGGCATCTCCTCTGTGGGGTGGGAATAGCGCTCATTGAGGGCAGCCAACAAAGGTGGCTTTGCTGAGCAGATAGGTAGCTGAGGGCAGGGGTCTCATATGTGTCCCCAGGTGGGCTTGATTCCTGCCATGAGATAGCAACTAATGCTTTCCCTGTTCCGACTTTCAGGAACGGCTTGGCTCTTAACCTCCACCTTCCCTTCCTCTCCCGTTCTTCCAGGAGAGGCGTCCTGCTGTGACCCTGTCAGCGCAGCATTTGAGGGCTGCTTGAGGCGGCTGTTCACACGCTGGGGGTCTTTCTGCGTCCGAAACCCTGGCTGTGTCATTTTCTTCTCGCTGGTCTTCATTACTGCGTGTTCGTCAGGCCTGGTGTTTGTCCGGGTCACAACCAATCCAGTTGACCTCTGGTCAGCCCCCAGCAGCCAGGCTCGCCTGGAAAAAGAGTACTTTGACCAGCACTTTGGGCCTTTCTTCCGGACGGAGCAGCTCATCATCCGGGCCCCTCTCACTGACAAACACATTTACCAGCCATACCCTTCGGGAGCTGATGTACCCTTTGGACCTCCGCTTGACATACAGATACTGCACCAGGTAACCTGCTGTTTGAAGAAATAAGTCACTCTAGATGACCTTGTGGTTTGCTGGCTTTTACATGTTGACTACTGCTAGATGGGGATTTGGGGCTGAATGTCATGGTATATCTTGAAAATCTTAGCGTATAATGGCAAAGCTGCCTTTAAGTTAGGTTTCAAGAAAGTGAATGATGTTGAACTTAATGGAATATTTATTGTTGCTCACTTTTGTATTTACTTCAGATAGTAGACCTTGCCTTTTTCTTGAAATTGAGATGAGCAGAGAAAGAAGACTTCAGTGGCGTTTCTCTATTGAGGCAGGATATATTTATTAGGAAGTCACCTTAGGAATTTGTGAAATGTTTTCTGTTGGTAACTGAAAGTAATATGCAAGGACCCAGAGGCATGAAGCCCTTACTGCTGTCCTGGGGGCTGAGGAAGGAGCTGCCAGATTACCATCCCTGATCCAACCTGTAGGAATGAACTTATCACTCACTGCCTGAACATGGGCACCCAGCCTGTTTTTGGTGAGAGGCGCATTTGGGGCAAGATCCATCCCATTGCTCCTAGAAAGGCATGTAAACCTTCCCATTGTCCCTGTCACACTTGCCTTGGAGAACTGTACCTGTGCATAAACTGTACCGGCTTCTTTTTTAATGAATGTATAATCACATGGTTTTTCCTTTAAACATTGCTCATGTCTACAAGAAAGTCTGCAATCTTGAAAAGCATTAAAATGGTCCCAAGACTTGAATCTTTTCTCTACCCAGTGACTGTCTGTTGCTTTTTCCAGCTTGTTGCTGAAGGTGAACAGCATAGTCATTTACCTCCAAGATCATCTTCTCTGTTAGGAAATAAGGGGACATATATAAATGGCTGTAGTGCAGAGCAAGGCAGGAGGTTATGTGTTACTATTGAGAGGAGGGTCAGGGAGACCAGGAGTCCCCCTCCACTCTCCCCTCTGGCCTGCTGGCCACCACTGGAGAACGGTGGAGGGGAGATGGTTGTGTGTCCTATGTTGATAGCTGTTCTGGTCATGGTGTTCCCCCTACCCCTCGCCGCCTCTGTGGACGCCTCTAACTAGTTTGCTGTTAGAGTGGGCCTGTGGCCTGACCAGTTTTCTTACTGTATTGCATCTTAATTCTCTCCCTCATCTTAGGAAGTATTTTCCCCAAATACTCTTTGTCTTCTGACCCTCAGGGCAATGCTGATTAATCAAGATCTGAGAGAAATGTGACGTGTTTCTGGGTTTGCTTATTTTTAAAATCTTCTTTCAGGTTCTTGACTTACAAATAGCCATCGAAAACATTACTGCCTCTTATGACAATGAGACTGTGACACTTCAAGACATCTGCTTGGCCCCTCTTTCACCGTATAACACGAACTGCACCATTTTGAGTGTGTTAAATTACTTCCAGAACAGCCATTCCGTGCTGGACCACAAGAAAGGGGACGACTTCTTTGTGTATGCCGATTACCACACGCACTTTCTGTACTGCGTACGGTAAGTGGCAAGAGACAATCATTGGTAGACACCATTCTTGGGTCTGACTTAGGGTACATGGGCAAAAGCTTGTTTTATGAGCATAACCCAGAGGTGAGCAAACAACAAGACCTTGCCCTGTGAAGTTTACATCATCTTTTTTTTTTTTTTTTGAGACAGGGTCTCGCTCTGTCGCCCAGGCTGGAGTGCAGTGGCGCAATCTTGGCTCACTGTAACCTCCGGCTCCCAAGTTCAAGCGATTCTCATACCTCAGCCTCCTGAGTAGCTAGGACTACAGGTGTGTGCCACCACGCCCAGCTAATTTTTGTATTTTCAGTAGAGATGGGGTTTCGCCATGTTGGCCAGGCTGGTCTCAATCTCCTGACCTCAGGCGATCCGCCCACCTCGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCTTCCATGCCCAGCTGGAAGCTTACATCTTAATGGAGGGAGACGGTTGATGAACACATAACATGTGCTATCGTGCCAGCTAGAGATTAGTGCTATGAGGAGAAAAATAAGGCTGGACAGAGTGGGGGGTGCATTGCTTAAGCGTGGAGATGTGCACAAAGGGAGAGGAAAGGACAGCTGGGCACATCACAGGGATGAGAGTTCCCGGCAGAACCAGCAGCAAGTGCAGAGCCCTGGCAGGAAGCTCTCGTGGTGTGTGATTGAGGAGTGCAGCTGCCTCTCACCCTTTACCTCGTGCCTGGGTCGCTAACACAGTGTCATGTATCACACCCCCCACAAGATTTAAAGATAGAAGAGCCTTTGGTGCCTTTTGTTCTGTCTCAGATATATAGCCCAGTCCCCTGTAGTGCCCCAGCTATTTGGGAGGCAGCCTCCCTCTGAGGAGTTGAGGCAGTATAGGTCTGCAGCTCCGCAGCTTTAGATTGGAGGGCCCTGCAGCTGCTTCCCTTAGGAGGCATGTCTAGCTGGGCAGGGTGCGTTTATAATTGGGAATAGTCACCCCAGGAAGCGGTGCTTTGGTGACCTGTAGGGGAATCTTAAGGCTTCTCCCAGTAGGGGAAGAGTAGCATGATGCCGGATGGGCCTACTCTCCCTGAATGCTAGGGACCTGGCCTAGGGACATTTGTTCAGCCAGTTGAGCAACCACAGTGGCTATTTCTTCAGCATGGGAACAGAGAAATTATTCCTTTTTGCCTTTAAGGACACTGCTCAGCCGACTACTTCTCAAGAGCTAAGGACTCTCACTTCTGGTTCTAAAGAACTTTGACCTTGAGTTCTGTTTGTTTGTTACTGGAGTAAGACTTTTTATGCAGTTGGGCTATATTTACTCTGTTTCAAGAATATCACCCCTAAAAACATGAGTTATACTCATGAAAACACAATAGCTTATGCTCCATACCCTAAACCGGCATTCTCCACAGGGTAGACGGTGCAGACGAGCCATGGGTAATTTGAAGAAACAAAAAACATTTAATGTTACATAATTTTTATAATTGGACAACCATTTAATGTTACATAAATTTTATAGTTTACTCTCTGTGGCACAAGATAAAAGTCAACAAAAATGATGGGGGACAGAGGTGCGTGAGCCTTGTGTTTCCTCAAAGCGGACGTGGTTCCCACCAGTGTGGAAGCGGTACAGGGAGTGGCAGGCTCCTGGTGGCAGGGACCTGAATTGGTTTGTAGTTATGCTTGTGCGCGTCCTCATAACCCCAGTCTCGCCCTAGCGCTGTCCCCTTTCCTCTCCCTCCAGCTTTTCCTGGACTTTTTCACCTGAGGGTCCTGCAGTAATGGCAGGTGGCCTGCCCAGAACCATGCCCTTACCTGCTTCTTCTCCCCATTTTGTTTAAAGGCAGTGACAGCTACCAGTTACTCAGGCTTGAGGCTTTATCCCTGAATTCTGCCTCGCCCTCGCCTTCCTCATGGGGTTCTTACGGGTCTGAGCCTCTGGATGCTCTCTCAGATTTCTGCTGTGGATGAAGGGACTCAGCTGCTCGCTGCAGGTCACCTGACCTCCCTCATGCCGTCACCCATCCACTCTGACGGGTGGGTCATATGCAGAAGCTTCTCAGCACCTGGCCAAGTTGTAGCTGATGGTCTGTCCGAAAATGCTGGTTCACTCTCCACTGGCCAACTGTCTGTCTGCACTGCACTGCCAGTTGCCTCTTGCCTGCGCCATTGCGCTAACATCTCCACTTACTGTTCCACCTGCTTCCTGTTTCTTTGCCGTTTCCAGACCTTCCACTTTGCCACGCAAGCTATCTTTGTAAAACAGCTCATGACATTTCTTTCCCGGAAATCTCTAATTGTTCCCCAGTGCCTCCAGAATAAAAATCCAAACTACTTAACTGGCACTGAGTCCTTTTATTTTGCATTTGTCTGTCCATTACTCTTCCCAGACTGGCCCCCTCCTTCAGGAGCCCCCTTGGTGGGCACCCCATGCTCTAGGACAGGACATCTTTTCTTTGAATTATTATTATTTTTTTTTTAGAGATGGGATCTTGCTATGTTGTCCAGGCTGGACTCAAACTCCTGGGTTATAGCCATCCTTCTGCCTCAGCTTCCTGAGTACTTGAGATTAGGCGTGCCACCATACCCGGCATACAGGACTTGCCAAACCACCATCTTGCTCTCATTCCCTCTCACTGTTCTCTCTCCCTCCCTTTTTCCTCCCACAGTTGTAATTGTGTGAGACACCCTTTTGTCCTCCCTCTTTGGTGAAATCCCCCTCATCCTCGGAGCTCTGGGTCTGTACAGTCTCTTCCTCTTGGCTATAATTTTGCCTTTTAGTGTTTGCTCCCTCCTCTGTGCCTGCATAGCGCCATGCACCATGTGCCATTGATGGCACTGGGCTGTATTTGCCTGCCTCTTGCCCAGTGATTCTGAGCTCCCAAAGGTGAGTGCTGAGCTGTATTACTCAACTGAGAAACCTCAGGGCCCATGTTGTCCTTAGAATACAGCCAGCCTCATCAAATGTTCACTGTGTAAATGTTTAGGTCCCTGATGTCTTGAGGCCCTTCTAACTGGGAGGTGTTTTCTAAACTTTTTGGCAGGGCTCCTGCCTCTCTGAATGATACAAGTTTGCTCCATGACCCTTGTCTGGGTACGTTTGGTGGACCAGTGTTCCCGTGGCTTGTGTTGGGAGGCTATGATGGTAAGTAAGAGAAGCTTTGACTTTTCCTTTTAGATAAAGTCATCTCGGTTTTGTCATTAGCATCAAGTGGTAATTATGAAGATTTCATAAATTGGGCAGTTTTGTTAATTTCTTACCTCTTGAATCCCAGAATAGTATCTCCTTTGGCTTTGGGTTTGGGTTTCATTCCAGATTTAAAAGAAGTGGATTGGGTTAGCCATTTTTAGGTCACACATGCCTTTGAGAAGCTGTCGAAGGCTAAGTACCTTTCCCCAGAATAATGCAATTGCAAACCTCTGCATTGTTGTTCAGCTTGAAGGTCATGGGCCTCCGAAGTTCATTTATAGACCCTCTAGGGAGCTCATGGACCTCAGGTAAGAGCCTCTGTGATAGAGAAAAGATAGTATGTGAGGTATGTGGAAAAAGAAACAAAGTTGATGGATTTTTTTTCTTCTAAGCCAGTCAGTTGAGTATTTGGACACTCTTACAGTGTGAAGAGCAGCTGGTTTGCTCTTTCCTGGTTCCTGTAGCACTTTAGAACCAATTGTACTTGACAAAATGAGGTGATTATTCATGTGACACCTTTGGCATCTTAAGCCAAATTACAGGCTCAACAGGTTTTGCCCAACCAGTTAAGAATCCAGATAGGTTTTCTTCTCCTCACTTGGTGGCAGGGGAGAAGTTGCAATCTGTATTTAAAATTTACTGTGCATCAGAGAGGAAAATGCCATTTCTAATTGTTGGAGAAGGGATGGTGTCAGCAACTGACTAGCCATAGGGGAAACAATTGACTTTGATCTCTGACTTGTTCATTTCACCAAAATAAATTCCAGATGGATAAAAGATTGAAATGTAAGAACTGGGCCAGGCGTGGTGGCTCACGCCTGTAATCCCAGCACTTTCGGAGGCCGAGGCGGGTGGATCACAAGGTCAGGAGATCGAGACCATCCTGGCTAACACAGTGAAACCCTATCTCTGCTAAAAATATTCTTTAAAAAATTAGCTGGGTGTGGTGGCAGGTGCCTGTGGTCCCAGCTACTCGGGAGGCTGAGGCAGGAGAGTGGTGTGAACCCGGGAGGCAGAGCTTGCAGTGAGCCAAGATCAAGTCACTGCACTCCAGCCTGGGCGACAGAGTGAGACTCCATCTCAAAAAAAAAAAAAAAAAAAAGAAATGTAAGAACTGGAAGAAAATTCAGGAGGCATTTTTAAAAATAATTTTTAAGTGGAAAAGATATTTCTAAGCAAGACACAAAACTCAGAAGCCCGAAAAGGAAAGACTGATGAAGTTGAGTACATGTTCATTTGTGGAGAACAAACATACAGTTAAAAAAACAAAACTGGGCCGAGAGTTATTCATGCCTGTAATCCCAGCAATTTGGGAGGCAGAGGCGAGCACATCACTTGAGCTAGGAGTTTGAGACCAGCCTGAGCAACATGGAGAAACCCCGTCTCTGCAAAAAATACAAAAATTAGCTGGGCATGGTGGTGCATGCTTGTAGTCCCAGCTACTCGGGAGGCTGAGGTGGGAGGATCACTTGAGCCCAGGAGGTTGAGGCTGCAGTAAGCGAGATTGCACCACATTCCAGCCTGGGTGACAGAGCGAGACCTTGCCAGAAAAAAAAAAAAACTGGACAAAAATATTAGTATGCATGGCAGTCAGCATTTTCTTAATAAATAAAGATCTCATCTCAGCCTGGCCAAAATGTGAAACCCTGTCTCTACTGAAAATACAAAAAAAATTAGCCACACGTGGTGGTGTGTGCCTGTAGTCCCAGCTACTCGGGAGACTGAGGCAGGAGAATCACTTGAATCCTGGAGGTGGAGTTTGCAGTGAGCCAAGATCATTCCATTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCCGTCTTAAAAAAAAAAAAAAAAGTTGTGAAAAAAAGATCAACAACCTGAAAGAAAAGTGGGTGAGGTCATGTGAAAGATAACAAAAGAAGAAATACAAAAAAAAAAGGTTTTTATTTTATTTTTCAGAGACAGAGTCTTGCTCTGTTGTCCAGGCTGGAGTGCGGTGGTGTGATCTCGGCTCACTGCAACCCCTGCCTCCCAGGTTCGAGCAATTCTTCTGCCTCCACCTCCTGAGTAGCTGGGATTACAGGCATGTATCACCAGGCCCAGCTAATTTCTTGTATTTTTAGTAGAGACACGGTTTTGCCTTGTTGCCCAGACTGGTCTTGAACTCCTGACCTAAGGTGATCCACCCACCTTGGCCTCCCAAAGTGCTGGGATCATAGGCATGAGCCACCACGCCCAGCCTCAGTAAATATTTTCTTGACTAAAGTAATGAAAAGGGAGGCCAAGGCAGGAGGATTGCTTGAGCCTGAGAAGTCAAGGCTTCAGTAAACCATGATTGTGCCACTGCACTCCAGCCAGGGCAACAGAGTGAGATCCTGTCTCTAAAAAAGAAGAAAAAAAGGAATGAAAAATAGTTAAGCTTCTTTGGAAGGCAGTTTGGGAGAATTTATCAAAATTGGAAATATACATAGTTTTTGATTCATTGATTATGCTTTAAGAATTGATTCTAGCCAGGTGCAGTGGCTCATGCCTATAATCCCAGCACTTTGGGAGGGCAAAGCAGGAGGATTGCTTGAGCCCAGTAGTTCAAGTCCAGCCTGGGCAACATGACAAAATCCCATCTCTACATAAATACAAAAATTAGCCAGCAATGGTGGTGCACACCTTTAGTCCCAGCTACTGGGAGGCTGAGGCAGGAGGATTAATTGAGTTCGGGTGGTCAAGGCCACAAAAAGCCGCGATTGCACCACTGTACTTCAGCCTGGGCAACAGAACAAGACACTGTCCCCCTGTCAGGCCCCCACCCCAAAAAAAGAAAAAAGATTTATTTCTACAAGTATGTGTTTTACACATTAAAATATTTATAGGCTATTTATAGTAACTTTGTAATAGAAAAAATTGCAAAACTACTCATCAGTTGGGGGGGATTGGCTAAAGTATACCAGAAAATACTGTAGGAAAAGAATAAGGAAACTCTTTATGGAGCAGTCTCCAAGATACAAAATTTTAAAATGTAATGTGCAGAATAGTATTTTACTGTTTGTGTGGTTAAGAGGGAAAGGGGAAGAATCTGTGTGTTTGCTTGTGTGTGTGTGGAGTGGCTCTGGAAAGATTCGCAGATGGTCACAGTATGGGGAGGAGAACTAAGACAATGAAACAGATGTTGGAGAAGGAGAGAATTTTCGATAAACACTTTTCTGTTCTGTTTGAAATTGTTAACATGCATGTACTGTATCCTTTAAAAAAAAAAAAAAAAAGAGTTACTCTTCCTGAATGATAACCATGCCTACCTCAGATAAAAAATCCTTTTTATTCATTAACTGAAGTACATAAAGACTATTTCAGCAAACTCTTGTTTAATTCTTAGAGCCCAGAGATACAGTCCATAGCTCCAGTGAGAAATCTGTGTTGTGATTTTTCCCCTGGTATGTGTCTAATTTTCTGCATGCTTGTAATCTGCTTTTTGATGTCACATTTTTCCTTTCTAGATCAAAACTACAATAACGCCACTGCCCTTGTGATTACCTTCCCTGTCAATAATTACTATAATGATACAGAGAAGCTCCAGAGGGCCCAGGCCTGGGAAAAAGAGTGAGTCACTCATGGGTGTGAGCAGACTGTCCTTGCATTGTGGGAAGCTAGACACTTGCGGCAAGCACTTAAACTTCATTTTCTAAATTAACCAATGGCAGATCTGAGTTACGTAGTTTTGTTCACTTGGTACTAATGATGCTAAGAAGAAACTGTAAACACATTTACCTTTGAGCAGGTGCTTTAAACAGCTCTCCCTCCACAGGAATGCAAAAGTGTGCAAAAAAAGGTTCCTTGCATTGTTTTTACTTATTTCATTTATTTTTTGAGACTGGGTTCACTTTTGCCCAGGCTGGGGTGCAGTGACTGAATCTCAGCTCACTGCAGCCTCAACCTCCTAGGCTCAAGTGATCCTCCCACCTCAGCCTCCTGAGTAGCTGAGACTACACGTGCATGCCATCACACCCAGCTAATTTTTGTATTTGTTTGTAGAAACAGGGTTTTGCCATGGTGCCCAGGCTGGTCTTGACCTACTAACCTCAGGTGATTCACCCTCCTCGGCCTCCCAAAGTGCCGGGATTACAGGTGTGAGCCACTGCACCCAGCCACCTGCATTGTTTTCTAACAGCAAAACTTGGGAGCATGCTGAATGTATTTAATAAGGAATGAATACAATAGAATATTGTGCTGTCATAAAAGACAGTGAAGTAAATGGTCCATGATGTATATTTGTATAAATATATATTGTTTATGCTGCTGTCCATGCTTAGAAAAAAATATCAAGCAAATGACCTCAGAAATTAACTGTGTTTGTGACCTCTAGAGAATGGGAAGAGAGGACTTAGGAGGCCAGGTTGCACTTTATGCCCTCCAGTACTTTTAAAAAATTGTTTTACTGAGATATGGTATATGTATCATGCAGTTCACCCACTTAAAGTATACAGTTCAGGCTGGGAATGGTGGTTCACACTTGTAGTCCCAGCACTTTGGGAGGCCCAGACGAGAGGCTCACTTGAGGCCGGGAGTTCAAGACCAGCCTAGGCAATGTTTGCATGTCTCTAAAAAAAAGAAAAAAGAGAATTTAAAAAGAAAAAAAAGCGTACAATTCAGTAGCTTTACTATATTCACGTGTATGTGCAGCCATCACCACAGTCAATTTTAGGAACATTTTCATTACTCCACAATAAAACTCTGTACCCTTTAACTAACACCCTCCATCTTTTCATCCTCCTATCCACAGCCCTAGGCAACCACTAAAATACTGTCTCTGGAGATTTTCCTATTCTGGACTTTTATGTGCATAGAATAATATGTGGACTTTTTTGTCTGGCTATCATTGAACATAATATTCTCAAGGTTCATTCATGTTGTGGCATGTATCAGTACTCCATTCCTTTTCATTCCATTGTATGGATATACCACATTGTGTGCATTTATCAACTGACAAACACTTGGGCTGTTTCCATTTTGGCTATTATGAATAATGCTGCTATGAACACTTGAGTACAAGTTCTTGTGGATGTGAGTTTTCATTTCTTTTGGGTACATACCTAGTAGTAGAATTGCTGAGTCATAGGGTAAGTCCACCTTGAATAGTTTGAAGAACTGCCAGACTGTTTTCCAAAGTGGCTATAGCGCTTTACGTCACCACCAGCAGTCCATGAAACTTCCAATTCGTTCGCATCCTCGTCAGCACTTTTTATTATCTGACTTTGTGATTCTAGCTATCTTCATGGGTGTGAAGTGGTATCTCATTGTGGTTTTGATTTAGTAGACTGAATGCATTTCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGAGACAGAGTCTTGCTGTGTCATCCAGGCTGGAGTGCAGTGGCATGATCTCAGCTCGCTGCAGCCTCTGCCTTCCAGGTTCAAGTGATTCTCGTGCCTCAGCCTCCCAAGTAGCTGGGATTACAGGCACCTTCCACCACGCCTGGCTAATTTTTGTATTTTTAGTAGAGACGGGCTTTCACCATGTTGGCCAGGCTAGTCTCGAACTCTTGACCTCAGGTGATCTGCCAGCCTCAGCCTCCCAAAGTGCTGGAATTACAGGCATAAGCCATTGAGCCCAGCCCTAAACTTACTTTAATTCAGCATGTATGGAACCTTAGCTGTAATCTGATAGTCTCCAGTGTGGAAGACCCTAATGCAGTGGCTGGGCATGGTGCCTGTCATCCCAGCACTTAGGGATGTGGAGGCAGGAGGAATGCCTTGAGGCCAGGAGTTTGAGACCAGCTTGCACAACATGGCAAAGACCCCATCTCTACAAAAAATTTTTAAAATTAGCCAGGCATGGGGATACGTCTCTGTAGTACCAGCTACTCAAGAGGCTAAGGCAGGAGGATCCCTTAAGCTGAGGAGTTCGAGGCTGCAGTGAGCTGTAATAGTGCCACTGTACTCCAGCCGAGGCAACAGAGAGAGACTCTATTTCAAAACAGGAACAAAAGCAAACAAAGGATCCTAATGCAGGATAAAGGTTAAGAAAACATGGCCTTTGAGCCGGGCACAGTGGCTCACGCCTGTAATCCCAGCGCTTTGGGGAGGCTGAGGCAGGTGGATCACTTGAGGTCAGGAGTTTGAGACTAGCCTGGCCAACATGGTGAAACCCTGTCTCTACTAAAAATACCAAAATTAGCCGGGCCTGGTGGCGCACGCCTGGAGTCCCAGCTACTCAGGAGGCTGGGGCAGGAGAAGCACTCAAACCCGGGAGGTGGAGCTTGGAGTGAGCTGAGATTGCGCCATTGCACTTCAGCCTGGGCGACAGAGCGAGAATCAGTCTCAAAACCAAAAAAAAGAAAACGTGGCCTTTGTATCGTGAAAGTTAGGGAGAAGTTTCTTACTTAGCTGTCAGTTAGTTTAACTAAAAATATAACATTTTGCTTACCTTTTAGGTTTATTAATTTTGTGAAAAACTACAAGAATCCCAATCTGACCATTTCCTTCACTGCTGAACGAAGTATTGAAGATGAACTAAATCGTGAAAGTGACAGTGATGTCTTCACCGTTGTAATTAGCTATGCCATCATGTTTCTATATATTTCCCTAGCCTTGGGGCACATGAAAAGCTGTCGCAGGCTTCTGGTAAGCCGGGGGGGGGTGGTGTATGTTCTAGAGGTTAACAGCAGTGCACAGTGTAACGTCATATTTTTGCCTCTTTATTCTTATTCCATTATGTTTAAAACTGCCATAAATTCCCCCATGTTTTAATTGTATGTAACGTTTCTGTTGCCTACATCTATTTTCTTCATTCCAACTTTTTGGTTTATCTTAAAGTTTATTTCACATAATCCAGTTTTTTCTTATTTGTCCAGTCCATCACCTAAGAATGCAAACTCATAACATGTGTTGCCCGAGCAGACCTAGAAATGTTTACAAGTCCTCTCTGAAACACAGAATTGTACATTCAACTCTAGGTTTAATACAGCCCTGTAAAGTAAAAAGGAGGACCTTTTAGTAACAAGTGGGACAGACAACCCTGTAACTAATTGGTGATTGTGTCTGTCGCCTCTCTCAGGTGGATTCGAAGGTCTCACTAGGCATCGCGGGCATCTTGATCGTGCTGAGCTCGGTGGCTTGCTCCTTGGGTGTCTTCAGCTACATTGGGTTGCCCTTGACCCTCATTGTGATTGAAGTCATCCCGTTCCTGGTGCTGGCTGTTGGAGTGGACAACATCTTCATTCTGGTGCAGGCCTACCAGGTATACTTCCATATTCTCACAGGGCTCAGCATCTGTTCAAGTTTCAGGGACTGTGAATGGCTCCTGGGCTCCGCATTCGTGAGTGTGACCTGTGAGGGTGTTTTGTTTCCTTTCCCTGTGTGGCTCATCGGTCGTCTTGACTTGCTGTGGACATCTTAGGACCAAGAATTTCACCCCTCTTTTTGGTTGTTGAAATAGTAGATATAAAGTAAGAATTGTGTTTTAAATTGTATCTTTAAATAGTGTCTTTTAATAGTATCTTTTCATTTTAAATAGTATCATGTGTACAAGAAGGGCTAACACACTTTTGGAAAAGATTTTGGGTACGACTGCTGTTAAAATGATGTTCAGCATAGTATAGAATGTTAGATTCATTTTGCCCAAAGGTGCCACTAAAAAGGCAAAAGGTCAACACGTGTCCCGCTGCTGTAGAAGGTGGTCTCAGTCGTCCTGTAGACCCGACGTGGGCGGAGACTCAGTGCACGTGAGAGTGATGTTCACTGGTCCAGTCCCCTGCCGCCTGTGTTCCGAGTGTTTTCCTGATAATGTGGCTGGCTCAGCTTTCCCTTTAGTTTCTCACTTGGTACCTAGCTCTGTAGTGCAGAAATACTCTGAGAACATTGGAGTCCCCCACCGAAGTTTATATGCTTAGAAGACACTGCTAATCGTCTACTAATCATTTATTTTTACCCTTGAGTTAACACAAGGCAGCAAGAAATGGCGTTGTTATTGAGAAATTTTAATGTCGCATAATTTTTTTTTTTTTTTTTTAAGAGAGATGAACGTCTTCAAGGGGAAACCCTGGATCAGCAGCTGGGCAGGGTCCTAGGAGAAGTGGCTCCCAGTATGTTCCTGTCATCCTTTTCTGAGACTGTAGCATTTTTCTTAGGTAATTATGCTTTCAATCCTACCAGTCCTGTAGTCTGCTGAGCCTGGAGAAAGAAGGAGCTGGCTACCTGAACATGTCCCTTTGTGTTGCTTCCTTTTTTTTTTTTTCTTTTTTTTTTTTTTCTCTGAGACGGAGTCTCACTCTGCCACCCAGGCTGGAGTGCAGTGGTGCAATCTCGGCTCACTGCAGCCTCCGCCTCCCGGGTTCAAGCGATTTTCCTGCCTCAGCCTCCCAAATAGCTGGGATTAAAGGCACGTACCACCATGCCCAGTTAATTTTTTGCATTTTTAATAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAGGTGATGTACCTGCCTCGGCCTCCCAAAGTGCTGAGATTACAGGCGTGAGCCCCCGTGCCCAGCCCGTGTTGTCTCCTTTTTTTAAGCTTTGTTCTGCACTGGGAAAGTATCACTGGACCACAGAAAAATTGGCAGCAGTAACTTAGGTGTGATTTTGCAAGTGGCTTCCTTCTCATTTAACTGTCAGGACAGCATTGATGTTGGGGTTCAGGGTGAAAGAGACCTAGAGTTCGTCTTGCCACTTTCCCCTTTTAGTAGCCACTGGGAATGTTGATAGTTGAAAATGGCATCCTTGAGTAGCCACTGAATCCTTCTCCACATGACACTCTAAGCAGCAGCTCCCAAATCCACAGGCACTCGCTTACAAGATGTTTGCCGTTGTTTTCAAAGGCAGTCTTTCTCTTCTGTGCACACAACTCATTGGGGAAGCAGCCTTGTTAATGACCAGAAGCTCTTGACTCACCACATTACAAGGAGCCAGAATAAGCTGGAACAAAGTCAGCACTTCTGTGTTTCTTTCACATAGAGAATCATCAAATAGACCCACTAGTGGGGCTGTCTGCCCCATGTCTGAAGTGTAGTAAGAGCAAAGTGACTCTGTCCACTATAGGGGAGGCTGGACTGGAATCACTCAGTCCAAAGAAGACCATCCACGGGCCACAAACTGCAATGCCTACATGGCTGGGAGGTCAGCTTAATCAGGGCCATTGTAAGGTCATTGTAGGTGGTAGTCTTTCACCACAGATACACTGCTAGCTTGTTATTCTTCATCTCCACAAAGCCATGTGCTTTTGAAACCTGTAGCCCTGTAGTTCCTTTTGACAAACACAGGTGCAGAAAAAAAAAAAAAAAAGAAAAAACTTTCTTTTTTTCACTACTATTATAAGAAAACCAGTGCAAGTGTGATGATAATAGCAGCAGAGACTGTGCCTCAAGGTTGGAGTGACCTTGGGACAGTAGGAGTGAGTAGGGATTGTGGCACCCCAACTGCACGTGTCCTATCTAAAAAGACAGTTATGTGTGTGGCCAACCCAGTGCTACAAGGTCTGTGTTGTTGTTGTTGTTTTTCTTCCAAGCAAAGCTGTGAATCTAGATTTTTGTGTAAAATGCCATTGTTAAATATTGGCAACTTATAAAAAAAAGTTTTTTAATCTTAAGATGGGTTGATACAGTGTGGGCTAAACAGGAACCATCTGATTCATGGGCTGCCAGTTTGCAGTTTCCAAGTCTTACCCTCATGCCTTTGATCCTCACTCGATTGTAGATTACCTCTTAACTAAACTGGGAGGCTAGTAGTGTTGATGTAATAAATGGAAAATACTGTCCATTTCTTACAGTGAAGCACAGAAAGTACTATAAGAAATGGCCTGTATTAGTGGTTCTCAAATTTTAATGTGTGTGAATTTGCTGTGAACCTGAGTATAGTAGAATTGGGGTTGAATTCCTGTCATAACTAGGATGGGGCTTCCCAAATGGTCTGGTGCTGAGTGTGCTTTGAAAAGCACTGGCTTATCACCTCCTGTCCCACTTCTGGTGTAATGTCCAGCCGCAGCATGCCTTCTCATGCGTTTGGCCTGTGCTGGCTCCTTGTATCTGTACATGCACATGAACATAAGACCTGCAGAGAGCCCCCGGCTGTAAACAGAAGTGACGCAGAGCCCTTCTCTCCCCGACAGGAGCATTGTCCGTGATGCCAGCCGTGCACACCTTCTCTCTCTTTGCGGGATTGGCAGTCTTCATTGACTTTCTTCTGCAGATTACCTGTTTCGTGAGTCTCTTGGGGTTAGACATTAAACGTCAAGAGGTAAGTTGGTGCCAGGATTATAGTCTATTTAATTTGAGTCTAGAATCTAGAGGAAGCAGCTAGCGGGTATAACCTTTGTTTCCCTCTGTCCCCTCAGAAAAATCGGCTAGACATCTTTTGCTGTGTCAGAGGTGCTGAAGATGGAACAAGCGTCCAGGCCTCAGAGAGCTGTTTGTTTCGCTTCTTCAAAAACTCCTATTCTCCACTTCTGCTAAAGGACTGGATGAGACCAATTGTGGTATGCGCTTATCTGTGGTTTTTCTCTTTCCTCTCACTGAAACAGATTATCACATGCCTTCTAAGAAGCCAGACAGCCTGGGAAGGAGATTCTTAAAGCTGTTAAAATGTATCTAAAAAAAAAGCAAAAGCAAATGTGGAACAGTAGATAAAATGTTTTTCCTGTGAGCTTTTATCAGTCCATATAAACAAGAGTTTTAAGTTTTTTATTTTGAAATAGTTTCAGATTCACAGAAAGTTGCAAAGAAACTTTTATTTTTCCTCTTAATAATGAGGAAATAGAAGCCAAGAGAGGTGAAGTGGTTTGCCCCAAGTCACTCAGCCCGTAAGTGGCAGAGTCAGGATTTGCACCCAGGAATTTGGACTCCTGGTGCTGTGGTCTCACCCACTGCCCTGTACTCCCTATTAGCCTGTCATTTAAGCTTTTCCATTTTAAAAAATCCTGCTTTTTGTGTGTGCTTAAGATTTTATTTCTGGTCGTAAGCTTATTTACTAAGCAGTCTCTGTCTTATGATTCATTTGTTGTTCCAGATAGCAATATTTGTGGGTGTTCTGTCATTCAGCATCGCAGTCCTGAACAAAGTAGATATTGGATTGGATCAGTCTCTTTCGATGCCAGATGTAAGATGACTTCCTTTTTTTTTTTTTTTTAACTTCTTTAGCTGATGATGAATACATTTTTCAAAACATGCACGTAGGTGTTTCAAGCAAGTGCCTGCTTCTAACTGCAAATGGTGACAGGGTTTCCAGGGTTAGGAGAACTGTCGCAGTGCACTGCTGGTGTGGGCTGTCTGGCATTCTGACTGAGCCCCTCTGGGCACAGCTGCAGAACACGAATAACTAGTCTTATGAGGTTACTTTATGAGATGCTCTCCTGATTGTGGGGCTAGCAGGAGGAGCACCCTGGGGCCCTGGGGGGAAGACTGGTGGTGTTAGGAATCATGAGTCCAGCTGGAGGCATCTCAGCCAGGAACCTCCTGGCACCCTCTTATTCTCCATGATCCTCGCCTTGCTTAGTTACTATCAGAGTGTTCACACTCTCTCCTATTCTTTTATCTTTCTTTCAGGACTCCTACATGGTGGATTATTTCAAATCCATCAGTCAGTACCTGCATGCGGGTCCGCCTGTGTACTTTGTCCTGGAGGAAGGGCACGACTACACTTCTTCCAAGGGGCAGAACATGGTGTGCGGCGGCATGGGCTGCAACAATGATTCCCTGGTGCAGCAGATATTTAACGCGGCGCAGCTGGACAACTAGTCAGTACCACCTTGTCTTGTACTTCAGAAGCAGCGGAGGAGGCTCTCAGCCAGGCAGTCAGCTCAGGCCTGAAATGTCTCACTGAAAATAGACTTTCTTGGAAAAGTTGTTTTTATGCAAAATGTATGTTAAATCTGGCTTTACCTTAAAAAACCTTTGAAAGGACTAATTTACCACCTAATACTTTGAAGGCTTTTTTCATTAAGTGCTCATGTAGTTTTTCTTTTGACTGTTAGCAGTATAAAACGTAGAAAAGGAAGTTAGGTTTTAAGAAAAAGTACTGAAACTAAAGACTTCCTCCCTGTGGAGCAGGTCAGTAACCCTGTCTGTCCTCTCTAGTACCCGAATAGGCTTCGCCCCCTCGTCCTGGATCGACGATTATTTCGACTGGGTGAAGCCACAGTCGTCTTGCTGTCGAGTGGACAATATCACTGACCAGTTCTGCAATGCTTCAGGTACCTTCTCCTTTACCAAATCTTTCCTGTTTTGCTGAAAAATTTTCAAATTATCATTTAAAAATCATTTGCATCGTGCCTCAGTTTATACCTATTTGTATATCAAAGCTGGGTCTCCCTGTGTCATCATTCCTTTCCTCAGTCATTCATTCTGAAATTGTCATGTTGTTCCTGGCTCAGACAGCCACCCTCGGGGCTGCAAGCTGAACAAGGTCCACATGTTCGGAGTGTGGTTTCCACATAAGGTTTCTCATCCTGTTCTAACTCCAGCGATTGCCTCTCAGGATTGGTATCTGGCCTTAGCTTCTCAGAGGAGGGCTTTTCTTTATCACTTTACCCTGTGGTTTTGTAGGAGCGTCGAGGTTGCCCTGGAATTTTCTTAATAAAAACATAGAAGCCCCGGGCTCTGACCAGTCAAGGCCATACTTGAAGGAGGAGATCTACTTCAGGGCAGAAAATGATGCATAGTATGCCTAAGATGAAAATGGTATTTCAGATTCATTAAACTGTGAAAGTGACATGTGGCTGAAGCTTTTAGATAAGGGGAAAGATTATCCCTCACTAGTAAGGAAAGTAATCGATAGAGAAGAAAGTAATGCCCCTCACTGTCAGTATTTTAAAATGTTTTACAAAAAATCTGGAGACCTATTCTTCTAACAGTCCTCCCTGCATGTCTCCGCCAGTGGTTGACCCTGCCTGCGTTCGCTGCAGGCCTCTGACTCCGGAAGGCAAACAGAGGCCTCAGGGGGGAGACTTCATGAGATTCCTGCCCATGTTCCTTTCGGATAACCCTAACCCCAAGTGTGGCAAAGGGTAAGTGCTGCTGCCATTGCAGATAAGCATCCACTGCAACTTTAATTTGCAGTAGAAAACTAGGAGAGGACTGGGCTAAGACAGTTGCATGGGAACGTCTCTTCTCCGCCCCACCCTGTCCTGGTCCTTTGGTGGAAGCAGGAAAACCGAAAACACCTTTTTAAGAAAATGCCTCATAGTGTTCAACTGATTCTGTCTTAGCGTGGGCATTCACATCTCATGCTCTCTCTGTGTCCTGGCCCCCTGGGCATGAGAATGAACGCAGATTCCTGTGCACATTCCAAGCGGGGCTGAGGGAGAGGACGGCCTGCTGGTAATCCAGGCCTGAAGGAACTTGGCCTGTTCACTTGTACTGATGGCAGCTGGGGCGTGATCTTAGCTTTAGTAACATTATCCCACATTAAGGTTGCGATTCTTTTAGCCTCGTCATGCTCCTTGCCAGCCCATCCATGTATAGGGTTATGGGCTATCTCACTCCCCCATCCAGCCAGGCAGCCAGTTACCCACGGAAGCCAGATATATGGCCCAAAAATAGTGATGATGACCGGAAGTCTCTGGCCTTGATTTGGAAGCTTTGGGAGGTGGAAGATGAGTATCCCCATGTATGTTAGGTAAACCCTGAACTTAGGTTTTTCATAAGAACATACATCTGACCAGAGTCATATCAGTGAATCATTTATATCATGCATGTGCTTTGAGACCTATTCGAGGTATCATGGGATGACTCCTCCTAAAAGTTAAGTAGAAATGAATCTTGCAGCTTGATTTACTCACTGACTGGATGCTTTGGCCTACGTAAAATAAGTTGAAGTAGATTCAGTTTTTCTGAAGGCAGTAGCCACCGTTCCTGGGGAGCCTCCAGGGTGCCAGCGTCATGCCAGGCACTCCCTGACATTATTCCATTTCTCATCACGCAGCCTATGAGTAGGTGGTGGTATACCCATTTACAGAAGAGGAGACTGGGGCTCAGAGGTGGTCATTTTGCTCGGGGTTACATGACCAGTAAGTGGCAGGGCTGAGGTTGTTCCCAGGGCCCTTGCCCTTTCCTGCTTCCTATTACACAACAGGACTGAGTAAACCCTGTACCTTTGATTATACATGAAACCAGGTGGAGAAACAGCAGCTATGTACCAAAGAACCCAGAGCAATCGAGAAAAGCCCATCTGGCCAGGCGAAGTGGCTCACACCTGTAATCCCAGTACTTTTGGAGGCCGAGGTGGGCGGATCACCTGAGATCACCTCAGGAGTTCAAGACTAGCCAGGCCAACATGGCAAAACCCTGTCTCTACTAAAAAAATACAAAAGTTAGTTGAGCGTGGTGGCAGGTGCCTGTAATCCCAGCTATTCGGGAGGCTGAGGCAGGGAGAATTGCTTGAACCCGGGAGGTGGAGGTTGCAGTGAGCCGAGATCACGCCACTGCACTCCAGCCTGGGCTACAGAGCAAGACTCTGTCTCAAAATAAAAAAAAAAAGAAGCCAGTCTGGGAGAGAACAAGCTAAACCTTTGGTGTTCCCTTATCTGGGGGCCTTCTTCATCCCTGAAATGTACAGCTGGGTCTGACCTCTGAGTCCAGGGTCAGGTGATTTTGCTTAGCCTCAAGTGCTCAGATTCTGCTGATATTTTGCAAGACCTGGACTCTCTTGACACCCAGGATTCTTTCCTCAGGGGACATGCTGCCTATAGTTCTGCAGTTAACATCCTCCTTGGCCATGGCACCAGGGTCGGAGCCACGTACTTCATGACCTACCACACCGTGCTGCAGACCTCTGCTGACTTTATTGACGCTCTGAAGAAAGCCCGACTTATAGCCAGTAATGTCACCGAAACCATGGGCATTAACGGCAGTGCCTACCGAGTATTTCCTTACAGGTAAAGCCTGCCCTTTTTCAATGGGGTTTACCCAGCAAAGGGCCTACACTGGGTGGGAGTGGGGAGGGTTCCCTTGGCAAGATGCTGATTTTCAGGTTGGGTTCTGGCCCCTGCTCCATTCTGAGCACAGGGCAGTATATCAAAGGAAATGGGTGCTGGGCAAAGGAGTTCAGAATCTAAAGTCTCTGTGAAGGCCTGAGGGCTAGAGACGCAAAACTTGATCTCTGCGCCACTGCACAGCTGCAAGAGACACACACTGGAAAATGGCTTAAGGCAGGGGGCGCTTGGAGAGCAGGCGGCTCAGAGCAGGGCCCGGCCCACATTCTTGGCCAACAATGAACCAGAATCCCTAACTGCTGGTTATTTGGGATGCTGCCTGTATGTAGACTTTTTATATTGTTAGGGGTTTTTTTTCCCAGGAAGAAAAGTATTATGTATGAACTACTGAATTTAGAAACTGTAGAAAGGTAGGAGAAACAAGTGATTTATTTTTCCTGCCTCCCCATGATCTCGCTTAAAGCAGGAAGGCCTGGATTTGTTTGGAAGAAGTTAAGAGCCGGTTAGCTCTGGCAGAAAATAAATGAAAGCATGTTTTCCTCAGGCCTTGCACGGACCCCGCTGAGCCTGAGGTAGTGTCTCAGGATAGATCAGGATTCTTTGTTTTTTTGTGTTTTTTCAGAATGCTGTGGAATGCTCTCTGTAAATGTCTATAAAATAGCATAGATTGGGCTTATAAACAGAAACTTTATCAAAAATATACATTTTGCATCACTGCTGGGCCCTTCTCTGGGTGGTCAGTGGCCATGAGAGGTCAAGTGAGTTGCTTTCGGTGAGTCTTGTAGACAGCCAGCAAGGTTTTCTGCAAGGGATGTTTCCCAAAGGAGTCTGACCACTTGGCAGTGGTGACAGGATGAACACGCAGTGTTCGGGAGTGAGAGCGAGCTTTAATGAGGCCTCCCCTCTCCCCTCCAGTGTGTTTTATGTCTTCTACGAACAGTACCTGACCATCATTGACGACACTATCTTCAACCTCGGTGTGTCCCTGGGCGCGATATTTCTGGTGACCATGGTCCTCCTGGGCTGTGAGCTCTGGTCTGCAGTCATCATGTGTGCCACCATCGCCATGGTCTTGGTCAACATGTTTGGAGTTATGTGGCTCTGGGGCATCAGTCTGAACGCTGTATCCTTGGTCAACCTGGTGATGGTGAGTCCTCATACAGTCTCAGTTTGTCCCTAGCTCCTGTTTCACTTGGGGGAATTGGCTGTCTTAGATTCCATGTAAACCCTAAAGATGGAGTAAGATACCAAGTCTGGCGCTTGCTCTTGGCACACATGGAGAGGCAGGATGAGTGCTGGAGGAGTGCTGGATGGTGGTGGGACAGGGCATAGAGGGAGCGAGCATTGAGTTGGACATCTGGGAGCATAGGCACATTACAGGCAATTTCTGTTCAATTTTTTCTCTTGTCCCATTCCTTGCGGCTATACTAGTATACCTGATGGTGCCTCTGACCATGGAAATGTGATTTCCTGGCCTAGTTCTGGGCTAGTCTGCCTGTAATTTGTTATTCTTTAGAGATTGCACAAGCCTGTAGCCTGATGACAGCAGGATGTTCACTTTTTACTTAGAAAATTGCACCCCGCCCCAGGAGCTCTCCGACCAGTGCCTTTTGCCTCCTATGTGGTTATCAGGTACTTTTAATCATTAAAGATGAGAGCACTTGAGAAGGTATTCATGGAAAATAGAACAGTGTATCCGTACTCTCAGATATGAGCCCTGCTTCAGATAGGGGAGCACTGAGGTCCAAGAAAAGAAGTTGTGACAATGCGCCAGCTCGGTGCGGGTGGGGTGACCTTAACGGGTTCCAGCAATTTCTCCTGGTCAACACAAACGTGCCACAGAAAACCAGGCTTTTGGCTGTGTGTAGAGAGGGCCCCAAAAAGTTCCTGGTACAGTAAGATTGGTGTGATGGAGGCCTTGTAAGTCCAATGGGATGCTTGGCCTCCTCTAGCACCCAGGGTGCCCTGGGTAATTAGCACCCATCCTCAGAACGGGGTGGCTGCCTAGGGTCTTCAACAGGAAGAGAGCCATCCTAAAGGAAGTGCTTTATTTCAGAGCTGTGGCATCTCCGTGGAGTTCTGCAGCCACATAACCAGAGCGTTCACGGTGAGCATGAAAGGCAGCCGCGTGGAGCGCGCGGAAGAGGCACTTGCCCACATGGGCAGCTCCGTGAGTACCCTGAGCAGGGCCACGCCGGCAGAGTCGCACCACAAAGTAATCCTCCTCAGTGACTGAAGAGTCTGGATCCTGTACTTACAAAGCAGCTTCTAAGGATTGCAAGCTTTCAGGCAATTCATGAATTAGCTGCCACATCGTGGACAGAACGGACGTTCTGTGGAACTGTACCTGTTGGTACGGCTCCTTTTTAGGTGGCAGTGTGCTGAAGCAGGAAAATAACAGACAAGTTAAACATGAGACAGCTGGCAGTCTTTCCCATTTAAAATGCAGGGGAGCCCGGGCCAGAACCCAGCGTGTGATGTGCGGTTGGTGCCTGGAGAGTCGTCTTGGTTCAACTCTACACCCTGGCTTAGCCTATCTCTTTACCACTGTAGAAAATACCTGGTAAAGAGTAAAAACTAAAACTTTGTTTCGTAACACTTTTAAATATTTAAGTTTTCACCTGAGAATATAAAGAAAGATAATCAATTGGGAGACACGATGCAGTGTCTGTGCAGAATACACAGCTTTTAACTTGGTCATACCTCTCCCCCAGGATCATAAGGCAGCAAATAGTGTTAGGTAGTAGATGATGCTACCTGGGTTCAGTTCCCATTGCTTTGAACCTTGAATATTAAGAAATCCCCATAAGGGCTGGCCACGGTGGCTCATGCCTATAACCCCAGCACTTTGGGAGGCCAAGGCTGGCGGACCACTTGCGGCCAGGGGTTCGAGACCATGGCCAACATGGTGAAACCCCATCTCTACTAAAAACACAAAAATTAGCCAGGCATGGTGGCGTGCACCTGTTTAATCCCAGCTACTCAGGAGGCTGGGGCAGGAGAATCACTTGAACCTGGGAGAAATCCTTGTAAGGAAGTGTTTTTGTTCAATTACAGGTTGGTAAAAGTGGTTTCTAACACAGTATCTCTTCTTTTAGGTGTTCAGTGGAATCACACTTACAAAATTTGGAGGGATTGTGGTGTTGGCTTTTGCCAAATCTCAAATTTTCCAGATATTCTACTTCAGGATGTATTTGGCCATGGTCTTACTGGGAGCCACTCACGGATTAATATTTCTCCCTGTCTTACTCAGTTACATAGGTAAGAGTTCTCATCTTAAAAGGGTGGCACAATAGAAGGACATTACTGAAAGGGAATTCTATCCTGAGGCATTCTTTTCAAGTATTTGAACTCATACTAATGGTCATTTGATAATGATAAATGATACTGAGTAAAAAAATTTCTTCTAAAAGAAAAAACCCATCCAGGGGATTCATGATGGTGCAGACTACTTTATTAGGAAGTTGTCGATGTTTTTTCTGGAGGCCTGATCTGTCTGCTTCACAAAGGCCTGGAGCCAGTCCTTGAATGGATCTGAGTGTCAGCAGGCAGGGCAGCTCCTCCCTGCCACTGAGATGAAGGAGTCCATCTGGCAGCCAGCTCTCACACCAGCAGTGCTGCAGAACAGCTTTTTATGTCCCTCATGGATTTCCCGTTTCTTAGCAAAGTGCTTGCTGCCTTTCTTCATCTCGAGACTGTCCTTGATCCTTTTACTTCTATGGCCACTTCACCTTGCACAAAAATGACCCACGGTTGAAAGAACAATACTGATTTGCTTCATTTATAGCTTTGTCACTAAATTGAAGCACTGAAGTAGAAGATTAAGAAAATGAGGGGCTTTTTATCATCTCCGGGGGATAGAAAGTAGTTCTATTACAATCTAATATACTAGTTCCTTTTAAGAAAAAAAAAAAAAAAAAGAGATGAGCACTTTGGAAGGCTGAGACAGGAGAATCGTTTGAGACCAGCCTAGGCAACATAGTGAGGCCTCCATCTCTACAAAAATAAAATTAGCCAGGTGAAGTGGTGTGCGTCTGCAGTCCCACCTACTTGTTAGGCTGAGGCAGGAAGCTTGCTTGAGCCCAGAAGGGTGGGCTTAGGATGCAGTGAGTCGTGTTCATACCACTGCACTGCAGCCTGAGGAAGAAAGCAAAGAGCCCATCTCCAAAAGAGAGGGAGAGAGATGTGGTCTCACTCTGTTGTCCAGGCTGGTCTCAAGCAATTCTCCTGCCTCAGTCTTCCAAAGTGGGATTACAGGCGTGAGCCACTATGCCCAGCCAACTAGCTCCCTTTCTCCTGCAGAAATAAGAAAAAGTCTCTCTCTCTCATAGGGCCATCAGTAAATAAAGCCAAAAGTTGTGCCACTGAAGAGCGATACAAAGGAACAGAGCGCGAACGGCTTCTAAATTTCTAGCCCTCTCGCAGGGCATCCTGACTGAACTGTGTCTAAGGGTCGGTCGGTTTACCACTGGACGGGTGCTGCATCGGCAAGGCCAAGTTGAACACCGGATGGTGCCAACCATCGGTTGTTTGGCAGCAGCTTTGAACGTAGCGCCTGTGAACTCAGGAATGCACAGTTGACTTGGGAAGCAGTATTACTAGATCTGGAGGCAACCACAGGACACTAAACTTCTCCCAGCCTCTTCAGGAAAGAAACCTCATTCTTTGGCAAGCAGGAGGTGACACTAGATGGCTGTGAATGTGATCCGCTCACTGACACTCTGTAAAGGCCAATCAATGCACTGTCTGTCTCTCCTTTTAGGAGTAAGCCATCCCACAAGTTCTATACCATATTTTTAGTGACAGTTGAGGTTGTAGATACACTTTATAACATTTTATAGTTTAAAGAGCTTTATTAATGCAATAAATTAACTTTGTACACATTTTTATATAAAAAAACAGCAAGTGATTTCAGAATGTTGTAGGCCTCATTAGAGCTTGGTCTCCAAAAATCTGTTTGAAAAAAGCAACATGTTCTTCACAGTGTTCCCCTAGAAAGGAAGAGATTTAATTGCCAGTTAGATGTGGCATGAAATGAGGGACAAAGAAAGCATCTCGTAGGTGTGTCTACTGGGTTTTAACTTATTTTTCTTTAATAAAATACATTGTTTTCCTAAGTTTTGGGGTTACCCTATCTGCTTTGAGAGACAAATACAAAAGCTAAATGGAAGAGATTCTATCTAACCTGTCCTTATGGTAACTAAATGCCGTCTTACATTGAGCTAGAAATAGACCTAGAAGTTTCATTAGACAGCCCTGATCCTTCCCTATCCTAAAGATGATGTCTTAGGTTGTATAACTATTTGGAGATGAGAATGATCAACCAGGGCCAGGTGCGGTGGCTCAAACCTGTAATCCCAGCACTTTGGGAGGCTGAGGCAGGCGGATCATGAGGTCAGGAGTTTGAGACCAGCCTGGACAATATAGTAAAACCCCATCTCTACTAAAAATACAAAAATCAGCCGGGTGTGGTGGCACGCACCTGTAGTCCCAACTACTCAGGAGGCTGAGGCAGAAGAATCGCTTGAACCCAGCGGAGGTTGCAGTGAACCGAGATCACACCACTGCACTCCAGCCTGGGCAACGGAGCGAGACTCTGTCTCAAAAAAAAAATGAGAATGATCAACCAATGTATACTTCATAAAACTGAAACCTTAATAAGCCCCAGACCCTTTAAAACCCTTAGCCACCATTTGCCGTCTTATTCCTGGCTTTAAGAGATATTCCAAGATCTGCTATAAGAGATGGGCTGTGCCTGATCTGGGTCCTAAATGTGTCTTGACTCAAAACACACCTCCTCGGTGAGTTCCAGAGCATAATTCAGATTCTGTCAGTATACTGAATTCACTCTACTACAAATAATGGGCCAAGGGCTAGGTGGGCTGTTATCAAATTGTGTTGTTTACAAAAATGCTAACCCAGGGTCCTCGCCCACCAGCTGCCAGTGCCCTCTGCTACTCTTTGAGGCTATGGTTACCCCAAGTCTTTTCATTGCATTCTCACCTGGTGTGAAATTGGGGCTCCCTCGCAAACGCTGGTTTCGCTGTTCAAAAAAGCGGAATATTGTATAGAAAAGCATGTTGTCTTCAGTCTGCTTTGCAGCATCTAAAAATTTTCGTGCAGAAATGTTGTCATGGCCACCAATGCCCCGGATAAACCTTAAGGCAGCTAACACTTGGTGTTTGGAAAGGAGAACTTCTACTATTTCATCATTTGCTGTTGAAAGTCGCTAGCAGTAAGGGAGAGAAGTCCAGGTCAGTGCAAACAACAGGAACAGAGTTAGTTTCCATAGTCTAAAACCTCACACATCAGAGTTACCTTCAGCATGTCCAGAGATAGCTGATGAGCAGGAGGATAGAAACTCTCTAGGGATAACAGCAGACAAGCCTGAAAGACATTTTTAGACCCACTTCAGTTGGAAAGATAACGGTTAAAATTTTCCATTTTTAACCACAATGGAAGTAAAAATCTGGCAATGCATACCAAAGGTTTGGAGTCGCTGAGGACGTGGTACTGCAGGAACTGATGCAGCATATAAAAGAGGTTGTGCTGGACAAGGGTTTTGATAACAAGTTCATGTAGGTAATGCTGAGGACAAAAGTAAAAAGTGAAAGAACACTTCCAAATCATTCAGCTACAACAGACTAGAGGCTCCCCAAGGACTGGCTATTCTAACCAACACAGTAAAAGTCTGTCATTACAAGAAGTGGTTTCGTCATGCAGGTAAAGACCCCAACTTGACCTTACACTTCCCATTCCAACTAATAATGTCAGGAGTCACTCAGCATTCTGAGTCAGGGAGGCAGACCTGTCTTAGCATATGAGTCATCTTCTAAGACAGTGACTGTGTTTTTTTTTTAAATTCCTTCTGTTTTAACTTGGGCCCAGATGATTTGAAGGTACCTGTACTGCAATCTGAAACTGGTTAAGAGAACGAATGTATTCCATCAGCACGGCTATCACAAATTTATGAGGCATCTCCTAGGGAGAAAAAAATGTGGTCTTACAAATACCAACGAGGTGCAAAAGAGGCTGCATATAACTCTCTATCCAACCCCCACCTTGTTTCCATCTTAAAATGGCCCAGTGTTCATCTTTCACTGGTTTTGCACACATCGCTCCAGAACCACCCGTCAACAATTATGCTTTAGGCCTCAGCATTAGAAGCCAAACTACCAGCTCTAGGGCCTCACCCAAGGAAACTCCAGTGATTCTAATCACTTCAAGTGACTCTAATCACATGAAGTCTCCTCGTTTTCAGCAACTTCCTTGTTTTGAGCATTCTCAGTCCAGAAGAGGCGGAAAGCTGCAGCCCACCTTCTTTTCCACAAAGGCTGACAGGACATGGGTGTACACATCTGACTGGTCCAGCACCGCCTGGGTCCGCACCGGCCTCTTGAGGAGCGGGCTGCTTCGGCTCTGCCCTGCTTCCACCGCCTGAAAGAAAAAAACCACAAACTATGATCTTCGGCATCTTAGAGGAAGGGTGCTGTTTACAGTTCATCCACAAGGACTGAATTCTTCGATGTGGACCCAGGATATGAGCGGAAAACACTTTCTCTACTTAGATACAACTTTTTCCTGTGCGCATGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGAATCCCTTGAACCCAGGAGGCAGAGGTTGCGGTGAGCCAAGATCTCACCATTGCACTCCAGCCTGGGCAATAAGAACAAAACTCCGTCTCAAAAAAAAAAAAGCAGTTCAGATCCGTGCAGATTATGCAATAGCTGTGGGGTGTAGCCTGAGAACTTGCATTTCCAAGAAACTCCAGATGCTGCTCATGTGGCTGGTCAGTGGCCCACACTGCTGAGTCATGACGGTTTATGGAGCCCAGCAGACCGTGTGGGACGGCACAGAAACTGCCATTTGGGATCAGACCTACTGATTCCCACAGCCCAGAACACCCACAGCAATAGAGTCCAAAAGGACTCAGCCATCCCTCACGTCTGGCAGCGTAGGAATGGACACTGTCCCAGCAACTGGCCCTCTTCAGTGCCTGTCTCAGACCTCTTACCCTTCCATGAACAGCTAAAGGGGAGTGGAGTTCTGGGGCTTTTGTTGGTTTAAAACCATTTTCAGCCTAGGACTAATCAGATCCTGGAATTGAAATAATTCATTCTCCTTGTCCTAAACTTTTCTTCTGGCTTCAGAAGATATGATGTACAAGTAATACAGCGGGAATTGGTGGCGATAAGCCATGGTTATTACCTTGACTACAAACACGCCTGCTAAGTGCTAACACTGAATCGTCACTATCTCAACAGGATTCTTTCCCAAAAGGGAAGAAAGGTGTGGCAAATATAAATATTTCTAATTTAATTTTCTAAGTCCTCACTCTGGCATAACAGAAAAATATACAAAATATTGCAAAGCAGAGACTGATTTTTCTCATCTATAACAGTAGACCAAGGATCTACAGGCAAGATCAAACACAGATGGGAAAAACAAAAACAGTGAAGGTATGAAGTGAGATGCAGCCGCCAGCTCGTGGGATGCAGGGACCCTGAATTTACTACTCCTCCACTATCCCCCACTACTGCCACCTTGCCCTATGGCAGGCGGCAAATCTCAGCGACCTTATTCTAATATATAGGAAACAATTTTGCATCATAATTACTTAGAAAATACCCGGGAGGGGGTGGGGGAGGAGGACCCTTTGTCATACTCCATGTAACTCACCATCGCATAACTCTGCTCGGCATCCAGGTACTTTTTATACTCATGGTTGAGTTTATCAAAAACAGTGGCTATCACGGGCAGCGATGCTCTGTCTGACTCACTTAACACTGGAAAGGCACAATGTTCACACACGGATCAAACCAACTTCATGTCAGCTTCAGAATTTCCACACGTTGCTATGATAAAAACTAATCTCAAAAGGTTACCAATGCAAAAGTACCTTTAAAGGACACTCTACTTTAAAGACCTGACAGCTAGATGTCATTCGCAACCCCTTTCTGGTTACGGTTAAAAAAAAAAAAAAAAAAAAAAGCTATAGCAGGCCAGGCTCAGTGGCACATGCCTATAATCCCAGCACTTTGGGTAGGCCGAGGCAGAAGGATCACTTAACGCTGGGAGTTTGAGACCAGCCTGGGCAACAAGGCAAGACCCCATCTATACCAAAACAAAAACAAACACCAACAGCACATATTGGTAGGGGATTATTATTATTATTTTTTTTTGGATACAGGGTCTTGCTCTGTCGCCCAGGCTGGAGGTACACTGACACAAACGGCTCGCTGCAGCCTCGTCCTCCCGGGCTCAAGGAATCCTCCCTCGGCAGCCTCTGGAGTAGCTGGGGCCACAGGTGTATACCACCAAACTCAGCTAATTTTTTTTTTTTTTTTTTTTTTTTTTGTAGAGACAGGGTTTTGCCATGTTGTCGTCCAGGCTGGTCTCGAACTCCTAGGCTCAGGCAATCCTCCTGCTTCAGCCTCCCAGAGTGCTGGGATTATAAGCATGAGCCACCATGCCTGGCCTCAGTAGGGGATTCTTAAAGAAGACACATATGCAGTGAGTGGCTTGGATTTTGAAAGAGGTGTGTGTGAAGGCCAGGGGTGGTGGCCCACTCCCCTCCTGTGTGCCCACTTTCATTCAGAACCATCCCATTTATTGTTCTTTTCTACCAGTATCTCTACAAATCATCTTTCCATTTAGCAGCCTTTCCTAGGGGGTCACATAGCCACCCCTCACATAAAGAATGAGGCTGTGGGTCACAGACAAGACACAACAATGTAGCCCACATCCCGATAAAAAGTGTTGGGCAGCACAGGCCTCACACTGGAATCAGAGCAAGGGGGAAGGATTCAACTTACTCTGTGAACAGACAGACAGGATGACCATCTTGCATTCCTTTCTCTGGAGGAGAAAGTCCATGAGTCTTCCTTTGTCTGGTAAGAGATTTACTATGGGCTCAAGTTTCACTTGGAGGTTCCAGAGGTAACCTGGATTTTAAGAGGCAGCAAATAAAACAGTATGATGCAAACCGTAACAAAAGCCCAAAAGTGGTTCCCCTAAACATCTGCGGGGCGGGTGGCAGGTGGTGATAAAAAGCCGCAAAGTACAGTCAGTGTAGCTTTTCCTTCCTAACCAAAGCAGAGCTGAGCCATTCAGGAGCAATTCAGGAGCGTGTCTACCACAGGAGGATGACAGCCCAACCACCGCACACCTGGCTGACTCTTTTCCAAGTAACCTCTGCATTCAGGGGCACATCAAAGGTGTAGCTCCTAGTCCTTCATTCCAAACGGGGACTTCCCTAGACCTAGCCCCTCTTTTAACGTTTAAAATAGAAAAAGATGTCAACACGTGGCATCAACTTCAGTCCTGTGCTTTGGTTTCTCCTACAACAGCTCATTAGTTTAAAAGGTAACTCCAGAGGCTCTCAATGGAACATCATAACTCATCCATTCATCGACCCATAAATGTACTGATCACCCACACTGCCAGCATCTGGTGTGGCCTTTCCCAATTGGGATGCCACAGGAGAATGAAGTGCCACATAAAAAATCATCTGGGTGACCCCCTTTTCAGTTGGCCCAAGGCAGGTACAGAGCAGCTGTACAGGAAAACACCAGCGAGATGCACAGGAGAGAAATGACTTCATTACATACATACAGTGGATGTCACATGAGGCTATGGGTTACAGACAAGGCACAACAATGCATTACATACAGTGGATGCCTACAGCATCAGGGCTAATTCTCTCCTCAAGAGTTCTTAGGAATTCCAGAGGAAAGGCAGGAAAATACACAGAGGATTAAAGAGTAACATAGGAGATTCTCTAATAACCAGCCTGGCGAGGTATTAGAGACACAGGGGCAACATGGCAAGACCCTGTCTCTACAAAAAAAAAATTATAGGCCGGCTGTGGTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCTGAGGTGGGCAGATCACGAGGTCAGGAGATCGAGACCATCCTGGCCAACATGGTGAAACCCCGTATCTACTAAAAATACAAAAATTAGCTGGGTGTGGTGGCGCATGCCTGTAATCCCAGCTACTGGGGAGGCTGAGGCAGGAGAATCGCTTAAACCCAGGAGTTGGAGGTTGCAGTGAGCCGAGATGGCACCACTGCACTCCAGCCTGGTGACAAAGCGAGATTCCGTCTCAAAATAATTATTATTATTATTATAATAAATTAACTGGGCGTGGTGATGTGCGCCTGTAGGCCCAGCTACTTGGGAGGCTGAAGCAGGAGGATCGCCTGAGCCCAGGAGCTCAAGGCTGCAGTAAGCTGAGATAGCACTACTGCACTCCAGGCTGGGTGACGGAGCAAGACCCTGCCTTAAAAAAATAAGATTTCTTTAGGCCGGGCACAGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCAGGCGGATCACCTGAGGTTGGGAGTTTGAGACCAGCCTGACCAACATGGAAAAACCTCGTCTCTACTAAAAATACAAAATTAGCTGGGCGTGGTGGCACATGCCTGTAATCCCAGCTATTCAGGAGGCTGAGGCAGGAGAATCGCTTGAACCCGGGAGGCGGAGGTTGCAGTGAGCCAAGATCACGCCATTGCACTCCAGCCTGGGCAACGAGCAAAACTCCGTCTCAAAAAAAAAAAAAAAAAAAAAAAAGATTTCTCTAATAAAGAGATTACCCAGGAAGAGACAATTAACAGACTGAGGAGGCTTCCTCAGCAAGGCCAGAAAGAGGAGCACACCTCCCGGGCTCATGCAGAACAGAAAAGGGCACGGACACCGGTGGGAAGGTCGATGGGAGAAATGAGGGAGACACCCTGGGGTGGAGTCCGGCTTTCCATCCACCCTGGGGTGGAGTCTGGCTTTTCCAGAATGGGCTTAAGCAGGAGAATGGCATTCTTAGTTGTTGCTTTAATTATTAAAAGTAGTATATGTTCTTGATAAAATGCACATATAGTAAAAAACGTATAAAGTGAAAAAAAAAAATCCCATTCCCACGCTTGAAAGGAGGGGTCATTTCTAAGAGATTCACCTTGAAAACGTCCCTGGCTACAACTGGGATCCAAAGTCAACAAGCACCATGTTGTAACACGACAACTGTCCCCGCTGACCTACCTTGGCTTGCGCTGATAATGATGTCAGGTTGAAAGACAATCCAAGATGAAGAATCCACATGTTATAGGAAATTCTAAACCAGGAAAAGATGAAAACAAAAAGCAAACCCAGTTTCCGCTAGCACTCGCCCCTGCCCACCATGTACTGAGTCCACGCTAAACGCGAGGCCCCTGGACAGTCAGGGAAGCTGCCTGCGGGGTGGCTCTCGGAGTGTTATTCACAGCTGCCCGGAGGAGGACTTCAGGACCACTCTCTGAGGGTGACCACTTGCCCTGTTGTGCACGGTGCCACACCTTAGTAAAGGATACAGAGTTTACATGGAACAGGAGACTGGCTGGTCACGGCAGCAGGACCTACAAATTGAGAAAACATAAGTGCAACGATGCAGTCAGAAAATGCTGCAAATGCTGGTACTTATGACACAAAAGTCAATACTTTTTAATGTCATTACGAAATGTTTATTCAATTGTAGTCAAGGAAGAAATGAACTGTTCCGTCTCACTGAAAGCACGTACGGGGAGGAAGGGGGAAGGAGCTAACAATCCAGGAAAATCTCACCAAGAAAAAGAAAGCATGTCAAGGCTTCAATCACTGTGGTTTGGGTTATTTTTAATAACCAAAGATGACTCATGATCGTTTACATATGCACGTTAAGGAACTGAGAAATTTACTTGAAGGATTCAAAATCAAATACCCAGATCATCCACGGAGAATGTTTCAAATAAATGTGGCTTGTAGCTTAATTATCTTTTTTTTTCTTTAAGAGAGGGTGTTGCTCTGCTGTCCAGGCTTGAGTGCAGTAGTTGATCATAGCCCACTATAACCACGAACTCCTTGGCTCAAGTGGTCCTCCTGCCTCAGCCTTCAGAGTAGCTAGGACTACAGGCATGTGACCATGCCCTAACTTTTTTTCTTTTTTTTTTTTTTTTTTTTTTTTTTGTGAAGACAAGGTCTATGTTACCTAGGCTGGTCTCCAACTCCTGGGCTTAAGTGATCTGCCCACCTCAGCCTCCCAACATGCTGCGATTACAGGCATGAGCCACTGTGCCCAGCCACTTAATTATCTAAATAATTAGTTCGATTATCCATTGCATAGAGTAGGTCCAAGCACAGTGAGCTCGTCTGGGAAGCAGACCCCCAAAACCTCACATGACAGGGACCGTTAACAACCAGTTATACTGCTCATGAGCCATGCAGGCAGCCCTACAAGCTAACCATGACTCCTGGTTCTGTTCCAATTACCCAGGTACAATCAGAAGGCAGGTTTCAATCAGCTGGTCAGAGAAAGGGTCATTGTGAACAGACCACCCAAAGGTAGGAAAGAGCCCAGGCAGACAAGCTTTGGCGAAGAGCACTCGCGCTTTGGACCTAAGTGTCAAGGTCTGCGCCGAGTGCACAGCCCTCACCTTTGGGTGGCTGACCTACACACTGTCAGGTGAGAGCTTTCATTTTTAAGGCCCCCCAGATGATCCTAATATGTAGTCAGATTGAGACCCACTGTTCTAACAGGCCCAAAACAAAAAGAAAAAGGGTGGCTGACTCTTCCCAAAAGTGCTGGTTATATCTTTCTCAACAGGCCCATTCAATTCCTGAGCACGCCCACCCAGTGGCAGCACAGTGGGCAAGACACACGGATGCATCAAGCCGCCAGGGCTCACAGCCCAGCAGGAAACAAAAGGAGAGTCACTAACCTCTGAAAATGCTTTGCAGCCCACACTACCTAGATCCCCAGACCCTCAGTGGATTCCTGATTTCCTCCTATTGATCTCTGCACGGGCTGTTACTGTGACCAGGCCTCGCATCTGTTCCCTTATGACCAGATGGTTAGAACCTGATGCCTCCTAACTGGTCCTGTACCACCGGAACAGAGCTGAAGGTTCTAAGCCAGGGGTGTCCAATGTTTTGGCTTCCCTGGGCCTTAAGAGGAAGAAGAAGAATGGTCTTGGGCCACACATAAAATACACTAACACTAACAATAGCTGATGAGCTTAAAAAATATCATTAAAAAAATCTCATAATGTTTTAAGAAAGTTTAAGAATTTGTGTTGGGCTGCATTCAAAGCTGTCCTGGGCCACATGTGGCCCACAGACCGTGGGTTGGACAGGCTTGTTCTAAATGTTTAGTTTTTTTCCCCCAATTCACCAGCAGTTACCTTCATGCCAAGTGGGCAGCAGACACAAGACAATCACTTGGCAAAATCTATTCTTTCAATACTAACATTATTTACAAAGGAAAAGGAAGAAGCTTGAAAGAACACAGAAAGCCAAAAGACCTAATTGAACGTCTGTTAAGAACCAGCTCCTTCCTCCAACTGTGCCAGAAAGTAACTAAGCTTTTGGCTGGTCCAGCAAGACAGGGCAGTCAGGCTGACAATGGTGCTCTTGCTGAACTTTCAGCCAGAGTGCGATTCTGAACTCCCGGGTGAACGGTACAAGGAAATCCTGACTGCAGGCTGGGTCAACCCGCCCAATGCCATCGGACAAAGAATAAAACATTACTACTAGGGTTCCAAATGTGAGCCATCTGACTACGTCTTGCACACTGAAACCTCAGACTAGCCAATTCTGCACTCCAATCTCCTTCAAAAGAGAGCCGGGAGAGACTGCTGCGAGGGACAGGCACAGAAGAAAGACCCTGTGAGAACACAGTGAGAAGGTGGCCATCTGCAAAGAGGCCTGCCAGGAGGGAGGCCTCAGAAGAAAGCAAACCTGCAGACATCTTGATCTTGAACTTCTAGCCTCCAGAACTGTGAGAAAATAAAGTTCTGTTTAAGGAAAAAAAAAAAAGAGAGAGAGTGTGTGTTGAATATTCTTTCAGTTCTATCTTAAAATCAATTACACTGGAAAAAGGCAAAACGAAGCAAATAAATGACTTCTTTCCCTTTTCCTGAATTCCTGACCTCCACTCTTCTGACTTCCCAACCCCACCTCTCCAGACAGAAGGAGGACTGATTTGGGTAAGCCTAAGAGCCACAGCCGAAGCACTTACTGTGACTGTCAGTCCCAAAGAATGCAATATTCATCATCACTGTCACACGGAATGTGAGAAAGAGAAAAGTGATCCCAGGTTACAGTAACAAACCTACAGCCAAAGTTAATTTCAGCGTTACAGAGCTAAGGCAAACAGAAAACGTTACGGGTGTATTCAATATTAAAACATATTTCACCATCAACGGCTAATCAAAACTATCCATTCTAAAGCTCAGGGAAGATAAATTATTCTATTTCCTCCCAAGGGAGATTCATCTATCTTAGAAAATGCTTTTTTCACAACATAATTTTAGCTTATAGGATCAGTAGTAGTTGCATTTTTTAAAAAACTAGAACAGGCTGGGCATGGTGGCTCACACTTGTAATCCTAGCACTTTGGGAGAGCGAGGCAGGCGGATCACCTGAGGTCAGGAGTTCAAGACCAGTCTGGCCAACATGGTGAAACCCCATCTCTACCAAAAATATAAAAATTTGGGCCAGGCGTGGTGGCTCATGCCTGTAATCCCACCACTTTGAGAGGCCAAGGTGGGCAGATCACTTGAGGCCAGAAGTTCAAGACCAGCCTGGCCAACATGGTGAAACCCCATCTCTACTAAAAATACAAAAAAATTAGCTGGGCGTGGTGGTGCACGCCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCACTTGAACCTTATCTCCTCTCACAAGTATTTAAGCGATTGAATACTTGGTTCAATTGCTTGAATACCTCACAAGCTTGAACCTTGTGACAGACAGGTGGAGGTTGCAGTGAGCCGAGATCATGCCACTGCACTCCAGCCTGGGCAACAAAGTGAGGCTCTGTCAAAAAAATAAATTTAAAAAAATATAAAAATTAGCTGGGCACGGTGGCACACACCTGTAATCCCCACTACTTGGGAGGCTGAGGCAGGATAATCACTTGAACCCAGGAGGTGGAGACTGTAGTGAGCCAAGATCACGACACTACCTACCAGCCTGGGTGACTCAGTGAGACTGTCTCAAAACAACAACAAAACTGGAACAAATGGCCCCTGGCAAAATCAGACAGATCTGGGAATCTCTGTTTATTCCTCACTCCACTTTTAACGTGACTCCCAAAGATCATGGTGAGAACACAGCCACATGGTGAAAGGGCAGCACAGACTCCTCTACAGAACCCGTGTTACCTGTGATGGGGATCTGATAGGGCTGGATCGATCGAGCGGGAAGCACGGGGTGGTGGAAGGTAACGGAGCCGTCAAACTCTCCCCGTAACTTGATATCGAATATTACCGATGTCTGGGGGGGAAAAAGACAAGACTGAGGCCAAAATCAATCATGGTTTGCCCAGTTGCTTTCATTCCATCCCATCTTGCTGTTTAAATCAGTTTAAAAGCCTGTGTTTGCATTTCCTCCCTACAGGCTAGCTCTTACTTGAGAAGGAATTTGTCATTAACATCACAACTCTCTTTTAATATTTTTATCTCCTCTCACAAGTATTTCCTGCATTTATGACATGCTTCCTTTGATGAGCTCACTCAAAGTGACCTAAGCAGATCTCTGTCATTTCAACTGGAAACATCCTCACGTGTCACAGAGTTAGCGTCACCACCCTCTGGGAGGGTAGAGGAGGTAAGCAGCTTCTTTATATCAGAGGCCCAGCCCACAGGACCCATTCTAGTTGTCCTGGTCCACACGGCCTCAAAACCATTATCCCCCAGCACTGTCATCCATGCTCACAATTGCAACAGAGAGTTCAAGTACTCGTGGAATGGAGCGGATTCCCACCTTCTTCCAAGGTCAAATCTCAAGCGTTAGTTTCTGAAATAGTTTTGAATTATCTTTAATCAACTGACACAATCACTTTTTTCTAAACTACTTGAGACTACCAAACCCATTTCCATCTGGAAGACCAAAACTCTTAGCATAAAAATGCACTTTCTAGTCTTATTCAGACATTTTGCCAATTTTTTTTTTTTTTCGGAGACAGGATCTTGCTCCATCACCCAGGCTGGAGTGCAGTGGCGCGATCTCCACTCACTGAAGCCCCGACCTCCTGGGCTCAAGCCATCCTCCAGCCTTAGCCCCACAAGTAGCTGGGACTATAGGCGTGCACTACCACGCCCGGCTAATTTTTGTATTTTTTATATAGGTGGGGTTTTGCCATGCTGCTCAGGCTGGTCTCGAACTCCTGGGCTCAAGCAATCTGTCCGCCTTGGCCTCCCAAAGTGCTGGGATTACAGGCGTGATCCACCGTGCCCAGCCACCAATTTTCACAAGGCTTTTAAGCAACCTTAACTTTGGTAGAAACGCAGACAGCTTGTACCTCTGTATCCTGATGATGCACGACTACCAGGTTGTCCACCACGTTCAGGGCAAACTTTCCCGTCCTATTTAACTTCAATATGTGCATCTTTTTACAGGCACCTTCTCTGTAGGATAGAAAGCAAAAAACAGATCAACAAGCTGCAGTTCACATTTTAAAATCAGAGAGAGAGGGAAAACAAAGCATGAAATCTACCGTGGTAGATGATAGAGGACCACCTCCGCTCCTGTGCTGTTGGAGGTCCGAGAATGATGCCTCAAGAAGAGAACATACAGCTGCCCGTATCTAATTAGGGAACAAACAGACATAAATCACATCTGGCCATTCAAAATTCCTTTGTTCTAAATGGCATCACGGTTAAGTAAATTATAAGATATTCACTTAATGGAGTATTTTGCTGCCAACAAGTGTTTACAAAGAAACATGCAGTTACTCAAAGCCTATTATAAAGTTAAGTGGAAAAGAGAACACACACTAAACACAGCTTGATCATAATATTTTAAAAGAAAACCCCAAACCTAAGCATAGAGTCTAAAATGATTGGAAAGAAACACATGTAATAGTTATACTTGAGTGATATGCTAAGTTCATTTTCTTCTCTGTTTTCCAAGTTTTGTATAATGAATGTATATTCCTTAATAACAGGAAAATATAATCACTATTTTTTTTTTTCATTTTTCAGAGACAGGGTCTCCCTCTGTCACCCAGGCTGGAATGCAGTGGTGCAACCACAGCTCACTGCAACCTCCACCTCCTAGGCTTTGGCGATCTTCCCTCACCTCAGCCTCCCCAGTAGCTAGGACTACATGCACGTGCCACCGTGCCTGGCTAATTTTTAAATTTTTTTGTAGAAACAGGGTCTCACTATGTTGCCCGGGCTGGTCTTGAACTCCTGGCCTCAAGGCGATCCCCCTGCCTTGGCCTCCCCAGTCACTGGTATTACAGGTGTGTGCCACCATGCTCAGCCTTTTCTATTTAAGTGCCATCTAATAAATGTTGCTGTGAACAGTTCCTGAATGCATATTCTAGTCCAGTGGTAAACTCTGTGCTGGGCCTGCCCAGGGACAAGGAGGAGACCAAGGTGGGAGGGAACAGGTCCCCACCTCCACTTCAGCCAGGACTGCTCTCACTTTATCTATTGTCTAAACAGGAATGCTGGCTGGGCACGGCGGCTCATGCCTATAAACCCAGCACTTTGGGAGGATGAGGCGGGAGGATCACCCGAGCCCAGGAGTTCAAGACCAGCCTGGGCAACATGGTGAAACTCCATCTCTTCAGAAAATACAAAAATTATCCAGATGTGGTGGCATGCGCCTGTAGTCCCAGCTACTTGGGAGACTGTGGCAGGAAAATCACTTGAACCTAGAAGGCGGAGGTTGTGGTGAGCTGAGATTGTAACACTGCACTCCAGCCTGGGCAACAGAGCGACACTCTCCAAAAAAAATTTAAAAATAAACAGGAATGCCACAGAAGAGTACGTTTAAAAAAAAAGGAAGAAGAAATGAAAGAACATTATACTAACTACCATAAAGTTTGAAAGTTTGGGCCACTGTTTTAGGCCACAGAAGAATCAGAAGTAACTTAGAAGCAAAATTTTGACTATTGTCGAATCAGATACAGGCATACAGGGGTTCTTTTTTATTAGTCTCTATTGTGTGTTTAAAATTTTCATTACAAATTTAAAAACTGAGATATCCACTTTTTCAAATGAAAATATACCTCCGTACTGCCAGGCGTGGTGGCTCACGCCTGTAATCCCAACACTTTGGGAGGCTGAGGAGGGCAGATCAAGAGGTCAAGAGACCGAGACCACCCTGGCCAACATGGTGAAACCCTGTCTCTACTAAAAATACAAAAATTAGTTGGGCATGGTGGCACGCACCTGTAGTCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCGCTTGAACCTGGGAGGCGGAGGTTGCAGTGAGCCAAGATCGTGCCACTGTACTCCAGCCTGGCAACAGAGCAAGACTCCATCACAAAAACAAACAAAAAAAAAAAGTAAAAGAAAATATACCTCTATATATACGTAATTTAGTTCCATGTCTGTTACATAAAATCTTAATCTATTTTCTTATTTAGAACAATTATTATTTAACTGAGCTTTTAAAAAAAATAAACTTGGCCAGGCACAGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCAGGTGGATCACTTGAGGTCAGGAGTTCGAGACCAGCCTGGCCAACATGGTGAAGCCCTGTCTCTACCAAAAATACAAAGACTAGCCGGGCGAGGTGACGCACACTTGTAATCCCAGCTACTTGGGAGGCTGAAGCAGAAGAATCGTTTGAGCCTGGGAGGTGGAGGCTGCAGTGAGCCGACACTGCACCACTGCACTCCAGCCTAGGGGACAGAACAAGACTCTGTCTCGAAAAAAAAAAAAAAAGAAGAAGAAATTCTAAAACAAAGATACTAAGAAATAAATTGGTTCAATGTTCTTGTTTTATCAGGCTAGAAAGGTAAAGGAATTCCTTAGCATCACAAAGCTGATAAAAATCAAAAAGGAATGCCAAAAACACTGCAGGTTTTCTATGTTCACAGGACCTATACACTGAATACCCAGAACAAGGGGAGTCCTCCTTATGTGTTCTAGGGGTCAGGGCATCACGTGGTGCTTGTAACACACTCCTTCTATTATTTATATTACTGAAAGCAATCACAGGATGGAATTCTCTCTGACACGGACATACATGGTAGCCATTGCGATGTCTCTTTCGGAAAGGCTGGGTTTAGTTGACTTAGGCGCAGCTGGTAATTCAATCTCAAATTTGGGCAGCTTCGACATAGTGCCAGCCTGTTTAGGGGGAAAATGTTTTAGGAAAAGCTTATTAAACCCCTTCAATGTTTCATCATTCCCTGTGTAAAACCAACAAGGATAAACACAGACTTCGTCTTTGGATCCTTTCCACCGTCCCCCATGTCCTCTCACAGCCTGTCTGCCCAGCATAGAATGAATGGCTCCAGGAGCTGACGGGTATACAGAGTGCCCTCTAGTGGTCAGAGCGGTGACGTTACGGCTAGAGGAACCTGTCCCTAACGTGCCTGACACATTAGGATGCTACAGGAACAGGGGACAACTGGGGAAAGGTGTTTTTTTCAGGGGAGGCTTCCTCTTACCCTAAAGTGAAAAGGCTGCAGGACATTCTCCAGGACCGTGGTAGACAGCAAGATCACGGCGCTCTCGGGGCAGTACATGTACCAATTCACATTGAGATTGTGGCTCTTCAAGAGTTTCAGACTCCGTTTCTCTGGTAATACCTGAAGCAGAGTTTAAGAAACAGGATCTTCATTTAAAAAACGGCAAACTAATCCCAGCACTTTGGGAGGCTAAGGTGGGCGGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGGACAAAATGGTAAAACCCCATCTCTACTAAAAATACAAAAATTAGCCAGGCGTGGTGGCACATGCCTGTAATTCCAGCTACTCAGAAGGCTGAGGCACAAGAATTGCTTGAATGAACCCAGGAGGCAGAGGTTGCAGTGAGTCAAGATTGCACCATCACACTCCAGCGTGAGTGACAGAGCGAGATTCAGTCTCAATTAATAAATAAATCAATAACAGCAAACTGTCAGAAGATCCTTACAGTGCGCTCTGAGAATAAAAAGCAGAAGAAACCCACTAAGTGAAATGAACATTCTCACTTGTACTTATTACAGCTACTACTTAACCAGCCCTATGCTTGGTGCTTTACAGAGCCTCCTAACTCATTTACTCTTTGCCACGACTGAGAGGCAGGCATCACTGGCCCTATTAGCCAGATGAGAAACAAGGCTCCAAGAGTGGATTAGGGAACCTGCCCCTTAACAAAGCAATTATAGCCTGGGTAGGCTGTTTCCCTCCAAAATCCTTATCTGTGCCTCCACATGCCTGGGCATGTGGAGCACATGGATACACCTAAGAGCAATTTACAACAAATTTCTCCTCATCCAGGAAACGGCCAAAAGAAACTGACACCTCCAGGACCCCATGTGTTAACTCGGCCACCTCCCAGACCATGGCAGATCTGCCTTCTGCTTGGCCTCCACCTCGACTCCAGTCTACACTGGGCCTGGGAGGAGCTCCCTTCTTCTAGCAGATGTGTTCATAAGACTCCATACAAATGCAGTACTTTATAATCCAGGCACATTTTCAATGTACCCTAAATATTCCGATATTACAGAACACTGTACAGAGCCCCCAAGACATTAATGCTCATGGTACACTGCACTGAAGAACTGCTGCGCAAGTCAGGGGCAGGAGCCGTAAGCTTCTTAAGAACTATAATAATTAGGATGTGCTAGAGTCTTCTTTCTTTTTAACTTTTTTCTTGAAGATCTGAAGCCATCTAGGTAACCTTAAGGTATACTTTCCCACTGCAGAGAACAGAAAGACAGACTTTTAAATGATTACCATAGGGAACTCCCCCAGAAAGCAAGCCATCCTTCCCATGCAATCACATGTACAAAATTCTATTTCTGTGTGTATGGAATTTGTCTAAAGTTTGTTTAAAGTTCTCCTATTGGTCATTACAAATTTTTTTTTTTTTTGAGACGGAGTTTCACTCTTGTTGCCCAGGCTGGAGTGCAGTGGCACAATCTCGGCTCACCGCAACCTCCACCTCCCACGTTCAAGGGATTCTTCTGCCTCAGCCTCCCAAGTAACTGGGATTATAGGCGCCCACCACCACACCCAGCTAATTTTTGTATTTTTATTTTGAGACAGTAGAGACGGCACTTAGTAAAGATGGAGTTTAATAGAGACGGGGTTTCGCCATGGCGGCCAGGCTGGTCTCGAACTCCTGACCTCAGATGATCGCCCACCTCGGCCTCCCAAAGTGCTAGGATTACAGGCATGAGCCACCGTGCCCAGCCAGTCATTACTAAGATTTCGATGATGGCCTTACAGCAAAGCACCATGGCATTAACACACAGGTGTATTTTCTCTAACCATACATTCTAAATTATATGACTTTCATTAGGTCAACAAAATTAAAACCTGAAAGAACTCTTAACACCCTCTAAATTAGTTCCCCTTAGAGATCTCAGAAGCATGCTTAATAGGTCAGGAAGCTGGAACAGATGAAAAGAAACAGGCAGGTACATCAAAGGACACAATCCACAGAGTGGAAAGGCAACCTCCGGATTCGGAGAAAATACTTGCAAATTGTATCTCTAAGAAGGTGTTAATATCAGAATATATAAAGAACTACAATTCAACAAATAATAGTAATTTGATTTTAAAAATAGGCACAATGACCCGAATTAGTCATTTCTCCAAAGATGATACACAAAGTGGCCAAAACACACACACAAAAGTGCTCAACATCACTAATCAACAAAGAGCGCAAATCAAAACCACAATTAAGATGGCTAGTATCAAAAACAAAACAAAACAAAACAGCAAGTGTTGGTGAGGATATGGAGAAACTGGGACCCTTGTACACTTGGAGGGATTGCAAAATGGTGTAACTGCTATGGAAAACAGTATAGCGGTTCCCTAAAATATTCAGAAACAGAACTACCATCTGCTCCAGCAATCTCACTCTGGGTATAAATCTAAAAGAACTGAAAACGGGATCTTGAAGCGGTATCTGCATACCTGTATTGACAGCAGCACTATTCACAATGGCCAAGAGGCAGAAGCAACCCAAATGTCCCTCAACAGATGAATGGATAAGCAAAATGTGGTGTATACGCTCAGTGCGGTATTATCAGTCTTAAAAAGGAAACCCTATCACATGCTATGGCATGGGGGAACCTGTAGGAAATTATGGTAGATGAAATAAGCCAGTCACAAAGGGACAAATACTGTATAATTTCACTTATATGAAGTATAAAAGGTAATCAAATTCGGCCGGACACAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGTGAGTGGATCACCTGAAGTCAGGAGTTCAAGACCAGCTTGGCCAACATGGTGAAATCCCATCTCTACCAAAAATACAAAAATTAGCCAGGCGTGGTGGCGCACACCTGTAATCCCAGCTATTCAGGAAGCTGAGACAGGAGAATCGCCTGAACCCAGGAGACAGAGGTTGCAGTGAGCTGAGATCACGCCACTGCACTCCAGCCTGGGCAACAGAGCAAGACTCCATCTTAAAAAAAAAGGAGTCAAATTCATAGAAACAGAAAGTAAAATAGAGATTGCTGGGGCTGCAGGGAAGGGATAAGGGGAGTTGTTTACTGGATAGTTTTGGTTTCACAAGATGAAAAAAGTTCTGGAGCTATTTCATAACAATGTGAATGAATATACTTAACACTACTGAACTGAACACTTAAAAACAGTTAAGATAATAAATGTTGTATGTTTTTTTACCACAGTAAAAAAAATATTTTTGACCACACACAGTGGCTCATGCCCATAAATCCCAGCACTCTGGGAGGCCAAGGCAGAAGAATGGCTTGAACCTAGGAGTTCAAGACCAGTCTAGGCAACACAGCAAGACCTCATCTCTACAAAAAAAAAAAAAGGAAAAAAAAATTAAGTTGGGCGTGCTGGCACACACCTGTAGTTCCAGCTACTCAGGAAGCTGAGGTGGGAGGACTACGTGAGGCTAGGAGGTCGAGGCTGCAGTGAGCCGTGATTGTGCCACTGTACTCCAGCCTGGGTGACAGAGATCCTGTCTCAAAATAATTATTACAAAATAAAAAAATTTTAAGAGGAAGTTAACAAAATACAAATGGACAATATACAAATGAAAAGATGCTTACTTCCCTAGTAATGTAAAATGCAAATTAAAATGTCTTTCGGCCAGGCATGGTGGCTCACGCCTGTAATCCCAGCACTTTAGGGGGCCGAGATAGGTGGATTATTTGAGGCCAGGGGTTCAAGACCAGCCTGGCCAACATGGTGAAACCCCACCTCTTCTAAAAATACAAAAATTAGCCAGGCGTGGTGCTGGGCGCCTGTAGACCCAGCTACTTGGGAGGCTGAGGCAGGAGAATTGCTTGAACCCAGGAGGTGGAGGTTGCCGTGAGCCGAGATCGCACCATTGCACTCCAGCCTGGGCGACGGAGTGAGACTCTGTCTCAGAAAAAAAAAAAAAAAAAAAAGTCTTTCTACCTCTCAGGTTGGCAAATGTCTATAGACTGATAATATCCAGTCCTCCTAAAGGTATGAAAAGCAGAAGTTCCTATATTGCTAGTGAAAATACACATGTCTAGAAGAAATTTGGCGATACTGGTTCAGCTTTTCAGATGTTCGTACCTATACTGCAACTCTCCCTCTAATATAAAGAAGTGTGTACAAGCATGTTACTGAAGGGTTATTTGTAATCACAAAAAAATGGAAAACCAGCCAATGTCCAATAACAAGAAAATTTTTAAACTGCAGTCCATCCATACAGTGGAATACTACCCAGTCAGAATAAAATATAGAAAGATGTCCAAGATACACTTTGGACAAAAAAAAAAAAAGCTAGCTGCAAAAGTTTATATACAACATTCCCCTTTTTGTTAAAAAGAAGTTTGTATTTATTTTTAAAAATAGAGGAATATGCACCAAACTGTTCATAATAATTATTTATCGGGATTATAGGGAACATTTGCTTTCCATATTACATATCTTGCAATGTTTGAATGTTTTTTGTTTTAACTTTTAGGTTCAGGGATAGATGTGAAGGTTTGTTACATACGTAAACTCATGTCACGGGGTTTGTGGTACAGATTATTTCATCACCCAGGTATTAAGTCCAGTACCCAATAGTTATCTTTTCTGCTCCTCTCCCTCCTCCCACCCTCCCCTGCTCAAGTAGCCCCCCGTGTCTGTTGTTTCCTTCTTTGCATTCATAACTTACATTTAGCTCCCACTTAGAAGTGAGATCATGTGGTATTTGGTTTTCTGTTCCTGTGTTAGTTTGCTAAGGATGATGGCCTCCAGCTCCATCCATGTTCCCACAAAAGACATGATCTTGTTCATTTTTATGGCTGCATAGTATTCCATGGTATATATGTACCACATTTTCTTTATCCAATCTGTCACTGATGGGCATTTAGGATGATTCCATGTCTTTGCCATTGTGAACAGTGCTGCAATGAACATTCACGTGCATGTGCCTTTATGGTAGAATAATTTATATTCCTCTGCATATTACACCCAGTAATGGGGCTGCTAGGTCAAACAGTAGTTCTGCTTTTAGCTCTCTGAGGAATCGCCATACTGTTTTCCACAAAGGTTGAACTAATTTACACTCCCAGCAATAGTGCATAAGGGTTCCCTTTTCTCCACAACCTTGCCAGTATCTGTTATTCTTTGACTTTTTTATAATGGCTATGCTGACTAGTGTGAGATAGTTTCTCATTGTGGTTTTGATTTGCATTTCTCTAATGATCAGTGATGTTGAGCTCTTTTATGTTTGTTGGTCGCATGTGTGTCTTCTTTTAAAAAGTGTCTGCTCATGTCCTTTGCCCACTTTTTTTTTTTTGAGACGGAGTCTCGCTCTGTTGCCCAGGCTGGAGTGCAGTGGCACCATCTCAGCTCACTACAAGCTCCGCCTTCCAGGTTCAAGCAATTCCCTGGCCTCAGCCTCCCTAGTAGCTGGGATTACAGGTGCCTGCCACCAACCTGGCTAATTTTTGTATTTTTAATAGAGACAGGGTTTCGTCATGTTGGCCATGCTGGTCTCGAACTCCTGACCTCAGGTGATCTGCCCACCTCGGTCTCCCAAAGTGCTGGGATTACAGGTGTGAGCCACTGTACCTGGCCTTTGCCCACTTTTTAATGTTGTTGTGTTTTTGTTTTTTTTTTTGAGATGGGGTCTCACTGTCATCCAGGCTGGAGTGCAGTGCTGTGATCTTGGCTCACTGCAACCTCCTGCCTCCCAGGCTCAAGCAATCCTCCCACTTCAGCCTCCCAAGTAGCTGGGACTACAGGCGCACACCACCATGCCTGACTAACATTTTGTATTTTTTATAGAGATGGGATTTCATCATGTTGGCCTGGCTGGTCTCAGACTCCTGGACTCAAGCCATCCACCCACCTTGGCCTTCCAAAGAGCTGGAATTACAGGCATGGGCCACCAAGCCCTTTTTCTTTTCTTTTTTTTTTTTTTAATTTATTACTTGCAATTATAAAAAAAAAAAAAAAGAATAAAATCCCCAGCAAGAGACTAAAGCTGAGTGGCCAAGGCAGGAGTTGAGGTTAGGAGTTTGACACCAGCCTGGGCAACATAGCAAGACTTCGTCTCTACAAAAAAGTTTAAAAATTAGCCAGGGCCGGGCGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGCGGGTGGATCACCTGAGGTCGGGAGTTCGAGACCAGTCTCAACATGGAGAAATCCCGTCTCTACTAAAAATACAAAATTACCCGGGCATGGTGATGCATGCCTGTAATCCCATCTACTCACGAGGCTGAGACAGGAGAATCGCTTGAACCTGGGAGGCGGAGGTTGCGGTGAGCCGAGATCGCGCCATTGCACTCCACCAGCCTGGGCAACAAGAGCGAAACTCCGTCTCAAAAATAAAATAAAATAAAATAAAATAATAAAAAGAAAAATTAGCCAGGCATGGTGGTACATGCCTGTAGTCCCACCTACTCAGGAGACTGAGGCAGGAGGATTGCTTGAGCCCAGGAGTTTGAGATTACAGTGAGCCATGATGGTGCCACTGCACTGCAGCCTGGGCAACAGAGCAAGACTCCATCTCTAGAAAATGTTTAAAATATATATATATATATTCAGTACTGAATTCAAAAGGCTGCCAGAATGCTATCACTGAACTTTAACCAACAAACATAAATGATAAACATAATACCTGGTAAAATTCGATTCCTTGATCTGTTATGAAGACAATTTCAGTTGAACTAGTCCAGCAGAATCCTAGAATGTTGGCATTCTTAGTCTAAGAAAAATTTTTTAAAAATATTTTTAATTAATAAGAAAAAACACATATAACTCTCTTCAAAAGCTTCACAAACTCTGCAGTTTGTCATTCTTTAATGAACGTTCCCCGGAATGTTTACTAATTAACAAAACAAATTTTCTTTTAAATACAATGTTCCCTGATTTTTGCCCATAACTCTTCATTCAAGAACCTGAATCCTAATTCCTTCTACTAAACAGAACAGGAGAAGTCTGTGTTTTGTAGAAAAGTAACTGACCAGAGCTCACAGACAGCAGCTTCTACCTGCAGGAATCACCATACTGCCAACATTCTTAGTCACCCACGTTATAAAAATGGTTATTAAAAATGTACAAAGGCCTAAGGGTCTTTAGTGAGTGTTGACTAAAATGGGTTGAGGACCCTGAGACACACACCCGACTCGCTTGAGGGCAGACAGGTTTGAGAAGGGCCGGGCTGAGGGTCTCTTCACACGGGGCCACTGCAGGGCAGGCAGGACAGTGGTGGGGATGCACCTCTCCTCACCAAAGAGTCCGCCCTGAACTCCATTGAGCAAAACAGTCACAAAAATGCAGAAAGCCCTACCCCAACCACTAGCAGCTTCTGTCAGCGCCCAAGGTGCCACACTGCCAATTTTAGCTCAGCTCCCTCTAGCCTAGTTTACTACACCCAGCAAATCTCATTAATGTGGATTAGAATCAACACCTAGGAGAAGAAAGAAAGAGTAAGGACAAGACAAAGACAACAAATTGAGGAAAGGAAACTTCAGGAAACAGAAAAAGAAACTCCTCACCAGAAACCTCCACTCCAGGTGGCTGTGAGGCATCCCAGGGCCCAGACCCAGATGTGCTGTCAGCCCAGTGAGGAGAAAAAGGGCAAGACAGACGACAGCCCCAAGGGCTAGCACTACTGGGTGTTCACCACGCATCATCCATTGAACCCTCCCCCTCCAAAGGAACAAGCTTTCAAACTTAGAAAACTGTTCAGTGTCACAAAGCAAACACCCCGCCTGACTCCAGTTTGGGAATCAACATGAGGGACAGTCTGACTTCAAGTCTGTGCTCCCTGCGACCCCAATGCCCCGCTCTCCACTACATAACCCAGCTCAACACCACTGACACCAGCAGCTGAGAAAGGGCCTGGGGTCATACCTTGCACTCCTGTGTGTATTCCAGCTGGGAATTATCAGGGATAAAATTACAAAAATCCTGAAAGGAAAAACACACAGACACACACAAATTTGGATTAGGCAGCATACTGCCAACCTACGTTGGCATACTACAAGACAAGAAAAATAAATATTAACTTAAAAAGTGACCAGAAAATAACTGAAGACAACCAAAACACAGGAAAGATAAAAAGACCAATTCGGATCATCTGTCTCAACAGCAGCAGGCTTACGATTCAATTTTTTTTAAGTTAATACAAATATTCAGTTACAGTTTAGTAACTCCTTTCAAAAATTCATTCCTCAAGCAGCTGATGTCAGAGAAATGTGTTGCTGCACTAAGAGGCTTCCCCAAGACTTTAACACTTAAAACTGATGGAAGAAACTAACAGAGGATTCTGCCTGTTTCTAACAGCCTTCCCTCTACTCTACAAACGGCAATGGTGAACATTTACACGGGCTAAAGTGCCTGTAGGCTGCTTCAACTTGGAATATCTGCTCCTATCAGATCTAGCACTCAGAAATGAGAGATGAAAAGGCTAATTCACAAAGTAGCCAAAAATACCTCACATATTCTATGCTGCTATCAAGCAATACAAAAGACACATGAAGTTCCAAATTATTTTTTAACAATTTTTAAGGGAGACTGAGGCGAGAGAATCACTTGAGCCTGAGAGATCGAGGCTGCAGTGAGCCGAGATCACATCACTGCACTCCAGCCTGGGCAACAAAGGAAGACTGGCTCAAAAAAAAATTTTTAATTTAATTTAAAAATCAAACTAAGGTCATTTTTTTAACCCACTCAAATGTCTTTTTCGTTTTTGAAGGCTCTAATACAATGCAACATAACTATACCTTTCACAACAGTAAGATAATAAAAGTTTCCTTTAACACTGAAAATTTGCGATTCCTTCTCTTCCAAATGTATTTCTAATGCCCTTTAATGCTGTATTTTAAAGATAAGTCTTACCACAGTCTTTGAGGTCCTCTGAACAGCCAATATCTTATTTTCTAAGGAAAACTTAATGCACTTCACTTCTCCTTTGTCATCCATTCTTTAAGAAGAAAGATTGTGTTAGTAGTTAAATAACCGAATTCTAGCTACTACCATTTATTGAAAAGGCAAAAGACACAATCTATATTCAGGAGGCAGCAAATTCTAGTCTAAAATTAAAATTATGTTTCGGAAGCCATCAGTAGGACCTCTTTTCAAACTACCAAATCCAACTGGAAAGAACTTGCTGGGAAACTTACAGTATTATGGGTAACAAGTGATTGAAGAATTCAGATCACACACACATATCACCTGAGAATTGTTCCAACATAAATAACTATAGACCCGCTCAGGAGCCTTCTCCGTAACTGCTGTTTCTCTCTCACAGCAAAGCTTCTGGAAAGAACTATCTACTTGTGCATCTCACAGCACATTCATTATGCAACCCAGATGGCTCCACTACAGTGTCTCATGACCGCCTCAGACAGATGTTAAAAAGTGAACTCAGCTGGGCACAGCGGCCTACACCTGTAATCCCAGCACTGTGAGAGGATGAAGCAGGAGGATCACAGGAATTCGAGACCAGCCTCAGCAACACAGTGAGACCCCGTCTCTATTCCAATACATACATTTTTTAAATTAAAAATTCATTTAAAAAAAAAAAACTCAAGGGATGGATTACAGAAGGGCCCAAGGAAACTTTTCGGGGTCTGAACATGTTCATTGCCTTGATTGTGGTGATGGTTTCATGGGTGTATACATGTCAAAACTCACATATTGCATAATATTAAGTGTGTACAGTTTATTATGTGTCAACTATGCCTCAATAAAGCTGCTTTTAAAAATC |
122 | 潛在GBA標的序列 | ACGTTTTACAAACAGCCCATGTTCT |
123 | 潛在SERPINA1標的序列 | CCAGTCCAACAGCACCAATATCTTC |
124 | 潛在FIG4標的序列 | GTCATAATTGATGACAGGGTAAGTA |
125 | 潛在ATM標的序列 | TCTGAAACCACTATCGCAAGAAATT |
126 | 潛在BTD標的序列 | AATATATCAAAGCATGTGAAGATGC |
127 | 潛在PMM2標的序列 | CTGACAAGCCAGCATAGGGCATTCG |
128 | 潛在CLCN1標的序列 | CTGGGCCACCATGTTGGCCAAGATA |
129 | 潛在PTEN標的序列 | TAGTTGTGCTGAAAGACATTATGAC |
130 | 潛在CFTR標的序列 | GACTTCATCCAGATATGTAAAAATA |
131 | 潛在DBH標的序列 | GAGTCTCTCCTCCCTGCCAGCTCTC |
132 | 潛在LDLR標的序列 | GCAGATCAACCCCCACTCGCCCAAG |
133 | 潛在MEFV標的序列 | CTTCGTGGACTACAGAGCTGGAAGC |
134 | 潛在 GCDH標的序列 | CCCGGTACACATGACATTCACGCCC |
135 | 潛在GNE標的序列 | GCACCCTGTGACCACTGACATTAAG |
136 | 潛在 HADHA標的序列 | TATCACGACCGAGAAAACTTCCAAA |
137 | 潛在 CALM1標的序列 | GTAGTTCTGCTGCACTGATATAACC |
138 | 潛在IDUA標的序列 | GAACCTGCTACTGGCCAACACCACC |
139 | 潛在 NPC1標的序列 | CCCGACTTATAGCCAGTAATGTCACC |
140 | 潛在 SLC26A4標的序列 | CCGAAATAAAACAAAAGATGTTAAA |
141 | 潛在 RAF1標的序列 | ATCCACACCTAATGTCCACATGGTC |
142 | 潛在ALDH7A1標的序列 | CGTCCATTGCACACACACAGACTTT |
143 | 潛在 SBDS標的序列 | AACAGCTGCAGCATAGCTAACCCTA |
144 | 潛在ATP7B標的序列 | GGCCCAGGCCATCCAGACCACCTTC |
145 | NLS-3XFLAG標籤-APG30130-L32-nAPG07433.1-連結子-NLS | MAPKKKRKVDYKDHDGDYKDHDIDYKDDDDKMIKTEYTLRSGYPIVRRTLENKKNLVKQPGFGPESCCAVVEYRLRGNIRYAFGNSRMQVSVPPGIYTNNWVRLHGEMAALVAAIERIERFSSDDVIPITAAYIELRPCEANCMQALHNILPENANVYYSFDHPTQVEEWKLRAHELCSGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSKRPAATKKAGQAKKKK |
146 | APG09980-L32-nAPG07433.1-連結子-USP2 | MAAGPAPEARSLMDEQTFLDNFNNLKYPRKTYLCYEVELLVGENHIPLDDYKGFVHNEGFDMGLERCHAELIFLERMASWNLDTELRYRITVFISWSPCPECADELVKFLRENRHVNLRIFAARIYDWYQGYEAGLRALKAAGAEVAMMTLHEFEYCWNNFVDHQQDEDTPFPPWDNLVARSEELSQRLEGILQPSVLVFCWPSQVSVTAAHSDIMSQASRAWEKRRDPPSGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSGGSGGSMKTTTQELKQYITRLFQLSNNETWECEALEEAAENILPERFINNSLLAHLTLNTYTYYNDELHELSIYPFLMYANDQLISIGYLDHFDMDFLYLTDTKNTIIDERHLLKQGENNHE |
147 | APG05840-L32-nAPG07433.1-連結子-USP2 | MEASPASRPRPLMDPHMFTGNFTNNPRVFGLHQTYLCYEVKRQGPDGTRDLMNEQRDFLCNQAKNHFSGSEDHHAERCFLDRIPSWQLDPAQTYRVTCFISWSPCFSCAQEVAEFLHENPHVNLRIFAARIYDYLPRYEEGLQMLQNAGAQVSIMTSEEFGHCWDTFVDRQGHPFQPWEGLDEHSQALSGRLQAILQNQGNSGGSSGGSSGSETPGTSESATPESSGGSSGGSMRELDYRIGLAIGTNSIGWGVIELSWNKDRERYEKVRIVDQGVRMFDRAEMPKTGASLAEPRRIARSSRRRLNRKSQRKKNIRNLLVQHGVITQEELDSLYPLSKKSMDIWGIRLDGLDRLLNHFEWARLLIHLAQRRGFKSNRKSELKDTETGKVLSSIQLNEKRLSLYRTVGEMWMKDPDFSKYDRKRNSPNEYVFSVSRAELEKEIVTLFAAQRRFQSPYASKDLQETYLQIWTHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTKEQREIILNNMFQRTDYYKKKTIPEVTYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEINKVVANYSERTNETFSTLDYDGIGYALTVYKTDKDIRSYLKSSHNLPKRCYDDQLIEELLSLSYTKFGHLSLKAINHVLSIMQKGNTYKEAVDQLGYDTSGLKKEKRSKFLPPISDEITNPIVKRALTQARKVVNAIIRRHGSPHSVHIELARELSKNHDERTKIVSAQDENYKKNKGAISILSEHGILNPTGYDIVRYKLWKEQGERCAYSLKEIPADTFFNELKKERNGAPILEVDHILPYSQSFIDSYHNKVLVYSDENRKKGNRIPYTYFLETNKDWEAFERYVRSNKFFSKKKREYLLKRAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEAEDNPRKRRVQTVNGVITAHFRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTRVTEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSLDYIFVSRMPKRSITGAAHKQTIMRKGGIDKKGKTIIIERLHLKDIKFDENGDFKMVGKEQDMATYEAIKQRYLEHGKNSKKAFETPLYKPSKKGTGNLIKRVKVEGQAKSFVREVNGGVAQNGDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVASSKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKKNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHSGGSGGSGGSMKTTTQELKQYITRLFQLSNNETWECEALEEAAENILPERFINNSLLAHLTLNTYTYYNDELHELSIYPFLMYANDQLISIGYLDHFDMDFLYLTDTKNTIIDERHLLKQGENNHE |
148 | C端NLS前的連結子 | SGGS |
149 | APG05083.1 | MRELDYRIGLDIGTNSIGWGIIELSWNKDREQYEKARIVDKGVRMFDKAEIPKTGASLAEPRRIARSSRRRLNRKSQRKKDIRNLLVQHEIISQKELASLYPLTKSSMDIWDIRLDGLDRLLDRFEWTRLLIHLAQRRGFKSNRKSELKDVETGKVLSSIQANEKRLSLYRTVGEMWMKNEDFSKYDKRRNSSNEYVFSVSRADLEKEIVTLFEAQRKFQSSYASADLQKTYLQIWAHQLPFASGNAIVNKVGYCSLLKGKEKRVPKATYTFQYFSTLDQINRTRLGPNFQPFTKEQRDVILDEMFNRTDYYKKKTIPEVTYYDIRKWLALDETIQFKGLTYDPNEELKKIELKSFINLKPFYEIKKVVTNYAKKTNEAFSTLDYDTFAYALTVYKTDKDIRSYLKKSNNLSKCCYDDQLIEELLTLSYTKFGHLSFKAINHVLPIMQEGRTYQEAIHQLGYDATNLKKENRSMFLPLFPDEITNPIVKRALTQARKVVNAIIRRYGSPNSVHIELARELSKSHDERTKIMKAHDENYKKNKGAISILIENGILNPTGYDIVRYKLWKEQGERCAYSLKQIPANTFFNEMKKERSGSPVLEIDHILPYSQSFIDSYHNKVLVYGDENQKKGNRIPYTYFLEGNKDWESFESYVRLNSFFSKKKRGYLLKKAYLPRESNMIKERHLNDTRYASSYLKNFIEKNLKFKEVEGSTRKKHVQTVNGIITAHLRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTKVTEYYQIKESNKSIRKPYFPLPWVGFREEILSHLARQPIARKISEELKIGYQSFDYILVSRMPKRSVTGAAHEQTIMKKGGIDKKGKTIIIKRVYLKDIKFDENGDFKMVGKEQDLATYEAIKQRYIEYGKESKKAFETPLYKPSKKGKGNLIKKIKVEVQTKSFVREVNGGVAQNGDLVRVDLFEKDNRYYMIPIYVMDTVHSELPNKAVTSSKGYEQWLTIDNSFTFKFSLYPYDLVRLVKGNEDRFLYFSTLDINSDRLNFKDVNKPSKQAENRYSLKTIENLEKYEVGVLGDLRFVRQEIRKNF |
150 | APG05083.1 crRNA重複序列 | gucauaguuccauuauugc |
151 | APG05083.1 tracrRNA | gcuuugauguuucuaugauaagggcuuaggcccguggcguuggggaucgccugcccauuuuaaugggcuucuccccaucuauuu |
152 | APG05083.1, APG07433.1, 及APG07513.1 PAM | nnnncc |
153 | APG07433.1 crRNA重複序列 | gucauaguuccauuaaagcca |
154 | APG07433.1 tracrRNA | uggcuuugauguuucuaugauaaggguuucgacccguggcgucggggaucgccugcccauugaaaugggcuucuccccauuuauu |
155 | APG07513.1 | MRELDYRIGLDIGTNSIGWGVIELSWNKDREQYEKTRIVDKGVRMFDKAEIPKTGASLAEPRRIARSSRRRLNRKSQRKKDIRNLLVQHEIISQKELTSLYPLSKSSMDIWDIRLDGLDRLLDRFEWARLLIHLAQRRGFKSNRKSELKDVETGKVLSSIQVNEKRLSLYRTVGEMWMKNADCSKYGKRRNSPNEYVFSVSRADLEKEIVTLFEAQRKFHSSYASVDLQKTYIQIWAHQLPFASGNAIVNKVGYCSLLKGKEKRVPKATYTFQYFNTLDQINRTRLGPNFQPFTKEQRDIILDKMFQRTDYYKKKTIPEVTYYDIRKWLALDETIQFKGLTYDPNEELKKIEMKPFINLKPFYEIKKVVTNYAKKTNEVFSALDYDTVAYALTVYKTDKDIRSYLKRSNNLSKRCYDDQLIEELLTLSYTKFGHLSFKAINHVLPIMQEGRTYQEAIHQLGYDTTNLKKENRSMFLPIIPDEITNPIVKRALTQARKVVNAIIRRYGSPNSVHIELARELSKSHDERKKIMTAHDENYKKNKGAVSILIDNGILNPTGYDIVRYKLWKEQGERCAYSLKKIPANTFFNELKKERSGPPVLEVDHILPYSQSFIDSYHNKVLVYGDENQKKGNRIPYTFFSEEDKEWESFESYVRSNSFFSKKKRGYLLKKAYLPRESNLIKERHLNDTRYASSYLKNFIEKNLKFKEAVGITRKKYVQTVNGVITAHLRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTKVTEYYQIKEGNKSIKKPYFPLPWMGFREEILSHLESQPIARKISEELKIGYQSPDYILVSRMPKRSVTGSAHDQTVMKKGDIDKKGKTIIIKRVHLKDIKFDENGDFKMVGKEQDLATYEAIKQRYLEYRKESKKAFETPLYKPSKKGKGNLIKKIKVEVQTKSFVREINGGVAQNGDLVRVDLFEKDNRYYMVPIYVVDTVRSELPNKAVTSSKGYEQWLSIDNSFTFKFSLYPYDLVRLVKGDEDRFLYFSTLDINSDRLNFKDVNKPSKQAEYRYSLKTIENLEKYEIGVLGDLRLVRQETRKIFK |
156 | APG07513.1 crRNA重複序列 | gucauaguuccauuaaagccauugcug |
157 | APG07513.1 tracrRNA | acagcaauggcuuugauguuucuaugauaagggcuucggcccguggcguuggggaucgccugcccauuuuaaugggcuucuccccaucuauuu |
158 | APG08290.1 crRNA重複序列 | gucauaguuccaugaaagcca |
159 | APG08290.1 tracrRNA | uggcuuugauguuucuaugauaaggguuucggcccguggcgucggggaucgccugcccauuccgaugggcuucuccccauuuauu |
160 | APG08290.1 PAM | nnrncc |
161 | APG05459.1 | MKKDYVIGLDIGTNSVGWAVMTEDYQLVKKKMPIYGNTEKKKIKKNFWGVRLFEEGHTAEDRRLKRTARRRISRRRNRLRYLQAFFEEAMTALDENFFARLQESFLVPEDKKWHRHPIFAKLEDEVAYHETYPTIYHLRKKLADSSEQADLRLIYLALAHIVKYRGHFLIEGKLSTENISVKEQFQQFMIIYNQTFVNGESRLVSAPLPESVLIEEELTEKASRTKKSEKVLQQFPQEKANGLFGQFLKLMVGNKADFKKVFGLEEEAKITYASESYEEDLEGILAKVGDEYSDVFLAAKNVYDAVELSTILADSDKKSHAKLSSSMIVRFTEHQEDLKKFKRFIRENCPDEYDNLFKNEQKDGYAGYIAHAGKVSQLKFYQYVKKIIQDIAGAEYFLEKIAQENFLRKQRTFDNGVIPHQIHLAELQAIIHRQAAYYPFLKENQEKIEQLVTFRIPYYVGPLSKGDASTFAWLKRQSEEPIRPWNLQETVDLDQSATAFIERMTNFDTYLPSEKVLPKHSLLYEKFMVFNELTKISYTDDRGIKANFSGKEKEKIFDYLFKTRRKVKKKDIIQFYRNEYNTEIVTLSGLEEDQFNASFSTYQDLLKCGLTRAELDHPDNAEKLEDIIKILTIFEDRQRIRTQLSTFKGQFSAEVLKKLERKHYTGWGRLSKKLINGIYDKESGKTILDYLIKDDGVSKHYNRNFMQLINDSQLSFKNAIQKAQSSEHEETLSETVNELAGSPAIKKGIYQSLKIVDELVAIMGYAPKRIVVEMARENQTTSTGKRRSIQRLKIVEKAMAEIGSNLLKEQPTTNEQLRDTRLFLYYMQNGKDMYTGDELSLHRLSHYDIDHIIPQSFMKDDSLDNLVLVGSTENRGKSDDVPSKEVVKDMKAYWEKLYAAGLISQRKFQRLTKGEQGGLTLEDKAHFIQRQLVETRQITKNVAGILDQRYNANSKEKKVQIITLKASLTSQFRSIFGLYKVREVNDYHHGQDAYLNCVVATTLLKVYPNLAPEFVYGEYPKFQAFKENKATAKTIIYTNLMRFFTEDEPRFMKDGEILWSNSYLKNIKKELNYHQMNIVKKVEVQKGGFSKESIKPKGPSNKLIPVKNGLDPQKYGGFDSPVVAYTVLFTHEKGKKPLIKQEILGITIMEKTRFEQNPILFLEEKGFLRPRVLMKLPKYTLYEFPEGRRRLLASAKEAQKGNQMVLPEHLLTLLYHAKQCLLPNQSESLAYVEQHQPEFQEILERVVDFAEVHTLAKSKVQQIVKLFEANQTADVKEIAASFIQLMQFNAMGAPSTFKFFQKDIERARYTSIKEIFDATIIYQSTTGLYETRRKVVD |
162 | APG05459.1 crRNA重複序列 | guuuuagagucauguu |
163 | APG05459.1 tracrRNA | aacauagcaaguuaaaauaagguuuuaaccguaaucaacuguaaaguggcgcuguuucggcgcuuuuuuuguuu |
164 | APG05459.1 PAM | ngg |
165 | APG04583.1 | MAKNILGLDLGTNSIGWALVQQDFENKEGNILGMGSRIIPMSQDILGEFGKGNSISQTAERTGYRGVRRLRERHLLRRERLHRVLHLLGFLPKHYDEKIDFTQRFGKFINQAEPKLAFDSEFLFKDSFHEMLADFKQNQPEFLKDKNGEDCLVPYDWTIYYLRKKALTQKIEKYELAWLILNFNQKRGYYQLRGEEEKENPNKLVGFHSLKIVDVIPDAETNKKGETWYSLHLENGWVYRRSSKISLADWKDKVRDFIVTTDLNDDGSEKLDKDGIVKRSFRAPSADDWTLLKKKTEKDIDNSNKTVGTYIYDNLLLNPKQKIKGKMVRTIERKFYKQELEQILKTQKEFHSELQSENLLQDCVRELYRNNEQHQQMLEAKDFVHLFLNDIIFYQRPLRSQKSSISNCTLEFRKSKNENGEEVIHRLKVIAKSNPYYQEFRLLQWVQNLAIYTKDDDKNVTNEFLKSTQDWEDLLRWLHSKKEIKQDALIKFLIEKKGLKGKALTIEVAKYRWNYVQDKDYPGNETRYLIQSRLDKVEYAPKDFLTYENEMALWHIIYSINDKIEYEKALKSFANKKGLDEVTFVEAFKKFPPFKSDYGSFSEKAIKKLLPLMRFGTQWNWDNIDQNSKERIGKILTGEYDENIKGRVREKARHLNSETDFQALPLWLAQYVVYGRHSEADIAGKWNSVDDLKQFLDDFKQHSLRNPIVEQVITETLRAVKDIWNFYGKGAKDFFSEIHIELGREMKNTADERKRITTMVTDNENTNLRIKALLAEMALDQNVDNVRPYSPMQQEILKIYEEGVLNAEENIDDDILKISKTAQPSATDLKRYKLWLEQKYRSPYTGQMIPLNKLFTPEYEIEHIIPQSRYFDDSMSNKVICEAAVNKLKDNQIGLVFIKNHHGEVVDFGMGKQVKILEVSDYEDFVKQNYNKNRGKRNKLLLEDIPEKMIERQLNDTRYISKYITQVLSNIVRDDKEGSKDDGVNSKNIVPGNGKITTRLKQDWGLNDVWNDLVLPRFERMNTLTNSNDFTSKNTHGKTIPTVPIELSKGFSKKRIDHRHHAMDALVIACATRDHVNLLNNESSKSDTKRYDLNRKLRKYEKVAYNDPKTGERIEKEVPKDFIKPWETFTEDTRTLLENIVISFKQNLRVINKATNYYEKIENGKKVKVEQKGINWAVRKALHKETVSGQVHLDRIKVAKGKILTATRKTLDASFNEKTIESITDTGIQKILLNYLKSKDNNPEVAFSPEGIEELNKNIRLYNDGKAHQPILKVRVFEQGSKFTLGETGNKTTKFVEAAKGTNLFFGIYEDKSGKRSYETIPLNIVIERQKQGLQAVPETNEKGKQLLFTLSPNDLVYVPEEGVFDENNIKVDRIYKVVSFSTYQCFFVRNDVSTSVVNKVEYSALNKMEKSIDNIMIKENCVKLNVDRLGKISKA |
166 | APG04583.1 crRNA重複序列 | guugugaguuccuuuc |
167 | APG04583.1 tracrRNA | gaaaggaacucacaauaaggauuauuccguugugaaaacauuuagcgccucgacuaucuucggggcuuuuuuauuuuu |
168 | APG04583.1 PAM | nnraaty |
169 | APG01688.1 | MMIKNILGLDLGTNSIGWALIKQDFENKHGEILGMGSRIIPMSQDILGDFGKGNSISQTADRTKYRSVRRLRERFLLRRERLHRVLHLLNFLPQHYASQIDFEKKFGKFKSETEPKLAWENWGGKFSFLFQNSFNEMLEDFKAAGQGLKIPYDWTIYYLRKKALSQKIEKEELAWILLNFNQKRGYYQLRGEEEEENPNKLVEFYSLKIVDVVADEPQKGKSDIWYSLILENGWVYRRASKIPLFDWKDKTRDFIVTTDLNDDRSVKTDKEGNEKRSFRAPSENDWTLVKKKTEQEIDQSHKTVGTYIYETLLLNPKQKIKGKLVRTIERKFYKDELKQILEKQKEFHQELKNDDLYNDCIRELYRNNEAHQLTLSKKDFVHLLMDDLIFYQRPLRSQKSSISNCTLEFRKYKDENGIEHTQYLKAIPKSNPYYQEFRLWQWMYNLNIYRKDDEANVTKEFLNTNKDFESLFEFLNNRKEIEQKPLIKFLLEQKDINKKLLNAEAEKYRWNYVEDKKYPCNETKTMISSRLDKVENISDDFLTRDIEQKIWHIIYSVNDKIEYEKALKSFATRNDLDENSFIEAFKKFSPFKSEYGSFSEKAIKKLLPLMRLGKYWYEDEIVKHSDIYFKNIENLLGDFSNRDKKISEEDKEKWNKSINLKLQEELKDFQTAEIDLFQGLRLHIAQYLVYGRHSEASMIGKWNSAEDLEEFLKDFKQHSLRNPIVEQVITETLRVVKDIWLKYGNGAKDFFNEIHIELGREMKLPADDRKKLTNQISENENTNFRIKALLAEMMNDSSVENVRPFSPMQQEILKIYEDDVLKSDIEIEDDILKISKTAQPSPSDLKRYKLWLEQKYKSPYTGQIIPLNKLFTPEYEIEHIIPQSRYFDDSFSNKVICESAVNKLKDNYIGLEFIKQFGGTIIELGFGKSIKVFETKEYEDFVKKHYANNQGKRNKLLMEDIPEKMIERQMNDTRYISKYISGVLSNIVRVEDGSDEGVNSKNIVPGNGKITTQLKQDWGLNDVWNDLILPRFERMNQLTNSKVFTAWNENYQKFLPTVPIEYSKGFSKKRIDHRHHALDALVIACATKDHVNLLNNQSAKSDTKRYDLKKKSMKFEKVVYNDAKTGEKIEREVPKQFLKPWENFTLDVKHNLETIIVSFKQNLRVINKATNYYEKYVEKDGTKNKERVEQTGTNWAIRKPMHKDTVSGKVDLPWVKVPKGKILTATRKSLDSSFDLKSIGSITDTGIQKILKNYLAFKDGNPELAFSPEGIDDLNKNIEKYNDGKPHQPINKVRVFELGSKFQVGQSGNKKDKYVEAAKGTNLFFAVYEDEKGKRNYETIPLNEVIERQKQGLSVVDLKGTNDFYLCPNDFVYIPSGDELENINNVDFKDIKKEINERIYKVVSFTGNRLSCIPYMVATTIVNKLEFTQLNKIEFTKEKEICIKLNVDRLGNISKA |
170 | APG01688.1 crRNA重複序列 | guugugaauugcuuucaa |
171 | APG01688.1 tracrRNA | uugaaaagcaauucacaauaaggauuauuccguugugaaaacauucaaggcggggcaacucgucuuuuuucuuuu |
172 | APG01688.1 PAM | nnrnnc |
173 | APG00969 | MKQTSYSLGLDIGIASVGYGLIDNDENIVDAGVRLFPEANSKNNDGRRKSRGSKRLIRRKRHRIARVKHLLKESGIDVSYENTVLTNPYEIRCKGLTLPLTNHELSIALLHLAKRRGVHNVKSMDQEKVKGNELSTKEQLTINDNLLEEKFICELQLERLNKEGIVRSHSNRFKTADYIKEIKNLLETQAKQNTLVTEEFIEKYIEIFSGRRKYYEGPGGESKYGWKGDIEKWYEGLMGKCTYFPKELRCVKHAYSAALFNLLNDLNNLSINREEDTKLSQYEKEQIIEKIFKVRKTPTLTQIAKLLKVDPTNIKGFRTKANGTPDFLSIKIYHDLKGIIDDKQLLDDIAFLDNVAQILTVWQDSQSIQEKLKTLNKNLDDKTIKEISELKKYTQTHSLSLKLINVLLPELWETTKNQMT ILSELKLKPRKIDLHNCNEIPVNMINDLIVSPVVRRSLTQSIEMINQIIKDYGHPREIVIELAREKNSEEKKNFIKSLNEKNKQINDEVIEKLNASNHRDNKGMFNKVKLWILQDGHCLYSLKPIRLEDLLNNPNHYEIDHIIPKSVSFDDSMSNKVLVYQIENSKKGNRTPYQYLTSADKTITYEKFKANITQLAKSNHKISKKKLDYLLEERDINRFHIKKEFINRNLVDTRYATRSLINLLKYYFSEKDINVKVKSINGSFTDYLRKLWNFPKDREFYHKHHAEDALIIAMANKIFTTRKIFKEQNSVFSDEQILDGEVTNILSDDQFQAEFTEKFYKVQAIKKYDKYKYSHRVDKKPNRQLFDDTLYSTREFEGEEYYIGKIKDIYNLKDKRLKKIFTKSPEKILMYQHDSQTFKKLKQIMRSYEDEVNPLAKYHKETGEYLRKECKKGNGPIVKSLKYRVTKLGVHKDITHKYENSKNKVVILSLKPFRMDVFKENGVYKFITIRYCDLKETVNSYTISEHLYKAKLKAKDIKSMDSFKWSFYKNDLLEYNGELCTFKGVNDDKKNKIEVNWVEKNFAIYAEKKNLKSKQLVKSITKSTVKSLLKYTTDILGNRYPVRNEKLKLMIRKQTFRGDL |
174 | APG00969 crRNA重複序列 | guuuuaguacucugug |
175 | APG00969 tracrRNA | cacagaaucuacuaaaauaaggcauaaugccguauuuaaucccaucauaauucugaugggauuuuuuauauuu |
176 | APG00969 PAM | nnarv |
177 | APG03128 | MNNLLYSFDIGTNSIGWCVFALDEVGDPCRIVDLGARIYADGRDPQTKTSLAVARREARAMSRRRDRSLRRRKATLRTMIEYGLMPAHKVEQETLLRKTGDREGGDEGFNPYALRARALGEKLPPFYIGRALFHLGQRRGFKSNRKTDRKDNDKGKIALGIDELRAAMHRSGSPTLGAWLAMRRADGHPVRLRAGSEVFDAEGYAFYPERSLLEDEFRQIWTAQAVHHPQLLTSERRAHLFRVMFYQRPLKKPLVGRCSFNPAEARLSRAHPLFQEFRLYKEVNDLEVVLPDQSHRKLTLDERNALVAKLKSSRKASFSVLRRTLKLTPDLAFNKESEARKDLLGDEINSALADAKMFGVRWGGFPRARQWEIITHLKEEENPARLSDWLKSEFGLDDERVVAIANIALPEGYGRLGETALASMLEEMKTAVIPESEAAKRCGYDHSNLAKEQDEGLDILPEYQEILERHIPPGTGDPDDIYDIRKGRITNPTVHIGLNQLRRVVNALIKRHGKPRHIVVELARDLQLSEKQKADVNRRIAKNTREAEGRSQKLIEMGQLDTGYNRLLLKLWEELNQDKPEDRVCIYSGKPIGIAMLFSGEVDIDHILPWSKTLDDSQANKLLCLKSANRQKRNRTPSDVPEWRDCYEEVLARAARLPKNKRWRFAADAMQQFEAEGGFLARQLTDTQYLSRMAFEYLSALFPSEEADKWGELRQRKRVHVVPGRLTELLRRNWGLNTLLPDHNLGEMAQEKNRKDHRHHAIDAAVIGVTSRSLLQRMSGAAARLDDVAFDDLVRTVVKDNPPWPGFREELLGCINRVTVSHKPDHGTVSRAAYAQGKGQTAGKLHNDTAYGITGLQDMKGSPLVVRRKPFMALEVKDIASIRDTELQSALYDAIGSLTEKKALQEALVRFRDRHPQFKGIRRVRVLEALSVIPIVDNNGKAYKGYKGDANYRYEVWETLDGRWHTEVVSMFDAHQPGWQSPFHRQHPAARRVLKLQQNDMVAYEHPADGYTIARVVKFSNDKRIYFASHRESGSLKARDADKGDPFTYFAKANNGLRDIKCRQVRIDAAGRVFDPGPQDREARQSKGRA |
178 | APG03128 crRNA重複序列 | gguugcggcuggaccgcguuuucugaucugc |
179 | APG03128 tracrRNA | gcaaaucagaaaacgcggucuggccguuaacaagccucgaccagcaccagauaaggcggucccuccgggggccguuuuu |
180 | APG03128 PAM | nnggnnc |
181 | APG09748 | MAIRSIKLKLKTRTGPEAQNLRKGIWRTHRLLNEGVAYYMKMLLLFRQESTGGQTKKELQEELVRHIREQQQKNRADKNTQALPLDKAFAALRQLYELLVPSSIGQSGDAQIISRKFLSPLVDPNSEGGKGTSKAGAKPTWQKKKEANDPTWEQDYEKWKKRREEDPTASVITTLEEYGIRPIFPLYTNTVADIAWLPLQSNQFVRTWDRDMLQQAIERLLSWESWNKRVQEEYSKLQEKMTQLNEQLEGGQEWISLLEQYEEQREQELIENMTAANDKYRITKRQMKGWNELYEQWSTVLPNASHEQYREALKRVQQRLRGRFGDAHFFQYLMKEEHHLIWKGNPQRIHYFVARNELKKRLEEAKQNATMTLPDARKHPLWVRFDARGGNLQDYYLTAEADNPRSRRFVTFSQLIWPNESGWMEKQDVEVELALSKQFYQQVTLQKNDKGKQEIEFKDKGSGSTFSGHLGGAKLQLERGDLEKEEKDFEGGEIGSVYLNIVIDFEPLQEVKNGRLQSPYGQVLQLVRRPNEFPKVTTYKSEELVEWIKSSTKDSAGVESLESGFRVMSIDLGLRTAAATSIFSVEESNDANAAGFSYWIEGTPLVAVHKRSYMLKLPGEQVEKQVREKRDERQDQQRRVRFQIRILSQVIRMAKKQNRERADELDHLSQALEKQKSLLDQTDRTFWNGIVCDLTDALREKEGGWEQAVVQIHRKAEEHVGKVVQAWRKRFDADERKGIAGLSMWSIEELDSLRKLLISWSRRTRNPREINCFEQGHTSHQRLLTHIQNVKEDRLKQLSHAIVMTALGYVYDEKKLEWFAKYPACQVILFENLSQYRSNMDRSTKENSTLMKWAHRSIPKYVHMQAEPYGIQIGDVRAEYSSRFHAKTGTPGIRCKMVSGHDLQGRRFENLQKRLISEQFLTEEQVKQLRPGDIVPDDSGEWFMTLSDGSEGKEVVFLQADINAAQNLQKRFWQRYNELFKVSCRVLIRGEEEYLIPKTKSVQAKLGKGLFVKKTDTVMKDVYVWDSQAKLKGKTTFTEESESPEQLEDFQEIIEEAEEAKGTYRTLFRDPSGVFFPEFVWSTQKDFWSEVKRRLYGKLRERFLMKTR |
182 | APG09748 crRNA重複序列 | uggaaagcuucgagguuagcac |
183 | APG09748 tracrRNA | cgacgguuagaggccguaugucgauuugcuuuaauuucgugcgugugcauugucguccuccauuacagggcggcuaccacgaauagccacgaagu |
184 | APG09748及APG09106 PAM | dttn |
185 | APG00771 | MTKNILGLDLGTNSIGWALIKQDFENKQGEILGMGSRIIPMDAGDMGKFAEGATVSKTADRTKYRSVRRLRERFLLRRERLHRVLHLLNFLPQHYASQIDFEKRFGKFKVETEPKLAWKNIEGKFSFLFQNSFNEMLEDFKANEQDLKIPYDWTIYFLRKKALSQKIEKEELAWILLNFNQKRGYYQLRGEEEEENPNKLVEFYSLKVVDVLADEPQKGKSEIWYSLVLKNGWIYRRASKIPLFEWKDKTRDFIVTTDLNDDGSIKKDKDGNEKRSFRAPGENDWTLVKKKTEQEIEQSHKTVGTYIYETLLLNPKQKIKGKLVRTIERKFYKDELKQILEKQKEFHQELQNDDLYNDCIRELYRNNEAHQLTLSKKDFVHLLMDDLIFYQRPLRSQKSSISNCTLEFRKYKDENGIEHTQYLKAIPKSNPYYQEFRLWQWIYNLNIYRKDDEVNVTKDFLNTTKEFENLFEFLNSRKEVDQKALLKYFKLNEKTHRWNFVEDKKYPCNETKTMISSRLDKVENISDDFLTRNIEQKIWHIIYSVNDKIEYEKALKSFARKHHLDETSFFEAFRKFPPFKSEYGSFSEKAIKKLLPLMRLGKYWNYADIDKYSRERIQKIITGEYDENIKDKIREKAIHLTKENDFQGLQLWLAQYLVYGRHSEASMIGKWNSADDLEVFLKDFKQHSLRNPIVEQVITETLRVVKDIWLKYGNGTKDFFNEIHIELGREMKLPADDRKKLTSQISENENTNLRIKALLAEMINDHSVENVRPFSPMQQEILKIYEDGVLNSDIEIEDDILKISKTAQPSPSDLKRYKLWLEQKYKSPYTGQIIPLNKLFTPEYEIEHIIPQSRYFDDSFSNKVICESAVNKLKDNYIGLEFIKKLGGTVVECGNGKSVTVLKEDQYEDFVKKHYANNRGKRNKLLMEDIPEKMIERQLNDTRYISKYISGVLSNIVRVEDGSDEGINSKNIVPGNGKITSQLKQDWGLNDVWNDLILPRFERMNQLTNSTDFTAWNENYQKFLPTVPIEYSKGFSKKRIDHRHHALDALVIACATKDHVNLLNNQSAKSDTKRYDLKKKLMKFEKVVYHHTQTGEKIEREIPRQFLKPWENFTVDAKHNLESIIVSFKQNLRVINKATNYYEKYVEKDGTKNKERVEQTGTNWAIRKPMHKDTVSGKVDLPWVKVPKGKILTATRKSLDTSFDLKSIGSITDTGIQKILKNYLAFKDGNPEMAFSPEGIDDLNKNIEKYNDGKPHQPINKVRVFELGSKFQVGQTGNKKDKYVEAAKGTNLFFAVYEDEKGKRSYETIPLNEVIERQKQGLSVVDLKDTNDFYLCPNDLVYIPSGDELENVNNVDFKDIKKDKNERIYKVVSFSGSQIFFVRQDIATFIVNKAELSTLNKMERAIDGSMIKENCIKLNIDRLGNISKA |
186 | APG00771 crRNA重複序列 | guugugaauugcuuucaaaa |
187 | APG00771 tracrRNA | uuuugaaagcaauucacaauaaggauuauuccguugugaaaacauucaaggcggggcaacucgccuuuuuucguuu |
188 | APG00771 PAM | nnraat |
189 | APG02789 | MAIRSIKLKMKTNSGTDSIYLRKALWRTHQLINEGIAYYMNLLTLYRQEAIGDKTKEAYQAELINIIRNQQRNNGSSEEHGSDQEILALLRQLYELIIPSSIGESGDANQLGNKFLYPLVDPNSQSGKGTSNAGRKPRWKRLKEEGNPDWELEKKKDEERKAKDPTVKIFDNLNKYGLLPLFPLFTNIQKDIEWLPLGKRQSVRKWDKDMFIQAIERLLSWESWNRRVADEYKQLKEKTESYYKEHLTGGEEWIEKIRKFEKERNMELEKNAFAPNDGYFITSRQIRGWDRVYEKWSKLPESASPEELWKVVAEQQNKMSEGFGDPKVFSFLANRENRDIWRGHSERIYHIAAYNGLQKKLSRTKEQATFTLPDAIEHPLWIRYESPGGTNLNLFKLEEKQKKNYYVTLSKIIWPSEEKWIEKENIEIPLAPSIQFNRQIKLKQHVKGKQEISFSDYSSRISLDGVLGGSRIQFNRKYIKNHKELLGEGDIGPVFFNLVVDVAPLQETRNGRLQSPIGKALKVISSDFSKVIDYKPKELMDWMNTGSASNSFGVASLLEGMRVMSIDMGQRTSASVSIFEVVKELPKDQEQKLFYSINDTELFAIHKRSFLLNLPGEVVTKNNKQQRQERRKKRQFVRSQIRMLANVLRLETKKTPDERKKAIHKLMEIVQSYDSWTASQKEVWEKELNLLTNMAAFNDEIWKESLVELHHRIEPYVGQIVSKWRKGLSEGRKNLAGISMWNIDELEDTRRLLISWSKRSRTPGEANRIETDEPFGSSLLQHIQNVKDDRLKQMANLIIMTALGFKYDKEEKDRYKRWKETYPACQIILFENLNRYLFNLDRSRRENSRLMKWAHRSIPRTVSMQGEMFGLQVGDVRSEYSSRFHAKTGAPGIRCHALTEEDLKAGSNTLKRLIEDGFINESELAYLKKGDIIPSQGGELFVTLSKRYKKDSDNNELTVIHADINAAQNLQKRFWQQNSEVYRVPCQLARMGEDKLYIPKSQTETIKKYFGKGSFVKNNTEQEVYKWEKSEKMKIKTDTTFDLQDLDGFEDISKTIELAQEQQKKYLTMFRDPSGYFFNNETWRPQKEYWSIVNNIIKSCLKKKILSNKVEL |
190 | APG02789 crRNA重複序列 | gccugaauacuuagcagaaauaaugaugauuggcac |
191 | APG02789 tracrRNA | auaauaaaggugaccuauagggucaaugaaucugugcgugugccauaaguaauuaaaaauuacccaccacaggauuaucuuauuucugcuaaguguuuag |
192 | APG02789 PAM | attn |
193 | APG09106 | MAIRSIKLKLKTRTGPEAQNLRKGIWRTHRLLNEGVAYYMKMLLLFRQESTGGQTKKELQEELVRHIREQQQKNRADKNTQALPLDKAFAALRQLYELLVPSSIGQSGDAQIISRKFLSPLVDPNSEGGKGTSKAGAKPTWQKKKEANDPTWEQDYEKWKKRREEDPTASVITTLEEYGIRPIFPLYTNTVADIAWLPLQSNQFVRTWDRDMLQQAIERLLSWESWNKRVQEEYSKLQEKMTQLNEQLEGGQEWISLLEQYEEQREQELIENMTAANDKYRITKRQMKGWNELYEQWSTVLPNASHEQYREALKRVQQRLRGRFGDAHFFQYLMKEEHHLIWKGNPQRIHYFVARNELKKRLEEAKQNATMTLPDARKHPLWVRFDARGGNLQDYYLTAEADNPRSRRFVTFSQLIWPNESGWMEKQDVEVELALSKQFYQQVTLQKNDKGKQEIEFKDKGSGSTFSGHLGGAKLQLERGDLEKEEKDFEGGEIGSVYLNIVIDFEPLQEVKNGRLQSPYGQVLQLVRRPNEFPKVTTYKSEELVEWMKASQNHSSGVESLESGFRVMSIDLGLRTAAATSIFSVEESNDANAAGFSYWIEGTPLVAVHKRSYMLKLPGEQVEKQVREKRDERQDQQRRVRFQIRILSQVIRMAKKQNRERADELDHLSQALEKQKSLLDQTDRTFWNGIVCDLTDALREKEGGWEQAVVQIHRKAEEHVGKVVQAWRKRFDADERKGIAGLSMWSIEELDSLRKLLISWSRRTRNPQEINRFEQGHTSHQRLLTHIQNVKEDRLKQLSHAIVMTALGYVYDEKKLEWFAKYPACQVILFENLSQYRSHMDRSTKENSTLMKWAHRSIPKYVHMQAEPYGIQIGDVRAEYSSRFHAKTGTPGIRCKMVKGQELQGKRFENLQKRLVSEQFLTEEQVKQLRPGDIVPDDSGEWFMTLSDGSEGKEVVFLQADINAAQNLQKRFWQRYNELFKVSCRVLIRGEEEYLIPKAKSVQAKLGKGLFVKKTDTVMKDVYVWDSQAKLKGKTTFTEESESPEQLEDFQEIIEEAEEAKGTYRTLFRDPSGVFFPEFVWNTQKDFWSEVKRRLYGKLRERFLMKTR |
194 | APG09106 crRNA重複序列 | uggaaagcuucgagguuagcac |
195 | APG09106 tracrRNA | cgacgguuagaggccguaugucgauuugcuuuaauuucgugcgugugcauugucguccuccauuacagggcggcuaccacgaauagucacgaaguuccacugagu |
196 | APG05733.1 | MRELDYRIGLDIGTNSIGWGVIELSWNKDREQYEKTRIVDKGVRMFDKAEIPKTGASLAEPRRIARSSRRRLNRKSQRKKDIRNLLVQHEIISQKELTSLYPLSKSSMDIWDIRLDGLDRLLDRFEWARLLIHLAQRRGFKSNRKSELKDVETGKVLSSIQVNEKRLSLYRTVGEMWMKNADCSKYGKRRNSPNEYVFSVSRADLEKEIVTLFEAQRKFHSSYASVDLQKTYIQIWAHQLPFASGNAIVNKVGYCSLLKGKEKRVPKATYTFQYFNTLDQINRTRLGPNFQPFTKEQRDIILDKMFQRTDYYKKKTIPEVTYYDIRKWLALDETIQFKGLTYDPNEELKKIEMKPFINLKPFYEIKKVVTNYAKKTNEVFSALDYDTVAYALTVYKTDKDIRSYLKRSNNLSKRCYDDQLIEELLTLSYTKFGHLSFKAINHVLPIMQEGRTYQEAIHQLGYDTTNLKKENRSMFLPIIPDEITNPIVKRALTQARKVVNAIIRRYGSPNSVHIELARELSKSHDERKKIMTAHDENYKKNKGAISILIENGILNPTGYDIVRYKLWKEQGERCAYSLKKIPANTFFNELKKERSGPPVLEVDHILPYSQSFIDSYHNKVLVYGDENQKKGNRIPYTFFSEEDKEWESFESYVRSNSFFSKKKRGYLLKKAYLPRESNLIKERHLNDTRYASSYLKNFIEKNLKFKEAVGITRKKYVQTVNGVITAHLRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTKVTEYYQIKEGNKSIKKPYFPLPWMGFREEILSHLESQPIARKISEELKIGYQSSDYILVSRMPKRSVTGSAHDQTVMKKGGIDKKGKTIIIKRVHLKDIKFDENGDFKMVGKEQDLATYEAIKQRYLEYRKKSKKAFETPLYKPSKKGKGNLIKKIKVEVQTKSFVREINGGVAQNGDLVRVDLFEKDNRYYMVPIYVVDTVRSELPNKAVTSSKGYEQWLSIDNSFTFKFSLYPYDLVRLVKGDEDRFLYFSTLDINSDRLNFKDVNKPSKQAEYRYSLKTIENLEKYEIGVLGDLRLVRQETRKIFK |
197 | APG05733.1 crRNA重複序列 | gucauaguuccauuaaagccauugcuguuuuaug |
198 | APG05733.1 tracrRNA | caugauacagcaauggcuuugauguuucuaugauaagggcuucggcccguggcguuggggaucgccugcccauuuuaaugggcuucuccccaucuauuuaaugagaaauuuacaaccuuggcuauucuuaaauagcuaagguuuuuuu |
199 | APG05733.1及APG06877.1 PAM | nnnncc |
200 | APG06207.1 | MVERILGLDLGVSSIGWALVEEDVENPENNKIIKLGVRVNPLTIDEKTNFEKGKSITTNAGRTSARSARRNLQRFKLRRKSLWEVLINYKIIKNDTVLAEIGKNSTFQTQYLRAKAAKEKIELDELARVLFLINKKRGYKSSRKVQSDDEGKAIDGMSVAKELYEKNYTPGQYVYDLLKNGKKQIPDFYRSDLQNELDRVWEFQKQYHPDILTDEYKKELEGKGQRATAAIFLNRYKIYTADNKGTREEKRFQAYQWRVEALSQPLDIKEVAYVITEINNNLNNSSGYLGAISDRSKKLYFNGQTIGEYLYEELSLNPHARLKNQVFYRQDYQDEFEKIWETQAKFHSVLTTELKEDVRDIIIFYQRKLKSQKGLISFCEFESKEIVIEENGKKKRKKVGLKVVPKSSPLFQEFKIWQVLNNIEIKNEDGRRYLDQEEKELLFNELNCKGNLTSQKCLEFLGFKSKETKINFKVIEGNRTNEKLYDAFLKILELKGYNVFELLKIKEDRDEAKLSELKASADEIKRMVKEIFNANLINTSILDFNAELEGKDFENQASYQFWHLIYSYEGDNSPSGNEKLYELLENKFGFKKEHSKILSTIVFPQEYGSLSAKAMRRIYPYIKDNKYSEACLLAGYNHSKQSLTKEELENRKLKEQLEVLPKNSLRNPVVEKILNQMINLVNAIISEHGKLDGVRIELARELKKSAQEREDMTKSINEATILHQKYATVLRQEFGVVNPSRNDIIRYKLYMELAGNGYKDLYTNVKIEKENIFTDKYDIDHIIPQSRFFDDSFSNKVLVPRQANLDKGNLTGYDFMSNKGAEREEHFLNVIKDLLENGSISKAKYEKLKKKGIEIGDGFIERDLRDTQYIARKAKEILFEITNSVISTSGRITDKLREDWDLVNTMKELNLDKYRRLGLTEIVINSKGEEKEVIPDWTKRNDHRHHAMDALTVAFTTRNHIQYLNYLNARKDEKHKEHQNIYAIENIITEIIEKKNGSKSRRFKTPMNRFRHEAKQHLKEVLVSHKTKNKVVTSNINKTKKKRGIHKKAELTPRGQLHKETVYGSKKFLQSREEKVSAKFDYETILMVVNPIHRNALLNRLKEYGNDPKKAFSGKNAVNKTPVYLSDSKIEVLPEKVTLSWFETGYTIRKAVTPDNFKDYKNLEKITDMGIKKILKERLDQFKGNAKEAFSNLDKEPIWLNEEKGIAIKTVTITGVSNAESLHFKKDHLGKEILDENGNKIPVDFVSTGNNHHLAIYLNEEEKLDDKMVTFYEAVLRVNQGLPVIDKNYNREKGYKFLMTLKQNEMFVFPNEEFDPSEIDLLDEKNLEQISQNLFRVQKISKVGYGNSFIRDFVFRHHLETTVEDRKELRNTTYIQLKSLEGLRNIVKVRLNHLGKIVQIGEY |
201 | APG06207.1 crRNA重複序列 | guugugaaaugcuuucaaaacuua |
202 | APG06207.1 tracrRNA | auaaauuuugaaagcacuucacaauaaggauuauuccguugugaaaacauucaaggcggggcaacucgccuuuuuuuu |
203 | APG06207.1及APG02675.1 PAM | nrrttt |
204 | APG01647.1 | MMKRILGLDLGTSSIGWAYVLEAQDENEISQIKKLGVRVNPLTTDEQLNFEKGKPITTNAGRTLARSARRNLQRYKLRRENLIEVLKREKWIDDKSILAENGNKSTFETYALRAAAASKEIKLEELARVLLMINKKRGYKSSRKVNKEDDGQLVDGMEVAKKLYHENLTPGEFVYRLLKEGKKKIPDFYRSDLQRELDLIWDFQFKYYPDLLTQDLKEELKGKGLRATSAIFWSKYKFNTAENKGTREEKKIQAYQWRKDGLTKQLEQEEVAYIIAEINGQLANSSGYLGAISDRSKELYFNKQTVGQFLFNQLQHNTHARVKNQVFYRQDYLDEFEKIWSVQSQYHQGLTEQLKEEIRDIIIFYQRKLKSQKGLISFCEFEQHEVVINGKNKIVGLRVAPKSSPIFQEFKIWQQINNVKLRNKITKEVYNLAEEQKRSLFETLNLKGKLSAYQVLNLIEVKPKEWELNYTELEGNSTNLALYNAYLDILDIEGYDVRSELKIKLNKDEITLSDLDIPVSEIKGMIRRIFQHLGINTSILDFNAQMQGDDFEKQLSYQLWHLLYSYEEDNSKTGMERLYNQLNLKFGFSLDQAKIFGKIA LQEDYGNLSTKAIRKIYPYIQDVEYSVACKQAGYNHSKSSLTKEQLTNRVLKDHLDILPKNSLRNPVVEKILNQMVNVVNTLIETENDKLIKEGKNADFRFDEIRIELARELKKNAKEREELTKAINTSKSEHEKIIKILQTEDGIKNPTRNDIIRFKLYQELKNNGYKNLYTNEYIQRKDLFTNVYDIDHIIPQSRLFDDSFSNKVLVPRNINIEKGNQTAFDYVHAKFGEDGIEAYEARVERLFNLKEEGVSRSKYKKLLMRGLDIGEGFIERDLRDSQYIAKKAKAMLFEIAPSVISTSGSVTDRLREDWGLVSVMKELNLPKFKAVGLTEYLETKDGNRKEVIKDWSKRNDHRHHAMDALTVAFTKHSHIHYLNHLNARKNEKSEFFSTIKAIEIKETYVERDDLGNRKRLFKEPIPHFRSIAKEHLESVLVSHKAKNKVVTKNRNKIDGKKQAQEVLTPRGQLHKESIYGKILQYASKEEKISAKFDAATIAMVSNPRYRSALLDRLSAYGNDPKKAFTGKNSPNKSPIYLDQEKQLAVPEKVKLVWLEEDYTIRKEIGPDLKIEKVIDQGVKRILEQRLTEYGGDSKKAFSDLDNNPIWLNKEKGIAIKRVTISGVKNAEALHIKKDHLGQVLKDKDGKPMPVDFVSTGNNHHVAIYEDDNGALQERIVPFYEAVARVNNGFPIIDKHYNQHLGWKFLFSMKQNEMFLFPSEEFDPKQINLLDRSNYRLISKNLFRVQKFGELSKSGFWFRHHLETSVDVNKSLRSISYFDFYSKDFMKNIAKVRINHLGEIIHVGEY |
205 | APG01647.1 crRNA重複序列 | guugugaauugcuuucau |
206 | APG01647.1 tracrRNA | augaaagcaauucacaauaaggauuauuuccguuguguaaacauuuagcgccucgucuaucuacggggcauu |
207 | APG01647.1 PAM | nnrrngg |
208 | APG08032.1 | MMIKNILGLDLGTNSIGWALIKQDFENKYGEILGMGSRIIPMDQKVLGEFGSGNSVSQTADRTKYRGVRRLRERFLLRRERLHRVLNVLNFLPIHYASQIDFEKRFGKFREEIEPKLVYNNDGFIFKNSFEEMLSDFRKHQPQILENDKKIPYDWTIYYLRKKALTQKIEKEELAWILLNFNQKRGYYQLRGEDIEEEKDKTFVRLKVEKIVDSGDNVKGKILYDVYFDNGWKYDKQIVKTEDWIERVKEFIVTESFLKNGDIKRTYKAVDSEKDWIAIKTKTEQEIEKSHKTVGTYIYETILHNPKQKIKGKLVRTIERKFYKDELRQILEKQKEFHPELQNDDLYSDCVRELYRNNEAHQLTLSKKDFVHLFIEDIIFYQRPLRSQKSSISNCTLEYRRYKDKHGVEHIQYLKAIPKSNPYYQEFRIWQWMYNLNIYKRDDDTNVTKEFLNSTEDFENLFDFLNNRKEVEQKALLKHFKLNEKTHRWNFVENKKYPCNETKTMISSRLDKVENISENFLTSEIEHKIWHIIYSVNDKIEYEKALKSFANKNNLDEVSFFEAFKKFPPFKNEYGSFSEKAIKKLLPLMRVGKYWDEDEIVKNSDTYFKNIEDLLGNIARKEENISDDDRKKYNKTVNLKLREELEIFQDAEIASFQKLRLHIAQYLVYGRHSEASIIGKWNSADDLEEFLKEFKQHSLRNPIVEQVITETLRVVKDIWMKYGNGAKDFFNEIHIELGREMKLPAEDRKKLTSQISENENTNLRIKALLAEMMNDSSVENVRPFSPMQQEILKIYEDGVLNSGIEIEDEYLKISKTAQPSSSDLKRYKLWLEQKYKSPYTGQIIPLNKLFTPEYEIEHIIPKSRYFDDSFSNKIICESAVNKLKDNYIGLGFIKQFAGAIVELGFGKNVKVFEIEEYEDFVKKHYANNRGKRNKLLLEEIPEKMIERQLNDTRHISKYISSVLSNIVRVEDGTDEGVNSKNIVPGNGKITIQLKQDWGLNDVWNDLILPRFERMNQLTNSTDFTAWNKNHQKYLPTVPIEFSKGFSKKRIDHRHHALDALVIACTTKDHVNLLNNQSAKSDTKRYDLKKKLMKFEKVVYNHTQTGEKIERDIPKQFLKPWETFTIDAKNRLETIIVSFKQNLRVINKATNHYEKYVEKEGVKMKERVEQTGTNWAIRKSLHEETVSGKITLSWVETSKGEFITATRKPLDSSFTFEKINKITDTGIQKILNNYLEAKDNNPELAFSAEGIEDLNKNIEKYNDGKSHQPIIKIRLYEKGKGRFVLGQTGNKINKYVQGSPNLFFAIYKDENGKKIFESIRLDIVIERLKQGLQAIPETNQNGVSLYQSLSPLDLVYIPTEYELESPHILDFSKLNKTQITRLYNTNDFSGVTAYFSQNSFAKHIYPKEMDLSWNEKKQKLSGSFDSKTASYNNTSIKDIFIKVKVDRLGNISKA |
209 | APG08032.1 crRNA重複序列 | guugugaauugcuuucaaaaauuauuauc |
210 | APG08032.1 tracrRNA | uaauaauuuugaaagcaauucacaauaaggauuauuccguugugaaaacauucaaggcggggcaacucgccuuuuuucguuuu |
211 | APG08032.1 PAM | nnraar |
212 | APG05712.1 | MKTLGIDLGTASIGWAILDEASIIASGVRIFSQSEMAGRDPQSKASLAVARRDARGARRRRDRYLKRRRRLLDLLTEHGLAPADEKSRKALVREYEDGKDGDLSNSVYALRARALDEALTPYEIGRAIFQLNQRRGFKSNRKTDSNDPEQGKIATAIHVLDAKMDEDKARTFGEWLHMRRLKGLSVRARMTADGDSYDFYPSRAALEREFDRLMASQKRFHPDLLNSSVIDDIRKVVFHQRPLKPVQPGKCSYNHRESRLPKAHPLFQKFRLLKEVNELEIVGEDQRYVKLTPAQRDVLTLALRTGLTKQGRLPFSKLRSILKLGKEVRFNKEKDNRTDLEGDVIHFRVSRPDCFGNRWAAMPVEEQAAVTEKLRTEPDYSALLDWLKNEAGLDEAHARAVADTPVPDGFGRMGPSALSALADAMEHEIDAQGFVITEAEAAKRVYGRTNSEADPGRKGVDQLPKYQEVLQRHIPPGTGEPDDPYDEYMGRITNPTVHIALNQLRRLVNALIRKYGKPNKIAIEVGRELKLNEKQRNEVNREIGQNTRAAMARGQQLVEIFKQPNTGYNRLRLELWEDLNREQPLKRLCTYCGKAIAAHMLFNGETDIDHILPYSKTLDDSKANRLLCCTPCNREKKNYAPANVLQWRDHYGEILARATALPKNKQWRFAEDAMTRYEAEGGFLARQLTDMQYISRLALTYLAHLYDYEEPDLDGVYKRHDRVRALPGRMTEMLRRQWALNELLHGHNLAGGDGAKEKNRLDHRHHAIDAIVIACTSQSLINRLSTAAGEAEERGAARVVERIDPPWPSFREDVREAVNAIVVSHKPDHGTASRSGYDKGRGQTAGKLHNDTAYGETGEKDHNGNNLVVRRIAISDIKRSADIMKIRTNAHGHSELRDRLYEATRDLEGKAFEQAVTAFVKHDAKFKGIRHVRVTEVQNPVWITHGGGKYKKGYLPGGNDRFDVWELPDGKWDAEVVTTFDAHRPDFTPRMRIEHHNARKIMSLKKGDMIAYDDPDSGKRVIAIVRKFDQRNKQLYLDPHNEAGNLDQREKEKTYKPLRPMPNPLKKYRPRQVRVDEIGQVFDPGPWWEKRSD |
213 | APG05712.1 crRNA重複序列 | guugcgguuggccugcgauuucugaac |
214 | APG05712.1 tracrRNA | guucagaaaucgcaguccagccguuaacaagcugagauaugcaccaaauaaggcgcucgcuucggcgggcgcuuuuucguu |
215 | APG05712.1 PAM | nnrnat |
216 | APG01658.1 | MKEKYILGLDLGITSVGYGIINFETKKIIDAGVRLFPEANVDNNEGRRSKRGSRRLKRRRIHRLERVKLLLTEYDLINKEQIPTSNNPYQIRVKGLSEILSKDELAIALLHLAKRRGIHNINVSSEDEDASNELSTKEQINRNNKLLKDKYVCEVQLQRLKEGQIRGEKNRFKTTDILKEIDQLLKVQKDYHNLDIDFINQYKEIVETRREYFEGPGQGSPFGWNGDLKKWYEMLMGHCTYFPQELRSVKYAYSADLFNALNDLNNLIIQRDNSEKLEYHEKYHIIENVFKQKKKPTLKQIAKEIGVNPEDIKGYRITKSGTPQFTEFKLYHDLKSIVFDKSILENEAILDQIAEILTIYQDEQSIKEELNKLPEILNEQDKAEIAKLIGYNGTHRLSLKCIHLINEELWQTSRNQMEIFNYLNIKPNKVDLSEQNKIPKDMVNDFILSPVVKRTFIQSINVINKVIEKYGIPEDIIIELARENNSDDRKKFINNLQKKNEATRKRINEIIGQTGNQNAKRIVEKIRLHDQQEGKCLYSLESIALMDLLNNPQNYEVDHIIPRSVAFDNSIHNKVLVKQIENSKKGNRTPYQYLNSSDAKLSYNQFKQHILNLSKSKDRISKKKKDYLLEERDINKFEVQKEFINRNLVDTRYATRELTSYLKAYFSANNMDVKVKTINGSFTNHLRKVWRFDKYRNHGYKHHAEDALIIANADFLFKENKKLQNANKILEKPTIENNTKKVTVEKEEDYNNVFETPKLVEDIKQYRDYKFSHRVDKKPNRQLINDTLYSTRMKDEHDYIVQTITDIYGKDNTNLKKQFNKNPEKFLMYQNDPKTFEKLSIIMKQYSDEKNPLAKYYEETGEYLTKYSKKNNGPIVKKIKLLGNKVGNHLDVTNKYENSTKKLVKLSIKNYRFDVYLTEKGYKFVTIAYLNVFKKDNYYYIPKDKYQELKEKKKIKDTDQFIASFYKNDLIKLNGDLYKIIGVNSDDRNIIELDYYDIKYKDYCEINNIKGEPRIKKTIGKKTESIEKFTTDVLGNLYLHSTEKAPQLIFKRGL |
217 | APG01658.1 crRNA重複序列 | guuuuaguacucuguaauuuuagguaug |
218 | APG01658.1 tracrRNA | ucauaccuaaaauuacagaaucuacugaaacaagacuauaugucguguuuaucccacuaauuuauuagugggauuuuuuuguuuu |
219 | APG01658.1 PAM | nngg |
220 | APG06498.1 | MSELDYRIGLDIGTNSIGWGVIELFWNKDRERYEKVRIVDKGVRMFDKAEIPKTGASLAEPRRIARSSRRRLNRKSQRKKEIRNLLVQHGVITQEELDLLYPLSKKSMDIWDIRLDGLDRLLNHLEWTRLLIHLAQRRGFKSNRKSELKDAETGKVLSSIQVNEKRLSLYRTVGEMWIKDAEFSKYDRRRNSPNEYVFSVSRADLEKEIVTLFEAQRKFQSSYSSKNLQETYLQIWAHQLPFASGNAILNKVGYCSLLKGKERRIPKATYTFQYFSALDQVNRTRLGPDFQPFTQEQKEIILDKMFQRTDYYKKKTIPEVSYYDIRKWLELDETIQFKGLNYDPNEELKKIEKKPFINLKAFYEIKKVVANYAERTNEAFSTLDYDAIAYALTVYKTDKDIRSYLKKSNNLSKRCYDDQLIEELFTLSYTKFGHLSFKAINRVLPIMQEGRTYQEAIQQLGYDTTNLKKENRSMFLPLIPDEITNPIVKRALTQARKVVNAIIRRYGSPNSVHIELARELSKSHDERKKIMTAHDENYKKNKGAISILIENGILNPTGYDIVRYKLWKEQGERCAYSLKEIPPDTFFNELKKERNGSSILEVDHILPYSQSFIDSYHNKVLVYSDENRNKGNRIPYTYFLETNKDWEAFERYVRSNKLFSKKKREYLLKKAYLPRESELIKERHLNDTRYASTFLKNFIEQNLQFKEVEVNLRKKRVQTVNGVITAHLRKRWGLEKNRQETYLHHAMDAIIVACTDHHMVTRITEYYQIKESNKSVKKPYFPMPWEGFRDELLSHLASQPIAKKISEELKAGYQSSDYIFVSRMPKRSVTGAAHNQMIRRKGGIDKKGKTIIIKRVRLKDIKFDENGDFKMVGKEQDLATYEAIKQRYLDHGKNLKKAFETPLYKPSKKGTGNLIKRVKIEGQTKAFVREVNGGVAQNSDLVRVDLFEKDDKYYMVPIYVPDTVCSELPKKVVKSGKGYEQWLTLDNSFTFKFSLYPYDLVRLVKGDEDRFLYFGTLDIDSDRLNFKDVNKPSKQNEYRYSLKTIEDLEKYEVGVLGDLRLVRKETRRNFHEIKIN |
221 | APG06498.1 crRNA重複序列 | gucauaguuccauuaaagcc |
222 | APG06498.1 tracrRNA | ggcuuugauguuucuaugauaaggguuucggcccguggcgucggggaucgccugcccauuccgaugggcuucuccccauuuauu |
223 | APG06498.1 PAM | nnnncc |
224 | APG09106.1 | MAIRSIKLKLKTRTGPEAQNLRKGIWRTHRLLNEGVAYYMKMLLLFRQESTGGQTKKELQEELVRHIREQQQKNRADKNTQALPLDKAFAALRQLYELLVPSSIGQSGDAQIISRKFLSPLVDPNSEGGKGTSKAGAKPTWQKKKEANDPTWEQDYEKWKKRREEDPTASVITTLEEYGIRPIFPLYTNTVADIAWLPLQSNQFVRTWDRDMLQQAIERLLSWESWNKRVQEEYSKLQEKMTQLNEQLEGGQEWISLLEQYEEQREQELIENMTAANDKYRITKRQMKGWNELYEQWSTVLPNASHEQYREALKRVQQRLRGRFGDAHFFQYLMKEEHHLIWKGNPQRIHYFVARNELKKRLEEAKQNATMTLPDARKHPLWVRFDARGGNLQDYYLTAEADNPRSRRFVTFSQLIWPNESGWMEKQDVEVELALSKQFYQQVTLQKNDKGKQEIEFKDKGSGSTFSGHLGGAKLQLERGDLEKEEKDFEGGEIGSVYLNIVIDFEPLQEVKNGRLQSPYGQVLQLVRRPNEFPKVTTYKSEELVEWMKASQNHSSGVESLESGFRVMSIDLGLRTAAATSIFSVEESNDANAAGFSYWIEGTPLVAVHKRSYMLKLPGEQVEKQVREKRDERQDQQRRVRFQIRILSQVIRMAKKQNRERADELDHLSQALEKQKSLLDQTDRTFWNGIVCDLTDALREKEGGWEQAVVQIHRKAEEHVGKVVQAWRKRFDADERKGIAGLSMWSIEELDSLRKLLISWSRRTRNPQEINRFEQGHTSHQRLLTHIQNVKEDRLKQLSHAIVMTALGYVYDEKKLEWFAKYPACQVILFENLSQYRSHMDRSTKENSTLMKWAHRSIPKYVHMQAEPYGIQIGDVRAEYSSRFHAKTGTPGIRCKMVKGQELQGKRFENLQKRLVSEQFLTEEQVKQLRPGDIVPDDSGEWFMTLSDGSEGKEVVFLQADINAAQNLQKRFWQRYNELFKVSCRVLIRGEEEYLIPKAKSVQAKLGKGLFVKKTDTVMKDVYVWDSQAKLKGKTTFTEESESPEQLEDFQEIIEEAEEAKGTYRTLFRDPSGVFFPEFVWNTQKDFWSEVKRRLYGKLRERFLMKTR |
225 | APG09106.1 crRNA重複序列 | uggaaagcuucgagguuagcac |
226 | APG09106.1 tracrRNA | cgacgguuagaggccguaugucgauuugcuuuaauuucgugcgugugcauugucguccuccauuacagggcggcuaccacgaauagucacgaaguuccacugagu |
227 | APG09106.1 PAM | dttn |
228 | APG09882.1 | MYSIGLDLGISSVGWSVIDERTGNVIDLGIRLFSAKNSEKNLERRTNRGGRRLIRRKTNRLKDAKKILAAVGFYEDKSLKNSCPYQLRVKGLTEPLSKGEIYKVTLHILKKRGISYLDEDDTEAAKESQDYKEQVRENAQLLTKYTPGQIQLQRLKENNRVKTGINAQGNYQLNVFKVSAYANELATILKTQQAFYPNELTDDWIALFVQPGIAEEAGLIYRKRPYYHGPGNEANNSPYGRWSDFKKTGQPATNIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEIPLSPEQKEYILAELMTKEFTRFGVNDVVKLLGVKKERLSGWRLDKKGKPEIHTLKGYRNWRKIFAESGIDLATLPTETIDCLAKVLTLNTEREGIENTLAFELSELAESVKLLVLDRYKELSQSVSTQAWHRFSLKTLHLLIPELMNATSEQNTLLEQFQLKSDVRKRYSEYKKLPTKDVLTEIYNPTVNKTVSQAFKVIDALLVKYGKEQIRYITIEMPRDDNEEDEKKRIKELHAKNSQRKNDSQSYFMQKSGWSQEKFQTTIQKNRRFLAKLLYYYEQDGICAYTGLSISPELLVSDSTEID HIIPISISLDDSINNKVLVLSKANQVKGQQTPYDAWMDGSFKKINGKFSNWDDYQKWVESCHFSHKKENNLLETRNIFDSEQVEKFLARNLNDTRYASRLVLNTLQSFFANQETKVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVKEETGEKVMREIDFETGEIVDEMSYREFKKSKKYERKTYQVKWPNFREQLKPVNLHPRIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKQKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKDLDEKTYERLLSIAETTPDFQEVEEKNGKVKRVKRSPFAVYCEENDIPAIRKYAKKNNGPLIRSLKYYDGKLNKHINITKDSQGRPVEKTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGKYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQCYDVRFYNFQSANSINFKGLEQEMMPAENQFKQKPYNNGAINLNIAKYGKEGKKLRKFNTDILGKKHYLYYEKEPKNIIK |
229 | APG09882.1 crRNA重複序列 | guuuuuguacucucaauaa |
230 | APG09882.1 tracrRNA | uuauugagaaucuacaaaaauaaggcauuuugccgaauuuaccgcccuacauauguagggcgguuuuuuuauu |
231 | APG09882.1 PAM | nnnna |
232 | APG02675.1 | MKRILGLDLGTSSIGWAYVLEAQDENEISKIEKLGVRVNPLTTDEQLNFEKGKPITTNAGRTLARSARRNLQRFKLRRNNLIEVLKREKWIDDKSILAENGNKSTFETYALRAAAASKEIKLEELARVLLMINKKRGYKSSRKVIKEDDGQLVDGMEVAKKLYHENLTPGEFVCRLLKEGKKKLPDFYRSDLQRELDLIWDFQFKYYPELLTRDFKEELKGKGLRATSAIFWSKYKFNTAENKGTKEEKKIQAYQWRKDGLTKQLAKEEVAYIIAEINGQLANSSGYLGAISDRSKELYFNKQTVGQFLFNQLQQNTHARLKNQVFYRQDYLDEFEKIWCIQSQFHQALTEQLKEEIRDIIIFYQRKLKSQKGLISFCEFEQHEVVVNGKNKVVGLRVAPKSSPIFQEFKIWQQLNNVKLRNNITKEVYNLAEEQKKLLFETLNLKGKLSAYQVLSLIEGKPKEWELNYTELEGNSTNSALYNAYLNILDIEGYDVRSELKIKLNKDEITLSDLDIPVSEIKDMIRRIFQHLGINTSILDFDAQMQGDDFEKQLSYQLWHLLYSYEEDDSKTGMDRLYNQLNLKFGFSLDQAKFIGKIALQDDYGNLSTKAIRQIYPYIQDAEYSAACKLAGYNHSKSSLTKEQLTNRVLKDHLDILPKNSLRNPVVEKILNQMVNVVNTLIDTENDKLIKEGKNADFRFDEIRIELARELKKNAKEREELTKAINTSKEQHEKIIKILQTEDGIKNPTRNDIIRFKLYQELKNNGYKNLYTNEYIQRKDLFTNIYDIDHIVPQSRLFDDSFSNKVLVPRNINIEKGNQTAFDYVRTKFGEDGIEAYEARVERLFNLKEEGVSRSKYKKLLMRGSDIGEGFIERDLRDSQYIAKKAKAMLFEITPSVISTSGSVTDRLREDWGLVSVMKELNLPKFKAVGLTEYLETKDGNRKEVIKDWSKRNDHRHHAMDALTVAFTKHSHIQYLNHLNARKNEKSEFFSSIKAIEIKETYVERDDLGNRKRLFKEPIAHFRTIVKEHLERVLVSHKAKNKVVTKNRNKIDGKKEAQEVLTPRGQLHKETIYGKILQYASKEEKISAKFDAATIAMVSNPRYRSALLDRLIEYGNDPKKAFTGKNSPSKSPIYLDQQRQLAVPEKVKLVWLEADYTIRKEIGPDLKIEKVIDQGVKRILKQRLSVYDGDTKKAFSDLDNNPIWLNEEKGIAIKRVTISGVKNAEALHTKKDHLGQVLEDKDGNTMPVDFVSTGNNHHVAIYEDSEGNLYDRVVSFYEAVERINQNLPIVDRHYKQEEGWKFLFSMKQNELFVFPSINFDPKEIDLLDKKNYKEVSKHLFRMQKFSKVEYGNSAVRDYVFRHHLETSIIDTKELRDIAYKVFKSIGEFKSFVKIRTNHLGEIVHLGEY |
233 | APG02675.1 crRNA重複序列 | guugugaauugcuuuc |
234 | APG02675.1 tracrRNA | gaaagcaauucacaauaaggauuauuuccguuguguaaacauuuagcgccucgucuaucuacggggcauuuu |
235 | APG01405.1 | MMIKHILGLDLGTNSIGWALIKQNFENKYGEILGMGSRIIPMSQDILGEFGKGNSVSQTAARTDYRGIRRLRERFLLRRERLHRILNVLNFLPEHYASQIDFDKRFGKFKVETEPKLAWKNSDGKFSFLFQTSFNEMLEDFKAHGQDLKVPYDWTIYYLRKKALSQKIEKEELAWILLNFNQKRGYYQLRGEEEEENPNKLIEFYSLKIIDVLADEPQKGKSDIWYSLVLENGWIYRRSSKTSLLDWKDKIRDFIVTTDLNDNGSVKTDKEGNEKRSFRAPGENDWTLVKTKTEQEIDRSRKTVGTYIYETLLQNPKQKIKGKLVRTIERKFYKEELKQILEKQKEFHYELQSDDLYDDCIRELYRNNEAHQLTLSKKDFVHLFMEDIIFYQRPLKSQKSSISNCTLEFRKYKDENGVEHTQFLKAIPKSNPYYQEFRIWQWIFNLNIYKKDNDDNVTKEFLSTTEDFENLFEFLNNRKEIDQKALLKHFKLNEKTHRWKYVEDKKYPCNETKTMISERLKKVENISDDFLTRGMEQKIWHIIYSVNDKTEYEKALKSFAEKNNLDENSFFEAFRKFPPFKSEYGSFSEKAIKKLLPLMRLGKYWSYANIDLYSKNRIQKIITGEFDENIKDRVREKAIHLTAENDFQGLQLWLAQYIVYGRHSEATMIGKWNSADDLEEFLKEFKQHSLRNPIVEQVITETLRVVKDIWLKYGNGAKDFFNEVHIELGREMKQTKDERANATKTITENENTNLRIKALLAEMMNDHSVENVRPYSPMQQEILKIYEDGILKSDIEIDDDILKISKTAQPSSSDLKRYKLWLEQKYKSPYTGQIIPLNKLFTPEYEIEHIIPQSRYFDDSLSNKIICESAVNKLKDNYIGLGFIKQFGGTIIECGFGKRVKVFKAEEYEEFVKKHYANNRGKRNKLLLEDIPEKMIERQMNDTRHISKYISGILSHIVRVEDGTDEGVNSKNVIPGNGKITTQLRQDWGLNDVWNELVLPRFERMNQLTNSTDFTSWNENHQKYLPTVPVEFSKGFSKKRIDHRHHALDALVIACATKDHVNLLNNQSAKSDTKRYDLKKKLMKFEKTVYKDPQTEKRIEREVPKYFLKPWETFTVDAKNKLETIIVSFKQNLRVINKATNYYEKYVDKDGVKTKERVEQTGTNWAIRKPMHKETVSGKIDLPWVKVPKGKILTATRKSLDTSFDLKAIASITDTGIQKILKNYLEFKESPELAFSPEGIEDMNKNIKKYNGGKPHQPISKVRVFELGSKFQVGQTGNKKDKYVEAAKGTNLFFAIYEDRKGKRSYETIPLNEVIERQKQGLSVVDLKNINDFFLCPNDLVYIPSGDELENGGSIEIKNITKEKSERFYKVVSFSGSQIFFVRHDIAVSIVNKGEFSTLNKMERAIDGSMVKESCIKLKIDRLGNVLKA |
236 | APG01405.1 crRNA重複序列 | guugugaauugcuuucaaa |
237 | APG01405.1 tracrRNA | uuugaaaagcaauucacaauaaggauuauuccguugugaaaacauucaaggcggggcaacucgccuuuuuucguu |
238 | APG01405.1 PAM | nnraat |
239 | APG06250.1 | MKNILGLDLGTNSIGWALVKQDFKNKQGEILGMGTRIIPMSQDILGDFGKGNSVSQTAERTKYRSARRLRERFLLRRERLHRVLNILNFLPEHYASQIDFEKRFGKFKVETEPKLAWKNIEGQFSFLFQNSFNEMLEDFKANAQDLRIPYDWTIYYLRKKALSQKIEKEELVWILLNFNQKRGYYQLRGEEEEENPNKLVELYSLKVVDVFVDEPQKGKSDIWYSLVLENGWIYRRASKISLFDWKDKIRDFIVTTDLNDDGSVKTDKDGNEKRSFRAPGENDWTLVKKKTEQEIEQSHKTVGMYIYETLRANPKQKIKGKLVRTIERKFYKEELRQILEKQKEFHQELQNDDLYNDCIRELYRNNEAHQLTLSKKDFVHLFIEDIVFYQRPLRSQKSSISNCTLEFRKYKDENGAEHTQYLKAIPKSNPYYQEFRLWQWIFNLNLYKKDNDENVIKEFLTTTQDVENLFEFLNNRKEIDQKALLKHFKLSEKTHRWNFVEDKKYPCNETKTMIATRLEKVENISDDFLTREIEQKIWHIIYSVNDKIEYEKALKSFALKHNLDENSFFEAFRKFPPFKSEYGSFSEKAIKKLLPLMRLGKYWDYANIDQFSKGRIQKIINGEYDENIKDRVREKAVHLTSENDFQGLQLWLAQYIVYGRHSEASIAGKWNSADDLEEFLKDFKHHSLRNPIVEQVITETLRVVKDIWLKYGKGAKDFFNEIHIELGREMKLPADDRKKLTNQITENENTNLRIKALLAEMMNDHGVENVRPFSPQQQEILKIYEDGVLNSDIEIEDEYLKISKTAQPSPSDLKRYKLWLEQKYKSPYTGQIIPLNKLFTPEYEIEHIIPQSRYFDDSFSNKIICESAVNKLKDNYIGLGFIKQFGGTIIELGFGKSVKVFDIDEYEDFVKKHYANNRSKRNKLLLEDIPEKMIERQINDTRYISKYISGILSNIVRLEDGSDEGINSKNIVPGNGKITTQLKKDWGLNDVWNDLILPRFKRMNQLTNSTDFIAWNENFQKFLPTVPIEYSKGFSKKRIDHRHHALDALVIACATKDHVNLLNNQSAKSETKRYDLKKKLMKFERVVYLHTQTGEKIEREVPKHFLKPWENFTVDVKHNLDTVIVSFKQNLRVINKATNYYEKYAENGGARNKARVEQKGINWAIRKPMHKDTVSGKVDLPWVKVPKGKILTATRKSLDTSFDLKSIGSITDTGIQKILKNYLMLKDGNPELAFSPEGIEDLNKSIEKYNDGKPHQPINKVRVFELGSKFQIGQAGNKKDKYVEAAKGTNLFFAVYEDKNGKRSYETIPLNEVIERQKQGLPVVDLRSTNDFYLCPNDLVYILSDDERGNMTNNDFENLSDEQVKRIYKFVSCTGGEGHFIPYANATEIIKNENGTNSKSERMQNFYDGSCMLDKNSKPIMIKENCVKLKVDRLGNISKI |
240 | APG06250.1 crRNA重複序列 | guugugaauugcuuucaaaa |
241 | APG06250.1 tracrRNA | uuuugaaagcaauucacaauaaggauuauuccguugugaaaacauuuagagccucgacuaccuucggggcauuuuuauu |
242 | APG06250.1 PAM | nnrrng |
243 | APG06877.1 | MRELDYRIGLDIGTNSIGWGVIELSWNKDREQYEKTRIVDKGVRMFDKAEIPKTGASLAEPRRIARSSRRRLNRKSQRKKDIRNLLVQHEIISQKELTSLYPLSKSSMDIWDIRLDGLDRLLDRFEWARLLIHLAQRRGFKSNRKSELKDVETGKVLSSIQVNEKRLSLYRTVGEMWMKNADFSKYGKRRNSPNEYVFSVSRADLEKEIVTLFEAQRKFHSSYASVDLQKTYIQIWAHQLPFASGNAIVNKVGYCSLLKGKEKRVPKATYTFQYFNTLDQINRTRLGPNFQPFTKEQRDIILDKMFQRTDYYKKKTIPEVTYYDIRKWLALDETIQFKGLTYDPNEELKKIEMKPFINLKPFYEIKKVVTNYAKKTNEVFSALDYDTVAYALTVYKTDKDIRSYLKRSNNLSKRCYDDQLIEELLTLSYTKFGHLSFKAINHVLPIMQEGRTYQEAIHQLGYDTTNLKKENRSMFLPIIPDEITNPIVKRALTQARKVVNAIIRRYGSPNSVHIELARELSKSHDERKKIMTAHDENYKKNKGAISILIENGILNPTGYDIVRYKLWKEQGERCAYSLKKISANTFFNELKKERSGPPVLEVDHILPYSQSFIDSYHNKVLVYGDENQKKGNRIPYTFFSEEDKEWESFESYVRSNSFFSKKKRGYLLKKAYLPRESNLIKERHLNDTRYASSYLKNFIEKNLKFKEAVGITRKKYVQTVNGVITAHLRKRWGLEKDRQETYLHHAMDAIIVACTDHHMVTKVTEYYQIKEGNKSIKKPYFPLPWMGFREEILSHLESQPIARKISEELKIGYQSSDYILVSRMPKRSVTGSAHDQTVMKKGGIDKKGKTIIIKRVHLKDIKFDENGDFKMVGKEQDLATYEAIKQRYLEYRKESKKAFETPLYKPSKKGKGNLIKKIKVEVQTKSFVREINGGVAQNGDLVRVDLFEKDNRYYMVPIYVVDTVRSELPNKAVTSSKGYEQWLSIDNSFTFKFSLYPYDLVRLVKGDEDRFLYFSTLDINSDRLNFKDVNKPSKQAEYRYSLKTIENLEKYEIGVLGDLRLVRQETRKIFK |
244 | APG06877.1 crRNA重複序列 | gucauaguuccauuaaagccauug |
245 | APG06877.1 tracrRNA | caauggcuuugauguuucuaugauaagggcuucggcccguggcguuggggaucgccugcccauuuuaaugggcuucuccccaucuauuuaaugagaauuuuacaaccuuggcuauucuuaaauagcuaagguuuuuuu |
246 | APG09053.1 | MDIETLFAFDIGTNSIGFCVFALDENGEPYRIIDIGTRIYADGRDPQSKASLAVARREARAMSRRRDRYVNRRKAVLRTLTEYGLMPAEASARQALIAETSDRNGAAGEASANPYALRAMALDEKLPLYWIGRVLFHLNQRRGFKSNRKTDRKDNEKGVIALGIGELRAAMHKTKARTYGEWLAARREDGHVTRLRAGSDAFEGDGYAFYPERSLLEAEFREIWARQSSFYPDVLTEARGDHLFQVMFYQRPLKKPRVGKCAFNPLEERLAKAHPLFQEFRLYKEVNELELVLPDHSHKKLDIEQRNALVILLRANREVTFKKLRTALKLAPDIVFNKESESREKLRGDEVHSVLADKKRFGPQWGALSRERQWQIIQTLKDEENPEKLFGWLKEEFGFEGEKADAIANAPLPEGYGRLGETALSSMLDEMKAAVIPEAEAAKNCGYDHSKLGEDREEGEAFLPPYQEILSRQIPPGTNDPADIYDIRMGRFTNPTVHIGLNQLRRVVNALIARHGKPQFVSLELARDLQLSEKQKAEANRAIAKNTREAAARSKKLGEMGQLDTGYNRLLLKLWEELNPSKPEDRVCIYSGKPIGIDMLFSAEVDVDHILPWSKTLDDSQANKLLCLKSANRQKRNRAPADVPEWRDRYEEILARAARLAPNKRRRFAPNAMAEFEAEGGFLARQLTDTQYLSRMAREYLSCLFPSAEIDRRGERKKKIRVIVSPGRLTEMLRRNWGLNNILPDHNLGEMTQAKNRKDHRHHAIDAAVVGVTTRSLLQRIATAAGRLDEADFENLVRKMVSENPPWPTFREELQAAVNGIVVSHKPDHGTVSRKGYAEGKGRTAGRLHNDTAYGFGTDASGNPVAVRRKLFTSLEAKDIPMIRDPELQAELYAAIDGLDDRRALQDALLSFRRTHPKFKGIRRVRMAETLSFIPIRDSQGNVYKGYKGDANYRYDVWETLDGKWHADVVTMFNAHQPDWRSPVHQEHPTARRVLRLQQNDMVAYEHPNDGYTIARVVKFNTAGIVYFASHRESGSLKARDADKQDPFKYFSKSAAGLKDIQCRQIRIDAAGRVFDPGPQDRASKSTRKTN |
247 | APG09053.1 crRNA重複序列 | guugcggcuggaccgcguuuucugaucug |
248 | APG09053.1 tracrRNA | cagaucagaaaacgcggucuggccguuaacaagcuagaagcaccaaauaaggccguuccuucgggagcggcuuuuucu |
249 | APG09053.1 PAM | ngg |
250 | APG04293.1 | MKRILGIDLGTTSIGWAYVHEAENENEISSIEKLGVRVNPLTVDEQINFEKGKPITTNATRTLFRSARRNLQRFKLRRKHLIEILKHNNWISKQTLLTENGNHTTFETISLRDKAATQKVTLEELARVLLMINKKRGYKSSRKVNNTEEGQLIDGMEVAKKLYHEQLTPGQLSLQLIKQGVKRLPDYYRSDLNHELDLIWAFQQKFYPHILTSEFKELLKGKGLRATSNQFWTNYNFNTADNKGTREEKKLQNYQWRSDALIKQLDKEIVAYVISEINGQINNSSGYLGAISDRSKELYFNQLTVGQYLHRQLIANPHTRLKSQVFYRQDYLDEFEKIWETQSKFYPKELTTVLKNEIRDTVIFYQRKLKSQKGLISFCEFEQEQKIINGKTKTIGHRVIPKSSPLFQEFKIWQQLHNVVLRNKKTNVITPLAEEQKSHLFEELNLKGKLSSTQILKLIEDKPKDWELNYSELEGNNTNKALYNAYLDILDLEGYDIRDELKIKLNKDDIELSDLDVNASEIKEMIFSIFKHLGINTEILEFDATLKDKAFEKQASYQLWHLLYSYEEDNSPTGLDRLHNLLQKKFNFTLDQAKLVGNVLFQDDYGNLSSKAIKNIFPYITDNNYSTACELAGYKHSKHSLTKEENEKRELKSRLTILTKNSLRNPVVEKILNQMINVINTLIESENDKLVAQGKEPNFQFDEIRIELARELKKNAKEREELTKSMTQGKTNHEKIIKILQKEDGIKNPTRNDITRFKLYSELKNNGYKDLYTNEYIERKDIFSKEYDIEHIIPQSKLFDDSFSNKTLVRRNVNLKKGNQTAYDFILSEYGQEKANEFETRITNLYSLGKDEGISKSKYKKLLMQESEIGKGFIERDLRETQYIAKKAKSLLLEITRNVVSTSGGITDRLREDWGLVNVMKELNLKKFRDAGLTEFVEMKDGNKKEVIIDWTKRNDHRHHAMDALTIAFTKHNHIQYLNHLNARKNTKDELHTNIIAIEKKETTIITDERGNKKRIFKEPIPNFRNIAKSHLEAILVSHKAKNKVVTKNINKISGKKIGQQTLTPRGQLHKETVYGKIRQYVSKEEKVGPKFTKEVIELVSNPTYRDLLLKRLQENNNDPKKAFGGKNALSKSPIYINLEKNIIVPEVVKLVWLEDDYTIRKEISPELKIDKVVDEGVKRILQNRLALYNGDAKIAFSDLDNNPIWLSKDKGITIKRVTLSGVKNATALHTKKDHLGQPILDHKGQEIPVDFISTGNNHHVAIYEDKNGKLQESVVSHFEAVERVNQQLPIIDKTFNQHLGWKFLFTMKQNELFLFPSDDFNPNEIDLFDTRNYAVISKHLFRAQKLSTKDYSFRHHLETNVEDIKDLKTITWRREGLNGIQNIVKIRTNHLGEIVHIGEY |
251 | APG04293.1 crRNA重複序列 | guugugaauugcuuucaaaca |
252 | APG04293.1 tracrRNA | ugaaagcaauucacaauaaggauuauuccguugugaaaacaucuaguccucgacuaauuucggggaauaaagccuuaacucuguuaaggcuuuuuuuaguuuuuu |
253 | APG04293.1及APG06646.1 PAM | nnnnc |
254 | APG01308.1 | MAKNILGLDLGTNSIGWALINQDFENKQGKILGMGSRIIPMSQDILGDFGKGNSVSQTAARTGYRGVRRLRERFLLRRERLHRVLNIINFLPEHYASQIDFEKRFGKFKEETEPKLAYNKDGFVFKDSFEEMLADFKNYQPQLLENDKKIPYDWTIYYLRKKALSQKIEKEELAWILLNFNQKRGYYQLRGEDFEEEKDKMFVRLKVEKIIDSGDNVKGKILYDVYFENGWKYDKQIVKTEDWIERVKEFIVTESFLKNGDIKRTFKAVDSEKDWIAIKTKTEQEIDKSHKTVGVYIYETLLQNPKQKIKGKLVRTIERKFYKDELKQILEKQKEFHQELKNDDLYNDCVRELYRNNEAHQLTLSKKEFVHLLMEDIIFYQRPLRSQKSSISNCSLEFRKYKDENGVEHIQYLKAVPKSNPYYQEFRIWQWIFNLNIYKRDDEQNPVTTEFLNTTTDIENLFEFLNNRKEVDQKALLKHFKLNEKTHRWKYVEDKKYPCNETKSMISERLKKVENIANDFLTREIEQKIWHIIYSVNDKIEYEKALKSFAKKNNLDENSFFEAFKKFPPFKSEYGSFSEKAIKKLLPLMRLGKYWNCENISDDSKERIQKIINGEYDENIKDRVREKAIHLTSENNFQGLQLWLAQYVVYDRHSEASMIGKWNSADDLEEFLKEFKQHSLRNPIVEQVITETLRVVKDIWLKYGNGAKDFFNEIHIELGREMKQTKDERLDATKRITENENTNLRIKALLAEMMNDNSVENVRPYSPMQQEILKIYEDGVLNSGIEIEDEYLKISKTAQPSPSDLKRYKLWLEQRYKSPYTGQIIPLNKLFTPEYEIEHIIPQSRYFDDSFSNKIICESAVNKLKDNYIGLGFIKQFGGTIVECGLGKNVKVFEVNEYEDFVKKHYANNRGKRNKLLLEEIPEKMIERQLNDTRHISKYISGVLSNIVRVEDGSDEGVNSKNIVPGNGKITTQLKQDWGLNDVWNDLILPRFERMNQLTNSTDFTAWNENHQKFLPTVPIEFSKGFSKKRIDHRHHALDALVIACATKDHINLLNNQSAKSDTKRYDLKKKLMKFEKGVYNHPQTGERIQRDVPKQFLKPWESFTIDAKNNLDKIIISFKQNLRVINKATNYYEKYVEKNGIKTKERVEQTGTNWAIRKPMHKETVSGIVNLPWVKVPKGKILTATRKSLDTTFDLKSINSITDTGIQKILRNYLEFKGSPELAFSPEGIEDMNKNIEKYNDGKLHQPINKVRVFELGSKFQVGQTGNKKDKYVEAAKGTNLFFAVYEDKNGKRNYETIPLNIVIERQKQGLLACPESNEKGEKLLFQLSPNDFVYLTTEEENDNATPINFSLLSKEQINNLYKIVSFTGNRLYGIPICVATTIVNKAEYTQLNKIEFTKEKDLLLKLNVNRLGDVKTFTANDIRKIFNRQE |
255 | APG01308.1 crRNA重複序列 | guugugaauugcuuuc |
256 | APG01308.1 tracrRNA | gaaagcaauucacaauaaggauuauuccguugugaaaacauuuagcgccucgacuaucuucggggcauuuuuu |
257 | APG01308.1 PAM | nnnnnc |
258 | APG06646.1 | MRYSIGLDIGTTSIGNAVINKDLQRFEHLGVRIFDAAENPKDGSSLSAPRRLARSSRRRLRRRKHRVERTKQLLINKGLLTKTQVKNLYNSKNINLDIWDIRVSGIDRKLFNNEFARVLIHFSKNRGFKSNRKSELKEDDNGAILSAVKENRELMDEKGYRTIAEMLVSDEKYEGTKRNKGGDYSHVVARSDIENEICLLFQKQREYGHPFATEENEEAFLSIWSSQRPFSTKDDIVKKIGNCTLEPKEKRAPKSTYTFERFRALDKLNRLRILSTTAPSRPLTNEERKSILSSLFSKKEVKYKELRKLLKLTDDQRFNEIYYSPDETIEKTENRTFLSLESQYKIKKIIEKTESKNMQSSYHPIDYDTIGYALTVFKDDKDIQHYLQNSYIDSKGKAIPNMANREYNLELIEELLGLSFAKFGHLSLKALNNILPYMEEGEPYHIACEMASYQFSQRLSKEKHRLLPPIPVDEIPNPVVVRALTQVRKVLNSIIKKYGPPSDIYIELAREMSKPFKERKSLEREFNENRQINEKAKAHISELYRIPNDPRPHDILKFKLWNEQNGICPYSLKPISIEYLFNIGYAEVDHIIPYSRSFDDSNGNKVLVLTRENQNKLNRTPYEWFGHEENRWEDFVSFIRTMKVGKKKKNMLLKKNFDEEQEEQILSRNLNDTRYITRYIKSFIEDNLEFRTEENKEQYVHTVNGAYTSLMRKRWGLNKDRRGNDLHHAVDAAIIAVSLPFKNKVNAYFKRQETGLSKLLNNKKDIFPEPWRNFIKELEARMIQDPEKMKRALESLELETYGEIFLNKLKPIFVSRMPKHSIKGQIHEETIRRVRGFTEEGFLVTVKKTRLDQIPFDKNGDFPMYGKETDIKTYMAIKQRYLEYGQDKQKAFAVPLRKPSKNPKNAPIVRSVKIEGKANRVVMLDDKAAADNASIVRTEVFRHKKTGEYYLTPVYVADILSNKIPDRLITIKKSYSDWDRITDEHEYLFSLYNNDLVKIILPKEKETKKYTGGNHLWQEGFFYFKGVDSSNAGIKIINHLNSFEARIGTKRLIAFEKYQVNPLGEINKVHGEKRPGELLNKEEIKENRKNIS |
259 | APG06646.1 crRNA重複序列 | gccauaauuccucuguaaaacuu |
260 | APG06646.1 tracrRNA | aagguuuauagaguuauuaugguaaggcaauaugccguggcguuggggaucgccuauguccgguuuuaccggaucucccuaaaggugacuaacuuugguuagucaccuuuuu |
261 | APG09624 | MSTPLQQPHQKSKKTSQMITTRKFKLAIVSDNRNEAYSFIRNEIRNQNKALNAAYNHLYFEHIATEKLKHSDEEYQKHLTKYREVATNKYQDYLKVKEKVNASKDDEKLQKRVDKAREAYNKAQEKVYKIEKEFNKKSMETYQKVVGLSKQTRIGKLLKSQFTLHYDTEDRITSTVLSHFNNDMKTGVLRGDRSLRTYKNSHPLLVRARSMKVYEENGDYFIKWVKGIVFKIVISAGSKQKANIGELKSVLINILNGHYKVCDSSISLNKDLILNLSLNIPVSKENVFVPGRVVGVDLGLKIPAYVSLNDNPYIKKGIGNIDDFLNVRTQLQNQRKRLQKTLECTSGGKGRSKKLKGLDRLKAKEKNFVNTYNHFLSKKIIQFAVKNNAGVIHLEELQFDKLKHKSLLRNWSYYQLQTMIEYKAEREGIEVKYVDASYTSQTCSKCGHYEEGQRVLQDTFTCKNKECKGYVHKVNADFNASQNIAKSTDIIRCTEMAKNNDIEKNA |
262 | APG09624 crRNA重複序列 | aggauugaaau |
263 | APG09624 tracrRNA | aaacagcuagaauguaacuuaaaguaggucaauguuuaaauucgauguugcaauuuguuuggacaaguggauuaaaacguuccuugaaaaucauauaaagcagccaguuuacgggcuugggcgaauuugcguccaaagggugaggccagguguaaguaagaaccuacaaaagcacucaccaaagggucaacucgauacauu |
264 | APG05405 | MSTPLQQPHQKSKKTSQMITTRKFKLAIVSDNRNEAYSFIRNEIRNQNKALNAAYNHLYFEHIATEKLKHSDEEYQKHLTKYREVATNKYQDYLKVKEKVNDSKDDEKLQKRVDKAREAYNKAQEKVYKIEKEFNKKSMETYQKVVGLSKQTRIGKLLKSQFTLHYDTEDRITSTVISHFNNDMKTGVLRGDRSLRTYKNSHPLLVRARSMKVYEENGDYFIKWVKGIVFKIVISAGSKQKANIGELKSVLINILNGHYKVCDSSISLNKDLILNLSLNIPVSKENVFVPGRVVGVDLGLKIPAYVSLNDTPYIKKGIGNIDDFLKVRTQLQSQRKRLQKTLECTSGGKGRNKKLKGLDRLKAKEKNFVNTYNHFLSKKIIQFAVKNNAGVIHLEELQFDKLKHKSLLRNWSYYQLQTMIEYKAEREGIEVKYVDASYTSQTCSKCGHYEEGQRVLQDTFTCKNKECKGYVHKVNADFNASQNIAKSTDIIRCTEMAKNNDIEKNA |
265 | APG05405 crRNA重複序列 | aggauugaaau |
266 | APG05405 tracrRNA | aaacagcuagaauguaacuuaaaguaggucaauguuuaaauucgauguugcaauuuguuuggacaaguggauuaaaacguuccuugaaaaucauauaaagcagccaguuuacgggcuugggcgaauuugcguccaaagggugaggccagguguaaguaagaaccuacaaaagcacucaccaaagggucaacucgauacauu |
267 | APG06622 | MTKNILGLDLGTNSIGWALIKIDHENKTLKIIALGSRIIPMDGQEFSKFNAGQKIESAAGNRTALHRARITKERYLLRRDRLHLVLNLLEALPNHYKIEVDFERNDKRCGQFKEGKEPKMAYLPTKNLENKFDFYFEEAFNEMIEDLQKVNPEIKNEKKKRVPKDWTIYFLRNKAMSQKVSLEELAWVLLSYNQKRGTDSEEIENEDEKSEIKEQIDLKVIKAEKKVDVNGAFFEITLNDAENFKYKEYTTKQLTFEDDVKEVTKILKLDEAGNIINEKTAYQISDLYNLTLANIEHTDINDKKAKHKYDFIYTNGWCTEKKKENFDVTYQKLEKQIKEESKVITELFVVSNKYDFAGKPESIIPSIKLPDFNSEGSKDWTLLKKKTEKEIVKSEKTLSGWIYDVLKNDVNTGERTKIIGGLFQTIDRKFYREELYQIINTQRKFHTSTLDDKDTFEKCVKLLYPHNKDHSKTLLENKQALTNLLIEDILLYQRPLKSKKSEISDCKYEIDYWKEDVNISTGEVVEIPVYKKAIFASHPLFQEFRIWDKIHNIKLIQLESKDADGNTQTNVDITSQYFKPENYRALFNHFNGRSTVAIDDFLKFCEEQFKLGIGKKGERKILWNYPVEEEFKGNETRKGFENRFRKCGFDGFDDFMTQQKEIELWHYLYSVSSAERKKVSQVKDSSDPKFGKTGIWNFFTKYFKDENISLETLEKLCRDFETYPKFTSKYASYSVKALNKMLAVMRVGKNFLTAESVNEKWQEKYIERADTIIKKNNEIDWSAESIDLTDIILNDVNVKNGEIPFPKGLFNTFKSFETVDDFEFLNLTQASYFIYGRHSELAQAKYWNSPTKIREEITKELKHHSLNNPTAEKVLKETLKVVADIWEIYGNSEEKFFNEIHLEVARELQKSNQEKKDIIERQKNNRAENNRIRNILEEFLSSSPYNAKRGNQDHFERLKIVEDGAKVRSYSDKEFYSNNKDKFSKIDIEVILKKKKITQSDFEKYKLWIEQGYKSPYTDQIIKLTDLFDGNKYNVDHIFSRAAITNDSLNNKVVCEAVINRFKSYKTGREFIAQFGGKTHTIFDDKLNKNVTFSLIDEDAYVSLVKSQFKDAKRLILLSKEVPKAFTESQLNNAKYIARKAMELLSHIVREEGEVEFRSKNVLPVSGAITDRLKKEWKINQIWTELLKPRFERLNKIHNSEAFGSYAISKSGHQYFDINTKYILGENDKFDLKRLDHRHHALDALIIALCTDNHVQYFNNINSGITNKKKGKMEAIKKQRAGIKRQIMYSEKDKENPNEKVWRYMLPGSFRNKESVNNEKDSVVDLSWENNYSAKESNDYRKTILECLDNCIVSFKNDFKIVSKSSNKYESYYDENGNLRLDSNGKPQKEFISQQNNNQKHWSVRKPLHTDNPSAEITLQFDRLKLIDNLGKVDLIIEEKIKDAVKEILGMHNNKIGKAESYLKKNPLILEEKKIEYTDFKISNKKYRKRQPITNLSVRTGTGALPTYDSVVDRINKVSDFVLRNELLQHLKINDNDIDKAFSIEGINEFNSNRKIPVFRLPISESATLKFKIGHKNSNSHKWVETGGNFHFRIADEENSRDYETIPLRIAIEMEKDNIIRRQIVDNENEIVLSPNDLVYVPLEKNEIVDFNNLTIQQIKRIYKFVFSTKKEAHFIPYSSSAEIIKNENGTNGYSERTKDFFDGNVLQDDKGKPIQVKSVCWKLKVDRLGNISKA |
268 | APG06622 crRNA重複序列 | GuuGuGAuuuGCuuuCA |
269 | APG06622 tracrRNA | uGAAAGCAAAuCACAAuAAGGAuuAuuCCGuuGuGAAAACAuuuGGGuuGCCuCuuGuCCACAAAuCAGGAGGCuuuuuuAuuu |
270 | APG06622 PAM | nnAARG |
271 | APG02787 | MKKLIVGLDLGVNSIGWAVVGDDDSNRQILGMGSRIIPLSPDDNNEFVTGNAISKNAKRTEKRTQRKGYDRYQQRRRKLVAFLERHSMMVEKELMCLPPLELWALRNKGITQALSSRELGRVLYHLNQRRGYRSSRSEESSDGKKNTAYVEEVKGRYEELKTRGITIGQHFYQKLQTAHNRNEPYRIKQQVFPRQAYIDEFDAIINQQKNHHSSLTADEIAFLRDEIIYMQRPLKSQKGLVSICEFEGQYRKNAKDAEVFVGPKVAPRSSPLAQVCKIWESINNITFTNKRREPYPINTDQKLRLFDALNKTERLSQKAIFFILGIKPGDGYTGNKQTAKGIQGNLTNAAISTIIPERKDLLNFELKIVVDEEDAHLINRSNGEIISTVQKKTVSADYERSPFFRLWHVIYSISDIDKCIETLMEKFGLTKEQAVALSRLDFRKAGFANKSARAMRKILPYLMDGHIFSDAMSLAGYNHSASLTHEENLKRQLKGSLPLLKKNSLRQPVVEKILNQMIGVMNAIIKEWGRPDEIRVELARELKQSAEERNKAFAALSKREREGEIITKRIEAEFRQFGIRATRNNILKWRLFHEISNDEARLNATCVYCGHPFGITDALRGSSVDIEHIIPKSKLFDDSQGNKTLVHRRCNEDKGDRTAFDFMSAKGESVLASYIETVDRLYQSNVISRHKRDRLLTTGDDIPKDFIERQLRETQYIARKAKEILEQICYNVWSTSGQITEYLRRIWGWNDVLMNLQLPVYRDLGLTEWKEYTDRDGNLHRQEVIKDWSKRNDHRHHAIDALTIACTRQGFIQRINRLNATNNREEMRASLNGNYDPKKNLLENYIFALKPFSTKQVEVAAAQILISFKPGKRVATLSKLKAKGKNSGTGVIVPRGPLSEESVYGRVRLMDSKKQPVRYLFEHPELIFKPYIRVLVEERLASYSQDLKKALASLKKDPIYLDGTKTIILEWGSCYKDEVVIKYPLTDIKAKDTQFIIDGHIRAIVNERLSQYKGNEKKAFEHPLYSDAACTKEIRSVRCLTGLTAVVSVKKDESGREIGFVKPGNNHHIALYTDAEGQKREHLCTFWHAVERKKWGMPAVITQPGVIWDNILQKQDNFPQAFLEKLPLEAWTFDKSLQQNEMFIVGLTIEEVQTCIDSFDYARLSKHLYRIQKLSSTGYKIVLRHHLATTIEHTRDMIGIASPSSFTGIKVYVSKTGKISMPHD |
272 | APG02787 crRNA重複序列 | GuuGuGAuuuGCuu |
273 | APG02787 tracrRNA | AAGCAAAuCACAAuAAGGAuuuuuCuuCCGuuGAGAAAuCAuuCACGCCGCCCuCGuCGuuuAuCGGGGGCuuuuuuu |
274 | APG02787 PAM | nnRRnA |
275 | APG06248 | MKNILGLDLGTNSIGWALIQSDFDNKEGKILGTGSRIIPMSQDIKDEYGKGNSISQTADRTRFRSLRRLRERHLLRRERLHRILNILGFLPEHYADQIDFKNRLGQYLPEKEPKLAYRNNEFIFKASFEEMLIDFREQQPEMLQGDKKVPYDWTIYYLRKKALTQKVEKAELAWLILNFNQKRGYYQLRGEEQQENPNKKVEFHSLKVVDVIADETQRGKAETWYSLILENGWVYRRSSKTPLDNWRDKQRDFIVTTDLNDDGSIKKDKDGNIKRSFRAPDENDWTLLKKKTEQDIDHANKTAGAYIYDHLLVAPDQKIKGKLVRTIERRFYKTELKAILAKQQNFHAELQNKDLFLDCVRELYRHNLSHLSNLNQKDTIHLLTEDIIFYQRPLRSQKSSIGNCPLEFRRYQNKEGGDQTEYLKVIPKSHPLYQEFRLWQWIYNLGIYQKEDDTNVTADLIKGIQGYQDLFDFLNSKKEIKQDTLIKFLLSQTGLKGKELNKAALTLRWNFVEDKTYPCNETGTEIRARLAKVAYIPENFLTAEKALSLWHIIYSVNDKKEYELALRKFAKKHQIDEETFFINFQKFPPFQSEYGAFSEKAIKKLLPLIRLGKYWHWEAIDPKSQERIEKILSGEADQNIKERIREKAMHLTREEHFQGLQLWLANYIVYDRHAEAANPDKWSTVSDLEDYLKELKQHSLRNPIVEQVVTETLRVVKDIWLTYGNGAKNFFDEIHIELAREMKNTMEERKRLTSIVTDNENTNLRIKALLVELFEDGNIENVRPYSPIQHEALKIFEDGILNSGIEIDDDILKISKTPQPTSTELKRYKLWLEQKYRSPYTGNVIPLNRLFTTDYEIEHIIPQSRFFDDSFSNKIICESAINKLKDKQLGLEFIKNHAGTIVELGLGKTARVFDEERYQDFVKANYTKNPGKRSKLMLEEIPDKMIARQLNDTRYISKFITSVLSNIVRSETKDDGVNSKNVLLCNGRITSVLRQDWGMNDIWNELILPRFERLNQITDSTVFTAWNENHQKFLPTVPMGFSKGFQRKRIDHRHHAMDALIIASCTRDHINLLNNEYAKSSKRFDLNRKLRKFEKVAYKSPVNGQQIDKDIPTVFIKPWQRFTIDAKCSLEDIIVSFKQNLRVINKTTNYFDGYKDEHGIVNFDNKGAPVKQQRKQTKGDSWAIRKPMHKDFVYGKVDLKHIKIPKGKFATAIRKSLDTTFDQKKIQTITDTGVQKILINYLQSKDNKAELAFSPEGIEDMNQNIRAYNDGKLHQPIKKVRVFEIGSRFPLGETGNKKTKYVETAKGTNLFFAIYQHKNKRNYETVPLNTVIERQKQHLSPVPTEDDKGGTLLFYLSPNDLVYVPTPDELGNNLGGLDIRNLNKEQRRRIYKVEKASGVECYFIRQDIAYLIKSYDATTKIGELESQNKLQTTMSSDRLKIADVCIKLKIDRLGISR |
276 | APG06248 crRNA重複序列 | GuuGuGAuuuGCuuuCAu |
277 | APG06248 tracrRNA | AuGAAAGCAAAuCACAAuAAGGAuuAuuCCGuuGuGAAAACAuCuAAGuCGCCuCGCCuuACAAuGCGGGGCuuu |
278 | APG06248 PAM | nnRAA |
279 | APG06007 | MKKILGLDIGTTSIGYSIIKVSDEKNENIISDKVAASDINNDRIGIFEEAIGVRIINQDTDRFDRGLKLNDPKGSTLTPTANRRKFRGVRRMRNRYKLRRNKLYKVLSILGLTPDESYFTNKKGKRGKDNDIGKALYGLRERAAREKISLSELARVLLHLNQLRGYSSDRFANDEETKFDYYLTEVVEADWENRTAVFEKGSTEDVKYYQFKAKLRFVEPYVIVEDDEKTILYEVEGYIFKKELDFEVGDFITIKAPEFKQNKKGKVVIEEYYKITPTKPDATDWKYKYQTLHKNLSDWCKAGGTVGSYFYKNFYELTTLSRIRNNVVNREWYENEFDAIWTLQYEFYKDFFEKIDVSELVKGVFKDYSAVLNDVISKSGNKAQLQTLIKDKIIFYQRPWQQAKSKGRCEFEKIKVKRKFAIKGTGTKELREEHIGRKVVPRSHPIFQDFKVWQQINNVRLIWNTADEKINLFENAELSEKLTGKTIEKVKELLFKKLQGSKTLSWRTFVKEELGLDTYDEIEEKRKSKVSKKQGLDIETGEIVDSFFSVNFRKRKRDGTFDDIKLKGNTTKAELQNILKEKRAEWFDTLHNQNKKVTNLQLLWEIIYDITNSDATKVSSIIKKHFDFDESVCLTLAKVQFDDAGMANLSAKAIRNLLPLMSDGANYSKITKAKVDELISLNTSETDVDADDKLNGLKDFVTDRKARIRLSKFSNENDFKYLNYWEAAAIVYGSHSSKKSSETKIMERVKNHSMNNPVVEKIVNEAISIVNLLKEKYGFDEIRIELSRELRASADERQQMWEGMSNGAAKNEWAKKMLREIKQAMLDNNRDISYLDTEISNSNLDKIKIIEDVVKYQKPVEFKTKEKEYKLTEPTKAEVTKYLLWLEQNFKCPYTNQPIPLTDVFARGKVVEIEHIIPRERYYSNAYANKVITWREVNQEKGNKTAYEFIVSKRNPAGTVQVGKKEISLVSASQWENHVKEMFPKSGKRTNLLRKEIPEDPIERTLKENQYINKKLKEKLGELVGSDKVWVTSGAITDMLREKWKLNDIWKELVQERFLKFNNGEVKDRLNLKYTTKYYNNKTNQYEDVEKFAGMSKRIDHRHHALDAIIIACTKQSHIQYINNLNAINSADIENDDNKKTKYKGIKTDVCIGNSSSKFKFPWDENKFIPEVKQALQNILISHKNSNVLISPSKHRNNKDINSGKVASVRGELHLQTNYAKKKYFENEKIDIVKLIPLLFKKKFENQNQTLVRFKSFDEIIKEAVLKEKYQNVLISLFKDYDSEKLSTQTTKDFSKKILKRIEDEKLFIHEKSGEKMTWLSTFTEKNASVRPMGLAMDLNSEKEIKDISNPRLRRIGQYRLNYINKKIIEIKALKLPFKEEENNRIREVREIPLYNNAIYELRIKQKDGKYHWVEIKDVQHSDLENIEYAKQETTIAVKNKIKDFSLDELKERYISNPIFLSEKPTPVKKARQKSFFQDLYQLNDGRYVYSRDVFMTYVFVPEDSNRKDAKRELEFLKFFDAVKIVTLEKPEKIDYQKLIKKEDHKLLFTLSKNDIVYIPEEILTDEQIAEINWNDKRDIVPKLFVVKEMTPSRNEIVFQHLYKSDSIRVNGDEAKNILNTEKLEEQIKYGDTNMWKRCIKVDIDKLGTEIKPYWENNKIVL |
280 | APG06007 crRNA重複序列 | GuuGuGAAuuGCuu |
281 | APG06007 tracrRNA | AAGCAAuuCACAAuAAAuuuuuAAuGuuGuGAAAACAuuCAAAGCGGCGCAAGuCGCuuuuuu |
282 | APG06007 PAM | nnnnTC |
283 | APG02874 | MDYRIGLDIGTNSVGWGVIRMQYNDLLERYEKQGIVDAGVRMFDKAEIPKTGASLAAPRREARSSRKRLRRRSQRKKAIRYLIILHELLSEDQLQQLYPLQKESIDIWDIRLESLDRVLNQTEWARLLIHLGQRRGFKSNRKSEYKEEETGKVLVNIQENQKALQQYRTVAEMWMKDAKFSQFDKKRNAPGEYLFSVSRYDLQNEIQTIFESQRNLGSPYATTDLEEEYISVWSKQLPFASGEDILKKVGYCSLERKERRIPKATYTFQYFILLDGLNKIRVGADARQLTTEERSILIEKILTRNDYFSKKSLPDLTYGDLRKWLALDSSLLFKDLTYDPNEKVSKVEKKVFANLKSLYELRKVVETSSNGQSFERIDYDTFGYALTVYKTDEDIRRYLKKPSNLAHKVYEEDLIERLLSLSYEKFGHLSLKAIQTILPYMEDGMMYTEAVQAAGYDITGLQSAKRTLLLPTIPADITNPVVRRALTQTRKVVNAIIKRYGSPLTIHIELARELSKDHQERQQILKNQQANYERNKGAISVLVENGILNPTGYDIVRYKLWKEQGERCAYSLKVIPPSVFFGELKRERNHIPTLEVDHILPYSQSFMDNYHNKVLVYSDENQKKGNRIPSQYLMAVSPEKWTKFEEYVSSNKGFSKQKRQYLLKKDYSSRERDIVKERHLVDTRYATRFMKNFIEKTLLFKESRSSSLTKRVQTVNGKITAHFRKRWGLEKERTETYLHHALDAIVVACTDQHMVTRVTEYYQERERNVRQPYFPWPWEGFRDELLNYLNRQPDSLEISQSIKQNLFLRDYLMVSRMPKHSVTGMSHKQTIRSKACVDEKGKVKTTKRVLLQDIKFDSNGDFKMIGKEQDMATYNAIKERFLSSGGNVKSAFTEPLHKPSKKGKGNVIRKVTVEDQTKSFVRDVNGGVAENGSLVRIDLFEKEGMYYVVPIYVGDTVLKQLPIKISASNRGYYKWVELDENYRFKFSLYAHDLIRIVTKDEDRFFYFSYFDNDGNRIKFLNINSPTGKNENRYGVRSIKLIEKYNVSTLGDISLVKSEERQLFQGMKKKVLNIIN |
284 | APG02874 crRNA重複序列 | GuCAuAGuuCCAuuAAA |
285 | APG02874 tracrRNA | uuuGAuGuuCCuAuGAuAAGGGCCuuGAGCCCGuGGCGuuGGGGAuCGCCuGCCCGuuuAuACGGGCuuCuCCCuACuuACuu |
286 | APG02874 PAM | nnnnCC |
287 | APG03850 | MKYVLGLDIGIASCGWAVINQEKHRIEDLGVRIFDKAENPKDGKSLATPRRDARSTRRTLRRKKHRMQRIKILLVKHGLLSKTEIDHLYESATEIDVWYLRLNALERRLNPKEFARVLIHLAKRRGFKSNRKETTLSENGQILENISENLQIMEQQNYRTVGEMILKDKKFENHKRNKDGTYIGTVTRQQLKEEIQMIFNAQRLYKNDYATEEFESSYLEIWASQRPYASKDQIEKMIGYCTLEPKEKRVPKASWSFQYFVALQTINNLRLINKDRIEELSFEEKNQIMNLALEKSIVKYIDIRKLLSIPNEFHFNNLLYSADTVDTAVENKKCIEFKEYHSINKLYKQIYGKSVPNLLPIDYDTIACGLTIFKDDKDILAYLQNKYVNAKGKPISNLAKKTYDDTFIQALLTLNFSKMGHLSFKALKNIIPFLEEGLSYDKACEKAGYNFKGTSHAEKTKYLPVIPQNTNPVVHRALSQTRKVINAIIKKYGSPSAIHIETARELSKTFQERKEIDSMYQDNSKKNEHAIHKLKELGLINPSGINIVKFKLWNEQDGRCMYSGKYIEPHRLFEEGYTEVDHILPYSRSLDDSYNNKALTLGIENQRKGNKTPYEYIGKTSIWHEFETRVQSNKRINKKKQQKLLLQYFSYTREQEFIKRNLNDTRYATIYLSTLIQQHLIFSESSRKKKVHTVSGIITSHLRSRWGFNKDRKEGHIHHALDAVIVAVTSDHMIQRVTKYYKLKELNRNLQAKRMQFPEPWEGFRLELEARISPNTQQYLKRILFKNYADVNLSEIKPIFVSRMPKRSITGELHQETIRKLIGYNEKGKVLTAIKTKLEDIPFDANGDFPMYGKETDLYTYNAIKERYLSHKKDKRKSFQDPLYKPTKSGEIGPLIKSIKIMDTRTIVNPVNQGKGVVYNSKIARTDVFKKDEKYYLIPIYTIDLLKNILPQKAITAGKGYEDWTTIDPSFTFLFSLFPNDLIQIVPSKNKTIKARTTVSKKEVLLPSLTGYFKGVHSGTAGITVETHDGSVIANVGSKQLLLFEKYQVDVLGHYTKIKEEKRIGMVI |
288 | APG03850 crRNA重複序列 | GCuAuAGuuCCAuAAGAAA |
289 | APG03850 tracrRNA | uuuCuuAAGuuACuAuAGuAAGGGCAAuGACCCGuGGCGuuuGGGGAuCGCCuuAuCCuGGuAuGGAuAuuCuCCCCAuGuGAAAAGCACCuAAGCAuAGCGCuAuGGuGCuuuu |
290 | APG03850 PAM | nnnnG |
291 | APG07553 | MQYVLGLDIGIASCGWAVINQEKERIEDLGVRIFDKAENPKDGKSLAAPRRDARSTRRTLRRKKHRMQRIKILLVKHGLLSQTELDHLYESATEVDVWNLRLDAIERKLNPKEFTRVLIHLAKRRGFKSNSKETTLSENGQILESISENQQIMEQKNYKTIGEMILKDKKFENHKRNKDGTYIGTVTRQQLQDEIQIIFNAQRLYKNNYATKEFESSYLEIWASQRPYASKDQIEKMIGYCTLEQKEKRVPRASWSFQYFVALHTINNLRLISKDRIEELSFKEKKQIMNLALEKPIVKYIDIRKLLSIPNELHFNSLLYSADTVDTTVENRKCIELKEYHSINKVYKQIYGKNALNLLPIDYDTIAYGLTIFKDDKDILEHLKNKYVNAKGKPINNLAKKTYDDTFIQALLTLNFSKMGHLSFKALKNIIPFLEEGLSYDKACEKAGYNFKGTSYTEQTKYLPVIPQNTNPVVHRALSQTKKVINAIIKKYGSPNAIHIETARELSKTFQERKEIDSMYQDNSKKNEHAIHKLKELGNINPSGINIVKFKLWNEQDGKCMYSGKYIEPHRLFEEGYTEVDHILPYSRSLDDSYNNKTLTLGIENQRKGNKTPYEYMGNTSIWDEYEIRVQSNKKINKKKQQKLLLQHFSYAREQEFIERNLNDTRYATIYLSSLIQQHLIFSESSRKKKVHTVSGIITSHLRSRWGFNKDRKEGHIHHALDAVIVAVTSDHMIQRVTKYYKLKELNRNLQAKRMPFPEPWEGFRLELEARISPNTQQYLKGLRFKNYADVNLCEIKPIFVSKMPKRSITGELHQETIRKFIGYNEKGKVLTAIKTKLEDIPFDANGDFPMYGKETDLYTYNSIKERYLSHKKDKRKSFQEPLYKPTKSGGIGPLIKSIKIMDTRTIVNPVNQGKGVVYNSKIARTDVFKKDDKYYLIPIYTIDLMKNILPQKAITAGKGYEDWITIDHSFTFLFSLFPNDLIKIVPSKNKEIKARSTSSKKEILLPSLIGYFKSVHSGTAGITVESHDGRFIANVGSKQLLLFEKYQVDVLGHYTKIKEEKRIGMATCNDNKKSTAFGSL |
292 | APG07553 crRNA重複序列 | GCuAuAGuuCCAuAAG |
293 | APG07553 tracrRNA | CuuAAGuuACuAuAGuAAGGGCAAuGACCCGuGGCGuuuGGGGAuCGCCuCAuCCAuuACGGAuAuuCuCCCCAuGuGAAAAGCACCuAAGCAuAAGGCuAAGGuGCuuuu |
294 | APG07553 PAM | nnnnGnnA |
295 | APG03031 | MKKTLGIDLGTNSIGWVIRNADLLDNQIEDFGVITFEKGVASEKGNEFPKVQKRTESRGKRRNYQSEKYRKFALLAFLIQKNMCPLTMDEFCNWKDYRKGKKREYPQSEEFLNWIRFDFNGDGLPDFHLFGKEKDDSYYVFRAFAADENHKNVFDNNPHILGRVLYQMVQRRGFKGRDEEEAKTMLVGSDKNGTKGRNDIEEYIEKYKTLGAALYYHQKDFGGRIKQRYNLRKDNENELKEICKIHQLSQEDYEKLWKAIIWQRPLRTQKGLVGNCIYEKNKKRVAVSHPLYEEYRTWVFINNLNIIPPFGEEKQNYISEKIYPLFYKSKPDFELSDIDKQLKKDGAKRTSKHNDKTKVLSVKLLKQFQDVFGEDWKQKLQWDINGDRNSQPEKKEKSLYTFEDLWHILLTFDGQENLKKFALEKLNLDDEKAIKFSKIKLQQGYATLSISAIKKILPYLQRGFLYSHAVYMANLYKMLGETTISETLTNHFSDEILKILENDDFNRKNSAIINSLISEMLNDDNRYYIADNRNLDKTEEQIVLKSITDNYGLETWGNFDEEKKMEIIDFVSSKYLEFLKKTYTEKGNLFIQPERIHDKIFNFLKETYHVSEDKIKYLWHPSEQENYAKADEYFEYSIGSKKYYVKEESTQNFLSRNPNAEFDGRQLKLLGNPEPLSKGFKNPMALKSLHKLKNLVNYLLQTGKIDEGTRVVIEIARELNDKNKRKAIENWQKDREKENEAFRKEIEVYKEQFPNINLIDENTLIRKIRLWHEQNKICLYTGKTIPFSELIIGNKYDFEHTIPASISFDNELKNLTISDSSYNRLYKGKKFPTQLSNYDSEQTINGESCNSILRNIEFIFGERIVEYKEIKGKTEKIVKWKKIDELEKQFDEWKKKASYASTKEIKDNCIVKYHTIKMDLDYLKSKLATFTITEYKAGWRNSQIRDTQIITKYALPYFKTLFKRVSVEKGGVTDIFKKVYKVQSRNSKKDRSVHSHHAQDAAILTLIPNAFHRERIIKAYENEIDNRTGKTYHEQPLDWENFSEKYILELQDKVLINNLTDNRTITQTYKTVRKRGKVVYDIDENGNSLKRVSKGDTIRGQLHGETFYGAIKQPVRDEDNKILFDENKKMILKDEIYLAVRKPLVYKKDANSPGFKTLDEVEKVIVDKGLFKMIKKQVEESDFKTALIDGVYMLNESGEKVNKIRRIRCFENGLKYTTAIKVHEHSFVSHKEYKQSTLATNGENTYCLFYKNDKGKAMKILSIVDLAELKLKNIQNLYNEPEFSSFEVGKGKNKYKIPLYSVLKSGDKVLFYKENIYELKDLEQKELSDRMFKMYQFEKDGRIKFRHHLAAGIDTELKKENPENSSVNFEEKQVFLRLSQGQWNFAIDGKDFEISLDGKINWKF |
296 | APG03031 crRNA重複序列 | GuuGuGAAuuGCuuu |
297 | APG03031 tracrRNA | AAAGCAAuuCACAAuAAGGCuuAAAAGCCGAAGAAAAuCuuuAGuCCuGCGuACuCCGuGGGAuuuuu |
298 | APG09208 | MRYSIGLDIGTTSIGSAVINNDLQRFEHLGVRIFDAAENPKDGSSLSAPRRLARSSRKRLRRRKHRVERTKQILINKGLLTKTQVKNLYNSKNVNLDVWDIRVSGLDRKLFNDEFARVLIHFSKNRGFKSNRKSELKEDDNGAILSAVKENKELMEEKGYRTIAEMLVLDERYEGTKRNKDGDYSHVVSRSDIENEIRLLFQKQREYGHPFAIEENEEAFLAIWSSQRPFATKDDIVKKIGTCTLEPREKRAPKSTYTFERFRALDKLNRLRILSTTTPSRPLTNEERDSILNSLFSKKEVKYKELRKMLKLTDDQRFNEIYYSPDETIEKTENRVFLSSESQYKIKKIIEKTESKNMLSTYCPIDYDTIGYALTVFKDDKDIQHYLQNRYVDSKGKAISNMANREYNLELIEELLGLSFSKFGHLSLKALNNILPYMEEGEPYHIACEMAGYQFSQRLTKEKHRLLPPIPVDEIPNPVVVRALTQVRKVLNSIIKKYGPPSDIYIELAREMGKPFKERKSLEREFNENRQVNEKAKAHISELYRVPNDPRPHDILKFKLWKEQNGICPYSFKPISVDYLFNIGYTEVDHIIPYSRSFDDSNGNKVLVLTNENRNKLNRTPYEWFGHDENRWGDFVSFVRTMKVGKKKKDMLLKKNFDEEQEEQILSRNLNDTRYITRYIKSFIEDNLEFRTEENKKQYVHTVNGGYTSLMRKRWGLNKDRRGNDLHHAVDAAIIAVSLPFKHKVNTYFKRQEIGLSNLSNNKKDIFPEPWRNFIKELEARMIQDPEKMKTALESLELETYGEIFLNKLKPIFVSRMPKHSIKGQIHEETIRRVRGLTEEGFLVTVKKTRLDQIPFDKNGDFPMYGKETDIKTYMAIKQRYLEYGQDKQKAFAIPLRKPSKNPENAPIVRSVKIEGKANRVVMLDDKAAADNASIARTEVFRHKETGEYYVTPVYVADIVSNKIPDRLITLKKPYSEWDRITDEYEYLFSLYNNDLIKIVLPKEKETKKYTGGNHLWQEGFFYFKGVDSSNASIKIIDHLNSFEVRIGIRRLIAFEKYQVNPLGEINKVHGEKRPGELLNEEEIKENRKNIS |
299 | APG09208 crRNA重複序列 | GCCAuAAuuCCuCuGuAAAACuu |
300 | APG09208 tracrRNA | AAGGuuuAuAGAGuuAuuAuGGuAAGGCAAuAuGCCGuGGCGuuGGGGAuCGCCuAuGuCCGGuuuuACCGGAuCuCCCuAGAGGuGACuAACuuuGGuuAGuCGCCuuuuu |
301 | APG09208 PAM | nnnnC |
302 | APG05586 | MYSIGLDLGISSVGWSVIDEETGKIVDLGVRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVSAYADELATILKTQQALYPNELTDDWIALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPEQKEFILTELMTKEFARFGVNDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEAGIDLATLPTETIDCLAKVLTLNTEREGVENTLAFELPELAEPVKSLVLDHYKELSQSISTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAGVRKRYSDYKKLPTKEVLAEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESRPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGKKLRKFNTDILGKKHHLSYEKEPKNIIK |
303 | APG05586 crRNA重複序列 | GuuAuuGuACuCuCAAuAA |
304 | APG05586 tracrRNA | uuAuuGAGAAuCuACAAuAAuAAGGCAuCuuGCCGAAuuuACCGCCCuACAuAuGuAGGGCGGuuuu |
305 | APG05586 PAM | nnRYA |
306 | APG08770 | MYSIGLDLGISSVGWSVIDEETGKIVDLGVRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGNYQLNVFKVSAYADELATILKTQQALYPNELTDDWIALFVQPGIAEDAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEQPLSPTQKEFILTELMTKEFARFGVNDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEAGIDLATLPTETIDCLAKVLTLNTEREGVENTLAFELPELAEPVKSLVLDHYKELSQSISTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAGVRKRYSDYKKLPTKEVLAEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDAWMAGAFKKINGKFSNWDEYQKWVESRPFSRKKANNLLETRNIFDSEQVQNFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAIDASLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPLTIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMMPAENQFKQKPYNNGAINLNIAKYGKEGNKLRKFNTDILGKKHHLSYEKEPKNIIK |
307 | APG08770 crRNA重複序列 | GuuAuuGuACuCuCAAuAA |
308 | APG08770 tracrRNA | uuAuuGAGAAuCuACAAuAAuAAGGCAuCuuGCCGAAuuuACCGCCCuACAuAuGuAGGGCGGuuuu |
309 | APG08167 | MKRHYILGLDIGITSVGYGIIDYETREVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRKHRLQSVKKLLFDYDLLTNHSELSGINPYEARVKGLSQNLSEVEFSGALLHLAKRRGVHNVNEVEEDTRNELSTKEQISRNSKALEEKYVAELQLERLKTDSEVRGAINRFKTSDYVKEAKQLLKVQKEYHQLDQSFIDTYIDLLETRRTYYEGPGKGSPFGWKDIKEWYEMLIGHCTYFPEELRSVKYAYNADLYNALNDLNNLVISRDDNEKLAYYEKFQIIENVFKQKKKPTLKQISKEIFVNEEDIKGYRVTSTGKPEFTKFKIYHDIKGIKERKEIIENAEVLDQIAEILTIYQSSEDIQEELAKLNSELTQEEIEQISKLTGYTGTHSLSLKAINLILDELWHTSDNQMAIFNRLKLVPKKMDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPSDIIIELAREKNSKDAQKLINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHNMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKDNRTPFQYLSSSDSKMDYETFKKHILNLSKGKDRISKKKKVYLLEERDINRFSVQKDFINRNLVDTRYATRELMTLLRSYFSVNNLDVKVKSINGGFTSFLRRKWKFKKERNQGYKHHAEDALIIANADYVFKEWKKLDRANKVMENQTVEENQAESMPEIETEQEYKEIFITPHQIQHIKDFKDYKYSHRVDKKSNRELVNDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLMNQSPEKLLMYHHDPQTYQKLKLIMEQYGGEKNPLYKYHEETGNYLTKYSKKDNGPVIKKIKYYGNKLNVHLDITDDYPNSRNKVVKLSLKPFRFDVYLDNGVYKFVTIKNLDVIKKEDYYEVNSKCYKEAKKLKQISDQAEFIASFYNNDLIKVNGELYRIIGVNNDLLNRIEVNMVDITYKEYLETMNDKRTPRIFKAITGKTQSIKKYSTDILGNLYEVKSKQNPQMIMKR |
310 | APG08167 crRNA重複序列 | GuuuuAGuACuCuGuAA |
311 | APG08167 tracrRNA | uuACAGAAuCuACuAAAACAAGACuAuAuAuCGuGuuuAuCCCAuCAAuuuAuuGAuGGGAuuu |
312 | APG08167 PAM | nnGRR |
313 | APG01604 | MVTKYILGLDIGITSVGYGIINYEDKTIIDAGVRLFPEANVENNEGRRSKRGARRLKRRRIHRLDRIKQLLSEYNLVDLDNIPQSPSPYEIRVKGLREELSKDELVIALLHIAKRRGIHNVEAVDETQDEGNELSTKEQLAKNNNLLKDKYVCELLLERLKDGKVRGEKNRFKTTDIIKEVKQLLETQKEAHQLDDDFINRYIDLIETRREYFEGPGKGSPFGWGGDLKKWYETLMGHCTYFPNELRSVKYSYSADLFNALNDLNNLVIQREGNSKLEYHEKYHIIENVFKQKKKPTLKQIANEIGVSPDDIKGFRINKSGKETFTEFKLYHDLKKVLIDQSILENVQLLDQIAEILTIYQDKESIINELNQLSEIINEQDKESISNLSGYNGTHRLSLKCINLVIEELWHTSRNQMEIFTYLNIKPKKIDLAKTNKIPKNMIDEFILSPVVKRTFGQAINVINKVIEKYGVPEDIIIELARESNSKDKQKFINSLQKKNETTRKRINEIIGQYGNQNAKRLVEKIRLHDEQEGKCLYSLESIPLEDLINNPQYYEVDHIIPRSVSFDNSYQNKVLVKQTENSKKSNRTPYQYFNSGETKLSYNQFKQHVLNLSKSKDRISKKKKEYLLEERDINKYEVQKEFINRNLVDTRYATRELTNYLKAYFSANDMDVKVKTINGSFTDYLRKVWKFKKERNHGYKHHAEDALIIANADFLFKENKKLKKANAILEQPSLDNGKSDATVENDNEYVETFSIPKQVNDIKEFRDFKFSHRVDKKPNRQLINDTLYSTRKIENHTFIVSPITNIYSKDNDELKKKFNKNPEKFLMYQHDPKTFEKLEVIMKQYANEKNPLAKYHEETGEYLTKYSKKNNGPIVKTIKVLGDKVGKHLDVTHKYKYSNSKIVKKTINPYRFDVYLTDKGYKFITISYLDVLKKDNYYYILKEKYEELKIKKSISDTDQFIGSFYYNDLIKINDQIFKVVGVNNDLLNRIELDLLDISYKEYCKINNIKTNRIIKGITKKITNIEKFSTDVLGNLYKAHSNHPQLIFKQRD |
314 | APG01604 crRNA重複序列 | GuuuuAGuACuCuGuAA |
315 | APG01604 tracrRNA | uuACAGAAuCuACuAAAACAAGACuAuAuAuCGuGuuuAuCCCAuCAAuuuAuuGAuGGGAuuu |
316 | APG03021 | MSNGKILGLDIGVASVGVGIIDAKTGNVIHANSRLFSAANAENNAERRGFRGARRLTRRKKHRVKRVRDLFEKYDISTDFRNLNLNPYELRVKGLTEQLTNEELFAALRTIAKRRGISYLDDAEDDSTGSSDYAKSIDENRRLLKTKTPGQIQLERLEKYGQLRGNFTVYDENGEAHRLINVFSTSDYKNEARKILEAQSNYNKQITDEFIEDYIEILTQKRKYYHGPGNEKSRTDYGRFRTDGTTLENIFGILIGKCSFYPEEYRASKASYTAQEFNFLNDLNNLKVPTETGKLSTEQKEYLVDFAKKSKALGASKLLKEIAKIVDCSVDDIKGYRVDNKDKPDLHTFEPYRKLKFNLSSIDIDELSRETLDKLADILTLNTEREGIEDTIKRNLPSQFTEEQISEIVQIRKNQSSAFNKGWHSFSAKLMNELIPELYVTSEEQMTILTRLEKFKVNKKSSKNTKTIDEKEITDEIYNPVVAKSVRQTIKIINAAVKKYGDFDKIVIEMPRDKNAEDEKKFIDKKEKENKKEKDDSLKRAAFLYNGTDNLPDGVFHGNKELKTKIRLWYQQGERCLYSGKLISIHDLVHNSNKFEIDHILPLSLSFDDSLANKVLVYAWTNQEKGQKTPYQVIDSMDAAWSFREMKDYVLKQKRLGKKKREYLLTTENIDKIEVKKKFIERNLVDTRYASRVVLNSLQTALKELGKDTKVSVVRGQFTSQLRRKWNIDKSRETYHHHAVDALIIAASSQLKLWQKQENPMFESYGENQVVNKETGEILSISDDKYKELVFQPPYQGFVNTISSKGFEDEILFSYQVDSKFNRKVSDATIYSTRKAKLGKDKKDETYVLGKIKDIYSQDGFDTFIKRYKKDKTQFLMYQKDPLTWENVIEVILRDYPSEKLSEDGKKTVKCNPFEEYRRENGLICKYSKKGNGTPIKSLKYYDKKLGNCIDITPEKSKNRVVLRQISPWRADIYFNLETLKYELMGLKYSDLSFEKGTGKYHISQEKYDAIREKEGIGKKSEFKFTLYRNDLILIKDTLNNCERMLRFGSKNDTSKHYVELKPLEKGTFDSEEEILPVLGKVAKSGQFIKGLNKTNISIYKVRTDVLGNKFFIKKEGDKPKLDFKNNNK |
317 | APG03021 crRNA重複序列 | GuAuuuGuACuCuCAA |
318 | APG03021 tracrRNA | uuGCAGAGCCuACAAAUAuAAGGCuuCAuGCCGAAuuCAAGCACCCCAuGuuuACAuGGGGuGCuuuu |
319 | APG03021 PAM | nnnAAA |
320 | APG06015 | MEKVPYNIGLDIGTSSIGFAATDNLNKPIRAKGKTVIGVRLFEEGKTAADRRGFRTTRRRLSRRKWRLRLLDEIFDKEMAKVDNTFFARLKESNLSPKDANKKYLGSLLFPEKKDFKFYEDYPTIYHLRYALMHEKRQFDIREVYLAMHHIIKYRGNFLNSAPMNSFKTQDFDFVAKFKKLNELFESIDAEHETKFDIENISKFRDIMLNQDIRKLDRKKQAAKILILDSTDKTAKKINNKIATAVANSALGYKFALDAILKLDVEESKDWSISLNDEEIDSILDNLTSDLDAERIEIIEILRDLYSHIALNEIVPNGQSLSKSMMDKYDKHHADLDVLKKVISNMDDRKKAKSLKNIYNQYVGKTNDKVLDKDEFYKQIQKNLDKSEDAMKIVNEIELDQFMPKQRTSQNGVIPHQLHQKELDEIIENQKQYYPFLAEPNPNEKRKPHAQFKLDELIAFKIPYYVGPLITKEEQQAQSGAKFAWMKRKQDGVITPWNFDEKVDRMASANEFIRRMTTKDTYLLGEDVLPDESLIYQKFKVLNELNNVKVNDKKLTVADKQDIFNDLFKKQKTVSVSKLQKYFVTEKHYLTEPTIKGLSDTKKFSNSLSTYIDFEKIFGNEILADQNKQNDLEKIIEWSTIFEDRKIFEDKLHEIEWLTEKQIKAIRRYRGWGRLSKKLLVDLRNNEGKSILDELWRTNDNFMQIQAREEFAKSIVEANQKLMNLGGAASVQNTVESTLEDAYTSPQNKKAIRQVIKVVEDIVKAVGYAPEKITIEFTRGADKNSRRTQNRQKQIMEVYKTAAKEIVDATLKGQLENEEKLTDKLYLYFTQLGKDIYSGETINIDQLNNYDIDHILPQAFIKDDSLDNRVLTSRDLNNGKSDSVPVKQFGANMKSFWMRLQAHGLISKRKLNNLMTDPDSIGKYTMQGFVRRQLVETSQVIKLTANILGAVYGENTDIVEIPAKLTHQMREKFNLYKVREVNDYHHAFDAYLTTFVGNYLFKRYPKLRPYFVYGDFKMTDNALKGMRRFNFLHDLKDDEVLVDNETGEVLWEGQKSIEELKKIYGYKFMLTTHEAYINNGAMYDQTVYPAKSNKKLIPSKNNRPTNIYGGFSGNKDAYLAIVKILGKKGDTYKVVGVPRRFSDELLNAYNDDYSEYLNKLHDVLVTQFTKKQRNKKTGKIIKKIENFEIVVGKVNYRQRIIDRNQSFMLGSSTYKYNTKQLVLTESSMKILSNFKHASDDNLNLVYDEILEKVNESFELYDKNGFRKKLNNNIDKFRKLPCKSIFEKNKLISVGKCEILFQILNGLHANATMGDLKGIGFSTPFGFMQDASGIKLNKDSMLLYQSPTGLFERKVKLSDL |
321 | APG06015 crRNA重複序列 | GuuuCAGAAGAGuG |
322 | APG06015 tracrRNA | CAuuCuGuuuuGAAAuCAAACAACGCuuuACGCGGAGuuuACACAuCuGuCCCAuuAuAuGGGCAuuACAuAAuAAAAGAGGAAuCACCuuuAAGGuuGAuuCCuCuuuuu |
323 | APG06015 PAM | nnAAA |
324 | APG09344 | MAKQKYTVGLDIGTNSVGWAVINKDFKLVSGKKHINDNGKQKRSRTNLWGVRLFDAADTAADRRLKRGMRRRIARRKERLNYLRGIFQADILAFDDSFFIRMDESFLQDDDKQATAFSYRDQSGAMQTRVVTEKEAVKYPLFNGKSGSGETYTDESAYYNQYPTIYHLRQRLIDNPAQADLRLVYLAMHHILKYRGHFVNQGQTFDLGNINIAGNLTSALDKLDEASSFKFGLADVDADQANAILKNKQWSASKKAYELNTLYEIIQDTVYRRENETQAVAYDSLTVKQQEKWLAEKQKQVKAFLTGIVGNTISPKDIFANKDYDRKQNEDFPEKIKYSNENFEEQIGELEKYLDETEVAAIVAGKDVYESLVLSNILTKSTLSGSMIEKYNVHGTQLKSLKSFSRKVSAEFYDKLFNVVKDEKGKPQIGVYAQYIDGVGNPAKRLAREDFYDALKKVFESEFKGLTFPAGEKGIDFTKTDLSADRMAFIREMNEAINLENYLPKQRQADNGAIPYQVHEHELIRIIENQKQYYPFLGDKVQVTYEDESGQTQVRSEYKIQVLFKFRIPYYVGTLAKNSGWVNEDGKKLVARNVAAKNSWVVRNSDERVTPWNFEQVINKEASSINFIERMTNFDTYLPNEKVLPKNSLLYQEFIVNNELISSGYYLNGRKEYFLPEQRQRIITRLFKRYRKVSAKQMLDFLKNEYQIKLDDDPKKLFGLDTFVKVPSYNGSLSTVVDLTNKMGISEDLIANYPERFEEIIKWQTIFEDKKILKKTIREVNHNKWSGMLTAEQVNKLSKRHYTGWGRLSQKLLDGVKTSQGRTIIESLREGICDNFMRLIEDEKIAEFIANAQVAGAKDGVLAYDLVDQLPGSPAIKKGIWQSLRVLQELEHYLGRDAIGKVVIEMSRDDESSRRTKARKQQLEEFYKKFKESTGSDVTAELKRELSEKDAKEIDDEKVFLYFLQNGKSMYSGDQLYLSRLADYQVDHIVPQTYIKDDSLDNKVLVTQRDNQNKGGDTPSHTVVTRMNSYWDMLAKNGQVSPRKLANLKKGTITLKQREGFINRQLVENRQIIKHVANILTNYYTGTDTLVLTPKSGLTSQLRSGLIYELNPAFDEAKALDRGKAYQVERYTTVKLHDRFVKNRKLNDYHHAHDAYLNAFVAQYVYQEHPEWKNAWVYGKYPRNGQADFGKWATQRKQKSLQLLSSMANDVWNLEDPDTMEKTILNRDETFEQMRQTLCYRNINIVKKLETQTGKFGDESVYKKGNKADHYSLGLKRKYPPQKYGGTKGAISAVTALVKDNSGRVIPVSISASDYDSYQNASDKLAWLLMRKKNIAEILVASLPKYTKYELPSGALRLLASYQEAQSAVELPMLNLGLMDDEAKVLNLYDQLAQFIADNKLFTDKKIALLKGEMRVAFEGLEEFKDKQKVIDELLGVTNGSNQGLQALNSIGLGTSNQRLKSGNTMTNGVTLINESVTGLYSTRTTYN |
325 | APG09344 crRNA重複序列 | GuuuuAGuGuCAuGuuGAAuAG |
326 | APG09344 tracrRNA | CuAuuCAACAuGGCAAGuuAAAAuAAGCuuuAuGCGuAuuCAAACuuuuGuuAAGGCGACAuCGCCuuuu |
327 | APG09344 PAM | nAG |
328 | APG07991 | MKKDYVIGLDIGTNSVGWAVMTEDYQLVKKKMPIYGNTEKKKIKKNFWGVRLFEEGHTAEDRRLKRTARRRISRRRNRLRYLQAFFEEAMTALDENFFARLQESFLVPEDKKWHRHPIFAKLEDEVAYHETYPTIYHLRKKLADSSEQADLRLIYLALAHIVKYRGHFLIEGKLSTENISVKEQFQQFMIIYNQTFVNGESRLVSAPLPESVLIEEELTEKASRTKKSEKVLQQFPQEKANGLFGQFLKLMVGNKADFKKVFGLEEEAKITYASESYEEDLEGILAKVGDEYSDVFLAAKNVYDAVELSTILADSDKKSHAKLSSSMIVRFTEHQEDLKNFKRFIRENCPDEYDNLFKNEQKDGYAGYIAHAGKVSQLKFYQYVKKIIQDIAGAEYFLEKIAQENFLRKQRTFDNGVIPHQIHLAELQAIIHRQAAYYPFLKENQKKIEQLVTFRIPYYVGPLSKGDASTFAWLKRQSEEPIRPWNLQETVDLDQSATAFIERMTNFDTYLPSEKVLPKHSLLYEKFMVFNELTKISYTDDRGIKANFSGKEKEKIFDYLFKTRRKVKKKDIIQFYRNEYNTEIVTLSGLEEDQFNASFSTYQDLLKCGLTRAELDHPDNAEKLEDIIKILTIFEDRQRIRTQLSTFKGQFSEEVLKKLERKHYTGWGRLSKKLINGIYDKESGKTILDYLIKDDGVSKHYNRNFMQLINDSQLSFKNAIQKAQSSEHEETLSETVNELAGSPAIKKGIYQSLKIVDELVAIMGYAPKRIVVEMARENQTTSTGKRRSIQRLKIVEKAMAEIGSNLLKEQPTTNEQLRDTRLFLYYMQNGKDMYTGDELSLHRLSHYDIDHIIPQSFMKDDSLDNLVLVGSTENRGKSDDVPSKEVVKKMKAYWEKLYAAGLISQRKFQRLTKGEQGGLTLEDKAHFIQRQLVETRQITKNVAGILDQRYNAKSKEKKVQIITLKASLTSQFRSIFGLYKVREVNDYHHGQDAYLNCVVATTLLKVYPNLAPEFVYGEYPKFQAFKENKATAKAIIYTNLLRFFTEDEPRFTKDGEILWSNSYLKTIKKELNYHQMNIVKKVEVQKGGFSKESIKPKGPSNKLIPVKNGLDPQKYGGFDSPVVAYTVLFTHEKGKKPLIKQEILGITIMEKTRFEQNPILFLEEKGFLRPRVLMKLPKYTLYEFPEGRRRLLASAKEAQKGNQMVLPEHLLTLLYHAKQCLLPNQSESLAYVEQHQPEFQEILERVVDFAEVHTLAKSKVQQIVKLFEANQTADVKEIAASFIQLMQFNAMGAPSTFKFFQKDIERARYTSIKEIFDATIIYQSTTGLYETRRKVVD |
329 | APG07991 crRNA重複序列 | GuuuuAGAGuCAuGuuG |
330 | APG07991 tracrRNA | CAACAuAGCAAGuuAAAAuAAGGuuuuAACCGuAAuCAACuGuAAAGuGGCGCuGuuuCGGCGCuuuu |
331 | APG07991 PAM | nGG |
332 | APG01868 | MKKEYTIGLDIGTNSVGWSVLTDDYRLVSKKMKVAGNTEKSSTKKNFWGVRLFDEGQTAEARRSKRTARRRLARRRQRILELQKIFAPEILKIDEHFFARLNESFLVPDEKKQSRHPVFATIKQEKSYHQTYPTIYHLRQALADSSEKADIRLVYLAMAHLLKYRGHFLIEGELNTENSSVTETFRQFLSTYNQQFSEAGDKQTEKLDEAVDCSFVFTEKMSKTKKAETLLKYFPHEKSNGYLSQFIKLMVGNQGNFKNVFGLEEEAKLQFSKETYEEDLQELLEKIGDDYIDLFVQAKNVYDAVLLSEILSDSTKNTRAKLSAGMIRRYDAHKEDLVLLKRFVKENLPKKYRAFFGDNSVNGYAGYIEGHATQEDFYKFVKKELTGIRGSEVFLTKIEQENFLRKQRTFDNGVIPHQIHLTELRAIIANQKKHYPFLKEEQEKLESLLTFKIPYYVGPLAKKQENSPFAWLIRKSEEKIKPWNLPEIVDMEDSAVRFIERMINTDMYMPHNKVLPKNSLLYQKFSIYNELTKVRYQDERGQMNYFSSIEKKEIFHELFEKNRKVTKKDLQEFLYLKYDIKHAELSGIEKAFNASYTTYHDFLTMSENKREMKQWLEDPELASMFEEIIKTLTVFEDREMIKTRLSHHEATLGKHIIKKLTKKHYTGWGRLSKELIQGIRDKQSNKTILDYLINDDDFPHHRNRNFMQLINDDSLSFKKEIKKAQMITDTENLEEIVKELTGSPAIKKGILQSLKIVDEIVGIMGYEPANIVVEMARENQTTGRGLKSSRPRLKALEESLKDFGSQLLKEYPTDNSSLQKDRLYLYYLQNGRDMYTGAPLDIHRLSDYDIDHIIPRSFTTDNSIDNKVLVSSKENRLKKDDVPSEKVVKKMRSFWYDLYSSKLISKRKLDNLTKIKLTEEDKAGFIKRQLVETRQITKHVAGILHHRFNKAEDTNEPIRKVRIITLKSALVSQFRNRFGIYKVREINEYHHAHDAYLNGVIALALLKKYPQLAPEFVYGEYLKFNAHKANKATVKKEFYSNIMKFFESDTPVCDENGEIFWDKSKSIAQVKKVINHHHMNIVKKTEIQKGGFSKETVEPKKDSSKLLPRKNNWDPAKYGGLGSPNVAYTVAFTYEKGKARKRTNALEGITIMEREAFEQSPVLFLKNKGYEQAEIEMKLPKYALFELENGRKRMVASNKEAQKANSFLLPEHLVTLLYHAKQYDEISHKESFDYVNEHHKEFSEVFARVLEFAGKYTLAEKNIEKLEKIYKENQTDDLAKLASSFVNLMQFNAMGAPADFKFFDVTIPRKRYTSLTEIWQSTIIHQSITGLYETRIRMGK |
333 | APG01868 crRNA重複序列 | GuuuuAGAGCuAuGC |
334 | APG01868 tracrRNA | GCAuAGCAAGuuAAAAuAAGGCuuuGuCCGuCAuCAGCuuuuuuAAAGCAGCGCuGuuCuCGGCGCuuuu |
335 | APG02998 | MKKNYTIGLDIGTASVGWAVLTEDYDLVKRKMKISGNTQKKAVKKNFWGVRLFEQGETAEGRRLKRTTRRRIARRRQRIQYLRTIFDEAMNQVDANFFARLDESFSITDEKENERHPIFGNVAEEVAYHEQFRTIYRLREVLANSSEQADLRLIYLALAHIIKFRGHFLIEGELNTENSSVSGTFEQFIKVYNETFNVEKVLELTVDLDEIAKQKVSRMKRAELILSLFPEEKSTGDFAQFIKMIVGNQGNVKKTFSLNEDAKIQFSKEEYEENLETLLAEIGEDFRGVFDAAKSVYDAISLANILKVTDAATRAKLSSSMVARFKEHKEDLKALKQFVRDNLPDEYDDLFKNKKVAGYAGYIDGDATQEEFYKYLKKALAKTTGAEYFLAKIEQEDFLRKQRTFDNGVIPYQLHLEELKAIIRNQKPYYPFLDEEKISQLMTFRIPYYVGPLAQGQGNFAWLTRKESGKITPWNLNEKVDIEKSATDFVERMTNNDSYLPMEKVLPKHSLLYEKFTVYNELTKVRYMDDNGRVQNFSSKEKQQIVNDLFKQQRKVKKEILEAFIKNEYGIENPKVEGIEKAFNASLGTYHDLVKLGIRPALFEQPEYEQQFEQIVKILTVFEDRKMRRKQLEQFSDLLTEDEQKQLERKHYKGWGRLSAKLIHGIVDQKTQKTILDYLIDDDDLPRNRNRNFMQLINDENLSFKEEIEKIAFDNDKSTEEIVQELAGSPAIKKGILQSLKIVEEIIEIMGELPTNIVVEMARENQTTAQGNRASQARMKYLEESIKKLGSSILEDEPISKDANLLRNDRLFLYYLQNGRDMYTGDELDINNLSSYDIDHIIPQSFVKDDSIDNRVLTTQRINRGKSNTVPAESVVKDMRATWERLYASNLISKKKLNNLMKAVNGGLTEEDKAYFIQRQLVETRQITKNVAQILHQKYNNEQSSEKPVRVVTLKSALASQFRKDFSLYKIRELNDYHHAQDAYLNGVIAQALLKVYPKLEPEFVYGEYQKVSIRALNKATAKKETYSNIMKFFTNDEVLTNKETGEVLWNRQRDIKTIKKVMNYHQMNIVKKVEIQTGRFTKESIQPKGPSKKLIARKNNWAPVNYGGFDSPTVAYSVIITHEKGKAAKVVQQLVGIKILERQAFEQNEVAFLEGKGFIHPKVQLKLPKYSLYQFADGRRRLLASADEAQKGNQMVLPTELIELLYHAKHVNDSSGESLTYLENHRTKFAELLEVILQFTNRYVGAEDRQKTVRDLYEKNQDADMKELAPSFVQLLQLNKQGAPASFKFFGETIERSRYKNMTELNKATFINQSITGLYETQRRLV |
336 | APG02998 crRNA重複序列 | GuuuuAGAGCuAuGC |
337 | APG02998 tracrRNA | GCAuAGCAAGuuAAAAuAAGGCuuAGuCCGuAAACAAACuuuGGCACuGuAuuCGGuGCuuuuuuu |
338 | APG06251 | MYSIGLDLGISSVGWSVIDEETGKIVDLGIRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVSAYADELATILKTQQALYPNELTDDWIALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPTQKEFILTELMTKEFARFGVNDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAESGIDLATLPTETIDCLAKVLTLNTEREGVENTLAFELPELAEPVKLLVLDRYKELSQSVSTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKADVRKRYSDYKKLPTKEVLTEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESCPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAIDASLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGNKLRKFNTDILGKKHHLSYEKEPKNIIK |
339 | APG03066 | MYSIGLDLGISSVGWSVIDEETGKIVDLGIRLFSAKNSDNNEGRRSKRGSRRLKRRRIHRLERVKLLLTEYDLINKEQIPTVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVSAYADELATILKTQQALYPNELTDDWIALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLNNLIIDGEVSLSPTQKEFILTELMTKEFARFGVNDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAESGIDLATLPTETIDCLAKVLTLNTEREGVENTLAFELPELAEPVKLLVLDRYKELSQSVSTQAWHRLSLKCIHLINEELIKSTSEQNTLLEQFQLKADVRKRYSDYKKLPTKEVLTEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEVDHIIPRSISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESCPFSRKKVNNLLETRNIFDSEQVQKFLSRNLVDTRYATRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHRVDKKPNRQLINDTLYSTRMKDEVKTLKSGKEKITTDEYTIGKITDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGNKLRKFTTDVLGKKHHLSYEKEPKNIIK |
340 | APG01560 | MYSIGLDLGISSVGWSVIDEETGKIVDLGARLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVSAYADELATILKTQQALYPNELTDDWIALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPDQKEFILTELMTKEFARFGVNDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEVGIDLATLPTETIDCLAKVLTLNTEREGVENTLAFELPELAEPVKTLVLDRYKELSQSLSTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAAVRKRYSDYKKLPTKEVLVEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESKPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGRKLRKFNTDILGKKHHLSYEKEPKNIIK |
341 | APG02777 | MYSIGLDLGISSVGWSVIDEETGKIVDLGARLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKATAYADEIASLIKSQQAIYPNEISDDWLALFAQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPDQKEFLISEIMSKEFARFGANDLAKIIGAKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEVGLDIASIPSESLDCIAKVLTLNTEREGAENSIAFEIPEIAEPAKTIAIDRYKEITQTLSTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAAVRKRYSDYKKLPTKEVLVEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESKPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGRKLRKFNTDILGKKHHLSYEKEPKNIIK |
342 | APG05761 | MYSIGLDLGISSVGWSVIDEETGKIVDLGVRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKASAYADELATLLKTQQALYPNEITDDWLALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPEQKEFLLTELMTKEFARFGVNDIAKLLGAKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEAGIDIASLPTETLDCLAKVLTLNTEREGVENSLAFELPELAEPVKSLVLDHYKELSQSISTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAGVRKRYSDYKKLPTKEVLAEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESRPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGKKLRKFNTDILGKKHHLSYEKEPKNIIK |
343 | APG02479 | MYSIGLDLGISSVGWSVIDEETGKIVDLGVRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVTAYADELATILKTQQAIYPNEITDDWIAIFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPEQKEFILTELMTKEFARFGANDIAKILGAKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEAGIDIATLPTETIDCLAKVLTLNTEREGAENTLAFELPELAEPAKTLVLDHYKELTQSISTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAGVRKRYSDYKKLPTKEVLAEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESRPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGKKLRKFNTDILGKKHHLSYEKEPKNIIK |
344 | APG08385 | MYSIGLDLGISSVGWSVIDEETGKIVDLGVRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVSAYADELASILKTQQALYPNEITDDWIAIFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPEQKEFIITELMTKEFARFGVNDLAKILGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEAGLDLATIPSETLDCLAKVLTLNTEREGAENTLAFELPELAEPVKTLVLDHYKELSQSISTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAGVRKRYSDYKKLPTKEVLAEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESRPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGKKLRKFNTDILGKKHHLSYEKEPKNIIK |
345 | APG09217 | MYSIGLDLGISSVGWSVIDEETGKIVDLGVRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVTAYADEIASILKTQQAIYPNEITDDWIALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPEQKEFIISELMTKEFARFGVNDLAKIIGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEAGIDLATLPSETLDCLAKVLTLNTEREGAENTLAFELPELAEPVKSLVLDHYKELSQTISTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAGVRKRYSDYKKLPTKEVLAEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESRPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGKKLRKFNTDILGKKHHLSYEKEPKNIIK |
346 | APG06657 | MYSIGLDLGISSVGWSVIDEETGKIVDLGVRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKASAYADEIASLLKTQQAIYPNELTDDWLALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPEQKEFIISELMTKEFARFGANDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEAGLDLATLPTETIDCLAKVLTLNTEREGAENSLAFELPELAEPVKSLALDHYKELTQSISTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAGVRKRYSDYKKLPTKEVLAEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESRPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGKKLRKFNTDILGKKHHLSYEKEPKNIIK |
347 | APG05586 | MYSIGLDLGISSVGWSVIDEETGKIVDLGVRLFSAKNSEKNLERRTSRGARRLIRRKTNRLKDAKKLLEAIGFYEDKALKNVCPYQLRVKGLTEGLTKGELYKVVLHIVKKRGISYLDEDDAEAAKESQDYKEQVRKNAQLLTKYTPGQIQLQRLKENNRVKTGINGQGHYQLNVFKVSAYADELATILKTQQALYPNELTDDWIALFVQPGIAENAGLIYRKRPYYHGPGNEANNSPYGRWSDFQKTGQPAANIFDKLIGKDFQGELRASGLSLSAQQYNLLNDLTNLKIDGEVSLSPEQKEFILTELMTKEFARFGVNDIAKLLGVKKEQLSGWRLDKKGKPEIHTLKGYRNWRKIFAEAGIDLATLPTETIDCLAKVLTLNTEREGVENTLAFELPELAEPVKSLVLDHYKELSQSISTQAWHRFSLKTLHLLIPELIKSTSEQNTLLEQFQLKAGVRKRYSDYKKLPTKEVLAEIYNPTVNKTVSQAFKVMDALLEKYGKDQIHYITVEMPRDDNEEEERKRIKELQTKNSQRKNDSQQYFLQKSGWSQEKFQATIHKNRRFLAKLLYYFEQDGVCAYTGNPISPELLVSDSTEIDHIIPISISLDDSINNKVLVLSHANQVKGQQTPYDARMAGAFNKINGKFSNWDEYQKWVESRPFSRKKVNNLLETRNIFDSEQVQKFLSRNLNDTRYASRLVLNTLQSFFENQDTIVRVVNGSFTHTLRKKWGADLDKTRETHHHHAVDATLCAVTPFVKVSRYHYAVNEETGEKFMREIDVETGEILDEIPYREYKKAKHYERKTYQVKWSNFREQLKPITIHPKIKFSHQVDRKANRKLSDATIYSVREKTEVKTLKSGKEKITTDEYTIGKIKDIYTVDGWEAFKKKQDKLLMKEFDEKTYELLVTIAATTPDFQEVEEKNGKVKRVKRSPFAVYCEENGIPAIRKYAKKNNGPVIRSLKYYDGKLNKHINITKDEKGRPVEQTKNGRKVTLQSLKPYRYDIYQDLETKAYYTVQLYYSDLRFVEGEYGITEKEYMKKVAEQTKGQVVRFCFSLQKNDGLEIEWKDSQRYDVRFYNFQSANSINFKGLEQEMIPAENQFKQKPYNNGAINLNIAKYGKEGKKLRKFNTDILGKKHHLSYEKEPKNIIK |
348 | NC_041760啟動子 | AGCTCCACGGCAAGAGAATTCAAAGCCGCGGGCCTGGGTTCCACGCGGGGCCCCTTACCCAAGGTGCCCCGGGCGCTCATTTGCATGTCCCACCCAACAGGTAAACCTGACAGGTCAGTCGCGGCCGGGTACGGCCTGGCGGTCAGAGCACCAAACGTACGAGCCTTGTGATGCGGTTCCATTGCATGAAATTCTCCTAAAGGCCCCAAGATGAACGGGAAAGCGCGCGGTTCGCTCACCGTAACTAAAACAGGTGAGAGACTCCCGTGCCTTATAAGGCCTGTGGACGGAGGCAGTTGC |
349 | NW_004848155啟動子 | TGTTCTCCGAACAGTACTTGTAATATACAGGTTCCCCGATCCACCACCGTCTGCGGGTGGCGGTACAGCCTCTCCCAGTGTGCTTTGCGCTCATTTGCATAGAGCACGGCACCGAACGCAGCCACTGTCCCCCGCGTCCGCTGTCCCCCGTGCAGGCCAAACCCGGGCGCGGCCCCGCCGACGGTGGGTACAGAGAGTGGTCGGCTCGGCACCGGCTGCTGCGCGGCACCGGCACTCACCCTGTCCTTATGGAGCCCTAACTCCATGGCTATAAATATCTAAGGGGAGGAAGGGTAGATC |
350 | LR738627啟動子 | AGCGCTCCGCGGAGACTTCTGGGACGCGGCGGCTCCGACTCCGCCCCGCTTCCGGCTTATTTGCATACAGCAATTCCTAGCAGGCCCTGTGCTGAATTTAGTCGGAAAACTACCATGTTCAGTCGAAAAAGCAAATACTTTTGTCAGATATGGCCAAAAACTTCACTTGACTTAGCCGTGTTTCATGTAAAGCATTAAAAGGATGGAGTGATTGTTCAAATTTCATAAGAAGAATTCACCTTCAGTTTAAGGTGGTTCGCTTTCTGCACTTCAAATACCGCGGTGGACAGACCCTGTTTC |
351 | NC_044556啟動子 | GCCTGAGTCGCGCCGCCGCCTCCCAAAGACTTCTGGGAAGGCGGTGCGGCTCAGGCTCCGCCCCGCTTCCGGGGATATTTGCATACGAGCATTCCCAGTAATTCCCAGCAGCCACTGTAGCTATATTTGGTAGAATAACGAGCACTTTCTGAACTCCAGTTAATAACTGCGTTAGTTGCGTTACACATTGGACTAAAACAAATAGAAGTTGAATCTCTAGAGCAGTGGAGATAAGTCGCCGTATGTGTACAGAAATTGCTTCCGGGGGCTATAAATAGCTGGTAGTGGGGCTAGAACGTC |
352 | XM_030845548啟動子 | CGCCCGCGCAGCGCAGCCGCTTCCCAGAGACTTCTGGGACGGCAGCGGCTGCGGCTCCGCCCCTCTTCCAGTATAATTTGCATGCGACCATGGATTCCCAGCAGCCACCTGAGTCATATTTGGTGGAACAAAAACCACTTTCTCAATTTCAGTGAATGACCCCATTTGGTTAAGGTATTGTTGCACAAATATCATAAAAGAAGGGACGAATGGCTGAACCGGTTTTTAATGGAGTTCGCCCTTAGCGTAAAAGAGTTTATTCTATGCCCTCTAAATAGTTCTGGGATCAACCGTACTACT |
353 | Mini NC_041760啟動子 | CCCCTTACCCAAGGTGCCCCGGGCGCTCATTTGCATGTCCCACCGCTCACCGTAACTAAAACAGGTGAGAGACTCCCGTGCCTTATAAGGCCTGTGGACGGAGGCAGTTGC |
354 | Mini NW_004848155啟動子 | ACAGCCTCTCCCAGTGTGCTTTGCGCTCATTTGCATAGAGCACGACTCACCCTGTCCTTATGGAGCCCTAACTCCATGGCTATAAATATCTAAGGGGAGGAAGGGTAGATC |
355 | Mini LR738627啟動子 | GGCTCCGACTCCGCCCCGCTTCCGGCTTATTTGCATACAGCAATATTCACCTTCAGTTTAAGGTGGTTCGCTTTCTGCACTTCAAATACCGCGGTGGACAGACCCTGTTTC |
356 | Mini NC_044556啟動子 | GCTCAGGCTCCGCCCCGCTTCCGGGGATATTTGCATACGAGCATAGTCGCCGTATGTGTACAGAAATTGCTTCCGGGGGCTATAAATAGCTGGTAGTGGGGCTAGAACGTC |
357 | Mini XM_030845548啟動子 | GCTGCGGCTCCGCCCCTCTTCCAGTATAATTTGCATGCGACCATGTTCGCCCTTAGCGTAAAAGAGTTTATTCTATGCCCTCTAAATAGTTCTGGGATCAACCGTACTACT |
Claims (151)
- 一種多肽,包括從由以下者組成的群組選出的一胺基酸序列: a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的一胺基酸序列;以及 b)對SEQ ID NO:4或6具有至少95%序列一致性的一胺基酸序列; 其中該多肽具有去胺酶活性。
- 如請求項1所述的多肽,包括對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性的一胺基酸序列。
- 一種核酸分子,包括編碼一去胺酶多肽的一多核苷酸,其中該去胺酶由從由以下者組成的群組選出的一核苷酸序列編碼: a)對SEQ ID NO:114-119中的任一者具有至少80%序列一致性的一核苷酸序列; b)對SEQ ID NO:109、111及113中的任一者具有至少95%序列一致性的一核苷酸序列; c)編碼對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的一胺基酸序列的一核苷酸序列;以及 d)編碼對SEQ ID NO:4或6具有至少95%序列一致性的一胺基酸序列的一核苷酸序列。
- 如請求項3所述的核酸分子,其中該去胺酶由對SEQ ID NO:114-119中的任一者具有至少90%序列一致性的核苷酸序列編碼。
- 如請求項3所述的核酸分子,其中該去胺酶由對SEQ ID NO:109、111及113-119中的任一者具有100%序列一致性的一核苷酸序列編碼。
- 如請求項3所述的核酸分子,其中該去胺酶多肽具有對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性的一胺基酸序列。
- 如請求項3至請求項6中任一項所述的核酸分子,其中該核酸分子進一步包括可操作地連結至該多核苷酸的一異源啟動子。
- 一種載體,包括如請求項3至請求項7中任一項所述的核酸分子。
- 一種細胞,包括如請求項3至請求項7中任一項所述的核酸分子或如請求項8所述的載體。
- 一種醫藥組成物,包括一藥學上可接受的載體以及如請求項1或請求項2所述的多肽、如請求項3至請求項7中任一項所述的核酸分子、如請求項8所述的載體或如請求項9所述的細胞。
- 一種用於製造一去胺酶的方法,包括:在該去胺酶被表現的條件下,培養如請求項9所述的細胞。
- 一種用於製造一去胺酶的方法,包括將如請求項3至請求項7中任一項所述的核酸分子或如請求項8所述的載體引入一細胞中以及在該去胺酶被表現的條件下培養該細胞。
- 如請求項11或請求項12所述的方法,進一步包括純化該去胺酶。
- 一種融合蛋白,包括一DNA結合多肽以及具有從由以下者組成的群組選出的一胺基酸序列的一去胺酶: a)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的一胺基酸序列;以及 b)對SEQ ID NO:4或6具有至少95%序列一致性的一胺基酸序列。
- 如請求項14所述的方法,其中該去胺酶對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性。
- 如請求項14或請求項16所述的方法,其中該去胺酶為一胞嘧啶去胺酶。
- 如請求項14至請求項15中任一項所述的融合蛋白,其中該DNA結合多肽為一大範圍核酸酶、一鋅指融合蛋白或一TALEN;或一大範圍核酸酶、一鋅指融合蛋白或一TALEN的一變異體,其中該核酸酶活性已被降低或抑制。
- 如請求項14至請求項16中任一項所述的融合蛋白,其中該DNA結合多肽為一RNA引導的DNA結合多肽。
- 如請求項18所述的融合蛋白,其中該RNA引導的DNA結合多肽為一RNA引導的核酸酶(RGN)多肽。
- 如請求項19所述的融合蛋白,其中該RGN為一II型或V型CRISPR-Cas多肽。
- 如請求項19或請求項20所述的融合蛋白,其中該RGN為一RGN切口酶。
- 如請求項21所述的融合蛋白,其中該RGN切口酶具有一不活化RuvC域。
- 如請求項19或請求項20所述的融合蛋白,其中該RGN為一核酸酶不活化的RGN。
- 如請求項19所述的融合蛋白,其中該RGN具有對表1中的該RGN序列中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項19所述的融合蛋白,其中該RGN具有表1中的該RGN序列中的任一者的一胺基酸序列。
- 如請求項19所述的融合蛋白,其中該RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項19所述的融合蛋白,其中該RGN具有SEQ ID NO:74、82、87、106及107中的任一者的一胺基酸序列。
- 如請求項21所述的融合蛋白,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項21所述的融合蛋白,其中該RGN切口酶具有一胺基酸序列,該胺基酸序列具有SEQ ID NO:75及88-98中的任一者。
- 如請求項14至請求項29中任一項所述的融合蛋白,其中該融合蛋白進一步包括至少一個核定位訊號(NLS)。
- 如請求項14至請求項30中任一項所述的融合蛋白,其中該融合蛋白進一步包括一尿嘧啶穩定蛋白(USP)。
- 如請求項31所述的融合蛋白,其中該USP具有如SEQ ID NO:81所示的該序列。
- 如請求項14所述的融合蛋白,其中該融合蛋白具有SEQ ID NO:67、68、146及147中的任一者的一胺基酸序列。
- 一種核酸分子,包括編碼一融合蛋白的一多核苷酸,該融合蛋白包括一DNA結合多肽及一去胺酶,其中該去胺酶由從由以下者組成的群組選出的一核苷酸序列編碼: a)對SEQ ID NO:114-119中的任一者具有至少80%序列一致性的一核苷酸序列; b)對SEQ ID NO:109、111及113中的任一者具有至少95%序列一致性的一核苷酸序列; c)編碼對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的一胺基酸序列的一核苷酸序列;以及 d)編碼對SEQ ID NO:4或6具有至少95%序列一致性的一胺基酸序列的一核苷酸序列。
- 如請求項34所述的核酸分子,其中該去胺酶由對SEQ ID NO:114-119中的任一者具有至少90%序列一致性的一核苷酸序列編碼。
- 如請求項34所述的核酸分子,其中該去胺酶核苷酸序列對SEQ ID NO:109、111及113-119中的任一者具有100%序列一致性。
- 如請求項34所述的核酸分子,其中該去胺酶核苷酸序列編碼對SEQ ID NO:2、4及6-12中的任一者具有100%序列一致性的一胺基酸序列。
- 如請求項34至請求項37中任一項所述的核酸分子,其中該去胺酶為一胞嘧啶去胺酶。
- 如請求項34至請求項38中任一項所述的核酸分子,其中該DNA結合多肽為一大範圍核酸酶、一鋅指融合蛋白或一TALEN;或一大範圍核酸酶、一鋅指融合蛋白或一TALEN的一變異體,其中該核酸酶活性已被降低或抑制。
- 如請求項34至請求項38中任一項所述的核酸分子,其中該DNA結合多肽為一RNA引導的DNA結合多肽。
- 如請求項40所述的核酸分子,其中該RNA引導的DNA結合多肽為一RNA引導的核酸酶(RGN)多肽。
- 如請求項41所述的核酸分子,其中該RGN為一II型或V型CRISPR-Cas多肽。
- 如請求項41或請求項42所述的核酸分子,其中該RGN為一RGN切口酶。
- 如請求項43所述的核酸分子,其中該RGN切口酶具有一不活化的RuvC域。
- 如請求項41或請求項42所述的核酸分子,其中該RGN為一核酸酶不活化的RGN。
- 如請求項41所述的核酸分子,其中該RGN具有對表1中的該RGN序列中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項41所述的核酸分子,其中該RGN具有表1中的該RGN序列中的任一者的一胺基酸序列。
- 如請求項41所述的核酸分子,其中該RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項41所述的核酸分子,其中該RGN具有SEQ ID NO:74、82、87、106及107中的任一者的一胺基酸序列。
- 如請求項43所述的核酸分子,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項43所述的核酸分子,其中該RGN切口酶具有一胺基酸序列,該胺基酸序列具有SEQ ID NO:75及88-98中的任一者。
- 如請求項34至請求項51中任一項所述的核酸分子,其中編碼該融合蛋白的該多核苷酸於其5'端處可操作地連結至一啟動子。
- 如請求項34至請求項52中任一項所述的核酸分子,其中編碼該融合蛋白的該多核苷酸於其3'端處可操作地連結至一終止子。
- 如請求項34至請求項53中任一項所述的核酸分子,其中該融合蛋白包括一或多個核定位訊號。
- 如請求項34至請求項54中任一項所述的核酸分子,其中該融合蛋白針對於一真核細胞中的表現而被密碼子最佳化。
- 如請求項34至請求項55中任一項所述的核酸分子,其中該融合蛋白針對於一原核細胞中的表現而被密碼子最佳化。
- 如請求項34至請求項56中任一項所述的核酸分子,其中該融合蛋白進一步包括一尿嘧啶穩定蛋白(USP)。
- 如請求項57所述的核酸分子,其中該USP具有如SEQ ID NO:81所示的該序列。
- 如請求項34所述的核酸分子,其中該融合蛋白具有SEQ ID NO:67、68、146及147中的任一者所示的一胺基酸序列。
- 一種載體,包括如請求項34至請求項59中任一項所述的核酸分子。
- 如請求項60所述的載體,進一步包括編碼能夠與一標的序列雜合的一引導RNA(gRNA)的至少一個核苷酸序列。
- 一種包括如請求項14至請求項33中任一項所述的融合蛋白的細胞。
- 如請求項62所述的細胞,其中該細胞進一步包括一引導RNA。
- 一種包括如請求項34至請求項59中任一項所述的核酸分子的細胞。
- 一種包括如請求項60或請求項61所述的載體的細胞。
- 一種醫藥組成物,包括一藥學上可接受的載體以及如請求項14至請求項33中任一項所述的融合蛋白、如請求項34至請求項59中任一項所述的核酸分子、如請求項60或請求項61所述的載體、或如請求項62至請求項65中任一項所述的細胞。
- 一種用於製造一融合蛋白的方法,包括:在該融合蛋白被表現的條件下,培養如請求項62至請求項65中任一項所述的細胞。
- 一種用於製造一融合蛋白的方法,包括將如請求項34至請求項59中任一項所述的核酸分子或如請求項60或請求項61所述的載體引入一細胞中、以及在該融合蛋白被表現的條件下培養該細胞。
- 如請求項67或請求項68所述的方法,進一步包括純化該融合蛋白。
- 一種用於製造一RGN融合核糖核蛋白複合物的方法,包括將如請求項34至請求項59中任一項所述的核酸分子及包括編碼一引導RNA的一表現卡匣的一核酸分子、或如請求項60或請求項61所述的載體引入一細胞中;以及在該融合蛋白及該gRNA被表現且形成一RGN融合核糖核蛋白複合物的條件下,培養該細胞。
- 如請求項70所述的方法,進一步包括純化該RGN融合核糖核蛋白複合物。
- 一種用於修飾包括一標的DNA序列的一標的DNA分子的系統,該系統包括: a)一融合蛋白或編碼該融合蛋白的一核酸序列,其中該融合蛋白包括一RNA引導的核酸酶多肽(RGN)以及一去胺酶,其中該去胺酶具有從由以下者組成的群組選出的一胺基酸序列: i)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的一胺基酸序列;以及 ii)對SEQ ID NO:4或6具有至少95%序列一致性的一胺基酸序列;以及 b)能夠與該標的DNA序列雜合的一或多個引導RNA、或編碼該一或多個引導RNA(gRNA)的一或多個核苷酸序列;以及 其中該一或多個引導RNA能夠與該融合蛋白形成一複合物,以引導該融合蛋白與該標的DNA序列結合及修飾該標的DNA分子。
- 如請求項72所述的系統,其中該去胺酶具有對SEQ ID NO:2、4及6-12中的至少一者具有100%序列一致性的一胺基酸序列。
- 如請求項72或請求項73所述的系統,其中編碼該一或多個引導RNA的該核苷酸序列和編碼該融合蛋白的該核苷酸序列中的至少一者可操作地連結至一啟動子。
- 如請求項72至請求項74中任一項所述的系統,其中該標的DNA序列被定位為與由該RGN辨識的一前間隔序列鄰近模體(PAM)相鄰。
- 如請求項72至請求項75中任一項所述的系統,其中該標的DNA分子在一細胞內。
- 如請求項72至請求項76中任一項所述的系統,其中該融合蛋白的該RGN為一II型或V型CRISPR-Cas多肽。
- 如請求項72至請求項76中任一項所述的系統,其中該融合蛋白的該RGN具有對表1中的該RGN序列中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項72至請求項76中任一項所述的系統,其中該融合蛋白的該RGN具有表1中的該RGN序列中的任一者的一胺基酸序列。
- 如請求項72至請求項76中任一項所述的系統,其中該融合蛋白的該RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項72至請求項76中任一項所述的系統,其中該融合蛋白的RGN具有SEQ ID NO:74、82、87、106及107中的任一者的一胺基酸序列。
- 如請求項72至請求項76中任一項所述的系統,其中該融合蛋白的RGN為一RGN切口酶。
- 如請求項82所述的系統,其中該RGN切口酶具有一不活化的RuvC域。
- 如請求項82或請求項83所述的系統,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項82或請求項83所述的系統,其中該RGN切口酶為SEQ ID NO:75及88-98中的任一者。
- 如請求項72至請求項76中任一項所述的系統,其中該融合蛋白的RGN為一核酸酶不活化的RGN。
- 如請求項72至請求項86中任一項所述的系統,其中該融合蛋白包括一或多個核定位訊號。
- 如請求項72至請求項87中任一項所述的系統,其中該融合蛋白進一步包括一尿嘧啶穩定蛋白(USP)。
- 如請求項88所述的系統,其中該USP具有如SEQ ID NO:81所示的該序列。
- 如請求項72所述的系統,其中該融合蛋白具有如SEQ ID NO:67、68、146及147中的任一者所示的一胺基酸序列。
- 如請求項72至請求項90中任一項所述的系統,其中該融合蛋白針對於一真核細胞中的表現而被密碼子最佳化。
- 如請求項72至請求項91中任一項所述的系統,其中編碼該一或多個引導RNA的核苷酸序列及編碼一融合蛋白的該核苷酸序列被定位於一個載體上。
- 一種核糖核蛋白複合物,包括如請求項72至請求項92中任一項所述的系統的該至少一個引導RNA和該融合蛋白。
- 一種細胞,包括如請求項72至請求項92中任一項所述的系統或如請求項93所述的核糖核蛋白複合物。
- 一種醫藥組成物,包括一藥學上可接受的載體及如請求項72至請求項92中任一項所述的系統、如請求項93所述的核糖核蛋白複合物、或如請求項94所述的細胞。
- 一種用於修飾包括一標的DNA序列的一標的DNA分子的方法,該方法包括將如請求項72至請求項92中任一項所述的一系統或如請求項93所述的一核糖核蛋白複合物遞送至該標的DNA分子或包括該標的DNA分子的一細胞。
- 如請求項96所述的系統,其中該經修飾的標的DNA分子包括該標的DNA分子內的至少一個核苷酸的一C>N突變,其中N為A、G或T。
- 如請求項96所述的系統,其中該經修飾的標的DNA分子包括該標的DNA分子內的至少一個核苷酸的一C>T突變。
- 如請求項97所述的系統,其中該經修飾的標的DNA分子包括該標的DNA分子內的至少一個核苷酸的一C> G突變。
- 一種用於修飾包括一標的序列的一標的DNA分子的方法,該方法包括: a)在適合形成一RGN去胺酶核糖核苷酸複合物的條件下,藉由結合以下者以在體外組裝該RGN去胺酶核糖核苷酸複合物: i)能夠與該標的DNA序列雜合的一或多個引導RNA;以及 ii)包括一RNA引導的核酸酶多肽(RGN)及至少一個去胺酶的一融合蛋白,其中該去胺酶具有從由以下者組成的群組選出的一胺基酸序列: I)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的一胺基酸序列;以及 II)對SEQ ID NO:4或6具有至少95%序列一致性的一胺基酸序列;以及 b)使該標的DNA分子或包括該標的DNA分子的一細胞與在體外組裝的RGN去胺酶核糖核苷酸複合物接觸; 其中該一或多個引導RNA與該標的DNA序列雜合,從而引導該融合蛋白與該標的DNA序列結合,且發生該標的DNA分子的修飾。
- 如請求項100所述的方法,其中該去胺酶具有對SEQ ID NO:2、4及6-12中的至少一者具有100%序列一致性的一胺基酸序列。
- 如請求項100或請求項101所述的方法,其中該經修飾的標的DNA分子包括該標的DNA分子內的至少一個核苷酸的一C>N突變,其中N為A、G或T。
- 如請求項102所述的方法,其中該經修飾的標的DNA分子包括該標的DNA分子內的至少一個核苷酸的一C>T突變。
- 如請求項102所述的方法,其中該經修飾的標的DNA分子包括該標的DNA分子內的至少一個核苷酸的一C> G突變。
- 如請求項100至請求項104中任一項所述的方法,其中該融合蛋白的該RGN為一II型或V型CRISPR-Cas多肽。
- 如請求項100至請求項104中任一項所述的方法,其中該融合蛋白的該RGN具有對表1中的該RGN序列中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項100至請求項104中任一項所述的方法,其中該融合蛋白的該RGN具有表1中的該RGN序列中的任一者的一胺基酸序列。
- 如請求項100至請求項104中任一項所述的方法,其中該融合蛋白的該RGN具有對SEQ ID NO:74、82、87、106及107中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項100至請求項104中任一項所述的方法,其中該融合蛋白的RGN具有SEQ ID NO:74、82、87、106及107中的任一者的一胺基酸序列。
- 如請求項100至請求項104中任一項所述的方法,其中該融合蛋白的該RGN為一RGN切口酶。
- 如請求項110所述的方法,其中該RGN切口酶具有一不活化的RuvC域。
- 如請求項110或請求項111所述的方法,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項110或請求項111所述的方法,其中該RGN切口酶為SEQ ID NO:75及88-98中的任一者。
- 如請求項100至請求項104中任一項所述的方法,其中該融合蛋白的該RGN為一核酸酶不活化的RGN。
- 如請求項100至請求項114中任一項所述的方法,其中該融合蛋白包括一或多個核定位訊號。
- 如請求項100至請求項115中任一項所述的方法,其中該融合蛋白進一步包括一尿嘧啶穩定蛋白(USP)。
- 如請求項116所述的方法,其中該USP具有如SEQ ID NO:81所示的該序列。
- 如請求項100所述的方法,其中該融合蛋白具有如SEQ ID NO:67、68、146及147中的任一者所示的一胺基酸序列。
- 如請求項100至請求項118中任一項所述的方法,其中該標的DNA序列被定位為與一前間隔序列鄰近模體(PAM)相鄰。
- 如請求項100至請求項119中任一項所述的方法,其中該標的DNA分子在一細胞內。
- 如請求項120所述的方法,進一步包括選擇包括該經修飾的DNA分子的一細胞。
- 一種細胞,包括如請求項121所述方法的一經修飾的標的DNA序列。
- 一種醫藥組成物,包括如請求項122所述的細胞以及一藥學上可接受的載體。
- 一種用於以針對一基因遺傳性疾病的一因果突變中的一更正產生一經基因修飾的細胞的方法,該方法包括將以下者引入該細胞中: a)一融合蛋白或編碼該融合蛋白的一多核苷酸,其中該融合蛋白包括一RNA引導的核酸酶多肽(RGN)及一去胺酶,其中該去胺酶具有從由以下者組成的群組選出的一胺基酸序列: i)對SEQ ID NO:2及7-12中的任一者具有至少90%序列一致性的一胺基酸序列;以及 ii)對SEQ ID NO:4或6具有至少95%序列一致性的一胺基酸序列;以及 b)能夠與一標的DNA序列雜合的一或多個引導RNA(gRNA)或編碼該gRNA的一多核苷酸, 藉以,該融合蛋白及gRNA靶向該因果突變的基因體位置以及修飾該基因體序列以去除該因果突變。
- 如請求項124所述的方法,其中該去胺酶具有對SEQ ID NO:2、4及6-12具有100%序列一致性的一胺基酸序列。
- 如請求項124或請求項125所述的方法,其中該融合蛋白的該RGN為一II型或V型CRISPR-Cas多肽。
- 如請求項124至請求項126中任一項所述的方法,其中該融合蛋白的該RGN具有對表1中的該RGN序列中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項124至請求項126中任一項所述的方法,其中該融合蛋白的該RGN具有表1中的該RGN序列中的任一者的一胺基酸序列。
- 如請求項124至請求項126中任一項所述的方法,其中該融合蛋白的該RGN為一RGN切口酶。
- 如請求項129所述的方法,其中該RGN切口酶具有一不活化的RuvC域。
- 如請求項129或請求項130所述的方法,其中該RGN切口酶具有對SEQ ID NO:75及88-98中的任一者具有至少90%序列一致性的一胺基酸序列。
- 如請求項129或請求項130所述的方法,其中該RGN切口酶為SEQ ID NO:75及88-98中的任一者。
- 如請求項124至請求項126中任一項所述的方法,其中該融合蛋白的該RGN為一核酸酶不活化的RGN。
- 如請求項124至請求項133中任一項所述的方法,其中該融合蛋白包括一或多個核定位訊號。
- 如請求項124至請求項134中任一項所述的方法,其中該融合蛋白進一步包括一尿嘧啶穩定蛋白(USP)。
- 如請求項135所述的方法,其中該USP具有如SEQ ID NO:81所示的該序列。
- 如請求項124所述的方法,其中該融合蛋白具有SEQ ID NO:67、68、146及147中的任一者所示的一胺基酸序列。
- 如請求項124至請求項137中任一項所述的方法,其中該基因體修飾包括將至少一個核苷酸的一C>T突變引入該標的DNA序列內。
- 如請求項124至請求項137中任一項所述的方法,其中該基因體修飾包括將至少一個核苷酸的一C>G突變引入該標的DNA序列內。
- 如請求項124至請求項139中任一項所述的方法,其中該細胞為一動物細胞。
- 如請求項124至請求項140中任一項所述的方法,其中該因果突變的該更正包括更正一無意義突變。
- 如請求項124至請求項140中任一項所述的方法,其中該基因遺傳性疾病為表23中列出的一疾病。
- 一種用於治療一疾病的方法,該方法包括對需要治療的一個體投予如請求項14至請求項33中任一項所述的融合蛋白、如請求項34至請求項59中任一項所述的核酸分子、如請求項60或請求項61所述的載體、如請求項62至請求項65、請求項94及請求項122所述的細胞、如請求項72至請求項92中任一項所述的系統、如請求項93所述的核糖核蛋白複合物、或如請求項66、請求項95及請求項123中任一項所述的醫藥組成物。
- 如請求項143所述的方法,其中該疾病與一因果突變關聯,以及該醫藥組成物更正該因果突變。
- 如請求項143或請求項144所述的方法,其中該疾病為表23中列出的一疾病。
- 一種如請求項14至請求項33中任一項所述的融合蛋白、如請求項34至請求項59中任一項所述的核酸分子、如請求項60或請求項61所述的載體、如請求項62至請求項65、請求項94及請求項122中任一項所述的細胞、如請求項72至請求項92中任一項所述的系統、或如請求項93所述的核糖核蛋白複合物用於治療一個體的一疾病的用途。
- 如請求項146所述的用途,其中該疾病與一因果突變關聯,以及該治療包括更正該因果突變。
- 如請求項146或請求項147所述的用途,其中該疾病為表23中列出的一疾病。
- 一種如請求項14至請求項33中任一項所述的融合蛋白、如請求項34至請求項59中任一項所述的核酸分子、如請求項60或請求項61所述的載體、如請求項62至請求項65、請求項94及請求項122中任一項所述的細胞、如請求項72至請求項92中任一項所述的系統、或如請求項93所述的核糖核蛋白複合物用於製造有用於治療一疾病的一藥物的用途。
- 如請求項149所述的用途,其中該疾病與一因果突變關聯,以及一有效量的該藥物更正該因果突變。
- 如請求項149或請求項150所述的用途,其中該疾病為表23中列出的一疾病。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163164273P | 2021-03-22 | 2021-03-22 | |
US63/164,273 | 2021-03-22 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW202300649A true TW202300649A (zh) | 2023-01-01 |
Family
ID=81307870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW111110606A TW202300649A (zh) | 2021-03-22 | 2022-03-22 | Dna修飾酶及活性片段及其變體及使用方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20240301385A1 (zh) |
EP (1) | EP4314266A1 (zh) |
JP (1) | JP2024511131A (zh) |
CN (1) | CN117295817A (zh) |
AR (1) | AR125191A1 (zh) |
AU (1) | AU2022242754A1 (zh) |
CA (1) | CA3173950A1 (zh) |
TW (1) | TW202300649A (zh) |
WO (1) | WO2022204093A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024042489A1 (en) | 2022-08-25 | 2024-02-29 | LifeEDIT Therapeutics, Inc. | Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing |
WO2024095245A2 (en) | 2022-11-04 | 2024-05-10 | LifeEDIT Therapeutics, Inc. | Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use |
WO2024178397A2 (en) | 2023-02-24 | 2024-08-29 | Elevatebio Technologies, Inc. | Modified immune effector cells and methods of use |
Family Cites Families (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4217344A (en) | 1976-06-23 | 1980-08-12 | L'oreal | Compositions containing aqueous dispersions of lipid spheres |
US4196265A (en) | 1977-06-15 | 1980-04-01 | The Wistar Institute | Method of producing antibodies |
US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
US4186183A (en) | 1978-03-29 | 1980-01-29 | The United States Of America As Represented By The Secretary Of The Army | Liposome carriers in chemotherapy of leishmaniasis |
US4261975A (en) | 1979-09-19 | 1981-04-14 | Merck & Co., Inc. | Viral liposome particle |
US4485054A (en) | 1982-10-04 | 1984-11-27 | Lipoderm Pharmaceuticals Limited | Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV) |
US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
US5569597A (en) | 1985-05-13 | 1996-10-29 | Ciba Geigy Corp. | Methods of inserting viral DNA into plant material |
US4774085A (en) | 1985-07-09 | 1988-09-27 | 501 Board of Regents, Univ. of Texas | Pharmaceutical administration systems containing a mixture of immunomodulators |
US4853331A (en) | 1985-08-16 | 1989-08-01 | Mycogen Corporation | Cloning and expression of Bacillus thuringiensis toxin gene toxic to beetles of the order Coleoptera |
US5268463A (en) | 1986-11-11 | 1993-12-07 | Jefferson Richard A | Plant promoter α-glucuronidase gene construct |
US5608142A (en) | 1986-12-03 | 1997-03-04 | Agracetus, Inc. | Insecticidal cotton plants |
US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
US5039523A (en) | 1988-10-27 | 1991-08-13 | Mycogen Corporation | Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin |
KR920701453A (ko) | 1989-03-17 | 1992-08-11 | 미리엄 디. 멕코나헤이 | 유전자발현의 외부조절 |
ES2187497T3 (es) | 1990-04-12 | 2003-06-16 | Syngenta Participations Ag | Promotores preferentemente en tejidos. |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
WO1991017424A1 (en) | 1990-05-03 | 1991-11-14 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
US5498830A (en) | 1990-06-18 | 1996-03-12 | Monsanto Company | Decreased oil content in plant seeds |
CA2051562C (en) | 1990-10-12 | 2003-12-02 | Jewel M. Payne | Bacillus thuringiensis isolates active against dipteran pests |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
US5399680A (en) | 1991-05-22 | 1995-03-21 | The Salk Institute For Biological Studies | Rice chitinase promoter |
DE69230290T2 (de) | 1991-08-27 | 2000-07-20 | Novartis Ag, Basel | Proteine mit insektiziden eigenschaften gegen homopteran insekten und ihre verwendung im pflanzenschutz |
TW261517B (zh) | 1991-11-29 | 1995-11-01 | Mitsubishi Shozi Kk | |
US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
US5814618A (en) | 1993-06-14 | 1998-09-29 | Basf Aktiengesellschaft | Methods for regulating gene expression |
US5789156A (en) | 1993-06-14 | 1998-08-04 | Basf Ag | Tetracycline-regulated transcriptional inhibitors |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US5608144A (en) | 1994-08-12 | 1997-03-04 | Dna Plant Technology Corp. | Plant group 2 promoters and uses thereof |
US5659026A (en) | 1995-03-24 | 1997-08-19 | Pioneer Hi-Bred International | ALS3 promoter |
US6072050A (en) | 1996-06-11 | 2000-06-06 | Pioneer Hi-Bred International, Inc. | Synthetic promoters |
EP1056864B1 (en) | 1998-02-26 | 2004-10-06 | Pioneer Hi-Bred International, Inc. | Constitutive maize promoters |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
CZ20013894A3 (cs) | 1999-05-04 | 2002-04-17 | Monsanto Technology Llc | Polypeptidové kompozice toxické pro hmyz z řádu Coleoptera a transgenní rostliny rezistentní proti hmyzu |
AU7491600A (en) | 1999-09-15 | 2001-04-17 | Monsanto Technology Llc | Lepidopteran-active bacillus thuringiensis delta-endotoxin compositions and methods of use |
US20050183161A1 (en) | 2003-10-14 | 2005-08-18 | Athenix Corporation | AXMI-010, a delta-endotoxin gene and methods for its use |
WO2005066202A2 (en) | 2003-12-22 | 2005-07-21 | E.I. Du Pont De Nemours And Company | Bacillus cry9 family members |
BRPI0713646B1 (pt) | 2006-06-14 | 2017-11-21 | Athenix Corporation | Nucleic acid molecule; vector; hospedeira cell; polipeptídeo with pesticide activity and method for their production; composition; method for obtaining a plant, as well as methods for control of pest populations; to exterminate a plague of lepidópteros or coleópteros; to protect a plant of a nematode prague |
CN102648281B (zh) | 2009-07-02 | 2017-04-05 | 阿森尼克斯公司 | Axmi‑205杀虫基因和它的使用方法 |
US8586832B2 (en) | 2009-12-21 | 2013-11-19 | Pioneer Hi Bred International Inc | Bacillus thuringiensis gene with Lepidopteran activity |
CA2807375A1 (en) | 2010-08-19 | 2012-02-23 | Pioneer Hi-Bred International, Inc. | Novel bacillus thuringiensis gene with lepidopteran activity |
US9405700B2 (en) | 2010-11-04 | 2016-08-02 | Sonics, Inc. | Methods and apparatus for virtualization in an integrated circuit |
DK2800811T3 (en) | 2012-05-25 | 2017-07-17 | Univ Vienna | METHODS AND COMPOSITIONS FOR RNA DIRECTIVE TARGET DNA MODIFICATION AND FOR RNA DIRECTIVE MODULATION OF TRANSCRIPTION |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
US10450584B2 (en) | 2014-08-28 | 2019-10-22 | North Carolina State University | Cas9 proteins and guiding features for DNA targeting and genome editing |
CA2978314A1 (en) | 2015-03-03 | 2016-09-09 | The General Hospital Corporation | Engineered crispr-cas9 nucleases with altered pam specificity |
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
CN111163799A (zh) | 2017-07-28 | 2020-05-15 | 扬森疫苗与预防公司 | 用于异源repRNA免疫接种的方法和组合物 |
EP3802807A1 (en) | 2018-06-05 | 2021-04-14 | Lifeedit, Inc. | Rna-guided nucleases and active fragments and variants thereof and methods of use |
BR112021012665A2 (pt) | 2018-12-27 | 2021-11-03 | Lifeedit Therapeutics Inc | Polipeptídeos úteis para edição de genes e métodos de uso |
EP4004563B1 (en) | 2019-07-29 | 2024-02-28 | Waters Technologies Corporation | Method of loading samples into a sample manager of a chromatography system |
US20220364074A1 (en) | 2019-08-12 | 2022-11-17 | LifeEDIT Therapeutics, Inc. | Rna-guided nucleases and active fragments and variants thereof and methods of use |
TW202208626A (zh) | 2020-04-24 | 2022-03-01 | 美商生命編輯公司 | Rna引導核酸酶及其活性片段與變體,以及使用方法 |
JP2023534693A (ja) * | 2020-07-15 | 2023-08-10 | ライフエディット セラピューティクス,インコーポレイティド | ウラシル安定化タンパク質並びにその活性断片及びバリアント並びに使用方法 |
-
2022
- 2022-03-22 US US18/551,749 patent/US20240301385A1/en active Pending
- 2022-03-22 WO PCT/US2022/021271 patent/WO2022204093A1/en active Application Filing
- 2022-03-22 EP EP22716628.7A patent/EP4314266A1/en active Pending
- 2022-03-22 JP JP2023558569A patent/JP2024511131A/ja active Pending
- 2022-03-22 CA CA3173950A patent/CA3173950A1/en active Pending
- 2022-03-22 TW TW111110606A patent/TW202300649A/zh unknown
- 2022-03-22 CN CN202280031917.0A patent/CN117295817A/zh active Pending
- 2022-03-22 AU AU2022242754A patent/AU2022242754A1/en active Pending
- 2022-03-22 AR ARP220100668A patent/AR125191A1/es unknown
Also Published As
Publication number | Publication date |
---|---|
CA3173950A1 (en) | 2022-09-22 |
AU2022242754A1 (en) | 2023-11-02 |
CN117295817A (zh) | 2023-12-26 |
AR125191A1 (es) | 2023-06-21 |
AU2022242754A9 (en) | 2023-11-16 |
JP2024511131A (ja) | 2024-03-12 |
US20240301385A1 (en) | 2024-09-12 |
WO2022204093A1 (en) | 2022-09-29 |
EP4314266A1 (en) | 2024-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3902911B1 (en) | Polypeptides useful for gene editing and methods of use | |
US20220002756A1 (en) | Rna-guided nucleases and active fragments and variants thereof and methods of use | |
US11981940B2 (en) | DNA modifying enzymes and active fragments and variants thereof and methods of use | |
TW202120688A (zh) | Rna導引之核酸酶及其活性片段及變體以及使用方法 | |
KR20230049100A (ko) | 우라실 안정화 단백질 및 그의 활성 단편 및 변이체 및 사용 방법 | |
TW202300649A (zh) | Dna修飾酶及活性片段及其變體及使用方法 | |
TW202208626A (zh) | Rna引導核酸酶及其活性片段與變體,以及使用方法 | |
TW202346583A (zh) | Rna引導核酸酶、其活性片段與變體,及使用方法 | |
CA3125175A1 (en) | Polypeptides useful for gene editing and methods of use | |
CN116635524A (zh) | Dna修饰酶及其活性片段及变体与使用方法 | |
WO2024095245A2 (en) | Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use |