JP2021523736A - プログラム可能塩基エディターシステムを用いて病原性変異を抑制する方法 - Google Patents
プログラム可能塩基エディターシステムを用いて病原性変異を抑制する方法 Download PDFInfo
- Publication number
- JP2021523736A JP2021523736A JP2021513762A JP2021513762A JP2021523736A JP 2021523736 A JP2021523736 A JP 2021523736A JP 2021513762 A JP2021513762 A JP 2021513762A JP 2021513762 A JP2021513762 A JP 2021513762A JP 2021523736 A JP2021523736 A JP 2021523736A
- Authority
- JP
- Japan
- Prior art keywords
- polynucleotide
- domain
- protein
- cas9
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000035772 mutation Effects 0.000 title claims description 155
- 230000001717 pathogenic effect Effects 0.000 title description 13
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 336
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 335
- 239000002157 polynucleotide Substances 0.000 claims abstract description 334
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 199
- 239000002773 nucleotide Substances 0.000 claims abstract description 195
- 238000000034 method Methods 0.000 claims abstract description 174
- 230000027455 binding Effects 0.000 claims abstract description 129
- 108091033409 CRISPR Proteins 0.000 claims description 362
- 108090000623 proteins and genes Proteins 0.000 claims description 242
- 150000007523 nucleic acids Chemical group 0.000 claims description 209
- 102000004169 proteins and genes Human genes 0.000 claims description 192
- 235000018102 proteins Nutrition 0.000 claims description 188
- 108020005004 Guide RNA Proteins 0.000 claims description 174
- 102000053602 DNA Human genes 0.000 claims description 169
- 108020004414 DNA Proteins 0.000 claims description 169
- 102000039446 nucleic acids Human genes 0.000 claims description 160
- 108020004707 nucleic acids Proteins 0.000 claims description 160
- 235000001014 amino acid Nutrition 0.000 claims description 126
- 210000004027 cell Anatomy 0.000 claims description 116
- 150000001413 amino acids Chemical group 0.000 claims description 112
- 229920002477 rna polymer Polymers 0.000 claims description 99
- 229940024606 amino acid Drugs 0.000 claims description 96
- 101710163270 Nuclease Proteins 0.000 claims description 91
- 102100022712 Alpha-1-antitrypsin Human genes 0.000 claims description 89
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 62
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 54
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 claims description 51
- 230000000295 complement effect Effects 0.000 claims description 51
- 230000000694 effects Effects 0.000 claims description 44
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical group O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 42
- 238000006467 substitution reaction Methods 0.000 claims description 42
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 41
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 41
- 230000004568 DNA-binding Effects 0.000 claims description 39
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 36
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 36
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 36
- 230000004048 modification Effects 0.000 claims description 36
- 238000012986 modification Methods 0.000 claims description 36
- 108091079001 CRISPR RNA Proteins 0.000 claims description 31
- 201000010099 disease Diseases 0.000 claims description 29
- 208000026350 Inborn Genetic disease Diseases 0.000 claims description 28
- 238000006481 deamination reaction Methods 0.000 claims description 27
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 claims description 26
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 claims description 26
- 208000016361 genetic disease Diseases 0.000 claims description 26
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 25
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 24
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 24
- 108010050122 alpha 1-Antitrypsin Proteins 0.000 claims description 24
- 230000009615 deamination Effects 0.000 claims description 24
- 230000014509 gene expression Effects 0.000 claims description 23
- 210000003494 hepatocyte Anatomy 0.000 claims description 21
- 230000008859 change Effects 0.000 claims description 20
- 210000000056 organ Anatomy 0.000 claims description 20
- 210000001519 tissue Anatomy 0.000 claims description 20
- 210000000130 stem cell Anatomy 0.000 claims description 18
- 230000008685 targeting Effects 0.000 claims description 18
- 108010054147 Hemoglobins Proteins 0.000 claims description 16
- 102000001554 Hemoglobins Human genes 0.000 claims description 16
- 241000282414 Homo sapiens Species 0.000 claims description 15
- 230000007812 deficiency Effects 0.000 claims description 15
- 230000001965 increasing effect Effects 0.000 claims description 15
- 229930024421 Adenine Natural products 0.000 claims description 14
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 14
- 229960000643 adenine Drugs 0.000 claims description 14
- 229940024142 alpha 1-antitrypsin Drugs 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 102220493413 Endothelin receptor type B_M374I_mutation Human genes 0.000 claims description 13
- 230000002440 hepatic effect Effects 0.000 claims description 13
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 11
- 239000004472 Lysine Substances 0.000 claims description 11
- 230000001976 improved effect Effects 0.000 claims description 11
- 102000002735 Acyl-CoA Dehydrogenase Human genes 0.000 claims description 10
- 108010001058 Acyl-CoA Dehydrogenase Proteins 0.000 claims description 10
- 230000003993 interaction Effects 0.000 claims description 10
- 108700026244 Open Reading Frames Proteins 0.000 claims description 8
- 210000005260 human cell Anatomy 0.000 claims description 8
- 210000004962 mammalian cell Anatomy 0.000 claims description 8
- 208000011580 syndromic disease Diseases 0.000 claims description 8
- 108091032955 Bacterial small RNA Proteins 0.000 claims description 7
- 229930182817 methionine Natural products 0.000 claims description 7
- 208000007056 sickle cell anemia Diseases 0.000 claims description 7
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 6
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 6
- 229960000310 isoleucine Drugs 0.000 claims description 6
- 208000000094 Chronic Pain Diseases 0.000 claims description 5
- 201000003883 Cystic fibrosis Diseases 0.000 claims description 5
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 5
- 206010053185 Glycogen storage disease type II Diseases 0.000 claims description 5
- 101150013707 HBB gene Proteins 0.000 claims description 5
- 208000018565 Hemochromatosis Diseases 0.000 claims description 5
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 claims description 5
- 102000004882 Lipase Human genes 0.000 claims description 5
- 108090001060 Lipase Proteins 0.000 claims description 5
- 241000124008 Mammalia Species 0.000 claims description 5
- 208000002193 Pain Diseases 0.000 claims description 5
- 201000011252 Phenylketonuria Diseases 0.000 claims description 5
- 201000007737 Retinal degeneration Diseases 0.000 claims description 5
- 235000013922 glutamic acid Nutrition 0.000 claims description 5
- 239000004220 glutamic acid Substances 0.000 claims description 5
- 201000004502 glycogen storage disease II Diseases 0.000 claims description 5
- 238000001727 in vivo Methods 0.000 claims description 5
- 208000015872 Gaucher disease Diseases 0.000 claims description 4
- 210000004263 induced pluripotent stem cell Anatomy 0.000 claims description 4
- 210000003712 lysosome Anatomy 0.000 claims description 4
- 230000001868 lysosomic effect Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 201000010275 acute porphyria Diseases 0.000 claims description 3
- 208000033552 hepatic porphyria Diseases 0.000 claims description 3
- 238000006116 polymerization reaction Methods 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 230000005945 translocation Effects 0.000 claims description 3
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 claims description 2
- 101150116759 HBA2 gene Proteins 0.000 claims description 2
- 101150052743 Hba1 gene Proteins 0.000 claims description 2
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 claims description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 claims description 2
- 230000004075 alteration Effects 0.000 claims description 2
- 230000000536 complexating effect Effects 0.000 claims description 2
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 2
- 230000001939 inductive effect Effects 0.000 claims description 2
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 claims description 2
- 210000003463 organelle Anatomy 0.000 claims description 2
- 102200106861 rs121909375 Human genes 0.000 claims description 2
- 102220340766 rs1555191832 Human genes 0.000 claims description 2
- 102220005330 rs34956202 Human genes 0.000 claims description 2
- 102200144543 rs397515439 Human genes 0.000 claims description 2
- 102220230246 rs397516434 Human genes 0.000 claims description 2
- 102220076034 rs545955828 Human genes 0.000 claims description 2
- 102200102137 rs78396650 Human genes 0.000 claims description 2
- 102220095417 rs876659755 Human genes 0.000 claims description 2
- 102220098824 rs878853363 Human genes 0.000 claims description 2
- 102100026846 Cytidine deaminase Human genes 0.000 claims 21
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 claims 4
- 230000000735 allogeneic effect Effects 0.000 claims 2
- 102220578707 Caspase recruitment domain-containing protein 16_F51L_mutation Human genes 0.000 claims 1
- 102220470576 Protein ripply1_E22G_mutation Human genes 0.000 claims 1
- 102220370480 c.209C>T Human genes 0.000 claims 1
- 230000006872 improvement Effects 0.000 claims 1
- 102000054765 polymorphisms of proteins Human genes 0.000 claims 1
- 102220196096 rs1057518583 Human genes 0.000 claims 1
- 102200135700 rs137852531 Human genes 0.000 claims 1
- 102220271762 rs146066553 Human genes 0.000 claims 1
- 102220013271 rs200529550 Human genes 0.000 claims 1
- 102220081735 rs201715603 Human genes 0.000 claims 1
- 102200016993 rs35198096 Human genes 0.000 claims 1
- 102220005363 rs63749997 Human genes 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 13
- 125000003275 alpha amino acid group Chemical group 0.000 description 116
- 108090000765 processed proteins & peptides Proteins 0.000 description 83
- 102000004196 processed proteins & peptides Human genes 0.000 description 70
- 229920001184 polypeptide Polymers 0.000 description 68
- 230000033590 base-excision repair Effects 0.000 description 36
- 239000012634 fragment Substances 0.000 description 34
- 102000005381 Cytidine Deaminase Human genes 0.000 description 33
- 239000003112 inhibitor Substances 0.000 description 32
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 26
- 108020001507 fusion proteins Proteins 0.000 description 25
- 102000037865 fusion proteins Human genes 0.000 description 25
- 230000007018 DNA scission Effects 0.000 description 24
- 102000004533 Endonucleases Human genes 0.000 description 24
- 108010042407 Endonucleases Proteins 0.000 description 24
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 23
- 238000003776 cleavage reaction Methods 0.000 description 23
- 230000007017 scission Effects 0.000 description 23
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 22
- 102000004190 Enzymes Human genes 0.000 description 21
- 108090000790 Enzymes Proteins 0.000 description 21
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 21
- 230000002829 reductive effect Effects 0.000 description 20
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 19
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 18
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 18
- 230000000670 limiting effect Effects 0.000 description 18
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 17
- 230000037430 deletion Effects 0.000 description 17
- 238000012217 deletion Methods 0.000 description 17
- 230000005782 double-strand break Effects 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- 108020001580 protein domains Proteins 0.000 description 17
- 230000008439 repair process Effects 0.000 description 17
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 16
- 230000037431 insertion Effects 0.000 description 16
- 238000003780 insertion Methods 0.000 description 16
- 230000006780 non-homologous end joining Effects 0.000 description 15
- 108020004422 Riboswitch Proteins 0.000 description 14
- 238000010362 genome editing Methods 0.000 description 14
- -1 small molecule compound Chemical class 0.000 description 14
- 102220613830 Casein kinase II subunit alpha 3_D1255A_mutation Human genes 0.000 description 13
- 102220613440 Casein kinase II subunit alpha 3_D917A_mutation Human genes 0.000 description 13
- 102220613443 Casein kinase II subunit alpha 3_E1006A_mutation Human genes 0.000 description 13
- 229930010555 Inosine Natural products 0.000 description 13
- 229960003786 inosine Drugs 0.000 description 13
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 12
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 12
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 12
- 230000003197 catalytic effect Effects 0.000 description 12
- 238000009396 hybridization Methods 0.000 description 12
- 239000002777 nucleoside Substances 0.000 description 12
- 125000006850 spacer group Chemical group 0.000 description 12
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 12
- 101710096438 DNA-binding protein Proteins 0.000 description 11
- 239000012636 effector Substances 0.000 description 11
- 230000030648 nucleus localization Effects 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- 239000011780 sodium chloride Substances 0.000 description 11
- 239000001509 sodium citrate Substances 0.000 description 11
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 11
- 229940038773 trisodium citrate Drugs 0.000 description 11
- 239000013598 vector Substances 0.000 description 11
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 10
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 10
- 241000700159 Rattus Species 0.000 description 10
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 10
- 229960005305 adenosine Drugs 0.000 description 10
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 238000011144 upstream manufacturing Methods 0.000 description 10
- 229940035893 uracil Drugs 0.000 description 10
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 9
- 229940104302 cytosine Drugs 0.000 description 9
- 230000001404 mediated effect Effects 0.000 description 9
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 9
- 241000283690 Bos taurus Species 0.000 description 8
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 8
- 108010017842 Telomerase Proteins 0.000 description 8
- 238000002347 injection Methods 0.000 description 8
- 239000007924 injection Substances 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 239000000758 substrate Substances 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 7
- 108010080611 Cytosine Deaminase Proteins 0.000 description 7
- 102000000311 Cytosine Deaminase Human genes 0.000 description 7
- 235000004279 alanine Nutrition 0.000 description 7
- 229960002685 biotin Drugs 0.000 description 7
- 239000011616 biotin Substances 0.000 description 7
- 208000035475 disorder Diseases 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 238000000338 in vitro Methods 0.000 description 7
- 210000004072 lung Anatomy 0.000 description 7
- 150000003833 nucleoside derivatives Chemical class 0.000 description 7
- 108700028369 Alleles Proteins 0.000 description 6
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 6
- 241000282412 Homo Species 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 239000004698 Polyethylene Substances 0.000 description 6
- 108700008625 Reporter Genes Proteins 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 6
- 235000020958 biotin Nutrition 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 230000003301 hydrolyzing effect Effects 0.000 description 6
- 239000003446 ligand Substances 0.000 description 6
- 102000026415 nucleotide binding proteins Human genes 0.000 description 6
- 108091014756 nucleotide binding proteins Proteins 0.000 description 6
- 230000009437 off-target effect Effects 0.000 description 6
- 230000037361 pathway Effects 0.000 description 6
- 229940113082 thymine Drugs 0.000 description 6
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 6
- 229940045145 uridine Drugs 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 5
- 241000282472 Canis lupus familiaris Species 0.000 description 5
- 108700004991 Cas12a Proteins 0.000 description 5
- 108060002716 Exonuclease Proteins 0.000 description 5
- 206010019851 Hepatotoxicity Diseases 0.000 description 5
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 5
- 230000004570 RNA-binding Effects 0.000 description 5
- 108020004511 Recombinant DNA Proteins 0.000 description 5
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 5
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 5
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 5
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 5
- 210000004899 c-terminal region Anatomy 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 230000007711 cytoplasmic localization Effects 0.000 description 5
- 102000013165 exonuclease Human genes 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 231100000304 hepatotoxicity Toxicity 0.000 description 5
- 230000007686 hepatotoxicity Effects 0.000 description 5
- 230000005764 inhibitory process Effects 0.000 description 5
- 210000004185 liver Anatomy 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- 230000025308 nuclear transport Effects 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 239000001226 triphosphate Substances 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- 102000002797 APOBEC-3G Deaminase Human genes 0.000 description 4
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 4
- 108010052875 Adenine deaminase Proteins 0.000 description 4
- 108091023037 Aptamer Proteins 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 4
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 4
- 241000282693 Cercopithecidae Species 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 241000702189 Escherichia virus Mu Species 0.000 description 4
- 108700024394 Exon Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 241000282575 Gorilla Species 0.000 description 4
- 102000029812 HNH nuclease Human genes 0.000 description 4
- 108060003760 HNH nuclease Proteins 0.000 description 4
- 101000964382 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3D Proteins 0.000 description 4
- 102000015335 Ku Autoantigen Human genes 0.000 description 4
- 108010025026 Ku Autoantigen Proteins 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- 239000004367 Lipase Substances 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- 241000251745 Petromyzon marinus Species 0.000 description 4
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 4
- 101150069374 Serpina1 gene Proteins 0.000 description 4
- 241000191967 Staphylococcus aureus Species 0.000 description 4
- 241000194020 Streptococcus thermophilus Species 0.000 description 4
- 230000002378 acidificating effect Effects 0.000 description 4
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 235000003704 aspartic acid Nutrition 0.000 description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000009977 dual effect Effects 0.000 description 4
- 230000009881 electrostatic interaction Effects 0.000 description 4
- 235000019421 lipase Nutrition 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- 230000002685 pulmonary effect Effects 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 125000002652 ribonucleotide group Chemical group 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 235000011178 triphosphate Nutrition 0.000 description 4
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 3
- WOXWUZCRWJWTRT-UHFFFAOYSA-N 1-amino-1-cyclohexanecarboxylic acid Chemical compound OC(=O)C1(N)CCCCC1 WOXWUZCRWJWTRT-UHFFFAOYSA-N 0.000 description 3
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 3
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 3
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 3
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 3
- 102100040264 DNA dC->dU-editing enzyme APOBEC-3D Human genes 0.000 description 3
- 238000010442 DNA editing Methods 0.000 description 3
- 230000033616 DNA repair Effects 0.000 description 3
- 208000037595 EN1-related dorsoventral syndrome Diseases 0.000 description 3
- 241000283086 Equidae Species 0.000 description 3
- 101000637245 Escherichia coli (strain K12) Endonuclease V Proteins 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 3
- 241000589601 Francisella Species 0.000 description 3
- 101150106478 GPS1 gene Proteins 0.000 description 3
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 3
- 101000964385 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3B Proteins 0.000 description 3
- 101000964377 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3F Proteins 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 3
- 241000282560 Macaca mulatta Species 0.000 description 3
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 3
- 108010067372 Pancreatic elastase Proteins 0.000 description 3
- 102000016387 Pancreatic elastase Human genes 0.000 description 3
- 241000605861 Prevotella Species 0.000 description 3
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 3
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 3
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 3
- 102000006382 Ribonucleases Human genes 0.000 description 3
- 108010083644 Ribonucleases Proteins 0.000 description 3
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 3
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 239000004473 Threonine Substances 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 210000005006 adaptive immune system Anatomy 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 3
- 235000009582 asparagine Nutrition 0.000 description 3
- 229960001230 asparagine Drugs 0.000 description 3
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 101150055766 cat gene Proteins 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 239000013078 crystal Substances 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 210000002257 embryonic structure Anatomy 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 3
- 235000004554 glutamine Nutrition 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 230000000813 microbial effect Effects 0.000 description 3
- 230000007170 pathology Effects 0.000 description 3
- 150000004713 phosphodiesters Chemical group 0.000 description 3
- 229920002401 polyacrylamide Polymers 0.000 description 3
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008263 repair mechanism Effects 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 230000003007 single stranded DNA break Effects 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 229940104230 thymidine Drugs 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 2
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 2
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- PECYZEOJVXMISF-UHFFFAOYSA-N 3-aminoalanine Chemical compound [NH3+]CC(N)C([O-])=O PECYZEOJVXMISF-UHFFFAOYSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 description 2
- 241000193412 Alicyclobacillus acidoterrestris Species 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000616876 Belliella baltica Species 0.000 description 2
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Chemical compound CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 2
- 102100040399 C->U-editing enzyme APOBEC-2 Human genes 0.000 description 2
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 2
- 241000589875 Campylobacter jejuni Species 0.000 description 2
- 241000186216 Corynebacterium Species 0.000 description 2
- 241000918600 Corynebacterium ulcerans Species 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- 101710180243 Cytidine deaminase 1 Proteins 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 2
- 102100040262 DNA dC->dU-editing enzyme APOBEC-3B Human genes 0.000 description 2
- 102100040266 DNA dC->dU-editing enzyme APOBEC-3F Human genes 0.000 description 2
- 101710082737 DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 2
- 102100038050 DNA dC->dU-editing enzyme APOBEC-3H Human genes 0.000 description 2
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 102000016942 Elastin Human genes 0.000 description 2
- 108010014258 Elastin Proteins 0.000 description 2
- 101710191360 Eosinophil cationic protein Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 108050008753 HNH endonucleases Proteins 0.000 description 2
- 102000000310 HNH endonucleases Human genes 0.000 description 2
- 101000964322 Homo sapiens C->U-editing enzyme APOBEC-2 Proteins 0.000 description 2
- 101000964383 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3C Proteins 0.000 description 2
- 101000598921 Homo sapiens Orexin Proteins 0.000 description 2
- 101000800426 Homo sapiens Putative C->U-editing enzyme APOBEC-4 Proteins 0.000 description 2
- 101000755690 Homo sapiens Single-stranded DNA cytosine deaminase Proteins 0.000 description 2
- 108010015268 Integration Host Factors Proteins 0.000 description 2
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 2
- 108010028275 Leukocyte Elastase Proteins 0.000 description 2
- 102000016799 Leukocyte elastase Human genes 0.000 description 2
- 241000186805 Listeria innocua Species 0.000 description 2
- 208000024556 Mendelian disease Diseases 0.000 description 2
- 241000588650 Neisseria meningitidis Species 0.000 description 2
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 2
- 241000282579 Pan Species 0.000 description 2
- 241000282577 Pan troglodytes Species 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 241001135221 Prevotella intermedia Species 0.000 description 2
- 101150044917 Prl3b1 gene Proteins 0.000 description 2
- 101150113550 Prl3d1 gene Proteins 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 102100033091 Putative C->U-editing enzyme APOBEC-4 Human genes 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 2
- 102100036007 Ribonuclease 3 Human genes 0.000 description 2
- 101710192197 Ribonuclease 3 Proteins 0.000 description 2
- 102000003661 Ribonuclease III Human genes 0.000 description 2
- 108010057163 Ribonuclease III Proteins 0.000 description 2
- 230000018199 S phase Effects 0.000 description 2
- MEFKEPWMEQBLKI-AIRLBKTGSA-N S-adenosyl-L-methioninate Chemical compound O[C@@H]1[C@H](O)[C@@H](C[S+](CC[C@H](N)C([O-])=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 MEFKEPWMEQBLKI-AIRLBKTGSA-N 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 241001606419 Spiroplasma syrphidicola Species 0.000 description 2
- 241000203029 Spiroplasma taiwanense Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000194056 Streptococcus iniae Species 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 241000167564 Sulfolobus islandicus Species 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 2
- 208000014769 Usher Syndromes Diseases 0.000 description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 230000010933 acylation Effects 0.000 description 2
- 238000005917 acylation reaction Methods 0.000 description 2
- 229960001570 ademetionine Drugs 0.000 description 2
- 230000002411 adverse Effects 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 125000003636 chemical group Chemical group 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000004087 circulation Effects 0.000 description 2
- 230000007882 cirrhosis Effects 0.000 description 2
- 208000019425 cirrhosis of liver Diseases 0.000 description 2
- 101150037603 cst-1 gene Proteins 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- 230000003292 diminished effect Effects 0.000 description 2
- 206010013023 diphtheria Diseases 0.000 description 2
- 229920002549 elastin Polymers 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- FVTCRASFADXXNN-SCRDCRAPSA-N flavin mononucleotide Chemical compound OP(=O)(O)OC[C@@H](O)[C@@H](O)[C@@H](O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-SCRDCRAPSA-N 0.000 description 2
- 229940013640 flavin mononucleotide Drugs 0.000 description 2
- FVTCRASFADXXNN-UHFFFAOYSA-N flavin mononucleotide Natural products OP(=O)(O)OCC(O)C(O)C(O)CN1C=2C=C(C)C(C)=CC=2N=C2C1=NC(=O)NC2=O FVTCRASFADXXNN-UHFFFAOYSA-N 0.000 description 2
- 239000011768 flavin mononucleotide Substances 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 102000046390 human APOBEC1 Human genes 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 239000013600 plasmid vector Substances 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 235000019231 riboflavin-5'-phosphate Nutrition 0.000 description 2
- 102220094365 rs776407427 Human genes 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000005783 single-strand break Effects 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- ZFXYFBGIUFBOJW-UHFFFAOYSA-N theophylline Chemical compound O=C1N(C)C(=O)N(C)C2=C1NC=N2 ZFXYFBGIUFBOJW-UHFFFAOYSA-N 0.000 description 2
- 229960002363 thiamine pyrophosphate Drugs 0.000 description 2
- 235000008170 thiamine pyrophosphate Nutrition 0.000 description 2
- 239000011678 thiamine pyrophosphate Substances 0.000 description 2
- YXVCLPJQTZXJLH-UHFFFAOYSA-N thiamine(1+) diphosphate chloride Chemical compound [Cl-].CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N YXVCLPJQTZXJLH-UHFFFAOYSA-N 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- 229940075420 xanthine Drugs 0.000 description 2
- 239000011701 zinc Substances 0.000 description 2
- 229910052725 zinc Inorganic materials 0.000 description 2
- OCLLVJCYGMCLJG-CYBMUJFWSA-N (2r)-2-azaniumyl-2-naphthalen-1-ylpropanoate Chemical compound C1=CC=C2C([C@@](N)(C(O)=O)C)=CC=CC2=C1 OCLLVJCYGMCLJG-CYBMUJFWSA-N 0.000 description 1
- QFQYGJMNIDGZSG-YFKPBYRVSA-N (2r)-3-(acetamidomethylsulfanyl)-2-azaniumylpropanoate Chemical compound CC(=O)NCSC[C@H]([NH3+])C([O-])=O QFQYGJMNIDGZSG-YFKPBYRVSA-N 0.000 description 1
- ZDTFMPXQUSBYRL-FTWQFJAYSA-N (2r,3r,4r,5r)-2-(2,6-diaminopurin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@H](O)[C@H]1O ZDTFMPXQUSBYRL-FTWQFJAYSA-N 0.000 description 1
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 description 1
- BFNDLDRNJFLIKE-ROLXFIACSA-N (2s)-2,6-diamino-6-hydroxyhexanoic acid Chemical compound NC(O)CCC[C@H](N)C(O)=O BFNDLDRNJFLIKE-ROLXFIACSA-N 0.000 description 1
- BVAUMRCGVHUWOZ-ZETCQYMHSA-N (2s)-2-(cyclohexylazaniumyl)propanoate Chemical compound OC(=O)[C@H](C)NC1CCCCC1 BVAUMRCGVHUWOZ-ZETCQYMHSA-N 0.000 description 1
- DWKNTLVYZNGBTJ-IBGZPJMESA-N (2s)-2-amino-6-(dibenzylamino)hexanoic acid Chemical compound C=1C=CC=CC=1CN(CCCC[C@H](N)C(O)=O)CC1=CC=CC=C1 DWKNTLVYZNGBTJ-IBGZPJMESA-N 0.000 description 1
- WAMWSIDTKSNDCU-ZETCQYMHSA-N (2s)-2-azaniumyl-2-cyclohexylacetate Chemical compound OC(=O)[C@@H](N)C1CCCCC1 WAMWSIDTKSNDCU-ZETCQYMHSA-N 0.000 description 1
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical compound C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 description 1
- MSTNYGQPCMXVAQ-RYUDHWBXSA-N (6S)-5,6,7,8-tetrahydrofolic acid Chemical compound C([C@H]1CNC=2N=C(NC(=O)C=2N1)N)NC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 MSTNYGQPCMXVAQ-RYUDHWBXSA-N 0.000 description 1
- UKAUYVFTDYCKQA-UHFFFAOYSA-N -2-Amino-4-hydroxybutanoic acid Natural products OC(=O)C(N)CCO UKAUYVFTDYCKQA-UHFFFAOYSA-N 0.000 description 1
- BWKMGYQJPOAASG-UHFFFAOYSA-N 1,2,3,4-tetrahydroisoquinoline-3-carboxylic acid Chemical compound C1=CC=C2CNC(C(=O)O)CC2=C1 BWKMGYQJPOAASG-UHFFFAOYSA-N 0.000 description 1
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- PISWNSOQFZRVJK-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 PISWNSOQFZRVJK-XLPZGREQSA-N 0.000 description 1
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- KNQHBAFIWGORKW-UHFFFAOYSA-N 2,3-diamino-3-oxopropanoic acid Chemical compound NC(=O)C(N)C(O)=O KNQHBAFIWGORKW-UHFFFAOYSA-N 0.000 description 1
- VHVGNTVUSQUXPS-UHFFFAOYSA-N 2-amino-3-hydroxy-3-phenylpropanoic acid Chemical compound OC(=O)C(N)C(O)C1=CC=CC=C1 VHVGNTVUSQUXPS-UHFFFAOYSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- JINGUCXQUOKWKH-UHFFFAOYSA-N 2-aminodecanoic acid Chemical compound CCCCCCCCC(N)C(O)=O JINGUCXQUOKWKH-UHFFFAOYSA-N 0.000 description 1
- YXDGRBPZVQPESQ-QMMMGPOBSA-N 4-[(2s)-2-amino-2-carboxyethyl]benzoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=C(C(O)=O)C=C1 YXDGRBPZVQPESQ-QMMMGPOBSA-N 0.000 description 1
- WCKQPPQRFNHPRJ-UHFFFAOYSA-N 4-[[4-(dimethylamino)phenyl]diazenyl]benzoic acid Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=C(C(O)=O)C=C1 WCKQPPQRFNHPRJ-UHFFFAOYSA-N 0.000 description 1
- XXSIICQLPUAUDF-TURQNECASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidin-2-one Chemical compound O=C1N=C(N)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XXSIICQLPUAUDF-TURQNECASA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- CMUHFUGDYMFHEI-QMMMGPOBSA-N 4-amino-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(N)C=C1 CMUHFUGDYMFHEI-QMMMGPOBSA-N 0.000 description 1
- GTVVZTAFGPQSPC-UHFFFAOYSA-N 4-nitrophenylalanine Chemical compound OC(=O)C(N)CC1=CC=C([N+]([O-])=O)C=C1 GTVVZTAFGPQSPC-UHFFFAOYSA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- ODHCTXKNWHHXJC-VKHMYHEASA-N 5-oxo-L-proline Chemical compound OC(=O)[C@@H]1CCC(=O)N1 ODHCTXKNWHHXJC-VKHMYHEASA-N 0.000 description 1
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 1
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 description 1
- UEHOMUNTZPIBIL-UUOKFMHZSA-N 6-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7h-purin-8-one Chemical compound O=C1NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UEHOMUNTZPIBIL-UUOKFMHZSA-N 0.000 description 1
- HWRFTOWHSBECMR-UHFFFAOYSA-N 6-n-[(4-aminophenyl)methyl]-2-n-[[3-(trifluoromethyl)phenyl]methyl]-7h-purine-2,6-diamine Chemical class C1=CC(N)=CC=C1CNC1=NC(NCC=2C=C(C=CC=2)C(F)(F)F)=NC2=C1NC=N2 HWRFTOWHSBECMR-UHFFFAOYSA-N 0.000 description 1
- UBKVUFQGVWHZIR-UHFFFAOYSA-N 8-oxoguanine Chemical compound O=C1NC(N)=NC2=NC(=O)N=C21 UBKVUFQGVWHZIR-UHFFFAOYSA-N 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 239000012099 Alexa Fluor family Substances 0.000 description 1
- 101000860094 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) CRISPR-associated endonuclease Cas12b Proteins 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 101710081722 Antitrypsin Proteins 0.000 description 1
- 101100123845 Aphanizomenon flos-aquae (strain 2012/KM1/D3) hepT gene Proteins 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 101100412103 Arabidopsis thaliana REC3 gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 241000825009 Bacillus hisashii Species 0.000 description 1
- 241001037049 Bacillus sp. V3-13 Species 0.000 description 1
- 101000755699 Bos taurus Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 102220607926 C-reactive protein_H20Y_mutation Human genes 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 101100452003 Caenorhabditis elegans ape-1 gene Proteins 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 101000755689 Canis lupus familiaris Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000010804 Caulobacter vibrioides Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 206010057248 Cell death Diseases 0.000 description 1
- 241000867607 Chlorocebus sabaeus Species 0.000 description 1
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 102100040261 DNA dC->dU-editing enzyme APOBEC-3C Human genes 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241001135761 Deltaproteobacteria Species 0.000 description 1
- 108700034637 EC 3.2.-.- Proteins 0.000 description 1
- NIGWMJHCCYYCSF-UHFFFAOYSA-N Fenclonine Chemical compound OC(=O)C(N)CC1=CC=C(Cl)C=C1 NIGWMJHCCYYCSF-UHFFFAOYSA-N 0.000 description 1
- 206010016654 Fibrosis Diseases 0.000 description 1
- 230000010190 G1 phase Effects 0.000 description 1
- 230000010337 G2 phase Effects 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 206010018464 Glycogen storage disease type I Diseases 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 101000964330 Homo sapiens C->U-editing enzyme APOBEC-1 Proteins 0.000 description 1
- 101000742736 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3G Proteins 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- ZGUNAGUHMKGQNY-ZETCQYMHSA-N L-alpha-phenylglycine zwitterion Chemical compound OC(=O)[C@@H](N)C1=CC=CC=C1 ZGUNAGUHMKGQNY-ZETCQYMHSA-N 0.000 description 1
- JTTHKOPSMAVJFE-VIFPVBQESA-N L-homophenylalanine Chemical compound OC(=O)[C@@H](N)CCC1=CC=CC=C1 JTTHKOPSMAVJFE-VIFPVBQESA-N 0.000 description 1
- UKAUYVFTDYCKQA-VKHMYHEASA-N L-homoserine Chemical compound OC(=O)[C@@H](N)CCO UKAUYVFTDYCKQA-VKHMYHEASA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- VHVGNTVUSQUXPS-YUMQZZPRSA-N L-threo-3-phenylserine Chemical compound [O-]C(=O)[C@@H]([NH3+])[C@@H](O)C1=CC=CC=C1 VHVGNTVUSQUXPS-YUMQZZPRSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- UBORTCNDUKBEOP-UHFFFAOYSA-N L-xanthosine Natural products OC1C(O)C(CO)OC1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UHFFFAOYSA-N 0.000 description 1
- 241001112693 Lachnospiraceae Species 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 206010067125 Liver injury Diseases 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101000755751 Mus musculus Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108010066154 Nuclear Export Signals Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 101100214779 Pan troglodytes APOBEC3G gene Proteins 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 102220550380 Protein unc-50 homolog_N68D_mutation Human genes 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 241001647888 Psychroflexus Species 0.000 description 1
- 241000577544 Psychroflexus torquis Species 0.000 description 1
- MTVVRWVOXZSVBW-UHFFFAOYSA-M QSY21 succinimidyl ester Chemical compound [Cl-].C1CN(S(=O)(=O)C=2C(=CC=CC=2)C2=C3C=CC(C=C3OC3=CC(=CC=C32)N2CC3=CC=CC=C3C2)=[N+]2CC3=CC=CC=C3C2)CCC1C(=O)ON1C(=O)CCC1=O MTVVRWVOXZSVBW-UHFFFAOYSA-M 0.000 description 1
- GMRIOMQGYOXUCH-UHFFFAOYSA-N QSY35 succinimidyl ester Chemical compound C12=NON=C2C([N+](=O)[O-])=CC=C1NC(C=C1)=CC=C1CC(=O)ON1C(=O)CCC1=O GMRIOMQGYOXUCH-UHFFFAOYSA-N 0.000 description 1
- BDJDTKYGKHEMFF-UHFFFAOYSA-M QSY7 succinimidyl ester Chemical compound [Cl-].C=1C=C2C(C=3C(=CC=CC=3)S(=O)(=O)N3CCC(CC3)C(=O)ON3C(CCC3=O)=O)=C3C=C\C(=[N+](\C)C=4C=CC=CC=4)C=C3OC2=CC=1N(C)C1=CC=CC=C1 BDJDTKYGKHEMFF-UHFFFAOYSA-M 0.000 description 1
- PAOKYIAFAJVBKU-UHFFFAOYSA-N QSY9 succinimidyl ester Chemical compound [H+].[H+].[Cl-].C=1C=C2C(C=3C(=CC=CC=3)S(=O)(=O)N3CCC(CC3)C(=O)ON3C(CCC3=O)=O)=C3C=C\C(=[N+](\C)C=4C=CC(=CC=4)S([O-])(=O)=O)C=C3OC2=CC=1N(C)C1=CC=C(S([O-])(=O)=O)C=C1 PAOKYIAFAJVBKU-UHFFFAOYSA-N 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 108010046983 Ribonuclease T1 Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 101100528972 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RPD3 gene Proteins 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 241000863432 Shewanella putrefaciens Species 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 102220538768 Superoxide dismutase [Cu-Zn]_E22G_mutation Human genes 0.000 description 1
- WDLRUFUQRNWCPK-UHFFFAOYSA-N Tetraxetan Chemical compound OC(=O)CN1CCN(CC(O)=O)CCN(CC(O)=O)CCN(CC(O)=O)CC1 WDLRUFUQRNWCPK-UHFFFAOYSA-N 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102220577562 Transcription factor NF-E2 45 kDa subunit_T68A_mutation Human genes 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 101800005109 Triakontatetraneuropeptide Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- UBORTCNDUKBEOP-HAVMAKPUSA-N Xanthosine Natural products O[C@@H]1[C@H](O)[C@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-HAVMAKPUSA-N 0.000 description 1
- SIIZPVYVXNXXQG-UQTMIEBXSA-N [(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-4-[[(2r,3s,4r,5r)-5-(6-aminopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-3-hydroxyoxolan-2-yl]methyl [(2r,3r,4r,5r)-2-(6-aminopurin-9-yl)-4-hydroxy-5-(phosphonooxymethyl)oxolan-3-yl] hydrogen phos Chemical compound C1=NC2=C(N)N=CN=C2N1[C@@H]1O[C@H](COP(O)(=O)O[C@H]2[C@@H](O[C@H](COP(O)(O)=O)[C@H]2O)N2C3=NC=NC(N)=C3N=C2)[C@@H](O)[C@H]1OP(O)(=O)OC[C@H]([C@@H](O)[C@H]1O)O[C@H]1N1C(N=CN=C2N)=C2N=C1 SIIZPVYVXNXXQG-UQTMIEBXSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 150000001408 amides Chemical group 0.000 description 1
- JINBYESILADKFW-UHFFFAOYSA-N aminomalonic acid Chemical compound OC(=O)C(N)C(O)=O JINBYESILADKFW-UHFFFAOYSA-N 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000001475 anti-trypsic effect Effects 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- DMLAVOWQYNRWNQ-UHFFFAOYSA-N azobenzene Chemical compound C1=CC=CC=C1N=NC1=CC=CC=C1 DMLAVOWQYNRWNQ-UHFFFAOYSA-N 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 125000000837 carbohydrate group Chemical group 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000009614 chemical analysis method Methods 0.000 description 1
- 150000005829 chemical entities Chemical class 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000012707 chemical precursor Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 239000012228 culture supernatant Substances 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- IBOVDNBDQHYNJI-UHFFFAOYSA-N dabcyl SE dye Chemical compound C1=CC(N(C)C)=CC=C1N=NC1=CC=C(C(=O)ON2C(CCC2=O)=O)C=C1 IBOVDNBDQHYNJI-UHFFFAOYSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000006203 ethylation Effects 0.000 description 1
- 238000006200 ethylation reaction Methods 0.000 description 1
- 230000006846 excision repair Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000003804 extraction from natural source Methods 0.000 description 1
- 125000004030 farnesyl group Chemical group [H]C([*])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])C([H])([H])C([H])=C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 230000006126 farnesylation Effects 0.000 description 1
- 125000005313 fatty acid group Chemical group 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 230000022244 formylation Effects 0.000 description 1
- 238000006170 formylation reaction Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000003197 gene knockdown Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 231100000722 genetic damage Toxicity 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 230000006127 geranylation Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-L glutamate group Chemical class N[C@@H](CCC(=O)[O-])C(=O)[O-] WHUUTDBJXJRKMK-VKHMYHEASA-L 0.000 description 1
- 201000004541 glycogen storage disease I Diseases 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 231100000753 hepatic injury Toxicity 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 102000048646 human APOBEC3A Human genes 0.000 description 1
- 102000048415 human APOBEC3B Human genes 0.000 description 1
- 102000048419 human APOBEC3C Human genes 0.000 description 1
- 102000043429 human APOBEC3D Human genes 0.000 description 1
- 102000049338 human APOBEC3F Human genes 0.000 description 1
- 102000054962 human APOBEC3G Human genes 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000000984 immunochemical effect Effects 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- QNRXNRGSOJZINA-UHFFFAOYSA-N indoline-2-carboxylic acid Chemical compound C1=CC=C2NC(C(=O)O)CC2=C1 QNRXNRGSOJZINA-UHFFFAOYSA-N 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 230000006122 isoprenylation Effects 0.000 description 1
- 230000006144 lipoylation Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000004777 loss-of-function mutation Effects 0.000 description 1
- 230000017156 mRNA modification Effects 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 239000003471 mutagenic agent Substances 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 230000026792 palmitoylation Effects 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 230000010412 perfusion Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 229940079889 pyrrolidonecarboxylic acid Drugs 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 108700015182 recombinant rCAS Proteins 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 102220309483 rs1041124171 Human genes 0.000 description 1
- 102220214967 rs1060503560 Human genes 0.000 description 1
- 102220009473 rs397507189 Human genes 0.000 description 1
- 102220045907 rs587782481 Human genes 0.000 description 1
- 102220327920 rs781611267 Human genes 0.000 description 1
- 102220278924 rs864622656 Human genes 0.000 description 1
- 102220097798 rs876658274 Human genes 0.000 description 1
- 102220096694 rs876660270 Human genes 0.000 description 1
- 102220093762 rs876661269 Human genes 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 108091069025 single-strand RNA Proteins 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001839 systemic circulation Effects 0.000 description 1
- 229940065721 systemic for obstructive airway disease xanthines Drugs 0.000 description 1
- NPDBDJFLKKQMCM-UHFFFAOYSA-N tert-butylglycine Chemical compound CC(C)(C)C(N)C(O)=O NPDBDJFLKKQMCM-UHFFFAOYSA-N 0.000 description 1
- 239000005460 tetrahydrofolate Substances 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 229960000278 theophylline Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- YAHHPOUXPBUKTL-DXKBKMAZSA-N thymidine dimer Chemical compound CC12C(C3N([C@H]4C[C@H](O)[C@@H](CO)O4)C(=O)NC(=O)C13C)N([C@H]1C[C@H](O)[C@@H](CO)O1)C(=O)NC2=O YAHHPOUXPBUKTL-DXKBKMAZSA-N 0.000 description 1
- 230000000451 tissue damage Effects 0.000 description 1
- 231100000827 tissue damage Toxicity 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- 125000002264 triphosphate group Chemical group [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- NMEHNETUFHBYEG-IHKSMFQHSA-N tttn Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 NMEHNETUFHBYEG-IHKSMFQHSA-N 0.000 description 1
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 description 1
- 238000004879 turbidimetry Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 241000243207 uncultured Parcubacteria group bacterium Species 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- UBORTCNDUKBEOP-UUOKFMHZSA-N xanthosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UUOKFMHZSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/81—Protease inhibitors
- C07K14/8107—Endopeptidase (E.C. 3.4.21-99) inhibitors
- C07K14/811—Serine protease (E.C. 3.4.21) inhibitors
- C07K14/8121—Serpins
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/50—Hydrolases (3) acting on carbon-nitrogen bonds, other than peptide bonds (3.5), e.g. asparaginase
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/16—Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3513—Protein; Peptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/34—Allele or polymorphism specific uses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04005—Cytidine deaminase (3.5.4.5)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Epidemiology (AREA)
- Mycology (AREA)
- Immunology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
Description
本出願は、2018年5月11日出願の米国仮出願第62/670,498号、および2018年12月17日出願の米国仮出願第62/780,864,号の利益を主張するものであり、それぞれの内容全体が参照により本明細書に組み込まれる。
参照による組み込み
本明細書に記載されているすべての刊行物、特許、および特許出願は、それぞれの個々の刊行物、特許、または特許出願が具体的かつ個別に参照により組み込まれるように示されているのと同じ程度に、参照により本明細書に組み込まれる。別段の表示がない限り、本明細書に記載されている刊行物、特許および特許出願は、その全体が参照により本明細書に組み込まれる。
塩基エディター、または塩基エディターをコードするポリヌクレオチド(ここで塩基エディターはポリヌクレオチドプログラム可能なDNA結合ドメインとシチジンデアミナーゼドメインとを含む)と;
塩基エディターをターゲティングしてSERPINA1ポリヌクレオチドの核酸位置1455におけるシチジンを改変させる、1つ以上のガイドポリヌクレオチドと
を対象に投与することを含む。
(a) A1ADに関連するSNPを含む肝前駆細胞に、塩基エディターまたはそれをコードするポリヌクレオチド(ここで、塩基エディターは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインとシチジンデアミナーゼドメインとを含む)と;1つ以上のガイドポリヌクレオチド(ここで、1つ以上のガイドポリヌクレオチドは、塩基エディターをターゲティングしてSERPINA1ポリヌクレオチドの核酸位置1455におけるシチジンにおいてシチジン脱アミノ化をもたらす)とを導入すること、および
(b) 前記肝前駆細胞を幹細胞に分化させること
を含む。一実施形態では、方法は、肝前駆細胞を幹細胞に分化させることを含む。別の実施形態では、肝前駆細胞はA1ATポリペプチドを発現する。別の実施形態では、肝前駆細胞は、A1ADを有する対象から得られるものである。別の実施形態では、肝前駆細胞は哺乳類細胞またはヒト細胞である。
5’-CAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-UCAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-UUCAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-GUUCAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-UGUUCAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-UUGUUCAAUCAUUAAGAAGACAAAGGGUU-3’
5’-UUCAAUCAUUAAGAAGACAAAG-3’
5’-UUCAAUCAUUAAGAAGACAAAGG-3’
5’-UCAAUCAUUAAGAAGACAAAGGG-3’
5’-AAUCAUUAAGAAGACAAAGGGU-3’
から選択される核酸配列を含む、ガイドRNAを提供する。
以下の定義は、本技術分野のものを補足するものであり、本出願に向けられるものであり、任意の関連する、または関連しない事例、例えば、任意の同時所有される特許または特許出願に帰属されるべきではない。本明細書に記載のものと類似するか、または等価である任意の方法および材料を、本開示の試験のための実施において使用することができるが、好ましい方法および材料を本明細書で説明する。したがって、本明細書で使用される用語は、特定の実施形態だけを説明するためのものであり、限定を意図するものではない。
>sp|P01009|A1AT_HUMAN Alpha-1-antitrypsin OS=Homo sapiens OX=9606 GN=SERPINA1 PE=1 SV=3:
MPSSVSWGILLLAGLCCLVPVSLAEDPQGDAAQKTDTSHHDQDHPTFNKITPNLAEFAFS
LYRQLAHQSNSTNIFFSPVSIATAFAMLSLGTKADTHDEILEGLNFNLTEIPEAQIHEGF
QELLRTLNQPDSQLQLTTGNGLFLSEGLKLVDKFLEDVKKLYHSEAFTVNFGDTEEAKKQ
INDYVEKGTQGKIVDLVKELDRDTVFALVNYIFFKGKWERPFEVKDTEEEDFHVDQVTTV
KVPMMKRLGMFNIQHCKKLSSWVLLMKYLGNATAIFFLPDEGKLQHLENELTHDIITKFL
ENEDRRSASLHLPKLSITGTYDLKSVLGQLGITKVFSNGADLSGVTEEAPLKLSKAVHKA
VLTIDEKGTEAAGAMFLEAIPMSIPPEVKFNKPFVFLMIEQNTKSPLFMGKVVNPTQK
1 atatgccaag tacgccccct attgacgtca atgacggtaa atggcccgcc tggcattatg
61 cccagtacat gaccttatgg gactttccta cttggcagta catctacgta ttagtcatcg
121 ctattaccat ggtgatgcgg ttttggcagt acatcaatgg gcgtggatag cggtttgact
181 cacggggatt tccaagtctc caccccattg acgtcaatgg gagtttgttt tggcaccaaa
241 atcaacggga ctttccaaaa tgtcgtaaca actccgcccc attgacgcaa atgggcggta
301 ggcgtgtacg gtgggaggtc tatataagca gagctggttt agtgaaccgt cagatccgct
361 agagatccgc ggccgctaat acgactcact atagggagag ccgccaccat gagctcagag
421 actggcccag tggctgtgga ccccacattg agacggcgga tcgagcccca tgagtttgag
481 gtattcttcg atccgagaga gctccgcaag gagacctgcc tgctttacga aattaattgg
541 gggggccggc actccatttg gcgacataca tcacagaaca ctaacaagca cgtcgaagtc
601 aacttcatcg agaagttcac gacagaaaga tatttctgtc cgaacacaag gtgcagcatt
661 acctggtttc tcagctggag cccatgcggc gaatgtagta gggccatcac tgaattcctg
721 tcaaggtatc cccacgtcac tctgtttatt tacatcgcaa ggctgtacca ccacgctgac
781 ccccgcaatc gacaaggcct gcgggatttg atctcttcag gtgtgactat ccaaattatg
841 actgagcagg agtcaggata ctgctggaga aactttgtga attatagccc gagtaatgaa
901 gcccactggc ctaggtatcc ccatctgtgg gtacgactgt acgttcttga actgtactgc
961 atcatactgg gcctgcctcc ttgtctcaac attctgagaa ggaagcagcc acagctgaca
1021 ttctttacca tcgctcttca gtcttgtcat taccagcgac tgcccccaca cattctctgg
1081 gccaccgggt tgaaatctgg tggttcttct ggtggttcta gcggcagcga gactcccggg
1141 acctcagagt ccgccacacc cgaaagttct ggtggttctt ctggtggttc tgataaaaag
1201 tattctattg gtttagccat cggcactaat tccgttggat gggctgtcat aaccgatgaa
1261 tacaaagtac cttcaaagaa atttaaggtg ttggggaaca cagaccgtca ttcgattaaa
1321 aagaatctta tcggtgccct cctattcgat agtggcgaaa cggcagaggc gactcgcctg
1381 aaacgaaccg ctcggagaag gtatacacgt cgcaagaacc gaatatgtta cttacaagaa
1441 atttttagca atgagatggc caaagttgac gattctttct ttcaccgttt ggaagagtcc
1501 ttccttgtcg aagaggacaa gaaacatgaa cggcacccca tctttggaaa catagtagat
1561 gaggtggcat atcatgaaaa gtacccaacg atttatcacc tcagaaaaaa gctagttgac
1621 tcaactgata aagcggacct gaggttaatc tacttggctc ttgcccatat gataaagttc
1681 cgtgggcact ttctcattga gggtgatcta aatccggaca actcggatgt cgacaaactg
1741 ttcatccagt tagtacaaac ctataatcag ttgtttgaag agaaccctat aaatgcaagt
1801 ggcgtggatg cgaaggctat tcttagcgcc cgcctctcta aatcccgacg gctagaaaac
1861 ctgatcgcac aattacccgg agagaagaaa aatgggttgt tcggtaacct tatagcgctc
1921 tcactaggcc tgacaccaaa ttttaagtcg aacttcgact tagctgaaga tgccaaattg
1981 cagcttagta aggacacgta cgatgacgat ctcgacaatc tactggcaca aattggagat
2041 cagtatgcgg acttattttt ggctgccaaa aaccttagcg atgcaatcct cctatctgac
2101 atactgagag ttaatactga gattaccaag gcgccgttat ccgcttcaat gatcaaaagg
2161 tacgatgaac atcaccaaga cttgacactt ctcaaggccc tagtccgtca gcaactgcct
2221 gagaaatata aggaaatatt ctttgatcag tcgaaaaacg ggtacgcagg ttatattgac
2281 ggcggagcga gtcaagagga attctacaag tttatcaaac ccatattaga gaagatggat
2341 gggacggaag agttgcttgt aaaactcaat cgcgaagatc tactgcgaaa gcagcggact
2401 ttcgacaacg gtagcattcc acatcaaatc cacttaggcg aattgcatgc tatacttaga
2461 aggcaggagg atttttatcc gttcctcaaa gacaatcgtg aaaagattga gaaaatccta
2521 acctttcgca taccttacta tgtgggaccc ctggcccgag ggaactctcg gttcgcatgg
2581 atgacaagaa agtccgaaga aacgattact ccatggaatt ttgaggaagt tgtcgataaa
2641 ggtgcgtcag ctcaatcgtt catcgagagg atgaccaact ttgacaagaa tttaccgaac
2701 gaaaaagtat tgcctaagca cagtttactt tacgagtatt tcacagtgta caatgaactc
2761 acgaaagtta agtatgtcac tgagggcatg cgtaaacccg cctttctaag cggagaacag
2821 aagaaagcaa tagtagatct gttattcaag accaaccgca aagtgacagt taagcaattg
2881 aaagaggact actttaagaa aattgaatgc ttcgattctg tcgagatctc cggggtagaa
2941 gatcgattta atgcgtcact tggtacgtat catgacctcc taaagataat taaagataag
3001 gacttcctgg ataacgaaga gaatgaagat atcttagaag atatagtgtt gactcttacc
3061 ctctttgaag atcgggaaat gattgaggaa agactaaaaa catacgctca cctgttcgac
3121 gataaggtta tgaaacagtt aaagaggcgt cgctatacgg gctggggacg attgtcgcgg
3181 aaacttatca acgggataag agacaagcaa agtggtaaaa ctattctcga ttttctaaag
3241 agcgacggct tcgccaatag gaactttatg cagctgatcc atgatgactc tttaaccttc
3301 aaagaggata tacaaaaggc acaggtttcc ggacaagggg actcattgca cgaacatatt
3361 gcgaatcttg ctggttcgcc agccatcaaa aagggcatac tccagacagt caaagtagtg
3421 gatgagctag ttaaggtcat gggacgtcac aaaccggaaa acattgtaat cgagatggca
3481 cgcgaaaatc aaacgactca gaaggggcaa aaaaacagtc gagagcggat gaagagaata
3541 gaagagggta ttaaagaact gggcagccag atcttaaagg agcatcctgt ggaaaatacc
3601 caattgcaga acgagaaact ttacctctat tacctacaaa atggaaggga catgtatgtt
3661 gatcaggaac tggacataaa ccgtttatct gattacgacg tcgatcacat tgtaccccaa
3721 tcctttttga aggacgattc aatcgacaat aaagtgctta cacgctcgga taagaaccga
3781 gggaaaagtg acaatgttcc aagcgaggaa gtcgtaaaga aaatgaagaa ctattggcgg
3841 cagctcctaa atgcgaaact gataacgcaa agaaagttcg ataacttaac taaagctgag
3901 aggggtggct tgtctgaact tgacaaggcc ggatttatta aacgtcagct cgtggaaacc
3961 cgccaaatca caaagcatgt tgcacagata ctagattccc gaatgaatac gaaatacgac
4021 gagaacgata agctgattcg ggaagtcaaa gtaatcactt taaagtcaaa attggtgtcg
4081 gacttcagaa aggattttca attctataaa gttagggaga taaataacta ccaccatgcg
4141 cacgacgctt atcttaatgc cgtcgtaggg accgcactca ttaagaaata cccgaagcta
4201 gaaagtgagt ttgtgtatgg tgattacaaa gtttatgacg tccgtaagat gatcgcgaaa
4261 agcgaacagg agataggcaa ggctacagcc aaatacttct tttattctaa cattatgaat
4321 ttctttaaga cggaaatcac tctggcaaac ggagagatac gcaaacgacc tttaattgaa
4381 accaatgggg agacaggtga aatcgtatgg gataagggcc gggacttcgc gacggtgaga
4441 aaagttttgt ccatgcccca agtcaacata gtaaagaaaa ctgaggtgca gaccggaggg
4501 ttttcaaagg aatcgattct tccaaaaagg aatagtgata agctcatcgc tcgtaaaaag
4561 gactgggacc cgaaaaagta cggtggcttc gatagcccta cagttgccta ttctgtccta
4621 gtagtggcaa aagttgagaa gggaaaatcc aagaaactga agtcagtcaa agaattattg
4681 gggataacga ttatggagcg ctcgtctttt gaaaagaacc ccatcgactt ccttgaggcg
4741 aaaggttaca aggaagtaaa aaaggatctc ataattaaac taccaaagta tagtctgttt
4801 gagttagaaa atggccgaaa acggatgttg gctagcgccg gagagcttca aaaggggaac
4861 gaactcgcac taccgtctaa atacgtgaat ttcctgtatt tagcgtccca ttacgagaag
4921 ttgaaaggtt cacctgaaga taacgaacag aagcaacttt ttgttgagca gcacaaacat
4981 tatctcgacg aaatcataga gcaaatttcg gaattcagta agagagtcat cctagctgat
5041 gccaatctgg acaaagtatt aagcgcatac aacaagcaca gggataaacc catacgtgag
5101 caggcggaaa atattatcca tttgtttact cttaccaacc tcggcgctcc agccgcattc
5161 aagtattttg acacaacgat agatcgcaaa cgatacactt ctaccaagga ggtgctagac
5221 gcgacactga ttcaccaatc catcacggga ttatatgaaa ctcggataga tttgtcacag
5281 cttgggggtg actctggtgg ttctggagga tctggtggtt ctactaatct gtcagatatt
5341 attgaaaagg agaccggtaa gcaactggtt atccaggaat ccatcctcat gctcccagag
5401 gaggtggaag aagtcattgg gaacaagccg gaaagcgata tactcgtgca caccgcctac
5461 gacgagagca ccgacgagaa tgtcatgctt ctgactagcg acgcccctga atacaagcct
5521 tgggctctgg tcatacagga tagcaacggt gagaacaaga ttaagatgct ctctggtggt
5581 tctggaggat ctggtggttc tactaatctg tcagatatta ttgaaaagga gaccggtaag
5641 caactggtta tccaggaatc catcctcatg ctcccagagg aggtggaaga agtcattggg
5701 aacaagccgg aaagcgatat actcgtgcac accgcctacg acgagagcac cgacgagaat
5761 gtcatgcttc tgactagcga cgcccctgaa tacaagcctt gggctctggt catacaggat
5821 agcaacggtg agaacaagat taagatgctc tctggtggtt ctcccaagaa gaagaggaaa
5881 gtctaaccgg tcatcatcac catcaccatt gagtttaaac ccgctgatca gcctcgactg
5941 tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg
6001 aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga
6061 gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg
6121 aagacaatag caggcatgct ggggatgcgg tgggctctat ggcttctgag gcggaaagaa
6181 ccagctgggg ctcgataccg tcgacctcta gctagagctt ggcgtaatca tggtcatagc
6241 tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca
6301 taaagtgtaa agcctagggt gcctaatgag tgagctaact cacattaatt gcgttgcgct
6361 cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac
6421 gcgcggggag aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc
6481 tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt
6541 tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg
6601 ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg
6661 agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat
6721 accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta
6781 ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct
6841 gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc
6901 ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa
6961 gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg
7021 taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag
7081 tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt
7141 gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta
7201 cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc
7261 agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca
7321 cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa
7381 cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat
7441 ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct
7501 taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt
7561 tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat
7621 ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta
7681 atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg
7741 gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt
7801 tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg
7861 cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg
7921 taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc
7981 ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa
8041 ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac
8101 cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt
8161 ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg
8221 gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa
8281 gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata
8341 aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc gacggatcgg
8401 gagatcgatc tcccgatccc ctagggtcga ctctcagtac aatctgctct gatgccgcat
8461 agttaagcca gtatctgctc cctgcttgtg tgttggaggt cgctgagtag tgcgcgagca
8521 aaatttaagc tacaacaagg caaggcttga ccgacaattg catgaagaat ctgcttaggg
8581 ttaggcgttt tgcgctgctt cgcgatgtac gggccagata tacgcgttga cattgattat
8641 tgactagtta ttaatagtaa tcaattacgg ggtcattagt tcatagccca tatatggagt
8701 tccgcgttac ataacttacg gtaaatggcc cgcctggctg accgcccaac gacccccgcc
8761 cattgacgtc aataatgacg tatgttccca tagtaacgcc aatagggact ttccattgac
8821 gtcaatgggt ggagtattta cggtaaactg cccacttggc agtacatcaa gtgtatc
ATGagctcagagactggcccagtggctgtggaccccacattgagacggcggatcgagccccatgagtttgaggtattcttcgatccgagagagctccgcaaggagacctgcctgctttacgaaattaattgggggggccggcactccatttggcgacatacatcacagaacactaacaagcacgtcgaagtcaacttcatcgagaagttcacgacagaaagatatttctgtccgaacacaaggtgcagcattacctggtttctcagctggagcccatgcggcgaatgtagtagggccatcactgaattcctgtcaaggtatccccacgtcactctgtttatttacatcgcaaggctgtaccaccacgctgacccccgcaatcgacaaggcctgcgggatttgatctcttcaggtgtgactatccaaattatgactgagcaggagtcaggatactgctggagaaactttgtgaattatagcccgagtaatgaagcccactggcctaggtatccccatctgtgggtacgactgtacgttcttgaactgtactgcatcatactgggcctgcctccttgtctcaacattctgagaaggaagcagccacagctgacattctttaccatcgctcttcagtcttgtcattaccagcgactgcccccacacattctctgggccaccgggttgaaatctggtggttcttctggtggttctagcggcagcgagactcccgggacctcagagtccgccacacccgaaagttctggtggttcttctggtggttctgataaaaagtattctattggtttagccatcggcactaattccgttggatgggctgtcataaccgatgaatacaaagtaccttcaaagaaatttaaggtgttggggaacacagaccgtcattcgattaaaaagaatcttatcggtgccctcctattcgatagtggcgaaacggcagaggcgactcgcctgaaacgaaccgctcggagaaggtatacacgtcgcaagaaccgaatatgttacttacaagaaatttttagcaatgagatggccaaagttgacgattctttctttcaccgtttggaagagtccttccttgtcgaagaggacaagaaacatgaacggcaccccatctttggaaacatagtagatgaggtggcatatcatgaaaagtacccaacgatttatcacctcagaaaaaagctagttgactcaactgataaagcggacctgaggttaatctacttggctcttgcccatatgataaagttccgtgggcactttctcattgagggtgatctaaatccggacaactcggatgtcgacaaactgttcatccagttagtacaaacctataatcagttgtttgaagagaaccctataaatgcaagtggcgtggatgcgaaggctattcttagcgcccgcctctctaaatcccgacggctagaaaacctgatcgcacaattacccggagagaagaaaaatgggttgttcggtaaccttatagcgctctcactaggcctgacaccaaattttaagtcgaacttcgacttagctgaagatgccaaattgcagcttagtaaggacacgtacgatgacgatctcgacaatctactggcacaaattggagatcagtatgcggacttatttttggctgccaaaaaccttagcgatgcaatcctcctatctgacatactgagagttaatactgagattaccaaggcgccgttatccgcttcaatgatcaaaaggtacgatgaacatcaccaagacttgacacttctcaaggccctagtccgtcagcaactgcctgagaaatataaggaaatattctttgatcagtcgaaaaacgggtacgcaggttatattgacggcggagcgagtcaagaggaattctacaagtttatcaaacccatattagagaagatggatgggacggaagagttgcttgtaaaactcaatcgcgaagatctactgcgaaagcagcggactttcgacaacggtagcattccacatcaaatccacttaggcgaattgcatgctatacttagaaggcaggaggatttttatccgttcctcaaagacaatcgtgaaaagattgagaaaatcctaacctttcgcataccttactatgtgggacccctggcccgagggaactctcggttcgcatggatgacaagaaagtccgaagaaacgattactccatggaattttgaggaagttgtcgataaaggtgcgtcagctcaatcgttcatcgagaggatgaccaactttgacaagaatttaccgaacgaaaaagtattgcctaagcacagtttactttacgagtatttcacagtgtacaatgaactcacgaaagttaagtatgtcactgagggcatgcgtaaacccgcctttctaagcggagaacagaagaaagcaatagtagatctgttattcaagaccaaccgcaaagtgacagttaagcaattgaaagaggactactttaagaaaattgaatgcttcgattctgtcgagatctccggggtagaagatcgatttaatgcgtcacttggtacgtatcatgacctcctaaagataattaaagataaggacttcctggataacgaagagaatgaagatatcttagaagatatagtgttgactcttaccctctttgaagatcgggaaatgattgaggaaagactaaaaacatacgctcacctgttcgacgataaggttatgaaacagttaaagaggcgtcgctatacgggctggggacgattgtcgcggaaacttatcaacgggataagagacaagcaaagtggtaaaactattctcgattttctaaagagcgacggcttcgccaataggaactttatgcagctgatccatgatgactctttaaccttcaaagaggatatacaaaaggcacaggtttccggacaaggggactcattgcacgaacatattgcgaatcttgctggttcgccagccatcaaaaagggcatactccagacagtcaaagtagtggatgagctagttaaggtcatgggacgtcacaaaccggaaaacattgtaatcgagatggcacgcgaaaatcaaacgactcagaaggggcaaaaaaacagtcgagagcggatgaagagaatagaagagggtattaaagaactgggcagccagatcttaaaggagcatcctgtggaaaatacccaattgcagaacgagaaactttacctctattacctacaaaatggaagggacatgtatgttgatcaggaactggacataaaccgtttatctgattacgacgtcgatcacattgtaccccaatcctttttgaaggacgattcaatcgacaataaagtgcttacacgctcggataagaaccgagggaaaagtgacaatgttccaagcgaggaagtcgtaaagaaaatgaagaactattggcggcagctcctaaatgcgaaactgataacgcaaagaaagttcgataacttaactaaagctgagaggggtggcttgtctgaacttgacaaggccggatttattaaacgtcagctcgtggaaacccgccaaatcacaaagcatgttgcacagatactagattcccgaatgaatacgaaatacgacgagaacgataagctgattcgggaagtcaaagtaatcactttaaagtcaaaattggtgtcggacttcagaaaggattttcaattctataaagttagggagataaataactaccaccatgcgcacgacgcttatcttaatgccgtcgtagggaccgcactcattaagaaatacccgaagctagaaagtgagtttgtgtatggtgattacaaagtttatgacgtccgtaagatgatcgcgaaaagcgaacaggagataggcaaggctacagccaaatacttcttttattctaacattatgaatttctttaagacggaaatcactctggcaaacggagagatacgcaaacgacctttaattgaaaccaatggggagacaggtgaaatcgtatgggataagggccgggacttcgcgacggtgagaaaagttttgtccatgccccaagtcaacatagtaaagaaaactgaggtgcagaccggagggttttcaaaggaatcgattcttccaaaaaggaatagtgataagctcatcgctcgtaaaaaggactgggacccgaaaaagtacggtggcttcgatagccctacagttgcctattctgtcctagtagtggcaaaagttgagaagggaaaatccaagaaactgaagtcagtcaaagaattattggggataacgattatggagcgctcgtcttttgaaaagaaccccatcgacttccttgaggcgaaaggttacaaggaagtaaaaaaggatctcataattaaactaccaaagtatagtctgtttgagttagaaaatggccgaaaacggatgttggctagcgccggagagcttcaaaaggggaacgaactcgcactaccgtctaaatacgtgaatttcctgtatttagcgtcccattacgagaagttgaaaggttcacctgaagataacgaacagaagcaactttttgttgagcagcacaaacattatctcgacgaaatcatagagcaaatttcggaattcagtaagagagtcatcctagctgatgccaatctggacaaagtattaagcgcatacaacaagcacagggataaacccatacgtgagcaggcggaaaatattatccatttgtttactcttaccaacctcggcgctccagccgcattcaagtattttgacacaacgatagatcgcaaacgatacacttctaccaaggaggtgctagacgcgacactgattcaccaatccatcacgggattatatgaaactcggatagatttgtcacagcttgggggtgactctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctggaggatctggtggttctactaatctgtcagatattattgaaaaggagaccggtaagcaactggttatccaggaatccatcctcatgctcccagaggaggtggaagaagtcattgggaacaagccggaaagcgatatactcgtgcacaccgcctacgacgagagcaccgacgagaatgtcatgcttctgactagcgacgcccctgaatacaagccttgggctctggtcatacaggatagcaacggtgagaacaagattaagatgctctctggtggttctAAAAGGACGGCGGACGGATCAGAGTTCGAGAGTCCGAAAAAAAAACGAAAGGTCGAAtaa
ATGTCATCCGAAACCGGGCCAGTGGCCGTAGACCCAACACTCAGGAGGCGGATAGAACCCCATGAGTTTGAAGTGTTCTTCGACCCCAGAGAGCTGCGCAAAGAGACTTGCCTCCTGTATGAAATAAATTGGGGGGGTCGCCATTCAATTTGGAGGCACACTAGCCAGAATACTAACAAACACGTGGAGGTAAATTTTATCGAGAAGTTTACCACCGAAAGATACTTTTGCCCCAATACACGGTGTTCAATTACCTGGTTTCTGTCATGGAGTCCATGTGGAGAATGTAGTAGAGCGATAACTGAGTTCCTGTCTCGATATCCTCACGTCACGTTGTTTATATACATCGCTCGGCTTTATCACCATGCGGACCCGCGGAACAGGCAAGGTCTTCGGGACCTCATATCCTCTGGGGTGACCATCCAGATAATGACGGAGCAAGAGAGCGGATACTGCTGGCGAAACTTTGTTAACTACAGCCCAAGCAATGAGGCACACTGGCCTAGATATCCGCATCTCTGGGTTCGACTGTATGTCCTTGAACTGTACTGCATAATTCTGGGACTTCCGCCATGCTTGAACATTCTGCGGCGGAAACAACCACAGCTGACCTTTTTCACGATTGCTCTCCAAAGTTGTCACTACCAGCGATTGCCACCCCACATCTTGTGGGCTACTGGACTCAAGTCTGGAGGAAGTTCAGGCGGAAGCAGCGGGTCTGAAACGCCCGGAACCTCAGAGAGCGCAACGCCCGAAAGCTCTGGAGGGTCAAGTGGTGGTAGTGATAAGAAATACTCCATCGGCCTCGCCATCGGTACGAATTCTGTCGGTTGGGCCGTTATCACCGATGAGTACAAGGTCCCTTCTAAGAAATTCAAGGTTTTGGGCAATACAGACCGCCATTCTATAAAAAAAAACCTGATCGGCGCCCTTTTGTTTGACAGTGGTGAGACTGCTGAAGCGACTCGCCTGAAGCGAACTGCCAGGAGGCGGTATACGAGGCGAAAAAACCGAATTTGTTACCTCCAGGAGATTTTCTCAAATGAAATGGCCAAGGTAGATGATAGTTTTTTTCACCGCTTGGAAGAAAGTTTTCTCGTTGAGGAGGACAAAAAGCACGAGAGGCACCCAATCTTTGGCAACATAGTCGATGAGGTCGCATACCATGAGAAATATCCTACGATCTATCATCTCCGCAAGAAGCTGGTCGATAGCACGGATAAAGCTGACCTCCGGCTGATCTACCTTGCTCTTGCTCACATGATTAAATTCAGGGGCCATTTCCTGATAGAAGGAGACCTCAATCCCGACAATTCTGATGTCGACAAACTGTTTATTCAGCTCGTTCAGACCTATAATCAACTCTTTGAGGAGAACCCCATCAATGCTTCAGGGGTGGACGCAAAGGCCATTTTGTCCGCGCGCTTGAGTAAATCACGACGCCTCGAGAATTTGATAGCTCAACTGCCGGGTGAGAAGAAAAACGGGTTGTTTGGGAATCTCATAGCGTTGAGTTTGGGACTTACGCCAAACTTTAAGTCTAACTTTGATTTGGCCGAAGATGCCAAATTGCAGCTGTCCAAAGATACCTATGATGACGACTTGGATAACCTTCTTGCGCAGATTGGTGACCAATACGCGGATCTGTTTCTTGCCGCAAAAAATCTGTCCGACGCCATACTCTTGTCCGATATACTGCGCGTCAATACTGAGATAACTAAGGCTCCCCTCAGCGCGTCCATGATTAAAAGATACGATGAGCACCACCAAGATCTCACTCTGTTGAAAGCCCTGGTTCGCCAGCAGCTTCCAGAGAAGTATAAGGAGATATTTTTCGACCAATCTAAAAACGGCTATGCGGGTTACATTGACGGTGGCGCCTCTCAAGAAGAATTCTACAAGTTTATAAAGCCGATACTTGAGAAAATGGACGGTACAGAGGAATTGTTGGTTAAGCTCAATCGCGAGGACTTGTTGAGAAAGCAGCGCACATTTGACAATGGTAGTATTCCACACCAGATTCATCTGGGCGAGTTGCATGCCATTCTTAGAAGACAAGAAGATTTTTATCCGTTTCTGAAAGATAACAGAGAAAAGATTGAAAAGATACTTACCTTTCGCATACCGTATTATGTAGGTCCCCTGGCTAGAGGGAACAGTCGCTTCGCTTGGATGACTCGAAAATCAGAAGAAACAATAACCCCCTGGAATTTTGAAGAAGTGGTAGATAAAGGTGCGAGTGCCCAATCTTTTATTGAGCGGATGACAAATTTTGACAAGAATCTGCCTAACGAAAAGGTGCTTCCCAAGCATTCCCTTTTGTATGAATACTTTACAGTATATAATGAACTGACTAAAGTGAAGTACGTTACCGAGGGGATGCGAAAGCCAGCTTTTCTCAGTGGCGAGCAGAAAAAAGCAATAGTTGACCTGCTGTTCAAGACGAATAGGAAGGTTACCGTCAAACAGCTCAAAGAAGATTACTTTAAAAAGATCGAATGTTTTGATTCAGTTGAGATAAGCGGAGTAGAGGATAGATTTAACGCAAGTCTTGGAACTTATCATGACCTTTTGAAGATCATCAAGGATAAAGATTTTTTGGACAACGAGGAGAATGAAGATATCCTGGAAGATATAGTACTTACCTTGACGCTTTTTGAAGATCGAGAGATGATCGAGGAGCGACTTAAGACGTACGCACATCTCTTTGACGATAAGGTTATGAAACAATTGAAACGCCGGCGGTATACTGGCTGGGGCAGGCTTTCTCGAAAGCTGATTAATGGTATCCGCGATAAGCAGTCTGGAAAGACAATCCTTGACTTTCTGAAAAGTGATGGATTTGCAAATAGAAACTTTATGCAGCTTATACATGATGACTCTTTGACGTTCAAGGAAGACATCCAGAAGGCACAGGTATCCGGCCAAGGGGATAGCCTCCATGAACACATAGCCAACCTGGCCGGCTCACCAGCTATTAAAAAGGGAATATTGCAAACCGTTAAGGTTGTTGACGAACTCGTTAAGGTTATGGGCCGACACAAACCAGAGAATATCGTGATTGAGATGGCTAGGGAGAATCAGACCACTCAAAAAGGTCAGAAAAATTCTCGCGAAAGGATGAAGCGAATTGAAGAGGGAATCAAAGAACTTGGCTCTCAAATTTTGAAAGAGCACCCGGTAGAAAACACTCAGCTGCAGAATGAAAAGCTGTATCTGTATTATCTGCAGAATGGTCGAGATATGTACGTTGATCAGGAGCTGGATATCAATAGGCTCAGTGACTACGATGTCGACCACATCGTTCCTCAATCTTTCCTGAAAGATGACTCTATCGACAACAAAGTGTTGACGCGATCAGATAAGAACCGGGGAAAATCCGACAATGTACCCTCAGAAGAAGTTGTCAAGAAGATGAAAAACTATTGGAGACAATTGCTGAACGCCAAGCTCATAACACAACGCAAGTTCGATAACTTGACGAAAGCCGAAAGAGGTGGGTTGTCAGAATTGGACAAAGCTGGCTTTATTAAGCGCCAATTGGTGGAGACCCGGCAGATTACGAAACACGTAGCACAAATTTTGGATTCACGAATGAATACCAAATACGACGAAAACGACAAATTGATACGCGAGGTGAAAGTGATTACGCTTAAGAGTAAGTTGGTTTCCGATTTCAGGAAGGATTTTCAGTTTTACAAAGTAAGAGAAATAAACAACTACCACCACGCCCATGATGCTTACCTCAACGCGGTAGTTGGCACAGCTCTTATCAAAAAATATCCAAAGCTGGAAAGCGAGTTCGTTTACGGTGACTATAAAGTATACGACGTTCGGAAGATGATAGCCAAATCAGAGCAGGAAATTGGGAAGGCAACCGCAAAATACTTCTTCTATTCAAACATCATGAACTTCTTTAAGACGGAGATTACGCTCGCGAACGGCGAAATACGCAAGAGGCCCCTCATAGAGACTAACGGCGAAACCGGGGAGATCGTATGGGACAAAGGACGGGACTTTGCGACCGTTAGAAAAGTACTTTCAATGCCACAAGTGAATATTGTTAAAAAGACAGAAGTACAAACAGGGGGGTTCAGTAAGGAATCCATTTTGCCCAAGCGGAACAGTGATAAATTGATAGCAAGGAAAAAAGATTGGGACCCTAAGAAGTACGGTGGTTTCGACTCTCCTACCGTTGCATATTCAGTCCTTGTAGTTGCGAAAGTGGAAAAGGGGAAAAGTAAGAAGCTTAAGAGTGTTAAAGAGCTTCTGGGCATAACCATAATGGAACGGTCTAGCTTCGAGAAAAATCCAATTGACTTTCTCGAGGCTAAAGGTTACAAGGAGGTAAAAAAGGACCTGATAATTAAACTCCCAAAGTACAGTCTCTTCGAGTTGGAGAATGGGAGGAAGAGAATGTTGGCATCTGCAGGGGAGCTCCAAAAGGGGAACGAGCTGGCTCTGCCTTCAAAATACGTGAACTTTCTGTACCTGGCCAGCCACTACGAGAAACTCAAGGGTTCTCCTGAGGATAACGAGCAGAAACAGCTGTTTGTAGAGCAGCACAAGCATTACCTGGACGAGATAATTGAGCAAATTAGTGAGTTCTCAAAAAGAGTAATCCTTGCAGACGCGAATCTGGATAAAGTTCTTTCCGCCTATAATAAGCACCGGGACAAGCCTATACGAGAACAAGCCGAGAACATCATTCACCTCTTTACCCTTACTAATCTGGGCGCGCCGGCCGCCTTCAAATACTTCGACACCACGATAGACAGGAAAAGGTATACGAGTACCAAAGAAGTACTTGACGCCACTCTCATCCACCAGTCTATAACAGGGTTGTACGAAACGAGGATAGATTTGTCCCAGCTCGGCGGCGACTCAGGAGGGTCAGGCGGCTCCGGTGGATCAACGAATCTTTCCGACATAATCGAGAAAGAAACCGGCAAACAGTTGGTGATCCAAGAATCAATCCTGATGCTGCCTGAAGAAGTAGAAGAGGTGATTGGCAACAAACCTGAGTCTGACATTCTTGTCCACACCGCGTATGACGAGAGCACGGACGAGAACGTTATGCTTCTCACTAGCGACGCCCCTGAGTATAAACCATGGGCGCTGGTCATCCAAGATTCCAATGGGGAAAACAAGATTAAGATGCTTAGTGGTGGGTCTGGAGGGAGCGGTGGGTCCACGAACCTCAGCGACATTATTGAAAAAGAGACTGGTAAACAACTTGTAATACAAGAGTCTATTCTGATGTTGCCTGAAGAGGTGGAGGAGGTGATTGGGAACAAACCGGAGTCTGATATACTTGTTCATACCGCCTATGACGAATCTACTGATGAGAATGTGATGCTTTTaACGTCAGACGCTCCCGAGTACAAACCCTGGGCTCTGGTGATTCAGGACAGCAATGGTGAGAATAAGATTAAAATGTTGAGTGGGGGCTCAAAGCGCACGGCTGACGGTAGCGAATTTGAGAGCCCCAAAAAAAAACGAAAGGTCGAAtaa
(一本下線:HNHドメイン;二重下線:RuvCドメイン)。
(一本下線:HNHドメイン;二重下線:RuvCドメイン)。
PAM配列に対して相補的な塩基の位置を斜体、二重下線で示している。位置1455におけるGは、位置1455の標的Cに対して相補的なものであるが、太字、下線で示している。
ポリヌクレオチドの標的ヌクレオチド配列を編集、修飾または改変するための塩基エディターまたは核酸塩基エディターが本明細書に開示される。本明細書に記載されるのは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメインを含む核酸塩基エディターまたは塩基エディターである。ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、結合されたガイドポリヌクレオチド(例えばgRNA)と一緒である場合に、(結合されたガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的塩基対形成を介して)標的ポリヌクレオチド配列に特異的に結合することができ、それによって、編集されることが所望される標的核酸配列に塩基エディターを局在化させることができる。或る実施態様では、標的ポリヌクレオチド配列は一本鎖DNAまたは二本鎖DNAを含む。或る実施態様では、標的ポリヌクレオチド配列はRNAを含む。或る実施態様では、標的ポリヌクレオチド配列はDNA-RNAハイブリッドを含む。
用語「ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン」とは、ガイドポリヌクレオチド(例えばガイドRNA)のような核酸(例えばDNAまたはRNA)と会合するタンパク質であって、その核酸がポリヌクレオチドプログラム可能なヌクレオチド結合ドメインを特定の核酸配列にガイドするところのものをいう。ある態様において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なDNA結合ドメインである。ある態様において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、ポリヌクレオチドプログラム可能なRNA結合ドメインである。ある態様において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cas9タンパク質である。ある態様において、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインは、Cpf1タンパク質である。
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA
(単一下線:HNHドメイン;二重下線:RuvCドメイン)。
ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA
(単一下線:HNHドメイン;二重下線:RuvCドメイン)。
(単一下線:HNHドメイン;二重下線:RuvCドメイン)。
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYEFGRSPGMVERTRRVKLEVEPHYLIIAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVRIYTISDAVGQNPTTINGGFSIDLTKLLEKRYLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTG SKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
MEVPLYNIFGDNYIIQVATEAENSTIYNNKVEIDDEELRNVLNLAYKIAKNNEDAAAERRGKAKKKKGEEGETTTSNIILPLSGNDKNPWTETLKCYNFPTTVALSEVFKNFSQVKECEEVSAPSFVKPEFYKFGRSPGMVERTRRVKLEVEPHYLIMAAAGWVLTRLGKAKVSEGDYVGVNVFTPTRGILYSLIQNVNGIVPGIKPETAFGLWIARKVVSSVTNPNVSVVSIYTISDAVGQNPTTINGGFSIDLTKLLEKRDLLSERLEAIARNALSISSNMRERYIVLANYIYEYLTGSKRLEDLLYFANRDLIMNLNSDDGKVRDLKLISAYVNGELIRGEG
MEKRINKIRKKLSADNATKPVSRSGPMKTLLVRVMTDDLKKRLEKRRKKPEVMPQVISNNAANNLRMLLDDYTKMKEAILQVYWQEFKDDHVGLMCKFAQPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPVKDSDEAVTYSLGKFGQRALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDfAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSFPVVERRENEVDWWNTINEVKKLIDAKRDMGRVFWSGVTAEKRNTILEGYNYLPNENDHKKREGSLENPKKPAKRQFGDLLLYLEKKYAGDWGKVFDEAWERIDKKIAGLTSHIEREEARNAEDAQSKAVLTDWLRAKASFVLERLKEMDEKEFYACEIQLQKWYGDLRGNPFAVEAENRVVDISGFSIGSDGHSIQYRNLLAWKYLENGKREFYLLMNYGKKGRIRFTDGTDIKKSGKWQGLLYGGGKAKVIDLTFDPDDEQLIILPLAFGTRQGREFIWNDLLSLETGLIKLANGRVIEKTIYNKKIGRDEPALFVALTFERREVVDPSNIKPVNLIGVARGENIPAVIALTDPEGCPLPEFKDSSGGPTDILRIGEGYKEKQRAIQAAKEVEQRRAGGYSRKFASKSRNLADDMVRNSARDLFYHAVTHDAVLVFANLSRGFGRQGKRTFMTERQYTKMEDWLTAKLAYEGLTSKTYLSKTLAQYTSKTCSNCGFTITYADMDVMLVRLKKTSDGWATTLNNKELKAEYQITYYNRYKRQTVEKELSAELDRLSEESGNNDISKWTKGRRDEALFLLKKRFSHRPVQEQFVCLDCGHEVHAAEQAALNIARSWLFLNSNSTEFKSYKSGKQPFVGAWQAFYKRRLKEVWKPNA
>APG80656.1 CRISPR-associated protein CasY [uncultured Parcubacteria group bacterium]) のアミノ酸配列は以下の通りである:
MSKRHPRISGVKGYRLHAQRLEYTGKSGAMRTIKYPLYSSPSGGRTVPREIVSAINDDYVGLYGLSNFDDLYNAEKRNEEKVYSVLDFWYDCVQYGAVFSYTAPGLLKNVAEVRGGSYELTKTLKGSHLYDELQIDKVIKFLNKKEISRANGSLDKLKKDIIDCFKAEYRERHKDQCNKLADDIKNAKKDAGASLGERQKKLFRDFFGISEQSENDKPSFTNPLNLTCCLLPFDTVNNNRNRGEVLFNKLKEYAQKLDKNEGSLEMWEYIGIGNSGTAFSNFLGEGFLGRLRENKITELKKAMMDITDAWRGQEQEEELEKRLRILAALTIKLREPKFDNHWGGYRSDINGKLSSWLQNYINQTVKIKEDLKGHKKDLKKAKEMINRFGESDTKEEAVVSSLLESIEKIVPDDSADDEKPDIPAIAIYRRFLSDGRLTLNRFVQREDVQEALIKERLEAEKKKKPKKRKKKSDAEDEKETIDFKELFPHLAKPLKLVPNFYGDSKRELYKKYKNAAIYTDALWKAVEKIYKSAFSSSLKNSFFDTDFDKDFFIKRLQKIFSVYRRFNTDKWKPIVKNSFAPYCDIVSLAENEVLYKPKQSRSRKSAAIDKNRVRLPSTENIAKAGIALARELSVAGFDWKDLLKKEEHEEYIDLIELHKTALALLLAVTETQLDISALDFVENGTVKDFMKTRDGNLVLEGRFLEMFSQSIVFSELRGLAGLMSRKEFITRSAIQTMNGKQAELLYIPHEFQSAKITTPKEMSRAFLDLAPAEFATSLEPESLSEKSLLKLKQMRYYPHYFGYELTRTGQGIDGGVAENALRLEKSPVKKREIKCKQYKTLGRGQNKIVLYVRSSYYQTQFLEWFLHRPKNVQTDVAVSGSFLIDEKKVKTRWNYDALTVALEPVSGSERVFVSQPFTIFPEKSAEEEGQRYLGIDIGEYGIAYTALEITGDSAKILDQNFISDPQLKTLREEVKGLKLDQRRGTFAMPSTKIARIRESLVHSLRNRIHHLALKHKAKIVYELEVSRFEEGKQKIKKVYATLKKADVYSEIDADKNLQTTVWGKLAVASEISASYTSQFCGACKKLWRAEMQVDETITTQELIGTVRVIKGGTLIDAIKDFMRPPIFDENDTPFPKYRDFCDKHHISKKMRGNSCLFICPFCRANADADIQASQTIALLRYVKEEKKVEDYFERFRKLKN IKVLGQMKKI
MAVKSIKVKLRLDDMPEIRAGLWKLHKEVNAGVRYYTEWLSLLRQENLYRRSPNGDGEQECDKTAEECKAELLERLRARQVENGHRGPAGSDDELLQLARQLYELLVPQAIGAKGDAQQIARKFLSPLADKDAVGGLGIAKAGNKPRWVRMREAGEPGWEEEKEKAETRKSADRTADVLRALADFGLKPLMRVYTDSEMSSVEWKPLRKGQAVRTWDRDMFQQAIERMMSWESWNQRVGQEYAKLVEQKNRFEQKNFVGQEHLVHLVNQLQQDMKEASPGLESKEQTAHYVTGRALRGSDKVFEKWGKLAPDAPFDLYDAEIKNVQRRNTRRFGSHDLFAKLAEPEYQALWREDASFLTRYAVYNSILRKLNHAKMFATFTLPDATAHPIWTRFDKLGGNLHQYTFLFNEFGERRHAIRFHKLLKVENGVAREVDDVTVPISMSEQLDNLLPRDPNEPIALYFRDYGAEQHFTGEFGGAKIQCRRDQLAHMHRRRGARDVYLNVSVRVQSQSEARGERRPPYAAVFRLVGDNHRAFVHFDKLSDYLAEHPDDGKLGSEGLLSGLRVMSVDLGLRTSASISVFRVARKDELKPNSKGRVPFFFPIKGNDNLVAVHERSQLLKLPGETESKDLRAIREERQRTLRQLRTQLAYLRLLVRCGSEDVGRRERSWAKLIEQPVDAANHMTPDWREAFENELQKLKSLHGICSDKEWMDAVYESVRRVWRHMGKQVRDWRKDVRSGERPKIRGYAKDVVGGNSIEQIEYLERQYKFLKSWSFFGKVSGQVIRAEKGSRFAITLREHIDHAKEDRLKKLADRIIMEALGYVYALDERGKGKWVAKYPPCQLILLEELSEYQFNNDRPPSENNQLMQWSHRGVFQELINQAQVHDLLVGTMYAAFSSRFDARTGAPGIRCRRVPARCTQEHNPEPFPWWLNKFVVEHTLDACPLRADDLIPTGEGEIFVSPFSAEEGDFHQIHADLNAAQNLQQRLWSDFDISQIRLRCDWGEVDGELVLIPRLTGKRTADSYSNKVFYTNTGVTYYERERGKKRRKVFAQEKLSEEEAELLVEADEAREKSVVLMRDPSGIINRGNWTRQKEFWSMV NQRIEGYLVKQIRSRVPLQDSACENTGDI
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIDRGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
MSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFADLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDAAANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN.
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG.
この配列において、太字で下線を付している残基N579は、(例えばA579に)変異されてSaCas9ニッカーゼを生じることができる。
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG.
この配列において、N579から変異されてSaCas9ニッカーゼを生じることができる残基A579には太字で下線を付している。
KRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEEASKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRKLINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYKNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPHIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG.
本明細書中で使用される、用語「ガイドポリヌクレオチド」とは、標的配列に特異的であり得かつポリヌクレオチドプログラム可能ヌクレオチド結合ドメインタンパク質(例えばCas9またはCpf1)と複合体を形成し得るポリヌクレオチドをいう。一実施形態では、ガイドポリヌクレオチドはガイドRNAである。本明細書において使用される用語「ガイドRNA (gRNA)」およびその文法的等価物は、標的DNAに対して特異的であり得かつCasタンパク質と複合体を形成し得るRNAを表し得る。RNA/Cas複合体は、Casタンパク質を標的DNAに「ガイド」するのを補助することができる。Cas9/crRNA/tracrRNAは、スペーサーに相補的な線状または環状dsDNA標的をエンドヌクレアーゼ的に切断する。crRNAに相補的でない標的鎖が最初にエンドヌクレアーゼで切断され、次いでエキソヌクレアーゼ的に3’-5’方向にトリムされる。自然界では、DNA結合と切断にはタンパク質と両方のRNAが通常必要とされる。しかしながら、crRNAおよびtracrRNAの両方の側面を単一のRNA種に組み込むように、単一ガイドRNA (「sgRNA」、または単に「gRNA」)を作製することができる。例えば、Jinek M. et al., Science 337:816-821(2012)を参照されたい(その内容全体が参照により本明細書に組み入れられる)。Cas9は、CRISPR反復配列中の短いモチーフ(PAMまたはプロトスペーサー隣接モチーフ)を認識して、自己と非自己を区別するのを助ける。
用語「プロトスペーサー隣接モチーフ(PAM)」またはPAM様モチーフは、CRISPR細菌適応免疫系においてCas9ヌクレアーゼによって標的化されるDNA配列の直後の2〜6塩基対DNA配列を指す。いくつかの実施形態では、PAMは5’PAM (すなわちプロトスペーサの5’末端の上流に位置する)であり得る。他の実施形態では、PAMは3’PAM (すなわちプロトスペーサの5’末端の下流に位置する)であり得る。
本明細書で提供される塩基エディターは、標準的または非標準的プロトスペーサー隣接モチーフ (PAM) 配列を含むヌクレオチド配列に結合することができるCRISPRタンパク質由来ドメインを含むことができる。PAM部位は、標的ポリヌクレオチド配列に近接するヌクレオチド配列である。本開示のいくつかの側面は、異なるPAM特異性を有するCRISPRタンパク質の全部または一部を含む塩基エディターを提供する。例えば、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、典型的に、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、ここで「NGG」中の「N」はアデニン (A) 、チミン(T) 、グアニン (G) 、またはシトシン (C) であり、Gはグアニンである。PAMはCRISPRタンパク質特異的であり得、異なるCRISPRタンパク質由来ドメインを含む異なる塩基エディター間で異なり得る。PAMは標的配列の5’または3’にあり得る。PAMは、標的配列の上流または下流にあり得る。PAMは、1、2、3、4、5、6、7、8、9、10またはそれ以上のヌクレオチドの長さであり得る。多くの場合、PAMは2〜6ヌクレオチドの長さである。
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFESPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD. この配列において、D1135、R1335、およびT1337から変異されてSpEQR Cas9を生じることができる残基E1135、Q1335、およびR1337には太字で下線を付している。
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD. この配列において、D1135、R1335、およびT1337から変異されてSpVQR Cas9を生じることができる残基V1135、Q1335、およびR1337には太字で下線を付している。
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKEYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFVSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASARELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKQYRSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
1135D1135、G1218、R1335、およびT1337から変異されてSpVRQR Cas9を生じることができる上記残基V1135、R1218、Q1335、およびR1337には太字で下線を付している。
例示的SpyMacCas9
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFGSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLADSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQIYNQLFEENPINASRVDAKAILSARLSKSRRLENLIAQLPGEKRNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNSEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGAYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDRGMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGHSLHEQIANLAGSPAIKKGILQTVKIVDELVKVMGHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFIKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEIQTVGQNGGLFDDNPKSPLEVTPSKLVPLKKELNPKKYGGYQKPTTAYPVLLITDTKQLIPISVMNKKQFEQNPVKFLRDRGYQQVGKNDFIKLPKYTLVDIGDGIKRLWASSKEIHKGNQLVVSKKSQILLYHAHHLDSDLSNDYLQNHNQQFDVLFNEIISFSKKCKLGKEHIQKIENVYSNKKNSASIEELAESFIKLLGFTQLGATSPFNFLGVKLNQKQYKGKKDYILPCTEGTLIRQSITGLYETRVDLSKIGED.
本開示のいくつかの態様は、高忠実度Cas9ドメインを提供する。いくつかの実施形態において、高忠実度Cas9ドメインは、対応する野生型Cas9ドメインと比較して、Cas9ドメインとDNAの糖-リン酸骨格との間の静電相互作用を減少させる1つ以上の突然変異を含む人工Cas9ドメインである。特定の理論に縛られることを望まないが、DNAの糖-リン酸骨格との静電相互作用を減少させた高忠実度Cas9ドメインは、より少ないオフターゲット効果を有し得る。ある態様において、Cas9ドメイン(例えば、野生型Cas9ドメイン)は、Cas9ドメインとDNAの糖-リン酸骨格との間の結合を低減させる一つ以上の突然変異を含む。ある態様において、Cas9ドメインは、Cas9ドメインとDNAの糖-リン酸骨格との間の結合を少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、または少なくとも70%だけ低減させる一つ以上の突然変異を含む。
では、Cas9と比べた高忠実度Cas9ドメイン突然変異は太字および下線で示されている。
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTAFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGALSRKLINGIRDKQSGKTILDFLKSDGFANRNFMALIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRAITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD.
1以上の核局在化配列 (NLS) を含むCRISPR酵素をコードするベクターを使用することができる。例えば、約1、2、3、4、5、6、7、8、9、10個のNLSを使用することができる。CRISPR酵素は、アミノ末端またはその近傍のNLS、カルボキシ末端またはその近傍の約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個またはそれ以上のNLS、またはこれらの任意の組み合わせ(例えばアミノ末端における1以上のNLSおよびカルボキシ末端における1以上のNLS)を含むことができる。複数のNLSが存在する場合、各NLSは他から独立して選択することができ、したがって1つのNLSが1つ以上のコピーで存在することができ、および/または1つ以上のコピーで存在する1つ以上の他のNLSと組み合わせて存在することができる。
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよび核酸塩基編集ドメイン(例えばデアミナーゼドメイン)を含む融合タンパク質を含む塩基エディターを本明細書に記載する。塩基エディターは、標的配列を認識することができるガイドポリヌクレオチドと相互作用することによって、標的ポリヌクレオチド配列中の1以上の塩基を編集するようにプログラムすることができる。標的配列がいったん認識されると、編集が行われるポリヌクレオチド上に塩基エディターが固定され、次いで、塩基エディターのデアミナーゼドメイン成分が標的塩基を編集することができる。
いくつかの実施形態において、本明細書に開示される塩基エディターは、ポリヌクレオチドの標的シチジン (C) 塩基を脱アミノ化してチミンの塩基対形成特性を有するウリジン (U) を生成することができる、シチジンデアミナーゼを含む融合タンパク質を含む。いくつかの実施形態において、例えば、ポリヌクレオチドが二本鎖(例えばDNA)である場合、ウリジン塩基は次いで、チミジン塩基で置換されて(例えば細胞修復機構により)、C:GからT:Aへの転移を生じさせることができる。他の実施形態において、塩基エディターによる核酸中のCからUへの脱アミノ化は、UからTへの置換を伴うことができない。
>tr|A5H718|A5H718_PETMA Cytosine deaminase OS=Petromyzon marinus OX=7757 PE=2 SV=1 アミノ酸配列:
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSG
TERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLK
IWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKT
LKRAEKRRSELSIMIQVKILHTTKSPAV
核酸配列: >EF094822.1 Petromyzon marinus isolate PmCDA.21 cytosine deaminase mRNA, complete cds:
TGACACGACACAGCCGTGTATATGAGGAAGGGTAGCTGGATGGGGGGGGGGGGAATACGTTCAGAGAGGA
CATTAGCGAGCGTCTTGTTGGTGGCCTTGAGTCTAGACACCTGCAGACATGACCGACGCTGAGTACGTGA
GAATCCATGAGAAGTTGGACATCTACACGTTTAAGAAACAGTTTTTCAACAACAAAAAATCCGTGTCGCA
TAGATGCTACGTTCTCTTTGAATTAAAACGACGGGGTGAACGTAGAGCGTGTTTTTGGGGCTATGCTGTG
AATAAACCACAGAGCGGGACAGAACGTGGAATTCACGCCGAAATCTTTAGCATTAGAAAAGTCGAAGAAT
ACCTGCGCGACAACCCCGGACAATTCACGATAAATTGGTACTCATCCTGGAGTCCTTGTGCAGATTGCGC
TGAAAAGATCTTAGAATGGTATAACCAGGAGCTGCGGGGGAACGGCCACACTTTGAAAATCTGGGCTTGC
AAACTCTATTACGAGAAAAATGCGAGGAATCAAATTGGGCTGTGGAACCTCAGAGATAACGGGGTTGGGT
TGAATGTAATGGTAAGTGAACACTACCAATGTTGCAGGAAAATATTCATCCAATCGTCGCACAATCAATT
GAATGAGAATAGATGGCTTGAGAAGACTTTGAAGCGAGCTGAAAAACGACGGAGCGAGTTGTCCATTATG
ATTCAGGTAAAAATACTCCACACCACTAAGAGTCCTGCTGTTTAAGAGGCTATGCGGATGGTTTTC
ヒトの活性化誘導型シチジンデアミナーゼ(AID)のコード配列(CDS)のアミノ酸配列および核酸配列を下記に示す。
>tr|Q6QJ80|Q6QJ80_HUMAN Activation-induced cytidine deaminase OS=Homo sapiens OX=9606 GN=AICDA PE=2 SV=1 アミノ酸配:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELL
FLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRK
AEPEGLRRLHRAGVQIAIMTFKAPV
核酸配列: >NG_011588.1:5001-15681 Homo sapiens activation induced cytidine deaminase (AICDA), RefSeqGene (LRG_17) on chromosome 12:
AGAGAACCATCATTAATTGAAGTGAGATTTTTCTGGCCTGAGACTTGCAGGGAGGCAAGAAGACACTCTG
GACACCACTATGGACAGGTAAAGAGGCAGTCTTCTCGTGGGTGATTGCACTGGCCTTCCTCTCAGAGCAA
ATCTGAGTAATGAGACTGGTAGCTATCCCTTTCTCTCATGTAACTGTCTGACTGATAAGATCAGCTTGAT
CAATATGCATATATATTTTTTGATCTGTCTCCTTTTCTTCTATTCAGATCTTATACGCTGTCAGCCCAAT
TCTTTCTGTTTCAGACTTCTCTTGATTTCCCTCTTTTTCATGTGGCAAAAGAAGTAGTGCGTACAATGTA
CTGATTCGTCCTGAGATTTGTACCATGGTTGAAACTAATTTATGGTAATAATATTAACATAGCAAATCTT
TAGAGACTCAAATCATGAAAAGGTAATAGCAGTACTGTACTAAAAACGGTAGTGCTAATTTTCGTAATAA
TTTTGTAAATATTCAACAGTAAAACAACTTGAAGACACACTTTCCTAGGGAGGCGTTACTGAAATAATTT
AGCTATAGTAAGAAAATTTGTAATTTTAGAAATGCCAAGCATTCTAAATTAATTGCTTGAAAGTCACTAT
GATTGTGTCCATTATAAGGAGACAAATTCATTCAAGCAAGTTATTTAATGTTAAAGGCCCAATTGTTAGG
CAGTTAATGGCACTTTTACTATTAACTAATCTTTCCATTTGTTCAGACGTAGCTTAACTTACCTCTTAGG
TGTGAATTTGGTTAAGGTCCTCATAATGTCTTTATGTGCAGTTTTTGATAGGTTATTGTCATAGAACTTA
TTCTATTCCTACATTTATGATTACTATGGATGTATGAGAATAACACCTAATCCTTATACTTTACCTCAAT
TTAACTCCTTTATAAAGAACTTACATTACAGAATAAAGATTTTTTAAAAATATATTTTTTTGTAGAGACA
GGGTCTTAGCCCAGCCGAGGCTGGTCTCTAAGTCCTGGCCCAAGCGATCCTCCTGCCTGGGCCTCCTAAA
GTGCTGGAATTATAGACATGAGCCATCACATCCAATATACAGAATAAAGATTTTTAATGGAGGATTTAAT
GTTCTTCAGAAAATTTTCTTGAGGTCAGACAATGTCAAATGTCTCCTCAGTTTACACTGAGATTTTGAAA
ACAAGTCTGAGCTATAGGTCCTTGTGAAGGGTCCATTGGAAATACTTGTTCAAAGTAAAATGGAAAGCAA
AGGTAAAATCAGCAGTTGAAATTCAGAGAAAGACAGAAAAGGAGAAAAGATGAAATTCAACAGGACAGAA
GGGAAATATATTATCATTAAGGAGGACAGTATCTGTAGAGCTCATTAGTGATGGCAAAATGACTTGGTCA
GGATTATTTTTAACCCGCTTGTTTCTGGTTTGCACGGCTGGGGATGCAGCTAGGGTTCTGCCTCAGGGAG
CACAGCTGTCCAGAGCAGCTGTCAGCCTGCAAGCCTGAAACACTCCCTCGGTAAAGTCCTTCCTACTCAG
GACAGAAATGACGAGAACAGGGAGCTGGAAACAGGCCCCTAACCAGAGAAGGGAAGTAATGGATCAACAA
AGTTAACTAGCAGGTCAGGATCACGCAATTCATTTCACTCTGACTGGTAACATGTGACAGAAACAGTGTA
GGCTTATTGTATTTTCATGTAGAGTAGGACCCAAAAATCCACCCAAAGTCCTTTATCTATGCCACATCCT
TCTTATCTATACTTCCAGGACACTTTTTCTTCCTTATGATAAGGCTCTCTCTCTCTCCACACACACACAC
ACACACACACACACACACACACACACACACACAAACACACACCCCGCCAACCAAGGTGCATGTAAAAAGA
TGTAGATTCCTCTGCCTTTCTCATCTACACAGCCCAGGAGGGTAAGTTAATATAAGAGGGATTTATTGGT
AAGAGATGATGCTTAATCTGTTTAACACTGGGCCTCAAAGAGAGAATTTCTTTTCTTCTGTACTTATTAA
GCACCTATTATGTGTTGAGCTTATATATACAAAGGGTTATTATATGCTAATATAGTAATAGTAATGGTGG
TTGGTACTATGGTAATTACCATAAAAATTATTATCCTTTTAAAATAAAGCTAATTATTATTGGATCTTTT
TTAGTATTCATTTTATGTTTTTTATGTTTTTGATTTTTTAAAAGACAATCTCACCCTGTTACCCAGGCTG
GAGTGCAGTGGTGCAATCATAGCTTTCTGCAGTCTTGAACTCCTGGGCTCAAGCAATCCTCCTGCCTTGG
CCTCCCAAAGTGTTGGGATACAGTCATGAGCCACTGCATCTGGCCTAGGATCCATTTAGATTAAAATATG
CATTTTAAATTTTAAAATAATATGGCTAATTTTTACCTTATGTAATGTGTATACTGGCAATAAATCTAGT
TTGCTGCCTAAAGTTTAAAGTGCTTTCCAGTAAGCTTCATGTACGTGAGGGGAGACATTTAAAGTGAAAC
AGACAGCCAGGTGTGGTGGCTCACGCCTGTAATCCCAGCACTCTGGGAGGCTGAGGTGGGTGGATCGCTT
GAGCCCTGGAGTTCAAGACCAGCCTGAGCAACATGGCAAAACGCTGTTTCTATAACAAAAATTAGCCGGG
CATGGTGGCATGTGCCTGTGGTCCCAGCTACTAGGGGGCTGAGGCAGGAGAATCGTTGGAGCCCAGGAGG
TCAAGGCTGCACTGAGCAGTGCTTGCGCCACTGCACTCCAGCCTGGGTGACAGGACCAGACCTTGCCTCA
AAAAAATAAGAAGAAAAATTAAAAATAAATGGAAACAACTACAAAGAGCTGTTGTCCTAGATGAGCTACT
TAGTTAGGCTGATATTTTGGTATTTAACTTTTAAAGTCAGGGTCTGTCACCTGCACTACATTATTAAAAT
ATCAATTCTCAATGTATATCCACACAAAGACTGGTACGTGAATGTTCATAGTACCTTTATTCACAAAACC
CCAAAGTAGAGACTATCCAAATATCCATCAACAAGTGAACAAATAAACAAAATGTGCTATATCCATGCAA
TGGAATACCACCCTGCAGTACAAAGAAGCTACTTGGGGATGAATCCCAAAGTCATGACGCTAAATGAAAG
AGTCAGACATGAAGGAGGAGATAATGTATGCCATACGAAATTCTAGAAAATGAAAGTAACTTATAGTTAC
AGAAAGCAAATCAGGGCAGGCATAGAGGCTCACACCTGTAATCCCAGCACTTTGAGAGGCCACGTGGGAA
GATTGCTAGAACTCAGGAGTTCAAGACCAGCCTGGGCAACACAGTGAAACTCCATTCTCCACAAAAATGG
GAAAAAAAGAAAGCAAATCAGTGGTTGTCCTGTGGGGAGGGGAAGGACTGCAAAGAGGGAAGAAGCTCTG
GTGGGGTGAGGGTGGTGATTCAGGTTCTGTATCCTGACTGTGGTAGCAGTTTGGGGTGTTTACATCCAAA
AATATTCGTAGAATTATGCATCTTAAATGGGTGGAGTTTACTGTATGTAAATTATACCTCAATGTAAGAA
AAAATAATGTGTAAGAAAACTTTCAATTCTCTTGCCAGCAAACGTTATTCAAATTCCTGAGCCCTTTACT
TCGCAAATTCTCTGCACTTCTGCCCCGTACCATTAGGTGACAGCACTAGCTCCACAAATTGGATAAATGC
ATTTCTGGAAAAGACTAGGGACAAAATCCAGGCATCACTTGTGCTTTCATATCAACCATGCTGTACAGCT
TGTGTTGCTGTCTGCAGCTGCAATGGGGACTCTTGATTTCTTTAAGGAAACTTGGGTTACCAGAGTATTT
CCACAAATGCTATTCAAATTAGTGCTTATGATATGCAAGACACTGTGCTAGGAGCCAGAAAACAAAGAGG
AGGAGAAATCAGTCATTATGTGGGAACAACATAGCAAGATATTTAGATCATTTTGACTAGTTAAAAAAGC
AGCAGAGTACAAAATCACACATGCAATCAGTATAATCCAAATCATGTAAATATGTGCCTGTAGAAAGACT
AGAGGAATAAACACAAGAATCTTAACAGTCATTGTCATTAGACACTAAGTCTAATTATTATTATTAGACA
CTATGATATTTGAGATTTAAAAAATCTTTAATATTTTAAAATTTAGAGCTCTTCTATTTTTCCATAGTAT
TCAAGTTTGACAATGATCAAGTATTACTCTTTCTTTTTTTTTTTTTTTTTTTTTTTTTGAGATGGAGTTT
TGGTCTTGTTGCCCATGCTGGAGTGGAATGGCATGACCATAGCTCACTGCAACCTCCACCTCCTGGGTTC
AAGCAAAGCTGTCGCCTCAGCCTCCCGGGTAGATGGGATTACAGGCGCCCACCACCACACTCGGCTAATG
TTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCAAACTCCTGACCTCAGAGG
ATCCACCTGCCTCAGCCTCCCAAAGTGCTGGGATTACAGATGTAGGCCACTGCGCCCGGCCAAGTATTGC
TCTTATACATTAAAAAACAGGTGTGAGCCACTGCGCCCAGCCAGGTATTGCTCTTATACATTAAAAAATA
GGCCGGTGCAGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAAGCCAAGGCGGGCAGAACACCCGAGGT
CAGGAGTCCAAGGCCAGCCTGGCCAAGATGGTGAAACCCCGTCTCTATTAAAAATACAAACATTACCTGG
GCATGATGGTGGGCGCCTGTAATCCCAGCTACTCAGGAGGCTGAGGCAGGAGGATCCGCGGAGCCTGGCA
GATCTGCCTGAGCCTGGGAGGTTGAGGCTACAGTAAGCCAAGATCATGCCAGTATACTTCAGCCTGGGCG
ACAAAGTGAGACCGTAACAAAAAAAAAAAAATTTAAAAAAAGAAATTTAGATCAAGATCCAACTGTAAAA
AGTGGCCTAAACACCACATTAAAGAGTTTGGAGTTTATTCTGCAGGCAGAAGAGAACCATCAGGGGGTCT
TCAGCATGGGAATGGCATGGTGCACCTGGTTTTTGTGAGATCATGGTGGTGACAGTGTGGGGAATGTTAT
TTTGGAGGGACTGGAGGCAGACAGACCGGTTAAAAGGCCAGCACAACAGATAAGGAGGAAGAAGATGAGG
GCTTGGACCGAAGCAGAGAAGAGCAAACAGGGAAGGTACAAATTCAAGAAATATTGGGGGGTTTGAATCA
ACACATTTAGATGATTAATTAAATATGAGGACTGAGGAATAAGAAATGAGTCAAGGATGGTTCCAGGCTG
CTAGGCTGCTTACCTGAGGTGGCAAAGTCGGGAGGAGTGGCAGTTTAGGACAGGGGGCAGTTGAGGAATA
TTGTTTTGATCATTTTGAGTTTGAGGTACAAGTTGGACACTTAGGTAAAGACTGGAGGGGAAATCTGAAT
ATACAATTATGGGACTGAGGAACAAGTTTATTTTATTTTTTGTTTCGTTTTCTTGTTGAAGAACAAATTT
AATTGTAATCCCAAGTCATCAGCATCTAGAAGACAGTGGCAGGAGGTGACTGTCTTGTGGGTAAGGGTTT
GGGGTCCTTGATGAGTATCTCTCAATTGGCCTTAAATATAAGCAGGAAAAGGAGTTTATGATGGATTCCA
GGCTCAGCAGGGCTCAGGAGGGCTCAGGCAGCCAGCAGAGGAAGTCAGAGCATCTTCTTTGGTTTAGCCC
AAGTAATGACTTCCTTAAAAAGCTGAAGGAAAATCCAGAGTGACCAGATTATAAACTGTACTCTTGCATT
TTCTCTCCCTCCTCTCACCCACAGCCTCTTGATGAACCGGAGGAAGTTTCTTTACCAATTCAAAAATGTC
CGCTGGGCTAAGGGTCGGCGTGAGACCTACCTGTGCTACGTAGTGAAGAGGCGTGACAGTGCTACATCCT
TTTCACTGGACTTTGGTTATCTTCGCAATAAGGTATCAATTAAAGTCGGCTTTGCAAGCAGTTTAATGGT
CAACTGTGAGTGCTTTTAGAGCCACCTGCTGATGGTATTACTTCCATCCTTTTTTGGCATTTGTGTCTCT
ATCACATTCCTCAAATCCTTTTTTTTATTTCTTTTTCCATGTCCATGCACCCATATTAGACATGGCCCAA
AATATGTGATTTAATTCCTCCCCAGTAATGCTGGGCACCCTAATACCACTCCTTCCTTCAGTGCCAAGAA
CAACTGCTCCCAAACTGTTTACCAGCTTTCCTCAGCATCTGAATTGCCTTTGAGATTAATTAAGCTAAAA
GCATTTTTATATGGGAGAATATTATCAGCTTGTCCAAGCAAAAATTTTAAATGTGAAAAACAAATTGTGT
CTTAAGCATTTTTGAAAATTAAGGAAGAAGAATTTGGGAAAAAATTAACGGTGGCTCAATTCTGTCTTCC
AAATGATTTCTTTTCCCTCCTACTCACATGGGTCGTAGGCCAGTGAATACATTCAACATGGTGATCCCCA
GAAAACTCAGAGAAGCCTCGGCTGATGATTAATTAAATTGATCTTTCGGCTACCCGAGAGAATTACATTT
CCAAGAGACTTCTTCACCAAAATCCAGATGGGTTTACATAAACTTCTGCCCACGGGTATCTCCTCTCTCC
TAACACGCTGTGACGTCTGGGCTTGGTGGAATCTCAGGGAAGCATCCGTGGGGTGGAAGGTCATCGTCTG
GCTCGTTGTTTGATGGTTATATTACCATGCAATTTTCTTTGCCTACATTTGTATTGAATACATCCCAATC
TCCTTCCTATTCGGTGACATGACACATTCTATTTCAGAAGGCTTTGATTTTATCAAGCACTTTCATTTAC
TTCTCATGGCAGTGCCTATTACTTCTCTTACAATACCCATCTGTCTGCTTTACCAAAATCTATTTCCCCT
TTTCAGATCCTCCCAAATGGTCCTCATAAACTGTCCTGCCTCCACCTAGTGGTCCAGGTATATTTCCACA
ATGTTACATCAACAGGCACTTCTAGCCATTTTCCTTCTCAAAAGGTGCAAAAAGCAACTTCATAAACACA
AATTAAATCTTCGGTGAGGTAGTGTGATGCTGCTTCCTCCCAACTCAGCGCACTTCGTCTTCCTCATTCC
ACAAAAACCCATAGCCTTCCTTCACTCTGCAGGACTAGTGCTGCCAAGGGTTCAGCTCTACCTACTGGTG
TGCTCTTTTGAGCAAGTTGCTTAGCCTCTCTGTAACACAAGGACAATAGCTGCAAGCATCCCCAAAGATC
ATTGCAGGAGACAATGACTAAGGCTACCAGAGCCGCAATAAAAGTCAGTGAATTTTAGCGTGGTCCTCTC
TGTCTCTCCAGAACGGCTGCCACGTGGAATTGCTCTTCCTCCGCTACATCTCGGACTGGGACCTAGACCC
TGGCCGCTGCTACCGCGTCACCTGGTTCACCTCCTGGAGCCCCTGCTACGACTGTGCCCGACATGTGGCC
GACTTTCTGCGAGGGAACCCCAACCTCAGTCTGAGGATCTTCACCGCGCGCCTCTACTTCTGTGAGGACC
GCAAGGCTGAGCCCGAGGGGCTGCGGCGGCTGCACCGCGCCGGGGTGCAAATAGCCATCATGACCTTCAA
AGGTGCGAAAGGGCCTTCCGCGCAGGCGCAGTGCAGCAGCCCGCATTCGGGATTGCGATGCGGAATGAAT
GAGTTAGTGGGGAAGCTCGAGGGGAAGAAGTGGGCGGGGATTCTGGTTCACCTCTGGAGCCGAAATTAAA
GATTAGAAGCAGAGAAAAGAGTGAATGGCTCAGAGACAAGGCCCCGAGGAAATGAGAAAATGGGGCCAGG
GTTGCTTCTTTCCCCTCGATTTGGAACCTGAACTGTCTTCTACCCCCATATCCCCGCCTTTTTTTCCTTT
TTTTTTTTTTGAAGATTATTTTTACTGCTGGAATACTTTTGTAGAAAACCACGAAAGAACTTTCAAAGCC
TGGGAAGGGCTGCATGAAAATTCAGTTCGTCTCTCCAGACAGCTTCGGCGCATCCTTTTGGTAAGGGGCT
TCCTCGCTTTTTAAATTTTCTTTCTTTCTCTACAGTCTTTTTTGGAGTTTCGTATATTTCTTATATTTTC
TTATTGTTCAATCACTCTCAGTTTTCATCTGATGAAAACTTTATTTCTCCTCCACATCAGCTTTTTCTTC
TGCTGTTTCACCATTCAGAGCCCTCTGCTAAGGTTCCTTTTCCCTCCCTTTTCTTTCTTTTGTTGTTTCA
CATCTTTAAATTTCTGTCTCTCCCCAGGGTTGCGTTTCCTTCCTGGTCAGAATTCTTTTCTCCTTTTTTT
TTTTTTTTTTTTTTTTTTTTAAACAAACAAACAAAAAACCCAAAAAAACTCTTTCCCAATTTACTTTCTT
CCAACATGTTACAAAGCCATCCACTCAGTTTAGAAGACTCTCCGGCCCCACCGACCCCCAACCTCGTTTT
GAAGCCATTCACTCAATTTGCTTCTCTCTTTCTCTACAGCCCCTGTATGAGGTTGATGACTTACGAGACG
CATTTCGTACTTTGGGACTTTGATAGCAACTTCCAGGAATGTCACACACGATGAAATATCTCTGCTGAAG
ACAGTGGATAAAAAACAGTCCTTCAAGTCTTCTCTGTTTTTATTCTTCAACTCTCACTTTCTTAGAGTTT
ACAGAAAAAATATTTATATACGACTCTTTAAAAAGATCTATGTCTTGAAAATAGAGAAGGAACACAGGTC
TGGCCAGGGACGTGCTGCAATTGGTGCAGTTTTGAATGCAACATTGTCCCCTACTGGGAATAACAGAACT
GCAGGACCTGGGAGCATCCTAAAGTGTCAACGTTTTTCTATGACTTTTAGGTAGGATGAGAGCAGAAGGT
AGATCCTAAAAAGCATGGTGAGAGGATCAAATGTTTTTATATCAACATCCTTTATTATTTGATTCATTTG
AGTTAACAGTGGTGTTAGTGATAGATTTTTCTATTCTTTTCCCTTGACGTTTACTTTCAAGTAACACAAA
CTCTTCCATCAGGCCATGATCTATAGGACCTCCTAATGAGAGTATCTGGGTGATTGTGACCCCAAACCAT
CTCTCCAAAGCATTAATATCCAATCATGCGCTGTATGTTTTAATCAGCAGAAGCATGTTTTTATGTTTGT
ACAAAAGAAGATTGTTATGGGTGGGGATGGAGGTATAGACCATGCATGGTCACCTTCAAGCTACTTTAAT
AAAGGATCTTAAAATGGGCAGGAGGACTGTGAACAAGACACCCTAATAATGGGTTGATGTCTGAAGTAGC
AAATCTTCTGGAAACGCAAACTCTTTTAAGGAAGTCCCTAATTTAGAAACACCCACAAACTTCACATATC
ATAATTAGCAAACAATTGGAAGGAAGTTGCTTGAATGTTGGGGAGAGGAAAATCTATTGGCTCTCGTGGG
TCTCTTCATCTCAGAAATGCCAATCAGGTCAAGGTTTGCTACATTTTGTATGTGTGTGATGCTTCTCCCA
AAGGTATATTAACTATATAAGAGAGTTGTGACAAAACAGAATGATAAAGCTGCGAACCGTGGCACACGCT
CATAGTTCTAGCTGCTTGGGAGGTTGAGGAGGGAGGATGGCTTGAACACAGGTGTTCAAGGCCAGCCTGG
GCAACATAACAAGATCCTGTCTCTCAAAAAAAAAAAAAAAAAAAAGAAAGAGAGAGGGCCGGGCGTGGTG
GCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGCCGGGCGGATCACCTGTGGTCAGGAGTTTGAGA
CCAGCCTGGCCAACATGGCAAAACCCCGTCTGTACTCAAAATGCAAAAATTAGCCAGGCGTGGTAGCAGG
CACCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCGCTTGAACCCAGGAGGTGGAGGTTGCA
GTAAGCTGAGATCGTGCCGTTGCACTCCAGCCTGGGCGACAAGAGCAAGACTCTGTCTCAGAAAAAAAAA
AAAAAAAGAGAGAGAGAGAGAAAGAGAACAATATTTGGGAGAGAAGGATGGGGAAGCATTGCAAGGAAAT
TGTGCTTTATCCAACAAAATGTAAGGAGCCAATAAGGGATCCCTATTTGTCTCTTTTGGTGTCTATTTGT
CCCTAACAACTGTCTTTGACAGTGAGAAAAATATTCAGAATAACCATATCCCTGTGCCGTTATTACCTAG
CAACCCTTGCAATGAAGATGAGCAGATCCACAGGAAAACTTGAATGCACAACTGTCTTATTTTAATCTTA
TTGTACATAAGTTTGTAAAAGAGTTAAAAATTGTTACTTCATGTATTCATTTATATTTTATATTATTTTG
CGTCTAATGATTTTTTATTAACATGATTTCCTTTTCTGATATATTGAAATGGAGTCTCAAAGCTTCATAA
ATTTATAACTTTAGAAATGATTCTAATAACAACGTATGTAATTGTAACATTGCAGTAATGGTGCTACGAA
GCCATTTCTCTTGATTTTTAGTAAACTTTTATGACAGCAAATTTGCTTCTGGCTCACTTTCAATCAGTTA
AATAAATGATAAATAATTTTGGAAGCTGTGAAGATAAAATACCAAATAAAATAATATAAAAGTGATTTAT
ATGAAGTTAAAATAAAAAATCAGTATGATGGAATAAACTTG
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL
DGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNK PQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRG NGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQ LNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQ VYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDP KVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKF NYDEFQHCWSKFVYSQ RELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVER MHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTC FTSWSPCFSCAQEMAKFISK KHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISF T YSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHG FLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCI FTARIYDDQGRCQEGLRTLAEAGAKISF TYSEFKHCWDTFVDHQGCPFQPWDGLD EHSQDLSGRLRAILQ
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHG FLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCI FTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGCPFQPWDGLDE HSQDLSGRLRAILQ
いくつかの実施形態において、本明細書に記載される塩基エディターは、アデノシンデアミナーゼを含むデアミナーゼドメインを含むことができる。塩基エディターのこのようなアデノシンデアミナーゼドメインは、Aを脱アミノ化して、Gの塩基対形成特性を示すイノシン (I) を形成することによって、アデニン (A) 核酸塩基からグアニン (G) 核酸塩基への編集することを促進することができる。アデノシンデアミナーゼは、デオキシリボ核酸 (DNA) 中のデオキシアデノシン残基のアデニンを脱アミノ化すること(すなわちアミン基を除去すること)ができる。
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
を含み、これは「TadA参照配列」と呼ばれる。
MRRAFITGVFFLSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTD
を含む。
MGSHMTNDIYFMTLAIEEAKKAAQLGEVPIGAIITKDDEVIARAHNLRETLQQPTAHAEHIAIERAAKVLGSWRLEGCTLYVTLEPCVMCAGTIVMSRIPRVVYGADDPKGGCS GS LMNLLQQS NFNHRAIVDKG VLKE AC S TLLTTFFKNLRANKKS TN
MTQDELYMKEAIKEAKKAEEKGEVPIGAVLVINGEIIARAHNLRETEQRSIAHAEML VIDEACKALGTWRLEGATLYVTLEPCPMCAGAVVLSRVEKVVFGAFDPKGGC S GTLMN LLQEERFNHQAEVVSGVLEEECGGMLSAFFRELRKKKKAARKNLSE
MPPAFITGVTSLSDVELDHEYWMRHALTLAKRAWDEREVPVGAVLVHNHRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVLQNYRLLDTTLYVTLEPCVMCAGAMVHSRIGRVVFGARDAKTGAAGSLIDVLHHPGMNHRVEIIEGVLRDECATLLSDFFRMRRQEIK ALKKADRAEGAGPAV
MDE YWMQVAMQM AEKAEAAGE VPVGA VLVKDGQQIATGYNLS IS QHDPT AHAEILCLRSAGKKLENYRLLDATLYITLEPCAMCAGAMVHSRIARVVYGARDEKTGAAGTVVNLLQHPAFNHQVEVTSGVLAEACSAQLSRFFKRRRDEKKALKLAQRAQQGIE
MDAAKVRSEFDEKMMRYALELADKAEALGEIPVGAVLVDDARNIIGEGWNLSIVQSDPTΑΗAEIIALRNGAKNIQNYRLLNSTLYVTLEPCTMCAGAILHS RIKRLVFG ASDYKTGAIGSRFHFFDDYKMNHTLEITSGVLAEECSQKLSTFFQKRREEKKIEKALLKSLSDK
MRTDESEDQDHRMMRLALDAARAAAEAGETPVGAVILDPSTGEVIATAGNGPIAAHDPTAHAEIAAMRAAAAKLGNYRLTDLTLVVTLEPCAMCAGAISHARIGRVVFGADD PKGGAVVHGPKFFAQPTCHWRPEVTGGVLADESADLLRGFFRARRKAKI
MSSLKKTPIRDDAYWMGKAIREAAKAAARDEVPIGAVIVRDGAVIGRGHNLREGSNDPSAHAEMIAIRQAARRSANWRLTGATLYVTLEPCLMCMGAIILARLERVVFGCYDPKGGAAGSLYDLSADPRLNHQVRLSPGVCQEECGTMLSDFFRDLRRRKKAKATPALF IDERKVPPEP
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTD
(A106V_D108N), (R107C_D108N), (H8Y_D108N_N127S_D 147Y_Q154H), (H8Y_R24W_D108N_N127S_D147Y_E155V), (D108N_D147Y_E155V), (H8Y_D108N_N127S), (H8Y_D108N_N127S_D147Y_Q154H), (A106V_D108N_D147Y_E155V) (D108Q_D147Y_E155V) (D108M_D147Y_E155V), (D108L_D147Y_E155V), (D108K_D147Y_E155V), (D108I_D147Y_E155V),
(D108F_D147Y_E155V), (A106V_D108N_D147Y), (A106V_D108M_D147Y_E155V),
(E59A_A106V_D108N_D147Y_E155V), (E59A cat dead_A106V_D108N_D147Y_E155V),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156Y),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F), (D103A_D104N),
(G22P_D103A_D104N), (G22P_D103A_D104N_S138 A), (D103 A_D104N_S138A),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(E25G_R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F), (E25D_R26G_L84F_A106V_R107K_D108N_H123Y_A142N_A143G_D147Y_E155V_
I156F), (R26Q_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25M_R26G_L84F_A106V_R107P_D108N_H123Y_A142N_A143D_D147Y_E155V
_I156F), (R26C_L84F_A106V_R107H_D108N_H123Y_A142N_D147Y_E155V_I156F), (L84F_A106V_D108N_H123Y_A142N_A143L_D147Y_E155V_I156F),
(R26G_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(E25A_R26G_L84F_A106V_R107N_D108N_H123Y_A142N_A143E_D147Y_E155V
_I156F),
(R26G_L84F_A106V_R107H_D108N_H123Y_A142N_A143D_D147Y_E155V_I156F),
(A106V_D108N_A142N_D147Y_E155V),
(R26G_A106V_D108N_A142N_D147Y_E155V),
(E25D_R26G_A106V_R107K_D108N_A142N_A143G_D147Y_E155V),
(R26G_A106V_D108N_R107H_A142N_A143D_D147Y_E155V),
(E25D_R26G_A106V_D108N_A142N_D147Y_E155V),
(A106V_R107K_D108N_A142N_D147Y_E155V),
(A106V_D108N_A142N_A143G_D147Y_E155V),
(A106V_D108N_A142N_A143L_D147Y_E155V),
(H36L_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(N37T_P48T_M70L_L84F_A106V_D108N_H123Y_D147Y_I49V_E155V_I156F),
(N37S_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K161T),
(H36L_L84F_A106V_D108N_H123Y_D147Y_Q154H_E155V_I156F),
(N72S_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F),
(H36L_P48L_L84F_A106V_D108N_H123Y_E134G_D147Y_E155V_I156F),
(H36L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N), (H36L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F_K161T),
(N37S_R51H_D77G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_K157N),
(D24G_Q71R_L84F_H96L_A106V_D108N_H123Y_D147Y_E155V_I156F_K160E),
(H36L_G67V_L84F_A106V_D108N_H123Y_S146T_D147Y_E155V_I156F),
(Q71L_L84F_A106V_D108N_H123Y_L137M_A143E_D147Y_E155V_I156F),
(E25G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A91T_F104I_A106V_D108N_H123Y_D147Y_E155V_I156F),
(N72D_L84F_A106V_D108N_H123Y_G125A_D147Y_E155V_I156F),
(P48S_L84F_S97C_A106V_D108N_H123Y_D147Y_E155V_I156F),
(W23G_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(D24G_P48L_Q71R_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F_Q159L),
(L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F),
(H36L_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F
_K157N), (N37S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_D147Y_E155V_I156F),
(R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E_K161T),
(L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F_K157N_K160E), (R74Q
L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74A_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(R74Q_L84F_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_R98Q_A106V_D108N_H123Y_D147Y_E155V_I156F),
(L84F_A106V_D108N_H123Y_R129Q_D147Y_E155V_I156F),
(P48S_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F), (P48S_A142N),
(P48T_I49V_L84F_A106V_D108N_H123Y_A142N_D147Y_E155V_I156F_L157N),
(P48T_I49V_A142N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48S_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F (H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48T_I49V_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_ I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_A142N_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152H_E155V_I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_E155V
_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142A_S146C_D147Y_R152P _E155V_I156F _K157N),
(W23L_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146R_D147Y_E155V_I156F _K161T),
(W23R_H36L_P48A_R51L_L84F_A106V_D108N_H123Y_S146C_D147Y_R152P_E155V _I156F _K157N),
(H36L_P48A_R51L_L84F_A106V_D108N_H123Y_A142N_S146C_D147Y_R152P_E155V
_I156F _K157N).
典型的には、S. pyogenes由来のCas9 (spCas9) などのCas9タンパク質は、特定の核酸領域に結合するために標準的なNGG PAM配列を必要とし、ここで「NGG」の「N」はアデノシン (A) 、チミジン (T) またはシトシン (C) であり、Gはグアノシンである。これは、ゲノム内の所望の塩基を編集する能力を制限し得る。いくつかの実施形態において、本明細書に提供される塩基編集融合タンパク質は、正確な位置、例えばPAMの上流にある標的塩基を含む領域に配置することが必要になり得る。例えばKomor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage” Nature 533, 420-424 (2016)参照(これらの内容全体は、参照により本明細書に組み込まれる)。従って、いくつかの実施形態において、本明細書で提供される融合タンパク質のいずれかは、標準的(例えばNGG)PAM配列を含まないヌクレオチド配列に結合することができるCas9ドメインを含み得る。非標準的PAM配列に結合するCas9ドメインは本技術分野において記述されており当業者には明らかであろう。例えば、非標準PAM配列に結合するCas9ドメインは、Kleinstiver, B. P., et al., “Engineered CRISPR-Cas9 nucleases with altered PAM specificities” Nature 523, 481-485 (2015); およびKleinstiver, B. P., et al., “Broadening the targeting range of Staphylococcus aureus CRISPR-Cas9 by modifying PAM recognition” Nature Biotechnology 33, 1293-1298 (2015); Nishimasu, H., et al., “Engineered CRISPR-Cas9 nuclease with expanded targeting space” Science. 2018 Sep 21;361(6408):1259-1262, Chatterjee, P., et al., Minimal PAM specificity of a highly similar SpCas9 ortholog” Sci Adv. 2018 Oct 24;4(10):eaau0766. doi: 10.1126/sciadv.aau0766に記述されており、それぞれの全内容を参照によりここに組み込む。次の表1に、いくつかのPAMバリアントを示す。
本開示のいくつかの態様は、本明細書に提供される融合タンパク質または複合体を使用する方法を提供する。例えば、本開示のいくつかの局面は、目的タンパク質をコードするDNA分子を、本明細書中に提供される融合タンパク質のいずれか、および少なくとも一つのガイドRNAと接触させることを含む方法を提供し、ここで、ガイドRNAは、約15〜100ヌクレオチド長であり、標的配列に相補的である少なくとも10個の連続したヌクレオチドの配列を含む。いくつかの実施形態において、標的配列の3’末端は、標準的PAM配列(NGG)にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、標準的PAM配列(NGG)にすぐ隣接していない。いくつかの実施形態において、標的配列の3’末端は、AGC、GAG、TTT、GTG、またはCAA配列にすぐ隣接している。いくつかの実施形態において、標的配列の3’末端は、NGA、NAA、NGCG、NGN、NNGRRT、NNNRRT、NGCG、NGCN、NGTN、NGTN、NGTN、または5’ (TTTV) 配列にすぐ隣接している。
本明細書に記載される塩基エディターは、ポリヌクレオチドの核酸塩基の編集、修飾、または改変を促進させるのを助ける任意のドメインを含むことができる。ある態様において、塩基エディターは、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例えばCas9)、核酸塩基編集ドメイン(例えばデアミナーゼドメイン)、および一つ以上のさらなるドメインを含む。場合によっては、追加のドメインは、塩基エディターの酵素的または触媒的機能、塩基エディターの結合機能を促進することができ、または所望の塩基編集結果に干渉し得る細胞機構(例えば酵素)の阻害因子であり得る。ある態様において、塩基エディターは、ヌクレアーゼ、ニッカーゼ、リコンビナーゼ、デアミナーゼ、メチルトランスフェラーゼ、メチラーゼ、アセチラーゼ、アセチルトランスフェラーゼ、転写アクチベーター、または転写リプレッサードメインを含むことができる。
本明細書で提供される塩基エディターシステムは、 (a) 対象のポリヌクレオチド(例えば、二本鎖DNAまたはRNA、一本鎖DNAまたはRNA)の標的ヌクレオチド配列を、核酸塩基エディター(例えば、アデノシン塩基エディターまたはシチジン塩基エディター)およびガイドポリ核酸(例えばgRNA)を含む塩基エディターシステムと接触させる工程であって、標的ヌクレオチド配列は標的核酸塩基対を含む、工程と;(b) 標的領域の鎖分離を誘導する工程と;(c) 標的領域の一本鎖における標的核酸塩基対の第1の核酸塩基を第2の核酸塩基に変換する工程と;(d) 標的領域の鎖を2本以上は切断することなく、第1の核酸塩基に相補的な第3の核酸塩基が、第2の核酸塩基に相補的な第4の核酸塩基に置換される工程とを含む。一部の実施形態では、ステップ (b) は省略されることを理解されたい。ある態様において、標的核酸塩基対は、1以上の遺伝子における複数の核酸塩基対である。いくつかの実施形態において、本明細書に提供される塩基エディターシステムは、1以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。ある態様において、複数の核酸塩基対は、同一遺伝子内に位置する。いくつかの実施形態において、複数の核酸塩基対は、1またはそれより多い遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。
表2:ABEの遺伝子型
NH2-[核酸塩基編集ドメイン]-リンカー1-[例えば Cas9 由来ドメイン]-COOH;
NH2-[例えば シチジンデアミナーゼ]-リンカー1-[例えば Cas9 由来ドメイン]-COOH;
NH2-[例えば シチジンデアミナーゼ]-リンカー1-[例えば Cas9 由来ドメイン]-リンカー2-[UGI]-COOH;
NH2-[例えば APOBEC]-リンカー1-[例えば Cas9 由来ドメイン]-COOH;
NH2-[例えば シチジンデアミナーゼ]-リンカー1-[例えば Cas9 由来ドメイン]-COOH;
NH2-[例えば APOBEC]-リンカー1-[例えば Cas9 由来ドメイン]-COOH;
NH2-[例えば APOBEC]-リンカー1-[例えば Cas9 由来ドメイン]-リンカー2-[UGI]-COOH
NH2-[例えば アデノシンデアミナーゼ]-[例えばCas9 由来ドメイン]-COOH;
NH2-[例えば Cas9 由来ドメイン]-[例えば アデノシンデアミナーゼ]-COOH;
NH2-[例えば アデノシンデアミナーゼ]-[例えばCas9 由来ドメイン]-[イノシンBER阻害因子]-COOH;
NH2-[例えば アデノシンデアミナーゼ]-[ イノシンBER阻害因子]-[例えば Cas9 由来ドメイン]-COOH;
NH2-[イノシンBER阻害因子]-[例えば アデノシンデアミナーゼ]-[例えばCas9 由来ドメイン]-COOH;
NH2-[例えば Cas9 由来ドメイン]-[例えば アデノシンデアミナーゼ]-[ イノシンBER阻害因子]-COOH;
NH2-[例えば Cas9 由来ドメイン]-[ イノシンBER阻害因子]-[例えば アデノシンデアミナーゼ]-COOH; または
NH2-[イノシンBER阻害因子]-[例えば Cas9 由来ドメイン]-[例えば アデノシンデアミナーゼ]-COOH
NH2-[APOBEC1]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-COOH;
NH2-[CDA1]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-COOH;
NH2-[AID]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-COOH;
NH2-[APOBEC1]-リンカー1-[Cas9(D10A)]-リンカー2-[SSB]-COOH;
NH2-[UGI]-リンカー1-[ABOBEC1]-リンカー2-[Cas9(D10A)]-COOH;
NH2-[APOBEC1]-リンカー1-[Cas9(D10A)]-リンカー2-[UGI]-リンカー3-[UGI]-COOH;
NH2-[Cas9(D10A)]-リンカー1-[CDA1]-リンカー2-[UGI]-COOH;
NH2-[Gam]-リンカー1-[APOBEC1]-リンカー2-[Cas9(D10A)]-リンカー3-[UGI]-COOH;
NH2-[Gam]-リンカー1-[APOBEC1]-リンカー2-[Cas9(D10A)]-リンカー3-[UGI]-リンカー4-[UGI]-COOH;
NH2-[APOBEC1]-リンカー1-[dCas9(D10A, H840A)]-リンカー2-[UGI]-COOH; または
NH2-[APOBEC1]-リンカー1-[dCas9(D10A, H840A)]-COOH
CRISPR-Cas9ヌクレアーゼは、標的ゲノム編集を媒介するために広く使用されている。ほとんどのゲノム編集応用において、Cas9はガイドポリヌクレオチド(例えば単一ガイドRNA (sgRNA))と複合体を形成し、sgRNA配列により指定される標的部位で二本鎖DNA切断 (DSB) を誘導する。細胞は主に非相同末端結合 (NHEJ) 修復経路を介してこのDSBに応答し、遺伝子を破壊するフレームシフト変異を生じる確率的挿入または欠失 (インデル) を生じる。DSBに隣接する配列と高度の相同性を有するドナーDNA鋳型の存在下で、相同性指向性修復 (HDR) として知られる代替経路を介して遺伝子補正が達成され得る。残念ながら、ほとんどの非侵襲的条件下では、HDRは非効率であり、細胞状態および細胞型に依存し、より高いインデルの頻度によって支配される。ヒトの疾患に関連する既知の遺伝的変異の大部分は点突然変異であるため、より効率的かつクリーンに正確な点突然変異を作製できる方法が必要である。本明細書に提供される塩基編集システムは、二本鎖DNA切断を生じることなく、ドナーDNA鋳型を必要とせず、かつ過剰な確率的挿入および欠失を誘導することなく、ゲノム編集を編集するための新しい方法を提供する。
いくつかの実施形態において、本明細書に提供される塩基エディターシステムは、1以上の遺伝子における複数の核酸塩基対の多重編集を可能にする。ある態様において、複数の核酸塩基対は、同一遺伝子内に位置する。いくつかの実施形態において、複数の核酸塩基対は、1つまたはそれより多い遺伝子に位置し、ここで、少なくとも1つの遺伝子は、異なる遺伝子座に位置する。ある態様において、多重編集は、1以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態では、多重編集は、1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、単一のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、複数のガイドポリヌクレオチドを有する1つ以上の塩基エディターシステムを含むことができる。いくつかの実施形態において、多重編集は、単一の塩基エディターシステムを有する1以上のガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドを含むことができる。いくつかの実施形態において、多重編集は、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要としない少なくとも1つのガイドポリヌクレオチドと、標的ポリヌクレオチド配列への結合を標的化するためにPAM配列を必要とする少なくとも1つのガイドポリヌクレオチドとの混合物を含むことができる。本明細書に記載される塩基エディターのいずれかを使用する多重編集の特徴は、本明細書に提供される塩基エディターのいずれかを使用する方法の任意の組み合わせに適用され得ることを理解されたい。また、本明細書に記載される塩基エディターのいずれかを使用する多重編集は、複数の核酸塩基対の順次的編集を含むことができることを理解されたい。
疾患関連遺伝子およびアリルにおける点突然変異の補正は、治療および基礎研究への応用を有する遺伝子補正のための新しい戦略を切り開く。ここで開示される部位特異的単一塩基改変システムは、ある遺伝子の機能を意図的に抑制または除去する「リバース」遺伝子療法においても応用を有し得る。これらのケースでは、タンパク質において不活性化変異をもたらす残基を部位特異的に変異させること、またはタンパク質の機能を阻害する変異を用いて、in vitro、ex vivo、またはin vivoでタンパク質機能を除去または阻害することができる。
いくつかの態様において、本明細書において提供される方法の目的は、遺伝子編集を介して機能不全遺伝子の機能を回復させることである。いくつかの実施形態において、機能不全遺伝子の機能は、意図された突然変異を導入することによって回復される。本明細書において提供される核酸塩基編集タンパク質は、例えばヒト細胞培養物中の疾患関連突然変異を補正することによって、インビトロでの遺伝子編集に基づくヒト治療のために検証され得る。本明細書において提供される核酸塩基編集タンパク質、例えば、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメイン(例:Cas9)および核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼドメインまたはシチジンデアミナーゼドメイン)を含む融合タンパク質は、任意のAからGまたはCからTへの単一点突然変異を補正するために使用することができることが当業者によって理解されよう。最初のケースでは、変異体AからIへの脱アミノ化が変異を修正し、後者のケースでは、変異体Tと塩基対を形成しているAの脱アミノ化とそれに続く一回の複製が変異を修正する。
いくつかの実施形態では、本明細書に提供される塩基エディターは、1つ以上の補完的(compensatory)変異を導入して、遺伝子のオープンリーディングフレームの変異を補正することができ、そしてそのことは、(1)活性部位変異を補正することにより、もしくは触媒活性もしくは基質親和性を増加させるアロステリック変異を導入することにより、タンパク質の活性を増加させるか、(2) タンパク質の安定性を増加させるか、または(3)翻訳率を向上させること、エンドソーム放出を増加させること、シグナルペプチドプロセシングを改善すること、もしくは他のタンパク質(例えばリプレッサーまたはシャペロン)との相互作用を増加/減少させることによりタンパク質の発現を増加させる。いくつかの実施形態では、補完的変異は疾患原因変異を無効にし得る。補完的変異導入の非限定的な例は表3Aおよび3Bに記載されている。突然変異および他の配列バリエーションを記述する命名法の詳細は、den Dunnen, J.T. and Antonarakis, S.E., “Mutation Nomenclature Extensions and Suggestions to Describe Complex Mutations: A Discussion.” Human Mutation 15:712 (2000)に記載されており、その内容全体が参照により本明細書に組み入れられる。
本開示による核酸塩基エディターをコードする核酸は、当業者に知られる方法によって、または本明細書に記載されるように、対象に投与され、またはインビトロで細胞に送達され得る。一実施形態では、核酸塩基エディターは、肝臓、肺、または他の任意の器官およびそれらの前駆体の細胞に選択的に送達される。特定の実施形態では、編集を経た細胞が、コードされるタンパク質の機能に対する遺伝子編集の機能的影響を圧制するために使用され得る。一実施形態では、核酸塩基エディターは、例えばベクター(例えばウイルス性ベクターまたは非ウイルス性ベクター)、ベクターに基づかない方法(例えば裸のDNA、DNA複合体、脂質ナノ粒子を使用すること)、またはそれらの組合せによって送達され得る。
表5は、遺伝子導入および/またはナノ粒子製剤における使用のための例示的ポリマーを列挙する。
表6は、本明細書で記述される融合タンパク質をコードするポリヌクレオチドのための送達法を要約する。
発現を増強し、可能性のある毒性を低減するために、塩基エディターコード配列および/またはガイド核酸は、例えば擬似Uまたは5-メチル-Cを用いて、1以上の修飾ヌクレオシドを含むように修飾され得る。いくつかの実施形態では、gRNA分子は、最初と最後の3塩基についてホスホロチオエート結合および2’O-Me修飾を有する。
AGGAAAUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGAGCCACC
GCGGCCGCUUAAUUAAGCUGCCUUCUGCGGGGCUUGCCUUCUGGCCAUGCCCUUCUUCUCUCCCUUGCACCUGUACCUCUUGGUCUUUGAAUAAAGCCUGAGUAGGAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
Cap-AGGAAAUAAGAGAGAAAAGAAGAGUAAGAAGAAAUAUAAGAGCCACCAUGAGCAGCGAGACAGGCCCUGUGGCUGUGGAUCCUACACUGCGGAGAAGAAUCGAGCCCCACGAGUUCGAGGUGUUCUUCGACCCCAGAGAGCUGCGGAAAGAGACAUGCCUGCUGUACGAGAUCAACUGGGGCGGCAGACACUCUAUCUGGCGGCACACAAGCCAGAACACCAACAAGCACGUGGAAGUGAACUUUAUCGAGAAGUUUACGACCGAGCGGUACUUCUGCCCCAACACCAGAUGCAGCAUCACCUGGUUUCUGAGCUGGUCCCCUUGCGGCGAGUGCAGCAGAGCCAUCACCGAGUUUCUGUCCAGAUAUCCCCACGUGACCCUGUUCAUCUAUAUCGCCCGGCUGUACCACCACGCCGAUCCUAGAAAUAGACAGGGACUGCGCGACCUGAUCAGCAGCGGAGUGACCAUCCAGAUCAUGACCGAGCAAGAGAGCGGCUACUGCUGGCGGAACUUCGUGAACUACAGCCCCAGCAACGAAGCCCACUGGCCUAGAUAUCCUCACCUGUGGGUCCGACUGUACGUGCUGGAACUGUACUGCAUCAUCCUGGGCCUGCCUCCAUGCCUGAACAUCCUGAGAAGAAAGCAGCCUCAGCUGACCUUCUUCACAAUCGCCCUGCAGAGCUGCCACUACCAGAGACUGCCUCCACACAUCCUGUGGGCCACCGGACUUAAGAGCGGAGGAUCUAGCGGCGGCUCUAGCGGAUCUGAGACACCUGGCACAAGCGAGUCUGCCACACCUGAGAGUAGCGGCGGAUCUUCUGGCGGCUCCGACAAGAAGUACUCUAUCGGACUGGCCAUCGGCACCAACUCUGUUGGAUGGGCCGUGAUCACCGACGAGUACAAGGUGCCCAGCAAGAAAUUCAAGGUGCUGGGCAACACCGACCGGCACAGCAUCAAGAAGAAUCUGAUCGGCGCCCUGCUGUUCGACUCUGGCGAAACAGCCGAAGCCACCAGACUGAAGAGAACCGCCAGGCGGAGAUACACCCGGCGGAAGAACCGGAUCUGCUACCUGCAAGAGAUCUUCAGCAACGAGAUGGCCAAGGUGGACGACAGCUUCUUCCACAGACUGGAAGAGUCCUUCCUGGUGGAAGAGGACAAGAAGCACGAGCGGCACCCCAUCUUCGGCAACAUCGUGGAUGAGGUGGCCUACCACGAGAAGUACCCCACCAUCUACCACCUGAGAAAGAAACUGGUGGACAGCACCGACAAGGCCGACCUGAGACUGAUCUACCUGGCUCUGGCCCACAUGAUCAAGUUCCGGGGCCACUUUCUGAUCGAGGGCGAUCUGAACCCCGACAACAGCGACGUGGACAAGCUGUUCAUCCAGCUGGUGCAGACCUACAACCAGCUGUUCGAGGAAAACCCCAUCAACGCCUCUGGCGUGGACGCCAAGGCUAUCCUGUCUGCCAGACUGAGCAAGAGCAGAAGGCUGGAAAACCUGAUCGCCCAGCUGCCUGGCGAGAAGAAGAAUGGCCUGUUCGGCAACCUGAUUGCCCUGAGCCUGGGACUGACCCCUAACUUCAAGAGCAACUUCGACCUGGCCGAGGAUGCCAAACUGCAGCUGAGCAAGGACACCUACGACGACGACCUGGACAAUCUGCUGGCCCAGAUCGGCGAUCAGUACGCCGACUUGUUUCUGGCCGCCAAGAACCUGUCCGACGCCAUCCUGCUGAGCGAUAUCCUGAGAGUGAACACCGAGAUCACAAAGGCCCCUCUGAGCGCCUCUAUGAUCAAGAGAUACGACGAGCACCACCAGGAUCUGACCCUGCUGAAGGCCCUCGUUAGACAGCAGCUGCCAGAGAAGUACAAAGAGAUUUUCUUCGAUCAGUCCAAGAACGGCUACGCCGGCUACAUUGAUGGCGGAGCCAGCCAAGAGGAAUUCUACAAGUUCAUCAAGCCCAUCCUGGAAAAGAUGGACGGCACCGAGGAACUGCUGGUCAAGCUGAACAGAGAGGACCUGCUGCGGAAGCAGCGGACCUUCGACAAUGGCUCUAUCCCUCACCAGAUCCACCUGGGAGAGCUGCACGCCAUUCUGCGGAGACAAGAGGACUUUUACCCAUUCCUGAAGGACAACCGGGAAAAGAUCGAGAAGAUCCUGACCUUCAGGAUCCCCUACUACGUGGGACCACUGGCCAGAGGCAAUAGCAGAUUCGCCUGGAUGACCAGAAAGAGCGAGGAAACCAUCACACCCUGGAACUUCGAGGAAGUGGUGGACAAGGGCGCCAGCGCUCAGUCCUUCAUCGAGCGGAUGACCAACUUCGAUAAGAACCUGCCUAACGAGAAGGUGCUGCCCAAGCACUCCCUGCUGUAUGAGUACUUCACCGUGUACAACGAGCUGACCAAAGUGAAAUACGUGACCGAGGGAAUGAGAAAGCCCGCCUUUCUGAGCGGCGAGCAGAAAAAGGCCAUUGUGGAUCUGCUGUUCAAGACCAACCGGAAAGUGACCGUGAAGCAGCUGAAAGAGGACUACUUCAAGAAAAUCGAGUGCUUCGACAGCGUGGAAAUCAGCGGCGUGGAAGAUCGGUUCAAUGCCAGCCUGGGCACAUACCACGACCUGCUGAAAAUUAUCAAGGACAAGGACUUCCUGGACAACGAAGAGAACGAGGACAUUCUCGAGGACAUCGUGCUGACCCUGACACUGUUUGAGGACAGAGAGAUGAUCGAGGAACGGCUGAAAACAUACGCCCACCUGUUCGACGACAAAGUGAUGAAGCAACUGAAGCGGAGGCGGUACACAGGCUGGGGCAGACUGUCUCGGAAGCUGAUCAACGGCAUCCGGGAUAAGCAGUCCGGCAAGACAAUCCUGGAUUUCCUGAAGUCCGACGGCUUCGCCAACAGAAACUUCAUGCAGCUGAUCCACGACGACAGCCUGACCUUUAAAGAGGACAUCCAGAAAGCCCAGGUGUCCGGCCAAGGCGAUUCUCUGCACGAGCACAUUGCCAACCUGGCCGGAUCUCCCGCCAUUAAGAAGGGCAUCCUGCAGACAGUGAAGGUGGUGGACGAGCUUGUGAAAGUGAUGGGCAGACACAAGCCCGAGAACAUCGUGAUCGAAAUGGCCAGAGAGAACCAGACCACACAGAAGGGCCAGAAGAACAGCCGCGAGAGAAUGAAGCGGAUCGAAGAGGGCAUCAAAGAGCUGGGCAGCCAGAUCCUGAAAGAACACCCCGUGGAAAACACCCAGCUGCAGAACGAGAAGCUGUACCUGUACUACCUGCAGAAUGGACGGGAUAUGUACGUGGACCAAGAGCUGGACAUCAACCGGCUGAGCGACUACGAUGUGGACCAUAUCGUGCCCCAGAGCUUUCUGAAGGACGACUCCAUCGAUAACAAGGUCCUGACCAGAAGCGACAAGAACCGGGGCAAGAGCGAUAACGUGCCCUCCGAAGAGGUGGUCAAGAAGAUGAAGAACUACUGGCGACAGCUGCUGAACGCCAAGCUGAUUACCCAGCGGAAGUUCGAUAACCUGACCAAGGCCGAGAGAGGCGGCCUGAGCGAACUUGAUAAGGCCGGCUUCAUUAAGCGGCAGCUGGUGGAAACCCGGCAGAUCACCAAACACGUGGCACAGAUUCUGGACUCCCGGAUGAACACUAAGUACGACGAGAAUGACAAGCUGAUCCGGGAAGUGAAAGUCAUCACCCUGAAGUCUAAGCUGGUGUCCGAUUUCCGGAAGGAUUUCCAGUUCUACAAAGUGCGGGAAAUCAACAACUACCAUCACGCCCACGACGCCUACCUGAAUGCCGUUGUUGGAACAGCCCUGAUCAAGAAGUAUCCCAAGCUGGAAAGCGAGUUCGUGUACGGCGACUACAAGGUGUACGACGUGCGGAAGAUGAUCGCCAAGAGCGAACAAGAGAUCGGCAAGGCUACCGCCAAGUACUUUUUCUACAGCAACAUCAUGAACUUUUUCAAGACAGAGAUCACCCUGGCCAACGGCGAGAUCCGGAAAAGACCCCUGAUCGAGACAAACGGCGAAACCGGGGAGAUCGUGUGGGAUAAGGGCAGAGAUUUUGCCACAGUGCGGAAAGUGCUGAGCAUGCCCCAAGUGAAUAUCGUGAAGAAAACCGAGGUGCAGACAGGCGGCUUCAGCAAAGAGUCUAUCCUGCCUAAGCGGAACAGCGAUAAGCUGAUCGCCAGAAAGAAGGACUGGGACCCUAAGAAGUACGGCGGCUUCGAUAGCCCUACCGUGGCCUAUUCUGUGCUGGUGGUGGCCAAAGUGGAAAAGGGCAAGUCCAAAAAGCUCAAGAGCGUGAAAGAGCUGCUGGGGAUCACCAUCAUGGAAAGAAGCAGCUUUGAGAAGAACCCGAUCGACUUUCUGGAAGCCAAGGGCUACAAAGAAGUCAAGAAGGACCUCAUCAUCAAGCUCCCCAAGUACAGCCUGUUCGAGCUGGAAAAUGGCCGGAAGCGGAUGCUGGCCUCAGCAGGCGAACUGCAGAAAGGCAAUGAACUGGCCCUGCCUAGCAAAUACGUCAACUUCCUGUACCUGGCCAGCCACUAUGAGAAGCUGAAGGGCAGCCCCGAGGACAAUGAGCAAAAGCAGCUGUUUGUGGAACAGCACAAGCACUACCUGGACGAGAUCAUCGAGCAGAUCAGCGAGUUCUCCAAGAGAGUGAUCCUGGCCGACGCUAACCUGGAUAAGGUGCUGUCUGCCUAUAACAAGCACCGGGACAAGCCUAUCAGAGAGCAGGCCGAGAAUAUCAUCCACCUGUUUACCCUGACCAACCUGGGAGCCCCUGCCGCCUUCAAGUACUUCGACACCACCAUCGACCGGAAGAGGUACACCAGCACCAAAGAGGUGCUGGACGCCACACUGAUCCACCAGUCUAUCACCGGCCUGUACGAAACCCGGAUCGACCUGUCUCAGCUCGGCGGCGAUUCUGGUGGUUCUGGCGGAAGUGGCGGAUCCACCAAUCUGAGCGACAUCAUCGAAAAAGAGACAGGCAAGCAGCUCGUGAUCCAAGAAUCCAUCCUGAUGCUGCCUGAAGAGGUUGAGGAAGUGAUCGGCAACAAGCCUGAGUCCGACAUCCUGGUGCACACCGCCUACGAUGAGAGCACCGAUGAGAACGUCAUGCUGCUGACAAGCGACGCCCCUGAGUACAAGCCUUGGGCUCUCGUGAUUCAGGACAGCAAUGGGGAGAACAAGAUCAAGAUGCUGAGCGGAGGUAGCGGAGGCAGUGGCGGAAGCACAAACCUGUCUGAUAUCAUUGAAAAAGAAACCGGGAAGCAACUGGUCAUUCAAGAGUCCAUUCUCAUGCUCCCGGAAGAAGUCGAGGAAGUCAUUGGAAACAAACCCGAGAGCGAUAUUCUGGUCCACACAGCCUAUGACGAGUCUACAGACGAAAACGUGAUGCUCCUGACCUCUGACGCUCCCGAGUAUAAGCCCUGGGCACUUGUUAUCCAGGACUCUAACGGGGAAAACAAAAUCAAAAUGUUGUCCGGCGGCAGCAAGCGGACAGCCGAUGGAUCUGAGUUCGAGAGCCCCAAGAAGAAACGGAAGGUgGAGUaaGCGGCCGCUUAAUUAAGCUGCCUUCUGCGGGGCUUGCCUUCUGGCCAUGCCCUUCUUCUCUCCCUUGCACCUGUACCUCUUGGUCUUUGAAUAAAGCCUGAGUAGGAAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
本開示の他の態様は、本明細書に記載される塩基エディター、融合タンパク質、または融合タンパク質-ガイドポリヌクレオチド複合体のいずれかを含む医薬組成物に関する。用語「医薬組成物」は、本明細書中で使用される場合、薬学的使用のために処方される組成物を指す。いくつかの態様において、医薬組成物は、薬学的に許容される担体をさらに含む。ある態様において、医薬組成物は、さらなる剤(例えば特異的送達、半減期の延長のためのもの、または他の治療化合物)を含む。
本開示の様々な態様は、塩基エディターシステムを含むキットを提供する。一実施形態では、キットは、核酸塩基エディター融合タンパク質をコードするヌクレオチド配列を含む核酸構築物を含む。この融合タンパク質は、デアミナーゼ(例えば、シチジンデアミナーゼまたはアデニンデアミナーゼ)および核酸プログラム可能DNA結合タンパク質 (napDNAbp) を含む。ある態様において、キットは、対象核酸分子、例えば表3Aおよび3Bに特定される遺伝子における疾患関連変異を標的とすることができる、少なくとも一つのガイドRNAを含む。いくつかの実施形態において、キットは、少なくとも1つのガイドRNAをコードするヌクレオチド配列を含む核酸構築物を含む。
1. 必要とする対象において疾患を治療する方法であって、
ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメイン又はそれをコードする核酸、及び
デアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを対象に投与することを含み、
該ポリヌクレオチドが、塩基エディターシステムをターゲティングして対象の細胞のSERPINA1ポリヌクレオチド中の核酸塩基の脱アミノ化をもたらすことができ、それによって疾患を治療し、
前記核酸塩基は前記疾患の原因ではない
方法。
2. 必要とする対象において疾患を治療する方法であって、
(a) 細胞に、
ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、および
デアミナーゼドメインまたはそれをコードする核酸、
を含む塩基エディターシステムを導入することと、
(b) 前記細胞を前記対象に投与することと
を含み、前記ガイドポリヌクレオチドが、前記塩基エディターシステムをターゲティングして前記細胞中のSERPINA1ポリヌクレオチド中の核酸塩基の脱アミノ化をもたらすことができ、それによって前記疾患を治療し、
前記核酸塩基は前記疾患の原因ではない、
方法。
3. 前記細胞が肝細胞またはその前駆細胞である、実施形態2の方法。
4. 前駆細胞を分化させて肝細胞を生成することをさらに含む、実施形態3の方法。
5. 前記細胞が対象にとって自家性である、実施形態2〜4のいずれか一つの方法。
6. 前記細胞が対象にとって同種異系である、実施形態2〜4のいずれか一つの方法。
7. 前記細胞が対象にとって異種性である、実施形態2〜4のいずれか一つの方法。
8. 前記対象が哺乳動物である、先の実施形態のいずれか1つの方法。
9. SERPINA1ポリヌクレオチドを編集する方法であって、SERPINA 1ポリヌクレオチドを、
ガイドポリヌクレオチド;
ポリヌクレオチドプログラム可能なDNA結合ドメイン、および
デアミナーゼドメイン
を含む塩基エディターシステムと接触させることを含み、
前記ガイドポリヌクレオチドが、前記塩基エディターシステムをターゲティングしてSERPINA1ポリヌクレオチド中の核酸塩基の脱アミノ化をもたらすことができ、
ここで、核酸塩基は前記疾患の原因ではない、
方法。
10. 疾患の治療のための改変された細胞を産生する方法であって、
ガイドポリヌクレオチドまたは1以上のガイドポリヌクレオチドをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、及び
デアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを細胞に導入することをふくみ、
前記ガイドポリヌクレオチドが、前記塩基エディターシステムをターゲティングして前記細胞中のSERPINA1ポリヌクレオチド中の核酸塩基の脱アミノ化をもたらすことができ、
前記核酸塩基は前記疾患の原因ではない、
方法。
11. 前記導入がインビボである、実施形態10の方法。
12. 前記導入がex vivoである、実施形態10の方法。
13. 前記細胞が前記疾患を有する対象から得られるものである、実施形態12の方法。
14. 前記細胞が哺乳動物細胞である、実施態様10〜13のいずれか1つの方法。
15. 前記細胞が肝細胞またはその前駆細胞である、実施形態14の方法。
16. 前駆細胞を分化させて肝細胞を産生することをさらに含む、実施形態15の方法。
17. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインがCas9ドメインである、前記実施形態のいずれか1つの方法。
18. Cas9ドメインがヌクレアーゼ不活性Cas9ドメインである、実施形態17の方法。
19. Cas9ドメインがCas9ニッカーゼドメインである、実施形態18の方法。
20. Cas9ドメインがSpCas9ドメインを含む、実施態様17〜19のいずれか1つの方法。
21. SpCas9ドメインがD10Aおよび/またはH840Aアミノ酸置換またはそれらに対応するアミノ酸置換を含む、実施形態20の方法。
22. SpCas9ドメインがNGG PAMに対する特異性を有する、実施形態20または21の方法。
23. SpCas9ドメインが、NGA PAM、NGT PAM、またはNGC PAMに対する特異性を有する、実施形態20〜22のいずれか1つの方法。
24. SpCas9ドメインが、アミノ酸置換L 1111 R、D 1135 V、G 1218 R、E 1219 F、A 1322 R、R 1335 V、T 1337 R、ならびにL 1111、D 1135 L、S 1136 R、G 1218 S、E 1219 V、D 1332 A、R 1335 Q、T 1337 I、T 1337 V、T 1337 F、およびT 1337 Mのうちの1つ以上、またはそれらに対応するアミノ酸置換を含む、実施形態20〜23のいずれか1つの方法。
25. SpCas9ドメインが、アミノ酸置換L 1111 R、D 1135 V、G 1218 R、E 1219 F、A 1322 R、R 1335 V、T 1337 R、ならびにL 1111、D 1135 L、S 1136 R、G 1218 S、E 1219 V、D 1332 A、D 1332 S、D 1332 T、D 1332 V、D 1332 L、D 1332 K、D 1332 R、R 1335 Q、T 1337 I、T 1337 V、T 1337 F、T 1337 S、T 1337 N、T 1337 K、T 1337 R、T 1337 H、T 1337 Q、およびT 1337 Mのうちの1つ以上、またはそれらに対応するアミノ酸置換を含む、実施形態20〜23のいずれか1つの方法。
26. SpCas9ドメインが、アミノ酸置換D 1135 L、S 1136 R、G 1218 S、E 1219 V、A 1322 R、R 1335 Q、T 1337、およびA 1322 R、ならびにL 1111、D 1135 L、S 1136 R、G 1218 S、E 1219 V、D 1332 A、D 1332 S、D 1332 T、D 1332 V、D 1332 L、D 1332 K、D 1332 R、R 1335 Q、T 1337 I、T 1337 V、T 1337 F、T 1337 S、T 1337 N、T 1337 K、T 1337 R、T 1337 H、T 1337 Q、およびT 1337 Mのうちの1つ以上、またはそれらに対応するアミノ酸置換を含む、実施形態20〜23のいずれか1つの方法。
27. SpCas9ドメインがアミノ酸置換D 1135 M、S 1136 Q、G 1218 K、E 1219 F、A 1322 R、D 1332 A、R 1335 E、およびT 1337 R、またはそれらに対応するアミノ酸置換を含む、実施形態20〜23のいずれか1つの方法。
28. SpCas9ドメインが、NG PAM、NNG PAM、GAA PAM、GAT PAM、またはCAA PAMに対する特異性を有する、実施形態20または21の方法。
29. SpCas9ドメインがアミノ酸置換E 480 K、E 543 K、およびE 1219 V、またはそれらに対応するアミノ酸置換を含む、実施形態28の方法。
30. Cas 9ドメインがSaCas9ドメインを含む、実施態様17〜19のいずれか1つの方法。
31. SaCas9ドメインは、NNNRRT PAMに対する特異性を有する、実施形態30の方法。
32. SaCas9ドメインは、NNGRRT PAMに対する特異性を有する、実施形態31の方法。
33. SaCas9ドメインがアミノ酸置換N 579 Aまたはそれに対応するアミノ酸置換を含む、実施態様30〜32のいずれか1つの方法。
34. SaCas9ドメインがアミノ酸置換E 782 K、N 968 K、およびR 1015 H、またはそれらに対応するアミノ酸置換を含む、実施態様30〜33のいずれか1つの方法。
35. Cas9ドメインがSt1Cas9ドメインを含む、実施態様17〜19のいずれか1つの方法。
36. St1Cas9ドメインがNNACCA PAMに対する特異性を有する、実施形態35の方法。
37. 前記デアミナーゼドメインがシチジンデアミナーゼドメインを含む、前記実施形態のいずれか1つの方法。
38. シチジンデアミナーゼドメインがAPOBECドメインを含む、実施形態31の方法。
39. APOBECドメインがAPOBEC1ドメインを含む、実施形態32の方法。
40. デアミナーゼドメインがアデノシンデアミナーゼドメインを含む、実施態様1〜36のいずれか1つの方法。
41. アデノシンデアミナーゼドメインが、天然には存在しない改変アデノシンデアミナーゼドメインである、実施形態40の方法。
42. アデノシンデアミナーゼドメインがTadAドメインを含む、実施形態41の方法。
43. TadAドメインは、TadA 7.10のアミノ酸配列を含む、実施形態42の方法。
44. 前記塩基エディターシステムが少なくとも1つのUGIドメインをさらに含む、前記実施形態のいずれか1つの方法。
45. 前記塩基エディターシステムが少なくとも二つのUGIドメインを含む、実施形態44の方法。
46. 前記塩基エディターシステムがジンクフィンガードメインをさらに含む、前記実施形態のいずれか1つの方法。
47. ジンクフィンガードメインが、認識ヘリックス配列RNEHLEV、QSTTLKR、およびRTEHLAR、または認識ヘリックス配列RGEHLRQ、QSGTLKR、およびRNDKLVPを含む、実施形態46の方法。
48. ジンクフィンガドメインがzf1raまたはzf1rbである、実施形態46または47の方法。
49. 前記塩基エディターシステムが核局在化シグナル (NLS) をさらに含む、前記実施形態のいずれか一つの方法。
50. 前記塩基エディターシステムが1つ以上のリンカーをさらに含む、前記実施形態のいずれか1つの方法。
51. ポリヌクレオチドプログラム可能なDNA結合ドメイン、デアミナーゼドメイン、UGIドメイン、NLS、及び/又はジンクフィンガードメインのうちの二つ以上がリンカーを介して連結されている、実施形態50の方法。
52. リンカーがペプチドリンカーであり、それによって塩基編集融合タンパク質を形成している、実施形態50の方法。
53. 前記ペプチドリンカーが、SGGSSGSETPGTSESATPESSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGS, GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS, SGGSSGGSSGSETPGTSESATPES, SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS, PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAP GTSTEPSEGSAPGTSESATPESGPGSEPATS, (SGGS)n, (GGGS)n, (GGGGS)n, (G)n, (EAAAK)n, (GGS)n, SGSETPGTSESATPES, および (XP)nからなる群から選択されるアミノ酸配列含む、実施形態52の方法。
54. 塩基編集融合タンパク質がBE4のアミノ酸配列を含む、実施形態53の方法。
55. 前記塩基編集融合タンパク質は、
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFmqPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAkfLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPrAFKYFDTTIaRKeYrSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
のアミノ酸配列を含む、実施形態53の方法。
56. SERPINA1ポリヌクレオチドが、前記疾患の原因となる病原性一塩基多型 (SNP) を含む、先の実施形態のいずれか一つの方法。
57. 前記疾患がアルファ-1アンチトリプシン欠損症 (A1AD) である、実施形態56の方法。
58. SERPINA1ポリヌクレオチドは、病原性SNPから生じるアミノ酸変異を含むA1ATタンパク質をコードする、実施形態57の方法。
59. 前記アミノ酸変異が342 Lまたは376 L変異またはそれらに対応する位置のものである、実施形態58の方法。
60. 前記核酸塩基の脱アミノ化が、A1ATタンパク質の位置342もしくは376またはそれらに対応する位置以外の位置でのアミノ酸置換をもたらす、実施形態58または59の方法。
61. 前記核酸塩基の脱アミノ化が、A1ATタンパク質におけるF 51 L、M 374 I、A 348 V、A 347 V、K 387 R、T 59 A、およびT 68 Aからなる群より選択されるアミノ酸置換またはそれらに対応する置換をもたらす、実施形態60の方法。
62. 前記核酸塩基の脱アミノ化が、A1ATタンパク質の位置374またはそれに対応する位置におけるアミノ酸置換をもたらす、実施形態60の方法。
63. A1ATタンパク質におけるアミノ酸置換がM374I置換またはそれに対応する置換である、実施形態62の方法。
64. 前記核酸塩基がSERPINA1ポリヌクレオチドの1455の位置またはそれに対応する位置にある、実施形態63の方法。
65. 前記ガイドポリヌクレオチドが2つの個別のポリヌクレオチドを含み、前記2つの個別のポリヌクレオチドが2つのDNA、2つのRNA、またはDNAとRNAである、前記実施形態のいずれか1つの方法。
66. 前記ガイドポリヌクレオチドがcrRNAおよびtracrRNAを含み、前記crRNAはSERPINA1ポリヌクレオチド中の標的配列に対して相補的な核酸配列を含む、前記実施形態のいずれか1つの方法。
67. 標的配列がSERPINA1ポリヌクレオチドの位置1455を含む、実施形態66の方法。
68. 標的配列が、GAAGAAGATATTGGTGCTGT, TCAATCATTAAGAAGACAAA, ACTTTTCCCATGAAGAGGGG, CATCGCTACAGCCTTTGCAA, および GGGACCAAGGCTGACACTCA
から選択される配列を含む、実施形態66の方法。
69. 前記塩基エディターシステムが単一ガイドRNA (sgRNA) を含む、実施形態66または67の方法。
70. sgRNAが、5’-CAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-GUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UGUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUGUUCAAUCAUUAAGAAGACAAAGGGUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAG-3’,
5’-UUCAAUCAUUAAGAAGACAAAGG-3’,
5’-UCAAUCAUUAAGAAGACAAAGGG-3’, および
5’-AAUCAUUAAGAAGACAAAGGGU-3’からなる群より選択される配列を含む、実施形態68の方法。
71. 必要とする対象においてアルファ-1アンチトリプシン欠損症 (A1AD) を治療する方法であって、
単一ガイドRNA (sgRNA)、
BE 4のアミノ酸配列を含む融合タンパク質
を含む塩基エディターシステムを前記対象に投与することを含み、
前記sgRNAは、前記塩基エディターシステムをターゲティングして前記対象の細胞中のSERPINA1ポリヌクレオチド中の位置1455またはそれに対応する位置におけるシチジンを脱アミノ化させ、それによってA1ADを治療し、
ここで、前記sgRNAは、
5’-CAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-UCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-GUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UGUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUGUUCAAUCAUUAAGAAGACAAAGGGUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAG-3’,
5’-UUCAAUCAUUAAGAAGACAAAGG-3’,
5’-UCAAUCAUUAAGAAGACAAAGGG-3’, および
5’-AAUCAUUAAGAAGACAAAGGGU-3’
からなる群から選択される配列を含む、
方法。
72. 必要とする対象においてアルファ−1アンチトリプシン欠損症 (A1AD)を治療する方法であって、
(a) 細胞に、
単一ガイドRNA (sgRNA)、
BE4のアミノ酸配列を含む融合タンパク質
を含む塩基エディターシステムを導入することと、
(b) 前記細胞を前記対象に投与することと
を含み、
前記sgRNAは、前記塩基エディターシステムをターゲティングして前記細胞中のSERPINA1ポリヌクレオチドの位置1455またはそれに対応する位置におけるシチジンを脱アミノ化させ、それによってA1ADを治療し、
ここで、前記sgRNAは、
5’-CAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-UCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-GUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UGUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUGUUCAAUCAUUAAGAAGACAAAGGGUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAG-3’,
5’-UUCAAUCAUUAAGAAGACAAAGG-3’,
5’-UCAAUCAUUAAGAAGACAAAGGG-3’, および
5’-AAUCAUUAAGAAGACAAAGGGU-3’
からなる群から選択される配列を含み、
前記細胞は前記対象から得られる肝細胞である、
方法。
73. 塩基エディターシステムを含む改変された細胞であって、
前記塩基エディターシステムが、
ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、および
デアミナーゼドメインまたはそれをコードする核酸
を含み、
ここで、前記ガイドポリヌクレオチドは、前記塩基エディターシステムをターゲティングして前記細胞中のSERPINA1ポリヌクレオチドにおける核酸塩基の脱アミノ化をもたらすことができ、前記核酸塩基は疾患の原因ではない、
細胞。
74. 導入がインビボである、実施形態73の改変された細胞。
75. 導入がex vivoである、実施形態73の改変された細胞。
76. 前記細胞は前記疾患を有する対象から得られるものである、実施形態75の改変された細胞。
77. 前記細胞が哺乳動物細胞である、実施態様73〜76のいずれか1つの改変された細胞。
78. 前記細胞が肝細胞またはその前駆細胞である、実施形態77の改変された細胞。
79. 前駆細胞を分化させて肝細胞を産生することをさらに含む、実施形態78の改変された細胞。
80. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインがCas9ドメインである、実施形態73〜79のいずれか1つの改変された細胞。
81. Cas9ドメインがヌクレアーゼ不活性Cas9ドメインである、実施形態80の改変された細胞。
82. Cas9ドメインがCas9ニッカーゼドメインである、実施態様80の改変された細胞。
83. Cas9ドメインがSpCas9ドメインを含む、実施態様80〜82のいずれか1つの改変された細胞。
84. SpCas9ドメインがD10Aおよび/またはH840Aアミノ酸置換またはそれらに対応するアミノ酸置換を含む、実施形態83の改変された細胞。
85. SpCas9ドメインがNGG PAMに対する特異性を有する、実施形態83または84の改変された細胞。
86. SpCas 9ドメインがNGA PAM、NGT PAM、またはNGC PAMに対する特異性を有する、実施形態83〜85のいずれか1つの改変された細胞。
87. SpCas9ドメインが、アミノ酸置換L 1111 R、D 1135 V、G 1218 R、E 1219 F、A 1322 R、R 1335 V、T 1337 R、ならびにL 1111、D 1135 L、S 1136 R、G 1218 S、E 1219 V、D 1332 A、R 1335 Q、T 1337 I、T 1337 V、T 1337 F、およびT 1337 Mのうちの1つ以上、またはそれらに対応するアミノ酸置換を含む、実施態様83〜86のいずれか1つの改変された細胞。
88. SpCas9ドメインが、アミノ酸置換L 1111 R、D 1135 V、G 1218 R、E 1219 F、A 1322 R、R 1335 V、T 1337 R、ならびにL 1111、D 1135 L、S 1136 R、G 1218 S、E 1219 V、D 1332 A、D 1332 S、D 1332 T、D 1332 V、D 1332 L、D 1332 K、D 1332 R、R 1335 Q、T 1337 I、T 1337 V、T 1337 F、T 1337 S、T 1337 N、T 1337 K、T 1337 R、T 1337 H、T 1337 Q、およびT 1337 Mのうちの1つ以上、またはそれらに対応するアミノ酸置換を含む、実施形態83〜86のいずれか1つの改変された細胞。
89. SpCas9ドメインが、アミノ酸置換D 1135 L、S 1136 R、G 1218 S、E 1219 V、A 1322 R、R 1335 Q、T 1337、およびA 1322 R、ならびにL 1111、D 1135 L、S 1136 R、G 1218 S、E 1219 V、D 1332 A、D 1332 S、D 1332 T、D 1332 V、D 1332 L、D 1332 K、D 1332 R、R 1335 Q、T 1337 I、T 1337 V、T 1337 F、T 1337 S、T 1337 N、T 1337 K、T 1337 R、T 1337 H、T 1337 Q、およびT 1337 Mのうちの1つ以上、またはそれらに対応するアミノ酸置換を含む、実施形態83〜86のいずれか1つの改変された細胞。
90. SpCas9ドメインが、アミノ酸置換D 1135 M、S 1136 Q、G 1218 K、E 1219 F、A 1322 R、D 1332 A、R 1335 E、およびT 1337 R、またはそれらに対応するアミノ酸置換を含む、実施態様83〜86のいずれか1つの改変された細胞。
91. SpCas9ドメインがNG PAM、NNG PAM、GAA PAM、GAT PAM、またはCAA PAMに対する特異性を有する、実施形態83または84の改変された細胞。
92. SpCas9ドメインがアミノ酸置換E 480 K、E 543 K、およびE 1219 V、またはそれらに対応するアミノ酸置換を含む、実施形態91の改変された細胞。
93. Cas9ドメインがSaCas9ドメインを含む、実施態様80〜82のいずれか1つの改変された細胞。
94. SaCas9ドメインがNNNRRT PAMに対する特異性を有する、実施形態93の改変された細胞。
95. SaCas9ドメインがNNGRRT PAMに対する特異性を有する、実施形態94の改変された細胞。
96. SaCas9ドメインがアミノ酸置換N 579 Aまたはそれに対応するアミノ酸置換を含む、実施態様93〜95のいずれか1つの改変された細胞。
97. SaCas9ドメインがアミノ酸置換E 782 K、N 968 K、およびR 1015 H、またはそれらに対応するアミノ酸置換を含む、実施態様93〜96のいずれか1つの改変された細胞。
98. Cas9ドメインがSt1Cas 9ドメインを含む、実施態様80〜82のいずれか1つの改変された細胞。
99. St1Cas9ドメインがNNACCA PAMに対する特異性を有する、実施形態98の改変された細胞。
100. デアミナーゼドメインがシチジンデアミナーゼドメインを含む、実施態様71〜99のいずれか1つの改変された細胞。
101. シチジンデアミナーゼドメインがAPOBECドメインを含む、実施形態100の改変された細胞。
102. APOBECドメインがAPOBEC1ドメインを含む、実施形態101の改変された細胞。
103. デアミナーゼドメインがアデノシンデアミナーゼドメインを含む、実施態様71〜99のいずれか1つの改変された細胞。
104. アデノシンデアミナーゼドメインが、天然には存在しない改変されたアデノシンデアミナーゼドメインである、実施形態103の改変された細胞。
105. アデノシンデアミナーゼドメインがTadAドメインを含む、実施形態104の改変された細胞。
106. TadAドメインがTadA 7.10のアミノ酸配列を含む、実施形態105の改変された細胞。
107. 前記塩基エディターシステムが少なくとも1つのUGIドメインをさらに含む、実施形態71〜106のいずれか1つの改変された細胞。
108. 前記塩基エディターシステムが少なくとも二つのUGIドメインを含む、実施形態107の改変された細胞。
109. 前記塩基エディターシステムがジンクフィンガードメインをさらに含む、実施態様71〜108のいずれか1つの改変された細胞。
110. ジンクフィンガードメインが、認識ヘリックス配列RNEHLEV、QSTTLKR、およびRTEHLAR、または認識ヘリックス配列RGEHLRQ、QSGTLKR、およびRNDKLVPを含む、実施形態109の改変された細胞。
111. ジンクフィンガードメインがzf1raまたはzf1rbである、実施形態109または110の改変された細胞。
112. 前記塩基エディターシステムが核局在化シグナル (NLS) をさらに含む、実施形態71〜111のいずれか一実施形態の改変された細胞。
113. 前記塩基エディターシステムが1つ以上のリンカーをさらに含む、実施形態71〜112のいずれか1つの改変された細胞。
114. ポリヌクレオチドプログラム可能なDNA結合ドメイン、デアミナーゼドメイン、UGIドメイン、NLS、及び/又はジンクフィンガードメインのうちの二つ以上がリンカーを介して連結されている、実施形態113の改変された細胞。
115. リンカーがペプチドリンカーであり、それによって塩基編集融合タンパク質を形成している、実施形態114の改変された細胞。
116. 前記ペプチドリンカーが、SGGSSGSETPGTSESATPESSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGS, GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS, SGGSSGGSSGSETPGTSESATPES, SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS, PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAP GTSTEPSEGSAPGTSESATPESGPGSEPATS, (SGGS)n, (GGGS)n, (GGGGS)n, (G)n, (EAAAK)n, (GGS)n, SGSETPGTSESATPES, および (XP)nからなる群から選択されるアミノ酸配列を含む、実施形態115の改変された細胞。
117. 前記塩基編集融合タンパク質がBE4のアミノ酸配列を含む、実施形態116の改変された細胞。
118. 前記塩基編集融合タンパク質が、TadA 7.10のアミノ酸配列を含む、実施形態116の改変された細胞。
119. 前記SERPINA1ポリヌクレオチドが、前記疾患の原因となる病原性一塩基多型 (SNP) を含む、実施形態71〜118のいずれか一つの改変された細胞。
120. 前記疾患がアルファ-1アンチトリプシン欠損症 (A1AD) である、実施形態119の改変された細胞。
121. 前記SERPINA1ポリヌクレオチドが、病原性SNPから生じたアミノ酸変異を含むA1ATタンパク質をコードする、実施形態120の改変された細胞。
122. 前記アミノ酸変異が342 Lもしくは376 L変異またはそれに対応する位置である、実施形態121の改変された細胞。
123. 前記核酸塩基の脱アミノ化が、A1ATタンパク質の位置342もしくは376またはそれに対応する位置以外の位置でのアミノ酸置換をもたらす、実施形態121または122の改変された細胞。
124. 前記核酸塩基の脱アミノ化が、A1ATタンパク質におけるF 51 L、M 374 I、A 348 V、A 347 V、K 387 R、T 59 A、およびT 68 Aからなる群より選択されるアミノ酸置換、またはそれらに対応する置換をもたらす、実施形態123の改変された細胞。
125. 前記核酸塩基の脱アミノ化が、A1ATタンパク質の位置374またはそれに対応する位置におけるアミノ酸置換をもたらす、実施形態122の改変された細胞。
126. A1ATタンパク質におけるアミノ酸置換がM 374 I置換またはその対応する置換である、実施形態125の改変された細胞。
127. 前記核酸塩基がSERPINA1ポリヌクレオチドの位置1455またはそれに対応する位置にある、実施形態126の改変された細胞。
128. 前記ガイドポリヌクレオチドが2つの個別のポリヌクレオチドを含み、前記2つの個別のポリヌクレオチドが、2つのDNA、2つのRNA、またはDNAとRNAである、実施形態71〜127のいずれか1つの改変された細胞。
129. 前記ガイドポリヌクレオチドがcrRNAおよびtracrRNAを含み、crRNAは、SERPINA1ポリヌクレオチド中の標的配列に対して相補的な核酸配列を含む、実施形態71〜128のいずれか1つの改変された細胞。
130. 前記標的配列がSERPINA1ポリヌクレオチドの位置1455を含む、実施形態129の改変された細胞。
131. 前記標的配列が、GAAGAAGATATTGGTGCTGT, TCAATCATTAAGAAGACAAA, ACTTTTCCCATGAAGAGGGG, CATCGCTACAGCCTTTGCAA, および GGGACCAAGGCTGACACTCAから選択される配列を含む、実施形態130の改変された細胞。
132. 前記塩基エディターシステムが単一ガイドRNA (sgRNA) を含む、実施形態130または131の改変された細胞。
133. 前記sgRNAが、
5’-CAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-GUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UGUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUGUUCAAUCAUUAAGAAGACAAAGGGUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAG-3’,
5’-UUCAAUCAUUAAGAAGACAAAGG-3’,
5’-UCAAUCAUUAAGAAGACAAAGGG-3’, および
5’-AAUCAUUAAGAAGACAAAGGGU-3’
からなる群より選択される配列を含む、実施形態132の改変された細胞。
134. 単一ガイドRNA (sgRNA)
BE4のアミノ酸配列を含む融合タンパク質
を含む塩基エディターシステムを含む、改変された細胞であって、
前記sgRNAは、前記塩基エディターシステムをターゲティングしてSERPINA1ポリヌクレオチド中の位置1455またはそれに対応する位置におけるシチジンを脱アミノ化させることができる。
135. ここで、前記sgRNAは、
5’-CAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-GUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UGUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUGUUCAAUCAUUAAGAAGACAAAGGGUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAG-3’,
5’-UUCAAUCAUUAAGAAGACAAAGG-3’,
5’-UCAAUCAUUAAGAAGACAAAGGG-3’, および
5’-AAUCAUUAAGAAGACAAAGGGU-3’
からなる群から選択される配列を含み、
ここで、前記細胞は肝細胞である。
136. 塩基エディターシステムであって、
ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、および
デアミナーゼドメインまたはそれをコードする核酸
を含み、
ここで、前記ガイドポリヌクレオチドは、前記塩基エディターシステムをターゲティングしてSERPINA1ポリヌクレオチド中の核酸塩基の脱アミノ化をもたらすことができ、
前記核酸塩基は疾患の原因ではない、
塩基エディターシステム。
137. Cas 9ドメインがヌクレアーゼ不活性Cas 9ドメインである、実施形態135の塩基エディターシステム。
138. Cas 9ドメインがCas9ニッカーゼドメインである、実施形態135の塩基エディターシステム。
139. Cas 9ドメインがSpCas9ドメインを含む、実施形態135〜137のいずれか1つの塩基エディターシステム。
140. SpCas9ドメインがD10Aおよび/またはH840Aアミノ酸置換またはそれらに対応するアミノ酸置換を含む、実施形態138の塩基エディターシステム。
141. SpCas9ドメインがNGG PAMに対する特異性を有する、実施形態138または139の塩基エディターシステム。
142. SpCas9ドメインが、NGA PAM、NGT PAM、またはNGC PAMに対する特異性を有する、実施形態138〜140のいずれか1つの塩基エディターシステム。
143. SpCas9ドメインが、アミノ酸置換L 1111 R、D 1135 V、G 1218 R、E 1219 F、A 1322 R、R 1335 V、T 1337 R、ならびにL 1111、D 1135 L、S 1136 R、G 1218 S、E 1219 V、D 1332 A、R 1335 Q、T 1337 I、T 1337 V、T 1337 F、およびT 1337 Mのうちの1つ以上、またはそれらに対応するアミノ酸置換を含む、実施形態138〜141のいずれか1つの塩基エディターシステム。
144. SpCas9ドメインが、アミノ酸置換L 1111 R、D 1135 V、G 1218 R、E 1219 F、A 1322 R、R 1335 V、T 1337 R、ならびにL 1111、D 1135 L、S 1136 R、G 1218 S、E 1219 V、D 1332 A、D 1332 S、D 1332 T、D 1332 V、D 1332 L、D 1332 K、D 1332 R、R 1335 Q、T 1337 I、T 1337 V、T 1337 F、T 1337 S、T 1337 N、T 1337 K、T 1337 R、T 1337 H、T 1337 Q、およびT 1337 Mのうちの1以上、またはそれらに対応するアミノ酸置換を含む、実施形態138〜141のいずれか1つの塩基エディターシステム。
145. SpCas9ドメインが、アミノ酸置換D 1135 L、S 1136 R、G 1218 S、E 1219 V、A 1322 R、R 1335 Q、T 1337、およびA 1322 R、ならびにL 1111、D 1135 L、S 1136 R、G 1218 S、E 1219 V、D 1332 A、D 1332 S、D 1332 T、D 1332 V、D 1332 L、D 1332 K、D 1332 R、R 1335 Q、T 1337 I、T 1337 V、T 1337 F、T 1337 S、T 1337 N、T 1337 K、T 1337 R、T 1337 H、T 1337 Q、およびT 1337 Mのうちの1つ以上、またはそれらに対応するアミノ酸置換を含む、実施形態138〜141のいずれか1つの塩基エディターシステム。
146. SpCas9ドメインが、アミノ酸置換D 1135 M、S 1136 Q、G 1218 K、E 1219 F、A 1322 R、D 1332 A、R 1335 E、およびT 1337 R、またはそれらに対応するアミノ酸置換を含む、実施形態138〜141のいずれか1つの塩基エディターシステム。
147. SpCas9ドメインが、NG PAM、NNG PAM、GAA PAM、GAT PAM、またはCAA PAMに対する特異性を有する、実施形態138または139の塩基エディターシステム。
148. SpCas9ドメインが、アミノ酸置換E 480 K、E 543 K、およびE 1219 V、またはそれらに対応するアミノ酸置換を含む、実施形態146の塩基エディターシステム。
149. Cas9ドメインがSaCas9ドメインを含む、実施形態135〜137のいずれか1つの塩基エディターシステム。
150. SaCas9ドメインは、NNNRRT PAMに対する特異性を有する、実施形態148の塩基エディターシステム。
151. SaCas9ドメインがNNGRRT PAMに対する特異性を有する、実施形態149の塩基エディターシステム。
152. SaCas9ドメインがアミノ酸置換N579Aまたはそれに対応するアミノ酸置換を含む、実施態様135〜137のいずれか1つの塩基エディターシステム。
153. SaCas9ドメインがアミノ酸置換E 782 K、N 968 K、およびR 1015 H、またはそれらに対応するアミノ酸置換を含む、実施態様148〜151のいずれか1つの塩基エディターシステム。
154. Cas9ドメインがSt1Cas 9ドメインを含む、実施形態135〜137のいずれか1つの塩基エディターシステム。
155. St1Cas9ドメインがNNACCA PAMに対する特異性を有する、実施形態153の塩基エディターシステム。
156. デアミナーゼドメインがシチジンデアミナーゼドメインを含む、実施形態134〜154のいずれか1つの塩基エディターシステム。
157. シチジンデアミナーゼドメインがAPOBECドメインを含む、実施形態155の塩基エディターシステム。
158. APOBECドメインがAPOBEC1ドメインを含む、実施形態156の塩基エディターシステム。
159. デアミナーゼドメインがアデノシンデアミナーゼドメインを含む、実施形態134〜157のいずれか1つの塩基エディターシステム。
160. アデノシンデアミナーゼドメインが、天然には存在しない改変されたアデノシンデアミナーゼドメインである、実施形態158の塩基エディターシステム。
161. アデノシンデアミナーゼドメインがTadAドメインを含む、実施形態159の塩基エディターシステム。
162. TadAドメインがTadA 7.10のアミノ酸配列を含む、実施形態160の塩基エディターシステム。
163. 前記塩基エディターシステムが少なくとも1つのUGIドメインをさらに含む、実施形態134〜161のいずれか1つの塩基エディターシステム。
164. 前記塩基エディターシステムは、少なくとも二つのUGIドメインを含む、実施形態162の塩基エディターシステム。
165. 前記塩基エディターシステムは、ジンクフィンガードメインをさらに含む、実施形態134〜163のいずれか1つの塩基エディターシステム。
166. ジンクフィンガードメインが、認識ヘリックス配列RNEHLEV、QSTTLKR、およびRTEHLAR、または認識ヘリックス配列RGEHLRQ、QSGTLKR、およびRNDKLVPを含む、実施形態164の塩基エディターシステム。
167. ジンクフィンガードメインがzf1raまたはzf1rbである、実施形態165の塩基エディターシステム。
168. 前記塩基エディターシステムは、核局在化シグナル (NLS) をさらに含む、実施形態134〜166のいずれか一つの塩基エディターシステム。
169. 前記塩基エディターシステムは、1つ以上のリンカーをさらに含む、実施形態134〜167のいずれか1つの塩基エディターシステム。
170. 前記ポリヌクレオチドプログラム可能なDNA結合ドメイン、デアミナーゼドメイン、UGIドメイン、NLS、及び/又はジンクフィンガードメインのうちの二つ以上がリンカーを介して接続されている、実施形態168の塩基エディターシステム。
171. リンカーがペプチドリンカーであり、それによって塩基編集融合タンパク質を形成している、実施形態169の塩基エディターシステム。
172. 前記170ペプチドリンカーが、SGGSSGSETPGTSESATPESSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGS, GGSGGSPGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGSAPGTSESATPESGPGSEPATSGGSGGS, SGGSSGGSSGSETPGTSESATPES, SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGS, SGGSSGGSSGSETPGTSESATPESSGGSSGGSSGGSSGGSSGSETPGTSESATPESSGGSSGGS, PGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAP GTSTEPSEGSAPGTSESATPESGPGSEPATS, (SGGS)n, (GGGS)n, (GGGGS)n, (G)n, (EAAAK)n, (GGS)n, SGSETPGTSESATPES, および (XP)nからなる群から選択されるアミノ酸配列を含むペプチドリンカーである、実施形態170の塩基エディターシステム。
173. 塩基編集融合タンパク質がBE4のアミノ酸配列を含む、実施形態170の塩基エディターシステム。
174. 前記塩基編集融合タンパク質は、
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFmqPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAkfLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPrAFKYFDTTIaRKeYrSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
のアミノ酸配列を含む、実施形態170の塩基エディターシステム。
175. SERPINA1ポリヌクレオチドが、疾患の原因となる病原性一塩基多型 (SNP) を含む、実施形態134〜173のいずれか一つの塩基エディターシステム。
176. 疾患がアルファ-1アンチトリプシン欠損症 (A1AD) である、実施形態174の塩基エディターシステム。
177. SERPINA1ポリヌクレオチドが、病原性SNPから生じるアミノ酸変異を含むA1ATタンパク質をコードする、実施形態175の塩基エディターシステム。
178. 前記アミノ酸変異が、342Lまたは376L変異またはそれに対応する位置のものである、実施形態176の塩基エディターシステム。
179. 前記核酸塩基の脱アミノ化が、A1ATタンパク質の位置342もしくは376またはそれに対応する位置以外の位置でのアミノ酸置換をもたらす、実施形態176または177の塩基エディターシステム。
180. 前記核酸塩基の脱アミノ化が、A1ATタンパク質におけるF 51 L、M 374 I、A 348 V、A 347 V、K 387 R、T 59 A、およびT 68 Aからなる群より選択されるアミノ酸置換、またはそれらに対応する置換をもたらす、実施形態178の塩基エディターシステム。
181. 前記核酸塩基の脱アミノ化が、A1ATタンパク質の位置374またはそれに対応する位置におけるアミノ酸置換をもたらす、実施形態178の塩基エディターシステム。
182. A1ATタンパク質におけるアミノ酸置換がM374I置換またはそれに対応する置換である、実施形態180の塩基エディターシステム。
183. 前記核酸塩基がSERPINA1ポリヌクレオチドの位置1455またはそれに対応する位置にある、実施形態126の塩基エディタシステム。
184. 前記ガイドポリヌクレオチドが2つの個別のポリヌクレオチドを含み、前記2つの個別のポリヌクレオチドが、2つのDNA、2つのRNA、またはDNAとRNAである、実施形態134〜182のいずれか1つの塩基エディターシステム。
185. ガイドポリヌクレオチドがcrRNAおよびtracrRNAを含み、crRNAはSERPINA1ポリヌクレオチド中の標的配列に対して相補的な核酸配列を含む、実施形態183のいずれか一つの塩基エディターシステム。
186. 標的配列がSERPINA1ポリヌクレオチドの位置1455を含む、実施形態184の塩基エディターシステム。
187. 標的配列が、GAAGAAGATATTGGTGCTGT, TCAATCATTAAGAAGACAAA, ACTTTTCCCATGAAGAGGGG, CATCGCTACAGCCTTTGCAA, および GGGACCAAGGCTGACACTCAから選択される配列を含む、実施形態184の塩基エディターシステム。
188. 該塩基エディターシステムが単一ガイドRNA (sgRNA) を含む、実施形態185または186の塩基エディターシステム。
189. 前記sgRNAが、
5’-CAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-GUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UGUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUGUUCAAUCAUUAAGAAGACAAAGGGUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAG-3’,
5’-UUCAAUCAUUAAGAAGACAAAGG-3’,
5’-UCAAUCAUUAAGAAGACAAAGGG-3’, および
5’-AAUCAUUAAGAAGACAAAGGGU-3’
からなる群より選択される配列を含む、実施形態187の塩基エディターシステム。
190. 単一ガイドRNA (sgRNA)、
BE4のアミノ酸配列を含む融合タンパク質
を含む塩基エディターシステムであって、
前記sgRNAは、前記塩基エディターシステムをターゲティングしてSERPINA1ポリヌクレオチド中の位置1455またはそれに対応する位置のシチジンを脱アミノ化させることができ、
191. ここで、前記sgRNAは、
5’-CAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-GUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UGUUCAAUCAUUAAGAAGACAAAGGGUUU-3’,
5’-UUGUUCAAUCAUUAAGAAGACAAAGGGUU-3’,
5’-UUCAAUCAUUAAGAAGACAAAG-3’,
5’-UUCAAUCAUUAAGAAGACAAAGG-3’,
5’-UCAAUCAUUAAGAAGACAAAGGG-3’, および
5’-AAUCAUUAAGAAGACAAAGGGU-3’
からなる群から選択される配列を含む。
192. 必要とする対象において疾患を治療する方法であって、
ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、および
デアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを前記対象に投与することを含み、
ここで、前記ガイドポリヌクレオチドは、前記塩基エディターシステムをターゲティングして前記対象の細胞の標的ポリヌクレオチドにおける核酸塩基の脱アミノ化をもたらすことができ、前記核酸塩基は前記疾患の原因ではない、
方法。
193. 必要とする対象において疾患を治療する方法であって、
(a) 細胞に、
ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、および
デアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを導入することと、
(b) 前記細胞を前記対象に投与することと
を含み、
前記ガイドポリヌクレオチドは、前記塩基エディターシステムをターゲティングして前記対象の細胞の標的ポリヌクレオチド中の核酸塩基の脱アミノ化をもたらすことができ、それによって疾患を治療し、前記核酸塩基は前記疾患の原因ではない、
方法。
194. 疾患の治療のための改変された細胞を産生する方法であって、
ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、および
デアミナーゼドメインまたはそれをコードする核酸
を含む塩基エディターシステムを細胞に導入することを含み、
前記ガイドポリヌクレオチドは前記塩基エディターシステムをターゲティングして前記細胞の標的ポリヌクレオチド中の核酸塩基の脱アミノ化をもたらすことができ、
前記核酸塩基は前記疾患の原因ではない、方法。
195. 前記導入することがインビボまたはエクスビボである、実施形態192の方法。
196. 前記細胞が肝細胞またはその前駆細胞である、実施形態192または193の方法。
197. 標的ポリヌクレオチドは、タンパク質をコードする遺伝子を含み、前記遺伝子は前記疾患の原因となる病原性一塩基多型 (SNP) を含む、実施形態190〜194のいずれか一実施形態の方法。
198. 前記疾患が、鎌状赤血球症、ベータ-サラセミア、アルファ-1アンチトリプシン欠損症 (A1AD) 、ATTRアミロイドーシス、または嚢胞性線維症である、実施形態95の方法。
199. 前記タンパク質が、病原性SNPに起因するアミノ酸変異を含む、実施形態195または196の方法。
200. 前記核酸塩基の脱アミノ化が、タンパク質の発現、活性、または安定性を改変する、実施形態197の方法。
201. 前記核酸塩基の脱アミノ化が、タンパク質の発現、活性、または安定性を増加させる、実施形態198の方法。
202. 前記遺伝子がCFTRであり、タンパク質がCFTRタンパク質である、実施形態195〜199のいずれか1つの方法。
203. 前記脱アミノ化が、CFTRタンパク質におけるR 555 K、F 409 L、F 433 L、H 667 R、R 1070 W、R 29 K、R 553 Q、I 539 T、G 550 E、F 429 S、およびQ 637 Rからなる群より選択されるアミノ酸置換またはそれらに対応する置換をもたらす、実施形態200の方法。
204. 前記遺伝子がTTRであり、タンパク質がTTRタンパク質である、実施形態195〜199のいずれか1つの方法。
205. 前記脱アミノ化が、TTRタンパク質におけるA 108 V、R 104 H、およびT 119 Mからなる群より選択されるアミノ酸置換またはそれらに対応する置換をもたらす、実施形態202の方法。
206. 前記遺伝子がHBBであり、タンパク質がヘモグロビンのベータサブユニット (HbB) である、実施形態195〜199のいずれか1つの方法。
207. 前記脱アミノ化が、HbBのA 70 T、A 70 V、L 88 P、F 85 L、F 85 P、E 22 G、G 16 D、およびG 16 Nからなる群より選択されるアミノ酸置換またはそれらに対応する置換をもたらす、実施形態204の方法。
208. 前記ポリヌクレオチドプログラム可能なDNA結合ドメインがCas9ドメインである、実施形態189〜205のいずれか1つの方法。
209. Cas9ドメインがヌクレアーゼ不活性Cas9ドメインまたはCas9ニッカーゼドメインである、実施形態206の方法。
210. Cas9ドメインがSpCas9ドメインを含む、実施形態206または207の方法。
211. SpCas9ドメインがD10Aおよび/またはH840Aアミノ酸置換またはそれに対応するアミノ酸置換を含む、実施形態208の方法。
212. SpCas9ドメインがNGN PAMに対する特異性を有する、実施形態209の方法。
213. Cas9ドメインが、アミノ酸置換D 1135 M、S 1136 Q、G 1218 K、E 1219 F、A 1322 R、D 1332 A、R 1335 E、およびT 1337 R、またはそれらに対応するアミノ酸置換を含む、実施形態208〜210のいずれか1つの方法。
214. Cas9ドメインがSaCas9ドメインを含む、実施形態206または207の方法。
215. SaCas9ドメインは、NNNRRT PAMに対する特異性を有する、実施形態212の方法。
216. SaCas9ドメインがアミノ酸置換N579Aまたはそれに対応するアミノ酸置換を含む、実施形態212または213の方法。
217. Cas9ドメインがアミノ酸置換E 782 K、N 968 K、およびR 1015 H、またはそれらに対応するアミノ酸置換を含む、実施形態212〜214のいずれか1つの方法。
218. デアミナーゼドメインがシチジンデアミナーゼドメインを含む、実施形態189〜215のいずれか1つの方法。
219. シチジンデアミナーゼドメインがAPOBEC1ドメインを含む、実施形態216の方法。
220. デアミナーゼドメインがアデノシンデアミナーゼドメインを含む、実施形態189〜215のいずれか1つの方法。
221. アデノシンデアミナーゼドメインが、TadA 7.10を含むTadAドメインを含む、実施形態218の方法。
222. 塩基エディターシステムが少なくとも1つのUGIドメインをさらに含む、実施形態189〜219のいずれか1つの方法。
223. 塩基エディターシステムが少なくとも二つのUGIドメインを含む、実施形態220の方法。
224. 塩基エディターシステムが1つ以上のリンカーをさらに含む、実施形態189〜221のいずれか1つの方法。
225. ポリヌクレオチドプログラム可能なDNA結合ドメインおよびデアミナーゼドメインがリンカーを介して連結される、実施形態222の方法。
226. UGIドメインおよびデアミナーゼドメインがリンカーを介して接続される、実施形態222または223の方法。
227. リンカーがペプチドリンカーであり、それによって塩基編集融合タンパク質を形成している、実施形態224の方法。
228. 塩基編集融合タンパク質がBE4のアミノ酸配列を含む、実施形態225の方法。
229. 前記塩基編集融合タンパク質は、
MSEVEFSHEYWMRHALTLAKRAWDEREVPVGAVLVHNNRVIGEGWNRPIGRHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTLEPCVMCAGAMIHSRIGRVVFGARDAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLSDFFRMRRQEIKAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHYPGMNHRVEITEGILADECAALLCYFFRMPRQVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFmqPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAkfLQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPrAFKYFDTTIaRKeYrSTKEVLDATLIHQSITGLYETRIDLSQLGGDEGADKRTADGSEFESPKKKRKV
のアミノ酸配列を含む、実施形態225の方法。
230. 脱アミノ化が10%未満のインデル形成をもたらす、実施形態159〜197のいずれか一つの方法。
231. ガイドポリヌクレオチドまたはそれをコードする核酸;
ポリヌクレオチドプログラム可能なDNA結合ドメインまたはそれをコードする核酸、および
デアミナーゼドメインまたはそれをコードする核酸
を含む、塩基エディターシステムであって、
前記ガイドポリヌクレオチドが、塩基エディターシステムをターゲティングして標的ポリヌクレオチド中の核酸塩基の脱アミノ化をもたらすことができ、
前記核酸塩基は疾患の原因ではなく、
前記標的ポリヌクレオチドは表3Aまたは表3Bの標的配列を含む、
塩基エディターシステム。
塩基エディター中のPAMバリアントの検証
新規CRISPR系およびPAMバリアントにより、塩基エディターは標的SNPで精密修正を行うことができる。いくつかの新規PAMバリアントを評価および検証した。PAM評価および塩基エディターの詳細は、例えば、国際出願PCT/2017/045381 (WO2018/027078)およびPCT/US2016/058344 (WO2017/070632)に記載されており、それぞれ、その全体が参照により本明細書に組み込まれる。また、Komor, A.C., et al., “Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533, 420-424 (2016); Gaudelli, N.M., et al., “Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage” Nature 551, 464-471 (2017); および Komor, A.C., et al., “Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances 3:eaao4774 (2017)(それぞれの全内容が参照により本明細書に組み込まれる)も参照されたい。
アルファ−1アンチトリプシン欠損症(A1AD)を修正するための遺伝子編集
アルファ−1アンチトリプシン(A1AまたはA1AT)は、第14染色体上のSERPINA1遺伝子によってコードされるプロテアーゼ阻害因子である。この糖タンパク質は、主に肝臓で合成され、血中に分泌され、その血清濃度は、健康な成人では1.5〜3.0g/L(20〜52μmol/L)である。A1ATは、肺間質および肺胞上皮被覆液(alveolar lining fluid)に拡散し、そこでそれは好中球エラスターゼを不活化することによって、プロテアーゼ媒介性損傷から肺組織を保護する。アルファ−1アンチトリプシン欠損症(A1AD)は、常染色体共優性様式で遺伝する。
ATGAGCAGCGAGACAGGCCCTGTGGCTGTGGATCCTACACTGCGGAGAAGAATCGAGCCCCACGAGTTCGAGGTGTTCTTCGACCCCAGAGAGCTGCGGAAAGAGACATGCCTGCTGTACGAGATCAACTGGGGCGGCAGACACTCTATCTGGCGGCACACAAGCCAGAACACCAACAAGCACGTGGAAGTGAACTTTATCGAGAAGTTTACGACCGAGCGGTACTTCTGCCCCAACACCAGATGCAGCATCACCTGGTTTCTGAGCTGGTCCCCTTGCGGCGAGTGCAGCAGAGCCATCACCGAGTTTCTGTCCAGATATCCCCACGTGACCCTGTTCATCTATATCGCCCGGCTGTACCACCACGCCGATCCTAGAAATAGACAGGGACTGCGCGACCTGATCAGCAGCGGAGTGACCATCCAGATCATGACCGAGCAAGAGAGCGGCTACTGCTGGCGGAACTTCGTGAACTACAGCCCCAGCAACGAAGCCCACTGGCCTAGATATCCTCACCTGTGGGTCCGACTGTACGTGCTGGAACTGTACTGCATCATCCTGGGCCTGCCTCCATGCCTGAACATCCTGAGAAGAAAGCAGCCTCAGCTGACCTTCTTCACAATCGCCCTGCAGAGCTGCCACTACCAGAGACTGCCTCCACACATCCTGTGGGCCACCGGACTTAAGAGCGGAGGATCTAGCGGCGGCTCTAGCGGATCTGAGACACCTGGCACAAGCGAGTCTGCCACACCTGAGAGTAGCGGCGGATCTTCTGGCGGCTCCGACAAGAAGTACTCTATCGGACTGGCCATCGGCACCAACTCTGTTGGATGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAATCTGATCGGCGCCCTGCTGTTCGACTCTGGCGAAACAGCCGAAGCCACCAGACTGAAGAGAACCGCCAGGCGGAGATACACCCGGCGGAAGAACCGGATCTGCTACCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGACAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGATGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGAGACTGATCTACCTGGCTCTGGCCCACATGATCAAGTTCCGGGGCCACTTTCTGATCGAGGGCGATCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCTCTGGCGTGGACGCCAAGGCTATCCTGTCTGCCAGACTGAGCAAGAGCAGAAGGCTGGAAAACCTGATCGCCCAGCTGCCTGGCGAGAAGAAGAATGGCCTGTTCGGCAACCTGATTGCCCTGAGCCTGGGACTGACCCCTAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAATCTGCTGGCCCAGATCGGCGATCAGTACGCCGACTTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGATATCCTGAGAGTGAACACCGAGATCACAAAGGCCCCTCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGATCTGACCCTGCTGAAGGCCCTCGTTAGACAGCAGCTGCCAGAGAAGTACAAAGAGATTTTCTTCGATCAGTCCAAGAACGGCTACGCCGGCTACATTGATGGCGGAGCCAGCCAAGAGGAATTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTGGTCAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAATGGCTCTATCCCTCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGAGACAAGAGGACTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCAGGATCCCCTACTACGTGGGACCACTGGCCAGAGGCAATAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACACCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCCAGCGCTCAGTCCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCTAACGAGAAGGTGCTGCCCAAGCACTCCCTGCTGTATGAGTACTTCACCGTGTACAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTTCTGAGCGGCGAGCAGAAAAAGGCCATTGTGGATCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACAGCGTGGAAATCAGCGGCGTGGAAGATCGGTTCAATGCCAGCCTGGGCACATACCACGACCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAACGAAGAGAACGAGGACATTCTCGAGGACATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACATACGCCCACCTGTTCGACGACAAAGTGATGAAGCAACTGAAGCGGAGGCGGTACACAGGCTGGGGCAGACTGTCTCGGAAGCTGATCAACGGCATCCGGGATAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAAGGCGATTCTCTGCACGAGCACATTGCCAACCTGGCCGGATCTCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTTGTGAAAGTGATGGGCAGACACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACACAGAAGGGCCAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGACGGGATATGTACGTGGACCAAGAGCTGGACATCAACCGGCTGAGCGACTACGATGTGGACCATATCGTGCCCCAGAGCTTTCTGAAGGACGACTCCATCGATAACAAGGTCCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGATAACGTGCCCTCCGAAGAGGTGGTCAAGAAGATGAAGAACTACTGGCGACAGCTGCTGAACGCCAAGCTGATTACCCAGCGGAAGTTCGATAACCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTTGATAAGGCCGGCTTCATTAAGCGGCAGCTGGTGGAAACCCGGCAGATCACCAAACACGTGGCACAGATTCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTCATCACCCTGAAGTCTAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTCTACAAAGTGCGGGAAATCAACAACTACCATCACGCCCACGACGCCTACCTGAATGCCGTTGTTGGAACAGCCCTGATCAAGAAGTATCCCAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAACAAGAGATCGGCAAGGCTACCGCCAAGTACTTTTTCTACAGCAACATCATGAACTTTTTCAAGACAGAGATCACCCTGGCCAACGGCGAGATCCGGAAAAGACCCCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCAGAGATTTTGCCACAGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAGAAAACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCTAAGCGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGATAGCCCTACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAAAAGCTCAAGAGCGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTTGAGAAGAACCCGATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTCAAGAAGGACCTCATCATCAAGCTCCCCAAGTACAGCCTGTTCGAGCTGGAAAATGGCCGGAAGCGGATGCTGGCCTCAGCAGGCGAACTGCAGAAAGGCAATGAACTGGCCCTGCCTAGCAAATACGTCAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCAGCCCCGAGGACAATGAGCAAAAGCAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAACCTGGATAAGGTGCTGTCTGCCTATAACAAGCACCGGGACAAGCCTATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAACCTGGGAGCCCCTGCCGCCTTCAAGTACTTCGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACACTGATCCACCAGTCTATCACCGGCCTGTACGAAACCCGGATCGACCTGTCTCAGCTCGGCGGCGATTCTGGTGGTTCTGGCGGAAGTGGCGGATCCACCAATCTGAGCGACATCATCGAAAAAGAGACAGGCAAGCAGCTCGTGATCCAAGAATCCATCCTGATGCTGCCTGAAGAGGTTGAGGAAGTGATCGGCAACAAGCCTGAGTCCGACATCCTGGTGCACACCGCCTACGATGAGAGCACCGATGAGAACGTCATGCTGCTGACAAGCGACGCCCCTGAGTACAAGCCTTGGGCTCTCGTGATTCAGGACAGCAATGGGGAGAACAAGATCAAGATGCTGAGCGGAGGTAGCGGAGGCAGTGGCGGAAGCACAAACCTGTCTGATATCATTGAAAAAGAAACCGGGAAGCAACTGGTCATTCAAGAGTCCATTCTCATGCTCCCGGAAGAAGTCGAGGAAGTCATTGGAAACAAACCCGAGAGCGATATTCTGGTCCACACAGCCTATGACGAGTCTACAGACGAAAACGTGATGCTCCTGACCTCTGACGCTCCCGAGTATAAGCCCTGGGCACTTGTTATCCAGGACTCTAACGGGGAAAACAAAATCAAAATGTTGTCCGGCGGCAGCAAGCGGACAGCCGATGGATCTGAGTTCGAGAGCCCCAAGAAGAAACGGAAGGTgGAGtaa
下記表7は、記述された実施形態において利用された野生型およびバリアント(E342K)のSERPINA1にコードされたアミノ酸配列ならびに野生型およびバリアント(E342K)のSERPINA1ポリヌクレオチドのオープンリーティングフレーム(ORF)核酸配列の代表的リストを提供する。
表7.例示的配列
本明細書に記載される実施例で提供された結果は、以下の材料および方法を用いて得られた。
[クローニング/トランスフェクション]
PCRはVeraSeq ULtra DNAポリメラーゼ (Enzymatics) またはQ5 Hot Start High-Fidelity DNAポリメラーゼ(New England Biolabs)を用いて行った。USERクローニング(New England Biolabs)を用いて塩基エディター (BE) プラスミドを構築した。デアミナーゼ遺伝子はgBlocks Gene Fragments (Integrated DNA Technologies)として合成された。用いたCas9遺伝子は下記に示す。Cas9遺伝子は以前に報告されたプラスミドから得られた。デアミナーゼと融合遺伝子をpCMV (哺乳類コドン最適化)またはpET28b (大腸菌コドン最適化)の骨格にクローニングした。sgRNA発現プラスミドは、部位特異的変異誘発を用いて構築した。
BEAM53
ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNGCCGTGCATAAGGCTGTGCTG
BEAM54
TGGAGTTCAGACGTGTGCTCTTCCGATCTGGGTGGGATTCACCACTTTTCCCATG
BEAM1704
ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNN AGGTGTCCACGTGAGCCTTG
すべてのssDNA基質の配列を下記に示す。Cy3標識基質はすべてIntegrated DNA Technologies (IDT) から入手した。デアミナーゼは、1μgのプラスミドを使用して、製造業者の指示に従ってTNT T7 Quick Coupled Transcription/Translation Kit (Promega) を使用してin vitroで発現させた。タンパク質発現に続いて、5μlの溶解物を、CutSmart緩衝液(New England Biolabs) (50 mM酢酸カリウム、29 mMトリス酢酸、10 mM酢酸マグネシウム、100μg ml-1 BSA、pH 7.9)中で35μlのssDNA (1.8μM)およびUSER酵素(1ユニット)と組み合わせ、37℃で2時間インキュベートした。切断されたU含有基質を、10% TBE‐尿素ゲル (Bio‐Rad) 上で完全長未改変基質から分離した。
大腸菌BL21 STAR (DE 3) コンピテント細胞(ThermoFisher Scientific)を、pET28b-His6-rAPOBEC1-リンカー-dCas9をコードするプラスミドで形質転換した。得られた発現株を、カナマイシン100μg ml-1を含むLuria-Bertani (LB) ブロス中で37℃で一晩増殖させた。細胞を同じ増殖培地に1:100希釈し、OD600=〜0.6になるまで37℃で増殖させた。培養物を4℃で2時間冷却し、イソプロピル-β-d-1-チオガラクトピラノシド (IPTG) を0.5 mMで添加してタンパク質発現を誘導した。約16時間後、4,000 gで遠心分離して細胞を集め、溶解緩衝液(50 mMトリス(ヒドロキシメチル)アミノメタン(Tris) -HCl (pH 7.5)、1M NaCl、20%グリセロール、10 mMトリス(2-カルボキシエチル)ホスフィン(TCEP、Soltec Ventures))に再懸濁した。細胞を超音波処理(20秒パルス・オン、20秒パルス・オフ、合計8分間、6 W出力)によって溶解し、25,000 gで15分間遠心分離した後に溶解物上清を単離した。溶解物をHis-Purニッケル-ニトリロ酢酸 (ニッケル-NTA) 樹脂(ThermoFisher Scientific)と共に4℃で1時間インキュベートし、His標識融合タンパク質を捕捉した。樹脂をカラムに移し、溶解緩衝液40 mlで洗浄した。Hisタグ融合タンパク質を、285 mMイミダゾールを補充した溶解緩衝液中で溶出し、限外濾過(100 kDa分子量カットオフのAmicon-Millipore)によって全容量1 mlに濃縮した。タンパク質を、50 mMトリス(ヒドロキシメチル)-アミノメタン (Tris) -HCl (pH 7.0)、0.1 M NaCl、20%グリセロール、10 mM TCEPを含む低塩精製緩衝液中で20mlに希釈し、SPセファロースFast Flow樹脂(GE Life Sciences)上にロードした。樹脂をこの低塩緩衝液40 mlで洗浄し、50 mMトリス(ヒドロキシメチル)アミノメタン (Tris) -HCl (pH 7.0)、0.5 M NaCl、20%グリセロール、10 mM TCEPを含む活性緩衝液5 mlでタンパク質を溶出した。溶出したタンパク質をSDS-PAGEで定量した。
T7プロモーターに続いて20-bp sgRNA標的配列を含む直鎖DNA断片を、製造業者の指示に従ってTranscriptAid T 7 High Yield Transcription Kit (ThermoFisher Scientific)を用いて、in vitroで転写した。製造業者の指示に従ってMEGAclear キット(ThermoFisher Scientific)を用いてsgRNA産物を精製し、UV吸収により定量した。
80 ntの無標識鎖を、PAGE精製オリゴヌクレオチドとしてIDT社にオーダーした。補足情報に列挙される25-nt Cy3標識プライマーは各80 nt基質の3’末端に対して相補的である。このプライマーは、HPLC精製オリゴヌクレオチドとしてIDTにオーダーした。Cy3標識dsDNA基質を生成するために、80 nt鎖(5μlの100μM溶液)を、Cy3標識プライマー(5μlの100μM溶液)とNEBuffer 2 (38.25μlの50 mM NaCl、10 mM Tris-HCl、10 mM MgCl2、1 mM DTT、pH 7.9溶液、New England Biolabs)中でdNTP (0.75μlの100 mM溶液)と組み合わせ、95℃で5分間加熱し、その後45℃まで0.1℃/秒の速度で徐々に冷却した。このアニーリング期間の後、Klenow exo-(5U、New England Biolabs)を加え、反応物を37℃で1時間インキュベートした。溶液を緩衝液PB (250μl、Qiagen)およびイソプロパノール(50μl)で希釈し、QIAprepスピンカラム (Qiagen) で精製し、50μlのTris緩衝液で溶出した。dsDNAに対するデアミナーゼアッセイ。精製した融合タンパク質(活性緩衝液中1.9μMを20μl)を1当量の適切なsgRNAと組み合わせ、周囲温度で5分間インキュベートした。Cy3標識dsDNA基質を125 nMの最終濃度で添加し、得られた溶液を37℃で2時間インキュベートした。緩衝液PB (100μl、Qiagen)およびイソプロパノール(25μl)の添加により融合物からdsDNAを分離し、EconoSpinマイクロスピンカラム(Epoch Life Science)で精製し、20μlのCutSmart緩衝液(New England Biolabs)で溶出した。精製された編集dsDNAにUSER酵素(1 U、New England Biolabs)を添加し、37℃で1時間インキュベートした。5μlの反応溶液を15μlのDMSOベースのローディング緩衝液(5 mM Tris、0.5 mM EDTA、12.5%グリセロール、0.02%ブロモフェノールブルー、0.02%キシレンシアン、80% DMSO)と組み合わせることによって、Cy3標識鎖をその相補鎖から完全に変性させた。全長C含有基質を、10% TBE-尿素ゲル (Bio-Rad) 上で、切断されたU含有編集基質から分離し、GE Amersham Typhoonイメージャー上で画像化した。
下記オリゴヌクレオチドはIDT社から入手した。相補的配列をTris緩衝液中で組み合わせ(5μlの100μM溶液)、95℃に5分間加熱し、続いて45℃まで0.1℃/秒の速度で徐々に冷却することによってアニールし、60 bpのdsDNA基質を生成した。精製融合タンパク質(活性緩衝液中1.9μMを20μl)を1当量の適切なsgRNAと組み合わせ、周囲温度で5分間インキュベートした。60マーdsDNA基質を125 nMの最終濃度で添加し、得られた溶液を37℃で2時間インキュベートした。緩衝液PB (100μl、Qiagen)およびイソプロパノール(25μl)の添加により融合物からdsDNAを分離し、EconoSpinマイクロスピンカラム(Epoch Life Science)で精製し、20μlのTris緩衝液で溶出した。得られた編集されたDNA (1μlをテンプレートとして使用した)を、製造業者の指示に従って上記ハイスループット配列決定プライマー対およびVeraSeq Ultra (Enzymatics) を用いて13サイクルの増幅を伴うPCRによって増幅した。RapidTips (Diffinity Genomics)を用いてPCR反応生成物を精製し、精製したDNAを、シークエンシングアダプターを含むプライマーを用いてPCRにより増幅し、精製し、先に記載したようにMiSeqハイスループットDNAシークエンサー (Illumina) 上で配列決定した。
HEK293T (ATCC CRL-3216)およびU2OS (ATCC HTB-96)を、10% (v/v) ウシ胎児血清 (FBS) を補充したダルベッコの改変イーグル培地プラスGlutaMax (ThermoFisher) 中で、37℃、5% CO2で維持した。HCC1954細胞(ATCC CRL-2338)を、上記のように補充したRPMI-1640培地(ThermoFisher Scientific)中で維持した。SERPINA1遺伝子を含有する不死化細胞(Taconic Biosciences)を、10% (v/v) ウシ胎児血清 (FBS) および200μg ml-1ゲネチシン(ThermoFisher Scientific)を補足したダルベッコの改変イーグル培地プラスGlutaMax (ThermoFisher Scientific)中で培養した。
HEK293Tを、48ウェルのコラーゲン被覆BioCoatプレート (Corning) 上に播種し、約85%コンフルエントの状態でトランスフェクトした。簡単に述べれば、750 ngのBEおよび250 ngのsgRNA発現プラスミドを、1.5μlのリポフェクタミン2000 (ThermoFisher Scientific)/ウェルを用いて、製造業者のプロトコルに従ってトランスフェクトした。HEK293T細胞を、メーカーの指示に従って、適切なAmaxa Nucleofector IIプログラムを用いてトランスフェクトした(HEK 293T細胞のためのプログラムQ-001を用いるVキット)。
トランスフェクトした細胞を3日後に収穫し、Agencourt DNAdvance Genomic DNA Isolation Kit (Beckman Coulter)を製造業者の指示に従って用いてゲノムDNAを単離した。対象のオン・ターゲットおよびオフ・ターゲットゲノム領域を、隣接するハイスループット配列決定プライマー対BEAM53/BEAM54またはBEAM1704/BEAM54を用いたPCRによって増幅した。PCR増幅は、5 ngのゲノムDNAをテンプレートとして使用し、Phusion高忠実度DNAポリメラーゼ (ThermoFisher) を用いて、製造業者の指示に従って実施した。反応が直線的増幅範囲内で停止することを確実にするために、各プライマー対について別々にサイクル数を決定した。RapidTips (Diffinity Genomics)を用いてPCR産物を精製した。精製DNAを、配列決定アダプターを含むプライマーを用いたPCRにより増幅した。生成物をゲル精製し、Quant-iT PicoGreen dsDNA Assay Kit (ThermoFisher) およびKAPA Library Quantification Kit-Illumina (KAPA Biosystems)を用いて定量した。サンプルは、前述のようにIllumina MiSeq上で配列決定された(Pattanayak, Nature Biotechnol. 31, 839-843 (2013))。
配列決定リード(read)は、MiSeq Reporter (Illumina) を使用して自動的に脱マルチプレックス化され、個々のFASTQファイルを、カスタムMatlabを使用して分析した。各リードは、Smith-Watermanアルゴリズムを使用して、適切な参照配列にペアワイズでアラインメントされた。Qスコアが31未満の塩基コールはNに置き換え、ヌクレオチド頻度の計算から除外した。この処理により、予測されるMiSeq塩基呼び出しエラー率は約1,000分の1になる。リードと参照配列がギャップを含まないアラインメント配列は、アラインメントテーブルに保存し、そこから各遺伝子座について塩基頻度を表にすることができた。インデル頻度は、前述の基準 (Zuris, et al., Nature Biotechnol. 33, 73-80 (2015)) を用いて、カスタムのMatlabスクリプトで定量した。配列決定リードをスキャンして、インデル(indel)が生じる可能性のあるウィンドウの両側に隣接する二つの10 bp配列との正確なマッチを探した。完全なマッチが見つからなかった場合、そのリードは分析から除外した。このインデルウィンドウの長さが参照配列と正確に一致した場合、そのリードはインデルを含まないものとして分類された。インデルウィンドウが参照配列よりも2塩基以上長いかまたは短い場合、その配列決定リードは、それぞれ挿入または欠失として分類された。
Claims (122)
- アルファ−1アンチトリプシン欠乏症(A1AD)に関連する一塩基多型(SNP)を含むSERPINA1ポリペプチドを編集する方法であって、
前記SERPINA1ポリペプチドを、1つ以上のガイドポリヌクレオチドと複合体をなす塩基エディターと接触させることを含み、
前記塩基エディターは、ポリヌクレオチドプログラム可能なDNA結合ドメインとシチジンデアミナーゼドメインとを含み、前記1つ以上のガイドポリヌクレオチドは前記塩基エディターをターゲティングしてA1ADに関連する一塩基多型(SNP)の改変をもたらす、
方法。 - 前記接触させることは、細胞中、真核生物細胞中、哺乳類細胞中、またはヒト細胞中である、請求項1に記載の方法。
- 細胞はin vivoまたはex vivoである、請求項1または2に記載の方法。
- 前記塩基エディターはSERPINA1ポリヌクレオチドの位置1455のシチジンを脱アミノ化し、それによりアルファ−1アンチトリプシン(A1AT)のタンパク質のアミノ酸位置374においてメチオニンからイソロイシンへの変異を誘導する、請求項1〜3のいずれか一項に記載の方法。
- 前記A1ATポリペプチドはアミノ酸位置342においてリジンを含む、請求項1〜4のいずれか一項に記載の方法。
- 前記A1ATポリペプチドはアミノ酸位置376においてリジンを含む、請求項1〜4のいずれか一項に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、Streptococcus pyogenes Cas9 (SpCas9)またはそのバリアントである、請求項1〜4のいずれか一項に記載の方法。
- 前記SpCas9が、5’-NGG-3’ または 5’-GGG-3’から選択されるPAM配列に対する特異性を有する、請求項7に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントである、請求項1〜8のいずれか一項に記載の方法。
- 前記ニッカーゼバリアントは、アミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む、請求項9に記載の方法。
- 前記シチジンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のシチジンを脱アミノ化することができる、請求項1〜10のいずれか一項に記載の方法。
- 前記シチジンデアミナーゼドメインは、天然には存在しない改変されたシチジンデアミナーゼドメインである、請求項11に記載の方法。
- 前記シチジンデアミナーゼドメインはAPOBECデアミナーゼドメインである、請求項11または12に記載の方法。
- 前記塩基エディターはBE4である、請求項11〜13のいずれか一項に記載の方法。
- 前記1つ以上のガイドポリヌクレオチドが、CRISPR RNA(crRNA)とトランスコード化小RNA(tracrRNA)とを含み、前記crRNAは、A1ADに関連するSNPを含むSERPINA1核酸配列に対して相補的な核酸配列を含む、請求項1〜14のいずれか一項に記載の方法。
- 前記塩基エディターは、メチオニン374をコードするSERPINA1核酸配列に対して相補的な核酸配列を含む単一ガイドRNA(sgRNA)と複合体をなす、請求項1〜15のいずれか一項に記載の方法。
- 細胞またはその前駆細胞に、
ポリヌクレオチドプログラム可能なDNA結合ドメインおよびシチジンデアミナーゼドメインを含むエディター、それをコードするポリヌクレオチドと、
前記塩基エディターをターゲティングしてSERPINA1ポリヌクレオチドの核酸位置1455におけるシチジンを脱アミノ化させる、1つ以上のガイドポリヌクレオチドと
を導入することにより産生される、細胞。 - 産生された前記細胞は肝細胞である、請求項17に記載の細胞。
- 前記細胞またはその前駆細胞は、人工多能性幹細胞または肝細胞である、請求項17または18に記載の細胞。
- 前記肝細胞はA1ATポリペプチドを発現する、請求項18または19に記載の細胞。
- A1ADを有する対象からのものである、請求項17〜20のいずれか一項に記載の細胞。
- 哺乳類細胞またはヒト細胞である、請求項17〜21のいずれか一項に記載の細胞。
- 前記シチジンにおける改変が、A1ATポリペプチドの位置374のメチオニンをイソロイシンに変える、請求項17〜22のいずれか一項に記載の細胞。
- 前記シチジンの脱アミノ化が、アミノ酸位置374においてイソロイシンを有するA1ATポリペプチドの発現をもたらす、請求項17〜23のいずれか一項に記載の細胞。
- A1ADに関連するSNPがアミノ酸位置342においてグルタミン酸をリジンで置換する、請求項17〜24のいずれか一項に記載の細胞。
- 前記細胞は、SERPINA1ポリヌクレオチドの核酸位置1455におけるシチジンの脱アミノ化のために選択されるものである、請求項17〜25のいずれか一項に記載の細胞。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、Streptococcus pyogenes Cas9 (SpCas9)またはそのバリアントである、請求項17〜26のいずれか一項に記載の細胞。
- 前記SpCas9が、5’-NGG-3’ or 5’-GGG-3’から選択されるPAM配列に対する特異性を有する、請求項27に記載の細胞。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントまたはである、請求項17〜28のいずれか一項に記載の細胞。
- 前記ニッカーゼバリアントはアミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む、請求項29に記載の細胞。
- 前記シチジンデアミナーゼドメインはデオキシリボ核酸(DNA)におけるシチジンを脱アミノ化することができる、請求項17〜30のいずれか一項に記載の細胞。
- 前記シチジンデアミナーゼドメインは、天然には存在しない改変されたシチジンデアミナーゼドメインである、請求項31に記載の細胞。
- 前記シチジンデアミナーゼドメインはAPOBECデアミナーゼドメインである、請求項31または32に記載の細胞。
- 前記塩基エディターはBE4である、請求項31〜33のいずれか一項に記載の細胞。
- 前記1つ以上のガイドポリヌクレオチドはCRISPR RNA (crRNA)およびトランス活性化小(tracrRNA)を含み、前記crRNAは、SERPINA1ポリヌクレオチドの核酸位置1455におけるシチジンに対して相補的な核酸配列を含む、請求項17〜34のいずれか一項に記載の細胞。
- 前記塩基エディターと前記1つ以上のガイドポリヌクレオチドとが前記細胞内で複合体を形成する、請求項17〜35のいずれか一項に記載の細胞。
- 前記塩基エディターは、SERPINA1ポリヌクレオチドの核酸位置1455におけるシチジンに対して相補的な核酸配列を含む単一ガイドRNA (sgRNA)と複合体をなす、請求項36に記載の細胞。
- 対象におけるA1ADを治療する方法であって、請求項17〜37のいずれか一項に記載の細胞を前記対象に投与することを含む、方法。
- 前記細胞は前記対象にとって自家性または同種異系である、請求項38に記載の方法。
- 請求項17〜37のいずれか一項に記載の細胞から増殖または拡張された、単離細胞または細胞集団。
- 対象におけるA1ADを治療する方法であって、
ポリヌクレオチドプログラム可能なDNA結合ドメインおよびシチジンデアミナーゼドメインを含む、塩基エディターまたはそれをコードするポリヌクレオチドと;
前記塩基エディターをターゲティングしてSERPINA1ポリヌクレオチドの核酸位置1455におけるシチジンの改変をもたらす、1つ以上のガイドポリヌクレオチドと
を、必要とする対象に投与することを含む、
方法。 - 前記対象は哺乳類またはヒトである、請求項41に記載の方法。
- 前記塩基エディターまたはそれをコードするポリヌクレオチドと、前記1つ以上のガイドポリヌクレオチドとを前記対象の細胞に送達することを含む、請求項41または42に記載の方法。
- 前記細胞は、肝細胞であるかまたは肝細胞の前駆細胞である、請求項43に記載の方法。
- 前記肝細胞はA1ATタンパク質を発現する、請求項44に記載の方法。
- 前記シチジンの脱アミノ化が、A1ATポリヌクレオチドにおいてメチオニンをイソロイシンに変える、請求項41〜45のいずれか一項に記載の方法。
- 前記A1ATタンパク質はA1ADに関連するSNPを含む、請求項45または46に記載の方法。
- A1ADに関連するSNPが、アミノ酸位置342においてグルタミン酸をリジンに置換する、請求項41〜47のいずれか一項に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、Streptococcus pyogenes Cas9 (SpCas9)またはそのバリアントを含む、請求項41〜48のいずれか一項に記載の方法。
- 前記SpCas9が5’-NGG-3’ または 5’-GGG-3’から選択されるPAM配列に対する特異性を有する、請求項49に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントである、請求項41〜50のいずれか一項に記載の方法。
- 前記ニッカーゼバリアントは、アミノ酸置換D10A、またはそれに対応するアミノ酸置換を含む、請求項51に記載の方法。
- 前記シチジンデアミナーゼドメインはデオキシリボ核酸(DNA)におけるシチジンを脱アミノ化することができる、請求項41または42に記載の方法。
- 前記シチジンデアミナーゼドメインは、天然には存在しない改変されたシチジンデアミナーゼドメインである、請求項53に記載の方法。
- 前記シチジンデアミナーゼドメインはAPOBECデアミナーゼドメインである、請求項53または54に記載の方法。
- 前記塩基エディターはBE4である、請求項54または55に記載の方法。
- 前記1つ以上のガイドポリヌクレオチドはCRISPR RNA (crRNA)およびトランスコード化小RNA (tracrRNA)を含み、前記crRNAは、SERPINA1核酸配列に対して相補的な核酸配列を含む、請求項41〜56のいずれか一項に記載の方法。
- 前記塩基エディターは、SERPINA1の核酸位置1455におけるシチジンに対して相補的な核酸配列を含む単一ガイドRNA (sgRNA)と複合体をなす、請求項41〜57のいずれか一項に記載の方法。
- 肝細胞またはその前駆細胞を産生する方法であって、
(a) A1ADに関連するSNPを含む肝前駆細胞に、
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインおよびシチジンデアミナーゼドメインを含む塩基エディター、またはそれをコードするポリヌクレオチドと、
前記塩基エディターをターゲティングしてSERPINA1ポリヌクレオチドの核酸位置1455におけるシチジンにおいてシチジン脱アミノ化をもたらす、1つ以上のガイドポリヌクレオチドと
を導入すること;および
(b) 前記肝前駆細胞を肝細胞に分化させること
を含む、方法。 - 前記肝前駆細胞はA1ATポリペプチドを発現する、請求項59に記載の方法。
- 前記肝前駆細胞は、A1ADを有する対象から得られるものである、請求項59または60に記載の方法。
- 前記肝前駆細胞は哺乳類細胞またはヒト細胞である、請求項59〜61のいずれか一項に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、Streptococcus pyogenes Cas9 (SpCas9)またはそのバリアントを含む、請求項59〜62のいずれか一項に記載の方法。
- 前記SpCas9は、5’-NGG-3’ または 5’-GGG-3’から選択されるPAM配列に対する特異性を有する、請求項63に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活性バリアントまたはニッカーゼバリアントである、請求項59〜64のいずれか一項に記載の方法。
- 前記ニッカーゼバリアントはアミノ酸置換D10Aまたはそれに対応するアミノ酸置換を含む、請求項65に記載の方法。
- 前記シチジンデアミナーゼドメインは、デオキシリボ核酸(DNA)におけるシチジンを脱アミノ化することができる、請求項59〜66のいずれか一項に記載の方法。
- 前記シチジンデアミナーゼドメインは、天然には存在しない改変されたシチジンデアミナーゼドメインである、請求項57に記載の方法。
- 前記シチジンデアミナーゼドメインは、APOBECデアミナーゼドメインである、請求項57または58に記載の方法。
- 前記塩基エディターはBE4である、請求項67〜69のいずれか一項に記載の方法。
- 前記1つ以上のガイドポリヌクレオチドは、CRISPR RNA (crRNA)およびトランスコード化小RNA (tracrRNA)を含み、前記crRNAは、SERPINA1の核酸位置1455におけるシチジンに対して相補的な核酸配列を含む、請求項57〜69のいずれか一項に記載の方法。
- 前記塩基エディターおよび1つ以上のガイドポリヌクレオチドは、前記細胞中で複合体を形成する、請求項57〜71のいずれか一項に記載の方法。
- 前記塩基エディターは、SERPINA1の核酸位置1455におけるシチジンに対して相補的な核酸配列を含む単一ガイドRNA (sgRNA)と複合体をなす、請求項72に記載の方法。
- 5’-CAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-UCAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-UUCAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-GUUCAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-UGUUCAAUCAUUAAGAAGACAAAGGGUUU-3’
5’-UUGUUCAAUCAUUAAGAAGACAAAGGGUU-3’
5’-UUCAAUCAUUAAGAAGACAAAG-3’
5’-UUCAAUCAUUAAGAAGACAAAGG-3’
5’-UCAAUCAUUAAGAAGACAAAGGG-3’
5’-AAUCAUUAAGAAGACAAAGGGU-3’
から選択される核酸配列を含む、
ガイドRNA。 - 請求項74のガイドRNAの18、19、20、21、または22ヌクレオチドを含む、ガイドRNA。
- 塩基エディターおよび請求項74のガイドRNAを含む、タンパク質核酸複合体。
- 対象における遺伝的障害を治療する方法であって、
必要とする対象に、ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインとデアミナーゼドメインとを含む塩基エディター、またはそれをコードするポリヌクレオチドを投与すること;
対象の標的ヌクレオチド配列へと前記塩基エディターをターゲティングする、ガイドポリヌクレオチドを前記対象に投与すること;および
前記標的ヌクレオチド配列への前記塩基エディターのターゲティングの際に、核酸塩基を脱アミノ化することにより前記標的ヌクレオチド配列の核酸塩基を編集し、それにより前記核酸塩基を別の核酸塩基に変えることによって前記遺伝的障害を治療すること
を含み、
前記核酸塩基はポリヌクレオチドのタンパク質コード領域中にあり、前記核酸塩基は前記遺伝的障害の原因ではない、
方法。 - 対象における遺伝的障害を治療するための細胞、組織、または器官を産生する方法であって、
ポリヌクレオチドプログラム可能なヌクレオチド結合ドメインとデアミナーゼドメインとを含む塩基エディター、またはそれをコードするポリヌクレオチドに、細胞、組織、または器官を接触させること;
前記細胞、組織、または器官の標的ヌクレオチド配列へと前記塩基エディターをターゲティングするガイドポリヌクレオチドに、前記細胞、組織、または器官を接触させること;および
前記標的ヌクレオチド配列への前記塩基エディターのターゲティングの際に、核酸塩基を脱アミノ化することにより前記標的ヌクレオチド配列の核酸塩基を編集し、それにより前記核酸塩基を別の核酸塩基に変えることによって、前記遺伝的障害を治療するための細胞、組織、または器官を産生すること
を含み、
前記核酸塩基はポリヌクレオチドのタンパク質コード領域中にあり、前記核酸塩基は前記遺伝的障害の原因ではない、
方法。 - 前記細胞、組織、または器官を、必要とする対象に投与することをさらに含む、請求項78に記載の方法。
- 前記細胞、組織、または器官は、前記対象にとって自家性、同種異系、または異種である、請求項78または79に記載の方法。
- 前記核酸塩基を別の核酸塩基に変えることは、前記ポリヌクレオチドによってコードされるタンパク質の活性の増加をもたらす、請求項77〜80のいずれか一項に記載の方法。
- 前記核酸塩基を別の核酸塩基に変えることは、前記ポリヌクレオチドによってコードされるタンパク質の折り畳みの改善および/または安定性の増加をもたらす、請求項77〜80のいずれか一項に記載の方法。
- 前記核酸塩基を別の核酸塩基に変えることは、前記ポリヌクレオチドによってコードされるタンパク質の発現の増加をもたらす、請求項77〜80のいずれか一項に記載の方法。
- 前記タンパク質の発現の増加は、
前記タンパク質の翻訳率の改善、もしくは前記タンパク質を含有する細胞小器官もしくは細胞区画からの放出率の増加;
前記タンパク質のシグナルペプチドのプロセシング率の改善;または
別のタンパク質との前記タンパク質の相互作用の改変
のうちの1つ以上に起因する、請求項83に記載の方法。 - 前記核酸塩基は、前記遺伝的障害の原因である遺伝子に位置する、請求項77〜84のいずれか一項に記載の方法。
- 前記編集することは、前記遺伝子に位置する複数の核酸塩基を編集することを含み、前記複数の核酸塩基は前記遺伝的障害の原因ではない、請求項85に記載の方法。
- 前記編集することは、少なくとも1つの別の遺伝子に位置する1つ以上の追加の核酸塩基を編集することをさらに含む、請求項85または86に記載の方法。
- 前記遺伝子と、前記少なくとも1つの別の遺伝子は、タンパク質の1つ以上のサブユニットをコードする、請求項87に記載の方法。
- 前記核酸塩基は、表3Aまたは表3Bに記載された遺伝子中にあり、前記編集することが、表3Aまたは表3Bに示された遺伝子によりコードされるタンパク質におけるアミノ酸変化をもたらす、請求項77〜88のいずれか一項に記載の方法。
- 前記遺伝的障害は、網膜色素変性症、アッシャー症候群、鎌状赤血球症、ベータサラセミア、アルファ−1アンチトリプシン欠損症(A1AD)、肝性ポルフィリン症、中鎖アシルCoAデヒドロゲナーゼ(MCAD)欠損症、ライソゾーム酸性リパーゼ(LAL)欠損症、フェニルケトン尿症、ヘモクロマトーシス、フォン・ギールケ病、ポンペ病、ゴーシェ病、ハーラー症候群、嚢胞性線維症、または慢性疼痛である、請求項77〜89のいずれか一項に記載の方法。
- 前記遺伝的障害はアルファ−1アンチトリプシン欠損症(A1AD)である、請求項77〜90のいずれか一項に記載の方法。
- 前記編集することは、F51L、M374I、A348V、A347V、K387R、T59A、およびT68Aからなる群から選択される、アルファ−1アンチトリプシン(A1AT)タンパク質におけるアミノ酸変化をもたらす、請求項91に記載の方法。
- 前記編集することは、A1ATタンパク質におけるM374Iアミノ酸変化をもたらす、請求項92に記載の方法。
- 前記遺伝的障害は鎌状赤血球症である、請求項77〜90のいずれか一項に記載の方法。
- 前記編集することは、HbA/HbSテトラマーの重合能力を減少させるアミノ酸変化をもたらす、請求項94に記載の方法。
- 前記核酸塩基は、ヘモグロビンのベータサブユニット(HbB)をコードするHBB遺伝子に位置する、請求項94または9595に記載の方法。
- 前記HBB遺伝子は、鎌状赤血球ヘモグロビンアリル(HbS)である、請求項96に記載の方法。
- 前記編集することは、ヘモグロビンのベータサブユニットにおけるアミノ酸変化をもたらす、請求項96または97に記載の方法。
- ヘモグロビンのベータサブユニットにおける前記アミノ酸変化が、A70T、A70V、L88P、F85L、F85P、E22G、G16D、G16N、またはそれらのいずれかの組合せを含む、請求項98に記載の方法。
- 前記核酸塩基は、ヘモグロビンのアルファサブユニット(HbA)をコードするHBA1またはHBA2遺伝子に位置する、請求項94または95に記載の方法。
- 前記編集することは、ヘモグロビンのアルファサブユニットにおけるアミノ酸変化をもたらす、請求項100に記載の方法。
- 前記アルファサブユニットのアミノ酸変化は、鎌状赤血球ヘモグロビンのアルファサブユニットとベータサブユニットとの重合境界面に位置する、請求項101に記載の方法。
- ヘモグロビンのアルファサブユニットにおける前記アミノ酸変化は、K11E、D47G、Q54R、N68D、E116K、H20Y、H50Y、またはそのいずれかの組合せを含む、請求項101または102に記載の方法。
- 追加の核酸塩基の第2の編集をさらに含み、前記追加の核酸塩基は前記遺伝的障害の原因ではないか、または前記追加の核酸塩基は前記遺伝的障害の原因である、請求項77〜103のいずれか一項に記載の方法。
- 前記デアミナーゼドメインは、シチジンデアミナーゼドメインまたはアデノシンデアミナーゼドメインである、請求項77〜104のいずれか一項に記載の方法。
- 前記アデノシンデアミナーゼドメインは、デオキシリボ核酸(DNA)中のアデニンを脱アミノ化することができる、請求項105に記載の方法。
- 前記ガイドポリヌクレオチドは、リボ核酸(RNA)またはデオキシリボ核酸(DNA)を含む、請求項77〜106のいずれか一項に記載の方法。
- 前記ガイドポリヌクレオチドは、CRISPR RNA (crRNA)配列、トランス活性化CRISPR RNA (tracrRNA) 配列、またはそれらの組合せを含む、請求項77〜107のいずれか一項に記載の方法。
- 第2のガイドポリヌクレオチドをさらに含む、請求項77〜108のいずれか一項に記載の方法。
- 前記第2のガイドポリヌクレオチドは、リボ核酸(RNA)またはデオキシリボ核酸(DNA)を含む、請求項109に記載の方法。
- 前記第2のガイドポリヌクレオチドは、CRISPR RNA (crRNA)配列、トランス活性化CRISPR RNA (tracrRNA) 配列、またはそれらの組合せを含む、請求項109に記載の方法。
- 前記第2のガイドポリヌクレオチドは前記塩基エディターを第2の標的ヌクレオチド配列へとターゲティングする、請求項109〜111のいずれか一項に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、Cas9ドメイン、Cpf1ドメイン、CasXドメイン、CasYドメイン、Cas12b/C2c1ドメイン、またはCas12c/C2c3ドメインを含む、請求項77〜112のいずれか一項に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活である、請求項77〜113のいずれか一項に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインはニッカーゼである、請求項77〜113のいずれか一項に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、ヌクレアーゼ不活Cas9 (dCas9)、Cas9ニッカーゼ (nCas9)、またはヌクレアーゼ活性Cas9から選択されるCas9ドメインを含む、請求項77〜115のいずれか一項に記載の方法。
- 前記Cas9ドメインは、Cas9ニッカーゼを含む、請求項116に記載の方法。
- 前記ポリヌクレオチドプログラム可能なDNA結合ドメインは、操作または改変されたポリヌクレオチドプログラム可能なDNA結合ドメインである、請求項77〜117のいずれか一項に記載の方法。
- 第2の塩基エディターをさらに含む、請求項77〜118のいずれか一項に記載の方法。
- 前記第2の塩基エディターは、前記塩基エディターとは異なるデアミナーゼドメインを含む、請求項119に記載の方法。
- 前記編集することが、20%未満のインデル形成をもたらす、請求項77〜120のいずれか一項に記載の方法。
- 前記編集することは転座をもたらさない、請求項77〜121のいずれか一項に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862670498P | 2018-05-11 | 2018-05-11 | |
US62/670,498 | 2018-05-11 | ||
US201862780864P | 2018-12-17 | 2018-12-17 | |
US62/780,864 | 2018-12-17 | ||
PCT/US2019/031896 WO2019217941A1 (en) | 2018-05-11 | 2019-05-11 | Methods of suppressing pathogenic mutations using programmable base editor systems |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021523736A true JP2021523736A (ja) | 2021-09-09 |
JPWO2019217941A5 JPWO2019217941A5 (ja) | 2022-05-19 |
Family
ID=68468436
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021513762A Pending JP2021523736A (ja) | 2018-05-11 | 2019-05-11 | プログラム可能塩基エディターシステムを用いて病原性変異を抑制する方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20210371858A1 (ja) |
EP (1) | EP3790964A4 (ja) |
JP (1) | JP2021523736A (ja) |
KR (1) | KR20210023830A (ja) |
CN (1) | CN112601816A (ja) |
AU (1) | AU2019265018A1 (ja) |
CA (1) | CA3100014A1 (ja) |
WO (1) | WO2019217941A1 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2020223060B2 (en) | 2019-02-13 | 2023-04-13 | Beam Therapeutics Inc. | Compositions and methods for treating hemoglobinopathies |
JP2022542839A (ja) | 2019-07-19 | 2022-10-07 | フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー | リコンビナーゼ組成物及び使用方法 |
EP4097233A4 (en) * | 2020-01-31 | 2024-02-28 | Univ Massachusetts | CAS9 PDBD BASES EDITOR PLATFORM WITH IMPROVED TARGET RANGE AND SPECIFICITY |
US20230340435A1 (en) * | 2020-04-09 | 2023-10-26 | Verve Therapautics, Inc. | Base editing of angptl3 and methods of using same for treatment of disease |
WO2021231603A2 (en) * | 2020-05-12 | 2021-11-18 | City Of Hope | Compositions and methods for base specific mitochondrial gene editing |
JP2023526422A (ja) | 2020-05-20 | 2023-06-21 | フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー | コロナウイルス抗原組成物及びそれらの使用 |
AU2021275213A1 (en) | 2020-05-20 | 2023-02-02 | Flagship Pioneering Innovations Vi, Llc | Immunogenic compositions and uses thereof |
CN116018405A (zh) | 2020-05-29 | 2023-04-25 | 旗舰先锋创新Vi有限责任公司 | Trem组合物及其相关方法 |
AU2021281453A1 (en) | 2020-05-29 | 2022-11-17 | Flagship Pioneering Innovations Vi, Llc. | Trem compositions and methods relating thereto |
CN116157148A (zh) | 2020-09-03 | 2023-05-23 | 旗舰创业创新第六有限责任公司 | 免疫原性组合物及其用途 |
KR20230135585A (ko) | 2020-12-23 | 2023-09-25 | 플래그쉽 파이어니어링 이노베이션스 브이아이, 엘엘씨 | 변형된 trem의 조성물 및 이의 용도 |
EP4313109A1 (en) | 2021-03-31 | 2024-02-07 | Flagship Pioneering Innovations V, Inc. | Thanotransmission polypeptides and their use in treating cancer |
JP2024515317A (ja) * | 2021-04-28 | 2024-04-08 | ジェネバント サイエンシズ ゲーエムベーハー | mRNA送達構築物およびそれを使用する方法 |
EP4337246A2 (en) * | 2021-05-14 | 2024-03-20 | Beam Therapeutics Inc. | Compositions and methods for treating transthyretin amyloidosis |
EP4377457A1 (en) | 2021-07-26 | 2024-06-05 | Flagship Pioneering Innovations VI, LLC | Trem compositions and uses thereof |
KR20230016751A (ko) * | 2021-07-26 | 2023-02-03 | 서울대학교산학협력단 | 염기 편집기 및 이의 용도 |
AR127073A1 (es) | 2021-09-17 | 2023-12-13 | Flagship Pioneering Innovations Vi Llc | Composiciones y métodos para producir polirribonucleótidos circulares |
CA3235625A1 (en) | 2021-10-18 | 2023-04-27 | Flagship Pioneering Innovations Vi, Llc | Compositions and methods for purifying polyribonucleotides |
AU2022397292A1 (en) | 2021-11-24 | 2024-05-30 | Flagship Pioneering Innovations Vi, Llc | Varicella-zoster virus immunogen compositions and their uses |
WO2023096990A1 (en) | 2021-11-24 | 2023-06-01 | Flagship Pioneering Innovation Vi, Llc | Coronavirus immunogen compositions and their uses |
WO2023097003A2 (en) | 2021-11-24 | 2023-06-01 | Flagship Pioneering Innovations Vi, Llc | Immunogenic compositions and their uses |
WO2023102550A2 (en) | 2021-12-03 | 2023-06-08 | The Broad Institute, Inc. | Compositions and methods for efficient in vivo delivery |
TW202340460A (zh) | 2021-12-17 | 2023-10-16 | 美商旗艦先鋒創新有限責任公司 | 用於在變性條件下富集環狀rna之方法 |
WO2023122745A1 (en) | 2021-12-22 | 2023-06-29 | Flagship Pioneering Innovations Vi, Llc | Compositions and methods for purifying polyribonucleotides |
TW202342064A (zh) | 2021-12-23 | 2023-11-01 | 美商旗艦先鋒創新有限責任公司 | 編碼抗融合多肽之環狀多核糖核苷酸 |
WO2023196634A2 (en) | 2022-04-08 | 2023-10-12 | Flagship Pioneering Innovations Vii, Llc | Vaccines and related methods |
WO2023220083A1 (en) | 2022-05-09 | 2023-11-16 | Flagship Pioneering Innovations Vi, Llc | Trem compositions and methods of use for treating proliferative disorders |
WO2023220729A2 (en) | 2022-05-13 | 2023-11-16 | Flagship Pioneering Innovations Vii, Llc | Double stranded dna compositions and related methods |
WO2023250112A1 (en) | 2022-06-22 | 2023-12-28 | Flagship Pioneering Innovations Vi, Llc | Compositions of modified trems and uses thereof |
WO2024030856A2 (en) | 2022-08-01 | 2024-02-08 | Flagship Pioneering Innovations Vii, Llc | Immunomodulatory proteins and related methods |
WO2024035952A1 (en) | 2022-08-12 | 2024-02-15 | Remix Therapeutics Inc. | Methods and compositions for modulating splicing at alternative splice sites |
WO2024077191A1 (en) | 2022-10-05 | 2024-04-11 | Flagship Pioneering Innovations V, Inc. | Nucleic acid molecules encoding trif and additionalpolypeptides and their use in treating cancer |
WO2024097664A1 (en) | 2022-10-31 | 2024-05-10 | Flagship Pioneering Innovations Vi, Llc | Compositions and methods for purifying polyribonucleotides |
WO2024102799A1 (en) | 2022-11-08 | 2024-05-16 | Flagship Pioneering Innovations Vi, Llc | Compositions and methods for producing circular polyribonucleotides |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11053481B2 (en) * | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
EP3712269A1 (en) * | 2014-12-17 | 2020-09-23 | ProQR Therapeutics II B.V. | Targeted rna editing |
IL310721A (en) * | 2015-10-23 | 2024-04-01 | Harvard College | Nucleobase editors and their uses |
JP6932698B2 (ja) * | 2015-12-01 | 2021-09-08 | クリスパー・セラピューティクス・アクチェンゲゼルシャフトCRISPR Therapeutics AG | アルファ1アンチトリプシン欠乏症の治療のための材料および方法 |
WO2017189308A1 (en) * | 2016-04-19 | 2017-11-02 | The Broad Institute Inc. | Novel crispr enzymes and systems |
CA3032699A1 (en) * | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
US11352647B2 (en) * | 2016-08-17 | 2022-06-07 | The Broad Institute, Inc. | Crispr enzymes and systems |
EP3507366B1 (en) * | 2016-09-01 | 2020-10-07 | ProQR Therapeutics II B.V. | Chemically modified single-stranded rna-editing oligonucleotides |
CN106916852B (zh) * | 2017-04-13 | 2020-12-04 | 上海科技大学 | 一种碱基编辑系统及其构建和应用方法 |
-
2019
- 2019-05-11 AU AU2019265018A patent/AU2019265018A1/en active Pending
- 2019-05-11 KR KR1020207034998A patent/KR20210023830A/ko active Search and Examination
- 2019-05-11 JP JP2021513762A patent/JP2021523736A/ja active Pending
- 2019-05-11 WO PCT/US2019/031896 patent/WO2019217941A1/en unknown
- 2019-05-11 CN CN201980046522.6A patent/CN112601816A/zh active Pending
- 2019-05-11 CA CA3100014A patent/CA3100014A1/en active Pending
- 2019-05-11 EP EP19800129.9A patent/EP3790964A4/en active Pending
- 2019-05-11 US US17/054,393 patent/US20210371858A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN112601816A (zh) | 2021-04-02 |
EP3790964A1 (en) | 2021-03-17 |
AU2019265018A1 (en) | 2020-11-26 |
WO2019217941A1 (en) | 2019-11-14 |
KR20210023830A (ko) | 2021-03-04 |
US20210371858A1 (en) | 2021-12-02 |
CA3100014A1 (en) | 2019-11-14 |
EP3790964A4 (en) | 2022-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210371858A1 (en) | Methods of suppressing pathogenic mutations using programmable base editor systems | |
US20230159956A1 (en) | Methods of editing single nucleotide polymorphism using programmable base editor systems | |
US11155803B2 (en) | Adenosine deaminase base editors and methods of using same to modify a nucleobase in a target sequence | |
JP2021532794A (ja) | マルチエフェクター核酸塩基エディターおよびそれを用いて核酸標的配列を改変する方法 | |
US20220136012A1 (en) | Nucleobase editors having reduced off-target deamination and methods of using same to modify a nucleobase target sequence | |
US20230140953A1 (en) | Methods of editing a disease-associated gene using adenosine deaminase base editors, including for the treatment of genetic disease | |
US20230017979A1 (en) | Compositions and methods for non-toxic conditioning | |
JP2022520231A (ja) | 遺伝子疾患の治療用を含めアデノシンデアミナーゼ塩基エディターを用いた疾患関連遺伝子のスプライスアクセプター部位破壊 | |
JP2021523737A (ja) | プログラム可能塩基エディターシステムを用いて病原性アミノ酸を置換する方法 | |
US20220313799A1 (en) | Compositions and methods for editing a mutation to permit transcription or expression | |
US20230070861A1 (en) | Compositions and methods for treating hepatitis b | |
JP2022519761A (ja) | アルファ-1アンチトリプシン不全を治療するための組成物および方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220511 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220511 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230905 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240513 |