JP2024511621A - 新規crispr酵素、方法、システム、及びそれらの使用 - Google Patents
新規crispr酵素、方法、システム、及びそれらの使用 Download PDFInfo
- Publication number
- JP2024511621A JP2024511621A JP2023558369A JP2023558369A JP2024511621A JP 2024511621 A JP2024511621 A JP 2024511621A JP 2023558369 A JP2023558369 A JP 2023558369A JP 2023558369 A JP2023558369 A JP 2023558369A JP 2024511621 A JP2024511621 A JP 2024511621A
- Authority
- JP
- Japan
- Prior art keywords
- cas9
- sequence
- seq
- protein
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 368
- 238000000034 method Methods 0.000 title claims abstract description 139
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 235
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 193
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 193
- 241001291896 Streptococcus constellatus Species 0.000 claims abstract description 57
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 52
- 201000010099 disease Diseases 0.000 claims abstract description 36
- 241000889558 Ezakiella peruensis Species 0.000 claims abstract description 24
- 241001440001 Peptoniphilus sp. Species 0.000 claims abstract description 23
- 241000186840 Lactobacillus fermentum Species 0.000 claims abstract description 22
- 241000756761 Sharpea Species 0.000 claims abstract description 22
- 241001148135 Veillonella parvula Species 0.000 claims abstract description 22
- 229940012969 lactobacillus fermentum Drugs 0.000 claims abstract description 22
- 210000005260 human cell Anatomy 0.000 claims abstract description 20
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 218
- 210000004027 cell Anatomy 0.000 claims description 169
- 108090000623 proteins and genes Proteins 0.000 claims description 145
- 125000003729 nucleotide group Chemical group 0.000 claims description 128
- 239000002773 nucleotide Substances 0.000 claims description 122
- 102000004169 proteins and genes Human genes 0.000 claims description 106
- 230000000694 effects Effects 0.000 claims description 105
- 235000018102 proteins Nutrition 0.000 claims description 103
- 230000035772 mutation Effects 0.000 claims description 85
- 230000014509 gene expression Effects 0.000 claims description 73
- 102000040430 polynucleotide Human genes 0.000 claims description 73
- 108091033319 polynucleotide Proteins 0.000 claims description 73
- 239000002157 polynucleotide Substances 0.000 claims description 73
- 235000001014 amino acid Nutrition 0.000 claims description 63
- 108020005004 Guide RNA Proteins 0.000 claims description 56
- 150000001413 amino acids Chemical group 0.000 claims description 55
- 239000013598 vector Substances 0.000 claims description 53
- 238000003776 cleavage reaction Methods 0.000 claims description 48
- 230000007017 scission Effects 0.000 claims description 48
- 108020001507 fusion proteins Proteins 0.000 claims description 43
- 102000037865 fusion proteins Human genes 0.000 claims description 43
- 230000000295 complement effect Effects 0.000 claims description 42
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 41
- 230000004048 modification Effects 0.000 claims description 41
- 238000012986 modification Methods 0.000 claims description 41
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 37
- 108020004705 Codon Proteins 0.000 claims description 37
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 36
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 35
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 34
- 230000027455 binding Effects 0.000 claims description 33
- 229930024421 Adenine Natural products 0.000 claims description 28
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 28
- 229960000643 adenine Drugs 0.000 claims description 28
- 125000006850 spacer group Chemical group 0.000 claims description 28
- 101710163270 Nuclease Proteins 0.000 claims description 26
- 238000006467 substitution reaction Methods 0.000 claims description 26
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 23
- 239000013603 viral vector Substances 0.000 claims description 23
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical group O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 22
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 claims description 20
- 108010031325 Cytidine deaminase Proteins 0.000 claims description 18
- 229940104302 cytosine Drugs 0.000 claims description 18
- 230000030648 nucleus localization Effects 0.000 claims description 18
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 claims description 18
- 108091027544 Subgenomic mRNA Proteins 0.000 claims description 16
- 208000035475 disorder Diseases 0.000 claims description 16
- 230000003612 virological effect Effects 0.000 claims description 16
- 239000013607 AAV vector Substances 0.000 claims description 14
- 108010008532 Deoxyribonuclease I Proteins 0.000 claims description 14
- 102000007260 Deoxyribonuclease I Human genes 0.000 claims description 14
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims description 14
- 230000000051 modifying effect Effects 0.000 claims description 14
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 claims description 12
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 9
- 229940113082 thymine Drugs 0.000 claims description 9
- 108091081062 Repeated sequence (DNA) Proteins 0.000 claims description 8
- 230000015572 biosynthetic process Effects 0.000 claims description 8
- 102220491082 ADP-ribosylation factor 6_D12A_mutation Human genes 0.000 claims description 7
- 241000702421 Dependoparvovirus Species 0.000 claims description 7
- 108010080611 Cytosine Deaminase Proteins 0.000 claims description 6
- 102000000311 Cytosine Deaminase Human genes 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 6
- 210000004962 mammalian cell Anatomy 0.000 claims description 6
- 230000012743 protein tagging Effects 0.000 claims description 5
- 102000008157 Histone Demethylases Human genes 0.000 claims description 3
- 108010074870 Histone Demethylases Proteins 0.000 claims description 3
- 239000013600 plasmid vector Substances 0.000 claims description 3
- 235000003704 aspartic acid Nutrition 0.000 claims description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims description 2
- 238000010354 CRISPR gene editing Methods 0.000 claims 9
- 102100026846 Cytidine deaminase Human genes 0.000 claims 3
- 108091006106 transcriptional activators Proteins 0.000 claims 1
- 239000000203 mixture Substances 0.000 abstract description 51
- 241000282414 Homo sapiens Species 0.000 abstract description 34
- 230000008685 targeting Effects 0.000 abstract description 29
- 241000894006 Bacteria Species 0.000 abstract description 13
- 239000002585 base Substances 0.000 description 179
- 108020004414 DNA Proteins 0.000 description 70
- 108090000765 processed proteins & peptides Proteins 0.000 description 65
- 102000004196 processed proteins & peptides Human genes 0.000 description 58
- 229920001184 polypeptide Polymers 0.000 description 53
- 238000006243 chemical reaction Methods 0.000 description 52
- 125000003275 alpha amino acid group Chemical group 0.000 description 43
- 108091079001 CRISPR RNA Proteins 0.000 description 42
- 239000008194 pharmaceutical composition Substances 0.000 description 37
- 229940024606 amino acid Drugs 0.000 description 33
- 230000000875 corresponding effect Effects 0.000 description 32
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 31
- 230000004927 fusion Effects 0.000 description 29
- 125000005647 linker group Chemical group 0.000 description 24
- 230000001225 therapeutic effect Effects 0.000 description 23
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 22
- 150000001875 compounds Chemical class 0.000 description 21
- 238000009472 formulation Methods 0.000 description 20
- -1 and optionally Proteins 0.000 description 19
- 238000010586 diagram Methods 0.000 description 19
- 238000003780 insertion Methods 0.000 description 19
- 230000037431 insertion Effects 0.000 description 19
- 238000012360 testing method Methods 0.000 description 19
- 239000012636 effector Substances 0.000 description 16
- 230000001105 regulatory effect Effects 0.000 description 16
- 102000005381 Cytidine Deaminase Human genes 0.000 description 15
- 102000053602 DNA Human genes 0.000 description 15
- 239000003795 chemical substances by application Substances 0.000 description 15
- 239000012634 fragment Substances 0.000 description 15
- 239000013612 plasmid Substances 0.000 description 15
- 241000701161 unidentified adenovirus Species 0.000 description 15
- 238000010362 genome editing Methods 0.000 description 14
- 238000001727 in vivo Methods 0.000 description 14
- 238000004806 packaging method and process Methods 0.000 description 14
- 102000004190 Enzymes Human genes 0.000 description 13
- 108090000790 Enzymes Proteins 0.000 description 13
- 241000700605 Viruses Species 0.000 description 13
- 229940009098 aspartate Drugs 0.000 description 13
- 239000003814 drug Substances 0.000 description 13
- 230000006870 function Effects 0.000 description 13
- 238000004519 manufacturing process Methods 0.000 description 13
- 238000011282 treatment Methods 0.000 description 13
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Natural products NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 12
- 239000000872 buffer Substances 0.000 description 12
- 238000000338 in vitro Methods 0.000 description 12
- 239000000463 material Substances 0.000 description 12
- 241000894007 species Species 0.000 description 12
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 11
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 11
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 11
- 241000700159 Rattus Species 0.000 description 11
- 229960005305 adenosine Drugs 0.000 description 11
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical group O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 11
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- 108020001580 protein domains Proteins 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- 241000283690 Bos taurus Species 0.000 description 10
- 230000017730 intein-mediated protein splicing Effects 0.000 description 10
- 238000005457 optimization Methods 0.000 description 10
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 9
- 239000004471 Glycine Substances 0.000 description 9
- 108010081734 Ribonucleoproteins Proteins 0.000 description 9
- 102000004389 Ribonucleoproteins Human genes 0.000 description 9
- 230000008499 blood brain barrier function Effects 0.000 description 9
- 210000001218 blood-brain barrier Anatomy 0.000 description 9
- 239000003085 diluting agent Substances 0.000 description 9
- 229940079593 drug Drugs 0.000 description 9
- 239000007924 injection Substances 0.000 description 9
- 238000002347 injection Methods 0.000 description 9
- 239000000047 product Substances 0.000 description 9
- 230000001177 retroviral effect Effects 0.000 description 9
- 239000003981 vehicle Substances 0.000 description 9
- 241000588724 Escherichia coli Species 0.000 description 8
- 102220622304 Huntingtin-associated protein 1_D10G_mutation Human genes 0.000 description 8
- 241000713666 Lentivirus Species 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 102220625641 Phosphatidylinositol 5-phosphate 4-kinase type-2 alpha_D38A_mutation Human genes 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 239000002299 complementary DNA Substances 0.000 description 8
- 238000012350 deep sequencing Methods 0.000 description 8
- 230000009977 dual effect Effects 0.000 description 8
- 150000002632 lipids Chemical class 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 230000007018 DNA scission Effects 0.000 description 7
- 108010033040 Histones Proteins 0.000 description 7
- 108020004566 Transfer RNA Proteins 0.000 description 7
- 235000004279 alanine Nutrition 0.000 description 7
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 7
- 210000004899 c-terminal region Anatomy 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 7
- 239000003937 drug carrier Substances 0.000 description 7
- 239000000499 gel Substances 0.000 description 7
- 238000001415 gene therapy Methods 0.000 description 7
- 230000001939 inductive effect Effects 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 239000007787 solid Substances 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 241000701022 Cytomegalovirus Species 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 108020004682 Single-Stranded DNA Proteins 0.000 description 6
- 241000193996 Streptococcus pyogenes Species 0.000 description 6
- 108700019146 Transgenes Proteins 0.000 description 6
- 239000013543 active substance Substances 0.000 description 6
- 230000004071 biological effect Effects 0.000 description 6
- 239000003623 enhancer Substances 0.000 description 6
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 239000002105 nanoparticle Substances 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 6
- 239000000546 pharmaceutical excipient Substances 0.000 description 6
- 230000006798 recombination Effects 0.000 description 6
- 239000011780 sodium chloride Substances 0.000 description 6
- 102000012758 APOBEC-1 Deaminase Human genes 0.000 description 5
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 5
- 108010052875 Adenine deaminase Proteins 0.000 description 5
- 108090000565 Capsid Proteins Proteins 0.000 description 5
- 102100023321 Ceruloplasmin Human genes 0.000 description 5
- 108700010070 Codon Usage Proteins 0.000 description 5
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 101000964382 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3D Proteins 0.000 description 5
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 5
- 241000124008 Mammalia Species 0.000 description 5
- 108060004795 Methyltransferase Proteins 0.000 description 5
- 108010066154 Nuclear Export Signals Proteins 0.000 description 5
- 241000251745 Petromyzon marinus Species 0.000 description 5
- 239000002202 Polyethylene glycol Substances 0.000 description 5
- 230000003139 buffering effect Effects 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 239000005090 green fluorescent protein Substances 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 239000002609 medium Substances 0.000 description 5
- 239000002357 osmotic agent Substances 0.000 description 5
- 229920001223 polyethylene glycol Polymers 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 5
- 210000002966 serum Anatomy 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 102000002797 APOBEC-3G Deaminase Human genes 0.000 description 4
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 4
- 102220468857 Albumin_R23H_mutation Human genes 0.000 description 4
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 108010077544 Chromatin Proteins 0.000 description 4
- 102220606260 Cytosolic arginine sensor for mTORC1 subunit 2_D14A_mutation Human genes 0.000 description 4
- 102100040264 DNA dC->dU-editing enzyme APOBEC-3D Human genes 0.000 description 4
- 230000004568 DNA-binding Effects 0.000 description 4
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 4
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 4
- 101000742736 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3G Proteins 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- 102100034349 Integrase Human genes 0.000 description 4
- 241000699660 Mus musculus Species 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 230000004570 RNA-binding Effects 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 230000033590 base-excision repair Effects 0.000 description 4
- 210000003483 chromatin Anatomy 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 230000007711 cytoplasmic localization Effects 0.000 description 4
- 230000004049 epigenetic modification Effects 0.000 description 4
- 235000019441 ethanol Nutrition 0.000 description 4
- 102000054962 human APOBEC3G Human genes 0.000 description 4
- 239000004615 ingredient Substances 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000001990 intravenous administration Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 210000004379 membrane Anatomy 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 230000003204 osmotic effect Effects 0.000 description 4
- 102220338324 rs1554062124 Human genes 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 238000002560 therapeutic procedure Methods 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 241001430294 unidentified retrovirus Species 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- 108091093088 Amplicon Proteins 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 101710132601 Capsid protein Proteins 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- 102220489939 Cartilage oligomeric matrix protein_L51W_mutation Human genes 0.000 description 3
- 101710094648 Coat protein Proteins 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 101710180243 Cytidine deaminase 1 Proteins 0.000 description 3
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 3
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 3
- 241000713730 Equine infectious anemia virus Species 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 3
- 102000006947 Histones Human genes 0.000 description 3
- 101000964322 Homo sapiens C->U-editing enzyme APOBEC-2 Proteins 0.000 description 3
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 3
- 101000964385 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3B Proteins 0.000 description 3
- 101000964383 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3C Proteins 0.000 description 3
- 101000964377 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3F Proteins 0.000 description 3
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 3
- 241000282560 Macaca mulatta Species 0.000 description 3
- 101710125418 Major capsid protein Proteins 0.000 description 3
- 229930195725 Mannitol Natural products 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 101710141454 Nucleoprotein Proteins 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 241000282577 Pan troglodytes Species 0.000 description 3
- 241000282405 Pongo abelii Species 0.000 description 3
- 101710083689 Probable capsid protein Proteins 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 230000007022 RNA scission Effects 0.000 description 3
- 108020004511 Recombinant DNA Proteins 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 3
- 241000700584 Simplexvirus Species 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- 229920002472 Starch Polymers 0.000 description 3
- 102000008579 Transposases Human genes 0.000 description 3
- 108010020764 Transposases Proteins 0.000 description 3
- 239000012190 activator Substances 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 239000002671 adjuvant Substances 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 230000000840 anti-viral effect Effects 0.000 description 3
- 229940088710 antibiotic agent Drugs 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000001580 bacterial effect Effects 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000030833 cell death Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013270 controlled release Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 102000015694 estrogen receptors Human genes 0.000 description 3
- 108010038795 estrogen receptors Proteins 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 239000003102 growth factor Substances 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 239000007943 implant Substances 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 239000002502 liposome Substances 0.000 description 3
- 239000000314 lubricant Substances 0.000 description 3
- 239000000594 mannitol Substances 0.000 description 3
- 235000010355 mannitol Nutrition 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 108091070501 miRNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 231100000252 nontoxic Toxicity 0.000 description 3
- 230000003000 nontoxic effect Effects 0.000 description 3
- 238000010899 nucleation Methods 0.000 description 3
- 102000044158 nucleic acid binding protein Human genes 0.000 description 3
- 108700020942 nucleic acid binding protein Proteins 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 102200124762 rs121918364 Human genes 0.000 description 3
- 102200004091 rs387906857 Human genes 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 230000003007 single stranded DNA break Effects 0.000 description 3
- 150000003384 small molecules Chemical class 0.000 description 3
- 239000003381 stabilizer Substances 0.000 description 3
- 235000019698 starch Nutrition 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 239000000829 suppository Substances 0.000 description 3
- 239000000454 talc Substances 0.000 description 3
- 229910052623 talc Inorganic materials 0.000 description 3
- 229940124597 therapeutic agent Drugs 0.000 description 3
- 231100000419 toxicity Toxicity 0.000 description 3
- 230000001988 toxicity Effects 0.000 description 3
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 101710159293 Acyl-CoA desaturase 1 Proteins 0.000 description 2
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 2
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 2
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 2
- 229920001817 Agar Polymers 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102100040399 C->U-editing enzyme APOBEC-2 Human genes 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 2
- 108090000994 Catalytic RNA Proteins 0.000 description 2
- 102000053642 Catalytic RNA Human genes 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 2
- 102100040262 DNA dC->dU-editing enzyme APOBEC-3B Human genes 0.000 description 2
- 102100040261 DNA dC->dU-editing enzyme APOBEC-3C Human genes 0.000 description 2
- 102100040266 DNA dC->dU-editing enzyme APOBEC-3F Human genes 0.000 description 2
- 102100038050 DNA dC->dU-editing enzyme APOBEC-3H Human genes 0.000 description 2
- 101710082737 DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 2
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 241000702189 Escherichia virus Mu Species 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 241000282575 Gorilla Species 0.000 description 2
- 239000012981 Hank's balanced salt solution Substances 0.000 description 2
- 101000964330 Homo sapiens C->U-editing enzyme APOBEC-1 Proteins 0.000 description 2
- 101001062864 Homo sapiens Fatty acid-binding protein, adipocyte Proteins 0.000 description 2
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 2
- 101000800426 Homo sapiens Putative C->U-editing enzyme APOBEC-4 Proteins 0.000 description 2
- 101000755690 Homo sapiens Single-stranded DNA cytosine deaminase Proteins 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- 108010061833 Integrases Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 2
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 2
- 102000016397 Methyltransferase Human genes 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 239000012124 Opti-MEM Substances 0.000 description 2
- 235000019483 Peanut oil Nutrition 0.000 description 2
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 2
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 102100033091 Putative C->U-editing enzyme APOBEC-4 Human genes 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 241000700157 Rattus norvegicus Species 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 102100038247 Retinol-binding protein 3 Human genes 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 108091006300 SLC2A4 Proteins 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 2
- 229930006000 Sucrose Natural products 0.000 description 2
- 102000001435 Synapsin Human genes 0.000 description 2
- 108050009621 Synapsin Proteins 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 2
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 2
- 108010017842 Telomerase Proteins 0.000 description 2
- 239000004098 Tetracycline Substances 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 108010022394 Threonine synthase Proteins 0.000 description 2
- 108090000901 Transferrin Proteins 0.000 description 2
- 102000004338 Transferrin Human genes 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 2
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 108020000999 Viral RNA Proteins 0.000 description 2
- MCMNRKCIXSYSNV-UHFFFAOYSA-N Zirconium dioxide Chemical compound O=[Zr]=O MCMNRKCIXSYSNV-UHFFFAOYSA-N 0.000 description 2
- NMFHJNAPXOMSRX-PUPDPRJKSA-N [(1r)-3-(3,4-dimethoxyphenyl)-1-[3-(2-morpholin-4-ylethoxy)phenyl]propyl] (2s)-1-[(2s)-2-(3,4,5-trimethoxyphenyl)butanoyl]piperidine-2-carboxylate Chemical compound C([C@@H](OC(=O)[C@@H]1CCCCN1C(=O)[C@@H](CC)C=1C=C(OC)C(OC)=C(OC)C=1)C=1C=C(OCCN2CCOCC2)C=CC=1)CC1=CC=C(OC)C(OC)=C1 NMFHJNAPXOMSRX-PUPDPRJKSA-N 0.000 description 2
- 230000001594 aberrant effect Effects 0.000 description 2
- 102000005421 acetyltransferase Human genes 0.000 description 2
- 108020002494 acetyltransferase Proteins 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 239000004480 active ingredient Substances 0.000 description 2
- 230000006154 adenylylation Effects 0.000 description 2
- 210000001789 adipocyte Anatomy 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 239000003708 ampul Substances 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000010171 animal model Methods 0.000 description 2
- 230000001775 anti-pathogenic effect Effects 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- 239000003963 antioxidant agent Substances 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- WWVKQTNONPWVEL-UHFFFAOYSA-N caffeic acid phenethyl ester Natural products C1=C(O)C(O)=CC=C1C=CC(=O)OCC1=CC=CC=C1 WWVKQTNONPWVEL-UHFFFAOYSA-N 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 229910001424 calcium ion Inorganic materials 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 235000013877 carbamide Nutrition 0.000 description 2
- 230000000747 cardiac effect Effects 0.000 description 2
- 210000004413 cardiac myocyte Anatomy 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 108091092356 cellular DNA Proteins 0.000 description 2
- 210000003169 central nervous system Anatomy 0.000 description 2
- 239000013522 chelant Substances 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000009615 deamination Effects 0.000 description 2
- 238000006481 deamination reaction Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000368 destabilizing effect Effects 0.000 description 2
- 230000029180 desumoylation Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000009504 deubiquitination Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- MWRBNPKJOOWZPW-CLFAGFIQSA-N dioleoyl phosphatidylethanolamine Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(COP(O)(=O)OCCN)OC(=O)CCCCCCC\C=C/CCCCCCCC MWRBNPKJOOWZPW-CLFAGFIQSA-N 0.000 description 2
- 239000002552 dosage form Substances 0.000 description 2
- 238000012377 drug delivery Methods 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 230000013020 embryo development Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 150000002148 esters Chemical class 0.000 description 2
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 239000012091 fetal bovine serum Substances 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 238000001476 gene delivery Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000007614 genetic variation Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 230000003781 hair follicle cycle Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 102000046390 human APOBEC1 Human genes 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 108010048996 interstitial retinol-binding protein Proteins 0.000 description 2
- 238000007912 intraperitoneal administration Methods 0.000 description 2
- 238000007913 intrathecal administration Methods 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 231100000053 low toxicity Toxicity 0.000 description 2
- 239000012931 lyophilized formulation Substances 0.000 description 2
- 239000011777 magnesium Substances 0.000 description 2
- 229910052749 magnesium Inorganic materials 0.000 description 2
- HQKMJHAJHXVSDF-UHFFFAOYSA-L magnesium stearate Chemical compound [Mg+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O HQKMJHAJHXVSDF-UHFFFAOYSA-L 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 229920000609 methyl cellulose Polymers 0.000 description 2
- 239000001923 methylcellulose Substances 0.000 description 2
- 235000010981 methylcellulose Nutrition 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 230000007498 myristoylation Effects 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 235000019198 oils Nutrition 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002018 overexpression Effects 0.000 description 2
- 239000000312 peanut oil Substances 0.000 description 2
- 239000000825 pharmaceutical preparation Substances 0.000 description 2
- 239000002953 phosphate buffered saline Substances 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- 108091008695 photoreceptors Proteins 0.000 description 2
- 231100000683 possible toxicity Toxicity 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 108091092562 ribozyme Proteins 0.000 description 2
- 102200049192 rs1057517679 Human genes 0.000 description 2
- 102220275780 rs1555942389 Human genes 0.000 description 2
- 239000008159 sesame oil Substances 0.000 description 2
- 235000011803 sesame oil Nutrition 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 239000002924 silencing RNA Substances 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 210000002460 smooth muscle Anatomy 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 239000003549 soybean oil Substances 0.000 description 2
- 235000012424 soybean oil Nutrition 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 239000005720 sucrose Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 230000010741 sumoylation Effects 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 229960002180 tetracycline Drugs 0.000 description 2
- 229930101283 tetracycline Natural products 0.000 description 2
- 235000019364 tetracycline Nutrition 0.000 description 2
- 150000003522 tetracyclines Chemical class 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108091008023 transcriptional regulators Proteins 0.000 description 2
- 230000031998 transcytosis Effects 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 230000010415 tropism Effects 0.000 description 2
- 210000002845 virion Anatomy 0.000 description 2
- 239000000080 wetting agent Substances 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 2
- ALNDFFUAQIVVPG-NGJCXOISSA-N (2r,3r,4r)-3,4,5-trihydroxy-2-methoxypentanal Chemical compound CO[C@@H](C=O)[C@H](O)[C@H](O)CO ALNDFFUAQIVVPG-NGJCXOISSA-N 0.000 description 1
- LNAZSHAWQACDHT-XIYTZBAFSA-N (2r,3r,4s,5r,6s)-4,5-dimethoxy-2-(methoxymethyl)-3-[(2s,3r,4s,5r,6r)-3,4,5-trimethoxy-6-(methoxymethyl)oxan-2-yl]oxy-6-[(2r,3r,4s,5r,6r)-4,5,6-trimethoxy-2-(methoxymethyl)oxan-3-yl]oxyoxane Chemical compound CO[C@@H]1[C@@H](OC)[C@H](OC)[C@@H](COC)O[C@H]1O[C@H]1[C@H](OC)[C@@H](OC)[C@H](O[C@H]2[C@@H]([C@@H](OC)[C@H](OC)O[C@@H]2COC)OC)O[C@@H]1COC LNAZSHAWQACDHT-XIYTZBAFSA-N 0.000 description 1
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 1
- NCYCYZXNIZJOKI-IOUUIBBYSA-N 11-cis-retinal Chemical compound O=C/C=C(\C)/C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-IOUUIBBYSA-N 0.000 description 1
- RSMRWWHFJMENJH-LQDDAWAPSA-M 2,3-bis[[(z)-octadec-9-enoyl]oxy]propyl-trimethylazanium;methyl sulfate Chemical compound COS([O-])(=O)=O.CCCCCCCC\C=C/CCCCCCCC(=O)OCC(C[N+](C)(C)C)OC(=O)CCCCCCC\C=C/CCCCCCCC RSMRWWHFJMENJH-LQDDAWAPSA-M 0.000 description 1
- ZIIUUSVHCHPIQD-UHFFFAOYSA-N 2,4,6-trimethyl-N-[3-(trifluoromethyl)phenyl]benzenesulfonamide Chemical compound CC1=CC(C)=CC(C)=C1S(=O)(=O)NC1=CC=CC(C(F)(F)F)=C1 ZIIUUSVHCHPIQD-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- KISWVXRQTGLFGD-UHFFFAOYSA-N 2-[[2-[[6-amino-2-[[2-[[2-[[5-amino-2-[[2-[[1-[2-[[6-amino-2-[(2,5-diamino-5-oxopentanoyl)amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]-5-(diaminomethylideneamino)p Chemical compound C1CCN(C(=O)C(CCCN=C(N)N)NC(=O)C(CCCCN)NC(=O)C(N)CCC(N)=O)C1C(=O)NC(CO)C(=O)NC(CCC(N)=O)C(=O)NC(CCCN=C(N)N)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 KISWVXRQTGLFGD-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical group OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 102000040125 5-hydroxytryptamine receptor family Human genes 0.000 description 1
- 108091032151 5-hydroxytryptamine receptor family Proteins 0.000 description 1
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 description 1
- 102100033350 ATP-dependent translocase ABCB1 Human genes 0.000 description 1
- 208000035657 Abasia Diseases 0.000 description 1
- 244000215068 Acacia senegal Species 0.000 description 1
- 235000006491 Acacia senegal Nutrition 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001164825 Adeno-associated virus - 8 Species 0.000 description 1
- 102000011690 Adiponectin Human genes 0.000 description 1
- 108010076365 Adiponectin Proteins 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 102400000068 Angiostatin Human genes 0.000 description 1
- 108010079709 Angiostatins Proteins 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 108091023037 Aptamer Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 102000003823 Aromatic-L-amino-acid decarboxylases Human genes 0.000 description 1
- 108090000121 Aromatic-L-amino-acid decarboxylases Proteins 0.000 description 1
- 241000416162 Astragalus gummifer Species 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 101100377887 Bos taurus APOBEC2 gene Proteins 0.000 description 1
- 101000755699 Bos taurus Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 108700031361 Brachyury Proteins 0.000 description 1
- 101800004538 Bradykinin Proteins 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 1
- 102000049320 CD36 Human genes 0.000 description 1
- 108010045374 CD36 Antigens Proteins 0.000 description 1
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 1
- 101100421200 Caenorhabditis elegans sep-1 gene Proteins 0.000 description 1
- 108010026870 Calcium-Calmodulin-Dependent Protein Kinases Proteins 0.000 description 1
- 102000019025 Calcium-Calmodulin-Dependent Protein Kinases Human genes 0.000 description 1
- 102100033093 Calcium/calmodulin-dependent protein kinase type II subunit alpha Human genes 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 101800005309 Carboxy-terminal peptide Proteins 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 102000003727 Caveolin 1 Human genes 0.000 description 1
- 108090000026 Caveolin 1 Proteins 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000700199 Cavia porcellus Species 0.000 description 1
- 241000867607 Chlorocebus sabaeus Species 0.000 description 1
- 102100031196 Choriogonadotropin subunit beta 3 Human genes 0.000 description 1
- 102100031162 Collagen alpha-1(XVIII) chain Human genes 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 102000003706 Complement factor D Human genes 0.000 description 1
- 108090000059 Complement factor D Proteins 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- OCUCCJIRFHNWBP-IYEMJOQQSA-L Copper gluconate Chemical class [Cu+2].OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O OCUCCJIRFHNWBP-IYEMJOQQSA-L 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 1
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 102100030801 Elongation factor 1-alpha 1 Human genes 0.000 description 1
- 108010079505 Endostatins Proteins 0.000 description 1
- 101710121417 Envelope glycoprotein Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102000008857 Ferritin Human genes 0.000 description 1
- 108050000784 Ferritin Proteins 0.000 description 1
- 238000008416 Ferritin Methods 0.000 description 1
- 108091004242 G-Protein-Coupled Receptor Kinase 1 Proteins 0.000 description 1
- 102000004437 G-Protein-Coupled Receptor Kinase 1 Human genes 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 101150014889 Gad1 gene Proteins 0.000 description 1
- 108090000577 Geminin Proteins 0.000 description 1
- 102000004064 Geminin Human genes 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 1
- 102100035902 Glutamate decarboxylase 1 Human genes 0.000 description 1
- 102100035857 Glutamate decarboxylase 2 Human genes 0.000 description 1
- NMJREATYWWNIKX-UHFFFAOYSA-N GnRH Chemical compound C1CCC(C(=O)NCC(N)=O)N1C(=O)C(CC(C)C)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)CNC(=O)C(NC(=O)C(CO)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)C(CC=1NC=NC=1)NC(=O)C1NC(=O)CC1)CC1=CC=C(O)C=C1 NMJREATYWWNIKX-UHFFFAOYSA-N 0.000 description 1
- 229920000084 Gum arabic Polymers 0.000 description 1
- QXZGBUJJYSLZLT-UHFFFAOYSA-N H-Arg-Pro-Pro-Gly-Phe-Ser-Pro-Phe-Arg-OH Natural products NC(N)=NCCCC(N)C(=O)N1CCCC1C(=O)N1C(C(=O)NCC(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CO)C(=O)N2C(CCC2)C(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CCCN=C(N)N)C(O)=O)CCC1 QXZGBUJJYSLZLT-UHFFFAOYSA-N 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 241000606768 Haemophilus influenzae Species 0.000 description 1
- 101001023784 Heteractis crispa GFP-like non-fluorescent chromoprotein Proteins 0.000 description 1
- 101000944249 Homo sapiens Calcium/calmodulin-dependent protein kinase type II subunit alpha Proteins 0.000 description 1
- 101000776619 Homo sapiens Choriogonadotropin subunit beta 3 Proteins 0.000 description 1
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 1
- 101000742769 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 1
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 description 1
- 101000920078 Homo sapiens Elongation factor 1-alpha 1 Proteins 0.000 description 1
- 101000873786 Homo sapiens Glutamate decarboxylase 2 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000742373 Homo sapiens Vesicular inhibitory amino acid transporter Proteins 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108090001061 Insulin Proteins 0.000 description 1
- 102000004877 Insulin Human genes 0.000 description 1
- 101150105817 Irbp gene Proteins 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- 102100035792 Kininogen-1 Human genes 0.000 description 1
- 102000015335 Ku Autoantigen Human genes 0.000 description 1
- 108010025026 Ku Autoantigen Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 102000016267 Leptin Human genes 0.000 description 1
- 108010092277 Leptin Proteins 0.000 description 1
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 1
- NNJVILVZKWQKPM-UHFFFAOYSA-N Lidocaine Chemical compound CCN(CC)CC(=O)NC1=C(C)C=CC=C1C NNJVILVZKWQKPM-UHFFFAOYSA-N 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 108090000362 Lymphotoxin-beta Proteins 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 241000282567 Macaca fascicularis Species 0.000 description 1
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 1
- 108010047230 Member 1 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 241000699673 Mesocricetus auratus Species 0.000 description 1
- 229920000168 Microcrystalline cellulose Polymers 0.000 description 1
- 241000736257 Monodelphis domestica Species 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100377883 Mus musculus Apobec1 gene Proteins 0.000 description 1
- 101100377889 Mus musculus Apobec2 gene Proteins 0.000 description 1
- 101100489911 Mus musculus Apobec3 gene Proteins 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 101000755751 Mus musculus Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100026925 Myosin regulatory light chain 2, ventricular/cardiac muscle isoform Human genes 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 102000008763 Neurofilament Proteins Human genes 0.000 description 1
- 108010088373 Neurofilament Proteins Proteins 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 101100214779 Pan troglodytes APOBEC3G gene Proteins 0.000 description 1
- 241000701945 Parvoviridae Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 102100027913 Peptidyl-prolyl cis-trans isomerase FKBP1A Human genes 0.000 description 1
- 102220469981 Phosphatidylinositol 3,4,5-trisphosphate 3-phosphatase and dual-specificity protein phosphatase PTEN_D38G_mutation Human genes 0.000 description 1
- 102000015439 Phospholipases Human genes 0.000 description 1
- 108010064785 Phospholipases Proteins 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- 102100031574 Platelet glycoprotein 4 Human genes 0.000 description 1
- 101710202087 Platelet glycoprotein 4 Proteins 0.000 description 1
- 101710124239 Poly(A) polymerase Proteins 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 101710150114 Protein rep Proteins 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 239000012980 RPMI-1640 medium Substances 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 101710152114 Replication protein Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 108010034634 Repressor Proteins Proteins 0.000 description 1
- 102000007156 Resistin Human genes 0.000 description 1
- 108010047909 Resistin Proteins 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 102100040756 Rhodopsin Human genes 0.000 description 1
- 108090000820 Rhodopsin Proteins 0.000 description 1
- 108090000799 Rhodopsin kinases Proteins 0.000 description 1
- 108020004422 Riboswitch Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 235000019485 Safflower oil Nutrition 0.000 description 1
- 241000293871 Salmonella enterica subsp. enterica serovar Typhi Species 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 241000863432 Shewanella putrefaciens Species 0.000 description 1
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 1
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- 238000012167 Small RNA sequencing Methods 0.000 description 1
- 102100029937 Smoothelin Human genes 0.000 description 1
- 101710151526 Smoothelin Proteins 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 1
- 101000857870 Squalus acanthias Gonadoliberin Proteins 0.000 description 1
- 102100028897 Stearoyl-CoA desaturase Human genes 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 108091012456 T4 RNA ligase 1 Proteins 0.000 description 1
- 101150052863 THY1 gene Proteins 0.000 description 1
- 102000003570 TRPV5 Human genes 0.000 description 1
- 108010006877 Tacrolimus Binding Protein 1A Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000005497 Thymidylate Synthase Human genes 0.000 description 1
- 229920001615 Tragacanth Polymers 0.000 description 1
- 241000283907 Tragelaphus oryx Species 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 101710195626 Transcriptional activator protein Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102000013534 Troponin C Human genes 0.000 description 1
- 101150034091 Trpv5 gene Proteins 0.000 description 1
- 108091000117 Tyrosine 3-Monooxygenase Proteins 0.000 description 1
- 102000048218 Tyrosine 3-monooxygenases Human genes 0.000 description 1
- 102100038170 Vesicular inhibitory amino acid transporter Human genes 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 235000010489 acacia gum Nutrition 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009056 active transport Effects 0.000 description 1
- 210000005006 adaptive immune system Anatomy 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 235000010443 alginic acid Nutrition 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 229920000615 alginic acid Polymers 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 125000003368 amide group Chemical group 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 230000001772 anti-angiogenic effect Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical class N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- FZCSTZYAHCUGEM-UHFFFAOYSA-N aspergillomarasmine B Natural products OC(=O)CNC(C(O)=O)CNC(C(O)=O)CC(O)=O FZCSTZYAHCUGEM-UHFFFAOYSA-N 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 108010028263 bacteriophage T3 RNA polymerase Proteins 0.000 description 1
- 239000008228 bacteriostatic water for injection Substances 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 210000002459 blastocyst Anatomy 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000004204 blood vessel Anatomy 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- QXZGBUJJYSLZLT-FDISYFBBSA-N bradykinin Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(=O)NCC(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CO)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CCC1 QXZGBUJJYSLZLT-FDISYFBBSA-N 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 210000004900 c-terminal fragment Anatomy 0.000 description 1
- BPKIGYQJPYCAOW-FFJTTWKXSA-I calcium;potassium;disodium;(2s)-2-hydroxypropanoate;dichloride;dihydroxide;hydrate Chemical compound O.[OH-].[OH-].[Na+].[Na+].[Cl-].[Cl-].[K+].[Ca+2].C[C@H](O)C([O-])=O BPKIGYQJPYCAOW-FFJTTWKXSA-I 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000000234 capsid Anatomy 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 235000010980 cellulose Nutrition 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 229940110456 cocoa butter Drugs 0.000 description 1
- 235000019868 cocoa butter Nutrition 0.000 description 1
- 239000008119 colloidal silica Substances 0.000 description 1
- 239000008139 complexing agent Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000000599 controlled substance Substances 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 239000002385 cottonseed oil Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 229940124447 delivery agent Drugs 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 230000006114 demyristoylation Effects 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 108020001096 dihydrofolate reductase Proteins 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000012153 distilled water Substances 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- 229940126534 drug product Drugs 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 230000003511 endothelial effect Effects 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000006718 epigenetic regulation Effects 0.000 description 1
- 238000012236 epigenome editing Methods 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 230000002964 excitative effect Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 239000012894 fetal calf serum Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000796 flavoring agent Substances 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000013355 food flavoring agent Nutrition 0.000 description 1
- 235000003599 food sweetener Nutrition 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 210000001222 gaba-ergic neuron Anatomy 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000004034 genetic regulation Effects 0.000 description 1
- 235000003869 genetically modified organism Nutrition 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 150000002334 glycols Chemical class 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 210000000569 greater omentum Anatomy 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940047650 haemophilus influenzae Drugs 0.000 description 1
- 210000005003 heart tissue Anatomy 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 102000043482 human APOBEC2 Human genes 0.000 description 1
- 102000048646 human APOBEC3A Human genes 0.000 description 1
- 102000048415 human APOBEC3B Human genes 0.000 description 1
- 102000048419 human APOBEC3C Human genes 0.000 description 1
- 102000043429 human APOBEC3D Human genes 0.000 description 1
- 102000049338 human APOBEC3F Human genes 0.000 description 1
- 102000044839 human APOBEC3H Human genes 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000009474 immediate action Effects 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000009851 immunogenic response Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 239000003978 infusion fluid Substances 0.000 description 1
- 230000000266 injurious effect Effects 0.000 description 1
- 150000002485 inorganic esters Chemical class 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000002743 insertional mutagenesis Methods 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 238000007914 intraventricular administration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 210000004153 islets of langerhan Anatomy 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 201000010260 leiomyoma Diseases 0.000 description 1
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 1
- 229940039781 leptin Drugs 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 150000002617 leukotrienes Chemical class 0.000 description 1
- 229960004194 lidocaine Drugs 0.000 description 1
- 239000012669 liquid formulation Substances 0.000 description 1
- 238000010859 live-cell imaging Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 239000003589 local anesthetic agent Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 230000017156 mRNA modification Effects 0.000 description 1
- VTHJTEIRLNZDEV-UHFFFAOYSA-L magnesium dihydroxide Chemical compound [OH-].[OH-].[Mg+2] VTHJTEIRLNZDEV-UHFFFAOYSA-L 0.000 description 1
- 239000000347 magnesium hydroxide Substances 0.000 description 1
- 229910001862 magnesium hydroxide Inorganic materials 0.000 description 1
- 235000019359 magnesium stearate Nutrition 0.000 description 1
- 238000007885 magnetic separation Methods 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 229910052748 manganese Inorganic materials 0.000 description 1
- 239000011572 manganese Substances 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 239000013081 microcrystal Substances 0.000 description 1
- 235000019813 microcrystalline cellulose Nutrition 0.000 description 1
- 239000008108 microcrystalline cellulose Substances 0.000 description 1
- 229940016286 microcrystalline cellulose Drugs 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000036438 mutation frequency Effects 0.000 description 1
- 108010065781 myosin light chain 2 Proteins 0.000 description 1
- 210000004898 n-terminal fragment Anatomy 0.000 description 1
- 210000005044 neurofilament Anatomy 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000009438 off-target cleavage Effects 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 150000002895 organic esters Chemical class 0.000 description 1
- 230000000065 osmolyte Effects 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000003002 pH adjusting agent Substances 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000002304 perfume Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 239000003208 petroleum Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 235000021317 phosphate Nutrition 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical group [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- XJMOSONTPMZWPB-UHFFFAOYSA-M propidium iodide Chemical compound [I-].[I-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CCC[N+](C)(CC)CC)=C1C1=CC=CC=C1 XJMOSONTPMZWPB-UHFFFAOYSA-M 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- ZJFJVRPLNAMIKH-UHFFFAOYSA-N pseudo-u Chemical compound O=C1NC(=O)C(C)=CN1C1OC(COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)CO)C(O)C1 ZJFJVRPLNAMIKH-UHFFFAOYSA-N 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000006722 reduction reaction Methods 0.000 description 1
- 210000003289 regulatory T cell Anatomy 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 102220102929 rs762648754 Human genes 0.000 description 1
- 102220089709 rs869320709 Human genes 0.000 description 1
- 235000005713 safflower oil Nutrition 0.000 description 1
- 239000003813 safflower oil Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 1
- 235000010356 sorbitol Nutrition 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 239000008227 sterile water for injection Substances 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 229940037128 systemic glucocorticoids Drugs 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 235000012222 talc Nutrition 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 231100001274 therapeutic index Toxicity 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 238000011200 topical administration Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 231100000167 toxic agent Toxicity 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 235000010487 tragacanth Nutrition 0.000 description 1
- 239000000196 tragacanth Substances 0.000 description 1
- 229940116362 tragacanth Drugs 0.000 description 1
- 230000005029 transcription elongation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 239000012581 transferrin Substances 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 238000011830 transgenic mouse model Methods 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 102000027257 transmembrane receptors Human genes 0.000 description 1
- 108091008578 transmembrane receptors Proteins 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 150000003672 ureas Chemical class 0.000 description 1
- 150000003673 urethanes Chemical class 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 230000002227 vasoactive effect Effects 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 239000001993 wax Substances 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- XOOUIPVCVHRTMJ-UHFFFAOYSA-L zinc stearate Chemical compound [Zn+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O XOOUIPVCVHRTMJ-UHFFFAOYSA-L 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04001—Cytosine deaminase (3.5.4.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04002—Adenine deaminase (3.5.4.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04004—Adenosine deaminase (3.5.4.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/04—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in cyclic amidines (3.5.4)
- C12Y305/04005—Cytidine deaminase (3.5.4.5)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
- C07K2319/42—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a HA(hemagglutinin)-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/40—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation
- C07K2319/43—Fusion polypeptide containing a tag for immunodetection, or an epitope for immunisation containing a FLAG-tag
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Immunology (AREA)
- Virology (AREA)
- Gastroenterology & Hepatology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Cell Biology (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Bakery Products And Manufacturing Methods Therefor (AREA)
Abstract
本発明は、ヒト細胞に、核酸標的化及び操作に最適化された組換え操作された新規Cas9酵素を作製及び使用するための新規なシステム、方法、及び組成物を提供する。本発明は、コドン最適化され、ヒト細胞における使用のために組換え産生された、Streptococcus constellatus、Sharpea spp.分離株RUG017、Veillonella parvula、Ezakiella peruensis、Lactobacillus fermentum株AF15-40LB株、及びPeptoniphilus sp.Marseille-P3761細菌からの新規Cas9酵素の発見に基づく。いくつかの実施形態では、新規Cas9酵素は、塩基編集に使用することができる。いくつかの実施形態では、新規の操作されたCas9酵素は、ヒト疾患を治療するために使用される。【選択図】図1A、図1B、図1C、図1D
Description
関連出願の相互参照
本出願は、全ての目的のためにその全体が参照により本明細書に組み込まれる、2021年3月23日に出願された、米国仮特許出願第63/164,798号の優先権を主張する。
本出願は、全ての目的のためにその全体が参照により本明細書に組み込まれる、2021年3月23日に出願された、米国仮特許出願第63/164,798号の優先権を主張する。
原核生物の、クラスター化され、規則的に間隔が空いている短回文反復(CRISPR)及びCRISPR関連タンパク質(CRISPR-Cas)システム由来の酵素は、真核生物における使用のための再プログラマブルかつ非常に特異的なゲノム編集ツールとして利用されている。ゲノム編集及び開裂に加えて、CRISPR-Cas9を使用して、エフェクター分子をゲノム上の特定の部位に局在化し、様々なメカニズムを通して、遺伝子及びエピジェネティック調節並びに転写調節を可能にすることができる。
しかしながら、多様なゲノム及びゲノム標的は、効果的な遺伝子操作のための多様なツールを必要とし、多様な配列を認識及び標的化することができる新規Casタンパク質の発見及び操作を通して、CRISPRツールボックスを拡張する必要性が残る。
CRISPR-Cas9システムを使用して、遺伝子をノックアウトするか、又は遺伝子の発現を修飾することができるが、特定の種類の遺伝子編集は、標的遺伝子に対する正確な修飾、例えば、遺伝子内の単一塩基を編集することを必要とする。そのような正確な修飾は、課題のままであり、多種多様な標的遺伝子における正確なゲノム修飾を達成するために、多様な遺伝子編集ツールキットを必要とする。
独自のプロトスペーサー隣接モチーフ(PAM)についての特異性を有する新規Cas9酵素の特定は、遺伝子編集のための利用可能なツールの拡張を可能にする。本発明は、とりわけ、Streptococcus constellatus、Sharpea spp.分離株RUG017、Veillonella parvula、Ezakiella peruensis、Lactobacillus fermentum株AF15-40LB、及びPeptoniphilus sp.Marseille-P3761細菌から単離された操作された天然に存在しない新規Cas9酵素を提供する。本発明は、一部には、特定のPAM配列を認識する、異なる細菌から発見された新規Cas9酵素が、真核細胞(例えば、ヒト、植物など)における発現のために操作され得るという驚くべき発見に基づいている。したがって、記載されるCas9酵素及びそれらのバリアントは、真核生物において機能的である。本明細書に提供される例は、様々なゲノム部位を標的とする多様なPAM認識配列を有するヒト細胞における操作された天然に存在しないCas9酵素の使用を示す。例えば、Streptococcus constellatus、Ezakiella peruensis、及びPeptoniphilus sp.Marseille-P3761から操作されたCas9は、コンセンサスPAM配列5’-NGG-3’を認識する。Sharpea spp.分離株RUG017から単離されたCas9によって認識されるコンセンサスPAM配列は、5’-NAGHC-3’である。Veillonella parvulaから単離されたCas9によって認識されるコンセンサスPAM配列は、5’-NRHRRH-3’として特定された。Lactobacillus fermentum株AF15-40LBから単離されたCas9によって認識されるコンセンサスPAM配列は、5’-NNAAA-3’として特定された。(H=A、C、又はT;R=A又はG)。
一態様では、Streptococcus constellatus Cas9、Sharpea Cas9、Veillonella parvula Cas9、Ezakiella peruensis Cas9、Lactobacillus fermentum株AF15-40LB Cas9、又はPeptoniphilus sp.Marseille-P3761 Cas9から修飾された操作された天然に存在しないCas9タンパク質が本明細書に提供される。
いくつかの実施形態では、Streptococcus constellatus Cas9タンパク質は、
MGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGED(配列番号1)と少なくとも80%の配列同一性を有する。
MGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGED(配列番号1)と少なくとも80%の配列同一性を有する。
いくつかの実施形態では、Sharpea Cas9タンパク質は、
MAKNKDIRYSIGLDIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKL(配列番号4)と少なくとも80%の配列同一性を有する。
MAKNKDIRYSIGLDIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKL(配列番号4)と少なくとも80%の配列同一性を有する。
いくつかの実施形態では、Veillonella parvula Cas9タンパク質は、
MSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLDIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIV(配列番号8)と少なくとも80%の配列同一性を有する。
MSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLDIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIV(配列番号8)と少なくとも80%の配列同一性を有する。
いくつかの実施形態では、Ezakiella peruensis Cas9タンパク質は、
MTKVKDYYIGLDIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKL(配列番号14)と少なくとも80%の配列同一性を有する。
MTKVKDYYIGLDIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKL(配列番号14)と少なくとも80%の配列同一性を有する。
いくつかの実施形態では、Lactobacillus fermentum Cas9タンパク質は、
MKEYHIGLDIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNL(配列番号84)と少なくとも80%の配列同一性を有する。
MKEYHIGLDIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNL(配列番号84)と少なくとも80%の配列同一性を有する。
いくつかの実施形態では、Peptoniphilus sp.Marseille-P3761 Cas9タンパク質は、
MEKKTNYTIGLDIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFED(配列番号86)と少なくとも80%の配列同一性を有する。
MEKKTNYTIGLDIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFED(配列番号86)と少なくとも80%の配列同一性を有する。
いくつかの実施形態では、Cas9タンパク質は、配列番号1、4、8、14、84、又は86と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、又は少なくとも99%同一であるアミノ酸配列を含む。
いくつかの実施形態では、Cas9タンパク質は、核局在化配列(NLS)及び/又はFLAGタグ、HISタグ、若しくはHAタグを更に含む。
いくつかの実施形態では、Streptococcus constellatus Cas9は、
MPKKKRKVGGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号2)と少なくとも80%同一のアミノ酸配列を有する。
MPKKKRKVGGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号2)と少なくとも80%同一のアミノ酸配列を有する。
いくつかの実施形態では、Sharpea Cas9は、
MPKKKRKVGAKNKDIRYSIGLDIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号5)と少なくとも80%同一のアミノ酸配列を有する。
MPKKKRKVGAKNKDIRYSIGLDIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号5)と少なくとも80%同一のアミノ酸配列を有する。
いくつかの実施形態では、Veillonella parvula Cas9は、
MPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLDIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号9)と少なくとも80%同一のアミノ酸配列を有する。
MPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLDIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号9)と少なくとも80%同一のアミノ酸配列を有する。
いくつかの実施形態では、Ezakiella peruensis Cas9は、
MPKKKRKVGTKVKDYYIGLDIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号15)と少なくとも80%同一のアミノ酸配列を有する。
MPKKKRKVGTKVKDYYIGLDIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号15)と少なくとも80%同一のアミノ酸配列を有する。
いくつかの実施形態では、Lactobacillus fermentum株AF15-40LB Cas9は、
MPKKKRKVGKEYHIGLDIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号85)と少なくとも80%同一のアミノ酸配列を有する。
MPKKKRKVGKEYHIGLDIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号85)と少なくとも80%同一のアミノ酸配列を有する。
いくつかの実施形態では、Peptoniphilus sp.Marseille-P3761 Cas9は、
MPKKKRKVGEKKTNYTIGLDIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号87)と少なくとも80%同一のアミノ酸配列を有する。
MPKKKRKVGEKKTNYTIGLDIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号87)と少なくとも80%同一のアミノ酸配列を有する。
いくつかの実施形態では、Cas9タンパク質のアミノ酸配列は、配列番号1、4、8、14、84、又は86に少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、又は少なくとも10個の変異を含む。
いくつかの実施形態では、変異は、アミノ酸置換である。
いくつかの実施形態では、Cas9タンパク質は、ニッカーゼ活性を有する。
いくつかの実施形態では、Cas9タンパク質が本明細書に提供され、Cas9タンパク質は、野生型SpCas9の1つ以上のアミノ酸10、12、17、762、840、854、863、982、983、984、986、987に対応するアミノ酸位置にニッカーゼ変異を含む。
いくつかの実施形態では、少なくとも1つの変異は、不活性Cas9(dCas9)をもたらす。
いくつかの実施形態では、Cas9タンパク質は、PAM相互作用ドメイン、HNHドメイン、及び/又はRuvCドメインに少なくとも1つのアミノ酸変異を含む。
いくつかの実施形態では、Cas9タンパク質が本明細書に提供され、アミノ酸位置の変異は、SirCas9のRuvCドメインにおけるアミノ酸14に対応する。
いくつかの実施形態では、Cas9タンパク質が本明細書に提供され、アミノ酸位置の変異は、EpeCas9のRuvCドメインにおけるアミノ酸12に対応する。
いくつかの実施形態では、Cas9タンパク質が本明細書に提供され、アミノ酸位置の変異は、LfeCas9のRuvCドメインにおけるアミノ酸9に対応する。
いくつかの実施形態では、Cas9タンパク質が本明細書に提供され、アミノ酸位置の変異は、PmaCas9のRuvCドメインにおけるアミノ酸12に対応する。
いくつかの実施形態では、Cas9タンパク質は、核局在化配列(NLS)及び/又はFLAGタグ、HISタグ、若しくはHAタグを更に含む。
一態様では、配列番号1、4、8、14、84、又は86と少なくとも80%の同一性を有するCas9タンパク質を含む、操作された天然に存在しないCas9融合タンパク質が本明細書に提供され、Cas9タンパク質は、ヒストンデメチラーゼ、転写アクチベーター、又はデアミナーゼに融合している。
いくつかの実施形態では、核局在化配列(NLS)及び/又はFLAGタグ、HISタグ、若しくはHAタグを更に含む、操作された天然に存在しないCas9融合タンパク質が本明細書に提供される。
いくつかの実施形態では、配列番号2、5、9、15、85、87、95、又は96と少なくとも80%の同一性を有する、操作された天然に存在しないCas9融合タンパク質が本明細書に提供される。
いくつかの実施形態では、Cas9タンパク質は、シトシンデアミナーゼ又はアデノシンデアミナーゼに融合している。
いくつかの実施形態では、Cas9タンパク質は、アデノシンデアミナーゼに融合しており、
(a)MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号20)、
(b)MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGAKNKDIRYSIGLAIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号6)、
(c)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号10)、
(d)MPKKKRKVSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号11)、
(e)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号16)、
(f)MPKKKRKVTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号17)、
(g)MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号88)、
(h)MPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号89)、
(i)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号91)、
(j)MPKKKRKVEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号92)と少なくとも80%同一のアミノ酸配列を有する。
(a)MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号20)、
(b)MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGAKNKDIRYSIGLAIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号6)、
(c)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号10)、
(d)MPKKKRKVSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号11)、
(e)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号16)、
(f)MPKKKRKVTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号17)、
(g)MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号88)、
(h)MPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号89)、
(i)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号91)、
(j)MPKKKRKVEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号92)と少なくとも80%同一のアミノ酸配列を有する。
いくつかの実施形態では、Cas9タンパク質は、シトシンデアミナーゼに融合しており、
(a)MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号21)、
(b)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号12)、
(c)MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号18)、
(d)MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号90)、
(e)MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号93)、又は
(f)
MPAAKRVKLDTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSPKKKRKVEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDKRPAATKKAGQAKKKKGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号94)と少なくとも80%同一のアミノ酸配列を有する。
(a)MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号21)、
(b)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号12)、
(c)MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号18)、
(d)MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号90)、
(e)MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号93)、又は
(f)
MPAAKRVKLDTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSPKKKRKVEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDKRPAATKKAGQAKKKKGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号94)と少なくとも80%同一のアミノ酸配列を有する。
いくつかの実施形態では、Streptococcus constellatus Cas9タンパク質は、5’-NGG-3’を含むPAM配列を認識する。
いくつかの実施形態では、Streptococcus constellatus Cas9タンパク質は、5’-NGC-3’を含むPAM配列を認識する。
いくつかの実施形態では、本明細書に開示されるCas9タンパク質(例えば、SirCas9、VapCas9、EpeCas9、LfeCas9、又はPmaCas9)は、5’-NGC-3’を含むPAM配列を認識する。
いくつかの実施形態では、Sharpea Cas9タンパク質は、H=A、C、又はTである、5’-NAGHC-3’を含むPAM配列を認識する。
いくつかの実施形態では、Veillonella parvula Cas9タンパク質は、Hが、アデニン、シトシン、又はチミンであり、Rが、アデニン又はグアニンである、5’-NRHRRH-3’を含むPAM配列を認識する。
いくつかの実施形態では、Ezakiella peruensis Cas9タンパク質は、5’-NGG-3’を含むPAM配列を認識する。
いくつかの実施形態では、Lactobacillus fermentum株AF15-40LB Cas9タンパク質は、5’-NGG-3’を含むPAM配列を認識する。
いくつかの実施形態では、Peptoniphilus sp.Marseille-P3761 Cas9タンパク質は、5’-NNAAA-3’を含むPAM配列を認識する。
いくつかの実施形態では、Cas9タンパク質をコードする核酸が提供される。
いくつかの実施形態では、核酸は、哺乳動物細胞における発現のためにコドン最適化される。
いくつかの実施形態では、核酸は、ヒト細胞における発現のためにコドン最適化される。
いくつかの実施形態では、Cas9タンパク質を含む真核細胞が提供される。
いくつかの実施形態では、細胞は、ヒト細胞である。いくつかの実施形態では、細胞は、植物細胞である。
一態様では、細胞を、本明細書に記載されるCas9、及びRNAガイド又はRNAガイドをコードする核酸と接触させることを含み、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含み、Cas9タンパク質が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列における切断を引き起こすことができる、真核細胞中の標的核酸を開裂する方法が提供される。
一態様では、細胞を、本明細書に記載されるCas9、及びRNAガイド又はRNAガイドをコードする核酸と接触させることを含み、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含み、Cas9タンパク質が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列における切断を引き起こすことができる、真核細胞中の標的核酸の発現を改変する方法が提供される。
一態様では、細胞を、本明細書に記載されるCas9、及びRNAガイド又はRNAガイドをコードする核酸と接触させることを含み、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含み、Cas9タンパク質が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列を編集することができる、真核細胞中の標的核酸の発現を改変する方法が提供される。
一態様では、細胞を、本明細書に記載されるCas9、及びRNAガイド又はRNAガイドをコードする核酸と接触させることを含み、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含み、Cas9タンパク質が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列を編集することができる、真核細胞中の標的核酸を修飾する方法が提供される。
いくつかの実施形態では、Cas9タンパク質は、不活性Cas9(dCas9)である。
いくつかの実施形態では、dCas9は、デアミナーゼに融合している。
いくつかの実施形態では、RNAガイドは、crRNA及びtracrRNAを含む。
いくつかの実施形態では、RNAガイドは、sgRNAを含む。
いくつかの実施形態では、Streptococcus constellatus Cas9での使用のためのsgRNAは、
5’-GUUUUAGAGCUGUGCUGUUUAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACUCAAGCUUGCAAAAGCGUGCACCGAUUCGGUGCU-3’(配列番号3)と少なくとも約80%の同一性を有する配列を含む足場を含む。
5’-GUUUUAGAGCUGUGCUGUUUAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACUCAAGCUUGCAAAAGCGUGCACCGAUUCGGUGCU-3’(配列番号3)と少なくとも約80%の同一性を有する配列を含む足場を含む。
いくつかの実施形態では、Sharpea Cas9での使用のためのsgRNAは、
5’-GUUUUAGAGUUGUGUUAUUGAAAAAUAACACAACGAGUUAAAAUAAAGCUUAUGCUUAAAUGCCAGCUUUGCUGGUGUCAUUUAGAUGACUUUACUAAGGUUGCUUCGGCAACCUUUUU-3’(配列番号7)と少なくとも約80%の同一性を有する配列を含む足場を含む。
5’-GUUUUAGAGUUGUGUUAUUGAAAAAUAACACAACGAGUUAAAAUAAAGCUUAUGCUUAAAUGCCAGCUUUGCUGGUGUCAUUUAGAUGACUUUACUAAGGUUGCUUCGGCAACCUUUUU-3’(配列番号7)と少なくとも約80%の同一性を有する配列を含む足場を含む。
いくつかの実施形態では、Veillonella parvula Cas9での使用のためのsgRNAは、
5’-GUUUGAGAGUAGUGUGAAAACAUUACGAGUUCAAAUACAAAUUAAUUUACAAUGCCUUCGGGCUGCCCGACGUAGGGCACCUACUCUCAAUUCUUCGGAAUUGAGUU-3’(配列番号13)と少なくとも約80%の同一性を有する配列を含む足場を含む。
5’-GUUUGAGAGUAGUGUGAAAACAUUACGAGUUCAAAUACAAAUUAAUUUACAAUGCCUUCGGGCUGCCCGACGUAGGGCACCUACUCUCAAUUCUUCGGAAUUGAGUU-3’(配列番号13)と少なくとも約80%の同一性を有する配列を含む足場を含む。
いくつかの実施形態では、Ezakiella peruensis Cas9での使用のためのsgRNAは、
5’-GUUUGAGAGUUAUGUAAUUGAAAAAUUACAUGACGAGUUCAAAUAAAAAUUUAUUCAAACCGCCUAUUUAUAGGCCGCAGAUGUUCUGCAUUAUGCUUGCUAUUGCAAGCUU-3’(配列番号19)と少なくとも約80%の同一性を有する配列を含む足場を含む。
5’-GUUUGAGAGUUAUGUAAUUGAAAAAUUACAUGACGAGUUCAAAUAAAAAUUUAUUCAAACCGCCUAUUUAUAGGCCGCAGAUGUUCUGCAUUAUGCUUGCUAUUGCAAGCUU-3’(配列番号19)と少なくとも約80%の同一性を有する配列を含む足場を含む。
いくつかの実施形態では、Lactobacillus fermentum株AF15-40LB Cas9での使用のためのsgRNAは、
5’-GUCUUGGAUGAGUGUGAAAACACUCAUAGUCAAGAUCAAACGAGUGGUUUUCCACGAGUUAUUACUUUUGAGGUCUUAUAUGGCCCAUACAUAAAAAGGAGUCGGAAUUUCCGGCUCCUUUUCUU-3’(配列番号95)と少なくとも約80%の同一性を有する配列を含む足場を含む。
5’-GUCUUGGAUGAGUGUGAAAACACUCAUAGUCAAGAUCAAACGAGUGGUUUUCCACGAGUUAUUACUUUUGAGGUCUUAUAUGGCCCAUACAUAAAAAGGAGUCGGAAUUUCCGGCUCCUUUUCUU-3’(配列番号95)と少なくとも約80%の同一性を有する配列を含む足場を含む。
いくつかの実施形態では、Peptoniphilus sp.Marseille-P3761 Cas9での使用のためのsgRNAは、
5’-GUUUUAGAGCCAUGUAGAAAUACAUUGCAAGUUAAAAUAAGGCUUUGUCCGUAAUCAACUUGAAAAAGUGGCGCUGUUUCGGCGCUUU-3’(配列番号96)と少なくとも約80%の同一性を有する配列を含む足場を含む。
5’-GUUUUAGAGCCAUGUAGAAAUACAUUGCAAGUUAAAAUAAGGCUUUGUCCGUAAUCAACUUGAAAAAGUGGCGCUGUUUCGGCGCUUU-3’(配列番号96)と少なくとも約80%の同一性を有する配列を含む足場を含む。
いくつかの実施形態では、crRNAは、約16~26ヌクレオチド長のガイド配列を含む。
いくつかの実施形態では、crRNAは、18~24ヌクレオチド長のガイド配列を含む。
いくつかの実施形態では、標的核酸における切断は、一本鎖切断又は二本鎖切断である。
いくつかの実施形態では、標的核酸における切断は、一本鎖切断である。
いくつかの実施形態では、Cas9タンパク質は、標的核酸配列の両方の鎖を開裂するヌクレアーゼである。いくつかの実施形態では、Cas9は、標的核酸配列の一方の鎖を開裂するニッカーゼである。
いくつかの実施形態では、標的核酸は、プロトスペーサー隣接モチーフ(PAM)配列に対して5’である。
いくつかの実施形態では、Cas9は、真核細胞における発現のためのプロモーター配列に作動可能に結合しており、ガイドRNAは、真核細胞における発現のためのプロモーター配列に作動可能に結合している。
いくつかの実施形態では、真核細胞は、ヒト細胞である。
いくつかの実施形態では、プロモーター配列は、真核プロモーター又はウイルスプロモーターである。
一態様では、RNAガイド又はRNAガイドをコードする核酸であって、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む、RNAガイド又は核酸と、配列番号1、4、8、14、84、又は86と少なくとも80%の配列同一性を有するコドン最適化CRISPR関連(Cas)タンパク質であって、Casタンパク質が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列における切断を引き起こすことができる、Casタンパク質と、を含む、操作された天然に存在しないCRISPR-Casシステムが本明細書に提供される。
いくつかの実施形態では、配列番号2、5、9、15、85、87、95、又は96と少なくとも80%の配列同一性を有するコドン最適化CRISPR関連(Cas)タンパク質であって、Casタンパク質が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列における切断を引き起こすことができる、Casタンパク質を含む、操作された天然に存在しないCRISPR-Casシステムが本明細書に提供される。
一態様では、RNAガイド又はRNAガイドをコードする核酸であって、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む、RNAガイド又は核酸と、配列番号1、4、8、14、84、又は86と少なくとも80%の配列同一性を有するコドン最適化CRISPR関連(Cas)タンパク質であって、Casタンパク質が、デアミナーゼに融合しており、Casタンパク質融合体が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列を編集することができる、Casタンパク質と、を含む、操作された天然に存在しないCRISPR-Casシステムが本明細書に提供される。
いくつかの実施形態では、操作された天然に存在しないCRISPR-Casシステムは、核局在化配列(NLS)及び/又はFLAGタグ、HISタグ、若しくはHAタグを更に含む、CRISPR関連(Cas)タンパク質を含む。
いくつかの実施形態では、操作された天然に存在しないCRISPR-Casシステムは、配列番号2、5、9、15、85、87、95、又は96と少なくとも80%の配列同一性を有するコドン最適化CRISPR関連(Cas)タンパク質であって、Casタンパク質が、デアミナーゼに融合しており、Casタンパク質融合体が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列を編集することができる、Casタンパク質を含む。
一実施形態では、Cas9タンパク質は、不活性Cas9(dCas9)である。
一実施形態では、RNAガイドは、crRNA及びtracrRNAを含む。
一実施形態では、RNAガイドは、sgRNAを含む。
一実施形態では、Casタンパク質は、真核細胞における発現のためのプロモーター配列に作動可能に結合しており、ガイドRNAは、真核細胞における発現のためのプロモーター配列に作動可能に結合している。
一実施形態では、真核細胞は、ヒト細胞である。
一実施形態では、プロモーター配列は、真核プロモーター配列である。
一実施形態では、本明細書に記載されるシステムをコードする核酸が提供される。
一実施形態では、本明細書に記載されるシステムを含むベクターが提供される。
一実施形態では、ベクターは、プラスミドベクター又はウイルスベクターである。
一実施形態では、ウイルスベクターは、アデノ随伴ウイルス(AAV)ベクター又はレンチウイルスベクターである。
一実施形態では、ウイルスベクターは、AAVベクターである。
一実施形態では、2つ以上のAAVベクターは、システムをパッケージングするために使用される。
一実施形態では、障害又は疾患を治療する必要がある対象においてそれを行う方法は、対象に、本明細書に記載されるシステムを投与することを含み、ガイドRNAは、状態又は疾患に関連する標的核酸の少なくとも10ヌクレオチドに相補的であり、Casタンパク質は、ガイドRNAと会合し、ガイドRNAは、標的核酸に結合し、Casタンパク質は、標的核酸における切断を引き起こし、任意選択的に、Cas9は、デアミナーゼに融合した不活性なCas9(dCas9)であり、標的核酸に1つ以上の塩基編集をもたらし、それによって障害又は疾患を治療する。
いくつかの実施形態では、ガイドRNAは、約18~24ヌクレオチドに相補的である。
いくつかの実施形態では、ガイドRNAは、20ヌクレオチドに相補的である。
いくつかの実施形態では、塩基エディターは、融合タンパク質を含む。
いくつかの実施形態では、塩基エディターは、アデノシンデアミナーゼドメイン又はシチジンデアミナーゼドメインを含む。
いくつかの実施形態では、ポリヌクレオチドの核酸塩基を編集する方法であって、方法が、ポリヌクレオチドを塩基エディターと、1つ以上のガイドRNAとの複合体において接触させることを含み、塩基エディターが、アデノシンデアミナーゼドメインを含み、1つ以上のガイドRNAが、塩基エディターを標的化して、ポリヌクレオチドにおけるA・TからG・Cへの改変をもたらす、方法が本明細書に提供される。
いくつかの実施形態では、ポリヌクレオチドの核酸塩基を編集する方法であって、方法が、ポリヌクレオチドを塩基エディターと、1つ以上のガイドRNAとの複合体において接触させることを含み、塩基エディターが、シチジンデアミナーゼドメインを含み、1つ以上のガイドRNAが、塩基エディターを標的化して、ポリヌクレオチドにおけるC・GからT・Aへの改変をもたらす、方法が本明細書に提供される。
いくつかの実施形態では、編集は、標的ポリヌクレオチド配列における50%未満のインデル形成をもたらす。
いくつかの実施形態では、編集は、点変異を生成する。
定義
本発明をより容易に理解するために、特定の用語を最初に以下に定義する。以下の用語及び他の用語についての更なる定義は、本明細書全体にわたって記載される。
本発明をより容易に理解するために、特定の用語を最初に以下に定義する。以下の用語及び他の用語についての更なる定義は、本明細書全体にわたって記載される。
a又はan:「a」及び「an」という冠詞は、冠詞の文法的目的語の1つ又は1つ超(すなわち、少なくとも1つ)を指すために本明細書で使用される。一例として、「要素(an element)」は、1つの要素又は2つ以上の要素を意味する。
およそ又は約:本明細書で使用される場合、「およそ」又は「約」という用語は、1つ以上の目的の値に適用される場合、記載される参照値に類似する値を指す。特定の実施形態では、「およそ」又は「約」という用語は、別段の記載がない限り、又は文脈から明らかでない限り、記載された参照値のいずれかの方向(より大きいか、より小さい)で25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%又はそれ未満内に収まる値の範囲を指す(そのような数値が可能な値の100%を超える場合を除く)。
関連する:一方の存在、レベル及び/又は形態が、他方の存在、レベル及び/又は形態と相関する場合に用語が本明細書で使用される場合、2つの事象又は実体は、互いに「関連する」。例えば、特定の実体(例えば、ポリペプチド)は、その存在、レベル及び/又は形態が(例えば、関連する集団全体にわたって)疾患、障害若しくは状態の発生率及び/又はその感受性と相関する場合、特定の疾患、障害若しくは状態と関連するとみなされる。一部の実施形態では、2つ以上の実体が、直接的又は間接的に相互作用する場合、それらが互いに物理的に近接し、それを維持するように、物理的に互いに「関連する」。一部の実施形態では、互いに物理的に会合している2つ以上の実体は、互いに共有結合しており、一部の実施形態では、互いに物理的に会合している2つ以上の実体は、互いに共有結合していないが、例えば、水素結合、ファンデルワールス相互作用、疎水性相互作用、磁性、及びそれらの組み合わせによって、非共有結合的に会合している。
塩基エディター「塩基エディター(BE)」又は「核酸塩基エディター(NBE)」は、ポリヌクレオチドに結合し、核酸塩基修飾活性を有する薬剤を意味する。様々な実施形態では、塩基エディターは、ガイドポリヌクレオチド(例えば、ガイドRNA)と併せて、核酸塩基修飾ポリペプチド(例えば、デアミナーゼ)及びポリヌクレオチドプログラマブルヌクレオチド結合ドメインを含む。様々な実施形態では、薬剤は、塩基編集活性を有するタンパク質ドメイン、すなわち、核酸分子(例えば、DNA)内の塩基(例えば、A、T、C、G、又はU)を修飾することができるドメインを含む生体分子複合体である。一部の実施形態では、ポリヌクレオチドプログラマブルDNA結合ドメインは、デアミナーゼドメインに融合又は連結される。一実施形態では、薬剤は、塩基編集活性を有する1つ以上のドメインを含む融合タンパク質である。別の実施形態では、塩基編集活性を有するタンパク質ドメインは、ガイドRNAに連結される(例えば、ガイドRNA上のRNA結合モチーフ及びデアミナーゼに融合されたRNA結合ドメインを介して)。一部の実施形態では、塩基編集活性を有するタンパク質ドメインは、核酸分子内の塩基を脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNA分子内の1つ以上の塩基を脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNA内のシトシン(C)又はアデノシン(A)を脱アミノ化することができる。一部の実施形態では、塩基エディターは、DNA内のシトシン(C)及びアデノシン(A)を脱アミノ化することができる。一部の実施形態では、塩基エディターは、シチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターは、アデノシン塩基エディター(ABE)である。一部の実施形態では、塩基エディターは、アデノシン塩基エディター(ABE)及びシチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターは、アデノシンデアミナーゼに融合されたヌクレアーゼ不活性型Cas9(dCas9)である。一部の実施形態では、塩基エディターは、塩基除去修復の阻害因子(例えば、UGIドメイン、又はdISNドメイン)に融合される。一部の実施形態では、融合タンパク質は、デアミナーゼに融合されたCas9ニッカーゼと、塩基除去修復の阻害因子(例えば、UGIドメイン又はdISNドメイン)と、を含む。他の実施形態では、塩基エディターは、脱塩基(abasic)塩基エディターである。塩基エディターの詳細は、国際PCT出願第2017/045381号(WO2018/027078)及び同第PCT/US2016/058344号(WO2017/070632)に記載されており、これらの各々は、その全体が参照により本明細書に組み込まれる。また、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature533,420-424(2016);Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature551,464-471(2017);Komor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances3:eaao4774(2017)、及びRees,H.A.,et al.,“Base editing:precision chemistry on the genome and transcriptome of living cells.”Nat Rev Genet.2018 Dec;19(12):770-788.doi:10.1038/s41576-018-0059-1を参照されたく、その全容は、参照により本明細書に組み込まれる。
塩基編集活性:「塩基編集活性」とは、ポリヌクレオチド内の塩基を化学的に改変するように作用することを意味する。一実施形態では、第1の塩基は、第2の塩基に変換される。一実施形態では、塩基編集活性は、シチジンデアミナーゼ活性であり、例えば、標的C・GをT・Aに変換する。別の実施形態では、塩基編集活性は、アデノシン又はアデニンデアミナーゼ活性であり、例えば、A・TをG・Cに変換する。別の実施形態では、塩基編集活性は、シトシン又はシチジンデアミナーゼ活性であり、例えば、標的C・GをT・Aに変換し、かつアデノシン又はアデニンデアミナーゼ活性であり、例えば、A・TをG・Cに変換する。
塩基エディターシステム:「塩基エディターシステム」という用語は、標的ヌクレオチド配列の核酸塩基を編集するためのシステムを指す。様々な実施形態では、塩基エディター(BE)システムは、(1)標的ヌクレオチド配列中の核酸塩基を脱アミノ化するための、ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)、デアミナーゼドメイン、及びシチジンデアミナーゼドメイン、並びに(2)ポリヌクレオチドプログラマブルヌクレオチド結合ドメインと併せて、1つ以上のガイドポリヌクレオチド(例えば、ガイドRNA)を含む。様々な実施形態では、塩基エディター(BE)システムは、アデノシンデアミナーゼ又はシチジンデアミナーゼ、及び核酸配列特異的結合活性を有するドメインから選択される核酸塩基エディタードメインを含む。一部の実施形態では、塩基エディターシステムは、(1)標的ヌクレオチド配列中の1つ以上の核酸塩基を脱アミノ化するための、ポリヌクレオチドプログラマブルDNA結合ドメイン及びデアミナーゼドメインを含む塩基エディター(BE)、並びに(2)ポリヌクレオチドプログラマブルDNA結合ドメインと併せて、1つ以上のガイドRNAを含む。一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、ポリヌクレオチドプログラマブルDNA結合ドメインである。一部の実施形態では、塩基エディターは、シチジン塩基エディター(CBE)である。一部の実施形態では、塩基エディターは、アデニン又はアデノシン塩基エディター(ABE)である。一部の実施形態では、塩基エディターは、アデニン又はアデノシン塩基エディター(ABE)又はシチジン塩基エディター(CBE)である。
一部の実施形態では、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインは、デアミナーゼドメインと非共有結合的に相互作用するか、又はデアミナーゼドメインと会合することによって、デアミナーゼドメインを標的ヌクレオチド配列に標的化することができる。例えば、一部の実施形態では、核酸塩基編集成分(例えば、デアミナーゼ成分)は、ポリヌクレオチドプログラマブルヌクレオチド結合ドメインの一部である追加の異種部分若しくは異種ドメインと相互作用し得るか、会合し得るか、又は複合体を形成し得る追加の異種部分又は異種ドメインを含むことができる。一部の実施形態では、追加の異種部分は、ポリペプチドに結合し得るか、ポリペプチドと相互作用し得るか、ポリペプチドと会合し得るか、又はポリペプチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドに結合し得るか、ポリヌクレオチドと相互作用し得るか、ポリヌクレオチドと会合し得るか、又はポリヌクレオチドと複合体を形成し得る場合がある。一部の実施形態では、追加の異種部分は、ガイドポリヌクレオチドに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリペプチドリンカーに結合し得る場合がある。一部の実施形態では、追加の異種部分は、ポリヌクレオチドリンカーに結合し得る場合がある。追加の異種部分は、タンパク質ドメインであり得る。一部の実施形態では、追加の異種部分は、K相同性(KH)ドメイン、MS2コートタンパク質ドメイン、PP7コートタンパク質ドメイン、SfMu Comコートタンパク質ドメイン、ステリルαモチーフ、テロメラーゼKu結合モチーフ及びKuタンパク質、テロメラーゼSm7結合モチーフ及びSm7タンパク質、又はRNA認識モチーフであり得る。
生物学的に活性:本明細書で使用される場合、「生物学的に活性」という語句は、生物学的システム、特に生物において活性を有する任意の薬剤の特徴を指す。例えば、生物に投与される場合、その生物に対して生物学的効果を有する薬剤は、生物学的に活性であるとみなされる。特定の実施形態では、ペプチドが生物学的に活性である場合、ペプチドの少なくとも1つの生物学的活性を共有するそのペプチドの一部分は、典型的には、「生物学的に活性」な部分と称される。
開裂:本明細書で使用される場合、開裂は、本明細書に記載のCRISPRシステムのヌクレアーゼによって作製される標的核酸の切断を指す。一部の実施形態では、開裂事象は、二本鎖DNA切断である。一部の実施形態では、開裂事象は、一本鎖DNA切断である。一部の実施形態では、開裂事象は、一本鎖RNA切断である。一部の実施形態では、開裂事象は、二本鎖RNA切断である。
相補的:本明細書で使用される場合、相補的とは、A塩基がTと対になり、C塩基がGと対になるような、ワトソン-クリック塩基対形成、又は第2の核酸鎖上の塩基での非従来的な塩基対形成を形成する核酸鎖を指す。言い換えれば、適切な条件下で互いにハイブリダイズする核酸を指す。
クラスター化して間隔を開けた短い回文配列反復(CRISPR)関連(Cas)システム:本明細書で使用される場合、CRISPR-Cas9システムは、CRISPRエフェクター、RNAガイド、及びCRISPR遺伝子座からの他の配列及び転写物をコードする配列を含む、CRISPRエフェクターの発現に関与する、又はその活性を指向する核酸及び/又はタンパク質を指す。一部の実施形態では、CRISPRシステムは、操作された天然に生じないCRISPRシステムである。一部の実施形態では、CRISPRシステムの成分は、システムの1つ以上の成分をコードする核酸(例えば、ベクター)、タンパク質形態の成分、又はそれらの組み合わせを含み得る。
CRISPRアレイ:「CRISPRアレイ」という用語は、本明細書で使用される場合、第1のCRISPR反復の第1のヌクレオチドで始まり、最後の(末端)CRISPR反復の最後のヌクレオチドで終わる、CRISPR反復及びスペーサーを含む核酸(例えば、DNA)セグメントを指す。典型的には、CRISPRアレイ中の各スペーサーは、2つの反復の間に位置する。「CRISPR反復」又は「CRISPR直接反復」、又は「直接反復」という用語は、本明細書で使用される場合、CRISPRアレイ内の配列バリエーションをほとんど示さないか、又は全く示されない複数の短い直接反復配列を指す。
CRISPR関連タンパク質(Cas):「CRISPR関連タンパク質」、「CRISPRエフェクター」、「エフェクター」、又は「CRISPR酵素」という用語は、本明細書で使用される場合、酵素活性を行うか、又はRNAガイドによって特定される核酸上の標的部位に結合するタンパク質を指す。種々の実施形態では、CRISPRエフェクターは、エンドヌクレアーゼ活性、ニッカーゼ活性、エキソヌクレアーゼ活性、トランスポザーゼ活性、及び/又は切除活性を有する。いくつかの実施形態では、Casは、高精度Casである。いくつかの実施形態では、Casは、高忠実度Casである。いくつかの実施形態では、Casは、SuperFi-Casである。いくつかの実施形態では、高精度、高忠実度、及びSuperFi-Casは、Bravo,J.et al.Structural basis for mismatch surveillance by CRISPR-Cas9 Nature,603,March 2022に記載されるとおりである。
crRNA:「CRISPR RNA」又は「crRNA」という用語は、本明細書で使用される場合、特定の核酸配列を標的化するためにCRISPRエフェクターによって使用されるガイド配列を含むRNA分子を指す。典型的には、crRNAは、標的認識を媒介する配列、及びtracrRNAと二本鎖を形成する配列を含む。一部の実施形態では、crRNA:tracrRNA二本鎖は、CRISPRエフェクターに結合する。
エクスビボ:本明細書で使用される場合、「エクスビボ」という用語は、多細胞生物内ではなく、外部で増殖した細胞又は組織において生じる事象を指す。
機能的同等物又は類似体:本明細書で使用される場合、「機能的同等物」又は「機能的類似体」という用語は、アミノ酸配列の機能的誘導体の状況において、元の配列の生物学的活性と実質的に同様の生物学的な活性(機能又は構造のいずれか)を保持する分子を示す。機能的誘導体又は同等物は、天然誘導体であってもよく、又は合成的に調製されてもよい。例示的な機能的誘導体としては、タンパク質の生物学的な活性が保存されることを条件として、1つ以上のアミノ酸の置換、欠失、又は付加を有するアミノ酸配列が挙げられる。置換するアミノ酸は、望ましくは、置換されたアミノ酸と同様の化学物理的特性を有する。同様の望ましい化学物理的特性としては、電荷の類似性、かさ高さ、疎水性、親水性などが含まれる。
半減期:本明細書で使用される場合、「半減期」という用語は、タンパク質濃度又は活性などの量が、期間の開始時に測定されたその値の半分に低下するのに必要な時間である。
改善する、増加する、又は低減する:本明細書で使用される場合、「改善する」、「増加する」、若しくは「低減する」という用語、又は文法的同等物は、本明細書に記載の治療の開始前の同じ個体における測定値、又は本明細書に記載の治療の不在下での対照対象(又は複数の対照対象)における測定値などの、ベースライン測定値に対する値を示す。「対照対象」は、治療されている対象と同じ形態の疾患に罹患している対象であり、治療されている対象とほぼ同じ年齢である。
阻害:本明細書で使用される場合、「阻害」、「阻害する」、及び「阻害すること」という用語は、目的のタンパク質又は遺伝子の活性及び/又は発現を減少又は低減するプロセス又は方法を指す。典型的には、タンパク質又は遺伝子を阻害することは、本明細書に記載されるか、又は当該技術分野で認識される1つ以上の方法によって測定される、タンパク質又は遺伝子の発現又は関連する活性を少なくとも10%以上、例えば、20%、30%、40%、若しくは50%、60%、70%、80%、90%若しくはそれ以上低減させること、又は1倍より大きい、2倍、3倍、4倍、5倍、10倍、50倍、100倍若しくはそれ以上の発現又は関連する活性の低下を指す。
ハイブリダイゼーション:本明細書で使用される場合、「ハイブリダイゼーション」という用語は、2つ以上の核酸が、ワトソン-クリック対形成、フーグスティーン結合、又は2つの核酸の塩基間の他の配列特異的結合による水素結合を介して互いに結合する反応を指す。別の配列とハイブリダイズすることができる配列は、配列の「補体」と呼ばれ、「相補的」であるか、又は「相補性」を示すと言われる。
インデル:本明細書で使用される場合、「インデル」という用語は、核酸配列における塩基の挿入又は欠失を指す。一般的に変異をもたらし、遺伝的バリエーションの一般的な形態である。
インビトロ:本明細書で使用される場合、「インビトロ」という用語は、多細胞生物内ではなく、人工環境、例えば、試験管又は反応容器内、細胞培養内などにおいて生じる事象を指す。
インビボ:本明細書で使用される場合、「インビボ」という用語は、ヒト及び非ヒト動物などの多細胞生物内で生じる事象を指す。細胞ベースのシステムの文脈では、用語は、(例えば、インビトロシステムとは対照的に)生細胞内で生じる事象を指すために使用され得る。
リンカー:「リンカー」という用語は、2つ以上の実体を結合するために使用される任意の手段、実体、又は部分を指す。いくつかの実施形態では、リンカーは、共有結合リンカーである。いくつかの実施形態では、リンカーは、非共有結合リンカーである。共有結合リンカーの例としては、結合されるタンパク質又はドメインのうちの1つ以上に共有結合した共有結合又はリンカー部分が挙げられる。いくつかの実施形態では、リンカーは、非共有結合、例えば、白金原子などの金属中心を通した有機金属結合である。結合は、永続的又は可逆的であり得る。共有結合のために、炭酸誘導体、エーテル、有機及び無機エステルを含む、エステル、アミノ、ウレタン、尿素などを含む、アミド基などの、様々な官能基を使用することができる。結合を提供するために、ドメインは、カップリングのための部位を提供するために、酸化、ヒドロキシル化、置換、還元などによって修飾することができる。コンジュゲーションのための方法は、当業者によって周知であり、本発明における使用のために包含される。リンカー部分としては、これらに限定されないが、化学リンカー部分、又は例えば、ペプチドリンカー部分(リンカー配列)が挙げられる。RNA結合ドメイン及びエフェクタードメインの機能を有意に低下させない修飾が好ましいことは、理解されるであろう。
変異:本明細書で使用される場合、「突然変異」という用語は、当該技術分野における通常の意味を有し、例えば、点突然変異、置換、挿入、欠失、反転、及び欠失を含む。
オリゴヌクレオチド:本明細書で使用される場合、「オリゴヌクレオチド」という用語は、概して、約5~約100個のヌクレオチドの一本鎖DNA又は二本鎖DNAのポリヌクレオチドを指す。オリゴヌクレオチドは、「オリゴマー」又は「オリゴ」としても知られており、遺伝子から単離されてもよく、又は化学的に合成されてもよい。
PAM:「PAM」又は「プロトスペーサー隣接モチーフ」という用語は、CRISPR-Cas9などの、CRISPRシステムによる開裂の標的となる核酸領域に続く短い核酸配列(通常、2~6個の塩基対の長さ)を指す。PAMは、切断するためにCasヌクレアーゼに必要とされ、概して、切断部位から3~4ヌクレオチド下流に見出される。
ポリペプチド:「ポリペプチド」という用語は、本明細書で使用される場合、ペプチド結合を介してともに連結されたアミノ酸の連続鎖を指す。用語は、任意の長さのアミノ酸鎖を指すために使用されるが、当業者は、用語が長鎖に限定されず、ペプチド結合を介してともに連結された2つのアミノ酸を含む最小鎖を指すことができることを理解するであろう。当業者に既知のように、ポリペプチドは、処理及び/又は修飾され得る。本明細書で使用される場合、「ポリペプチド」及び「ペプチド」という用語は、互換的に使用される。
予防する:本明細書で使用される場合、「予防する」又は「予防」という用語は、疾患、障害、及び/又は状態の発生に関連して使用される場合、疾患、障害、及び/又は状態を発症するリスクを低減することを指す。
タンパク質:「タンパク質」という用語は、本明細書で使用される場合、別個の単位として機能する1つ以上のポリペプチドを指す。単一のポリペプチドが別個の機能単位であり、別個の機能単位を形成するために他のポリペプチドとの永続的又は一時的な物理的会合を必要としない場合、「ポリペプチド」及び「タンパク質」という用語は、互換的に使用され得る。個別機能単位が、互いに物理的に会合する1つより多くのポリペプチドからなる場合、「タンパク質」という用語は、物理的にカップリングされ、個別単位としてともに機能する複数のポリペプチドを指す。
参照:「参照」の実体、システム、量、条件のセットなどは、本明細書に記載のように試験の実体、システム、量、条件のセットなどと比較されるものである。例えば、一部の実施形態では、「参照」抗体は、本明細書に記載のように操作されていない対照抗体である。
RNAガイド:RNAガイドという用語は、本明細書に記載のタンパク質の標的核酸への標的化を促進するRNA分子を指す。例示的な「RNAガイド」又は「ガイドRNA」としては、同族のtracrRNAと組み合わせたcrRNA又はcrRNAが挙げられるが、これらに限定されない。後者は、独立したRNAであってもよく、又はリンカー(sgRNA)を使用して単一のRNAとして融合されてもよい。一部の実施形態では、RNAガイドは、化学的又は生化学的修飾を含むように操作され、一部の実施形態では、RNAガイドは、1つ以上のヌクレオチドを含み得る。
対象:「対象」という用語は、本明細書で使用される場合、診断、予後、又は療法が望まれる任意の対象を意味する。例えば、対象は、哺乳動物、例えば、ヒト又は非ヒト霊長類(類人猿、サル、オランウータン、又はチンパンジーなど)、イヌ、ネコ、モルモット、ウサギ、ラット、マウス、ウマ、ウシ(cattle)、又はウシ(cow)であり得る。
sgRNA:「sgRNA」又は「シングルガイドRNA」という用語は、(i)ガイド配列(crRNA配列)及び(ii)Cas9ヌクレアーゼ動員配列(tracrRNA)を含有するシングルガイドRNAを指す。
実質的な同一性:「実質的な同一性」という語句は、アミノ酸又は核酸配列間の比較を指すために本明細書で使用される。当業者に理解されるように、2つの配列は、概して、対応する位置に同一の残基を含有する場合、「実質的に同一」であるとみなされる。当該技術分野で周知であるように、アミノ酸又は核酸配列は、様々なアルゴリズムのうちのいずれかを使用して比較され得、それは、ヌクレオチド配列についてはBLASTN、及びアミノ酸配列についてはBLASTP、ギャップ付きBLAST、及びPSI-BLASTなどの市販のコンピュータプログラムで利用可能なものを含む。例示的なかかるプログラムは、Altschul,et al.,Basic local alignment search tool,J.Mol.Biol.,215(3):403-410,1990、Altschul,et al.,Methods in Enzymology、Altschul et al.,Nucleic Acids Res.25:3389-3402,1997、Baxevanis et al.,Bioinformatics:A Practical Guide to the Analysis of Genes and Proteins,Wiley,1998、及びMisener,et al.,(eds.),Bioinformatics Methods and Protocols(Methods in Molecular Biology,Vol.132),Humana Press,1999に記載される。同一の配列を同定することに加えて、上述のプログラムは、典型的には、同一性の程度の指標を提供する。一部の実施形態では、2つの配列が、対応する残基の少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又はそれ以上が、関連するひと続きの残基にわたって同一である場合、実質的に同一であるとみなされる。一部の実施形態では、関連するひと続きは、完全な配列である。一部の実施形態では、関連するひと続きは、少なくとも10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500又はそれ以上の残基である。
標的核酸:「標的核酸」という用語は、本明細書で使用される場合、CRISPR-Cas9システムが結合する任意の長さのヌクレオチド(オリゴヌクレオチド又はポリヌクレオチド)、デオキシリボヌクレオチド、リボヌクレオチド、又はそれらの類似体のいずれかを指す。標的核酸は、コーディング領域又は非コーディング領域を含み得る三次元構造を有し得、エクソン、イントロン、mRNA、tRNA、rRNA、siRNA、shRNA、miRNA、リボザイム、cDNA、プラスミド、ベクター、外因性配列、内因性配列を含み得る。標的核酸は、修飾されたヌクレオチド、メチル化されたヌクレオチド、又はヌクレオチド類似体を含み得る。標的核酸は、非核酸成分とともに散布されてもよい。標的核酸は、一本鎖、二本鎖、若しくは多重鎖のDNA若しくはRNA、ゲノムDNA、cDNA、DNA-RNAハイブリッド、又はプリン及びピリミジン塩基、若しくは他の天然、化学的若しくは生化学的に修飾された、非天然、若しくは誘導体化されたヌクレオチド塩基を含むポリマーであるが、これらに限定されない。
治療有効量:本明細書で使用される場合、「治療有効量」という用語は、任意の医学的治療に適用可能な妥当な利益/リスク比で治療される対象に治療効果を与える治療分子(例えば、本明細書に記載の操作された抗体)の量を指す。治療効果は、客観的であり得る(すなわち、何らかの試験又はマーカーによって測定可能である)、又は主観的であり得る(すなわち、対象が効果の指標を与えるか、又は効果を感じる)。特に、「治療有効量」とは、疾患と関連する症状を改善すること、疾患の発症を予防又は遅延させること、及び/又は疾患の症状の重症度若しくは頻度を減少させることなどによって、特定の疾患若しくは状態を治療、改善、若しくは予防するのに有効であるか、又は検出可能な治療効果若しくは予防効果を示すのに有効である治療分子又は組成物の量を指す。治療有効量は、複数の単位用量を含み得る投与レジメンで投与することができる。任意の特定の治療分子について、治療有効量(及び/又は有効な投与レジメン内の適切な単位用量)は、例えば、投与経路、他の薬剤との組み合わせに依存して変化し得る。また、任意の特定の対象に対する特定の治療有効量(及び/又は単位用量)は、治療されている障害及び障害の重症度;用いられる特定の薬剤の活性;用いられる特定の組成物;対象の年齢、体重、一般的な健康、性別及び食事;用いられる特定の治療分子の投与時間、投与経路、及び/又は排泄若しくは代謝速度;治療期間;並びに医学分野で周知の同様の因子を含む、様々な因子に依存し得る。
tracrRNA:「tracrRNA」又は「トランス活性化crRNA」という用語は、本明細書で使用される場合、CRlSPR関連タンパク質が特定された標的核酸に結合するのに必要な構造を形成する配列を含むRNAを指す。
治療:本明細書で使用される場合、「治療」(「治療する」又は「治療すること」も)という用語は、特定の疾患、障害、及び/又は状態の1つ以上の症状又は特徴の発症を部分的に又は完全に緩和、改善、軽減、阻害、遅延、それらの重症度の低減、及び/又はそれらの発生率を低減する治療分子(例えば、本明細書に記載のCRISPR-Cas治療タンパク質又はシステム)の任意の投与を指す。そのような治療は、関連する疾患、障害、及び/若しくは状態の兆候を示していない対象、並びに/又は疾患、障害、及び/若しくは状態の早期兆候のみを示している対象の治療であり得る。代替的又は追加的に、そのような治療は、関連する疾患、障害及び/又は状態の1つ以上の確立された兆候を示す対象のものであってもよい。
図面は、限定のためではなく、例示の目的のみのためである。
クラスター化され、規則的に間隔が空いている短回文反復(CRISPR)は、まず細菌及び古細菌において適応免疫系として発見され、次いで生細胞及び生物において標的化されたDNA切断を生成するように操作された。細胞DNA修復プロセス中に、様々なDNA変化を導入することができる。多様な拡張するCRISPRツールボックスは、プログラマブルゲノム編集、エピゲノム編集、及びトランスクリプトーム調節を可能にする。
CRISPR-Casシステムは、それらのCas遺伝子組織、並びに成分タンパク質の配列及び構造に基づいて、3つの主なタイプ(I、II、及びIII)を含む。3つのCRISPRシステムの各々は、独自のCas遺伝子によって特徴付けられる:Cas3、I型における標的分解ヌクレアーゼ/ヘリカーゼ、Cas9、II型におけるRNA結合及び標的分解ヌクレアーゼ、Cas10、III型における複数の機能のための大型タンパク質。3つのCRISPRタイプはまた、それらの関連するエフェクター複合体において異なる。I型Casシステムは、カスケードエフェクター複合体に関連し、II型エフェクター複合体は、単一のCas9及び1つ以上のRNA分子からなり、III型干渉複合体は、III-A型(DNAを標的とするCsm複合体)及びIII-B型(RNAを標的とするCmr複合体)に更に分割される。Casタンパク質は、全てのCRISPR-Casシステムにおけるエフェクター複合体の重要な成分である。
現在のゲノム編集技術は、クラスII CRISPR-Casシステムに焦点を当てており、これは、DNA開裂のための単一タンパク質エフェクターヌクレアーゼ、具体的には、Cas9、CRISPR RNA(crRNA)及びtracrRNAの両方を必要とする二重RNA誘導ヌクレアーゼを含有し、HNHヌクレアーゼドメイン及びRuvCヌクレアーゼドメインの両方、並びにCas12a、crRNAのみを必要とし、単一RuvCドメインを含有する単一RNA誘導ヌクレアーゼを含有する。
本発明の様々な態様は、以下のセクションで詳細に説明される。セクションの使用は、本発明を限定することを意図するものではない。各セクションは、本発明の任意の態様に適用することができる。本出願では、「又は」の使用は、別段明記されない限り、「及び/又は」を意味する。
操作された天然に存在しないCas9タンパク質
Streptococcus constellatus(ScoCas9)、Sharpea spp.分離株RUG017(SirCas9)、Veillonella parvula(VapCas9又はVpaCas9、本明細書では交換可能に使用される)、Ezakiella peruensis(EpeCas9)、Lactobacillus fermentum(LfeCas9)、及びPeptoniphilus sp.Marseille-P3761(PmaCas9)細菌から得られるWT Cas9から修飾された操作された天然に存在しないCas9タンパク質が本明細書に記載される。
Streptococcus constellatus(ScoCas9)、Sharpea spp.分離株RUG017(SirCas9)、Veillonella parvula(VapCas9又はVpaCas9、本明細書では交換可能に使用される)、Ezakiella peruensis(EpeCas9)、Lactobacillus fermentum(LfeCas9)、及びPeptoniphilus sp.Marseille-P3761(PmaCas9)細菌から得られるWT Cas9から修飾された操作された天然に存在しないCas9タンパク質が本明細書に記載される。
いくつかの実施形態では、本明細書に記載される操作された天然に存在しないCas9タンパク質は、配列番号1、4、8、14、84、又は86と少なくとも60%(例えば、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上)同一のアミノ酸配列を含む。いくつかの実施形態では、Cas9タンパク質は、配列番号1、4、8、14、84、又は86と80%同一である。いくつかの実施形態では、Cas9タンパク質のアミノ酸配列は、配列番号1、4、8、14、84、又は86と同一である。例示的なCas9アミノ酸配列は、以下の表1に提供される。
いくつかの実施形態では、Cas9タンパク質は、配列番号1、4、8、14、84、又は86を参照して1つ以上の変異を含む。例えば、Cas9タンパク質のアミノ酸配列は、配列番号1、4、8、14、84、又は86に少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個の変異を含む。様々な変異は、当該技術分野で既知であり、例えば、アミノ酸置換を含む。
いくつかの実施形態では、Cas9の2つ以上の触媒ドメイン(RuvC1、RuvCII、RuvCIII)は、核酸開裂活性を欠く不活性、又は「死んだ」Cas9(dCas9)を生成するように変異している。いくつかの実施形態では、1つ以上の変異は、PAM相互作用ドメイン、HNHドメイン、及び又はRuvCドメインにある。いくつかの実施形態では、Cas9は、DNA開裂活性を、その非変異形態に対して約25%、15%、10%、5%、1%、0.1%、0.01%以下に低減するように変異している。
いくつかの実施形態では、Cas9のニッカーゼ変異体バージョンが提供される。いくつかの実施形態では、ニッカーゼ変異体は、RuvCドメイン及び/又はHNHドメインに1つ以上のアミノ酸置換を有する。様々なニッカーゼ変異は、SpCas9(Streptococcus pyogenes)に関して既知であり、例えば、野生型SpCas9のアミノ酸位置10、12、17、762、840、854、863、982、983、984、986、987のうちの1つ以上に変異を含む。例えば、SpCas9におけるD10Aに対応するアスパラギン酸からアラニンへの置換は、ニッカーゼの生成をもたらす。いくつかの実施形態では、本明細書に記載されるCas9は、ニッカーゼの生成をもたらす1つ以上の変異を有する。いくつかの実施形態では、本明細書に記載されるCas9は、SpCas9のアミノ酸10、12、17、762、840、854、863、982、983、984、986、987のうちの1つ以上に対応するアミノ酸位置に1つ以上の変異を有する。
いくつかの実施形態では、変異は、ScoCas9のRuvCドメインにおけるアスパラギン酸からアラニンへの置換(D10A)である。いくつかの実施形態では、変異は、SirCas9のRuvCドメインにおけるアスパラギン酸からアラニンへの置換(D14A)である。いくつかの実施形態では、変異は、(例えば、SpCas9のD10Aに対応する)VapCas9のRuvCドメインにおけるアスパラギン酸からアラニンへの置換(D38A)である。いくつかの実施形態では、変異は、EpeCas9のRuvCドメインにおけるアスパラギン酸からアラニンへの置換(D12A)である。いくつかの実施形態では、変異は、LfeCas9のRuvCドメインにおけるアスパラギン酸からアラニンへの置換(D9A)である。いくつかの実施形態では、変異は、PmaCas9のRuvCドメインにおけるアスパラギン酸からアラニンへの置換(D12A)である。
いくつかの実施形態では、変異は、ScoCas9のRuvCドメインにおけるアスパラギン酸からグリシンへの置換(D10G)である。いくつかの実施形態では、変異は、SirCas9のRuvCドメインにおけるアスパラギン酸からグリシンへの置換(D14G)である。いくつかの実施形態では、変異は、(例えば、SpCas9のD10Gに対応する)VapCas9のRuvCドメインにおけるアスパラギン酸からグリシンへの置換(D38G)である。いくつかの実施形態では、変異は、EpeCas9のRuvCドメインにおけるアスパラギン酸からグリシンへの置換(D12G)である。いくつかの実施形態では、変異は、LfeCas9のRuvCドメインにおけるアスパラギン酸からグリシンへの置換(D9A)である。いくつかの実施形態では、変異は、PmaCas9のRuvCドメインにおけるアスパラギン酸からグリシンへの置換(D12G)である。
いくつかの実施形態では、本明細書に記載されるそのような1つ以上の変異は、Cas9を不活性、又はCas9の「死んだ」バージョン(dCas9)に変換する。したがって、いくつかの実施形態では、Cas9タンパク質は、DNA二本鎖の両方の鎖を開裂するCas9の能力を阻害する1つ以上の変異を含む。
いくつかの実施形態では、ガイドRNAと共発現されるとき、死んだCas9は、転写伸長、RNAポリメラーゼ結合、又は転写因子結合に特異的に干渉することができるDNA認識複合体を生成する。いくつかの実施形態では、死んだCas9は、様々な機能のエフェクタータンパク質を特定の核酸標的部位に特異的に標的化するために使用される。
いくつかの実施形態では、高忠実度Cas9バリアントは、増強された特異性を含み、これは、オフターゲット開裂を最小限に抑える。いくつかの実施形態では、操作されたバリアント、例えば、主にREC3ドメイン内の変異を含み、より高い特異性及び忠実度を達成する、「超高精度Cas9」(SpyCas9に対応するN692A、M694A、Q695A、及び/又はH698A変異)及び/又は「高忠実度Cas9」(SpyCas9に対応するN467A、R661A、Q695A、及び/又はQ926A変異)が使用される。高忠実度バリアントは、ミスマッチを安定化し、オフターゲットDNA開裂を低減するCas9の能力を低減する。いくつかの実施形態では、特異性の増加は、オンターゲット開裂の効率の約100倍の喪失を伴う。いくつかの実施形態では、野生型Cas9に相当するオンターゲット開裂率を維持する高忠実度バリアントである、SuperFi-Cas9が使用される。いくつかの実施形態では、SuperFi-Cas9は、RuvCループにおける変異を含む。いくつかの実施形態では、変異は、gRNA-TS二本鎖の後続の開裂を促進するねじれたコンフォメーションの形成を阻害する。いくつかの実施形態では、SpyCas9に対応するY1016残基、R1019残基、Y1010残基、Y1013残基、K1031残基、Q1027残基、及び/又はV1018残基は、例えば、アスパラギン酸に変異している。(Bravo,J.et al.Structural basis for mismatch surveillance by CRISPR-Cas9 Nature,603,March 2022)。
操作された天然に存在しないCas9は、配列番号2、5、9、15、85、87、95、又は96にあるCas9アミノ配列と少なくとも80%(例えば、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上)同一のアミノ酸配列を有する。
いくつかの実施形態では、操作された天然に存在しないCas9は、ヒト細胞についてコドン最適化された(例えば、発現、安定性などについてコドン最適化された)核酸分子においてコードされる。
核局在化シグナル(NLS)及びリンカーを有する例示的なCas9配列は、以下の表2に提供される。
いくつかの実施形態では、操作された天然に存在しないCas9は、タグを含む。当業者には明らかであろうように、様々なタグは、目的に応じて、Cas9バリアント(例えば、3xHAタグ)に融合し得る。
様々な種は、特定の生物におけるそのコドンについてのtRNA種の存在量と対応するmRNAにおけるコドンを利用することによって、メッセンジャーRNA(mRNA)の翻訳の効率と相関するコドンバイアス(すなわち、生物によるコドン使用の差)を示す。当該技術分野における様々な方法は、例えば、ソフトウェアの使用を通したものを含む、コンピュータ最適化のために使用することができる。いくつかの実施形態では、コドン最適化は、天然配列の少なくとも1つのコドン(例えば、1、2、3、4、5、10、15、20、25、50個以上のコドン)を、天然アミノ酸配列を維持しながら、宿主細胞の遺伝子においてより頻繁に又は最も頻繁に使用されるコドンで置換することによって、目的の宿主細胞における増強した発現のための核酸配列の修飾を指す。
いくつかの実施形態では、本明細書に記載されるCas9タンパク質は、コドン最適化される。このタイプの最適化は、当該技術分野において既知であり、同じのタンパク質をコードしながら、意図される宿主生物又は細胞のコドン選好を模倣するために、外来由来DNAの変異を伴う。よって、コドンは、変更されるが、コードされたタンパク質は、変更されないままである。コドン最適化は、所与の種において可溶性タンパク質レベルを改善し、活性及び編集効率を増加させる。コドン最適化はまた、増加した翻訳及びタンパク質発現をもたらす。
いくつかの実施形態では、Cas9タンパク質は、真核細胞における発現のためにコドン最適化される。いくつかの実施形態では、Cas9タンパク質は、ヒト細胞における発現のためにコドン最適化される。
プロトスペーサー隣接モチーフ(PAM)
各Casエンドヌクレアーゼは、非標的化、すなわち、相補的DNA鎖上の、プロトスペーサー隣接モチーフ(PAM)として知られる、特定の配列の存在下でのみ、その標的配列に結合する。異なる細菌種から単離されたCasヌクレアーゼは、異なるPAM配列を認識する。例えば、SpCas9ヌクレアーゼ(Staphylococcus pyogenes由来)は、PAM配列5’-NGG-3’の上流(「N」は、任意のヌクレオチド塩基であり得る)を切断し、SaCas9(Staphylococcus aureus由来)は、標的におけるPAM配列5’-NNGRR(N)-3’を認識する。よって、異なるCasタンパク質によって標的化することができるゲノムにおける位置は、独自のPAM配列の位置によって限定される。
各Casエンドヌクレアーゼは、非標的化、すなわち、相補的DNA鎖上の、プロトスペーサー隣接モチーフ(PAM)として知られる、特定の配列の存在下でのみ、その標的配列に結合する。異なる細菌種から単離されたCasヌクレアーゼは、異なるPAM配列を認識する。例えば、SpCas9ヌクレアーゼ(Staphylococcus pyogenes由来)は、PAM配列5’-NGG-3’の上流(「N」は、任意のヌクレオチド塩基であり得る)を切断し、SaCas9(Staphylococcus aureus由来)は、標的におけるPAM配列5’-NNGRR(N)-3’を認識する。よって、異なるCasタンパク質によって標的化することができるゲノムにおける位置は、独自のPAM配列の位置によって限定される。
Streptococcus constellatus及びEzakiella peruensis及びPeptoniphilus sp.Marseille-P3761種から操作された本明細書に開示されるCas9タンパク質は、コンセンサスPAM配列5’-NGG-3’を認識する。Streptococcus constellatus及びEzakiella peruensis及びPeptoniphilus sp.Marseille-P3761種から操作された本明細書に開示されるCas9タンパク質は、コンセンサスPAM配列5’-NGG-3’を認識する。いくつかの実施形態では、本明細書に開示されるCas9タンパク質は、コンセンサスPAM配列5’-NGC-3’を認識するように操作される。例示的な実施形態は、以下に記載され、非限定的であるべきである。いくつかの実施形態では、Streptococcus constellatusからのCas9タンパク質は、コンセンサスPAM配列5’-NGC-3’を認識するように操作される。いくつかの実施形態では、NGC PAMバリアントは、ScoCas9(配列番号1)を参照して、D1117M、S118Q、E1201F、A1299R、D1309A、R1312E、及びT1314R(総称して「MQFRAER」)から選択されるか、又はこれらに対応する1つ以上のアミノ酸置換を含む。いくつかの実施形態では、NGC PAMバリアントは、天然に存在するSpyCas9(配列番号173)を参照して、D1135M、S1136Q、G1218K、E1219F、A1322R、D1332A、R1335E、及びT1337R(総称して「MQKFRAER」)から選択されるか、又はこれらに対応する1つ以上のアミノ酸置換を含む。いくつかの実施形態では、類似又は対応するアミノ酸置換は、SirCas9、VapCas9、EpeCas9、LfeCas9、又はPmaCas9に対して行うことができる。
Streptococcus pyogenes Cas9(SpyCas9、GenBank:QSG91308.1)
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(配列番号173)。
MDKKYSIGLDIGTNSVGWAVITDDYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(配列番号173)。
いくつかの実施形態では、本明細書に記載されるCas9タンパク質は、任意の他のPAM配列に結合しないか、又はそれとの活性を示さない。
RNAガイド
RNAガイドは、標的配列との相補性を有するポリヌクレオチド配列を含む。RNAガイドは、標的核酸配列とハイブリダイズし、CRISPR複合体の標的核酸への配列特異的結合を指向する。一部の実施形態では、RNAガイドは、標的核酸配列に対して50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、又は100%の相補性を有する。
RNAガイドは、標的配列との相補性を有するポリヌクレオチド配列を含む。RNAガイドは、標的核酸配列とハイブリダイズし、CRISPR複合体の標的核酸への配列特異的結合を指向する。一部の実施形態では、RNAガイドは、標的核酸配列に対して50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、又は100%の相補性を有する。
いくつかの実施形態では、RNAガイドは、約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75以上のヌクレオチド長である。いくつかの実施形態では、RNAガイドは、約18~24ヌクレオチド長である。いくつかの実施形態では、RNAガイドは、標的核酸配列における約18~24ヌクレオチドに相補的である。例えば、RNAガイドは、標的核酸配列における約18、19、20、21、22、23、又は24ヌクレオチドに相補的である。いくつかの実施形態では、RNAガイドは、約18~22ヌクレオチドに相補的である。いくつかの実施形態では、RNAガイドは、約18~21ヌクレオチドに相補的である。いくつかの実施形態では、RNAガイドは、約18~20ヌクレオチドに相補的である。いくつかの実施形態では、RNAガイドは、標的核酸配列における20ヌクレオチドに相補的である。
RNAガイドは、任意の標的配列を標的化するように設計することができる。最適なアラインメントは、Needleman-Wunschアルゴリズム、Smith-Watermanアルゴリズム、Burrows-Wheelerアルゴリズム、ClustlW、ClustlX、BLAST、Novoalign、SOAP、Maq及びELANDを含む配列をアラインメントするための任意のアルゴリズムを使用して決定される。
いくつかの実施形態では、RNAガイドは、細胞のゲノム内の独自の標的配列に標的化される。いくつかの実施形態では、RNAガイドは、PAM配列を欠くように設計される。いくつかの実施形態では、RNAガイド配列は、mFold又はGeneiousを含む折り畳みアルゴリズムを使用した最適な二次構造を有するように設計される。いくつかの実施形態では、RNAガイドの発現は、誘導性プロモーター、例えば、ホルモン誘導性、テトラサイクリン若しくはドキシサイクリン誘導性、アラビノース誘導性、又は光誘導性の下であり得る。
いくつかの実施形態では、CRISPRシステムは、1つ以上のRNAガイド、例えば、crRNA、tracrRNA、及び/又はsgRNAを含む。したがって、いくつかの実施形態では、RNAガイドは、crRNAを含む。いくつかの実施形態では、RNAガイドは、tracrRNAを含む。いくつかの実施形態では、RNAガイドは、sgRNAを含む。いくつかの実施形態では、CRISPRシステムは、1、2、3、4、5、6、7、8、9、10、15個以上のRNAガイドを含む、複数のRNAガイドを含む。
いくつかの実施形態では、RNAガイドは、crRNAを含む。いくつかの実施形態では、CRISPRシステムは、2~15個のcrRNAを含む複数のcrRNAを含む。いくつかの実施形態では、crRNAは、直接反復配列、スペーサー配列、及び直接反復配列を含む、前駆体crRNA(pre-crRNA)である。いくつかの実施形態では、crRNAは、切断された直接反復配列を含む、処理された又は成熟したcrRNAである。
いくつかの実施形態では、CRISPR関連タンパク質は、pre-crRNAを開裂して、処理された又は成熟したcrRNAを形成する。
いくつかの実施形態では、CRISPR関連タンパク質は、成熟crRNAと複合体を形成し、スペーサー配列は、複合体を標的核酸における相補的配列に標的化する。いくつかの実施形態では、RNAガイドは、適切な条件下で標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む。
いくつかの実施形態では、crRNAのスペーサー長は、約15~50ヌクレオチドの範囲であり得る。いくつかの実施形態では、RNAガイドのスペーサー長は、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。いくつかの実施形態では、スペーサー長は、15~17ヌクレオチド(例えば、15、16、又は17ヌクレオチド)、17~20ヌクレオチド(例えば、17、18、19、又は20ヌクレオチド)、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド(例えば、45、46、47、48、49、又は50ヌクレオチド)以上である。
いくつかの実施形態では、RNAガイドは、約16~26ヌクレオチド長の直接反復(DR)配列を含む。例えば、いくつかの実施形態では、DRは、約16ヌクレオチド長である。いくつかの実施形態では、DRは、約17ヌクレオチド長である。いくつかの実施形態では、DRは、約18ヌクレオチド長である。いくつかの実施形態では、DRは、約19ヌクレオチド長である。いくつかの実施形態では、DRは、約20ヌクレオチド長である。いくつかの実施形態では、DRは、約21ヌクレオチド長である。いくつかの実施形態では、DRは、約22ヌクレオチド長である。いくつかの実施形態では、DRは、約23ヌクレオチド長である。いくつかの実施形態では、DRは、約24ヌクレオチド長である。いくつかの実施形態では、DRは、約25ヌクレオチド長である。いくつかの実施形態では、DRは、約26ヌクレオチド長である。
いくつかの実施形態では、crRNAは、ヌクレオチドガイド配列及びDR配列を含む。ヌクレオチドガイド配列は、約18~24ヌクレオチド長であり得る。したがって、いくつかの実施形態では、ヌクレオチドガイド配列は、約18ヌクレオチド長である。いくつかの実施形態では、ヌクレオチドガイド配列は、約19ヌクレオチド長である。いくつかの実施形態では、ヌクレオチドガイド配列は、約20ヌクレオチド長である。いくつかの実施形態では、ヌクレオチドガイド配列は、約21ヌクレオチド長である。いくつかの実施形態では、ヌクレオチドガイド配列は、約22ヌクレオチド長である。いくつかの実施形態では、crRNAは、約22ヌクレオチド長のヌクレオチドガイド配列及び約22ヌクレオチド長の直接反復を含む。
いくつかの実施形態では、crRNA配列は、CRISPR関連タンパク質と複合体を形成し、いずれの実質的なヌクレアーゼ活性もなしに特定の標的に結合することができる「死んだcrRNA」、「死んだガイド」、又は「死んだガイド配列」に修飾され得る。
いくつかの実施形態では、crRNAは、糖リン酸塩骨格又は塩基において化学修飾され得る。いくつかの実施形態では、crRNAは、ヌクレアーゼ耐性又は塩基対形成を改善するために2’O-メチル、2’-F、又はロックド核酸を使用して修飾され得る。いくつかの実施形態では、crRNAは、2-チオウリジエン又はN6-メチルアデノシンなどの修飾された塩基を含有し得る。
いくつかの実施形態では、crRNAは、他のオリゴヌクレオチド、ペプチド、タンパク質、タグ、色素、又はポリエチレングリコールとコンジュゲートされる。
いくつかの実施形態では、crRNAは、三次元構造に起因して特定の標的分子に結合することができるアプタマー又はリボスイッチ配列を含み得る。
いくつかの実施形態では、トランス活性化RNA(tracrRNA)は、Cas9タンパク質との複合体の形成を促進するために、crRNAと会合される。いくつかの実施形態では、tracrRNAは、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80、90、100個以上のヌクレオチドの長さ以上である。いくつかの実施形態では、tracrRNAは、約70ヌクレオチド長である。
いくつかの実施形態では、tracrRNA及びcrRNAは、シングルガイドRNA(sgRNA)と呼ばれる単一転写物に含有される。いくつかの実施形態では、sgRNAは、tracrRNAとsgRNAとの間にループを含む。
一部の実施形態では、ループ形成配列は、3、4、5又はそれ以上のヌクレオチド長である。いくつかの実施形態では、ループは、配列GAAA、AAAG、CAAA、AAAC、UUUU、UUAUAU、UUA、UUU、及び/又はAAUCAを有する。いくつかの実施形態では、ループは、配列GAAAを有する。いくつかの実施形態では、ループは、配列AAAGを有する。いくつかの実施形態では、ループは、配列CAAAを有する。いくつかの実施形態では、ループは、配列AAACを有する。いくつかの実施形態では、ループは、配列AAUCAを有する。いくつかの実施形態では、ループは、配列UUUUを有する。いくつかの実施形態では、ループは、配列UUAUAUを有する。いくつかの実施形態では、ループは、配列UUAを有する。いくつかの実施形態では、ループは、配列UUUを有する。いくつかの実施形態では、ループは、配列AAUCAを有する。
いくつかの実施形態では、tracrRNA及びcrRNAは、ヘアピンループを形成する。いくつかの実施形態では、sgRNAは、少なくとも2つ以上のヘアピンを有する。いくつかの実施形態では、sgRNAは、2、3、4、又は5つのヘアピンを有する。
いくつかの実施形態では、sgRNAは、6ヌクレオチドを含むポリT配列を含む、転写終結配列を含む。
いくつかの実施形態では、sgRNAは、ScoCas9について5’-GUUUUAGAGCUGUGCUGUUUAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACUC(配列番号3)、
SirCas9について5’-GUUUUAGAGUUGUGUUAUUGAAAAAUAACACAACGAGUUAAAAUAAAGCUUAUGCUUAAAUGCCAGCUUUGCUGGUGUCAUUUAGAUGACUUUACUAAGGUUGCUUCGGCAACCUUUUU-3’(配列番号7)、
VapCas9について5’-GUUUGAGAGUAGUGUGAAAACAUUACGAGUUCAAAUACAAAUUAAUUUACAAUGCCUUCGGGCUGCCCGACGUAGGGCACCUACUCUCAAUUCUUCGGAAUUGAGUU-3’(配列番号13)、
EpeCas9について5’-GUUUGAGAGUUAUGUAAUUGAAAAAUUACAUGACGAGUUCAAAUAAAAAUUUAUUCAAACCGCCUAUUUAUAGGCCGCAGAUGUUCUGCAUUAUGCUUGCUAUUGCAAGCUU-3’(配列番号19)、
LfeCas9について5’-GUCUUGGAUGAGUGUGAAAACACUCAUAGUCAAGAUCAAACGAGUGGUUUUCCACGAGUUAUUACUUUUGAGGUCUUAUAUGGCCCAUACAUAAAAAGGAGUCGGAAUUUCCGGCUCCUUUUCUU-3’(配列番号95)、及び
PmaCas9について5’-GUUUUAGAGCCAUGUAGAAAUACAUUGCAAGUUAAAAUAAGGCUUUGUCCGUAAUCAACUUGAAAAAGUGGCGCUGUUUCGGCGCUUU-3’(配列番号96)と少なくとも80%の同一性を有する配列を含む。
SirCas9について5’-GUUUUAGAGUUGUGUUAUUGAAAAAUAACACAACGAGUUAAAAUAAAGCUUAUGCUUAAAUGCCAGCUUUGCUGGUGUCAUUUAGAUGACUUUACUAAGGUUGCUUCGGCAACCUUUUU-3’(配列番号7)、
VapCas9について5’-GUUUGAGAGUAGUGUGAAAACAUUACGAGUUCAAAUACAAAUUAAUUUACAAUGCCUUCGGGCUGCCCGACGUAGGGCACCUACUCUCAAUUCUUCGGAAUUGAGUU-3’(配列番号13)、
EpeCas9について5’-GUUUGAGAGUUAUGUAAUUGAAAAAUUACAUGACGAGUUCAAAUAAAAAUUUAUUCAAACCGCCUAUUUAUAGGCCGCAGAUGUUCUGCAUUAUGCUUGCUAUUGCAAGCUU-3’(配列番号19)、
LfeCas9について5’-GUCUUGGAUGAGUGUGAAAACACUCAUAGUCAAGAUCAAACGAGUGGUUUUCCACGAGUUAUUACUUUUGAGGUCUUAUAUGGCCCAUACAUAAAAAGGAGUCGGAAUUUCCGGCUCCUUUUCUU-3’(配列番号95)、及び
PmaCas9について5’-GUUUUAGAGCCAUGUAGAAAUACAUUGCAAGUUAAAAUAAGGCUUUGUCCGUAAUCAACUUGAAAAAGUGGCGCUGUUUCGGCGCUUU-3’(配列番号96)と少なくとも80%の同一性を有する配列を含む。
ガイドRNAは、Cas9の5’末端に付加される。いくつかの実施形態では、sgRNAは、配列番号3、7、13、19、95、又は96と約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の同一性を有する配列を含む。いくつかの実施形態では、sgRNAは、配列番号3、7、13、19、95、又は96と同一の配列を含む。
いくつかの実施形態では、tracrRNAは、別個の転写物であり、同じ転写物にcrRNA配列で含有されない。
Cas9融合タンパク質
いくつかの実施形態では、Cas9酵素は、1つ以上の異種タンパク質ドメインに融合している。いくつかの実施形態では、Cas9酵素は、約1、2、3、4、5、6、7、8、9、10個以上のタンパク質ドメインに融合している。いくつかの実施形態では、異種タンパク質ドメインは、Cas9酵素のC末端に融合している。いくつかの実施形態では、異種タンパク質ドメインは、Cas9酵素のN末端に融合している。いくつかの実施形態では、異種タンパク質ドメインは、Cas9酵素のC末端とN末端との間で、内部融合している。いくつかの実施形態では、内部融合は、Cas9 RuvCI、RuvC II、RuvCIII、HNH、REC I、又はPAM相互作用ドメイン内で行われる。
いくつかの実施形態では、Cas9酵素は、1つ以上の異種タンパク質ドメインに融合している。いくつかの実施形態では、Cas9酵素は、約1、2、3、4、5、6、7、8、9、10個以上のタンパク質ドメインに融合している。いくつかの実施形態では、異種タンパク質ドメインは、Cas9酵素のC末端に融合している。いくつかの実施形態では、異種タンパク質ドメインは、Cas9酵素のN末端に融合している。いくつかの実施形態では、異種タンパク質ドメインは、Cas9酵素のC末端とN末端との間で、内部融合している。いくつかの実施形態では、内部融合は、Cas9 RuvCI、RuvC II、RuvCIII、HNH、REC I、又はPAM相互作用ドメイン内で行われる。
Cas9タンパク質は、別のタンパク質ドメインに直接的又は間接的に結合し得る。いくつかの実施形態では、好適なCRISPRシステムは、Cas9タンパク質及び異種タンパク質を結合するリンカー又はスペーサーを含有する。アミノ酸リンカー又はスペーサーは、一般に、可撓性であるように、又はアルファ-ヘリックスなどの構造を、2つのタンパク質部分の間に介在させるように設計される。リンカー又はスペーサーは、比較的短い場合があるか、又はより長い場合がある。典型的には、リンカー又はスペーサーは、例えば、1~100(例えば、1~100、5~100、10~100、20~100、30~100、40~100、50~100、60~100、70~100、80~100、90~100、5~55、10~50、10~45、10~40、10~35、10~30、10~25、10~20)アミノ酸長を含有する。いくつかの実施形態では、リンカー又はスペーサーは、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、又は100アミノ酸長以上である。典型的には、より長いリンカーは、立体障害を減少させ得る。いくつかの実施形態では、リンカーは、グリシン残基及びセリン残基の混合物を含むであろう。いくつかの実施形態では、リンカーは、スレオニン残基、プロリン残基、及び/又はアラニン残基を更に含み得る。
いくつかの実施形態では、Cas9タンパク質は、酵素活性、エピジェネティック修飾活性、RNA開裂活性、核酸結合活性、転写調節活性を有する細胞局在化シグナル、エピトープタグ、レポーター遺伝子、及びタンパク質ドメインに融合している。いくつかの実施形態では、Cas9タンパク質は、核局在化配列(NLS)、FLAGタグ、HISタグ、及び/又はHAタグに融合している。
好適な融合パートナーとしては、これらに限定されないが、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、又はヌクレアーゼ活性を提供するポリペプチドが挙げられ、これらのいずれかは、DNA又はDNA関連ポリペプチド(例えば、ヒストン又はDNA結合タンパク質)を修飾することができる。いくつかの実施形態では、Cas9タンパク質は、ヒストンデメチラーゼ、転写アクチベーター、又はデアミナーゼに融合している。
更なる好適な融合パートナーとしては、これらに限定されないが、境界エレメント(例えば、CTCF)、末梢動員を提供するタンパク質及びその断片(例えば、Lamin A、Lamin Bなど)、並びにタンパク質ドッキングエレメント(例えば、FKBP/FRB、Pill/Abylなど)が挙げられる。
特定の実施形態では、Cas9は、例えば、塩基編集における使用のために、シチジンデアミナーゼドメイン又はアデノシンデアミナーゼドメインに融合している。いくつかの実施形態では、Cas9は、アデニン及びシトシン塩基エディター(ACBE又はCABE)に融合しており、ACBE又はCABEは、TadAのヘテロ二量体及び活性化誘導シチジンデアミナーゼ(AID)をCas9ニッカーゼ(nCas9)のN末端及びC末端に融合することによって生成される。いくつかの実施形態では、ACBE又はCABEは、同じ標的部位でCからTへの及びAからGへの塩基編集を同時に誘導する。Xie,J et al.ACBE,a new base editor for simultaneous C-to-T and A-to-G substitutions in mammalian systems.BMC Biology(18:131),2020)
いくつかの実施形態では、「シチジンデアミナーゼ」及び「シトシンデアミナーゼ」という用語は、交換可能に使用することができる。特定の実施形態では、シチジンデアミナーゼドメインは、本明細書に記載される任意のシチジンデアミナーゼと70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を有し得る。いくつかの実施形態では、シチジンデアミナーゼドメインは、シチジンデアミナーゼ活性を有する(例えば、CをUに変換する)。特定の実施形態では、アデノシンデアミナーゼドメインは、本明細書に記載される任意のアデノシンデアミナーゼと70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%以上の配列同一性を有し得る。いくつかの実施形態では、アデノシンデアミナーゼドメインは、アデノシンデアミナーゼ活性を有する(例えば、AをIに変換する)。いくつかの実施形態では、「アデノシンデアミナーゼ」及び「アデニンデアミナーゼ」という用語は、交換可能に使用することができる。
いくつかの実施形態では、シチジンデアミナーゼは、アポリポタンパク質B mRNA編集複合体(APOBEC)ファミリーデアミナーゼの全部又は一部を含むことができる。APOBECは進化的に保存されたシチジンデアミナーゼのファミリーである。このファミリーのメンバーは、CからUの編集酵素である。APOBEC様タンパク質のN末端ドメインは、触媒ドメインであり、C末端ドメインは、偽触媒ドメインである。より具体的には、触媒ドメインは、亜鉛依存性シチジンデアミナーゼドメインであり、シチジンの脱アミノ化に重要である。APOBECファミリーメンバーには、APOBEC1、APOBEC2、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D(「APOBEC3E」は現在これを指す)、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、及び活性化誘導(シチジン又はシトシン)デアミナーゼが含まれる。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC1デアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC2デアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC3デアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC3Aデアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC3Bデアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC3Cデアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC3Dデアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC3Eデアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC3Fデアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC3Gデアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC3Hデアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、APOBEC4デアミナーゼの全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、活性化誘導デアミナーゼ(AID)の全部又は一部を含む。いくつかの実施形態では、融合タンパク質に組み込まれるデアミナーゼは、シチジンデアミナーゼ1(CDA1)の全部又は一部を含む。融合タンパク質は、任意の好適な生物(例えば、ヒト又はラット)由来のデアミナーゼを含み得ることを理解されたい。いくつかの実施形態では、融合タンパク質のデアミナーゼドメインは、ヒト、チンパンジー、ゴリラ、サル、ウシ、イヌ、ラット、又はマウス由来である。いくつかの実施形態では、融合タンパク質のデアミナーゼドメインは、ラット(例えば、ラットAPOBEC1)に由来する。いくつかの実施形態では、デアミナーゼドメインは、ヒトAPOBEC1である。いくつかの実施形態では、デアミナーゼドメインは、pmCDA1である。例示的なシチジンデアミナーゼの配列は、以下に提供される。
pmCDA1(Petromyzon marinus)
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV(配列番号22)
ヒトAID:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKAPV(配列番号23)
ヒトAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)(配列番号24)
マウスAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)(配列番号25)
イヌAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)(配列番号26)
ウシAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)(配列番号27)
ラットAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)
clAID(Canis lupus familiaris):
MDSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFAARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENREKTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL(配列番号29)
btAID(Bos taurus):
MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL(配列番号30)
mAID(Mus musculus):
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL(配列番号31)
rAPOBEC-1(Rattus norvegicus):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(配列番号32)
maAPOBEC-1(Mesocricetus auratus):
MSSETGPVVVDPTLRRRIEPHEFDAFFDQGELRKETCLLYEIRWGGRHNIWRHTGQNTSRHVEINFIEKFTSERYFYPSTRCSIVWFLSWSPCGECSKAITEFLSGHPNVTLFIYAARLYHHTDQRNRQGLRDLISRGVTIRIMTEQEYCYCWRNFVNYPPSNEVYWPRYPNLWMRLYALELYCIHLGLPPCLKIKRRHQYPLTFFRLNLQSCHYQRIPPHILWATGFI(配列番号33)
ppAPOBEC-1(Pongo pygmaeus):
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR(配列番号34)
ocAPOBEC1(Oryctolagus cuniculus):
MASEKGPSNKDYTLRRRIEPWEFEVFFDPQELRKEACLLYEIKWGASSKTWRSSGKNTTNHVEVNFLEKLTSEGRLGPSTCCSITWFLSWSPCWECSMAIREFLSQHPGVTLIIFVARLFQHMDRRNRQGLKDLVTSGVTVRVMSVSEYCYCWENFVNYPPGKAAQWPRYPPRWMLMYALELYCIILGLPPCLKISRRHQKQLTFFSLTPQYCHYKMIPPYILLATGLLQPSVPWR(配列番号35)
mdAPOBEC-1(Monodelphis domestica):
MNSKTGPSVGDATLRRRIKPWEFVAFFNPQELRKETCLLYEIKWGNQNIWRHSNQNTSQHAEINFMEKFTAERHFNSSVRCSITWFLSWSPCWECSKAIRKFLDHYPNVTLAIFISRLYWHMDQQHRQGLKELVHSGVTIQIMSYSEYHYCWRNFVDYPQGEEDYWPKYPYLWIMLYVLELHCIILGLPPCLKISGSHSNQLALFSLDLQDCHYQKIPYNVLVATGLVQPFVTWR(配列番号36)
ppAPOBEC-2(Pongo pygmaeus):
MAQKEEAAAATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEELEIQDALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK(配列番号37)
btAPOBEC-2(Bos taurus):
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(配列番号38)
mAPOBEC-3-(1)(Mus musculus):
MQPQRLGPRAGMGPFCLGCSHRKCYSPIRNLISQETFKFHFKNLGYAKGRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQIVRFLATHHNLSLDIFSSRLYNVQDPETQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKRLLTNFRYQDSKLQEILRPCYISVPSSSSSTLSNICLTKGLPETRFWVEGRRMDPLSEEEFYSQFYNQRVKHLCYYHRMKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVTITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLRRIKESWGLQDLVNDFGNLQLGPPMS(配列番号39)
マウスAPOBEC-3-(2):
(斜体:核酸編集ドメイン)(配列番号40)
ラットAPOBEC-3:
(斜体:核酸編集ドメイン)(配列番号41)
hAPOBEC-3A(Homo sapiens):
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN(配列番号42)
hAPOBEC-3F(Homo sapiens):
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPRLDAKIFRGQVYSQPEHHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHHSPVSWKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIMGYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE(配列番号43)
アカゲザルAPOBEC-3G:
(斜体:核酸編集ドメイン、下線:細胞質局在化シグナル)(配列番号44)
チンパンジーAPOBEC-3G:
(斜体:核酸編集ドメイン、下線:細胞質局在化シグナル)
ミドリザルAPOBEC-3G:
(斜体:核酸編集ドメイン、下線:細胞質局在化シグナル)
ヒトAPOBEC-3G:
(斜体:核酸編集ドメイン、下線:細胞質局在化シグナル)
ヒトAPOBEC-3F:
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3B:
(斜体:核酸編集ドメイン)
ラットAPOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL(配列番号50)
ウシAPOBEC-3B:
MDGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI(配列番号51)
チンパンジーAPOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG(配列番号52)
ヒトAPOBEC-3C:
(斜体:核酸編集ドメイン)
ゴリラAPOBEC-3C
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3A:
(斜体:核酸編集ドメイン)
アカゲザルAPOBEC-3A:
(斜体:核酸編集ドメイン)
ウシAPOBEC-3A:
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3H:
(斜体:核酸編集ドメイン)
アカゲザルAPOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR(配列番号59)
ヒトAPOBEC-3D:
(配列番号60)
(斜体:核酸編集ドメイン)
ヒトAPOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR(配列番号61)
マウスAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK(配列番号62)
ラットAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(配列番号63)
ヒトAPOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK(配列番号64)
マウスAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(配列番号65)
ラットAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(配列番号66)
ウシAPOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(配列番号67)
Petromyzon marinus CDA1(pmCDAl):
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQ LNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV(配列番号68)
ヒトAPOBEC3G D316R D317R:
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKFNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN(配列番号69)
ヒトAPOBEC3G A鎖:
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLD EHSQDLSGRLRAILQ(配列番号70)
ヒトAPOBEC3G A鎖 D120R D121R:
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ(配列番号71)
hAPOBEC-4(Homo sapiens):
MEPIYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTFPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYSNNSPCNEANHCCISKMYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFISGVSGSHVFQPILTGRALADRHNAYEINAITGVKPYFTDVLLQTKRNPNTKAQEALESYPLNNAFPGQFFQMPSGQLQPNLPPDLRAPVVFVLVPLRDLPPMHMGQNPNKPRNIVRHLNMPQMSFQETKDLGRLPTGRSVEIVEITEQFASSKEADEKKKKKGKK(配列番号72)
mAPOBEC-4(Mus musculus):
MDSLLMKQKKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSCSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVAEFLRWNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIGIMTFKDYFYCWNTFVENRERTFKAWEGLHENSVRLTRQLRRILLPLYEVDDLRDAFRMLGF(配列番号73)
rAPOBEC-4(Rattus norvegicus):
MEPLYEEYLTHSGTIVKPYYWLSVSLNCTNCPYHIRTGEEARVPYTEFHQTFGFPWSTYPQTKHLTFYELRSSSGNLIQKGLASNCTGSHTHPESMLFERDGYLDSLIFHDSNIRHIILYSNNSPCDEANHCCISKMYNFLMNYPEVTLSVFFSQLYHTENQFPTSAWNREALRGLASLWPQVTLSAISGGIWQSILETFVSGISEGLTAVRPFTAGRTLTDRYNAYEINCITEVKPYFTDALHSWQKENQDQKVWAASENQPLHNTTPAQWQPDMSQDCRTPAVFMLVPYRDLPPIHVNPSPQKPRTVVRHLNTLQLSASKVKALRKSPSGRPVKKEEARKGSTRSQEANETNKSKWKKQTLFIKSNICHLLEREQKKIGILSSWSV(配列番号74)
mfAPOBEC-4(Macaca fascicularis):
MEPTYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTYPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYCNNSPCNEANHCCISKVYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFVSGVSGSHVFQPILTGRALTDRYNAYEINAITGVKPFFTDVLLHTKRNPNTKAQMALESYPLNNAFPGQSFQMTSGIPPDLRAPVVFVLLPLRDLPPMHMGQDPNKPRNIIRHLNMPQMSFQETKDLERLPTRRSVETVEITERFASSKQAEEKTKKKKGKK(配列番号75)
pmCDA-1(Petromyzon marinus):
MAGYECVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLTMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGIPLHLFTLQTPLLSGRVVWWRV(配列番号76)
pmCDA-2(Petromyzon marinus):
MELREVVDCALASCVRHEPLSRVAFLRCFAAPSQKPRGTVILFYVEGAGRGVTGGHAVNYNKQGTSIHAEVLLLSAVRAALLRRRRCEDGEEATRGCTLHCYSTYSPCRDCVEYIQEFGASTGVRVVIHCCRLYELDVNRRRSEAEGVLRSLSRLGRDFRLMGPRDAIALLLGGRLANTADGESGASGNAWVTETNVVEPLVDMTGFGDEDLHAQVQRNKQIREAYANYASAVSLMLGELHVDPDKFPFLAEFLAQTSVEPSGTPRETRGRPRGASSRGPEIGRQRPADFERALGAYGLFLHPRIVSREADREEIKRDLIVVMRKHNYQGP(配列番号77)
pmCDA-5(Petromyzon marinus):
MAGDENVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLMMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGMPLHLFT(配列番号78)
yCD(Saccharomyces cerevisiae):
MVTGGMASKWDQKGMDIAYEEAALGYKEGGVPIGGCLINNKDGSVLGRGHNMRFQKGSATLHGEISTLENCGRLEGKVYKDTTLYTTLSPCDMCTGAIIMYGIPRCVVGENVNFKSKGEKYLQTRGHEVVVVDDERCKKIMKQFIDERPQDWFEDIGE(配列番号79)
rAPOBEC-1(Δ177-186):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(配列番号80)
rAPOBEC-1(Δ202-213):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQHYQRLPPHILWATGLK(配列番号81)
マウスAPOBEC-3:
(斜体:核酸編集ドメイン)
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQLNENRWLEKTLKRAEKRRSELSIMIQVKILHTTKSPAV(配列番号22)
ヒトAID:
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKAPV(配列番号23)
ヒトAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)(配列番号24)
マウスAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)(配列番号25)
イヌAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)(配列番号26)
ウシAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)(配列番号27)
ラットAID:
(下線:核局在化配列、二重下線:核外輸送シグナル)
clAID(Canis lupus familiaris):
MDSLLMKQRKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSFSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFAARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENREKTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL(配列番号29)
btAID(Bos taurus):
MDSLLKKQRQFLYQFKNVRWAKGRHETYLCYVVKRRDSPTSFSLDFGHLRNKAGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGYPNLSLRIFTARLYFCDKERKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL(配列番号30)
mAID(Mus musculus):
MDSLLMNRRKFLYQFKNVRWAKGRRETYLCYVVKRRDSATSFSLDFGYLRNKNGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVADFLRGNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIAIMTFKDYFYCWNTFVENHERTFKAWEGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL(配列番号31)
rAPOBEC-1(Rattus norvegicus):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(配列番号32)
maAPOBEC-1(Mesocricetus auratus):
MSSETGPVVVDPTLRRRIEPHEFDAFFDQGELRKETCLLYEIRWGGRHNIWRHTGQNTSRHVEINFIEKFTSERYFYPSTRCSIVWFLSWSPCGECSKAITEFLSGHPNVTLFIYAARLYHHTDQRNRQGLRDLISRGVTIRIMTEQEYCYCWRNFVNYPPSNEVYWPRYPNLWMRLYALELYCIHLGLPPCLKIKRRHQYPLTFFRLNLQSCHYQRIPPHILWATGFI(配列番号33)
ppAPOBEC-1(Pongo pygmaeus):
MTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWR(配列番号34)
ocAPOBEC1(Oryctolagus cuniculus):
MASEKGPSNKDYTLRRRIEPWEFEVFFDPQELRKEACLLYEIKWGASSKTWRSSGKNTTNHVEVNFLEKLTSEGRLGPSTCCSITWFLSWSPCWECSMAIREFLSQHPGVTLIIFVARLFQHMDRRNRQGLKDLVTSGVTVRVMSVSEYCYCWENFVNYPPGKAAQWPRYPPRWMLMYALELYCIILGLPPCLKISRRHQKQLTFFSLTPQYCHYKMIPPYILLATGLLQPSVPWR(配列番号35)
mdAPOBEC-1(Monodelphis domestica):
MNSKTGPSVGDATLRRRIKPWEFVAFFNPQELRKETCLLYEIKWGNQNIWRHSNQNTSQHAEINFMEKFTAERHFNSSVRCSITWFLSWSPCWECSKAIRKFLDHYPNVTLAIFISRLYWHMDQQHRQGLKELVHSGVTIQIMSYSEYHYCWRNFVDYPQGEEDYWPKYPYLWIMLYVLELHCIILGLPPCLKISGSHSNQLALFSLDLQDCHYQKIPYNVLVATGLVQPFVTWR(配列番号36)
ppAPOBEC-2(Pongo pygmaeus):
MAQKEEAAAATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEELEIQDALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK(配列番号37)
btAPOBEC-2(Bos taurus):
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(配列番号38)
mAPOBEC-3-(1)(Mus musculus):
MQPQRLGPRAGMGPFCLGCSHRKCYSPIRNLISQETFKFHFKNLGYAKGRKDTFLCYEVTRKDCDSPVSLHHGVFKNKDNIHAEICFLYWFHDKVLKVLSPREEFKITWYMSWSPCFECAEQIVRFLATHHNLSLDIFSSRLYNVQDPETQQNLCRLVQEGAQVAAMDLYEFKKCWKKFVDNGGRRFRPWKRLLTNFRYQDSKLQEILRPCYISVPSSSSSTLSNICLTKGLPETRFWVEGRRMDPLSEEEFYSQFYNQRVKHLCYYHRMKPYLCYQLEQFNGQAPLKGCLLSEKGKQHAEILFLDKIRSMELSQVTITCYLTWSPCPNCAWQLAAFKRDRPDLILHIYTSRLYFHWKRPFQKGLCSLWQSGILVDVMDLPQFTDCWTNFVNPKRPFWPWKGLEIISRRTQRRLRRIKESWGLQDLVNDFGNLQLGPPMS(配列番号39)
マウスAPOBEC-3-(2):
(斜体:核酸編集ドメイン)(配列番号40)
ラットAPOBEC-3:
(斜体:核酸編集ドメイン)(配列番号41)
hAPOBEC-3A(Homo sapiens):
MEASPASGPRHLMDPHIFTSNFNNGIGRHKTYLCYEVERLDNGTSVKMDQHRGFLHNQAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGEVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFKHCWDTFVDHQGCPFQPWDGLDEHSQALSGRLRAILQNQGN(配列番号42)
hAPOBEC-3F(Homo sapiens):
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPRLDAKIFRGQVYSQPEHHAEMCFLSWFCGNQLPAYKCFQITWFVSWTPCPDCVAKLAEFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYSEGQPFMPWYKFDDNYAFLHRTLKEILRNPMEAMYPHIFYFHFKNLRKAYGRNESWLCFTMEVVKHHSPVSWKRGVFRNQVDPETHCHAERCFLSWFCDDILSPNTNYEVTWYTSWSPCPECAGEVAEFLARHSNVNLTIFTARLYYFWDTDYQEGLRSLSQEGASVEIMGYKDFKYCWENFVYNDDEPFKPWKGLKYNFLFLDSKLQEILE(配列番号43)
アカゲザルAPOBEC-3G:
(斜体:核酸編集ドメイン、下線:細胞質局在化シグナル)(配列番号44)
チンパンジーAPOBEC-3G:
(斜体:核酸編集ドメイン、下線:細胞質局在化シグナル)
ミドリザルAPOBEC-3G:
(斜体:核酸編集ドメイン、下線:細胞質局在化シグナル)
ヒトAPOBEC-3G:
(斜体:核酸編集ドメイン、下線:細胞質局在化シグナル)
ヒトAPOBEC-3F:
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3B:
(斜体:核酸編集ドメイン)
ラットAPOBEC-3B:
MQPQGLGPNAGMGPVCLGCSHRRPYSPIRNPLKKLYQQTFYFHFKNVRYAWGRKNNFLCYEVNGMDCALPVPLRQGVFRKQGHIHAELCFIYWFHDKVLRVLSPMEEFKVTWYMSWSPCSKCAEQVARFLAAHRNLSLAIFSSRLYYYLRNPNYQQKLCRLIQEGVHVAAMDLPEFKKCWNKFVDNDGQPFRPWMRLRINFSFYDCKLQEIFSRMNLLREDVFYLQFNNSHRVKPVQNRYYRRKSYLCYQLERANGQEPLKGYLLYKKGEQHVEILFLEKMRSMELSQVRITCYLTWSPCPNCARQLAAFKKDHPDLILRIYTSRLYFWRKKFQKGLCTLWRSGIHVDVMDLPQFADCWTNFVNPQRPFRPWNELEKNSWRIQRRLRRIKESWGL(配列番号50)
ウシAPOBEC-3B:
MDGWEVAFRSGTVLKAGVLGVSMTEGWAGSGHPGQGACVWTPGTRNTMNLLREVLFKQQFGNQPRVPAPYYRRKTYLCYQLKQRNDLTLDRGCFRNKKQRHAERFIDKINSLDLNPSQSYKIICYITWSPCPNCANELVNFITRNNHLKLEIFASRLYFHWIKSFKMGLQDLQNAGISVAVMTHTEFEDCWEQFVDNQSRPFQPWDKLEQYSASIRRRLQRILTAPI(配列番号51)
チンパンジーAPOBEC-3B:
MNPQIRNPMEWMYQRTFYYNFENEPILYGRSYTWLCYEVKIRRGHSNLLWDTGVFRGQMYSQPEHHAEMCFLSWFCGNQLSAYKCFQITWFVSWTPCPDCVAKLAKFLAEHPNVTLTISAARLYYYWERDYRRALCRLSQAGARVKIMDDEEFAYCWENFVYNEGQPFMPWYKFDDNYAFLHRTLKEIIRHLMDPDTFTFNFNNDPLVLRRHQTYLCYEVERLDNGTWVLMDQHMGFLCNEAKNLLCGFYGRHAELRFLDLVPSLQLDPAQIYRVTWFISWSPCFSWGCAGQVRAFLQENTHVRLRIFAARIYDYDPLYKEALQMLRDAGAQVSIMTYDEFEYCWDTFVYRQGCPFQPWDGLEEHSQALSGRLRAILQVRASSLCMVPHRPPPPPQSPGPCLPLCSEPPLGSLLPTGRPAPSLPFLLTASFSFPPPASLPPLPSLSLSPGHLPVPSFHSLTSCSIQPPCSSRIRETEGWASVSKEGRDLG(配列番号52)
ヒトAPOBEC-3C:
(斜体:核酸編集ドメイン)
ゴリラAPOBEC-3C
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3A:
(斜体:核酸編集ドメイン)
アカゲザルAPOBEC-3A:
(斜体:核酸編集ドメイン)
ウシAPOBEC-3A:
(斜体:核酸編集ドメイン)
ヒトAPOBEC-3H:
(斜体:核酸編集ドメイン)
アカゲザルAPOBEC-3H:
MALLTAKTFSLQFNNKRRVNKPYYPRKALLCYQLTPQNGSTPTRGHLKNKKKDHAEIRFINKIKSMGLDETQCYQVTCYLTWSPCPSCAGELVDFIKAHRHLNLRIFASRLYYHWRPNYQEGLLLLCGSQVPVEVMGLPEFTDCWENFVDHKEPPSFNPSEKLEELDKNSQAIKRRLERIKSRSVDVLENGLRSLQLGPVTPSSSIRNSR(配列番号59)
ヒトAPOBEC-3D:
(配列番号60)
(斜体:核酸編集ドメイン)
ヒトAPOBEC-1:
MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR(配列番号61)
マウスAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK(配列番号62)
ラットAPOBEC-1:
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(配列番号63)
ヒトAPOBEC-2:
MAQKEEAAVATEAASQNGEDLENLDDPEKLKELIELPPFEIVTGERLPANFFKFQFRNVEYSSGRNKTFLCYVVEAQGKGGQVQASRGYLEDEHAAAHAEEAFFNTILPAFDPALRYNVTWYVSSSPCAACADRIIKTLSKTKNLRLLILVGRLFMWEEPEIQAALKKLKEAGCKLRIMKPQDFEYVWQNFVEQEEGESKAFQPWEDIQENFLYYEEKLADILK(配列番号64)
マウスAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEVQSKGGQAQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(配列番号65)
ラットAPOBEC-2:
MAQKEEAAEAAAPASQNGDDLENLEDPEKLKELIDLPPFEIVTGVRLPVNFFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQATQGYLEDEHAGAHAEEAFFNTILPAFDPALKYNVTWYVSSSPCAACADRILKTLSKTKNLRLLILVSRLFMWEEPEVQAALKKLKEAGCKLRIMKPQDFEYLWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(配列番号66)
ウシAPOBEC-2:
MAQKEEAAAAAEPASQNGEEVENLEDPEKLKELIELPPFEIVTGERLPAHYFKFQFRNVEYSSGRNKTFLCYVVEAQSKGGQVQASRGYLEDEHATNHAEEAFFNSIMPTFDPALRYMVTWYVSSSPCAACADRIVKTLNKTKNLRLLILVGRLFMWEEPEIQAALRKLKEAGCRLRIMKPQDFEYIWQNFVEQEEGESKAFEPWEDIQENFLYYEEKLADILK(配列番号67)
Petromyzon marinus CDA1(pmCDAl):
MTDAEYVRIHEKLDIYTFKKQFFNNKKSVSHRCYVLFELKRRGERRACFWGYAVNKPQSGTERGIHAEIFSIRKVEEYLRDNPGQFTINWYSSWSPCADCAEKILEWYNQELRGNGHTLKIWACKLYYEKNARNQIGLWNLRDNGVGLNVMVSEHYQCCRKIFIQSSHNQ LNENRWLEKTLKRAEKRRSELSFMIQVKILHTTKSPAV(配列番号68)
ヒトAPOBEC3G D316R D317R:
MKPHFRNTVERMYRDTFSYNFYNRPILSRRNTVWLCYEVKTKGPSRPPLDAKIFRGQVYSELKYHPEMRFFHWFSKWRKLHRDQEYEVTWYISWSPCTKCTRDMATFLAEDPKVTLTIFVARLYYFWDPDYQEALRSLCQKRDGPRATMKFNYDEFQHCWSKFVYSQRELFEPWNNLPKYYILLHFMLGEILRHSMDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQNQEN(配列番号69)
ヒトAPOBEC3G A鎖:
MDPPTFTFNFNNEPWWGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYDDQGRCQEGLRTLAEAGAKISFTYSEFKHCWDTFVDHQGCPFQPWDGLD EHSQDLSGRLRAILQ(配列番号70)
ヒトAPOBEC3G A鎖 D120R D121R:
MDPPTFTFNFNNEPWVRGRHETYLCYEVERMHNDTWVLLNQRRGFLCNQAPHKHGFLEGRHAELCFLDVIPFWKLDLDQDYRVTCFTSWSPCFSCAQEMAKFISKNKHVSLCIFTARIYRRQGRCQEGLRTLAEAGAKISFMTYSEFKHCWDTFVDHQGCPFQPWDGLDEHSQDLSGRLRAILQ(配列番号71)
hAPOBEC-4(Homo sapiens):
MEPIYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTFPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYSNNSPCNEANHCCISKMYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFISGVSGSHVFQPILTGRALADRHNAYEINAITGVKPYFTDVLLQTKRNPNTKAQEALESYPLNNAFPGQFFQMPSGQLQPNLPPDLRAPVVFVLVPLRDLPPMHMGQNPNKPRNIVRHLNMPQMSFQETKDLGRLPTGRSVEIVEITEQFASSKEADEKKKKKGKK(配列番号72)
mAPOBEC-4(Mus musculus):
MDSLLMKQKKFLYHFKNVRWAKGRHETYLCYVVKRRDSATSCSLDFGHLRNKSGCHVELLFLRYISDWDLDPGRCYRVTWFTSWSPCYDCARHVAEFLRWNPNLSLRIFTARLYFCEDRKAEPEGLRRLHRAGVQIGIMTFKDYFYCWNTFVENRERTFKAWEGLHENSVRLTRQLRRILLPLYEVDDLRDAFRMLGF(配列番号73)
rAPOBEC-4(Rattus norvegicus):
MEPLYEEYLTHSGTIVKPYYWLSVSLNCTNCPYHIRTGEEARVPYTEFHQTFGFPWSTYPQTKHLTFYELRSSSGNLIQKGLASNCTGSHTHPESMLFERDGYLDSLIFHDSNIRHIILYSNNSPCDEANHCCISKMYNFLMNYPEVTLSVFFSQLYHTENQFPTSAWNREALRGLASLWPQVTLSAISGGIWQSILETFVSGISEGLTAVRPFTAGRTLTDRYNAYEINCITEVKPYFTDALHSWQKENQDQKVWAASENQPLHNTTPAQWQPDMSQDCRTPAVFMLVPYRDLPPIHVNPSPQKPRTVVRHLNTLQLSASKVKALRKSPSGRPVKKEEARKGSTRSQEANETNKSKWKKQTLFIKSNICHLLEREQKKIGILSSWSV(配列番号74)
mfAPOBEC-4(Macaca fascicularis):
MEPTYEEYLANHGTIVKPYYWLSFSLDCSNCPYHIRTGEEARVSLTEFCQIFGFPYGTTYPQTKHLTFYELKTSSGSLVQKGHASSCTGNYIHPESMLFEMNGYLDSAIYNNDSIRHIILYCNNSPCNEANHCCISKVYNFLITYPGITLSIYFSQLYHTEMDFPASAWNREALRSLASLWPRVVLSPISGGIWHSVLHSFVSGVSGSHVFQPILTGRALTDRYNAYEINAITGVKPFFTDVLLHTKRNPNTKAQMALESYPLNNAFPGQSFQMTSGIPPDLRAPVVFVLLPLRDLPPMHMGQDPNKPRNIIRHLNMPQMSFQETKDLERLPTRRSVETVEITERFASSKQAEEKTKKKKGKK(配列番号75)
pmCDA-1(Petromyzon marinus):
MAGYECVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLTMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGIPLHLFTLQTPLLSGRVVWWRV(配列番号76)
pmCDA-2(Petromyzon marinus):
MELREVVDCALASCVRHEPLSRVAFLRCFAAPSQKPRGTVILFYVEGAGRGVTGGHAVNYNKQGTSIHAEVLLLSAVRAALLRRRRCEDGEEATRGCTLHCYSTYSPCRDCVEYIQEFGASTGVRVVIHCCRLYELDVNRRRSEAEGVLRSLSRLGRDFRLMGPRDAIALLLGGRLANTADGESGASGNAWVTETNVVEPLVDMTGFGDEDLHAQVQRNKQIREAYANYASAVSLMLGELHVDPDKFPFLAEFLAQTSVEPSGTPRETRGRPRGASSRGPEIGRQRPADFERALGAYGLFLHPRIVSREADREEIKRDLIVVMRKHNYQGP(配列番号77)
pmCDA-5(Petromyzon marinus):
MAGDENVRVSEKLDFDTFEFQFENLHYATERHRTYVIFDVKPQSAGGRSRRLWGYIINNPNVCHAELILMSMIDRHLESNPGVYAMTWYMSWSPCANCSSKLNPWLKNLLEEQGHTLMMHFSRIYDRDREGDHRGLRGLKHVSNSFRMGVVGRAEVKECLAEYVEASRRTLTWLDTTESMAAKMRRKLFCILVRCAGMRESGMPLHLFT(配列番号78)
yCD(Saccharomyces cerevisiae):
MVTGGMASKWDQKGMDIAYEEAALGYKEGGVPIGGCLINNKDGSVLGRGHNMRFQKGSATLHGEISTLENCGRLEGKVYKDTTLYTTLSPCDMCTGAIIMYGIPRCVVGENVNFKSKGEKYLQTRGHEVVVVDDERCKKIMKQFIDERPQDWFEDIGE(配列番号79)
rAPOBEC-1(Δ177-186):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(配列番号80)
rAPOBEC-1(Δ202-213):
MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQHYQRLPPHILWATGLK(配列番号81)
マウスAPOBEC-3:
(斜体:核酸編集ドメイン)
いくつかの実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼADAR(例えば、ADAR1又はADAR2)の全部又は一部を含むことができる。別の実施形態では、アデノシンデアミナーゼは、アデノシンデアミナーゼADATの全部又は一部を含むことができる。いくつかの実施形態では、アデノシンデアミナーゼは、以下の変異のうちの1つ以上を含むEscherichia coli由来のADAT(EcTadA)の全部又は一部を含むことができる:D108N、A106V、D147Y、E155V、L84F、H123Y、I157F、又は別のアデノシンデアミナーゼにおける対応する変異。アデノシンデアミナーゼは、任意の好適な生物(例えば、E.coli)に由来し得る。一部の実施形態では、アデノシンデアミナーゼは、Escherichia coli、Staphylococcus aureus、Salmonella typhi、Shewanella putrefaciens、Haemophilus influenzae、Caulobacter crescentus、又はBacillus subtilis由来である。いくつかの実施形態では、アデノシンデアミナーゼは、E.coli由来である。一部の実施形態では、アデニンデアミナーゼは、本明細書に提供される変異(例えば、ecTadAにおける変異)のいずれかに対応する1つ以上の変異を含む、天然に存在するアデノシンデアミナーゼである。任意の相同タンパク質における対応する残基は、例えば、配列整列及び相同残基の決定によって特定することができる。本明細書に記載される変異のいずれか(例えば、ecTadAにおいて特定された変異のいずれか)に対応する、任意の天然に存在するアデノシンデアミナーゼにおける(例えば、ecTadAと相同性を有する)変異は、それに応じて生成することができる。特定の実施形態では、TadAは、PCT/US2017/045381(WO2018/027078)に記載されるTadAのいずれか1つである(その全体が、参照により本明細書に組み込まれる)。表3に示されるように一本鎖DNAに所望のアデノシンデアミナーゼ活性を有する変異を、進化及び選択のラウンド(例えば、TadA*7.10=進化の第7ラウンドからのバリアント10)を通して特定した。
いくつかの実施形態では、TadAは、単量体又は二量体(例えば、野生型E.coli TadA及び操作されたTadAバリアントのヘテロ二量体)として提供される。いくつかの実施形態では、アデノシンデアミナーゼは、以下の表4に示される第8世代TadA*8バリアントである。
いくつかの実施形態では、アデノシンデアミナーゼは、以下から選択されるアミノ酸位置で改変を含有する第9世代TadA*9バリアントである:以下の参照配列に示されるTadAバリアントの21、23、25、38、51、54、70、71、72、72、94、124、133、138、139、146、及び158:
一実施形態では、アデノシンデアミナーゼバリアントは、以下から選択される2つ以上のアミノ酸位置で改変を含有する:上記のTadA参照配列の21、23、25、38、51、54、70、71、72、94、124、133、138、139、146、及び158。別の実施形態では、アデノシンデアミナーゼバリアントは、以下から選択される1つ以上(例えば、2つ、3つ、4つ)の改変を含有する:配列番号1のR21N、R23H、E25F、N38G、L51W、P54C、M70V、Q71M、N72K、Y73S、M94V、P124W、T133K、D139L、D139M、C146R、及びA158K。他の実施形態では、アデノシンデアミナーゼバリアントは、以下の改変のうちの1つ以上を更に含有する:Y147T、Y147R、Q154S、Y123H、及びQ154R。更に他の実施形態では、アデノシンデアミナーゼバリアントは、以下から選択される上記TadA参照配列に対する改変の組み合わせを含有する:E25F+V82S+Y123H、T133K+Y147R+Q154R;E25F+V82S+Y123H+Y147R+Q154R;L51W+V82S+Y123H+C146R+Y147R+Q154R;Y73S+V82S+Y123H+Y147R+Q154R;P54C+V82S+Y123H+Y147R+Q154R;N38G+V82T+Y123H+Y147R+Q154R;N72K+V82S+Y123H+D139L+Y147R+Q154R;E25F+V82S+Y123H+D139M+Y147R+Q154R;Q71M+V82S+Y123H+Y147R+Q154R;E25F+V82S+Y123H+T133K+Y147R+Q154R;E25F+V82S+Y123H+Y147R+Q154R;V82S+Y123H+P124W+Y147R+Q154R;L51W+V82S+Y123H+C146R+Y147R+Q154R;P54C+V82S+Y123H+Y147R+Q154R;Y73S+V82S+Y123H+Y147R+Q154R;N38G+V82T+Y123H+Y147R+Q154R;R23H+V82S+Y123H+Y147R+Q154R;R21N+V82S+Y123H+Y147R+Q154R;V82S+Y123H+Y147R+Q154R+A158K;N72K+V82S+Y123H+D139L+Y147R+Q154R;E25F+V82S+Y123H+D139M+Y147R+Q154R;M70V+V82S+M94V+Y123H+Y147R+Q154R;Q71M+V82S+Y123H+Y147R+Q154R;E25F+I76Y+V82S+Y123H+Y147R+Q154R;I76Y+V82T+Y123H+Y147R+Q154R;N38G+I76Y+V82S+Y123H+Y147R+Q154R;R23H+I76Y+V82S+Y123H+Y147R+Q154R;P54C+I76Y+V82S+Y123H+Y147R+Q154R;R21N+I76Y+V82S+Y123H+Y147R+Q154R;I76Y+V82S+Y123H+D138M+Y147R+Q154R;Y72S+I76Y+V82S+Y123H+Y147R+Q154R;E25F+I76Y+V82S+Y123H+Y147R+Q154R;I76Y+V82T+Y123H+Y147R+Q154R;N38G+I76Y+V82S+Y123H+Y147R+Q154R;R23H+I76Y+V82S+Y123H+Y147R+Q154R;P54C+I76Y+V82S+Y123H+Y147R+Q154R;R21N+I76Y+V82S+Y123H+Y147R+Q154R;I76Y+V82S+Y123H+D138M+Y147R+Q154R;Y72S+I76Y+V82S+Y123H+Y147R+Q154R;andV82S+Q154R;N72K_V82S+Y123H+Y147R+Q154R;Q71M_V82S+Y123H+Y147R+Q154R;V82S+Y123H+T133K+Y147R+Q154R;V82S+Y123H+T133K+Y147R+Q154R+A158K;M70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R;N72K_V82S+Y123H+Y147R+Q154R;Q71M_V82S+Y123H+Y147R+Q154R;M70V+V82S+M94V+Y123H+Y147R+Q154R;V82S+Y123H+T133K+Y147R+Q154R;V82S+Y123H+T133K+Y147R+Q154R+A158K;及びM70V+Q71M+N72K+V82S+Y123H+Y147R+Q154R。一部の実施形態では、デアミナーゼ又は他のポリペプチド配列は、例えば、融合タンパク質の成分として含まれる場合、メチオニンを欠く。これにより、位置の番号付けが変化する場合がある。しかしながら、当業者は、かかる対応する変異が、同じ変異(例えば、Y73S及びY72S、並びにD139M及びD138M)を指すことを理解するであろう。
いくつかの実施形態では、Cas9は、SV40大T抗原のNLS、ヌクレオプラスミン、c-myc、hRNPA1 M9、インポーチン-アルファ由来のIBBドメイン、筋腫Tタンパク質のNLS、ヒトp53、c-abl IV、インフルエンザウイルスNS1、肝炎ウイルスデルタ抗原、マウスMx1、ヒトポリ(ADP-リボース)ポリメラーゼ、ステロイドホルモン受容体(ヒト)グルココルチコイドを含む、核局在化配列に融合している。
いくつかの実施形態では、Cas9タンパク質は、ヘマグルチニン(HA)タグ、ヒスチジン(His)タグ、FLAGタグ、Mycタグ、V5タグ、VSV-Gタグ、SNAPタグ、チオレドキシン(Trx)タグを含むが、これらに限定されないエピトープタグに融合している。
いくつかの実施形態では、Cas9は、これらに限定されないが、グルタチオン-S-トランスフェラーゼ(GST)、セイヨウワサビペルオキシダーゼ(HRP)、クロラムフェニコールトランスフェラーゼ(CAT)、HcRed、DsRed、シアン蛍光タンパク質、黄色蛍光タンパク質、及び青色蛍光タンパク質、増強バージョン又はスーパーフォルダーGFPを含む、緑色蛍光タンパク質(GFP)、並びにレポーター遺伝子の他の修飾バージョンを含む、レポーター遺伝子に融合している。
いくつかの実施形態では、操作されたCas9タンパク質の血清半減期は、カルボキシ末端ペプチド(絨毛性ゴナドトロピンβ鎖のCTP)などの、ヒト血清アルブミンタンパク質、トランスフェリンタンパク質、ヒトIgG及び/又はシアリル化ペチドなどの、異種タンパク質との融合によって増加する。
いくつかの実施形態では、操作されたCas9タンパク質の血清半減期は、ゲミニン、ユビキチン、FKBP12-L106P、及び/又はジヒドロ葉酸レダクターゼを含むが、これらに限定されない、不安定化ドメインとの融合によって減少する。
増加又は減少した安定性をもたらす好適な融合パートナーとしては、これらに限定されないが、デグロン配列が挙げられる。デグロンは、当業者によって、それらがその一部であるタンパク質の安定性を制御するアミノ酸配列であると容易に理解される。例えば、デグロン配列を含むタンパク質の安定性は、デグロン配列によって少なくとも部分的に制御される。いくつかの場合では、好適なデグロンは、デグロンが、実験的対照とは無関係に、タンパク質安定性に対してその影響を及ぼすように構成的である(すなわち、デグロンは、薬物誘導性、温度誘導性などではない)。いくつかの場合では、デグロンは、バリアントCas9ポリペプチドを、所望の条件に応じて「オン」(すなわち、安定)又は「オフ」(すなわち、不安定、分解)にすることができるように、制御可能な安定性を有するバリアントCas9ポリペプチドを提供する。例えば、デグロンが温度感受性デグロンである場合、バリアントCas9ポリペプチドは、閾値温度(例えば、42℃、41℃、40℃、39℃、38℃、37℃、36℃、35℃、34℃、33℃、32℃、31℃、30℃など)を下回る機能的(すなわち、「オン」、安定)であり得るが、閾値温度を上回る非機能的(すなわち、「オフ」、分解)であり得る。別の例として、デグロンが薬物誘導性デグロンである場合、薬物の存在又は不在は、タンパク質を「オフ(すなわち、不安定)状態」から「オン」(すなわち、安定)状態に、又はその逆に切り替えることができる。例示的な薬物誘導性デグロンは、FKBP12タンパク質に由来する。デグロンの安定性は、デグロンに結合する小分子の存在又は不在によって制御される。
好適なデグロンの例としては、これらに限定されないが、Shield-1、DHFR、オーキシン、及び/又は温度によって制御されるそれらのデグロンが挙げられる。好適なデグロンの非限定的な例は、当該技術分野で既知である(例えば、Dohmen et al.,Science,1994.263(5151):p.1273-1276:Heat-inducible degron:a method for constructing temperature-sensitive mutants、Schoeber et al.,Am J Physiol Renal Physiol.2009 Jan;296(l):F204-l l:Conditional fast expression and function of multimeric TRPV5 channels using Shield-1、Chu et al.,Bioorg Med Chem Lett.2008 Nov 15;18(22):5941-4:Recent progress with FKBP-derived destabilizing domains、Kanemaki,Pflugers Arch.2012 Dec 28:Frontiers of protein expression control with conditional degrons、Yang et al.,Mol Cell.2012 Nov 30;48(4):487-8:Titivated for destruction:the methyl degron、Barbour et al.,Biosci Rep.2013 Jan 18;33(1).:Characterization of the bipartite degron that regulates ubiquitin-independent degradation of thymidylate synthase、及びGreussing et al.,J Vis Exp.2012 Nov 10;(69):Monitoring of ubiquitin-proteasome activity in living cells using a Degron(dgn)-destabilized green fluorescent protein(GFP)-based reporter proteinであり、これらの全ては、参照によってそれらの全体が本明細書に組み込まれる)。
例示的なデグロン配列は、細胞及び動物の両方において十分に特徴分析され、試験されている。よって、死んだCas9をデグロン配列に融合することは、「調節可能な」及び「誘導可能な」死んだCas9ポリペプチドを産生する。
本明細書に記載される融合パートナーのいずれかは、任意の所望の組み合わせで使用することができる。この点を示す1つの非限定的な例として、Cas9融合タンパク質は、検出のためのYFP配列、安定性のためのデグロン配列、及び標的DNAの転写を増加させるための転写アクチベーター配列を含むことができる。更に、dCas9融合タンパク質において使用することができる融合パートナーの数は、無制限である。いくつかの場合では、Cas9融合タンパク質は、1つ以上(例えば、2つ以上、3つ以上、4つ以上、又は5つ以上)の異種配列を含む。
標的核酸
標的核酸は、DNA分子、RNA分子であり、これは、一本鎖、二本鎖、若しくは多重鎖のDNA若しくはRNA、ゲノムDNA、cDNA、DNA-RNAハイブリッド、又はプリン及びピリミジン塩基、若しくは他の天然、化学的若しくは生化学的に修飾された、天然に存在しない、若しくは誘導体化されたヌクレオチド塩基を含むポリマー、デオキシリボヌクレオチド、リボヌクレオチド、又はそれらの類似体のいずれかである。標的核酸は、コーディング領域又は非コーディング領域を含み得る三次元構造を有し得、エクソン、イントロン、mRNA、tRNA、rRNA、siRNA、shRNA、miRNA、リボザイム、cDNA、プラスミド、ベクター、外因性配列、内因性配列を含み得る。標的核酸は、修飾されたヌクレオチド、メチル化されたヌクレオチド、又はヌクレオチド類似体を含み得る。いくつかの実施形態では、標的核酸は、非核酸成分とともに散布されてもよい。
標的核酸は、DNA分子、RNA分子であり、これは、一本鎖、二本鎖、若しくは多重鎖のDNA若しくはRNA、ゲノムDNA、cDNA、DNA-RNAハイブリッド、又はプリン及びピリミジン塩基、若しくは他の天然、化学的若しくは生化学的に修飾された、天然に存在しない、若しくは誘導体化されたヌクレオチド塩基を含むポリマー、デオキシリボヌクレオチド、リボヌクレオチド、又はそれらの類似体のいずれかである。標的核酸は、コーディング領域又は非コーディング領域を含み得る三次元構造を有し得、エクソン、イントロン、mRNA、tRNA、rRNA、siRNA、shRNA、miRNA、リボザイム、cDNA、プラスミド、ベクター、外因性配列、内因性配列を含み得る。標的核酸は、修飾されたヌクレオチド、メチル化されたヌクレオチド、又はヌクレオチド類似体を含み得る。いくつかの実施形態では、標的核酸は、非核酸成分とともに散布されてもよい。
標的核酸は、CRISPR-Cas9システムによって認識され、Cas9に結合する。いくつかの実施形態では、それは、Cas9の結合に起因して、修飾若しくは開裂されるか、又は改変された発現を有する。標的核酸は、特定の認識可能なPAMモチーフ、例えば、5’-NGG-3’、5’-NGC-3’、5’-NAGHC-3’、5’-NRHRRH-3’、又は5’-NNAAA-3’(H=A、C、又はT、R=A又はG)を含有する。
組換え遺伝子技術
本開示によれば、当該技術分野内の従来の分子生物学、微生物学、及び組換えDNA技法が用いられ得る。かかる技法は、文献に記載されている(例えば、Sambrook,Fritsch&Maniatis,Molecular Cloning:A Laboratory Manual,Second Edition(1989)Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.、DNA Cloning:A Practical Approach,Volumes I and II(D.N.Glover ed.1985)、Oligonucleotide Synthesis(M.J.Gait ed.1984)、Nucleic Acid Hybridization(B.D.Hames&S.J.Higgins eds.(1985))、Transcription And Translation(B.D.Hames&S.J.Higgins,eds.(1984))、Animal Cell Culture(R.I.Freshney,ed.(1986))、Immobilized Cells and Enzymes(IRL Press,(1986))、B.Perbal,A Practical Guide To Molecular Cloning(1984)、F.M.Ausubel et al.(eds.),Current Protocols in Molecular Biology,John Wiley&Sons,Inc.(1994)を参照されたい)。
本開示によれば、当該技術分野内の従来の分子生物学、微生物学、及び組換えDNA技法が用いられ得る。かかる技法は、文献に記載されている(例えば、Sambrook,Fritsch&Maniatis,Molecular Cloning:A Laboratory Manual,Second Edition(1989)Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.、DNA Cloning:A Practical Approach,Volumes I and II(D.N.Glover ed.1985)、Oligonucleotide Synthesis(M.J.Gait ed.1984)、Nucleic Acid Hybridization(B.D.Hames&S.J.Higgins eds.(1985))、Transcription And Translation(B.D.Hames&S.J.Higgins,eds.(1984))、Animal Cell Culture(R.I.Freshney,ed.(1986))、Immobilized Cells and Enzymes(IRL Press,(1986))、B.Perbal,A Practical Guide To Molecular Cloning(1984)、F.M.Ausubel et al.(eds.),Current Protocols in Molecular Biology,John Wiley&Sons,Inc.(1994)を参照されたい)。
本明細書に記載される操作されたCas9酵素などの、ポリペプチドをコードする核酸などの、遺伝子の組換え発現は、ポリペプチドをコードする核酸を含有する発現ベクターの構築を含むことができる。ポリヌクレオチドが得られると、ポリペプチドの産生のためのベクターは、当該技術分野で既知の技法を使用した組換えDNA技法によって産生することができる。既知の方法を使用して、ポリペプチドコード配列並びに適切な転写及び翻訳制御シグナルを含有する発現ベクターを構築することができる。これらの方法には、例えば、インビトロで組換えDNA技法、合成技法、及びインビボ遺伝子組換えが含まれる。
発現ベクターは、従来の技法によって宿主細胞に導入することができ、次いで、トランスフェクトされた細胞は、従来の技法によって培養して、ポリペプチドを産生することができる。
いくつかの実施形態では、DNA標的化RNA及び/又はCas9タンパク質をコードするヌクレオチド配列は、制御エレメント、例えば、プロモーターなどの、転写制御エレメントに作動可能に結合している。転写制御エレメントは、真核細胞、例えば、哺乳動物細胞、又は原核細胞(例えば、細菌又は古細菌細胞)のいずれかにおいて機能的であり得る。いくつかの実施形態では、真核細胞は、ヒト細胞である。いくつかの実施形態では、DNA標的化RNA及び/又は新規Cas9タンパク質をコードするヌクレオチド配列は、原核細胞及び真核細胞の両方においてコードされるヌクレオチド配列の発現を可能にする複数の制御エレメントに作動可能に結合している。
プロモーターは、構成的に活性なプロモーター(すなわち、構成的に活性/「ON」状態であるプロモーター)であり得るが、誘導性プロモーター(すなわち、その状態、活性/「ON」又は不活性/「OFF」が、外部刺激、例えば、特定の温度、化合物、又はタンパク質の存在によって制御されるプロモーター)であってもよく、空間的に制限されたプロモーター(すなわち、転写制御エレメント、エンハンサーなど)(例えば、組織特異的プロモーター、細胞型特異的プロモーターなど)であってもよく、時間的に制限されたプロモーターであってもよい(すなわち、プロモーターは、胚発生の特定の段階中、又は生物学的プロセスの特定の段階、例えば、マウスにおける毛包サイクル中に「ON」状態又は「OFF」状態にある)。
好適なプロモーターは、ウイルスに由来し得、したがって、ウイルスプロモーターと称され得るか、又はそれらは、原核生物若しくは真核生物を含む、任意の生物に由来し得る。好適なプロモーターは、任意のRNAポリメラーゼ(例えば、pol I、pol II、pol III)による発現を駆動するために使用することができる。例示的なプロモーターとしては、SV40初期プロモーター、マウス乳腺腫瘍ウイルス長末端反復(LTR)プロモーター、アデノウイルス主要後期プロモーター(Ad MLP)、単純ヘルペスウイルス(HSV)プロモーター、サイトメガロウイルス(CMV)プロモーター、例えば、CMV最初期プロモーター領域(CMVIE)、ルース肉腫ウイルス(RSV)プロモーター、ヒトU6小核プロモーター(U6)(Miyagishi et al.,Nature Biotechnology20,497-500(2002))、増強されたU6プロモーター(例えば、Xia et al.,Nucleic Acids Res.2003 Sep 1;31(17))、及び/又はヒトHIプロモーター(HI)が挙げられるが、これらに限定されない。
誘導性プロモーターの例としては、T7 RNAポリメラーゼプロモーター、T3 RNAポリメラーゼプロモーター、イソプロピル-ベータ-D-チオガラクトピラノシド(IPTG)調節プロモーター、ラクトース誘導プロモーター、ヒートショックプロモーター、テトラサイクリン調節プロモーター(例えば、Tet-ON、Tet-OFFなど)、ステロイド調節プロモーター、金属調節プロモーター、エストロゲン受容体調節プロモーターなどが挙げられるが、これらに限定されない。したがって、誘導性プロモーターは、これらに限定されないが、ドキシサイクリン、RNAポリメラーゼ、例えば、T7 RNAポリメラーゼ、エストロゲン受容体及び/又はエストロゲン受容体融合体を含む、分子によって調節することができる。
いくつかの実施形態では、プロモーターは、空間的に制限されたプロモーター(すなわち、細胞型特異的プロモーター、組織特異的プロモーターなど)であり、多細胞生物において、プロモーターは、特定の細胞のサブセットにおいて活性(すなわち、「ON」)である。空間的に制限されたプロモーターはまた、エンハンサー、転写制御エレメント、制御配列などとも称され得る。任意の便利な空間的に制限されたプロモーターが使用され得、好適なプロモーター(例えば、脳特異的プロモーター、ニューロンのサブセットにおける発現を駆動するプロモーター、生殖細胞系における発現を駆動するプロモーター、肺における発現を駆動するプロモーター、筋肉における発現を駆動するプロモーター、膵臓の膵島細胞における発現を駆動するプロモーターなど)の選択は、生物に依存するであろう。よって、空間的に制限されたプロモーターは、生物に応じて、多種多様な異なる組織及び細胞型における対象部位特異的ポリペプチドをコードする核酸の発現を調節するために使用することができる。いくつかの空間的に制限されたプロモーターはまた、プロモーターが胚発生の特定の段階中又は生物学的プロセスの特定の段階(例えば、毛包サイクル)中に「ON」状態又は「OFF」状態にあるように、時間的に制限される。
例示の目的のために、空間的に制限されたプロモーターの例としては、これらに限定されないが、ニューロン特異的プロモーター、脂肪細胞特異的プロモーター、心筋細胞特異的プロモーター、平滑筋特異的プロモーター、光受容体特異的プロモーターなどが挙げられる。ニューロン特異的な空間的に制限されたプロモーターとしては、ニューロン特異的エノラーゼ(NSE)プロモーター、芳香族アミノ酸デカルボキシラーゼ(AADC)プロモーター、ニューロフィラメントプロモーター、シナプシンプロモーター、thy-1プロモーター、セロトニン受容体プロモーター、チロシンヒドロキシラーゼプロモーター(TH)、GnRHプロモーター、L7プロモーター、DNMTプロモーター、エンケファリンプロモーター、ミエリン塩基性タンパク質(MBP)プロモーター、Ca2+カルモジュリン依存性タンパク質キナーゼII-アルファ(CamKIIa)プロモーター、及び/又はCMVエンハンサー/血小板由来成長因子-βプロモーターが挙げられるが、これらに限定されない。
脂肪細胞特異的な空間的に制限されたプロモーターとしては、aP2遺伝子プロモーター/エンハンサー、例えば、ヒトaP2遺伝子の-5.4kb~+21bpの領域、グルコーストランスポーター-4(GLUT4)プロモーター、脂肪酸トランスロカーゼ(FAT/CD36)プロモーター、ステアロイル-CoAデサチュラーゼ-1(SCD1)プロモーター、レプチンプロモーター、及びアジポネクチンプロモーター、アジプシンプロモーター及び/又はレジスチンプロモーターが挙げられるが、これらに限定されない。
心筋細胞特異的な空間的に制限されたプロモーターとしては、以下の遺伝子に由来する対照配列が挙げられるが、これらに限定されない:ミオシン軽鎖-2、a-ミオシン重鎖、AE3、心臓トロポニンC、及び/又は心臓アクチン。
平滑筋特異的な空間的に制限されたプロモーターとしては、これらに限定されないが、SM22aプロモーター、スムーセリンプロモーター、及び/又はa-平滑筋アクチンプロモーターが挙げられる。
光受容体特異的な空間的に制限されたプロモーターとしては、ロドプシンプロモーター、ロドプシンキナーゼプロモーター、ベータホスホジエステラーゼ遺伝子プロモーター、網膜色素変性症遺伝子プロモーター、光受容体間レチノイド結合タンパク質(IRBP)遺伝子エンハンサー、及び/又はIRBP遺伝子プロモーターが挙げられるが、これらに限定されない。
CRISPR-Cas9の遺伝子編集使用
本明細書に記載されるCRISPR-Cas9システムは、遺伝子編集に使用することができ、これは、遺伝子サイレンシング事象、又は所望の標的遺伝子の発現における発現の改変(例えば、増加又は減少)をもたらすことができる。したがって、いくつかの実施形態では、本明細書に記載されるCRISPR-Cas9システムは、標的核酸の発現を改変する方法で使用される。いくつかの実施形態では、本明細書に記載されるCRISPR-Cas9システムは、所望の標的細胞における標的核酸を修飾する方法で使用される。いくつかの実施形態では、本発明は、遺伝子発現における所望の修飾を達成する真核細胞における標的核酸の部位特異的修飾のための方法を提供する。
本明細書に記載されるCRISPR-Cas9システムは、遺伝子編集に使用することができ、これは、遺伝子サイレンシング事象、又は所望の標的遺伝子の発現における発現の改変(例えば、増加又は減少)をもたらすことができる。したがって、いくつかの実施形態では、本明細書に記載されるCRISPR-Cas9システムは、標的核酸の発現を改変する方法で使用される。いくつかの実施形態では、本明細書に記載されるCRISPR-Cas9システムは、所望の標的細胞における標的核酸を修飾する方法で使用される。いくつかの実施形態では、本発明は、遺伝子発現における所望の修飾を達成する真核細胞における標的核酸の部位特異的修飾のための方法を提供する。
いくつかの実施形態では、本発明は、RNAガイド又はRNAガイドをコードする核酸であって、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む、RNAガイド又は核酸と、配列番号1、4、8、14、84、又は86と少なくとも80%の配列同一性を有するコドン最適化CRISPR関連(Cas)タンパク質であって、Casタンパク質が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列における切断を引き起こすことができる、Casタンパク質と、を含む、操作された天然に存在しないCRISPR-Casシステムを提供する。
いくつかの実施形態では、本発明は、RNAガイド又はRNAガイドをコードする核酸であって、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む、RNAガイド又は核酸と、配列番号1、4、8、14、84、又は86と少なくとも80%の配列同一性を有するコドン最適化CRISPR関連(Cas)タンパク質であって、Casタンパク質が、デアミナーゼに融合しており、Casタンパク質融合体が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列を編集することができる、Casタンパク質と、を含む、操作された天然に存在しないCRISPR-Casシステムを提供する。
いくつかの実施形態では、核局在化配列(NLS)及び/又はFLAGタグ、HISタグ、若しくはHAタグを更に含む、コドン最適化CRISPR関連(Cas)タンパク質を含む、操作された天然に存在しないCRISPR-Casシステムが本明細書に提供される。
いくつかの実施形態では、核局在化配列(NLS)及び/又はFLAGタグ、HISタグ、若しくはHAタグを更に含む、操作された天然に存在しないCas9融合タンパク質が本明細書に提供される。
いくつかの実施形態では、配列番号2、5、9、15、85、87、95、又は96と少なくとも80%の同一性を有する、操作された天然に存在しないCas9融合タンパク質が本明細書に提供される。
いくつかの実施形態では、本発明は、細胞を、本明細書に記載されるCas9、及びRNAガイド又はRNAガイドをコードする核酸と接触させることを含み、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含み、Cas9タンパク質が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列における切断を引き起こすことができる、真核細胞中の標的核酸の発現を改変する方法を提供する。
いくつかの実施形態では、本発明は、細胞を、本明細書に記載されるCas9、及びRNAガイド又はRNAガイドをコードする核酸と接触させることを含み、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含み、Cas9タンパク質が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列を編集することができる、真核細胞中の標的核酸の発現を改変する方法を提供する。
いくつかの実施形態では、本発明は、細胞を、本明細書に記載されるCas9、及びRNAガイド又はRNAガイドをコードする核酸と接触させることを含み、RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含み、Cas9タンパク質が、RNAガイドに結合し、RNAガイドに相補的な標的核酸配列を編集することができる、真核細胞中の標的核酸の発現を修飾する方法を提供する。
したがって、いくつかの実施形態では、Casタンパク質は、配列番号1、4、8、14、84、又は86と約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%の同一性を有する。いくつかの実施形態では、Casタンパク質は、配列番号1、4、8、14、84、又は86と同一である。
CRISPR-Cas9システム及び方法における使用のための好適なガイドRNA、Cas9変異、及び融合タンパク質は、本開示全体を通して記載されるとおりである。
一態様では、方法は、CRISPR-Cas9の標的核酸への結合、及び標的核酸の開裂を行うことを含む。いくつかの実施形態では、CRISPR-Cas9システムは、二本鎖切断を導入することによって、標的DNA二本鎖又は標的RNA二本鎖を開裂する。いくつかの実施形態では、CRISPR-Cas9システムは、一本鎖切断又はニックを導入することによって、標的DNA又は標的RNAを開裂する。
いくつかの実施形態では、CRISPR-Cas9方法又はシステムは、標的DNAを部位特異的な方法で修飾するエフェクターを有する融合タンパク質を含み、修飾活性は、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、又はヌクレアーゼ活性を含み、これらのいずれかは、DNA又はDNA関連ポリペプチド(例えば、ヒストン又はDNA結合タンパク質)を修飾することができる。
いくつかの実施形態では、CRISPR-Cas9方法又はシステムは、アデノシン又はシトシン塩基を修飾することができ、部位特異的塩基エディターとして機能することができるデアミナーゼ酵素を含む、ヌクレオチド塩基を化学的に修飾することによって、DNA配列を編集することができる酵素を有する融合タンパク質を含む。例えば、通常、RNAを基質として使用する、APOBEC1シチジンデアミナーゼは、Cas9に融合しているとき、一本鎖DNA及び二本鎖DNAに標的化することができ、シチジンをウリジンに直接変換し、ADAR酵素は、アデノシンをイノシンに脱アミノ化する。よって、デアミナーゼを使用する「塩基編集」は、1つの標的DNA塩基の別の塩基へのプログラマブル変換を可能にする。様々な塩基エディターは、当該技術分野で知られており、本明細書に記載の方法及びシステムにおいて使用することができる。例示的な塩基エディターは、例えば、Rees and Liu Nature Review Genetics,2018,19(12):770-788に記載されており、その内容は、本明細書に組み込まれる。したがって、いくつかの実施形態では、本明細書に記載されるCas9酵素(ScoCas9、SirCas9、VapCas9、EpeCas9、LfeCas9、PmaCas9)は、核酸塩基エディターの成分である。いくつかの実施形態では、塩基エディターは、アデニンデアミナーゼTadA8又はTadA9である。
一部の実施形態では、塩基編集は、遺伝子をサイレンシングするための終止コドンの導入をもたらす。一部の実施形態では、塩基編集は、アミノ酸配列を改変することによって、改変されたタンパク質機能をもたらす。
いくつかの実施形態では、CRISPR-Cas9方法又はシステムは、ヒストンとの融合による標的DNAのエピジェネティック修飾を含む。いくつかの実施形態では、CRISPR-Cas9システムは、リーダー、ライター、又はイレーザータンパク質などのエピジェネティック修飾酵素との融合による標的DNAのエピジェネティック修飾を含む。いくつかの実施形態では、CRISPR-Cas9システムは、標的DNAの選択された領域におけるヒストン修飾パターンを改変するヒストン修飾酵素との融合を含む。ヒストン修飾は、メチル化、アセチル化、ユビキチン化、リン酸化を含む多くの異なる方法で、及び多くの異なる組み合わせで生じ、DNAの構造変化をもたらし得る。いくつかの実施形態では、ヒストン修飾は、転写抑制又は活性化をもたらす。
いくつかの実施形態では、CRISPR-Cas9方法又はシステムは、転写アクチベータータンパク質又は転写リプレッサータンパク質、小分子/薬物応答性転写レギュレーター、誘導性転写レギュレーターとの融合を通して転写を増加又は減少させることによって、標的DNAの転写を調節する。いくつかの実施形態では、CRISPR-Cas9システムは、結合が増加又は減少した遺伝子発現をもたらす、標的コードmRNA(すなわち、遺伝子をコードするタンパク質)の発現を制御するために使用される。
いくつかの実施形態では、CRISPR-Cas9方法又はシステムは、プロモーター又はエンハンサーなどの遺伝子調節エレメントを編集することによって遺伝子調節を制御するために使用される。
いくつかの実施形態では、CRISPR-Cas9方法又はシステムは、tRNA、rRNA、snoRNA、siRNA、miRNA、及び長ncRNAを含む、標的非コードRNAの発現を制御するために使用される。
いくつかの実施形態では、CRISPR-Cas9方法又はシステムは、クロマチンループ構造の標的化された操作のために使用される。調節ゲノム領域間のクロマチンループの標的化された操作は、遺伝的欠陥を克服するか、又は異常なエンハンサー-プロモーター接続を阻害するために、内因性クロマチン構造を操作し、新しいエンハンサー-プロモーター接続の形成を可能にする手段を提供する。
いくつかの実施形態では、CRISPR-Cas9は、生細胞イメージングに使用される。蛍光標識されたCas9は、細胞周期全体を通して天然クロマチン遺伝子座を追跡し、3D核空間における転写活性領域及び不活性領域の差分測位を決定するために、セントロメア及びテロメアなどの反復ゲノム領域を標的化する。
いくつかの実施形態では、CRISPR-Cas9方法又はシステムは、有益な臨床バイリアント又はサプレッサー変異の挿入による病原性変異の補正のために使用される。
核酸塩基エディター
Cas9を含むポリヌクレオチドの標的ヌクレオチド配列を編集、修飾、又は改変するための新規塩基エディター又は核酸塩基エディターが本明細書に開示される。ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)と、核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼ)と、を含む、核酸塩基エディター又は塩基エディターが本明細書に記載される。ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)は、結合したガイドポリヌクレオチド(例えば、gRNA)と併せた場合、標的ポリヌクレオチド配列に(すなわち、結合したガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的な塩基対形成を介して)特異的に結合し、それによって、塩基エディターを編集されることが望まれる標的核酸配列に局在化することができる。いくつかの実施形態では、標的ポリヌクレオチド配列は、一本鎖DNA又は二本鎖DNAを含む。一部の実施形態では、標的ポリヌクレオチド配列は、RNAを含む。一部の実施形態では、標的ポリヌクレオチド配列は、DNA-RNAハイブリッドを含む。ヒト疾患に関連する既知の遺伝的バリエーションのほとんどが点変異であるため、より効率的できれいに正確な点変異を作製し得る方法が必要である。本明細書に提供される塩基エディターシステムは、二本鎖DNA切断を生成せず、ドナーDNA鋳型を必要とせず、かつ過剰な確率的な挿入及び欠失を誘発しない、ゲノム編集を提供する新しい方法を提供する。
Cas9を含むポリヌクレオチドの標的ヌクレオチド配列を編集、修飾、又は改変するための新規塩基エディター又は核酸塩基エディターが本明細書に開示される。ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)と、核酸塩基編集ドメイン(例えば、アデノシンデアミナーゼ)と、を含む、核酸塩基エディター又は塩基エディターが本明細書に記載される。ポリヌクレオチドプログラマブルヌクレオチド結合ドメイン(例えば、Cas9)は、結合したガイドポリヌクレオチド(例えば、gRNA)と併せた場合、標的ポリヌクレオチド配列に(すなわち、結合したガイド核酸の塩基と標的ポリヌクレオチド配列の塩基との間の相補的な塩基対形成を介して)特異的に結合し、それによって、塩基エディターを編集されることが望まれる標的核酸配列に局在化することができる。いくつかの実施形態では、標的ポリヌクレオチド配列は、一本鎖DNA又は二本鎖DNAを含む。一部の実施形態では、標的ポリヌクレオチド配列は、RNAを含む。一部の実施形態では、標的ポリヌクレオチド配列は、DNA-RNAハイブリッドを含む。ヒト疾患に関連する既知の遺伝的バリエーションのほとんどが点変異であるため、より効率的できれいに正確な点変異を作製し得る方法が必要である。本明細書に提供される塩基エディターシステムは、二本鎖DNA切断を生成せず、ドナーDNA鋳型を必要とせず、かつ過剰な確率的な挿入及び欠失を誘発しない、ゲノム編集を提供する新しい方法を提供する。
本明細書で提供される塩基エディターは、顕著な割合のインデルを生成することなく、特定のヌクレオチド塩基を修飾することができる。本明細書で使用される、「インデル」という用語は、核酸内のヌクレオチド塩基の挿入又は欠失を指す。かかる挿入又は欠失は、遺伝子のコード領域内のフレームシフト変異をもたらし得る。いくつかの実施形態では、標的ヌクレオチド配列における多数の挿入又は欠失(すなわち、インデル)を生成することなく、核酸内の特定のヌクレオチドを効率的に修飾(例えば、変異又は脱アミノ化)する塩基エディターを生成することが望ましい。特定の実施形態では、本明細書に提供される塩基エディターのいずれかは、インデルに対してより大きな割合の意図された修飾(例えば、点変異又は脱アミノ化)を生成することができる。
一部の実施形態では、本明細書に提供される塩基エディターシステムのいずれかは、標的ポリヌクレオチド配列において、50%未満、40%未満、30%未満、20%未満、19%未満、18%未満、17%未満、16%未満、15%未満、14%未満、13%未満、12%未満、11%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.9%未満、0.8%未満、0.7%未満、0.6%未満、0.5%未満、0.4%未満、0.3%未満、0.2%未満、0.1%未満、0.09%未満、0.08%未満、0.07%未満、0.06%未満、0.05%未満、0.04%未満、0.03%未満、0.02%未満、又は0.01%未満のインデル形成をもたらす。
本開示の一部の態様は、本明細書に提供される塩基エディターのいずれかが、意図されない点変異などの、相当数の意図されない変異を生成することなく、核酸(例えば、対象のゲノム内の核酸)において、意図された変異、例えば、点変異を効率的に生成することができるという認識に基づく。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、少なくとも0.01%の意図された変異(すなわち、少なくとも0.01%の塩基編集効率)を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターのいずれかは、意図された変異の少なくとも0.01%、1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、40%、45%、50%、60%、70%、80%、90%、95%、又は99%を生成することができる。
一部の実施形態では、本明細書に提供される塩基エディターは、1:1を超えるインデルに対する意図される点変異の比を生成することができる。一部の実施形態では、本明細書に提供される塩基エディターは、少なくとも1.5:1、少なくとも2:1、少なくとも2.5:1、少なくとも3:1、少なくとも3.5:1、少なくとも4:1、少なくとも4.5:1、少なくとも5:1、少なくとも5.5:1、少なくとも6:1、少なくとも6.5:1、少なくとも7:1、少なくとも7.5:1、少なくとも8:1、少なくとも8.5:1、少なくとも9:1、少なくとも10:1、少なくとも11:1、少なくとも12:1、少なくとも13:1、少なくとも14:1、少なくとも15:1、少なくとも20:1、少なくとも25:1、少なくとも30:1、少なくとも40:1、少なくとも50:1、少なくとも100:1、少なくとも200:1、少なくとも300:1、少なくとも400:1、少なくとも500:1、少なくとも600:1、少なくとも700:1、少なくとも800:1、少なくとも900:1、又は少なくとも1000:1以上である、意図される点変異対インデルの比を生成することができる。
意図される変異及びインデルの数は、例えば、これらの内容全体が、参照によって本明細書に組み込まれる、国際PCT出願第2017/045381号(WO2018/027078)及び同第PCT/US2016/058344号(WO2017/070632)、Komor,A.C.,et al.,“Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage”Nature 533,420-424(2016)、Gaudelli,N.M.,et al.,“Programmable base editing of A・T to G・C in genomic DNA without DNA cleavage”Nature551,464-471(2017)、及びKomor,A.C.,et al.,“Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity”Science Advances3:eaao4774(2017)に記載される、任意の好適な方法を使用して決定することができる。
一部の実施形態では、インデル頻度を計算するために、配列決定リード(sequencing reads)は、インデルが生じ得るウィンドウの両側に隣接する2つの10bp配列と正確に一致するようにスキャンされる。正確な一致が見つからない場合、リードは、分析から除外される。このインデルウィンドウの長さが参照配列と完全に一致する場合、リードは、インデルを含まないものとして分類される。インデルウィンドウが参照配列よりも2塩基以上長い又は短い場合、配列決定リードは、それぞれ、挿入又は欠失として分類される。一部の実施形態では、本明細書に提供される塩基エディターは、核酸の領域におけるインデルの形成を制限し得る。一部の実施形態では、この領域は、塩基エディターによって標的化されるヌクレオチドにあるか、又は塩基エディターによって標的化されるヌクレオチドの2、3、4、5、6、7、8、9、若しくは10ヌクレオチド以内の領域にある。
標的ヌクレオチド領域で形成されるインデルの数は、核酸(例えば、細胞のゲノム内の核酸)が塩基エディターに曝露される時間の量に依存し得る。一部の実施形態では、インデルの数又は割合は、標的ヌクレオチド配列(例えば、細胞のゲノム内の核酸)を塩基エディターに曝露して少なくとも1時間、少なくとも2時間、少なくとも6時間、少なくとも12時間、少なくとも24時間、少なくとも36時間、少なくとも48時間、少なくとも3日、少なくとも4日、少なくとも5日、少なくとも7日、少なくとも10日、又は少なくとも14日後に決定される。本明細書に記載される塩基エディターの特徴は、融合タンパク質、又は本明細書に提供される融合タンパク質を使用する方法のいずれかに適用することができることを理解されたい。
治療用途
本明細書に記載されるCRISPR-Cas9方法又はシステムは、様々な治療用途を有することができる。したがって、いくつかの実施形態では、障害又は疾患を治療する必要がある対象においてそれを行う方法が提供され、方法は、対象に、本明細書に記載されるCas9を含むCRISPR-Cas9システムを投与することを含み、ガイドRNAは、状態又は疾患に関連する標的核酸の少なくとも10ヌクレオチドに相補的であり、Casタンパク質は、ガイドRNAと会合し、ガイドRNAは、標的核酸に結合し、Casタンパク質は、標的核酸における切断を引き起こし、任意選択的に、Cas9は、デアミナーゼに融合した不活性なCas9(dCas9)であり、標的核酸に1つ以上の塩基編集をもたらし、それによって障害又は疾患を治療する。
本明細書に記載されるCRISPR-Cas9方法又はシステムは、様々な治療用途を有することができる。したがって、いくつかの実施形態では、障害又は疾患を治療する必要がある対象においてそれを行う方法が提供され、方法は、対象に、本明細書に記載されるCas9を含むCRISPR-Cas9システムを投与することを含み、ガイドRNAは、状態又は疾患に関連する標的核酸の少なくとも10ヌクレオチドに相補的であり、Casタンパク質は、ガイドRNAと会合し、ガイドRNAは、標的核酸に結合し、Casタンパク質は、標的核酸における切断を引き起こし、任意選択的に、Cas9は、デアミナーゼに融合した不活性なCas9(dCas9)であり、標的核酸に1つ以上の塩基編集をもたらし、それによって障害又は疾患を治療する。
いくつかの実施形態では、CRISPR-Cas9方法又はシステムは、様々な疾患及び障害、例えば、遺伝子障害(例えば、単一遺伝子疾患)、ヌクレアーゼ活性によって治療することができる疾患、並びに様々ながんなどを治療するために使用することができる。
いくつかの実施形態では、本明細書に記載されるCRISPR方法又はシステムは、(例えば、1つ以上の核酸残基を挿入、欠失、又は変異させることによって)標的核酸を修飾するように標的核酸を編集するために使用することができる。例えば、いくつかの実施形態では、本明細書に記載されるCRISPRシステムは、所望の核酸配列を含む、外因性ドナーテンプレート核酸(例えば、DNA分子又はRNA分子)を含む。本明細書に記載されるCRISPRシステムで誘導される開裂事象の解消後、細胞の分子機構は、開裂事象の修復及び/又は解消において外因性ドナーテンプレート核酸を利用するであろう。代替的に、細胞の分子機構は、開裂事象の修復及び/又は解消において内因性テンプレートを利用することができる。いくつかの実施形態では、本明細書に記載されるCRISPRシステムは、標的核酸を改変して、挿入、欠失、及び/又は点変異をもたらすために使用され得る。一部の実施形態では、挿入は、瘢痕のない挿入である(すなわち、開裂事象の解決時に追加の意図されない核酸配列をもたらさない標的核酸への意図された核酸配列の挿入)。ドナーテンプレート核酸は、二本鎖核酸分子又は一本鎖核酸分子(例えば、DNA又はRNA)であり得る。いくつかの実施形態では、本明細書に記載されるCRISPR方法又はシステムは、核酸塩基エディターを含む。例えば、いくつかの実施形態では、本明細書に記載されるCas9タンパク質は、核酸塩基編集活性を有するポリペプチドに融合している。
一態様では、本明細書に記載されるCRISPR方法又はシステムは、RNA、毒性RNA、及び/又は変異RNA(例えば、スプライシング欠陥又は切断)の過剰発現によって引き起こされる疾患を治療するために使用することができる。
いくつかの実施形態では、本明細書に記載されるCRISPR方法又はシステムはまた、様々な疾患を引き起こすRNA依存性機能に影響を及ぼすトランス作用変異を標的化することができる。
いくつかの実施形態では、本明細書に記載されるCRISPR方法又はシステムはまた、スプライシング欠陥及び疾患を引き起こすことができるシス作用スプライシングコードを破壊する変異を標的化するために使用することができる。
本明細書に記載されるCRISPR方法又はシステムは、特にRNAウイルスに対する、抗ウイルス活性に更に使用することができる。CRISPR関連タンパク質は、ウイルスRNA配列を標的化するために選択された好適なRNAガイドを使用して、ウイルスRNAを標的化することができる。
本明細書に記載されるCRISPR方法又はシステムはまた、対象(例えば、ヒト対象)におけるがんを治療するために使用することができる。例えば、本明細書に記載されるCRISPR関連タンパク質は、異常であり(例えば、点変異を含むか、又は代替的にスプライシングされ)、がん細胞においてがん細胞における細胞死を(例えば、アポトーシスを介して)誘導することが見出されるRNA分子を標的化するcrRNAでプログラミングすることができる。
更に、本明細書に記載されるCRISPR方法又はシステムはまた、対象における感染性疾患を治療するために使用することができる。例えば、本明細書に記載されるCRISPR関連タンパク質は、感染体細胞における細胞死を標的化し、誘導するために、感染体(例えば、細菌、ウイルス、寄生虫、又は原生動物)によって発現されるRNA分子を標的化するcrRNAでプログラミングすることができる。CRISPRシステムはまた、細胞内感染体が宿主対象の細胞に感染する疾患を治療するために使用され得る。感染体遺伝子によってコードされるRNA分子を標的化するようにCRISPR関連タンパク質をプログラミングすることによって、感染体で感染した細胞を標的化し、細胞死を誘導することができる。
更に、インビトロRNA感知アッセイは、特定のRNA基質を検出するために使用することができる。CRISPR関連タンパク質は、生細胞におけるRNAベースの感知に使用することができる。用途の例は、例えば、疾患特異的RNAの、感知による診断である。
ポリヌクレオチド配列を標的DNA配列中に挿入することが望ましい用途においては、挿入されるドナー配列を含むポリヌクレオチドも細胞に提供される。「ドナー配列」又は「ドナーポリヌクレオチド」とは、部位指向性修飾ポリペプチドによって誘導される開裂部位に挿入される核酸配列を意味する。ドナーポリヌクレオチドは、開裂部位でのゲノム配列に対して十分な相同性、例えば、開裂部位に隣接する、例えば、開裂部位の約50塩基以下以内、例えば、約30塩基以内、約15塩基以内、約10塩基以内、約5塩基以内、又は開裂部位に直接隣接するヌクレオチド配列と70%、80%、85%、90%、95%、又は100%の相同性を含有し、それと相同性を有するゲノム配列との間の相同性指向性修復を支持する。約25、50、100、若しくは200ヌクレオチド、又は200ヌクレオチド超の、ドナーとゲノム配列との間の配列相同性(又は10~200ヌクレオチド以上の任意の整数値)は、相同性指向性修復を支持するであろう。ドナー配列は、任意の長さ、例えば、10ヌクレオチド以上、50ヌクレオチド以上、100ヌクレオチド以上、250ヌクレオチド以上、500ヌクレオチド以上、1000ヌクレオチド以上、5000ヌクレオチド以上などであり得る。
ドナー配列は、典型的には、置換するゲノム配列と同一ではない。むしろ、ドナー配列は、相同性指向性修復を支持するのに十分な相同性が存在する限り、ゲノム配列に関して、少なくとも1つ以上の単一塩基変化、挿入、欠失、逆位、又は転位を含み得る。一部の実施形態では、ドナー配列は、標的DNA領域と2つの隣接配列との間の相同性指向性修復が標的領域に非相同配列の挿入をもたらすように、2つの相同領域と隣接する非相同配列を含む。ドナー配列はまた、目的のDNA領域に相同ではなく、目的のDNA領域への挿入を意図していない配列を含有するベクター骨格を含んでもよい。概して、ドナー配列の相同領域は、組換えが所望されるゲノム配列と少なくとも50%の配列同一性を有するであろう。特定の実施形態では、60%、70%、80%、90%、95%、98%、99%、又は99.9%の配列同一性が存在する。ドナーポリヌクレオチドの長さに応じて、1%~100%の任意の値の配列同一性が存在し得る。
ドナー配列は、ゲノム配列と比較して特定の配列の差異、例えば、制限部位、ヌクレオチド多型、選択可能なマーカー(例えば、薬剤耐性遺伝子、蛍光タンパク質、酵素など)などを含み得、これらは、開裂部位でのドナー配列の挿入の成功を評価するために使用され得るか、又は場合によっては、他の目的のために(例えば、標的化されたゲノム遺伝子座での発現を示すために)使用され得る。いくつかの場合では、コード領域に位置する場合、そのようなヌクレオチド配列の差異は、アミノ酸配列を変化させないか、又はサイレントアミノ酸変化(すなわち、タンパク質の構造又は機能に影響を与えない変化)を行うであろう。代替的に、これらの配列の差異には、マーカー配列の除去のために後で活性化され得るFLP、loxP配列などの隣接組換え配列が含まれ得る。
ドナー配列は、一本鎖DNA、一本鎖RNA、二本鎖DNA、又は二本鎖RNAとして細胞に提供され得る。細胞内に直鎖状形態又は環状形態で導入され得る。直鎖状形態で導入された場合、ドナー配列の末端は、当業者に既知の方法によって(例えば、エキソヌクレオチド分解から)保護され得る。例えば、1つ以上のジデオキシヌクレオチド残基が直鎖状分子の3´末端に付加され、かつ/又は自己相補性オリゴヌクレオチドが一方又は両方の末端にライゲーションされる。外因性ポリヌクレオチドを分解から保護するための追加の方法としては、末端アミノ基の付加、並びに例えば、ホスホロチオエート、ホスホルアミデート、並びにO-メチルリボース又はデオキシリボース残基などの修飾されたヌクレオチド間連結の使用が挙げられるが、これらに限定されない。直鎖状ドナー配列の末端を保護する代替として、配列の追加の長さは、組換えに影響を与えることなく分解され得る相同性の領域の外側に含まれてもよい。ドナー配列は、例えば、複製起点、プロモーター、及び抗生物質耐性をコードする遺伝子などの追加の配列を有するベクター分子の一部として細胞に導入され得る。更に、ドナー配列は、DNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドをコードする核酸について上に記載されるように、裸の核酸として、リポソーム若しくはポロキサマーなどの薬剤と複合体化された核酸として導入され得るか、又はウイルス(例えば、アデノウイルス、AAV)によって送達され得る。
上に記載の方法に従って、エクスビボで目的のDNA領域を開裂及び修飾、すなわち、「遺伝子組換え」し得る。一部の実施形態では、選択可能なマーカーが目的のDNA領域に挿入されている場合と同様に、細胞の集団は、遺伝子組換え細胞を残りの集団から分離することによって、遺伝子組換えを含むものに対して濃縮され得る。濃縮する前に、「遺伝子組換え」細胞は、細胞集団の約1%以上(例えば、2%以上、3%以上、4%以上、5%以上、6%以上、7%以上、8%以上、9%以上、10%以上、15%以上、又は20%以上)しか構成しない可能性がある。「遺伝子組換え」細胞の分離は、使用される選択可能なマーカーに適切な任意の好都合な分離技術によって達成され得る。例えば、蛍光マーカーが挿入されている場合、細胞は、蛍光活性化細胞選別によって分離され得、細胞表面マーカーが挿入されている場合、細胞は、親和性分離技術、例えば、磁気分離、親和性クロマトグラフィー、固体マトリックスに親和性試薬が結合した「パニング」、又は他の好都合な技術によって、不均一集団から分離され得る。正確な分離を提供する技法としては、蛍光活性化細胞選別機が挙げられ、これは、複数のカラーチャネル、低角及び鈍角光散乱検出チャネル、インピーダンスチャネルなどのような、変動する洗練度を有することができる。細胞は、死細胞と関連する色素(例えば、ヨウ化プロピジウム)を用いることによって、死細胞に対して選択され得る。遺伝子修飾された細胞の生存率に過度に有害ではない任意の技法が用いられ得る。修飾されたDNAを含む細胞に対して高度に濃縮された細胞組成物は、この様式で達成される。「高度に濃縮された」とは、遺伝子組換え細胞が、細胞組成物の70%以上、75%以上、80%以上、85%以上、90%以上、例えば、約95%以上、又は98%以上であることを意味する。言い換えれば、組成物は、遺伝子組換え細胞の実質的に純粋な組成物であり得る。
本明細書に記載の方法によって産生される遺伝子組換え細胞は、直ちに使用され得る。代替的に、細胞を、液体窒素温度で凍結し、長時間保管し、解凍して再利用可能であり得る。かかる場合、細胞は、通常、10%のジメチルスルホキシド(DMSO)、50%の血清、40%の緩衝培地、又はかかる凍結温度で細胞を保存するために当該技術分野で一般的に使用されるいくつかの他のかかる溶液中で凍結され、凍結された培養細胞を解凍するために当該技術分野で一般的に既知の様式で解凍される。
遺伝子組換え細胞は、様々な培養条件下で、インビトロで培養され得る。細胞は、培養で増殖し得る、すなわち、細胞の増殖を促進する条件下で増殖し得る。培養培地は、例えば、寒天、メチルセルロースなどを含有する、液体又は半固体であり得る。細胞集団は、通常、ウシ胎仔血清(約5~10%)、
L-グルタミン、チオール、特に2-メルカプトエタノール、及び抗生物質、例えば、ペニシリン及びストレプトマイシンが補充された、Iscoveの改変DMEM又はRPMI1640などの適切な栄養培地に懸濁され得る。培養物は、制御性T細胞が応答性である成長因子を含有し得る。本明細書で定義される成長因子は、膜貫通受容体に対する特定の効果を介して、培養物中又は無傷の組織中のいずれかで、細胞の生存、増殖及び/又は分化を促進することができる分子である。成長因子には、ポリペプチド及び非ポリペプチド因子が含まれる。
L-グルタミン、チオール、特に2-メルカプトエタノール、及び抗生物質、例えば、ペニシリン及びストレプトマイシンが補充された、Iscoveの改変DMEM又はRPMI1640などの適切な栄養培地に懸濁され得る。培養物は、制御性T細胞が応答性である成長因子を含有し得る。本明細書で定義される成長因子は、膜貫通受容体に対する特定の効果を介して、培養物中又は無傷の組織中のいずれかで、細胞の生存、増殖及び/又は分化を促進することができる分子である。成長因子には、ポリペプチド及び非ポリペプチド因子が含まれる。
このように遺伝子組換えされた細胞は、例えば、疾患を治療するために、若しくは抗ウイルス薬、抗病原薬、又は抗がん治療薬として、遺伝子治療などの目的のために、農業における遺伝子組換え生物の産生のために、又は生物学的研究のために、対象に移植され得る。対象は、新生児、若年者、又は成人であり得る。特に目的であるのは、哺乳動物の対象である。本方法で治療され得る哺乳動物種としては、イヌ及びネコ、ウマ、ウシ、ヒツジなど、並びに霊長類、特にヒトが含まれる。動物モデル、特に小型哺乳動物(例えば、マウス、ラット、モルモット、ハムスター、ラゴモルファ(例えば、ウサギ)など)を実験調査のために使用してもよい。
細胞は、対象に単独で、又は、例えば、細胞が移植される組織内の細胞の成長及び/又は組織化を支持するための好適な基質若しくはマトリックスとともに、提供され得る。通常、少なくとも1×103個の細胞、例えば、5×103個の細胞、1×104個の細胞、5×104個の細胞、1×105個の細胞、1×106個の細胞以上が投与されるであろう。細胞は、以下の経路、非経口、皮下、静脈内、頭蓋内、脊髄内、眼内、又は脊髄液中のうちのいずれかを介して対象に導入され得る。細胞は、注射、カテーテルなどによって導入され得る。細胞はまた、トランスジェニック動物(例えば、トランスジェニックマウス)を生成する目的のために、胚(例えば、胚盤胞)に導入されてもよい。
対象への治療の投与回数は変化し得る。遺伝子組換え細胞を対象内に導入することは、1回の事象であってもよいが、特定の状況においては、かかる治療は、限られた期間にわたって改善を誘発し、一連の継続的な反復治療を必要とする場合がある。他の状況においては、効果が観察される前に、遺伝子修飾細胞の複数回投与が必要とされる場合がある。正確なプロトコルは、疾患又は状態、疾患のステージ、及び治療される個々の対象のパラメータに依存する。
本発明の他の態様では、例えば、疾患を治療するために、又は抗ウイルス薬、抗病原薬、若しくは抗がん治療薬として、遺伝子治療などの目的のために、農業における遺伝子組換え生物の産生のために、又は生物学的研究のために、再び、DNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドが用いられ、細胞DNAをインビボで修飾する。これらのインビボ実施形態では、DNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドは、個体に直接投与される。DNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドは、ペプチド、小分子及び核酸の対象への投与のための当該技術分野におけるいくつかの周知の方法のうちのいずれかによって投与され得る。DNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドは、様々な製剤に組み込まれ得る。より具体的には、本発明のDNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドは、適切な薬学的に許容される担体又は希釈剤との組み合わせによって薬学的組成物に製剤化され得る。
薬学的調製物は、薬学的に許容されるビヒクルに存在する1つ以上のDNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドを含む組成物である。「薬学的に許容されるビヒクル」とは、連邦又は州政府の規制機関によって承認された、又は米国においてリスト化されたビヒクルであり得る。
薬局方又はヒトなどの哺乳動物において使用するための他の一般に認められた薬局方。「ビヒクル」という用語は、哺乳動物に投与するために本発明の化合物が製剤化される希釈剤、アジュバント、賦形剤、又は担体を指す。かかる薬学的ビヒクルは、脂質、例えば、リポソーム、例えば、リポソームデンドリマー;水、並びに、ピーナッツ油、大豆油、鉱油、ゴマ油などの石油起源、動物起源、植物起源、又は合成起源のものを含む油、生理食塩水などの液体;アカシアゴム、ゼラチン、デンプンペースト、タルク、ケラチン、コロイドシリカ、尿素などであり得る。加えて、補助剤、安定化剤、増粘剤、潤滑剤、及び着色剤を使用してもよい。薬学的組成物は、錠剤、カプセル剤、粉末剤、顆粒剤、軟膏剤、溶液剤、坐剤、注射剤、吸入剤、ゲル剤、微粒子剤、及びエアロゾル剤などの固体、半固体、液体又は気体形態の調製物に製剤化され得る。したがって、DNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドの投与は、経口、口腔、直腸、非経口、腹腔内、皮内、経皮、気管内、眼内などの投与を含む様々な方式で達成され得る。活性剤は、投与後に全身性であってもよく、又は、局所投与の使用、壁内投与、又は移植部位に活性用量を保持するように作用するインプラントの使用によって局所的であってもよい。活性剤は、即時活性のために製剤化され得るか、又は持続放出のために製剤化され得る。
いくつかの状態、特に中枢神経系の状態の場合、血液脳関門(BBB)を通過するための薬剤を製剤化する必要がある場合がある。血液脳関門(BBB)を介した薬物送達のための1つの戦略は、マンニトール又はロイコトリエンなどの浸透手段によって、又は生化学的にブラジキニンなどの血管作用性物質の使用によってのいずれかで、BBBの破壊を伴う。BBB開口部を使用して特定の薬剤を脳腫瘍に標的化する可能性も1つの選択肢である。BBB破壊剤は、組成物が血管内注射によって投与されるときに、本発明の治療用組成物と共投与され得る。BBBを通過するための他の戦略には、カベオリン1媒介性トランスサイトーシス、グルコース及びアミノ酸担体などの担体媒介性トランスポーター、インスリン又はトランスフェリンの受容体媒介性トランスサイトーシス、並びにp-糖タンパク質などの活性流出トランスポーターを含む、内因性トランスポーターシステムの使用を伴ってもよい。血管の内皮壁を横断する輸送を容易にするために、能動輸送部分もまた本発明において使用するための治療用化合物にコンジュゲートされてもよい。
代替的に、BBBの背後への治療薬の薬物送達は、局所送達、例えば、くも膜下腔内送達によってであってもよい。
典型的には、有効量のDNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドが提供される。エクスビボ方法に関して上で考察されたように、DNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドの有効量又は有効用量は、陰性対照、例えば、空のベクター又は無関係なポリペプチドと接触させた細胞と比較して、2つの相同配列間で観察される組換えの量の2倍以上の増加を誘導する量である。組換えの量は、例えば、上に記載され、当該技術分野において知られる、任意の便利な方法によって測定され得る。投与されるDNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドの有効量又は有効用量の計算は、当業者の技能の範囲内であり、当業者にとっては日常的である。投与される最終量は、投与経路及び治療される障害又は状態の性質に依存する。
特定の患者に与えられる有効量は、様々な要因に依存し、そのうちのいくつかは患者ごとに異なる。有能な臨床医は、必要に応じて疾患状態の進行を停止又は逆転させるために、患者に投与する治療剤の有効量を決定することができるであろう。LD50動物データ、及び薬剤についての利用可能な他の情報を利用して、臨床医は、投与経路に応じて、個体の最大安全用量を決定することができる。例えば、静脈内投与される用量は、治療用組成物が投与される流体のより大きい体積を考えると、髄腔内投与される用量よりも多い場合がある。同様に、治療濃度を維持するために、身体から急速に除去される組成物は、より高い用量で、又は反復用量で投与されてもよい。通常の技術を利用して、有能な臨床医は、日常的な臨床試験の過程で特定の治療薬の投薬量を最適化することができるであろう。
薬剤に含めるために、DNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドは、好適な商業的供給源から入手し得る。一般的な提案として、用量当たりの非経口的に投与されるDNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドの総薬学的有効量は、用量応答曲線によって測定され得る範囲にある。
DNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドに基づく療法、すなわち、治療的投与に使用されるDNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドの調製物は、無菌である必要がある。滅菌性は、滅菌濾過膜(例えば、0.2μm膜)を通した濾過によって容易に達成される。治療用組成物は、概して、滅菌取り出し口を有する容器、例えば、皮下注射針によって貫通可能なストッパーを有する静脈注射用溶液バッグ又はバイアルに配置される。DNA標的化RNA及び/又は部位指向性修飾ポリペプチド及び/又はドナーポリヌクレオチドに基づく療法は、水溶液として、又は再構築のための凍結乾燥製剤として、単位用量又は複数用量容器、例えば、密封アンプル又はバイアルに保管され得る。凍結乾燥製剤の例として、10mLのバイアルを、5mlの滅菌濾過1%(w/v)の化合物の水溶液で充填し、得られた混合物を凍結乾燥する。注入溶液は、静菌注射用水を使用して凍結乾燥化合物を再構成することによって調製される。
薬学的組成物は、所望の製剤に応じて、動物又はヒト投与のための薬学的組成物を製剤化するために一般的に使用されるビヒクルとして定義される希釈剤の薬学的に許容される非毒性の担体を含むことができる。希釈剤は、組み合わせの生物学的活性に影響を与えないように選択される。かかる希釈剤の例は、蒸留水、緩衝水、生理食塩水、PBS、リンゲル溶液、デキストロース溶液、及びハンクス溶液である。加えて、薬学的組成物又は製剤は、他の担体、アジュバント、又は非毒性、非治療用、非免疫原性安定剤、賦形剤などを含み得る。組成物はまた、pH調整剤及び緩衝剤、毒性調整剤、湿潤剤並びに洗剤などの、生理学的条件に近似する追加の物質を含み得る。
組成物はまた、例えば抗酸化物質などの様々な安定化剤のうちのいずれも含み得る。薬学的組成物がポリペプチドを含む場合、ポリペプチドは、ポリペプチドのインビボでの安定性を増強するか、又はそれ以外の場合、その薬理学的特性を増強する(例えば、ポリペプチドの半減期を増加させ、その毒性を低減し、溶解性又は取り込みを増強する)様々な周知の化合物と複合体化され得る。そのような修飾又は複合体化剤の例としては、サルフェート、グルコネート、シトレート及びホスフェートが挙げられる。組成物の核酸又はポリペプチドはまた、それらのインビボ属性を増強する分子と複合体化され得る。そのような分子には、例えば、炭水化物、ポリアミン、アミノ酸、他のペプチド、イオン(例えば、ナトリウム、カリウム、カルシウム、マグネシウム、マンガン)、及び脂質が含まれる。
薬学的組成物は、予防的及び/又は治療的処置のために投与され得る。活性成分の毒性及び治療有効性を、例えば、LD50(集団の50%に対して致死的な用量)及びED50(集団の50%に対して治療的に有効な用量)を決定することを含む、細胞培養物及び/又は実験動物における標準的な薬学的手順に従って決定し得る。毒性効果と治療効果との間の用量比は、治療指標であり、それは、比LD50/ED50として表すことができる。大きい治療指標を示す療法が好ましい。
細胞培養及び/又は動物研究から得られたデータを、ヒトについての投薬量の範囲の製剤化において使用することができる。活性成分の投薬量は、典型的には、低毒性のED50を含む循環濃度の範囲内のラインである。投薬量は、用いられる剤形及び利用される投与経路に依存して、この範囲内で変化し得る。
薬学的組成物を製剤化するために使用される成分は、高純度であることが好ましく、潜在的に有害な汚染物質を実質的に含まない(例えば、少なくともナショナルフード(NF)グレード、概して少なくとも分析グレード、及びより典型的には少なくとも医薬グレード)。更に、インビボでの使用を意図した組成物は、通常、無菌である。所与の化合物を使用する前に合成しなければならない範囲で、得られる産物は、典型的には、合成又は精製プロセス中に存在し得る任意の潜在的な毒性剤、特に任意のエンドトキシンを実質的に含まない。親投与のための組成物はまた、無菌であり、実質的に等張性であり、GMP条件下で作製される。
送達システム
本明細書に記載されるCRISPRシステム、若しくはその成分、その核酸分子、及び/又はその成分をコード若しくは提供する核酸分子、CRISPR関連タンパク質、又はRNAガイドは、ベクター、例えば、プラスド及び送達ベクターなどの様々な送達システムによって送達することができる。例示的な実施形態は、以下に記載される。CRISPRシステム(例えば、本明細書に記載される核酸塩基エディターを含むCas9を含む)は、ウイルスベクターに含有される核酸でコードすることができる。ウイルスベクターとしては、レンチウイルス、アデノウイルス、レトロウイルス、及びアデノ随伴ウイルス(AAV)が挙げられ得る。ウイルスベクターは、用途に基づいて選択することができる。例えば、AAVは、それらの軽度の免疫原性のために、インビボでの遺伝子送達に一般的に使用される。アデノウイルスは、それらが強い免疫原性応答を誘導するため、ワクチンとして一般的に使用される。ウイルスベクターのパッケージング容量は、ベクターにパッケージングされ得る塩基エディターのサイズを制限し得る。例えば、AAVのパッケージング容量は、2つの145塩基逆位末端反復(ITR)を含む約4.5kbである。
本明細書に記載されるCRISPRシステム、若しくはその成分、その核酸分子、及び/又はその成分をコード若しくは提供する核酸分子、CRISPR関連タンパク質、又はRNAガイドは、ベクター、例えば、プラスド及び送達ベクターなどの様々な送達システムによって送達することができる。例示的な実施形態は、以下に記載される。CRISPRシステム(例えば、本明細書に記載される核酸塩基エディターを含むCas9を含む)は、ウイルスベクターに含有される核酸でコードすることができる。ウイルスベクターとしては、レンチウイルス、アデノウイルス、レトロウイルス、及びアデノ随伴ウイルス(AAV)が挙げられ得る。ウイルスベクターは、用途に基づいて選択することができる。例えば、AAVは、それらの軽度の免疫原性のために、インビボでの遺伝子送達に一般的に使用される。アデノウイルスは、それらが強い免疫原性応答を誘導するため、ワクチンとして一般的に使用される。ウイルスベクターのパッケージング容量は、ベクターにパッケージングされ得る塩基エディターのサイズを制限し得る。例えば、AAVのパッケージング容量は、2つの145塩基逆位末端反復(ITR)を含む約4.5kbである。
AAVは、パルボウイルス科に属する小型の一本鎖DNA依存性ウイルスである。4.7kbの野生型(wt)AAVゲノムは、それぞれ4つの複製タンパク質と3つのカプシドタンパク質とをコードする2つの遺伝子で構成され、両側に145bpの逆位末端反復(ITR)が隣接している。ビリオンは、3つのカプシドタンパク質であるVp1、Vp2、及びVp3から構成され、同じオープンリーディングフレームから1:1:10の比率で生成されるが、差次的スプライシング(Vp1)及び選択的翻訳開始部位(それぞれ、Vp2及びVp3)から産生される。Vp3は、ビリオン内で最も豊富なサブユニットであり、ウイルスのトロピズムを定義する細胞表面での受容体認識に関与する。ウイルス感染性において機能するホスホリパーゼドメインは、Vp1の固有のN末端に特定されている。
wtAAVと同様に、組換えAAV(rAAV)は、隣接ベクター導入遺伝子カセットに対する145bpのシス作用性ITRを利用し、外来DNAのパッケージングのために最大4.5kbを提供する。感染後、rAAVは、本発明の融合タンパク質を発現することができ、環状ヘッド・トゥ・テール(head-to-tail)コンカテマーでエピソーム的に存在することによって、宿主ゲノムに組み込まれることなく持続する。このシステムをインビトロ及びインビボで使用したrAAVの成功例は多数あるが、遺伝子のコード配列の長さがwtAAVゲノムと同等又はそれ以上である場合、パッケージング容量の制限により、AAV媒介性遺伝子送達の使用が制限される。
AAVベクターの小さなパッケージング容量は、このサイズを超えるいくつかの遺伝子の送達及び/又は大きな生理学的調節エレメントの使用を困難にする。これらの課題は、例えば、送達されるタンパク質を2つ以上の断片に分割することによって対処することができ、N末端断片は、スプリットインテイン-Nに融合され、C末端断片は、スプリットインテイン-Cに融合される。次いで、これらの断片は、2つ以上のAAVベクターにパッケージングされる。本明細書で使用される場合、「インテイン」とは、隣接するN末端及びC末端エクステイン(例えば、結合する断片)をライゲートする自己スプライシングタンパク質イントロン(例えば、ペプチド)を指す。異種タンパク質断片を連結するための特定のインテインの使用は、例えば、Wood et al.,J.Biol.Chem.289(21);14512-9(2014)に記載されている。インテインのIntN及びIntCは、例えば、タンパク質断片を分離するために融合された場合、互いを認識し、それらがスプライシングで除かれ、同時に、それらが融合されたタンパク質断片の隣接するN末端エクステイン及びC末端エクステインがライゲーションされ、それによって、2つのタンパク質断片から全長タンパク質が再構成される。他の好適なインテインは、当業者には明らかであろう。
一部の実施形態では、本発明のCRISPRシステムは、長さが変動することができる。一部の実施形態では、タンパク質断片は、2アミノ酸長~約1000アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約5アミノ酸長~約500アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約20アミノ酸長~約200アミノ酸長の範囲である。一部の実施形態では、タンパク質断片は、約10アミノ酸長~約100アミノ酸長の範囲である。他の長さの好適なタンパク質断片は、当業者には明らかであろう。
一部の実施形態では、ヌクレアーゼ(例えば、Cas9)の一部分又は断片がインテインに融合される。ヌクレアーゼは、インテインのN末端又はC末端に融合され得る。一部の実施形態では、融合タンパク質の一部分又は断片は、インテインに融合され、AAVカプシドタンパク質に融合される。インテイン、ヌクレアーゼ、及びカプシドタンパク質は、任意の配置(例えば、ヌクレアーゼ-インテイン-カプシド、インテイン-ヌクレアーゼ-カプシド、カプシド-インテイン-ヌクレアーゼなど)で一緒に融合され得る。一部の実施形態では、インテインのN末端は、融合タンパク質のC末端に融合され、インテインのC末端は、AAVカプシドタンパク質のN末端に融合される。
一実施形態では、デュアルAAVベクターは、大きな導入遺伝子発現カセットを2つの別々の半分(5’末端及び3’末端、又は頭部及び尾部)に分割することによって生成され、カセットの各半分は、単一のAAVベクター(5kb未満)にパッケージングされる。次いで、全長の導入遺伝子発現カセットの再構築は、両方のデュアルAAVベクター、続いて、(1)5’ゲノムと3’ゲノムとの間の相同組換え(HR)(デュアルAAV重複ベクター)、(2)5’ゲノムと3’ゲノムとのITR媒介性テール・トゥ・ヘッド(tail-to-head)コンカテマー化(デュアルAAVトランススプライシングベクター)、又は(3)これらの2つの機構の組み合わせ(デュアルAAVハイブリッドベクター)によって同じ細胞を同時感染させると達成される。インビボでのデュアルAAVベクターの使用は、全長タンパク質の発現をもたらす。デュアルAAVベクタープラットフォームの使用は、サイズが4.7kb超の導入遺伝子のための効率的かつ実行可能な遺伝子導入戦略を表す。
本明細書に記載されるCas9を含むCRISPRシステムを設計するための開示された戦略は、ウイルスベクターにパッケージングすることができるCRISPRシステムを生成するために有用であり得る。塩基エディターの送達のためのRNA又はDNAウイルスベースのシステムの使用は、培養物中又は宿主内の特定の細胞にウイルスを標的化し、ウイルスペイロードを核又は宿主細胞ゲノムに輸送するための高度に進化したプロセスを利用する。ウイルスベクターは、培養物中の細胞、患者に(インビボで)直接投与することができ、又は、インビトロで細胞を処理するためにそれらを使用することができ、修飾細胞は、任意選択的に(エクスビボで)患者に投与され得る。従来のウイルスベースのシステムは、遺伝子導入用のレトロウイルス、レンチウイルス、アデノウイルス、アデノ随伴ウイルス、及び単純ヘルペスウイルスのベクターを含み得る。宿主ゲノムへの組み込みは、レトロウイルス、レンチウイルス、及びアデノ随伴ウイルスの遺伝子導入法で可能であり、多くの場合、挿入された導入遺伝子の長期発現をもたらす。追加的に、多くの異なる細胞型及び標的組織での高い形質導入効率が観察されている。
外来のエンベロープタンパク質を組み込み、標的細胞の潜在的な標的集団を拡大することによって、レトロウイルスのトロピズムを変化させることができる。レンチウイルスベクターは、非分裂細胞を形質導入又は感染させることができ、典型的には、高いウイルス力価を生成するレトロウイルスベクターである。したがって、レトロウイルス遺伝子導入システムの選択は、標的組織に依存することになる。レトロウイルスベクターは、最大6~10kbの外来配列のパッケージング能力を有する、シス作用型の長い末端反復から構成される。最小のシス作用LTRは、ベクターの複製及びパッケージングに十分であり、次いで、療法的遺伝子を標的細胞に統合して永続的な導入遺伝子発現を提供するために使用される。広く使用されているレトロウイルスベクターとしては、マウス白血病ウイルス(MuLV)、テナガザル白血病ウイルス(GaLV)、サル免疫不全ウイルス(SIV)、ヒト免疫不全ウイルス(HIV)、及びこれらの組み合わせに基づくものが挙げられる(例えば、Buchscher et al.,J.Virol.66:2731-2739(1992)、Johann et al.,J.Virol.66:1635-1640(1992)、Sommnerfelt et al.,Virol.176:58-59(1990)、Wilson et al.,J.Virol.63:2374-2378(1989)、Miller et al.,J.Virol.65:2220-2224(1991)、PCT/US94/05700を参照されたい)。
レトロウイルスベクター、特に、レンチウイルスベクターは、標的細胞への効率的な組み込みのために、所与の長さよりも小さいポリヌクレオチド配列を必要とし得る。例えば、9kbを超える長さのレトロウイルスベクターは、より小さいサイズのものと比較して、低いウイルス力価をもたらし得る。いくつかの態様では、本開示のCRISPRシステム(例えば、本明細書に開示されるCas9を含む)は、効率的なパッケージング及びレトロウイルスベクターを介した標的細胞への送達を可能にするように十分なサイズである。いくつかの実施形態では、Cas9は、ガイド核酸及び/又は標的化可能なヌクレアーゼシステムの他の成分と一緒に発現されるときでも、効率的なパッキング及び送達を可能にするようなサイズである。
一過的な発現が好ましい用途では、アデノウイルスベースのシステムを使用することができる。アデノウイルスベースのベクターは、多くの細胞型において非常に高い形質導入効率を有することが可能であり、細胞分裂を必要としない。このようなベクターを用いて、高い力価及び発現レベルが得られている。このベクターは、比較的単純なシステムで大量に産生され得る。アデノ随伴ウイルス(「AAV」)ベクターは、例えば、核酸及びペプチドのインビトロ産生において、インビボ及びエクスビボ遺伝子療法手順のために、標的核酸を用いて細胞を形質導入するために使用することもできる(例えば、West et al.,Virology160:38-47(1987)、米国特許第4,797,368号、WO93/24641、Kotin,Human Gene Therapy5:793-801(1994)、Muzyczka,J.Clin.Invest.94:1351(1994)を参照されたい)。組換えAAVベクターの構築は、いくつかの刊行物に記載されており、米国特許第5,173,414号、Tratschin et al.,Mol.Cell.Biol.5:3251-3260(1985)、Tratschin,et al.,Mol.Cell.Biol.4:2072-2081(1984)、Hermonat&Muzyczka,PNAS81:6466-6470(1984)、及びSamulski et al.,J.Virol.63:03822-3828(1989)が挙げられる。
したがって、本明細書に記載されるCRISPRシステム(例えば、本明細書に開示されるCas9を含む)は、ウイルスベクターと送達することができる。塩基エディターシステムの1つ以上の成分は、1つ以上のウイルスベクター上にコードすることができる。例えば、塩基エディター及びガイド核酸は、単一のウイルスベクター上にコードされ得る。他の場合では、塩基エディター及びガイド核酸は、異なるウイルスベクター上にコードされる。いずれの場合も、塩基エディター及びガイド核酸は、各々、プロモーター及びターミネーターに作動可能に結合され得る。
ウイルスベクター上にコードされる成分の組み合わせは、選択されたウイルスベクターのカーゴサイズ制約によって決定され得る。
塩基エディターの非ウイルス送達
CRISPRのための非ウイルス送達アプローチも利用可能である。非ウイルス核酸ベクターの1つの重要なカテゴリーは、ナノ粒子であり、有機又は無機であり得る。ナノ粒子は、当該技術分野で周知である。任意の好適なナノ粒子設計を使用して、ゲノム編集システムの成分、又はかかる成分をコードする核酸を送達することができる。例えば、有機(例えば脂質及び/又はポリマー)ナノ粒子は、本開示の特定の実施形態では、送達ビヒクルとして使用するのに好適であり得る。ナノ粒子製剤、及び/又は遺伝子導入における使用のための例示的な脂質を表5(以下)に示す。
CRISPRのための非ウイルス送達アプローチも利用可能である。非ウイルス核酸ベクターの1つの重要なカテゴリーは、ナノ粒子であり、有機又は無機であり得る。ナノ粒子は、当該技術分野で周知である。任意の好適なナノ粒子設計を使用して、ゲノム編集システムの成分、又はかかる成分をコードする核酸を送達することができる。例えば、有機(例えば脂質及び/又はポリマー)ナノ粒子は、本開示の特定の実施形態では、送達ビヒクルとして使用するのに好適であり得る。ナノ粒子製剤、及び/又は遺伝子導入における使用のための例示的な脂質を表5(以下)に示す。
表6は、遺伝子導入及び/又はナノ粒子製剤における使用のための例示的なポリマーを列挙する。
表7は、本明細書に記載されるCas9をコードするポリヌクレオチドのための送達方法を要約する。
別の態様では、ゲノム編集システム成分又はかかる成分をコードする核酸、例えば、任意選択的に生物学的活性を有するポリペプチド(例えば、核酸塩基エディター)に融合した、例えば、Cas9又はそのバリアントなどの核酸結合タンパク質、及び目的のゲノム核酸配列を標的とするgRNAの送達は、リボ核タンパク質(RNP)を細胞に送達することによって達成され得る。RNPは、標的gRNAとの複合体中に、核酸結合タンパク質(例えば、Cas9)を含む。RNPは、例えば、Zuris,J.A.et al.,2015,Nat.Biotechnology,33(1):73-80によって報告されているように、エレクトロポレーション、ヌクレオフェクション、又はカチオン性脂質媒介性の方法などの既知の方法を使用して細胞に送達され得る。RNPは、CRISPR塩基エディターシステムでの使用に有利であり、特に、トランスフェクトが困難な細胞(例えば、初代細胞)に有利である。加えて、RNPはまた、特に、CRISPRプラスミドにおいて使用され得る真核生物プロモーター(例えば、CMV又はEF1A)が十分に発現していない場合、細胞内のタンパク質発現で生じ得る困難を緩和することができる。有利には、RNPの使用は、細胞内への外来DNAの送達を必要としない。更に、核酸結合タンパク質とgRNA複合体とを含むRNPは、時間とともに分解されるため、RNPの使用は、オフターゲット効果を制限する可能性がある。プラスミドベースの技術の場合と同様の様式で、RNPを使用して、結合タンパク質(例えば、Cas9バリアント)を送達し、相同組換え修復(HDR)を誘導することができる。
CRISPRシステム(例えば、本明細書に記載されるCas9を含む)を駆動するために使用されるプロモーターは、AAV ITRを含むことができる。これは、ベクター内の空間を占有し得る追加のプロモーターエレメントの必要性を排除するために有利であり得る。解放された追加の空間を使用して、追加のエレメント(例えば、ガイド核酸又は選択可能なマーカー)の発現を駆動することができる。ITR活性は比較的弱いため、選択されたヌクレアーゼの過剰発現による潜在的な毒性を低減するために使用することができる。
任意の好適なプロモーターを使用して、Cas9及び該当する場合、ガイド核酸の発現を駆動し得る。遍在的な発現の場合、使用され得るプロモーターとしては、CMV、CAG、CBh、PGK、SV40、フェリチン重鎖又は軽鎖などが挙げられる。脳又は他のCNS細胞での発現の場合、好適なプロモーターとしては、全てのニューロンに対してシナプシンI、興奮性ニューロンに対してCaMKIIα、GABA作動性ニューロンに対してGAD67若しくはGAD65又はVGATなどが挙げられ得る。肝細胞での発現の場合、好適なプロモーターとしては、アルブミンプロモーターが挙げられる。肺細胞での発現の場合、好適なプロモーターとしては、SP-Bが挙げられ得る。内皮細胞の場合、好適なプロモーターとしては、ICAMが挙げられ得る。造血細胞の場合、好適なプロモーターとしては、IFNβ又はCD45が挙げられ得る。骨芽細胞の場合、好適なプロモーターとしては、OG-2が挙げられ得る。
いくつかの場合では、本開示のCas9は、別個のプロモーターが、同じ核酸分子内の塩基エディター及び適合性ガイド核酸の発現を駆動することを可能にするのに十分に小さいサイズのものである。例えば、ベクター又はウイルスベクターは、塩基エディターをコードする核酸に作動可能に結合された第1のプロモーターと、ガイド核酸に作動可能に結合された第2のプロモーターとを含むことができる。
ガイド核酸の発現を駆動するために使用されるプロモーターとしては、U6又はH1などのPolIIIプロモーターが挙げられ得る gRNAアデノ随伴ウイルス(AAV)を発現するには、PolIIプロモーター及びイントロンカセットの使用。
1つ以上のガイド核酸を含む又は含まない本明細書に記載されるCas9は、アデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルス、又は他のプラスミド若しくはウイルスベクタータイプを使用して、特に、例えば、米国特許第8,454,972号(アデノウイルスのための製剤、用量)、米国特許第8,404,658号(AAVのための製剤、用量)、及び米国特許第5,846,946号(DNAプラスミドのための製剤、用量)からの、並びにレンチウイルス、AAV、及びアデノウイルスを伴う臨床試験に関する臨床試験及び刊行物からの、製剤及び用量を使用して送達することができる。例えば、AAVの場合、投与経路、製剤、及び用量は、米国特許第8,454,972号及びAAVを伴う臨床試験と同様であり得る。アデノウイルスの場合、投与経路、製剤、及び用量は、米国特許第8,404,658号及びアデノウイルスを伴う臨床試験と同様であり得る。プラスミド送達の場合、投与経路、製剤、及び用量は、米国特許第5,846,946号及びプラスミドを伴う臨床試験と同様であり得る。用量は、平均70kgの個体(例えば、成人男性)に基づくか、又は推定され得、患者、対象、異なる体重及び種の哺乳動物に対して調整され得る。投与頻度は、年齢、性別、全般的な健康状態、患者若しくは対象の他の状態、及び対処される特定の状態若しくは症状を含む通常の要因に応じて、医師又は獣医(例えば、医師、獣医)の範疇である。ウイルスベクターは、目的の組織に注射され得る。細胞型特異的塩基エディターの場合、塩基エディター及び任意選択的なガイド核酸の発現は、細胞型特異的プロモーターによって駆動され得る。
インビボでの送達の場合、AAVは、他のウイルスベクターよりも有利であり得る。場合によっては、AAVは低毒性を可能にし、これは、免疫応答を活性化し得る細胞粒子の超遠心分離を必要としない精製方法に起因し得る。場合によっては、AAVは、宿主ゲノムに組み込まれないため、挿入変異誘発を引き起こす低い確率を可能にする。
AAVは4.5Kb又は4.75Kbのパッケージング制限を有する。4.5Kb又は4.75Kbを超える構築物は、ウイルス産生の著しい低下をもたらし得る。例えば、SpCas9はかなり大きく、遺伝子自体が4.1Kbを超え、AAVへのパッケージングが困難になる。したがって、本開示の実施形態は、従来のCas9よりも長さが短い開示されるCas9の利用を含む。
AAVは、AAV1、AAV2、AAV5、又はそれらの任意の組み合わせであり得る。標的化される細胞に関してAAVのタイプを選択することができ、例えば、脳又は神経細胞を標的化するためのAAV血清型1、2、5、又はハイブリッドカプシドAAV1、AAV2、AAV5、又はそれらの任意の組み合わせを選択することができ、心組織を標的化する場合、AAV4を選択することができる。AAV8は、肝臓への送達に有用である。これらの細胞に関する特定のAAV血清型の作表は、Grimm,D.et al,J.Virol.82:5887-5911(2008)に見出すことができる。
レンチウイルスは複雑なレトロウイルスであり、分裂細胞と分裂終了細胞の両方において感染し、それらの遺伝子を発現する能力を有する。最も一般的に知られているレンチウイルスは、ヒト免疫不全ウイルス(HIV)であり、他のウイルスのエンベロープ糖タンパク質を使用して、広範囲の細胞型を標的化する。
レンチウイルスは、以下のように調製することができる。pCasES10(レンチウイルス転写プラスミド骨格を含む)をクローニングした後、トランスフェクションの前日に、低継代(p=5)のHEK293FTを、10%ウシ胎仔血清を含み抗生物質を含まないDMEM中で、T-75フラスコ内で50%コンフルエンスに播種した。20時間後、培地をOptiMEM(無血清)培地に交換し、4時間後にトランスフェクションを行った。細胞を、10μgのレンチウイルス導入プラスミド(pCasES10)及び以下のパッケージングプラスミドを用いてトランスフェクトする:5μgのpMD2.G(VSV-gシュードタイプ)、及び7.5μgのpsPAX2(gag/pol/rev/tat)。トランスフェクションは、カチオン性脂質送達剤(50μlのLipofectamine2000及び100ulのPlus試薬)を含む4mLのOptiMEM中で行うことができる。6時間後、培地を、10%胎仔ウシ血清を含み抗生物質を含まないDMEMに交換する。これらの方法は、細胞培養中に血清を使用するが、無血清の方法が好ましい。
レンチウイルスは、以下のように精製することができる。ウイルス上清を48時間後に回収する。上清は、最初にデブリを除去し、0.45μmの低タンパク質結合(PVDF)フィルターを通して濾過する。次いで、超遠心分離機で、24,000rpmで2時間スピンする。ウイルスペレットを、50μlのDMEM中に、4℃で一晩再懸濁する。次いで、それらをアリコートし、-80℃ですぐに凍結する。
別の実施形態では、ウマ伝染性貧血ウイルス(EIAV)に基づく最小非霊長類レンチウイルスベクターも企図される。別の実施形態では、RetinoStat(登録商標)は、ウマ伝染性貧血ウイルスベースのレンチウイルス遺伝子療法ベクターであり、血管新生抑制タンパク質であるエンドスタチン及びアンジオスタチンを発現し、これは、網膜下注射によって送達されることが企図される。別の実施形態では、自己不活性化レンチウイルスベクターの使用が企図される。
システムの任意のRNA、例えば、ガイドRNA又はCas9コードmRNAは、RNAの形態で送達され得る。Cas9コードmRNAは、インビトロ転写を使用して生成することができる。例えば、Cas9のmRNAは、以下のエレメントを含むPCRカセットを使用して合成することができる:T7プロモーター、任意選択的なkozak配列(GCCACC)、ヌクレアーゼ配列、及び3’UTR(例えば、βグロビン-ポリAテール由来の3’UTR)。カセットは、T7ポリメラーゼによる転写に使用することができる。ガイドポリヌクレオチド(例えば、gRNA)は、T7プロモーター、続いて、配列「GG」、及びガイドポリヌクレオチド配列を含むカセットからのインビトロ転写を使用して転写することもできる。
発現を増強し、可能性のある毒性を低減するために、Cas9配列及び/又はガイド核酸は、例えば、シュードU又は5-メチルCを使用して、1つ以上の修飾ヌクレオシドを含むように修飾され得る。
本開示は、一部の実施形態では、細胞又は生物を修飾する方法を包含する。細胞は、原核細胞又は真核細胞であり得る。細胞は、哺乳動物細胞であり得る。哺乳動物細胞の多くは、非ヒト霊長類、ウシ、ブタ、げっ歯類、又はマウス細胞である。本開示の塩基エディター、組成物、及び方法によって細胞に導入される修飾は、抗体、デンプン、アルコール、又は他の所望の細胞出力などの生物学的産物の産生の改善のために細胞及び細胞の子孫が変化されるようにすることができる。本開示の方法により細胞に導入される修飾は、細胞及び細胞の子孫が、産生された生物学的産物を変化させる変化を含むようにすることができる。
システムは、1つ以上の異なるベクターを含むことができる。一態様では、Cas9は、所望の細胞型、好ましくは真核細胞、好ましくは哺乳動物細胞又はヒト細胞の発現のために、コドン最適化される。
概して、「コドン最適化」とは、天然配列の少なくとも1つのコドン(例えば、約1又は約1より大きい、2、3、4、5、10、15、20、25、50、又はそれ以上のコドン)において、天然アミノ酸配列を維持しながら、その宿主細胞の遺伝子でより頻繁に又は最も頻繁に使用されるコドンで置換することによって、目的の宿主細胞における発現を増強させるための核酸配列を修飾するプロセスを指す。様々な種は、特定のアミノ酸の特定のコドンについて特定のバイアスを示す。コドンバイアス(生物間のコドン使用の差異)は、多くの場合、メッセンジャーRNA(mRNA)の翻訳の効率と相関し、これは次いで、とりわけ、翻訳されるコドンの特性及び特定のトランスファーRNA(tRNA)分子の利用可能性に依存すると考えられている。細胞において選択されるtRNAの優位性は、概して、ペプチド合成で最も頻繁に使用されるコドンの反映である。したがって、遺伝子は、コドン最適化に基づいて所与の生物における最適な遺伝子発現のために調整され得る。コドン使用率表は、例えば、www.kazusa.orjp/codon/(2002年7月9日に参照)で入手可能な「コドン使用率データベース」で容易に入手可能であり、これらの表は、いくつかの方法で適合され得る。Nakamura,Y.,et al.“Codon usage tabulated from the international DNA sequence databases:status for the year 2000”Nucl.Acids Res.28:292(2000)を参照されたい。特定の宿主細胞における発現のために特定の配列を最適化するためのコドンに関するコンピュータアルゴリズムも利用可能であり、例えば、Gene Forge(Aptagen、Jacobus,Pa.)も利用可能である。一部の実施形態では、操作されたヌクレアーゼをコードする配列中の1つ以上のコドン(例えば、1、2、3、4、5、10、15、20、25、50、若しくはそれ以上のコドン、又は全てのコドン)は、特定のアミノ酸について最も頻繁に使用されるコドンに対応する。
パッケージング細胞は、典型的には、宿主細胞に感染することが可能なウイルス粒子を形成するために使用される。そのような細胞には、アデノウイルスをパッケージングする293細胞、及びレトロウイルスをパッケージングするpsi.2細胞又はPA317細胞が含まれる。遺伝子療法に使用されるウイルスベクターは、通常、核酸ベクターをウイルス粒子にパッケージングする細胞株を産生することによって生成される。ベクターは、典型的には、パッケージング及びその後の宿主への組み込みに必要な最小限のウイルス配列を含み、他のウイルス配列は、発現されるポリヌクレオチドのための発現カセットによって置き換えられる。欠損したウイルス機能は、典型的には、パッケージング細胞株によってトランスで供給される。例えば、遺伝子療法で使用されるAAVベクターは、典型的には、宿主ゲノムへのパッケージング及び組み込みに必要なAAVゲノム由来のITR配列のみを有する。ウイルスDNAは、他のAAV遺伝子(すなわち、rep及びcap)をコードするがITR配列を欠くヘルパープラスミドを含む細胞株にパッケージングすることができる。細胞株は、ヘルパーとしてアデノウイルスで感染され得る。ヘルパーウイルスは、AAVベクターの複製及びヘルパープラスミド由来のAAV遺伝子の発現を促進することができる。場合によっては、ヘルパープラスミドは、ITR配列を欠くために、かなりの量でパッケージ化されない。アデノウイルスによる汚染は、例えば、アデノウイルスがAAVよりも感受性が高い熱処理によって低減することができる。
薬学的組成物
本開示の他の態様は、(例えば、本明細書に開示されるCas9を含む)CRISPRシステムを含む薬学的組成物に関する。「薬学的組成物」という用語は、本明細書で使用される場合、薬学的使用のために製剤化された組成物を指す。一部の実施形態では、薬学的組成物は、薬学的に許容される担体を更に含む。一部の実施形態では、薬学的組成物は、追加の薬剤(例えば、特異的送達用、半減期の増加、又は他の治療用化合物)を含む。
本開示の他の態様は、(例えば、本明細書に開示されるCas9を含む)CRISPRシステムを含む薬学的組成物に関する。「薬学的組成物」という用語は、本明細書で使用される場合、薬学的使用のために製剤化された組成物を指す。一部の実施形態では、薬学的組成物は、薬学的に許容される担体を更に含む。一部の実施形態では、薬学的組成物は、追加の薬剤(例えば、特異的送達用、半減期の増加、又は他の治療用化合物)を含む。
本明細書で使用される場合、「薬学的に許容される担体」という用語は、化合物を体のある部位(例えば、送達部位)から別の部位(例えば、臓器、組織、又は体の一部分)に運搬若しくは輸送することに関与する、液体若しくは固体充填剤、希釈剤、賦形剤、製造助剤(例えば、潤滑剤、タルクマグネシウム、ステアリン酸カルシウム若しくはステアリン酸亜鉛、又は立体酸(steric acid))、又は溶媒封入材などの、薬学的に許容される材料、組成物、又はビヒクルを意味する。薬学的に許容される担体は、製剤の他の成分と適合性であるという意味で「許容される」ものであり、対象の組織に害を及ぼさない(例えば、生理学的に適合性、無菌性、生理学的pHなど)。
薬学的に許容される担体としての役割を果たすことができる材料のいくつかの非限定的な例としては、以下が挙げられる:(1)糖類(例えば、乳糖、グルコース及びスクロース)、(2)デンプン(例えば、トウモロコシデンプン及びジャガイモデンプン)、(3)セルロース及びその誘導体(例えば、カルボキシメチルセルロースナトリウム、メチルセルロース、エチルセルロース、微結晶セルロース、及び酢酸セルロース)、(4)粉末トラガント、(5)麦芽、(6)ゼラチン、(7)潤滑剤(例えば、ステアリン酸マグネシウム、ラウリル硫酸ナトリウム、及びタルク)、(8)賦形剤(例えば、ココアバター及び坐剤ワックス)、(9)油(例えば、ピーナッツ油、綿実油、紅花油、ゴマ油、オリーブ油、トウモロコシ油、及び大豆油)、(10)グリコール(例えば、プロピレングリコール)、(11)ポリオール(例えば、グリセリン、ソルビトール、マンニトール、及びポリエチレングリコール(PEG))、(12)エステル(例えば、オレイン酸エチル及びラウリン酸エチル)、(13)寒天、(14)緩衝剤(例えば、水酸化マグネシウム及び水酸化アルミニウム)、(15)アルギン酸、(16)パイロジェンフリー水、(17)等張生理食塩水、(18)リンゲル溶液、(19)エチルアルコール、(20)pH緩衝溶液、(21)ポリエステル、ポリカーボネート、及び/又はポリ酸無水物、(22)膨張剤(例えば、ポリペプチド及びアミノ酸)、(23)血清アルコール(例えば、エタノール)、並びに(23)薬学的製剤に用いられる他の非毒性の適合性物質。湿潤剤、着色剤、剥離剤、コーティング剤、甘味剤、香味剤、芳香剤、防腐剤、及び抗酸化剤も、製剤中に存在し得る。「賦形剤」、「担体」、「薬学的に許容される担体」、「ビヒクル」などの用語は、本明細書において交換可能に使用される。
薬学的組成物は、製剤のpHを、生理学的pHを反映する所定のレベルで、例えば、約5.0~約8.0の範囲に維持するために、1つ以上のpH緩衝化合物を含むことができる。水性液体製剤に使用されるpH緩衝化合物は、アミノ酸、又はアミノ酸の混合物(例えば、ヒスチジン、又はヒスチジン及びグリシンなどのアミノ酸の混合物)であり得る。代替的に、pH緩衝化合物は、好ましくは、製剤のpHを所定のレベルに(例えば、約5.0~約8.0の範囲に)維持し、かつカルシウムイオンをキレートしない薬剤である。かかるpH緩衝化合物の例示的な例としては、イミダゾール及び酢酸イオンが挙げられるが、これらに限定されない。pH緩衝化合物は、製剤のpHを所定のレベルに維持するのに好適な任意の量で存在してもよい。
薬学的組成物はまた、1つ以上の浸透圧調節剤、すなわち、製剤の浸透圧特性(例えば、張力、オスモラリティ、及び/又は浸透圧)を、レシピエント個体の血流及び血液細胞で許容されるレベルに調節する化合物を含み得る。浸透圧調節剤は、カルシウムイオンをキレートしない薬剤であり得る。浸透圧調節剤は、製剤の浸透圧特性を調節する、当業者に既知又は利用可能な任意の化合物であり得る。当業者は、本発明の製剤で使用される所与の浸透圧調節剤の適合性を経験的に決定することができる。好適なタイプの浸透圧調節剤の例示的な例としては、塩(例えば、塩化ナトリウム及び酢酸ナトリウム)、糖(例えば、スクロース、デキストロース、及びマンニトール)、アミノ酸(例えば、グリシン)、並びにこれらの薬剤及び/又は薬剤のタイプのうちの1つ以上の混合物が挙げられるが、これらに限定されない。浸透圧調節剤は、製剤の浸透圧特性を調節するのに十分な任意の濃度で存在してもよい。
一部の実施形態では、薬学的組成物は、例えば、遺伝子編集のために、対象への送達のために製剤化される。本明細書に記載の薬学的組成物を投与する好適な経路としては、局所、皮下、経皮、皮内、病巣内、関節内、腹腔内、膀胱内、経粘膜、歯肉、歯内、蝸牛内、鼓室内、臓器内、硬膜外、髄腔内、筋肉内、静脈内、血管内、骨内、眼周囲、腫瘍内、脳内、及び脳室内投与が挙げられるが、これらに限定されない。
一部の実施形態では、本明細書に記載の薬学的組成物は、疾患部位に局所的に投与される。一部の実施形態では、本明細書に記載の薬学的組成物は、注射によって、カテーテルによって、坐剤によって、又はインプラントによって、対象に投与され、インプラントは、シアラスティック(sialastic)膜又は繊維などの膜を含む、多孔性、非多孔性、又はゲル状物質である。
他の実施形態では、本明細書に記載の薬学的組成物は、制御放出システムにおいて送達される。一実施形態では、ポンプを使用することができる(例えば、Langer,1990,Science249:1527-1533、Sefton,1989,CRC Crit.Ref.Biomed.Eng.14:201、Buchwald et al.,1980,Surgery88:507、Saudek et al.,1989,N.Engl.J.Med.321:574を参照されたい)。別の実施形態では、ポリマー材料を使用することができる。(例えば、Medical Applications of Controlled Release(Langer and Wise eds.,CRC Press,Boca Raton,Fla.,1974)、Controlled Drug Bioavailability,Drug Product Design and Performance(Smolen and Ball eds.,Wiley,New York,1984)、Ranger and Peppas,1983,Macromol.Sci.Rev.Macromol.Chem.23:61を参照されたい。またLevy et al.,1985,Science228:190、During et al.,1989,Ann.Neurol.25:351、Howard et ah,1989,J.Neurosurg.71:105を参照されたい。)他の制御放出システムは、例えば、上記のLangerで考察されている。
一部の実施形態では、薬学的組成物は、対象(例えば、ヒト)への静脈内又は皮下投与に適した組成物として、通常の手順に従って製剤化される。一部の実施形態では、注射による投与のための薬学的組成物は、可溶化剤としての滅菌等張使用における溶液、及び注射部位の疼痛を緩和するためのリグノカインなどの局所麻酔剤である。一般に、成分は、例えば、活性剤の量を示すアンプル又はサシェなどの密封容器中の乾燥した凍結乾燥粉末又は水を含まない濃縮物として、別々に又は単位剤形で一緒に混合されてのいずれかで供給される。医薬品が注入によって投与される場合、医薬品は、滅菌医薬品グレードの水又は生理食塩水を含む注入ボトルを用いて分注され得る。薬学的組成物が注射によって投与される場合、投与前に成分が混合され得るように、注射用の滅菌水又は生理食塩水のアンプルが提供され得る。
全身投与のための薬学的組成物は、液体(例えば、滅菌生理食塩水、乳酸リンゲル溶液、又はハンクス溶液)であってもよい。加えて、薬学的組成物は、固体形態であってもよく、使用の直前に再溶解又は懸濁され得る。凍結乾燥形態も企図される。薬学的組成物は、脂質粒子又は小胞(例えば、非経口投与にも好適なリポソーム又は微結晶)内に含まれ得る。粒子は、組成物がその中に含まれている限り、単層(unilamellar)又は多層(plurilamellar)などの任意の好適な構造の粒子であり得る。化合物は、融合脂質ジオレオイルホスファチジルエタノールアミン(DOPE)、低レベル(5~10mol%)のカチオン性脂質を含有する「安定化プラスミド-脂質粒子」(SPLP)に封入し、ポリエチレングリコール(PEG)コーティングによって安定化することができる(Zhang Y.P.et ah,Gene Ther.1999,6:1438-47)。かかる粒子及び小胞には、N-[l-(2,3-ジオレオイルオキシ)プロピル]-N,N,N-トリメチル-アンモニウムメチルサルフェート又は「DOTAP」などの正に帯電した脂質が特に好ましい。そのような脂質粒子の調製は周知である。例えば、米国特許第4,880,635号、同第4,906,477号、同第4,911,928号、同第4,917,951号、同第4,920,016号、及び同第4,921,757号を参照されたい(それらの各々は、参照により本明細書に組み込まれる)。
本明細書に記載の薬学的組成物は、例えば、単位用量として投与又は包装され得る。「単位用量」という用語は、本開示の薬学的組成物に関して使用される場合、対象のための単位投薬量として好適な物理的に分離された単位を指し、各単位は、必要な希釈剤(すなわち、担体又はビヒクル)と関連して所望の治療効果がもたらされるように計算された所定の量の活性物質を含む。
更に、薬学的組成物は、薬学的キットとして提供され得、(a)凍結乾燥形態の本発明の化合物を含む容器、及び(b)薬学的に許容される希釈剤(例えば、本発明の凍結乾燥化合物の再構築又は希釈に使用される滅菌物)を含む第2の容器を含む。任意選択的に、医薬品又は生物学的製品の製造、使用、又は販売を規制する政府機関によって規定される形式の通知が、かかる容器に付随してもよく、通知は、ヒト投与のための製造、使用、又は販売の機関の承認を反映する。
別の態様では、上に記載の疾患の治療に有用な材料を含む製造品(article of manufacture)が含まれる。一部の実施形態では、製造品は、容器及びラベルを含む。好適な容器には、例えば、ボトル、バイアル、シリンジ、及び試験管が含まれる。容器は、様々な材料、例えば、ガラス又はプラスチックから形成され得る。一部の実施形態では、容器は、本明細書に記載の疾患を治療するのに有効な組成物を保持し、無菌アクセスポートを有し得る。例えば、容器は、皮下注射針によって貫通可能なストッパーを有する、静脈内輸液バッグ又はバイアルであり得る。組成物中の活性剤は、本発明の化合物である。一部の実施形態では、容器上の、又は容器に付随するラベルは、組成物が、選択された疾患を治療するために使用されることを示す。製造品は、リン酸緩衝生理食塩水、リンゲル液、又はデキストロース溶液などの、薬学的に許容される緩衝液を含む第2の容器を更に含み得る。これには、商業及び使用者の観点から望ましい他の材料が更に含まれ得、他の緩衝液、希釈剤、フィルター、針、シリンジ、及び使用説明書を含む添付文書が挙げられる。
一部の実施形態では、CRISPRシステム(例えば、本明細書に記載のCas9を含む)は、薬学的組成物の一部として提供される。一部の実施形態では、薬学的組成物は、本明細書に提供される融合タンパク質のうちのいずれかを含む(例えば、LubCas9を含む、本明細書に記載の核酸塩基エディターを含む)。一部の実施形態では、薬学的組成物は、本明細書に提供される複合体のいずれかを含む。一部の実施形態では、薬学的組成物は、gRNAとカチオン性脂質との複合体を形成するRNAガイドヌクレアーゼ(例えば、Cas9)を含むリボ核タンパク質複合体を含む。一部の実施形態では、薬学的組成物は、gRNA、核酸プログラマブルDNA結合タンパク質、カチオン性脂質、及び薬学的に許容される賦形剤を含む。薬学的組成物は、任意選択的に、1つ以上の追加の治療活性物質を含むことができる。
キット
一態様では、本発明は、上記の方法及び組成物において開示されるエレメントのうちのいずれか1つ以上を含有するキットを提供する。いくつかの実施形態では、キットは、ベクターシステムと、キットを使用するための説明書と、を含む。いくつかの実施形態では、ベクターシステムは、ガイド配列を挿入するための1つ以上の挿入部位を含み、発現されるとき、ガイド配列は、真核細胞における標的配列へのCRISPR複合体の配列特異的結合を指向し、CRISPR複合体は、(1)標的配列にハイブリダイズされるガイド配列、及び(2)tracr配列にハイブリダイズされる配列、並びに/又は(b)核局在化配列を含む当該CRISPR酵素をコードする酵素コード配列に作動可能に結合した第2の調節エレメントと複合体化されたCRISPR酵素を含む。エレメントは、個別に又は組み合わせて提供され得、バイアル、ボトル、又はチューブなどの、任意の好適な容器で提供され得る。いくつかの実施形態では、キットは、1つ以上の言語、例えば、2つ以上の言語での説明書を含む。
一態様では、本発明は、上記の方法及び組成物において開示されるエレメントのうちのいずれか1つ以上を含有するキットを提供する。いくつかの実施形態では、キットは、ベクターシステムと、キットを使用するための説明書と、を含む。いくつかの実施形態では、ベクターシステムは、ガイド配列を挿入するための1つ以上の挿入部位を含み、発現されるとき、ガイド配列は、真核細胞における標的配列へのCRISPR複合体の配列特異的結合を指向し、CRISPR複合体は、(1)標的配列にハイブリダイズされるガイド配列、及び(2)tracr配列にハイブリダイズされる配列、並びに/又は(b)核局在化配列を含む当該CRISPR酵素をコードする酵素コード配列に作動可能に結合した第2の調節エレメントと複合体化されたCRISPR酵素を含む。エレメントは、個別に又は組み合わせて提供され得、バイアル、ボトル、又はチューブなどの、任意の好適な容器で提供され得る。いくつかの実施形態では、キットは、1つ以上の言語、例えば、2つ以上の言語での説明書を含む。
いくつかの実施形態では、キットは、核酸塩基エディターを含む。例えば、いくつかの実施形態では、キットは、本明細書に記載されるCas9酵素(ScoCas9、SirCas9、VapCas9、EpeCas9、LfeCas9、PmaCas9)を含む核酸塩基エディターを含む。
一部の実施形態では、キットは、本明細書に記載のエレメントのうちの1つ以上を利用するプロセスで使用するための1つ以上の試薬を含む。試薬は、任意の好適な容器に提供され得る。例えば、キットは、1つ以上の反応又は保管緩衝液を提供し得る。試薬は、特定のアッセイにおいて使用可能な形態、又は使用前に1つ以上の他の成分の添加を必要とする形態(例えば、濃縮物又は凍結乾燥形態)で提供され得る。緩衝液は、炭酸ナトリウム緩衝液、重炭酸ナトリウム緩衝液、ホウ酸塩緩衝液、Tris緩衝液、MOPS緩衝液、HEPES緩衝液、及びそれらの組み合わせを含むが、これらに限定されない、任意の緩衝液であり得る。一部の実施形態では、緩衝液は、アルカリ性である。一部の実施形態では、緩衝液は、pHが、約7~約10である。一部の実施形態では、キットは、ガイド配列及び調節エレメントを作動可能に連結するように、ベクターに挿入するためのガイド配列に対応する1つ以上のオリゴヌクレオチドを含む。一部の実施形態では、キットは、相同組換えテンプレートポリヌクレオチドを含む。
本明細書で言及される全ての刊行物、特許出願、特許、及び他の参考文献は、それらの全体において参照により組み込まれる。加えて、材料、方法、及び実施例は、単に例示であり、限定することを意図するものではない。別途明示されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する当業者によって通常理解されているものと同じ意味を有する。本明細書に記載されているものと同様又は同等の方法及び材料を本発明の実施又は試験に使用することができるが、好適な方法及び材料が本明細書に記載されている。
以下の実施例は、本発明の作製及び実施の好ましいモードのいくつかを説明する。しかしながら、これらの実施例は、例示のみを目的とし、本発明の範囲を限定することを意図するものではないことを理解されたい。
実施例1.新規Cas9酵素のスクリーニング、新規Cas9酵素の発見及び最適化
この例は、新規Cas9酵素の発見のためのスクリーンを説明する。本明細書に記載されるように、このスクリーンを使用して、Streptococcus constellatus、Sharpea spp.分離株RUG017、Veillonella parvula、Ezakiella peruensis、Lactobacillus fermentum株AF15-40LB、及びPeptoniphilus sp.Marseille-P3761細菌からの新規Cas9酵素を単離し、最適化した。
この例は、新規Cas9酵素の発見のためのスクリーンを説明する。本明細書に記載されるように、このスクリーンを使用して、Streptococcus constellatus、Sharpea spp.分離株RUG017、Veillonella parvula、Ezakiella peruensis、Lactobacillus fermentum株AF15-40LB、及びPeptoniphilus sp.Marseille-P3761細菌からの新規Cas9酵素を単離し、最適化した。
新規PAM配列を認識する新しいCas9酵素を発見するための探索において、バイオインフォマティクススクリーンを使用して、CRISPRの標的化範囲を拡張する追加の酵素を探索した。スクリーンは、S.pyogenes、S.aureus、S.thermophilus、及びF.novicida由来のCas9のシード配列を利用した。バイオインフォマティクスは、BLASTヒットを考慮するために、1e-6のe値閾値を有するBLASTのtblastnバリアントを使用して実施した。簡潔には、試験のために選択された遺伝子座は、他の種由来のCas9タンパク質の存在下で無傷のままであった遺伝子座であった。CRISPRアレイ内に3つを超えるスペーサー、1kbを超えるCas9の内因性配列5’、及び300ntを超えるCRISPRアレイの3’を有した遺伝子座を選択した。このアプローチを使用して、新規Cas9酵素を異なる細菌種から特定し、ヒト細胞における発現のためにコドン最適化した。次いで、新規の操作されたCas9酵素を組換え産生し、試験した。
実施例2.Streptococcus constellatus、Sharpea spp.分離株RUG017、Veillonella parvula、Ezakiella peruensis、Lactobacillus fermentum株AF15-40LB、及びPeptoniphilus sp.Marseille-P3761細菌からの新規Cas9酵素の3’PAMコンセンサスモチーフを特定する
この例は、元々Streptococcus constellatus、Sharpea spp.分離株RUG017、Veillonella parvula、Ezakiella peruensis、Lactobacillus fermentum株AF15-40LB、及びPeptoniphilus sp.Marseille-P3761種から単離されたヒトコドン最適化Cas9のプロトスペーサー隣接モチーフ(PAM)配列の特定を示す。
この例は、元々Streptococcus constellatus、Sharpea spp.分離株RUG017、Veillonella parvula、Ezakiella peruensis、Lactobacillus fermentum株AF15-40LB、及びPeptoniphilus sp.Marseille-P3761種から単離されたヒトコドン最適化Cas9のプロトスペーサー隣接モチーフ(PAM)配列の特定を示す。
ヒト、コドン最適化Cas9を、インビトロPAM特定アッセイを使用して、PAM配列のその認識について試験した。ランダム化PAM配列を有するプラスミドのライブラリーを、異なる細菌から単離されたCas9とインキュベートした。開裂されていないプラスミドを精製し、配列決定して、開裂された特異的PAMモチーフを特定した。Streptococcus constellatus Cas9によって認識されるコンセンサスPAM配列を、5’-NGG-3’として特定した(図1A)。Sharpea spp.分離株RUG017 Cas9によって認識されるコンセンサスPAM配列を、5’-NAGHC-3’として特定した(図1B)。Veillonella parvula Cas9によって認識されるコンセンサスPAM配列を、5’-NRHRRH-3’(H=A、C、又はT、R=A又はG)として特定した(図1C)。Ezakiella peruensis Cas9によって認識されるコンセンサスPAM配列を、5’-NGG-3’として特定した(図1D)。Lactobacillus fermentum株AF15-40LB Cas9によって認識されるコンセンサスPAM配列を、5’-NNAAA-3’(図1E)として特定した。Peptoniphilus sp.Marseille-P3761 Cas9によって認識されるコンセンサスPAM配列を、5’-NGG-3’として特定した(図1F)。
実施例3.Streptococcus constellatus、Sharpea spp.分離株RUG017、Veillonella parvula、Ezakiella peruensis、Lactobacillus fermentum株AF15-40LB、及びPeptoniphilus sp.Marseille-P3761細菌からの新規Cas9酵素のsgRNAのRNA折り畳み構造を予測する
この例は、新規Cas9酵素での使用のための、crRNA及びtracrRNAを含む例示的なsgRNAの予測されたRNA折り畳み構造を示す。
この例は、新規Cas9酵素での使用のための、crRNA及びtracrRNAを含む例示的なsgRNAの予測されたRNA折り畳み構造を示す。
小RNAシーケンシングは、Cas9 Crispr遺伝子座を異種発現するE.coli株に由来するRNAで実施した。簡潔には、RNAは、まずE.coliをTrizolに再懸濁し、次いで細菌をホモジナイザーにおいてジルコニア/シリカビーズで3回の1分サイクルにわたってホモジナイズすることによって、静止期細菌から単離した。総RNAをホモジナイズされた試料から精製し、DNAse処理し、T4ポリヌクレオチドキナーゼで3’脱リン酸化し、rRNAを除去した。RNAライブラリーを、rRNAが枯渇したRNAから調製し、小RNAについてサイズ選択した。
RNAシーケンシングのために、転写物を、E.coliポリ(A)ポリメラーゼでポリAテール化し、T4 RNAリガーゼ1を使用して5’RNAアダプターでライゲートし、逆転写し、続いてバーコード化プライマーを用いたcDNAのPCR増幅、及びMiSeqでのシーケンシングを行った。各試料からのリードは、それらの関連するバーコードに基づいて特定し、BWAを使用して参照配列にアラインした。ペアエンドアラインメントを使用して、Picardツールを使用して転写物配列を抽出し、配列を、Geneiousソフトウェアを使用して分析した。
RNA折り畳みは、Geneious11.1.2ソフトウェアからの予測に基づいた。単一sgRNA転写物は、crRNAを、部位特異的Cas9活性を誘導するために必要な二重RNA構造を模倣するtracrRNAに融合する。Streptococcus constellatus由来のScoCas9での使用のためのキメラsgRNAについての予測されるRNA折り畳み構造は、図2Aに示され、Sharpea spp.分離株RUG017由来のSirCas9での使用のためのsgRNAは、図2Bに示され、Veillonella parvula由来のVapCas9での使用のためのsgRNAは、図2Cに示され、Ezakiella peruensis由来のEpeCas9での使用のためのsgRNAは、図2Dに示され、Lactobacillus fermentum株AF15-40LB由来のLfeCas9での使用のためのsgRNAは、図2Eに示され、Peptoniphilus sp.Marseille-P3761由来のPmaCas9での使用のためのsgRNAは、図2Fに示される。
実施例4.HEK293T細胞におけるWT ScoCas9によるエクスビボ開裂活性
この例は、HEK293T細胞におけるStreptococcus constellatus由来のWT ScoCas9によるエクスビボ核酸開裂活性を示す。
この例は、HEK293T細胞におけるStreptococcus constellatus由来のWT ScoCas9によるエクスビボ核酸開裂活性を示す。
HEK293T細胞を96ウェルプレートにおいて播種した。細胞を、播種の24時間後、Cas9及びガイドRNA配列(表10)を含有する発現ベクターでトランスフェクトした。細胞をトランスフェクションの72時間後に採取し、全DNAを抽出した。
HEK293T細胞におけるインデルパターンを特徴分析するために、ディープシーケンシングも実施した。簡潔には、例示的な標的(表8)を、2ラウンドPCRを使用して増幅して、Illuminaアダプター及び独自のバーコードを標的アンプリコンに添加した。PCR生成物を、2%ゲルで実行し、ゲル抽出した。試料をプールし、定量化し、cDNAライブラリーを調製し、MiSeqで配列決定した。ディープシーケンシングによって、インデル頻度を決定した(図3)。
データは、WT ScoCas9が2~32%のインデル頻度を達成したことを示した。ガイドRNA2及び9は、30%を超えるインデル変異をもたらしたが、ガイドRNA11は、約2%のインデル変異をもたらした。
実施例5.アデニン塩基エディター(ABE)又はシチジン塩基エディター(CBE)のN末端融合を用いたCas9酵素による塩基編集
この例は、アデニン塩基エディター(ABE)に、又はシチジン塩基エディター(CBE)に融合したCas9酵素の塩基変換効率を示す。
この例は、アデニン塩基エディター(ABE)に、又はシチジン塩基エディター(CBE)に融合したCas9酵素の塩基変換効率を示す。
簡潔には、25,000個のHEK293T細胞を、96ウェルごとに播種した。100ngのCas9発現プラスミド及び100ngのガイド発現プラスミドを、播種の24時間後にトランスフェクトした。トランスフェクションの5日後に細胞を採取し、DNAを抽出した。
HEK293T細胞におけるAからGへの変換又はCからTへの変換を特徴分析するために、ディープシーケンシングを実施した。例示的な標的を、2ラウンドPCR領域を使用して増幅して、Illuminaアダプター及び独自のバーコードを標的アンプリコンに添加した。PCR生成物を、2%ゲルで実行し、ゲル抽出した。試料をプールし、定量化し、cDNAライブラリーを調製し、MiSeqで配列決定した。N末端及びC末端TadA8融合構築物のディープシーケンシングによって、AからGへの変換パーセントを決定した。N末端及びC末端ppAPOBEC1融合構築物のディープシーケンシングによって、CからTへの変換パーセントを決定した。
図4Aは、N末端でABE又はCBEに融合したScoCas9の構築物の概略図を示す。表9は、ScoCas9で使用されるガイドRNA配列を示す。図4Bは、ヒト細胞株(HEK293T)におけるゲノム部位に向けられる、アデニン塩基エディター(ABE)(図4B)へのScoCas9のN末端融合で達成されるインデル変異及び標的化されたアデニンからグアニンへの変換パーセンテージのグラフを示す。図4Cは、ヒト細胞株(HEK293T)におけるゲノム部位に向けられる、シチジン塩基エディター(図4C)へのScoCas9のN末端融合で達成されるインデル変異及び標的化されたシトシンからチミンへの変換パーセンテージのグラフを示す。
図5Aは、WT SirCas9及びN末端でABEに融合したSirCas9(「D14A」変異体)の構築物の概略図を示す。表10は、SirCas9で使用される例示的なNAGMCガイドRNA配列を示す。図5Bは、ヒト細胞株(HEK293T)におけるゲノム部位に向けられる、アデニン塩基エディター(ABE)(図5B)へのSirCas9のN末端融合で達成されるインデル変異及び標的化されたアデニンからグアニンへの変換パーセンテージのグラフを示す。
図6Aは、WT VapCas9、及びN末端でABE又はCBEに融合したVapCas9(「D38A」変異体)を示す構築物の概略図を示す。表11は、VapCas9で使用される例示的なNRHRRH[ここで、Hは、アデニン、シトシン、又はチミンであり、Rは、アデニン又はグアニンである]ガイドRNA配列を示す。図6Bは、ヒト細胞株(HEK293T)におけるゲノム部位に向けられる、VapCas9のアデニン塩基エディター(ABE)へのN末端融合で達成されるインデル変異及び標的化されたアデニンからグアニンへの変換パーセンテージ、並びにVapCas9のシチジン塩基エディター(CBE)(図6B)へのN末端融合で達成される標的化されたシトシンからチミンへの変換パーセンテージのグラフを示す。
図7Aは、VapCas9へのABEのN末端融合及びABEのC末端融合を示す構築物の概略図を示す。図7Bは、アデニン塩基エディター(ABE)へのN末端融合及びC末端融合で達成される標的化されたアデニンからグアニンへの変換パーセンテージのグラフを示す。
図8Aは、EpeCas9へのABE及びCBEのN末端融合を示す構築物の概略図を示す。表12は、EpeCas9で使用される例示的なガイドRNA配列を示す。図8Bは、インデル変異のグラフ、ABEへのN末端融合で達成される標的化されたアデニンからグアニンへの変換パーセンテージ及びCBEへのN末端融合で達成される標的化されたシトシンからチミンへの変換パーセンテージのグラフを示す。
図9Aは、N末端でABE及びCBEに融合したWT LfeCas9及びLfeCas9 D9A変異体を示す構築物の概略図を示す。表13は、LfeCas9で使用される例示的なガイドRNA配列を示す。図9Bは、LfeCas9で達成されるインデル変異頻度の結果を示すグラフを示す。図9Cは、LfeCas9のアデニン塩基エディターへのN末端融合で達成される標的化されたアデニンからグアニンへの変換のグラフを示す。図9Dは、LfeCas9 D9A変異体のN末端に融合したCBEを含む塩基エディターで達成される標的化されたシトシンからチミンへの変換のグラフを示す。
図10Aは、N末端及びC末端でABE及びCBEに融合したWT PmaCas9及びPmaCas9 D12A変異体を示す構築物の概略図を示す。図10Bは、PmaCas9 D12A変異体のN末端又はC末端に融合したABE又はCBEを含む塩基エディターで達成されるAからGへ又はCからTへの変換の結果を示すグラフを示す。
表15は、塩基編集機能のための例示的なCas9アデノシン又はアデニン及びシトシン又はシチジン塩基エディターの配列を開示する。
実施例6.操作されたStreptococcus constellatus(ScoCas9)NGC PAMバリアント
この例は、NGC PAMバリアントを認識するScoCas9バリアントの操作を示す。
この例は、NGC PAMバリアントを認識するScoCas9バリアントの操作を示す。
簡潔には、2つのバリアントは、操作された、NGC PAM認識のためにアミノ酸置換を含有する、ScoCas9-NGC-v1、及びNGC PAM認識のためにアミノ酸置換及びSpyCas9活性を増強する追加のアミノ酸置換を含有する、ScoCas9-NGC-v2であった。アミノ酸残基を、S.pyogenes SpyCas9とS.constellatus ScoCas9との間の構造比較によって特定した。ScoCas9-NGC-v1のアミノ酸配列(配列番号95)は、野生型ScoCas9配列からの以下の変異:D1117M、S118Q、E1201F、A1299R、D1309A、R1312E、T1314Rを含んだ。ScoCas9-NGC-v2のアミノ酸配列(配列番号96)は、野生型ScoCas9配列からの以下の変異:S409I、R655L、D1117M、S118Q、E1201F、A1299R、D1309A、R1312E、T1314Rを含んだ。
ScoCas9-NGCバリアントを、レンチウイルス媒介挿入によってHEK293T細胞のゲノムにランダムに組み込まれたゲノム遺伝子座を標的化するように使用し、ヌクレアーゼ及び塩基編集活性について試験した。
簡潔には、HEK293T細胞を96ウェルプレートにおいて播種した。細胞を、播種の24時間後、ScoCas9-NGCバリアント、及びガイドRNA配列ATCGACAAGAAAGGGACTGA(配列番号97)を含有する発現ベクターでトランスフェクトした。ScoCas9バリアントは、例示的なNGC 3’PAM配列、AGCを認識した。細胞をトランスフェクションの72時間後に採取し、全DNAを抽出した。
HEK293T細胞におけるインデルパターンを特徴分析するために、ディープシーケンシングも実施した。例示的な標的を、2ラウンドPCRを使用して増幅して、Illuminaアダプター及び独自のバーコードを標的アンプリコンに添加した。PCR生成物を、2%ゲルで実行し、ゲル抽出した。試料をプールし、定量化し、cDNAライブラリーを調製し、MiSeqで配列決定した。トランスフェクションの4日後にディープシーケンシングによって、インデル頻度を決定した。
結果は、両方のScoCas9-NGCバリアントのヌクレアーゼ活性を示した。約20~35%のインデル頻度は、ScoCas9-NGC-v1及びScoCas9-NGC-v2で達成された(図11A)。
ScoCas9-NGCバリアントのABE塩基エディターとの融合体を構築した。
HEK293T細胞におけるAからGへの変換を特徴分析するために、ディープシーケンシングも実施した(図11B)。アデニンからグアニンへの(AからGへの)変換を、トランスフェクションの4日後にNGSによって測定した。結果は、両方のABE-nScoCas9-NGCバリアントによる塩基編集活性を示した。両方のバリアントは、約20~30%のAからGへの変換を示した。NGGを認識したScoCas9は、陰性対照として使用され、塩基編集を示さなかった。SpyCas9は、陽性対照として使用され、約40%のAからGへの変換を示した。
全体として、結果は、NGC PAM配列を認識するように操作されたScoCas9バリアントが、ヌクレアーゼ活性及び塩基編集活性を実施することができることを示した。
同等物及び範囲
当業者であれば、通常範囲を超えない実験を使用して、本明細書に記載の本発明の特定の実施形態に対する多くの均等物を認識するか、又は確定することができるであろう。本発明の範囲は、上記の説明に限定されることを意図するものではなく、むしろ、以下の特許請求の範囲に記載されるとおりである。
当業者であれば、通常範囲を超えない実験を使用して、本明細書に記載の本発明の特定の実施形態に対する多くの均等物を認識するか、又は確定することができるであろう。本発明の範囲は、上記の説明に限定されることを意図するものではなく、むしろ、以下の特許請求の範囲に記載されるとおりである。
Claims (107)
- Streptococcus constellatus Cas9、Sharpea Cas9、Veillonella parvula Cas9、Ezakiella peruensis Cas9、Lactobacillus fermentum株AF15-40LB Cas9、又はPeptoniphilus sp.Marseille-P3761 Cas9から修飾された、操作された天然に存在しないCas9タンパク質。
- 前記Streptococcus constellatus Cas9が、
MGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGED(配列番号1)と少なくとも80%の配列同一性を有する、請求項1に記載のCas9タンパク質。 - 前記Sharpea Cas9が、
MAKNKDIRYSIGLDIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKL(配列番号4)と少なくとも80%の配列同一性を有する、請求項1に記載のCas9タンパク質。 - 前記Veillonella parvula Cas9が、
MSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLDIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIV(配列番号8)と少なくとも80%の配列同一性を有する、請求項1に記載のCas9タンパク質。 - 前記Ezakiella peruensis Cas9が、
MTKVKDYYIGLDIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKL(配列番号14)と少なくとも80%の配列同一性を有する、請求項1に記載のCas9タンパク質。 - 前記Lactobacillus fermentum株AF15-40LB Cas9が、
MKEYHIGLDIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNL(配列番号84)と少なくとも80%の配列同一性を有する、請求項1に記載のCas9タンパク質。 - 前記Peptoniphilus sp.Marseille-P3761 Cas9が、
MEKKTNYTIGLDIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFED(配列番号86)と少なくとも80%の配列同一性を有する、請求項1に記載のCas9タンパク質。 - 配列番号1、4、8、14、84、又は86と少なくとも85%、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、又は少なくとも99%同一であるアミノ酸配列を含む、請求項2~7のいずれか一項に記載のCas9タンパク質。
- 核局在化配列(NLS)及び/又はFLAGタグ、HISタグ、若しくはHAタグを更に含む、先行請求項のいずれか一項に記載のCas9タンパク質。
- 前記Streptococcus constellatus Cas9が、
MPKKKRKVGGKPYSIGLDIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号2)と少なくとも80%同一のアミノ酸配列を有する、請求項9に記載のCas9タンパク質。 - 前記Sharpea Cas9が、
MPKKKRKVGAKNKDIRYSIGLDIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号5)と少なくとも80%同一のアミノ酸配列を有する、請求項9に記載のCas9タンパク質。 - 前記Veillonella parvula Cas9が、
MPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLDIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号9)と少なくとも80%同一のアミノ酸配列を有する、請求項9に記載のCas9タンパク質。 - 前記Ezakiella peruensis Cas9が、
MPKKKRKVGTKVKDYYIGLDIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号15)と少なくとも80%同一のアミノ酸配列を有する、請求項9に記載のCas9タンパク質(D12A変異体は太字)。 - 前記Lactobacillus fermentum株AF15-40LB Cas9が、
MPKKKRKVGKEYHIGLDIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号85)と少なくとも80%同一のアミノ酸配列を有する、請求項9に記載のCas9タンパク質。 - 前記Peptoniphilus sp.Marseille-P3761 Cas9が、
MPKKKRKVGEKKTNYTIGLDIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号87)と少なくとも80%同一のアミノ酸配列を有する、請求項9に記載のCasタンパク質。 - 前記Cas9タンパク質の前記アミノ酸配列が、配列番号1、4、8、14、84、又は86に少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、又は少なくとも10個の変異を含む、先行請求項のいずれか一項に記載のCas9タンパク質。
- 前記変異が、アミノ酸置換である、請求項18に記載のCas9タンパク質。
- 前記Cas9タンパク質が、ニッカーゼ活性を有する、先行請求項のいずれか一項に記載のCas9タンパク質。
- アミノ酸位置のニッカーゼ変異が、野生型SpCas9の1つ以上のアミノ酸10、12、17、762、840、854、863、982、983、984、986、987に対応する、請求項20に記載のCas9タンパク質。
- 少なくとも1つの前記変異が、不活性Cas9(dCas9)をもたらす、請求項18に記載のCas9タンパク質。
- 前記Cas9タンパク質が、PAM相互作用ドメイン、HNHドメイン、及び/又はRuvCドメインに少なくとも1つのアミノ酸変異を含む、先行請求項のいずれか一項に記載のCas9タンパク質。
- アミノ酸位置の前記変異が、SirCas9の前記RuvCドメインにおけるアミノ酸14に対応する、請求項23に記載のCas9タンパク質。
- アミノ酸位置の前記変異が、EpeCas9の前記RuvCドメインにおけるアミノ酸12に対応する、請求項23に記載のCas9タンパク質。
- アミノ酸位置の前記変異が、LfeCas9の前記RuvCドメインにおけるアミノ酸9に対応する、請求項23に記載のCas9タンパク質。
- アミノ酸位置の前記変異が、PmaCas9の前記RuvCドメインにおけるアミノ酸12に対応する、請求項23に記載のCas9タンパク質。
- 前記Cas9タンパク質が、超高精度Cas9である、請求項23に記載のCas9タンパク質。
- 前記Cas9タンパク質が、SpyCas9(配列番号173)を参照して、N692A、M694A、Q695A、及び/又はH698Aに対応する変異を含む、請求項23に記載のCas9タンパク質。
- 前記Cas9タンパク質が、高忠実度Cas9である、請求項23に記載のCas9タンパク質。
- 前記Cas9タンパク質が、SpyCas9(配列番号173)を参照して、N467A、R661A、Q695A、及び/又はQ926Aに対応する変異を含む、請求項23に記載のCas9タンパク質。
- 前記Cas9タンパク質が、SuperFi-Cas9である、請求項23に記載のCas9タンパク質。
- SpyCas9に対応するY1016残基、R1019残基、Y1010残基、Y1013残基、K1031残基、Q1027残基、及び/又はV1018残基が、アスパラギン酸に変異している、請求項23に記載のCas9タンパク質。
- 配列番号1、4、8、14、84、又は86と少なくとも80%の同一性を有するCas9タンパク質を含む、操作された天然に存在しないCas9融合タンパク質であって、前記Cas9タンパク質が、ヒストンデメチラーゼ、転写アクチベーター、又はデアミナーゼに融合している、Cas9融合タンパク質。
- 核局在化配列(NLS)及び/又はFLAGタグ、HISタグ、若しくはHAタグを更に含む、請求項34に操作された天然に存在しないCas9融合タンパク質。
- 配列番号2、5、9、15、85、87、95、又は96と少なくとも80%の同一性を有する、請求項37に記載の操作された天然に存在しないCas9融合タンパク質。
- 前記Cas9タンパク質が、シトシンデアミナーゼ又はアデノシンデアミナーゼに融合している、請求項34に記載のCas9タンパク質。
- 前記Cas9タンパク質が、アデノシンデアミナーゼに融合しており、
(a)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号20)、
(b)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGAKNKDIRYSIGLAIGTNSVGWAVMDEHYELLKKGNHHMWGSRLFDAAEPAATRRASRSIRRRYNKRRERIRLLRDLLGDMVMEVDPTFFIRLLNVSFLDEEDKQKNLGNDYKDNYNLFIEKDFNDKTYYDKYPTIYHLRKELCENKEKADPRLIYLALHHIVKYRGNFLKEGQSFAKVYEDIEEKLDNTLKKFMSLNDLDNLFVDNDINSMITVLSKIYQRSKKADDLLKIMNPTKEERAAYKEFTKALVGLKFNVSKMILAQEVKKDDKDIELDFSNVDYDSTVDGLQAELGEYIEFIEMLHSINSWVELQDILGNNSTISAAMVERYEEHKNDLRVLKKVIREELPDKYNEVFREDNPKLHNYLGYIKYPKNTPVEEFYEYIKRLLAKVDTGEAREILERIDLEKFMLKQNSRTNGSIPYQMQKDEMIQIIDNQSVYYPQLKENREKLISILEFRIPYYFGPLNTHSEFAWIKKFEDKQKERILPWNYDQIVDIDATAEGFIERMQNTGTYFPDKPVMAKNSLTVSKFEVLNELNKIRINGKLIPVETKKELLSDLFMKNKTITDKKLKDWLVTHQYYDTNEELKIEGYQKDLQFSTSLAPWIDFTKIFGEINASNYQLIEKIIYDISIFEDKKILKRRLKKVYQLDDLLVDKILKLNYTGWSRLSEKLLTGIKSKNSKETILSILENSNMNLMEIINDESLGFKQIIEESNKKDIEGPFRYDEVKKLAGSPAIKRGIWQALLVVQEITKFMKHEPSHIYIEFAREEQEKVRTESRIAKLQKIYKDLNLQTKEDQLVYESLKKEDAKKKIDTDALYLYYLQMGKSMYSGKPLDIDKLSTYHIDHILPRSLIKDDSLDNRVLVLPKENEWKLDSETVPFEIRNKMMGFWQKLHENGLMSNKKFFSLIRTDFNEKDKKRFINRQLVETRQIIKNVAVIINDHYTNTNVVTVRAELSHQFRERYKIYKNRDLNDLHHAHDAYIACILGQFIHQNFGNMDVNMIYGQYKKNYKKDVQEHNNYGFILNSMNHIHFNDDNSVIWDPSYIGKIKSCFCYKDVYVTKKLEQNDAKLFDLTILPSDKNSENGVTKAKIPVNKYRKDVNKYGGFSGDAPIMLAIEADKGKKHVRQVIAFPLRLKNYNDEERIKFIEKEKNLKNVKILTEVKKNQLILINHQYFFITGTNELVNATQLKLSAKNTKNLFNLVDANKHNKLESIDDANFNEVIQELICKLQEPIYSRYNSIGKEFEDSYEKINAVTKQDKLYIIEYLIAIMSAKATQGYIKPELAREIGTNGKNKGRIKSFTIDLNKTTFISTSVTGLFSKKYKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号6)、
(c)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号10)、
(d)
MPKKKRKVSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号11)、
(e)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号16)、
(f)
MPKKKRKVTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号17)、
(g)
MPAAKRVKLDGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDGSSGSETPGTSESATPESSGPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号88)、
(h)
MPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLKRPAATKKAGQAKKKKSGSETPGTSESATPESSGSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDPAAKRVKLDGSYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号89)、又は
(i)
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFMQPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKFLQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPRAFNFFGENIARKEYRSVTECLNATLIHQSITGLYETRIDLSKLGEDGEGADKRTADGSEFESPKKKRKV(配列番号98)、
(j)
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHAEIMALRQGGLVMQNYRLYDATLYSTFEPCVMCAGAMIHSRIGRVVFGVRNAKTGAAGSLMDVLHHPGMNHRVEITEGILADECAALLCRFFRMPRRVFNAQKKAQSSTDSGGSSGGSSGSETPGTSESATPESSGGSSGGSGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGIIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERLHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFMQPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKFLQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPRAFNFFGENIARKEYRSVTECLNATLIHQSITGLYETRIDLSKLGEDGEGADKRTADGSEFESPKKKRKV(配列番号99)と少なくとも80%同一のアミノ酸配列を有する、請求項37に記載のCas9タンパク質。 - 前記Cas9タンパク質が、シトシンデアミナーゼに融合しており、
(a)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGGKPYSIGLAIGTNSVGWAVVTDDYKVPAKKMKVLGNTDKQSIKKNLLGALLFDSGETAEATRLKRTARRRYTRRKNRLRYLQEIFTGEMNKVDENFFQRLDDSFLVDEDKRGEHHPIFGNIAAEVKYHDDFPTIYHLRRHLADTSKKADLRLVYLALAHMIKFRGHFLYEGDLKAENTDVQALFKDFVEEYDKTIEESHLSEITVDALSILTEKVSKSSRLENLIAHYPTEKKNTLFGNLIALSLDLHPNFKTNFQLSEDAKLQFSKDTYEEDLEGFLGEVGDEYADLFASAKNLYDAILLSGILTVDDNSTKAPLSASMVKRYEEHQKDLKKLKDFIKVNAPDQYNAIFKDKNKKGYASYIESGVKQDEFYKYLKGILLKINGSGDFLDKIDREDFLRKQRTFDNGSIPHQIHLQEMHAILRRQGEHYPFLKENQDKIEKILTFRIPYYVGPLARKGSRFAWAEYKADEKITPWNFDDILDKEKSAEKFITRMTLNDLYLPEEKVLPKHSPLYEAFTVYNELTKVKYVNEQGEAKFFDTNMKQEIFDHVFKENRKVTKDKLLNYLNKEFEEFRIVNLTGLDKENKAFNSSLGTYHDLRKILDKSFLDDKANEKTIEDIIQTLTLFEDREMIRQRLQKYSDIFTKAQLKKLERRHYTGWGRLSYKLINGIRNKENKKTILDYLIDDGYANRNFMQLINDDALSFKEEIARAQIIDDVDDIANVVHDLPGSPAIKKGILQSVKIVDELVKVMGHNPANIIIEMARENQTTDKGRRNSQQRLKLLQDSLKNLDNPVNIKNVENQQLQNDRLFLYYIQNGKDMYTGETLDINNLSQYDIDHIIPQAFIKDNSLDNRVLTRSDKNRGKSDDVPSIEVVHEMKSFWSKLLSVKLITQRKFDNLTKAERGGLTEEDKAGFIKRQLVETRQITKHVAQILDERFNTEFDGNKRRIRNVKIITLKSNLVSNFRKEFELYKVREINDYHHAHDAYLNAVVGNALLLKYPQLEPEFVYGEYPKYNSYRSRKSATEKFLFYSNILRFFKKEDIQTNEDGEIAWNKEKHIKILRKVLSYPQVNIVKKTEEQTGGFSKESILPKGESDKLIPRKTKNSYWDPKKYGGFDSPVVAYSILVFADVEKGKSKKLRKVQDMVGITIMEKKRFEKNPVDFLEQRGYRNVRLEKIIKLPKYSLFELENKRRRLLASAKELQKGNELVIPQRFTTLLYHSYRIEKDYEPEHREYVEKHKDEFKELLEYISVFSRKYVLADNNLTKIEMLFSKNKDAEVSSLAKSFISLLTFTAFGAPAAFNFFGENIDRKRYTSVTECLNATLIHQSITGLYETRIDLSKLGEDGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号21)、
(b)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGSIINFQRRGLMETQASNQLISSHLKGYPIKDYFVGLAIGTSSVGWAVTNKAYELLKFRSHKMWGSRLFDEGESAVARRGFRSMRRRLERRKLRLKLLEELFADAMAQVDPTFFMRLRESKYHYEDKTTGHSSKHILFIDKNYNDQDYFKEYPTVYHLRSELMKSGTDDIRKLFLAVHHILKYRGNFLYEGATFDSNASTLDDVIKQALENITFNCFDCNSAISSIGQILMEAGKTKSDKAKAIEHLVDTYIATDTVDTSSKTQKDQVKEDKKRLKAFANLVLGLNASLIDLFGSVEELEEDLKKLQITGDTYDDKRDELAKAWSDEIYIIDDCKSVYDAIILLSIKEPGLTISESKVKAFNKHKDDLAILKSLLKSDRSIYNTMFKVDEKGLHNYVHYIKQGRTEETSCNREDFYKYTKKIVEGLSDSKDKEYILSQIELQILLPLQRIKDNGVIPYQLHLEELKAILAKCGPKFPFLNEVADGFSVAEKLIKMLEFRIPYYVGPLNTHHNVDNGGFAWAVRKASGRVTPWNFDDKIDREKSAAAFIKNLTNKCTYLLGEDVLPKSSLLYSEFMLLNELNNVRIDGKPLEKVVKEHLIEAVFKQDHKKMTKNRIEQFLKDNGYISETHKHEITGLDGEIKNDLASYRDMVRILGDGFDRSMAEEIITDITIFGESKKMLRETLRKKFASCLDDEAIKKLTKLRYRDWGRLSQKLLNGIEGCDKAGDGTPETIIILMRNFSYNLMELLGDKFSFMERIQEINAKLTEGQIVNPHDIIDDLALSPAVKRAVWQALRIVDEVAHIKKALPARIFVEVTRSNKNEKKKKDSRQKRLSDLYAAIKKDDVLLNGLNNEIFGELKSSLAKYDDAALRSKKLYLYYTQMGRCAYTGEIIELSLLNTDNYDIDHIYPRSLTKDDSFDNLVLCKRTANAQKSDAYPISEEIQKTQKPFWTFLKQQGLISERKYERLTRITPLTADDLSGFIARQLVETNQSVKAATTLLRRLYPGVDVVFVKAENVTDFRHDNNFIKVRSLNHHHHAKDAYLNIVVGNVYHERFTRNFRAFFKKNGANRTYNLAKMFNYDVNCTNAKDGKAWDVKTSMDTVKKMMDSNDVRVTKRLLEQTGALADATIYKATVAGKAKDGAYIGMKTKSSVFADVSKYGGMTKIKNAYSIIVQYTGKKGEVIKEIVPLPIYLTNRNTTDQDLINYVASIIPQAKDISIIYGKLCINQLVKVNGFYYYLGGKTNSKFCIDNAIQVIVSNEWIPYLKVLEKFNNMRKDNKDLKANVVSTRALDNKHTIEVRIVEEKNIEFFDYLVSKLKMPIYQKMKGNKAAELSEKGYGLFKKMSLEEQSIHLIELLNLLTNQKTTFEVKPLGITASRSTVGSKISNQDEFKVINESITGLYSNEVTIVGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号12)、
(c)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGTKVKDYYIGLAIGTSSVGWAVTDEAYNVLKFNSKKMWGVRLFDDAKTAEERRGQRGARRRLDRKKERLSLLQDFFAEEVAKVDPNFFLRLDNSDLYMEDKDQKLKSKYTLFNDKDFKDKNFHKKYPTIHHLLMDLIEDDSKKDIRLVYLACHYLLKNRGHFIFEGQKFDTKSSFENSLNELKVHLNDEYGLDLEFDNENLINILTDPKLNKTAKKKELKSVIGDTKFLKAVSAIMIGSSQKLVDLFENPEDFDDSAIKSVDFSTTSFDDKYSDYELALGDKIALVNILKEIYDSSILENLLKEADKSKDGNKYISNAFVKKYNKHGQDLKEFKRLVRQYHKSAYFDIFRSEKVNDNYVSYTKSSISNNKRVKANKFTDQEAFYKFAKKHLETIKYKINKVNGSKADLELIDGMLRDMEFKNFMPKIKSSDNGVIPYQLKLMELNKILENQSKHHEFLNVSDEYGSVCDKIASIMEFRIPYYVGPLNPNSKYAWIKKQKDSEITPWNFKDVVDLDSSREEFIDSLIGRCTYLKDEKVLPKASLLYNEYMVLNELNNLKLNDLPITEEMKKKIFDQLFKTRKKVTLKAVANLLKKEFNINGEILLSGTDGDFKQGLNSYNDFKAIVGDKVDSDDYRDKIEEIIKLIVLYGDDKSYLQKKIKAGYGKYFTDSEIKKMAGLNYKDWGRLSKKLLTGLEGANKITGERGSIIHFMREYNLNLMELMSASFTFTEEIQKLNPVDDRKLSYEMVDELYLSPSVKRMLWQSLRIVDEIKNIMGTDSKKIFIEMARGKEEVKARKESRKNQLLKFYKDGKKAFISEIGEERYSYLLSEIEGEEENKFRWDNLYLYYTQLGRCMYSLEPIDISELSSKNIYDQDHIYPKSKIYDDSIENRVLVKKDLNSKKGNSYPIPDEILNKNCYAYWKILYDKGLIGQKKYTRLTRRTGFTDDELVQFISRQIVETRQATKETANLLKTICKNSEIVYSKAENASRFRQEFDIVKCRAVNDLHHMHDAYINIIVGNVYNTKFTKDPMNFVKKQEKARSYNLENMFKYDVKRGGYTAWIADDEKGTVKNASIKRIRKELEGTNYRFTRMNYIESGALFNATLQRKNKGSRPLKDKGPKSSIEKYGGYTNINKACFAVLDIKSKNKIERKLMPVEREIYAKQKNDKKLSDEIFSKYLKDRFGIEDYRVVYPVVKMRTLLKIDGSYYFITGGSDKTLELRSALQLILPKKNEWAIKQIDKSSENDYLTIERIQDLTEELVYNTFDIIVNKFKTSVFKKSFLNLFQDDKIENIDFKFKSMDFKEKCKTLLMLVKAIRASGVRQDLKSIDLKSDYGRLSSKTNNIGNYQEFKIINQSITGLFENEVDLLKLGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号18)、
(d)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGKEYHIGLAIGTSSIGWAVTDSQFKLMRIKGKTAIGVRLFEEGKTAAERRTFRTTRRRLKRRKWRLHYLDEIFAPHLQEVDENFLRRLKQSNIHPEDPAKNQAFIGKLLFPDLLKKNERGYPTLIKMRDELPVEQRAHYPVTNIYKLREAMINEDRQFDLREVYLAVHHIVKYRGHFLNNASVDKFKVGRIDFDKSFNVLNEAYEELQNGEGSFTIEPSKVEKIGQLLLDTKMRKLDRQKAVAKLLEVKVADKEETKRNKQIATAMSKLVLGYKADFATVAMANGNEWKIDLSSETSEDEIEKFREELSDAQNDILTEITSLFSQIMLNEIVPNGMSISESMMDRYWTHERQLAEVKEYLATQPASARKEFDQVYNKYIGQAPKEKGFDLEKGLKKILSKKENWKEIDELLKAGDFLPKQRTSANGVIPHQMHQQELDRIIEKQAKYYPWLATENPATGERDRHQAKYELDQLVSFRIPYYVGPLVTPEVQKATSGAKFAWAKRKEDGEITPWNLWDKIDRAESAEAFIKRMTVKDTYLLNEDVLPANSLLYQKYNVLNELNNVRVNGRRLSVGIKQDIYTELFKKKKTVKAGDVASLVMAKTRGVNKPSVEGLSDPKKFNSNLATYLDLKSIVGDKVDDNRYQMDLENIIEWRSVFEDGEIFADKLTEVEWLTDEQRSALVKKRYKGWGRLSKKLLTGIVDENGQRIIDLMWNTDQNFMQIVNQPVFKEQIDQLNQKAITNDGMTLRERVESVLDDAYTSPQNKKAIWQVVRVVEDIVKAVGNAPKSISIEFARNEGNKGEITRSRRTQLQKLFEDQAHELVKDTSLTEELEKAPDLSDRYYFYFTQGGKDMYTGDPINFDEISTKYDIDHILPQSFVKDDSLDNRVLVSRAENNKKSDRVPAKLYAAKMKPYWNQLLKQGLITQRKFENLTMDVDQTIKYRSLGFVKRQLVETRQVIKLTANILGSMYQEAGTDIIETRAGLTKQLREEFDLPKVREVNDYHHAVDAYLTTFAGQYLNRRYPKLRSFFVYGEYMKFKHGSDLKLRNFNFFHELMEGDKSQGKVVDQQTGELITTRDEVADYFDWVINLKVMLISNETYEETGKYFDASHESSSLYLKNQNKKSKLVVPLKNKLQPEYYGAYTGITQGYMVILKLLDKKGGFGVYRIPRYAADILNKCHDEVAYRNKIAEIISSDPRAPKSFEVVVPRVLKGTFLVDGEEKFILSSYRYKVNATQLILPVSDIKLIQDNFKALKKLNVEMQTKKLIEIYDNILRQVDKYYKLYDINKFRAKLHDGRSKFVELDDFGQDASKEKVIIKILRGLHFGSDLQNLKEIGFGTTPLGQFQVSEAGIRLSNTAFIIFKSPTGLFNRKLYLKNLGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号90)、
(e)
MPAAKRVKLDTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRLKSGGSSGGSSGSETPGTSESATPESSGGSSGGSPKKKRKVGEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDGKRPAATKKAGQAKKKKGSSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLYPYDVPDYAYPYDVPDYAY(配列番号93)、
(f)
MPAAKRVKLDTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKMLSGGSGGSGGSPKKKRKVEKKTNYTIGLAIGTDSVGWAVVKDDLELVKKRMKVLGNTETNYIKKNLWGSLLFESGQTAKDRRLKRVARRRYERRRNRLTELQKIFAPAIDEVDENFFFRLNESFLVPEDKAFSKNPIFGTLGEDKTYYKTYPTIYHLRQHLADSEEKADVRLIYLALAHMIKYRGHFLIEGKLDTEHIAINENLEQFFESYNALFSEEPIELRKEELIAIENILREKNSRTVKEKRITSFLKDIGRANKQSPMMAFITLIVGKKAKFKAAFNLEEEISLNLTDDSYDENLEILLNTIGSDFADLFDHAQRVYNAVELAGILSGDVKNTHAKLSAQMVAMYERHKEQLKEYKSFIKANLPDQYDMTFVAPKDAQKKDLKGYAGYIDGNMSQDSFYKFVKDQLKEVPGSEKFLDSIEKEDFLRKQRSFYNGVIPNQVHLAEMEAILDRQENYYPWLKENREKIISLLTFRIPYYVGPLADGQSEFAWLERKSDEKIKPWNFSDVVDLDRSAEKFIEQLIGRDTYLPDEYVLPKKSLIYQKYMVFNELTKIAYLDERQKRMNLSSVEKKEIFETLFKKRSKVTEKQLVKFFENYLQIDNPTIFGIEDAFNADYSTYVELAKVPGMKSMMDDPDNEDLMEEIVKILTVFEDRKMRRKQLEKYKERLSPEQIKELAKKHYTGWGRLSKKLLVGIRDKETQKTILDYLVEDDNHSGGRQHLNRNLMQLINDDRLSFKKTIAELQMIDPSADLYAQVQEIAGSPAIKKGILLGLKIVDEIIRVMGEKPENIVIEMARENQTTARGKALSKRREAKIKEGLAALGSSLLKENLPGNADLSQRKIYLYYTQNGKDIYLDEPLDFDRLSQYDEDHIIPQSFTVDNSLDNLVLTNSSQNRGNKKDDVPSLEVVNRQLAYWRSLKDAGLMTQRKFDNLTKAMRGGLTDKDRERFIQRQLVETRQITKNVAKLLDMRLNDKKDEAGNKIRETNIVLLKSAMASEFRKMFRLYKVRELNDYHHAHDAYLNAAIAINLLALYPYMADDFVYGEFRYKKKPQAEKATYEKLRQWNLIKRFGEKQLFTPDHEDCWNKERDIKTIKKVMGYRQVNVVKKAEERTGMLFKETINGKTNKGSRIPIKKDLDPSKYGGYIEEKMAYYAVISYEDKKKKPGKTIVGISIMDKKEFEYDSISYLGKLGFSNPVVQIILKNYSLIAYPDGRRRYITGATKTTKGKVELQKANQIAMEQDLVNFIYHLKNYDEISHPESYAFVQSHTDYFDRLFDSIEHYTRRFLDAETNINRLRRIYEEEKKKDPVDIEALVASFIELLKLTSAGAPADFIFMGEAISRRRYNSMTGLFDGQVIYQSLTGLYETRMRFEDKRPAATKKAGQAKKKKGSSGGSSGGSSGSETPGTSESATPESSGGSSGGSTSEKGPSTGDPTLRRRIESWEFDVFYDPRELRKETCLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERRFHSSISCSITWFLSWSPCWECSQAIREFLSQHPGVTLVIYVARLFWHMDQRNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLAFFRLHLQNCHYQTIPPHILLATGLIHPSVTWRYPYDVPDYAYPYDVPDYAYPYDVPDYA(配列番号94)と少なくとも80%同一のアミノ酸配列を有する、請求項37に記載のCas9タンパク質。 - 前記Cas9タンパク質が、5’-NGG-3’を含むPAM配列を認識する、請求項2に記載のCas9タンパク質。
- 前記Cas9タンパク質が、5’-NAGHC-3’を含むPAM配列を認識し、Hが、アデニン、シトシン、又はチミンである、請求項3に記載のCas9タンパク質。
- 前記Cas9タンパク質が、5’-NRHRRH-3’を含むPAM配列を認識し、Hが、アデニン、シトシン、又はチミンであり、Rが、アデニン又はグアニンである、請求項4に記載のCas9タンパク質。
- 前記Cas9タンパク質が、5’-NGG-3’を含むPAM配列を認識する、請求項5又は7に記載のCas9タンパク質。
- 前記Cas9タンパク質が、5’-NNAAA-3’を含むPAM配列を認識する、請求項6に記載のCas9タンパク質。
- 前記Cas9タンパク質が、5’-NGG-3’を含むPAM配列を認識する、請求項11又は12に記載のCas9タンパク質。
- 先行請求項のいずれか一項に記載のCas9タンパク質をコードする、核酸。
- 前記核酸が、哺乳動物細胞における発現のためにコドン最適化される、請求項46に記載の核酸。
- 前記核酸が、ヒト細胞における発現のためにコドン最適化される、請求項47に記載の核酸。
- 請求項44のいずれか一項に記載のCas9タンパク質を含む、真核細胞。
- 前記細胞が、ヒト細胞である、請求項49に記載の真核細胞。
- 真核細胞における標的核酸を開裂する方法であって、
前記細胞を、請求項1~44のいずれか一項に記載のCas9、及びRNAガイド又は前記RNAガイドをコードする核酸であって、前記RNAガイドが、前記標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む、RNAガイド又は核酸と接触させることを含み、
前記Cas9タンパク質が、前記RNAガイドに結合し、前記RNAガイドに相補的な標的核酸配列における切断を引き起こすことができる、方法。 - 真核細胞における標的核酸の発現を改変する方法であって、
前記細胞を、請求項1~44のいずれか一項に記載のCas9、及びRNAガイド又は前記RNAガイドをコードする核酸であって、前記RNAガイドが、前記標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む、RNAガイド又は核酸と接触させることを含み、
前記Cas9タンパク質が、前記RNAガイドに結合し、前記RNAガイドに相補的な標的核酸配列における切断を引き起こすことができる、方法。 - 真核細胞における標的核酸の発現を改変する方法であって、
前記細胞を、請求項1~44のいずれか一項に記載のCas9、及びRNAガイド又は前記RNAガイドをコードする核酸であって、前記RNAガイドが、前記標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む、RNAガイド又は核酸と接触させることを含み、
前記Cas9タンパク質が、前記RNAガイドに結合し、前記RNAガイドに相補的な標的核酸配列を編集することができる、方法。 - 真核細胞における標的核酸を修飾する方法であって、
前記細胞を、請求項1~44のいずれか一項に記載のCas9、及びRNAガイド又は前記RNAガイドをコードする核酸であって、前記RNAガイドが、前記標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む、RNAガイド又は核酸と接触させることを含み、
前記Cas9タンパク質が、前記RNAガイドに結合し、前記RNAガイドに相補的な標的核酸配列を編集することができる、方法。 - 前記Cas9タンパク質が、不活性Cas9(dCas9)である、請求項53又は54に記載の方法。
- 前記dCas9が、デアミナーゼに融合している、請求項55に記載の方法。
- 前記RNAガイドが、crRNA及びtracrRNAを含む、請求項51~56のいずれか一項に記載の方法。
- 前記RNAガイドが、sgRNAを含む、請求項51~55のいずれか一項に記載の方法。
- Streptococcus constellatus Cas9での使用のための前記sgRNAが、
5’-GUUUUAGAGCUGUGCUGUUUAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACUCAAGCUUGCAAAAGCGUGCACCGAUUCGGUGCU-3’(配列番号3)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項58に記載の方法。 - Sharpea Cas9での使用のための前記sgRNAが、
5’-GUUUUAGAGUUGUGUUAUUGAAAAAUAACACAACGAGUUAAAAUAAAGCUUAUGCUUAAAUGCCAGCUUUGCUGGUGUCAUUUAGAUGACUUUACUAAGGUUGCUUCGGCAACCUUUUU-3’(配列番号7)
と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項58に記載の方法。 - Veillonella parvula Cas9での使用のための前記sgRNAが、
5’-GUUUGAGAGUAGUGUGAAAACAUUACGAGUUCAAAUACAAAUUAAUUUACAAUGCCUUCGGGCUGCCCGACGUAGGGCACCUACUCUCAAUUCUUCGGAAUUGAGUU-3’(配列番号13)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項58に記載の方法。 - Ezakiella peruensis Cas9での使用のための前記sgRNAが、
5’-GUUUGAGAGUUAUGUAAUUGAAAAAUUACAUGACGAGUUCAAAUAAAAAUUUAUUCAAACCGCCUAUUUAUAGGCCGCAGAUGUUCUGCAUUAUGCUUGCUAUUGCAAGCUU-3’(配列番号19)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項58に記載の方法。 - Lactobacillus fermentum株AF15-40LB Cas9での使用のための前記sgRNAが、
5’-GUCUUGGAUGAGUGUGAAAACACUCAUAGUCAAGAUCAAACGAGUGGUUUUCCACGAGUUAUUACUUUUGAGGUCUUAUAUGGCCCAUACAUAAAAAGGAGUCGGAAUUUCCGGCUCCUUUUCUU-3’(配列番号95)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項58に記載の方法。 - Peptoniphilus sp.Marseille-P3761 Cas9での使用のための前記sgRNAが、
5’-GUUUUAGAGCCAUGUAGAAAUACAUUGCAAGUUAAAAUAAGGCUUUGUCCGUAAUCAACUUGAAAAAGUGGCGCUGUUUCGGCGCUUU-3’(配列番号96)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項58に記載の方法。 - 前記crRNAが、約16~26ヌクレオチド長のガイド配列を含む、請求項57に記載の方法。
- 前記crRNAが、18~24ヌクレオチド長のガイド配列を含む、請求項65に記載の方法。
- 前記標的核酸における前記切断が、一本鎖切断又は二本鎖切断である、請求項51又は52に記載の方法。
- 前記標的核酸における前記切断が、一本鎖切断である、請求項67に記載の方法。
- 前記Cas9タンパク質が、前記標的核酸配列の両方の鎖を開裂するヌクレアーゼであるか、又は前記標的核酸配列の一方の鎖を開裂するニッカーゼである、請求項50又は51に記載の方法。
- 前記標的核酸が、プロトスペーサー隣接モチーフ(PAM)配列に対して5’である、請求項50~69のいずれか一項に記載の方法。
- 前記Cas9が、真核細胞における発現のためのプロモーター配列に作動可能に結合しており、ガイドRNAが、真核細胞における発現のためのプロモーター配列に作動可能に結合している、請求項50~70のいずれか一項に記載の方法。
- 前記真核細胞が、ヒト細胞である、請求項71に記載の方法。
- 前記プロモーター配列が、真核プロモーター又はウイルスプロモーターである、請求項71に記載の方法。
- RNAガイド又は前記RNAガイドをコードする核酸であって、前記RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む、RNAガイド又は核酸と、
配列番号1、4、8、14、84、又は86と少なくとも80%の配列同一性を有するコドン最適化CRISPR関連(Cas)タンパク質であって、前記Casタンパク質が、前記RNAガイドに結合し、前記RNAガイドに相補的な標的核酸配列における切断を引き起こすことができる、Casタンパク質と、を含む、操作された天然に存在しないCRISPR-Casシステム。 - 前記コドン最適化CRISPR関連(Cas)タンパク質が、核局在化配列(NLS)及び/又はFLAGタグ、HISタグ、若しくはHAタグを更に含む、請求項74に記載の操作された天然に存在しないCRISPR-Casシステム。
- 前記コドン最適化CRISPR関連(Cas)タンパク質が、配列番号2、5、9、15、85、87、95、又は96と少なくとも80%の配列同一性を有し、前記Casタンパク質が、前記RNAガイドに結合し、前記RNAガイドに相補的な前記標的核酸配列における切断を引き起こすことができる、請求項77に記載の操作された天然に存在しないCRISPR-Casシステム。
- RNAガイド又は前記RNAガイドをコードする核酸であって、前記RNAガイドが、標的核酸にハイブリダイズすることができる直接反復配列及びスペーサー配列を含む、RNAガイド又は核酸と、
配列番号1、4、8、14、84、又は86と少なくとも80%の配列同一性を有するコドン最適化CRISPR関連(Cas)タンパク質であって、
前記Casタンパク質が、デアミナーゼに融合しており、Casタンパク質融合体が、前記RNAガイドに結合し、前記RNAガイドに相補的な標的核酸配列を編集することができる、Casタンパク質と、を含む、操作された天然に存在しないCRISPR-Casシステム。 - 前記コドン最適化CRISPR関連(Cas)タンパク質が、核局在化配列(NLS)及び/又はFLAGタグ、HISタグ、若しくはHAタグを更に含む、請求項77に記載の操作された天然に存在しないCRISPR-Casシステム。
- 前記コドン最適化CRISPR関連(Cas)タンパク質が、配列番号2、5、9、15、85、87、95、又は96と少なくとも80%の配列同一性を有し、前記Casタンパク質が、デアミナーゼに融合しており、前記Casタンパク質融合体が、前記RNAガイドに結合し、前記RNAガイドに相補的な前記標的核酸配列を編集することができる、請求項78に記載の操作された天然に存在しないCRISPR-Casシステム。
- 前記Cas9タンパク質が、不活性Cas9(dCas9)である、請求項77に記載のシステム。
- 前記RNAガイドが、crRNA及びtracrRNAを含む、請求項74~80のいずれか一項の請求項に記載のシステム。
- 前記RNAガイドが、sgRNAを含む、請求項74~80のいずれか一項に記載のシステム。
- Streptococcus constellatus Cas9での使用のための前記sgRNAが、
5’-GUUUUAGAGCUGUGCUGUUUAAACAACACAGCAAGUUAAAAUAAGGCUUUGUCCGUACUCAAGCUUGCAAAAGCGUGCACCGAUUCGGUGCU-3’(配列番号3)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項82に記載のシステム。 - Sharpea Cas9での使用のための前記sgRNAが、
5’-GUUUUAGAGUUGUGUUAUUGAAAAAUAACACAACGAGUUAAAAUAAAGCUUAUGCUUAAAUGCCAGCUUUGCUGGUGUCAUUUAGAUGACUUUACUAAGGUUGCUUCGGCAACCUUUUU-3’(配列番号7)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項82に記載のシステム。 - Veillonella parvula Cas9での使用のための前記sgRNAが、
5’-GUUUGAGAGUAGUGUGAAAACAUUACGAGUUCAAAUACAAAUUAAUUUACAAUGCCUUCGGGCUGCCCGACGUAGGGCACCUACUCUCAAUUCUUCGGAAUUGAGUU-3’(配列番号13)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項82に記載のシステム。 - Ezakiella peruensis Cas9での使用のための前記sgRNAが、
5’-GUUUGAGAGUUAUGUAAUUGAAAAAUUACAUGACGAGUUCAAAUAAAAAUUUAUUCAAACCGCCUAUUUAUAGGCCGCAGAUGUUCUGCAUUAUGCUUGCUAUUGCAAGCUU-3’(配列番号19)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項82に記載のシステム。 - Lactobacillus fermentum株AF15-40LB Cas9での使用のための前記sgRNAが、
5’-GUCUUGGAUGAGUGUGAAAACACUCAUAGUCAAGAUCAAACGAGUGGUUUUCCACGAGUUAUUACUUUUGAGGUCUUAUAUGGCCCAUACAUAAAAAGGAGUCGGAAUUUCCGGCUCCUUUUCUU-3’(配列番号95)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項82に記載のシステム。 - Peptoniphilus sp.Marseille-P3761 Cas9での使用のための前記sgRNAが、
5’-GUUUUAGAGCCAUGUAGAAAUACAUUGCAAGUUAAAAUAAGGCUUUGUCCGUAAUCAACUUGAAAAAGUGGCGCUGUUUCGGCGCUUU-3’(配列番号96)と少なくとも約80%の同一性を有する配列を含む足場を含む、請求項82に記載のシステム。 - 前記Casタンパク質が、真核細胞における発現のためのプロモーター配列に作動可能に結合しており、ガイドRNAが、真核細胞における発現のためのプロモーター配列に作動可能に結合している、請求項74~88のいずれか一項に記載のシステム。
- 前記真核細胞が、ヒト細胞である、請求項89に記載のシステム。
- 前記プロモーター配列が、真核プロモーター配列である、請求項90に記載のシステム。
- 請求項74~91のいずれか一項に記載のシステムをコードする、核酸。
- 請求項74~92のいずれか一項に記載のシステムを含む、ベクター。
- 前記ベクターが、プラスミドベクター又はウイルスベクターである、請求項93に記載のベクター。
- 前記ウイルスベクターが、アデノ随伴ウイルス(AAV)ベクター又はレンチウイルスベクターである、請求項94に記載のベクター。
- 前記ウイルスベクターが、AAVベクターである、請求項95に記載のベクター。
- 2つ以上のAAVベクターが、請求項77~91に記載のシステムをパッケージングするために使用される、請求項96に記載のベクター。
- 障害又は疾患の治療を必要とする対象においてそれを行う方法であって、前記方法が、前記対象に請求項74~91のいずれか一項に記載のシステムを投与することを含み、
前記ガイドRNAが、状態又は疾患に関連する標的核酸の少なくとも10ヌクレオチドに相補的であり、
前記Casタンパク質が、前記ガイドRNAと会合し、
前記ガイドRNAが、前記標的核酸に結合し、
前記Casタンパク質が、前記標的核酸における切断を引き起こし、任意選択的に、前記Cas9が、デアミナーゼに融合した不活性Cas9(dCas9)であり、前記標的核酸において1つ以上の塩基編集をもたらし、それによって前記障害又は疾患を治療する、方法。 - 前記ガイドRNAが、約18~24ヌクレオチドに相補的である、請求項98に記載の方法。
- 前記ガイドRNAが、20ヌクレオチドに相補的である、請求項99に記載の方法。
- 請求項18~22のいずれか一項に記載の融合タンパク質を含む、塩基エディター。
- アデノシンデアミナーゼドメイン又はシチジンデアミナーゼドメインを含む、請求項101に記載の塩基エディター。
- アデノシンデアミナーゼドメイン及びシチジンデアミナーゼドメインを含む、請求項101に記載の塩基エディター。
- ポリヌクレオチドの核酸塩基を編集する方法であって、前記方法が、前記ポリヌクレオチドを、請求項101に記載の塩基エディターと、1つ以上のガイドRNAとの複合体において接触させることを含み、前記塩基エディターが、アデノシンデアミナーゼドメインを含み、前記1つ以上のガイドRNAが、前記塩基エディターを標的化して、前記ポリヌクレオチドにおけるA・TからG・Cへの改変をもたらす、方法。
- ポリヌクレオチドの核酸塩基を編集する方法であって、前記方法が、前記ポリヌクレオチドを、請求項101に記載の塩基エディターと、1つ以上のガイドRNAとの複合体において接触させることを含み、前記塩基エディターが、シチジンデアミナーゼドメインを含み、前記1つ以上のガイドRNAが、前記塩基エディターを標的化して、前記ポリヌクレオチドにおけるC・GからT・Aへの改変をもたらす、方法。
- 前記編集が、標的ポリヌクレオチド配列における50%未満のインデル形成をもたらす、請求項104又は105に記載の方法。
- 前記編集が、点変異を生成する、請求項104~106のいずれか一項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163164798P | 2021-03-23 | 2021-03-23 | |
US63/164,798 | 2021-03-23 | ||
PCT/US2022/021523 WO2022204268A2 (en) | 2021-03-23 | 2022-03-23 | Novel crispr enzymes, methods, systems and uses thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024511621A true JP2024511621A (ja) | 2024-03-14 |
Family
ID=81326585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023558369A Pending JP2024511621A (ja) | 2021-03-23 | 2022-03-23 | 新規crispr酵素、方法、システム、及びそれらの使用 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20240167008A1 (ja) |
EP (1) | EP4314265A2 (ja) |
JP (1) | JP2024511621A (ja) |
KR (1) | KR20230158531A (ja) |
CN (1) | CN117529555A (ja) |
AU (1) | AU2022245243A1 (ja) |
CA (1) | CA3211495A1 (ja) |
WO (1) | WO2022204268A2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117866926B (zh) * | 2024-03-07 | 2024-08-16 | 珠海舒桐医疗科技有限公司 | 一种CRISPR-FrCas9蛋白突变体及应用 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4880635B1 (en) | 1984-08-08 | 1996-07-02 | Liposome Company | Dehydrated liposomes |
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
US4921757A (en) | 1985-04-26 | 1990-05-01 | Massachusetts Institute Of Technology | System for delayed and pulsed release of biologically active substances |
US4920016A (en) | 1986-12-24 | 1990-04-24 | Linear Technology, Inc. | Liposomes with enhanced circulation time |
JPH0825869B2 (ja) | 1987-02-09 | 1996-03-13 | 株式会社ビタミン研究所 | 抗腫瘍剤包埋リポソ−ム製剤 |
US4911928A (en) | 1987-03-13 | 1990-03-27 | Micro-Pak, Inc. | Paucilamellar lipid vesicles |
US4917951A (en) | 1987-07-28 | 1990-04-17 | Micro-Pak, Inc. | Lipid vesicles formed of surfactants and steroids |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
US5846946A (en) | 1996-06-14 | 1998-12-08 | Pasteur Merieux Serums Et Vaccins | Compositions and methods for administering Borrelia DNA |
AU2005274948B2 (en) | 2004-07-16 | 2011-09-22 | Genvec, Inc. | Vaccines against aids comprising CMV/R-nucleic acid constructs |
AU2008346801A1 (en) | 2007-12-31 | 2009-07-16 | Nanocor Therapeutics, Inc. | RNA interference for the treatment of heart failure |
US9405700B2 (en) | 2010-11-04 | 2016-08-02 | Sonics, Inc. | Methods and apparatus for virtualization in an integrated circuit |
CN105139759B (zh) | 2015-09-18 | 2017-10-10 | 京东方科技集团股份有限公司 | 一种拼接屏 |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
CA3032699A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
EP3592853A1 (en) * | 2017-03-09 | 2020-01-15 | President and Fellows of Harvard College | Suppression of pain by gene editing |
WO2019168953A1 (en) * | 2018-02-27 | 2019-09-06 | President And Fellows Of Harvard College | Evolved cas9 variants and uses thereof |
-
2022
- 2022-03-23 EP EP22715917.5A patent/EP4314265A2/en active Pending
- 2022-03-23 AU AU2022245243A patent/AU2022245243A1/en active Pending
- 2022-03-23 JP JP2023558369A patent/JP2024511621A/ja active Pending
- 2022-03-23 KR KR1020237034367A patent/KR20230158531A/ko unknown
- 2022-03-23 CA CA3211495A patent/CA3211495A1/en active Pending
- 2022-03-23 WO PCT/US2022/021523 patent/WO2022204268A2/en active Application Filing
- 2022-03-23 CN CN202280036959.3A patent/CN117529555A/zh active Pending
- 2022-03-23 US US18/283,148 patent/US20240167008A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3211495A1 (en) | 2022-09-29 |
WO2022204268A3 (en) | 2022-10-20 |
KR20230158531A (ko) | 2023-11-20 |
AU2022245243A1 (en) | 2023-09-28 |
CN117529555A (zh) | 2024-02-06 |
WO2022204268A2 (en) | 2022-09-29 |
EP4314265A2 (en) | 2024-02-07 |
US20240167008A1 (en) | 2024-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2016381313B2 (en) | Compositions and methods for the treatment of hemoglobinopathies | |
EP3589751A1 (en) | RNA TARGETING OF MUTATIONS VIA SUPPRESSOR tRNAs AND DEAMINASES | |
CA3026110A1 (en) | Novel crispr enzymes and systems | |
KR20220123398A (ko) | 합성 가이드 rna, 이의 조성물, 방법 및 용도 | |
WO2023078314A1 (en) | Novel crispr-cas12i systems and uses thereof | |
US20230279373A1 (en) | Novel crispr enzymes, methods, systems and uses thereof | |
JP2024511621A (ja) | 新規crispr酵素、方法、システム、及びそれらの使用 | |
US20240327813A1 (en) | Crispr enzymes, methods, systems and uses thereof | |
US20240252550A1 (en) | Genetic modification of hepatocytes | |
WO2023138685A9 (en) | Novel crispr-cas12i systems and uses thereof | |
WO2023196772A1 (en) | Novel rna base editing compositions, systems, methods and uses thereof | |
KR20240037299A (ko) | Crispr/cas 편집 시스템용 가이드 rna | |
JP2024540337A (ja) | 新型CRISPR-Cas12iシステム及びその用途 | |
EP4347830A2 (en) | Circular guide rnas for crispr/cas editing systems | |
CN117916373A (zh) | 用于crispr/cas编辑系统的引导rna | |
WO2024108092A1 (en) | Prime editor delivery by aav |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20240325 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20240509 |