KR20180042394A - 조작된 crispr-cas9 뉴클레아제 - Google Patents
조작된 crispr-cas9 뉴클레아제 Download PDFInfo
- Publication number
- KR20180042394A KR20180042394A KR1020187008311A KR20187008311A KR20180042394A KR 20180042394 A KR20180042394 A KR 20180042394A KR 1020187008311 A KR1020187008311 A KR 1020187008311A KR 20187008311 A KR20187008311 A KR 20187008311A KR 20180042394 A KR20180042394 A KR 20180042394A
- Authority
- KR
- South Korea
- Prior art keywords
- artificial sequence
- dna
- spcas9
- lys
- protein
- Prior art date
Links
- 101710163270 Nuclease Proteins 0.000 title claims abstract description 38
- 230000000694 effects Effects 0.000 claims description 104
- 230000035772 mutation Effects 0.000 claims description 100
- 210000004027 cell Anatomy 0.000 claims description 85
- 108090000623 proteins and genes Proteins 0.000 claims description 81
- 102000004169 proteins and genes Human genes 0.000 claims description 61
- 238000000034 method Methods 0.000 claims description 50
- 150000007523 nucleic acids Chemical class 0.000 claims description 40
- 102000039446 nucleic acids Human genes 0.000 claims description 36
- 108020004707 nucleic acids Proteins 0.000 claims description 36
- 102220467841 MyoD family inhibitor domain-containing protein 2_Y211A_mutation Human genes 0.000 claims description 34
- 108020005004 Guide RNA Proteins 0.000 claims description 32
- 108020001507 fusion proteins Proteins 0.000 claims description 31
- 102000037865 fusion proteins Human genes 0.000 claims description 31
- 108020004414 DNA Proteins 0.000 claims description 27
- 102000053602 DNA Human genes 0.000 claims description 24
- 239000013598 vector Substances 0.000 claims description 22
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 claims description 16
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 claims description 16
- 239000002773 nucleotide Substances 0.000 claims description 14
- 125000003729 nucleotide group Chemical group 0.000 claims description 14
- 102220606971 Cytosolic arginine sensor for mTORC1 subunit 2_H982A_mutation Human genes 0.000 claims description 13
- 102000004190 Enzymes Human genes 0.000 claims description 13
- 108090000790 Enzymes Proteins 0.000 claims description 13
- 230000000295 complement effect Effects 0.000 claims description 13
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 12
- 230000003993 interaction Effects 0.000 claims description 12
- 102220468816 Inositol 1,4,5-trisphosphate receptor type 2_L169A_mutation Human genes 0.000 claims description 10
- 238000013518 transcription Methods 0.000 claims description 9
- 230000035897 transcription Effects 0.000 claims description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 8
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 claims description 8
- 102000003964 Histone deacetylase Human genes 0.000 claims description 8
- 108090000353 Histone deacetylase Proteins 0.000 claims description 8
- 102000003893 Histone acetyltransferases Human genes 0.000 claims description 7
- 108090000246 Histone acetyltransferases Proteins 0.000 claims description 7
- 230000001105 regulatory effect Effects 0.000 claims description 7
- 102220502946 Geranylgeranyl transferase type-2 subunit alpha_D10N_mutation Human genes 0.000 claims description 6
- 108010033040 Histones Proteins 0.000 claims description 6
- 230000011987 methylation Effects 0.000 claims description 6
- 238000007069 methylation reaction Methods 0.000 claims description 6
- 101710141454 Nucleoprotein Proteins 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 5
- 238000000338 in vitro Methods 0.000 claims description 5
- 102220605869 Cytosolic arginine sensor for mTORC1 subunit 2_H557A_mutation Human genes 0.000 claims description 4
- 102000011787 Histone Methyltransferases Human genes 0.000 claims description 4
- 108010036115 Histone Methyltransferases Proteins 0.000 claims description 4
- 241001465754 Metazoa Species 0.000 claims description 4
- 230000003584 silencer Effects 0.000 claims description 4
- 102220605857 Cytosolic arginine sensor for mTORC1 subunit 2_N580A_mutation Human genes 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 claims description 3
- 239000004018 propan-1,2-diol esters of fatty acids Substances 0.000 claims description 3
- 230000037426 transcriptional repression Effects 0.000 claims description 3
- SWWQQSDRUYSMAR-UHFFFAOYSA-N 1-[(4-hydroxyphenyl)methyl]-1,2,3,4-tetrahydroisoquinoline-6,7-diol;hydrochloride Chemical group Cl.C1=CC(O)=CC=C1CC1C2=CC(O)=C(O)C=C2CCN1 SWWQQSDRUYSMAR-UHFFFAOYSA-N 0.000 claims description 2
- 102220606875 Cytosolic arginine sensor for mTORC1 subunit 2_H840A_mutation Human genes 0.000 claims description 2
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 claims description 2
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 claims description 2
- 108091006090 chromatin-associated proteins Proteins 0.000 claims description 2
- 230000002103 transcriptional effect Effects 0.000 claims description 2
- 239000000758 substrate Substances 0.000 claims 2
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 claims 1
- 102000003945 NF-kappa B Human genes 0.000 claims 1
- 108010057466 NF-kappa B Proteins 0.000 claims 1
- 102000004357 Transferases Human genes 0.000 claims 1
- 108090000992 Transferases Proteins 0.000 claims 1
- 150000001875 compounds Chemical class 0.000 claims 1
- 210000001671 embryonic stem cell Anatomy 0.000 claims 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 claims 1
- 210000001161 mammalian embryo Anatomy 0.000 claims 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 claims 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims 1
- 210000000130 stem cell Anatomy 0.000 claims 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 abstract description 6
- 230000008685 targeting Effects 0.000 abstract description 6
- 238000010362 genome editing Methods 0.000 abstract description 4
- 108091033409 CRISPR Proteins 0.000 description 72
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 64
- 108091027544 Subgenomic mRNA Proteins 0.000 description 61
- 238000006467 substitution reaction Methods 0.000 description 58
- 235000018102 proteins Nutrition 0.000 description 43
- 235000004279 alanine Nutrition 0.000 description 41
- 235000001014 amino acid Nutrition 0.000 description 38
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 37
- 229940024606 amino acid Drugs 0.000 description 33
- 150000001413 amino acids Chemical class 0.000 description 33
- 238000003556 assay Methods 0.000 description 30
- 238000002474 experimental method Methods 0.000 description 30
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 26
- 239000013612 plasmid Substances 0.000 description 23
- 102100039087 Peptidyl-alpha-hydroxyglycine alpha-amidating lyase Human genes 0.000 description 22
- 210000005260 human cell Anatomy 0.000 description 21
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 20
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 20
- 238000003780 insertion Methods 0.000 description 20
- 230000037431 insertion Effects 0.000 description 20
- 238000003776 cleavage reaction Methods 0.000 description 18
- 230000006378 damage Effects 0.000 description 18
- 230000007017 scission Effects 0.000 description 18
- 125000006850 spacer group Chemical group 0.000 description 17
- 238000012217 deletion Methods 0.000 description 16
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 15
- 230000001580 bacterial effect Effects 0.000 description 15
- 230000037430 deletion Effects 0.000 description 15
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 14
- 241000894006 Bacteria Species 0.000 description 12
- 241000193996 Streptococcus pyogenes Species 0.000 description 12
- 230000015556 catabolic process Effects 0.000 description 12
- 108090000765 processed proteins & peptides Proteins 0.000 description 11
- 108010022012 Fanconi Anemia Complementation Group F protein Proteins 0.000 description 10
- 238000012163 sequencing technique Methods 0.000 description 10
- 230000004083 survival effect Effects 0.000 description 10
- 239000013604 expression vector Substances 0.000 description 9
- 230000002829 reductive effect Effects 0.000 description 9
- 230000000717 retained effect Effects 0.000 description 9
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 8
- 230000027455 binding Effects 0.000 description 8
- 230000001066 destructive effect Effects 0.000 description 8
- 108010050848 glycylleucine Proteins 0.000 description 8
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 8
- 108010034529 leucyl-lysine Proteins 0.000 description 8
- 108010054155 lysyllysine Proteins 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 108020004705 Codon Proteins 0.000 description 7
- 239000004472 Lysine Substances 0.000 description 7
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 7
- 230000006872 improvement Effects 0.000 description 7
- 230000002601 intratumoral effect Effects 0.000 description 7
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 6
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 6
- 241000588724 Escherichia coli Species 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 241000238631 Hexapoda Species 0.000 description 6
- 102220513044 Src substrate cortactin_R165A_mutation Human genes 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 6
- 239000004475 Arginine Substances 0.000 description 5
- 102220606842 Cytosolic arginine sensor for mTORC1 subunit 2_R165A_mutation Human genes 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- 102220546502 Vacuolar protein sorting-associated protein 41 homolog_R69A_mutation Human genes 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 5
- 230000003197 catalytic effect Effects 0.000 description 5
- 230000007423 decrease Effects 0.000 description 5
- 238000010348 incorporation Methods 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 4
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 4
- 102220490764 Acid sphingomyelinase-like phosphodiesterase 3b_H111Q_mutation Human genes 0.000 description 4
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 4
- 102220493839 Casein kinase I isoform gamma-1_N169A_mutation Human genes 0.000 description 4
- 102220567824 Claudin-17_R45A_mutation Human genes 0.000 description 4
- 102220572009 Claudin-17_R61A_mutation Human genes 0.000 description 4
- 102220605856 Cytosolic arginine sensor for mTORC1 subunit 2_N985A_mutation Human genes 0.000 description 4
- 102220605851 Cytosolic arginine sensor for mTORC1 subunit 2_N986A_mutation Human genes 0.000 description 4
- 102220607031 Cytosolic arginine sensor for mTORC1 subunit 2_R1015A_mutation Human genes 0.000 description 4
- 102220605962 Cytosolic arginine sensor for mTORC1 subunit 2_R59A_mutation Human genes 0.000 description 4
- 102220605855 Cytosolic arginine sensor for mTORC1 subunit 2_T787A_mutation Human genes 0.000 description 4
- 102220551601 DNA polymerase epsilon subunit 4_L909A_mutation Human genes 0.000 description 4
- 102220473277 ER membrane protein complex subunit 8_R314A_mutation Human genes 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- 102220515172 Heterogeneous nuclear ribonucleoprotein F_R116A_mutation Human genes 0.000 description 4
- 102220511569 Histone H2A type 1-A_Y239A_mutation Human genes 0.000 description 4
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 4
- 102220575743 Lipase maturation factor 1_V164A_mutation Human genes 0.000 description 4
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 4
- 102220578776 Mapk-regulated corepressor-interacting protein 1_R60A_mutation Human genes 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- 102220558655 Nuclear protein 1_R51A_mutation Human genes 0.000 description 4
- 102220523008 RNA 5'-monophosphate methyltransferase_R209A_mutation Human genes 0.000 description 4
- 102220590214 RNA helicase Mov10l1_N394A_mutation Human genes 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 4
- 102220513194 Serine/threonine-protein kinase TAO2_K57A_mutation Human genes 0.000 description 4
- 102220522292 THAP domain-containing protein 1_N44A_mutation Human genes 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 108010068265 aspartyltyrosine Proteins 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 231100000350 mutagenesis Toxicity 0.000 description 4
- 239000013642 negative control Substances 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 102200048064 rs4135010 Human genes 0.000 description 4
- 229960001153 serine Drugs 0.000 description 4
- 102220533573 tRNA wybutosine-synthesizing protein 5_R55A_mutation Human genes 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 3
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 3
- 102220606905 Cytosolic arginine sensor for mTORC1 subunit 2_R78A_mutation Human genes 0.000 description 3
- 102220480809 E3 ubiquitin-protein ligase DCST1_R115A_mutation Human genes 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 102100027723 Endogenous retrovirus group K member 6 Rec protein Human genes 0.000 description 3
- 102000002494 Endoribonucleases Human genes 0.000 description 3
- 108010093099 Endoribonucleases Proteins 0.000 description 3
- 101710091045 Envelope protein Proteins 0.000 description 3
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 3
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 3
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 102220605043 Histone H4-like protein type G_K76A_mutation Human genes 0.000 description 3
- 102220605057 Histone H4-like protein type G_R75A_mutation Human genes 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 3
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 3
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- 102220578775 Mapk-regulated corepressor-interacting protein 1_R63A_mutation Human genes 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- 102220492945 Nuclear RNA export factor 1_R71A_mutation Human genes 0.000 description 3
- 102220466384 PRA1 family protein 2_N77A_mutation Human genes 0.000 description 3
- 102220484160 Pogo transposable element with ZNF domain_H840A_mutation Human genes 0.000 description 3
- 101710188315 Protein X Proteins 0.000 description 3
- 102220516352 Pterin-4-alpha-carbinolamine dehydratase 2_R447A_mutation Human genes 0.000 description 3
- 102220506974 Rab11 family-interacting protein 1_K163A_mutation Human genes 0.000 description 3
- 108091027981 Response element Proteins 0.000 description 3
- 102000004389 Ribonucleoproteins Human genes 0.000 description 3
- 108010081734 Ribonucleoproteins Proteins 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 101000910033 Staphylococcus aureus CRISPR-associated endonuclease Cas9 Proteins 0.000 description 3
- 102220484285 T cell receptor alpha variable 34_Y72A_mutation Human genes 0.000 description 3
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 3
- 102220472576 Vitamin K epoxide reductase complex subunit 1_H160A_mutation Human genes 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 108010037850 glycylvaline Proteins 0.000 description 3
- 108010028295 histidylhistidine Proteins 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 229920001519 homopolymer Polymers 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 230000001771 impaired effect Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 108010064235 lysylglycine Proteins 0.000 description 3
- 108010017391 lysylvaline Proteins 0.000 description 3
- 230000030648 nucleus localization Effects 0.000 description 3
- 108010011110 polyarginine Proteins 0.000 description 3
- 108700012359 toxins Proteins 0.000 description 3
- 241000701447 unidentified baculovirus Species 0.000 description 3
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 2
- RCLDHCIEAUJSBD-UHFFFAOYSA-N 6-(6-sulfonaphthalen-2-yl)oxynaphthalene-2-sulfonic acid Chemical compound C1=C(S(O)(=O)=O)C=CC2=CC(OC3=CC4=CC=C(C=C4C=C3)S(=O)(=O)O)=CC=C21 RCLDHCIEAUJSBD-UHFFFAOYSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 2
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 2
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 2
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 2
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 102220607176 Cytosolic arginine sensor for mTORC1 subunit 2_R1333A_mutation Human genes 0.000 description 2
- 102220607172 Cytosolic arginine sensor for mTORC1 subunit 2_R1335A_mutation Human genes 0.000 description 2
- 102220607024 Cytosolic arginine sensor for mTORC1 subunit 2_R66A_mutation Human genes 0.000 description 2
- 102220606910 Cytosolic arginine sensor for mTORC1 subunit 2_R70A_mutation Human genes 0.000 description 2
- 102220606911 Cytosolic arginine sensor for mTORC1 subunit 2_R74A_mutation Human genes 0.000 description 2
- 102220606969 Cytosolic arginine sensor for mTORC1 subunit 2_R991A_mutation Human genes 0.000 description 2
- 102220566980 Dermatan-sulfate epimerase_Y256A_mutation Human genes 0.000 description 2
- 102000016680 Dioxygenases Human genes 0.000 description 2
- 108010028143 Dioxygenases Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- RGAOLBZBLOJUTP-GRLWGSQLSA-N Gln-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N RGAOLBZBLOJUTP-GRLWGSQLSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 2
- UZWUBBRJWFTHTD-LAEOZQHASA-N Glu-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O UZWUBBRJWFTHTD-LAEOZQHASA-N 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 2
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- 102220500024 Interferon-induced GTP-binding protein Mx2_K248A_mutation Human genes 0.000 description 2
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 2
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- 102220481690 Methylmalonyl-CoA epimerase, mitochondrial_K114A_mutation Human genes 0.000 description 2
- 108010021466 Mutant Proteins Proteins 0.000 description 2
- 102000008300 Mutant Proteins Human genes 0.000 description 2
- 102220467840 MyoD family inhibitor domain-containing protein 2_R208A_mutation Human genes 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 102220516459 Oncostatin-M_R991A_mutation Human genes 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- 101710182846 Polyhedrin Proteins 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 101100209986 Rattus norvegicus Slc18a1 gene Proteins 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 2
- BYOHPUZJVXWHAE-BYULHYEWSA-N Val-Asn-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N BYOHPUZJVXWHAE-BYULHYEWSA-N 0.000 description 2
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 2
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 2
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 2
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000004721 adaptive immunity Effects 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 108010008355 arginyl-glutamine Proteins 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000005251 capillar electrophoresis Methods 0.000 description 2
- 239000003054 catalyst Substances 0.000 description 2
- 238000000423 cell based assay Methods 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 229960005091 chloramphenicol Drugs 0.000 description 2
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 2
- 229960002743 glutamine Drugs 0.000 description 2
- 235000004554 glutamine Nutrition 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 2
- 108010009298 lysylglutamic acid Proteins 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000036438 mutation frequency Effects 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 230000009871 nonspecific binding Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000009438 off-target cleavage Effects 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 102000005912 ran GTP Binding Protein Human genes 0.000 description 2
- 238000007423 screening assay Methods 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 229960004441 tyrosine Drugs 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- PCDUALPXEOKZPE-DXCABUDRSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoyl]amino]-3-hydroxypropanoic acid Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O PCDUALPXEOKZPE-DXCABUDRSA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 102100033647 Activity-regulated cytoskeleton-associated protein Human genes 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 1
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- WUHJHHGYVVJMQE-BJDJZHNGSA-N Ala-Leu-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WUHJHHGYVVJMQE-BJDJZHNGSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- AOAKQKVICDWCLB-UWJYBYFXSA-N Ala-Tyr-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N AOAKQKVICDWCLB-UWJYBYFXSA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- 102100021954 Alpha-tubulin N-acetyltransferase 1 Human genes 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- JAYIQMNQDMOBFY-KKUMJFAQSA-N Arg-Glu-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JAYIQMNQDMOBFY-KKUMJFAQSA-N 0.000 description 1
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- FKQITMVNILRUCQ-IHRRRGAJSA-N Arg-Phe-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O FKQITMVNILRUCQ-IHRRRGAJSA-N 0.000 description 1
- KZXPVYVSHUJCEO-ULQDDVLXSA-N Arg-Phe-Lys Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 KZXPVYVSHUJCEO-ULQDDVLXSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- JPAWCMXVNZPJLO-IHRRRGAJSA-N Arg-Ser-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JPAWCMXVNZPJLO-IHRRRGAJSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- OQPAZKMGCWPERI-GUBZILKMSA-N Arg-Ser-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O OQPAZKMGCWPERI-GUBZILKMSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- OGZBJJLRKQZRHL-KJEVXHAQSA-N Arg-Thr-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OGZBJJLRKQZRHL-KJEVXHAQSA-N 0.000 description 1
- NVPHRWNWTKYIST-BPNCWPANSA-N Arg-Tyr-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=C(O)C=C1 NVPHRWNWTKYIST-BPNCWPANSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- DAPLJWATMAXPPZ-CIUDSAMLSA-N Asn-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O DAPLJWATMAXPPZ-CIUDSAMLSA-N 0.000 description 1
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 1
- NLCDVZJDEXIDDL-BIIVOSGPSA-N Asn-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O NLCDVZJDEXIDDL-BIIVOSGPSA-N 0.000 description 1
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 1
- XQQVCUIBGYFKDC-OLHMAJIHSA-N Asn-Asp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XQQVCUIBGYFKDC-OLHMAJIHSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- UEONJSPBTSWKOI-CIUDSAMLSA-N Asn-Gln-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O UEONJSPBTSWKOI-CIUDSAMLSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- BEHQTVDBCLSCBY-CFMVVWHZSA-N Asn-Tyr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BEHQTVDBCLSCBY-CFMVVWHZSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- LRCIOEVFVGXZKB-BZSNNMDCSA-N Asn-Tyr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LRCIOEVFVGXZKB-BZSNNMDCSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- JUWISGAGWSDGDH-KKUMJFAQSA-N Asp-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=CC=C1 JUWISGAGWSDGDH-KKUMJFAQSA-N 0.000 description 1
- HJZLUGQGJWXJCJ-CIUDSAMLSA-N Asp-Pro-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJZLUGQGJWXJCJ-CIUDSAMLSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 1
- ZUNMTUPRQMWMHX-LSJOCFKGSA-N Asp-Val-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O ZUNMTUPRQMWMHX-LSJOCFKGSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 101100180402 Caenorhabditis elegans jun-1 gene Proteins 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 101710150820 Cellular tumor antigen p53 Proteins 0.000 description 1
- 102220618553 Cerebellin-3_Y42A_mutation Human genes 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108010060385 Cyclin B1 Proteins 0.000 description 1
- PMATZTZNYRCHOR-CGLBZJNRSA-N Cyclosporin A Chemical compound CC[C@@H]1NC(=O)[C@H]([C@H](O)[C@H](C)C\C=C\C)N(C)C(=O)[C@H](C(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](CC(C)C)N(C)C(=O)[C@@H](C)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)N(C)C(=O)[C@H](C(C)C)NC(=O)[C@H](CC(C)C)N(C)C(=O)CN(C)C1=O PMATZTZNYRCHOR-CGLBZJNRSA-N 0.000 description 1
- 108010036949 Cyclosporine Proteins 0.000 description 1
- DRXOWZZHCSBUOI-YJRXYDGGSA-N Cys-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N)O DRXOWZZHCSBUOI-YJRXYDGGSA-N 0.000 description 1
- 102220607027 Cytosolic arginine sensor for mTORC1 subunit 2_S15A_mutation Human genes 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 102220481105 DNA-binding death effector domain-containing protein 2_F405W_mutation Human genes 0.000 description 1
- 102220595903 Endonuclease_N14A_mutation Human genes 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 1
- 108010078519 Extramel Proteins 0.000 description 1
- 239000008954 Extramel Substances 0.000 description 1
- 102000012216 Fanconi Anemia Complementation Group F protein Human genes 0.000 description 1
- 238000000729 Fisher's exact test Methods 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 102100032340 G2/mitotic-specific cyclin-B1 Human genes 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 1
- LJEPDHWNQXPXMM-NHCYSSNCSA-N Gln-Arg-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O LJEPDHWNQXPXMM-NHCYSSNCSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- HPCOBEHVEHWREJ-DCAQKATOSA-N Gln-Lys-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HPCOBEHVEHWREJ-DCAQKATOSA-N 0.000 description 1
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 1
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- HUFCEIHAFNVSNR-IHRRRGAJSA-N Glu-Gln-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUFCEIHAFNVSNR-IHRRRGAJSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- PHONAZGUEGIOEM-GLLZPBPUSA-N Glu-Glu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PHONAZGUEGIOEM-GLLZPBPUSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 1
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 1
- CGWHAXBNGYQBBK-JBACZVJFSA-N Glu-Trp-Tyr Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)C1=CC=C(O)C=C1 CGWHAXBNGYQBBK-JBACZVJFSA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- LSYFGBRDBIQYAQ-FHWLQOOXSA-N Glu-Tyr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LSYFGBRDBIQYAQ-FHWLQOOXSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- LURCIJSJAKFCRO-QWRGUYRKSA-N Gly-Asn-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LURCIJSJAKFCRO-QWRGUYRKSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 108091007417 HOX transcript antisense RNA Proteins 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- AFPFGFUGETYOSY-HGNGGELXSA-N His-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AFPFGFUGETYOSY-HGNGGELXSA-N 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- MLZVJIREOKTDAR-SIGLWIIPSA-N His-Ile-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MLZVJIREOKTDAR-SIGLWIIPSA-N 0.000 description 1
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 101001118566 Homo sapiens 40S ribosomal protein S15a Proteins 0.000 description 1
- 101000914676 Homo sapiens Fanconi anemia group F protein Proteins 0.000 description 1
- 101000857677 Homo sapiens Runt-related transcription factor 1 Proteins 0.000 description 1
- 101000595467 Homo sapiens T-complex protein 1 subunit gamma Proteins 0.000 description 1
- 101100263585 Homo sapiens VEGFA gene Proteins 0.000 description 1
- 101000785569 Homo sapiens Zinc finger and SCAN domain-containing protein 2 Proteins 0.000 description 1
- 101000818735 Homo sapiens Zinc finger protein 10 Proteins 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- QTUSJASXLGLJSR-OSUNSFLBSA-N Ile-Arg-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N QTUSJASXLGLJSR-OSUNSFLBSA-N 0.000 description 1
- QADCTXFNLZBZAB-GHCJXIJMSA-N Ile-Asn-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N QADCTXFNLZBZAB-GHCJXIJMSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 1
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- YBJWJQQBWRARLT-KBIXCLLPSA-N Ile-Gln-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O YBJWJQQBWRARLT-KBIXCLLPSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- PWDSHAAAFXISLE-SXTJYALSSA-N Ile-Ile-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O PWDSHAAAFXISLE-SXTJYALSSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- OTSVBELRDMSPKY-PCBIJLKTSA-N Ile-Phe-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OTSVBELRDMSPKY-PCBIJLKTSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- VGSPNSSCMOHRRR-BJDJZHNGSA-N Ile-Ser-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N VGSPNSSCMOHRRR-BJDJZHNGSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 1
- DGTOKVBDZXJHNZ-WZLNRYEVSA-N Ile-Thr-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N DGTOKVBDZXJHNZ-WZLNRYEVSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 1
- 206010062016 Immunosuppression Diseases 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108010054278 Lac Repressors Proteins 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PJYSOYLLTJKZHC-GUBZILKMSA-N Leu-Asp-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O PJYSOYLLTJKZHC-GUBZILKMSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 1
- LCNASHSOFMRYFO-WDCWCFNPSA-N Leu-Thr-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(N)=O LCNASHSOFMRYFO-WDCWCFNPSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- URJUVJDTPXCQFL-IHPCNDPISA-N Leu-Trp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N URJUVJDTPXCQFL-IHPCNDPISA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- DZQYZKPINJLLEN-KKUMJFAQSA-N Lys-Cys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)O DZQYZKPINJLLEN-KKUMJFAQSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- QKXZCUCBFPEXNK-KKUMJFAQSA-N Lys-Leu-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QKXZCUCBFPEXNK-KKUMJFAQSA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- YXPJCVNIDDKGOE-MELADBBJSA-N Lys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N)C(=O)O YXPJCVNIDDKGOE-MELADBBJSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- FPQMQEOVSKMVMA-ACRUOGEOSA-N Lys-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CCCCN)N)O FPQMQEOVSKMVMA-ACRUOGEOSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- HMZPYMSEAALNAE-ULQDDVLXSA-N Lys-Val-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMZPYMSEAALNAE-ULQDDVLXSA-N 0.000 description 1
- IKXQOBUBZSOWDY-AVGNSLFASA-N Lys-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N IKXQOBUBZSOWDY-AVGNSLFASA-N 0.000 description 1
- 238000012307 MRI technique Methods 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 1
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- DJBCKVNHEIJLQA-GMOBBJLQSA-N Met-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCSC)N DJBCKVNHEIJLQA-GMOBBJLQSA-N 0.000 description 1
- JHDNAOVJJQSMMM-GMOBBJLQSA-N Met-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N JHDNAOVJJQSMMM-GMOBBJLQSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- TWEWRDAAIYBJTO-ULQDDVLXSA-N Met-Tyr-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N TWEWRDAAIYBJTO-ULQDDVLXSA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102100035971 Molybdopterin molybdenumtransferase Human genes 0.000 description 1
- 101710119577 Molybdopterin molybdenumtransferase Proteins 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 206010028400 Mutagenic effect Diseases 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 102000002488 Nucleoplasmin Human genes 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- LXVFHIBXOWJTKZ-BZSNNMDCSA-N Phe-Asn-Tyr Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O LXVFHIBXOWJTKZ-BZSNNMDCSA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- ABQFNJAFONNUTH-FHWLQOOXSA-N Phe-Gln-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N ABQFNJAFONNUTH-FHWLQOOXSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- OVJMCXAPGFDGMG-HKUYNNGSSA-N Phe-Gly-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OVJMCXAPGFDGMG-HKUYNNGSSA-N 0.000 description 1
- WKTSCAXSYITIJJ-PCBIJLKTSA-N Phe-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O WKTSCAXSYITIJJ-PCBIJLKTSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- SMCHPSMKAFIERP-FXQIFTODSA-N Pro-Asn-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 SMCHPSMKAFIERP-FXQIFTODSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- FRKBNXCFJBPJOL-GUBZILKMSA-N Pro-Glu-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FRKBNXCFJBPJOL-GUBZILKMSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 108010079005 RDV peptide Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- FCRMLGJMPXCAHD-FXQIFTODSA-N Ser-Arg-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O FCRMLGJMPXCAHD-FXQIFTODSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- BCKYYTVFBXHPOG-ACZMJKKPSA-N Ser-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N BCKYYTVFBXHPOG-ACZMJKKPSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- IOVHBRCQOGWAQH-ZKWXMUAHSA-N Ser-Gly-Ile Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOVHBRCQOGWAQH-ZKWXMUAHSA-N 0.000 description 1
- QBUWQRKEHJXTOP-DCAQKATOSA-N Ser-His-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QBUWQRKEHJXTOP-DCAQKATOSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- UGTZYIPOBYXWRW-SRVKXCTJSA-N Ser-Phe-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O UGTZYIPOBYXWRW-SRVKXCTJSA-N 0.000 description 1
- KZPRPBLHYMZIMH-MXAVVETBSA-N Ser-Phe-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZPRPBLHYMZIMH-MXAVVETBSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- PURRNJBBXDDWLX-ZDLURKLDSA-N Ser-Thr-Gly Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CO)N)O PURRNJBBXDDWLX-ZDLURKLDSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 1
- 102100036049 T-complex protein 1 subunit gamma Human genes 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 102220536494 THAP domain-containing protein 1_S55A_mutation Human genes 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- YLXAMFZYJTZXFH-OLHMAJIHSA-N Thr-Asn-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YLXAMFZYJTZXFH-OLHMAJIHSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- IHAPJUHCZXBPHR-WZLNRYEVSA-N Thr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N IHAPJUHCZXBPHR-WZLNRYEVSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- KAJRRNHOVMZYBL-IRIUXVKKSA-N Thr-Tyr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAJRRNHOVMZYBL-IRIUXVKKSA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- AYHSJESDFKREAR-KKUMJFAQSA-N Tyr-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AYHSJESDFKREAR-KKUMJFAQSA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- HVHJYXDXRIWELT-RYUDHWBXSA-N Tyr-Glu-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O HVHJYXDXRIWELT-RYUDHWBXSA-N 0.000 description 1
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 1
- UNUZEBFXGWVAOP-DZKIICNBSA-N Tyr-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UNUZEBFXGWVAOP-DZKIICNBSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- MXFPBNFKVBHIRW-BZSNNMDCSA-N Tyr-Lys-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O MXFPBNFKVBHIRW-BZSNNMDCSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- IGXLNVIYDYONFB-UFYCRDLUSA-N Tyr-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 IGXLNVIYDYONFB-UFYCRDLUSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- ZMDCGGKHRKNWKD-LAEOZQHASA-N Val-Asn-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZMDCGGKHRKNWKD-LAEOZQHASA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- JAKHAONCJJZVHT-DCAQKATOSA-N Val-Lys-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N JAKHAONCJJZVHT-DCAQKATOSA-N 0.000 description 1
- UOUIMEGEPSBZIV-ULQDDVLXSA-N Val-Lys-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UOUIMEGEPSBZIV-ULQDDVLXSA-N 0.000 description 1
- VENKIVFKIPGEJN-NHCYSSNCSA-N Val-Met-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N VENKIVFKIPGEJN-NHCYSSNCSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108091007416 X-inactive specific transcript Proteins 0.000 description 1
- 108091035715 XIST (gene) Proteins 0.000 description 1
- 102100021112 Zinc finger protein 10 Human genes 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 230000003281 allosteric effect Effects 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 229960005261 aspartic acid Drugs 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- 230000008970 bacterial immunity Effects 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000008499 blood brain barrier function Effects 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 101150102092 ccdB gene Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 238000010382 chemical cross-linking Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 229960001265 ciclosporin Drugs 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 239000002872 contrast media Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 244000096108 cunha Species 0.000 description 1
- 229930182912 cyclosporin Natural products 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000005860 defense response to virus Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 230000001094 effect on targets Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 108010025678 empty spiracles homeobox proteins Proteins 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 229960002989 glutamic acid Drugs 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 230000033444 hydroxylation Effects 0.000 description 1
- 238000005805 hydroxylation reaction Methods 0.000 description 1
- 230000001146 hypoxic effect Effects 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000013101 initial test Methods 0.000 description 1
- 210000003093 intracellular space Anatomy 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 231100000243 mutagenic effect Toxicity 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 108060005597 nucleoplasmin Proteins 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 229940046166 oligodeoxynucleotide Drugs 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 108010043655 penetratin Proteins 0.000 description 1
- MCYTYTUNNNZWOK-LCLOTLQISA-N penetratin Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=CC=C1 MCYTYTUNNNZWOK-LCLOTLQISA-N 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 239000002574 poison Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 102000016914 ras Proteins Human genes 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 102200059791 rs587777019 Human genes 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 210000001578 tight junction Anatomy 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010068794 tyrosyl-tyrosyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
개선된 특이성을 갖는 조작된 CRISPR-Cas9 뉴클레아제 및 게놈 조작, 에피게놈 조작, 게놈 표적화 및 게놈 편집에서의 그의 용도.
Description
우선권의 주장
본 출원은 35 USC §119(e)에 의거하여, 2015년 8월 28일자로 출원된 미국 특허 출원 제 62/211,553호; 2015년 9월 9일자로 출원된 제 62/216,033호; 2015년 11월 20일자로 출원된 제 62/258,280호; 2015년 12월 28일자로 출원된 제 62/271,938호; 및 2016년 2월 4일자로 출원된 제 15/015,947호에 대한 우선권을 주장한다. 전술된 특허 출원의 전문은 본 명세서에 참조로 포함된다.
서열 목록
본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 포함하며, 이는 그 전문이 본 명세서에 참조로 포함된다. 상기 ASCII 복사본은 2016년 8월 26일자로 생성되었고, 서열 LISTING.txt라는 명칭으로, 129,955 바이트 크기이다.
미국 연방정부 지원 하의 연구 또는 개발
본 발명은 미국 국립 보건원에 의해 부여된 허가 번호 DP1 GM105378 및 R01 GM088040 하에 미국 정부의 지원으로 이루어졌다. 미국 정부는 본 발명에 대해 특정 권리를 가진다.
기술 분야
본 발명은 적어도 부분적으로는, 변이되고 개선된 표적 특이성을 갖는 조작된 일정한 간격으로 주기적으로 분포하는 짧은 회문 구조의 반복서열(Clustered Regularly Interspaced Short Palindromic Repeat)(CRISPR)/CRISPR-연관 단백질 9(Cas9) 뉴클레아제 및 게놈 조작, 에피게놈 조작, 게놈 표적화, 게놈 편집 및 시험관내 진단법에서의 그의 용도에 관한 것이다.
CRISPR-Cas9 뉴클레아제는 다양한 유기체 및 세포 유형에서 효율적인 게놈 편집을 가능하게 한다(문헌[Sander & Joung, Nat Biotechnol 32, 347-355 (2014); Hsu et al., Cell 157, 1262-1278 (2014); Doudna & Charpentier, Science 346, 1258096 (2014); Barrangou & May, Expert Opin Biol Ther 15, 311-314 (2015)]). Cas9에 의한 표적 부위 인식은, 표적 프로토스페이서(protospacer)에 상보성인 서열을 인코딩하는 키메라 단일 가이드 RNA(sgRNA)에 의해 프로그래밍되나(문헌[Jinek et al., Science 337, 816-821 (2012)]), 또한, 짧은 이웃 PAM의 인식이 필요하다(문헌[Mojica et al., Microbiology 155, 733-740 (2009); Shah et al., RNA Biol 10, 891-899 (2013); Jiang et al., Nat Biotechnol 31, 233-239 (2013); Jinek et al., Science 337, 816-821 (2012); Sternberg et al., Nature 507, 62-67 (2014)]).
본 명세서에 기재된 바와 같이, Cas9 단백질은 이론적으로는, DNA에 대한 Cas9의 결합 친화도를 감소시킴으로써, 증대된 특이성을 나타내도록 조작될 수 있다. 따라서, 본 명세서에는, 야생형 단백질과 비교하여, 특이성이 증대된(즉, 불완전하게 매치되거나, 미스매치된 DNA 부위에서 실질적으로 더 적은 표적외 효과를 유도하는) 다수의 Cas9 변이체뿐만 아니라, 이들을 사용하는 방법이 기재되어 있다.
제1 양태에서, 본 발명은 L169A, Y450, N497, R661, Q695, Q926, 및/또는 D1135E의 위치 중 1, 2, 3, 4, 5, 6 또는 7개 모두에서 돌연변이를 가지고, 예를 들어, L169, Y450, N497, R661, Q695, Q926, D1135E의 위치 중 1, 2, 3, 4, 5, 6 또는 7개에 돌연변이를 갖는 SEQ ID NO:1의 아미노산 서열과 적어도 80% 동일한 서열 및 선택적으로, 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그 중 하나 이상을 포함하는 단리된 스트렙토코커스 피오게네스(Streptococcus pyogenes) Cas9(SpCas9) 단백질을 제공한다. 돌연변이는 아미노산을 천연 아미노산이 아닌 다른 아미노산으로 변이시킨다(예를 들어, 497은 N 이외의 다른 것임). 바람직한 구현예에서 돌연변이는 아미노산을 천연 아미노산, 아르기닌 또는 리신 이외에 임의의 아미노산으로 변화시킨다; 일부 구현예에서, 아미노산은 알라닌이다.
일부 구현예에서, 변이체 SpCas9 단백질은 N497, R661, Q695, 및 Q926 중 1, 2, 3 또는 4개 모두에서의 돌연변이, 예를 들어, N497A, R661A, Q695A, 및 Q926A의 돌연변이 중 1, 2, 3, 또는 4개 모두를 포함한다.
일부 구현예에서, 변이체 SpCas9 단백질은 Q695 및/또는 Q926, 및 선택적으로 L169, Y450, N497, R661 및 D1135E 중 1, 2, 3, 4 또는 5개 모두에서의 돌연변이를 포함하며, 예를 들어, Y450A/Q695A, L169A/Q695A, Q695A/Q926A, Q695A/D1135E, Q926A/D1135E, Y450A/D1135E, L169A/Y450A/Q695A, L169A/Q695A/Q926A, Y450A/Q695A/Q926A, R661A/Q695A/Q926A, N497A/Q695A/Q926A, Y450A/Q695A/D1135E, Y450A/Q926A/D1135E, Q695A/Q926A/D1135E, L169A/Y450A/Q695A/Q926A, L169A/R661A/Q695A/Q926A, Y450A/R661A/Q695A/Q926A, N497A/Q695A/Q926A/D1135E, R661A/Q695A/Q926A/D1135E, 및 Y450A/Q695A/Q926A/D1135E를 포함하지만, 이에 제한되지 않는다.
일부 구현예에서, 변이체 SpCas9 단백질은 N14; S15; S55; R63; R78; H160; K163; R165; L169; R403; N407; Y450; M495; N497; K510; Y515; W659; R661; M694; Q695; H698; A728; S730; K775; S777; R778; R780; K782; R783; K789; K797; Q805; N808; K810; R832; Q844; S845; K848; S851; K855; R859; K862; K890; Q920; Q926; K961; S964; K968; K974; R976; N980; H982; K1003; K1014; S1040; N1041; N1044; K1047; K1059; R1060; K1107; E1108; S1109; K1113; R1114; S1116; K1118; D1135; S1136; K1153; K1155 ; K1158; K1200; Q1221; H1241; Q1254; Q1256; K1289; K1296; K1297; R1298; K1300; H1311; K1325; K1334; T1337 및/또는 S1216에서의 돌연변이를 포함한다.
일부 구현예에서, 변이체 SpCas9 단백질은 또한 하기의 돌연변이 중 하나 이상을 포함한다: N14A; S15A; S55A; R63A; R78A; R165A; R403A; N407A; N497A; Y450A; K510A; Y515A; R661A; Q695A; S730A; K775A; S777A; R778A; R780A; K782A; R783A; K789A; K797A; Q805A; N808A; K810A; R832A; Q844A; S845A; K848A; S851A; K855A; R859A; K862A; K890A; Q920A; Q926A; K961A; S964A; K968A; K974A; R976A; N980A; H982A; K1003A; K1014A; S1040A; N1041A; N1044A; K1047A; K1059A; R1060A; K1107A; E1108A; S1109A; K1113A; R1114A; S1116A; K1118A; D1135A; S1136A; K1153A; K1155A; K1158A; K1200A; Q1221A; H1241A; Q1254A; Q1256A; K1289A; K1296A; K1297A; R1298A; K1300A; H1311A; K1325A; K1334A; T1337A 및/또는 S1216A. 일부 구현예에서, 변이체 단백질은 HF1(N497A/R661A/Q695A/Q926A)+K810A, HF1+K848A, HF1+K855A, HF1+H982A, HF1+K848A/K1003A, HF1+K848A/R1060A, HF1+K855A/K1003A, HF1+K855A/R1060A, HF1+H982A/K1003A, HF1+H982A/R1060A, HF1+K1003A/R1060A, HF1+K810A/K1003A/R1060A, HF1+K848A/K1003A/R1060A를 포함한다. 일부 구현예에서, 변이체 단백질은 HF1+K848A/K1003A, HF1+K848A/R1060A, HF1+K855A/K1003A, HF1+K855A/R1060A, HF1+K1003A/R1060A, HF1+K848A/K1003A/R1060A를 포함한다. 일부 구현예에서, 변이체 단백질은 Q695A/Q926A/R780A, Q695A/Q926A/R976A, Q695A/Q926A/H982A, Q695A/Q926A/K855A, Q695A/Q926A/K848A/K1003A, Q695A/Q926A/K848A/K855A, Q695A/Q926A/K848A/H982A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/K848A/R1060A, Q695A/Q926A/K855A/H982A, Q695A/Q926A/K855A/K1003A, Q695A/Q926A/K855A/R1060A, Q695A/Q926A/H982A/K1003A, Q695A/Q926A/H982A/R1060A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/K810A/K1003A/R1060A, Q695A/Q926A/K848A/K1003A/R1060A를 포함한다. 일부 구현예에서, 변이체는 N497A/R661A/Q695A/Q926A/K810A, N497A/R661A/Q695A/Q926A/K848A, N497A/R661A/Q695A/Q926A/K855A, N497A/R661A/Q695A/Q926A/R780A, N497A/R661A/Q695A/Q926A/K968A, N497A/R661A/Q695A/Q926A/H982A, N497A/R661A/Q695A/Q926A/K1003A, N497A/R661A/Q695A/Q926A/K1014A, N497A/R661A/Q695A/Q926A/K1047A, N497A/R661A/Q695A/Q926A/R1060A, N497A/R661A/Q695A/Q926A/K810A/K968A, N497A/R661A/Q695A/Q926A/K810A/K848A, N497A/R661A/Q695A/Q926A/K810A/K1003A, N497A/R661A/Q695A/Q926A/K810A/R1060A, N497A/R661A/Q695A/Q926A/K848A/K1003A, N497A/R661A/Q695A/Q926A/K848A/R1060A, N497A/R661A/Q695A/Q926A/K855A/K1003A, N497A/R661A/Q695A/Q926A/K855A/R1060A, N497A/R661A/Q695A/Q926A/K968A/K1003A, N497A/R661A/Q695A/Q926A/H982A/K1003A, N497A/R661A/Q695A/Q926A/H982A/R1060A, N497A/R661A/Q695A/Q926A/K1003A/R1060A, N497A/R661A/Q695A/Q926A/K810A/K1003A/R1060A, N497A/R661A/Q695A/Q926A/K848A/K1003A/R1060A, Q695A/Q926A/R780A, Q695A/Q926A/K810A, Q695A/Q926A/R832A, Q695A/Q926A/K848A, Q695A/Q926A/K855A, Q695A/Q926A/K968A, Q695A/Q926A/R976A, Q695A/Q926A/H982A, Q695A/Q926A/K1003A, Q695A/Q926A/K1014A, Q695A/Q926A/K1047A, Q695A/Q926A/R1060A, Q695A/Q926A/K848A/K968A, Q695A/Q926A/R976A, Q695A/Q926A/H982A, Q695A/Q926A/K855A, Q695A/Q926A/K848A/K1003A, Q695A/Q926A/K848A/K855A, Q695A/Q926A/K848A/H982A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/R832A/R1060A, Q695A/Q926A/K968A/K1003A, Q695A/Q926A/K968A/R1060A, Q695A/Q926A/K848A/R1060A, Q695A/Q926A/K855A/H982A, Q695A/Q926A/K855A/K1003A, Q695A/Q926A/K855A/R1060A, Q695A/Q926A/H982A/K1003A, Q695A/Q926A/H982A/R1060A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/K810A/K1003A/R1060A, Q695A/Q926A/K1003A/K1047A/R1060A, Q695A/Q926A/K968A/K1003A/R1060A, Q695A/Q926A/R832A/K1003A/R1060A, 또는 Q695A/Q926A/K848A/K1003A/R1060A를 포함한다.
알라닌 이외의 아미노산으로의 돌연변이가 또한 포함되며, 이는 본 발명의 방법 및 조성물로 제조되고, 사용될 수 있다.
일부 구현예에서, 변이체 SpCas9 단백질은 다음의 추가의 돌연변이 중 하나 이상을 포함한다: R63A, R66A, R69A, R70A, R71A, Y72A, R74A, R75A, K76A, N77A, R78A, R115A, H160A, K163A, R165A, L169A, R403A, T404A, F405A, N407A, R447A, N497A, I448A, Y450A, S460A, M495A, K510A, Y515A, R661A, M694A, Q695A, H698A, Y1013A, V1015A, R1122A, K1123A, K1124A, K1158A, K1185A, K1200A, S1216A, Q1221A, K1289A, R1298A, K1300A, K1325A, R1333A, K1334A, R1335A, 및 T1337A.
일부 구현예에서, 변이체 SpCas9 단백질은 다중 치환 돌연변이를 포함한다: N497/R661/Q695/Q926(사중 변이체 돌연변이체); Q695/Q926(이중 돌연변이체); R661/Q695/Q926 및 N497/Q695/Q926(삼중 돌연변이체). 일부 구현예에서, L169, Y450 및/또는 D1135에서의 추가의 치환 돌연변이가 이들 이중-, 삼중 및 사중 돌연변이체에 첨가될 수 있거나, Q695 또는 Q926에서 치환을 보유하는 단일 돌연변이체에 첨가될 수 있다. 일부 구현예에서, 돌연변이체는 야생형 아미노산 대신에 알라닌을 갖는다. 일부 구현예에서, 돌연변이체는 아르기닌 또는 리신(또는, 천연 아미노산) 이외의 임의의 아미노산을 갖는다.
일부 구현예에서, 변이체 SpCas9 단백질은 또한 D10, E762, D839, H983, 또는 D986; 및 H840 또는 N863에서의 돌연변이로 이루어진 군으로부터 선택되는 뉴클레아제 활성을 감소시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, 돌연변이는 (i) D10A 또는 D10N, 및 (ii) H840A, H840N, 또는 H840Y이다.
일부 구현예에서, SpCas9 변이체는 또한 다음의 돌연변이 세트 중 하나를 포함한다: D1135V/R1335Q/T1337R(VQR 변이체); D1135E/R1335Q/T1337R(EQR 변이체); D1135V/G1218R/R1335Q/T1337R(VRQR 변이체); 또는 D1135V/G1218R/R1335E/T1337R(VRER 변이체).
또한 본 명세서에서는 Y211, Y212, W229, Y230, R245, T392, N419, Y651, 또는 R654의 위치 중 1, 2, 3, 4, 5, 6개 이상에서 돌연변이를 가지고, 예를 들어, Y211, Y212, W229, Y230, R245, T392, N419, Y651, 또는 R654의 위치 중 1, 2, 3, 4, 또는 5, 또는 6개에 돌연변이를 갖는 SEQ ID NO:1의 아미노산 서열과 적어도 80% 동일한 서열 및 선택적으로, 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그 중 하나 이상을 포함하는 단리된 스타필로코커스 아우레우스(Staphylococcus aureus) Cas9(SaCas9) 단백질이 제공된다. 일부 구현예에서, 본 명세서에 기재된 SaCas9 변이체는 Y211, Y212, W229, Y230, R245, T392, N419, Y651및/또는 R654의 위치 중 1, 2, 3, 4, 5, 6개 이상에서 돌연변이를 갖는 SEQ ID NO:2의 아미노산 서열을 포함한다. 일부 구현예에서 변이체는 Y211A, Y212A, W229, Y230A, R245A, T392A, N419A, Y651, 및/또는 R654A의 돌연변이 중 하나 이상을 포함한다.
일부 구현예에서, 변이체 SaCas9 단백질은 N419 및/또는 R654에서의 돌연변이 및 선택적으로 추가의 돌연변이 Y211, Y212, W229, Y230, R245 및 T392 중 1, 2, 3, 4개 이상, 바람직하게는 N419A/R654A, Y211A/R654A, Y211A/Y212A, Y211A/Y230A, Y211A/R245A, Y212A/Y230A, Y212A/R245A, Y230A/R245A, W229A/R654A, Y211A/Y212A/Y230A, Y211A/Y212A/R245A, Y211A/Y212A/Y651A, Y211A/Y230A/R245A, Y211A/Y230A/Y651A, Y211A/R245A/Y651A, Y211A/R245A/R654A, Y211A/R245A/N419A, Y211A/N419A/R654A, Y212A/Y230A/R245A, Y212A/Y230A/Y651A, Y212A/R245A/Y651A, Y230A/R245A/Y651A, R245A/N419A/R654A, T392A/N419A/R654A, R245A/T392A/N419A/R654A, Y211A/R245A/N419A/R654A, W229A/R245A/N419A/R654A, Y211A/R245A/T392A/N419A/R654A, 또는 Y211A/W229A/R245A/N419A/R654A를 포함한다.
일부 구현예에서, 변이체 SaCas9 단백질은 Y211; Y212; W229; Y230; R245; T392; N419; L446; Q488; N492; Q495; R497; N498; R499; Q500; K518; K523; K525; H557; R561; K572; R634; Y651; R654; G655; N658; S662; N667; R686; K692; R694; H700; K751; D786; T787; Y789; T882; K886; N888; 889; L909; N985; N986; R991; R1015; N44; R45; R51; R55; R59; R60; R116; R165; N169; R208; R209; Y211; T238; Y239; K248; Y256; R314; N394; Q414; K57; R61; H111; K114; V164; R165; L788; S790; R792; N804; Y868; K870; K878; K879; K881; Y897; R901; 및/또는 K906에서의 돌연변이를 포함한다.
일부 구현예에서, 변이체 SaCas9 단백질은 다음의 돌연변이 중 하나 이상을 포함한다: Y211A; Y212A; W229A; Y230A; R245A; T392A; N419A; L446A; Q488A; N492A; Q495A; R497A; N498A; R499A; Q500A; K518A; K523A; K525A; H557A; R561A; K572A; R634A; Y651A; R654A; G655A; N658A; S662A; N667A; R686A; K692A; R694A; H700A; K751A; D786A; T787A; Y789A; T882A; K886A; N888A; A889A; L909A; N985A; N986A; R991A; R1015A; N44A; R45A; R51A; R55A; R59A; R60A; R116A; R165A; N169A; R208A; R209A; T238A; Y239A; K248A; Y256A; R314A; N394A; Q414A; K57A; R61A; H111A; K114A; V164A; R165A; L788A; S790A; R792A; N804A; Y868A; K870A; K878A; K879A; K881A; Y897A; R901A; K906A.
일부 구현예에서, 변이체 SaCas9 단백질은 다음의 추가의 돌연변이 중 하나 이상을 포함한다: Y211A, W229A, Y230A, R245A, T392A, N419A, L446A, Y651A, R654A, D786A, T787A, Y789A, T882A, K886A, N888A, A889A, L909A, N985A, N986A, R991A, R1015A, N44A, R45A, R51A, R55A, R59A, R60A, R116A, R165A, N169A, R208A, R209A, T238A, Y239A, K248A, Y256A, R314A, N394A, Q414A, K57A, R61A, H111A, K114A, V164A, R165A, L788A, S790A, R792A, N804A, Y868A, K870A, K878A, K879A, K881A, Y897A, R901A, K906A.
일부 구현예에서, 변이체 SaCas9 단백질은 다중 치환 돌연변이를 포함한다: R245/T392/N419/R654 및 Y221/R245/N419/R654(사중 변이체 돌연변이체); N419/R654, R245/R654, Y221/R654, 및 Y221/N419(이중 돌연변이체); R245/N419/R654, Y211/N419/R654, 및 T392/N419/R654(삼중 돌연변이체). 일부 구현예에서 돌연변이체는 야생형 아미노산 대신에 알라닌을 함유한다.
일부 구현예에서, 변이체 SaCas9 단백질은 또한 D10, E477, D556, H701, 또는 D704; 및 H557 또는 N580에서의 돌연변이로 이루어진 군으로부터 선택되는 뉴클레아제 활성을 감소시키는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, 돌연변이는 (i) D10A 또는 D10N, (ii) H557A, H557N, 또는 H557Y, (iii) N580A, 및/또는(iv) D556A이다.
일부 구현예에서, 변이체 SaCas9 단백질은 다음의 돌연변이 중 하나 이상을 포함한다: E782K, K929R, N968K, 또는 R1015H. 구체적으로는, E782K/N968K/R1015H(KKH 변이체); E782K/K929R/R1015H(KRH 변이체); 또는 E782K/K929R/N968K/R1015H(KRKH 변이체).
일부 구현예에서, 변이체 Cas9 단백질은 특이성을 증대시키기 위해, 다음의 영역 중 하나 이상에 돌연변이를 포함한다:
또한, 본 명세서에서는 선택적 개입 링커에 의해, 이종 기능성 도메인에 융합된 본 명세서에 기재된 단리된 변이체 Cas9 단백질을 포함하는 융합 단백질이 제공되며, 여기서, 링커는 융합 단백질의 활성에 간섭하지 않는다. 일부 구현예에서, 이종 기능성 도메인은 DNA 또는 단백질, 예를 들어 염색질에 작용한다. 일부 구현예에서, 이종 기능성 도메인은 전사 활성화 도메인이다. 일부 구현예에서, 전사 활성화 도메인은 VP64 또는 NF-κB p65으로부터 유래한다. 일부 구현예에서, 이종 기능성 도메인은 전사 사일런서(transcriptional silencer) 또는 전사 억제 도메인이다. 일부 구현예에서, 전사 억제 도메인은 Kruppel-연관 박스(KRAB) 도메인, ERF 리프레서 도메인(ERD), 또는 mSin3A 상호작용 도메인(SID)이다. 일부 구현예에서, 전사 사일런서는 이질염색질 단백질 1(HP1), 예를 들어, HP1α 또는 HP1β이다. 일부 구현예에서, 이종 기능성 도메인은 DNA의 메틸화 상태를 변형시키는 효소이다. 일부 구현예에서, DNA의 메틸화 상태를 변형시키는 효소는 DNA 메틸기전달효소(DNMT) 또는 TET 단백질의 전체 또는 디옥시게나제 도메인, 예를 들어, 시스테인-풍부 연장을 포함하는 촉매 모듈 및 7개의 고도로 보존된 엑손에 의해 인코딩되는 2OGFeDO 도메인, 예를 들어, 아미노산 1580 내지 2052를 포함하는 Tet1 촉매 도메인, 아미노산 1290 내지 1905를 포함하는 Tet2 및 아미노산 966 내지 1678을 포함하는 Tet3이다. 일부 구현예에서, TET 단백질 또는 TET-유래 디옥시게나제 도메인은 TET1로부터 유래한다. 일부 구현예에서, 이종 기능성 도메인은, 히스톤 서브유닛을 변형시키는 효소이다. 일부 구현예에서, 히스톤 서브유닛을 변형시키는 효소는 히스톤 아세틸기전달효소(HAT), 히스톤 탈아세틸효소(HDAC), 히스톤 메틸기전달효소(HMT), 또는 히스톤 탈메틸효소이다. 일부 구현예에서, 이종 기능성 도메인은 생물학적 테더(biological tether)이다. 일부 구현예에서, 생물학적 테더는 MS2, Csy4 또는 람다 N 단백질이다. 일부 구현예에서, 이종 기능성 도메인은 FokI이다.
또한 본 명세서에서는 본 명세서에 기재된 변이체 Cas9 단백질을 인코딩하는 핵산으로서, 단리된 핵산뿐만 아니라, 선택적으로, 본 명세서에 기재된 변이체 Cas9 단백질을 발현시키기 위한 하나 이상의 조절 도메인에 작동 가능하게 연결된 단리된 핵산을 포함하는 벡터가 제공된다. 또한, 본 명세서에서는 본 명세서에 기재된 핵산을 포함하고, 선택적으로 본 명세서에 기재된 변이체 Cas9 단백질을 발현하는 숙주 세포, 예를 들어 박테리아, 효모, 곤충 또는 포유류 숙주 세포 또는 트랜스제닉 동물(transgenic animal)(예를 들어, 마우스)이 제공된다.
또한, 본 명세서에서는 Cas9변이체를 인코딩하는 단리된 핵산뿐만 아니라, 선택적으로, 이러한 변이체를 발현시키기 위한 하나 이상의 조절 도메인에 작동 가능하게 연결된 단리된 핵산을 포함하는 벡터 및 이러한 핵산을 포함하고, 선택적으로, 이러한 변이체 단백질을 발현하는 숙주 세포, 예를 들어 포유류 숙주 세포가 제공된다.
또한, 본 명세서에서는, 본 명세서에 기재된 바와 같은 변이체 Cas9 단백질 또는 융합 단백질 및, 게놈 표적 부위에서 최적의 뉴클레오타이드 간격의 세포 게놈의 선택 부분에 상보성인 영역을 가지는 적어도 하나의 가이드 RNA를 세포에서 발현시키거나, 이들과 세포를 접촉시킴으로써, 세포의 게놈 또는 에피게놈을 변이시키는 방법이 제공된다. 이 방법은 특히, 예를 들어 단일 벡터에서 Cas9 단백질을 인코딩하는 핵산 및 가이드 RNA와 세포를 접촉시키는 단계; 예를 들어, 다수의 벡터에서, Cas9 단백질을 인코딩하는 핵산 및 가이드 RNA를 인코딩하는 핵산과 세포를 접촉시키는 단계; 및 정제된 Cas9 단백질 및 합성되거나, 정제된 gRNA의 복합체와 세포를 접촉시키는 단계를 포함할 수 있다. 일부 구현예에서, 세포는 gRNA 또는 변이체 단백질/융합 단백질 중 하나 또는 둘 모두를 안정하게 발현하고, 다른 요소가 세포 내로 형질감염되거나, 도입된다. 예를 들어, 세포는 본 명세서에 기재된 바와 같은 변이체 단백질 또는 융합 단백질을 안정하게 발현할 수 있으며, 상기 방법은 합성 gRNA, 재조합적으로 생성된 정제된 gRNA, 또는 gRNA를 인코딩하는 핵산과 세포를 접촉시키는 단계를 포함할 수 있다. 일부 구현예에서, 변이체 단백질 또는 융합 단백질은 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그 중 하나 이상을 포함한다.
또한, 본 명세서에서는, 본 명세서에 기재된 바와 같은 정제된 변이체 단백질 또는 융합 단백질 및, dsDNA 분자의 선택 부분에 상보성인 영역을 가지는 가이드 RNA와 dsDNA를 접촉시킴으로써, 시험관내에서 단리된 dsDNA 분자를 변이시키기 위한 방법, 예를 들어, 선택적으로 변이시키기 위한 방법이 제공된다.
달리 정의되지 않는 한, 본 명세서에 사용되는 모든 기술 및 과학 용어는, 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에는 본 발명에 사용하기 위한 방법 및 재료가 기재되어 있으며; 당업계에 공지된 다른 적절한 방법 및 재료가 또한 사용될 수 있다. 이러한 재료, 방법 및 실시예는 단지 예시를 위한 것이며, 제한하고자 하는 것은 아니다. 본 명세서에서 언급되는 모든 공보물, 특허 출원, 특허, 서열, 데이터베이스 목록 및 다른 참조문헌은 그 전문이 본 명세서에 참조로 포함된다. 모순되는 경우, 정의를 포함하는 본 명세서가 우선할 것이다.
하기의 상세한 설명 및 도면 및 청구범위로부터 본 발명의 다른 특징 및 이점이 분명해질 것이다.
도 1a 내지 도 1e | 비특이적 DNA 접촉을 형성하는 잔기에 돌연변이를 보유하는 SpCas9 변이체의 확인 및 특성화. 도 1a, PDB 4OOG 및 4UN3(각각, 참조문헌 31 및 32로부터 개작됨)을 기반으로 한 표적 DNA:sgRNA 이중가닥의 야생형 SpCas9 인식을 도시하는 도식. 도 1b, DNA 백본에 수소 결합을 형성하는 위치에 알라닌 치환을 함유하는 SpCas9 변이체의 특성화. 야생형 SpCas9 및 변이체는, 완전히 매치된 sgRNA 또는, 표적 부위에 대한 미스매치를 인코딩하는 4개의 다른 sgRNA에 의해 프로그래밍되는 경우, 인간 세포 EGFP 파괴 분석을 사용하여 평가되었다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 백그라운드 EGFP 손실의 평균 수준은 적색 점선으로 표시된다(도 1b 및 도 1c). 도 1c 및 도 1d, EGFP 파괴 분석(도 1c)에 의해 평가된 24개의 부위 및 T7E1 분석(도 1d)에 의해 평가된 13개의 내인성 부위에 걸친 야생형 SpCas9 및 SpCas9-HF1의 표적내 활성. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 1e, SpCas9-HF1 대 야생형 SpCas9의 표적내 활성(도 1c 및 도 1d)의 비율.
도 2a 내지 도 2c | 표준 표적 부위에 대한 sgRNA에 의한 야생형 SpCas9 및 SpCas9 -HF1의 게놈 전체 특이성. 도 2a, GUIDE-서열에 의해 결정되는 바와 같은 내인성 인간 유전자에 표적화된 8개의 sgRNA에 의한 야생형 SpCas9와 SpCas9-HF1의 표적외 부위. 판독 계수는 특정 부위에서의 절단 빈도의 측정치를 나타내며; 스페이서 또는 PAM 내의 미스매치 위치는 채색되어 강조되어 있다. 도 2b, 도 2a에서 사용된 8개의 sgRNA로부터 야생형 SpCas9 및 SpCas9-HF1에 대해 GUIDE-서열에 의해 확인된 게놈 전체의 표적외 부위의 총수의 요약. 도 2c, 표적내 부위와 비교하여, (프로토스페이서 및 PAM 내의) 미스매치의 총수에 따라 분류된 8개의 sgRNA에 대해 야생형 SpCas9 및 SpCas9-HF1의 경우에 확인된 표적외 부위.
도 3a 내지 도 3c | GUIDE-서열에 의해 확인된 표적외 부위의 표적화된 심층 서열분석에 의한 SpCas9-HF1 특이성 개선의 검증. 도 3a, 도 2로부터의 6개의 sgRNA에 의한 야생형 SpCas9 및 SpCas9-HF1의 심층 서열분석에 의해 결정된 평균 표적내 변형 퍼센트. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 3b, 삽입결실 돌연변이를 함유하는 심층 서열분석된 표적내 부위 및 GUIDE-서열 검출된 표적외 부위의 백분율. 야생형 SpCas9, SpCas9-HF1, 및 대조군 조건에 대한 3회 반복 실험이 도시되어 있다. x-축 하부의 채색된 원은, 삽입 또는 결실 돌연변이가 관찰되지 않은 2회 반복 실험을 나타낸다. PCR에 의해 증폭될 수 없는 표적외 부위는 별표가 표시된 적색 부분으로 제시된다. 풀링(pooling)된 판독 계수에 의한 일방 Fisher 정확 검증(one-sided Fisher exact test)을 사용한 가설 검증에 의해, SpCas9-HF1과 대조군 조건 사이의 비교시, 단지 EMX1-1 표적외 1 및 FANCF-3 표적외 1에서만 유의한 차이가 발견되었다(Benjamini-Hochberg 방법을 사용한 다중 비교로의 조정 후 p < 0.05). 또한, RUNX1-1 표적외 2를 제외하고, 모든 표적외 부위에서 야생형 SpCas9와 대조군 조건 사이 및 모든 표적외 부위에서 야생형 SpCas9와 SpCas9-HF1 사이에 유의한 차이가 발견되었다. 도 3c, 야생형 SpCas9에 의한 표적내 및 표적외 절단 부위에서의 심층 서열분석에 의해 결정된 평균 변형 퍼센트과 GUIDE-서열 판독 계수(도 2a) 사이의 상관관계의 산포도.
도 4a 내지 도 4c | 비표준 반복 부위에 대한 sgRNA에 의한 야생형 SpCas9 및 SpCas9 -HF1의 게놈 전체 특이성. 도 4a, 다수의 표적외 부위를 절단하는 것으로 인식되어 있는 2개의 sgRNA를 사용한 야생형 SpCas9 및 SpCas9-HF1의 GUIDE-서열 특이성 프로파일(문헌[Fu et al., Nat Biotechnol 31, 822-826(2013); Tsai et al., Nat Biotechnol 33, 187-197(2015)]). GUIDE-서열 판독 계수는 특정 부위에서의 절단 효율의 측정치를 나타내고; 스페이서 또는 PAM 내의 미스매치 위치는 채색되어 강조되어 있고; 적색 원은 sgRNA-DNA 경계면에서 지정된 벌지(bulge)(문헌[Lin et al., NucleicAcids Res 42, 7473-7485 (2014)])를 가질 수 있는 부위를 나타내며; 청색 원은, 도시된 것과 비교하여, 일정한 갭의 대안적 정렬을 가질 수 있는 부위를 나타낸다(도 8 참조). 도 4b, 도 4a에 사용된 2개의 sgRNA로부터 야생형 SpCas9 및 SpCas9-HF1에 대해 GUIDE-서열에 의해 확인된 게놈 전체 표적외 부위의 총수의 요약. 도 4c, 표적내 부위와 비교하여, (프로토스페이서 및 PAM 내의) 미스매치의 총수에 따라 분류된 VEGFA 부위 2 및 3에 대해 야생형 SpCas9 또는 SpCas9-HF1에 의해 확인된 표적외 부위. 도 4a의 적색 원으로 표시된 표적외 부위는 이들 계수에 포함되지 않으며; 도 4a의 청색 원으로 표시된 부위는 갭 무함유 정렬의 미스매치의 수에 의해 계수된다.
도 5a 내지 도 5d | 추가의 치환을 보유하는 SpCas9 - HF1 유도체의 활성. 도 5a, 8개의 sgRNA에 의한 야생형 SpCas9, SpCas9-HF1, 및 SpCas9-HF1-유도체 변이체의 인간 세포 EGFP 파괴 활성. SpCas9-HF1은 N497A, R661A, Q695, 및 Q926A 돌연변이를 보유하고; HF2 = HF1 + D1135E이고; HF3 = HF1 + L169A이며; HF4 = HF1 + Y450A이다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 백그라운드 EGFP 손실의 평균 수준은 적색 점선에 의해 표시된다. 도 5b, 도 5a로부터 8개의 sgRNA에 의해 야생형 SpCas9와 비교하여, SpCas9-HF 변이체를 사용한 경우의 표적내 활성의 요약. 중앙값 및 사분범위가 제시되며; 야생형 활성의 70% 초과를 나타내는 구근은 녹색으로 강조되어 있다. 도 5c, SpCas9-HF1의 효과에 내성인 도 2a 및 도 4a로부터의 표적외 부위뿐만 아니라, FANCF 부위 2 및 VEGFA 부위 3 표적내 부위에서의 SpCas9 및 HF 변이체에 의한 평균 변형 퍼센트. T7E1 분석에 의해 결정된 변형 퍼센트; 백그라운드 삽입결실 백분율을 모든 실험에서 차감하였다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 5d, 표적내 활성 대 표적외 활성(도 5c)의 비율로 도시된 것으로서, FANCF 부위 2 또는 VEGFA 부위 3 sgRNA에 의한 야생형 SpCas9 및 HF 변이체의 특이성 비율.
도 5e 및 도 5f | SpCas9 -HF1의 효과에 내성인 표적외 부위를 갖는 sgRNA에 의한 SpCas9 - HF1, -HF2, 및 -HF4의 게놈 전체 특이성. 도 5e, 도 5f로부터의 GUIDE-서열 실험에서 의도된 표적내 부위에서의 평균 GUIDE-서열 태그 혼입. SpCas9-HF1 = N497A/R661A/Q695A/Q926A이고; HF2 = HF1 + D1135E이며; HF4 = HF1 + Y450A이다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 5f, FANCF 부위 2 또는 VEGFA 부위 3 sgRNA에 의한 SpCas9-HF1, -HF2, 또는 -HF4의 GUIDE-서열 확인 표적외 부위. 판독 계수는 특정 부위에서의 절단 빈도의 측정치를 나타내며; 스페이서 또는 PAM 내의 미스매치 위치는 채색되어 강조되어 있다. 표적외 식별시의 개선-배수는 SpCas9-HF 변이체의 표적외 판독 계수를 SpCas9-HF 변이체 사이의 비교 전의 표적내 부위에서의 판독 계수에 대해 정규화함으로써, 계산된다.
도 6a 및 도 6b | sgRNA 및 표적 DNA와 SpCas9의 상호작용 . 도 6a, sgRNA와 표적 DNA 사이에 염기쌍을 갖는 SpCas9:sgRNA 복합체를 예시하는 도식. 도 6b, PDB: 4UN3(참조문헌 32)로부터 표적 DNA와 결합된 SpCas9:sgRNA 복합체의 구조 대표 예. 표적-가닥 DNA 백본과의 수소 결합 접촉을 형성하는 4개의 잔기는 청색으로 강조되어 있으며; HNH 도메인은 시각화 목적으로 숨겨져 있다.
도 7a 내지 도 7d | GUIDE - 서열 실험에 사용된 다양한 sgRNA에 의한 야생형 및 SpCas9 -HF1의 표적내 활성 비교. 도 7a 및 도 7c, 제한 단편 길이 다형성 분석에 의해 정량화된, 도 2a 및 도 4a에 제시된 GUIDE-서열 실험에서의 의도된 표적내 부위의 평균 GUIDE-서열 태그 혼입(각각, 도 7a 및 도 7c). 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 7b 및 도 7d, T7E1 분석에 의해 검출된, 도 2a 및 도 4a에 제시된 GUIDE-서열 실험에서의 의도된 표적내 부위의 평균 변형 퍼센트(각각, 도 7b 및 도 7d). 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다.
도 8 | VEGFA 부위 2 표적외 부위의 잠재적 대안적 정렬. Geneious(문헌[Kearse et al., Bioinformatics 28, 1647-1649 (2012)]) 버전 8.1.6을 사용하여 정렬된 단일 뉴클레오타이드 갭을 함유하는 표적외 부위(문헌[Lin et al., NucleicAcids Res 42, 7473-7485 (2014)])(우측)로서 잠재적으로 인식될 수 있는 GUIDE-서열에 의해 확인되는 10개의 VEGFA 부위 2 표적외 부위(좌측).
도 9 | 절두된 sgRNA14에 의한 야생형 SpCas9 및 SpCas9 -HF1의 활성. EGFP의 4개의 부위에 표적화된 전장의 sgRNA 또는 절두된 sgRNA를 사용한 야생형 SpCas9 및 SpCas9-HF1의 EGFP 파괴 활성. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 대조군 실험에서의 백그라운드 EGFP 손실의 평균 수준은 적색 점선에 의해 표시된다.
도 10 | 5 '- 미스매치된 구아닌 염기를 보유하는 sgRNA에 의한 야생형 SpCas9 및 SpCas9 -HF1 활성. 4개의 상이한 부위에 표적화된 sgRNA에 의한 야생형 SpCas9 및 SpCas9-HF1의 EGFP 파괴 활성. 각각의 표적 부위에서, sgRNA는, 의도적으로 미스매치된 5'-구아닌 또는 매치된 비-구아닌 5'-염기를 함유한다.
도 11 | 야생형 SpCas9 및 SpCas9 - HF1 발현 플라스미드의 양의 적정. 다양한 양의 야생형 및 SpCas9-HF1 발현 플라스미드에 의한 형질감염으로부터의 인간 세포 EGFP 파괴 활성. 모든 형질감염의 경우, sgRNA-함유 플라스미드의 양은 250 ng으로 고정시켰다. 2개의 sgRNA 표적화 개별 부위가 사용되었고; 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 음성 대조군의 백그라운드 EGFP 손실의 평균 수준은 적색 점선으로 표시된다.
도 12a 내지 도 12d | SpCas9 -HF1의 PAM 인식 특이성의 변이. 도 12a, T7E1 분석에 의해 정량화된 8개의 sgRNA를 사용하여, SpCas9-VQR(참조문헌 15) 및 개선된 SpCas9-VRQR에 의한 표적내 내인성 인간 부위의 평균 변형 퍼센트의 비교. 두 변이체 모두 NGAN PAM을 인식하도록 조작되었다. 오류 막대는 n = 2 또는 3인 경우의 s.e.m.을 나타낸다. 도 12b, 8개의 sgRNA를 사용하여, 그의 -HF1 대응 대상과 비교한 pCas9-VQR 및 SpCas9-VRQR의 표적내 EGFP 파괴 활성. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 음성 대조군의 백그라운드 EGFP 손실의 평균 수준은 적색 점선에 의해 표시된다. 도 12c, T7E1 분석의 정량화된 8개의 내인성 인간 유전자 부위에서 그의 -HF1 변이체와 비교한 SpCas9-VQR 및 SpCas9-VRQR에 의한 평균 표적내 변형 퍼센트의 비교. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; ND는 검출이 불가능한 것이다. 도 12d, 그의 상응하는 -HF1 변이체(도 12b 및 도 12c)와 비교한 SpCas9-VQR 또는 SpCas9-VRQR를 사용하는 경우의 표적내 활성의 변화-배수의 요약. 중앙값 및 사분범위가 도시되며; 야생형 활성의 70%를 초과하는 구간은 녹색으로 강조되어 있다.
도 13a 및 도 13b | 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9 , SpCas9 -HF1, 및 야생형 SpCas9 유도체의 활성. 도 13a 및 도 13b, 위치 11 및 12(도 13a) 또는 위치 9 및 10(도 13b)에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이고; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타내며; HF1 = N497A/R661A/Q695A/Q926A 치환을 갖는 SpCas9이다.
도 14a 및 도 14b | 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9, SpCas9 - HF1, 및 SpCas9 - HF1 유도체의 활성. 도 14a 및 도 14b, 위치 11 및 12(도 14a) 또는 위치 9 및 10(도 14b)에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이고; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타내며; HF1 = N497A/R661A/Q695A/Q926A 치환을 갖는 SpCas9이다.
도 15 | 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9, SpCas9 - HF1, 및 SpCas9 ( Q695A / Q926A) 유도체의 활성. 위치 11 및 12에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이고; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타내고; HF1 = N497A/R661A/Q695A/Q926A 치환을 갖는 SpCas9이이며; Dbl = Q695A/Q926A 치환을 갖는 SpCas9이다.
도 16 | 스페이서의 각 위치에 단일 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야생형 SpCas9, SpCas9 - HF1, 및 eSpCas9 -1.1의 활성. 지정 위치에서 의도적으로 미스매치된 sgRNA뿐만 아니라, ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이다. SpCas9-HF1 = N497A/R661A/Q695A/Q926A이고, eSP1.1 = K848A/K1003A/R1060A이다.
도 17a 및 도 17b | 스페이서의 다양한 위치에 단일 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야생형 SpCas9 및 변이체의 활성. (도 17a) (표적 또는 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 유도된) 알라닌 치환의 조합을 함유하는 SpCas9 뉴클레아제의 활성을, 지정 스페이서 위치에 의도적으로 미스매치된 sgRNA뿐만 아니라, ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 평가하였다. (도 17b) (도 17a)로부터의 이러한 뉴클레아제의 하위세트를, 매치된 표적내 부위에 대해 나머지 모든 가능한 단일 미스매치된 sgRNA를 사용하여, 시험하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이다. mm = 미스매치이고, WT = 야생형이고, Db = Q695A/Q926A이고, HF1 = N497A/R661A/Q695A/Q926A이고, 1.0 = K810A/K1003A/R1060A이며, 1.1 = K848A/K1003A/R1060A이다.
도 18 | 스페이서의 다양한 개별 위치에 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야 생형 SpCas9 및 변이체의 활성. (표적 또는 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 유도된) 알라닌 치환의 조합을 함유하는 SpCas9 뉴클레아제의 활성을, 지정 위치에서 의도적으로 미스매치된 sgRNA뿐만 아니라, ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 평가하였다. Db = Q695A/Q926A이고, HF1 = N497A/R661A/Q695A/Q926A이다.
도 19a 및 도 19b | 스페이서의 다양한 개별 위치에 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야생형 SpCas9 및 변이체의 활성. (도 19a) (표적 또는 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 유도된) 알라닌 치환의 조합을 함유하는 SpCas9 뉴클레아제의 표적내 활성을, EGFP 유전자의 일 부위에 완전히 매치된 2개의 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 평가하였다. (도 19b) (도 19a)로부터의 이러한 뉴클레아제의 하위세트를, 미스매치에 대한 불내성이 이들 치환에 의해 부여되는지를 결정하기 위해, 이들의 스페이서 서열의 (sgRNA '부위 1'의) 위치 12, 14, 16, 또는 18에 미스매치를 함유하는 sgRNA에 의해 시험하였다. Db = Q695A/Q926A이고, HF1 = N497A/R661A/Q695A/Q926A이다.
도 20 | (황색 구형 표시로 도시된) 사중 돌연변이 작제물의 돌연변이 위치 사이의 유사성을 예시하는 SpCas9(상단) 및 SaCas9(하단)의 구조 비교. 또한, DNA 백본과 접촉하는 다른 잔기는 분홍색 구형 표시로 도시된다.
도 21a 및 도 21b | 하나 이상의 알라닌 치환을 보유하는 야생형 SaCas9 및 SaCas9 유 도체의 활성. 도 21a 및 도 21b, 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치(도 21a) 또는 PAM 특이성에 영향을 주는 것으로 이전에 밝혀진 위치(도 21b)에 SaCas9 치환을 유도하였다. 위치 11 및 12에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이며; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타낸다.
도 22a 및 도 22b | 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 잔기에 하나 이상의 알라닌 치환을 보유하는 야생형(WT) SaCas9 및 SaCas9 유도체의 활성. 도 22a 및 도 22b, 위치 19 및 20에 의도적으로 미스매치된 sgRNA 및 ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이다.
도 23 | 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 잔기에 알라닌 치환의 삼중 조합을 보유하는 야생형(WT) SaCas9 및 SaCas9 변이체의 활성. EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 4개의 상이한 sgRNA를 사용하였으며(매치된 #1 내지 4), 또한, 4개의 표적 부위 각각을 야생형 SaCas9에 의해 효율적으로 사용되는 것으로 인식되어 있는 미스매치된 sgRNA에 의해 시험하였다. 각각의 부위에 대해 미스매치된 sgRNA는 각각의 매치된 sgRNA의 우측에 도시된다(예를 들어, 매치된 부위 3에 대한 단일 미스매치된 sgRNA는 mm 11&12임). 미스매치된 위치를 넘버링하였고, 위치 21은 PAM-최원위 위치이며; mm은 미스매치이다.
도 24a 및 도 24b | 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 잔기에 하나 이상의 알라닌 치환을 보유하는 야생형(WT) SaCas9 및 SaCas9 유도체의 활성. 도 24a 및 도 24b, 이중(도 24a) 또는 삼중(도 24a) 조합 치환을 보유하는 SaCas9 변이체를, T7E1 분석를 사용하여, 매치된 내인성 인간 유전자 표적 부위 및 단일 미스매치된 내인성 인간 유전자 표적 부위에 대해 평가하였다. 매치된 '표적내' 부위는 문헌[Kleinstiver et al., Nature Biotechnology 2015]으로부터의 그의 유전자 표적 부위 sgRNA 번호에 따라 명명된다. 미스매치된 sgRNA를 넘버링하였고, PAM-최원위 위치인 위치 21에 미스매치가 발생하였으며; 미스매치된 sgRNA는, 미스매치된 sgRNA의 좌측에 나열된 매치된 표적내 부위로부터 유해한다.
도 2a 내지 도 2c | 표준 표적 부위에 대한 sgRNA에 의한 야생형 SpCas9 및 SpCas9 -HF1의 게놈 전체 특이성. 도 2a, GUIDE-서열에 의해 결정되는 바와 같은 내인성 인간 유전자에 표적화된 8개의 sgRNA에 의한 야생형 SpCas9와 SpCas9-HF1의 표적외 부위. 판독 계수는 특정 부위에서의 절단 빈도의 측정치를 나타내며; 스페이서 또는 PAM 내의 미스매치 위치는 채색되어 강조되어 있다. 도 2b, 도 2a에서 사용된 8개의 sgRNA로부터 야생형 SpCas9 및 SpCas9-HF1에 대해 GUIDE-서열에 의해 확인된 게놈 전체의 표적외 부위의 총수의 요약. 도 2c, 표적내 부위와 비교하여, (프로토스페이서 및 PAM 내의) 미스매치의 총수에 따라 분류된 8개의 sgRNA에 대해 야생형 SpCas9 및 SpCas9-HF1의 경우에 확인된 표적외 부위.
도 3a 내지 도 3c | GUIDE-서열에 의해 확인된 표적외 부위의 표적화된 심층 서열분석에 의한 SpCas9-HF1 특이성 개선의 검증. 도 3a, 도 2로부터의 6개의 sgRNA에 의한 야생형 SpCas9 및 SpCas9-HF1의 심층 서열분석에 의해 결정된 평균 표적내 변형 퍼센트. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 3b, 삽입결실 돌연변이를 함유하는 심층 서열분석된 표적내 부위 및 GUIDE-서열 검출된 표적외 부위의 백분율. 야생형 SpCas9, SpCas9-HF1, 및 대조군 조건에 대한 3회 반복 실험이 도시되어 있다. x-축 하부의 채색된 원은, 삽입 또는 결실 돌연변이가 관찰되지 않은 2회 반복 실험을 나타낸다. PCR에 의해 증폭될 수 없는 표적외 부위는 별표가 표시된 적색 부분으로 제시된다. 풀링(pooling)된 판독 계수에 의한 일방 Fisher 정확 검증(one-sided Fisher exact test)을 사용한 가설 검증에 의해, SpCas9-HF1과 대조군 조건 사이의 비교시, 단지 EMX1-1 표적외 1 및 FANCF-3 표적외 1에서만 유의한 차이가 발견되었다(Benjamini-Hochberg 방법을 사용한 다중 비교로의 조정 후 p < 0.05). 또한, RUNX1-1 표적외 2를 제외하고, 모든 표적외 부위에서 야생형 SpCas9와 대조군 조건 사이 및 모든 표적외 부위에서 야생형 SpCas9와 SpCas9-HF1 사이에 유의한 차이가 발견되었다. 도 3c, 야생형 SpCas9에 의한 표적내 및 표적외 절단 부위에서의 심층 서열분석에 의해 결정된 평균 변형 퍼센트과 GUIDE-서열 판독 계수(도 2a) 사이의 상관관계의 산포도.
도 4a 내지 도 4c | 비표준 반복 부위에 대한 sgRNA에 의한 야생형 SpCas9 및 SpCas9 -HF1의 게놈 전체 특이성. 도 4a, 다수의 표적외 부위를 절단하는 것으로 인식되어 있는 2개의 sgRNA를 사용한 야생형 SpCas9 및 SpCas9-HF1의 GUIDE-서열 특이성 프로파일(문헌[Fu et al., Nat Biotechnol 31, 822-826(2013); Tsai et al., Nat Biotechnol 33, 187-197(2015)]). GUIDE-서열 판독 계수는 특정 부위에서의 절단 효율의 측정치를 나타내고; 스페이서 또는 PAM 내의 미스매치 위치는 채색되어 강조되어 있고; 적색 원은 sgRNA-DNA 경계면에서 지정된 벌지(bulge)(문헌[Lin et al., NucleicAcids Res 42, 7473-7485 (2014)])를 가질 수 있는 부위를 나타내며; 청색 원은, 도시된 것과 비교하여, 일정한 갭의 대안적 정렬을 가질 수 있는 부위를 나타낸다(도 8 참조). 도 4b, 도 4a에 사용된 2개의 sgRNA로부터 야생형 SpCas9 및 SpCas9-HF1에 대해 GUIDE-서열에 의해 확인된 게놈 전체 표적외 부위의 총수의 요약. 도 4c, 표적내 부위와 비교하여, (프로토스페이서 및 PAM 내의) 미스매치의 총수에 따라 분류된 VEGFA 부위 2 및 3에 대해 야생형 SpCas9 또는 SpCas9-HF1에 의해 확인된 표적외 부위. 도 4a의 적색 원으로 표시된 표적외 부위는 이들 계수에 포함되지 않으며; 도 4a의 청색 원으로 표시된 부위는 갭 무함유 정렬의 미스매치의 수에 의해 계수된다.
도 5a 내지 도 5d | 추가의 치환을 보유하는 SpCas9 - HF1 유도체의 활성. 도 5a, 8개의 sgRNA에 의한 야생형 SpCas9, SpCas9-HF1, 및 SpCas9-HF1-유도체 변이체의 인간 세포 EGFP 파괴 활성. SpCas9-HF1은 N497A, R661A, Q695, 및 Q926A 돌연변이를 보유하고; HF2 = HF1 + D1135E이고; HF3 = HF1 + L169A이며; HF4 = HF1 + Y450A이다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 백그라운드 EGFP 손실의 평균 수준은 적색 점선에 의해 표시된다. 도 5b, 도 5a로부터 8개의 sgRNA에 의해 야생형 SpCas9와 비교하여, SpCas9-HF 변이체를 사용한 경우의 표적내 활성의 요약. 중앙값 및 사분범위가 제시되며; 야생형 활성의 70% 초과를 나타내는 구근은 녹색으로 강조되어 있다. 도 5c, SpCas9-HF1의 효과에 내성인 도 2a 및 도 4a로부터의 표적외 부위뿐만 아니라, FANCF 부위 2 및 VEGFA 부위 3 표적내 부위에서의 SpCas9 및 HF 변이체에 의한 평균 변형 퍼센트. T7E1 분석에 의해 결정된 변형 퍼센트; 백그라운드 삽입결실 백분율을 모든 실험에서 차감하였다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 5d, 표적내 활성 대 표적외 활성(도 5c)의 비율로 도시된 것으로서, FANCF 부위 2 또는 VEGFA 부위 3 sgRNA에 의한 야생형 SpCas9 및 HF 변이체의 특이성 비율.
도 5e 및 도 5f | SpCas9 -HF1의 효과에 내성인 표적외 부위를 갖는 sgRNA에 의한 SpCas9 - HF1, -HF2, 및 -HF4의 게놈 전체 특이성. 도 5e, 도 5f로부터의 GUIDE-서열 실험에서 의도된 표적내 부위에서의 평균 GUIDE-서열 태그 혼입. SpCas9-HF1 = N497A/R661A/Q695A/Q926A이고; HF2 = HF1 + D1135E이며; HF4 = HF1 + Y450A이다. 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 5f, FANCF 부위 2 또는 VEGFA 부위 3 sgRNA에 의한 SpCas9-HF1, -HF2, 또는 -HF4의 GUIDE-서열 확인 표적외 부위. 판독 계수는 특정 부위에서의 절단 빈도의 측정치를 나타내며; 스페이서 또는 PAM 내의 미스매치 위치는 채색되어 강조되어 있다. 표적외 식별시의 개선-배수는 SpCas9-HF 변이체의 표적외 판독 계수를 SpCas9-HF 변이체 사이의 비교 전의 표적내 부위에서의 판독 계수에 대해 정규화함으로써, 계산된다.
도 6a 및 도 6b | sgRNA 및 표적 DNA와 SpCas9의 상호작용 . 도 6a, sgRNA와 표적 DNA 사이에 염기쌍을 갖는 SpCas9:sgRNA 복합체를 예시하는 도식. 도 6b, PDB: 4UN3(참조문헌 32)로부터 표적 DNA와 결합된 SpCas9:sgRNA 복합체의 구조 대표 예. 표적-가닥 DNA 백본과의 수소 결합 접촉을 형성하는 4개의 잔기는 청색으로 강조되어 있으며; HNH 도메인은 시각화 목적으로 숨겨져 있다.
도 7a 내지 도 7d | GUIDE - 서열 실험에 사용된 다양한 sgRNA에 의한 야생형 및 SpCas9 -HF1의 표적내 활성 비교. 도 7a 및 도 7c, 제한 단편 길이 다형성 분석에 의해 정량화된, 도 2a 및 도 4a에 제시된 GUIDE-서열 실험에서의 의도된 표적내 부위의 평균 GUIDE-서열 태그 혼입(각각, 도 7a 및 도 7c). 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다. 도 7b 및 도 7d, T7E1 분석에 의해 검출된, 도 2a 및 도 4a에 제시된 GUIDE-서열 실험에서의 의도된 표적내 부위의 평균 변형 퍼센트(각각, 도 7b 및 도 7d). 오류 막대는 n = 3인 경우의 s.e.m.을 나타낸다.
도 8 | VEGFA 부위 2 표적외 부위의 잠재적 대안적 정렬. Geneious(문헌[Kearse et al., Bioinformatics 28, 1647-1649 (2012)]) 버전 8.1.6을 사용하여 정렬된 단일 뉴클레오타이드 갭을 함유하는 표적외 부위(문헌[Lin et al., NucleicAcids Res 42, 7473-7485 (2014)])(우측)로서 잠재적으로 인식될 수 있는 GUIDE-서열에 의해 확인되는 10개의 VEGFA 부위 2 표적외 부위(좌측).
도 9 | 절두된 sgRNA14에 의한 야생형 SpCas9 및 SpCas9 -HF1의 활성. EGFP의 4개의 부위에 표적화된 전장의 sgRNA 또는 절두된 sgRNA를 사용한 야생형 SpCas9 및 SpCas9-HF1의 EGFP 파괴 활성. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 대조군 실험에서의 백그라운드 EGFP 손실의 평균 수준은 적색 점선에 의해 표시된다.
도 10 | 5 '- 미스매치된 구아닌 염기를 보유하는 sgRNA에 의한 야생형 SpCas9 및 SpCas9 -HF1 활성. 4개의 상이한 부위에 표적화된 sgRNA에 의한 야생형 SpCas9 및 SpCas9-HF1의 EGFP 파괴 활성. 각각의 표적 부위에서, sgRNA는, 의도적으로 미스매치된 5'-구아닌 또는 매치된 비-구아닌 5'-염기를 함유한다.
도 11 | 야생형 SpCas9 및 SpCas9 - HF1 발현 플라스미드의 양의 적정. 다양한 양의 야생형 및 SpCas9-HF1 발현 플라스미드에 의한 형질감염으로부터의 인간 세포 EGFP 파괴 활성. 모든 형질감염의 경우, sgRNA-함유 플라스미드의 양은 250 ng으로 고정시켰다. 2개의 sgRNA 표적화 개별 부위가 사용되었고; 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 음성 대조군의 백그라운드 EGFP 손실의 평균 수준은 적색 점선으로 표시된다.
도 12a 내지 도 12d | SpCas9 -HF1의 PAM 인식 특이성의 변이. 도 12a, T7E1 분석에 의해 정량화된 8개의 sgRNA를 사용하여, SpCas9-VQR(참조문헌 15) 및 개선된 SpCas9-VRQR에 의한 표적내 내인성 인간 부위의 평균 변형 퍼센트의 비교. 두 변이체 모두 NGAN PAM을 인식하도록 조작되었다. 오류 막대는 n = 2 또는 3인 경우의 s.e.m.을 나타낸다. 도 12b, 8개의 sgRNA를 사용하여, 그의 -HF1 대응 대상과 비교한 pCas9-VQR 및 SpCas9-VRQR의 표적내 EGFP 파괴 활성. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; 음성 대조군의 백그라운드 EGFP 손실의 평균 수준은 적색 점선에 의해 표시된다. 도 12c, T7E1 분석의 정량화된 8개의 내인성 인간 유전자 부위에서 그의 -HF1 변이체와 비교한 SpCas9-VQR 및 SpCas9-VRQR에 의한 평균 표적내 변형 퍼센트의 비교. 오류 막대는 n = 3인 경우의 s.e.m.을 나타내며; ND는 검출이 불가능한 것이다. 도 12d, 그의 상응하는 -HF1 변이체(도 12b 및 도 12c)와 비교한 SpCas9-VQR 또는 SpCas9-VRQR를 사용하는 경우의 표적내 활성의 변화-배수의 요약. 중앙값 및 사분범위가 도시되며; 야생형 활성의 70%를 초과하는 구간은 녹색으로 강조되어 있다.
도 13a 및 도 13b | 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9 , SpCas9 -HF1, 및 야생형 SpCas9 유도체의 활성. 도 13a 및 도 13b, 위치 11 및 12(도 13a) 또는 위치 9 및 10(도 13b)에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이고; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타내며; HF1 = N497A/R661A/Q695A/Q926A 치환을 갖는 SpCas9이다.
도 14a 및 도 14b | 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9, SpCas9 - HF1, 및 SpCas9 - HF1 유도체의 활성. 도 14a 및 도 14b, 위치 11 및 12(도 14a) 또는 위치 9 및 10(도 14b)에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이고; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타내며; HF1 = N497A/R661A/Q695A/Q926A 치환을 갖는 SpCas9이다.
도 15 | 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9, SpCas9 - HF1, 및 SpCas9 ( Q695A / Q926A) 유도체의 활성. 위치 11 및 12에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이고; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타내고; HF1 = N497A/R661A/Q695A/Q926A 치환을 갖는 SpCas9이이며; Dbl = Q695A/Q926A 치환을 갖는 SpCas9이다.
도 16 | 스페이서의 각 위치에 단일 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야생형 SpCas9, SpCas9 - HF1, 및 eSpCas9 -1.1의 활성. 지정 위치에서 의도적으로 미스매치된 sgRNA뿐만 아니라, ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이다. SpCas9-HF1 = N497A/R661A/Q695A/Q926A이고, eSP1.1 = K848A/K1003A/R1060A이다.
도 17a 및 도 17b | 스페이서의 다양한 위치에 단일 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야생형 SpCas9 및 변이체의 활성. (도 17a) (표적 또는 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 유도된) 알라닌 치환의 조합을 함유하는 SpCas9 뉴클레아제의 활성을, 지정 스페이서 위치에 의도적으로 미스매치된 sgRNA뿐만 아니라, ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 평가하였다. (도 17b) (도 17a)로부터의 이러한 뉴클레아제의 하위세트를, 매치된 표적내 부위에 대해 나머지 모든 가능한 단일 미스매치된 sgRNA를 사용하여, 시험하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이다. mm = 미스매치이고, WT = 야생형이고, Db = Q695A/Q926A이고, HF1 = N497A/R661A/Q695A/Q926A이고, 1.0 = K810A/K1003A/R1060A이며, 1.1 = K848A/K1003A/R1060A이다.
도 18 | 스페이서의 다양한 개별 위치에 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야 생형 SpCas9 및 변이체의 활성. (표적 또는 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 유도된) 알라닌 치환의 조합을 함유하는 SpCas9 뉴클레아제의 활성을, 지정 위치에서 의도적으로 미스매치된 sgRNA뿐만 아니라, ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 평가하였다. Db = Q695A/Q926A이고, HF1 = N497A/R661A/Q695A/Q926A이다.
도 19a 및 도 19b | 스페이서의 다양한 개별 위치에 미스매치를 갖는 sgRNA 및 매치된 sgRNA를 사용한 야생형 SpCas9 및 변이체의 활성. (도 19a) (표적 또는 비표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치에 유도된) 알라닌 치환의 조합을 함유하는 SpCas9 뉴클레아제의 표적내 활성을, EGFP 유전자의 일 부위에 완전히 매치된 2개의 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 평가하였다. (도 19b) (도 19a)로부터의 이러한 뉴클레아제의 하위세트를, 미스매치에 대한 불내성이 이들 치환에 의해 부여되는지를 결정하기 위해, 이들의 스페이서 서열의 (sgRNA '부위 1'의) 위치 12, 14, 16, 또는 18에 미스매치를 함유하는 sgRNA에 의해 시험하였다. Db = Q695A/Q926A이고, HF1 = N497A/R661A/Q695A/Q926A이다.
도 20 | (황색 구형 표시로 도시된) 사중 돌연변이 작제물의 돌연변이 위치 사이의 유사성을 예시하는 SpCas9(상단) 및 SaCas9(하단)의 구조 비교. 또한, DNA 백본과 접촉하는 다른 잔기는 분홍색 구형 표시로 도시된다.
도 21a 및 도 21b | 하나 이상의 알라닌 치환을 보유하는 야생형 SaCas9 및 SaCas9 유 도체의 활성. 도 21a 및 도 21b, 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 위치(도 21a) 또는 PAM 특이성에 영향을 주는 것으로 이전에 밝혀진 위치(도 21b)에 SaCas9 치환을 유도하였다. 위치 11 및 12에서 의도적으로 미스매치된 sgRNA뿐만 아니라, EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이며; 적색 점선은 EGFP 파괴의 백그라운드 수준을 나타낸다.
도 22a 및 도 22b | 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 잔기에 하나 이상의 알라닌 치환을 보유하는 야생형(WT) SaCas9 및 SaCas9 유도체의 활성. 도 22a 및 도 22b, 위치 19 및 20에 의도적으로 미스매치된 sgRNA 및 ("매치된") EGFP 유전자의 일 부위에 완전히 매치된 sgRNA에 의해, EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 미스매치된 위치를 넘버링하였고, PAM-최원위 위치는 위치 20이다.
도 23 | 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 잔기에 알라닌 치환의 삼중 조합을 보유하는 야생형(WT) SaCas9 및 SaCas9 변이체의 활성. EGFP 파괴 분석을 사용하여, 뉴클레아제를 평가하였다. 4개의 상이한 sgRNA를 사용하였으며(매치된 #1 내지 4), 또한, 4개의 표적 부위 각각을 야생형 SaCas9에 의해 효율적으로 사용되는 것으로 인식되어 있는 미스매치된 sgRNA에 의해 시험하였다. 각각의 부위에 대해 미스매치된 sgRNA는 각각의 매치된 sgRNA의 우측에 도시된다(예를 들어, 매치된 부위 3에 대한 단일 미스매치된 sgRNA는 mm 11&12임). 미스매치된 위치를 넘버링하였고, 위치 21은 PAM-최원위 위치이며; mm은 미스매치이다.
도 24a 및 도 24b | 표적 DNA 가닥과 잠재적으로 접촉할 수 있는 잔기에 하나 이상의 알라닌 치환을 보유하는 야생형(WT) SaCas9 및 SaCas9 유도체의 활성. 도 24a 및 도 24b, 이중(도 24a) 또는 삼중(도 24a) 조합 치환을 보유하는 SaCas9 변이체를, T7E1 분석를 사용하여, 매치된 내인성 인간 유전자 표적 부위 및 단일 미스매치된 내인성 인간 유전자 표적 부위에 대해 평가하였다. 매치된 '표적내' 부위는 문헌[Kleinstiver et al., Nature Biotechnology 2015]으로부터의 그의 유전자 표적 부위 sgRNA 번호에 따라 명명된다. 미스매치된 sgRNA를 넘버링하였고, PAM-최원위 위치인 위치 21에 미스매치가 발생하였으며; 미스매치된 sgRNA는, 미스매치된 sgRNA의 좌측에 나열된 매치된 표적내 부위로부터 유해한다.
CRISPR-Cas9 뉴클레아제의 한계는, 일부 경우, 그 빈도가 의도된 표적내 부위에서 관찰되는 빈도와 경쟁 관계에 있는(문헌[Fu et al., Nat Biotechnol. 2013]), 불완전하게 매치된 표적 부위에 바람직하지 않은 "표적외" 돌연변이를 유도할 수 있는 가능성이다(예를 들어, 문헌[Tsai et al., Nat Biotechnol. 2015] 참조). CRISPR-Cas9 뉴클레아제를 사용한 종래 연구는, 가이드 RNA(gRNA)와 표적 부위의 스페이서 영역 사이의 서열 특이적 상호작용의 수를 감소시키는 경우, 인간 세포에서 표적외 절단 부위에서의 돌연변이유발 효과를 감소시킬 수 있다고 제안했다(문헌[Fu et al., Nat Biotechnol. 2014]).
이는 종래에, gRNA를 5' 말단에서 2 또는 3개의 뉴클레오타이드만큼 절두시킴으로써 달성되었으며, 이러한 증대된 특이성의 메커니즘이, 단지, 표적내 부위의 절단에 필요한 에너지만큼만 유지되도록 함으로써, 표적 DNA 부위에서의 미스매치로 인해, 에너지 면에서 불리할 것으로 예상되는 표적외 부위의 절단에 필요한 에너지를 가질 가능성이 감소하도록 하는, gRNA/Cas9 복합체의 상호작용 에너지의 감소라고 가정하였다(WO2015/099850).
SpCas9의 (가이드 RNA에 대한 의도된 표적 부위와 불완전하게 매치되거나, 미스매치된 DNA 부위에서의) 표적외 효과가 표적 DNA 부위와의 비특이적 상호작용의 저하에 의해, 최소화될 수 있다고 가정하였다. SpCas9-sgRNA 복합체는 NGG PAM 서열(SpCas9에 의해 인식됨)로 구성된 표적 부위(문헌[Deltcheva, E. et al. Nature 471, 602-607(2011); Jinek, M. et al. Science 337, 816-821(2012); Jiang, W., et al., Nat Biotechnol 31, 233-239(2013); Sternberg, S.H., et al., Nature 507, 62-67(2014)]) 및 (sgRNA의 5' 말단에 상보성인) 인접한 20 bp의 프로토스페이서 서열(문헌[(Jinek, M. et al. Science 337, 816-821(2012); Jinek, M. et al. Elife 2, e00471(2013); Mali, P. et al., Science 339, 823-826(2013); Cong, L. et al., Science 339, 819-823(2013)])을 절단한다. SpCas9-sgRNA 복합체가 의도된 표적 DNA 부위를 인식하기 위해 필요한 에너지보다 더 많은 에너지를 보유할 수 있음으로써, 미스매치된 표적외 부위의 절단이 가능하게 된다는 것이 종래에 이론화되었다(문헌[Fu, Y., et al., Nat Biotechnol 32, 279-284(2014)]). 이러한 특성이 박테리아의 적응 면역에서 Cas9의 의도된 역할에 유리할 수 있음으로써, 돌연변이가 될 수 있는 외래 서열을 절단하는 능력을 부여할 수 있음을 유추할 수 있을 것이다. 이러한 과량의 에너지 모델은 또한, 표적외 효과에 대해 다른 해석이 또한 제안된 바 있으나(문헌[Josephs, E.A. et al. NucleicAcids Res 43, 8924-8941(2015); Sternberg, S.H., et al. Nature 527, 110-113(2015); Kiani, S. et al. Nat Methods 12, 1051-1054(2015)]), SpCas9 농도의 감소(문헌[Hsu, P.D. et al. Nat Biotechnol 31, 827-832(2013); Pattanayak, V. et al. Nat Biotechnol 31, 839-843(2013)]) 또는 sgRNA의 상보성 길이의 감소(문헌[Fu, Y., et al., Nat Biotechnol 32, 279-284(2014)])에 의해, 표적외 효과가 감소할 수 있음(그러나, 제거되지는 않음)을 입증하는 종래의 연구에 의해, 뒷받침된다. 구조 데이터는, SpCas9-sgRNA-표적 DNA 복합체가, 4개의 SpCas9 잔기(N497, R661, Q695, Q926)에 의해 이루어지는 표적 DNA 가닥의 포스페이트 백본과의 직접적 수소 결합을 포함하는 여러 개의 SpCas9-매개 DNA 접촉에 의해 안정화될 수 있음을 시사한다(문헌[Nishimasu, H. et al. Cell 156, 935-949(2014); Anders, C., et al. Nature 513, 569-573(2014)])(도 1a 및 도 6a 및 도 6b). 본 발명자들은, 하나 이상의 이러한 접촉의 파괴가 SpCas9-sgRNA 복합체를 에너지 면에서, 단지 강력한 표적내 활성만을 보유하기에 충분한 수준으로 유지시키면서, 미스매치된 표적외 부위의 절단 능력은 감소하도록 한다고 유추하였다.
본 명세서에 기재된 바와 같이, Cas9 단백질은, 이론상, DNA에 대한 Cas9의 결합 친화도의 감소에 의해, 증대된 특이성을 나타내도록 조작될 수 있다. 널리 사용되는 스트렙토코커스 피오게네스 Cas9(SpCas9)의 몇몇 변이체는, 구조 정보, 박테리아 선택-기반 직접 진화 및 조합 설계를 사용하여, DNA 백본 상의 포스페이트와 상호작용하는 것으로 예상되는 SpCas9의 다양한 잔기에 개개의 알라닌 치환을 도입시킴으로써, 조작되었다. 이러한 변이체는, 이러한 박테리아 시스템에서의 이들 변이체의 세포 활성으로서, gRNA 및 SpCas9에 의해 표적화되는 23개의 염기쌍의 서열 및 독성 자이라제 독(gyrase poison) ccdB의 유전자를 함유하는 선택 플라스미드의 절단 및 후속 파열에 따른 세포 생존을 평가하기 위한 강력한 E. 콜라이-기반 스크리닝 분석을 사용하여, 세포 활성에 대해 추가로 시험되었으며, 이는 활성의 보유 또는 손실과 관련된 잔기의 확인으로 이어졌다. 이에 더하여, 인간 세포에서 개선된 표적 특이성을 나타내는 또 다른 SpCas9 변이체가 확인되고, 특성화되었다.
추가로, 박테리아 세포-기반 시스템에서 평가된 바와 같은 SpCas9의 단일 알라닌 치환 돌연변이체의 활성은, 50 내지 100%의 생존율이 일반적으로 강력한 절단을 시사하며, 0% 생존은, 효소가 기능적으로 손상되었음을 시사하는 것으로 표현되었다. 이어서, 다음을 포함하는 SpCas9의 추가의 돌연변이를 박테리아에서 분석하였다: R63A, R66A, R69A, R70A, R71A, Y72A, R74A, R75A, K76A, N77A, R78A, R115A, H160A, K163A, R165A, L169A, R403A, T404A, F405A, N407A, R447A, N497A, I448A, Y450A, S460A, M495A, K510A, Y515A, R661A, M694A, Q695A, H698A, Y1013A, V1015A, R1122A, K1123A, K1124A, K1158A, K1185A, K1200A, S1216A, Q1221A, K1289A, R1298A, K1300A, K1325A, R1333A, K1334A, R1335A, 및 T1337A. 박테리아에서 5% 미만의 생존을 나타내는 2개의 돌연변이체 (R69A 및 F405A)를 제외하고, 이들 추가의 단일 돌연변이는 모두 SpCas9의 표적내 활성에 영향을 주지않는 것으로 나타났다(박테리아 스크린에서 70% 초과의 생존).
박테리아 스트린에서 확인된 Cas9의 변이체가 인간 세포에서 효율적으로 기능하였는지를 추가로 결정하기 위해, 다양한 알라닌 치환 Cas9 돌연변이체를 인간 U2OS 세포-기반 EGFP-파괴 분석을 사용하여 시험하였다. 이 분석에서, 단일 혼입된 항시 발현 EGFP 유전자의 코딩 서열에서의 표적 부위의 성공적인 절단은 삽입결실 돌연변이의 유도 및 EGFP 활성의 파괴를 야기하였으며, 이를 유동 세포계측법에 의해 정량적으로 평가하였다(예를 들어, 문헌[Reyon et al., Nat Biotechnol. 2012 May;30(5):460-5] 참조).
이 실험은, 박테리아 세포 기반 분석에서 얻은 결과가 인간 세포에서의 뉴클레아제 활성과 잘 일치 함을 보여주며, 이는 이러한 조작 전략이 다른 종 및 상이한 세포들로부터의 Cas9로 확장될 수 있음을 시사한다. 따라서, 이러한 발견은 본 명세서에서 "변이체" 또는 "이러한 변이체"로 총칭되는 SpCas9 및 SaCas9 변이체에 대한 뒷받침을 제공한다.
본 명세서에 기재된 변이체는 모두, 예를 들어, 단순 부위-직접 돌연변이유발에 의해, 기존의 광범위하게 사용되는 벡터 내로 빠르게 혼입될 수 있으며, 이러한 변이체는 소수의 돌연변이만이 필요하므로, 이들은 또한, SpCas9 플랫폼(예를 들어, 절두된 sgRNA(문헌[Tsai et al., Nat Biotechnol 33, 187-197(2015); Fu et al., Nat Biotechnol 32, 279-284(2014)]), 닉카제 돌연변이(nickase mutation)(문헌[Mali et al., Nat Biotechnol 31, 833-838(2013); Ran et al., Cell 154, 1380-1389(2013)]), FokI-dCas9 융합(문헌[Guilinger et al., Nat Biotechnol 32, 577-582(2014); Tsai et al., Nat Biotechnol 32, 569-576(2014); WO2014144288]); 및 PAM 특이성이 변이된 조작된 CRISPR-Cas9 뉴클레아제(문헌[Kleinstiver et al., Nature. 2015 Jul 23;523(7561):481-5])에 대한 종래 기재된 다른 개선과 함께 작업되어야 한다.
따라서, 본 명세서에서는 SpCas9 변이체를 포함하는 Cas9 변이체가 제공된다. SpCas9 야생형 서열은 다음과 같다:
본 명세서에 기재된 SpCas9 변이체는, N497, R661, Q695, Q926(또는, 이와 유사한 위치)의 위치 중 하나 이상에서 돌연변이(즉, 상이한 아미노산, 예를 들어 알라닌, 글리신 또는 세린으로의 천연 아미노산의 대체)를 가질 수 있는 SEQ ID NO:1의 아미노산 서열을 포함할 수 있다. 일부 구현예에서, SpCas9 변이체는 SEQ ID NO:1의 아미노산 서열과 적어도 80%, 예를 들어, 적어도 85%, 90%, 또는 95% 동일하고, 예를 들어, 본 명세서에 기재된 돌연변이에 더하여, 예를 들어 보존적 돌연변이에 의해 대체된, SEQ ID NO:1의 최대 5%, 10%, 15%, 또는 20%의 잔기에서 차이점을 가진다. 바람직한 구현예에서, 이러한 변이체는 모체의 바람직한 활성, 예를 들어 뉴클레아제 활성(모체가 닉카제 또는 사멸 Cas9인 경우는 제외됨) 및/또는 가이드 RNA 및 표적 DNA와의 상호작용 능력을 보유한다).
2개의 핵산 서열의 동일성 백분율을 결정하기 위해, 최적의 비교 목적을 위해, 서열을 정렬한다(예를 들어, 최적의 정렬을 위해, 제1 및 제2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 갭이 도입될 수 있으며, 비교 목적을 위해, 비상동성 서열이 무시될 수 있음). 비교 목적을 위해 정렬되는 기준 서열의 길이는 기준 서열 길이의 적어도 80%이며, 일부 구현예에서는 적어도 90% 또는 100%이다. 이어서, 상응하는 아미노산 위치 도는 뉴클레오타이드 위치의 뉴클레오타이드를 비교한다. 제1 서열이 제2 서열에서의 상응하는 위치와 동일한 뉴클레오타이드에 의해 점유된 경우, 그 후, 이러한 분자들은 이 위치에서 동일하다(본 명세서에 사용되는 바와 같은 핵산 "동일성"은 핵산 "상동성"과 동등함). 2개의 서열 사이의 동일성 백분율은, 2개의 서열의 최적의 정렬을 위해 도입될 필요가 있는 갭의 수 및 각각의 갭의 길이를 고려한 것으로, 서열에 의해 공유되는 동일한 위치의 수의 함수이다. 2개의 폴리펩타이드 또는 핵산 서열 사이의 동일성 백분율은, 예를 들어 공개적으로 이용 가능한 컴퓨터 소프트웨어, 예를 들어 Smith Waterman Alignment (문헌[Smith, T. F. and M. S. Waterman (1981) J Mol Biol 147:195-7]); GeneMatcher Plus™, 문헌[Schwarz and Dayhof (1979) Atlas of Protein Sequence and Structure, Dayhof, M.O., Ed, pp 353-358]에 내장된 것으로서, "BestFit" (문헌[Smith and Waterman, Advances in Applied Mathematics, 482-489 (1981)]); BLAST 프로그램 (Basic Local Alignment Search Tool; (문헌[Altschul, S. F., W. Gish, et al. (1990) J Mol Biol 215: 403-10]), BLAST-2, BLAST-P, BLAST-N, BLAST-X, WU-BLAST-2, ALIGN, ALIGN-2, CLUSTAL, 또는 Megalign (DNASTAR) 소프트웨어를 사용하여, 당업계의 기술 범위 내의 다양한 방법으로 결정된다. 이에 더하여, 당업자는, 비교되는 서열의 길이에 걸쳐 최대의 정렬을 달성하기 위해 필요한 임의의 알고리즘을 포함하여, 정렬을 측정하기 위한 적절한 매개변수를 결정할 수 있다. 일반적으로, 단백질 또는 핵산에서, 비교 길이는, 최대 전체 길이를 포함하는 임의의 길이일 수 있다(예를 들어, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 100%). 본 조성물 및 방법의 목적을 위해, 서열의 전체 길이의 적어도 80%가 정렬된다.
본 발명의 목적을 위해, 서열의 비교 및 2개의 서열 사이의 동일성 백분율의 결정은, 12의 갭 패널티, 4의 갭 연장 패널티 및 5의 프레임시프트 갭 패널티(frameshift gap penalty)의 Blossum 62 채점표를 사용하여 달성될 수 있다.
보존적 치환은 통상적으로 다음의 기 내에 치환을 포함한다: 글리신, 알라닌; 발린, 이소류신, 류신; 아스파르트산, 글루탐산, 아스파라긴, 글루타민; 세린, 트레오닌; 리신, 아르기닌; 및 페닐알라닌, 티로신.
일부 구현예에서, SpCas9 변이체는 다음의 돌연변이 세트 중 하나를 포함한다: N497A/R661A/Q695/Q926A(사중 알라닌 돌연변이체); Q695A/Q926A(이중 알라닌 돌연변이체); R661A/Q695A/Q926A 및 N497A/Q695A/Q926A(삼중 알라닌 돌연변이체). 일부 구현예에서, L169 및/또는 Y450에서의 추가의 치환 돌연변이가 이러한 이중, 삼중 및 사중 돌연변이체에 추가되거나, Q695 또는 Q926에서 치환을 보유하는 단일 돌연변이체에 추가된다. 일부 구현예에서, 이러한 돌연변이체는 야생형 아미노산 대신에 알라닌을 갖는다. 일부 구현예에서, 이러한 돌연변이체는 아르기닌 또는 리신(또는, 천연 아미노산) 이외에 임의의 아미노산을 갖는다.
일부 구현예에서, SpCas9 변이체는 또한, 단백질의 뉴클레아제 부분이 촉매적으로 비활성이 되도록 하는 것으로, Cas9의 뉴클레아제 활성을 감소시키거나, 파괴하는, D10, E762, D839, H983, 또는 D986 및 H840 또는 N863의 돌연변이, 예를 들어, D10A/D10N 및 H840A/H840N/H840Y 중 하나를 포함하며; 이들 위치에서의 치환은 알라닌(이는 문헌[Nishimasu al., Cell 156, 935-949(2014)]의 것과 같음), 또는 다른 잔기, 예를 들어, 글루타민, 아스파라긴, 티로신, 세린 또는 아스파테이트, 예를 들어, E762Q, H983N, H983Y, D986N, N863D, N863S, 또는 N863H일 수 있다(WO 2014/152432 참조). 일부 구현예에서, 이러한 변이체는 D10A 또는 H840A에서의 돌연변이(단일 가닥 닉카제를 생성함), 또는 D10A 및 H840A에서의 돌연변이(뉴클레아제 활성을 파기함; 이러한 돌연변이체는 사멸 Cas9 또는 dCas9로 일컬어짐)를 포함한다.
SpCas9 N497A/R661A/Q695A/R926A 돌연변이는 스타필로코커스 아우레우스 Cas9(SaCas9)에서와 유사한 잔기를 가지며; 도 20을 참조한다. DNA 또는 RNA 백본과 접촉된 잔기에 대한 돌연변이는 SaCas9의 특이성을 증대시킬 것으로 예상되며, 이는 본 발명자들이 SpCas9에서 관찰한 바와 같다. 따라서, 또한 본 명세서에서는 SaCas9 변이체를 제공한다.
SaCas9 야생형 서열은 다음과 같다:
본 명세서에 기재된 SaCas9 변이체는, Y211, W229, R245, T392, N419, 및/또는 R654의 위치 중 1, 2, 3, 4, 5 또는 6개 모두에서 돌연변이를 갖는 SEQ ID NO:2의 아미노산 서열을 포함하며, 예를 들어, Y211, W229, R245, T392, N419, 및/또는 R654의 위치 중 1, 2, 3, 4, 5 또는 6개에서 돌연변이를 갖는 SEQ ID NO:2의 아미노산 서열과 적어도 80% 동일한 서열을 포함한다.
일부 구현예에서, 변이체 SaCas9 단백질은 또한 다음의 돌연변이 중 하나 이상을 포함한다: Y211A; W229A; Y230A; R245A; T392A; N419A; L446A; Y651A; R654A; D786A; T787A; Y789A; T882A; K886A; N888A; A889A; L909A; N985A; N986A; R991A; R1015A; N44A; R45A; R51A; R55A; R59A; R60A; R116A; R165A; N169A; R208A; R209A; Y211A; T238A; Y239A; K248A; Y256A; R314A; N394A; Q414A; K57A; R61A; H111A; K114A; V164A; R165A; L788A; S790A; R792A; N804A; Y868A; K870A; K878A; K879A; K881A; Y897A; R901A; K906A.
일부 구현예에서, 변이체 SaCas9 단백질은 다음의 추가의 돌연변이 중 하나 이상을 포함한다: Y211A, W229A, Y230A, R245A, T392A, N419A, L446A, Y651A, R654A, D786A, T787A, Y789A, T882A, K886A, N888A, A889A, L909A, N985A, N986A, R991A, R1015A, N44A, R45A, R51A, R55A, R59A, R60A, R116A, R165A, N169A, R208A, R209A, Y211A, T238A, Y239A, K248A, Y256A, R314A, N394A, Q414A, K57A, R61A, H111A, K114A, V164A, R165A, L788A, S790A, R792A, N804A, Y868A, K870A, K878A, K879A, K881A, Y897A, R901A, K906A.
일부 구현예에서, 변이체 SaCas9 단백질은 다중 치환 돌연변이를 포함한다: R245/T392/N419/R654 및 Y221/R245/N419/R654(사중 변이체 돌연변이체); N419/R654, R245/R654, Y221/R654, 및 Y221/N419(이중 돌연변이체); R245/N419/R654, Y211/N419/R654, 및 T392/N419/R654(삼중 돌연변이체). 일부 구현예에서, 이러한 돌연변이체는 야생형 아미노산 대신에 알라닌을 함유한다.
일부 구현예에서, 변이체 SaCas9 단백질은 또한 E782K, K929R, N968K, 및/또는 R1015H에서 돌연변이를 포함한다. 예를 들어, KKH 변이체(E782K/N968K/R1015H), KRH 변이체(E782K/K929R/R1015H), 또는 KRKH 변이체(E782K/K929R/N968K/R1015H)]
일부 구현예에서, 변이체 SaCas9 단백질은 또한 D10, E477, D556, H701, 또는 D704; 및 H557 또는 N580에서의 돌연변이로 이루어진 군으로부터 선택되는, 뉴클레아제 활성을 감소시키는 하나 이상의 돌연변이를 포함한다.
일부 구현예에서, 돌연변이는 (i) D10A 또는 D10N, (ii) H557A, H557N, 또는 H557Y, (iii) N580A, 및/또는(iv) D556A이다.
또한 본 명세서에서는, Cas9 변이체를 인코딩하는 단리된 핵산, 선택적으로, 변이체 단백질을 발현시키기 위한 하나 이상의 조절 도메인과 작동 가능하게 연결된 이러한 단리된 핵산을 포함하는 벡터 및 이러한 핵산을 포함하고, 선택적으로 변이체 단백질을 발현하는 숙주 세포, 예를 들어 포유류 숙주 세포가 제공된다.
본 명세서에 기재된 변이체는 세포 게놈을 변이시키기 위해 사용될 수 있으며; 그 방법은 일반적으로, 세포 게놈의 선택 부분에 상보성인 영역을 갖는 가이드 RNA에 따라, 세포에서 변이체 단백질을 발현시키는 단계를 포함한다. 세포 게놈을 선택적으로 변이시키기 위한 방법은 당업계에 공지되어 있으며, 예를 들어, US 8, 993, 233; US 20140186958; US 9, 023, 649; WO/2014/099744; WO 2014/089290; WO2014/144592; WO144288; WO2014/204578; WO2014/152432; WO2115/099850; US8, 697, 359; US20160024529; US20160024524; US20160024523; US20160024510; US20160017366; US20160017301; US20150376652; US20150356239; US20150315576; US20150291965; US20150252358; US20150247150; US20150232883; US20150232882; US20150203872; US20150191744; US20150184139; US20150176064; US20150167000; US20150166969; US20150159175; US20150159174; US20150093473; US20150079681; US20150067922; US20150056629; US20150044772; US20150024500; US20150024499; US20150020223;; US20140356867; US20140295557; US20140273235; US20140273226; US20140273037; US20140189896; US20140113376; US20140093941; US20130330778; US20130288251; US20120088676; US20110300538; US20110236530; US20110217739; US20110002889; US20100076057; US20110189776; US20110223638; US20130130248; US20150050699; US20150071899; US20150050699; ; US20150045546; US20150031134; US20150024500; US20140377868; US20140357530; US20140349400; US20140335620; US20140335063; US20140315985; US20140310830; US20140310828; US20140309487; US20140304853; US20140298547; US20140295556; US20140294773; US20140287938; US20140273234; US20140273232; US20140273231; US20140273230; US20140271987; US20140256046; US20140248702; US20140242702; US20140242700; US20140242699; US20140242664; US20140234972; US20140227787; US20140212869; US20140201857; US20140199767; US20140189896; US20140186958; US20140186919; US20140186843; US20140179770; US20140179006; US20140170753; WO/2008/108989; WO/2010/054108; WO/2012/164565; WO/2013/098244; WO/2013/176772; US 20150071899; 문헌[Makarova et al., "Evolution and classification of the CRISPR-Cas systems" 9(6) Nature Reviews Microbiology 467-477 (1-23) (Jun. 2011); Wiedenheft et al., "RNA-guided genetic silencing systems in bacteria and archaea" 482 Nature 331-338 (Feb. 16, 2012); Gasiunas et al., "Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria" 109(39) Proceedings of the National Academy of Sciences USA E2579-E2586 (Sep. 4, 2012); Jinek et al., "A Programmable Dual-RNA-GuidedDNA Endonuclease in Adaptive Bacterial Immunity" 337 Science 816-821 (Aug. 17, 2012); Carroll, "A CRISPR Approach to Gene Targeting" 20(9) Molecular Therapy 1658-1660 (Sep. 2012); 2012년 5월 25일자로 출원된 미국 출원 제 61/652,086호; Al-Attar et al., Clustered Regularly Interspaced Short Palindromic Repeats (CRISPRs): The Hallmark of an Ingenious Antiviral Defense Mechanism in Prokaryotes, Biol Chem. (2011) vol. 392, Issue 4, pp. 277-289; Hale et al., Essential Features and Rational Design of CRISPR RNAs That FunctionWith the Cas RAMP Module Complex to Cleave RNAs, Molecular Cell, (2012) vol. 45, Issue 3, 292-302]을 참조한다.
본 명세서에 기재된 변이체 단백질은, 전술된 참조문헌에 기재된 Cas9 단백질 중 어느 하나 대신에 또는 그에 더하여, 또는 본 명세서에 기재된 돌연변이와 조합하여, 사용될 수 있다. 이에 더하여, 본 명세서에 기재된 변이체는 야생형 Cas9 또는 당업계에 공지된 바와 같은 다른 Cas9 돌연변이(예를 들어, 전술된 dCas9 또는 Cas9 닉카제) 대신에 융합 단백질, US 8, 993, 233; US 20140186958; US 9, 023, 649; WO/2014/099744; WO 2014/089290; WO2014/144592; WO144288; WO2014/204578; WO2014/152432; WO2115/099850; US8, 697, 359; US2010/0076057; US2011/0189776; US2011/0223638; US2013/0130248; WO/2008/108989; WO/2010/054108; WO/2012/164565; WO/2013/098244; WO/2013/176772; US20150050699; US 20150071899 및 WO 2014/124284에 기재된 바와 같은 이종 기능성 도메인과의 융합 단백질에서 사용된다. 예를 들어, 바람직하게는 하나 이상의 뉴클레아제-감소, -변이 또는 -사멸 돌연변이를 포함하는 변이체는 Cas9의 N 또는 C 말단에서 전사 활성화 도메인 또는 다른 이종 기능성 도메인(예를 들어, 전사 리프레서(예를 들어, KRAB, ERD, SID, 등, 예를 들어, ets2 리프레서(ERF) 리프레서 도메인(ERD)의 아미노산 473 내지 530, KOX1의 KRAB 도메인의 아미노산 1 내지 97 , 또는 Mad mSIN3 상호작용 도메인(SID)의 아미노산 1 내지 36; 문헌[Beerli et al., PNAS USA 95:14628-14633(1998)] 참조) 또는 사일런서, 예를 들어, 이질염색질 단백질 1(HP1, 또한 swi6으로 일컬어짐), 예를 들어, HP1α 또는 HP1β; MS2 외피 단백질, 엔도리보뉴클레아제 Csy4, 또는 람다 N 단백질에 의해 결합된 것과 같은 고정 RNA 결합 서열과 융합된 긴 비코딩 RNA(lncRNA)를 동원할 수 있는 단백질 또는 펩타이드; DNA의 메틸화 상태를 변형하는 효소(예를 들어, DNA 메틸기전달효소(DNMT) 또는 TET 단백질); 또는 히스톤 서브유닛을 변형하는 효소(예를 들어, 히스톤 아세틸기전달효소(HAT), 히스톤 탈아세틸효소(HDAC), 히스톤 메틸기전달효소(예를 들어, 리신 또는 아르기닌 잔기의 메틸화의 경우) 또는 히스톤 탈메틸효소(예를 들어, 리신 또는 아르기닌 잔기의 탈메틸화의 경우))에 융합될 수 있으며, 당업계에 공지된 바와 같은 것이 또한 사용될 수 있다. 이러한 도메인, 예를 들어, DNA에서 메틸화된 시토신의 하이드록실화를 촉매하는 도메인의 다수의 서열이 공지되어 있다. 예시적 단백질은, DNA에서 5-메틸시토신(5-mC)을 5-하이드록시메틸시토신(5-hmC)으로 전환시키는 효소인 10-11-전좌(Ten-Eleven-Translocation)(TET)1-3 패밀리를 포함한다.
인간 TET1-3의 서열은 당업계에 공지되어 있으며, 하기 표에 제시된다:
일부 구현예에서, 촉매 도메인, 예를 들어, 7개의 고도로 보존된 엑손에 의해 인코딩되는 2OGFeDO 도메인 및 시스테인-풍부 연장을 포함하는 촉매 모듈, 예를 들어, 아미노산 1580 내지 2052를 포함하는 Tet1 촉매 도메인, 아미노산 1290 내지 1905를 포함하는 Tet2 및 아미노산 966 내지 1678을 포함하는 Tet3의 전장 서열의 전부 또는 일부를 포함할 수 있다. 예를 들어, 3종의 Tet 단백질 모두의 주요 촉매 잔기를 예시하는 정렬에 대한 문헌[Iyer et al., Cell Cycle. 2009 Jun1;8(11):1698-710. Epub 2009 Jun27]의 도 1 및 전장 서열(예를 들어, 서열 2c 참조)에 대한 보충 자료(ftp site ftp.ncbi.nih.gov/pub/aravind/DONS/supplementary_material_DONS.html에서 이용 가능함)를 참조하고; 일부 구현예에서, 서열은 Tet1의 아미노산 1418 내지 2136 또는 Tet2/3의 상응하는 영역을 포함한다.
다른 촉매 모듈은 문헌[Iyer et al., 2009]에서 확인되는 단백질로부터 유래할 수 있다.
일부 구현예에서, 이종 기능성 도메인은 생물학적 테더(biological tether)이며, MS2 외피 단백질, 엔도리보뉴클레아제 Csy4, 또는 람다 N 단백질의 전부 또는 일부(예를 들어, DNA 결합 도메인)를 포함한다. 이들 단백질은, dCas9 gRNA 표적화 서열에 의해 특정되는 구역에 특이적 스템-루프 구조(stem-loop structure)를 함유하는 RNA 분자를 동원하기 위해 사용될 수 있다. 예를 들어, MS2 외피 단백질, 엔도리보뉴클레아제 Csy4, 또는 람다 N에 융합된 dCas9 변이체는, Csy4, MS2 또는 람다 N 결합 서열에 연결된 XIST 또는 HOTAIR과 같은 긴 비코딩 RNA(lncRNA)를 동원하기 위해 사용될 수 있으며; 예를 들어, 문헌[Keryer-Bibens et al., Biol. Cell 100:125-138(2008)]을 참조한다. 대안적으로, Csy4, MS2 또는 람다 N 단백질 결합 서열은, 예를 들어 전술된 문헌[Keryer-Bibens et al.]에 기재된 바와 같은 또 다른 단백질에 연결될 수 있으며, 이러한 단백질은, 본 명세서에 기재된 방법 및 조성물을 사용하여, dCas9 변이체 결합 부위에 표적화될 수 있다. 일부 구현예에서, Csy4는 촉매적으로 비활성이다. 일부 구현예에서, Cas9 변이체, 바람직하게는 dCas9 변이체는 FokI에 융합되며, 이는 US8,993,233; US20140186958; US9,023,649; WO/2014/099744; WO2014/089290; WO2014/144592; WO144288; WO2014/204578; WO2014/152432; WO2115/099850; US8,697,359; US2010/0076057; US2011/0189776; US2011/0223638; US2013/0130248; WO/2008/108989; WO/2010/054108; WO/2012/164565; WO/2013/098244; WO/2013/176772; US20150050699; US20150071899 및 WO2014/204578에 기재된 바와 같다.
일부 구현예에서, 이러한 융합 단백질은 dCas9 변이체와 이종 기능성 도메인 사이에 링커를 포함한다. 이들 융합 단백질(또는, 연쇄 구조의 융합 단백질 사이)에 사용될 수 있는 링커는, 융합 단백질의 기능에 간섭하지 않는 임의의 서열을 포함할 수 있다. 바람직한 구현예에서, 링커는, 예를 들어, 2 내지 20개의 아미노산으로 짧으며, 통상적으로 가요성이다(즉, 글리신, 알라닌 및 세린과 같은 자유도가 높은 아미노산을 포함함). 일부 구현예에서, 링커는 GGGS(SEQ ID NO:3) 또는 GGGGS(SEQ ID NO:4)로 이루어진 하나 이상의 단위, 예를 들어, GGGS(SEQ ID NO:5) 또는 GGGGS(SEQ ID NO:6) 단위의 2, 3, 4개 이상의 반복을 포함한다. 다른 링커 서열이 또한 사용될 수 있다.
일부 구현예에서, 이러한 변이체 단백질은, 세포내 공간으로의 전달을 용이하게 하는 세포-관통 펩타이드 서열, 예를 들어, HIV-유래 TAT 펩타이드, 페너트라틴(penetratin), 트랜스포탄(transportan), 또는 hCT 유래 세포-관통 펩타이드를 포함하며, 예를 들어, 문헌[Caron et al., (2001) Mol Ther. 3(3):310-8; Langel, Cell-Penetrating Peptides: Processes and Applications (CRC Press, Boca Raton FL 2002); El-Andaloussi et al., (2005) CurrPharm Des. 11(28):3597-611; 및 Deshayes et al., (2005) Cell Mol Life Sci. 62(16):1839-49]을 참조한다.
세포 관통 펩타이드(CPP)는, 세포막을 통해, 세포질 또는 다른 세포소기관, 예를 들어 미토콘드리아 및 핵으로의 광범위한 생체분자의 이동을 용이하게 하는 짧은 펩타이드이다. CPP에 의해 전달될 수 있는 분자의 예는 치료제, 플라스미드 DNA, 올리고뉴클레오타이드, siRNA, 펩타이드-핵산(PNA), 단백질, 펩타이드, 나노입자, 및 리포솜을 포함한다. CPP는 일반적으로 30개 이하의 아미노산이고, 천연 또는 비천연 유래 단백질 또는 키메라 서열로부터 유래하며, 비교적 고 풍부도의 양으로 하전된 아미노산, 예를 들어 리신 또는 아르기닌, 또는 극성 및 비극성 아미노산의 교대 패턴을 함유한다. 당업계에서 통상적으로 사용되는 CPP는 Tat(문헌[Frankel et al., (1988) Cell. 55:1189-1193, Vives et al., (1997) J. Biol. Chem. 272:16010-16017]), 페너트라틴(문헌[Derossi et al., (1994) J. Biol. Chem. 269:10444-10450]), 폴리아르기닌 펩타이드 서열(문헌[Wender et al., (2000) Proc. Natl. Acad. Sci. USA 97:13003-13008, Futaki et al., (2001) J. Biol. Chem. 276:5836-5840]), 및 트랜스포탄(문헌[Pooga et al., (1998) Nat. Biotechnol. 16:857-861])을 포함한다.
CPP는 공유 또는 비공유 전략을 통해 내용물과 연결될 수 있다. CPP와 그 내용물을 공유적으로 결합시키는 방법은 당업계에 공지되어 있으며, 예를 들어 화학적 가교 연결(문헌[Stetsenko et al., (2000) J. Org. Chem. 65:4900-4909, Gait et al.(2003) Cell. Mol. Life. Sci. 60:844-853]) 또는 융합 단백질의 클로닝(문헌[Nagahara et al., (1998) Nat. Med. 4:1449-1453])이 있다. 극성 및 비극성 도메인을 포함하는 짧은 양친매성 CPP와 내용물 사이의 비공유적 커플링은 정전기 및 소수성 상호작용을 통해 달성된다.
CPP는 치료용 생체분자를 세포 내로 잠재적으로 전달하기 위해, 당업계에서 사용되어 왔다. 예로는 면역억제를 위한, 폴리아르기닌에 연결된 사이클로스포린(cyclosporine)(문헌[Rothbard et al., (2000) Nature Medicine 6(11):1253-1257]), 종양생성을 억제하기 위한, MPG로 일컬어지는 CPP에 연결된 사이클린(cyclin) B1에 대한 siRNA(문헌[Crombez et al., (2007) Biochem Soc. Trans. 35:44-46]), 암 세포 성장을 감소시키기 위한, CPP에 연결된 종양 리프레서 p53 펩타이드(문헌[Takenobu et al., (2002) Mol. Cancer Ther. 1(12):1043-1049, Snyder et al., (2004) PLoS Biol. 2:E36]), 및 천식 치료를 위한, Tat에 융합된 Ras 또는 포스포이노시톨 3 키나제(PI3K)(문헌[Myou et al., (2003) J. Immunol. 171:4399-4405])를 포함한다.
CPP는 영상화 및 바이오센싱(biosensing) 적용을 위해, 조영제를 세포 내로 수송하기 위해, 당업계에서 사용되어 왔다. 예를 들어, Tat에 부착된 녹색 형광 단백질(GFP)이 암 세포의 표지를 위해 사용되어 왔다(문헌[Shokolenko et al., (2005) DNA Repair 4(4):511-518]). 퀀텀닷(quantum dot)에 접합된 Tat가 랫트 뇌의 시각화를 위해, 혈액 뇌장벽을 성공적으로 통과하기 위해 사용되어 왔다(문헌[Santra et al., (2005) Chem. Commun. 3144-3146]). CPP는 또한 세포 영상화를 위한 자기 공명 영상 기법과 조합되어 왔다(문헌[Liu et al., (2006) Biochem. and Biophys. Res. Comm. 347(1):133-140]). 또한 문헌[Ramsey and Flynn, Pharmacol Ther. 2015 Jul 22. pii: S0163-7258(15)00141-2]을 참조한다.
대안적으로, 또는 이에 더하여, 이러한 변이체 단백질은 핵 위치화 서열, 예를 들어, SV40 거대 T 항원 NLS(PKKKRRV(SEQ ID NO:7)) 및 뉴클레오플라스민(nucleoplasmin) NLS(KRPAATKKAGQAKKKK(SEQ ID NO:8))를 포함할 수 있다. 다른 NLS가 당업계에 공지되어 있으며; 예를 들어, 문헌[Cokol et al., EMBO Rep. 2000 Nov 15; 1(5): 411-415; Freitas and Cunha,CurrGenomics. 2009 Dec; 10(8): 550-557]을 참조한다.
일부 구현예에서, 이러한 변이체는 리간드, 예를 들어 GST, FLAG 또는 헥사히스티딘(hexahistidine) 서열에 대해 높은 친화도를 갖는 모이어티를 포함한다. 이러한 친화도 태그는 재조합 변이체 단백질의 정제를 용이하게 할 수 있다.
변이체 단백질의 세포로의 전달 방법에서, 당업계에 공지된 임의의 방법을 사용하여, 예를 들어, 변이체 단백질을 인코딩하는 핵산으로부터의 시험관내 번역 또는 적절한 숙주 세포에서의 발현에 의해, 단백질이 생성될 수 있으며; 단백질 생성을 위한 다수의 방법이 당업계에 공지되어 있다. 예를 들어, 단백질은 효모, E. 콜라이, 곤충 세포주, 식물, 트랜스제닉 동물(transgenic animal) 또는 배양된 포유류 세포에서 생성되고, 그로부터 정제될 수 있으며; 예를 들어, 문헌[Palomares et al., "Production of Recombinant Proteins: Challenges and Solutions," Methods Mol Biol. 2004;267:15-52]을 참조한다. 이에 더하여, 변이체 단백질은, 단백질이 세포 내부에 존재하는 경우, 선택적으로 절단되는 링커에 의해, 세포로의 전달을 용이하게 하는 모이어티, 예를 들어, 지질 나노입자에 연결될 수 있다. 예를 들어, 문헌[LaFountaine et al., Int J Pharm. 2015 Aug 13;494(1):180-194]을 참조한다.
발현 시스템
본 명세서에 기재된 Cas9 변이체를 사용하는 경우, 이를 인코딩하는 핵산으로부터 이를 발현시키는 것이 요망될 수 있다. 이는 다양한 방법으로 수행될 수 있다. 예를 들어, Cas9 변이체를 인코딩하는 핵산이 복제 및/또는 발현을 위해, 원핵세포 또는 진핵세포로의 형질전환을 위한 중간 벡터로 클로닝될 수 있다. 중간 벡터는 통상적으로, Cas9 변이체의 생성을 위해, Cas9 변이체를 인코딩하는 핵산의 저장 또는 조작을 위한 원핵생물 벡터, 예를 들어 플라스미드 또는 셔틀 벡터(shuttle vector) 또는 곤충 벡터이다. Cas9 변이체를 인코딩하는 핵산은 또한, 식물 세포, 동물 세포, 바람직하게는 포유류 세포 또는 인간 세포, 진균 세포, 박테리아 세포 또는 원생생물 세포로의 투여를 위한 발현 벡터 내로 클로닝될 수 있다.
발현되도록 하기 위해, Cas9 변이체를 인코딩하는 서열은 통상적으로, 전사를 유도하는 프로모터를 함유하는 발현 벡터 내로 서브클로닝된다. 적합한 박테리아 및 진핵생물 프로모터는 당업계에 널리 공지되어 있으며, 예를 들어 문헌[Sambrook et al., Molecular Cloning, A Laboratory Manual (3d ed. 2001); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990); 및 CurrentProtocols in Molecular Biology (Ausubel et al., eds., 2010)]에 기재되어 있다. 조작된 단백질을 발현시키기 위한 박테리아 발현 시스템은, 예를 들어 E. 콜라이, 바실루스 종 및 살모넬라에서 이용 가능하다(문헌[Palva et al., 1983, Gene 22:229-235]). 이러한 발현 시스템을 위한 키트는 상업적으로 구입 가능하다. 포유류 세포, 효모 및 곤충 세포용 진핵생물 발현 시스템은 당업계에 널리 공지되어 있으며, 또한 상업적으로 구입 가능하다.
핵산의 발현을 유도하기 위해 사용되는 프로모터는 특정 적용에 따른다. 예를 들어, 강력한 항시성 프로모터는 통상적으로, 융합 단백질의 발현 및 정제를 위해 사용된다. 달리는, Cas9 변이체가 유전자 조절을 위해, 생체내로 투여되어야 하는 경우, Cas9 변이체의 특정 용도에 따라, 항시성 또는 유도성 프로모터가 사용될 수 있다. 이에 더하여, Cas9 변이체의 투여를 위해 바람직한 프로모터는 약한 프로모터, 예를 들어, HSV TK 또는 유사한 활성을 갖는 프로모터일 수 있다. 프로모터는 또한, 전사활성화에 반응성인 요소, 예를 들어, 저산소 반응 요소, Gal4 반응 요소, lac 리프레서 반응 요소, 및 소분자 제어 시스템, 예를 들어, 테트라사이클린-조절 시스템 및 RU-486 시스템을 포함한다(예를 들어, 문헌[Gossen & Bujard,1992, Proc. Natl. Acad. Sci. USA, 89:5547; Oligino et al., 1998, Gene Ther., 5:491-496; Wang et al., 1997, Gene Ther., 4:432-441; Neering et al., 1996, Blood, 88:1147-55; 및 Rendahl et al., 1998, Nat. Biotechnol., 16:757-761] 참조).
프로모터에 더하여, 발현 벡터는 통상적으로, 원핵 또는 진핵 숙주 세포에서 핵산의 발현에 필요한 모든 추가의 요소를 함유하는 전사 단위 또는 발현 카세트를 함유한다. 통상적인 발현 카세트는 따라서, 예를 들어, Cas9 변이체를 인코딩하는 핵산 서열에 작동 가능하게 연결된 프로모터 및 예를 들어, 전사체의 효율적인 폴리아데닐화, 전사 종결, 리보솜 결합 부위 또는 번역 종결에 필요한 임의의 신호를 함유한다. 카세트의 추가의 요소는, 예를 들어 인핸서 및 이종 스플라이싱 인트론 신호(heterologous spliced intronic signal)를 포함할 수 있다.
세포로 유전자 정보를 수송하기 위해 사용되는 특정 발현 벡터는 Cas9 변이체의 의도된 용도, 예를 들어, 식물, 동물, 박테리아, 진균, 원생동물 등에서의 발현을 고려하여 선택된다. 표준 박테리아 발현 벡터는 플라스미드, 예를 들어, pBR322 기반 플라스미드, pSKF, pET23D, 및 상업적으로 구입 가능한 태그-융합 발현 시스템, 예를 들어, GST 및 LacZ를 포함한다.
진핵생물 바이러스로부터의 조절 요소를 함유하는 발현 벡터는 종종 진핵생물 발현 벡터, 예를 들어, SV40 벡터, 파필로마 바이러스 벡터(papilloma virus vector) 및 Epstein-Barr 바이러스로부터 유래한 벡터에 사용된다. 다른 예시적 진핵생물 벡터는 pMSG, pAV009/A+, pMTO10/A+, pMAMneo-5, 바큘로바이러스 pDSVE, 및 SV40 초기 프로모터, SV40 후기 프로모터, 메탈로티오네인 프로모터, 뮤린 유방 종양 바이러스 프로모터, 라우스 육종 바이러스 프로모터(Rous sarcoma virus promoter), 폴리헤드린 프로모터, 또는 진핵세포에서의 발현에 효과적인 것으로 밝혀진 다른 프로모터의 유도 하에, 단백질의 발현을 가능하게 하는 임의의 다른 벡터를 포함한다.
Cas9 변이체를 발현시키기 위한 벡터는, 가이드 RNA의 발현을 유도하는 RNA Pol III 프로모터, 예를 들어, H1, U6 또는 7SK 프로모터를 포함할 수 있다. 이들 인간 프로모터는 플라스미드 형질감염 후, 포유류 세포에서 Cas9 변이체의 발현을 가능하게 한다.
일부 발현 시스템은 안정적으로 형질감염된 세포주의 선택을 위한 마커, 예를 들어, 티미딘 키나제, 하이그로마이신 B 인산전달효소(hygromycin B phosphotransferase) 및 디히드로엽산 환원효소(dihydrofolate reductase)를 갖는다. 폴리헤드린 프로모터 또는 다른 강력한 바큘로바이러스 프로모터의 유도 하에, gRNA 인코딩 서열을 갖는 곤충 세포에서 바큘로바이러스 벡터를 사용하는 것과 같은 고수율 발현 시스템이 또한 적합하다.
발현 벡터에 통상적으로 포함되는 요소는 또한, E. 콜라이에서 기능하는 레플리콘(replicon), 재조합 플라스미드를 보유하는 박테리아의 선택을 가능하게 하는 항생제 내성을 인코딩하는 유전자 및 재조합 서열의 삽입을 가능하게 하는 플라스미드의 비필수 영역의 고유 제한 부위를 포함한다.
표준 형질감염 방법을 사용하여, 다량의 단백질을 발현하는 박테리아, 포유류, 효모 또는 곤충 세포를 생성한 후, 표준 기법을 사용하여 정제한다(문헌[Colley et al., 1989, J. Biol. Chem., 264:17619-22; Guideto Protein Purification,in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)] 참조). 진핵세포 및 원핵세포의 형질전환은 표준 기법에 따라 수행된다(예를 들어, 문헌[Morrison, 1977, J. Bacteriol. 132:349-351; Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362(Wu et al., eds, 1983] 참조).
외래 뉴클레오타이드 서열을 숙주 세포로 도입하기 위한 공지된 절차 중 임의의 것이 사용될 수 있다. 이는, 인산칼슘 형질감염, 폴리브렌(polybrene), 원형질체 융합, 전기천공, 뉴클레오펙션(nucleofection), 리포좀, 미세주입, 네이키드 DNA(naked DNA), 에피솜 및 혼입형 둘 모두의 경우의 플라스미드 벡터, 바이러스 벡터의 사용 및, 클로닝된 게놈 DNA , cDNA, 합성 DNA 또는 다른 외래 유전자 물질을 숙주 세포로 도입하기 위한 임의의 다른 널리 공지된 방법을 포함한다(예를 들어, 전술된 문헌[Sambrook et al.] 참조). 단지, 사용되는 특정 유전자 조작 절차는, Cas9 변이체를 발현할 수 있는 숙주 세포로 적어도 하나의 유전자를 성공적으로 도입시킬 수 있을 필요가 있다.
본 방법은 또한, Cas9 단백질을 인코딩하는 mRNA에 더하여, gRNA를 도입시킴에 의한 것뿐만 아니라, 리보핵 단백질(RNP) 복합체로서 gRNA를 갖는 정제된 Cas9 단백질을 세포로 도입시킴으로써, gDNA를 변형하는 단계를 포함한다. gRNA는 합성 gRNA 또는 가이드 RNA를 인코딩하는 핵산(예를 들어, 발현 벡터 내)일 수 있다.
본 발명은 또한 벡터 및 벡터를 포함하는 세포를 포함한다.
실시예
본 발명은 하기의 실시예에서 추가로 기재되며, 이는 청구범위에 기재된 본 발명의 범위를 제한하지 않는다.
방법
진화하는
SpCas9 변이체에
대한 박테리아 기반 양성 선택 분석
양성 선택 플라스미드(표적 부위가 내재됨)를 함유하는 경쟁적 E. 콜라이 BW25141(λDE3)23을 Cas9/sgRNA-인코딩 플라스미드에 의해 형질전환시켰다. SOB 배지 중에서의 회수 60분 후에, 클로람페니콜(chloramphenicol)(비선택성) 또는 클로람페니콜 + 10 mM 아라비노스(arabinose)(선택성)를 함유하는 LB 플레이트에 형질전환된 것을 플레이팅하였다.
게놈 전체 표적 특이성에 주요할 수 있는 추가의 위치를 확인하기 위해, 호밍 엔도뉴클레아제(homing endonuclease)의 특성을 연구하기 위해 종래에 사용된 박테리아 선택 시스템(이하, 양성 선택법으로 지칭됨)(문헌[Chen & Zhao, NucleicAcids Res 33, e154 (2005); Doyon et al., J Am Chem Soc 128, 2477-2484 (2006)])을 채용하였다.
이 시스템을 본 발명에 채용하는 경우, 유도성 독성 유전자를 인코딩하는 양성 선택 플라스미드의 Cas9-매개 절단은, 선형화된 플라스미드의 후속 분해 및 손실로 인해, 세포 생존을 가능하게 한다. SpCas9가 양성 선택 시스템에서 기능할 수 있도록 하는 단계를 달성한 후, 야생형 및 변이체 둘 모두를, 공지의 인간 게놈으로부터 선택된 표적 부위를 보유하는 선택 플라스미드를 절단하는 능력에 대해 시험하였다. 이들 변이체를 표적 부위를 함유하는 양성 선택 플라스미드를 갖는 박테리아로 도입시키고, 선택 배지에 플레이팅하였다. 생존 빈도: 선택성 플레이트 상의 콜로니 / 비선택성 플레이트 상의 콜로니를 계산함으로써, 양성 선택 플라스미드의 절단을 추산하였다(도 1, 도 5 내지 도 6 참조).
본 연구에 사용된 플라스미드의 하위세트(서열은 하기에서 제시됨)
인간 세포 배양 및 형질감염
항시적으로 발현되는 EGFP-PEST 리포터 유전자15의 단일 혼입 카피를 보유하는 U2OS.EGFP 세포를 37℃, 5% CO2에서 10% FBS, 2 mM GlutaMax(Life Technologies), 페니실린/스트렙토마이신, 및 400 μg/ml의 G418이 보충된 보강 DMEM 배지(Life Technologies) 중에서 배양하였다. 제조사의 프로토콜에 따라, (달리 언급되지 않는 한) Lonza 4D-nucleofector의 DN-100 프로그램을 사용하여, 750 ng의 Cas9 플라스미드 및 250 ng의 sgRNA 플라스미드에 의해, 세포를 공동 형질감염시켰다. 빈 U6 프로모터 플라스미드에 의해 함께 형질감염된 Cas9 플라스미드를 모든 인간 세포 실험의 음성 대조군으로서 사용하였다(도 2, 도 7 내지 도 10 참조).
인간 세포 EGFP 파괴 분석
EGFP 파괴 실험을 종래에 기재된 바와 같이 수행하였다16. 형질감염된 세포를 Fortessa 유동세포계측기(BD Biosciences)를 사용하여, 형질감염으로부터 약 52시간 후 EGFP 발현에 대해 분석하였다. 백그라운드 EGFP 손실은 모든 실험에서 대략 2.5%에서 게이팅(gating)되었다(도 2, 도 7 참조).
뉴클레아제-유도 돌연변이 비율을 정량화하기 위한
T7E1 분석, 표적화된
심층 서열분석 및 GUIDE-서열
T7E1 분석을 인간 세포에 대해 종래에 기재된 바와 같이 수행하였다(문헌[Kleinstiver, B.P. et al., Nature 523, 481-485(2015)]). U2OS.EGFP 인간 세포에서, Agencourt DNAdvance 게놈 DNA 단리 키트(Beckman Coulter Genomics)를 사용하여, 형질감염으로부터 약 72시간 후에, 형질감염된 세포로부터 게놈 DNA를 추출하였다. 대략 200 ng의 정제된 PCR 산물을 T7E1(New England BioLabs)을 사용하여, 변성시키고, 어닐링(annealing)시키고, 분해시켰다. 인간 세포에 대해 종래 기재된 바와 같이(문헌[Kleinstiver et al., Nature 523, 481-485(2015); Reyon et al, . Nat Biotechnol 30, 460-465(2012)]), Qiaxcel 모세관 전기영동 장비(QIagen)를 사용하여, 돌연변이유발 빈도를 정량화하였다.
GUIDE-서열 실험을 종래에 기재된 바와 같이 수행하였다(문헌[Tsai et al., Nat Biotechnol 33, 187-197(2015)]). 간략히 말하면, 전술된 바와 같이, Cas9 및 sgRNA 발현 플라스미드와 함께 Cas9 뉴클레아제를 사용하여, 인산화된 포스포로티오에이트-변형된 이중 가닥 올리고데옥시뉴클레오타이드(dsODN)를 U2OS 세포로 형질감염시켰다. DSB 활성을 함유하는 게놈 구간을 확인하기 위해, dsODN-특이적 증폭, 고-처리량 서열분석 및 맵핑(mapping)을 수행하였다. 야생형 대 이중 또는 사중 돌연변이체 변이체 실험에서, 샘플들 사이의 서열분석 심도 차 보정을 위해, 표적외 판독 계수를 표적내 판독 계수로 정규화하였다. 이어서, 야생형 및 변이체 SpCas9의 정규화된 비율을 비교하여, 표적외 부위에서 활성의 변화 배수를 계산하였다. GUIDE-서열에 대해 야생형 및 SpCas9 변이체 샘플이 의도된 표적 부위에서 유사한 올리고 태그 혼입 비율을 갖는지 여부를 결정하기 위해, Phusion Hot-Start Flex에 의해, 100 ng의 게놈 DNA(전술된 바와 같이 단리됨)로부터 의도된 표적 좌위를 증폭시킴으로써, 제한 단편 길이 다형성(RFLP) 분석을 수행하였다. 대략 150 ng의 PCR 산물을 37℃에서 3시간 동안 20 U의 NdeI(New England BioLabs)에 의해 분해한 후, Agencourt Ampure XP 키트를 사용하여 세정하였다. Qiaxcel 모세관 전기영동 장비(QIagen)를 사용하여, RFLP 결과를 정량화함으로써, 올리고 태그 혼입 비율을 추산하였다. T7E1 분석을 유사한 목적으로 전술된 바와 같이 수행하였다.
실시예
1
CRISPR-Cas9 RNA 가이드 유전자 편집의 표적화 특이성을 처리하기 위한 한가지 가능한 해결책은 신규한 돌연변이에 의해 Cas9 변이체를 조작하는 것일 것이다.
이러한 이전의 결과를 기반으로 하여, DNA 상의 포스페이트 기와의 결합 또는 DNA와의 소수성 또는 염기 중첩 상호작용에 의해 매개되는, DNA에 대한 Cas9의 비특이적 결합 친화도를 감소시킴으로써, CRISPR-Cas9 뉴클레아제의 특이성이 유의하게 증대될 것으로 가정하였다(이론에 결부시키고자 하는 것은 아님). 이러한 접근법은, 종래 기재된 절두된 gRNA 접근법에서와 같이, gRNA/Cas9 복합체에 의해 인식되는 표적 부위의 길이를 저하시키지 않는 이점을 갖는다. 이는, DNA에 대한 Cas9의 비특이적 결합 친화도가 표적 DNA 상의 포스페이트 기와 접촉하는 아미노산 잔기를 돌연변이시킴으로써, 감소될 것이기 때문이다.
유사한 접근법이 TALEN과 같은 비-Cas9 뉴클레아제의 변이체를 생성하기 위해 사용되어 왔다(예를 들어, 문헌[Guilinger et al., Nat. Methods. 11: 429(2014)] 참조).
이러한 가정의 초기 시험에서, 본 발명자들은, DNA 백본 상의 포스페이트와 상호작용할 것으로 예상되는 SpCas9의 다양한 잔기로 개개의 알라닌 치환을 도입함으로써, 광범위하게 사용되는 S. 피오게네스 Cas9(SpCas9)의 감소된 친화도 변이체를 조작하고자 시도하였다. E. 콜라이-기반 스크리닝 분석을 이들 변이체의 활성을 평가하기 위해 사용하였다(문헌[Kleinstiver et al., Nature. 2015 Jul 23;523(7561):481-5]). 이러한 박테리아 시스템에서, 세포 생존은, gRNA 및 SpCas9에 의해 표적화되는 23개의 염기쌍 서열 및 독성 자이라제 독 ccdB의 유전자를 함유하는 선택 플라스미드의 절단(및, 후속 파열)에 좌우되었다. 이 실험의 결과에 의해, 활성을 보유하였거나, 손실한 잔기가 확인되었다(표 1).
[표 1]
50 내지 100%의 생존율은 일반적으로 강력한 절단을 시사하였으며, 0%의 생존은 효소가 기능적으로 손실되었음을 시사하였다. 박테리아에서 분석된 추가의 돌연변이(그러나, 상기 표에 제시되지 않음)는 R69A, R71A, Y72A, R75A, K76A, N77A, R115A, H160A, K163A, L169A, T404A, F405A, R447A, I448A, Y450A, S460A, M495A, M694A, H698A, Y1013A, V1015A, R1122A, K1123A, 및 K1124A를 포함한다. (박테리아에서 5% 미만의 생존을 나타낸) R69A 및 F405A를 제외하고, 이들 추가의 단일 돌연변이 모두는 SpCas9의 표적내 활성에 영향을 주지 않는 것으로 나타났다(박테리아 스크린에서 70% 초과의 생존).
N497A, R661A, Q695A, 및 Q926A 돌연변이의 모든 가능한 단일, 이중, 삼중 및 사중 조합을 보유하는 15개의 상이한 SpCas9 변이체를, 이들 잔기에 의해 이루어지는 접촉이 표적내 활성에 비필수적인지 여부를 시험하기 위해, 작제하였다(도 1b). 이 실험에서, 단일 혼입 EGFP 리포터 유전자 내의 비상동성 말단-결합(NHEJ)-매개 수리에 의한 삽입 또는 결실 돌연변이(삽입결실)의 절단 및 유도가 세포 형광의 손실을 야기하는 종래 기재된 인간 세포-기반 분석을 사용하였다(문헌[Reyon, D. et al., Nat Biotechnol. 30, 460-465, 2012]). 야생형 SpCas9와 쌍을 형성하는 경우, 인간 세포에서 EGFP 발현을 효율적으로 파괴하는 것으로 이전에 밝혀진 EGFP-표적화된 sgRNA(문헌[Fu, Y. et al., Nat Biotechnol 31, 822-826(2013))를 사용한 경우, 15개의 SpCas9 변이체 모두가 야생형 SpCas9와 근사한 EGFP 파괴 활성을 보유하였다(도 1b, 회색 막대). 따라서, 이들 잔기 중 하나 또는 전부의 치환은 EGFP-표적화된 sgRNA에 의한 SpCas9의 표적내 절단 효율을 감소시키지 않았다.
다음으로, 미스매치된 표적 부위에서의 15개의 SpCas9 변이체 모두의 상대 활성을 평가하기 위한 실험을 수행하였다. 이를 위해, 위치 13 및 14, 15 및 16, 17 및 18, 및 18 및 19(PAM-최근위 염기를 1로 시작하여, PAM-최원위 염기를 20으로 종결하여 넘버링함; 도 1b)에서 치환된 염기쌍을 함유하는, 이전 실험에서 사용된 EGFP-표적화된 sgRNA의 유도체를 사용하여, EGFP 파괴 분석을 반복하였다. 이 분석에 의해, 삼중 돌연변이체(R661A/Q695A/Q926A) 및 사중 돌연변이체(N497A/R661A/Q695A/Q926A) 둘 모두 중 하나가 미스매치된 sgRNA 4개 모두에 의한 백그라운드와 등가의 EGFP 파괴 수준을 나타내는 것으로 밝혀졌다(도 1b, 채색 막대). 유의하게는, 15개의 변이체 중, 미스매치된 sgRNA와의 최저 활성을 보유하는 변이체는 모두 Q695A 및 Q926A 돌연변이를 보유하였다. 이들 결과 및 또 다른 EGFP 표적 부위에 대한 sgRNA를 사용한 실험으로부터의 유사한 결과를 기반으로 하여, 사중 돌연변이체(N497A/R661A/Q695A/Q926A)를 추가 분석을 위해 선택하였으며, SpCas9 -HF1(고 신뢰도 변이체 #1의 경우)로서 지정하였다.
SpCas9
-HF1의
표적내
활성
다수의 표적내 부위에서 SpCas9-HF1 기능이 얼마나 강력한지를 결정하기 위해, 추가의 sgRNA를 사용하여, 이 변이체와 야생형 SpCas9 간의 직접 비교를 수행하였다. 총 37개의 상이한 sgRNA를 시험하였다: EGFP에 표적화된 24개(EGFP 파괴 분석에 의해 분석함) 및 내인성 인간 유전자 표적에 표적화된 13개(T7 엔도뉴클레아제 I(T7EI) 미스매치 분석에 의해 분석함). EGFP 파괴 분석에 의해 시험된 24개의 sgRNA 중 20개(도 1c) 및 내인성 인간 유전자 부위에서 시험된 13개의 sgRNA 중 12개(도 1d)는 동일한 sgRNA에 의한 야생형 SpCas9와 비교하여 적어도 70% 활성인 SpCas9-HF1에 의한 활성을 나타내었다(도 1e). 사실상, SpCas9-HF1은 대다수의 sgRNA에 의한 야생형 SpCas9와 매우 근사한 활성(90 내지 140%)을 나타내었다(도 1e). 시험된 37개의 sgRNA 중 3개는 본질적으로 SpCas9-HF1에 의한 활성을 나타내지 않았으며, 이들 표적 부위를 조사한 결과, 높은 활성으로 나타난 것과 비교하여, 이들 서열의 특성에 대해 어떠한 분명한 차이도 시사되지 않았다(표 3). 종합하면, SpCas9-HF1은 시험된 sgRNA의 86%(32/37)와 근사한 활성(야생형 SpCas9 활성의 70%를 초과함)을 보유하였다.
[표 3]
SpCas9
-HF1의 게놈-전체 특이성
인간 세포에서 SpCas9-HF1가 감소된 표적외 효과를 나타내었는지를 시험하기 위해, 서열분석(GUIDE-서열) 방법에 의해 가능한 이중 가닥 파손의 게놈-전체 비편향 확인을 사용하였다. GUIDE-서열은 이중가닥 파손으로의 짧은 이중가닥 올리고데옥시뉴클레오타이드(dsODN) 태그의 혼입을 사용하여, 임의의 특정 부위에 다수의 태그가 혼입된 인접 게놈 서열의 증폭 및 서열분석을 가능하게 하며, 절단 효율의 정량적 측정을 제공한다(문헌[Tsai, S.Q. et al, Nat Biotechnol 33, 187-197(2015)]). 내인성 인간 EMX1, FANCF, RUNX1, 및 ZSCAN2 유전자의 다양한 부위에 표적화된 8개의 상이한 sgRNA를 사용하여, 야생형 SpCas9 및 SpCas9-HF1에 의해 유도되는 표적외 효과의 스펙트럼을 비교하기 위해, GUIDE-서열을 사용하였다. 이들 sgRNA에 의해 표적화되는 서열은 고유하며, 기준 인간 게놈에 다양한 수의 예측된 미스매치 부위를 갖는다(표 2). 8개의 sgRNA에 대한 표적내 dsODN 태그 혼입 평가(제한 단편 길이 다형성(RFLP) 분석) 및 삽입결실 형성 평가(T7EI 분석)는 야생형 SpCas9 및 SpCas9-HF1와 근사한 표적내 활성을 나타내었다(각각 도 7a 및 도 7b). GUIDE-서열 실험은, 8개의 sgRNA 중 7개가 다수의 게놈-전체 표적외 부위(sgRNA당 2 내지 25개의 범위)에서 절단을 유도하였으며, 8개의 sgRNA(FANCF 부위 4의 경우)는 임의의 검출 가능한 표적외 부위를 생성하지 않았음을 나타내었다(도 2a 및 도 2b). 그러나, 야생형 SpCas9에 의해 삽입결실을 유도하는 7개의 sgRNA 중 6개는 SpCas9-HF1에 의한 GUIDE-서열 검출 가능한 표적외 이벤트의 상당 정도의 완전한 부재를 나타내었으며(도 2a 및 도 2b); 나머지 7개의 sgRNA(FANCF 부위 2의 경우)는, 프로토스페이서 종자 서열 내에 하나의 미스매치를 보유하는 부위에서 단지 단일의 검출 가능한 게놈-전체 표적외 절단 이벤트를 유도하였다(도 2a). 종합하면, SpCas9-HF1을 사용하는 경우, 검출되지 않았던 표적외 부위는 프로토스페이서 및/또는 PAM 서열에 1 내지 6개의 미스매치를 보유하였다(도 2c). 야생형 SpCas9와 같이, 8개의 sgRNA(FANCF 부위 4의 경우)는, SpCas9-HF1에 의해 시험한 경우, 임의의 검출 가능한 표적외 절단 이벤트를 생성하지 않았다(도 2a).
GUIDE-서열 결과를 확인하기 위해, 표적화된 앰플리콘 서열분석을 사용하여, 야생형 SpCas9 및 SpCas9-HF1에 의해 유도되는 NHEJ-매개 삽입결실 돌연변이의 빈도를 보다 직접적으로 측정하였다. 이들 실험에서, 인간 세포를 단지 sgRNA- 및 Cas9-인코딩 플라스미드만으로 (즉, GUIDE-서열 태그 없이) 형질감염시켰다. 이어서, 차세대 서열분석을 사용하여, GUIDE-서열 실험에서 6개의 sgRNA에 대해 야생형 SpCas9에 의해 확인된 40개의 표적외 부위 중 36개를 조사하였다(40개의 부위 중 4개는, 게놈 DNA로부터 특이적으로 증폭될 수 없으므로, 조사할 수 없었음). 이러한 심층 서열분석 실험은: (1) 야생형 SpCas9 및 SpCas9-HF1이 6개의 sgRNA 표적내 부위 각각에서 근사한 빈도의 삽입결실을 유도하고(도 3a 및 도 3b); (2) 야생형 SpCas9는, 예상된 바와 같이, 36개의 표적외 부위 중 35개에서, 이들 동일 부위에 대한 GUIDE-서열 판독 계수와 적절한 상관관계에 있는 빈도로(도 3c), 통계적으로 유의한 삽입결실 돌연변이의 증거를 나타내었으며(도 3b); (3) 36개의 표적외 부위 중 34개에서 SpCas9-HF1에 의해 유도되는 삽입결실의 빈도는 대조군 형질감염으로부터의 샘플에서 관찰된 삽입결실의 백그라운드 수준과 구별 불가능함(도 3b)을 나타내었다. 음성 대조군과 비교하여, SpCas9-HF1에 의해 통계적으로 유의한 돌연변이 빈도를 갖는 것으로 나타난 2개의 표적외 부위의 경우, 삽입결실의 평균 빈도는 0.049% 및 0.037%이었으며, 이는, 이들이 서열분석/PCR 오류로 인한 것인지, 또는 진정한 뉴클레아제-유도 삽입결실인지를 결정하기 어려운 수준이다. 이러한 결과를 기반으로, SpCas9-HF1이, 야생형 SpCas9와 상이한 빈도의 범위에 걸쳐 검출 불가능한 수준으로 발생하는 표적외 돌연변이를 완전히, 또는 거의 완전히 감소시킬 수 있는 것으로 결론지었다.
그런 다음, 통상적인 호모폴리머(homopolymer) 또는 반복 서열을 표적화하는 sgRNA의 게놈-전체 표적외 효과를 감소시키는 SpCas9-HF1의 능력을 평가하였다. 게놈에 대한 직교성의 상대적 결핍으로 인해, 이러한 특성을 갖는 표적내 부위를 피하기 위한 많은 시도가 현재 이루어지고 있으나, SpCas9-HF1이 이들 유발 표적에 대해서도 표적외 삽입결실을 감소시킬 수 있는지에 대한 조사가 요망되었다. 따라서, 인간 VEGFA 유전자에서 시토신-풍부 호모폴리머 서열 또는 다수의 TG 반복을 함유하는 서열(각각 VEGFA 부위 2 및 VEGFA 부위 3)을 표적화하는, 이미 특성화된 sgRNA(문헌[Fu, Y. et al., Nat Biotechnol 31, Tsai, S.Q. et al., Nat Biotechnol 33, 187-197(2015)]를 사용하였다(표 2). 대조군 실험에서, 각각의 이들 sgRNA는 야생형 SpCas9 및 SpCas9-HF1 둘 모두와 근사한 수준의 GUIDE-서열 ds ODN 태그 혼입(도 7c) 및 삽입결실 돌연변이(도 7d)를 유도하였으며, 이는, SpCas9-HF1이 이들 sgRNA 중 어느 것에서도 표적내 활성이 손상되지 않았음을 시사한다. 중요하게는, GUIDE-서열 실험에 의해, SpCas9-HF1이 이들 sgRNA의 표적외 부위를 감소시키는 데 매우 효과적이라는 것이 밝혀졌으며, VEGFA 부위 2의 경우, 123/144 부위가, VEGFA 부위 3의 경우, 31/32 부위가 검출되지 않았다(도 4a 및 도 4b). SpCas9-HF1에 의해 검출되지 않은 이들 표적외 부위에 대한 조사에 따르면, 이들 각각이 프로토스페이서 및 PAM 서열 내에 일정한 범위의 총 미스매치로서: VEGFA 부위 2 sgRNA의 경우, 2 내지 7개의 미스매치 및 VEGFA 부위 3 sgRNA의 경우, 1 내지 4개의 미스매치를 보유하며(도 4c); 또한, VEGFA 부위 2의 이들 표적외 부위 중 9개는 sgRNA-DNA 경계면에서 잠재적인 벌지 염기(bulged base)(문헌[Lin, Y. et al,. NucleicAcids Res 42, 7473-7485 (2014)]를 가질 수 있는 것으로 나타났다(도 4a 및 도 8). SpCas9-HF1에 의해 검출되지 않은 부위는 VEGFA 부위 2 sgRNA의 경우, 2 내지 6개의 미스매치를, VEGFA 부위 3 sgRNA의 경우, 단일 부위에서 2개의 미스매치를 보유하며(도 4c), VEGFA 부위 2 sgRNA의 3개의 표적외 부위는 다시 잠재적 벌지를 갖는다(도 8). 종합하면, 이들 결과에 따르면, SpCas9-HF1은, 단순 반복 서열에 표적화된 sgRNA의 표적외 효과의 감소에 매우 효과적일 수 있으며, 또한, 호모폴리머 서열에 표적화된 sgRNA에 대해 실질적인 영향을 줄 수 있음이 입증되었다.
[표 2]
GUIDE-서열에 의해 조사된 10개의 sgRNA에 대한 기준 인간 게놈에서의 잠재적 미스매치 부위의 정리
* Cas-OFFinder(문헌[Bae et al., Bioinformatics 30, 1473-1475 (2014)])를 사용하여 결정됨
[표 4]
SpCas9
-HF1의 특이성에 대한 재정의
종래에 기재된 방법, 예를 들어 절두된 gRNA(문헌[Fu, Y. et al., Nat Biotechnol 32, 279-284(2014)) 및 SpCas9-D1135E 변이체(문헌[Kleinstiver, B.P. et al., Nature 523, 481-485(2015)])는 SpCas9 표적외 효과를 부분적으로 감소시킬 수 있으며, 본 발명자들은, 이것이 SpCas9-HF1과 조합되어, 게놈-전체 특이성을 추가로 개선할 수 있는지에 대한 궁금증이 들었다. 인간 세포-기반 EGFP 파괴 분석에서, 4개의 부위에 표적화된, 전장 매치된 절두된 sgRNA에 의한 SpCas9-HF1의 시험에 의하면, sgRNA의 상보성 길이를 단축시키는 경우, 표적내 활성이 현저히 손상되는 것으로 밝혀졌다(도 9). 반대로, 추가의 D1135E 돌연변이를 갖는 SpCas9-HF1(본 명세서에서 SpCas9-HF2로 지칭되는 변이체)은 인간 세포-기반 EGFP 파괴 분석을 사용하여 시험된 8개의 sgRNA 중 6개에 의해, 야생형 SpCas9의 70% 이상의 활성을 보유하였다(도 5a 및 도 5b). 또한, PAM 근위 말단에서 측쇄가 표적 DNA와의 소수성 비특이적 상호작용을 매개하는 위치에서, 각각 L169A 또는 Y450A 돌연변이를 보유하는 SpCas9-HF3 및 SpCas9-HF4 변이체가 생성되었다(문헌[Nishimasu, H. et al., Cell 156, 935-949 (2014); Jiang, F., et al., Science 348, 1477-1481 (2015)]). SpCas9-HF3 및 SpCas9-HF4는 8개의 EGFP-표적화된 sgRNA 중 동일한 6개에 의해, 야생형 SpCas9에서 관찰된 활성의 70% 이상을 보유하였다(도 5a 및 도 5b).
SpCas9-HF2, -HF3, 및 -HF4가, SpCas9-HF1에 내성인 2개의 표적외 부위(FANCF 부위 2 및 VEGFA 부위 3 sgRNA)에서 삽입결실 빈도를 감소시킬 수 있는지를 결정하기 위해, 추가의 실험을 수행하였다. 프로토스페이서의 종자 서열에서 단일 미스매치를 보유하는 FANCF 부위 2 표적외의 경우, SpCas9-HF4는 삽입결실 돌연변이 빈도를, T7EI 분석에 의해 평가된 바와 같이, 거의 백그라운드 수준으로 감소시켰고, 이는 또한, 표적내 활성을 유리하게 증대시켰으며(도 5c), 3개의 변이체 중 최대의 특이성 증대를 야기하였다(도 5d). 2개의 프로토스페이서 미스매치(하나는 종자 서열에, 다른 하나는 PAM 서열로부터 최원위의 뉴클레오타이드에 존재함)를 보유하는 VEGFA 부위 3 표적외 부위의 경우, SpCas9-HF2는 삽입결실 형성에서 최대 감소를 나타내었고, 표적내 돌연변이 효율에 대해 단지 중간 정도의 효과를 나타내었으며(도 5c), 이는 시험된 3개의 변이체 중 최대의 특이성 증대를 야기하였다(도 5d). 이를 종합하면, 이들 결과에 의해, 비특이적 DNA 접촉을 매개하거나, PAM 인식을 변이시킬 수 있는 추가의 돌연변이를 다른 잔기에 도입시킴으로써, SpCas9-HF1에 내성인 표적외 효과를 감소시킬 수 있는 가능성이 입증되었다.
SpCas9-HF4 및 SpCas9-HF2가 각각 FANCF 부위 2 및 VEGFA 부위 3 sgRNA의 표적외에 대해, SpCas9-HF1과 비교하여, 개선된 식별성을 갖는다는 것을 보여주는 전술된 T7E1 분석 결과를 일반화하기 위해, GUIDE-서열을 사용하여, 이들 변이체의 게놈-전체 특이성을 조사하였다. RFLP 분석을 사용하는 경우, SpCas9-HF4 및 SpCas9-HF2는 SpCas9-HF1과 유사한 표적내 활성을 가진 것으로 나타났으며, 이는 GUIDE-서열 태그 혼입율에 의해 분석된 바와 같다(도 5e). GUIDE-서열 데이터를 분석하자면, SpCas9-HF2 또는 SpCas9-HF4의 경우, 새로운 표적외 부위가 확인되지 않았다(도 5f). SpCas9-HF1과 비교하여, 모든 부위에서의 표적외 활성은 GUIDE-서열에 의해 검출 불가능해지거나, 실질적으로 저하되었다. SpCas9-HF1과 비교하여, SpCas9-HF4는, SpCas9-HF1의 특이성 개선에 대해 저항성으로 남아 있는 단일 FANCF 부위 2 표적외 부위에 대해 거의 26배 더 증대된 특이성을 가졌다(도 5f). SpCas9-HF2는 고빈도 VEGFA 부위 3 표적외에 대해, SpCas9-HF1과 비교하여, 거의 4배의 개선된 특이성을 가졌으며, 또한, 다른 저빈도 표적외 부위에서 GUIDE-서열에 의한 검출 가능한 이벤트를 급격하게 감소시키거나(38배 초과), 이를 제거하였다. 주목할 것은, SpCas9-HF1에서 확인된 저빈도 부위 중 3개의 게놈 위치는 종래에 특성화된 백그라운드 U20S 세포 파손 지점 핫스폿(hotspot)에 인접해 있다는 점이다. 종합하면, 이들 결과는, SpCas9-HF2 및 SpCas9-HF4 변이체가 SpCas9-HF1의 게놈-전체 특이성을 개선할 수 있다는 것을 시사한다.
표준 비 반복 표적 서열에 대해 설계된 sgRNA를 사용한 경우, SpCas9-HF1은 표적외 돌연변이를 강력하고, 일관되게 감소시켰다. SpCas9-HF1에 대해 가장 내성인 2개의 표적외 부위는 프로토스페이서에 단지 하나의 미스매치 및 2개의 미스매치를 갖는다. 종합하면, 이들 관찰 결과는, 게놈 내의 다른 부분에 하나 또는 2개의 미스매치를 보유하는 밀접 부위를 갖지 않는 비 반복 서열을 표적화하고, SpCas9-HF1을 사용함으로써, 표적외 돌연변이가 검출 불가능한 수준으로 최소화될 수 있음을 시사한다(일부 경우, 기존의 공개적으로 이용 가능한 소프트웨어 프로그램(문헌[Bae, S., et al, Bioinformatics 30, 1473-1475(2014)])을 사용하여 용이하게 달성될 수 있음). 사용자가 유념해야 할 한 가지 매개변수는, SpCas9-HF1이, 프로토스페이서 서열에 미스매치된 gRNA의 5' 말단의 구아닌을 이용하는 통상의 실행 방식과 호환될 수 없다는 것이다. 표적 부위에 미스매치된 5' 구아닌을 보유하는 4개의 sgRNA를 시험한 결과, 위의 4개 중 3개가 야생형 SpCas9와 비교하여, SpCas9-HF1에 의한 활성을 감소시키는 것으로 나타났으며(도 10), 이는, 예상컨대, 부분적으로 매치된 부위를 더 잘 식별하는 SpCas9-HF1의 능력을 반영한다.
추가의 생화학적 작업에 의해, SpCas9-HF1가 게놈-전체에 대해 고 특이성을 달성하는 정확한 메커니즘을 확인하거나, 명료화할 수 있다. 발현 플라스미드의 농도를 저하시킨 적정 실험에서, 야생형 SpCas9 및 SpCas9-HF1이, 농도가 저하된 경우와 유사하게 거동하는 것으로 보아, 도입된 4개의 돌연변이는 세포에서 SpCas9의 안정성 또는 정상 상태(steady state)의 발현 수준을 변이시키는 것으로 보이지 않는다(도 11). 그 대신, 메커니즘에 대해, 가장 단순한 설명은, 이들 돌연변이가 Cas9-sgRNA와 표적 DNA 사이의 상호작용의 에너지적 상태를 저하하여, 복합체의 에너지 수준이 표적내 활성의 보유에 필요한 수준 정도는 되나, 표적외 부위의 절단이 비효율적이 되거나, 부재하도록 할 수 있을 만큼의 낮은 수준이라는 것이다. 이러한 메커니즘은, 구조 데이터에서의 표적 DNA 포스페이트 백본과 돌연변이된 잔기 사이에 관찰되는 비특이적 상호작용과 일치한다(문헌[Nishimasu, H. et al., Cell 156, 935-949 (2014); Anders, C et. Al., Nature 513, 569-573 (2014)]). 양으로 하전된 잔기에서 치환을 보유하는 전사 활성인자형 효과기 뉴클레아제의 증대된 특이성을 설명하기 위해, 일부 유사한 메커니즘이 제안된 바 있다(문헌[Guilinger, J.P. et al., Nat Methods 11, 429-435(2014)]).
또한, SpCas9-HF1을, Cas9 기능을 변이시키는 것으로 밝혀진 다른 돌연변이와 조합하는 것이 가능하다. 예를 들어, 3개의 아미노산 치환을 보유하는 SpCas9 돌연변이체(D1135V/R1335Q/T1337R, 또한 SpCas9-VQR 변이체로 일컬어짐)는 NGAN PAM을 갖는 부위를 인식하며(상대 효율성은 NGAG>NGAT=NGAA>NGAC임)(문헌[Kleinstiver, B.P. et al, Nature 523, 481-485(2015)]), 최근 확인된 사중 SpCas9 돌연변이체(D1135V/G1218R/R1335Q/T1337R, SpCas9-VRQR 변이체로 지칭됨)는 NGAH(H = A, C, 또는 T) PAM을 갖는 부위에서 VQR 변이체와 비교하여, 개선된 활성을 갖는다(도 12a). SpCas9-VQR에 SpCas9-HF1로부터의 4개의 돌연변이(N497A/R661A/Q695A/Q926A)를 도입시킴으로써, 각각 SpCas9-VQR-HF1 및 SpCas9-VRQR-HF1을 생성시켰다. 이들 뉴클레아제의 HF 버젼 둘 모두는, 8개의 sgRNA 중 5개가 EGFP 리포터 유전자에 표적화되고, 8개의 sgRNA 중 7개가 내인성 인간 유전자 부위에 표적화된 비-HF 대응 대상과 유사한 표적내 활성(즉, 70% 이상)을 나타내었다(도 12b 내지 도 12d).
더욱 광범위하게는, 이들 결과는 CRISPR-관련 뉴클레아제의 추가의 고 신뢰도 변이체의 조작을 위한 일반 전략을 예시한다. 잔기와 접촉된 비특이적 DNA에 추가의 돌연변이를 첨가함으로써, SpCas9-HF1에 저항성인 매우 소수의 나머지 표적외 부위 중 일부를 추가로 감소시켰다. 따라서, SpCas9-HF2, SpCas9-HF3, SpCas9-HF4, 등과 같은 변이체는 표적외 서열의 특성에 따라 사용자 지정 방식으로 활용될 수 있다. 추가로, SpCas9의 고 신뢰도 변이체 조작의 성공은, 비특이적 DNA 접촉을 돌연변이시키는 접근법이, 빈도가 증대된 것으로 밝혀지고, 특성화된 더 최근의 CRISPR-관련 뉴클레아제(문헌[Zetsche, B. et al., Cell 163, 759-771 (2015); Shmakov, S. et al., Molecular Cell 60, 385-397])뿐만 아니라, 다른 천연 유래의 Cas9 이종상동체 및 조작된 Cas9 이종상동체(문헌[Ran, F.A. et al., Nature 520, 186-191 (2015), Esvelt, K.M. et al., Nat Methods 10, 1116-1121 (2013); Hou, Z. et al., Proc Natl Acad Sci U S A (2013); Fonfara, I. et al., NucleicAcids Res 42, 2577-2590 (2014); Kleinstiver, B.P. et al, Nat Biotechnol (2015)])에 연장될 수 있음을 시사한다.
실시예
2
본 명세서에서는, N497A, Q695A, R661A, 및 Q926A를 포함하는 표적 가닥 DNA와 접촉하는 잔기에 알라닌 치환을 갖는 SpCas9 변이체가 기재된다. 본 발명자들은, 이들 잔기 이외에, 비표적 DNA 가닥과 접촉하는 것으로 보이는 양으로 하전된 SpCas9 잔기에 치환을 첨가함으로써, 이들 변이체, 예를 들어, SpCas9-HF1 변이체(N497A/R661A/Q695A/Q926A)의 특이성이, 추가로 개선될 수 있는지를 결정하고자 하였다: R780, K810, R832, K848, K855, K968, R976, H982, K1003, K1014, K1047, 및/또는 R1060(문자[Slaymaker et al., Science. 2016 Jan 1;351(6268):84-8] 참조).
처음에, 이들 위치에 단일 알라닌 치환 및 이들의 조합을 보유하는 야생형 SpCas9 유도체의 활성을, EGFP 유전자의 일 부위에 설계된 완전히 매치된 sgRNA(표적내 활성을 평가하기 위함) 및, PAM-최근위 염기인 위치 1과 위치 11 및 12에서의 의도된 미스매치를 보유하는 동일한 sgRNA(미스매치된 부위에서의 활성을 평가하기 위한 것으로, 표적외 부위에서 발견되는 바와 같음)에 의해, EGFP 파괴 분석을 사용하여 시험하였다(도 13a). (삼중 치환 K810A/K1003A/R1060A 또는 K848A/K1003A/R1060A를 보유하는 변이체는 각각 eSpCas9(1.0) 및 eSpCas9(1.1)로 일컬어지는 최근 기재된 변이체와 동일함에 유의한다; 참조문헌 1 참조). 예상된 바와 같이, 야생형 SpCas9는 강력한 표적내 및 미스매치된-표적 활성을 가졌다. 본 발명자들은 또한, 이 실험에서 대조군으로서 SpCas9-HF1을 시험하였으며, 예상된 바와 같이, 이는 미스매치된-표적 활성이 감소하였으나, 표적내 활성을 보유한다는 것을 발견하였다(도 13a). 잠재적으로 비표적 DNA 가닥과 접촉할 수 있는 위치에서 하나 이상의 알라닌 치환을 보유하는 야생형 SpCas9 유도체 모두는 야생형 SpCas9와 유사한 표적내 활성을 나타내었다(도 13a). 흥미롭게도, 이들 유도체 중 일부는 또한 야생형 SpCas9에 의해 관찰되는 활성과 비교하여, 미스매치된 11/12 sgRNA에 의해 감소된 절단을 나타내었으며, 이는, 이들 유도체의 치환의 하위세트가 야생형 SpCas9와 비교하여, 이러한 미스매치된 부위에 대해 증대된 특이성을 부여한다는 것을 시사한다(도 13a). 그러나, 이들 단일 치환 또는 치환의 조합 중 어느 것도 11/12 미스매치된 sgRNA에서 관찰된 활성을 완전히 제거하기에 충분하지 않았다. 본 발명자들이 위치 9 및 10에서 미스매치를 보유하는 추가의 sgRNA를 사용하여, 야생형 SpCas9, SpCas9-HF1, 및 이들의 동일한 야생형 SpCas9 유도체를 시험하였을 때(도 13b), 대부분의 유도체의 경우, 미스매치된-표적 활성에서 단지 최소의 변화만이 관찰되었다. 다시 말하자면, 이는 이러한 잠재적 비표적 가닥 접촉 잔기에서의 단일, 이중 또는 심지어 삼중 치환(이전에 기재된 eSpCas9(1.0) 및 (1.1) 변이체와 동등함)이, 불완전하게 매치된 DNA 부위에서 활성을 제거하기에 불충하다는 것이 입증되었다. 종합하면, 이들 데이터는, 야생형 SpCas9 변이체가 매치된 sgRNA에 의한 표적내 활성을 보유하며, (야생형 SpCas9의 맥락에서) 그 자체로 이들 유도체에 함유된 치환이 2개의 상이한 미스매치된 DNA 부위에서 뉴클레아제 활성을 제거하기에 충분하지 않다는 것을 입증한다(도 13a 및 도 13b).
이러한 결과를 감안할 때, 비표적 DNA 가닥과 접촉할 수 있는 잔기에 하나 이상의 추가적 아미노산 치환을 보유하는 SpCas9-HF1 유도체가 모 SpCas9-HF1 단백질과 비교하여, 특이성을 추가로 개선할 수 있을 것으로 가정하였다. 따라서, 단일, 이중 또는 삼중 알라닌 치환의 조합을 보유하는 다양한 SpCas9-HF1-유도체를, 완전히 매치된 sgRNA(표적내 활성을 시험하기 위함) 및, 위치 11 및 12에서의 미스매치를 보유하는 동일한 sgRNA(미스매치된 표적 부위에서의 활성을 평가하기 위한 것으로, 표적외 부위에서 발견되는 바와 같음)를 사용하여, 인간 세포-기반 EGFP 파괴 분석에서 시험하였다. 이들 sgRNA는 도 13a 및 도 13b에 사용된 것과 동일한 것이다. 이 실험에 의해, 본 발명자들이 시험한 SpCas9-HF1-유도체 변이체 대부분이 야생형 SpCas9 및 SpCas9-HF1 둘 모두에 의해 관찰된 것과 유사한 표적내 활성을 나타내는 것으로 밝혀졌다(도 14a). 11/12 미스매치된 sgRNA에 의한 경우, 시험된 일부 SpCas9-HF1 유도체(예를 들어, SpCas9-HF1 + R832A 및 SpCas9-HF1 + K1014A)는 미스매치된 sgRNA에 의해, 절단에서 현저한 변화를 나타내지 않았다. 그러나, 중요하게는, 대부분의 SpCas9-HF1 유도체는, SpCas9-HF1, eSpCas9(1.0), 또는 eSpCas9(1.1)에 의해 관찰된 것보다 11/12 미스매치된 sgRNA에 의해 실질적으로 더 낮은 활성을 가졌으며, 이는, 이들 신규한 변이체의 특정 조합이 감소된 미스매치된-표적 활성을 가지며, 따라서 개선된 특이성을 가짐을 시사한다(도 14a). 11/12 미스매치된 sgRNA에 의한 미스매치된-표적 활성을 거의 백그라운드 수준으로 감소시키는 16개의 SpCas9-HF1 유도체 중 9개가 표적내 활성에 대해 단지 최소의 효과만을 가진 것으로 나타났다(완전히 매치된 sgRNA를 사용하여 평가됨; 도 14a). 위치 9 및 10에서 의도적으로 미스매치된 sgRNA를 사용한 EGFP 파괴 분석에서의 이들 SpCas9-HF1 유도체의 하위세트의 추가의 시험(도 14b)은 또한, 이들 변이체가 SpCas9-HF1(도 14b), eSpCas9(1.1)(도 13a), 또는 야생형 SpCas9 뉴클레아제에 첨가된 동일한 치환(도 13b)에 의해 관찰된 것보다 이러한 미스매치된 sgRNA에 의해 더 낮은 활성을 보유하였음을 밝혀내었다. 중요하게는, 9/10 미스매치된 sgRNA에 의한 이러한 분석에서 5개의 변이체가 백그라운드 수준의 표적외 활성을 나타내었다.
다음으로, 비표적 가닥의 이러한 알라닌 치환이, 본 발명자들의 SpCas9-HF1 변이체(본 명세서의 "이중" 변이체)로부터의 Q695A 및 Q926A 치환만을 함유하는 SpCas9 변이체와 조합될 수 있는지를 시험하였다. 상기에서 시험된 많은 HF1 유도체가 표적내 활성에서 관찰 가능한(또한, 바람직하지 않은) 저하를 나타내므로, 하나 이상의 비표적 가닥 접촉 치환과 SpCas9-HF1로부터의 2개의 가장 중요한 치환(Q695A 및 Q926A; 도 1b 참조)만을 조합하는 경우, 표적내 활성이 구제되나, 이들 치환이 SpCas9-HF1 변이체에 첨가된 경우에 관찰되는 특이성의 증대가 여전히 유지되는 것으로 가정하였다. 따라서, 잠재적 비표적 DNA 가닥 상호작용 위치에서 단일, 이중 또는 삼중 알라닌 치환의 조합을 보유하는 다양한 SpCas9(Q695A/Q926A) 유도체를, 전술된 EGFP에 표적화된 동일한 완전히 매치된 sgRNA(표적내 활성을 시험하기 위함) 및 도 13a 및 도 13b에 사용된 위치 11 및 12에 미스매치를 보유하는 동일한 sgRNA(미스매치된 표적 부위에서의 활성을 평가하기 위한 것으로, 표적외 부위에서 발견되는 바와 같음)를 사용하여, 인간 세포-기반 EGFP 파괴 분석에서 시험하였다. 이 실험에 의해, 시험된 대부분의 SpCas9(Q695A/Q926A) 유도체 변이체가 야생형 SpCas9 및 SpCas9-HF1 둘 모두에 의해 관찰된 것과 유사한 표적내 활성을 나타내는 것으로 밝혀졌다(도 15). 중요하게는, 많은 SpCas9-HF1 유도체는 SpCas9-HF1, eSpCas9(1.0), 또는 eSpCas9(1.1)에 의해 관찰된 것과 비교하여, 11/12 미스매치된 sgRNA에 의해 실질적으로 더 낮은 활성을 가지며, 이는, 이들 신규한 변이체의 특정 조합이 미스매치된-표적 활성을 감소시키고, 따라서 특이성을 개선한다는 것을 시사한다(도 15). 11/12 미스매치된 sgRNA에 의한 미스매치된-표적 활성을 거의 백그라운드 수준으로 감소시키는 13개의 SpCas9(Q695A/Q926A) 유도체 중 단지 하나만이 표적내 활성에 실질적인 효과를 갖는 것으로 나타났다(완전히 매치된 sgRNA를 사용하여 평가됨; 도 15).
전체적으로 볼 때, 이러한 데이터에 의하면, 비표적 DNA 가닥과 접촉되는 위치에서 SpCas9-HF1 또는 SpCas9(Q695A/Q926A)로의 1, 2 또는 3개의 알라닌 치환의 첨가가, (그의 모 클론 또는 최근 기재된 eSpCas9(1.0) 또는 (1.1)과 비교하여) 미스매치된 표적외 부위에 대해 식별되는 개선된 능력을 갖는 신규한 변이체를 야기할 수 있음이 입증된다. 중요하게는, 야생형 SpCas9의 맥락에서의 이러한 동일한 치환은 임의의 실질적인 특이성 이점을 제공하는 것으로 보이지 않는다.
sgRNA-표적 DNA 상보성 경계면에서의 미스매치에 대한 SpCas9-HF1 및 eSpCas9-1.1의 내성을 더 잘 정의하고, 비교하기 위해, 스페이서 상보성 영역의 모든 가능한 위치에 단일 미스매치를 함유하는 sgRNA를 사용하여, 그의 활성을 조사하였다. SpCas9-HF1 및 eSPCas9-1.1 변이체 둘 모두는, SpCas9-HF1이 eSpCas9-1.1을 능가하는 소수의 경우를 제외하고, 야생형 SpCas9와 비교하는 경우, 대부분의 단일 미스매치된 sgRNA에 대해 유사한 활성을 가졌다(도 16).
다음으로, 본 발명자들은, 표적 가닥 DNA와 접촉하거나, 비표적 가닥 DNA와 잠재적으로 접촉할 수 있는 잔기에 추가의 알라닌 치환을 갖는 이중 돌연변이체(Db = Q695A/Q926A), SpCas9-HF1(N497A/R661A/Q695A/Q926A), eSpCas9-1.0(1.0 = K810A/K1003A/R1060A), 또는 eSpCas9-1.1(1.1 = K848A/K1003A/R1060A)로부터의 아미노산 치환의 조합을 함유하는 일부 변이체의 단일 뉴클레오타이드 미스매치 내성을 시험하였다(도 17a 및 도 17b). 완전히 매치된 sgRNA를 사용하여, 표적내 활성을 평가하였으며, 스페이서 서열의 위치 4, 8, 12, 또는 16에 이러한 미스매치를 보유하는 sgRNA를 사용하여, 단일 뉴클레오타이드 미스매치 내성을 평가하였다(도 17a). 다수의 이들 변이체는, 미스매치된 sgRNA에 의해 관찰된 활성에 실질적인 감소를 갖는 표적내 활성을 유지하였다. 이들 변이체(Q695A/K848A/Q926A/K1003A/R1060A, N497A/R661A/Q695A/K855A/Q926A/R1060A, 및 N497A/R661A/Q695A/Q926A/H982A/R1060A) 중 3개를 나머지 단일 미스매치 sgRNA(위치 1 내지 3, 5 내지 7, 9 내지 11, 13 내지 15, 및 17 내지 20에서 미스매치를 함유함)에 의해 추가로 시험하였다. 이들 변이체는 eSpCas9-1.1과 비교하여, sgRNA에서 단일 뉴클레오타이드 치환에 대해 더욱 강력한 불내성(intolerance)을 나타내었으며, 이는 이들 신규한 변이체의 개선된 특이성 특성을 입증한다(도 17b). 아미노산 치환의 대안적 조합을 함유하는 추가의 변이체 뉴클레아제를 스페이서의 위치 5, 7, 및 9에 미스매치를 함유하는 sgRNA를 사용하여 시험하였다(이전의 변이체가 이들 위치의 미스매치에 대해 내성을 갖는 것으로 나타났으므로, 이들 특정의 미스매치된 sgRNA를 사용하였음)(도 18). 다수의 이들 뉴클레아제는 미스매치된 부위에 대해 개선된 특이성을 가졌으며, 표적내 활성에 단지 미미한 감소만을 나타내었다(도 18).
돌연변이의 추가의 조합이 특이성 개선을 가져올 수 있는지를 추가로 결정하기 위해, 추가로 2개의 매치된 sgRNA에 의한 뉴클레아제 변이체의 크게 확장된 패널을 시험함으로써, 본 발명자들의 EGFP 파괴 활성에서의 표적내 활성을 조사하였다(도 19a). 다수의 이들 변이체는 강력한 표적내 활성을 유지하였으며, 이는, 이들이 특이성에 대한 추가의 개선을 유발하는 데 유용할 수 있음을 시사한다(도 19b). 위치 12, 14, 16, 또는 18에서 단일 치환을 함유하는 sgRNA에 의해, 다수의 이들 변이체를 시험함으로써, 특이성 개선이 관찰되는지를 결정하였으며, 이들은 이들 위치에서 단일 뉴클레오타이드 미스매치에 대한 더 큰 불내성을 나타내는 것으로 밝혀졌다(도 19b).
실시예 3
본 발명자들이 SpCas9를 사용하여 실행한 바와 같이, 스타필로코커스 아우레우스 Cas9(SaCas9)에 의한 유사한 전략을 취하여, 표적 DNA 가닥과 접촉하는 것으로 인식되는 잔기(도 20 및 도 21a), 비표적 DNA와 접촉할 수 있는 잔기(진행중인 실험), 및 본 발명자들이 이전에, PAM 특이성에 영향을 줄 수 있다는 것을 밝혀낸 잔기(도 21b)에 알라닌 치환을 도입함으로써, SaCas9의 특이성을 개선하기 위한 실험을 수행하였다. 표적 가닥 DNA 백본과 접촉할 수 있는 잔기는 Y211, Y212, W229, Y230, R245, T392, N419, L446, Y651, 및 R654를 포함하고; 비표적 가닥 DNA와 접촉할 수 있는 잔기는 Q848, N492, Q495, R497, N498, R499, Q500, K518, K523, K525, H557, R561, K572, R634, R654, G655, N658, S662, N668, R686, K692, R694, H700, K751을 포함하며; PAM과 접촉할 수 있는 잔기는 E782, D786, T787, Y789, T882, K886, N888, A889, L909, K929, N985, N986, R991, 및 R1015를 포함한다. 예비 실험에서, 표적 가닥 DNA 접촉 잔기 또는 PAM 접촉 잔기(각각, 도 21a 및 도 21b)의 단일 알라닌 치환(또는, 이들의 일부 조합)은 표적내 EGFP 파괴 활성(완전히 매치된 sgRNA를 사용함)에 가변적인 효과를 나타내었으며, (위치 11 및 12에서 미스매치된 sgRNA를 사용하는 경우) 표적외 절단을 제거할 수 없었다. 놀랍게도, HF1에서의 SpCas9 돌연변이는 유사하게 미스매치된 표적/sgRNA 쌍에 의한 표적외 활성을 완전히 폐지할 수 없었으며, 이는, 표적 가닥/비표적 가닥 치환의 조합을 함유하는 변이체가 이러한 부위에서의 특이성 개선에 필요할 수 있다는 것을 시사한다(본 발명자들이 SpCas9에 의해 관찰한 바와 같음).
SaCas9 특이성을 개선하는, 잠재적 표적 가닥 DNA 접촉의 돌연변이 전략을 추가로 평가하기 위해, sgRNA의 위치 19 및 20에서의 미스매치에 내성을 갖는 돌연변이의 단일, 이중, 삼중 및 사중 조합의 가능성을 시험하였다(도 22a 및 도 22b). 이들 조합들에 의해, Y230 및 R245에서의 알라닌 치환이, 다른 치환과 조합되는 경우, 특이성을 증대시킬 수 있음이 밝혀졌으며, 이는 미스매치된 부위에 대한 더 우수한 식별 능력에 의해 평가되는 바와 같다.
다음으로, 이들 삼중 알라닌 치환 변이체 중 2개(Y211A/Y230A/R245A 및 Y212A/Y230A/R245A)의 표적내 유전자 파괴 활성을 EGFP의 4개의 표적내 부위(매치된 부위 #1 내지 4; 도 23)에서 조사하였다. 이들 변이체는 매치된 부위 1 및 2에 대해 강력한 표적내 활성을 유지하였으나, 매치된 부위 3 및 4의 경우, 표적내 활성의 대략 60 내지 70%의 손실을 나타내었다. 이들 삼중 알라닌 치환 변이체 둘 모두는 야생형 SaCas9와 비교하여, 특이성을 급격하게 개선하였으며, 이는 표적 부위 1 내지 4의 스페이서의 다양한 위치에서 이중 미스매치를 보유하는 sgRNA를 사용함으로써, 평가된 바와 같다(도 23).
이들 알라닌 치환의 이중 및 삼중 조합(각각, 도 24a 및 도 24b)을 보유하는 SaCas9 변이체를, 위치 21(식별되는 유발 미스매치로 예상되는 PAM 최원위 위치)에서 단일 미스매치를 함유하는 sgRNA를 사용하여 평가되는 표적 활성 및 특이성의 개선에 대해, 6개의 내인성 부위에서 시험하였다. 일부 경우, 매치된 sgRNA에 의한 표적내 활성이 변이체에 의해 유지되었으며, 위치 21에서 미스매치된 sgRNA에 의한 '표적외' 활성은 제거되었다(도 24a 및 도 24b). 다른 경우, 매치된 sgRNA에 의해, 활성의 완전한 손실에 대한 한계가 관찰되었다.
참조문헌
1.
Sander, J.D. & Joung, J.K. CRISPR-Cas systems for editing, regulating and targeting genomes. Nat Biotechnol 32, 347-355 (2014).
2.
Hsu, P.D., Lander, E.S. & Zhang, F. Development and applications of CRISPR-Cas9 for genome engineering. Cell 157, 1262-1278 (2014).
3.
Doudna, J.A. & Charpentier, E. Genome editing. The new frontier of genome engineering with CRISPR-Cas9. Science 346, 1258096 (2014).
4.
Barrangou, R. & May, A.P. Unraveling the potential of CRISPR-Cas9 for gene therapy. Expert Opin Biol Ther 15, 311-314 (2015).
5.
Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012).
6.
Sternberg, S.H., Redding, S., Jinek, M., Greene, E.C. & Doudna, J.A. DNA interrogation by the CRISPR RNA-guided endonuclease Cas9. Nature 507, 62-67 (2014).
7.
Hsu, P.D. et al. DNA targeting specificity of RNA-guided Cas9 nucleases.Nat Biotechnol 31, 827-832 (2013).
8.
Tsai, S.Q. et al. GUIDE-seq enables genome-wide profiling of off-target cleavage by CRISPR-Cas nucleases.Nat Biotechnol 33, 187-197 (2015).
9.
Hou, Z. et al. Efficient genome engineering in human pluripotent stem cells using Cas9 from Neisseria meningitidis. Proc Natl Acad Sci U S A (2013).
10.
Fonfara, I. et al. Phylogeny of Cas9 determines functional exchangeability of dual-RNA and Cas9 among orthologous type II CRISPR-Cas systems. Nucleic Acids Res 42, 2577-2590 (2014).
11.
Esvelt, K.M. et al. Orthogonal Cas9 proteins for RNA-guided gene regulation and editing. Nat Methods 10, 1116-1121 (2013).
12.
Cong, L. et al. Multiplex genome engineering using CRISPR/Cas systems. Science 339, 819-823 (2013).
13.
Horvath, P. et al. Diversity, activity, and evolution of CRISPR loci in Streptococcus thermophilus. J Bacteriol 190, 1401-1412 (2008).
14.
Anders, C., Niewoehner, O., Duerst,A. & Jinek, M. Structural basis of PAM-dependent target DNA recognition by the Cas9 endonuclease. Nature 513, 569-573 (2014).
15.
Reyon, D. et al. FLASH assembly of TALENs for high-throughput genome editing. Nat Biotechnol 30, 460-465 (2012).
16.
Fu,Y. et al. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells. Nat Biotechnol 31, 822-826 (2013).
17.
Chen, Z. & Zhao, H. A highly sensitive selection method for directed evolution of homing endonucleases. Nucleic Acids Res 33, e154 (2005).
18.
Doyon, J.B., Pattanayak, V., Meyer, C.B. & Liu, D.R. Directed evolution and substrate specificity profile of homing endonuclease I-SceI. J Am Chem Soc 128, 2477-2484 (2006).
19.
Jiang, W., Bikard, D., Cox, D., Zhang, F. & Marraffini, L.A. RNA-guided editing of bacterial genomes using CRISPR-Cas systems. Nat Biotechnol 31, 233-239 (2013).
20.
Mali, P. et al. RNA-guided human genome engineering via Cas9. Science 339, 823-826 (2013).
21.
Hwang, W.Y. et al. Efficient genome editing in zebrafish using a CRISPR-Cas system. Nat Biotechnol 31, 227-229 (2013).
22.
Chylinski, K., Le Rhun, A. & Charpentier, E. The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems. RNA Biol 10, 726-737 (2013).
23.
Kleinstiver, B.P., Fernandes, A.D., Gloor, G.B. & Edgell, D.R. A unified genetic, computational and experimental framework identifies functionally relevant residues of the homing endonuclease I-BmoI. Nucleic Acids Res 38, 2411-2427 (2010).
24.
Gagnon, J.A. et al. Efficient mutagenesis by Cas9 protein-mediated oligonucleotide insertion and large-scale assessment of single-guide RNAs. PLoS One 9, e98186 (2014).
서열
SEQ ID NO:271 - JDS246: CMV-T7-인간SpCas9-NLS-3xFLAG
인간 코돈 최적화된 S. 피오게네스 Cas9는 정상 글꼴이고, NLS는 이중 밑줄 그어졌으며, 3xFLAG 태그는 볼드체이다:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA
SEQ ID NO:272 - VP12: CMV-T7-인간SpCas9-HF1(N497A, R661A, Q695A, Q926A)-NLS-3xFLAG
인간 코돈 최적화된 S. 피오게네스 Cas9는 정상 글꼴이고, 변형된 코돈은 소문자이고, NLS는 이중 밑줄 그어졌으며, 3xFLAG 태그는 볼드체이다:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCgccTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGAgccTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGgccCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCgccATCACAAAGCATGTTGCGCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA
SEQ ID NO:273 - MSP2135: CMV-T7-인간SpCas9-HF2(N497A, R661A, Q695A, Q926A, D1135E)-NLS-3xFLAG
인간 코돈 최적화된 S. 피오게네스 Cas9는 정상 글꼴이고, 변형된 코돈은 소문자이고, NLS는 이중 밑줄 그어졌으며, 3xFLAG 태그는 볼드체이다:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCgccTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGAgccTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGgccCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCgccATCACAAAGCATGTTGCGCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCgagAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA
SEQ ID NO:274 - MSP2133: CMV-T7-인간SpCas9-HF4(Y450A, N497A, R661A, Q695A, Q926A)-NLS-3xFLAG
인간 코돈 최적화된 S. 피오게네스 Cas9는 정상 글꼴이고, 변형된 코돈은 소문자이고, NLS는 이중 밑줄 그어졌으며, 3xFLAG 태그는 볼드체이다:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTgccTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCgccTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGAgccTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGgccCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCgccATCACAAAGCATGTTGCGCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA
SEQ ID NO:275 - MSP469: CMV-T7-인간SpCas9-VQR(D1135V, R1335Q, T1337R)-NLS-3xFLAG
인간 코돈 최적화된 S. 피오게네스 Cas9는 정상 글꼴이고, 변형된 코돈은 소문자이고, NLS는 이중 밑줄 그어졌으며, 3xFLAG 태그는 볼드체이다:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCgtgAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAAcagTACagaTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA
SEQ ID NO:276 - MSP2440: CMV-T7-인간SpCas9-VQR-HF1(N497A, R661A, Q695A, Q926A, D1135V, R1335Q, T1337R)-NLS-3xFLAG
인간 코돈 최적화된 S. 피오게네스 Cas9는 정상 글꼴이고, 변형된 코돈은 소문자이고, NLS는 이중 밑줄 그어졌으며, 3xFLAG 태그는 볼드체이다:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCgccTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGAgccTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGgccCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCgccATCACAAAGCATGTTGCGCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCgtgAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAAcagTACagaTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA
SEQ ID NO:277 - BPK2797: CMV-T7-인간SpCas9-VRQR(D1135V, G1218R, R1335Q, T1337R)-NLS-3xFLAG
인간 코돈 최적화된 S. 피오게네스 Cas9는 정상 글꼴이고, 변형된 코돈은 소문자이고, NLS는 이중 밑줄 그어졌으며, 3xFLAG 태그는 볼드체이다:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCgtgAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCagaGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAAcagTACagaTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA
SEQ ID NO:278 - MSP2443: CMV-T7-인간SpCas9-VRQR-HF1(N497A, R661A, Q695A, Q926A, D1135V, G1218R, R1335Q, T1337R)-NLS-3xFLAG
인간 코돈 최적화된 S. 피오게네스 Cas9는 정상 글꼴이고, 변형된 코돈은 소문자이고, NLS는 이중 밑줄 그어졌으며, 3xFLAG 태그는 볼드체이다:
ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCCTGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCgccTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGAgccTTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGgccCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCgccATCACAAAGCATGTTGCGCAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCgtgAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCagaGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAAcagTACagaTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGTGA
SEQ ID NO:279 - BPK1520: U6-BsmBI카세트-Sp-sgRNA
U6 프로모터는 정상 글꼴이고, BsmBI 부위는 이탤릭체이고, S. 피오게네스 sgRNA는 소문자이며, U6 종결인자는 이중 밑줄 그어져 있다:
TGTACAAAAAAGCAGGCTTTAAAGGAACCAATTCAGTCGACTGGATCCGGTACCAAGGTCGGGCAGGAAGAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTAATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTGTGGAAAGGACGAAACACCG GAGACG ATTAATG CGTCTC Cgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcttttttt
기타
구현예
본 발명은 그 상세한 설명과 관련하여 설명되었으나, 전술된 설명은 예시하기 위한 것이지, 본 발명의 범위를 제한하는 것이 아니며, 본 발명의 범위는 첨부된 청구범위의 범위에 의해서 규정된다. 다른 양태, 이점 및 변형들이 하기의 청구범위의 범위 내에 있다.
SEQUENCE LISTING
<110> THE GENERAL HOSPITAL CORPORATION
<120> ENGINEERED CRISPR-CAS9 NUCLEASES
<130> 29539-0189WO1
<150> US 15/015,947
<151> 2016-02-04
<150> US 62/258,280
<151> 2015-11-20
<150> US 62/216,033
<151> 2015-09-09
<150> US 62/211,553
<151> 2015-08-28
<150> US 62/271,938
<151> 2015-12-28
<160> 279
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 1053
<212> PRT
<213> Staphylococcus aureus
<400> 2
Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 3
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 3
Gly Gly Gly Ser
1
<210> 4
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 4
Gly Gly Gly Gly Ser
1 5
<210> 5
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 5
Gly Gly Gly Ser
1
<210> 6
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 6
Gly Gly Gly Gly Ser
1 5
<210> 7
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 7
Pro Lys Lys Lys Arg Arg Val
1 5
<210> 8
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 8
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 9
gggcacgggc agcttgccgg 20
<210> 10
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 10
gggcacgggc agcttgccgg tggt 24
<210> 11
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 11
gcacgggcag cttgccgg 18
<210> 12
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 12
gcacgggcag cttgccggtg gt 22
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 13
gggcacccgc agcttgccgg 20
<210> 14
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 14
gggcacccgc agcttgccgg tggt 24
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 15
gggctggggc agcttgccgg 20
<210> 16
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 16
gggctggggc agcttgccgg tggt 24
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 17
ggcgacgggc agcttgccgg 20
<210> 18
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 18
ggcgacgggc agcttgccgg tggt 24
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 19
gcccacgggc agcttgccgg 20
<210> 20
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 20
gcccacgggc agcttgccgg tggt 24
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 21
gtcgccctcg aacttcacct 20
<210> 22
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 22
gtcgccctcg aacttcacct cggc 24
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 23
gtaggtcagg gtggtcacga 20
<210> 24
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 24
gtaggtcagg gtggtcacga gggt 24
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 25
ggcgagggcg atgccaccta 20
<210> 26
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 26
ggcgagggcg atgccaccta cggc 24
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 27
ggtcgccacc atggtgagca 20
<210> 28
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 28
ggtcgccacc atggtgagca aggg 24
<210> 29
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 29
ggtcagggtg gtcacgaggg 20
<210> 30
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 30
ggtcagggtg gtcacgaggg tggg 24
<210> 31
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 31
ggtggtgcag atgaacttca 20
<210> 32
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 32
ggtggtgcag atgaacttca gggt 24
<210> 33
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 33
ggtgcagatg aacttca 17
<210> 34
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 34
ggtgcagatg aacttcaggg t 21
<210> 35
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 35
gttggggtct ttgctcaggg 20
<210> 36
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 36
gttggggtct ttgctcaggg cgga 24
<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 37
ggtggtcacg agggtgggcc 20
<210> 38
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 38
ggtggtcacg agggtgggcc aggg 24
<210> 39
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 39
gatgccgttc ttctgcttgt 20
<210> 40
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 40
gatgccgttc ttctgcttgt cggc 24
<210> 41
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 41
gccgttcttc tgcttgt 17
<210> 42
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 42
gccgttcttc tgcttgtcgg c 21
<210> 43
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 43
gtcgccacca tggtgagcaa 20
<210> 44
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 44
gtcgccacca tggtgagcaa gggc 24
<210> 45
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 45
gcactgcacg ccgtaggtca 20
<210> 46
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 46
gcactgcacg ccgtaggtca gggt 24
<210> 47
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 47
gtgaaccgca tcgagctgaa 20
<210> 48
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 48
gtgaaccgca tcgagctgaa gggc 24
<210> 49
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 49
gaagggcatc gacttcaagg 20
<210> 50
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 50
gaagggcatc gacttcaagg agga 24
<210> 51
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 51
gcttcatgtg gtcggggtag 20
<210> 52
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 52
gcttcatgtg gtcggggtag cggc 24
<210> 53
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 53
gctgaagcac tgcacgccgt 20
<210> 54
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 54
gctgaagcac tgcacgccgt aggt 24
<210> 55
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 55
gccgtcgtcc ttgaagaaga 20
<210> 56
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 56
gccgtcgtcc ttgaagaaga tggt 24
<210> 57
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 57
gaccaggatg ggcaccaccc 20
<210> 58
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 58
gaccaggatg ggcaccaccc cggt 24
<210> 59
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 59
gacgtagcct tcgggcatgg 20
<210> 60
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 60
gacgtagcct tcgggcatgg cgga 24
<210> 61
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 61
gaagttcgag ggcgacaccc 20
<210> 62
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 62
gaagttcgag ggcgacaccc tggt 24
<210> 63
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 63
gagctggacg gcgacgtaaa 20
<210> 64
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 64
gagctggacg gcgacgtaaa cggc 24
<210> 65
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 65
ggcatcgccc tcgccctcgc 20
<210> 66
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 66
ggcatcgccc tcgccctcgc cgga 24
<210> 67
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 67
ggccacaagt tcagcgtgtc 20
<210> 68
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 68
ggccacaagt tcagcgtgtc cggc 24
<210> 69
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 69
gggcgaggag ctgttcaccg 20
<210> 70
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 70
gggcgaggag ctgttcaccg gggt 24
<210> 71
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 71
gcgaggagct gttcaccg 18
<210> 72
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 72
gcgaggagct gttcaccggg gt 22
<210> 73
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 73
cctcgaactt cacctcggcg 20
<210> 74
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 74
cctcgaactt cacctcggcg cggg 24
<210> 75
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 75
gctcgaactt cacctcggcg 20
<210> 76
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 76
gctcgaactt cacctcggcg cggg 24
<210> 77
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 77
caactacaag acccgcgccg 20
<210> 78
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 78
caactacaag acccgcgccg aggt 24
<210> 79
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 79
gaactacaag acccgcgccg 20
<210> 80
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 80
gaactacaag acccgcgccg aggt 24
<210> 81
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 81
cgctcctgga cgtagccttc 20
<210> 82
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 82
cgctcctgga cgtagccttc gggc 24
<210> 83
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 83
ggctcctgga cgtagccttc 20
<210> 84
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 84
cgctcctgga cgtagccttc gggc 24
<210> 85
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 85
agggcgagga gctgttcacc 20
<210> 86
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 86
agggcgagga gctgttcacc gggg 24
<210> 87
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 87
ggggcgagga gctgttcacc 20
<210> 88
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 88
ggggcgagga gctgttcacc gggg 24
<210> 89
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 89
gttcgagggc gacaccctgg 20
<210> 90
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 90
gttcgagggc gacaccctgg tgaa 24
<210> 91
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 91
gttcaccagg gtgtcgccct 20
<210> 92
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 92
gttcaccagg gtgtcgccct cgaa 24
<210> 93
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 93
gcccaccctc gtgaccaccc 20
<210> 94
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 94
gcccaccctc gtgaccaccc tgac 24
<210> 95
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 95
gcccttgctc accatggtgg 20
<210> 96
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 96
gcccttgctc accatggtgg cgac 24
<210> 97
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 97
gtcgccgtcc agctcgacca 20
<210> 98
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 98
gtcgccgtcc agctcgacca ggat 24
<210> 99
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 99
gtgtccggcg agggcgaggg 20
<210> 100
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 100
gtgtccggcg agggcgaggg cgat 24
<210> 101
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 101
ggggtggtgc ccatcctggt 20
<210> 102
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 102
ggggtggtgc ccatcctggt cgag 24
<210> 103
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 103
gccaccatgg tgagcaaggg 20
<210> 104
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 104
gccaccatgg tgagcaaggg cgag 24
<210> 105
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 105
gagtccgagc agaagaagaa 20
<210> 106
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 106
gagtccgagc agaagaagaa gggc 24
<210> 107
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 107
gtcacctcca atgactaggg 20
<210> 108
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 108
gtcacctcca atgactaggg tggg 24
<210> 109
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 109
gggaagactg aggctacata 20
<210> 110
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 110
gggaagactg aggctacata gggt 24
<210> 111
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 111
gccacgaagc aggccaatgg 20
<210> 112
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 112
gccacgaagc aggccaatgg ggag 24
<210> 113
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 113
ggaatccctt ctgcagcacc 20
<210> 114
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 114
ggaatccctt ctgcagcacc tgga 24
<210> 115
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 115
gctgcagaag ggattccatg 20
<210> 116
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 116
gctgcagaag ggattccatg aggt 24
<210> 117
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 117
ggcggctgca caaccagtgg 20
<210> 118
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 118
ggcggctgca caaccagtgg aggc 24
<210> 119
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 119
gctccagagc cgtgcgaatg 20
<210> 120
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 120
gctccagagc cgtgcgaatg gggc 24
<210> 121
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 121
gaatcccttc tgcagcacct 20
<210> 122
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 122
gaatcccttc tgcagcacct ggat 24
<210> 123
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 123
gcggcggctg cacaaccagt 20
<210> 124
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 124
gcggcggctg cacaaccagt ggag 24
<210> 125
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 125
ggttgtgcag ccgccgctcc 20
<210> 126
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 126
ggttgtgcag ccgccgctcc agag 24
<210> 127
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 127
gcattttcag gaggaagcga 20
<210> 128
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 128
gcattttcag gaggaagcga tggc 24
<210> 129
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 129
gggagaagaa agagagatgt 20
<210> 130
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 130
gggagaagaa agagagatgt aggg 24
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 131
ggtgcatttt caggaggaag 20
<210> 132
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 132
ggtgcatttt caggaggaag cgat 24
<210> 133
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 133
gagatgtagg gctagagggg 20
<210> 134
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 134
gagatgtagg gctagagggg tgag 24
<210> 135
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 135
ggtatccagc agaggggaga 20
<210> 136
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 136
ggtatccagc agaggggaga agaa 24
<210> 137
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 137
gaggcatctc tgcaccgagg 20
<210> 138
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 138
gaggcatctc tgcaccgagg tgaa 24
<210> 139
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 139
gaggggtgag gctgaaacag 20
<210> 140
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 140
gaggggtgag gctgaaacag tgac 24
<210> 141
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 141
gagcaaaagt agatattaca 20
<210> 142
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 142
gagcaaaagt agatattaca agac 24
<210> 143
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 143
ggaattcaaa ctgaggcata 20
<210> 144
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 144
ggaattcaaa ctgaggcata tgat 24
<210> 145
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 145
gcagagggga gaagaaagag 20
<210> 146
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 146
gcagagggga gaagaaagag agat 24
<210> 147
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 147
gcaccgaggc atctctgcac 20
<210> 148
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 148
gcaccgaggc atctctgcac cgag 24
<210> 149
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 149
gagatgtagg gctagagggg 20
<210> 150
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 150
gagatgtagg gctagagggg tgag 24
<210> 151
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 151
gtgcggcaag agcttcagcc 20
<210> 152
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 152
gtgcggcaag agcttcagcc gggg 24
<210> 153
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 153
gggtgggggg agtttgctcc 20
<210> 154
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 154
gggtgggggg agtttgctcc tgga 24
<210> 155
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 155
gaccccctcc accccgcctc 20
<210> 156
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 156
gaccccctcc accccgcctc cggg 24
<210> 157
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 157
ggtgagtgag tgtgtgcgtg 20
<210> 158
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 158
ggtgagtgag tgtgtgcgtg tggg 24
<210> 159
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 159
gcgagcagcg tcttcgagag 20
<210> 160
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 160
gcgagcagcg tcttcgagag tgag 24
<210> 161
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 161
gtgcggcaag agcttcagcc 20
<210> 162
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 162
gtgcggcaag agcttcagcc agag 24
<210> 163
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 163
gagtccgagc agaagaagaa ggg 23
<210> 164
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 164
gtcacctcca atgactaggg tgg 23
<210> 165
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 165
ggaatccctt ctgcagcacc tgg 23
<210> 166
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 166
gctgcagaag ggattccatg agg 23
<210> 167
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 167
ggcggctgca caaccagtgg agg 23
<210> 168
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 168
gctccagagc cgtgcgaatg ggg 23
<210> 169
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 169
gcattttcag gaggaagcga tgg 23
<210> 170
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 170
gtgcggcaag agcttcagcc ggg 23
<210> 171
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 171
gaccccctcc accccgcctc cgg 23
<210> 172
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 172
ggtgagtgag tgtgtgcgtg tgg 23
<210> 173
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 173
ggagcagctg gtcagagggg 20
<210> 174
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 174
ccatagggaa gggggacact gg 22
<210> 175
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 175
gggccgggaa agagttgctg 20
<210> 176
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 176
gccctacatc tgctctccct cc 22
<210> 177
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 177
ccagcacaac ttactcgcac ttgac 25
<210> 178
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 178
catcaccaac ccacagccaa gg 22
<210> 179
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 179
tccagatggc acattgtcag 20
<210> 180
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 180
agggagcagg aaagtgaggt 20
<210> 181
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 181
cgaggaagag agagacgggg tc 22
<210> 182
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 182
ctccaatgca cccaagacag cag 23
<210> 183
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 183
agtgtggggt gtgtgggaag 20
<210> 184
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 184
gcaaggggaa gactctggca 20
<210> 185
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 185
tacgagtgcc tagagtgcg 19
<210> 186
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 186
gcagatgtag gtcttggagg ac 22
<210> 187
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 187
ggagcagctg gtcagagggg 20
<210> 188
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 188
cgatgtcctc cccattggcc tg 22
<210> 189
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 189
gtggggagat ttgcatctgt ggagg 25
<210> 190
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 190
gcttttatac catcttgggg ttacag 26
<210> 191
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 191
caatgtgctt caacccatca cggc 24
<210> 192
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 192
ccatgaattt gtgatggatg cagtctg 27
<210> 193
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 193
gagaaggagg tgcaggagct agac 24
<210> 194
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 194
catcccgacc ttcatccctc ctgg 24
<210> 195
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 195
gtagttctga cattcctcct gaggg 25
<210> 196
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 196
tcaaacaagg tgcagataca gca 23
<210> 197
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 197
cagggtcgct cagtctgtgt gg 22
<210> 198
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 198
ccagcgcacc attcactcca cctg 24
<210> 199
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 199
ggctgaagag gaagaccaga ctcag 25
<210> 200
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 200
ggcccctctg aattcaattc tctgc 25
<210> 201
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 201
ccacagcgag gagtgacagc c 21
<210> 202
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 202
ccaagtcttt cctaactcga ccttgg 26
<210> 203
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 203
ccctaggccc acaccagcaa tg 22
<210> 204
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 204
gggatgggaa tgggaatgtg aggc 24
<210> 205
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 205
gcccaggtga aggtgtggtt cc 22
<210> 206
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 206
ccaaagcctg gccagggagt g 21
<210> 207
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 207
aggcaaagat ctaggacctg gatgg 25
<210> 208
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 208
ccatctgagt cagccagcct tgtc 24
<210> 209
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 209
ggttccctcc cttctgagcc c 21
<210> 210
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 210
ggataggaat gaagaccccc tctcc 25
<210> 211
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 211
ggactggctg gctgtgtgtt ttgag 25
<210> 212
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 212
cttatccagg gctacctcat tgcc 24
<210> 213
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 213
gctgctgctg ctttgatcac tcctg 25
<210> 214
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 214
ctccttaaac cctcagaagc tggc 24
<210> 215
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 215
gcactgtcag ctgatcctac agg 23
<210> 216
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 216
acgttggaac agtcgagctg tagc 24
<210> 217
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 217
tgtgcataac tcatgttggc aaact 25
<210> 218
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 218
tccacaacta ccctcagctg gag 23
<210> 219
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 219
ccactgacaa ttcactcaac cctgc 25
<210> 220
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 220
aggcagacca gttatttggc agtc 24
<210> 221
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 221
acaggcgcag ttcactgaga ag 22
<210> 222
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 222
gggtaggctg actttgggct cc 22
<210> 223
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 223
gccctcttgc ctccactggt tg 22
<210> 224
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 224
cgcggatgtt ccaatcagta cgc 23
<210> 225
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 225
gcgggcagtg gcgtcttagt cg 22
<210> 226
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 226
ccctgggttt ggttggctgc tc 22
<210> 227
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 227
ctccttgccg cccagccggt c 21
<210> 228
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 228
cactggggaa gaggcgagga cac 23
<210> 229
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 229
ccagtgtttc ccatccccaa cac 23
<210> 230
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 230
gaatggatcc ccccctagag ctc 23
<210> 231
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 231
caggcccaca ggtccttctg ga 22
<210> 232
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 232
ccacacggaa ggctgaccac g 21
<210> 233
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 233
gcgcagagag agcaggacgt c 21
<210> 234
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 234
gcacctcatg gaatcccttc tgc 23
<210> 235
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 235
caagtgatgc gacttccaac ctc 23
<210> 236
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 236
ccctcagagt tcagcttaaa aagacc 26
<210> 237
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 237
tgcttctcat ccactctaga ctgct 25
<210> 238
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 238
caccaaccag ccatgtgcca tg 22
<210> 239
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 239
ctgcctgtgc tcctcgatgg tg 22
<210> 240
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 240
gggttcaaag ctcatctgcc cc 22
<210> 241
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 241
gcatgtgcct tgagattgcc tgg 23
<210> 242
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 242
gacattcaga gaagcgacca tgtgg 25
<210> 243
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 243
ccatcttccc ctttggccca cag 23
<210> 244
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 244
ccccaaaagt ggccaagagc ctgag 25
<210> 245
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 245
gttctccaaa ggaagagagg ggaatg 26
<210> 246
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 246
ggtgctgtgt cctcatgcat cc 22
<210> 247
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 247
cggcttgcct agggtcgttg ag 22
<210> 248
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 248
ccttcagggg ctcttccagg tc 22
<210> 249
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 249
gggaactggc aggcaccgag g 21
<210> 250
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 250
gggtgaggct gaaacagtga cc 22
<210> 251
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 251
gggaggatgt tggttttagg gaactg 26
<210> 252
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 252
tccaatcact acatgccatt ttgaaga 27
<210> 253
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 253
ccaccctctt cctttgatcc tccc 24
<210> 254
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 254
tcctccctac tccttcaccc agg 23
<210> 255
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 255
gagtgcctga catgtgggga gag 23
<210> 256
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 256
tccagctaaa gcctttccca cac 23
<210> 257
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 257
gaactctctg atgcacctga aggctg 26
<210> 258
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 258
accgtatcag tgtgatgcat gtggt 25
<210> 259
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 259
tgggtttaat catgtgttct gcactatg 28
<210> 260
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 260
cccatcttcc attctgccct ccac 24
<210> 261
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 261
cagctagtcc atttgttctc agactgtg 28
<210> 262
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 262
ggccaacatt gtgaaaccct gtctc 25
<210> 263
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 263
ccagggacct gtgcttgggt tc 22
<210> 264
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 264
caccccatga cctggcacaa gtg 23
<210> 265
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 265
aagtgttcct cagaatgcca gccc 24
<210> 266
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 266
caggagtgca gttgtgttgg gag 23
<210> 267
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 267
ctgatgaagc accagagaac ccacc 25
<210> 268
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 268
cacacctggc acccatatgg c 21
<210> 269
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 269
gatccacact ggtgagaagc cttac 25
<210> 270
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 270
cttcccacac tcacagcaga tgtagg 26
<210> 271
<211> 4206
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 271
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aagtga 4206
<210> 272
<211> 4206
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 272
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccctggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccgc ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
gccttgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tggccctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgcgccat cacaaagcat gttgcgcaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aagtga 4206
<210> 273
<211> 4206
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 273
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccctggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccgc ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
gccttgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tggccctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgcgccat cacaaagcat gttgcgcaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgagagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aagtga 4206
<210> 274
<211> 4206
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 274
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg catacctgcc tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccctggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccgc ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
gccttgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tggccctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgcgccat cacaaagcat gttgcgcaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aagtga 4206
<210> 275
<211> 4206
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 275
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgtgagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacagtacag atctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aagtga 4206
<210> 276
<211> 4206
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 276
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccctggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccgc ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
gccttgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tggccctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgcgccat cacaaagcat gttgcgcaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgtgagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacagtacag atctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aagtga 4206
<210> 277
<211> 4206
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 277
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgtgagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cagagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacagtacag atctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aagtga 4206
<210> 278
<211> 4206
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 278
atggataaaa agtattctat tggtttagac atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccctggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccgc ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
gccttgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tggccctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgcgccat cacaaagcat gttgcgcaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgtgagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cagagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacagtacag atctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgacggatcc cccaagaaga agaggaaagt ctcgagcgac 4140
tacaaagacc atgacggtga ttataaagat catgacatcg attacaagga tgacgatgac 4200
aagtga 4206
<210> 279
<211> 422
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 279
tgtacaaaaa agcaggcttt aaaggaacca attcagtcga ctggatccgg taccaaggtc 60
gggcaggaag agggcctatt tcccatgatt ccttcatatt tgcatatacg atacaaggct 120
gttagagaga taattagaat taatttgact gtaaacacaa agatattagt acaaaatacg 180
tgacgtagaa agtaataatt tcttgggtag tttgcagttt taaaattatg ttttaaaatg 240
gactatcata tgcttaccgt aacttgaaag tatttcgatt tcttggcttt atatatcttg 300
tggaaaggac gaaacaccgg agacgattaa tgcgtctccg ttttagagct agaaatagca 360
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt 420
tt 422
Claims (43)
- L169, Y450, N497, R661, Q695, Q926, 및/또는 D1135의 위치 중 1, 2, 3, 4, 5, 6 또는 7개 모두에서 돌연변이를 가지고, 바람직하게는, L169, Y450, N497, R661, Q695, Q926, D1135의 위치 중 1, 2, 3, 4, 5, 6 또는 7개에 돌연변이를 갖는 SEQ ID NO:1의 아미노산 서열과 적어도 80% 동일한 서열 및 선택적으로 하나 이상의 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그를 포함하는, 단리된 스트렙토코커스 피오게네스 Cas9(SpCas9) 단백질.
- 제1항에 있어서, N497, R661, Q695, 및 Q926 중 1, 2, 3 또는 4개 모두에서의 돌연변이, 바람직하게는 N497A, R661A, Q695A, 및 Q926A의 돌연변이 중 1, 2, 3 또는 4개 모두를 포함하는, 단리된 단백질.
- 제1항에 있어서, Q695 및/또는 Q926 중 하나 또는 둘 모두에서의 돌연변이, 선택적으로 L169, Y450, N497, R661, 및 D1135 중 1, 2, 3, 4 또는 5개 모두에서의 돌연변이, 바람직하게는 Y450A/Q695A, L169A/Q695A, Q695A/Q926A, Q695A/D1135E, Q926A/D1135E, Y450A/D1135E, L169A/Y450A/Q695A, L169A/Q695A/Q926A, Y450A/Q695A/Q926A, R661A/Q695A/Q926A, N497A/Q695A/Q926A, Y450A/Q695A/D1135E, Y450A/Q926A/D1135E, Q695A/Q926A/D1135E, L169A/Y450A/Q695A/Q926A, L169A/R661A/Q695A/Q926A, Y450A/R661A/Q695A/Q926A, N497A/Q695A/Q926A/D1135E, R661A/Q695A/Q926A/D1135E, 또는 Y450A/Q695A/Q926A/D1135E를 포함하는, 단리된 단백질.
- 제1항에 있어서, N14; S15; S55; R63; R78; H160; K163; R165; L169; R403; N407; Y450; M495; N497; K510; Y515; W659; R661; M694; Q695; H698; A728; S730; K775; S777; R778; R780; K782; R783; K789; K797; Q805; N808; K810; R832; Q844; S845; K848; S851; K855; R859; K862; K890; Q920; Q926; K961; S964; K968; K974; R976; N980; H982; K1003; Y1013; K1014; V1015; S1040; N1041; N1044; K1047; K1059; R1060; K1107; E1108; S1109; K1113; R1114; S1116; K1118; R1122; K1123; K1124; D1135; S1136; K1153; K1155 ; K1158; K1200; Q1221; H1241; Q1254; Q1256; K1289; K1296; K1297; R1298; K1300; H1311; K1325; K1334; T1337 및/또는 S1216에서의 돌연변이, 바람직하게는 N497A/R661A/Q695A/Q926A/K810A, N497A/R661A/Q695A/Q926A/K848A, N497A/R661A/Q695A/Q926A/K855A, N497A/R661A/Q695A/Q926A/R780A, N497A/R661A/Q695A/Q926A/K968A, N497A/R661A/Q695A/Q926A/H982A, N497A/R661A/Q695A/Q926A/K1003A, N497A/R661A/Q695A/Q926A/K1014A, N497A/R661A/Q695A/Q926A/K1047A, N497A/R661A/Q695A/Q926A/R1060A, N497A/R661A/Q695A/Q926A/K810A/K968A, N497A/R661A/Q695A/Q926A/K810A/K848A, N497A/R661A/Q695A/Q926A/K810A/K1003A, N497A/R661A/Q695A/Q926A/K810A/R1060A, N497A/R661A/Q695A/Q926A/K848A/K1003A, N497A/R661A/Q695A/Q926A/K848A/R1060A, N497A/R661A/Q695A/Q926A/K855A/K1003A, N497A/R661A/Q695A/Q926A/K855A/R1060A, N497A/R661A/Q695A/Q926A/K968A/K1003A, N497A/R661A/Q695A/Q926A/H982A/K1003A, N497A/R661A/Q695A/Q926A/H982A/R1060A, N497A/R661A/Q695A/Q926A/K1003A/R1060A, N497A/R661A/Q695A/Q926A/K810A/K1003A/R1060A, N497A/R661A/Q695A/Q926A/K848A/K1003A/R1060A, Q695A/Q926A/R780A, Q695A/Q926A/K810A, Q695A/Q926A/R832A, Q695A/Q926A/K848A, Q695A/Q926A/K855A, Q695A/Q926A/K968A, Q695A/Q926A/R976A, Q695A/Q926A/H982A, Q695A/Q926A/K1003A, Q695A/Q926A/K1014A, Q695A/Q926A/K1047A, Q695A/Q926A/R1060A, Q695A/Q926A/K848A/K968A, Q695A/Q926A/K848A/K1003A, Q695A/Q926A/K848A/K855A, Q695A/Q926A/K848A/H982A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/R832A/R1060A, Q695A/Q926A/K968A/K1003A, Q695A/Q926A/K968A/R1060A, Q695A/Q926A/K848A/R1060A, Q695A/Q926A/K855A/H982A, Q695A/Q926A/K855A/K1003A, Q695A/Q926A/K855A/R1060A, Q695A/Q926A/H982A/K1003A, Q695A/Q926A/H982A/R1060A, Q695A/Q926A/K1003A/R1060A, Q695A/Q926A/K810A/K1003A/R1060A, Q695A/Q926A/K1003A/K1047A/R1060A, Q695A/Q926A/K968A/K1003A/R1060A, Q695A/Q926A/R832A/K1003A/R1060A, 또는 Q695A/Q926A/K848A/K1003A/R1060A를 추가로 포함하는, 단리된 단백질.
- 제1항에 있어서, 돌연변이 D1135E; D1135V; D1135V/R1335Q/T1337R(VQR 변이체); D1135E/R1335Q/T1337R(EQR 변이체); D1135V/G1218R/R1335Q/T1337R(VRQR 변이체); 또는 D1135V/G1218R/R1335E/T1337R(VRER 변이체) 중 하나 이상을 추가로 포함하는, 단리된 단백질.
- 제1항에 있어서, D10, E762, D839, H983, 또는 D986에서; 및 H840 또는 N863에서의 돌연변이로 이루어진 군으로부터 선택되는, 뉴클레아제 활성을 감소시키는 하나 이상의 돌연변이를 추가로 포함하는, 단리된 단백질.
- 제6항에 있어서, 뉴클레아제 활성을 감소시키는 돌연변이는 하기의 것인, 단리된 단백질:
(i) D10A 또는 D10N, 및
(ii) H840A, H840N, 또는 H840Y. - Y211, Y212, W229, Y230, R245, T392, N419, Y651, R654의 위치 중 1, 2, 3, 4, 5, 6개 이상에서의 돌연변이를 가지며, 바람직하게는, Y211, Y212, W229, Y230, R245, T392, N419, Y651, R654의 위치 중 1, 2, 3, 4, 또는 5, 6개 이상에서 돌연변이를 갖는 SEQ ID NO:1의 아미노산 서열과 적어도 80% 동일한 서열 및 선택적으로 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그 중 하나 이상을 포함하는, 단리된 스타필로코커스 아우레우스 Cas9(SaCas9) 단백질.
- 제8항에 있어서, 돌연변이 Y211A, Y212A, W229, Y230A, R245A, T392A, N419A, Y651, 및/또는 R654A 중 하나 이상을 포함하는, 단리된 단백질.
- 제8항에 있어서, N419 및/또는 R654에서의 돌연변이 및 선택적으로 추가적인 돌연변이 Y211, Y212, W229, Y230, R245 및 T392 중 1, 2, 3, 4개 이상, 바람직하게는 N419A/R654A, Y211A/R654A, Y211A/Y212A, Y211A/Y230A, Y211A/R245A, Y212A/Y230A, Y212A/R245A, Y230A/R245A, W229A/R654A, Y211A/Y212A/Y230A, Y211A/Y212A/R245A, Y211A/Y212A/Y651A, Y211A/Y230A/R245A, Y211A/Y230A/Y651A, Y211A/R245A/Y651A, Y211A/R245A/R654A, Y211A/R245A/N419A, Y211A/N419A/R654A, Y212A/Y230A/R245A, Y212A/Y230A/Y651A, Y212A/R245A/Y651A, Y230A/R245A/Y651A, R245A/N419A/R654A, T392A/N419A/R654A, R245A/T392A/N419A/R654A, Y211A/R245A/N419A/R654A, W229A/R245A/N419A/R654A, Y211A/R245A/T392A/N419A/R654A, 또는 Y211A/W229A/R245A/N419A/R654A를 포함하는, 단리된 단백질.
- 제8항에 있어서, Y211; Y212; W229; Y230; R245; T392; N419; L446; Q488A; N492A; Q495A; R497A; N498A; R499; Q500; K518; K523; K525; H557; R561; K572; R634; Y651; R654; G655; N658; S662; N667; R686; K692; R694; H700; K751; D786; T787; Y789; T882; K886; N888; 889; L909; N985; N986; R991; R1015; N44; R45; R51; R55; R59; R60; R116; R165; N169; R208; R209; Y211; T238; Y239; K248; Y256; R314; N394; Q414; K57; R61; H111; K114; V164; R165; L788; S790; R792; N804; Y868; K870; K878; K879; K881; Y897; R901; 및/또는 K906에서의 돌연변이를 추가로 포함하는, 단리된 단백질.
- 제8항에 있어서, 돌연변이 E782K, K929R, N968K, 또는 R1015H 중 하나 이상, 구체적으로, E782K/N968K/R1015H(KKH 변이체); E782K/K929R/R1015H(KRH 변이체); 또는 E782K/K929R/N968K/R1015H(KRKH 변이체)를 추가로 포함하는, 단리된 단백질.
- 제8항에 있어서, D10, E477, D556, H701, 또는 D704에서의 돌연변이; 및 H557 또는 N580에서의 돌연변이로 이루어진 군으로부터 선택되는, 뉴클레아제 활성을 감소시키는 하나 이상의 돌연변이를 추가로 포함하는, 단리된 단백질.
- 제13항에 있어서, 돌연변이는 하기의 것인, 단리된 단백질:
(i) D10A 또는 D10N, 및/또는
(ii) H557A, H557N, 또는 H557Y, 및/또는
(iii) N580A, 및/또는
(iv) D556A. - 선택적 개입 링커에 의해, 이종 기능성 도메인에 융합된 제1항 내지 제14항 중 어느 한 항의 단리된 단백질을 포함하는 융합 단백질로서, 링커는 융합 단백질의 활성에 간섭하지 않는, 융합 단백질.
- 제15항에 있어서, 이종 기능성 도메인은 전사 활성화 도메인인, 융합 단백질.
- 제16항에 있어서, 전사 활성화 도메인은 VP64 또는 NF-κB p65로부터 유래하는, 융합 단백질.
- 제15항에 있어서, 이종 기능성 도메인은 전사 사일런서(transcriptional silencer) 또는 전사 억제 도메인인, 융합 단백질.
- 제18항에 있어서, 전사 억제 도메인은 Krueppel-연관 박스(KRAB) 도메인, ERF 리프레서 도메인(ERD), 또는 mSin3A 상호작용 도메인(SID)인, 융합 단백질.
- 제18항에 있어서, 전사 사일런서는 이질염색질 단백질 1(HP1), 바람직하게는 HP1α 또는 HP1β인, 융합 단백질.
- 제15항에 있어서, 이종 기능성 도메인은 DNA의 메틸화 상태를 변형하는 효소인, 융합 단백질.
- 제21항에 있어서, DNA의 메틸화 상태를 변형하는 효소는 DNA 메틸기전달효소(DNMT) 또는 TET 단백질인, 융합 단백질.
- 제22항에 있어서, TET 단백질은 TET1인, 융합 단백질.
- 제15항에 있어서, 이종 기능성 도메인은 히스톤 서브유닛을 변형하는 효소인, 융합 단백질.
- 제15항에 있어서, 히스톤 서브유닛을 변형하는 효소는 히스톤 아세틸기전달효소(HAT), 히스톤 탈아세틸효소(HDAC), 히스톤 메틸기전달효소(HMT), 또는 히스톤 탈메틸효소인, 융합 단백질.
- 제15항에 있어서, 이종 기능성 도메인은 생물학적 테더(biological tether)인, 융합 단백질.
- 제26항에 있어서, 생물학적 테더는 MS2, Csy4 또는 람다 N 단백질인, 융합 단백질.
- 제26항에 있어서, 이종 기능성 도메인은 FokI인, 융합 단백질.
- 제1항 내지 제14항 중 어느 한 항의 단백질을 인코딩하는, 단리된 핵산.
- 선택적으로, 제1항 내지 제24항 중 어느 한 항의 단백질의 발현을 위한 하나 이상의 조절 도메인에 작동 가능하게 연결된 제29항의 단리된 핵산을 포함하는 벡터.
- 제29항의 핵산을 포함하고, 선택적으로 제1항 내지 제14항 중 어느 한 항의 단백질을 발현하는 숙주 세포, 바람직하게는 포유류 숙주 세포.
- 세포의 게놈 또는 에피게놈을 변이시키는 방법으로서, 제1항 내지 제14항 중 어느 한 항의 단리된 단백질 및 세포 게놈의 선택 부분에 상보성인 영역을 가지는 가이드 RNA를 세포에서 발현시키거나 이들과 세포를 접촉시키는 단계를 포함하는 방법.
- 제15항의 단백질을 인코딩하는 단리된 핵산.
- 선택적으로, 제15항의 단백질의 발현을 위한 하나 이상의 조절 도메인에 작동 가능하게 연결된 제33항의 단리된 핵산을 포함하는 벡터.
- 제33항의 핵산을 포함하고, 선택적으로 제15항의 단백질을 발현하는 숙주 세포, 바람직하게는 포유류 숙주 세포.
- 세포의 게놈 또는 에피게놈을 변이시키는 방법으로서, 제1항 내지 제14항 중 어느 한 항의 단리된 단백질 및 세포 게놈의 선택 부분에 상보성인 영역을 가지는 가이드 RNA를 세포에서 발현시키거나 이들과 세포를 접촉시키는 단계를 포함하는, 방법.
- 세포의 게놈 또는 에피게놈을 변이시키는 방법으로서, 제15항 내지 제28항 중 어느 한 항의 단리된 융합 단백질 및 세포 게놈의 선택 부분에 상보성인 영역을 가지는 가이드 RNA를 세포에서 발현시키거나 이들과 세포를 접촉시키는 단계를 포함하는, 방법.
- 제36항 또는 제37항에 있어서, 단리된 단백질 또는 융합 단백질은 핵 위치화 서열, 세포 관통 펩타이드 서열, 및/또는 친화도 태그 중 하나 이상을 포함하는, 방법.
- 제36항 또는 제37항에 있어서, 세포는 줄기세포, 바람직하게는 배아 줄기세포, 간엽 줄기세포 또는 유도된 만능성 줄기세포이거나; 살아 있는 동물 내에 존재하거나, 배아 내에 존재하는, 방법.
- 이중 가닥 DNA D(dsDNA) 분자를 변이시키는 방법으로서, dsDNA 분자를 제1항 내지 제14항 중 어느 한 항의 단리된 단백질 및 dsDNA 분자의 선택 부분에 상보성인 영역을 가지는 가이드 RNA와 접촉시키는 단계를 포함하는, 방법.
- 제40항에 있어서, dsDNA 분자는 시험관내에(in vitro) 존재하는, 방법.
- 이중 가닥 DNA D(dsDNA) 분자를 변이시키는 방법으로서, dsDNA 분자를 제15항의 융합 단백질 및 dsDNA 분자의 선택 부분에 상보성인 영역을 가지는 가이드 RNA와 접촉시키는 단계를 포함하는, 방법.
- 제42항에 있어서, dsDNA 분자는 시험관내에 존재하는, 방법.
Applications Claiming Priority (11)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562211553P | 2015-08-28 | 2015-08-28 | |
US62/211,553 | 2015-08-28 | ||
US201562216033P | 2015-09-09 | 2015-09-09 | |
US62/216,033 | 2015-09-09 | ||
US201562258280P | 2015-11-20 | 2015-11-20 | |
US62/258,280 | 2015-11-20 | ||
US201562271938P | 2015-12-28 | 2015-12-28 | |
US62/271,938 | 2015-12-28 | ||
US15/015,947 | 2016-02-04 | ||
US15/015,947 US9512446B1 (en) | 2015-08-28 | 2016-02-04 | Engineered CRISPR-Cas9 nucleases |
PCT/US2016/049147 WO2017040348A1 (en) | 2015-08-28 | 2016-08-26 | Engineered crispr-cas9 nucleases |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180042394A true KR20180042394A (ko) | 2018-04-25 |
KR102668608B1 KR102668608B1 (ko) | 2024-05-24 |
Family
ID=
Also Published As
Publication number | Publication date |
---|---|
CA2996888A1 (en) | 2017-03-09 |
JP6799586B2 (ja) | 2020-12-16 |
HK1257676A1 (zh) | 2019-10-25 |
AU2016316845B2 (en) | 2022-03-10 |
JP6942848B2 (ja) | 2021-09-29 |
CN114875012A (zh) | 2022-08-09 |
JP2018525019A (ja) | 2018-09-06 |
AU2016316845A1 (en) | 2018-03-22 |
EP3341477B1 (en) | 2022-03-23 |
JP7074827B2 (ja) | 2022-05-24 |
EP4036236A1 (en) | 2022-08-03 |
CN108350449A (zh) | 2018-07-31 |
CN108350449B (zh) | 2022-05-31 |
JP7326391B2 (ja) | 2023-08-15 |
JP2021040644A (ja) | 2021-03-18 |
JP2023145657A (ja) | 2023-10-11 |
JP2021003110A (ja) | 2021-01-14 |
JP6745391B2 (ja) | 2020-08-26 |
EP3341477A1 (en) | 2018-07-04 |
AU2022203146A1 (en) | 2022-06-02 |
JP2022023028A (ja) | 2022-02-07 |
WO2017040348A1 (en) | 2017-03-09 |
EP3341477A4 (en) | 2019-07-10 |
JP2020010695A (ja) | 2020-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11060078B2 (en) | Engineered CRISPR-Cas9 nucleases | |
US10633642B2 (en) | Engineered CRISPR-Cas9 nucleases | |
JP6745391B2 (ja) | 遺伝子操作CRISPR−Cas9ヌクレアーゼ | |
JP7291114B2 (ja) | 変更PAM特異性を有する遺伝子操作CRISPR-Cas9ヌクレアーゼ | |
CN110669746B (zh) | 用于切割靶dna的组合物及其用途 | |
KR102668608B1 (ko) | 조작된 crispr-cas9 뉴클레아제 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |