KR20220128644A - 게놈 변형을 위한 높은 충실도 SpCas9 뉴클라제 - Google Patents
게놈 변형을 위한 높은 충실도 SpCas9 뉴클라제 Download PDFInfo
- Publication number
- KR20220128644A KR20220128644A KR1020227027960A KR20227027960A KR20220128644A KR 20220128644 A KR20220128644 A KR 20220128644A KR 1020227027960 A KR1020227027960 A KR 1020227027960A KR 20227027960 A KR20227027960 A KR 20227027960A KR 20220128644 A KR20220128644 A KR 20220128644A
- Authority
- KR
- South Korea
- Prior art keywords
- lys
- engineered
- leu
- glu
- ala
- Prior art date
Links
- 101710163270 Nuclease Proteins 0.000 title claims description 31
- 230000004048 modification Effects 0.000 title description 31
- 238000012986 modification Methods 0.000 title description 31
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 title description 2
- 108091033409 CRISPR Proteins 0.000 claims abstract description 183
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 135
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 122
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 62
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 55
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 55
- 238000000034 method Methods 0.000 claims abstract description 36
- 210000004027 cell Anatomy 0.000 claims description 145
- 230000035772 mutation Effects 0.000 claims description 114
- 108020004414 DNA Proteins 0.000 claims description 80
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 58
- 108020005004 Guide RNA Proteins 0.000 claims description 54
- 241000282414 Homo sapiens Species 0.000 claims description 47
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 38
- 230000002759 chromosomal effect Effects 0.000 claims description 30
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 29
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 28
- 230000014509 gene expression Effects 0.000 claims description 20
- 230000001105 regulatory effect Effects 0.000 claims description 19
- 239000013598 vector Substances 0.000 claims description 19
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims description 16
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 15
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 15
- 102100034343 Integrase Human genes 0.000 claims description 12
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 12
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 12
- 238000000338 in vitro Methods 0.000 claims description 12
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 10
- 108010091086 Recombinases Proteins 0.000 claims description 10
- 102000018120 Recombinases Human genes 0.000 claims description 10
- 239000003550 marker Substances 0.000 claims description 10
- 108010077544 Chromatin Proteins 0.000 claims description 9
- 230000027455 binding Effects 0.000 claims description 9
- 210000003483 chromatin Anatomy 0.000 claims description 9
- 210000004962 mammalian cell Anatomy 0.000 claims description 9
- 230000001580 bacterial effect Effects 0.000 claims description 8
- 239000004475 Arginine Substances 0.000 claims description 7
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 7
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 7
- 108091008103 RNA aptamers Proteins 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 6
- 210000005260 human cell Anatomy 0.000 claims description 6
- 239000013600 plasmid vector Substances 0.000 claims description 6
- 230000002103 transcriptional effect Effects 0.000 claims description 6
- 241000251539 Vertebrata <Metazoa> Species 0.000 claims description 5
- 238000001727 in vivo Methods 0.000 claims description 5
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 5
- 239000013603 viral vector Substances 0.000 claims description 5
- 230000006819 RNA synthesis Effects 0.000 claims description 4
- 239000008194 pharmaceutical composition Substances 0.000 claims description 4
- 210000004899 c-terminal region Anatomy 0.000 claims description 3
- 102000037865 fusion proteins Human genes 0.000 claims description 3
- 108020001507 fusion proteins Proteins 0.000 claims description 3
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 claims description 2
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 claims description 2
- 230000001973 epigenetic effect Effects 0.000 claims description 2
- 108020004705 Codon Proteins 0.000 claims 1
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 claims 1
- 108020000999 Viral RNA Proteins 0.000 claims 1
- 238000010362 genome editing Methods 0.000 abstract description 9
- 235000018102 proteins Nutrition 0.000 description 89
- 230000000694 effects Effects 0.000 description 77
- 125000003729 nucleotide group Chemical group 0.000 description 63
- 235000001014 amino acid Nutrition 0.000 description 61
- 239000002773 nucleotide Substances 0.000 description 59
- 108090000765 processed proteins & peptides Proteins 0.000 description 53
- 102000040430 polynucleotide Human genes 0.000 description 21
- 108091033319 polynucleotide Proteins 0.000 description 21
- 239000002157 polynucleotide Substances 0.000 description 21
- 125000005647 linker group Chemical group 0.000 description 20
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 19
- 238000006467 substitution reaction Methods 0.000 description 19
- 238000011144 upstream manufacturing Methods 0.000 description 19
- 108010033040 Histones Proteins 0.000 description 18
- 229940024606 amino acid Drugs 0.000 description 18
- 102000008300 Mutant Proteins Human genes 0.000 description 17
- 108010021466 Mutant Proteins Proteins 0.000 description 17
- 210000000130 stem cell Anatomy 0.000 description 17
- 238000001890 transfection Methods 0.000 description 17
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 16
- 150000001413 amino acids Chemical group 0.000 description 16
- 238000007481 next generation sequencing Methods 0.000 description 16
- 235000004554 glutamine Nutrition 0.000 description 15
- 102000004190 Enzymes Human genes 0.000 description 14
- 108090000790 Enzymes Proteins 0.000 description 14
- 201000010099 disease Diseases 0.000 description 14
- 102000004196 processed proteins & peptides Human genes 0.000 description 13
- 102100026846 Cytidine deaminase Human genes 0.000 description 12
- 108010031325 Cytidine deaminase Proteins 0.000 description 12
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 12
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 12
- 108091079001 CRISPR RNA Proteins 0.000 description 11
- 108010034529 leucyl-lysine Proteins 0.000 description 11
- 229920001184 polypeptide Polymers 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 10
- 108010062796 arginyllysine Proteins 0.000 description 10
- 108010054155 lysyllysine Proteins 0.000 description 10
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 9
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 9
- 108010092854 aspartyllysine Proteins 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 241000700159 Rattus Species 0.000 description 8
- 108010087924 alanylproline Proteins 0.000 description 8
- 230000009437 off-target effect Effects 0.000 description 8
- 230000004913 activation Effects 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 125000002652 ribonucleotide group Chemical group 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 6
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 6
- 102000055025 Adenosine deaminases Human genes 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 6
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 6
- 239000004472 Lysine Substances 0.000 description 6
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 6
- 210000001744 T-lymphocyte Anatomy 0.000 description 6
- 235000004279 alanine Nutrition 0.000 description 6
- 108010008355 arginyl-glutamine Proteins 0.000 description 6
- 230000004049 epigenetic modification Effects 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 239000000203 mixture Substances 0.000 description 6
- 108010073969 valyllysine Proteins 0.000 description 6
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 5
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 5
- -1 EYFP Proteins 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- 108091027305 Heteroduplex Proteins 0.000 description 5
- 108090000246 Histone acetyltransferases Proteins 0.000 description 5
- 102000003893 Histone acetyltransferases Human genes 0.000 description 5
- 108010061833 Integrases Proteins 0.000 description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 210000003719 b-lymphocyte Anatomy 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000003776 cleavage reaction Methods 0.000 description 5
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 5
- 208000035475 disorder Diseases 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 210000002919 epithelial cell Anatomy 0.000 description 5
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 5
- 239000003112 inhibitor Substances 0.000 description 5
- 210000003734 kidney Anatomy 0.000 description 5
- 108010064235 lysylglycine Proteins 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- 230000007017 scission Effects 0.000 description 5
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 4
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 4
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 4
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 4
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 4
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 4
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 4
- 102000004533 Endonucleases Human genes 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- 101000702560 Homo sapiens Probable global transcription activator SNF2L1 Proteins 0.000 description 4
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 4
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 4
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 4
- 101710125418 Major capsid protein Proteins 0.000 description 4
- 108060004795 Methyltransferase Proteins 0.000 description 4
- 108010047562 NGR peptide Proteins 0.000 description 4
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 4
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 4
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 4
- 108091028664 Ribonucleotide Proteins 0.000 description 4
- 108091027544 Subgenomic mRNA Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 108010013835 arginine glutamate Proteins 0.000 description 4
- 230000000295 complement effect Effects 0.000 description 4
- 230000001351 cycling effect Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 239000005547 deoxyribonucleotide Substances 0.000 description 4
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 108091006047 fluorescent proteins Proteins 0.000 description 4
- 102000034287 fluorescent proteins Human genes 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 108010057821 leucylproline Proteins 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 4
- 108010054624 red fluorescent protein Proteins 0.000 description 4
- 239000002336 ribonucleotide Substances 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 241001515965 unidentified phage Species 0.000 description 4
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 3
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 3
- TZDNWXDLYFIFPT-BJDJZHNGSA-N Ala-Ile-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O TZDNWXDLYFIFPT-BJDJZHNGSA-N 0.000 description 3
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 3
- 108091023037 Aptamer Proteins 0.000 description 3
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 3
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 3
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 3
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 3
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 3
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 description 3
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 3
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 3
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 3
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 3
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 3
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 3
- 239000012981 Hank's balanced salt solution Substances 0.000 description 3
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 102100022823 Histone RNA hairpin-binding protein Human genes 0.000 description 3
- 101000825762 Homo sapiens Histone RNA hairpin-binding protein Proteins 0.000 description 3
- 108700003968 Human immunodeficiency virus 1 tat peptide (49-57) Proteins 0.000 description 3
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- KWTVLKBOQATPHJ-SRVKXCTJSA-N Leu-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N KWTVLKBOQATPHJ-SRVKXCTJSA-N 0.000 description 3
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 3
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 3
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 3
- 206010025323 Lymphomas Diseases 0.000 description 3
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 3
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 3
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 3
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 3
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 3
- 102100025169 Max-binding protein MNT Human genes 0.000 description 3
- 102000016397 Methyltransferase Human genes 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 3
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 3
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 3
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 3
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 3
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 3
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 108010068380 arginylarginine Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 229910002091 carbon monoxide Inorganic materials 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 125000003636 chemical group Chemical group 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 210000001671 embryonic stem cell Anatomy 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 210000002540 macrophage Anatomy 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 210000003071 memory t lymphocyte Anatomy 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 210000001616 monocyte Anatomy 0.000 description 3
- 201000000050 myeloid neoplasm Diseases 0.000 description 3
- 230000002018 overexpression Effects 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 108010031719 prolyl-serine Proteins 0.000 description 3
- 238000003753 real-time PCR Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 108091006107 transcriptional repressors Proteins 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- QVVDVENEPNODSI-BTNSXGMBSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylidene Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QVVDVENEPNODSI-BTNSXGMBSA-N 0.000 description 2
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 2
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 2
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 2
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 2
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 2
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- 101100412103 Arabidopsis thaliana REC3 gene Proteins 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 2
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 2
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 2
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 2
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 2
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 2
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 2
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 2
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 2
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 2
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 2
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 2
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 2
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 2
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- 241000713838 Avian myeloblastosis virus Species 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 102100021277 Beta-secretase 2 Human genes 0.000 description 2
- 101710150190 Beta-secretase 2 Proteins 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 238000010354 CRISPR gene editing Methods 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 101710132601 Capsid protein Proteins 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 101710094648 Coat protein Proteins 0.000 description 2
- 241000699800 Cricetinae Species 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 2
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 2
- 101710180243 Cytidine deaminase 1 Proteins 0.000 description 2
- 101710180259 Cytidine deaminase 2 Proteins 0.000 description 2
- 108010080611 Cytosine Deaminase Proteins 0.000 description 2
- 102000000311 Cytosine Deaminase Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 241000255925 Diptera Species 0.000 description 2
- 206010014611 Encephalitis venezuelan equine Diseases 0.000 description 2
- 102100031780 Endonuclease Human genes 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 102100036334 Fragile X mental retardation syndrome-related protein 1 Human genes 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 2
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 2
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 2
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 2
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 2
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 2
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 2
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 2
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 2
- QQLBPVKLJBAXBS-FXQIFTODSA-N Glu-Glu-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QQLBPVKLJBAXBS-FXQIFTODSA-N 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 2
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 2
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 2
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 2
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 2
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 2
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 2
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 2
- 108010002459 HIV Integrase Proteins 0.000 description 2
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 2
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 2
- 102100038885 Histone acetyltransferase p300 Human genes 0.000 description 2
- 102000006947 Histones Human genes 0.000 description 2
- 101000930945 Homo sapiens Fragile X mental retardation syndrome-related protein 1 Proteins 0.000 description 2
- 101000882390 Homo sapiens Histone acetyltransferase p300 Proteins 0.000 description 2
- 108700000788 Human immunodeficiency virus 1 tat peptide (47-57) Proteins 0.000 description 2
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 2
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 2
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 2
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 2
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 2
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 2
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 2
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 2
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 2
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 2
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 2
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 2
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 2
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 2
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 2
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 2
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 2
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 2
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 2
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 2
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 2
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 2
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 2
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 2
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 2
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 2
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 2
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 2
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 2
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 2
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 2
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 2
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 2
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 2
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 2
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 2
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 2
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 2
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 2
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- 241000699666 Mus <mouse, genus> Species 0.000 description 2
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 2
- 101710141454 Nucleoprotein Proteins 0.000 description 2
- 108010047956 Nucleosomes Proteins 0.000 description 2
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 2
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 2
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 2
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 2
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 2
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 2
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 2
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 2
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 2
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 2
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 2
- 101710083689 Probable capsid protein Proteins 0.000 description 2
- 229930185560 Pseudouridine Natural products 0.000 description 2
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 101710122931 Replication and transcription activator Proteins 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 101100528972 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RPD3 gene Proteins 0.000 description 2
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 2
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 2
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 2
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 2
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 2
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 2
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 2
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 2
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 2
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 2
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 2
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 2
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 2
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 2
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 2
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 102100035100 Transcription factor p65 Human genes 0.000 description 2
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 2
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 2
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 2
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 2
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 2
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 2
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 2
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 2
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 2
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 2
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 2
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 2
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 2
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 2
- 208000002687 Venezuelan Equine Encephalomyelitis Diseases 0.000 description 2
- 201000009145 Venezuelan equine encephalitis Diseases 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 108010081404 acein-2 Proteins 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 125000000304 alkynyl group Chemical group 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 210000000227 basophil cell of anterior lobe of hypophysis Anatomy 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 2
- 230000031018 biological processes and functions Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 108010006025 bovine growth hormone Proteins 0.000 description 2
- 210000004413 cardiac myocyte Anatomy 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 108091092356 cellular DNA Proteins 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 230000002124 endocrine Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000002907 exocrine cell Anatomy 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 238000001415 gene therapy Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 125000000404 glutamine group Chemical group N[C@@H](CCC(N)=O)C(=O)* 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 2
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 2
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 210000004153 islets of langerhan Anatomy 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 235000014705 isoleucine Nutrition 0.000 description 2
- 108010027338 isoleucylcysteine Proteins 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 210000003292 kidney cell Anatomy 0.000 description 2
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 2
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 2
- 108010012058 leucyltyrosine Proteins 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 210000005229 liver cell Anatomy 0.000 description 2
- 239000000314 lubricant Substances 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000036438 mutation frequency Effects 0.000 description 2
- 210000003098 myoblast Anatomy 0.000 description 2
- 210000001623 nucleosome Anatomy 0.000 description 2
- 201000008968 osteosarcoma Diseases 0.000 description 2
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000007634 remodeling Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000002207 retinal effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 229910052594 sapphire Inorganic materials 0.000 description 2
- 239000010980 sapphire Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 210000002325 somatostatin-secreting cell Anatomy 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 108700029760 synthetic LTSP Proteins 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005030 transcription termination Effects 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- RAVVEEJGALCVIN-AGVBWZICSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-5-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2-[[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]hexanoyl]amino]hexanoyl]amino]-5-(diamino Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RAVVEEJGALCVIN-AGVBWZICSA-N 0.000 description 1
- OJHZNMVJJKMFGX-RNWHKREASA-N (4r,4ar,7ar,12bs)-9-methoxy-3-methyl-1,2,4,4a,5,6,7a,13-octahydro-4,12-methanobenzofuro[3,2-e]isoquinoline-7-one;2,3-dihydroxybutanedioic acid Chemical compound OC(=O)C(O)C(O)C(O)=O.O=C([C@@H]1O2)CC[C@H]3[C@]4([H])N(C)CC[C@]13C1=C2C(OC)=CC=C1C4 OJHZNMVJJKMFGX-RNWHKREASA-N 0.000 description 1
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- VGIRNWJSIRVFRT-UHFFFAOYSA-N 2',7'-difluorofluorescein Chemical compound OC(=O)C1=CC=CC=C1C1=C2C=C(F)C(=O)C=C2OC2=CC(O)=C(F)C=C21 VGIRNWJSIRVFRT-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- GXPCCSYVSYFRDU-LJWNLINESA-N 2-[[(2s)-2-[[(2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O)C1=CC=CC=C1 GXPCCSYVSYFRDU-LJWNLINESA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 1
- QQXLSKDNWDGVLG-UHFFFAOYSA-N 2-benzyl-1-ethoxyimidazole Chemical compound CCON1C=CN=C1CC1=CC=CC=C1 QQXLSKDNWDGVLG-UHFFFAOYSA-N 0.000 description 1
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- LQEZHWGJSWHXPJ-UHFFFAOYSA-N 5-(4-carboxyphenyl)benzene-1,3-dicarboxylic acid Chemical compound C1=CC(C(=O)O)=CC=C1C1=CC(C(O)=O)=CC(C(O)=O)=C1 LQEZHWGJSWHXPJ-UHFFFAOYSA-N 0.000 description 1
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 1
- 108010013043 Acetylesterase Proteins 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108700040115 Adenosine deaminases Proteins 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- FDAZDMAFZYTHGS-XVYDVKMFSA-N Ala-His-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FDAZDMAFZYTHGS-XVYDVKMFSA-N 0.000 description 1
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- MDNAVFBZPROEHO-DCAQKATOSA-N Ala-Lys-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MDNAVFBZPROEHO-DCAQKATOSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- WPWUFUBLGADILS-WDSKDSINSA-N Ala-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WPWUFUBLGADILS-WDSKDSINSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- OMCKWYSDUQBYCN-FXQIFTODSA-N Ala-Ser-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O OMCKWYSDUQBYCN-FXQIFTODSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- PXAFZDXYEIIUTF-LKTVYLICSA-N Ala-Trp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXAFZDXYEIIUTF-LKTVYLICSA-N 0.000 description 1
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- 101000935845 Aliivibrio fischeri Blue fluorescence protein Proteins 0.000 description 1
- 101710095342 Apolipoprotein B Proteins 0.000 description 1
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 1
- 101100339431 Arabidopsis thaliana HMGB2 gene Proteins 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- QKSAZKCRVQYYGS-UWVGGRQHSA-N Arg-Gly-His Chemical compound N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QKSAZKCRVQYYGS-UWVGGRQHSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 1
- ASQKVGRCKOFKIU-KZVJFYERSA-N Arg-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ASQKVGRCKOFKIU-KZVJFYERSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 1
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- NPDLYUOYAGBHFB-WDSKDSINSA-N Asn-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NPDLYUOYAGBHFB-WDSKDSINSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 1
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 1
- HYQYLOSCICEYTR-YUMQZZPRSA-N Asn-Gly-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O HYQYLOSCICEYTR-YUMQZZPRSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- ATYWBXGNXZYZGI-ACZMJKKPSA-N Asp-Asn-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ATYWBXGNXZYZGI-ACZMJKKPSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- WQSXAPPYLGNMQL-IHRRRGAJSA-N Asp-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N WQSXAPPYLGNMQL-IHRRRGAJSA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Chemical group OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108091005950 Azurite Proteins 0.000 description 1
- 210000002237 B-cell of pancreatic islet Anatomy 0.000 description 1
- 241000606125 Bacteroides Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 102100027310 Bromodomain adjacent to zinc finger domain protein 1A Human genes 0.000 description 1
- 102100040399 C->U-editing enzyme APOBEC-2 Human genes 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 101100381481 Caenorhabditis elegans baz-2 gene Proteins 0.000 description 1
- 101100042630 Caenorhabditis elegans sin-3 gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102100031437 Cell cycle checkpoint protein RAD1 Human genes 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 241000282552 Chlorocebus aethiops Species 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 102100039095 Chromatin-remodeling ATPase INO80 Human genes 0.000 description 1
- 102000017589 Chromo domains Human genes 0.000 description 1
- 108050005811 Chromo domains Proteins 0.000 description 1
- 102100035371 Chymotrypsin-like elastase family member 1 Human genes 0.000 description 1
- 101710138848 Chymotrypsin-like elastase family member 1 Proteins 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 108010051219 Cre recombinase Proteins 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- LHJDLVVQRJIURS-SRVKXCTJSA-N Cys-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N LHJDLVVQRJIURS-SRVKXCTJSA-N 0.000 description 1
- 241000701022 Cytomegalovirus Species 0.000 description 1
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 1
- 102100040262 DNA dC->dU-editing enzyme APOBEC-3B Human genes 0.000 description 1
- 102100040261 DNA dC->dU-editing enzyme APOBEC-3C Human genes 0.000 description 1
- 102100040264 DNA dC->dU-editing enzyme APOBEC-3D Human genes 0.000 description 1
- 102100040266 DNA dC->dU-editing enzyme APOBEC-3F Human genes 0.000 description 1
- 102100038076 DNA dC->dU-editing enzyme APOBEC-3G Human genes 0.000 description 1
- 102100038050 DNA dC->dU-editing enzyme APOBEC-3H Human genes 0.000 description 1
- 101710082737 DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 1
- 230000006463 DNA deamination Effects 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 102100033934 DNA repair protein RAD51 homolog 2 Human genes 0.000 description 1
- 102100036912 Desmin Human genes 0.000 description 1
- 108010044052 Desmin Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 108091005941 EBFP Proteins 0.000 description 1
- 108091005947 EBFP2 Proteins 0.000 description 1
- 108091005942 ECFP Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101710099240 Elastase-1 Proteins 0.000 description 1
- 102100037241 Endoglin Human genes 0.000 description 1
- 108010036395 Endoglin Proteins 0.000 description 1
- 101900009012 Epstein-Barr virus Replication and transcription activator Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 101000935842 Escherichia coli O127:H6 (strain E2348/69 / EPEC) Major structural subunit of bundle-forming pilus Proteins 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 108010046276 FLP recombinase Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 206010056740 Genital discharge Diseases 0.000 description 1
- 108010014458 Gin recombinase Proteins 0.000 description 1
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 description 1
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 1
- ZVQZXPADLZIQFF-FHWLQOOXSA-N Gln-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 ZVQZXPADLZIQFF-FHWLQOOXSA-N 0.000 description 1
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 1
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 1
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- PBEQPAZRHDVJQI-SRVKXCTJSA-N Glu-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N PBEQPAZRHDVJQI-SRVKXCTJSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- QPRZKNOOOBWXSU-CIUDSAMLSA-N Glu-Asp-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N QPRZKNOOOBWXSU-CIUDSAMLSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- YLJHCWNDBKKOEB-IHRRRGAJSA-N Glu-Glu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YLJHCWNDBKKOEB-IHRRRGAJSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- NJPQBTJSYCKCNS-HVTMNAMFSA-N Glu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N NJPQBTJSYCKCNS-HVTMNAMFSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- AQNYKMCFCCZEEL-JYJNAYRXSA-N Glu-Lys-Tyr Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AQNYKMCFCCZEEL-JYJNAYRXSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- CBWKURKPYSLMJV-SOUVJXGZSA-N Glu-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CBWKURKPYSLMJV-SOUVJXGZSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- BYYNJRSNDARRBX-YFKPBYRVSA-N Gly-Gln-Gly Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O BYYNJRSNDARRBX-YFKPBYRVSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- HFXJIZNEXNIZIJ-BQBZGAKWSA-N Gly-Glu-Gln Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFXJIZNEXNIZIJ-BQBZGAKWSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- BBTCXWTXOXUNFX-IUCAKERBSA-N Gly-Met-Arg Chemical compound CSCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O BBTCXWTXOXUNFX-IUCAKERBSA-N 0.000 description 1
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- NVTPVQLIZCOJFK-FOHZUACHSA-N Gly-Thr-Asp Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O NVTPVQLIZCOJFK-FOHZUACHSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- PYFIQROSWQERAS-LBPRGKRZSA-N Gly-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)CN)C(=O)NCC(O)=O)=CNC2=C1 PYFIQROSWQERAS-LBPRGKRZSA-N 0.000 description 1
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108010012029 Guanine Deaminase Proteins 0.000 description 1
- 102000013587 Guanine deaminase Human genes 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 108700010013 HMGB1 Proteins 0.000 description 1
- 101150021904 HMGB1 gene Proteins 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 102100031880 Helicase SRCAP Human genes 0.000 description 1
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 1
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 1
- 206010019695 Hepatic neoplasm Diseases 0.000 description 1
- 102100028177 High mobility group nucleosome-binding domain-containing protein 4 Human genes 0.000 description 1
- 102100028176 High mobility group nucleosome-binding domain-containing protein 5 Human genes 0.000 description 1
- 102100037907 High mobility group protein B1 Human genes 0.000 description 1
- 102100022128 High mobility group protein B2 Human genes 0.000 description 1
- 102100022130 High mobility group protein B3 Human genes 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- IDQNVIWPPWAFSY-AVGNSLFASA-N His-His-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O IDQNVIWPPWAFSY-AVGNSLFASA-N 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- CZVQSYNVUHAILZ-UWVGGRQHSA-N His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 CZVQSYNVUHAILZ-UWVGGRQHSA-N 0.000 description 1
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 1
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102100037487 Histone H1.0 Human genes 0.000 description 1
- 102100039869 Histone H2B type F-S Human genes 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 101000937778 Homo sapiens Bromodomain adjacent to zinc finger domain protein 1A Proteins 0.000 description 1
- 101000964322 Homo sapiens C->U-editing enzyme APOBEC-2 Proteins 0.000 description 1
- 101001130384 Homo sapiens Cell cycle checkpoint protein RAD1 Proteins 0.000 description 1
- 101001033682 Homo sapiens Chromatin-remodeling ATPase INO80 Proteins 0.000 description 1
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 1
- 101000964385 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3B Proteins 0.000 description 1
- 101000964383 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3C Proteins 0.000 description 1
- 101000964382 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3D Proteins 0.000 description 1
- 101000964377 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3F Proteins 0.000 description 1
- 101001132307 Homo sapiens DNA repair protein RAD51 homolog 2 Proteins 0.000 description 1
- 101000704158 Homo sapiens Helicase SRCAP Proteins 0.000 description 1
- 101001006375 Homo sapiens High mobility group nucleosome-binding domain-containing protein 4 Proteins 0.000 description 1
- 101001006376 Homo sapiens High mobility group nucleosome-binding domain-containing protein 5 Proteins 0.000 description 1
- 101001045791 Homo sapiens High mobility group protein B2 Proteins 0.000 description 1
- 101001045794 Homo sapiens High mobility group protein B3 Proteins 0.000 description 1
- 101001026554 Homo sapiens Histone H1.0 Proteins 0.000 description 1
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 1
- 101000608935 Homo sapiens Leukosialin Proteins 0.000 description 1
- 101000934372 Homo sapiens Macrosialin Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101000866795 Homo sapiens Non-histone chromosomal protein HMG-14 Proteins 0.000 description 1
- 101000866805 Homo sapiens Non-histone chromosomal protein HMG-17 Proteins 0.000 description 1
- 101000800426 Homo sapiens Putative C->U-editing enzyme APOBEC-4 Proteins 0.000 description 1
- 101000897979 Homo sapiens Putative spermatid-specific linker histone H1-like protein Proteins 0.000 description 1
- 101001079872 Homo sapiens RING finger protein 112 Proteins 0.000 description 1
- 101001012157 Homo sapiens Receptor tyrosine-protein kinase erbB-2 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000702544 Homo sapiens SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily A member 5 Proteins 0.000 description 1
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 1
- 101000801209 Homo sapiens Transducin-like enhancer protein 4 Proteins 0.000 description 1
- 208000023105 Huntington disease Diseases 0.000 description 1
- 241000235789 Hyperoartia Species 0.000 description 1
- 102000044753 ISWI Human genes 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 1
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 1
- SACHLUOUHCVIKI-GMOBBJLQSA-N Ile-Arg-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SACHLUOUHCVIKI-GMOBBJLQSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- PHIXPNQDGGILMP-YVNDNENWSA-N Ile-Glu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PHIXPNQDGGILMP-YVNDNENWSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 1
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 1
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- UYODHPPSCXBNCS-XUXIUFHCSA-N Ile-Val-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C UYODHPPSCXBNCS-XUXIUFHCSA-N 0.000 description 1
- 206010061598 Immunodeficiency Diseases 0.000 description 1
- 208000029462 Immunodeficiency disease Diseases 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 102100025306 Integrin alpha-IIb Human genes 0.000 description 1
- 101710149643 Integrin alpha-IIb Proteins 0.000 description 1
- 102100037872 Intercellular adhesion molecule 2 Human genes 0.000 description 1
- 101710148794 Intercellular adhesion molecule 2 Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical group OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- JQSXWJXBASFONF-KKUMJFAQSA-N Leu-Asp-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JQSXWJXBASFONF-KKUMJFAQSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- HFBCHNRFRYLZNV-GUBZILKMSA-N Leu-Glu-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HFBCHNRFRYLZNV-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- JFSGIJSCJFQGSZ-MXAVVETBSA-N Leu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N JFSGIJSCJFQGSZ-MXAVVETBSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- DCGXHWINSHEPIR-SRVKXCTJSA-N Leu-Lys-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N DCGXHWINSHEPIR-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- 102100039564 Leukosialin Human genes 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- OAPNERBWQWUPTI-YUMQZZPRSA-N Lys-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O OAPNERBWQWUPTI-YUMQZZPRSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- GFWLIJDQILOEPP-HSCHXYMDSA-N Lys-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N GFWLIJDQILOEPP-HSCHXYMDSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- GZGWILAQHOVXTD-DCAQKATOSA-N Lys-Met-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O GZGWILAQHOVXTD-DCAQKATOSA-N 0.000 description 1
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 1
- BOJYMMBYBNOOGG-DCAQKATOSA-N Lys-Pro-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O BOJYMMBYBNOOGG-DCAQKATOSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- YQAIUOWPSUOINN-IUCAKERBSA-N Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN YQAIUOWPSUOINN-IUCAKERBSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- 102100025136 Macrosialin Human genes 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 210000002361 Megakaryocyte Progenitor Cell Anatomy 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 1
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- MSSJHBAKDDIRMJ-SRVKXCTJSA-N Met-Lys-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O MSSJHBAKDDIRMJ-SRVKXCTJSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 1
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 101000981253 Mus musculus GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Proteins 0.000 description 1
- 101100123313 Mus musculus H1.8 gene Proteins 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 101150007813 NIH gene Proteins 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 102100031353 Non-histone chromosomal protein HMG-14 Human genes 0.000 description 1
- 102100031346 Non-histone chromosomal protein HMG-17 Human genes 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000010718 Oxidation Activity Effects 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- NEHSHYOUIWBYSA-DCPHZVHLSA-N Phe-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC3=CC=CC=C3)N NEHSHYOUIWBYSA-DCPHZVHLSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- QCHNRQQVLJYDSI-DLOVCJGASA-N Phe-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 QCHNRQQVLJYDSI-DLOVCJGASA-N 0.000 description 1
- WIVCOAKLPICYGY-KKUMJFAQSA-N Phe-Asp-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N WIVCOAKLPICYGY-KKUMJFAQSA-N 0.000 description 1
- UMKYAYXCMYYNHI-AVGNSLFASA-N Phe-Gln-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N UMKYAYXCMYYNHI-AVGNSLFASA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- SWCOXQLDICUYOL-ULQDDVLXSA-N Phe-His-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SWCOXQLDICUYOL-ULQDDVLXSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- KZRQONDKKJCAOL-DKIMLUQUSA-N Phe-Leu-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KZRQONDKKJCAOL-DKIMLUQUSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- PTLMYJOMJLTMCB-KKUMJFAQSA-N Phe-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N PTLMYJOMJLTMCB-KKUMJFAQSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- ZYFVNVRFVHJEIU-UHFFFAOYSA-N PicoGreen Chemical compound CN(C)CCCN(CCCN(C)C)C1=CC(=CC2=[N+](C3=CC=CC=C3S2)C)C2=CC=CC=C2N1C1=CC=CC=C1 ZYFVNVRFVHJEIU-UHFFFAOYSA-N 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- SSWJYJHXQOYTSP-SRVKXCTJSA-N Pro-His-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O SSWJYJHXQOYTSP-SRVKXCTJSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- BCNRNJWSRFDPTQ-HJWJTTGWSA-N Pro-Ile-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BCNRNJWSRFDPTQ-HJWJTTGWSA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- CHYAYDLYYIJCKY-OSUNSFLBSA-N Pro-Thr-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CHYAYDLYYIJCKY-OSUNSFLBSA-N 0.000 description 1
- RSTWKJFWBKFOFC-JYJNAYRXSA-N Pro-Trp-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O RSTWKJFWBKFOFC-JYJNAYRXSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 108010043400 Protamine Kinase Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 101710149951 Protein Tat Proteins 0.000 description 1
- 102100033091 Putative C->U-editing enzyme APOBEC-4 Human genes 0.000 description 1
- 102100021861 Putative spermatid-specific linker histone H1-like protein Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 101100372762 Rattus norvegicus Flt1 gene Proteins 0.000 description 1
- 102100030086 Receptor tyrosine-protein kinase erbB-2 Human genes 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 108090000820 Rhodopsin Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 101150071661 SLC25A20 gene Proteins 0.000 description 1
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108091061750 Signal recognition particle RNA Proteins 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000702031 Streptomyces phage R4 Species 0.000 description 1
- 241000701955 Streptomyces virus phiC31 Species 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 102100021905 Synapsin-1 Human genes 0.000 description 1
- 206010043395 Thalassaemia sickle cell Diseases 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- BGHVVGPELPHRCI-HZTRNQAASA-N Thr-Trp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N)O BGHVVGPELPHRCI-HZTRNQAASA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 102000005747 Transcription Factor RelA Human genes 0.000 description 1
- 108010031154 Transcription Factor RelA Proteins 0.000 description 1
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 1
- 102100033763 Transducin-like enhancer protein 4 Human genes 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- UUIYFDAWNBSWPG-IHPCNDPISA-N Trp-Lys-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N UUIYFDAWNBSWPG-IHPCNDPISA-N 0.000 description 1
- IYHRKILQAQWODS-VJBMBRPKSA-N Trp-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IYHRKILQAQWODS-VJBMBRPKSA-N 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- NIHNMOSRSAYZIT-BPNCWPANSA-N Tyr-Ala-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NIHNMOSRSAYZIT-BPNCWPANSA-N 0.000 description 1
- BURPTJBFWIOHEY-UWJYBYFXSA-N Tyr-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BURPTJBFWIOHEY-UWJYBYFXSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 1
- LFCQXIXJQXWZJI-BZSNNMDCSA-N Tyr-His-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N)O LFCQXIXJQXWZJI-BZSNNMDCSA-N 0.000 description 1
- FBHBVXUBTYVCRU-BZSNNMDCSA-N Tyr-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CN=CN1 FBHBVXUBTYVCRU-BZSNNMDCSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- PSALWJCUIAQKFW-ACRUOGEOSA-N Tyr-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N PSALWJCUIAQKFW-ACRUOGEOSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- AKRHKDCELJLTMD-BVSLBCMMSA-N Tyr-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N AKRHKDCELJLTMD-BVSLBCMMSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- UUJHRSTVQCFDPA-UFYCRDLUSA-N Tyr-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 UUJHRSTVQCFDPA-UFYCRDLUSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- 102100037111 Uracil-DNA glycosylase Human genes 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 208000020329 Zika virus infectious disease Diseases 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 108010028939 alanyl-alanyl-lysyl-alanine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010011559 alanylphenylalanine Proteins 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000004450 alkenylene group Chemical group 0.000 description 1
- 125000003545 alkoxy group Chemical group 0.000 description 1
- 125000000217 alkyl group Chemical group 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 125000002947 alkylene group Chemical group 0.000 description 1
- 125000004419 alkynylene group Chemical group 0.000 description 1
- 230000000735 allogeneic effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 210000002821 alveolar epithelial cell Anatomy 0.000 description 1
- 238000005576 amination reaction Methods 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 125000003710 aryl alkyl group Chemical group 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 210000003030 auditory receptor cell Anatomy 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- 210000000013 bile duct Anatomy 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 230000008238 biochemical pathway Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000000424 bronchial epithelial cell Anatomy 0.000 description 1
- 210000001593 brown adipocyte Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 101150102633 cact gene Proteins 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 125000002680 canonical nucleotide group Chemical group 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- BHONFOAYRQZPKZ-LCLOTLQISA-N chembl269478 Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=CC=C1 BHONFOAYRQZPKZ-LCLOTLQISA-N 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000020335 dealkylation Effects 0.000 description 1
- 238000006900 dealkylation reaction Methods 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000006114 demyristoylation Effects 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 210000005045 desmin Anatomy 0.000 description 1
- 230000029180 desumoylation Effects 0.000 description 1
- 230000010460 detection of virus Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 239000007884 disintegrant Substances 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000006353 environmental stress Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 1
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 1
- 210000003999 epithelial cell of bile duct Anatomy 0.000 description 1
- 210000003013 erythroid precursor cell Anatomy 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 210000000604 fetal stem cell Anatomy 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 239000013022 formulation composition Substances 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000003198 gene knock in Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 102000018146 globin Human genes 0.000 description 1
- 108060003196 globin Proteins 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 210000002768 hair cell Anatomy 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 210000004024 hepatic stellate cell Anatomy 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 125000001072 heteroaryl group Chemical group 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 210000003630 histaminocyte Anatomy 0.000 description 1
- 108010040030 histidinoalanine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000007813 immunodeficiency Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000000530 impalefection Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 210000000067 inner hair cell Anatomy 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 210000004966 intestinal stem cell Anatomy 0.000 description 1
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 210000001865 kupffer cell Anatomy 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 210000003738 lymphoid progenitor cell Anatomy 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010043322 lysyl-tryptophyl-alpha-lysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108091005949 mKalama1 Proteins 0.000 description 1
- 125000005439 maleimidyl group Chemical class C1(C=CC(N1*)=O)=O 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 210000003593 megakaryocyte Anatomy 0.000 description 1
- 210000001806 memory b lymphocyte Anatomy 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 235000006109 methionine Nutrition 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 210000003643 myeloid progenitor cell Anatomy 0.000 description 1
- 230000002107 myocardial effect Effects 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 1
- 210000000581 natural killer T-cell Anatomy 0.000 description 1
- 210000001178 neural stem cell Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000004248 oligodendroglia Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 210000002997 osteoclast Anatomy 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 210000002571 pancreatic alpha cell Anatomy 0.000 description 1
- 210000000277 pancreatic duct Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 108010091617 pentalysine Proteins 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 210000000608 photoreceptor cell Anatomy 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 210000000229 preadipocyte Anatomy 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 210000001948 pro-b lymphocyte Anatomy 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 210000003289 regulatory T cell Anatomy 0.000 description 1
- 210000001995 reticulocyte Anatomy 0.000 description 1
- 210000000964 retinal cone photoreceptor cell Anatomy 0.000 description 1
- 239000000790 retinal pigment Substances 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 210000004116 schwann cell Anatomy 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 210000001057 smooth muscle myoblast Anatomy 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 108091035705 tRNA adenine Proteins 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- GWBUNZLLLLDXMD-UHFFFAOYSA-H tricopper;dicarbonate;dihydroxide Chemical compound [OH-].[OH-].[Cu+2].[Cu+2].[Cu+2].[O-]C([O-])=O.[O-]C([O-])=O GWBUNZLLLLDXMD-UHFFFAOYSA-H 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 210000005167 vascular cell Anatomy 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
- 210000000636 white adipocyte Anatomy 0.000 description 1
- 238000002689 xenotransplantation Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Abstract
요약서
공작된 Cas9 단백질 변이체들과 시스템, 전술한 단백질 변이체들과 시스템을 인코딩하는 핵산, 그리고 게놈 변형을 위해 전술한 단백질 변이체들과 시스템을 만들고, 이용하는 방법.
공작된 Cas9 단백질 변이체들과 시스템, 전술한 단백질 변이체들과 시스템을 인코딩하는 핵산, 그리고 게놈 변형을 위해 전술한 단백질 변이체들과 시스템을 만들고, 이용하는 방법.
Description
관련 출원에 대한 상호-참조
본 출원은 2020년 3월 11일자로 제출된 미국 가출원 번호62/988,279를 우선권으로 주장하며, 이의 전문이 본 명세서의 참고자료에 편입된다.
서열 목록
본 출원은 ASCII 포멧으로 전자적으로 제출된 서열 목록을 포함하며, 이의 전문은 본 명세서의 참고자료에 편입된다. 2021년 3월 11일에 작성된 상기 ASCII 사본은 파일명을 "P20-035_WO-PCT_SL.txt"라고 하고, 크기는 49,120 바이트이다.
명세서의 분야
본 명세서는 공작된 Cas9 단백질 변이체들과 시스템, 전술한 단백질 변이체들과 시스템을 인코딩하는 핵산, 그리고 게놈 변형을 위해 전술한 단백질 변이체들과 시스템을 만들고, 이용하는 방법들에 관계한다.
본 명세서의 배경
스트렙토코커스 피오게네스(Streptococcus pyogenes) CRISPR Cas9 (SpCas9)는 많은 유형의 세포 및 유기체에서 게놈 편집 엔도뉴클라제로 널리 채택되었다. 그러나, 상기 야생형 뉴클라제는 표적 부위와 유사한 서열을 갖는, 의도하지 않은 게놈 부위에서 돌연변이를 일으키는 경향이 있다. 개선된 특이성을 가진 몇 가지 SpCas9 변이체들이 이러한 단점을 완화하기 위해 개발되었다. 이런 변이체들에는 다음의 것들이 내포된다: eSpCas9 1.0 (K810A, K1003A, R1060A), eSpCas9 1.1 (K848A, K1003A, R1060A), SpCas9-HF1 (N497A, R661A, Q695A, Q926A), HypaCas9 (N692A, M694A, Q695A, H698A), EvoCas9 (M495V, Y515N, K526E, R661L), Sniper Cas9 (F539S, M763I, K890N), HiFi Cas9 V3 (R691A), Opti-SpCas9 (R661A 및 K1003H), 그리고 OptiHF-SpCas9 (Q695A, K848A, E293M, T924V 및 Q926A) (Slaymaker et al., Science 351, 84-88; Kleinstiver et al., Nature 523, 490-495; Chen et al. Nature 550, 407-410; Casini et al., Nature Biotechnology 36, 265-271; Lee et al., Nature Communications 9, 3048; Vakulskas et al., Nature Medicine 24, 1216-1224; Choi et al., Nature Methods 16, 722-730). 그러나, 이러한 변이체의 대부분은 플라스미드 형태의 스크리닝을 통해 확인되었으며. 리보핵단백질(RNP) 전달을 통하여, 게놈 변형용으로 재조합 단백질로의 전환은 종종 낮은 활성을 초래했다.
게놈 변형에서 SpCas9 재조합 단백질에 대한 수요가 크게 증가함에 따라, 상이한 게놈 부위들에 걸쳐 향상된 특이성과 지속적인 활성으로 수행할 수 있는 재조합 단백질 형태의 뉴클레아제가 필요하다.
본 명세서의 요약
본 발명의 다양한 측면 중에는, 공작된 Cas9 단백질 변이체 및 이를 포함하는 시스템의 공급이 있다.
간략하게 설명하자면, 따라서, 본 명세서는 아미노산 위치들 526, 562, 652, 661, 691, 780, 810, 848, 855, 1003, 그리고 1060의 아미노산 위치중 하나, 둘 또는 그 이상의 위치에 변형을 포함하는 공작된 스트렙토코커스 피오게네스 Cas9 (SpCas9) 단백질 변이체에 관계하며, 이때 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 있는 리신(K)는 류신 (L) 또는 글루타민 (Q)으로 변화되고, 및/또는 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 있는 아르기닌 (R)은 류신 (L) 또는 글루타민 (Q)으로 변화된다. 예를 들면, 하나의 예시적인 구체예에서, 상기 공작된 SpCas9 단백질 변이체는 아미노산 위치 526, 562, 652, 661, 691, 780, 810, 848, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 K855L/Q 돌연변이 및 적어도 하나의 다른 돌연변이를 포함한다. 또다른 예시적인 구체예에서, 상기 공작된 SpCas9 단백질 변이체는 아미노산 위치 526, 562, 652, 691, 780, 810, 848, 855, 1003, 및 1060 (트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 R661L/Q 돌연변이 및 적어도 하나의 다른 돌연변이를 포함한다. 특정 구체예에서, 상기 돌연변이들은 다음의 군에서 선택된다: K562L-R661L-K855Q; K562Q-R661L-K855Q; K652L-R661L-K855Q; 및 K652Q-R661L-K855Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라).
본 명세서의 또다른 측면은 본 명세서에서 기술된 상기 공작된 Cas9 단백질 변이체들 및 적어도 하나의 공작된 가이드 RNA(들)을 포함하는 공작된 Cas9 시스템에 관계하며, 이때 각 공작된 가이드 RNA는 상기 공작된 Cas9 단백질 변이체와 복합되도록 기획된다.
본 명세서의 또다른 측면은 상기 공작된 Cas9 단백질 변이체들을 인코딩하는 핵산과 이를 포함하는 시스템에 관계한다. 상기 핵산들을 포함하는 벡터들이 또한 제공된다.
본 명세서의 또다른 측면은 본원에 기술된 상기 공작된 Cas9 단백질 변이체들과 시스템을 만드는 방법 및 이용하는 방법에 관계한다.
다른 목적 및 특징은 이하에서 어느 정도 명백해지고 부분적으로 지적될 것이다.
도 1A는 인간 U-2 OS 세포내 HEKSite4 표적 부위에서 K855 잔기 상에 5개 상이한 치환의 겨냥된(on-target) 활성을 나타낸다. K855E 및 K855A는 겨냥된 활성의 축소를 초래한다 (실시예 1). 도면에서 서열 식별 번호:73이 도시된다.
도 1B는 인간 U-2 OS 세포내 HEKSite4 표적-외 부위에서 K855 잔기 상에 5개 상이한 치환의 표적을 벗어난(off-target) 활성을 나타낸다 (실시예 1). 도면에서 서열 식별 번호:74가 도시된다.
도 2는 인간 U-2 OS 세포 (실시예 2)내 HEKSite4 표적 부위에서 R661, N692, 또는 Q695 잔기 상에 상이한 치환의 겨냥된 활성을 나타낸다. 도면에서 서열 식별 번호:73이 도시된다.
도 3A는 인간 K562 세포내 FANCF02 표적 부위에서 삼중 및 사중 돌연변이 단백질의 겨냥된 활성을 나타낸다 (실시예 3). 도면에서 서열 식별 번호:75가 도시된다.
도 3B는 인간 K562 세포 내 FANCF02 단일 불합치 표적-외 부위에서 삼중 및 사중 돌연변이 단백질의 표적을 벗어난 활성을 나타낸다 (실시예 3). 도면에서 서열 식별 번호:76이 도시된다.
도 3C는 인간 K562 세포내 HBB03 표적 부위에서 삼중 및 사중 돌연변이 단백질의 겨냥된 활성을 나타낸다 (실시예 3). 도면에서 서열 식별 번호:77이 도시된다.
도 3D는 인간 K562 세포 내 HBB03 단일 불합치 표적-외 부위에서 삼중 및 사중 돌연변이 단백질의 표적을 벗어난 활성을 나타낸다 (실시예 3). 도면에서 서열 식별 번호:78이 도시된다.
도 4는 K562 세포 내 5개 상이한 게놈 부위에서 선별된 그룹의 돌연변이 단백질의 겨냥된 활성을 나타낸다 (실시예 4). 도면에서 보이는 순서대로 차례로 서열 식별 번호: 79-83이 도시된다.
도 1B는 인간 U-2 OS 세포내 HEKSite4 표적-외 부위에서 K855 잔기 상에 5개 상이한 치환의 표적을 벗어난(off-target) 활성을 나타낸다 (실시예 1). 도면에서 서열 식별 번호:74가 도시된다.
도 2는 인간 U-2 OS 세포 (실시예 2)내 HEKSite4 표적 부위에서 R661, N692, 또는 Q695 잔기 상에 상이한 치환의 겨냥된 활성을 나타낸다. 도면에서 서열 식별 번호:73이 도시된다.
도 3A는 인간 K562 세포내 FANCF02 표적 부위에서 삼중 및 사중 돌연변이 단백질의 겨냥된 활성을 나타낸다 (실시예 3). 도면에서 서열 식별 번호:75가 도시된다.
도 3B는 인간 K562 세포 내 FANCF02 단일 불합치 표적-외 부위에서 삼중 및 사중 돌연변이 단백질의 표적을 벗어난 활성을 나타낸다 (실시예 3). 도면에서 서열 식별 번호:76이 도시된다.
도 3C는 인간 K562 세포내 HBB03 표적 부위에서 삼중 및 사중 돌연변이 단백질의 겨냥된 활성을 나타낸다 (실시예 3). 도면에서 서열 식별 번호:77이 도시된다.
도 3D는 인간 K562 세포 내 HBB03 단일 불합치 표적-외 부위에서 삼중 및 사중 돌연변이 단백질의 표적을 벗어난 활성을 나타낸다 (실시예 3). 도면에서 서열 식별 번호:78이 도시된다.
도 4는 K562 세포 내 5개 상이한 게놈 부위에서 선별된 그룹의 돌연변이 단백질의 겨냥된 활성을 나타낸다 (실시예 4). 도면에서 보이는 순서대로 차례로 서열 식별 번호: 79-83이 도시된다.
상세한 설명
게놈 변형에서 SpCas9 재조합 단백질에 대한 수요가 크게 증가함에 따라, 상이한 게놈 부위들에 걸쳐 향상된 특이성과 지속적인 활성으로 수행할 수 있는 재조합 단백질 형태의 뉴클레아제가 필요하다. 재조합 단백질-기반의 스크리닝 접근법을 이용하여, 상이한 수준의 특이성 및 활성을 갖는 적어도 두 개의 상이한 그룹의 SpCas9 변이체들이 확인되었다. 한 그룹은 다른 SpCas9 변이체들과 비교하여 상당히 높은 수준의 특이성을 갖지만, 그러나 상이한 게놈 부위 간에 매우 가변적인 활성을 갖는다. 또 다른 그룹은 활성에서 잘-확립된 eSpCas9 1.1과 특이성에서 최근 개발된 HiFi Cas9 V3을 능가하는 균형잡힌 특이성과 활성을 가지고 있다. 이 뉴클레아제 그룹은 진핵 세포의 게놈 변형에 광범위하게 적용할 수 있는 큰 잠재력을 보유하고 있다.
높은 충실도 SpCas9 변이체를 개발하려는 기존 시도들은 특정 플라스미드 발현-기반의 선택 체계에 크게 의존했다. 이러한 변이체들은 재조합 단백질로 사용될 때, 대개 낮은 활성을 보인다. 특정 이론에 결부되지 않고, 포유동물 세포에서 플라스미드 과다발현은 특이성을 증가시키는 돌연변이에 의해 야기된 이러한 변이체의 감쇠된 활성을 위장할 수 있는 것으로 추측된다. 플라스미드 과다-발현의 이러한 교란 효과를 피하기 위해, 상기 클라제를 개선시키기 위한 재조합 단백질-기반의 스크리닝 접근법이 이용되었다. 더욱이, 주요 잔기를 돌연변이시키기 위해 늘 이용되었던 알라닌 치환을 사용하는 이전의 시도와 달리, 특이성을 개선하면서 표적 활성을 유지하기 위해 최적의 아미노산 치환이 사용되었다. 이러한 차이점은 현재 공개된 단백질을 기존 SpCas9 단백질 공작 시도로부터 파생된 단백질과는 방법론적으로 구별된다.
상기 돌연변이들 및 이들의 조합은 Cas9 DNA 기질 결합 안정성의 기초가 되는 상이한 기전에 관련된 것으로 추정되는 주요 잔기를 함유하고, 한편 기존 시도는 돌연변이 조합을 아마도 하나의 기전에 관련된 주요 잔기로 국한시켰다. 예를 들면, eSpCas9는 양전하를 띤 잔기가 가닥 분리 시, 비-표적 가닥을 안정화한다는 가설에 기초하여, 이들 비-표적 가닥의 음으로 하전된 인산염 백본과 상호작용하는 보존된 양전하를 띤 아미노산 잔기를 돌연변이시킨 후, 후속적으로 가이드 RNA-표적 DNA 헤테로듀플렉스 형성을 안정화함으로써 개발되었다 (Slaymaker et al., Science 351, 84-88). 대조적으로, SpCas9-HF1은 표적 가닥의 인산염 백본과의 수소 결합, 또는 전하 상호 작용을 감소시킴으로써, 개발되었다 (Kleinstiver et al., Nature 523, 490-495). 다른 한편, HypaCas9는 REC3 도메인에서 클러스터(N692, M694, Q695 및 H698)를 알라닌으로 돌연변이시킴으로써 유도되는데, 이로써 보존된 잔기 RNA-DNA 상호작용을 아마도 감지하고, 이 신호를 전달하여 HNH 뉴클레아제 도메인의 구조적 전환을 촉발시키킨다 (Chen et al., Nature 550, 407-410).
재조합 단백질 기반의 독특 스크리닝 접근 방식을 사용하고, 합리적인 설계를 본 명세서에 개시된 바와 같은 다양한 기계적 조합으로 확장함으로써, 본 명세서에서 상이한 수준의 특이성 및 활성을 갖는, 적어도 3개의 독특한 그룹의 SpCas9 변이체들이 확인되었다.
(I) 공작된 Cas9 단백질
본 명세서의 한 측면은 공작된 Cas 단백질에 관계한다. 상기 공작된 Cas 단백질은 이의 야생형 대응부와 비교하여, 적어도 하나의, 적어도 두 개의, 또는 적어도 세 개의 아미노산 치환(들), 삽입(들), 또는 결손(들)을 포함하고; 즉, 상기 공작된 Cas9 단백질에는 야생형 Cas 단백질(들)의 것과 비교하였을 때, 해당 아미노산 서열에 변형 또는 돌연변이들이 내포된다. 다양한 Cas 단백질, Cas9 단백질은 예를 들면, 유형 II CRISPR 시스템에서 단일 작동체 단백질이며, 이는 다양한 박테리아에 존재한다.
한 구체예에서, 본원에서 기술된 상기 공작된 Cas9 단백질은 스트렙토코커스 종으로부터 기인된다. 또다른 구체예에서, 예를 들면, 상기 공작된 Cas9 단백질 변이체(SpCas9)는 스트렙토코커스 피오게네스 로부터 유래된다. 따라서, 일부 구체예들에서, 본원에 기술된 상기 공작된 Cas9 단백질은 SpCas9 상동체들이다.
야생형 Cas9 단백질은 두 개의 뉴클레아제 도메인, 가령, RuvC 도메인과 HNH 도메인을 포함하는데, 이들 각 도메인은 이중-가닥으로 된 서열의 한 개 가닥을 절단한다. Cas9 단백질은 가이드 RNA (가령, REC1, REC2) 또는 RNA/DNA 이종듀클렉스 (가령, REC3)와 상호작용하는 도메인, 그리고 프로토스페이서-인접 모티프 (PAM)와 상호작용하는 도메인 (즉, PAM-상호작용 도메인)을 또한 포함한다.
본원에서 언급된 바와 같이, 본 명세서의 Cas9 단백질은 하나 또는 그 이상의 변형 (가령, 적어도 하나의 아미노산 치환, 적어도 하나의 아미노산 결손, 적어도 하나의 아미노산 삽입)을 포함하도록 공작되고, 이러한 Cas9 단백질은 변경된 활성, 특이성, 및/또는 안정성을 갖는다. 이들 공작된 Cas9 단백질은 자연적으로 생성되지 않는다.
일반적으로, 알려진 및/또는 상업적으로 이용가능한 Cas9 돌연변이체는 이 단백질의 상이한 영역 및 상이한 영역의 돌연변이 조합에 관계없이, 해당 단백질의 특정 영역에서 점 돌연변이(들)에 집중되어 있다. Cas9 단백질의 상이한 영역들에서의 돌연변이의 조합으로 공지의 Cas9 돌연변이체에 비해 개선된 특이성, 활성(예를 들어, 온-타겟 활성 또는 오프-타겟 활성), 및/또는 다른 유익한 속성을 초래할 수 있다는 유익한 점이 발견되었다.
예를 들면, 본원에 기술된 Cas9 단백질은 비-표적 DNA 가닥 접촉하는 잔기들이 내포된 해당 단백질의 구조적 영역 내 적어도 하나의 돌연변이(들), 및/또는 표적 DNA/가이드 RNA 헤테로듀플렉스 접촉하는 잔기들을 표적으로 하는 해당 단백질의 구조적 영역내 적어도 하나의 돌연변이(들), 및/또는 알파-나선 편(lobe)이 내포된 해당 단백질의 구조적 영역내 적어도 하나의 돌연변이(들)을 갖는다. 본 명세서의 목적을 위해, 비-표적 DNA 가닥 접촉하는 잔기들에는 예를 들면, 아미노산 R780, K810, K848, K855, K1003, 및 1060 이 내포되며; 표적 DNA/가이드 RNA 헤테로듀플렉스 접촉하는 잔기들에는 예를 들면, 아미노산 R661 및 R691이 내포되며; 그리고 알파-나선 편 잔기들에는 예를 들면, 아미노산 K526, K562, 그리고 K652이 내포된다 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라). 따라서, 다양한 구체예들에서, 본원에 기술된 Cas9 단백질은 비-표적 DNA 가닥 접촉하는 잔기들이 내포된 해당 단백질의 구조적 영역 내 적어도 하나의 돌연변이(들), 및/또는 표적 DNA/가이드 RNA 헤테로듀플렉스 접촉하는 잔기들을 표적으로 하는 해당 단백질의 구조적 영역내 적어도 하나의 돌연변이(들)을 갖는다. 다른 구체예들에서, 본원에 기술된 Cas9 따라서, 다양한 구체예들에서, 본원에 기술된 Cas9 단백질은 비-표적 DNA 가닥 접촉하는 잔기들이 내포된 해당 단백질의 구조적 영역 내 적어도 하나의 돌연변이(들), 및/또는 알파-나선 편이 내포된 해당 단백질의 구조적 영역내 적어도 하나의 돌연변이(들)을 갖는다. . 여전히 다른 구체예들에서, 본원에 기술된 Cas9 단백질은 표적 DNA/가이드 RNA 헤테로듀플렉스 접촉하는 잔기들이 내포된 해당 단백질의 구조적 영역 내 적어도 하나의 돌연변이(들), 및/또는 알파-나선 편이 내포된 해당 단백질의 구조적 영역내 적어도 하나의 돌연변이(들)을 갖는다. 여전히 다른 구체예들에서, 예를 들면, 본원에 기술된 Cas9 단백질은 비-표적 DNA 가닥 접촉하는 잔기들이 내포된 해당 단백질의 구조적 영역 내 적어도 하나의 돌연변이(들), 그리고 표적 DNA/가이드 RNA 헤테로듀플렉스 접촉하는 잔기들을 표적으로 하는 해당 단백질의 구조적 영역내 적어도 하나의 돌연변이(들), 그리고 알파-나선 편(lobe)이 내포된 해당 단백질의 구조적 영역내 적어도 하나의 돌연변이(들)을 갖는다.
본원에 기술된 상기 Cas9 단백질 변이체들은 변형안된 성숙된 (야생형) 스트렙토코커스 피오게네스 Cas9 (서열 식별 번호: 1)의 대응하는 위치에서 아미노산 번호매김에 따라 확인된 변형된 아미노산 서열을 갖는다. 본원에 기술된 상기 Cas9 단백질 변이체들은 바람직하게는 서열 식별 번호: 1에 대해 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 또는 적어도 99% 동일성을 갖는다:
참조의 편의를 위해, 20개의 필수 아미노산과 그 단일 문자 코드의 표기가 아래 표 A에 나와 있다.
표 A: 아미노산
본 명세서에 기술된 아미노산 변형은 영향을 받는 아미노산(단일 문자 코드)을 나타내는 문자로 시작하고, 아미노산 잔기 위치와 함께 변화를 지정하는 문자(단일 문자 코드)로 끝나고, 이들 두 문자 사이에 이들 아미노산 잔기 위치를 나타내는 숫자가 있는 명명법을 이용하는 것을 인지할 것이다. 예를 들면, 가상 단백질은 가상 아미노산 위치 100에 알라닌 잔기를 가질 수 있으며, A100으로 지정될 것이다. 추가 예로서, 위치 100에서 알라닌에서 발린으로의 가상 아미노산의 변형은 A100V로 설정될 것이다. 2개 또는 그 이상의 옵션에서 선택된 변형은 "/"로 지정될 수 있으며, 예를 들어, 아미노산 위치 100에서 알라닌에서 발린 또는 세린으로의 가상 아미노산 변형은 A100V/S로 설정될 것이다.
한 구체예에서, 상기 공작된 Cas9 단백질 변이체에는 아미노산 위치 526, 562, 652, 661, 691, 780, 810, 848, 855, 1003, 그리고 1060중 하나 또는 그 이상에서 돌연변이가 내포된다(스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라). 또다른 구체예에서, 상기 공작된 Cas9 단백질 변이체에는 아미노산 위치 526, 562, 652, 661, 691, 780, 810, 848, 855, 1003, 그리고 1060중 두 개 또는 그 이상에서 돌연변이가 내포된다(스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라). 따라서, 예를 들면, 상기 공작된 Cas9 단백질은 다음중 하나 또는 그 이상에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 또다른 예로써, 상기 공작된 Cas9 단백질은 다음중 두 개 또는 그 이상에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 또다른 예로써, 상기 공작된 Cas9 단백질은 다음중 세 개 또는 그 이상에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 또다른 예로써, 상기 공작된 Cas9 단백질은 다음중 네 개 또는 그 이상에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 또다른 예로써, 상기 공작된 Cas9 단백질은 다음중 다섯 개 또는 그 이상에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 또다른 예로써, 상기 공작된 Cas9 단백질은 다음중 여섯 개 또는 그 이상에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 또다른 예로써, 상기 공작된 Cas9 단백질은 다음중 일곱 개 또는 그 이상에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 또다른 예로써, 상기 공작된 Cas9 단백질은 다음중 여덟 개 또는 그 이상에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 또다른 예로써, 상기 공작된 Cas9 단백질은 다음중 아홉 개 또는 그 이상에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 또다른 예로써, 상기 공작된 Cas9 단백질은 다음중 열 개 또는 그 이상에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 또다른 예로써, 상기 공작된 Cas9 단백질은 다음 각각의 위치에서 돌연변이가 내포될 수 있다: K526, K562, K652, R661, R691, R780, K810, K848, K855, K1003, 및 1060. 이러한 다양한 특정 구체예들에서, 예를 들면, 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에서 리신(K)는 류신 (L) 또는 글루타민 (Q)으로 변경되며, 및/또는 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에서 아르기닌 (R)은 류신 (L) 또는 글루타민 (Q)으로 변경된다.
한 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 562, 652, 661, 691, 780, 810, 848, 855, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 K526L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다. 또다른 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 526, 652, 661, 691, 780, 810, 848, 855, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 K562L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다. 또다른 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 526, 562, 661, 691, 780, 810, 848, 855, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 K652L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다. 또다른 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 526, 562, 691, 780, 810, 848, 855, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 R661L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다. 또다른 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 526, 562, 661, 780, 810, 848, 855, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 R691L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다. 또다른 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 526, 562, 661, 691, 810, 848, 855, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 R780L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다. 또다른 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 526, 562, 661, 691, 780, 848, 855, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 K810L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다. 또다른 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 526, 562, 661, 691, 780, 810, 855, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 K848L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다. 또다른 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 526, 562, 661, 691, 780, 810, 848, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 K855L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다. 또다른 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 526, 562, 661, 691, 780, 810, 848, 855, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 K1003L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다. 또다른 구체예에서, 예를 들면, 상기 공작된 SpCas9 변이체에는 아미노산 위치들 526, 562, 661, 691, 780, 810, 848, 855, 그리고 1003 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 R1060L/Q 돌연변이 및 적어도 하나의 다른 돌연변이가 내포된다.
따라서, 특정 구체예들에서, 예를 들면, 상기 공작된 SpCas9 단백질 변이체에는 K526L/Q, K562L/Q, K652L/Q, K810L/Q, K848L/Q, K855L/Q, R661L/Q, R691L/Q, R780L/Q, K1003L/Q, 및 1060 L/Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)로부터 선택된 두 개의 상이한 아미노산 위치에서 두 개 돌연변이가 내포된다. 다른 구체예들에서, 예를 들면, 상기 공작된 SpCas9 단백질 변이체에는 K526L/Q, K562L/Q, K652L/Q, K810L/Q, K848L/Q, K855L/Q, R661L/Q, R691L/Q, R780L/Q, K1003L/Q, 및 1060 L/Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)로부터 선택된 세 개의 상이한 아미노산 위치에서 두 개 돌연변이가 내포된다. K526L/Q, K562L/Q, K652L/Q, K810L/Q, K848L/Q, K855L/Q, R661L/Q, R691L/Q, R780L/Q, K1003L/Q, 및 1060 L/Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)로부터 선택된 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 11개 돌연변이가 존재할 수 있는 다른 구체예들이 제공됨을 이해할 것이다.
전술한 단락에서, 특정 구체예들 또는 실시예들의 범위 내에서 당업계에 공지된 돌연변이가 있다면, 단서에 의해 배제되어야 한다는 것이 이해될 것이다.
또다른 특정 구체예들에서, 상기 공작된 SpCas9 단백질 변이체에는 다음 돌연변이들중 적어도 하나가 내포된다: K526L, K526Q, K562L, K562Q, K652L, K652Q, K810L, K810Q, K848L, K848Q, K855L, K855Q, R661L, R661Q, R691L, R691Q, R780L, R780Q, K1003L, K1003Q, R1060L, 및 1060 Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라).
또다른 특정 구체예들에서, 상기 공작된 SpCas9 단백질 변이체에는 다음 돌연변이들중 적어도 두 개가 내포된다: K526L, K526Q, K562L, K562Q, K652L, K652Q, K810L, K810Q, K848L, K848Q, K855L, K855Q, R661L, R661Q, R691L, R691Q, R780L, R780Q, K1003L, K1003Q, R1060L, 및 1060Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라).
여전히 또다른 특정 구체예들에서, 상기 공작된 SpCas9 단백질 변이체에는 다음 돌연변이들중 적어도 세 개가 내포된다: K526L, K526Q, K562L, K562Q, K652L, K652Q, K810L, K810Q, K848L, K848Q, K855L, K855Q, R661L, R661Q, R691L, R691Q, R780L, R780Q, K1003L, K1003Q, R1060L, 및 1060Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라).
여전히 또다른 특정 구체예에서, 상기 공작된 SpCas9 단백질 변이체에는 다음 돌연변이들중 적어도 4개, 5개, 6개, 7개, 8개, 9개, 10개 또는 11개가 내포된다: K526L, K526Q, K562L, K562Q, K652L, K652Q, K810L, K810Q, K848L, K848Q, K855L, K855Q, R661L, R661Q, R691L, R691Q, R780L, R780Q, K1003L, K1003Q, R1060L, 및 1060 Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라).
하나의 특정 구체예에서, 상기 공작된 SpCas9 단백질은 다음의 변이체 그룹중 하나로부터 선택된다: K562L-R661L-K855Q; K562Q-R661L-K855Q; K652L-R661L-K855Q; K652Q-R661L-K855Q; R661L-K855Q-K1003Q; 그리고 R661L-K855Q-R1060Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라). 또다른 특정 구체예들에서, 상기 공작된 SpCas9 단백질은 다음의 변이체 그룹중 하나로부터 선택된다: K562L-R661L-K855Q; K562Q-R661L-K855Q; K652L-R661L-K855Q; 그리고 K652Q-R661L-K855Q. 따라서, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 K562L-R661L-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 K562Q-R661L-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 K652L-R661L-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 K652Q-R661L-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 R661L-K855Q-K1003Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 R661L-K855Q-R1060Q일 수 있다. 이들 변이체 그룹의 구성원은 활성에서 잘-확립된 eSpCas9 1.1과 특이성에서 최근 개발된 HiFi Cas9 V3을 능가하는 균형잡힌 특이성과 활성을 가지고 있다.
또다른 특정 구체예들에서, 상기 공작된 SpCas9 단백질은 다음의 변이체 그룹중 하나로부터 선택된다: K526L-R661L-K855Q; R661L-R691L-K855Q; R661L-R780L-K855Q; R661L-R780Q-K855Q; R661L-K810L-K855Q, 그리고 R661L-K848L-K855Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라). 따라서, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 K526L-R661L-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 R661L-R691L-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 R661L-R780L-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 R661L-R780Q-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 R661L-K810L-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 R661L-K848L-K855Q일 수 있다. 이들 변이체 그룹의 구성원은 매우 높은 수준의 특이성을 갖지만, 그러나 표적 부위 간에 매우 다양한 활성을 가지고 있다.
또다른 특정 구체예들에서, 상기 공작된 SpCas9 단백질은 다음 변이체 그룹중 하나로부터 선택된다: K526Q-R661L-K855Q; R661L-K810Q-K855Q; R661L-K855Q-K1003L; 그리고 R661L-K855Q-R1060L (스트렙토코커스 피오게네스Cas9, SpCas9의 번호매김 체계에 따라). 따라서, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 K526Q-R661L-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 R661L-K810Q-K855Q일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 R661L-K855Q-K1003L일 수 있다. 대안으로, 예를 들면, 상기 공작된 SpCas9 단백질 변이체는 R661L-K855Q-R1060L일 수 있다. 이들 변이체 그룹의 구성원은 특이성 및 활성 수준 모두에서 eSpCas9 1.1과 유사하지만; 그러나, 이들은 돌연변이 프로파일에서 eSpCas9 1.1과는 상이하다.
상기 논의된 다양한 돌연변이에 추가적으로, 상기 Cas9 단백질은 해당 뉴클라제 도메인들중 하나 또는 둘 모두를 비활성화시키기 위해 하나 또는 그 이상의 돌연변이 및/또는 결손을 통하여 또한 공작될 수 있다. 하나의 뉴클레아제 도메인의 비활성화로 이중-가닥 서열의 한 가닥이 절단된 Cas9 단백질이 생성된다 (가령, Cas9 니카제). RuvC 도메인은 돌연변이, 이를 테면, D10A, D8A, E762A, 및/또는 D986A에 의해 비활성화될 수 있고, HNH 도메인은 돌연변이, 이를 테면, H840A, H559A, N854A, N856A, 및/또는 N863A (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에 의해 돌연변이될 수 있다. 두 뉴클라제 도메인의 비활성화로 절단 활성이 없는 (가령, 촉매적으로 비활성 또는 사멸된 Cas9) Cas9 단백질이 생성된다.
상기 논의된 다양한 돌연변이에 추가적으로, 개선된 표적화 특이성, 개선된 충실성(fidelity), 변경된 PAM 특이성, 감소된 표적-외 효과, 및/또는 증가된 안정성을 갖도록 하기 위하여, 하나 또는 그 이상의 아미노산 치환, 결손, 및/또는 삽입을 통하여 Cas9 단백질이 또한 공작될 수 있다. 표적화 특이성을 개선시키고, 충실성을 개선시키거나, 및/또는 표적-외 효과를 감소시키는 하나 또는 그 이상의 돌연변이의 비-제한적인 예로는 N497A, R661A, Q695A, K810A, K848A, K855A, Q926A, K1003A, R1060A, 및/또는 D1135E 이 포함된다 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라).
상기 논의된 변형에 추가적으로, 상기 Cas9 단백질은 적어도 하나의 이질성 도메인을 포함하도록 또한 공작될 수 있는데, 가령, Cas9는 하나 또는 그 이상의 이질성 도메인에 융합된다. 두 개 또는 그 이상의 이질성 도메인이 Cas9와 융합되는 상황에서, 상기 두 개 또는 그 이상의 이질성 도메인은 동일하거나, 또는 서로 상이할 수 있다. 상기 하나 또는 그 이상의 이질성 도메인은 N 말단 단부, C 말단 단부, 내부 위치, 또는 이의 조합에 융합될 수 있다. 상기 융합은 화학 결합을 통한 직접적인 융합이거나, 또는 링키지는 하나 또는 그 이상의 링커를 통한 간접적인 것일 수 있다. 다양한 구체예들에서, 상기 이질성 도메인은 다음으로부터 선택된다: 핵 국소화 신호, 세포-투과 도메인, 검출을 용이하게 하는 마커 또는 리포터 도메인(형광 또는 효소 리포터 단백질), 염색질 변형 도메인, 후성유전학적 변형 도메인 (가령, 시티딘 데아미나제 도메인, 히스톤 아세틸트랜스퍼라제 도메인, 그리고 및 이와 유사한 것들), 전사 조절 도메인, DNA 또는 RNA 데아미나제 도메인, 우라실-DNA-글리코실라제 도메인, 역전사효소 도메인, 재조합효소 도메인, RNA 압타머 결합 도메인, 또는 비-Cas9 뉴클라제 도메인.
(a) 핵 국소화 신호
일부 구체예들에서, 상기 하나 또는 그 이상의 이질성 도메인은 핵 국소화 신호 (NLS)일 수 있다. 핵 국소화 신호의 비-제한적인 예시에는 다음이 내포된다: PKKKRKV (서열 식별 번호: 2), PKKKRRV (서열 식별 번호: 3), KRPAATKKAGQAKKKK (서열 식별 번호: 4), YGRKKRRQRRR (서열 식별 번호: 5), RKKRRQRRR (서열 식별 번호: 6), PAAKRVKLD (서열 식별 번호: 7), RQRRNELKRSP (서열 식별 번호: 8), VSRKRPRP (서열 식별 번호: 9), PPKKARED (서열 식별 번호: 10), PQPKKKPL (서열 식별 번호: 11), SALIKKKKKMAP (서열 식별 번호: 12), PKQKKRK (서열 식별 번호: 13), RKLKKKIKKL (서열 식별 번호: 14), REKKKFLKRR (서열 식별 번호: 15), KRKGDEVDGVDEVAKKKSKK (서열 식별 번호: 16), RKCLQAGMNLEARKTKK (서열 식별 번호: 17), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (서열 식별 번호: 18), 그리고 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (서열 식별 번호: 19).
(b) 세포-침투 도메인
다른 구체예들에서, 상기 하나 또는 그 이상의 이질성 도메인은 세포-침투 도메인일 수 있다. 적합한 세포-침투 도메인의 예시에는 다음이 내포되나, 이에 국한되지 않는다: GRKKRRQRRRPPQPKKKRKV (서열 식별 번호: 20), PLSSIFSRIGDPPKKKRKV (서열 식별 번호: 21), GALFLGWLGAAGSTMGAPKKKRKV (서열 식별 번호: 22), GALFLGFLGAAGSTMGAWSQPKKKRKV (서열 식별 번호: 23), KETWWETWWTEWSQPKKKRKV (서열 식별 번호: 24), YARAAARQARA (서열 식별 번호: 25), THRLPRRRRRR (서열 식별 번호: 26), GGRRARRRRRR (서열 식별 번호: 27), RRQRRTSKLMKR (서열 식별 번호: 28), GWTLNSAGYLLGKINLKALAALAKKIL (서열 식별 번호: 29), KALAWEAKLAKALAKALAKHLAKALAKALKCEA (서열 식별 번호: 30), 그리고 RQIKIWFQNRRMKWKK (서열 식별 번호: 31).
(c) 마커 도메인
대안적인 구체예들에서, 상기 하나 또는 그 이상의 이질성 도메인은 마커 도메인일 수 있다. 마커 도메인에는 형광 단백질 및 정제 또는 에피토프 테그들이 내포된다. 적합한 형광 단백질에는 다음의 것들이 포함되나, 이에 국한되지 않는다: 그린 형광 단백질 (가령, GFP, eGFP, GFP-2, tagGFP, turboGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, ZsGreen1), 엘로우 형광 단백질 (가령, YFP, EYFP, Citrine, Venus, YPet, PhiYFP, ZsYellow1), 블루 형광 단백질 (가령, BFP, EBFP, EBFP2, Azurite, mKalama1, GFPuv, Sapphire, T-sapphire), 시안 형광 단백질 (가령, ECFP, Cerulean, CyPet, AmCyan1, Midoriishi-Cyan), 레드 형광 단백질 (가령, mKate, mKate2, mPlum, DsRed monomer, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, HcRed1, AsRed2, eqFP611, mRasberry, mStrawberry, Jred), 오렌지 형광 단백질 (가령, mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine, tdTomato)또는 이의 조합. 상기 마커 도메인은 하나 또는 그 이상의 형광 단백질의 일렬 반복부를 포함할 수 있다 (가령, Suntag). 적합한 정제 또는 에피토프 태그의 비-제한적인 예로는 6xHis(서열 식별 번호: 32), FLAG®, HA, GST, Myc, SAM, 및 이와 유사한 것들이 내포된다. CRISPR 복합체의 탐지 또는 농축을 실시하는 이질성 융합체의 비-제한적인 예로는 스트렙타아비딘 (Kipriyanov et al., Human Antibodies, 1995, 6(3):93-101), 아비딘 (Airenne et al., Biomolecular Engineering, 1999, 16(1-4):87-92), 아비딘의 단향체 형태 (Laitinen et al., Journal of Biological Chemistry, 2003, 278(6):4010-4014), 재조합 생산 동안 바이오티닐화를 촉진시키는 펩티드 태그 (Cull et al., Methods in Enzymology, 2000, 326:430-440)가 내포된다.
(d) 염색질 조절 모티프
여전히 다른 구체예들에서, 상기 하나 또는 그 이상의 이질성 도메인은 염색질 조절 모티프 (CMM)일 수 있다. CMMs의 비-제한적인 예로는 고-이동성 기 (HMG) 단백질 (가령, HMGB1, HMGB2, HMGB3, HMGN1, HMGN2, HMGN3a, HMGN3b, HMGN4, 그리고 HMGN5 단백질)로부터 유래된 뉴클레오좀 상호작용 펩티드, 히스톤 H1 변이체의 중앙 구형 도메인 (가령, 히스톤 H1.0, H1.1, H1.2, H1.3, H1.4, H1.5, H1.6, H1.7, H1.8, H1.9, 그리고 H.1.10), 또는 크로마틴 리모델링 복합체의 DNA 결합 도메인 (가령, SWI/SNF (SWItch/Sucrose Non-Fermentable), ISWI (Imitation SWItch), CHD (Chromodomain-Helicase-DNA binding), Mi-2/NuRD (Nucleosome Remodeling and Deacetylase), INO80, SWR1, 그리고 RSC 복합체들이 내포된다. 다른 구체예들에서, CMMs는 또한 토포이소머라제, 헬리카제 또는 바이러스 단백질에서 파생될 수 있다. CMM의 원천은 다양할 수 있고, 달라질 수 있다. CMMs는 인간, 동물(즉, 척추동물 및 무척추동물), 식물, 조류 또는 효모에서 유래할 수 있다. 특정 CMMs의 비-제한적인 예는 아래 표 B에 나열되어 있다. 당업자는 다른 종의 상동체 및/또는 그 안의 관련 융합 모티프를 쉽게 확인할 수 있다.
표 B: 염색질 조절 모티프
(e) 후성유전학적 변형 도메인
여전히 다른 구체예들에서, 상기 하나 또는 그 이상의 이질성 도메인은 후성유전학적 변형 도메인일 수 있다. 적합한 후성유전학적 변형 도메인의 비-제한적인 예시에는 다음의 것들이 내포된다: DNA 탈아민화 (가령, 시티딘 데아미나제, 아데노신 데아미나제, 구아닌 데아미나제), DNA 메틸전이효소 활성 (가령, 시토신 메틸전이효소), DNA 데메틸라제 활성, DNA 아미노화, DNA 산화 활성, DNA 헬리카제 활성, 히스톤 아세틸전이효소 (HAT) 활성 (예로써, E1A 결합 단백질 p300로부터 유래된 HAT 도메인), 히스톤 탈아세틸라제 활성, 히스톤 메틸전이효소 활성, 히스톤 탈메틸라제 활성, 히스톤 키나제 활성, 히스톤 포스포타제 활성, 히스톤 유비퀴틴 리가제 활성, 히스톤 탈유비퀴티화 활성, 히스톤 아데닐화 활성, 히스톤 탈아데닐화 활성, 히스톤 SUMOyl화 활성, 히스톤 탈SUMOyl화 활성, 히스톤 리보실화 활성, 히스톤 탈리보실화 활성, 히스톤 미리스토일화 활성, 히스톤 탈미리스토일화 활성, 히스톤 시트룰린화 활성, 히스톤 알킬화 활성, 히스톤 탈알킬화 활성, 또는 히스톤 산화 활성. 특이적 구체예들에서, 상기 후성유전학적 변형 도메인은 시티딘 데아미나제 활성, 아데노신 데아미나제 활성, 히스톤 아세틸전이효소 활성, 또는 DNA 메틸전이효소 활성을 포함할 수 있다.
(f) 전사 조절 도메인
다른 구체예들에서, 상기 하나 또는 그 이상의 이질성 도메인은 전사 조절 도메인 (가령, 전사 활성화 도메인 또는 전사 억제자 도메인)일 수 있다. 적합한 전사 활성화 도메인에는 다음의 것들이 내포되나, 이에 국한되지 않는다: 단순 헤르페스 바이러스 VP16 도메인, VP64 (가령, VP16의 4개의 병렬 복사체), VP160 (가령, VP16의 10개의 병렬 복사체), NFκB p65 활성화 도메인 (p65), Epstein-Barr 바이러스 R 전이활성자 (Rta) 도메인, VPR (가령, VP64+p65+Rta), p300-의존적 전사 활성화 도메인, p53 활성화 도메인 1 및 2, 열-쇼크 인자 1 (HSF1) 활성화 도메인, Smad4 활성화 도메인 (SAD), cAMP 반응 요소 결합 단백질 (CREB) 활성화 도메인, E2A 활성화 도메인, 활성화된 T-세포 (NFAT) 활성화 도메인의 핵 인자, 또는 이의 조합. 적합한 전사 억제자 도메인의 비-제한적인 예시에는 Kruppel-연합된 박스 (KRAB) 억제 도메인, 유도성 cAMP 초기 억제 (ICER) 도메인, YY1 글리신 풍부 억제 도메인, Sp1-유사 억제제, E(spl) 억제제, IκB 억제제, Sin3 억제제, 메틸-CpG 결합 단백질 2 (MeCP2) 억제제, 또는 이의 조합이 내포된다. 전사 활성화 또는 전사 억제자 도메인은 유전적으로 Cas9 단백질에 융합될 수 있거나, 또는 비-공유적 단백질-단백질, 단백질-RNA, 또는 단백질-DNA 상호작용을 통하여 결합될 수 있다.
(g) RNA 압타머 결합 도메인
추가 구체예들에서, 상기 하나 또는 그 이상의 이질성 도메인은 RNA 압타머 결합 도메인일 수 있다 (Konermann et al., Nature, 2015, 517(7536):583-588; Zalatan et al., Cell, 2015, 160(1-2):339-50). 적합한 RNA 압타머 단백질 도메인의 예시에는 MS2 코트 단백질 (MCP), PP7 박테리오파아지 코트 단백질 (PCP), Mu 박테리오파아지 Com 단백질, 람다 박테리오파아지 N22 단백질, 스템-루프 결합 단백질 (SLBP), 그리고 Fragile X 정신 지체 증후군-관련된 단백질 1 (FXR1), 박테리오파아지로부터 유래된 단백질, 이를 테면, AP205, BZ13, f1, f2, fd, fr, ID2, JP34/GA, JP501, JP34, JP500, KU1, M11, M12, MX1, NL95, PP7, φCb5, φCb8r, φCb12r, φCb23r, Qβ, R17, SP-β, TW18, TW19, 그리고 VK, 이의 단편들, 또는 이의 유도체들이 내포된다.
(h) 비-Cas9 뉴클라제 도메인
여전히 다른 구체예들에서, 상기 하나 또는 그 이상의 이질성 도메인은 비-Cas9 뉴클라제 도메인일 수 있다. 적합한 뉴클라제 도메인은 임의의 엔도뉴클라제 또는 엑소뉴클라제로부터 수득될 수 있다. 뉴클레아제 도메인이 유래될 수 있는 비-제한적 엔도뉴클레아제의 예시에는 제한 엔도뉴클레아제와 호밍(homing) 엔도뉴클레아제가 내포되나, 이에 국한되지 않는다. 일부 구체예들에서, 상기 뉴클레아제 도메인은 유형 II-S 제한 엔도뉴클레아제로부터 유래될 수 있다. 유형 II-S 엔도뉴클레아제는 인지/결합 부위로부터 전형적으로 몇 개의 염기쌍만큼 떨어져 있는 부위에서 DNA를 절단하고, 이와 같이, 분리가능한 결합 및 절단 도메인를 갖는다. 이들 효소는 일반적으로 단량체이며, 이들은 일시적으로 연합되어 이량체를 형성하고, 스태거형(staggered) 위치에서 DNA의 각 가닥을 절단한다. 적합한 유형 II-S 엔도뉴클레아제의 비-제한적 실시예는 BfiI, BpmI, BsaI, BsgI, BsmBI, BsmI, BspMI, FokI, MboII, 그리고 SapI를 포함한다. 일부 구체예들에서, 상기 뉴클라제 도메인은 FokI 뉴클라제 도메인 또는 이의 유도체일 수 있다. 상기 유형 II-S 뉴클레아제 도메인은 2개의 상이한 뉴클레아제 도메인의 이량체화를 용이하게 하기 위하여 변형될 수 있다. 예로써, FokI의 절단 도메인은 특정 아미노산 잔기들을 돌연변이시킴으로써 변형될 수 있다. 비-제한적 예로써, FokI의 아미노산 잔기 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, 및 538에 있는 아미노산 잔기는 모두 FokI 뉴클레아제 도메인이 변형의 표적이다. 특정 구체예들에서, FokI 뉴클레아제 도메인은 Q486E, I499L, 및/또는 N496D 돌연변이를 포함하는 제 1 FokI 하프-도메인, 그리고 E490K, I538K, 및/또는 H537R 돌연변이를 포함하는 제 2 FokI 하프-도메인을 포함할 수 있다.
(i) 핵염기 변형 효소
본원에 기술된 상기 공작된 Cas9 변이체들은 또한 핵염기 변형 효소 또는 이의 촉매 도메인을 포함할 수 있다.
본원에 기술된 시스템에 다양한 핵염기 변형 효소들이 사용에 적합하다. 핵염기 변형 효소는 DNA 염기 편집자일 수 있다. 일부 구체예들에서, 상기 DNA 염기 편집자는 시티딘 데아미나제일 수 있고, 이는 시티딘을 우리딘으로 전환시키고, 중합효소 효소에 의해 티민으로 판독된다. 시티딘 데아미나제의 비-제한적 예시에는 시티딘 데아미나제 1 (CDA1), 시티딘 데아미나제 2 (CDA2), 활성화-유도된 시티딘 데아미나제 (AICDA), 아포리포단백질 B mRNA-편집 복합체 (APOBEC) 패밀리 시티딘 데아미나제 (가령, APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D/E, APOBEC3F, APOBEC3G, APOBEC3H, APOBEC4), APOBEC1 상보성 인자/APOBEC1 자극 인자 (ACF1/ASF) 시티딘 데아미나제, RNA (CDAR)에 작용하는 시토신 데아미나제, 박테리아 긴(long) 아이소형 시티딘 데아미나제 (CDDL), 그리고 tRNA에 작용하는 시토신 데아미나제 (CDAT)가 내포된다. 다른 구체예들에서, 상기 DNA 염기 편집자는 아데노신 데아미나제일 수 있고, 이는 아데노신을 이노신으로 전환시키고, 중합효소 효소에 의해 구아노신으로 판독된다. 아데노신 데아미나제의 비-제한적인 예시에는 tRNA 아데닌 데아미나제, 아데노신 데아미나제, RNA에 작용하는 아데노신 데아미나제 (ADAR), 그리고 tRNA에 작용하는 아데노신 데아미나제 (ADAT)가 내포된다.
핵염기 변형 효소 (염기 편집자)는 야생형 또는 이의 단편, 이의 변형된 형태 (가령, 비-필수 도메인은 결손될 수 있으며), 또는 이의 공작된 형태일 수 있다. 핵염기 변형 효소 (염기 편집자)는 진핵, 박테리아, 또는 고세균 기원(archael origin)일 수 있다.
일부 구체예들에서, 핵염기 변형 효소 (염기 편집자)는 시티딘 데아미나제 또는 이의 촉매 도메인일 수 있다. 시티딘 데아미나제는 인간, 마우스, 칠성장어(lamprey), 전복(abalone), 또는 대장균(E. coli) 기원일 수 있다. 핵염기 변형 효소가 시티딘 데아미나제인 구체예들에서, 상기 RNA-안내된 핵염기 변형 시스템은 적어도 하나의 우라실 글리코실라제 억제제 (UGI) 도메인을 더 포함할 수 있다. DNA로부터 우라실의 제거(시토신 탈아민화의 결과임)는 UGI에 의해 저해된다. 적합한 UGI 도메인은 당분야에 공지되어 있다.
일부 구체예들에서, 시티딘 데아미나제 및 UGI를 사용하는 시스템은 이러한 구성 요소가 과발현되면 부정적인 영향을 미칠 수 있다. 과다-발현을 방지하기 위해, 분래 테그가 추가될 수 있다. 분해 테그는 단백질 재활용 시스템에 의해 단백질이 분해된다는 신호다. 이들 분해 테그로 상이한 단백질 반감기를 초래한다. 분해 테그의 비-제한적 예는 LVA, AAV, ASV 및 LAA이다.
(j) 역전사효소
일부 구체예들에서, 본원에 기술된 상기 공작된 SpCas9 변이체에 융합된 도메인은 역전사효소다. 역전사효소의 예시에는 조류 골수아세포증 바이러스(AMV) 역전사효소 및 몰로니 뮤린 백혈병 바이러스(MMLV) 역전사효소가 내포된다.
(k) 재조합효소/인테그라제
일부 구체예들에서, 본원에 기술된 상기 공작된 SpCas9 변이체에 융합된 도메인은 재조합효소 또는 인테그라제다. 적합한 재조합효소의 비-제한적 예시에는 Cre 재조합효소, FLP 재조합효소, Gin 재조합효소, 박테로이드(Bacteroides) intN2 티로신 인테그라제 (NBU2 유전자에 의해 인코드됨), 스트렙토미세스(Streptomyces) 파아지 phiC31 (φC31) 리콤비나제, 골리파아지 P4 리콤비나제, 콜리파아지 람다 인테그라제, 리스테리아(Listeria) A118 파아지 리콤비나제, 렌티바이러스 또는 HIV 인테그라제 그리고 악티노파아지 R4 Sre 리콤비나제가 내포된다. 재조합효소/인테그라제는 두 개의 서열 특정 인지 (또는 부착) 부위 (가령, attP 부위와 attB 부위, 또는 두 개의 Cre/loxP 부위) 사이의 재조합을 매개하거나, 또는 HIV 인테그라제와 마찬가지로 무작위로 DNA를 삽입시킬 수 있다.
(l) 링커
상기 하나 또는 그 이상의 이질성 도메인은 하나 또는 그 이상의 화학 결합 (가령, 공유 결합)을 통하여 Cas9 단백질에 직접적으로 연계될 수 있거나, 또는 상기 하나 또는 그 이상의 이질성 도메인은 하나 또는 그 이상의 링커를 통하여 Cas9 단백질에 간접적으로 연계될 수 있다.
링커는 최소한 하나의 공유 결합을 통하여 하나 또는 그 이상의 다른 화학기에 연결되는 화학기다. 적합한 링커에는 아미노산, 펩티드, 뉴클레오티드, 핵산, 유리 링커 분자 (예로써, 말레이미드 유도체, N-에톡시벤질이미다졸, 바이페닐-3,4′,5-트리카르복실산, p-아미노벤조일옥시카르보닐, 및 이와 유사한 것), 이황화 링커, 그리고 폴리머 링커 (예로써, PEG)가 포함된다. 링커는 알킬렌, 알케닐렌, 알키닐렌, 알킬, 알케닐, 알키닐, 알콕시, 아릴, 헤테로아릴, 아르알킬, 알랄케닐, 알키닐 및 이와 유사한 것등을 포함하지만, 이에 제한되지 않는 하나 또는 그 이상의 스페이싱기를 포함할 수 있다. 링커는 중성이거나, 또는 양전하 또는 음전하를 지닐 수 있다. 추가적으로, 링커는 절단가능하여, 또다른 화학기에 링커를 연결시키는 링커의 공유결합이 pH, 온도, 염 농도, 광, 촉매 또는 효소를 포함하는 특정 조건 하에서 파괴되거나 또는 절단될 수 있게 한다. 일부 구체예들에서, 상기 링커는 펩티드 링커다. 상기 펩티드 링커는 연성 아미노산 링커일 수 있다(예로써, 작은, 비-극성 또는 극성 아미노산을 포함하는). 연성 링커의 비-제한적 예시예는 LEGGGS (서열 식별 번호: 33), TGSG (서열 식별 번호: 34), GGSGGGSG (서열 식별 번호: 35), (GGGGS)1-4 (서열 식별 번호: 36), 그리고 (Gly)6-8 (서열 식별 번호: 37)가 내포된다. 대안으로, 상기 펩티드 링커는 뻣뻣한(rigid) 아미노산 링커일 수 있다. 이러한 링커에는 (EAAAK)1-4 (서열 식별 번호: 38), A(EAAAK)2-5A (서열 식별 번호: 39), PAPAP (서열 식별 번호: 40), 그리고 (AP)6-8 (서열 식별 번호: 41)가 내포된다. 적합한 링커의 추가 실시예는 당분야에 잘 공지되어 있고, 디자인 링커를 기획하는 프로그램은 쉽게 이용가능하다 (가령, Crasto et al., Protein Eng., 2000, 13(5):309-312).
(m) 공작된 Cas9 단백질의 생산
일부 구체예들에서, 상기 공작된 Cas9 단백질은 무-세포 시스템, 박테리아 세포, 또는 진핵 세포에서 재조합적으로 생산되고, 통상적인 정제 방법을 이용하여 정제될 수 있다. 다른 구체예들에서, 상기 공작된 Cas9 단백질은 공작된 Cas9 단백질을 인코딩하는 핵산으로부터 관심 진핵 세포의 생체내에서 생산된다 (아래 섹션 (III) 참조 및 이 섹션 (I)에 참조로 편입됨).
상기 공작된 Cas9 단백질이 뉴클라제 또는 니카제 활성를 포함하는 구체예들에서, 상기 공작된 Cas9 단백질은 적어도 하나의 핵 국소화 신호, 세포-침투 도메인, 및/또는 마커 도메인, 뿐만 아니라 적어도 하나의 염색질 분열 도메인을 더 포함할 수 있다. 상기 공작된 Cas9 단백질은 후성유전학적 변형 도메인에 연계된 구체예들에서, 상기 공작된 Cas9 단백질은 적어도 하나의 핵 국소화 신호, 세포-침투 도메인, 및/또는 마커 도메인, 뿐만 아니라 적어도 하나의 염색질 분열 도메인을 더 포함할 수 있다. 더욱이, 상기 공작된 Cas9 단백질이 전사 조절 도메인에 연계된 구체예들에서, 상기 공작된 Cas9 단백질은 적어도 하나의 핵 국소화 신호, 세포-침투 도메인, 및/또는 마커 도메인, 뿐만 아니라 적어도 하나의 염색질 분열 도메인 및/또는 적어도 하나의 RNA 압타머 결합 도메인을 더 포함할 수 있다.
(II) 공작된 Cas9 시스템
본 명세서의 또다른 측면은 이 섹션 (II)에 참고로 편입된 섹션(I)에서 논의된 공작된 Cas9 단백질 변이체들을 포함하는 공작된 Cas9 시스템 및 공작된 가이드 RNAs를 제공하며 (예를 들면, 공작된 Cas9 단백질 변이체에는 아미노산 위치들 526, 562, 652, 661, 691, 780, 810, 848, 855, 1003, 및 1060중 하나 또는 그 이상(가령, 2개 또는 3개) 위치에 변형이 내포되며 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라), 이때 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 리신(K)는 류신 (L) 또는 글루타민 (Q)으로 변경되며, 및/또는 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 아르기닌 (R)은 류신 (L) 또는 글루타민 (Q)으로 변경됨), 이때 각 공작된 가이드 RNA는 특정 공작된 Cas9 단백질과 복합되도록 기획된다. 각 공작된 가이드 RNA는 표적 서열과 이중-가닥의 서열로 혼성화되도록 기획된 5' 가이드 서열을 포함하고, 이때 상기 표적 서열은 프로토스페이서 인접 모티프 (PAM)의 5'에 있다.
(a) 공작된 가이드 RNAs
상기 공작된 가이드 RNA는 특정 공작된 Cas9 단백질과 복합되도록 기획된다. 가이드 RNA는 (i) 5' 단부에서 표적 서열에 혼성화되는 가이드 서열을 함유하는 CRISPR RNA (crRNA), 그리고 (ii) Cas9 단백질을 모집하는 트랜스액팅 crRNA (tracrRNA) 서열을 포함한다. 각 가이드 RNA의 crRNA 가이드 서열은 상이하다 (가령, 서열 특이적이다). tracrRNA 서열은 특정 박테리아 종의 Cas9 단백질과 복합체를 이루도록 기획된 가이드 RNAs에서 일반적으로 동일하다.
CrRNA 가이드 서열은 표적 서열 (가령, 프로토스페이서)과 이중-가닥으로 된 서열로 혼성화되도록 기획된다. 일반적으로, crRNA와 표적 서열 간의 상보성(complementarity)은 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 적어도 99%이다. 특정 구체예들에서, 상보성은 완벽하다 (즉, 100%). 다양한 구체예들에서, crRNA 가이드 서열의 길이는 약 15개 뉴클레오티드 내지 약 25개 뉴클레오티드 범위가 될 수 있다. 예를 들면, crRNA 가이드 서열의 길이는 약 15개, 16개, 17개, 18개, 19개, 20개, 21개, 22개, 23개, 24개, 또는 25개 뉴클레오티드일 수 있다. 특이적 구체예들에서, crRNA의 길이는 약 19개, 20개, 또는 21개 뉴클레오티드이다. 한 구체예에서, 상기 crRNA 가이드 서열은 20개의 뉴클레오티드 길이를 갖는다.
상기 가이드 RNA는 적어도 하나의 줄기(stem)-루프 구조를 형성하는 반복 서열 (Cas9 단백질과 상호작용하며), 그리고 단일-가닥으로 남아있는 3' 서열을 포함한다. 각각 루프 및 줄기의 길이는 가변적일 수 있다. 예를 들면, 루프는 길이가 약 3 개 내지 약 10 개 뉴클레오티드 범위일 수 있고, 스템은 길이가 약 6 개 내지 약 20 개 염기쌍 범위일 수 있다. 상기 스템은 1 개 내지 약 10 개 뉴클레오티드로 된 한 개 또는 그 이상의 불지스(bulges)를 포함할 수 있다. 상기 단일-가닥으로된 3' 영역의 길이는 가변적일 수 있다. 조작된 가이드 RNA의 tracrRNA 서열은 일반적으로 관심 박테리아 종의 야생형 tracrRNA의 코딩 서열을 기반으로 한다. 상기 야생형 서열은 이차 구조 형성, 증가된 이차 구조 안정성, 그리고 진핵세포에서 발현의 용이성 및 기타 등등이 실행되도록 개질될 수 있다. 예를 들면, 하나 또는 그 이상의 뉴클레오티드 변화가 상기 가이드 RNA 서열 안으로 도입될 수 있다 (하기 실시예 3 참고). 상기 tracrRNA 서열의 길이는 약 50개 뉴클레오티드 내지 약 300개 뉴클레오티드 범위일 수 있다. 다양한 구체예들에서, tracrRNA의 길이는 약 50개 내지 약 90개 뉴클레오티드, 약 90개 내지 약 110개 뉴클레오티드, 약 110개 내지 약 130개 뉴클레오티드, 약 130개 내지 약 150개 뉴클레오티드, 약 150개 내지 약 170개 뉴클레오티드, 약 170개 내지 약 200개 뉴클레오티드, 약 200개 내지 약 250개 뉴클레오티드, 또는 약 250개 내지 약 300개 뉴클레오티드의 범위일 수 있다.
일반적으로, 상기 공작된 가이드 RNA는 단일 분자 (가령, 키메라 단일 가이드 RNA 또는 sgRNA)이며, 이때 crRNA 서열이 tracrRNA 서열에 연계된다. 일부 구체예들에서, 그러나 상기 공작된 가이드 RNA는 두 개의 별개 분자 (가령, 듀얼 분자 가이드 RNA)일 수 있다. 예를 들면, 상기 가이드 RNA에는 제 2 분자의 5' 단부와 염기 페어링할 수 있는 3' 서열 (약 6 ~ 약 20개 뉴클레오티드를 포함하는)을 함유하는 crRNA를 포함하는 제 1 분자 (또는 영역), 그리고 상기 제 1 분자 (또는 영역)의 3' 단부와 염기 페어링을 할 수 있는 5' 서열 (약 6 ~ 약 20개 뉴클레오티드를 포함하는)을 함유하는 tracrRNA를 포함하는 제 2 분자가 내포될 수 있다.
일부 구체예들에서, 상기 공작된 가이드 RNA의 tracrRNA 서열은 하나 또는 그 이상의 압타머 서열을 포함하도록 변형될 수 있다 (Konermann et al., Nature, 2015, 517(7536):583-588; Zalatan et al., Cell, 2015, 160(1-2):339-50). 적합한 압타머 서열에는 MCP, PCP, Com, SLBP, FXR1, AP205, BZ13, f1, f2, fd, fr, ID2, JP34/GA, JP501, JP34, JP500, KU1, M11, M12, MX1, NL95, PP7, φCb5, φCb8r, φCb12r, φCb23r, Qβ, R17, SP-β, TW18, TW19, VK, 이의 단편들, 또는 이의 유도체들로부터 선택된 어뎁터 단백질에 결합하는 것들이 내포된다. 상기 압타머 서열의 길이는 가변적일 수 있음을 당업자는 인지할 것이다.
다른 구체예들에서, 가이드 RNA는 적어도 하나의 탐지가능한 라벨을 더 포함한다. 상기 탐지가능한 라벨은 형광단 (예로써, FAM, TMR, Cy3, Cy5, Texas Red, Oregon Green, Alexa Fluors, Halo 테그, 또는 적합한 형광 염료), 검출용 테그 (예로써, 바이오틴, 디곡시게닌, 및 이와 유사한 것), 양자점, 또는 금 입자일 수 있다..
상기 가이드 RNA는 표준 리보뉴클레오티드 및/또는 변형된 리보뉴클레오티드를 포함할 수 있다. 일부 구체예들에서, 가이드 RNAs는 표준 또는 변형된 데옥시리보뉴클레오티드를 포함할 수 있다. 가이드 RNA가 효소적으로 (즉, 생체내 또는 시험관내에서)합성되는 구체예들에서, 이 가이드 RNA는 일반적으로 표준 리보뉴클레오티드를 포함한다. 가이드 RNA 화학적으로 합성되는 구체예들에서, 이 가이드 RNA는 표준 또는 변형된 리보뉴클레오티드 및/또는 데옥시리보뉴클레오티드를 포함할 수 있다. 변형된 리보뉴클레오티드 및/또는 데옥시리보뉴클레오티드는 염기 변형 (예로써, 슈도우리딘, 2-티오우리딘, N6-메틸아데노신, 및 이와 유사한 것들) 및/또는 당 변형 (예로써, 2'-O-메틸, 2'-플루오로, 2'-아미노, 잠금(locked) 핵산 (LNA), 및 등등)을 포함한다. 가이드 RNA의 기본골격은 포스포로티오에이트 링키지, 보라노포스페이트 링키지 또는 펩티드 핵산을 포함하도록 또한 변형될 수 있다.
(b) PAM 서열
위에서 자세히 설명한 조작된 Cas9 시스템은 PAM 서열의 상류에 위치한 이중 가닥 DNA의 특정 서열을 표적으로 한다. 상기 PAM 서열에는 정준성(canonical) 5'-NGG-3' PAM 또는 비-정준성 PAM, 이를 테면, 5'-NAG-3' PAM가 내포될 수 있다. 일부 구체예들에서, 상기 상술된 공작된 Cas9 시스템은 대체 PAMs, 이를 테면, 5'-NGAN-3', 5'-NGNG-3', 그리고 5'-NGCG-3' PAMs를 인지하도록 변형될 수 있다.
(III) 핵산
본 명세서의 추가 측면은 이 섹션 (III)에 참고로 편입된 섹션 (I) 및 섹션 (II)에서 논의된 공작된 Cas9 단백질 변이체들을 인코딩하는 핵산을 제공하며(예를 들면, 공작된 Cas9 단백질 변이체에는 아미노산 위치들 526, 562, 652, 661, 691, 780, 810, 848, 855, 1003, 및 1060중 하나 또는 그 이상(가령, 2개 또는 3개) 위치에 변형이 내포되며(스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라), 이때 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 리신(K)는 류신 (L) 또는 글루타민 (Q)으로 변경되며, 및/또는 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 아르기닌 (R)은 류신 (L) 또는 글루타민 (Q)으로 변경된다. 상기 단백질 및 시스템은 단일 핵산 또는 다중 핵산에 의해 인코드될 수 있다. 상기 핵산은 DNA 또는 RNA, 선형 또는 원형, 단일-가닥으로된 또는 이중-가닥으로된 것일 수 있다. 상기 RNA 또는 DNA는 관심대상의 진핵 세포의 단백질로 효과적으로 해독되도록 코돈 최적화될 수 있다. 코돈 최적화 프로그램은 프리웨어(freeware) 또는 상업적 출처로부터 제공된다.
일부 구체예들에서, 상기 공작된 Cas9 단백질을 인코딩하는 핵산은 RNA일 수 있다. 상기 RNA는 시험관에서 효소적으로 합성될 수 있다. 이를 위해, 상기 공작된 Cas9 단백질을 인코딩하는 DNA는 시험관에서 RNA 합성을 위하여 파아지 RNA 중합효소에 의해 인지되는 프로모터 서열에 작동가능하도록 연계될 수 있다. 예를 들면, 상기 프로모터 서열은 T7, T3, 또는 SP6 프로모터 서열이거나, 또는 T7, T3, 또는 SP6 프로모터 서열의 변이일 수 있다. 상기 공작된 단백질을 인코딩하는 DNA는 하기에서 기술된 바와 같이, 벡터의 일부분일 수 있다. 이러한 구체예들에서, 시험관에서-전사된 RNA는 정제되고, 캡핑되거나(capped), 및/또는 폴리아데닐화될 수 있다. 다른 구체예들에서, 상기 공작된 Cas9 단백질을 인코딩하는 RNA는 자가-복제하는 RNA의 일부분일 수 있다 (Yoshioka et al., Cell Stem Cell, 2013, 13:246-254). 자기-복제 RNA는 비-감염성 자기-복제 베네수엘라 말 뇌염 (VEE) 바이러스 RNA 레플리 콘에서 유래될 수 있고, 이는 제한된 수의 세포 분할을 위하여 자가-복제할 수 있는 양성-센스, 단일-가닥으로된 RNA이고, 그리고 관심 단백질을 코드하도록 변경될 수 있다(Yoshioka et al., Cell Stem Cell, 2013, 13:246-254).
다른 구체예들에서, 상기 공작된 Cas9 단백질을 인코딩하는 핵산은 DNA일 수 있다. DNA 코딩 서열은 관심 세포에서의 발현을 위해 최소한 하나의 프로모터 제어 서열에 작동 가능하게 연계될 수 있다. 특정 구체예들에서, DNA 코딩 서열은 박테리아 (예로써, 대장균(E. coli) 세포 또는 진핵세포 (예로써, 효모, 곤충, 또는 포유류) 세포에서 상기 공작된 Cas9 단백질의 발현을 위하여 프로모터 서열에 작동가능하도록 연계될 수 있다. 적합한 박테리아 프로모터는 T7 프로모터, lac 오페론 프로모터, trp 프로모터, tac 프로모터 (trp 및 lac 프로모터의 하이브리드), 잔술한 것들중 임의의 변이, 그리고 전술한 것들중 임의의 조합을 포함하나, 이에 국한되지 않는다. 적합한 진핵세포 프로모터의 비-제한적 실시예는 구성적, 조절된, 또는 세포- 또는 조직-특이적 프로모터를 포함한다. 적합한 진핵세포 구성적 프로모터 조절 서열은 사이토메갈로바이러스 즉각 초기 프로모터 (CMV), 원숭이 바이러스 (SV40) 프로모터, 아데노바이러스 주요 후기 프로모터, 라우스 육종 바이러스 (RSV) 프로모터, 마우스 유방 종양 바이러스 (MMTV) 프로모터, 포스포글리세레이트 키나제 (PGK) 프로모터, 연장 인자 (ED1)-알파 프로모터, 유비퀴틴 프로모터, 액틴 프로모터, 튜블린 프로모터, 면역글로블린 프로모터, 이의 단편들, 또는 전술한 것들중 임의의 조합을 포함하나, 이에 국한되지 않는다. 적합한 진핵세포 조절된 프로모터 조절 서열의 예로는 열쇼크, 금속, 스테로이드, 항생제, 또는 알코올에 의해 조절된 것을 포함하나, 이에 국한되지 않는다. 조직-특이적 프로모터의 비-제한적 실시예로는 B29 프로모터, CD14 프로모터, CD43 프로모터, CD45 프로모터, CD68 프로모터, 데스민 프로모터, 엘라스타제-1 프로모터, 엔도글린 프로모터, 피브로넥틴 프로모터, Flt-1 프로모터, GFAP 프로모터, GPIIb 프로모터, ICAM-2 프로모터, INF-β 프로모터, Mb 프로모터, NphsI 프로모터, OG-2 프로모터, SP-B 프로모터, SYN1 프로모터, 그리고 WASP 프로모터를 포함한다. 상기 프로모터 서열은 야생형일 수 있거나, 또는 더욱 효과적인 또는 효율적인 발현을 위하여 변형될 수 있다. 일부 구체예들에서, 상기 DNA 코딩 서열은 폴리아데닐화 신호 (예로써, SV40 polyA 신호, 소 성장 호르몬(BGH) polyA 신호, 등등) 및/또는 최소한 하나의 전사 종료 서열에 또한 연계될 수 있다. 일부 상황에서, 박테리아 또는 진핵 세포로부터 상기 공작된 Cas9 단백질를 순수분리할 수 있다.
여전히 다른 구체예들에서, 상기 공작된 가이드 RNA는 DNA에 의해 인코드될 수 있다. 일부 경우들에서, 상기 공작된 가이드 RNA를 인코딩하는 DNA는 시험관에서 RNA 합성을 위하여 파아지 RNA 중합효소에 의해 인지되는 프로모터 서열에 작동가능하도록 연계될 수 있다. 예를 들면, 상기 프로모터 서열은 T7, T3, 또는 SP6 프로모터 서열이거나, 또는 T7, T3, 또는 SP6 프로모터 서열의 변이일 수 있다. 다른 경우들에서, 상기 공작된 가이드 RNA를 인코딩하는 DNA는 관심대상의 진핵 세포에서 발현을 위해 RNA 중합효소 III (Pol III)에 의해 인지되는 프로모터 서열에 작동가능하도록 연계될 수 있다. 적합한 Pol III 프로모터의 예로는 포유류 U6, U3, H1, 그리고 7SL RNA 프로모터를 포함하나, 이에 국한되지 않는다.
다양한 구체예들에서, 상기 공작된 Cas9 단백질을 인코딩하는 핵산은 벡터에 존재할 수 있다. 일부 구체예들에서, 상기 벡터는 상기 공작된 가이드 RNA를 인코딩하는 핵산을 더 포함할 수 있다. 적합한 벡터에는 플라스미드 벡터, 바이러스성벡터, 그리고 자가-복제 RNA가 내포된다 (Yoshioka et al., Cell Stem Cell, 2013, 13:246-254). 일부 구체예들에서, 복합체 또는 융합 단백질을 인코딩하는 핵산은 플라스미드 벡터 안에 존재할 수 있다. 적합한 플라스미드 벡터의 비-제한적 실시예로는 pUC, pBR322, pET, pBluescript, 그리고 이의 변이체들이 내포된다. 다른 구체예들에서, 복합체 또는 융합 단백질을 인코딩하는 핵산은 바이러스 벡터 (예로써, 렌티바이러스 벡터, 아데노-연합된 바이러스 벡터, 아데노바이러스 벡터, 그리고 기타등등)의 일부분일 수 있다. 플라스미드 또는 바이러스 벡터는 추가 발현 조절 서열 (예로써, 인헨서 서열, Kozak 서열, 폴리아데닐화 서열, 전사 종료 서열, 등등), 선별가능한 표지 서열 (예로써, 항생제 저항성 유전자), 복제 원점, 및 이와 유사한 것을 포함할 수 있다. 벡터 및 이의 용도에 관한 추가 정보는 "Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, New York, 2003 또는 "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001에서 찾아볼 수 있다.
(IV) 진핵 세포
본 명세서의 또다른 측면은 이 섹션 (IV)에서 참고로 편입된 섹션(I)에서 상술된 적어도 하나의 공작된 Cas9 단백질 변이체들을 포함하는 진핵 세포, 및/또는 섹션 (I), (II) 및 섹션 (III)에서 상술된 공작된 Cas9 단백질 및/또는 시스템을 인코딩하는 적어도 하나의 핵산 및/또는 공작된 가이드 RNA (각 세션은 이 섹션 (IV)에서 참고로 편입됨)를 제공하며, (예를 들면, 공작된 Cas9 단백질 변이체에는 아미노산 위치들 526, 562, 652, 661, 691, 780, 810, 848, 855, 1003, 및 1060중 하나 또는 그 이상(가령, 2개 또는 3개) 위치에 변형이 내포되며(스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라), 이때 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 리신(K)는 류신 (L) 또는 글루타민 (Q)으로 변경되며, 및/또는 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 아르기닌 (R)은 류신 (L) 또는 글루타민 (Q)으로 변경된다).
진핵 세포는 인간 세포, 비-인간 포유동물 세포, 비-포유동물 척추동물 세포, 무척추동물 세포, 식물 세포, 또는 단세포 진핵 유기체일 수 있다. 적합한 진핵 세포의 예시는 하기 섹션 (V)(c)에서 상술된다. 상기 진핵 세포는 시험관내, 생체외, 또는 생체내 세포일 수 있다.
(V) 서열을 변형시키는 방법
본 명세서의 추가 측면은 진핵 세포에서 염색체 서열을 변형시키는 방법을 포괄한다. 일반적으로, 상기 방법은 섹션 (II)에서 상술되고, 섹션 (I)에서 상술된 바와 같이 공작된 Cas9 단백질 변이체이 더 내포된, 적어도 하나의 공작된 Cas9 시스템 및/또는 섹션 (I), (II) 및 섹션 (III)에서 상술된 공작된 Cas9 단백질 및/또는 시스템을 인코딩하는 적어도 하나의 핵산 및/또는 공작된 가이드 RNA (각 세션은 이 섹션 (V)에서 참고로 편입됨)을 관심 대상의 진핵 세포내로 도입시키는 것을 포함하며, 이때 각 섹션 (I) 및 섹션 (II)은 이 섹션 (V)에 참고로 편입되며 ((예를 들면, 공작된 Cas9 단백질 변이체에는 아미노산 위치들 526, 562, 652, 661, 691, 780, 810, 848, 855, 1003, 및 1060중 하나 또는 그 이상(가령, 2개 또는 3개) 위치에 변형이 내포되며(스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라), 이때 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 리신(K)는 류신 (L) 또는 글루타민 (Q)으로 변경되며, 및/또는 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 아르기닌 (R)은 류신 (L) 또는 글루타민 (Q)으로 변경된다).
상기 공작된 Cas9 단백질이 뉴클라제 또는 니카제 활성을 포함하는 구체예들에서, 염색체 서열 변형은 적어도 하나의 뉴클레오티드의 치환, 적어도 하나의 뉴클레오티드의 결손, 적어도 하나의 뉴클레오티드의 삽입을 포함할 수 있다. 일부 반복에서, 상기 방법은 뉴클라제 활성을 포함하는 하나의 공작된 Cas9 시스템, 또는 니카제 활성을 포함하고, 공여 폴리뉴클레오티드를 포함하지 않는 두 개의 공작된 Cas9 시스템을 상기 진핵 세포로 도입시키는 것을 포함하며, 이러한 상기 공작된 Cas9 시스템 또는 시스템은 염색체 서열의 표적 부위로 이중-가닥으로 된 파괴부분(break)을 도입시키고, 세포 DNA 복구 공정에 의한 해당 이중-가닥으로 된 파괴부분의 복구로 적어도 하나의 뉴클레오티드 변화가 도입되고 (가령, indel), 이로 인하여 염색체 서열이 비활성화된다 (가령, 유전자 녹-아웃). 다른 반복에서, 상기 방법은 뉴클라제 활성을 포함하는 하나의 공작된 Cas9 시스템, 또는 니카제 활성 뿐만 아니라 공여 폴리뉴클레오티드를 포함하는 두 개의 공작된 Cas9 시스템을 상기 진핵 세포로 도입시키는 것을 포함하며, 이러한 상기 공작된 Cas9 시스템 또는 시스템은 염색체 서열의 표적 부위로 이중-가닥으로 된 파괴부분을 도입시키고, 세포 DNA 복구 공정에 의한 해당 이중-가닥으로 된 파괴부분의 복구는 염색체 서열의 표적 부위로 공여 폴리뉴클레오티드에서 서열의 삽입 또는 교환으로 이어진다 (가령, 유전자 교정 또는 유전자 녹-인).
상기 공작된 Cas9 단백질이 후성유전학적 변형 활성 또는 전사 조절 활성을 포함하는 구체예들에서, 염색체 서열 변형은 염색체 서열에서 해당 표적 부위 또는 이 표적 부위의 부근에 적어도 하나의 뉴클레오티드의 전환, 해당 표적 부위 또는 이 표적 부위의 부근에 적어도 하나의 뉴클레오티드의 변형, 해당 표적 부위, 또는 이 표적 부위의 부근에 적어도 하나의 히스톤 단백질의 변형, 및/또는 해당 표적 부위 또는 이 표적 부위의 부근에 전사의 변형을 포함할 수 있다.
여전히 추가로, 본원에 기술된 상기 공작된 Cas9 변이체들은 진핵 세포이외의 다른 것들, 이를 테면, 미생물 게놈을 변형시키는데 또한 이용될 수 있음을 이해할 것이다.
(a) 세포 안으로의 도입
상기에서 언급된 바와 같이, 상기 방법은 적어도 하나의 공작된 Cas9 시스템 및/또는 전술한 시스템을 인코딩하는 핵산 (및 임의선택적으로 공여 폴리뉴클레오티드)을 진핵 세포 안으로 도입시키는 것을 포함한다. 상기 적어도 하나의 시스템 및/또는 핵산/공여 폴리뉴클레오티드는 다양한 수단에 의해 관심 대상 세포 안으로 도입될 수 있다.
일부 구체예들에서, 세포는 적절한 분자 (가령, 단백질, DNA, 및/또는 RNA)에 의해 형질감염될 수 있다. 적합한 형질감염 방법은 핵감염 (또는 전기천공), 칼슘 포스페이트-매개된 형질감염, 양이온 폴리머 형질감염 (예로써, DEAE-덱스트란 또는 폴리에틸이민), 바이러스성 형질유도, 비로좀 형질감염, 비리온 형질감염, 리포좀 형질감염, 양이온 리포좀 형질감염, 면역리포좀 형질감염, 비리포좀 지질 형질감염, 덴드리머 형질감염, 열 쇼크 형질감염, 마그네토펙션(magnetofection), 리포펙션(lipofection), 유전자 총 운반, 임팔레펙션( impalefection), 소노포레이션(sonoporation), 광학적 형질감염, 그리고 독점(proprietary) 물질-강화된 핵산의 취입을 포함한다. 형질감염 방법은 당분야에 공지되어 있다 (예로써, "Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, New York, 2003 or "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001). 다른 구체예들에서, 상기 분자는 세포 안으로 현미주사(microinjection)를 통하여 도입될 수 있다. 예로써, 상기 분자는 관심 대상의 세포질 또는 핵으로 주사될 수있다. 세포 안으로 도입되는 각 분자의 양은 가변적일 수 있지만, 당업자는 적절한 양을 결정하는 수단을 알고 있다.
다양한 분자는 세포 안으로 동시에 또는 순차적으로 도입될 수 있다. 예를 들면, 상기 공작된 Cas9 시스템 (또는 이의 인코딩 핵산) 및 공여 폴리뉴클레오티드는 동시에 도입될 수 있다. 대안으로, 하나가 먼저 도입되고, 이어서 다른 하나가 세로에 나중에 도입될 수 있다.
일반적으로, 상기 세포는 세포 성장 및/또는 유지에 적합한 조건하에서 유지된다. 적합한 세포 배양 조건은 당분야에 잘 공지되어 있고, 예로써, Santiago et al., Proc. Natl. Acad. Sci. USA, 2008, 105:5809-5814; Moehle et al. Proc. Natl. Acad. Sci. USA, 2007, 104:3055-3060; Urnov et al., Nature, 2005, 435:646-651; 그리고 Lombardo et al., Nat. Biotechnol., 2007, 25:1298-1306에서 기술되어 있다. 당업자는 세포 배양 방법이 당업계에 공지되어 있고, 세포 유형에 따라 달라질 수 있고, 달라질 수 있음을 인식한다. 모든 경우에 일상적인 최적화를 사용하여 특정 세포 유형에 가장 적합한 기술을 결정할 수 있다.
(b)임의선택적 공여 폴리뉴클레오티드
공작된 Cas9 단백질이 뉴클레아제 또는 니카제 활성을 갖는 구체예들에서, 상기 방법은 최소한 하나의 기증 폴리뉴클레오티드를 세포 안으로 도입시키는 것을 더 포함할 수 있다. 공여 폴리뉴클레오티드는 단일-가닥으로된 또는 이중-가닥으로된, 선형 또는 원형, 및/또는 RNA 또는 DNA일 수 있다. 일부 구체예들에서, 기증 폴리뉴클레오티드는 벡터, 예로써, 플라스미드 벡터일 수 있다.
상기 공여 폴리뉴클레오티드는 적어도 하나의 공여 서열을 포함한다. 일부 측면들에서, 공여 폴리뉴클레오티드의 공여 서열은 내생성 또는 고유(native) 염색체 서열의 변형된 형태일 수 있다. 예를 들면, 상기 공여 서열은 상기 공작된 Cas9 시스템에 의해 표적화되는 서열에서 또는 이 서열 부근에서 염색체 서열의 일부분과 기본적으로 동일하지만, 최소한 하나의 뉴클레오티드 변화를 포함한다. 따라서, 고유 서열에 통합 또는 교환 시에, 상기 표적화된 염색체 위치의 서열은 최소한 하나의 뉴클레오티드 변화를 포함한다. 예로써, 변화는 하나 또는 그 이상의 뉴클레오티드의 삽입, 하나 또는 그 이상의 뉴클레오티드의 결손, 하나 또는 그 이상의 뉴클레오티드의 치환, 또는 이의 조합일 수 있다. 변형된 서열의 "유전자 교정" 통합 결과로써, 세포는 상기 표적화된 염색체 서열로부터 변형된 유전자 산물을 만들 수 있다.
다른 측면들에서, 상기 공여 폴리뉴클레오티드의 공여 서열은 외생성 서열일 수 있다. 여기에서 사용된 바와 같이, "외생성(exogenous)" 서열이란 세포에 있어서 고유한 것은 아닌 서열이거나, 또는 서열의 고유 위치가 세포의 게놈에서 상이한 위치에 있는 서열을 말한다. 예로써, 외생성 서열은 단백질 코딩 서열을 포함할 수 있는데, 이 서열은 외생성 프로모터 조절 서열에 작동가능하도록 연계될 수 있어서, 게놈 안으로 통합시에 이 세포는 통합된 서열에 의해 인코드된 단백질을 발현시킬 수 있다. 대안으로, 상기 외생성 서열은 염색체 서열 안으로 통합되어, 이의 발현은 내생성 프로모터 조절 서열에 의해 조절된다. 다른 반복에서, 외생성 서열은 전사 조절 서열, 또다른 발현 조절 서열, RNA 코딩 서열, 그리고 기타 등등일 수 있다. 상기에서 명시된 바와 같이, 외생성 서열이 염색체 서열 안으로 통합되는 것을 "녹-인(knock in)"이라고 한다.
당업자에 의해 인지되는 바와 같이, 공여 서열의 길이는 가변적이며, 가변적일 것이다. 예로써, 공여자 서열은 몇 개 뉴클레오티드에서부터 수백개 뉴클레오티드 내지 수십만개 뉴클레오티드까지 길이가 가변적일 수 있다.
전형적으로, 상기 폴리뉴클레오티드에서 공여 서열은 상류(upstream) 서열과 하류(downstream) 서열 양측면에 있고, 이는 상기 공작된 Cas9 시스템에 의해 표적화된 서열의 상류와 하류 각각에 차례로 위치한 서열에 대하여 실질적 서열 동일성을 갖는다. 이러한 서열 유사성때문에, 공여 폴리뉴클레오티드의 상류 및 하류 서열은 공여 폴리뉴클레오티드 와 표적화된 염색체 서열 사이에 상동성 재조합을 허용하고, 이로 인하여 공여 서열은 염색체 서열 안으로 통합될 수 있다(또는 이와 교환될 수 있다).
본원에서 이용된 상류 서열은 상기 공작된 Cas9 시스템에 의해 표적화된 서열의 상류 염색체 서열과 실질적 서열 동일성을 공유하는 핵산 서열을 지칭한다. 유사하게, 하류 서열이란 상기 공작된 Cas9 시스템에 의해 표적화된 서열의 하류 염색체 서열과 실질적 서열 동일성을 공유하는 핵산 서열을 지칭한다. 여기에서 사용된 바와 같이, 구절 "실질적 서열 동일성"이란 최소한 약 75% 서열 동일성을 갖는 서열을 지칭한다. 따라서, 상기 공여 폴리뉴클레오티드에서 상류 서열과 하류 서열은 상기 표적 서열에 대하여 상류 또는 하류인 서열과 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 가질 수 있다. 예시적인 구체예에서, 기증 폴리뉴클레오티드에서 상류 및 하류 서열은 상기 공작된 Cas9 시스템에 의해 표적화되는 서열의 상류 또는 하류 염색체 서열과 약 95% 또는 100% 서열 동일성을 가질 수 있다.
일부 구체예들에서, 상류 서열은 상기 공작된 Cas9 시스템에 의해 표적화되는 서열의 바로 상류에 위치한 염색체 서열과 실질적 서열 동일성을 공유한다. 다른 구체예들에서, 상류 서열은 상기 표적 서열로부터 약 100개 뉴클레오티드 상류 안에 위치한 염색체 서열과 실질적 서열 동일성을 공유한다. 따라서, 예로써, 상류 서열은 상기 표적 서열로부터 약 1 내지 약 20개, 약 21 내지 약 40개, 약 41 내지 약 60개, 약 61 내지 약 80개, 또는 약 81 내지 약 100개 뉴클레오티드 상류에 위치한 염색체 서열과 실질적 서열 동일성을 공유한다. 일부 구체예들에서, 하류 서열은 상기 공작된 Cas9 시스템에 의해 표적화되는 서열의 바로 하류에 위치한 염색체 서열과 실질적 서열 동일성을 공유한다. 다른 구체예들에서, 하류 서열은 상기 표적 서열로부터 약 100개 뉴클레오티드 하류 안에 위치한 염색체 서열과 실질적 서열 동일성을 공유한다. 따라서, 예로써, 하류 서열은 상기 표적 서열로부터 약 1 내지 약 20개, 약 21 내지 약 40개, 약 41 내지 약 60개, 약 61 내지 약 80개, 또는 약 81 내지 약 100개 뉴클레오티드 하류에 위치한 염색체 서열과 실질적 서열 동일성을 공유한다.
각 상류 또는 하류 서열은 약 20개 뉴클레오티드 내지 약 5000개 뉴클레오티드 길이 범위일 수 있다. 일부 구체예들에서, 상류 및 하류 서열은 약 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2800, 3000, 3200, 3400, 3600, 3800, 4000, 4200, 4400, 4600, 4800, 또는 5000개의 뉴클레오티드를 포함할 수 있다. 특정 구체예들에서, 상류 서열 및 하류 서열은 약 50개 내지 약 1500개 뉴클레오티드 길이 범위일 수 있다.
(c) 세포 유형
원핵 세포 (예를 들어, 박테리아) 및 진핵 세포 (예를 들어, 동물 세포, 곤충 세포 및 식물 세포)를 포함하는 다양한 세포가 본원에 개시된 방법에 사용하기에 적합하다. 예로써, 세포는 인간 세포, 비-인간 포유 동물 세포, 비-포유 동물 척추 동물 세포, 무척추 동물 세포, 곤충 세포, 식물 세포, 효모 세포 또는 단일 세포 진핵 생물일 수 있다. 일부 구체예들에서, 세포는 하나의 세포 배아일 수 있다. 예로써, 렛, 햄스터, 설치류, 토끼, 고양이, 개, 양, 돼지, 소, 말 및 영장류 배아를 포함하는 비-인간 포유 동물 배아. 여전히 다른 구체예들에서, 세포는 배아 줄기 세포, ES-유사 줄기 세포, 태아 줄기 세포, 성체 줄기 세포 및 이와 유사한 것과 같은 줄기 세포일 수 있다. 한 구체 예에서, 줄기 세포는 인간 배아 줄기 세포가 아니다. 더욱이, 줄기 세포는 WO2003/046141에 개시된 기술에 의해 제조된 것을 포함 할 수 있으며, 이는 그 전체가 본 명세서에 포함되어 있거나, 또는 Chung et al. (Cell Stem Cell, 2008, 2:113-117)에 기술된다. 세포는 시험관내(즉, 배양 중), 생체외(즉, 유기체로부터 단리된 조직 내), 또는 생체내(즉, 유기체 내)일 수 있다. 예시적인 구체예들에서, 세포는 포유류 세포 또는 포유류 세포 계통이다. 특정 구체예들에서, 상기 세포는 인간 세포 또는 인간 세포 계통이다.
예로써, 일부 구체예들에서, 진핵 세포 또는 진핵 세포 집단은 T 세포, CD8+ T 세포, CD8+ 나이브 T 세포, 중추 기억 T 세포, 효과기 기억 T 세포, CD4+ T 세포, 줄기 세포 기억 T 세포, 보조 T 세포, 조절 T 세포, 세포독성 T 세포, 자연 살해 T 세포, 조혈 줄기 세포, 장기 조혈 줄기 세포, 단기 조혈 줄기 세포, 다분화능 전구 세포, 혈통 제한 전구 세포, 림프 전구 세포, 췌장 전구 세포, 내분비 전구 세포, 외분비 전구 세포, 골수 전구 세포, 일반 골수 전구 세포, 적혈구 전구 세포, 거핵구 적혈구 전구 세포, 단핵구 전구 세포, 내분비 전구 세포, 외분비 세포, 섬유아세포, 간모세포, 근모세포, 대식세포, 섬 베타 세포, 심근 세포, 혈액 세포, 관 세포, 포상 세포, 알파 세포, 베타 세포, 델타 세포, PP세포, 담관세포, 망막세포, 광수용체세포, 간상세포, 원추세포, 망막색소상피세포, 섬유주망세포, 와우유모세포, 외유모세포, 내유모세포, 폐 상피세포, 기관지 상피세포, 폐포상피세포, 폐상피전구세포, 횡문근세포, 심장근육세포, 근육위성세포, 근세포, 뉴런, 신경줄기세포, 간엽줄기세포, 유도만능줄기세포(iPS), 배아 줄기 세포, 단핵구, 거핵구, 호중구, 호산구, 호염기구, 비만 세포, 망상적혈구, B 세포, 예를 들어 전구 B 세포, Pre B 세포, Pro B 세포, 기억 B 세포, 혈장 B 세포, 위장 상피 세포, 담도 상피 세포, 췌관 상피 세포, 장 줄기 세포, 간세포, 간 성상 세포, 쿠퍼(Kupffer) 세포, 조골세포, 파골세포, 지방세포(예: 갈색 지방세포, 또는 백색 지방세포), 지방전구세포, 췌장 전구체 세포, 췌장 섬 세포, 췌장 베타 세포, 췌장 알파 세포, 췌장 델타 세포, 췌장 외분비 세포, 슈반(Schwann) 세포, 희소돌기아교세포, 또는 이러한 세포의 집단이다. 적합한 포유류 세포 또는 세포 계통의 비-제한적 실시예는 인간 유도 만능 줄기 세포(hiPSC), 인간 T 세포(자가 또는 동종), 인간 B 세포, 인간 대식세포, 인간 조혈 줄기 세포(hHSC), 인간 간 세포, 인간 망막 세포, 췌도, 인간 배아 신장 세포 (HEK293, HEK293T); 인간 자궁경부 암종 세포 (HELA); 인간 폐 세포 (W138); 인간 간 세포 (Hep G2); 인간 U2-OS 골육종 세포, 인간 A549 세포, 인간 A-431 세포, 그리고 인간 K562 세포; 중국 헴스터 난소 (CHO) 세포, 아기 헴스터 신장 (BHK) 세포; 마우스 골수종 NS0 세포, 마우스 배아 섬유아세포 3T3 세포 (NIH3T3), 마우스 B 림프종 A20 세포; 마우스 흑색종 B16 세포; 마우스 근아세포 C2C12 세포; 마우스 골수종 SP2/0 세포; 마우스 배아 간엽성 C3H-10T1/2 세포; 마우스 암종 CT26 세포, 마우스 전립선 DuCuP 세포; 마우스 유방 EMT6 세포; 마우스 간종양 Hepa1c1c7 세포; 마우스 골수종 J5582 세포; 마우스 상피 MTD-1A 세포; 마우스 심근 MyEnd 세포; 마우스 신장 RenCa 세포; 마우스 췌장 RIN-5F 세포; 마우스 흑색종 X64 세포; 마우스 림프종 YAC-1 세포; 렛 교아종 9L 세포; 렛 B 림프종 RBL 세포; 렛 신경아세포종 B35 세포; 렛 간종양 세포 (HTC); 버팔로 렛 간 BRL 3A 세포;개의 신장 세포 (MDCK); 개의 유방 (CMT) 세포; 렛 골육종 D17 세포; 렛 단핵구/마크로파아지 DH82 세포; 원숭이 신장 SV-40 형질변환된 섬유아세포 (COS7) 세포; 원숭이 신장 CVI-76 세포; 아프리카 그린 원숭이 신장 (VERO-76) 세포가 내포된다. 포유 동물 세포주의 광범위한 목록은 American Type Culture Collection(ATCC, Manassas, VA) 카탈로그에서 찾을 수 있다.
본 명세서의 다른 측면에는 상기 기재된 바와 같은 핵산 또는 벡터를 인코딩하도록 조작된 동물, 또는 본 명세서의 공작된 SpCas9 변이체에 의해 영구적으로 변형된 동물이 내포된다. 예를 들면, 상기 동물은 모델 유기체(즉, 드로소필라 멜라노가스터(Drosophila melanogaster), 마우스, 모기, 쥐)일 수 있거나, 또는 동물은 농장 동물 또는 양식 물고기 또는 애완동물일 수 있다. 또다른 예로써, 동물은 적어도 하나의 질환에 대한 벡터가 될 수 있다. 또다른 예로써, 상기 유기체(즉, 모기, 진드기, 새)는 인간 질환의 벡터가 될 수 있다.
본 명세서의 여전히 다른 측면에는 상기 기재된 바와 같은 핵산 또는 벡터를 이용하여 공작된 식물, 또는 본 명세서의 공작된 SpCas9 변이체에 의해 일시적으로 또는 영구적으로 변형된 식물이 내포된다. 예를 들면, 상기 식물은 작물(즉, 벼, 대두, 밀, 담배, 목화, 자주개자리, 캐놀라, 옥수수, 사탕무 등)일 수 있다.
(VI) 적용
본원에 개시된 조성물 및 방법은 다양한 치료, 진단, 산업 및 연구 응용에 사용될 수 있다. 일부 구체예들에서, 본 명세서는 유전자의 기능을 모델링 및/또는 연구하기 위해, 관심대상의 유전적 또는 후생적 상태를 연구하거나, 또는 다양한 질병 또는 장애와 관련된 생화학적 경로를 연구하기 위하여, 세포, 동물 또는 식물에서 관심대상의 임의의 염색체 서열을 변형하는데 사용될 수 있다. 예로써, 질병 또는 장애와 관련된 하나 또는 그이상의 핵산 서열의 발현이 변경되는 질환 또는 장애를 모델링하기 위한 유전자 삽입(transgenic) 유기체가 생성될 수 있다. 질병 모델은 유기체에 대한 돌연변이의 영향을 연구하고, 질병의 발달 및 / 또는 진행을 연구하고, 질병에 대한 약학적 활성 화합물의 효과를 연구하고 및/또는 잠재적 유전자 요법 전략의 효능을 평가하는데 사용될 수 있다.
다른 구체예들에서, 상기 조성물 및 방법은 효율적이고 비용 효과적인 기능성 게놈 스크린을 수행하는데 사용될 수 있으며, 이는 특정 생물학적 과정에 관여하는 유전자의 기능 및 유전자 발현의 변경이 생물학적 과정에 어떻게 영향을 줄 수 있는지를 연구하는데 사용될 수 있거나, 또는 세포 표현형과 함께 게놈 유전자 좌의 포화 또는 딥 스캐닝 돌연변이유발(deep scanning mutagenesis)을 수행한다. 예를 들어, 유전자 발현, 약물 내성 및 질병의 역전에 필요한 기능적 요소의 중요한 최소 특징 및 개별 취약성(vulnerabilities)을 결정하기 위해 포화 또는 딥 스캐닝 돌연변이 유발이 사용될 수 있다.
추가 구체예들에서, 본원에 개시된 조성물 및 방법은 질병 또는 장애의 존재를 확립하기 위한 진단 시험 및 / 또는 치료 옵션을 결정하는데 사용하기 위해 사용될 수 있다. 적합한 진단 테스트의 예로는 암 세포에서 특이적 돌연변이의 탐지 (예로써, EGFR, HER2, 및 이와 유사한 것에서 특이적 돌연변이), 특징 질환과 연합된 특이적 돌연변이 (예로써, 트리뉴클레오티드 반복부, 겸상 세포 질환과 연합된 β-글로빈에서 돌연변이, 특이적 SNPs, 등등), 간염의 탐지, 바이러스 (예로써, Zika) 탐지, 그리고 기타등등을 포함한다.
추가 구체예들에서, 본원에 개시된 조성물 및 방법은 특정 질환 또는 장애와 관련된 유전자 돌연변이를 교정하는데 사용될 수 있는데, 이를 테면, 예로써, 겸상 세포 질환 또는 지중해빈혈과 연합된 글로빈 유전자 돌연변이의 교정, 심각한 복합 면역 결핍(SCID)과 연합된 아데노신 탈아미노효소 유전자에서 돌연변이 교정, 헌팅턴 질환의 질환-원인 유전자인 HTT 발현의 감소, 또는 망막염 색소 증의 치료를 위한 로돕신 유전자의 돌연변이 교정에 이용될 수 있다. 이러한 변형은 생체외 세포에서 이루어질 수 있다.
여전히 다른 구체예들에서, 본원에 개시된 조성물 및 방법은 개선된 형질 또는 환경 스트레스에 대한 저항성을 갖는 작물을 생성하는데 사용될 수 있다. 본 명세서는 또한 개선된 형질 또는 생산 동물을 갖는 농장 동물을 생성하는데 사용될 수 있다. 예로써, 돼지는 생의학 모델, 특히 재생 의학 또는 이종 이식에서 매력적인 많은 특징을 가지고 있다.
예로서, 본 명세서는 유전자 요법을 위한 의약으로서 사용하기 위한, 상기 기재된 바와 같은 뉴클레오티드 또는 핵산 또는 벡터의 서열을 제공한다. 본 명세서는 또한 상기 기재된 바와 같은 뉴클레오티드 또는 핵산 또는 벡터의 서열, 및 적어도 하나의 약제학적으로 허용되는 부형제를 포함하는 약제학적 조성물을 제공한다. 본 명세서는 상기 기재된 돌연변이를 함유하는 재조합 Cas9 폴리펩티드 및 적어도 하나의 약제학적으로 허용되는 부형제를 포함하는 약제학적 조성물을 또한 제공한다. 약제학적으로 허용되는 부형제(들)에는 전형적으로 비히클(예를 들어, 물, 캡슐 껍질 등), 희석제, 또는 치료제와 같은 약물을 포함하는 제형 또는 약제학적 조성물을 구성하기 위한 성분으로 사용되는 불활성 성분이 내포된다. 약학적으로 허용되는 부형제(들)는 해당 조성물에 응집 기능(즉, 결합제), 붕해 기능(즉, 붕해제), 윤활제 기능(윤활제) 및/또는 다른 기능(즉, 용매, 계면활성제 등)을 부여하는 전형적으로 불활성인 성분을 포괄한다. 추가로, 본 명세서는 게놈 공학, 세포 공학, 단백질 발현 또는 다른 생명공학 적용을 위한, 상기 기재된 바와 같은 뉴클레오티드 또는 핵산 또는 벡터의 서열의 시험관내 용도를 제공한다. 추가로, 본 개시내용은 게놈 공학, 세포 공학, 단백질 발현 또는 기타 생명공학 응용 분야를 위한 가이드 RNA가이드 RNA(예를 들어, 단일 분자(즉, 키메라) 가이드 RNA 또는 듀얼 분자(즉, 2-부분)와 함께 상기 기재된 돌연변이를 함유하는 재조합 Cas9 폴리펩티드의 시험관내 용도를 제공한다.
본 명세서의 다른 측면은 본원에 기재된 다양한 성분, 이를 테면, 본 명세서에 기재된 Cas9 단백질 변이체, 가이드 RNAs, 벡터, 프라이머 등이 내포되며, 게놈 공학, 세포 공학, 단백질 발현 또는 기타 생명 공학 응용 분야에서의 사용 지침이 내포된 키트에 관한 것이다.
정의
다음의 정의 및 방법은 본 발명을 더 잘 정의하고, 본 발명의 실행에서 당업자를 안내하기 위해 제공된다. 달리 언급되지 않는 한, 용어는 관련 기술 분야의 통상의 지식을 가진 자에 의해 통상적인 사용법에 따라 이해되어야 한다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야의 당업자에 의해 일반적으로 이해되는 의미를 갖는다. 하기 참고 문헌은 당업자에게 본 발명에 사용된 많은 용어의 일반적인 정의를 제공한다: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd Ed. 1994); Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); 그리고 Hale & Marham, The Harper Collins Dictionary of Biology (1991). 여기에서 사용된 바와 같이, 다음의 용어는 달리 명시되지 않는 한 그 의미를 갖는다.
본 개시 내용의 요소 또는 그의 바람직한 구체예(들)를 소개할 때, 관사 "a", "an", "the" 및 "전술한"이란 하나 또는 이상의 요소가 존재함을 의미하도록 의도된다. "포함하는(comprising)", "내포하는(including)" 및 "갖는(having)"이라는 용어는 포괄적인 것으로 의도되며, 열거된 요소 이외의 추가 요소가 존재할 수 있음을 의미한다.
숫자 값 x와 관련하여 사용될 때, 용어 "약"이란 예를 들어 x ± 5 %를 의미한다.
여기에서 사용된 바와 같이, "상보적(complementary)" 또는 "상보성(complementarity)"이라는 용어는 특정 수소 결합을 통한 염기쌍에 의한 이중 가닥 핵산의 회합을 의미한다. 염기 쌍이란 표준 Watson-Crick 염기 쌍 (예로써, 5'-A G T C-3' 상보적인 서열 3'-T C A G-5'와 쌍을 이룬다). 상기 염기 쌍은 Hoogsteen 또는 역전된 Hoogsteen 수소 결합일 수 있다. 상보성은 전형적으로 듀플렉스(duplex) 영역에 대해 측정되므로, 예를 들어, 오버행(overhangs)을 배제한다. 염기의 일부 (예를 들어, 70 %)만이 상보적인 경우, 듀플렉스 영역의 두 가닥 사이의 상보성은 부분적이고, 백분율 (예를 들어, 70 %)로 표현될 수 있다. 상보적이지 않은 염기는 "불합치된다(mismatched)". 듀플렉스 영역의 모든 염기가 상보적인 경우, 상보성이 또한 완전한 상보성이 될 수 있다(즉, 100 %).
여기에서 사용된 바와 같이, "CRISPR/Cas 시스템" 또는 "Cas9 시스템"은 Cas9 단백질 (가령, 뉴클레아제, 니카제, 또는 촉매적으로 사멸 단백질) 및 유도 RNA를 포함하는 복합체를 지칭한다.
본원에 사용된 용어 "내생성 서열(endogenous sequence)"이란 세포 고유의 염색체 서열을 지칭한다.
여기에서 사용된 바와 같이, 용어 "외생성(exogenous)"이란 세포에 고유하지 않은 서열, 또는 세포의 게놈에서 고유 위치와 상이한 위치에 있는 염색체 서열을 지칭한다.
여기에서 사용된 바와 같이, "유전자"란 유전자 서열을 코딩하는 DNA 영역 (엑손 및 인트론 포함)뿐만 아니라, 이러한 조절 서열이 코딩 및 / 또는 전사 된 서열에 인접하는지 여부에 관계없이, 유전자 생성물의 생산을 조절하는 모든 DNA 영역을 지칭한다. 따라서, 유전자에는 프로모터 서열, 터미네이터, 리보솜 결합 부위 및 내부 리보솜 진입 부위와 같은 해독 조절 서열, 인핸서, 사일런서(silencers), 절연체(insulators), 경계 요소, 복제 원점(replication origins), 매트릭스 부착 부위 및 유전자 좌 조절 영역들이 내포되지만, 이에 제한되지는 않는다.
"이질성(heterologous)"이라는 용어는 내생성이 아니거나, 또는 관심대상 세포에 고유하지 않은 엔터티를 의미한다. 예로써, 이질성 단백질은 외생적으로 도입된 핵산 서열과 같은 외생성 공급원으로부터 유래되거나 또는 이로부터 유래된 단백질을 지칭한다. 일부 경우들에서, 이질성 단백질은 일반적으로 관심대상 세포에 의해 생성되지 않는다.
용어 "니카제(nickase)"란 이중-가닥으로된 핵산 서열중 하나의 가닥을 절단하는 (가령, 이중-가닥으로된 서열을 절단하는) 효소를 말한다. 예로써, 이중 가닥 절단 활성을 갖는 뉴클레아제는 니카제와 같은 기능을 하기 위하여 돌연변이 및/또는 결손에 의해 변형되어, 이중-가닥으로된 서열중 오직 하나의 가작을 절단할 수 있다.
용어 "뉴클라제"란 여기에서 사용된 바와 같이, 이중-가닥으로된 핵산 서열의 2개 서열을 모두 절단하는 효소를 말한다.
용어 "핵산" 및 "폴리뉴클레오티드"란 선형 또는 원형 형태에서, 그리고 단일- 또는 이중-가닥으로된 형태에서 데옥시리보뉴클레오티드 또는 리보뉴클레오티드를 지칭한다. 본 명세서의 목적을 위하여, 이들 용어는 중합체의 길이의 제한으로 해석되지 않아야 한다. 이들 용어는 천연 뉴클레오티드의 공지의 유사체들, 뿐만아니라 염기, 당 및/또는 포스페이트 모이어티 (예로써, 포스포로티오에이트 기본골격)에서 변형이 있는 뉴클레오티드를 포괄할 수 있다. 일반적으로, 특정 뉴클레오티드의 유사체는 동일한 염기-쌍 특이성을 갖는데; 가령, A의 유사체는 T와 염기쌍을 형성할 수 있다.
용어 "뉴클레오티드"란 데옥시리보뉴클레오티드 또는 리보뉴클레오티드를 지칭한다. 뉴클레오티드는 표준 뉴클레오티드 (가령, 아데노신, 구아노신, 시티딘, 티미딘, 그리고 우리딘), 뉴클레오티드 이성체, 또는 뉴클레오티드 유사체일 수 있다. 뉴클레오티드 유사체는 변형된 푸린 또는 피리미딘 염기 또는 변형된 리보스 모이어티를 갖는 뉴클레오티드를 지칭한다. 뉴클레오티드 유사체는 자연 발생적 뉴클레오티드 (예로써, 이노신, 슈도우리딘, 등등) 또는 비-자연 발생적 뉴클레오티드일 수 있다. 뉴클레오티드의 당 또는 염기 모이어티에 변형의 비-제한적 예로는 아세틸기, 아미노기, 카르복실기, 카르복시메틸기, 히드록실기, 메틸기, 포스포릴기 및 티올기의 첨가 (또는 제거) 및 염기의 탄소 및 질소 원자를 다른 원자로 치환하는 것 (예: 7-데자 퓨린)을 포함한다. 뉴클레오티드 유사체는 또한 디데옥시 뉴클레오티드, 2'-O-메틸 뉴클레오티드, 잠금 핵산 (LNA), 펩티드 핵산 (PNA) 및 몰폴리노를 포함한다.
용어 "폴리펩티드" 및 "단백질"은 상호 호환적으로 사용되며, 아미노산 잔기의 중합체를 지칭한다.
용어 "표적 서열", "표적 염색체 서열" 및 "표적 부위"는 상호 호환적으로 사용되며, 상기 공작된 Cas9 시스템이 표적화되는 염색체 DNA의 특정 서열, 및 상기 공작된 Cas9 시스템이 해당 DNA 또는 이 DNA와 연합된 단백질(들)을 변형시키는 부위를 지칭한다.
핵산 및 아미노산 서열 동일성을 결정하는 기술은 당업계에 공지되어 있다. 전형적으로, 이러한 기술은 유전자의 mRNA의 뉴클레오티드 서열을 결정하고, 이에 의해 인코드된 아미노산 서열을 결정하는 것과, 그리고 이들 서열을 제 2 뉴클레오티드 또는 아미노산 서열에 비교하는 것을 포함한다. 게놈 서열은 이러한 방식으로 또한 결정되며, 비교될 수 있다. 일반적으로, 동일성이란 2개의 폴리뉴클레오티드 또는 폴리펩티드 서열에서 각각 차례로 정확한 뉴클레오티드-대 뉴클레오티드, 또는 아미노산-대-아미노산 대응성을 말한다. 2개의 또는 그 이상의 서열 (폴리뉴클레오티드 또는 아미노산)은 이들의 동일성 백분율을 결정함으로써, 비교될 수 있다. 핵산 또는 아미노산 서열에 관계없이, 2 개의 서열의 동일성 백분율은 2 개의 정렬된 서열 사이의 정확하게 일치하는 수를 더 짧은 서열의 길이로 나눈 후, 100을 곱한 것이다. 예를 들면, 핵산 서열들을 위한 적절한 정렬은 Smith and Waterman, Advances in Applied Mathematics 2:482-489 (1981)의 국소 상동성 알고리즘에 의해 제공된다. 이 알고리즘은 Dayhoff, Atlas of Protein Sequences and Structure, M. O. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., USA에 의해 개발되고, Gribskov (1986), Nucl. Acids Res. 14(6):6745-6763 (1986)에의해 정상화된 스코어링 매트릭스(scoring matrix)를 이용하여 아미노산 서열에 적용될 수 있다. 서열의 동일성 백분율을 결정하기 위한 이 알고리즘의 예시적인 구현은 Genetics Computer Group (Madison, Wis.)에 의해 제공되는 "BestFit" 유틸리티 응용으로 제공된다. 서열 간의 동일성 또는 유사성을 계산하기 위한 다른 적합한 프로그램은 당업계에 일반적으로 공지되어 있으며, 예를 들어, 다른 정렬 프로그램은 디폴트 매개변수로 사용되는 BLAST이다. 예로써, BLASTN 및 BLASTP는 다음의 디폴트 매개변수를 이용할 수 있다: 유전자 코드=표준; 필터=없음; 가닥=양쪽 두 가닥; 컷오프=60; 예상=10; Matrix=BLOSUM62; 설명=50 서열; 소트 바이=HIGH SCORE; 데이터베이스=비-리던단트, GENBANK+EMBL+DDBJ+PDB+GENBANK CDS 해독+Swiss 단백질+Spupdate+PIR. 이러한 프로그램에 대한 자세한 내용은 GENBANK NIH 유전자 염기서열 데이터베이스 웹사이트에서 확인할 수 있다.
본 발명을 상세히 설명하였지만, 첨부된 특허청구범위에 정의된 본 발명의 범위를 벗어나지 않고 수정 및 변형이 가능함은 자명할 것이다. 더욱이, 본 명세서 내용의 모든 실시예는 비-제한적인 예로서 제공된다는 것을 이해해야 한다.
실시예
본 발명을 추가로 예시하기 위해 다음의 비-제한적 실시예가 제공된다. 다음의 실시예에 개시된 기술은 본 발명자들이 본 발명의 실행에서 기능을 잘 발견한 접근법을 나타낸다는 것을 당업자는 인식해야 하고, 따라서 실행 모드의 예를 구성하는 것으로 간주할 수 있다. 그러나, 본 개시에 비추어, 개시된 특정 실시예에 대해 많은 변경이 이루어질 수 있고, 본 발명의 사상 및 범위를 벗어나지 않으면서 여전히 유사하거나 또는 유사한 결과를 얻을 수 있음을 당업자는 인식해야 한다.
실시예 1: K855에서 상이한 아미노산 치환은 상이한 겨냥된 활성을 갖는다
야생형 SpCas9의 K855 잔기를 알라닌, 글루타민산, 이소류신, 메티오닌 또는 글루타민으로 돌연변이시키고, 대장균으로부터 95% 이상의 균질성으로 재조합 단백질을 정제하였다. K855Q 돌연변이 단백질에 대한 아미노산 서열은 표 1에 열거된다. 모든 K855 돌연변이 단백질은 K855 단일 돌연변이를 제외하고, 동일한 폴리펩티드 서열을 공유한다. 야생형 SpCas9 단백질은 대조군으로 사용하기 위해 MilliporeSigma에서 구입했다. 가이드 서열 5'-GGCACUGCGGCUGGAGGUGG-3' (서열 식별 번호: 42)과 함께 화학적으로 합성된 HEKSite4 단일 가이드 RNA (sgRNA) 또한 MilliporeSigma에서 구입했다. 각 단백질은 세 번의 생물학적 복제에서 테스트되었다.
완충액(20mM HEPES, 100mM KCl, 0.5mM DTT, 0.1mM EDTA, pH 7.5), 150pmol sgRNA 및 8μg의 Cas9 단백질을 1.5-mL 미세원심분리 튜브에 10 μL 총 반응 부피로 첨가하여, 리보핵단백질 (RNP) 복합체를 제조했다. sgRNA 대비 Cas9 단백질 몰비는 약 3:1이다. 상기 복합체를 실온에서 15분 동안 항온처리한 다음, 형질감염될 때까지 얼음에 보관하였다. 약 80% 합류(confluency)에서 인간 U-2OS 세포를 트립신 용액으로 분리시키고, Hank 균형 염 용액으로 두 번 세척했다. 그런 다음, 세포를 100 μL당 약 0.25 x 106 세포로 Nucleofector Solution V(Lonza)에 재현탁했다. 뉴클레오펙션은 100 μL의 세포를 RNP 복합체로 옮기고, Amaxa 프로그램 X-001로 전기천공을 위한 큐벳으로 옮기기 전에, 기포가 생기지 않도록 하면서, 아래 위로 부드럽게 피펫팅하여 즉시 혼합함으로써 수행되었다. 세포를 즉시 웰당 2mL의 예열된 배지를 포함하는 6-웰 플레이트로 옮기고, 게놈 변형 분석을 위해 수확하기 전에 3일 동안 37℃ 및 5% CO2에서 성장시켰다.
QuickExtract Solution을 사용하여 형질감염된 세포의 게놈 DNA 추출물을 제조했다. 표적 게놈 영역은 다음 사이클링 조건에서 KAPA HiFi HotStart ReadyMix PCR 키트 (Roche)를 사용하여 차세대 시퀀싱(NGS) 프라이머로 PCR 증폭되었다: 95℃/3m; 98℃/20s, 68℃/30s, 그리고 72℃/45s, 34회; 72℃/5m. HEKSite4 표적 부위에 대한 NGS 프라이머는 다음과 같다: 5'- TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGNNNNNNGGAACCCAGG테그CCAGAGA-3' (포워드) (서열 식별 번호: 43) 및 5'- GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGNNNNNNGGGGTGGGGTCAGACGT-3' (리버스) (서열 식별 번호: 44). HEKSite4 표적-외 부위에 대한 NGS 프라이머는 다음과 같다:
5'-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGNNNNNNC테그AGCAAACCTTGGCATTGTCC-3' (포워드) (서열 식별 번호: 45) 및
5'- GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGNNNNNNACCCTCTACCCTCCCTGATG-3' (리버스) (서열 식별 번호: 46). 일차 PCR 산물은 다음 사이클링 조건에서 정량적 PCR 키트(MilliporeSigma)용 JumpStart™ Taq ReadyMix™를 사용하여 Illumina 인덱스 프라이머로 재증폭되었다: 95℃/3m; 95℃/30s, 55℃/30s, 그리고 72℃/30s, 8회; 72℃/5m. 인덱싱된 PCR 산물은 Select-a-Size DNA Clean & Concentrator 키트(Zymo)로 정제하고 PicoGreen(ThermoFisher)으로 정량화했다. 그런 다음, PCR 산물을 정규화하고, 풀링시켜, NGS 라이브러리를 만들었다. NGS는 Illumina MiSeq 기기와 2 x 300bp 키트를 사용하여 수행되었다. NGS 분석 파이프라인을 사용하여, 각 샘플에 대한 FASTQ 파일의 게놈 편집 빈도를 분석했다. 결과는 도 1A 및 도 1B에 제시되어 있다. 상기 결과에서 상이한 K855 돌연변이 단백질이 상이한 수준의 겨냥된 활성을 가졌고, 5개의 모든 K855 돌연변이 단백질이 유사한 수준으로 표적을 벗어난 효과를 실질적으로 감소시켰다는 것을 보여준다. 상기 결과는 글루탐산과 알라닌이 표적 활성을 유지하기 위한 K855에 대한 최적의 대체물이 아님을 또한 보여준다.
표 1. SpCas9 K855Q 아미노산 서열
실시예 2: 최적의 아미노산 치환을 갖는 이중 돌연변이 변이체는 겨냥된 활성을 유지시킨다.
R661, N692 또는 Q695에서 서로 상이한 아미노산 치환을 K855M 및 K855Q 돌연변이 배경에 도입하여 이중 돌연변이를 만들었다. 대장균으로부터 95% 이상의 균질성으로 재조합 단백질을 정제하였다. 모든 이중 돌연변이는 명시된 돌연변이를 제외하고, 표 1에 나열된 K855Q 돌연변이의 것과 동일한 폴리펩티드 서열을 공유한다. 각 단백질은 U2-OS 세포의 동일한 HEKSite4 표적 부위 상에서 세 번의 생물학적 복제로 테스트되었다. RNP 복합체 제조, 세포 형질감염 및 NGS 분석은 실시예 1에 기재된 바와 같았다.
결과는 도 2에 제시되어 있다. 상기 결과에서 R661, N692, 또는 Q695에서 상이한 아미노산 치환은 상이한 수준의 겨냥된 활성을 초래한다는 것을 보여준다. R661 잔기에서, 이소류신 치환으로 이 활성의 실질적인 감소가 일어난 반면, 류신, 아스파라긴 또는 글루타민 치환으로 WT Cas9와 동일한 수준의 활성이 유지되었다. 두 개의 비-전하된 잔기에 대한 치환 효과는 예측하기 어려웠다.
실시예 3: 균형 잡힌 특이성과 활성이 특징인 삼중 돌연변이 변이체
K526, K562, K652, R691, R780, K810, K848, K1003 또는 R1060에서 류신 또는 글루타민 치환을 R661L-K855Q 배경에 도입하여 18개의 삼중 돌연변이체를 만들었고, 한 개의 사중 돌연변이체(R661L-K855Q-K1003Q-R1060Q)를 만들었다. 이들 삼중 및 사중 돌연변이 모두 명시된 돌연변이를 제외하고, 표 1에 나열된 K855Q 돌연변이의 것과 동일한 폴리펩티드 서열을 공유한다. 대장균으로부터 95% 이상의 균질성으로 재조합 단백질을 정제하였다. 인간 FANCF02 및 HBB03을 표적으로 하는 합성 sgRNAs는 MilliporeSigma에서 구입했다. 이러한 sgRNA의 가이드 서열은 표 2에 나열되어 있다. eSpCas9 1.1 단백질은 MilliporeSigma에서 구입했으며, HiFi Cas9 V3 단백질은 Integrated DNA Technologies에서 구입했다. 각 단백질은 세 번의 생물학적 복제에서 테스트되었다.
RNP 복합체들을 실시예 1에 기재된 바와 같이 제조했다. 인간 k562 세포는 형질감염 1일 전에 mL당 0.25 x 106 세포로 씨딩되었고, 형질감염 시점에는 mL당 대략 0.5 x 106 세포였다. 세포를 Hank의 균형 염 용액으로 세척하였고, 그런 다음, 세포를 100 μL당 약 0.35 x 106 세포로 Nucleofector Solution V(Lonza)에 재현탁했다. 뉴클레오펙션은 100 μL의 세포를 RNP 복합체로 옮기고, Amaxa 프로그램 T-016으로 전기천공을 위한 큐벳으로 옮기기 전에, 기포가 생기지 않도록 하면서, 아래 위로 부드럽게 피펫팅하여 즉시 혼합함으로써 수행되었다. 세포를 즉시 웰당 2mL의 예열된 배지를 포함하는 6-웰 플레이트로 옮기고, 게놈 변형 분석을 위해 수확하기 전에 3일 동안 37℃ 및 5% CO2에서 성장시켰다. QuickExtract Solution을 사용하여 형질감염된 세포의 게놈 DNA 추출물을 제조했다. 표적화된 게놈 영역은 다음 사이클링 조건에서 정량적 PCR 키트(MilliporeSigma)용 JumpStart™ Taq ReadyMix™를 사용하여 NGS 프라이머로 PCR 증폭되었다: 98℃/2m; 98℃/15s, 62℃/30s, 그리고 72℃/45s, 34회; 72℃/5m. NGS 프라이머 서열들이 표 2에서 열거되어 있다. NGS 라이브러리 준비, 시퀀싱 및 데이터 분석은 실시예 1에 설명된 바와 같이 했다.
결과는 도 3A, 도 3B, 도 3C, 및 도 3D에 제시된다. 도 3A 및 도 3B의 결과에서 모든 단백질이 FANCF02 표적 부위에서 고도로 활성을 나타내었고, 그들 사이에 단지 작은 변이가 있음을 보여준다. 그러나, FANCF02 단일 불합치 표적-외 부위에서 표적을 벗어난 돌연변이 빈도에서 단백질 간의 광범위한 변이가 있었다. 6개의 삼중 돌연변이 단백질은 이러한 표적을 벗어난 효과 감소에 있어서 eSpCas9 1.1보다 우수했다. 이들 단백질에는 K526L-R661L-K855Q, R661L-R691L-K855Q, R661L-R780L-K855Q, R661L-R780Q-K855Q, R661L-K810L-K855Q, 그리고 R661L-K848L-K855Q이 내포된다. 나머지 돌연변이 단백질은 기준에 벗어난(outlier) 돌연변이 R661L-R691Q-K855Q를 제외하고, WT Cas9와 비교하였을 때, 표적-외 돌연변이 빈도를 줄이는 데 있어 eSpCas9 1.1 또는 eSpCas9 1.1과 HiFi Cas9 V3 사이에 필적했다. 도 3C 및 도 3D의 결과는 이러한 단백질 간의 표적 활성 및 특이성 수준을 더욱 구별짓는다. FANCF02 부위에서 확인된 상당히 높은 특이적 돌연변이 단백질은 HBB03 부위에서 거의 모든 표적 활성을 잃었다. 그러나, 6개의 삼중 돌연변이 단백질은 eSpCas9 1.1과 유사한 수준의 표적을 벗어난 돌연변이 빈도를 가졌으나, HBB03 부위에서 eSpCas9 1.1보다 실질적으로 더 높은 수준의 겨냥된 활성을 가졌다. 복합된 결과에 기초하여, 이 돌연변이 단백질 그룹은 균형 잡힌 특이성과 활성을 갖는 것으로 확인되었다. 돌연변이 단백질의 이러한 선택적 그룹에는 K562L-R661L-K855Q, K562Q-R661L-K855Q, K652L-R661L-K855Q, K652Q-R661L-K855Q, R661L-K855Q-K1003Q, 및 R661L-K855Q-R1060Q가 내포된다. 4개의 eSpCas9 1.1-유사 삼중 돌연변이 단백질도 결합된 결과를 기반으로 확인되었고, 여기에는 K526Q-R661L-K855Q, R661L-K810Q-K855Q, R661L-K855Q-K1003L, 및 R661L-K855Q-R1060L이 내포된다
표 2. sgRNA 가이드 서열 및 NGS 프라이머
실시예 4: 특이성이 개선된 SpCas9 뉴클레아제는 다양한 게놈 부위에서 효율적인 편집을 중재한다
5개의 인간 게놈 부위를 표적으로 하는 sgRNA는 MilliporeSigma에서 구입했다. 이러한 sgRNA의 가이드 서열은 표 3 나열되어 있다. RNP 복합체들을 실시예 1에 기재된 바와 같이 제조했다. 인간 k562 세포는 형질감염 1일 전에 mL당 0.25 x 106 세포로 씨딩되었고, 형질감염 시점에는 mL당 대략 0.5 x 106 세포였다. 세포를 Hank의 균형 염 용액으로 세척하였고, 그런 다음, 세포를 100 μL당 약 0.35 x 106 세포로 Nucleofector Solution V(Lonza)에 재현탁했다. 뉴클레오펙션은 100 μL의 세포를 RNP 복합체로 옮기고, Amaxa 프로그램 T-016으로 전기천공을 위한 큐벳으로 옮기기 전에, 기포가 생기지 않도록 하면서, 아래 위로 부드럽게 피펫팅하여 즉시 혼합함으로써 수행되었다. 세포를 즉시 웰당 2mL의 예열된 배지를 포함하는 6-웰 플레이트로 옮기고, 게놈 변형 분석을 위해 수확하기 전에 3일 동안 37℃ 및 5% CO2에서 성장시켰다.
QuickExtract Solution을 사용하여 형질감염된 세포의 게놈 DNA 추출물을 제조했다. 표적화된 게놈 영역은 다음 사이클링 조건에서 정량적 PCR 키트(MilliporeSigma)용 JumpStart™ Taq ReadyMix™를 사용하여 NGS 프라이머로 PCR 증폭되었다: 98℃/2m; 98℃/15s, 62℃/30s, 그리고 72℃/45s, 34회; 72℃/5m. NGS 프라이머 서열은 표 3에 열거되어 있다. NGS 라이브러리 준비, 시퀀싱 및 데이터 분석은 실시예 1에 설명된 바와 같이 했다. 결과는 도 4 제시되어 있다. 이들 결과에서 균형잡힌 특이성 및 활성을 갖는 것으로 확인된 4개의 삼중 돌연변이 단백질이 eSpCas9 1.1보다 실질적으로 더 높은 편집 효율을 가졌고, 5개의 모든 게놈 표적 부위에 걸쳐 WT Cas9와 유사함을 보여준다.
표 3. sgRNA 가이드 서열 및 NGS 프라이머
SEQUENCE LISTING
<110> SIGMA-ALDRICH CO. LLC
<120> HIGH FIDELITY SPCAS9 NUCLEASES FOR GENOME MODIFICATION
<130> P20-035 WO-PCT
<140>
<141>
<150> 62/988,279
<151> 2020-03-11
<160> 83
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 2
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 3
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 3
Pro Lys Lys Lys Arg Arg Val
1 5
<210> 4
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 4
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 5
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 5
Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5 10
<210> 6
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 6
Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5
<210> 7
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 7
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 8
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 8
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 9
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 9
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 10
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 10
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 11
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 11
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 12
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 12
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 13
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 13
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 14
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 14
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 15
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 15
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 16
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 16
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 17
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 17
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 18
<211> 38
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 18
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 19
<211> 42
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 19
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 20
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 20
Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Pro Lys Lys
1 5 10 15
Lys Arg Lys Val
20
<210> 21
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 21
Pro Leu Ser Ser Ile Phe Ser Arg Ile Gly Asp Pro Pro Lys Lys Lys
1 5 10 15
Arg Lys Val
<210> 22
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 22
Gly Ala Leu Phe Leu Gly Trp Leu Gly Ala Ala Gly Ser Thr Met Gly
1 5 10 15
Ala Pro Lys Lys Lys Arg Lys Val
20
<210> 23
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 23
Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly
1 5 10 15
Ala Trp Ser Gln Pro Lys Lys Lys Arg Lys Val
20 25
<210> 24
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 24
Lys Glu Thr Trp Trp Glu Thr Trp Trp Thr Glu Trp Ser Gln Pro Lys
1 5 10 15
Lys Lys Arg Lys Val
20
<210> 25
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 25
Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala
1 5 10
<210> 26
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 26
Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg
1 5 10
<210> 27
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 27
Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg
1 5 10
<210> 28
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 28
Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg
1 5 10
<210> 29
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 29
Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu
1 5 10 15
Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu
20 25
<210> 30
<211> 33
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 30
Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala
1 5 10 15
Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu
20 25 30
Ala
<210> 31
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 31
Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys
1 5 10 15
<210> 32
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
6xHis tag"
<400> 32
His His His His His His
1 5
<210> 33
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 33
Leu Glu Gly Gly Gly Ser
1 5
<210> 34
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 34
Thr Gly Ser Gly
1
<210> 35
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 35
Gly Gly Ser Gly Gly Gly Ser Gly
1 5
<210> 36
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> SITE
<222> (1)..(20)
<223> /note="This sequence may encompass 1-4 'Gly Gly Gly Gly Ser'
repeating units"
<400> 36
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
1 5 10 15
Gly Gly Gly Ser
20
<210> 37
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> SITE
<222> (1)..(8)
<223> /note="This sequence may encompass 6-8 residues"
<400> 37
Gly Gly Gly Gly Gly Gly Gly Gly
1 5
<210> 38
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> SITE
<222> (1)..(20)
<223> /note="This sequence may encompass 1-4 'Glu Ala Ala Ala Lys'
repeating units"
<400> 38
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu
1 5 10 15
Ala Ala Ala Lys
20
<210> 39
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> SITE
<222> (2)..(26)
<223> /note="This region may encompass 2-5 'Glu Ala Ala Ala Lys'
repeating units"
<400> 39
Ala Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys
1 5 10 15
Glu Ala Ala Ala Lys Glu Ala Ala Ala Lys Ala
20 25
<210> 40
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<400> 40
Pro Ala Pro Ala Pro
1 5
<210> 41
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
peptide"
<220>
<221> SITE
<222> (1)..(16)
<223> /note="This sequence may encompass 6-8 'Ala Pro'
repeating units"
<400> 41
Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro
1 5 10 15
<210> 42
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 42
ggcacugcgg cuggaggugg 20
<210> 43
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 43
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnng gaacccaggt agccagaga 59
<210> 44
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 44
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn ggggtggggt cagacgt 57
<210> 45
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 45
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnnc tagagcaaac cttggcattg 60
tcc 63
<210> 46
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 46
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn accctctacc ctccctgatg 60
<210> 47
<211> 1404
<212> PRT
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"
<400> 47
Pro Ala Ala Lys Arg Val Lys Leu Asp Gly Gly Gly Gly Ser Thr Gly
1 5 10 15
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
50 55 60
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
65 70 75 80
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
85 90 95
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
100 105 110
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
115 120 125
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
130 135 140
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
145 150 155 160
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
165 170 175
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
180 185 190
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
195 200 205
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
210 215 220
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
225 230 235 240
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
245 250 255
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
260 265 270
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
275 280 285
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
290 295 300
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
305 310 315 320
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
325 330 335
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
340 345 350
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
355 360 365
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
370 375 380
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
385 390 395 400
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
405 410 415
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
420 425 430
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
435 440 445
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
450 455 460
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
465 470 475 480
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
485 490 495
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
500 505 510
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
515 520 525
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
530 535 540
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
545 550 555 560
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
565 570 575
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
580 585 590
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
595 600 605
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
610 615 620
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
625 630 635 640
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
645 650 655
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
660 665 670
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
675 680 685
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
690 695 700
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
705 710 715 720
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
725 730 735
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
740 745 750
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
755 760 765
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
770 775 780
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
785 790 795 800
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
805 810 815
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
820 825 830
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
835 840 845
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
850 855 860
Asp Ser Ile Asp Asn Gln Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
865 870 875 880
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
885 890 895
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
900 905 910
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
915 920 925
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
930 935 940
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
945 950 955 960
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
965 970 975
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
980 985 990
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
995 1000 1005
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
1010 1015 1020
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1025 1030 1035
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1040 1045 1050
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1055 1060 1065
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1070 1075 1080
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1085 1090 1095
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1100 1105 1110
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1115 1120 1125
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1130 1135 1140
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1145 1150 1155
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1160 1165 1170
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1175 1180 1185
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1190 1195 1200
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1205 1210 1215
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1220 1225 1230
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1235 1240 1245
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1250 1255 1260
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1265 1270 1275
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1280 1285 1290
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1295 1300 1305
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1310 1315 1320
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1325 1330 1335
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1340 1345 1350
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1355 1360 1365
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1370 1375 1380
Glu Phe Pro Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Pro
1385 1390 1395
Lys Lys Lys Arg Lys Val
1400
<210> 48
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 48
gcugcagaag ggauuccaug 20
<210> 49
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 49
cacguucacc uugccccaca 20
<210> 50
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 50
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnna atggggccat gccgaccaa 59
<210> 51
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 51
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn agttgcccag agtcaaggaa 60
cac 63
<210> 52
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 52
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnnt ctttccctca ctctggctcg 60
<210> 53
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 53
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn tggaatgaat ggggtgggag 60
g 61
<210> 54
<211> 63
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 54
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnnt aggcagagag agtcagtgcc 60
tat 63
<210> 55
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 55
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn ccaatctact cccaggagca 60
g 61
<210> 56
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 56
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnnt cactggagca gggaggaca 59
<210> 57
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 57
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn gggtaggaaa acagcccaag 60
g 61
<210> 58
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 58
cucccuccca ggauccucuc 20
<210> 59
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 59
gccaguagcc agccccgucc 20
<210> 60
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 60
caggcagucu ucauccccgu 20
<210> 61
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 61
gaagcgugau gacaaagagg 20
<210> 62
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"
<400> 62
auucugguca acguguccuu 20
<210> 63
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 63
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnnc ttgggaagtg taaggaagct 60
gc 62
<210> 64
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 64
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn gcctcctcct tcctagtctc 60
c 61
<210> 65
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 65
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnng ctgcagcttc cttacacttc 60
c 61
<210> 66
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 66
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn gaggaatatg tcccagatag 60
cact 64
<210> 67
<211> 64
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 67
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnnc tgtgggattt catggaagtt 60
cagc 64
<210> 68
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 68
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn atcctggctg gcaaggtgg 59
<210> 69
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 69
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnnt tccttggcct ctgactgttg 60
<210> 70
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 70
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn ttcctgccca ccatctactc 60
c 61
<210> 71
<211> 61
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (34)..(39)
<223> a, c, t, g, unknown or other
<400> 71
tcgtcggcag cgtcagatgt gtataagaga cagnnnnnng atgggcctca gtaccacatt 60
g 61
<210> 72
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"
<220>
<221> modified_base
<222> (35)..(40)
<223> a, c, t, g, unknown or other
<400> 72
gtctcgtggg ctcggagatg tgtataagag acagnnnnnn caacctttgc cttcccctaa 60
cc 62
<210> 73
<211> 23
<212> DNA
<213> Homo sapiens
<400> 73
ggcactgcgg ctggaggtgg ggg 23
<210> 74
<211> 23
<212> DNA
<213> Homo sapiens
<400> 74
ggcacgacgg ctggaggtgg ggg 23
<210> 75
<211> 23
<212> DNA
<213> Homo sapiens
<400> 75
gctgcagaag ggattccatg agg 23
<210> 76
<211> 23
<212> DNA
<213> Homo sapiens
<400> 76
gctgcagaag ggattccaag ggg 23
<210> 77
<211> 23
<212> DNA
<213> Homo sapiens
<400> 77
cacgttcacc ttgccccaca ggg 23
<210> 78
<211> 23
<212> DNA
<213> Homo sapiens
<400> 78
cacgttcact ttgccccaca ggg 23
<210> 79
<211> 23
<212> DNA
<213> Homo sapiens
<400> 79
ctccctccca ggatcctctc tgg 23
<210> 80
<211> 23
<212> DNA
<213> Homo sapiens
<400> 80
gccagtagcc agccccgtcc tgg 23
<210> 81
<211> 23
<212> DNA
<213> Homo sapiens
<400> 81
caggcagtct tcatccccgt agg 23
<210> 82
<211> 23
<212> DNA
<213> Homo sapiens
<400> 82
gaagcgtgat gacaaagagg agg 23
<210> 83
<211> 23
<212> DNA
<213> Homo sapiens
<400> 83
attctggtca acgtgtcctt cgg 23
Claims (35)
- 아미노산 위치들 526, 562, 652, 661, 691, 780, 810, 848, 855, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)중 두 개 또는 그 이상의 위치에 돌연변이를 포함하는 공작된 스트렙토코커스 피오게네스 Cas9 (SpCas9) 단백질 변이체에 있어서, 이때 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 있는 리신(K)는 류신 (L) 또는 글루타민 (Q)으로 변화되고, 및/또는 전술한 아미노산 위치들중 하나 또는 그 이상의 위치에 있는 아르기닌 (R)은 류신 (L) 또는 글루타민 (Q)으로 변화된, SpCas9 단백질 변이체.
- 청구항 1에 있어서, 이때 상기 SpCas9 단백질 변이체는 아미노산 위치들 526, 562, 652, 661, 691, 780, 810, 848, 1003, 및 1060(스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 K855L/Q 돌연변이 및 적어도 하나의 다른 돌연변이를 포함하는, SpCas9 단백질 변이체.
- 청구항 1에 있어서, 이때 상기 SpCas9 단백질 변이체는 아미노산 위치들 526, 562, 652, 691, 780, 810, 848, 855, 1003, 및 1060 (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 R661L/Q 돌연변이 및 적어도 하나의 다른 돌연변이를 포함하는, 공작된 SpCas9 단백질 변이체.
- 청구항 1에 있어서, K526L/Q, K562L/Q, K652L/Q, K810L/Q, K848L/Q, K855L/Q, R661L/Q, R691L/Q, R780L/Q, K1003L/Q, 및 1060 L/Q (스트렙토코커스 피오게네스 Cas9, SpCas9의 번호매김 체계에 따라)에서 선택된 두 개의 상이한 아미노산 위치에서 두 개 돌연변이를 포함하는, 공작된 SpCas9 단백질 변이체.
- 청구항 1에 있어서, K526L/Q, K562L/Q, K652L/Q, K810L/Q, K848L/Q, K855L/Q, R661L/Q, R691L/Q, R780L/Q, K1003L/Q, 및 1060 L/Q에서 선택된 두 개의 상이한 아미노산 위치에서 세 개 돌연변이를 포함하는, 공작된 SpCas9 단백질 변이체.
- 청구항 5에 있어서, 이때 상기 돌연변이들은 다음의 군에서 선택된, 공작된 SpCas9 단백질 변이체:
K562L-R661L-K855Q;
K562Q-R661L-K855Q;
K652L-R661L-K855Q;
K652Q-R661L-K855Q;
R661L-K855Q-K1003Q; 그리고
R661L-K855Q-R1060Q. - 청구항 5에 있어서, 이때 상기 돌연변이들은 다음의 군에서 선택된, 공작된 SpCas9 단백질 변이체:
K562L-R661L-K855Q;
K562Q-R661L-K855Q;
K652L-R661L-K855Q; 그리고
K652Q-R661L-K855Q. - 청구항 5에 있어서, 이때 상기 돌연변이들은 다음의 군에서 선택된, 공작된 SpCas9 단백질 변이체:
K526L-R661L-K855Q;
R661L-R691L-K855Q;
R661L-R780L-K855Q;
R661L-R780Q-K855Q;
R661L-K810L-K855Q; 그리고
R661L-K848L-K855Q. - 청구항 5에 있어서, 이때 상기 돌연변이들은 다음의 군에서 선택된, 공작된 SpCas9 단백질 변이체:
K526Q-R661L-K855Q;
R661L-K810Q-K855Q;
R661L-K855Q-K1003L; 그리고
R661L-K855Q-R1060L. - 임의의 전술한 청구항에 있어서, N 말단 단부, C 말단 단부, 내부 위치, 또는 이의 조합에 융합된 하나 또는 그 이상의 이질성 도메인을 더 포함하는, 공작된 SpCas9 단백질 변이체.
- 청구항 10에 있어서, 이때 상기 이질성 도메인은 핵 국소화 신호, 세포-침투 도메인, 검출을 용이하게 하는 마커 또는 리포터 도메인, 염색질 변형 도메인, 후성유전학적 변형 도메인, 전사 조절 도메인, DNA 또는 RNA 데아미나제 도메인, 우라실-DNA-글리코실라제 도메인, 역전사효소 도메인, 재조합효소 도메인, RNA 압타머 결합 도메인, 그리고 비-Cas9 뉴클라제 도메인으로부터 선택된, 공작된 SpCas9 단백질 변이체.
- 임의의 전술한 청구항에 있어서, N 말단 단부, C 말단 단부, 내부 위치, 또는 이의 조합에 융합된 적어도 하나의 핵 국소화 신호를 더 포함하는, 공작된 SpCas9 단백질 변이체.
- 임의의 전술한 청구항에 있어서, RuvC 도메인에 적어도 하나의 돌연변이, 및/또는 HNH 도메인에 적어도 하나의 돌연변이를 더 포함하는, 공작된 SpCas9 단백질 변이체.
- 청구항 13에 있어서, 이때 RuvC 도메인에서 적어도 하나의 돌연변이 (존재한다면)는 D10A, D8A, E762A, 및 D986A로부터 선택된 적어도 하나의 돌연변이를 포함하고; 그리고 이때 HNH 도메인에서 적어도 하나의 돌연변이 (존재한다면)는 H840A, H559A, N854A, N856A, 그리고 N863A로부터 선택된 적어도 하나의 돌연변이를 포함하는, 공작된 SpCas9 단백질 변이체.
- 임의의 전술한 청구항에 따른 공작된 Cas9 시스템 및 적어도 하나의 공작된 가이드 RNA(들)를 포함하는 공작된 Cas9 시스템에 있어서, 이때 상기 적어도 하나의 공작된 가이드 RNA는 상기 공작된 SpCas9 단백질 변이체와 복합되도록 기획된, 공작된 SpCas9 단백질 변이체.
- 임의의 전술한 청구항에 따른 공작된 SpCas9 단백질 변이체를 인코딩하는 다수의 핵산.
- 청구항 15에 따른 공작된 SpCas9 시스템을 인코딩하는 다수의 핵산.
- 청구항 17에 있어서, 상기 다수의 핵산은 상기 공작된 SpCas9 단백질 변이체를 인코딩하는 적어도 하나의 핵산, 그리고 상기 공작된 가이드 RNA를 인코딩하는 적어도 하나의 핵산을 포함하는, 다수 핵산.
- 청구항 16-18중 임의의 한 항에 있어서, 이때 적어도 하나의 핵산은 RNA인, 다수 핵산.
- 청구항 16-18중 임의의 한 항에 있어서, 이때 적어도 하나의 핵산은 DNA인, 다수 핵산.
- 청구항 16-20중 임의의 한 항에 있어서, 이때 상기 공작된 SpCas9 단백질 변이체를 인코딩하는 적어도 하나의 핵산은 진핵 세포에서 발현을 위해 코돈 최적화된, 다수 핵산.
- 청구항 21에 있어서, 이때 진핵 세포는 인간 세포, 비-인간 포유동물 세포, 비-포유동물 척추동물 세포, 무척추동물 세포, 식물 세포, 또는 단세포 진핵 유기체인, 다수 핵산.
- 청구항 15에 있어서, 이때 상기 공작된 가이드 RNA를 인코딩하는 적어도 하나의 핵산은 DNA인, 다수 핵산.
- 청구항 15에 있어서, 이때 상기 공작된 SpCas9 단백질 변이체는 적어도 하나의 핵산은 박테리아 세포에서 시험관내 RNA 합성 또는 단백질 발현을 위한 파아지 프로모터 서열에 작동가능하도록 연계되며, 상기 공작된 가이드 RNA를 인코딩하는 적어도 하나의 핵산은 시험관내 RNA 합성을 위해 파아지 프로모터 서열에 작동가능하도록 연계된, 다수 핵산.
- 청구항 12에 있어서, 이때 상기 적어도 하나의 상기 공작된 Cas9 단백질을 인코딩하는 핵산 변이체는 진핵 세포에서 발현을 위해 진핵 프로모터 서열에 작동가능하도록 연계되며, 그리고 상기 공작된 가이드 RNA를 인코딩하는 적어도 하나의 핵산은 진핵 세포에서 발현을 위한 진핵 프로모터 서열에 작동가능하도록 연계된, 다수 핵산.
- 청구항 16-25중 임의의 한 항에 따른 다수의 핵산을 포함하는 적어도 하나의 벡터.
- 청구항 26에 있어서, 플라스미드 벡터, 바이러스 벡터 또는 자가 복제 바이러스 RNA 레플리콘인, 적어도 하나의 벡터.
- 청구항 15의 적어도 하나의 공작된 Cas9 시스템, 또는 청구항 17 또는 18의 핵산을 포함하는, 진핵 세포.
- 청구항 28에 있어서, 인간 세포, 비-인간 포유동물 세포, 식물 세포, 비-포유동물 척추동물 세포, 무척추동물 세포, 또는 단세포 진핵 유기체인, 진핵 세포.
- 청구항 29에 있어서, 생체 내, 생체 외 또는 시험관 내 세포인, 진핵 세포.
- 청구항 1-13중 임의의 한 항에 있어서, Cas9 상동체인, 공작된 SpCas9 단백질 변이체.
- 청구항 1-13중 임의의 청구항에 따른 공작된 SpCas9 단백질 변이체를 포함하는 리보핵단백질 (RNP) 복합체.
- 청구항 1-13중 임의의 청구항에 따른 공작된 SpCas9 단백질 변이체를 포함하는 융합 단백질.
- 청구항 1-13중 임의의 청구항에 따른 공작된 SpCas9 단백질 변이체 및 적어도 하나의 약제학적으로 수용가능한 부형제를 포함하는 약제학적 조성물.
- 진핵 세포의 염색체 서열을 변형시키는 방법에 있어서, 이 방법은 청구항 1-13중 임의의 청구항의 공작된 SpCas9 단백질 변이체과 가이드 RNA를 진핵 세포에서 발현시키는 것을 포함하는, 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202062988279P | 2020-03-11 | 2020-03-11 | |
US62/988,279 | 2020-03-11 | ||
PCT/US2021/021922 WO2021183771A1 (en) | 2020-03-11 | 2021-03-11 | High fidelity spcas9 nucleases for genome modification |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220128644A true KR20220128644A (ko) | 2022-09-21 |
Family
ID=75539896
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227027960A KR20220128644A (ko) | 2020-03-11 | 2021-03-11 | 게놈 변형을 위한 높은 충실도 SpCas9 뉴클라제 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20230058352A1 (ko) |
EP (1) | EP4118197A1 (ko) |
JP (1) | JP2023514327A (ko) |
KR (1) | KR20220128644A (ko) |
CN (1) | CN115244177A (ko) |
AU (1) | AU2021236230A1 (ko) |
BR (1) | BR112022012350A2 (ko) |
CA (1) | CA3163463A1 (ko) |
IL (1) | IL294120B2 (ko) |
WO (1) | WO2021183771A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023077149A1 (en) | 2021-11-01 | 2023-05-04 | Sigma-Aldrich Co. Llc | Electroporation enhancers for crispr-cas systems |
CN117866926A (zh) * | 2024-03-07 | 2024-04-12 | 珠海舒桐医疗科技有限公司 | 一种CRISPR-FrCas9蛋白突变体及应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003046141A2 (en) | 2001-11-26 | 2003-06-05 | Advanced Cell Technology, Inc. | Methods for making and using reprogrammed human somatic cell nuclei and autologous and isogenic human stem cells |
CN109536474A (zh) * | 2015-06-18 | 2019-03-29 | 布罗德研究所有限公司 | 降低脱靶效应的crispr酶突变 |
US11242542B2 (en) * | 2016-10-07 | 2022-02-08 | Integrated Dna Technologies, Inc. | S. pyogenes Cas9 mutant genes and polypeptides encoded by same |
-
2021
- 2021-03-11 WO PCT/US2021/021922 patent/WO2021183771A1/en unknown
- 2021-03-11 JP JP2022549484A patent/JP2023514327A/ja active Pending
- 2021-03-11 EP EP21719308.5A patent/EP4118197A1/en active Pending
- 2021-03-11 BR BR112022012350A patent/BR112022012350A2/pt unknown
- 2021-03-11 CA CA3163463A patent/CA3163463A1/en active Pending
- 2021-03-11 CN CN202180020084.3A patent/CN115244177A/zh active Pending
- 2021-03-11 KR KR1020227027960A patent/KR20220128644A/ko unknown
- 2021-03-11 AU AU2021236230A patent/AU2021236230A1/en active Pending
- 2021-03-11 IL IL294120A patent/IL294120B2/en unknown
- 2021-03-11 US US17/790,392 patent/US20230058352A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
IL294120B1 (en) | 2023-06-01 |
CA3163463A1 (en) | 2021-09-16 |
CN115244177A (zh) | 2022-10-25 |
US20230058352A1 (en) | 2023-02-23 |
IL294120A (en) | 2022-08-01 |
IL294120B2 (en) | 2023-10-01 |
BR112022012350A2 (pt) | 2022-09-27 |
WO2021183771A1 (en) | 2021-09-16 |
EP4118197A1 (en) | 2023-01-18 |
JP2023514327A (ja) | 2023-04-05 |
AU2021236230A1 (en) | 2022-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102458395B1 (ko) | 프로그램가능한 dna 결합 단백질을 사용한, 표적화된 게놈 변형의 개선 | |
EP2928496B1 (en) | Crispr-based genome modification and regulation | |
JP7109547B2 (ja) | 真核ゲノム修飾のための操作されたCas9システム | |
KR102655021B1 (ko) | 표적된 게놈 변형을 개선하기 위한 뉴클레오솜 상호작용 단백질 도메인 사용 | |
US11965184B2 (en) | CRISPR/Cas fusion proteins and systems | |
US20230058352A1 (en) | High Fidelity SpCas9 Nucleases for Genome Modification |