KR20220145917A - 뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법 - Google Patents
뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법 Download PDFInfo
- Publication number
- KR20220145917A KR20220145917A KR1020227035603A KR20227035603A KR20220145917A KR 20220145917 A KR20220145917 A KR 20220145917A KR 1020227035603 A KR1020227035603 A KR 1020227035603A KR 20227035603 A KR20227035603 A KR 20227035603A KR 20220145917 A KR20220145917 A KR 20220145917A
- Authority
- KR
- South Korea
- Prior art keywords
- hgem
- leu
- lys
- ile
- ser
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 101710163270 Nuclease Proteins 0.000 title claims description 101
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 title abstract description 92
- 230000001965 increasing effect Effects 0.000 title description 8
- 230000005782 double-strand break Effects 0.000 claims description 74
- 108091033409 CRISPR Proteins 0.000 claims description 71
- 108090000623 proteins and genes Proteins 0.000 claims description 63
- 102000004169 proteins and genes Human genes 0.000 claims description 45
- 108020001507 fusion proteins Proteins 0.000 claims description 43
- 102000037865 fusion proteins Human genes 0.000 claims description 43
- 230000022131 cell cycle Effects 0.000 claims description 31
- 230000001105 regulatory effect Effects 0.000 claims description 19
- 238000010354 CRISPR gene editing Methods 0.000 claims description 18
- 238000010459 TALEN Methods 0.000 claims description 17
- 108050008316 DNA endonuclease RBBP8 Proteins 0.000 claims description 16
- 102100039524 DNA endonuclease RBBP8 Human genes 0.000 claims description 16
- 230000018199 S phase Effects 0.000 claims description 14
- 230000010337 G2 phase Effects 0.000 claims description 11
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 claims description 11
- 239000000203 mixture Substances 0.000 claims description 11
- 108020001580 protein domains Proteins 0.000 claims description 6
- 108010060273 Cyclin A2 Proteins 0.000 claims description 4
- 102100025191 Cyclin-A2 Human genes 0.000 claims description 4
- 230000032258 transport Effects 0.000 claims description 4
- 108010060267 Cyclin A1 Proteins 0.000 claims description 3
- 108010060385 Cyclin B1 Proteins 0.000 claims description 3
- 102100025176 Cyclin-A1 Human genes 0.000 claims description 3
- 102100032340 G2/mitotic-specific cyclin-B1 Human genes 0.000 claims description 3
- 208000009869 Neu-Laxova syndrome Diseases 0.000 claims description 3
- 108010066154 Nuclear Export Signals Proteins 0.000 claims description 3
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims description 3
- 101150073031 cdk2 gene Proteins 0.000 claims description 3
- 210000000805 cytoplasm Anatomy 0.000 claims description 3
- 230000006780 non-homologous end joining Effects 0.000 abstract description 36
- 108020004414 DNA Proteins 0.000 description 61
- 210000004027 cell Anatomy 0.000 description 50
- 150000007523 nucleic acids Chemical class 0.000 description 46
- 235000018102 proteins Nutrition 0.000 description 43
- 102000039446 nucleic acids Human genes 0.000 description 42
- 108020004707 nucleic acids Proteins 0.000 description 42
- 108020005004 Guide RNA Proteins 0.000 description 38
- 230000014509 gene expression Effects 0.000 description 30
- 238000006471 dimerization reaction Methods 0.000 description 28
- 230000004568 DNA-binding Effects 0.000 description 24
- 230000000694 effects Effects 0.000 description 24
- 102000053602 DNA Human genes 0.000 description 23
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 21
- 230000027455 binding Effects 0.000 description 21
- 230000037361 pathway Effects 0.000 description 21
- 239000011701 zinc Substances 0.000 description 21
- 229910052725 zinc Inorganic materials 0.000 description 21
- 238000003776 cleavage reaction Methods 0.000 description 20
- 230000008439 repair process Effects 0.000 description 20
- 230000007017 scission Effects 0.000 description 20
- 230000004927 fusion Effects 0.000 description 18
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 17
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 17
- 150000001413 amino acids Chemical class 0.000 description 17
- -1 genomic DNA Chemical class 0.000 description 15
- 239000013598 vector Substances 0.000 description 15
- 239000002773 nucleotide Substances 0.000 description 14
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 13
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 13
- 235000001014 amino acid Nutrition 0.000 description 13
- 125000003729 nucleotide group Chemical group 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 12
- 102000001195 RAD51 Human genes 0.000 description 12
- 108010068097 Rad51 Recombinase Proteins 0.000 description 12
- 229940024606 amino acid Drugs 0.000 description 12
- 239000013612 plasmid Substances 0.000 description 12
- 230000007115 recruitment Effects 0.000 description 11
- 230000003834 intracellular effect Effects 0.000 description 10
- 241000282414 Homo sapiens Species 0.000 description 9
- 102100034107 TP53-binding protein 1 Human genes 0.000 description 9
- 108010041385 Tumor Suppressor p53-Binding Protein 1 Proteins 0.000 description 9
- 101100366466 Caenorhabditis elegans spo-11 gene Proteins 0.000 description 8
- 241000196324 Embryophyta Species 0.000 description 8
- 230000001419 dependent effect Effects 0.000 description 8
- 239000012636 effector Substances 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 230000001404 mediated effect Effects 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 102000036365 BRCA1 Human genes 0.000 description 7
- 108700020463 BRCA1 Proteins 0.000 description 7
- 101150072950 BRCA1 gene Proteins 0.000 description 7
- 108700020462 BRCA2 Proteins 0.000 description 7
- 102000052609 BRCA2 Human genes 0.000 description 7
- 101150008921 Brca2 gene Proteins 0.000 description 7
- 230000033616 DNA repair Effects 0.000 description 7
- 230000004075 alteration Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 6
- 108010077544 Chromatin Proteins 0.000 description 6
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 6
- 102000004533 Endonucleases Human genes 0.000 description 6
- 108010042407 Endonucleases Proteins 0.000 description 6
- 108060004795 Methyltransferase Proteins 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- 101710185494 Zinc finger protein Proteins 0.000 description 6
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 6
- 210000003483 chromatin Anatomy 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 210000004962 mammalian cell Anatomy 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 5
- 102100033996 Double-strand break repair protein MRE11 Human genes 0.000 description 5
- 101000591400 Homo sapiens Double-strand break repair protein MRE11 Proteins 0.000 description 5
- 102000053062 Rad52 DNA Repair and Recombination Human genes 0.000 description 5
- 108700031762 Rad52 DNA Repair and Recombination Proteins 0.000 description 5
- 238000003491 array Methods 0.000 description 5
- 238000010362 genome editing Methods 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 108010017391 lysylvaline Proteins 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- 102000018054 AP endonuclease 1 Human genes 0.000 description 4
- 108050007143 AP endonuclease 1 Proteins 0.000 description 4
- 102100039116 DNA repair protein RAD50 Human genes 0.000 description 4
- 102000005768 DNA-Activated Protein Kinase Human genes 0.000 description 4
- 108010006124 DNA-Activated Protein Kinase Proteins 0.000 description 4
- 108060002716 Exonuclease Proteins 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- 102100031880 Helicase SRCAP Human genes 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- 101000743929 Homo sapiens DNA repair protein RAD50 Proteins 0.000 description 4
- 101000704158 Homo sapiens Helicase SRCAP Proteins 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 4
- 108091008103 RNA aptamers Proteins 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 102000013165 exonuclease Human genes 0.000 description 4
- 210000005260 human cell Anatomy 0.000 description 4
- 108010034529 leucyl-lysine Proteins 0.000 description 4
- 230000006911 nucleation Effects 0.000 description 4
- 238000010899 nucleation Methods 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 230000026731 phosphorylation Effects 0.000 description 4
- 238000006366 phosphorylation reaction Methods 0.000 description 4
- 230000004481 post-translational protein modification Effects 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 108020005400 tyrosyl-DNA phosphodiesterase Proteins 0.000 description 4
- 102000007405 tyrosyl-DNA phosphodiesterase Human genes 0.000 description 4
- 108091023037 Aptamer Proteins 0.000 description 3
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 3
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 3
- 108010026653 Fanconi Anemia Complementation Group D2 protein Proteins 0.000 description 3
- 102000013601 Fanconi Anemia Complementation Group D2 protein Human genes 0.000 description 3
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 description 3
- 102000016627 Fanconi Anemia Complementation Group N protein Human genes 0.000 description 3
- 102100034554 Fanconi anemia group I protein Human genes 0.000 description 3
- 102100034553 Fanconi anemia group J protein Human genes 0.000 description 3
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 3
- 101000848174 Homo sapiens Fanconi anemia group I protein Proteins 0.000 description 3
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 description 3
- 101001128138 Homo sapiens NACHT, LRR and PYD domains-containing protein 2 Proteins 0.000 description 3
- 101000981336 Homo sapiens Nibrin Proteins 0.000 description 3
- 101000702606 Homo sapiens Structure-specific endonuclease subunit SLX4 Proteins 0.000 description 3
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 3
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 3
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 3
- 102100031897 NACHT, LRR and PYD domains-containing protein 2 Human genes 0.000 description 3
- 101100355599 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) mus-11 gene Proteins 0.000 description 3
- 101150006234 RAD52 gene Proteins 0.000 description 3
- 101150054847 RIF1 gene Proteins 0.000 description 3
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 3
- 230000004570 RNA-binding Effects 0.000 description 3
- 108091027981 Response element Proteins 0.000 description 3
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 3
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 3
- 102100031003 Structure-specific endonuclease subunit SLX4 Human genes 0.000 description 3
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 3
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 3
- 102100036976 X-ray repair cross-complementing protein 6 Human genes 0.000 description 3
- 101710124907 X-ray repair cross-complementing protein 6 Proteins 0.000 description 3
- 108010044940 alanylglutamine Proteins 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000447 dimerizing effect Effects 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 108010078144 glutaminyl-glycine Proteins 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 230000009545 invasion Effects 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- 108010051673 leucyl-glycyl-phenylalanine Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 108091006106 transcriptional activators Proteins 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- 238000010798 ubiquitination Methods 0.000 description 3
- 230000034512 ubiquitination Effects 0.000 description 3
- 241000701447 unidentified baculovirus Species 0.000 description 3
- KIAPWMKFHIKQOZ-UHFFFAOYSA-N 2-[[(4-fluorophenyl)-oxomethyl]amino]benzoic acid methyl ester Chemical compound COC(=O)C1=CC=CC=C1NC(=O)C1=CC=C(F)C=C1 KIAPWMKFHIKQOZ-UHFFFAOYSA-N 0.000 description 2
- 101710159080 Aconitate hydratase A Proteins 0.000 description 2
- 101710159078 Aconitate hydratase B Proteins 0.000 description 2
- BUDNAJYVCUHLSV-ZLUOBGJFSA-N Ala-Asp-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O BUDNAJYVCUHLSV-ZLUOBGJFSA-N 0.000 description 2
- 108010076441 Ala-His-His Proteins 0.000 description 2
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- BHTBAVZSZCQZPT-GUBZILKMSA-N Ala-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N BHTBAVZSZCQZPT-GUBZILKMSA-N 0.000 description 2
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 2
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 2
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 2
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 2
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 2
- QJWLLRZTJFPCHA-STECZYCISA-N Arg-Tyr-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QJWLLRZTJFPCHA-STECZYCISA-N 0.000 description 2
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 2
- BUVNWKQBMZLCDW-UGYAYLCHSA-N Asp-Asn-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BUVNWKQBMZLCDW-UGYAYLCHSA-N 0.000 description 2
- QOVWVLLHMMCFFY-ZLUOBGJFSA-N Asp-Asp-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QOVWVLLHMMCFFY-ZLUOBGJFSA-N 0.000 description 2
- RTXQQDVBACBSCW-CFMVVWHZSA-N Asp-Ile-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RTXQQDVBACBSCW-CFMVVWHZSA-N 0.000 description 2
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 2
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 2
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 2
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 2
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- PORWNQWEEIOIRH-XHNCKOQMSA-N Cys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)C(=O)O PORWNQWEEIOIRH-XHNCKOQMSA-N 0.000 description 2
- 102100033072 DNA replication ATP-dependent helicase DNA2 Human genes 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 101100300807 Drosophila melanogaster spn-A gene Proteins 0.000 description 2
- 102100034546 E3 ubiquitin-protein ligase FANCL Human genes 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 102100029075 Exonuclease 1 Human genes 0.000 description 2
- 108010087740 Fanconi Anemia Complementation Group A protein Proteins 0.000 description 2
- 102000009095 Fanconi Anemia Complementation Group A protein Human genes 0.000 description 2
- 108010077898 Fanconi Anemia Complementation Group E protein Proteins 0.000 description 2
- 102000010634 Fanconi Anemia Complementation Group E protein Human genes 0.000 description 2
- 108700026162 Fanconi Anemia Complementation Group L protein Proteins 0.000 description 2
- 201000004939 Fanconi anemia Diseases 0.000 description 2
- 230000010190 G1 phase Effects 0.000 description 2
- 241000205550 Galaxea Species 0.000 description 2
- 108010001515 Galectin 4 Proteins 0.000 description 2
- 102100039556 Galectin-4 Human genes 0.000 description 2
- ILKYYKRAULNYMS-JYJNAYRXSA-N Gln-Lys-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ILKYYKRAULNYMS-JYJNAYRXSA-N 0.000 description 2
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 2
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 2
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 2
- DCBSZJJHOTXMHY-DCAQKATOSA-N Glu-Pro-Pro Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DCBSZJJHOTXMHY-DCAQKATOSA-N 0.000 description 2
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 2
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 2
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 2
- WTUSRDZLLWGYAT-KCTSRDHCSA-N Gly-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN WTUSRDZLLWGYAT-KCTSRDHCSA-N 0.000 description 2
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 2
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 2
- 102100032742 Histone-lysine N-methyltransferase SETD2 Human genes 0.000 description 2
- 101000927313 Homo sapiens DNA replication ATP-dependent helicase DNA2 Proteins 0.000 description 2
- 101000918264 Homo sapiens Exonuclease 1 Proteins 0.000 description 2
- 101100119754 Homo sapiens FANCL gene Proteins 0.000 description 2
- 101000654725 Homo sapiens Histone-lysine N-methyltransferase SETD2 Proteins 0.000 description 2
- 101000687715 Homo sapiens SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily A containing DEAD/H box 1 Proteins 0.000 description 2
- 101000830950 Homo sapiens Three prime repair exonuclease 2 Proteins 0.000 description 2
- 101000904868 Homo sapiens Transcriptional regulator ATRX Proteins 0.000 description 2
- 108700039609 IRW peptide Proteins 0.000 description 2
- HZMLFETXHFHGBB-UGYAYLCHSA-N Ile-Asn-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZMLFETXHFHGBB-UGYAYLCHSA-N 0.000 description 2
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 2
- VUPHVQCDULLACF-NAKRPEOUSA-N Ile-Met-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)O)N VUPHVQCDULLACF-NAKRPEOUSA-N 0.000 description 2
- FBGXMKUWQFPHFB-JBDRJPRFSA-N Ile-Ser-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N FBGXMKUWQFPHFB-JBDRJPRFSA-N 0.000 description 2
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 2
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 2
- JKSIBWITFMQTOA-XUXIUFHCSA-N Leu-Ile-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O JKSIBWITFMQTOA-XUXIUFHCSA-N 0.000 description 2
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 2
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 2
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 2
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 2
- VQXAVLQBQJMENB-SRVKXCTJSA-N Lys-Glu-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O VQXAVLQBQJMENB-SRVKXCTJSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- PFZWARWVRNTPBR-IHPCNDPISA-N Lys-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCCN)N PFZWARWVRNTPBR-IHPCNDPISA-N 0.000 description 2
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 2
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 2
- WLXGMVVHTIUPHE-ULQDDVLXSA-N Lys-Phe-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O WLXGMVVHTIUPHE-ULQDDVLXSA-N 0.000 description 2
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 2
- 230000027311 M phase Effects 0.000 description 2
- WYEXWKAWMNJKPN-UBHSHLNASA-N Met-Ala-Phe Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCSC)N WYEXWKAWMNJKPN-UBHSHLNASA-N 0.000 description 2
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 2
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- FRPVPGRXUKFEQE-YDHLFZDLSA-N Phe-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FRPVPGRXUKFEQE-YDHLFZDLSA-N 0.000 description 2
- OMHMIXFFRPMYHB-SRVKXCTJSA-N Phe-Cys-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OMHMIXFFRPMYHB-SRVKXCTJSA-N 0.000 description 2
- MGBRZXXGQBAULP-DRZSPHRISA-N Phe-Glu-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGBRZXXGQBAULP-DRZSPHRISA-N 0.000 description 2
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 2
- KCIKTPHTEYBXMG-BVSLBCMMSA-N Phe-Trp-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCIKTPHTEYBXMG-BVSLBCMMSA-N 0.000 description 2
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 2
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 2
- 241000589579 Planomicrobium okeanokoites Species 0.000 description 2
- 101710182846 Polyhedrin Proteins 0.000 description 2
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 2
- VTFXTWDFPTWNJY-RHYQMDGZSA-N Pro-Leu-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VTFXTWDFPTWNJY-RHYQMDGZSA-N 0.000 description 2
- 101710105008 RNA-binding protein Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 102100024792 SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily A containing DEAD/H box 1 Human genes 0.000 description 2
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 2
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 2
- LOKXAXAESFYFAX-CIUDSAMLSA-N Ser-His-Cys Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CS)C(O)=O)CC1=CN=CN1 LOKXAXAESFYFAX-CIUDSAMLSA-N 0.000 description 2
- JUTGONBTALQWMK-NAKRPEOUSA-N Ser-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N JUTGONBTALQWMK-NAKRPEOUSA-N 0.000 description 2
- VIIJCAQMJBHSJH-FXQIFTODSA-N Ser-Met-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(O)=O VIIJCAQMJBHSJH-FXQIFTODSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 102220557642 Sperm acrosome-associated protein 5_D10N_mutation Human genes 0.000 description 2
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 2
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 2
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 2
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 2
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 2
- 102100024872 Three prime repair exonuclease 2 Human genes 0.000 description 2
- 108091028113 Trans-activating crRNA Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102100023931 Transcriptional regulator ATRX Human genes 0.000 description 2
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 2
- UUBKSZNKJUJQEJ-JRQIVUDYSA-N Tyr-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UUBKSZNKJUJQEJ-JRQIVUDYSA-N 0.000 description 2
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 2
- PWRITNSESKQTPW-NRPADANISA-N Val-Gln-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N PWRITNSESKQTPW-NRPADANISA-N 0.000 description 2
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 2
- UVHFONIHVHLDDQ-IFFSRLJSSA-N Val-Thr-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O UVHFONIHVHLDDQ-IFFSRLJSSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 150000001945 cysteines Chemical class 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 2
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 230000003278 mimic effect Effects 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 101150010682 rad50 gene Proteins 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 108091006107 transcriptional repressors Proteins 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- FSBCNCKIQZZASN-GUBZILKMSA-N Ala-Arg-Met Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O FSBCNCKIQZZASN-GUBZILKMSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- MCKSLROAGSDNFC-ACZMJKKPSA-N Ala-Asp-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MCKSLROAGSDNFC-ACZMJKKPSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- NBTGEURICRTMGL-WHFBIAKZSA-N Ala-Gly-Ser Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O NBTGEURICRTMGL-WHFBIAKZSA-N 0.000 description 1
- OBVSBEYOMDWLRJ-BFHQHQDPSA-N Ala-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N OBVSBEYOMDWLRJ-BFHQHQDPSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- XCZXVTHYGSMQGH-NAKRPEOUSA-N Ala-Ile-Met Chemical compound C[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C([O-])=O XCZXVTHYGSMQGH-NAKRPEOUSA-N 0.000 description 1
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- VCSABYLVNWQYQE-SRVKXCTJSA-N Ala-Lys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O VCSABYLVNWQYQE-SRVKXCTJSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- SAHQGRZIQVEJPF-JXUBOQSCSA-N Ala-Thr-Lys Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN SAHQGRZIQVEJPF-JXUBOQSCSA-N 0.000 description 1
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- YYOVLDPHIJAOSY-DCAQKATOSA-N Arg-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N YYOVLDPHIJAOSY-DCAQKATOSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- POOCJCRBHHMAOS-FXQIFTODSA-N Asn-Arg-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O POOCJCRBHHMAOS-FXQIFTODSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 1
- HUAOKVVEVHACHR-CIUDSAMLSA-N Asn-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N HUAOKVVEVHACHR-CIUDSAMLSA-N 0.000 description 1
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- GYOHQKJEQQJBOY-QEJZJMRPSA-N Asn-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N GYOHQKJEQQJBOY-QEJZJMRPSA-N 0.000 description 1
- DMLSCRJBWUEALP-LAEOZQHASA-N Asn-Glu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O DMLSCRJBWUEALP-LAEOZQHASA-N 0.000 description 1
- GWNMUVANAWDZTI-YUMQZZPRSA-N Asn-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N GWNMUVANAWDZTI-YUMQZZPRSA-N 0.000 description 1
- GJFYPBDMUGGLFR-NKWVEPMBSA-N Asn-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC(=O)N)N)C(=O)O GJFYPBDMUGGLFR-NKWVEPMBSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- YVXRYLVELQYAEQ-SRVKXCTJSA-N Asn-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N YVXRYLVELQYAEQ-SRVKXCTJSA-N 0.000 description 1
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 1
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- GKKUBLFXKRDMFC-BQBZGAKWSA-N Asn-Pro-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O GKKUBLFXKRDMFC-BQBZGAKWSA-N 0.000 description 1
- IIQIOFVDFOLCHP-UHFFFAOYSA-N Asn-Pro-Ser-Ser Chemical compound NC(=O)CC(N)C(=O)N1CCCC1C(=O)NC(CO)C(=O)NC(CO)C(O)=O IIQIOFVDFOLCHP-UHFFFAOYSA-N 0.000 description 1
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 1
- WEDGJJRCJNHYSF-SRVKXCTJSA-N Asp-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N WEDGJJRCJNHYSF-SRVKXCTJSA-N 0.000 description 1
- LTXGDRFJRZSZAV-CIUDSAMLSA-N Asp-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N LTXGDRFJRZSZAV-CIUDSAMLSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- WSGVTKZFVJSJOG-RCOVLWMOSA-N Asp-Gly-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O WSGVTKZFVJSJOG-RCOVLWMOSA-N 0.000 description 1
- KPNUCOPMVSGRCR-DCAQKATOSA-N Asp-His-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O KPNUCOPMVSGRCR-DCAQKATOSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 1
- KFAFUJMGHVVYRC-DCAQKATOSA-N Asp-Leu-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O KFAFUJMGHVVYRC-DCAQKATOSA-N 0.000 description 1
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 1
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- AWPWHMVCSISSQK-QWRGUYRKSA-N Asp-Tyr-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O AWPWHMVCSISSQK-QWRGUYRKSA-N 0.000 description 1
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102220555352 Caspase-4_H29A_mutation Human genes 0.000 description 1
- 108010068192 Cyclin A Proteins 0.000 description 1
- 102000003909 Cyclin E Human genes 0.000 description 1
- 108090000257 Cyclin E Proteins 0.000 description 1
- OIMUAKUQOUEPCZ-WHFBIAKZSA-N Cys-Asn-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIMUAKUQOUEPCZ-WHFBIAKZSA-N 0.000 description 1
- IIGHQOPGMGKDMT-SRVKXCTJSA-N Cys-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N IIGHQOPGMGKDMT-SRVKXCTJSA-N 0.000 description 1
- CVLIHKBUPSFRQP-WHFBIAKZSA-N Cys-Gly-Ala Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C)C(O)=O CVLIHKBUPSFRQP-WHFBIAKZSA-N 0.000 description 1
- QCUJUETWTSWPNZ-NAKRPEOUSA-N Cys-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CS)N QCUJUETWTSWPNZ-NAKRPEOUSA-N 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 102100024829 DNA polymerase delta catalytic subunit Human genes 0.000 description 1
- 102100034484 DNA repair protein RAD51 homolog 3 Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 108010093502 E2F Transcription Factors Proteins 0.000 description 1
- 102000001388 E2F Transcription Factors Human genes 0.000 description 1
- 101001091269 Escherichia coli Hygromycin-B 4-O-kinase Proteins 0.000 description 1
- 108091011114 FK506 binding proteins Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000205548 Galaxea fascicularis Species 0.000 description 1
- 102000004064 Geminin Human genes 0.000 description 1
- 108090000577 Geminin Proteins 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- XXLBHPPXDUWYAG-XQXXSGGOSA-N Gln-Ala-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XXLBHPPXDUWYAG-XQXXSGGOSA-N 0.000 description 1
- MQANCSUBSBJNLU-KKUMJFAQSA-N Gln-Arg-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQANCSUBSBJNLU-KKUMJFAQSA-N 0.000 description 1
- QYTKAVBFRUGYAU-ACZMJKKPSA-N Gln-Asp-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O QYTKAVBFRUGYAU-ACZMJKKPSA-N 0.000 description 1
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 1
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 1
- LTXLIIZACMCQTO-GUBZILKMSA-N Gln-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N LTXLIIZACMCQTO-GUBZILKMSA-N 0.000 description 1
- IWUFOVSLWADEJC-AVGNSLFASA-N Gln-His-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IWUFOVSLWADEJC-AVGNSLFASA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 1
- ZXGLLNZQSBLQLT-SRVKXCTJSA-N Gln-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZXGLLNZQSBLQLT-SRVKXCTJSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- HGBHRZBXOOHRDH-JBACZVJFSA-N Gln-Tyr-Trp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HGBHRZBXOOHRDH-JBACZVJFSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- RJONUNZIMUXUOI-GUBZILKMSA-N Glu-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N RJONUNZIMUXUOI-GUBZILKMSA-N 0.000 description 1
- VAIWPXWHWAPYDF-FXQIFTODSA-N Glu-Asp-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O VAIWPXWHWAPYDF-FXQIFTODSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 1
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 1
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 1
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- WVYJNPCWJYBHJG-YVNDNENWSA-N Glu-Ile-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O WVYJNPCWJYBHJG-YVNDNENWSA-N 0.000 description 1
- QXDXIXFSFHUYAX-MNXVOIDGSA-N Glu-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O QXDXIXFSFHUYAX-MNXVOIDGSA-N 0.000 description 1
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- CBEUFCJRFNZMCU-SRVKXCTJSA-N Glu-Met-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O CBEUFCJRFNZMCU-SRVKXCTJSA-N 0.000 description 1
- SOEPMWQCTJITPZ-SRVKXCTJSA-N Glu-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N SOEPMWQCTJITPZ-SRVKXCTJSA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- QOXDAWODGSIDDI-GUBZILKMSA-N Glu-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N QOXDAWODGSIDDI-GUBZILKMSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- HJTSRYLPAYGEEC-SIUGBPQLSA-N Glu-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)O)N HJTSRYLPAYGEEC-SIUGBPQLSA-N 0.000 description 1
- HBMRTXJZQDVRFT-DZKIICNBSA-N Glu-Tyr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O HBMRTXJZQDVRFT-DZKIICNBSA-N 0.000 description 1
- MLILEEIVMRUYBX-NHCYSSNCSA-N Glu-Val-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O MLILEEIVMRUYBX-NHCYSSNCSA-N 0.000 description 1
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 1
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 1
- OGCIHJPYKVSMTE-YUMQZZPRSA-N Gly-Arg-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O OGCIHJPYKVSMTE-YUMQZZPRSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 1
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 1
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 1
- LRQXRHGQEVWGPV-NHCYSSNCSA-N Gly-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN LRQXRHGQEVWGPV-NHCYSSNCSA-N 0.000 description 1
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 1
- WDEHMRNSGHVNOH-VHSXEESVSA-N Gly-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)CN)C(=O)O WDEHMRNSGHVNOH-VHSXEESVSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- IBYOLNARKHMLBG-WHOFXGATSA-N Gly-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IBYOLNARKHMLBG-WHOFXGATSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 1
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 1
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 1
- KBBFOULZCHWGJX-KBPBESRZSA-N Gly-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN)O KBBFOULZCHWGJX-KBPBESRZSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 1
- WGHJXSONOOTTCZ-JYJNAYRXSA-N His-Glu-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WGHJXSONOOTTCZ-JYJNAYRXSA-N 0.000 description 1
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 1
- FWWJVUFXUQOEDM-WDSOQIARSA-N His-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N FWWJVUFXUQOEDM-WDSOQIARSA-N 0.000 description 1
- FRDFAWHTPDKRHG-ULQDDVLXSA-N His-Tyr-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CN=CN1 FRDFAWHTPDKRHG-ULQDDVLXSA-N 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 101000868333 Homo sapiens Cyclin-dependent kinase 1 Proteins 0.000 description 1
- 101000909198 Homo sapiens DNA polymerase delta catalytic subunit Proteins 0.000 description 1
- 101001132271 Homo sapiens DNA repair protein RAD51 homolog 3 Proteins 0.000 description 1
- 101000886596 Homo sapiens Geminin Proteins 0.000 description 1
- 101000998810 Homo sapiens Insulin-like peptide INSL6 Proteins 0.000 description 1
- 101000619643 Homo sapiens Ligand-dependent nuclear receptor-interacting factor 1 Proteins 0.000 description 1
- 101001095487 Homo sapiens Telomere-associated protein RIF1 Proteins 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 102000017182 Ikaros Transcription Factor Human genes 0.000 description 1
- 108010013958 Ikaros Transcription Factor Proteins 0.000 description 1
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 1
- ZXJFURYTPZMUNY-VKOGCVSHSA-N Ile-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 ZXJFURYTPZMUNY-VKOGCVSHSA-N 0.000 description 1
- UKTUOMWSJPXODT-GUDRVLHUSA-N Ile-Asn-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N UKTUOMWSJPXODT-GUDRVLHUSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- BBQABUDWDUKJMB-LZXPERKUSA-N Ile-Ile-Ile Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C([O-])=O BBQABUDWDUKJMB-LZXPERKUSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- IDMNOFVUXYYZPF-DKIMLUQUSA-N Ile-Lys-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IDMNOFVUXYYZPF-DKIMLUQUSA-N 0.000 description 1
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 1
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 1
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- 108010054278 Lac Repressors Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- QJXHMYMRGDOHRU-NHCYSSNCSA-N Leu-Ile-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O QJXHMYMRGDOHRU-NHCYSSNCSA-N 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- NRFGTHFONZYFNY-MGHWNKPDSA-N Leu-Ile-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NRFGTHFONZYFNY-MGHWNKPDSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- FIICHHJDINDXKG-IHPCNDPISA-N Leu-Lys-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FIICHHJDINDXKG-IHPCNDPISA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- SBANPBVRHYIMRR-GARJFASQSA-N Leu-Ser-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N SBANPBVRHYIMRR-GARJFASQSA-N 0.000 description 1
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- CGHXMODRYJISSK-NHCYSSNCSA-N Leu-Val-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O CGHXMODRYJISSK-NHCYSSNCSA-N 0.000 description 1
- 102100022172 Ligand-dependent nuclear receptor-interacting factor 1 Human genes 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 1
- HEWWNLVEWBJBKA-WDCWCFNPSA-N Lys-Gln-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN HEWWNLVEWBJBKA-WDCWCFNPSA-N 0.000 description 1
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 1
- KNKJPYAZQUFLQK-IHRRRGAJSA-N Lys-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCCCN)N KNKJPYAZQUFLQK-IHRRRGAJSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- WWEWGPOLIJXGNX-XUXIUFHCSA-N Lys-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N WWEWGPOLIJXGNX-XUXIUFHCSA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- IHITVQKJXQQGLJ-LPEHRKFASA-N Met-Asn-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N IHITVQKJXQQGLJ-LPEHRKFASA-N 0.000 description 1
- RNAGAJXCSPDPRK-KKUMJFAQSA-N Met-Glu-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 RNAGAJXCSPDPRK-KKUMJFAQSA-N 0.000 description 1
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 1
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 1
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 1
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 1
- WXXNVZMWHOLNRJ-AVGNSLFASA-N Met-Pro-Lys Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O WXXNVZMWHOLNRJ-AVGNSLFASA-N 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 1
- 102100036220 PC4 and SFRS1-interacting protein Human genes 0.000 description 1
- 102000000470 PDZ domains Human genes 0.000 description 1
- 108050008994 PDZ domains Proteins 0.000 description 1
- 241001631646 Papillomaviridae Species 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- MPFGIYLYWUCSJG-AVGNSLFASA-N Phe-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MPFGIYLYWUCSJG-AVGNSLFASA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- ZUQACJLOHYRVPJ-DKIMLUQUSA-N Phe-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZUQACJLOHYRVPJ-DKIMLUQUSA-N 0.000 description 1
- KLXQWABNAWDRAY-ACRUOGEOSA-N Phe-Lys-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 KLXQWABNAWDRAY-ACRUOGEOSA-N 0.000 description 1
- FUAIIFPQELBNJF-ULQDDVLXSA-N Phe-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FUAIIFPQELBNJF-ULQDDVLXSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- BAONJAHBAUDJKA-BZSNNMDCSA-N Phe-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 BAONJAHBAUDJKA-BZSNNMDCSA-N 0.000 description 1
- BQMFWUKNOCJDNV-HJWJTTGWSA-N Phe-Val-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQMFWUKNOCJDNV-HJWJTTGWSA-N 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 102220484160 Pogo transposable element with ZNF domain_H840A_mutation Human genes 0.000 description 1
- CQZNGNCAIXMAIQ-UBHSHLNASA-N Pro-Ala-Phe Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O CQZNGNCAIXMAIQ-UBHSHLNASA-N 0.000 description 1
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- QXNSKJLSLYCTMT-FXQIFTODSA-N Pro-Cys-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O QXNSKJLSLYCTMT-FXQIFTODSA-N 0.000 description 1
- GQLOZEMWEBDEAY-NAKRPEOUSA-N Pro-Cys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GQLOZEMWEBDEAY-NAKRPEOUSA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- HFNPOYOKIPGAEI-SRVKXCTJSA-N Pro-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 HFNPOYOKIPGAEI-SRVKXCTJSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 108700020471 RNA-Binding Proteins Proteins 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- YIUWWXVTYLANCJ-NAKRPEOUSA-N Ser-Ile-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YIUWWXVTYLANCJ-NAKRPEOUSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 1
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- ASGYVPAVFNDZMA-GUBZILKMSA-N Ser-Met-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CO)N ASGYVPAVFNDZMA-GUBZILKMSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- SDFUZKIAHWRUCS-QEJZJMRPSA-N Ser-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N SDFUZKIAHWRUCS-QEJZJMRPSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 241000193996 Streptococcus pyogenes Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241001633172 Streptococcus thermophilus LMD-9 Species 0.000 description 1
- 101001091268 Streptomyces hygroscopicus Hygromycin-B 7''-O-kinase Proteins 0.000 description 1
- 241001661355 Synapsis Species 0.000 description 1
- 101150047500 TERT gene Proteins 0.000 description 1
- 108010017842 Telomerase Proteins 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- CAJFZCICSVBOJK-SHGPDSBTSA-N Thr-Ala-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAJFZCICSVBOJK-SHGPDSBTSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 1
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 1
- WLDUCKSCDRIVLJ-NUMRIWBASA-N Thr-Gln-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O WLDUCKSCDRIVLJ-NUMRIWBASA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- QNCFWHZVRNXAKW-OEAJRASXSA-N Thr-Lys-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNCFWHZVRNXAKW-OEAJRASXSA-N 0.000 description 1
- PZSDPRBZINDEJV-HTUGSXCWSA-N Thr-Phe-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PZSDPRBZINDEJV-HTUGSXCWSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- QYDKSNXSBXZPFK-ZJDVBMNYSA-N Thr-Thr-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYDKSNXSBXZPFK-ZJDVBMNYSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- LXXCHJKHJYRMIY-FQPOAREZSA-N Thr-Tyr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O LXXCHJKHJYRMIY-FQPOAREZSA-N 0.000 description 1
- QNXZCKMXHPULME-ZNSHCXBVSA-N Thr-Val-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N)O QNXZCKMXHPULME-ZNSHCXBVSA-N 0.000 description 1
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 102000000887 Transcription factor STAT Human genes 0.000 description 1
- 108050007918 Transcription factor STAT Proteins 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- PKUJMYZNJMRHEZ-XIRDDKMYSA-N Trp-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKUJMYZNJMRHEZ-XIRDDKMYSA-N 0.000 description 1
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 1
- NLWCSMOXNKBRLC-WDSOQIARSA-N Trp-Lys-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLWCSMOXNKBRLC-WDSOQIARSA-N 0.000 description 1
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- AKXBNSZMYAOGLS-STQMWFEESA-N Tyr-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AKXBNSZMYAOGLS-STQMWFEESA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- NLMXVDDEQFKQQU-CFMVVWHZSA-N Tyr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NLMXVDDEQFKQQU-CFMVVWHZSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- AZGZDDNKFFUDEH-QWRGUYRKSA-N Tyr-Gly-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 AZGZDDNKFFUDEH-QWRGUYRKSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- JAGGEZACYAAMIL-CQDKDKBSSA-N Tyr-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JAGGEZACYAAMIL-CQDKDKBSSA-N 0.000 description 1
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 1
- VXFXIBCCVLJCJT-JYJNAYRXSA-N Tyr-Pro-Pro Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N1CCC[C@H]1C(O)=O VXFXIBCCVLJCJT-JYJNAYRXSA-N 0.000 description 1
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 1
- XYBNMHRFAUKPAW-IHRRRGAJSA-N Tyr-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XYBNMHRFAUKPAW-IHRRRGAJSA-N 0.000 description 1
- JHDZONWZTCKTJR-KJEVXHAQSA-N Tyr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JHDZONWZTCKTJR-KJEVXHAQSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- OBKOPLHSRDATFO-XHSDSOJGSA-N Tyr-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N OBKOPLHSRDATFO-XHSDSOJGSA-N 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- DCOOGDCRFXXQNW-ZKWXMUAHSA-N Val-Asn-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DCOOGDCRFXXQNW-ZKWXMUAHSA-N 0.000 description 1
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 1
- FBVUOEYVGNMRMD-NAKRPEOUSA-N Val-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N FBVUOEYVGNMRMD-NAKRPEOUSA-N 0.000 description 1
- DJQIUOKSNRBTSV-CYDGBPFRSA-N Val-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](C(C)C)N DJQIUOKSNRBTSV-CYDGBPFRSA-N 0.000 description 1
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 1
- WMRWZYSRQUORHJ-YDHLFZDLSA-N Val-Phe-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WMRWZYSRQUORHJ-YDHLFZDLSA-N 0.000 description 1
- UZFNHAXYMICTBU-DZKIICNBSA-N Val-Phe-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UZFNHAXYMICTBU-DZKIICNBSA-N 0.000 description 1
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 1
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- JXWGBRRVTRAZQA-ULQDDVLXSA-N Val-Tyr-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](C(C)C)N JXWGBRRVTRAZQA-ULQDDVLXSA-N 0.000 description 1
- LMVWCLDJNSBOEA-FKBYEOEOSA-N Val-Tyr-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N LMVWCLDJNSBOEA-FKBYEOEOSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- 235000018936 Vitellaria paradoxa Nutrition 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 108091007916 Zinc finger transcription factors Proteins 0.000 description 1
- 102000038627 Zinc finger transcription factors Human genes 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010036999 aspartyl-alanyl-histidyl-lysine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 244000000005 bacterial plant pathogen Species 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 238000007413 biotinylation Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 239000011575 calcium Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010020688 glycylhistidine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 102000054910 human GMNN Human genes 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 108010093345 lens epithelium-derived growth factor Proteins 0.000 description 1
- 108010077158 leucinyl-arginyl-tryptophan Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 101150071637 mre11 gene Proteins 0.000 description 1
- 231100000219 mutagenic Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- VYXXMAGSIYIYGD-NWAYQTQBSA-N propan-2-yl 2-[[[(2R)-1-(6-aminopurin-9-yl)propan-2-yl]oxymethyl-(pyrimidine-4-carbonylamino)phosphoryl]amino]-2-methylpropanoate Chemical compound CC(C)OC(=O)C(C)(C)NP(=O)(CO[C@H](C)Cn1cnc2c(N)ncnc12)NC(=O)c1ccncn1 VYXXMAGSIYIYGD-NWAYQTQBSA-N 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000022983 regulation of cell cycle Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 108091035539 telomere Proteins 0.000 description 1
- 102000055501 telomere Human genes 0.000 description 1
- 210000003411 telomere Anatomy 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4738—Cell cycle regulated proteins, e.g. cyclin, CDC, INK-CCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/095—Fusion polypeptide containing a localisation/targetting motif containing a nuclear export signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Cell Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Mycology (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Paper (AREA)
Abstract
본 발명은 상동성-지정 복구 (HDR)의 절대 속도를 향상시키고/거나 비-상동 말단 연결 (NHEJ)에 비교한 HDR의 상대 속도를 향상시키는 방법에 관한 것이다.
Description
[우선권 주장]
본 출원은 2014년 10월 1일자 U.S. 특허 가출원 제62/058,456호의 우선권을 주장하는 바이다. 상기의 전체 내용은 의거 참조로 포함된다.
[기술분야]
본 발명은 상동성-지정 복구(homology-directed repair) (HDR)의 절대 속도를 향상시키고/거나 비-상동 말단 연결 (NHEJ)에 비교한 HDR의 상대 속도를 향상시키는 방법에 관한 것이다.
표적화된 게놈 편집은 광범위한 연구 및 치료 적용분야를 갖는 신종의 중요한 기술이다. 맞춤화가능한 뉴클레아제가 살아있는 세포에서 표적화된 이중-가닥 절단 (DSB)을 만드는 데에 사용될 수 있는데, 그의 복구는 원하는 서열 변화를 유도하는 데에 활용될 수 있다.
2종의 경쟁적인 경로가 포유동물 세포를 포함한 대부분의 세포에서 복구를 수행한다. 비-상동 말단-연결 (NHEJ)에 의한 뉴클레아제-유도 DSB의 복구는 높은 빈도의 삽입/결실 돌연변이 (인델(indel)) 도입으로 이어진다. 반면, 사용자가 제공하는 "공여자 주형(donor template)" DNA를 사용하는 상동성 지정 복구 (HDR)에 의한 DSB 복구는 특정 변경의 도입 (예컨대 점 돌연변이 및 삽입) 또는 다시 야생형으로의 돌연변이 서열의 보정으로 이어질 수 있다.
본 발명은 상동성-지정 복구 (HDR)의 절대 속도 및/또는 비-상동 말단 연결 (NHEJ)에 비교한 HDR의 상대 속도를 향상시키는 방법의 개발을 기반으로 한다.
이에 따라, 한 측면에서, 본 발명은 세포내 이중-가닥 핵산, 예컨대 게놈 DNA 상의 표적 부위로의 특정 서열의 도입 방법을 제공한다. 상기 방법은 (i) 표적 핵산으로 삽입될 특정 서열을 포함하는 공여자 핵산 분자의 이중-가닥 영역, 및 (ii) 표적 부위 또는 그 부근 (예컨대 그의 50, 30, 20, 10 또는 5개 뉴클레오티드 이내)에 결합하며, 표적 핵산으로 삽입될 특정 서열을 포함하는 공여자 핵산 분자의 이중-가닥 영역에도 결합하는 DNA 결합 도메인 (DBD), 예컨대 조작된 DNA 결합 도메인을 세포와 접촉시키거나 세포 내에서 발현시키는 것; 및 공여자 핵산 분자가 DSB의 부위로 삽입되고 DSB가 복구되기에 충분한 조건하에서 표적 부위에 이중 가닥 절단 (DSB)을 유도함으로써, 표적 부위로 특정 서열을 도입하는 것을 포함한다.
일부 실시양태에서, 상기 DBD는 표적 부위 부근 (예컨대 그의 50, 30, 20, 10 또는 5개 뉴클레오티드 이내)인 공여자 분자의 이중-가닥 DNA 부분에 직접적으로 결합하는 아연 핑거 도메인, 전사-활성화인자-유사 이펙터 (TALE) 도메인, 또는 뉴클레아제 활성이 결여되어 있는 "사멸" Cas9 변이체 ("dCas9")이다.
일부 실시양태에서, 뉴클레아제는 ZFN, TALEN 또는 Cas9 단백질이다.
일부 실시양태에서, 상기 방법은 예컨대 1-100, 1-50, 1-30 또는 1-20개 아미노산의 임의적인 개재 링커를 통하여 DSB를 만드는 데에 사용되는 뉴클레아제에 연결된 DBD를 포함하는 융합 단백질을 발현시키는 것을 포함한다.
일부 실시양태에서, DBD는 표적 DSB 부위에 인접하여, 또는 부근 예컨대 그의 50, 30, 20 또는 10개 nt 이내에 결합하는 제2 DBD에 연결된다.
일부 실시양태에서, 공여자 분자는 전체적으로 이중-가닥인 공여자 주형 또는 부분적으로는 이중-가닥이며 부분적으로는 단일-가닥인 DNA이다.
일부 실시양태에서, 상기 방법은 세포 내에서 하기를 발현시키는 것을 포함한다: 이량체화 도메인, 및 공여자 핵산 분자에 (공유 연결이라기 보다는) 결합하는 DBD를 포함하는 제1 융합 단백질, 그리고 상응하는 이량체화 도메인, 및 표적 부위에 DSB를 유도하는 뉴클레아제 또는 표적 DSB에 인접한 DNA 서열에 결합하는 제2 DBD를 포함하는 제2 융합 단백질.
일부 실시양태에서, 공여자 분자에 결합하는 DBD는 Csy4에 융합되거나 결합되며, 뉴클레아제는 Cas9이고, 가이드RNA는 Csy4 인식 서열에 융합된다.
일부 실시양태에서, 뉴클레아제는 촉매적으로 불활성인 Csy4 (dCsy4)에 융합되며, 공여자 분자는 Csy4 인식 부위 (RNA) 및 이중-가닥 공여자 (DNA)를 포함하는 RNA-DNA 혼성체이다.
또 다른 측면에서, 본 발명은 세포내 이중-가닥 핵산, 예컨대 게놈 DNA 상의 표적 부위로의 특정 서열의 도입 방법을 제공한다. 상기 방법은 조작된 뉴클레아제에 연결된 세포-주기에 의해 조절되는 단백질 도메인을 포함하는 융합 단백질을 포함하는 세포 주기의 특정 단계에서만 DSB를 유도하는 뉴클레아제를 세포 내에서 발현시키는 것을 포함한다.
일부 실시양태에서, 상기 세포-주기에 의해 조절되는 단백질 도메인은 G2 또는 S-단계 특이적 단백질의 것, 예를 들면 CtIP, Cdk2, 사이클린 A1, 사이클린 A2, 사이클린 B1, 또는 제미니(Gemini), 예컨대 인간 제미니의 아미노산 1-100이다.
일부 실시양태에서, 조작된 뉴클레아제는 ZFN, TALEN, CRISPR/Cas9 및 CRISPR RNA-가이드 FokI 뉴클레아제 (RFN)로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 융합 단백질은 hGem-ZFN, ZFN-hGem, mAG-hGem-ZFN, ZFN-mAG-hGem, hGem-TALEN, TALEN-hGem, mAG-hGem-TALEN, TALEN-mAG-hGem; hGem-Cas9, Cas9-hGem, mAG-hGem-Cas9, Cas9-mAG-hGem, hGem-Csy4, hGem-mAG-Csy4, Csy4-hGem, 또는 Csy4-mAG-hGem, hGem-FokI-dCas9, hGem-mAG-FokI-dCas9, FokI-dCas9-hGem, FokI-dCas9-hGem-mAG, hGem-dCas9-FokI, hGem-mAG-dCas9-FokI, dCas9-FokI-hGem, 또는 dCas9-FokI-hGem-mAG로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 상기 구축물은 하나 이상의 핵 국재화 신호 및 핵 외수송 신호, 또는 뉴클레아제 단백질의 세포질로의 트래픽킹(trafficking)을 조절하는 핵-세포질 셔틀 서열을 포함한다.
또 다른 측면에서, 본 발명은 세포내 이중-가닥 핵산, 예컨대 게놈 DNA 상의 표적 부위로의 특정 서열의 도입 방법을 제공하며, 상기 방법은 세포 주기 전체에 걸쳐 하나 이상의 HDR 경로 구성요소를 광범위하게 발현시키는 것을 포함한다.
일부 실시양태에서, 상기 방법은 전사 활성화 도메인 (예컨대 VP64, VP16, NF-KB p65) 및 서열-특이적 DNA 결합 도메인 (예컨대 조작된 아연 핑거, TALE, 또는 특정 가이드 RNA와 복합체화된 dCas9)을 포함하는 조작된 융합 단백질을 세포와 접촉시키거나 세포 내에서 발현시킴으로써, HDR 경로의 구성요소를 상향조절하는 것을 포함한다.
일부 실시양태에서, 상향조절하기 위한 인자는 Rad50, Rad51, Rad52, Rad54, BRCA1 또는 BRCA2 중 하나 이상을 포함한다.
또 다른 측면에서, 본 발명은 세포내 이중-가닥 핵산, 예컨대 게놈 DNA 상의 표적 부위로의 특정 서열의 도입 방법을 제공한다. 상기 방법은 세포 내에서 조작된 뉴클레아제 (예컨대 ZFN, TALEN, Cas9 뉴클레아제, Cas9 니카제 또는 CRISPR RNA-가이드 FokI 뉴클레아제)를 발현시킴으로써 표적 부위에 DSB를 생성시키는 것, 및 동일한 게놈 부위로 HDR 인자를 동원하거나, 그로부터 NHEJ 인자를 차단하는 것을 포함한다.
일부 실시양태에서, 상기 방법은 하기 중 하나 이상을 세포에서 발현시키는 것을 포함한다: 표적 부위 부근의 서열에 결합하는 DBD에 연결된 HDR 인자를 포함하는 융합 단백질, 조작된 뉴클레아제에 연결된 HDR 인자를 포함하는 융합 단백질, 이량체화 도메인에 연결된 HDR 인자를 포함하는 제1 융합 단백질과 상응하는 이량체화 도메인에 연결된 조작된 뉴클레아제를 포함하는 제2 융합 단백질, 가이드 RNA 서열의 말단에 첨부된 특정 RNA 서열과 상호작용하는 RNA-결합 단백질 (예컨대 MS2 또는 Csy4)에 연결된 HDR 인자를 포함하는 융합 단백질, 및/또는 임의의 전구-HDR 또는 항-NHEJ 인자의 플라스미드로부터의 발현물.
일부 실시양태에서, HDR 인자는 자유 DNA 말단을 프로세싱하는 뉴클레아제 또는 헬리카제, 및 보조 HDR 인자에 대한 핵형성(nucleation) 부위로 작용하는 단백질 결합 도메인으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, HDR-관련 단백질은 DNA 가닥 절단을 촉진하는 뉴클레아제 및/또는 헬리카제, 예컨대 MRE11, EXO1, DNA2, CtIP, TREX2 및 아폴로; 특이적 인자를 동원하거나 가닥 침입을 촉매하는 결합 인자/핵형성 단백질, 예컨대 BRCA1, BRCA2, PALB2, RAD50 또는 NBS1, RAD51, RAD52, RAD54, SRCAP, FANCI, FANCD2, BRIP1, SLX4, FANCA, FANCE 및 FANCL (이들 인자의 말단절단되거나, 돌연변이되거나, 변형되거나, 또는 최적화된 버전 포함)로 이루어진 군으로부터 선택된다.
또 다른 측면에서, 본 발명은 세포내 이중-가닥 핵산, 예컨대 게놈 DNA 상의 표적 부위로의 특정 서열의 도입 방법을 제공한다. 상기 방법은 전구-NHEJ 인자의 전사 억제를 포함하여, NHEJ-연관 인자를 국부적으로 차단하거나 그에 결합하는 것을 포함한다.
일부 실시양태에서, 상기 방법은 Ku70과 상호작용하여 그에 결합하나 아르테미스, 폴리뉴클레오티드 키나제/포스파타제 (PNKP), AP 엔도뉴클레아제 1 (APE1) 및 티로실-DNA 포스포디에스테라제 (TDP1)와 같은 말단-프로세싱 인자의 동원이 손상되어 있는 DNA-PK의 버전에 융합되거나, 또는 Rif1의 결손 버전에 융합된 표적 부위 또는 그 부근에 결합하는 DBD를 포함하는 융합 단백질을 세포에서 발현시키는 것을 포함한다.
또 다른 측면에서, 본 발명은 세포내 이중-가닥 핵산, 예컨대 게놈 DNA 상의 표적 부위로의 특정 서열의 도입 방법을 제공한다. 상기 방법은 표적 부위에 이중 가닥 절단 (DSB)을 유도하는 것을 포함하며, 여기서 상기 DSB는 3' 오버행을 갖는다.
일부 실시양태에서, 상기 방법은 세포에서 하기를 발현시키는 것을 포함한다: 3' 오버행을 갖는 DSB를 형성하도록 위치한 조작된 니카제 (예컨대 ZF니카제 또는 Cas9 니카제)의 쌍; 3' 오버행을 갖는 DSB를 만드는 이량체화-의존성 뉴클레아제 도메인, 예컨대 Kpn I로부터의 뉴클레아제 도메인을 포함하는 하나 이상의 ZFN, TALEN 또는 CRISPR RNA-가이드 뉴클레아제; 또는 Cas9 니카제 (예컨대 H840- 또는 N863A-Cas9 니카제)에 융합된 FokI 절단 도메인 및 3' 오버행을 갖는 DSB를 생성시키도록 이격된 2개의 가이드 RNA를 포함하는 융합 단백질.
또 다른 측면에서, 본 발명은 세포내 이중-가닥 핵산, 예컨대 게놈 DNA 상의 표적 부위로의 특정 서열의 도입 방법을 제공한다. 상기 방법은 Spo11에 연결된 (N-, C- 또는 내부 융합 중 어느 하나) 조작된 DNA 결합 도메인을 각각 포함하는 한 쌍의 융합 단백질을 세포에서 발현시키는 것을 포함하며, 여기서 상기 DBD-Spo11 단량체 각각은 적절한 간격을 두고 표적화됨으로써, 3' 오버행을 갖는 표적화된 DSB를 생성시킨다.
또 다른 측면에서, 본 발명은 세포내 이중-가닥 핵산, 예컨대 게놈 DNA 상의 표적 부위로의 특정 서열의 도입 방법을 제공한다. 상기 방법은 Cas9 및 크로마틴 변형인자, 예컨대 SETD2, SRCAP 및 SMARCAD1을 포함하는 융합 단백질을 세포에서 발현시키는 것을 포함한다.
또 다른 측면에서, 본 발명은 시험관 내에서 생성된 단백질-캡핑된 공여자 주형의 사용에 의한, 세포내 이중-가닥 핵산, 예컨대 게놈 DNA 상의 표적 부위로의 특정 서열의 도입 방법을 제공한다.
일부 실시양태에서, 상기 방법은 Cas9-기반 뉴클레아제 또는 니카제를 발현시키는 것을 포함하며, 표적 부위 또는 그 부근에 결합하는 하나 이상의 가이드 RNA를 세포에서 발현시키는 것을 추가로 포함한다.
일부 실시양태에서는, 상동성-지정 복구 (HDR)의 절대 속도 및/또는 비-상동 말단 연결 (NHEJ)의 속도와 비교하였을 때의 HDR의 상대 속도가 향상된다.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 관련 기술분야 통상의 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 발명에 사용하기 위한 방법 및 물질이 본원에 기술되어 있지만; 관련 기술분야에 알려져 있는 다른 적합한 방법 및 물질이 사용될 수도 있다. 물질, 방법 및 예는 오로지 예시적인 것으로써, 제한하고자 하는 것이 아니다. 본원에서 언급되는 모든 공개, 특허 출원, 특허, 서열, 데이터베이스 기재사항 및 기타 참고문헌은 그 전체가 참조로 포함된다. 충돌하는 경우, 정의를 포함한 본 명세서가 우선하게 된다.
본 발명의 다른 특징 및 장점은 하기하는 상세한 설명 및 도면, 그리고 청구범위에서 드러나게 될 것이다.
특허 또는 출원 파일은 컬러로 작성된 적어도 하나의 도면을 포함한다. 컬러 도면(들)을 포함하는 본 특허 또는 특허 출원 공개의 사본은 요청 및 필요 비용의 지불시 사무국에 의해 제공될 것이다.
도 1은 뉴클레아제 유도 DSB로의 공여자 동원에 대한 개략도이다. 이와 같은 시스템에서 가능한 많은 조합 변화를 반영하여, 몇 가지 가능한 배열구조만을 나타내었다. 매 경우, dsDNA 결합 부위는 녹색으로 강조하였다. 이중-가닥 DNA의 영역은 2개 가닥 사이의 대시로 나타내었다. (a-b) Cas9 N-말단에의 공여자-동원 DNA-결합 도메인 (DBD)의 직접적인 융합으로써, 여기서 (a)의 배열구조는 다른 부분은 ssDNA인 공여자 분자의 dsDNA 부분에의 결합에 의존하는 반면, (b)에서는 부분적으로 ssDNA 공여자 분자와 혼성화되는 분자의 dsDNA 부분에 결합함. (c) 결합 상대물이 dsDNA 공여자 플라스미드내 서열을 표적으로 하는 DBD에 융합되어 있는 이량체화 도메인에의 Cas9의 C-말단 융합.
도 2a-b는 세포-주기 국재화된 형광 마커를 도시한다. (a) 문헌 [Miyawaki et al. 2008]로부터 적합화된 개략도. 이와 같은 작업에서 기술된 세포-주기 태그화 형광 단백질은 mAzamiGreen-hGem (S/G2/M에 국재화) 및 mKusabiraOrange2-Cdt1 (G1에 국재화)임. (b) 이러한 세포-주기 지표 모두를 발현하는 본 발명자들이 확립한 세포주의 공초점 영상.
도 3a-d는 HDR-인자를 Cas9에 융합시키는 것에 대한 예시적인 개략도를 나타낸다. (a) N- 및 C-말단 단부를 강조하여 황색으로 나타낸 Cas9 뉴클레아제 또는 니카제, 및 적색으로 나타낸 가이드-RNA. (b) HDR-이펙터 분자의 전체 길이 또는 말단절단 도메인 버전은 Cas9 변이체의 N- 또는 C-말단 단부 중 어느 하나 또는 모두에 융합될 수 있음. (c) HDR-이펙터는 이량체화 도메인의 사용을 통하여 Cas9로 동원될 수 있음. (d) RNA-결합 단백질에 융합될 경우, HDR-이펙터는 gRNA의 3'-말단에 RNA-결합 모티프가 첨가되면 Cas9/gRNA 복합체로 동원될 수 있음.
도 3e-f는 뉴클레아제 유도 DSB로의 HR-특이적 인자의 동원에 대한 예시적인 개략도를 나타낸다. (e) Cas9 뉴클레아제를 인도하는 gRNA 3' 말단으로의 RNA 압타머의 직접적인 융합. 압타머는 고도의 특이성으로 HDR-연관 인자에 결합하여 Cas9 뉴클레아제에 의해 유도된 절단 부위로 해당 인자를 동원함. (f) CRISPR RNA-가이드 FokI 뉴클레아제를 인도하는 데에 사용되는 쌍을 이룬 gRNA 각각에 대한 구별되는 RNA 압타머 세트의 직접적인 융합.
도 4는 3' 오버행을 갖는 DSB의 형성을 위한 예시적인 쌍을 이룬 Cas9 니카제 (Cas9n)를 도시하는 개략도이다.
도 5는 3' 오버행을 도입하기 위한 예시적인 FokI-Cas9 니카제 (Cas9n) 구성을 도시하는 개략도이다.
도 1은 뉴클레아제 유도 DSB로의 공여자 동원에 대한 개략도이다. 이와 같은 시스템에서 가능한 많은 조합 변화를 반영하여, 몇 가지 가능한 배열구조만을 나타내었다. 매 경우, dsDNA 결합 부위는 녹색으로 강조하였다. 이중-가닥 DNA의 영역은 2개 가닥 사이의 대시로 나타내었다. (a-b) Cas9 N-말단에의 공여자-동원 DNA-결합 도메인 (DBD)의 직접적인 융합으로써, 여기서 (a)의 배열구조는 다른 부분은 ssDNA인 공여자 분자의 dsDNA 부분에의 결합에 의존하는 반면, (b)에서는 부분적으로 ssDNA 공여자 분자와 혼성화되는 분자의 dsDNA 부분에 결합함. (c) 결합 상대물이 dsDNA 공여자 플라스미드내 서열을 표적으로 하는 DBD에 융합되어 있는 이량체화 도메인에의 Cas9의 C-말단 융합.
도 2a-b는 세포-주기 국재화된 형광 마커를 도시한다. (a) 문헌 [Miyawaki et al. 2008]로부터 적합화된 개략도. 이와 같은 작업에서 기술된 세포-주기 태그화 형광 단백질은 mAzamiGreen-hGem (S/G2/M에 국재화) 및 mKusabiraOrange2-Cdt1 (G1에 국재화)임. (b) 이러한 세포-주기 지표 모두를 발현하는 본 발명자들이 확립한 세포주의 공초점 영상.
도 3a-d는 HDR-인자를 Cas9에 융합시키는 것에 대한 예시적인 개략도를 나타낸다. (a) N- 및 C-말단 단부를 강조하여 황색으로 나타낸 Cas9 뉴클레아제 또는 니카제, 및 적색으로 나타낸 가이드-RNA. (b) HDR-이펙터 분자의 전체 길이 또는 말단절단 도메인 버전은 Cas9 변이체의 N- 또는 C-말단 단부 중 어느 하나 또는 모두에 융합될 수 있음. (c) HDR-이펙터는 이량체화 도메인의 사용을 통하여 Cas9로 동원될 수 있음. (d) RNA-결합 단백질에 융합될 경우, HDR-이펙터는 gRNA의 3'-말단에 RNA-결합 모티프가 첨가되면 Cas9/gRNA 복합체로 동원될 수 있음.
도 3e-f는 뉴클레아제 유도 DSB로의 HR-특이적 인자의 동원에 대한 예시적인 개략도를 나타낸다. (e) Cas9 뉴클레아제를 인도하는 gRNA 3' 말단으로의 RNA 압타머의 직접적인 융합. 압타머는 고도의 특이성으로 HDR-연관 인자에 결합하여 Cas9 뉴클레아제에 의해 유도된 절단 부위로 해당 인자를 동원함. (f) CRISPR RNA-가이드 FokI 뉴클레아제를 인도하는 데에 사용되는 쌍을 이룬 gRNA 각각에 대한 구별되는 RNA 압타머 세트의 직접적인 융합.
도 4는 3' 오버행을 갖는 DSB의 형성을 위한 예시적인 쌍을 이룬 Cas9 니카제 (Cas9n)를 도시하는 개략도이다.
도 5는 3' 오버행을 도입하기 위한 예시적인 FokI-Cas9 니카제 (Cas9n) 구성을 도시하는 개략도이다.
게놈 편집에 있어서 해결되지 않은 주요 과제는 DSB가 공여자 주형을 사용한 HDR에 의해 복구되는지, 또는 돌연변이유발성인 NHEJ에 의해 복구되는지 여부를 조절하는 능력의 부재이다. HDR-매개 변경은 잠재적으로는 치료 적용분야에 필요할 정밀한 게놈 편집 사례를 달성하는 데에 사용될 수 있지만, 해당 변경이 갖는 효율이 일반적으로 NHEJ-매개 인델에 비해 덜 효율적이다. HDR 및 NHEJ에 의한 변경은 경쟁적인 과정이기 때문에, 원하는 정밀한 변화 전에 인델이 도입될 수 있다. 또한, 일부 경우에는, 이차적인 NHEJ-매개 인델이 HDR에 의해 보정된 대립유전자에 도입될 수 있다.
HDR이 NHEJ에 비해 더 효율적이 되는 것을 가능하게 되는 방법, 또는 NHEJ-매개 복구를 억제하는 방법은 뉴클레아제-유도 게놈 편집의 적용 영역을 확대하게 될 것이다. 본원에서는, 맞춤화가능한 뉴클레아제에 의해 HDR의 절대 및 상대 속도를 증가시키기 위한 수많은 전략을 기술한다. DSB를 유도하는 데에 클러스터화된 규칙적으로 이격된 짧은 회문식 반복부-CRISPR-연관 (CRISPR-Cas9) 시스템을 사용하여 이러한 전략을 기술하고 있기는 하지만, 이러한 전략 중 많은 것이 임의의 맞춤화가능한 뉴클레아제 플랫폼 (예를 들면 - 메가뉴클레아제, 아연 핑거 뉴클레아제 (ZFN), 전사 활성화인자-유사 이펙터 뉴클레아제 (TALEN))과의 사용에 일반화가능하다는 것에 유의한다.
방법 #1: 뉴클레아제-유도 DSB 부위 부근에 공여자 주형을 테더링시킴으로써 공여자 분자의 국부적 농도를 증가시키는 것에 의한 HDR의 증가
표적화된 DNA 절단에 의한 HDR을 강화하는 첫 번째 방법은 HDR 공여자 분자를 표적화된 DSB 부위에 물리적으로 국재화하는 조작된 DNA 결합 도메인을 사용하는 것이다. 이와 같은 접근법의 타당성은 DSB 부근 공여자 분자의 국부적 농도를 증가시키는 것이 이어지는 DNA 복구 반응을 표적화된 HDR-매개 복구쪽으로 추진하게 된다는 것으로써 (반응이 진행되는 데에 상동 공여자 분자가 필요하기 때문임), 원하는 반응은 하기이며:
경쟁하는 NHEJ-매개 복구 반응은 하기로 제시되고:
이에 따라 반응 (1)의 속도는 증가된 공여자 농도의 결과로 증가하게 되는 반면, 반응 (2)는 이와 같은 교란에 의해 직접적으로는 영향을 받지 않게 되지만; 반응 (1)에의 편향이 반응 (2)가 덜 효율적으로 진행되게 할 수 있다는 것이다.
이는 프로그램화가능한 특이성을 갖는 DNA 결합 도메인 (DBD), 예를 들면 조작된 DNA 결합 도메인, 예컨대 공여자 분자의 이중-가닥 DNA 부분에 직접적으로 결합하며 그것을 DSB 부위에 국재화하는 - 아연 핑거 도메인, 전사-활성화인자-유사 이펙터 (TALE) 도메인, 뉴클레아제 활성이 결여된 "사멸" Cas9 변이체 ("dCas9"), 또는 예컨대 본원에서 기술되는 것과 같은 기타 DNA-결합 플랫폼을 사용하여 달성될 수 있다. 이와 같은 DBD는 DSB를 만드는 데에 사용되는 뉴클레아제에의 직접적인 융합을 통하여 (예컨대 ZFN, TALEN 또는 Cas9 단백질; 예를 들면 도 1a & 1b 참조), 또는 표적 DNA, 예컨대 게놈의 표적 DSB 부위 부근의 서열에 결합하도록 조작된 제2 조작된 DNA 결합 도메인 (동일하거나 상이한 유형의 것)에의 융합을 통하여 표적 DNA, 예컨대 게놈에서 DSB 국재화를 인도한다. 모든 경우에서, 첫 번째 DBD는 전체적으로 이중-가닥인 공여자 주형, 다른 부분은 단일-가닥인 DNA공여자 분자의 이중-가닥인 부분, 또는 그의 단일-가닥인 부분이 공여자 분자의 단일-가닥인 부분과 혼성화되는 DNA 분자의 이중-가닥인 부분 중 어느 하나에 결합할 수 있다.
이와 같은 접근법에 대한 다른 변이에는 공여자 분자에 결합하거나 그것을 동원하는 DBD를 DSB-유도 뉴클레아제(들), 또는 표적 DSB에 인접한 DNA 서열에 결합하는 제2 DBD 중 어느 하나와 서로 연결하는 이량체화 도메인 (공유 연결이 아님)의 사용이 포함된다 (도 1c). 이러한 이량체화 도메인은 서로 상시적으로 상호작용할 수 있거나 (예컨대 류신 지퍼 모티프 (문헌 [Feuerstein et al., Proc. Nati. Acad. Sci. USA 91:10655-10659, 1994]), Fc 도메인), 또는 소형 분자와 같은 이펙터 또는 광에 의한 자극의 존재하에서만 상호작용할 수 있다. 수많은 이량체화 도메인이 관련 기술분야에 알려져 있는데, 예를 들면 상대 융합 단백질 상의 시스테인과 분자간 디술피드 결합을 형성할 수 있는 시스테인, 코일드-코일(coiled-coil) 도메인, 산 패치, 아연 핑거 도메인, 칼슘 핸드 도메인, CHI 영역, CL 영역, 류신 지퍼 도메인, SH2 (src 상동성 2) 도메인, SH3 (src 상동성 3) 도메인, PTB (포스포티로신 결합) 도메인, WW 도메인, PDZ 도메인, 14-3-3 도메인, WD40 도메인, EH 도메인, 림(Lim) 도메인, 이소류신 지퍼 도메인, 그리고 수용체 이량체 쌍의 이량체화 도메인이다 (예컨대 US20140170141호; US20130259806호; US20130253040호; 및 US20120178647호 참조). 적합한 이량체화 도메인은 다량체 또는 이량체로 존재하는 것으로 알려져 있는 임의의 단백질, 또는 그와 같은 다량체화 또는 이량체화 활성을 보유하는 것으로 알려져 있는 임의의 단백질에서 선택될 수 있다. 적합한 도메인의 예는 Gal4의 이량체화 요소, 류신 지퍼 도메인, STAT 단백질 N-말단 도메인, FK506 결합 단백질, 및 Zf 이량체화 활성용으로 선택되는 무작위화된 펩티드를 포함한다 (예컨대 문헌 [Bryan et al., 1999, Proc. Natl. Acad. Sci. USA, 96:9568]; [Pomerantz et al., 1998, Biochemistry, 37:965-970]; [Wolfe et al., 2000, Structure, 8: 739-750]; [O'Shea, 1991, Science, 254:539]; [Barahmand-Pour et al., 1996, Curr. Top. Microbiol. Immunol., 211:121-128]; [Klemm et al., 1998, Annu Rev. Immunol., 16:569-592]; [Ho et al., 1996, Nature, 382:822-826] 참조). 또한, 일부 아연 핑거 단백질은 자체가 이량체화 활성을 가지고 있다. 예를 들어, 전사 인자인 이카로스(Ikaros) 유래의 아연 핑거는 이량체화 활성을 가지고 있다 (문헌 [McCarty et al., 2003, Mol. Cell, 11:459-470]). 이에 따라, 조작된 Zf 단백질 자체가 이량체화 기능을 가지고 있는 경우에는, 해당 단백질에 추가적인 이량체화 도메인을 융합할 필요가 없게 된다. 일부 실시양태에서는, 엔도뉴클레아제 도메인 자체가 이량체화 활성을 보유하고 있다. 예를 들면, 고유의 이량체화 활성을 갖는 FokI의 뉴클레아제 도메인이 사용될 수 있다 (문헌 [Kim et al., 1996, Proc. Natl. Acad. Sci., 93:1156-60]). 일부 실시양태에서는, "조건부" 이량체화 기술이 사용될 수 있다. 예를 들면, 이는 FK506 및 FKBP 상호작용을 사용하여 실행될 수 있다. FK506 결합 도메인은 이량체화될 단백질에 결합된다. 이량체화제의 부재하에서는 이들 단백질이 분리되어 유지되게 된다. 합성 리간드인 FK1012와 같은 이량체화제의 첨가시, 상기 2종의 단백질은 융합하게 된다.
대안적으로, 공여자 분자에 결합하는 DBD는 Cas9 가이드 RNA (gRNA)에 첨부된 RNA 서열 또는 구조 (예컨대 "RNA 압타머")에 직접적으로 결합하는 인자와의 융합 또는 비-공유 상호작용을 통하여 DSB로 동원될 수 있는데; 예를 들면 Csy4는 gRNA에 융합되는 Csy4 인식 서열에 결합할 수 있다.
이와 같은 접근법에 대한 또 다른 변이는 뉴클레아제 (예컨대 ZFN, TALEN, Cas9 또는 FokI-dCas9)를 RNA-결합 도메인, 예컨대 촉매적으로 불활성인 Csy4 (dCsy4, 예컨대 문헌 [Haurwitz et al., EMBO J. Jun 13, 2012; 31(12): 2824-2832]; [Lee et al., Proc Natl Acad Sci U S A. Apr 2, 2013; 110(14): 5416-5421]에 기술되어 있는 바와 같은 H29A Csy4)에 융합시키고, Csy4 인식 부위 (RNA) 및 표준 공여자 (DNA)로 구성되는 RNA-DNA 혼성 공여자 분자를 제공하는 것일 수 있다. dCsy4는 단일 가닥 RNA-DNA 혼성 공여자 상의 Csy4 인식 부위에 결합하여, 그것을 표적화된 DSB에 근접한 가까운 영역에 테더링시키게 된다. 대안적으로는, MS2와 같은 RNA-결합 도메인이 Csy4 대신 사용될 수 있다. 주목할만한 것은 Cas9가 이전에 절단 후 결합되어 유지되는 것으로 보고된 바 있다는 것으로써, 이는 그것이 이와 같은 적용분야에 이상적이 되게 한다.
일부 경우에는, 상기한 것과 유사한 결과를 달성하는 데에 조작된 DBD 대신 비-프로그램가능 자연 DNA 도메인이 사용될 수도 있다는 것에 주목하고 있다.
방법 #2: 세포-주기에 의해 조절되는 뉴클레아제의 사용
NHEJ는 세포 주기의 모든 단계 동안 작동하는 반면, HDR은 세포 주기의 S 및 G2 단계로 제한된다.
HDR 기구는 세포 주기 동안 조절되며, S 및 G2 단계 동안 존재한다. M 또는 G1 단계 동안 생성되는 DSB는 NHEJ에 의해 우선적으로 복구되는 반면, S 및 G2 동안 만들어지는 것은 HDR에 의해 복구될 기회를 갖는다. 많은 내인성 세포 단백질의 발현이 유비퀴틴화 또는 인산화-의존성 분해 기작에 의해 세포-주기 특이적인 방식으로 조절된다. 예를 들어, 제미닌 단백질은 세포 주기의 G1 단계 동안 분해되나, S, G2 및 M 단계 동안에는 축적된다. 인간 제미닌 (hGem)의 일부에 대한 형광 단백질 단량체성 아자미 그린 (mAG)의 융합은 형광 활성을 세포 주기의 S, G2 및 M 단계로 제한한다는 것이 입증되어 있는데; 예를 들면 문헌 [Sakaue-Sawano et al., Cell. (2008) 132:487-98]; [Abe et al., Development 140, 237-246 (2013)]; [Sakaue-Sawano et al., BMC Cell Biol. 12:2 (2011)]; 및 US20100100977호를 참조한다.
mAG 뉴클레오티드 서열:
mAG 아미노산 서열:
hGem 뉴클레오티드 서열:
hGem 아미노산 서열:
여기에서는, ZFN, TALEN, CRISPR/Cas9, 및 FokI-dCas9 또는 Csy4 리보뉴클레아제와 같은 조작된 뉴클레아제에 대한 세포-주기에 의해 조절되는 단백질 도메인 (예컨대 hGEM, 또는 hGEM의 아미노산 1-110)의 융합을 사용하는, 세포 주기의 특정 단계에서만 DSB를 유도하는 뉴클레아제의 사용에 의해 NHEJ에 비해 HDR을 강화하는 방법을 기술한다.
ZFN의 경우, 일부 실시양태에서, 예시적인 융합 단백질에는 hGem-ZFN, ZFN-hGem, mAG-hGem-ZFN 또는 ZFN-mAG-hGem이 포함되게 된다.
TALEN의 경우, 일부 실시양태에서, 예시적인 융합 단백질에는 hGem-TALEN, TALEN-hGem, mAG-hGem-TALEN 또는 TALEN-mAG-hGem이 포함되게 된다.
야생형 CRISPR/Cas9의 경우, 조절될 수 있는 하기 2종의 구성요소가 존재한다: Cas9 단백질 및 gRNA. 먼저, 예시적인 Cas9 융합 단백질에는 hGem-Cas9, Cas9-hGem, mAG-hGem-Cas9 또는 Cas9-mAG-hGem이 포함된다. 두 번째로, gRNA의 활성은 Csy4-인식 부위와 측접시키고 그것을 RNA Pol II 프로모터의 조절하에 위치시키는 것에 의해 조절될 수 있다. 이와 같은 맥락에서 (USSN 61/930,782호 참조), Cas9/gRNA 활성은 Csy4 리보뉴클레아제의 공동-발현 및 그에 의한 프로세싱에 따라 달라진다. Csy4를 세포 주기 조절하에 위치시키는 것 (hGem-Csy4, hGem-mAG-Csy4, Csy4-hGem 또는 Csy4-mAG-hGem)은 Csy4의 발현을 조절하는 것에 의해 gRNA의 활성을 조절하기 위한 잠재적인 전략이다.
CRISPR RNA-가이드 FokI 뉴클레아제 (RFN)의 경우, 실시양태에는 hGem-FokI-dCas9, hGem-mAG-FokI-dCas9, FokI-dCas9-hGem, FokI-dCas9-hGem-mAG, hGem-dCas9-FokI, hGem-mAG-dCas9-FokI, dCas9-FokI-hGem 또는 dCas9-FokI-hGem-mAG가 포함된다.
이들 구축물 각각은 추가로 핵 국재화 신호 및 핵 외수송 신호, 또는 유비퀴틴화 및 이어지는 단백질 분해에 중요한 단계인 뉴클레아제 단백질의 세포질로의 트래픽킹을 조절하는 핵-세포질 셔틀 서열의 조합을 가질 수 있다. 일반적으로 단백질의 반감기를 감소시키기 위하여, 프롤린 (P), 글루탐산 (E), 세린 (S) 및 트레오닌 (T)가 풍부한 펩티드 서열인 PEST 단백질 분해 태그 (예컨대 문헌 [Rogers et al., Science 234 (4774): 364-8 (1986)] 참조)가 첨가될 수 있다.
hGem 대신, 비제한적으로 하기를 포함한 다른 G2 또는 S-단계 특이적 단백질 유래의 세포-주기 조절 도메인이 사용될 수도 있다: CtIP, Cdk2, 사이클린 A1, 사이클린 A2 및 사이클린 B1. 바람직하게는, 인간 서열이 사용되게 된다.
또한, 세포-주기-특이적 조절은 세포-주기-특이적 전사 조절 요소의 조절하에서 Cas9, TALEN 또는 조작된 아연 핑거 뉴클레아제와 같은 뉴클레아제를 발현시키는 것에 의해 달성될 수 있다. 전사 인자 E2F에 의해 조절되는 유전자의 프로모터 또는 조절 요소, 예컨대 사이클린-A, 사이클린-E 및 CDC2는 S 단계 동안에만 뉴클레아제를 발현시키는 데에 사용될 수 있다. SV40 프로모터 역시 주로 S 단계 동안 발현하는 것으로 입증되어 있다.
개별적으로 또는 조합으로써, 이러한 방법은 원하는 뉴클레아제의 발현을 세포 주기의 S 및 G2 단계로 제한함으로써, 유도되는 DSB가 HDR 경로에 의해 복구될 가능성을 증가시킬 수 있다.
방법 #3: HDR에 중요한 내인성 유전자 생성물의 활성화
HDR 경로에 연관되어 있는 단백질 인자는 세포 주기-의존성 방식으로 조절된다. 이는 HDR 경로에 의한 DSB 복구를 세포 주기의 S 및 G2 단계로 제한함으로써, HDR에 의해 유도되는 정밀한 변경을 인델-유도 NHEJ 경로에 비해 비효율적이 되게 한다. HDR을 더욱 효율적으로 사용하여 게놈에 정밀한 변경을 만들기 위한 전략은 세포 주기 전체에 걸쳐 중요한 HDR 경로 구성요소를 광범위하게 발현시키는 것이다. 이를 달성하기 위한 구체적인 방법에는 서열-특이적인 DNA 결합 도메인 (조작된 아연 핑거, TALE, 또는 특정 가이드 RNA와 복합체화된 dCas9)에 대한 전사 활성화 도메인 (예컨대 VP64, VP16, NF-KB p65)의 조작된 융합체를 사용하여 중요한 HDR 경로 구성요소를 상향조절하는 것이 포함된다. TALE 활성화인자에 사용될 수 있는 전사 활성화인자에 대해서는 관련 기술분야에 알려져 있는데, 예를 들면 1종 이상, 바람직하게는 4종의 VP16 펩티드 (예컨대 VP64 전사 활성화인자 서열 (서열식별번호(SEQ ID NO): 5), 또는 NF-KB p65 전사활성화 도메인이다. 예를 들면, 문헌 [Tremblay et al., Hum Gene Ther. 2012 Aug;23(8):883-90]; [Li et al., Scientific Reports 2:897 (2012) DOI: 10.1038/srep00897]; [Maeder et al., Nat Methods. 2013 Mar;10(3):243-5]; 및 US20110301073호를 참조한다.
상향-조절될 수 있는 인자에는 비제한적으로 하기가 포함된다: Rad50, Rad51, Rad52, Rad54, BRCA1, BRCA2 및 아폴로. 이들 인자 각각은 단독으로, 또는 열거된 인자의 임의 조합으로써 상향조절될 수 있다. 예를 들어, BRCA1 발현을 적정하는 것은 그것이 53BP1의 전구-NHEJ/항-HDR 역할을 억제하여 DSB 부위에서 CtIP와 같은 전구-HDR 인자의 더 큰 활성을 초래하는 것으로 나타나 있기 때문에, HDR을 강화할 수 있다.
세포에서 이들 인자를 일시적으로 그리고 광범위하게 상향조절하기 위해서는, 이러한 인자를 코딩하는 cDNA 또는 mRNA를 갖는 플라스미드가 형질감염될 수 있다.
방법 #4: HDR을 강화하기 위한 뉴클레아제-유도 DSB 부위에서의 DNA 복구 인자의 동원 또는 차단
4a: HDR-연관 인자의 동원
두 가지 세포내 주요 DNA-복구 경로 (NHEJ 또는 HDR)의 구체적인 구성요소에 대해서는 충분히 연구되어 있어서, 복구 결과의 특성에 영향을 주기 위하여 어느 한 기작의 개별 구성요소가 동원되거나 차단되도록 하는 것이 가능하다. 표적화된 DSB를 생성시키면서 동시에 동일한 게놈 부위로 HDR 인자를 동원하거나 그로부터 NHEJ 인자를 차단하는 데에, 맞춤화가능한 뉴클레아제 (예컨대 ZFN, TALEN, Cas9 뉴클레아제, Cas9 니카제, CRISPR RNA-가이드 FokI 뉴클레아제)가 사용될 수 있다.
HDR을 통한 DNA-복구는 자유 DNA 말단을 프로세싱하는 뉴클레아제 또는 헬리카제를 포함한 다수 클래스의 단백질, 그리고 보조 HDR 인자를 위한 핵형성 부위로 작용하는 단백질 결합 도메인과 연관되어 있다. 각 HDR-관련 단백질 (및 번역-후 변형된 이들 인자의 유도체) 클래스의 예에는 비제한적으로 하기가 포함된다:
1) DNA 가닥 절단을 촉진하는 뉴클레아제 및/또는 헬리카제
a. MRE11 - DSB 후 자유 DNA-말단의 최초 말단 절단을 완료하는 MRN (Mre11-Rad50-Nbs1) 복합체의 중요 구성요소. MRE11은 ssDNA 기질에서 엔도뉴클레아제 활성도 가지며 평활 DNA-말단 (Cas9 뉴클레아제 활성의 가장 일반적인 생성물)에 대하여 선호도를 갖는 3'-내지-5' 엑소뉴클레아제임.
b. EXO1 - MRN 복합체와 협력하여 작용한다고 알려져 있는데, EXO1은 dsDNA 말단의 긴 절단을 개시하여 HDR-추진 복구에 바람직한 3'-오버행을 생성시키는 5'-내지-3' 엑소뉴클레아제 활성을 보유함.
c. DNA2 - 역시 EXO1과 유사한 긴 절단 과정에 연관되어 있는 보존된 헬리카제/5'-내지-3' 엑소뉴클레아제.
d. CtIP - MRN 복합체에 의해 동원되어 그와 협력적으로 작용함으로써 MRE11과 함께 절단을 개시함. 53BP1 또는 RIF1과 같은 전구-NHEJ 인자의 결합을 길항하는 것으로도 알려져 있음.
e. 변형된 CtIP - 많은 HDR 경로 구성요소의 활성이 세포-주기-특이적 방식으로 인산화 또는 아세틸화와 같은 번역-후 변형 (PTM)에 의해 조절됨. 예를 들면, CtIP는 세포 주기의 S 및 G2 단계 동안 T847 및 S327 잔기에서 인산화되며, K432, K526 및 K604에서 탈아세틸화됨. 이러한 PTM은 HDR에서의 CtIP 활성을 S 및 G2로 제한함. 이러한 제한을 극복하기 위하여, 임의의 조합으로써 또는 함께 아미노산 치환 T847E, S327E, K432R, K526R 및 K604R을 보유하는 변형된 형태의 CtIP가 상기언급된 수단을 통하여 DSB로 동원될 수 있음. T847E 및 S327E의 경우, 이러한 변형은 CtIP의 상시 활성 형태를 모방함으로써, PTM 제한을 극복함. 반면, K432R, K526R 및 K604R은 해당 위치에서의 아세틸화를 방지하는 것에 의해 CtIP의 상시 활성 상태를 모방함.
f. TREX2 - 조작된 뉴클레아제와 함께 과다발현될 경우 유전자 붕괴 속도를 증가시키는 것으로 나타나 있는 3' 엑소뉴클레아제.
g. 아폴로 - NHEJ-복구 사례에 대하여 길항적으로 작용함으로써 텔로미어를 보호하는 5' 엑소뉴클레아제.
2) 특정 인자를 동원하거나 가닥 침입을 촉매하는 결합 인자/핵형성 단백질
a. BRCA1 - HDR 경로의 초기에 작용하여 HDR-특이적 단백질과의 상호작용을 매개하는 인자. BRCA1은 MRN 복합체의 각 구성요소는 물론, CtIP에도 결합하여 그것을 동원하는 것으로 나타나 있는데, 모두 가닥 절단을 개시하여 HDR 주형 말단을 생성시킬 수 있음. 또한, S-단계 동안 DSB 부위로부터 전구-NHEJ 인자를 배제하게 됨.
b. BRCA2 - 수많은 RAD51 결합 부위를 포함하며, RPA 코팅된 ssDNA 상으로의 적재를 보조하는 것에 의해 RAD51 필라멘트 형성에 관련되어 있음.
c. PALB2 - BRCA1 및 BRCA2 사이의 상호작용을 가교하고 DSB 부위로의 BRCA2 동원을 효과적으로 촉매하는 매개인자 단백질. ssDNA와 상호작용하며 RAD51과 직접적으로 상호작용함으로써, 가닥 침입을 자극하는 것으로 나타나 있음.
d. RAD50 또는 NBS1 - RAD50은 MRE11 및 NBS1에 결합하여 복구 경로 선택 전에 DSB 말단을 테더링시키는 데에 중요한 MRN 복합체를 형성하는 이량체 단백질임. RAD50 융합은 DNA 복구 경로의 매우 초기 단계에 연관되어 있는 인자를 동원하는 구조 스캐폴드로 작용할 수 있음. NBS1은 DSB에 초점을 형성하며, 그에 따라 체크포인트 신호전달에서의 추가적인 역할과 함께, RAD50과 유사한 동원 역할을 수행함.
e. RAD51 - ssDNA 3'-오버행상에 뉴클레오필라멘트 단백질로서 조립됨으로써, 상동 공여자 DNA 서열에 침입하여 HDR 복구를 추진하는 리콤비나제.
f. 변형된 RAD51 - RAD51은 세포 주기의 S 및 G2 단계 동안 T309 잔기에서 인산화됨. 이와 같은 잔기에서의 인산화는 DSB 부근에 필라멘트를 형성하는 RAD51의 능력에 중요함. T309를 T309E로 돌연변이시키는 것은 RAD51의 상시적 활성 형태를 모방함. 상기언급된 수단 중 어느 것을 통한 DSB로의 T309E 돌연변이를 보유하는 RAD51의 동원은 HDR 활성을 증가시키는 작용을 할 수 있음.
g. RAD52 - ssDNA 및 dsDNA 모두에 결합하여 상보성 가닥의 어닐링을 촉매하는 올리고머성 고리 복합체를 형성함. RAD52 융합체는 공여자 DNA가 형질감염을 통하여 과량으로 ssDNA 또는 dsDNA로 존재할 때 상기 예 #1에서와 같이 테더링될 때, 또는 혼성 gRNA/ssDNA 분자가 사용될 때 (상기 예 #1에서 기술된 바와 같음), HDR을 강화할 수 있어야 함.
h. RAD54 - DNA 위상구조(topology)를 변형시키는 것에 의한 재조합에 연관되어 있는 보존된 헬리카제 모티프를 갖는 인자. RAD51 결합 부위도 포함함.
i. SRCAP - DSB에서의 CtIP의 축적을 촉진하여 CtIP-의존성 DNA-말단 절단을 강화하는 크로마틴 개조 인자.
j. FANCI 및 FANCD2 - 하류 판코니 빈혈 상호가교결합 복구 경로(Fanconi Anemia Intercrosslink Repair Pathway) 단백질을 이중 가닥 절단 부위로 동원하여 상동성 복구를 수행함. FancI 및 FancD2는 이중 가닥 절단으로 국재화되기 위하여 모노유비퀴틴화되지만, 복합체의 활성이 유비퀴틴화에 의존하지 않을 수도 있을 가능성이 있음 (문헌 [Kim 및 D'Andrea, Genes Dev. 2012 Jul 1;26(13):1393-408]). 모노유비퀴틴화 및 비변형 복합체 모두가 이중 가닥 절단 부위에 HDR 인자를 동원하는 데에 이용되게 됨.
k. BRIP1 (FANCJ), SLX4 (FANCP), FANCA, FANCE, FANCL 및 상기언급된 RAD51C (FANCO), BRCA2 (FANCD1), PALB2 (FANCN) - DSB 부위로 동원되거나 거기에서의 모노유비퀴틴화 FANCD2/FANCI 단백질 복합체의 활성을 강화하는 판코니 빈혈 가닥간 가교결합 복구 경로의 하류 단백질. 이들 단백질은 이중 가닥 절단 부위에서 HDR을 촉진하기 위하여 동시에 또는 별도로 동원되게 됨.
HDR을 강화하기 위하여, 본원에서 기술되는 HDR-연관 인자 중 어느 것의 전체 길이 또는 말단절단된 버전은 뉴클레아제-유도 DSB에 인접하여 결합하는, 예를 들면 결합하도록 설계된 맞춤화가능한 뉴클레아제 (도 3b) 또는 DBD 중 어느 하나에 융합될 수 있다. 이러한 인자를 공유로 융합시키는 것에 대한 대안으로써, 그들은 이량체화 도메인을 통하여 맞춤화가능한 뉴클레아제 또는 DBD와 상호작용하도록 인도될 수도 있다 (도 3c). 일부 경우에서, 이러한 이량체화 도메인은 상시적으로 상호작용할 수 있거나, 또는 소형 분자- 또는 광-활성화 이량체화 도메인 중 어느 하나를 사용하여 시간적으로-제한되는 유도가능 방식으로 상호작용할 수 있다. 또한, 다수의 구별되는 HDR 인자가 동시에 뉴클레아제 또는 DBD로 동원될 수 있다 (예를 들면, CtIP와 함께 Mre11, Rad50 및 Nbs1이 모두 국재화되어 활성인 MRN-CtIP 복합체를 구성할 수 있음). 대안적으로, Cas9 뉴클레아제, Cas9 니카제 및/또는 CRISPR RNA-가이드 FokI 뉴클레아제의 경우, 이러한 HDR-연관 인자가 가이드 RNA 서열의 말단에 첨부된 특정 RNA 서열과 상호작용할 수 있는 RNA-결합 단백질 (예컨대 MS2 또는 Csy4)에 융합될 수도 있다 (도 3d). HDR을 유도하기 위하여 다양한 인자 또는 이량체화 도메인이 다양한 조합으로 맞춤화가능한 뉴클레아제 및 DBD에 융합될 수 있다는 것에 주목하고 있다. 대안적으로, 특정 HDR-연관 인자에 결합하는 RNA 압타머가 단일 압타머로써 또는 조합 방식으로 gRNA의 3' 말단에 융합됨으로써, 해당 인자를 DSB로 동원할 수 있다 (도 3e-f). CRISPR RNA-가이드 FokI 뉴클레아제의 경우, 하나의 gRNA에 융합되는 압타머가 그의 쌍을 이룬 gRNA에 융합되는 것과 상이하여, 더 큰 인자의 조합 동원을 가능하게 할 수 있다.
추가로, 본원에서 열거되는 전구-HDR 또는 항-NHEJ 인자 중 어느 것은 뉴클레아제, DBD, 이량체화 도메인 또는 RNA-결합 단백질에의 공유 테더링 없이도 플라스미드로부터 (개별 인자 또는 인자의 조합으로써) 세포 내에서 과다발현될 수 있다.
4b: NHEJ-연관 인자의 차단
오류-유발 NHEJ는 포유동물 세포에서 우세한 DSB 복구 경로로써, 세포 주기의 모든 단계 동안 가용하며, HDR 경로에 비해 더 빠른 동역학으로 DSB를 복구할 수 있다. HDR의 효율을 제한하는 한 가지 인자는 NHEJ-인자인 Ku70의 DSB에의 빠른 결합, 및 이후의 DNA-의존성 단백질 키나제 (DNA-PK), 53BP1 (종양 단백질 P53 결합 단백질 1 또는 TP53BP1으로도 지칭됨) 및 기타 NHEJ 기구 중요 구성요소의 동원일 수 있다.
HDR의 효율을 증가시키는 한 가지 접근법에는 Ku70과 상호작용하여 결합하나 아르테미스, 폴리뉴클레오티드 키나제/포스파타제 (PNKP), AP 엔도뉴클레아제 1 (APE1) 및 티로실-DNA 포스포디에스테라제 (TDP1)와 같은 하나 이상 말단-프로세싱 인자의 동원은 손상되어 있는 DNA-PK의 버전과 같은 결손 NHEJ 기구 구성요소의 동원이 포함된다.
53BP1은 DNA 복구 경로 선택의 주요 조절인자인 것으로도 알려져 있다. 최근의 연구에서는, 53BP1에 의해 5' 말단 절단을 차단하는 데에 사용되는 주요 인자인 53BP1의 ATM 인산화-의존성 상호작용인자로서, RAP1-상호작용 인자 (Rif1)가 확인되어 있다. 53BP1 기능을 손상시키는 한 가지 접근법은 Rif1의 결손 버전을 국부적으로 공급하는 것일 수 있다. 또한, dCas9 또는 다른 DBD에 융합된 KRAB 또는 SID 도메인으로 구성되는 전사 억제인자를 표적화하는 것에 의해 내인성 전구-NHEJ 인자 (비제한적으로 53BP1 포함)의 발현을 하향-조절하는 것이 가능할 수 있다.
이러한 전략은 정규적인 NHEJ 경로를 국부적으로 방해함으로써, 5' 말단 절단 및 상동성 지정 복구가 발생할 커다란 기회를 제공한다.
방법 #5: 3' 오버행을 갖는 DSB를 생성시키는 것에 의한 HDR의 강화
FokI-기반 뉴클레아제, 예컨대 ZFN, TALEN 및 최근에 기술된 CRISPR RNA-가이드 FokI-뉴클레아제 (RFN 또는 fCas9)는 4-뉴클레오티드 5' 오버행을 갖는 이중-가닥 절단을 유도하지만; 상동성 지정 복구는 RAD51의 결합을 위한 기질로써 HDR 기구와 더 상호작용할 수 있는 3' 오버행을 초래하는 DSB의 5'->3' 말단 절단에 의해 개시된다. 3' 오버행을 남기는 뉴클레아제를 사용하면, NHEJ보다는 HDR에 의해 복구될 가능성이 더 큰 DSB를 생성시킬 것으로 예상된다.
그와 같은 오버행을 생성시키기 위하여, 하기의 수많은 전략이 사용될 수 있다:
(1) 협력 작용이 3' 오버행을 갖는 DSB의 형성으로 이어지게 되는 적절하게 위치되는 조작된 니카제 (ZF니카제 또는 Cas9 니카제 중 어느 하나)의 쌍을 사용하는 것. 여기에는 H840A 또는 N863A Cas9 HNH 도메인 불활성화 돌연변이가 포함되나, 이에 제한되는 것은 아님 (도 4).
(2) 기존 FokI 도메인 (5' 오버행을 남김)을 3' 오버행을 갖는 DSB를 만드는 이량체화-의존성 뉴클레아제 도메인으로 대체하는 것에 의해, 기존의 ZFN, TALEN 또는 CRISPR RNA-가이드 FokI 뉴클레아제 구성을 변형시키는 것. 3' 오버행을 남기는 뉴클레아제 도메인은 예를 들면 3' 오버행을 남기는 제한 효소, 예컨대 KpnI, HHaI, MnlI, NlaIII, BspCNI, BsrI, BtsCI, HphI, PvuII, SacI 등으로부터 유래할 수 있음.
(3) H840-Cas9 니카제 (또는 N863A-Cas9 니카제)에 융합된 FokI 절단 도메인을 포함하는 FokI-dCas9 단백질을 사용하는 것. 2개의 적절하게 이격된 가이드 RNA에 의한 이와 같은 변이체의 동원은 3' 오버행을 갖는 DSB를 생성시킬 것으로 예상될 수 있음 (도 5 참조). 이와 같은 혼성 구성은 정해진 표적 부위에 2개의 닉(nick) 및 DSB를 도입함으로써 HDR의 이상적인 기질로 작용할 수 있는 긴 3' 오버행을 남길 것으로 예상됨 (도 5 참조).
방법 #6: Spo11에의 조작된 DNA 결합 도메인의 융합에 의한 HDR의 강화
Spo11은 감수분열 세포에서 DSB를 생성시키며, 연접(synapsis)에 필요하고, 절단 후 DSB에 공유 결합되어 유지된다. Mre11 엑소뉴클레아제가 Spo11-결합 DSB를 프로세싱하여 HDR의 이상적인 기질인 3' 말단을 생성시킬 수 있는 것으로 여겨진다. 이에 따라, HDR을 강화하기 위한 한 가지 전략은 조작된 DNA 결합 도메인 (ZF, TALE, dCas9/gRNA)을 Spo11에 융합시켜 (N-, C- 또는 내부 융합체 중 어느 하나로써) 적절한 간격을 갖는 DNA가 되게 하는 것일 수 있다. 이는 한 쌍의 DBD-Spo11 단량체를 적절한 간격으로 표적화함으로써 3' 오버행을 갖는 표적화된 DSB를 생성시키는 것에 의해 수행되게 된다.
인간 Spo11 이소형 A의 서열은 하기와 같다:
인간 Spo11 이소형 B의 서열은 하기와 같다:
이에 따라, 본원에서 제공되는 것은 임의적으로 1-50개 아미노산의 개재 링커 서열을 사용하여 본원에서 기술되는 바와 같은 DBD가 Spo11의 C 말단 또는 N 말단에 융합된 Spo11-DBD 융합 단백질이다.
방법 #7: 표적화된 크로마틴 변형에 의한 HDR의 강화
최근의 증거는 DSB의 크로마틴 상황이 복구 경로 선택에 영향을 줄 수도 있다는 것을 암시하고 있다. 예를 들어, H3K36me3에 결합된 LEDGF는 말단 절단에 중요한 인자인 CtIP를 동원할 수 있다. 이에 따라, 본원에서 제공되는 것은 비제한적으로 말단 절단의 개시 및 궁극적으로 DNA 복구 결과가 HDR을 선호하도록 편향될 수 있는지 여부를 결정하는 SETD2, SRCAP 및 SMARCAD1을 포함한 크로마틴 변형인자의 융합체이다. 크로마틴 변형 단백질 또는 도메인은 Cas9 또는 다른 DBD에 직접적으로 융합되거나, 또는 상기언급된 이량체화/동원 접근법을 통하여 국재화될 수 있다.
방법 #8: 시험관 내에서 생성된 단백질-결합 공여자 주형을 사용한 HDR의 강화
단백질-캡핑된 아데노바이러스 공여자 벡터 (문헌 [Holkers et al., Nat Methods. 2014 Oct;11(10):1051-7])를 사용한 뉴클레아제-매개 유전자 표적화가 자유-말단 통합-결손 렌티바이러스 벡터 (IDLV) 또는 플라스미드 공여자를 사용하는 것에 비해 더 높은 빈도로 정밀한 복구를 초래한다는 것이 최근 보고된 바 있다. 이와 같은 결과는 아데노바이러스 공여자 DNA의 단백질 캡핑에 따라 달라지는 것으로 나타났었다. 효모에서의 시험관내 연구 역시 DNA의 MRX-매개 절단이 DNA 말단상에서의 단백질 블록의 존재에 의해 자극되는 것으로 나타났었다 (문헌 [Cannavo et al. Nature 2014]). 5'- 또는 3'-바이오티닐화 프라이머를 사용한 PCR에 의해 생성되며 스트렙타비딘과 연관되어 있는 단순한 공여자 주형의 사용이 단백질-캡핑된 공여자 주형을 초래할 것으로 예상하고 있다.
DNA-결합 도메인
본원에서 기술되는 융합 단백질은 특정 결합 부위용으로 관련 기술분야에 알려져 있거나 조작된 어떠한 DNA 결합 도메인 (DBD)도 포함할 수 있다. 예시적인 DBD에는 조작되거나 천연인 TAL 이펙터 반복부 어레이, 조작되거나 천연인 아연 핑거, 귀소성 메가뉴클레아제(homing meganuclease)의 변형된 변이 (예컨대 촉매적으로 불황성인 것), CRISPR-Cas 시스템 유래의 변형된 변이 (예컨대 촉매적으로 불황성인 것) 뉴클레아제, 화학적 뉴클레아제 및 기타 천연 DBD가 포함된다.
TAL 이펙터 반복부 어레이
크산토모나스(Xanthomonas) 속 식물 병원성 박테리아의 TAL 이펙터는 숙주 DNA에 결합하여 이펙터-특이적 숙주 유전자를 활성화하는 것에 의해, 질환에서 중요한 역할을 하거나, 방어를 촉발한다. 특이성은 이펙터-가변성 수의 불완전하며 통상적으로 ~33-35개 아미노산인 반복부에 따라 달라진다. 다형성은 주로 반복 위치 12 및 13에 존재하는데, 본원에서는 반복부 가변성-이잔기 (RVD)로 지칭된다. TAL 이펙터의 RVD는 하나의 RVD 대 하나의 뉴클레오티드인 직접적 선형 방식으로 그의 표적 부위내 뉴클레오티드에 상응하는데, 약간의 축중성이 있으며, 분명한 상황 의존성은 없다. 일부 실시양태에서, 뉴클레오티드 특이성을 부여하는 다형성 영역은 삼잔기 또는 삼중체로 발현될 수 있다.
각 DNA 결합 반복부는 표적 DNA 서열내 염기쌍의 인식을 결정하는 RVD를 포함할 수 있는데, 여기서 각 DNA 결합 반복부는 표적 DNA 서열내 하나의 염기 쌍 인식을 담당한다. 일부 실시양태에서, RVD는 하기 중 하나 이상을 포함할 수 있으며: C를 인식하기 위한 HA; C를 인식하기 위한 ND; C를 인식하기 위한 HI; G를 인식하기 위한 HN; G를 인식하기 위한 NA; G 또는 A를 인식하기 위한 SN; T를 인식하기 위한 YG; 및 G를 인식하기 위한 NK, 하기 중 하나 이상을 포함할 수 있다: C를 인식하기 위한 HD; T를 인식하기 위한 NG; A를 인식하기 위한 NI; G 또는 A를 인식하기 위한 NN; A 또는 C 또는 G 또는 T를 인식하기 위한 NS; C 또는 T를 인식하기 위한 N* (여기서 *는 RVD 두 번째 위치의 갭을 나타냄); T를 인식하기 위한 HG; T를 인식하기 위한 H* (여기서 *는 RVD 두 번째 위치의 갭을 나타냄); 및 T를 인식하기 위한 IG.
TALE 단백질은 게놈 조작 (예컨대 식물에서 생물연료 또는 생물재생물질용으로 유용한 특질을 첨가하거나 강화하기 위한 것)에서의 상동성 재조합을 촉진할 수 있는 표적화된 키메라 뉴클레아제로서 연구 및 생물공학에서 유용할 수 있다. 이러한 단백질은 또한 예를 들면 전사 인자로서, 그리고 특히 비제한적인 예로서 병원체 (예컨대 바이러스)에 대한 치료제와 같이 매우 높은 특이성 수준을 필요로 하는 치료 적용분야용으로 유용할 수 있다.
조작된 TALE 어레이를 생성시키는 방법에 대해서는 관련 기술분야에 알려져 있는 바, 예를 들면 USSN 61/610,212호 및 문헌 [Reyon et al., Nature Biotechnology 30,460-465 (2012)]에 기술되어 있는 고속 라이게이션-기반 자동화가능 고체-상 고-처리량 (FLASH) 시스템은 물론; 모두 그 전체가 본원에 참조로 포함되는 문헌 [Bogdanove & Voytas, Science 333, 1843-1846 (2011)]; [Bogdanove et al., Curr Opin Plant Biol 13, 394-401 (2010)]; [Scholze & Boch, J. Curr Opin Microbiol (2011)]; [Boch et al., Science 326, 1509-1512 (2009)]; [Moscou & Bogdanove, Science 326, 1501 (2009)]; [Miller et al., Nat Biotechnol 29, 143-148 (2011)]; [Morbitzer et al., T. Proc Natl Acad Sci U S A 107, 21617-21622 (2010)]; [Morbitzer et al., Nucleic Acids Res 39, 5790-5799 (2011)]; [Zhang et al., Nat Biotechnol 29, 149-153 (2011)]; [Geissler et al., PLoS ONE 6, e19509 (2011)]; [Weber et al., PLoS ONE 6, e19722 (2011)]; [Christian et al., Genetics 186, 757-761 (2010)]; [Li et al., Nucleic Acids Res 39, 359-372 (2011)]; [Mahfouz et al., Proc Natl Acad Sci U S A 108, 2623-2628 (2011)]; [Mussolino et al., Nucleic Acids Res (2011)]; [Li et al., Nucleic Acids Res 39, 6315-6325 (2011)]; [Cermak et al., Nucleic Acids Res 39, e82 (2011)]; [Wood et al., Science 333, 307 (2011)]; [Hockemeye et al. Nat Biotechnol 29, 731-734 (2011)]; [Tesson et al., Nat Biotechnol 29, 695-696 (2011)]; [Sander et al., Nat Biotechnol 29, 697-698 (2011)]; [Huang et al., Nat Biotechnol 29, 699-700 (2011)]; 및 [Zhang et al., Nat Biotechnol 29, 149-153 (2011)]에 기술되어 있는 방법을 참조한다.
아연 핑거
아연 핑거 단백질은 개별적으로 접힌 아연-포함 소형-도메인인 하나 이상의 아연 핑거를 포함하는 DNA-결합 단백질로써, 관련 기술분야에 그의 구조가 잘 알려져 있는 바, 예를 들면 문헌 [Miller et al., 1985, EMBO J., 4:1609]; [Berg, 1988, Proc. Natl. Acad. Sci. USA, 85:99]; [Lee et al., 1989, Science. 245:635]; 및 [Klug, 1993, Gene, 135:83]에 정의되어 있다. DNA에 결합된 아연 핑거 단백질 Zif268 및 그의 변이체의 결정 구조는 통상적으로 아연 핑거의 알파-나선으로부터의 3개 아미노산이 DNA 내 3개의 인접 염기 쌍 또는 "하위부위(subsite)"에 접촉하는 반-보존 양식의 상호작용을 나타낸다 (문헌 [Pavletich et al., 1991, Science, 252:809]; [Elrod-Erickson et al., 1998, Structure, 6:451]). 따라서, Zif268의 결정 구조는 아연 핑거 DNA-결합 도메인이 DNA 서열 내에서 아연 핑거와 3개-염기-쌍 "하위부위" 사이에 1-대-1 상호작용을 갖는 모듈 방식으로 기능할 수 있다는 것을 암시하고 있다. 자연 발생 아연 핑거 전사 인자에서는, 다수의 아연 핑거가 통상적으로 직렬 배열로 서로 연결되어 연속되는 DNA 서열의 서열-특이적 인식을 달성한다 (문헌 [Klug, 1993, Gene 135:83]).
다수의 연구에서, DNA 결합에 연관되어 있는 알파-나선 위치에서 아미노산을 무작위화하고 파지 디스플레이(phage display)와 같은 선택 방법론을 사용하여 해당 DNA 표적 부위에 결합할 수 있는 원하는 변이체를 식별하는 것에 의해, 개별 아연 핑거의 DNA 결합 특징을 인공적으로 조작하는 것이 가능한 것으로 나타나 있다 (문헌 [Rebar et al., 1994, Science, 263:671]; [Choo et al., 1994 Proc. Natl. Acad. Sci. USA, 91:11163]; [Jamieson et al., 1994, Biochemistry 33:5689]; [Wu et al., 1995 Proc. Natl. Acad. Sci. USA, 92: 344]). 그와 같은 재조합 아연 핑거 단백질은 유전자 발현을 조절하고, DNA 메틸화를 변경하고, 모델 생물체, 식물 및 인간 세포의 게놈에 표적화된 변경을 도입하기 위하여 전사 활성화인자, 전사 억제인자, 메틸화 도메인 및 뉴클레아제와 같은 기능성 도메인에 융합될 수 있다 (문헌 [Carroll, 2008, Gene Ther., 15:1463-68]; [Cathomen, 2008, Mol. Ther., 16:1200-07]; [Wu et al., 2007, Cell. Mol. Life Sci., 64:2933-44]).
아연 핑거 단백질 기술의 광범위한 채택 및 대-규모 사용은 강력하고 사용하기가 용이하며 공공연하게 가용한 아연 핑거 어레이 조작 방법의 계속적인 결여에 의해 방해를 받고 있다. "모듈식 조립"으로 알려져 있는 한 가지 기존의 접근법은 사전-선택된 아연 핑거 모듈의 어레이로의 단순 공동 연결을 주장한다 (문헌 [Segal et al., 2003, Biochemistry, 42:2137-48]; [Beerli et al., 2002, Nat. Biotechnol., 20:135-141]; [Mandell et al., 2006, Nucleic Acids Res., 34:W516-523]; [Carroll et al., 2006, Nat. Protoc. 1:1329-41]; [Liu et al., 2002, J. Biol. Chem., 277:3850-56]; [Bae et al., 2003, Nat. Biotechnol., 21:275-280]; [Wright et al., 2006, Nat. Protoc., 1:1637-52]). 어떤 연구자에 의해서도 실시되기에 충분하도록 간단하기는 하지만, 최근의 보고는 통상적으로 임의의 주어진 표적 유전자에 대하여 매우 많은 수의 아연 핑거 단백질의 구성 및 세포-기반 시험을 필요로 하는 한계인 (문헌 [Kim et al., 2009, Genome Res. 19:1279-88]), 특히 아연 핑거 뉴클레아제 환경에서의 이와 같은 방법의 높은 실패율을 나타내고 있다 (문헌 [Ramirez et al., 2008, Nat. Methods, 5:374-375]; [Kim et al., 2009, Genome Res. 19:1279-88]).
무작위화된 라이브러리로부터 아연 핑거 어레이를 식별하는 조합 선택-기반 방법이 모듈식 조립에 비해 더 높은 성공률을 갖는 것으로 나타났다 (문헌 [Maeder et al., 2008, Mol. Cell, 31:294-301]; [Joung et al., 2010, Nat. Methods, 7:91-92]; [Isalan et al., 2001, Nat. Biotechnol., 19:656-660]; [Sander et al., Nat Methods. 8(1):67-9, 2011]; [Bhakta et al., Genome Res. 23(3):530-8, 2013]). 바람직한 실시양태에서, 아연 핑거 어레이에 대해서는 WO 2011/017293호 및 WO 2004/099366호에 기술되어 있는 것이거나, 또는 거기에 기술되어 있는 바와 같이 생성된다. 추가적인 적합한 아연 핑거 DBD에 대해서는 U.S. 특허 제6,511,808호, 6,013,453호, 6,007,988호 및 6,503,717호, 그리고 U.S. 특허 출원 2002/0160940호에 기술되어 있다.
천연 DBD
일부 실시양태에서는, 천연 DBD (예컨대 야생형의 일부, 특정 표적 서열에 결합하는 비-조작 DNA 결합 단백질)가 사용될 수 있다. 예를 들면, 전사 인자, 뉴클레아제, 히스톤, 텔로메라제 또는 다른 DNA 결합 단백질로부터의 DBD가 사용될 수 있다. 통상적으로, DBD는 표적 핵산 서열과의 특이적 상호작용을 촉진하는 구조를 포함하는데; 일반적인 DBD 구조에는 나선-방향전환-나선; 아연 핑거; 류신 지퍼; 익상 나선; 익상 나선 방향전환 나선; 나선-루프-나선; 및 hmg-box가 포함된다. 천연 DBD는 임의의 생물체로부터 유래할 수 있다. 예를 들면, 문헌 [Kummerfeld & Teichmann, Nucleic Acids Res. 34 (Database issue): D74-81 (2006)]을 참조한다. 예를 들면 문헌 [Tjong and Zhou, Nucl. Acids Res. 35:1465-1477 (2007)]에 기술되어 있는 바와 같이, DNA에 접촉함으로써 DBD의 일부를 형성하는 DNA 결합 단백질 내의 잔기는 경험적으로 결정되거나 컴퓨터에 의해 예측될 수 있다. DNA 결합 단백질 데이터베이스가 본 발명의 조성물 및 방법에서 사용하기 위한 DNA 결합 단백질 및 DBD를 식별하는 데에 사용될 수 있는데; 예를 들면 문헌 [Harrison, Nature, 353, 715-719 (1991)]; [Karmirantzou 및 Hamodrakas, Protein Eng. 14(7):465-472 (2001)]; [Kumar et al., BMC Bioinformatics. 8:463 (2007)]; [Kumar et al., J Biomol Struct Dyn. 26(6):679-86 (2009)]; [Lin et al., PLoS One. 6(9):e24756 (2011)]을 참조한다.
본원에서 기술되는 융합 단백질에 천연 DBD가 사용되는 경우, 촉매 도메인은 다른 단백질로부터 유래한다.
귀소성 메가뉴클레아제
메가뉴클레아제는 박테리아, 효모, 조류 및 식물 소기관과 같은 다양한 생물체로부터 기원하는 서열-특이적 엔도뉴클레아제이다. 내인성 메가뉴클레아제는 12 내지 30개 염기 쌍의 인식 부위를 가지며; 18 bp 및 24 bp-길이의 메가뉴클레아제 인식 부위를 갖는 맞춤화가능한 DNA 결합 부위가 기술되어 있는데, 모두 본 발명의 방법 및 구축물에 사용될 수 있다. 예를 들면, 문헌 [Silva, G., et al., Current Gene Therapy, 11:11-27, (2011)]; [Arnould et al., Journal of Molecular Biology, 355:443-58 (2006)]; [Arnould et al., Protein Engineering Design & Selection, 24:27-31 (2011)]; 및 [Stoddard, Q. Rev. Biophys. 38, 49 (2005)]; [Grizot et al., Nucleic Acids Research, 38:2006-18 (2010)]을 참조한다. 일부 실시양태에서는, 귀소성 메가뉴클레아제의 촉매적으로 불활성인 버전이 사용되는데, 예를 들면 첫 번째 LAGLIDADG 모티프로부터의 촉매적으로 활성인 아스파르테이트가 세린으로 돌연변이됨으로써 효소가 불활성이 되게 하는 D44S; 야생형-활성의 ~80 %를 갖는 것으로 보고되어 있는 N152K; 또는 예컨대 문헌 [Gruen et al., Nucleic Acids Res. 2002;30:e29]; [Fonfara et al., Nucleic Acids Res. 2012 January; 40(2):847-860]; 및 [Lippow et al., Nucleic Acids Res. 2009 May; 37(9):3061-73]에 기술되어 있는 바와 같이 효소의 활성을 더욱 더 감소시키는 이중 변이체 D150C/N152K의 돌연변이를 포함하는 I-SceI의 돌연변이이다.
Cas9
Cas9 뉴클레아제의 촉매적으로 불활성인 버전이 본원에서 기술되는 융합 단백질에서 DBD로 사용될 수도 있는데; 이러한 융합 단백질은 특이성을 위하여 단일 가이드 RNA 또는 crRNA/tracrRNA 쌍과의 조합으로써 사용된다. 수많은 박테리아가 Cas9 단백질 변이체를 발현한다. 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) 유래의 Cas9가 현재 가장 일반적으로 사용되는데; 다른 Cas9 단백질 중 일부는 에스. 피오게네스 Cas9와 높은 수준의 서열 동일성을 가지며, 동일한 가이드 RNA를 사용한다. 다른 것들은 더 다양하고, 상이한 gRNA를 사용하며, 또한 상이한 PAM 서열 (RNA에 의해 특이화되는 서열에 인접한 단백질에 의해 특이화되는 2-5개 뉴클레오티드의 서열)을 인식한다. 킬린스키(Chylinski) 등이 많은 박테리아 군으로부터의 Cas9 단백질을 분류하였는데 (문헌 [RNA Biology 10:5, 1-12; 2013]), 그의 보조 도면 1 및 보조 표 1에 많은 수의 Cas9 단백질이 열거되어 있는 바, 본원에 참조로 포함된다. 본원에서 기술되는 구축물 및 방법은 그와 같은 Cas9 단백질 중 어느 것, 및 그의 상응하는 가이드 RNA 또는 상용성인 다른 가이드 RNA의 사용을 포함할 수 있다. 문헌 [Cong et al (Science 339, 819 (2013))]에는, 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) LMD-9 CRISPR1 시스템으로부터의 Cas9 역시 인간 세포에서 기능하는 것으로 나타나 있다. 또한, 지넥(Jinek) 등은 시험관 내에서 에스. 써모필루스 및 엘. 인노쿠아(L. innocua)로부터의 Cas9 병렬상동체가 (상이한 가이드 RNA를 사용할 가능성이 있는 엔. 메닝기티디스(N. meningitidis) 또는 씨. 제주니(C. jejuni)로부터의 것이 아님) 이중 에스. 피오게네스 gRNA에 의해 가이드되어 비록 효율이 약간 감소되기는 하지만, 표적 플라스미드 DNA를 절단할 수 있다는 것을 보였다. 이러한 단백질은 바람직하게는 그것이 단일 가이드 RNA 또는 crRNA/tracrRNA 쌍에 의해 가이드되는 그의 능력을 유지하며 그에 따라 표적 특이성을 유지하나 뉴클레아제 활성은 결여되도록 돌연변이된다.
일부 실시양태에서, 본 발명의 시스템은 박테리아에 코딩되어 있는 대로, 또는 촉매적으로 불활성인 단백질 뉴클레아제 부분을 제공하는 돌연변이, 예를 들면 D10, E762, H983 또는 D986; 및 H840 또는 N863, 예컨대 D10 및 H840에서의 돌연변이, 예를 들면 D10A 또는 D10N 및 H840A 또는 H840N 또는 H840Y를 포함하는 포유동물 세포에서의 발현용으로 코돈-최적화된 것 중 어느 하나로의 에스. 피오게네스로부터의 Cas9 단백질을 활용하는 바; 예를 들면, 문헌 [Jinek et al., Science 2012; 337:816-821]; [Qi et al., Cell 152, 1173-1183 (2013)]을 참조한다.
화학적 뉴클레아제
소위 "화학적 뉴클레아제" (문헌 [Pingoud and Silva, Nat Biotechnol. 25:743-4 (2007)])로부터의 DNA 결합 도메인, 예컨대 삼중체-형성 올리고뉴클레오티드 또는 펩티드 핵산 역시 본 발명의 조성물 및 방법에 활용될 수 있는 바; 예를 들면 문헌 [Schleifman et al., Methods Mol Biol. 2008;435:175-90]; [Arimondo et al., Mol Cell Biol. 2006 Jan; 26(1):324-33]; [Majumdar et al., J Biol Chem. 2008 Apr 25; 283(17):11244-52]; [Simon et al., Nucleic Acids Res. 2008 Jun; 36(11):3531-8]; 또는 [Eisenschmidt et al., Nucleic Acids Res. 2005; 33(22):7039-47]을 참조한다.
뉴클레아제
본원에서 기술되는 융합 단백질은 관련 기술분야에 알려져 있는 임의의 뉴클레아제를 포함할 수 있다. 예시적인 뉴클레아제에는 조작된 TALEN, 아연 핑거 뉴클레아제 (ZFN), 귀소성 메가뉴클레아제, CRISPR-Cas 시스템으로부터의 뉴클레아제, 및 기타 화학적 뉴클레아제가 포함된다. 일부 실시양태에서는, 촉매적으로 활성인 뉴클레아제 도메인이 사용되는데, 예를 들면 FokI 절단 도메인이다. 일부 뉴클레아제 시스템이 문헌 [Gaj et al., Trends Biotechnol. 2013 Jul;31(7):397-405]; [Kim and Kim, Nat Rev Genet. 2014 May;15(5):321-34]에 일반적으로 기술되어 있다.
TALEN
전사 활성화인자-유사 이펙터 뉴클레아제 (TALEN)는 용이하게 조작될 수 있는 DNA-결합 도메인에 융합된 비특이적 DNA-절단 뉴클레아제 (예컨대 FokI 절단 도메인)를 포함하므로, TALEN은 본질적으로 어떠한 서열도 표적화할 수 있다 (예컨대 문헌 [Joung and Sander, Nature Reviews Molecular Cell Biology 14:49-55 (2013)] 참조). 조작된 TALEN을 생성시키는 방법에 대해서는 관련 기술분야에 알려져 있는데, 예를 들면 USSN 61/610,212호 및 문헌 [Reyon et al., Nature Biotechnology 30,460-465 (2012)]에 기술되어 있는 고속 라이게이션-기반 자동화가능 고체-상 고-처리량 (FLASH) 시스템은 물론; 모두 그 전체가 본원에 참조로 포함되는 문헌 [Bogdanove & Voytas, Science 333, 1843-1846 (2011)]; [Bogdanove et al., Curr Opin Plant Biol 13, 394-401 (2010)]; [Scholze & Boch, J. Curr Opin Microbiol (2011)]; [Boch et al., Science 326, 1509-1512 (2009)]; [Moscou & Bogdanove, Science 326, 1501 (2009)]; [Miller et al., Nat Biotechnol 29, 143-148 (2011)]; [Morbitzer et al., T. Proc Natl Acad Sci U S A 107, 21617-21622 (2010)]; [Morbitzer et al., Nucleic Acids Res 39, 5790-5799 (2011)]; [Zhang et al., Nat Biotechnol 29, 149-153 (2011)]; [Geissler et al., PLoS ONE 6, e19509 (2011)]; [Weber et al., PLoS ONE 6, e19722 (2011)]; [Christian et al., Genetics 186, 757-761 (2010)]; [Li et al., Nucleic Acids Res 39, 359-372 (2011)]; [Mahfouz et al., Proc Natl Acad Sci U S A 108, 2623-2628 (2011)]; [Mussolino et al., Nucleic Acids Res (2011)]; [Li et al., Nucleic Acids Res 39, 6315-6325 (2011)]; [Cermak et al., Nucleic Acids Res 39, e82 (2011)]; [Wood et al., Science 333, 307 (2011)]; [Hockemeye et al. Nat Biotechnol 29, 731-734 (2011)]; [Tesson et al., Nat Biotechnol 29, 695-696 (2011)]; [Sander et al., Nat Biotechnol 29, 697-698 (2011)]; [Huang et al., Nat Biotechnol 29, 699-700 (2011)]; 및 [Zhang et al., Nat Biotechnol 29, 149-153 (2011)]에 기술되어 있는 방법을 참조한다.
ZFN
아연-핑거 뉴클레아제 (ZFN)는 비특이적 DNA 절단 도메인, 예컨대 FokI 절단 도메인에 연결된 프로그램화가능한 서열-특이적 아연 핑거 DNA-결합 모듈 (상기 참조)로 구성된다. ZFN을 제조하고 사용하는 방법에 대해서는 관련 기술분야에 알려져 있는데, 예를 들면 문헌 [Maeder et al., 2008, Mol. Cell, 31:294-301]; [Joung et al., 2010, Nat. Methods, 7:91-92]; [Isalan et al., 2001, Nat. Biotechnol., 19:656-660]; [Sander et al., Nat Methods. 8(1):67-9, 2011]; [Bhakta et al., Genome Res. 23(3):530-8, 2013]을 참조한다. 일부 실시양태에서, ZFN은 WO 2011/017293호 또는 WO 2004/099366호에 기술되어 있는 것이거나, 또는 거기에 기술되어 있는 바와 같이 생성된다. 추가적인 적합한 ZFN에 대해서는 U.S. 특허 제6,511,808호, 6,013,453호, 6,007,988호 및 6,503,717호, 그리고 U.S. 특허 출원 2002/0160940호에 기술되어 있다.
메가뉴클레아제
상기에서 주지된 바와 같이, 메가뉴클레아제는 박테리아, 효모, 조류 및 식물 소기관과 같은 다양한 생물체에서 기원하는 서열-특이적 엔도뉴클레아제이다. 수많은 메가뉴클레아제가 관련 기술분야에 알려져 있는데, 예를 들면 WO 2012010976호 (TERT 유전자의 DNA 표적 서열을 절단하는 메가뉴클레아제 변이체); US 8,021,867호; 8,119,361호 및 8,119,381호 (I-CreI 메가뉴클레아제); 7,897,372호 (변형된 특이성을 갖는 I-CreI 메가뉴클레아제 변이체)를 참조한다.
CRISPR/Cas 시스템
클러스터화된 규칙적으로 이격된 짧은 회문식 반복부 (CRISPR)/CRISPR-연관 (Cas) 시스템 (문헌 [Wiedenheft et al., Nature 482, 331-338 (2012)]; [Horvath et al., Science 327, 167-170 (2010)]; [Terns et al., Curr Opin Microbiol 14, 321-327 (2011)])은 박테리아, 효모 및 인간 세포는 물론, 과실 파리, 제브라다니오 및 마우스와 같은 전체 생물체의 생체 내에서 게놈 편집을 수행하기 위한 기반으로 사용될 수 있다 (문헌 [Wang et al., Cell 153, 910-918 (2013)]; [Shen et al., Cell Res (2013)]; [Dicarlo et al., Nucleic Acids Res (2013)]; [Jiang et al., Nat Biotechnol 31, 233-239 (2013)]; [Jinek et al., Elife 2, e00471 (2013)]; [Hwang et al., Nat Biotechnol 31, 227-229 (2013)]; [Cong et al., Science 339, 819-823 (2013)]; [Mali et al., Science 339, 823-826 (2013c)]; [Cho et al., Nat Biotechnol 31, 230-232 (2013)]; [Gratz et al., Genetics 194(4):1029-35 (2013)]). Cas 뉴클레아제, 예컨대 에스. 피오게네스 유래의 Cas9 뉴클레아제 (이하 간단하게 Cas9)는 조작된 가이드 RNA (gRNA)의 처음 17-20 뉴클레오티드와 프로토스페이서 인접 모티프 (PAM), 예컨대 서열 NGG 또는 NAG에 맞는 PAM의 다음에 오는 해당 표적 게놈 DNA 서열의 상보성 가닥 사이의 염기 쌍 상보성을 통하여 가이드될 수 있다 (문헌 [Shen et al., Cell Res (2013)]; [Dicarlo et al., Nucleic Acids Res (2013)]; [Jiang et al., Nat Biotechnol 31, 233-239 (2013)]; [Jinek et al., Elife 2, e00471 (2013)]; [Hwang et al., Nat Biotechnol 31, 227-229 (2013)]; [Cong et al., Science 339, 819-823 (2013)]; [Mali et al., Science 339, 823-826 (2013c)]; [Cho et al., Nat Biotechnol 31, 230-232 (2013)]; [Jinek et al., Science 337, 816-821 (2012)]). 문헌 [Tsai et al., Nat Biotechnol. 2014 Jun;32(6):569-76]; [Hwang et al., Nat Biotechnol. 2013 Mar;31(3):227-9], US 8,697,359호; USSN 14/213,723호; 및 PCT/US2014/029068호도 참조한다.
화학적 뉴클레아제
화학적 뉴클레아제, 예컨대 삼중체-형성 올리고뉴클레오티드 또는 펩티드 핵산 역시 본 발명의 조성물 및 방법에 활용될 수 있는 바; 상기를 참조한다.
FokI
FokI는 DNA 인식 도메인 및 촉매 (엔도뉴클레아제) 도메인을 포함하는 유형 II 제한 엔도뉴클레아제이다. 본원에서 기술되는 융합 단백질은 전체 FokI, 또는 촉매 엔도뉴클레아제 도메인, 예를 들면 WO95/09233호, 문헌 [Li et al., Nucleic Acids Res. 39(1):359-372 (2011)]; [Cathomen 및 Joung, Mol. Ther. 16:1200-1207 (2008)]에 기술되어 있는 바와 같은 진뱅크(GenBank) 등재 번호 AAA24927.1의 아미노산 388-583 또는 408-583만을 포함하거나, 또는 문헌 [Miller et al. Nat Biotechnol 25:778-785 (2007)]; [Szczepek et al., Nat Biotechnol 25:786-793 (2007)]; 또는 [Bitinaite et al., Proc. Natl. Acad. Sci. USA. 95:10570-10575 (1998)]에 기술되어 있는 바와 같은 돌연변이된 형태의 FokI를 포함할 수 있다. 문헌 [Tsai et al., Nat Biotechnol. 2014 Jun;32(6):569-76]도 참조한다.
FokI의 예시적인 아미노산 서열은 하기와 같다:
FokI를 코딩하는 예시적인 핵산 서열은 하기와 같다:
일부 실시양태에서, 본원에서 사용되는 FokI 뉴클레아제는 서열식별번호: 8, 예컨대 서열식별번호: 8의 아미노산 388-583 또는 408-583과 적어도 약 50 % 동일하다. 이러한 변이 뉴클레아제는 DNA를 절단하는 능력을 보유해야 한다. 일부 실시양태에서, 뉴클레오티드 서열은 서열식별번호: 8의 아미노산 388-583 또는 408-583과 약 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, 95 %, 99 % 또는 100 % 동일하다. 일부 실시양태에서, 서열식별번호: 8 아미노산 388-583 또는 408-583과의 소정의 차이는 비-보존 영역에 존재한다.
2종 서열의 % 동일성을 측정하기 위하여, 서열은 최적 비교 의도에 맞게 정렬된다 (최적의 정렬을 위하여 필요에 따라 제1 및 제2 아미노산 또는 핵산서열 중 하나 또는 모두에 갭이 도입되며, 비교 의도에 맞게 비-상동 서열은 폐기될 수 있음). 비교 목적으로 정렬되는 참조 서열의 길이는 적어도 50 %이다 (일부 실시양태에서는, 참조 서열 길이의 약 50 %, 55 %, 60 %, 65 %, 70 %, 75 %, 85 %, 90 %, 95 % 또는 100 %가 정렬됨). 이후, 상응하는 위치에서의 뉴클레오티드 또는 잔기가 비교된다. 제1 서열에서의 위치가 제2 서열에서의 상응하는 위치와 동일한 뉴클레오티드 또는 잔기에 의해 점유되는 경우라면, 분자는 그 위치에서 동일한 것이다. 2종 서열 사이의 % 동일성은 2종 서열의 최적 정렬을 위해 도입되어야 하는 갭의 수 및 각 갭의 길이를 고려한, 서열에 의해 공유되는 동일한 위치의 수의 함수이다.
2종 서열 사이의 서열 비교 및 % 동일성 측정은 수학적 알고리즘을 사용하여 수행될 수 있다. 본 출원의 목적상, 2종 아미노산 서열 사이의 % 동일성은 GCG 소프트웨어 패키지에 GAP 프로그램으로 통합되어 있으며 12의 갭 패널티, 4의 갭 연장 패널티 및 5의 프레임시프트 갭 패널티를 갖는 블로섬(Blossum) 62 점수화 행렬을 사용하는 니들맨(Needleman) 및 운쉬(Wunsch) (문헌 [(1970) J. Mol. Biol. 48:444-453]) 알고리즘을 사용하여 측정된다.
발현 시스템
본원에서 기술되는 융합 단백질을 사용하기 위해서는, 일반적으로 세포에서 그것을 코딩하는 핵산으로부터 그것을 발현시키는 것이 바람직하게 된다. 이는 다양한 방식으로 수행될 수 있다. 예를 들면, 융합 단백질을 코딩하는 핵산이 복제 및/또는 발현을 위한 원핵 또는 진핵 세포로의 형질전환을 위하여 벡터로 클로닝될 수 있다. 적합한 벡터에는 원핵 벡터, 예컨대 융합 단백질을 코딩하는 핵산의 저장 또는 조작을 위한 플라스미드 또는 셔틀 벡터 또는 곤충 벡터가 포함된다. 융합 단백질을 코딩하는 핵산은 식물 세포, 동물 세포, 바람직하게는 포유동물 세포 또는 인간 세포, 진균 세포, 박테리아 세포 또는 원생동물 세포에서의 발현용인 발현 벡터로 클로닝될 수도 있다.
발현을 실현하기 위하여, 통상적으로 융합 단백질을 코딩하는 서열은 전사를 인도하는 프로모터를 포함하는 발현 벡터로 서브클로닝된다. 적합한 박테리아 및 진핵 프로모터에 대해서는 관련 기술분야에 잘 알려져 있는데, 예를 들면 문헌 [Sambrook et al., Molecular Cloning, A Laboratory Manual (3d ed. 2001)]; [Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990)]; 및 [Current Protocols in Molecular Biology (Ausubel et al., eds., 2010)]에 기술되어 있다. 조작된 단백질을 발현시키기 위한 박테리아 발현 시스템은 예를 들면 이. 콜라이(E. coli), 바실루스(Bacillus) 종 및 살모넬라(Salmonella)에서 가용하다 (문헌 [Palva et al., 1983, Gene 22:229-235]). 그와 같은 발현 시스템용의 키트가 시중에서 구입가능하다. 포유동물 세포, 효모 및 곤충 세포를 위한 진핵 발현 시스템에 대해서는 관련 기술분야에 잘 알려져 있으며, 역시 시중에서 구입가능하다.
핵산의 직접적인 발현에 사용되는 프로모터는 구체적인 적용분야에 따라 달라진다. 예를 들어, 융합 단백질의 발현 및 정제에는 통상적으로 강한 상시성 프로모터가 사용된다. 반면, 융합 단백질이 생체 내에서 유전자 조절을 위하여 발현되어야 하는 경우, 가이드 RNA의 구체적인 용도에 따라 상시성 또는 유도성 프로모터 중 어느 하나가 사용될 수 있다. 또한, 융합 단백질의 발현을 위한 바람직한 프로모터는 약한 프로모터, 예컨대 HSV TK 또는 유사한 활성을 갖는 프로모터일 수 있다. 프로모터는 전사활성화에 반응성인 요소, 예컨대 저산소증 반응 요소, Gal4 반응 요소, lac 억제인자 반응 요소, 및 소형 분자 조절 시스템 예컨대 테트라사이클린에 의해 조절되는 시스템 및 RU-486 시스템을 포함할 수도 있다 (예컨대 문헌 [Gossen & Bujard, 1992, Proc. Natl. Acad. Sci. USA, 89:5547]; [Oligino et al., 1998, Gene Ther., 5:491-496]; [Wang et al., 1997, Gene Ther., 4:432-441]; [Neering et al., 1996, Blood, 88:1147-55]; 및 [Rendahl et al., 1998, Nat. Biotechnol., 16:757-761] 참조).
프로모터 이외에, 발현 벡터는 통상적으로 원핵 또는 진핵 중 어느 하나인 숙주 세포에서의 핵산의 발현에 필요한 모든 추가적인 요소를 포함하는 전사 유닛 또는 발현 카세트를 포함한다. 이에 따라, 통상적인 발현 카세트는 예컨대 융합 단백질을 코딩하는 핵산 서열에 작용가능하게 연결된 프로모터, 그리고 예컨대 전사체의 효율적인 폴리아데닐화, 전사 종료, 리보솜 결합 부위 또는 번역 종료에 필요한 임의의 신호를 포함한다. 카세트의 추가적인 요소에는 예컨대 인핸서 및 이종유래의 스플라이싱된 인트론계 신호가 포함될 수 있다.
유전자 정보를 세포로 수송하는 데에 사용되는 구체적인 발현 벡터는 융합 단백질의 예정 용도, 예컨대 식물, 동물, 박테리아, 진균, 원생동물 등에서의 발현과 관련하여 선택된다. 표준 박테리아 발현 벡터에는 플라스미드 예컨대 pBR322 기반 플라스미드, pSKF, pET23D, 및 상업적으로 입수가능한 태그-융합 발현 시스템 예컨대 GST 및 LacZ가 포함된다.
진핵 발현 벡터에서는 종종 진핵 바이러스 유래의 조절 요소를 포함하는 발현 벡터가 사용되는데, 예를 들면 SV40 벡터, 파필로마 바이러스 벡터, 및 엡스타인-바르 바이러스 유래의 벡터이다. 다른 예시적인 진핵 벡터에는 pMSG, pAV009/A+, pMTO10/A+, pMAMneo-5, 바큘로바이러스 pDSVE, 그리고 SV40 초기 프로모터, SV40 후기 프로모터, 메탈로티오네인 프로모터, 뮤린 유방 종양 바이러스 프로모터, 라우스 육종 바이러스 프로모터, 폴리헤드린 프로모터, 또는 진핵 세포에서의 발현에 효과적인 것으로 나타나 있는 기타 프로모터의 인도하에서의 단백질 발현을 가능하게 하는 임의의 다른 벡터가 포함된다.
융합 단백질을 발현시키기 위한 벡터에는 가이드 RNA의 발현을 추진하는 RNA Pol III 프로모터, 예컨대 H1, U6 또는 7SK 프로모터가 포함될 수 있다. 이러한 인간 프로모터는 플라스미드 형질감염 후 포유동물 세포에서의 gRNA의 발현을 가능하게 한다. 대안적으로, T7 프로모터가 예를 들면 시험관내 전사를 위하여 사용될 수 있으며, RNA가 시험관 내에서 전사되어 정제될 수 있다.
일부 발현 시스템은 티미딘 키나제, 하이그로마이신 B 포스포트랜스퍼라제 및 디히드로폴레이트 리덕타제와 같은 안정하게 형질감염된 세포주의 선택을 위한 마커를 포함한다. 폴리헤드린 프로모터 또는 다른 강한 바큘로바이러스 프로모터 인도하의 융합 단백질 코딩 서열을 갖는 바큘로바이러스 벡터를 곤충 세포에서 사용하는 것과 같은 고수율 발현 시스템 역시 적합하다.
발현 벡터에 통상적으로 포함되는 요소에는 이. 콜라이에서 기능하는 레플리콘, 재조합 플라스미드를 보유하는 박테리아의 선택을 가능하게 하는 항생제 내성을 코딩하는 유전자, 및 재조합 서열의 삽입을 가능하게 하는 비필수 플라스미드 영역의 고유 제한 부위가 포함될 수 있다.
나중에 표준 기술을 사용하여 정제되는 다량의 단백질을 발현하는 박테리아, 포유동물, 효모 또는 곤충 세포주를 생성시키는 데에는, 표준 형질감염 방법이 사용된다 (예컨대 문헌 [Colley et al., 1989, J. Biol. Chem., 264:17619-22]; [Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed., 1990)] 참조). 진핵 및 원핵 세포의 형질전환은 표준 기술에 따라 수행된다 (예컨대 문헌 [Morrison, 1977, J. Bacteriol. 132:349-351]; [Clark-Curtiss & Curtiss, Methods in Enzymology 101:347-362 (Wu et al., eds, 1983)] 참조).
숙주 세포로 외래 뉴클레오티드 서열을 도입하기 위한 어떠한 공지의 절차도 사용될 수 있다. 여기에는 칼슘 포스페이트 형질감염, 폴리브렌, 원형질체 융합, 전기천공, 뉴클레오펙션(nucleofection), 리포좀, 미세주사, 노출 DNA, 플라스미드 벡터, 바이러스 벡터, 에피솜과 인테그레이티브(integrative) 양자, 그리고 숙주 세포에 클로닝된 게놈 DNA, cDNA, 합성 DNA 또는 다른 외래 유전자 물질을 도입하기 위한 다른 잘 알려져 있는 방법 중 어느 것의 사용이 포함된다 (예컨대 상기 문헌 [Sambrook et al.] 참조). 사용되는 구체적인 유전자 조작 절차가 융합 단백질을 발현할 수 있는 숙주 세포로 적어도 하나의 유전자를 성공적으로 도입할 수 있는 것만이 필수적이다.
본 발명에는 벡터 및 벡터를 포함하는 세포는 물론, 본원에서 기술되는 융합 단백질을 발현하는 세포도 포함된다.
세포에서 단백질을 발현시키는 것에 대한 대안으로, 단백질은 예컨대 재조합에 의해 발현된 다음, 세포에 첨가될 수 있다 (예컨대 세포를 단백질과 접촉시키는 것을 포함하는 방법). 수많은 방법이 재조합 단백질의 생성 및 정제용으로 관련 기술분야에 알려져 있다.
기타 실시양태
해당 상세한 설명과 연계하여 본 발명을 기술하기는 하였지만, 전기의 상세한 설명은 예시를 위한 것으로써, 첨부된 청구범위의 영역에 의해 정의되는 본 발명의 영역을 제한하고자 하는 것은 아니라는 것이 이해되어야 한다. 기타 측면, 장점 및 변형은 하기하는 청구범위의 영역에 속한다.
SEQUENCE LISTING
<110> The General Hospital Corporation
<120> METHODS FOR INCREASING EFFICIENCY OF
NUCLEASE-INDUCED HOMOLOGY-DIRECTED REPAIR
<130> 00786-0901WO1
<150> US 62/058,456
<151> 2014-10-01
<160> 9
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 708
<212> DNA
<213> Galaxea fascicularis
<400> 1
atggtgagcg tgatcaagcc cgagatgaag atcaagctgt gcatgagggg caccgtgaac 60
ggccacaact tcgtgatcga gggcgagggc aagggcaacc cctacgaggg cacccagatc 120
ctggacctga acgtgaccga gggcgccccc ctgcccttcg cctacgacat cctgaccacc 180
gtgttccagt acggcaacag ggccttcacc aagtaccccg ccgacatcca ggactacttc 240
aagcagacct tccccgaggg ctaccactgg gagaggagca tgacctacga ggaccagggc 300
atctgcaccg ccaccagcaa catcagcatg aggggcgact gcttcttcta cgacatcagg 360
ttcgacggca ccaacttccc ccccaacggc cccgtgatgc agaagaagac cctgaagtgg 420
gagcccagca ccgagaagat gtacgtggag gacggcgtgc tgaagggcga cgtgaacatg 480
aggctgctgc tggagggcgg cggccactac aggtgcgact tcaagaccac ctacaaggcc 540
aagaaggagg tgaggctgcc cgacgcccac aagatcgacc acaggatcga gatcctgaag 600
cacgacaagg actacaacaa ggtgaagctg tacgagaacg ccgtggccag gtactccatg 660
ctgcccagcc aggccaaggg atatccatca cactggcggc cgctcgag 708
<210> 2
<211> 236
<212> PRT
<213> Galaxea fascicularis
<400> 2
Met Val Ser Val Ile Lys Pro Glu Met Lys Ile Lys Leu Cys Met Arg
1 5 10 15
Gly Thr Val Asn Gly His Asn Phe Val Ile Glu Gly Glu Gly Lys Gly
20 25 30
Asn Pro Tyr Glu Gly Thr Gln Ile Leu Asp Leu Asn Val Thr Glu Gly
35 40 45
Ala Pro Leu Pro Phe Ala Tyr Asp Ile Leu Thr Thr Val Phe Gln Tyr
50 55 60
Gly Asn Arg Ala Phe Thr Lys Tyr Pro Ala Asp Ile Gln Asp Tyr Phe
65 70 75 80
Lys Gln Thr Phe Pro Glu Gly Tyr His Trp Glu Arg Ser Met Thr Tyr
85 90 95
Glu Asp Gln Gly Ile Cys Thr Ala Thr Ser Asn Ile Ser Met Arg Gly
100 105 110
Asp Cys Phe Phe Tyr Asp Ile Arg Phe Asp Gly Thr Asn Phe Pro Pro
115 120 125
Asn Gly Pro Val Met Gln Lys Lys Thr Leu Lys Trp Glu Pro Ser Thr
130 135 140
Glu Lys Met Tyr Val Glu Asp Gly Val Leu Lys Gly Asp Val Asn Met
145 150 155 160
Arg Leu Leu Leu Glu Gly Gly Gly His Tyr Arg Cys Asp Phe Lys Thr
165 170 175
Thr Tyr Lys Ala Lys Lys Glu Val Arg Leu Pro Asp Ala His Lys Ile
180 185 190
Asp His Arg Ile Glu Ile Leu Lys His Asp Lys Asp Tyr Asn Lys Val
195 200 205
Lys Leu Tyr Glu Asn Ala Val Ala Arg Tyr Ser Met Leu Pro Ser Gln
210 215 220
Ala Lys Gly Tyr Pro Ser His Trp Arg Pro Leu Glu
225 230 235
<210> 3
<211> 330
<212> DNA
<213> Homo sapiens
<400> 3
atgaatccca gtatgaagca gaaacaagaa gaaatcaaag agaatataaa gaatagttct 60
gtcccaagaa gaactctgaa gatgattcag ccttctgcat ctggatctct tgttggaaga 120
gaaaatgagc tgtccgcagg cttgtccaaa aggaaacatc ggaatgacca cttaacatct 180
acaacttcca gccctggggt tattgtccca gaatctagtg aaaataaaaa tcttggagga 240
gtcacccagg agtcatttga tcttatgatt aaagaaaatc catcctctca gtattggaag 300
gaagtggcag aaaaacggag aaaggcgctg 330
<210> 4
<211> 110
<212> PRT
<213> Homo sapiens
<400> 4
Met Asn Pro Ser Met Lys Gln Lys Gln Glu Glu Ile Lys Glu Asn Ile
1 5 10 15
Lys Asn Ser Ser Val Pro Arg Arg Thr Leu Lys Met Ile Gln Pro Ser
20 25 30
Ala Ser Gly Ser Leu Val Gly Arg Glu Asn Glu Leu Ser Ala Gly Leu
35 40 45
Ser Lys Arg Lys His Arg Asn Asp His Leu Thr Ser Thr Thr Ser Ser
50 55 60
Pro Gly Val Ile Val Pro Glu Ser Ser Glu Asn Lys Asn Leu Gly Gly
65 70 75 80
Val Thr Gln Glu Ser Phe Asp Leu Met Ile Lys Glu Asn Pro Ser Ser
85 90 95
Gln Tyr Trp Lys Glu Val Ala Glu Lys Arg Arg Lys Ala Leu
100 105 110
<210> 5
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> VP64 peptide
<400> 5
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu
50
<210> 6
<211> 396
<212> PRT
<213> Homo sapiens
<400> 6
Met Ala Phe Ala Pro Met Gly Pro Glu Ala Ser Phe Phe Asp Val Leu
1 5 10 15
Asp Arg His Arg Glu Ser Leu Leu Ala Ala Leu Arg Arg Gly Gly Arg
20 25 30
Glu Pro Pro Thr Gly Gly Ser Arg Leu Ala Ser Ser Ser Glu Val Leu
35 40 45
Ala Ser Ile Glu Asn Ile Ile Gln Asp Ile Ile Thr Ser Leu Ala Arg
50 55 60
Asn Glu Ala Pro Ala Phe Thr Ile Asp Asn Arg Ser Ser Trp Glu Asn
65 70 75 80
Ile Lys Phe Glu Asp Ser Val Gly Leu Gln Met Val Ser His Cys Thr
85 90 95
Thr Arg Lys Ile Lys Ser Asp Ser Pro Lys Ser Ala Gln Lys Phe Ser
100 105 110
Leu Ile Leu Lys Ile Leu Ser Met Ile Tyr Lys Leu Val Gln Ser Asn
115 120 125
Thr Tyr Ala Thr Lys Arg Asp Ile Tyr Tyr Thr Asp Ser Gln Leu Phe
130 135 140
Gly Asn Gln Thr Val Val Asp Asn Ile Ile Asn Asp Ile Ser Cys Met
145 150 155 160
Leu Lys Val Ser Arg Arg Ser Leu His Ile Leu Ser Thr Ser Lys Gly
165 170 175
Leu Ile Ala Gly Asn Leu Arg Tyr Ile Glu Glu Asp Gly Thr Lys Val
180 185 190
Asn Cys Thr Cys Gly Ala Thr Ala Val Ala Val Pro Ser Asn Ile Gln
195 200 205
Gly Ile Arg Asn Leu Val Thr Asp Ala Lys Phe Val Leu Ile Val Glu
210 215 220
Lys Asp Ala Thr Phe Gln Arg Leu Leu Asp Asp Asn Phe Cys Asn Lys
225 230 235 240
Leu Ser Pro Cys Ile Met Ile Thr Gly Lys Gly Val Pro Asp Leu Asn
245 250 255
Thr Arg Leu Leu Val Lys Lys Leu Trp Asp Thr Phe His Val Pro Val
260 265 270
Phe Thr Leu Val Asp Ala Asp Pro His Gly Ile Glu Ile Met Cys Ile
275 280 285
Tyr Lys Tyr Gly Ser Met Ser Met Ser Phe Glu Ala His His Leu Thr
290 295 300
Val Pro Ala Ile Arg Trp Leu Gly Leu Leu Pro Ser Asp Leu Lys Arg
305 310 315 320
Leu Asn Val Pro Lys Asp Ser Leu Ile Pro Leu Thr Lys Arg Asp Gln
325 330 335
Met Lys Leu Asp Ser Ile Leu Arg Arg Pro Tyr Val Thr Cys Gln Pro
340 345 350
Phe Trp Arg Lys Glu Met Glu Ile Met Ala Asp Ser Lys Met Lys Ala
355 360 365
Glu Ile Gln Ala Leu Thr Phe Leu Ser Ser Asp Tyr Leu Ser Arg Val
370 375 380
Tyr Leu Pro Asn Lys Leu Lys Phe Gly Gly Trp Ile
385 390 395
<210> 7
<211> 358
<212> PRT
<213> Homo sapiens
<400> 7
Met Ala Phe Ala Pro Met Gly Pro Glu Ala Ser Phe Phe Asp Val Leu
1 5 10 15
Asp Arg His Arg Glu Ser Leu Leu Ala Ala Leu Arg Arg Gly Gly Arg
20 25 30
Glu Pro Pro Thr Gly Gly Ser Arg Leu Ala Ser Arg Phe Glu Asp Ser
35 40 45
Val Gly Leu Gln Met Val Ser His Cys Thr Thr Arg Lys Ile Lys Ser
50 55 60
Asp Ser Pro Lys Ser Ala Gln Lys Phe Ser Leu Ile Leu Lys Ile Leu
65 70 75 80
Ser Met Ile Tyr Lys Leu Val Gln Ser Asn Thr Tyr Ala Thr Lys Arg
85 90 95
Asp Ile Tyr Tyr Thr Asp Ser Gln Leu Phe Gly Asn Gln Thr Val Val
100 105 110
Asp Asn Ile Ile Asn Asp Ile Ser Cys Met Leu Lys Val Ser Arg Arg
115 120 125
Ser Leu His Ile Leu Ser Thr Ser Lys Gly Leu Ile Ala Gly Asn Leu
130 135 140
Arg Tyr Ile Glu Glu Asp Gly Thr Lys Val Asn Cys Thr Cys Gly Ala
145 150 155 160
Thr Ala Val Ala Val Pro Ser Asn Ile Gln Gly Ile Arg Asn Leu Val
165 170 175
Thr Asp Ala Lys Phe Val Leu Ile Val Glu Lys Asp Ala Thr Phe Gln
180 185 190
Arg Leu Leu Asp Asp Asn Phe Cys Asn Lys Leu Ser Pro Cys Ile Met
195 200 205
Ile Thr Gly Lys Gly Val Pro Asp Leu Asn Thr Arg Leu Leu Val Lys
210 215 220
Lys Leu Trp Asp Thr Phe His Val Pro Val Phe Thr Leu Val Asp Ala
225 230 235 240
Asp Pro His Gly Ile Glu Ile Met Cys Ile Tyr Lys Tyr Gly Ser Met
245 250 255
Ser Met Ser Phe Glu Ala His His Leu Thr Val Pro Ala Ile Arg Trp
260 265 270
Leu Gly Leu Leu Pro Ser Asp Leu Lys Arg Leu Asn Val Pro Lys Asp
275 280 285
Ser Leu Ile Pro Leu Thr Lys Arg Asp Gln Met Lys Leu Asp Ser Ile
290 295 300
Leu Arg Arg Pro Tyr Val Thr Cys Gln Pro Phe Trp Arg Lys Glu Met
305 310 315 320
Glu Ile Met Ala Asp Ser Lys Met Lys Ala Glu Ile Gln Ala Leu Thr
325 330 335
Phe Leu Ser Ser Asp Tyr Leu Ser Arg Val Tyr Leu Pro Asn Lys Leu
340 345 350
Lys Phe Gly Gly Trp Ile
355
<210> 8
<211> 583
<212> PRT
<213> Flavobacterium okeanokoites
<400> 8
Met Phe Leu Ser Met Val Ser Lys Ile Arg Thr Phe Gly Trp Val Gln
1 5 10 15
Asn Pro Gly Lys Phe Glu Asn Leu Lys Arg Val Val Gln Val Phe Asp
20 25 30
Arg Asn Ser Lys Val His Asn Glu Val Lys Asn Ile Lys Ile Pro Thr
35 40 45
Leu Val Lys Glu Ser Lys Ile Gln Lys Glu Leu Val Ala Ile Met Asn
50 55 60
Gln His Asp Leu Ile Tyr Thr Tyr Lys Glu Leu Val Gly Thr Gly Thr
65 70 75 80
Ser Ile Arg Ser Glu Ala Pro Cys Asp Ala Ile Ile Gln Ala Thr Ile
85 90 95
Ala Asp Gln Gly Asn Lys Lys Gly Tyr Ile Asp Asn Trp Ser Ser Asp
100 105 110
Gly Phe Leu Arg Trp Ala His Ala Leu Gly Phe Ile Glu Tyr Ile Asn
115 120 125
Lys Ser Asp Ser Phe Val Ile Thr Asp Val Gly Leu Ala Tyr Ser Lys
130 135 140
Ser Ala Asp Gly Ser Ala Ile Glu Lys Glu Ile Leu Ile Glu Ala Ile
145 150 155 160
Ser Ser Tyr Pro Pro Ala Ile Arg Ile Leu Thr Leu Leu Glu Asp Gly
165 170 175
Gln His Leu Thr Lys Phe Asp Leu Gly Lys Asn Leu Gly Phe Ser Gly
180 185 190
Glu Ser Gly Phe Thr Ser Leu Pro Glu Gly Ile Leu Leu Asp Thr Leu
195 200 205
Ala Asn Ala Met Pro Lys Asp Lys Gly Glu Ile Arg Asn Asn Trp Glu
210 215 220
Gly Ser Ser Asp Lys Tyr Ala Arg Met Ile Gly Gly Trp Leu Asp Lys
225 230 235 240
Leu Gly Leu Val Lys Gln Gly Lys Lys Glu Phe Ile Ile Pro Thr Leu
245 250 255
Gly Lys Pro Asp Asn Lys Glu Phe Ile Ser His Ala Phe Lys Ile Thr
260 265 270
Gly Glu Gly Leu Lys Val Leu Arg Arg Ala Lys Gly Ser Thr Lys Phe
275 280 285
Thr Arg Val Pro Lys Arg Val Tyr Trp Glu Met Leu Ala Thr Asn Leu
290 295 300
Thr Asp Lys Glu Tyr Val Arg Thr Arg Arg Ala Leu Ile Leu Glu Ile
305 310 315 320
Leu Ile Lys Ala Gly Ser Leu Lys Ile Glu Gln Ile Gln Asp Asn Leu
325 330 335
Lys Lys Leu Gly Phe Asp Glu Val Ile Glu Thr Ile Glu Asn Asp Ile
340 345 350
Lys Gly Leu Ile Asn Thr Gly Ile Phe Ile Glu Ile Lys Gly Arg Phe
355 360 365
Tyr Gln Leu Lys Asp His Ile Leu Gln Phe Val Ile Pro Asn Arg Gly
370 375 380
Val Thr Lys Gln Leu Val Lys Ser Glu Leu Glu Glu Lys Lys Ser Glu
385 390 395 400
Leu Arg His Lys Leu Lys Tyr Val Pro His Glu Tyr Ile Glu Leu Ile
405 410 415
Glu Ile Ala Arg Asn Ser Thr Gln Asp Arg Ile Leu Glu Met Lys Val
420 425 430
Met Glu Phe Phe Met Lys Val Tyr Gly Tyr Arg Gly Lys His Leu Gly
435 440 445
Gly Ser Arg Lys Pro Asp Gly Ala Ile Tyr Thr Val Gly Ser Pro Ile
450 455 460
Asp Tyr Gly Val Ile Val Asp Thr Lys Ala Tyr Ser Gly Gly Tyr Asn
465 470 475 480
Leu Pro Ile Gly Gln Ala Asp Glu Met Gln Arg Tyr Val Glu Glu Asn
485 490 495
Gln Thr Arg Asn Lys His Ile Asn Pro Asn Glu Trp Trp Lys Val Tyr
500 505 510
Pro Ser Ser Val Thr Glu Phe Lys Phe Leu Phe Val Ser Gly His Phe
515 520 525
Lys Gly Asn Tyr Lys Ala Gln Leu Thr Arg Leu Asn His Ile Thr Asn
530 535 540
Cys Asn Gly Ala Val Leu Ser Val Glu Glu Leu Leu Ile Gly Gly Glu
545 550 555 560
Met Ile Lys Ala Gly Thr Leu Thr Leu Glu Glu Val Arg Arg Lys Phe
565 570 575
Asn Asn Gly Glu Ile Asn Phe
580
<210> 9
<211> 1752
<212> DNA
<213> Flavobacterium okeanokoites
<400> 9
atgtttttga gtatggtttc taaaataaga actttcggtt gggttcaaaa tccaggtaaa 60
tttgagaatt taaaacgagt agttcaagta tttgatagaa attctaaagt acataatgaa 120
gtgaaaaata taaagatacc aaccctagtc aaagaaagta agatccaaaa agaactagtt 180
gctattatga atcaacatga tttgatttat acatataaag agttagtagg aacaggaact 240
tcaatacgtt cagaagcacc atgcgatgca attattcaag caacaatagc agatcaagga 300
aataaaaaag gctatatcga taattggtca tctgacggtt ttttgcgttg ggcacatgct 360
ttaggattta ttgaatatat aaataaaagt gattcttttg taataactga tgttggactt 420
gcttactcta aatcagctga cggcagcgcc attgaaaaag agattttgat tgaagcgata 480
tcatcttatc ctccagcgat tcgtatttta actttgctag aagatggaca acatttgaca 540
aagtttgatc ttggcaagaa tttaggtttt agtggagaaa gtggatttac ttctctaccg 600
gaaggaattc ttttagatac tctagctaat gctatgccta aagataaagg cgaaattcgt 660
aataattggg aaggatcttc agataagtac gcaagaatga taggtggttg gctggataaa 720
ctaggattag taaagcaagg aaaaaaagaa tttatcattc ctactttggg taagccggac 780
aataaagagt ttatatccca cgcttttaaa attactggag aaggtttgaa agtactgcgt 840
cgagcaaaag gctctacaaa atttacacgt gtacctaaaa gagtatattg ggaaatgctt 900
gctacaaacc taaccgataa agagtatgta agaacaagaa gagctttgat tttagaaata 960
ttaatcaaag ctggatcatt aaaaatagaa caaatacaag acaacttgaa gaaattagga 1020
tttgatgaag ttatagaaac tattgaaaat gatatcaaag gcttaattaa cacaggtata 1080
tttatagaaa tcaaagggcg attttatcaa ttgaaagacc atattcttca atttgtaata 1140
cctaatcgtg gtgtgactaa gcaactagtc aaaagtgaac tggaggagaa gaaatctgaa 1200
cttcgtcata aattgaaata tgtgcctcat gaatatattg aattaattga aattgccaga 1260
aattccactc aggatagaat tcttgaaatg aaggtaatgg aattttttat gaaagtttat 1320
ggatatagag gtaaacattt gggtggatca aggaaaccgg acggagcaat ttatactgtc 1380
ggatctccta ttgattacgg tgtgatcgtg gatactaaag cttatagcgg aggttataat 1440
ctgccaattg gccaagcaga tgaaatgcaa cgatatgtcg aagaaaatca aacacgaaac 1500
aaacatatca accctaatga atggtggaaa gtctatccat cttctgtaac ggaatttaag 1560
tttttatttg tgagtggtca ctttaaagga aactacaaag ctcagcttac acgattaaat 1620
catatcacta attgtaatgg agctgttctt agtgtagaag agcttttaat tggtggagaa 1680
atgattaaag ccggcacatt aaccttagag gaagtgagac ggaaatttaa taacggcgag 1740
ataaactttt aa 1752
Claims (7)
- 세포 주기의 특정 단계에서만 이중 가닥 절단 (DSB)을 유도하는 뉴클레아제를 포함하는 조성물이며, 상기 뉴클레아제는 조작된 뉴클레아제에 연결된 세포-주기에 의해 조절되는 단백질 도메인을 포함하는 융합 단백질을 포함하는 것인, 조성물.
- 제1항에 있어서, 세포-주기에 의해 조절되는 단백질 도메인이 G2 또는 S-단계 특이적 단백질의 것인, 조성물.
- 제2항에 있어서, 세포-주기에 의해 조절되는 단백질 도메인이 CtIP, Cdk2, 사이클린 A1, 사이클린 A2, 사이클린 B1, 또는 제미니(Gemini)인, 조성물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 조작된 뉴클레아제가 ZFN, TALEN, CRISPR/Cas9 및 CRISPR RNA-가이드 FokI 뉴클레아제 (RFN)로 이루어진 군으로부터 선택된 것인, 조성물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 융합 단백질이 hGem-ZFN, ZFN-hGem, mAG-hGem-ZFN, ZFN-mAG-hGem, hGem-TALEN, TALEN-hGem, mAG-hGem-TALEN, TALEN-mAG-hGem; hGem-Cas9, Cas9-hGem, mAG-hGem-Cas9, Cas9-mAG-hGem, hGem-Csy4, hGem-mAG-Csy4, Csy4-hGem, 또는 Csy4-mAG-hGem, hGem-FokI-dCas9, hGem-mAG-FokI-dCas9, FokI-dCas9-hGem, FokI-dCas9-hGem-mAG, hGem-dCas9-FokI, hGem-mAG-dCas9-FokI, dCas9-FokI-hGem, 또는 dCas9-FokI-hGem-mAG로 이루어진 군으로부터 선택되는 것인 조성물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 융합 단백질이 하나 이상의 핵 국재화 신호 및 핵 외수송 신호, 또는 뉴클레아제 단백질의 세포질로의 트래픽킹을 조절하는 핵-세포질 셔틀 서열을 포함하는 것인 조성물.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 뉴클레아제가 촉매적으로 불활성인 Csy4 (dCsy4)에 융합되는 것인 조성물.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462058456P | 2014-10-01 | 2014-10-01 | |
US62/058,456 | 2014-10-01 | ||
PCT/US2015/053417 WO2016054326A1 (en) | 2014-10-01 | 2015-10-01 | Methods for increasing efficiency of nuclease-induced homology-directed repair |
KR1020177011319A KR102455807B1 (ko) | 2014-10-01 | 2015-10-01 | 뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177011319A Division KR102455807B1 (ko) | 2014-10-01 | 2015-10-01 | 뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220145917A true KR20220145917A (ko) | 2022-10-31 |
KR102630014B1 KR102630014B1 (ko) | 2024-01-25 |
Family
ID=55631484
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177011319A KR102455807B1 (ko) | 2014-10-01 | 2015-10-01 | 뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법 |
KR1020227035603A KR102630014B1 (ko) | 2014-10-01 | 2015-10-01 | 뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177011319A KR102455807B1 (ko) | 2014-10-01 | 2015-10-01 | 뉴클레아제-유도 상동성-지정 복구의 효율 증가 방법 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11021718B2 (ko) |
EP (2) | EP3845655A1 (ko) |
KR (2) | KR102455807B1 (ko) |
AU (2) | AU2015324935B2 (ko) |
CA (1) | CA2963080A1 (ko) |
IL (3) | IL287561B2 (ko) |
WO (1) | WO2016054326A1 (ko) |
Families Citing this family (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2853829C (en) | 2011-07-22 | 2023-09-26 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
JP6338221B2 (ja) * | 2012-10-24 | 2018-06-06 | タカラ バイオ ユーエスエー, インコーポレイテッド | 核酸生成物を生成するための、テンプレートスイッチに基づく方法 |
RS62263B1 (sr) | 2013-04-16 | 2021-09-30 | Regeneron Pharma | Ciljana modifikacija genoma pacova |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
RU2725520C2 (ru) | 2013-12-11 | 2020-07-02 | Регенерон Фармасьютикалс, Инк. | Способы и композиции для направленной модификации генома |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
ES2730378T3 (es) * | 2014-08-27 | 2019-11-11 | Caribou Biosciences Inc | Procedimientos para incrementar la eficiencia de la modificación mediada por Cas9 |
US20170306306A1 (en) * | 2014-10-24 | 2017-10-26 | Life Technologies Corporation | Compositions and Methods for Enhancing Homologous Recombination |
CA2963820A1 (en) | 2014-11-07 | 2016-05-12 | Editas Medicine, Inc. | Methods for improving crispr/cas-mediated genome-editing |
SI3221457T1 (sl) | 2014-11-21 | 2019-08-30 | Regeneron Pharmaceuticals, Inc. | Postopki in sestavki za ciljno genetsko modifikacijo z uporabo vodilnih RNK v parih |
EP3250688B1 (fr) * | 2015-01-29 | 2021-07-28 | Meiogenix | Procede pour induire des recombinaisons meiotiques ciblees |
EP3294879A4 (en) * | 2015-05-14 | 2019-02-20 | University of Southern California | OPTIMIZED GENETIZATION WITH A RECOMBINANT ENDONUCLEASE SYSTEM |
EP3328399B1 (en) | 2015-07-31 | 2023-12-27 | Regents of the University of Minnesota | Modified cells and methods of therapy |
US11667911B2 (en) | 2015-09-24 | 2023-06-06 | Editas Medicine, Inc. | Use of exonucleases to improve CRISPR/CAS-mediated genome editing |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
US11597924B2 (en) | 2016-03-25 | 2023-03-07 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
EP4047092A1 (en) * | 2016-04-13 | 2022-08-24 | Editas Medicine, Inc. | Cas9 fusion molecules, gene editing systems, and methods of use thereof |
BR112018074494A2 (pt) | 2016-06-01 | 2019-03-19 | Kws Saat Se & Co Kgaa | sequências de ácidos nucleicos híbridas para engenharia genômica |
JP2020511931A (ja) * | 2016-06-16 | 2020-04-23 | オスロ ウニヴェルスィテーツスィーケフース ハーエフOslo Universitetssykehus Hf | 改良された遺伝子編集 |
US20180004537A1 (en) * | 2016-07-01 | 2018-01-04 | Microsoft Technology Licensing, Llc | Molecular State Machines |
US11359234B2 (en) | 2016-07-01 | 2022-06-14 | Microsoft Technology Licensing, Llc | Barcoding sequences for identification of gene expression |
WO2018005117A1 (en) | 2016-07-01 | 2018-01-04 | Microsoft Technology Licensing, Llc | Storage through iterative dna editing |
CN109563508B (zh) * | 2016-07-29 | 2023-07-07 | 马克思—普朗克科学促进协会公司 | 通过定点dna裂解和修复靶向原位蛋白质多样化 |
IL308426A (en) | 2016-08-03 | 2024-01-01 | Harvard College | Adenosine nuclear base editors and their uses |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
EP4431607A2 (en) | 2016-09-09 | 2024-09-18 | The Board of Trustees of the Leland Stanford Junior University | High-throughput precision genome editing |
SG11201903089RA (en) | 2016-10-14 | 2019-05-30 | Harvard College | Aav delivery of nucleobase editors |
GB2604416B (en) | 2016-10-18 | 2023-03-15 | Univ Minnesota | Tumor infiltating lymphocytes and methods of therapy |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
US11168319B1 (en) | 2017-02-28 | 2021-11-09 | Inari Agriculture Technology, Inc. | Plant cell culture |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
US20200010519A1 (en) | 2017-03-10 | 2020-01-09 | Institut National De La Sante Et De La Recherche Medicale(Inserm) | Nuclease fusions for enhancing genome editing by homology-directed transgene integration |
JP7191388B2 (ja) | 2017-03-23 | 2022-12-19 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子 |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
EP3645021A4 (en) | 2017-06-30 | 2021-04-21 | Intima Bioscience, Inc. | ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY |
US11866726B2 (en) | 2017-07-14 | 2024-01-09 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
US11649442B2 (en) | 2017-09-08 | 2023-05-16 | The Regents Of The University Of California | RNA-guided endonuclease fusion polypeptides and methods of use thereof |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
US20210214724A1 (en) * | 2017-10-23 | 2021-07-15 | The Broad Institute, Inc. | Novel nucleic acid modifiers |
KR102387830B1 (ko) * | 2017-11-22 | 2022-04-18 | 고쿠리츠다이가쿠호진 고베다이가쿠 | 안정하고 부작용이 적은 게놈 편집용 복합체 및 이를 코딩하는 핵산 |
US11634722B2 (en) | 2018-01-22 | 2023-04-25 | Inari Agriculture Technology, Inc. | Plant gene editing systems, methods, and compositions |
KR102465067B1 (ko) * | 2018-02-15 | 2022-11-10 | 시그마-알드리치 컴퍼니., 엘엘씨 | 진핵 게놈 변형을 위한 조작된 cas9 시스템 |
CN108441520B (zh) * | 2018-04-04 | 2020-07-31 | 苏州大学 | 利用CRISPR/Cas9系统构建的基因条件性敲除方法 |
US11981892B2 (en) * | 2018-04-16 | 2024-05-14 | University Of Massachusetts | Compositions and methods for improved gene editing |
WO2020036653A2 (en) * | 2018-04-25 | 2020-02-20 | The Regents Of The University Of California | Improved method for homology directed repair in cells |
EP3805394A4 (en) * | 2018-05-25 | 2022-03-09 | University of Tsukuba | METHOD OF PRODUCTION OF FUSION PROTEIN, NUCLEIC ACID, CELL AND ANIMAL |
EP3575402A1 (en) * | 2018-06-01 | 2019-12-04 | Algentech SAS | Gene targeting |
EP3575396A1 (en) * | 2018-06-01 | 2019-12-04 | Algentech SAS | Gene targeting |
EP3810636A1 (en) | 2018-06-25 | 2021-04-28 | Yeda Research and Development Co. Ltd | Systems and methods for increasing efficiency of genome editing |
WO2020018166A1 (en) * | 2018-07-16 | 2020-01-23 | The Regents Of The University Of Michigan | Nuclease-mediated nucleic acid modification |
WO2020041172A1 (en) * | 2018-08-21 | 2020-02-27 | The Jackson Laboratory | Methods and compositions for recruiting dna repair proteins |
KR20210139271A (ko) | 2019-02-15 | 2021-11-22 | 시그마-알드리치 컴퍼니., 엘엘씨 | Crispr/cas 융합 단백질 및 시스템 |
WO2020191243A1 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
ES2920273T3 (es) * | 2019-04-25 | 2022-08-02 | Univ Freiburg Albert Ludwigs | Sistema CAS9 modificado y su uso para edición génica mejorada |
US20220220468A1 (en) * | 2019-05-17 | 2022-07-14 | Beth Israel Deaconess Medical Center, Inc. | Compositions and methods for homology directed repair |
EP3987024A4 (en) | 2019-06-20 | 2023-11-01 | University Of Massachusetts | COMPOSITIONS AND METHODS FOR IMPROVED GENE EDITING |
JP2022539338A (ja) | 2019-06-25 | 2022-09-08 | イナリ アグリカルチャー テクノロジー, インコーポレイテッド | 改良された相同性依存性修復ゲノム編集 |
US11746354B2 (en) | 2019-07-19 | 2023-09-05 | Inari Agriculture Technology, Inc. | Homology dependent repair genome editing |
CN110628761A (zh) * | 2019-09-27 | 2019-12-31 | 北京理工大学 | 一种基于细菌內源末端连接系统的基因组编辑方法 |
CN110669779A (zh) * | 2019-09-27 | 2020-01-10 | 北京理工大学 | 一种基于细菌內源同源重组系统的基因组编辑方法 |
CN112979823B (zh) * | 2019-12-18 | 2022-04-08 | 华东师范大学 | 一种用于治疗和/或预防β血红蛋白病的产品及融合蛋白 |
CN111154003B (zh) * | 2020-01-14 | 2022-11-04 | 温氏食品集团股份有限公司 | 提高基因敲入效率的Cas9融合蛋白和外源基因敲入整合系统 |
WO2021188840A1 (en) * | 2020-03-19 | 2021-09-23 | Rewrite Therapeutics, Inc. | Methods and compositions for directed genome editing |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
AU2022331228A1 (en) * | 2021-08-16 | 2024-03-07 | Targetgene Biotechnologies Ltd | Homology dna repair enhancement of cas derivatives compositions and uses thereof in genetic modulation |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120276074A1 (en) * | 2011-02-28 | 2012-11-01 | Seattle Children's Research Institute | Coupling endonucleases with end-processing enzymes drives high efficiency gene disruption |
US20140242702A1 (en) * | 2013-02-25 | 2014-08-28 | Sigma Aldrich Co. Llc | Methods and compositions for enhancing nuclease-mediated gene disruption |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5436150A (en) | 1992-04-03 | 1995-07-25 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease |
USRE39229E1 (en) | 1994-08-20 | 2006-08-08 | Gendaq Limited | Binding proteins for recognition of DNA |
US6503717B2 (en) | 1999-12-06 | 2003-01-07 | Sangamo Biosciences, Inc. | Methods of using randomized libraries of zinc finger proteins for the identification of gene function |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
WO2001083819A2 (en) | 2000-04-28 | 2001-11-08 | Sangamo Biosciences, Inc. | Methods for designing exogenous regulatory molecules |
WO2004037977A2 (en) * | 2002-09-05 | 2004-05-06 | California Institute Of Thechnology | Use of chimeric nucleases to stimulate gene targeting |
WO2004099366A2 (en) | 2002-10-23 | 2004-11-18 | The General Hospital Corporation | Context sensitive parallel optimization of zinc finger dna binding domains |
EP2325307A1 (en) | 2005-03-15 | 2011-05-25 | Cellectis | I-crel meganuclease variants with modified specificity, method of preparation and uses thereof |
US8021867B2 (en) | 2005-10-18 | 2011-09-20 | Duke University | Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity |
US8182987B2 (en) | 2007-03-16 | 2012-05-22 | Tokyo Metropolitan Institute Of Medical Science | Probe for visualizing cell-cycle |
WO2011017293A2 (en) | 2009-08-03 | 2011-02-10 | The General Hospital Corporation | Engineering of zinc finger arrays by context-dependent assembly |
EP3156062A1 (en) | 2010-05-17 | 2017-04-19 | Sangamo BioSciences, Inc. | Novel dna-binding proteins and uses thereof |
WO2012010976A2 (en) | 2010-07-15 | 2012-01-26 | Cellectis | Meganuclease variants cleaving a dna target sequence in the tert gene and uses thereof |
CA2820630A1 (en) | 2010-12-09 | 2012-06-14 | Bayer Healthcare Llc | Dimeric molecular complexes with free cysteine residues and conjugates thereof |
WO2013001517A1 (en) | 2011-06-30 | 2013-01-03 | Compugen Ltd. | Polypeptides and uses thereof for treatment of autoimmune disorders and infection |
AU2013225950B2 (en) | 2012-02-29 | 2018-02-15 | Sangamo Therapeutics, Inc. | Methods and compositions for treating huntington's disease |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
EP2796558A1 (en) | 2013-04-23 | 2014-10-29 | Rheinische Friedrich-Wilhelms-Universität Bonn | Improved gene targeting and nucleic acid carrier molecule, in particular for use in plants |
-
2015
- 2015-10-01 AU AU2015324935A patent/AU2015324935B2/en active Active
- 2015-10-01 KR KR1020177011319A patent/KR102455807B1/ko active IP Right Grant
- 2015-10-01 EP EP20210740.5A patent/EP3845655A1/en active Pending
- 2015-10-01 US US15/516,310 patent/US11021718B2/en active Active
- 2015-10-01 EP EP15846033.7A patent/EP3201340B1/en active Active
- 2015-10-01 IL IL287561A patent/IL287561B2/en unknown
- 2015-10-01 WO PCT/US2015/053417 patent/WO2016054326A1/en active Application Filing
- 2015-10-01 CA CA2963080A patent/CA2963080A1/en active Pending
- 2015-10-01 KR KR1020227035603A patent/KR102630014B1/ko active IP Right Grant
-
2017
- 2017-03-28 IL IL251432A patent/IL251432A0/en unknown
-
2020
- 2020-07-14 IL IL276040A patent/IL276040B/en unknown
-
2021
- 2021-05-26 US US17/331,551 patent/US20210292795A1/en active Pending
- 2021-06-09 AU AU2021203820A patent/AU2021203820B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120276074A1 (en) * | 2011-02-28 | 2012-11-01 | Seattle Children's Research Institute | Coupling endonucleases with end-processing enzymes drives high efficiency gene disruption |
US20140242702A1 (en) * | 2013-02-25 | 2014-08-28 | Sigma Aldrich Co. Llc | Methods and compositions for enhancing nuclease-mediated gene disruption |
Non-Patent Citations (1)
Title |
---|
PLOS ONE, Vol.9, No.5, pp. 1-8 (2014.05.01)* * |
Also Published As
Publication number | Publication date |
---|---|
US11021718B2 (en) | 2021-06-01 |
IL251432A0 (en) | 2017-05-29 |
EP3201340A4 (en) | 2018-02-28 |
EP3201340B1 (en) | 2020-12-02 |
EP3201340A1 (en) | 2017-08-09 |
KR102630014B1 (ko) | 2024-01-25 |
KR20170061697A (ko) | 2017-06-05 |
EP3845655A1 (en) | 2021-07-07 |
AU2021203820B2 (en) | 2023-09-21 |
AU2021203820A1 (en) | 2021-07-08 |
WO2016054326A1 (en) | 2016-04-07 |
CA2963080A1 (en) | 2016-04-07 |
KR102455807B1 (ko) | 2022-10-18 |
IL276040B (en) | 2021-12-01 |
US20210292795A1 (en) | 2021-09-23 |
US20180230494A1 (en) | 2018-08-16 |
IL287561B1 (en) | 2023-11-01 |
IL276040A (en) | 2020-08-31 |
IL287561A (en) | 2021-12-01 |
AU2015324935B2 (en) | 2021-04-08 |
IL287561B2 (en) | 2024-03-01 |
AU2015324935A1 (en) | 2017-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021203820B2 (en) | Methods for increasing efficiency of nuclease-induced homology-directed repair | |
KR102662249B1 (ko) | 후성적으로 조절되는 부위-특이적 뉴클레아제 | |
JP7058306B2 (ja) | ヌクレアーゼ媒介dnaアセンブリ | |
US20240200044A1 (en) | Evolution of talens | |
Chandrasegaran et al. | Origins of programmable nucleases for genome engineering | |
Li et al. | TAL nucleases (TALNs): hybrid proteins composed of TAL effectors and FokI DNA-cleavage domain | |
CN110997728A (zh) | 二分型碱基编辑器(bbe)结构和ii-型-cas9锌指编辑 | |
Kim et al. | Engineering and application of zinc finger proteins and TALEs for biomedical research | |
WO2011017293A2 (en) | Engineering of zinc finger arrays by context-dependent assembly | |
Yanik et al. | TALE-PvuII fusion proteins–novel tools for gene targeting | |
Pelletier | Genome Editing with Targetable Nucleases | |
Wolfs | Dual-active genome-editing reagents | |
KR20120087860A (ko) | 신규한 징크 핑거 뉴클레아제 및 이의 용도 | |
McDowell | Examining the Nucleotide Preference of the Linker Domain in Engineered Tev-mTALENs | |
Wibowo | Transcription Activator-Like Effectors (TALEs) Hybrid Nucleases for Genome Engineering Application | |
Akopian | Site-specific DNA recombinases with novel sequence recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |