CN114846146B - 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途 - Google Patents
用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途 Download PDFInfo
- Publication number
- CN114846146B CN114846146B CN202080089323.6A CN202080089323A CN114846146B CN 114846146 B CN114846146 B CN 114846146B CN 202080089323 A CN202080089323 A CN 202080089323A CN 114846146 B CN114846146 B CN 114846146B
- Authority
- CN
- China
- Prior art keywords
- sequence
- cas12f1
- crispr
- engineered
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108020005004 Guide RNA Proteins 0.000 title claims abstract description 344
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 259
- 238000010354 CRISPR gene editing Methods 0.000 title claims abstract description 254
- 230000001965 increasing effect Effects 0.000 title description 7
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 331
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 264
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 264
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims abstract description 80
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims abstract description 32
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims abstract description 32
- 229940045145 uridine Drugs 0.000 claims abstract description 32
- 108090000623 proteins and genes Proteins 0.000 claims description 380
- 102000004169 proteins and genes Human genes 0.000 claims description 315
- 108091079001 CRISPR RNA Proteins 0.000 claims description 226
- 125000006850 spacer group Chemical group 0.000 claims description 163
- 239000013598 vector Substances 0.000 claims description 128
- 108091093088 Amplicon Proteins 0.000 claims description 112
- 238000000034 method Methods 0.000 claims description 111
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 89
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 claims description 75
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 claims description 74
- 230000000295 complement effect Effects 0.000 claims description 45
- 239000013600 plasmid vector Substances 0.000 claims description 45
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 claims description 37
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 claims description 37
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 claims description 37
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 claims description 37
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 claims description 37
- 229940029575 guanosine Drugs 0.000 claims description 37
- 239000002126 C01EB10 - Adenosine Substances 0.000 claims description 36
- 229960005305 adenosine Drugs 0.000 claims description 36
- 239000013603 viral vector Substances 0.000 claims description 31
- 239000000203 mixture Substances 0.000 claims description 23
- 150000001413 amino acids Chemical class 0.000 claims description 16
- 241000702421 Dependoparvovirus Species 0.000 claims description 13
- 241000700584 Simplexvirus Species 0.000 claims description 10
- 241000701161 unidentified adenovirus Species 0.000 claims description 10
- 241000713666 Lentivirus Species 0.000 claims description 8
- 241000700618 Vaccinia virus Species 0.000 claims description 8
- 241001430294 unidentified retrovirus Species 0.000 claims description 8
- 238000000338 in vitro Methods 0.000 claims description 7
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 5
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 5
- 108091081062 Repeated sequence (DNA) Proteins 0.000 claims 1
- 230000014509 gene expression Effects 0.000 abstract description 29
- 230000000694 effects Effects 0.000 abstract description 22
- 238000010348 incorporation Methods 0.000 abstract 1
- 108020004414 DNA Proteins 0.000 description 234
- 108091027544 Subgenomic mRNA Proteins 0.000 description 209
- 108091028043 Nucleic acid sequence Proteins 0.000 description 170
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 159
- 210000004027 cell Anatomy 0.000 description 144
- 238000010362 genome editing Methods 0.000 description 92
- 238000010453 CRISPR/Cas method Methods 0.000 description 56
- 230000008685 targeting Effects 0.000 description 53
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 36
- 238000002474 experimental method Methods 0.000 description 29
- 102000053602 DNA Human genes 0.000 description 24
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical group O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 24
- 102100040750 CUB and sushi domain-containing protein 1 Human genes 0.000 description 22
- 101000892017 Homo sapiens CUB and sushi domain-containing protein 1 Proteins 0.000 description 22
- 108020004705 Codon Proteins 0.000 description 21
- 238000003776 cleavage reaction Methods 0.000 description 21
- 230000007017 scission Effects 0.000 description 21
- 230000006870 function Effects 0.000 description 19
- 229940035893 uracil Drugs 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 17
- 238000013518 transcription Methods 0.000 description 16
- 230000035897 transcription Effects 0.000 description 16
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 15
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 15
- 238000002716 delivery method Methods 0.000 description 15
- 108090000765 processed proteins & peptides Proteins 0.000 description 15
- 210000003527 eukaryotic cell Anatomy 0.000 description 14
- 108010009298 lysylglutamic acid Proteins 0.000 description 14
- 102000004190 Enzymes Human genes 0.000 description 13
- 108090000790 Enzymes Proteins 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 13
- 239000012636 effector Substances 0.000 description 13
- 108020001507 fusion proteins Proteins 0.000 description 13
- 102000037865 fusion proteins Human genes 0.000 description 13
- 238000001890 transfection Methods 0.000 description 13
- 108010034529 leucyl-lysine Proteins 0.000 description 12
- 102000004196 processed proteins & peptides Human genes 0.000 description 12
- 238000012986 modification Methods 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- 108091035707 Consensus sequence Proteins 0.000 description 10
- 102100037964 E3 ubiquitin-protein ligase RING2 Human genes 0.000 description 10
- 101001095815 Homo sapiens E3 ubiquitin-protein ligase RING2 Proteins 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 108010054155 lysyllysine Proteins 0.000 description 10
- 230000004048 modification Effects 0.000 description 10
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 9
- 108010062796 arginyllysine Proteins 0.000 description 9
- 230000006378 damage Effects 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000003834 intracellular effect Effects 0.000 description 9
- 238000002360 preparation method Methods 0.000 description 9
- LXVLKXPFIDDHJG-CIUDSAMLSA-N Pro-Glu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O LXVLKXPFIDDHJG-CIUDSAMLSA-N 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 238000004520 electroporation Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 8
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 7
- 108010065920 Insulin Lispro Proteins 0.000 description 7
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 7
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 7
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- 108020004682 Single-Stranded DNA Proteins 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 239000013604 expression vector Substances 0.000 description 7
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 108010005652 splenotritin Proteins 0.000 description 7
- 239000013607 AAV vector Substances 0.000 description 6
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 6
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 6
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 6
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 6
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 6
- 108091023040 Transcription factor Proteins 0.000 description 6
- 102000040945 Transcription factor Human genes 0.000 description 6
- 108010047495 alanylglycine Proteins 0.000 description 6
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 108010078144 glutaminyl-glycine Proteins 0.000 description 6
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 6
- 108010064235 lysylglycine Proteins 0.000 description 6
- 108010017391 lysylvaline Proteins 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 239000002105 nanoparticle Substances 0.000 description 6
- 108010012581 phenylalanylglutamate Proteins 0.000 description 6
- 108700029760 synthetic LTSP Proteins 0.000 description 6
- 229940104230 thymidine Drugs 0.000 description 6
- 108010051110 tyrosyl-lysine Proteins 0.000 description 6
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 5
- KLKARCOHVHLAJP-UWJYBYFXSA-N Ala-Tyr-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(O)=O KLKARCOHVHLAJP-UWJYBYFXSA-N 0.000 description 5
- HAJWYALLJIATCX-FXQIFTODSA-N Asn-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N HAJWYALLJIATCX-FXQIFTODSA-N 0.000 description 5
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 5
- PCBBLFVHTYNQGG-LAEOZQHASA-N Glu-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N PCBBLFVHTYNQGG-LAEOZQHASA-N 0.000 description 5
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 5
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 5
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 5
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 5
- WXJKFRMKJORORD-DCAQKATOSA-N Lys-Arg-Ala Chemical compound NC(=N)NCCC[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@@H](N)CCCCN WXJKFRMKJORORD-DCAQKATOSA-N 0.000 description 5
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 5
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 5
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 5
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 5
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 108010010147 glycylglutamine Proteins 0.000 description 5
- 108010037850 glycylvaline Proteins 0.000 description 5
- 108010000761 leucylarginine Proteins 0.000 description 5
- 238000001638 lipofection Methods 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 108010018625 phenylalanylarginine Proteins 0.000 description 5
- 108010051242 phenylalanylserine Proteins 0.000 description 5
- 108010029020 prolylglycine Proteins 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 5
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 5
- 108010073969 valyllysine Proteins 0.000 description 5
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 4
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 4
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 4
- HHRAXZAYZFFRAM-CIUDSAMLSA-N Ala-Leu-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O HHRAXZAYZFFRAM-CIUDSAMLSA-N 0.000 description 4
- AJBVYEYZVYPFCF-CIUDSAMLSA-N Ala-Lys-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O AJBVYEYZVYPFCF-CIUDSAMLSA-N 0.000 description 4
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 4
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 4
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 4
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 4
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 4
- GQNZIAGMRXOFJX-GUBZILKMSA-N Cys-Val-Met Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O GQNZIAGMRXOFJX-GUBZILKMSA-N 0.000 description 4
- 102100031780 Endonuclease Human genes 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 4
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 4
- GGJOGFJIPPGNRK-JSGCOSHPSA-N Glu-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 GGJOGFJIPPGNRK-JSGCOSHPSA-N 0.000 description 4
- ZHNHJYYFCGUZNQ-KBIXCLLPSA-N Glu-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(O)=O ZHNHJYYFCGUZNQ-KBIXCLLPSA-N 0.000 description 4
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 4
- LZEUDRYSAZAJIO-AUTRQRHGSA-N Glu-Val-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZEUDRYSAZAJIO-AUTRQRHGSA-N 0.000 description 4
- FGGKGJHCVMYGCD-UKJIMTQDSA-N Glu-Val-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGGKGJHCVMYGCD-UKJIMTQDSA-N 0.000 description 4
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 4
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 4
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 4
- LMMPTUVWHCFTOT-GARJFASQSA-N His-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O LMMPTUVWHCFTOT-GARJFASQSA-N 0.000 description 4
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 4
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 4
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 4
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 4
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 4
- RVOMPSJXSRPFJT-DCAQKATOSA-N Lys-Ala-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVOMPSJXSRPFJT-DCAQKATOSA-N 0.000 description 4
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 4
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 4
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 4
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 4
- XFANQCRHTMOEAP-WDSOQIARSA-N Lys-Pro-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XFANQCRHTMOEAP-WDSOQIARSA-N 0.000 description 4
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 4
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 4
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 4
- QGOZJLYCGRYYRW-KKUMJFAQSA-N Pro-Glu-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QGOZJLYCGRYYRW-KKUMJFAQSA-N 0.000 description 4
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 4
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 4
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 4
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 4
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 4
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 4
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 4
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 4
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 4
- STGXWWBXWXZOER-MBLNEYKQSA-N Thr-Ala-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 STGXWWBXWXZOER-MBLNEYKQSA-N 0.000 description 4
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 4
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 4
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 4
- YGKVNUAKYPGORG-AVGNSLFASA-N Tyr-Asp-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YGKVNUAKYPGORG-AVGNSLFASA-N 0.000 description 4
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 4
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 4
- FOADDSDHGRFUOC-DZKIICNBSA-N Val-Glu-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FOADDSDHGRFUOC-DZKIICNBSA-N 0.000 description 4
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 4
- UKEVLVBHRKWECS-LSJOCFKGSA-N Val-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](C(C)C)N UKEVLVBHRKWECS-LSJOCFKGSA-N 0.000 description 4
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 4
- 108010005233 alanylglutamic acid Proteins 0.000 description 4
- 108010068380 arginylarginine Proteins 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- 108010093581 aspartyl-proline Proteins 0.000 description 4
- 108010038633 aspartylglutamate Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010025306 histidylleucine Proteins 0.000 description 4
- 108010092114 histidylphenylalanine Proteins 0.000 description 4
- 108010091871 leucylmethionine Proteins 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 108010071207 serylmethionine Proteins 0.000 description 4
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 4
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 3
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 3
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 3
- WDIYWDJLXOCGRW-ACZMJKKPSA-N Ala-Asp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WDIYWDJLXOCGRW-ACZMJKKPSA-N 0.000 description 3
- KUDREHRZRIVKHS-UWJYBYFXSA-N Ala-Asp-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KUDREHRZRIVKHS-UWJYBYFXSA-N 0.000 description 3
- 241000203069 Archaea Species 0.000 description 3
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 3
- LLUGJARLJCGLAR-CYDGBPFRSA-N Arg-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LLUGJARLJCGLAR-CYDGBPFRSA-N 0.000 description 3
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 3
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 3
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 3
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 3
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 3
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 3
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 3
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 3
- 238000010443 CRISPR/Cpf1 gene editing Methods 0.000 description 3
- 241000701022 Cytomegalovirus Species 0.000 description 3
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 3
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 3
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 3
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 3
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 3
- GPSHCSTUYOQPAI-JHEQGTHGSA-N Glu-Thr-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O GPSHCSTUYOQPAI-JHEQGTHGSA-N 0.000 description 3
- UMZHHILWZBFPGL-LOKLDPHHSA-N Glu-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O UMZHHILWZBFPGL-LOKLDPHHSA-N 0.000 description 3
- ICUTTWWCDIIIEE-BQBZGAKWSA-N Gly-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN ICUTTWWCDIIIEE-BQBZGAKWSA-N 0.000 description 3
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 3
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 3
- VAXBXNPRXPHGHG-BJDJZHNGSA-N Ile-Ala-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)O)N VAXBXNPRXPHGHG-BJDJZHNGSA-N 0.000 description 3
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 3
- LLZLRXBTOOFODM-QSFUFRPTSA-N Ile-Asp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N LLZLRXBTOOFODM-QSFUFRPTSA-N 0.000 description 3
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 3
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 3
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 3
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 3
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 3
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 3
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 3
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 3
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 3
- OVAOHZIOUBEQCJ-IHRRRGAJSA-N Lys-Leu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OVAOHZIOUBEQCJ-IHRRRGAJSA-N 0.000 description 3
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 3
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 3
- WZVSHTFTCYOFPL-GARJFASQSA-N Lys-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N)C(=O)O WZVSHTFTCYOFPL-GARJFASQSA-N 0.000 description 3
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 3
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- 108091061960 Naked DNA Proteins 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 102000002488 Nucleoplasmin Human genes 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- CSDMCMITJLKBAH-SOUVJXGZSA-N Phe-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O CSDMCMITJLKBAH-SOUVJXGZSA-N 0.000 description 3
- 229920002873 Polyethylenimine Polymers 0.000 description 3
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 3
- KAAPNMOKUUPKOE-SRVKXCTJSA-N Ser-Asn-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KAAPNMOKUUPKOE-SRVKXCTJSA-N 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 3
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 3
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 3
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 3
- WZQZUVWEPMGIMM-JYJNAYRXSA-N Tyr-Gln-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WZQZUVWEPMGIMM-JYJNAYRXSA-N 0.000 description 3
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 3
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 3
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 3
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 3
- JMCOXFSCTGKLLB-FKBYEOEOSA-N Val-Phe-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N JMCOXFSCTGKLLB-FKBYEOEOSA-N 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 108010041407 alanylaspartic acid Proteins 0.000 description 3
- 108010087924 alanylproline Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 108010068265 aspartyltyrosine Proteins 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 238000007385 chemical modification Methods 0.000 description 3
- 108010016616 cysteinylglycine Proteins 0.000 description 3
- 108010069495 cysteinyltyrosine Proteins 0.000 description 3
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010089804 glycyl-threonine Proteins 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 108010018006 histidylserine Proteins 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 108010056582 methionylglutamic acid Proteins 0.000 description 3
- 108060005597 nucleoplasmin Proteins 0.000 description 3
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 3
- 108010079317 prolyl-tyrosine Proteins 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 108010061238 threonyl-glycine Proteins 0.000 description 3
- 241000736836 unidentified archaeon Species 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 3
- XXZCIYUJYUESMD-UHFFFAOYSA-N 2-[4-[2-(2,3-dihydro-1H-inden-2-ylamino)pyrimidin-5-yl]-3-(morpholin-4-ylmethyl)pyrazol-1-yl]-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)ethanone Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C=1C(=NN(C=1)CC(=O)N1CC2=C(CC1)NN=N2)CN1CCOCC1 XXZCIYUJYUESMD-UHFFFAOYSA-N 0.000 description 2
- IPAMZHCXCQLRJR-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-methylbutanoyl)amino]-4-methylpentanoyl]amino]-3-methylbutanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(N)C(C)C IPAMZHCXCQLRJR-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 2
- OILNWMNBLIHXQK-ZLUOBGJFSA-N Ala-Cys-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O OILNWMNBLIHXQK-ZLUOBGJFSA-N 0.000 description 2
- AWAXZRDKUHOPBO-GUBZILKMSA-N Ala-Gln-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O AWAXZRDKUHOPBO-GUBZILKMSA-N 0.000 description 2
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 2
- OMMDTNGURYRDAC-NRPADANISA-N Ala-Glu-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OMMDTNGURYRDAC-NRPADANISA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 2
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 2
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 2
- IHRGVZXPTIQNIP-NAKRPEOUSA-N Ala-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C)N IHRGVZXPTIQNIP-NAKRPEOUSA-N 0.000 description 2
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 2
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 2
- CWRBRVZBMVJENN-UVBJJODRSA-N Ala-Trp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N CWRBRVZBMVJENN-UVBJJODRSA-N 0.000 description 2
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 2
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 2
- OZNSCVPYWZRQPY-CIUDSAMLSA-N Arg-Asp-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OZNSCVPYWZRQPY-CIUDSAMLSA-N 0.000 description 2
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 2
- JVMKBJNSRZWDBO-FXQIFTODSA-N Arg-Cys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O JVMKBJNSRZWDBO-FXQIFTODSA-N 0.000 description 2
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 2
- YNSGXDWWPCGGQS-YUMQZZPRSA-N Arg-Gly-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O YNSGXDWWPCGGQS-YUMQZZPRSA-N 0.000 description 2
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 2
- SLNCSSWAIDUUGF-LSJOCFKGSA-N Arg-His-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O SLNCSSWAIDUUGF-LSJOCFKGSA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- UZGFHWIJWPUPOH-IHRRRGAJSA-N Arg-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UZGFHWIJWPUPOH-IHRRRGAJSA-N 0.000 description 2
- LCBSSOCDWUTQQV-SDDRHHMPSA-N Arg-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LCBSSOCDWUTQQV-SDDRHHMPSA-N 0.000 description 2
- INXWADWANGLMPJ-JYJNAYRXSA-N Arg-Phe-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CC1=CC=CC=C1 INXWADWANGLMPJ-JYJNAYRXSA-N 0.000 description 2
- DRDWXKWUSIKKOB-PJODQICGSA-N Arg-Trp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O DRDWXKWUSIKKOB-PJODQICGSA-N 0.000 description 2
- ZUVMUOOHJYNJPP-XIRDDKMYSA-N Arg-Trp-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZUVMUOOHJYNJPP-XIRDDKMYSA-N 0.000 description 2
- UVTGNSWSRSCPLP-UHFFFAOYSA-N Arg-Tyr Natural products NC(CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O UVTGNSWSRSCPLP-UHFFFAOYSA-N 0.000 description 2
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 2
- YNDLOUMBVDVALC-ZLUOBGJFSA-N Asn-Ala-Ala Chemical compound C[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC(=O)N)N YNDLOUMBVDVALC-ZLUOBGJFSA-N 0.000 description 2
- BRCVLJZIIFBSPF-ZLUOBGJFSA-N Asn-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N BRCVLJZIIFBSPF-ZLUOBGJFSA-N 0.000 description 2
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 2
- VDCIPFYVCICPEC-FXQIFTODSA-N Asn-Arg-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O VDCIPFYVCICPEC-FXQIFTODSA-N 0.000 description 2
- JJGRJMKUOYXZRA-LPEHRKFASA-N Asn-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N)C(=O)O JJGRJMKUOYXZRA-LPEHRKFASA-N 0.000 description 2
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 2
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 2
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 2
- IICZCLFBILYRCU-WHFBIAKZSA-N Asn-Gly-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IICZCLFBILYRCU-WHFBIAKZSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- ODBSSLHUFPJRED-CIUDSAMLSA-N Asn-His-Asn Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ODBSSLHUFPJRED-CIUDSAMLSA-N 0.000 description 2
- VXLBDJWTONZHJN-YUMQZZPRSA-N Asn-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N VXLBDJWTONZHJN-YUMQZZPRSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 2
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 2
- NLDNNZKUSLAYFW-NHCYSSNCSA-N Asn-Lys-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O NLDNNZKUSLAYFW-NHCYSSNCSA-N 0.000 description 2
- QGABLMITFKUQDF-DCAQKATOSA-N Asn-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGABLMITFKUQDF-DCAQKATOSA-N 0.000 description 2
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 2
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 2
- ZJIFRAPZHAGLGR-MELADBBJSA-N Asn-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC(=O)N)N)C(=O)O ZJIFRAPZHAGLGR-MELADBBJSA-N 0.000 description 2
- AMGQTNHANMRPOE-LKXGYXEUSA-N Asn-Thr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O AMGQTNHANMRPOE-LKXGYXEUSA-N 0.000 description 2
- QIRJQYQOIKBPBZ-IHRRRGAJSA-N Asn-Tyr-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QIRJQYQOIKBPBZ-IHRRRGAJSA-N 0.000 description 2
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 2
- RGKKALNPOYURGE-ZKWXMUAHSA-N Asp-Ala-Val Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O RGKKALNPOYURGE-ZKWXMUAHSA-N 0.000 description 2
- RATOMFTUDRYMKX-ACZMJKKPSA-N Asp-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RATOMFTUDRYMKX-ACZMJKKPSA-N 0.000 description 2
- KHBLRHKVXICFMY-GUBZILKMSA-N Asp-Glu-Lys Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O KHBLRHKVXICFMY-GUBZILKMSA-N 0.000 description 2
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 2
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 2
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- PCJOFZYFFMBZKC-PCBIJLKTSA-N Asp-Phe-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PCJOFZYFFMBZKC-PCBIJLKTSA-N 0.000 description 2
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 2
- XXAMCEGRCZQGEM-ZLUOBGJFSA-N Asp-Ser-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O XXAMCEGRCZQGEM-ZLUOBGJFSA-N 0.000 description 2
- OYSYWMMZGJSQRB-AVGNSLFASA-N Asp-Tyr-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O OYSYWMMZGJSQRB-AVGNSLFASA-N 0.000 description 2
- OQMGSMNZVHYDTQ-ZKWXMUAHSA-N Asp-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N OQMGSMNZVHYDTQ-ZKWXMUAHSA-N 0.000 description 2
- QPDUWAUSSWGJSB-NGZCFLSTSA-N Asp-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N QPDUWAUSSWGJSB-NGZCFLSTSA-N 0.000 description 2
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- AEJSNWMRPXAKCW-WHFBIAKZSA-N Cys-Ala-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AEJSNWMRPXAKCW-WHFBIAKZSA-N 0.000 description 2
- CFQVGYWKSLKWFX-KBIXCLLPSA-N Cys-Glu-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CFQVGYWKSLKWFX-KBIXCLLPSA-N 0.000 description 2
- RWAZRMXTVSIVJR-YUMQZZPRSA-N Cys-Gly-His Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CNC=N1)C(O)=O RWAZRMXTVSIVJR-YUMQZZPRSA-N 0.000 description 2
- YKKHFPGOZXQAGK-QWRGUYRKSA-N Cys-Gly-Tyr Chemical compound SC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YKKHFPGOZXQAGK-QWRGUYRKSA-N 0.000 description 2
- CIBLYQCAZRYWHY-UHFFFAOYSA-N Cys-Leu-Phe-Cys Chemical compound SCC(N)C(=O)NC(CC(C)C)C(=O)NC(C(=O)NC(CS)C(O)=O)CC1=CC=CC=C1 CIBLYQCAZRYWHY-UHFFFAOYSA-N 0.000 description 2
- 102100026846 Cytidine deaminase Human genes 0.000 description 2
- 108010031325 Cytidine deaminase Proteins 0.000 description 2
- 102220644534 Cytoglobin_T2A_mutation Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 2
- KWUSGAIFNHQCBY-DCAQKATOSA-N Gln-Arg-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O KWUSGAIFNHQCBY-DCAQKATOSA-N 0.000 description 2
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 2
- UWKPRVKWEKEMSY-DCAQKATOSA-N Gln-Lys-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWKPRVKWEKEMSY-DCAQKATOSA-N 0.000 description 2
- SXGMGNZEHFORAV-IUCAKERBSA-N Gln-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)N)N SXGMGNZEHFORAV-IUCAKERBSA-N 0.000 description 2
- OZEQPCDLCDRCGY-SOUVJXGZSA-N Gln-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O OZEQPCDLCDRCGY-SOUVJXGZSA-N 0.000 description 2
- SGVGIVDZLSHSEN-RYUDHWBXSA-N Gln-Tyr-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O SGVGIVDZLSHSEN-RYUDHWBXSA-N 0.000 description 2
- ZFBBMCKQSNJZSN-AUTRQRHGSA-N Gln-Val-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZFBBMCKQSNJZSN-AUTRQRHGSA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 2
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 2
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 2
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 2
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 2
- ZWABFSSWTSAMQN-KBIXCLLPSA-N Glu-Ile-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O ZWABFSSWTSAMQN-KBIXCLLPSA-N 0.000 description 2
- QIQABBIDHGQXGA-ZPFDUUQYSA-N Glu-Ile-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QIQABBIDHGQXGA-ZPFDUUQYSA-N 0.000 description 2
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 2
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 2
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 2
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 2
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 2
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 2
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 2
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 2
- NTHIHAUEXVTXQG-KKUMJFAQSA-N Glu-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O NTHIHAUEXVTXQG-KKUMJFAQSA-N 0.000 description 2
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 2
- RMWAOBGCZZSJHE-UMNHJUIQSA-N Glu-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N RMWAOBGCZZSJHE-UMNHJUIQSA-N 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- XZRZILPOZBVTDB-GJZGRUSLSA-N Gly-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)CN)C(O)=O)=CNC2=C1 XZRZILPOZBVTDB-GJZGRUSLSA-N 0.000 description 2
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 2
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 2
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 2
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 2
- ADZGCWWDPFDHCY-ZETCQYMHSA-N Gly-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 ADZGCWWDPFDHCY-ZETCQYMHSA-N 0.000 description 2
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 2
- UESJMAMHDLEHGM-NHCYSSNCSA-N Gly-Ile-Leu Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O UESJMAMHDLEHGM-NHCYSSNCSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 2
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 2
- CUVBTVWFVIIDOC-YEPSODPASA-N Gly-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)CN CUVBTVWFVIIDOC-YEPSODPASA-N 0.000 description 2
- ONSARSFSJHTMFJ-STQMWFEESA-N Gly-Trp-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ONSARSFSJHTMFJ-STQMWFEESA-N 0.000 description 2
- FNXSYBOHALPRHV-ONGXEEELSA-N Gly-Val-Lys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN FNXSYBOHALPRHV-ONGXEEELSA-N 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 2
- VSLXGYMEHVAJBH-DLOVCJGASA-N His-Ala-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O VSLXGYMEHVAJBH-DLOVCJGASA-N 0.000 description 2
- HRGGKHFHRSFSDE-CIUDSAMLSA-N His-Asn-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N HRGGKHFHRSFSDE-CIUDSAMLSA-N 0.000 description 2
- YADRBUZBKHHDAO-XPUUQOCRSA-N His-Gly-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C)C(O)=O YADRBUZBKHHDAO-XPUUQOCRSA-N 0.000 description 2
- JBSLJUPMTYLLFH-MELADBBJSA-N His-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N)C(=O)O JBSLJUPMTYLLFH-MELADBBJSA-N 0.000 description 2
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 2
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 2
- BRQKGRLDDDQWQJ-MBLNEYKQSA-N His-Thr-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O BRQKGRLDDDQWQJ-MBLNEYKQSA-N 0.000 description 2
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 2
- 108010001336 Horseradish Peroxidase Proteins 0.000 description 2
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 2
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 2
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 2
- DMZOUKXXHJQPTL-GRLWGSQLSA-N Ile-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N DMZOUKXXHJQPTL-GRLWGSQLSA-N 0.000 description 2
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 2
- LPXHYGGZJOCAFR-MNXVOIDGSA-N Ile-Glu-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N LPXHYGGZJOCAFR-MNXVOIDGSA-N 0.000 description 2
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 2
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 2
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 2
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 2
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 2
- OVDKXUDMKXAZIV-ZPFDUUQYSA-N Ile-Lys-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N OVDKXUDMKXAZIV-ZPFDUUQYSA-N 0.000 description 2
- PARSHQDZROHERM-NHCYSSNCSA-N Ile-Lys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)O)N PARSHQDZROHERM-NHCYSSNCSA-N 0.000 description 2
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 2
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 2
- UYNXBNHVWFNVIN-HJWJTTGWSA-N Ile-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 UYNXBNHVWFNVIN-HJWJTTGWSA-N 0.000 description 2
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 2
- JZNVOBUNTWNZPW-GHCJXIJMSA-N Ile-Ser-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N JZNVOBUNTWNZPW-GHCJXIJMSA-N 0.000 description 2
- PELCGFMHLZXWBQ-BJDJZHNGSA-N Ile-Ser-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)O)N PELCGFMHLZXWBQ-BJDJZHNGSA-N 0.000 description 2
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 2
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 2
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 2
- ZYVTXBXHIKGZMD-QSFUFRPTSA-N Ile-Val-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ZYVTXBXHIKGZMD-QSFUFRPTSA-N 0.000 description 2
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 2
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 2
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 2
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 2
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- OGUUKPXUTHOIAV-SDDRHHMPSA-N Leu-Glu-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGUUKPXUTHOIAV-SDDRHHMPSA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 2
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 2
- RTIRBWJPYJYTLO-MELADBBJSA-N Leu-Lys-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N RTIRBWJPYJYTLO-MELADBBJSA-N 0.000 description 2
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 2
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 2
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 2
- PWPBLZXWFXJFHE-RHYQMDGZSA-N Leu-Pro-Thr Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O PWPBLZXWFXJFHE-RHYQMDGZSA-N 0.000 description 2
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 2
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- OZTZJMUZVAVJGY-BZSNNMDCSA-N Leu-Tyr-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OZTZJMUZVAVJGY-BZSNNMDCSA-N 0.000 description 2
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 2
- LMDVGHQPPPLYAR-IHRRRGAJSA-N Leu-Val-His Chemical compound N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O LMDVGHQPPPLYAR-IHRRRGAJSA-N 0.000 description 2
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 2
- GAOJCVKPIGHTGO-UWVGGRQHSA-N Lys-Arg-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O GAOJCVKPIGHTGO-UWVGGRQHSA-N 0.000 description 2
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 2
- OVIVOCSURJYCTM-GUBZILKMSA-N Lys-Asp-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O OVIVOCSURJYCTM-GUBZILKMSA-N 0.000 description 2
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 2
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 2
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 2
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 2
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 2
- DTUZCYRNEJDKSR-NHCYSSNCSA-N Lys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN DTUZCYRNEJDKSR-NHCYSSNCSA-N 0.000 description 2
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 2
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 2
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 2
- RIJCHEVHFWMDKD-SRVKXCTJSA-N Lys-Lys-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RIJCHEVHFWMDKD-SRVKXCTJSA-N 0.000 description 2
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 2
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 2
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 2
- TWPCWKVOZDUYAA-KKUMJFAQSA-N Lys-Phe-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O TWPCWKVOZDUYAA-KKUMJFAQSA-N 0.000 description 2
- AEIIJFBQVGYVEV-YESZJQIVSA-N Lys-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CCCCN)N)C(=O)O AEIIJFBQVGYVEV-YESZJQIVSA-N 0.000 description 2
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 2
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 2
- ZUGVARDEGWMMLK-SRVKXCTJSA-N Lys-Ser-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN ZUGVARDEGWMMLK-SRVKXCTJSA-N 0.000 description 2
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 2
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 2
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 2
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 2
- QEVRUYFHWJJUHZ-DCAQKATOSA-N Met-Ala-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(C)C QEVRUYFHWJJUHZ-DCAQKATOSA-N 0.000 description 2
- JQEBITVYKUCBMC-SRVKXCTJSA-N Met-Arg-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JQEBITVYKUCBMC-SRVKXCTJSA-N 0.000 description 2
- BQVJARUIXRXDKN-DCAQKATOSA-N Met-Asn-His Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 BQVJARUIXRXDKN-DCAQKATOSA-N 0.000 description 2
- AETNZPKUUYYYEK-CIUDSAMLSA-N Met-Glu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O AETNZPKUUYYYEK-CIUDSAMLSA-N 0.000 description 2
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 2
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 2
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 2
- 108010002747 Pfu DNA polymerase Proteins 0.000 description 2
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 2
- AGYXCMYVTBYGCT-ULQDDVLXSA-N Phe-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O AGYXCMYVTBYGCT-ULQDDVLXSA-N 0.000 description 2
- YYRCPTVAPLQRNC-ULQDDVLXSA-N Phe-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CC1=CC=CC=C1 YYRCPTVAPLQRNC-ULQDDVLXSA-N 0.000 description 2
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 2
- DJPXNKUDJKGQEE-BZSNNMDCSA-N Phe-Asp-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DJPXNKUDJKGQEE-BZSNNMDCSA-N 0.000 description 2
- FGXIJNMDRCZVDE-KKUMJFAQSA-N Phe-Cys-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N FGXIJNMDRCZVDE-KKUMJFAQSA-N 0.000 description 2
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 2
- GXDPQJUBLBZKDY-IAVJCBSLSA-N Phe-Ile-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GXDPQJUBLBZKDY-IAVJCBSLSA-N 0.000 description 2
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 2
- CJAHQEZWDZNSJO-KKUMJFAQSA-N Phe-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CJAHQEZWDZNSJO-KKUMJFAQSA-N 0.000 description 2
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 2
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 2
- FENSZYFJQOFSQR-FIRPJDEBSA-N Phe-Phe-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FENSZYFJQOFSQR-FIRPJDEBSA-N 0.000 description 2
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 2
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 2
- UMIHVJQSXFWWMW-JBACZVJFSA-N Phe-Trp-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UMIHVJQSXFWWMW-JBACZVJFSA-N 0.000 description 2
- APXXVISUHOLGEE-ILWGZMRPSA-N Phe-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CC=CC=C4)N)C(=O)O APXXVISUHOLGEE-ILWGZMRPSA-N 0.000 description 2
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 2
- KTFZQPLSPLWLKN-KKUMJFAQSA-N Pro-Gln-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KTFZQPLSPLWLKN-KKUMJFAQSA-N 0.000 description 2
- SUENWIFTSTWUKD-AVGNSLFASA-N Pro-Leu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SUENWIFTSTWUKD-AVGNSLFASA-N 0.000 description 2
- AJBQTGZIZQXBLT-STQMWFEESA-N Pro-Phe-Gly Chemical compound C([C@@H](C(=O)NCC(=O)O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 AJBQTGZIZQXBLT-STQMWFEESA-N 0.000 description 2
- VGFFUEVZKRNRHT-ULQDDVLXSA-N Pro-Trp-Glu Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CCC(=O)O)C(=O)O VGFFUEVZKRNRHT-ULQDDVLXSA-N 0.000 description 2
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 2
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 2
- KNZQGAUEYZJUSQ-ZLUOBGJFSA-N Ser-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N KNZQGAUEYZJUSQ-ZLUOBGJFSA-N 0.000 description 2
- SWSRFJZZMNLMLY-ZKWXMUAHSA-N Ser-Asp-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O SWSRFJZZMNLMLY-ZKWXMUAHSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- BRGQQXQKPUCUJQ-KBIXCLLPSA-N Ser-Glu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRGQQXQKPUCUJQ-KBIXCLLPSA-N 0.000 description 2
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 2
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 2
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 2
- LRZLZIUXQBIWTB-KATARQTJSA-N Ser-Lys-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LRZLZIUXQBIWTB-KATARQTJSA-N 0.000 description 2
- IFLVBVIYADZIQO-DCAQKATOSA-N Ser-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N IFLVBVIYADZIQO-DCAQKATOSA-N 0.000 description 2
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 2
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 2
- UBTNVMGPMYDYIU-HJPIBITLSA-N Ser-Tyr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UBTNVMGPMYDYIU-HJPIBITLSA-N 0.000 description 2
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 2
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- NJEMRSFGDNECGF-GCJQMDKQSA-N Thr-Ala-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O NJEMRSFGDNECGF-GCJQMDKQSA-N 0.000 description 2
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 2
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 2
- HJOSVGCWOTYJFG-WDCWCFNPSA-N Thr-Glu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O HJOSVGCWOTYJFG-WDCWCFNPSA-N 0.000 description 2
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 2
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 2
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 2
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 2
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 2
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 2
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- FKAPNDWDLDWZNF-QEJZJMRPSA-N Trp-Asp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N FKAPNDWDLDWZNF-QEJZJMRPSA-N 0.000 description 2
- OBAMASZCXDIXSS-SZMVWBNQSA-N Trp-Glu-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N OBAMASZCXDIXSS-SZMVWBNQSA-N 0.000 description 2
- SNWIAPVRCNYFNI-SZMVWBNQSA-N Trp-Met-Arg Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N SNWIAPVRCNYFNI-SZMVWBNQSA-N 0.000 description 2
- RQLNEFOBQAVGSY-WDSOQIARSA-N Trp-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQLNEFOBQAVGSY-WDSOQIARSA-N 0.000 description 2
- LORJKYIPJIRIRT-BVSLBCMMSA-N Trp-Pro-Tyr Chemical compound C([C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 LORJKYIPJIRIRT-BVSLBCMMSA-N 0.000 description 2
- IELISNUVHBKYBX-XDTLVQLUSA-N Tyr-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IELISNUVHBKYBX-XDTLVQLUSA-N 0.000 description 2
- CRWOSTCODDFEKZ-HRCADAONSA-N Tyr-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O CRWOSTCODDFEKZ-HRCADAONSA-N 0.000 description 2
- DKKHULUSOSWGHS-UWJYBYFXSA-N Tyr-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N DKKHULUSOSWGHS-UWJYBYFXSA-N 0.000 description 2
- MBFJIHUHHCJBSN-AVGNSLFASA-N Tyr-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MBFJIHUHHCJBSN-AVGNSLFASA-N 0.000 description 2
- WEFIPBYPXZYPHD-HJPIBITLSA-N Tyr-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WEFIPBYPXZYPHD-HJPIBITLSA-N 0.000 description 2
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 2
- IMXAAEFAIBRCQF-SIUGBPQLSA-N Tyr-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N IMXAAEFAIBRCQF-SIUGBPQLSA-N 0.000 description 2
- FNWGDMZVYBVAGJ-XEGUGMAKSA-N Tyr-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC1=CC=C(C=C1)O)N FNWGDMZVYBVAGJ-XEGUGMAKSA-N 0.000 description 2
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 2
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 2
- SZEIFUXUTBBQFQ-STQMWFEESA-N Tyr-Pro-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SZEIFUXUTBBQFQ-STQMWFEESA-N 0.000 description 2
- QHONGSVIVOFKAC-ULQDDVLXSA-N Tyr-Pro-His Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QHONGSVIVOFKAC-ULQDDVLXSA-N 0.000 description 2
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 2
- ZZDYJFVIKVSUFA-WLTAIBSBSA-N Tyr-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O ZZDYJFVIKVSUFA-WLTAIBSBSA-N 0.000 description 2
- YOTRXXBHTZHKLU-BVSLBCMMSA-N Tyr-Trp-Met Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(O)=O)C1=CC=C(O)C=C1 YOTRXXBHTZHKLU-BVSLBCMMSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 2
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 2
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- ZIGZPYJXIWLQFC-QTKMDUPCSA-N Val-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N)O ZIGZPYJXIWLQFC-QTKMDUPCSA-N 0.000 description 2
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 2
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 2
- SVFRYKBZHUGKLP-QXEWZRGKSA-N Val-Met-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVFRYKBZHUGKLP-QXEWZRGKSA-N 0.000 description 2
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 2
- NZGOVKLVQNOEKP-YDHLFZDLSA-N Val-Phe-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NZGOVKLVQNOEKP-YDHLFZDLSA-N 0.000 description 2
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 2
- BGXVHVMJZCSOCA-AVGNSLFASA-N Val-Pro-Lys Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N BGXVHVMJZCSOCA-AVGNSLFASA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010070783 alanyltyrosine Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 108010013835 arginine glutamate Proteins 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 108091005948 blue fluorescent proteins Proteins 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 101150059443 cas12a gene Proteins 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- SPTYHKZRPFATHJ-HYZXJONISA-N dT6 Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=O)O[C@@H]2[C@H](O[C@H](C2)N2C(NC(=O)C(C)=C2)=O)CO)[C@@H](O)C1 SPTYHKZRPFATHJ-HYZXJONISA-N 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 229960002897 heparin Drugs 0.000 description 2
- 229920000669 heparin Polymers 0.000 description 2
- 108010036413 histidylglycine Proteins 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 108010078274 isoleucylvaline Proteins 0.000 description 2
- 150000002632 lipids Chemical class 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000025308 nuclear transport Effects 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 229940049954 penicillin Drugs 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 108010053725 prolylvaline Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 238000003753 real-time PCR Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108010058119 tryptophyl-glycyl-glycine Proteins 0.000 description 2
- 241000712461 unidentified influenza virus Species 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 1
- 101150084750 1 gene Proteins 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- VZSRBBMJRBPUNF-UHFFFAOYSA-N 2-(2,3-dihydro-1H-inden-2-ylamino)-N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]pyrimidine-5-carboxamide Chemical compound C1C(CC2=CC=CC=C12)NC1=NC=C(C=N1)C(=O)NCCC(N1CC2=C(CC1)NN=N2)=O VZSRBBMJRBPUNF-UHFFFAOYSA-N 0.000 description 1
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 1
- OSBLTNPMIGYQGY-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid;boric acid Chemical compound OB(O)O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O OSBLTNPMIGYQGY-UHFFFAOYSA-N 0.000 description 1
- QFVHZQCOUORWEI-UHFFFAOYSA-N 4-[(4-anilino-5-sulfonaphthalen-1-yl)diazenyl]-5-hydroxynaphthalene-2,7-disulfonic acid Chemical compound C=12C(O)=CC(S(O)(=O)=O)=CC2=CC(S(O)(=O)=O)=CC=1N=NC(C1=CC=CC(=C11)S(O)(=O)=O)=CC=C1NC1=CC=CC=C1 QFVHZQCOUORWEI-UHFFFAOYSA-N 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- LJIRBXZDQGQUOO-KVTDHHQDSA-N 6-amino-3-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1,4-dihydro-1,3,5-triazin-2-one Chemical compound C1NC(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LJIRBXZDQGQUOO-KVTDHHQDSA-N 0.000 description 1
- 241000028923 Acidibacillus sulfuroxidans Species 0.000 description 1
- 108010052875 Adenine deaminase Proteins 0.000 description 1
- 102000055025 Adenosine deaminases Human genes 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- ZEXDYVGDZJBRMO-ACZMJKKPSA-N Ala-Asn-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZEXDYVGDZJBRMO-ACZMJKKPSA-N 0.000 description 1
- SHYYAQLDNVHPFT-DLOVCJGASA-N Ala-Asn-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SHYYAQLDNVHPFT-DLOVCJGASA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- WCBVQNZTOKJWJS-ACZMJKKPSA-N Ala-Cys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WCBVQNZTOKJWJS-ACZMJKKPSA-N 0.000 description 1
- CXZFXHGJJPVUJE-CIUDSAMLSA-N Ala-Cys-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O)N CXZFXHGJJPVUJE-CIUDSAMLSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- NHLAEBFGWPXFGI-WHFBIAKZSA-N Ala-Gly-Asn Chemical compound C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N NHLAEBFGWPXFGI-WHFBIAKZSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- PNALXAODQKTNLV-JBDRJPRFSA-N Ala-Ile-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O PNALXAODQKTNLV-JBDRJPRFSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- VQAVBBCZFQAAED-FXQIFTODSA-N Ala-Pro-Asn Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)N)C(=O)O)N VQAVBBCZFQAAED-FXQIFTODSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 1
- PXAFZDXYEIIUTF-LKTVYLICSA-N Ala-Trp-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXAFZDXYEIIUTF-LKTVYLICSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- VWVPYNGMOCSSGK-GUBZILKMSA-N Arg-Arg-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O VWVPYNGMOCSSGK-GUBZILKMSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 1
- WOPFJPHVBWKZJH-SRVKXCTJSA-N Arg-Arg-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O WOPFJPHVBWKZJH-SRVKXCTJSA-N 0.000 description 1
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 1
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- KWTVWJPNHAOREN-IHRRRGAJSA-N Arg-Asn-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KWTVWJPNHAOREN-IHRRRGAJSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- OTCJMMRQBVDQRK-DCAQKATOSA-N Arg-Asp-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OTCJMMRQBVDQRK-DCAQKATOSA-N 0.000 description 1
- GIVWETPOBCRTND-DCAQKATOSA-N Arg-Gln-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GIVWETPOBCRTND-DCAQKATOSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 1
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- CVKOQHYVDVYJSI-QTKMDUPCSA-N Arg-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N)O CVKOQHYVDVYJSI-QTKMDUPCSA-N 0.000 description 1
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 1
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 1
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 1
- QHVRVUNEAIFTEK-SZMVWBNQSA-N Arg-Pro-Trp Chemical compound N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O QHVRVUNEAIFTEK-SZMVWBNQSA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- NMTANZXPDAHUKU-ULQDDVLXSA-N Arg-Tyr-Lys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 NMTANZXPDAHUKU-ULQDDVLXSA-N 0.000 description 1
- LFWOQHSQNCKXRU-UFYCRDLUSA-N Arg-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 LFWOQHSQNCKXRU-UFYCRDLUSA-N 0.000 description 1
- QCTOLCVIGRLMQS-HRCADAONSA-N Arg-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O QCTOLCVIGRLMQS-HRCADAONSA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- 241001408449 Asca Species 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 1
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 1
- PTNFNTOBUDWHNZ-GUBZILKMSA-N Asn-Arg-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O PTNFNTOBUDWHNZ-GUBZILKMSA-N 0.000 description 1
- ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N Asn-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC(N)=O ZZXMOQIUIJJOKZ-ZLUOBGJFSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- ZKDGORKGHPCZOV-DCAQKATOSA-N Asn-His-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZKDGORKGHPCZOV-DCAQKATOSA-N 0.000 description 1
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 1
- OLISTMZJGQUOGS-GMOBBJLQSA-N Asn-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OLISTMZJGQUOGS-GMOBBJLQSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 1
- ORJQQZIXTOYGGH-SRVKXCTJSA-N Asn-Lys-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ORJQQZIXTOYGGH-SRVKXCTJSA-N 0.000 description 1
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 1
- XFJKRRCWLTZIQA-XIRDDKMYSA-N Asn-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N XFJKRRCWLTZIQA-XIRDDKMYSA-N 0.000 description 1
- OROMFUQQTSWUTI-IHRRRGAJSA-N Asn-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N OROMFUQQTSWUTI-IHRRRGAJSA-N 0.000 description 1
- PPCORQFLAZWUNO-QWRGUYRKSA-N Asn-Phe-Gly Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N PPCORQFLAZWUNO-QWRGUYRKSA-N 0.000 description 1
- MVXJBVVLACEGCG-PCBIJLKTSA-N Asn-Phe-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVXJBVVLACEGCG-PCBIJLKTSA-N 0.000 description 1
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 1
- GOPFMQJUQDLUFW-LKXGYXEUSA-N Asn-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O GOPFMQJUQDLUFW-LKXGYXEUSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- DAYDURRBMDCCFL-AAEUAGOBSA-N Asn-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N DAYDURRBMDCCFL-AAEUAGOBSA-N 0.000 description 1
- ANRZCQXIXGDXLR-CWRNSKLLSA-N Asn-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC(=O)N)N)C(=O)O ANRZCQXIXGDXLR-CWRNSKLLSA-N 0.000 description 1
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 1
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- ICTXFVKYAGQURS-UBHSHLNASA-N Asp-Asn-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ICTXFVKYAGQURS-UBHSHLNASA-N 0.000 description 1
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- QHHVSXGWLYEAGX-GUBZILKMSA-N Asp-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N QHHVSXGWLYEAGX-GUBZILKMSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 1
- UZFHNLYQWMGUHU-DCAQKATOSA-N Asp-Lys-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UZFHNLYQWMGUHU-DCAQKATOSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- SARSTIZOZFBDOM-FXQIFTODSA-N Asp-Met-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O SARSTIZOZFBDOM-FXQIFTODSA-N 0.000 description 1
- IOXWDLNHXZOXQP-FXQIFTODSA-N Asp-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N IOXWDLNHXZOXQP-FXQIFTODSA-N 0.000 description 1
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 1
- UCHSVZYJKJLPHF-BZSNNMDCSA-N Asp-Phe-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O UCHSVZYJKJLPHF-BZSNNMDCSA-N 0.000 description 1
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 1
- XYPJXLLXNSAWHZ-SRVKXCTJSA-N Asp-Ser-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XYPJXLLXNSAWHZ-SRVKXCTJSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- OTKUAVXGMREHRX-CFMVVWHZSA-N Asp-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 OTKUAVXGMREHRX-CFMVVWHZSA-N 0.000 description 1
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- 206010061692 Benign muscle neoplasm Diseases 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 1
- GRNOCLDFUNCIDW-ACZMJKKPSA-N Cys-Ala-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N GRNOCLDFUNCIDW-ACZMJKKPSA-N 0.000 description 1
- SZQCDCKIGWQAQN-FXQIFTODSA-N Cys-Arg-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O SZQCDCKIGWQAQN-FXQIFTODSA-N 0.000 description 1
- SFUUYRSAJPWTGO-SRVKXCTJSA-N Cys-Asn-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SFUUYRSAJPWTGO-SRVKXCTJSA-N 0.000 description 1
- MUZAUPFGPMMZSS-GUBZILKMSA-N Cys-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N MUZAUPFGPMMZSS-GUBZILKMSA-N 0.000 description 1
- BSFFNUBDVYTDMV-WHFBIAKZSA-N Cys-Gly-Asn Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O BSFFNUBDVYTDMV-WHFBIAKZSA-N 0.000 description 1
- GCDLPNRHPWBKJJ-WDSKDSINSA-N Cys-Gly-Glu Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O GCDLPNRHPWBKJJ-WDSKDSINSA-N 0.000 description 1
- OXOQBEVULIBOSH-ZDLURKLDSA-N Cys-Gly-Thr Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O OXOQBEVULIBOSH-ZDLURKLDSA-N 0.000 description 1
- DVIHGGUODLILFN-GHCJXIJMSA-N Cys-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N DVIHGGUODLILFN-GHCJXIJMSA-N 0.000 description 1
- SSNJZBGOMNLSLA-CIUDSAMLSA-N Cys-Leu-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O SSNJZBGOMNLSLA-CIUDSAMLSA-N 0.000 description 1
- GDNWBSFSHJVXKL-GUBZILKMSA-N Cys-Lys-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O GDNWBSFSHJVXKL-GUBZILKMSA-N 0.000 description 1
- CAXGCBSRJLADPD-FXQIFTODSA-N Cys-Pro-Asn Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CAXGCBSRJLADPD-FXQIFTODSA-N 0.000 description 1
- BCFXQBXXDSEHRS-FXQIFTODSA-N Cys-Ser-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BCFXQBXXDSEHRS-FXQIFTODSA-N 0.000 description 1
- LKHMGNHQULEPFY-ACZMJKKPSA-N Cys-Ser-Glu Chemical compound SC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O LKHMGNHQULEPFY-ACZMJKKPSA-N 0.000 description 1
- VXDXZGYXHIADHF-YJRXYDGGSA-N Cys-Tyr-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VXDXZGYXHIADHF-YJRXYDGGSA-N 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N DMSO Substances CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 1
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 1
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 1
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- MADFVRSKEIEZHZ-DCAQKATOSA-N Gln-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N MADFVRSKEIEZHZ-DCAQKATOSA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- FYAULIGIFPPOAA-ZPFDUUQYSA-N Gln-Ile-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(O)=O FYAULIGIFPPOAA-ZPFDUUQYSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 1
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 1
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- QMVCEWKHIUHTSD-GUBZILKMSA-N Gln-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N QMVCEWKHIUHTSD-GUBZILKMSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- MFHVAWMMKZBSRQ-ACZMJKKPSA-N Gln-Ser-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N MFHVAWMMKZBSRQ-ACZMJKKPSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- DYVMTEWCGAVKSE-HJGDQZAQSA-N Gln-Thr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O DYVMTEWCGAVKSE-HJGDQZAQSA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- ARYKRXHBIPLULY-XKBZYTNZSA-N Gln-Thr-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ARYKRXHBIPLULY-XKBZYTNZSA-N 0.000 description 1
- QXQDADBVIBLBHN-FHWLQOOXSA-N Gln-Tyr-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QXQDADBVIBLBHN-FHWLQOOXSA-N 0.000 description 1
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- UTKICHUQEQBDGC-ACZMJKKPSA-N Glu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N UTKICHUQEQBDGC-ACZMJKKPSA-N 0.000 description 1
- LKDIBBOKUAASNP-FXQIFTODSA-N Glu-Ala-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LKDIBBOKUAASNP-FXQIFTODSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- SBYVDRJAXWSXQL-AVGNSLFASA-N Glu-Asn-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SBYVDRJAXWSXQL-AVGNSLFASA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- ZZIFPJZQHRJERU-WDSKDSINSA-N Glu-Cys-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZZIFPJZQHRJERU-WDSKDSINSA-N 0.000 description 1
- UENPHLAAKDPZQY-XKBZYTNZSA-N Glu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O UENPHLAAKDPZQY-XKBZYTNZSA-N 0.000 description 1
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 1
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- XIKYNVKEUINBGL-IUCAKERBSA-N Glu-His-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)NCC(O)=O XIKYNVKEUINBGL-IUCAKERBSA-N 0.000 description 1
- ZMVCLTGPGWJAEE-JYJNAYRXSA-N Glu-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)O ZMVCLTGPGWJAEE-JYJNAYRXSA-N 0.000 description 1
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 1
- KRRFFAHEAOCBCQ-SIUGBPQLSA-N Glu-Ile-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KRRFFAHEAOCBCQ-SIUGBPQLSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 1
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 1
- BIYNPVYAZOUVFQ-CIUDSAMLSA-N Glu-Pro-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O BIYNPVYAZOUVFQ-CIUDSAMLSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- GUOWMVFLAJNPDY-CIUDSAMLSA-N Glu-Ser-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O GUOWMVFLAJNPDY-CIUDSAMLSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- LWYUQLZOIORFFJ-XKBZYTNZSA-N Glu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O LWYUQLZOIORFFJ-XKBZYTNZSA-N 0.000 description 1
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 1
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 239000005561 Glufosinate Substances 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- JPXNYFOHTHSREU-UWVGGRQHSA-N Gly-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN JPXNYFOHTHSREU-UWVGGRQHSA-N 0.000 description 1
- DWUKOTKSTDWGAE-BQBZGAKWSA-N Gly-Asn-Arg Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DWUKOTKSTDWGAE-BQBZGAKWSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- QGZSAHIZRQHCEQ-QWRGUYRKSA-N Gly-Asp-Tyr Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QGZSAHIZRQHCEQ-QWRGUYRKSA-N 0.000 description 1
- CEXINUGNTZFNRY-BYPYZUCNSA-N Gly-Cys-Gly Chemical compound [NH3+]CC(=O)N[C@@H](CS)C(=O)NCC([O-])=O CEXINUGNTZFNRY-BYPYZUCNSA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- BIRKKBCSAIHDDF-WDSKDSINSA-N Gly-Glu-Cys Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O BIRKKBCSAIHDDF-WDSKDSINSA-N 0.000 description 1
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CUYLIWAAAYJKJH-RYUDHWBXSA-N Gly-Glu-Tyr Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CUYLIWAAAYJKJH-RYUDHWBXSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- FSPVILZGHUJOHS-QWRGUYRKSA-N Gly-His-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 FSPVILZGHUJOHS-QWRGUYRKSA-N 0.000 description 1
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 1
- HKSNHPVETYYJBK-LAEOZQHASA-N Gly-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN HKSNHPVETYYJBK-LAEOZQHASA-N 0.000 description 1
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- LLZXNUUIBOALNY-QWRGUYRKSA-N Gly-Leu-Lys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN LLZXNUUIBOALNY-QWRGUYRKSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- YKJUITHASJAGHO-HOTGVXAUSA-N Gly-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN YKJUITHASJAGHO-HOTGVXAUSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 1
- NZOAFWHVAFJERA-OALUTQOASA-N Gly-Phe-Trp Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O NZOAFWHVAFJERA-OALUTQOASA-N 0.000 description 1
- OCPPBNKYGYSLOE-IUCAKERBSA-N Gly-Pro-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN OCPPBNKYGYSLOE-IUCAKERBSA-N 0.000 description 1
- JNGHLWWFPGIJER-STQMWFEESA-N Gly-Pro-Tyr Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JNGHLWWFPGIJER-STQMWFEESA-N 0.000 description 1
- BMWFDYIYBAFROD-WPRPVWTQSA-N Gly-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN BMWFDYIYBAFROD-WPRPVWTQSA-N 0.000 description 1
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 1
- WRFOZIJRODPLIA-QWRGUYRKSA-N Gly-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O WRFOZIJRODPLIA-QWRGUYRKSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 241000724709 Hepatitis delta virus Species 0.000 description 1
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 1
- VCDNHBNNPCDBKV-DLOVCJGASA-N His-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VCDNHBNNPCDBKV-DLOVCJGASA-N 0.000 description 1
- PQKCQZHAGILVIM-NKIYYHGXSA-N His-Glu-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O PQKCQZHAGILVIM-NKIYYHGXSA-N 0.000 description 1
- NTXIJPDAHXSHNL-ONGXEEELSA-N His-Gly-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NTXIJPDAHXSHNL-ONGXEEELSA-N 0.000 description 1
- WJGSTIMGSIWHJX-HVTMNAMFSA-N His-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WJGSTIMGSIWHJX-HVTMNAMFSA-N 0.000 description 1
- MPXGJGBXCRQQJE-MXAVVETBSA-N His-Ile-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O MPXGJGBXCRQQJE-MXAVVETBSA-N 0.000 description 1
- JENKOCSDMSVWPY-SRVKXCTJSA-N His-Leu-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O JENKOCSDMSVWPY-SRVKXCTJSA-N 0.000 description 1
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 1
- KYFGGRHWLFZXPU-KKUMJFAQSA-N His-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N KYFGGRHWLFZXPU-KKUMJFAQSA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- CUEQQFOGARVNHU-VGDYDELISA-N His-Ser-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUEQQFOGARVNHU-VGDYDELISA-N 0.000 description 1
- XVZJRZQIHJMUBG-TUBUOCAGSA-N His-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CN=CN1)N XVZJRZQIHJMUBG-TUBUOCAGSA-N 0.000 description 1
- PBJOQLUVSGXRSW-YTQUADARSA-N His-Trp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CC4=CN=CN4)N)C(=O)O PBJOQLUVSGXRSW-YTQUADARSA-N 0.000 description 1
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 1
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 1
- GBMSSORHVHAYLU-QTKMDUPCSA-N His-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CN=CN1)N)O GBMSSORHVHAYLU-QTKMDUPCSA-N 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 1
- JXUGDUWBMKIJDC-NAKRPEOUSA-N Ile-Ala-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JXUGDUWBMKIJDC-NAKRPEOUSA-N 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- RSDHVTMRXSABSV-GHCJXIJMSA-N Ile-Asn-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N RSDHVTMRXSABSV-GHCJXIJMSA-N 0.000 description 1
- QYOGJYIRKACXEP-SLBDDTMCSA-N Ile-Asn-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N QYOGJYIRKACXEP-SLBDDTMCSA-N 0.000 description 1
- WNQKUUQIVDDAFA-ZPFDUUQYSA-N Ile-Gln-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N WNQKUUQIVDDAFA-ZPFDUUQYSA-N 0.000 description 1
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 1
- IXEFKXAGHRQFAF-HVTMNAMFSA-N Ile-Glu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IXEFKXAGHRQFAF-HVTMNAMFSA-N 0.000 description 1
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 1
- WUKLZPHVWAMZQV-UKJIMTQDSA-N Ile-Glu-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N WUKLZPHVWAMZQV-UKJIMTQDSA-N 0.000 description 1
- UQXADIGYEYBJEI-DJFWLOJKSA-N Ile-His-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N UQXADIGYEYBJEI-DJFWLOJKSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- MTONDYJJCIBZTK-PEDHHIEDSA-N Ile-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCSC)C(=O)O)N MTONDYJJCIBZTK-PEDHHIEDSA-N 0.000 description 1
- KBAPKNDWAGVGTH-IGISWZIWSA-N Ile-Ile-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KBAPKNDWAGVGTH-IGISWZIWSA-N 0.000 description 1
- QZZIBQZLWBOOJH-PEDHHIEDSA-N Ile-Ile-Val Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)O QZZIBQZLWBOOJH-PEDHHIEDSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- RQQCJTLBSJMVCR-DSYPUSFNSA-N Ile-Leu-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N RQQCJTLBSJMVCR-DSYPUSFNSA-N 0.000 description 1
- PNTWNAXGBOZMBO-MNXVOIDGSA-N Ile-Lys-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N PNTWNAXGBOZMBO-MNXVOIDGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- FJWALBCCVIHZBS-QXEWZRGKSA-N Ile-Met-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N FJWALBCCVIHZBS-QXEWZRGKSA-N 0.000 description 1
- NPAYJTAXWXJKLO-NAKRPEOUSA-N Ile-Met-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N NPAYJTAXWXJKLO-NAKRPEOUSA-N 0.000 description 1
- IIWQTXMUALXGOV-PCBIJLKTSA-N Ile-Phe-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)O)C(=O)O)N IIWQTXMUALXGOV-PCBIJLKTSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- LRAUKBMYHHNADU-DKIMLUQUSA-N Ile-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)CC)CC1=CC=CC=C1 LRAUKBMYHHNADU-DKIMLUQUSA-N 0.000 description 1
- XHBYEMIUENPZLY-GMOBBJLQSA-N Ile-Pro-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O XHBYEMIUENPZLY-GMOBBJLQSA-N 0.000 description 1
- IVXJIMGDOYRLQU-XUXIUFHCSA-N Ile-Pro-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O IVXJIMGDOYRLQU-XUXIUFHCSA-N 0.000 description 1
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- WLRJHVNFGAOYPS-HJPIBITLSA-N Ile-Ser-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N WLRJHVNFGAOYPS-HJPIBITLSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- KWHFUMYCSPJCFQ-NGTWOADLSA-N Ile-Thr-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N KWHFUMYCSPJCFQ-NGTWOADLSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- FXJLRZFMKGHYJP-CFMVVWHZSA-N Ile-Tyr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FXJLRZFMKGHYJP-CFMVVWHZSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- REPPKAMYTOJTFC-DCAQKATOSA-N Leu-Arg-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O REPPKAMYTOJTFC-DCAQKATOSA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- DLCXCECTCPKKCD-GUBZILKMSA-N Leu-Gln-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DLCXCECTCPKKCD-GUBZILKMSA-N 0.000 description 1
- KAFOIVJDVSZUMD-DCAQKATOSA-N Leu-Gln-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-DCAQKATOSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- CIVKXGPFXDIQBV-WDCWCFNPSA-N Leu-Gln-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CIVKXGPFXDIQBV-WDCWCFNPSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- NEEOBPIXKWSBRF-IUCAKERBSA-N Leu-Glu-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O NEEOBPIXKWSBRF-IUCAKERBSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 1
- HRTRLSRYZZKPCO-BJDJZHNGSA-N Leu-Ile-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O HRTRLSRYZZKPCO-BJDJZHNGSA-N 0.000 description 1
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- FKQPWMZLIIATBA-AJNGGQMLSA-N Leu-Lys-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FKQPWMZLIIATBA-AJNGGQMLSA-N 0.000 description 1
- YESNGRDJQWDYLH-KKUMJFAQSA-N Leu-Phe-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N YESNGRDJQWDYLH-KKUMJFAQSA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- SYRTUBLKWNDSDK-DKIMLUQUSA-N Leu-Phe-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYRTUBLKWNDSDK-DKIMLUQUSA-N 0.000 description 1
- LFSQWRSVPNKJGP-WDCWCFNPSA-N Leu-Thr-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O LFSQWRSVPNKJGP-WDCWCFNPSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- HQBOMRTVKVKFMN-WDSOQIARSA-N Leu-Trp-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O HQBOMRTVKVKFMN-WDSOQIARSA-N 0.000 description 1
- SXOFUVGLPHCPRQ-KKUMJFAQSA-N Leu-Tyr-Cys Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(O)=O SXOFUVGLPHCPRQ-KKUMJFAQSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 239000006137 Luria-Bertani broth Substances 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 1
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- ZAENPHCEQXALHO-GUBZILKMSA-N Lys-Cys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZAENPHCEQXALHO-GUBZILKMSA-N 0.000 description 1
- GGNOBVSOZPHLCE-GUBZILKMSA-N Lys-Gln-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GGNOBVSOZPHLCE-GUBZILKMSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- IRRZDAIFYHNIIN-JYJNAYRXSA-N Lys-Gln-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IRRZDAIFYHNIIN-JYJNAYRXSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- LPAJOCKCPRZEAG-MNXVOIDGSA-N Lys-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN LPAJOCKCPRZEAG-MNXVOIDGSA-N 0.000 description 1
- ZASPELYMPSACER-HOCLYGCPSA-N Lys-Gly-Trp Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O ZASPELYMPSACER-HOCLYGCPSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- IVFUVMSKSFSFBT-NHCYSSNCSA-N Lys-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN IVFUVMSKSFSFBT-NHCYSSNCSA-N 0.000 description 1
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- WAIHHELKYSFIQN-XUXIUFHCSA-N Lys-Ile-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O WAIHHELKYSFIQN-XUXIUFHCSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- ATNKHRAIZCMCCN-BZSNNMDCSA-N Lys-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N ATNKHRAIZCMCCN-BZSNNMDCSA-N 0.000 description 1
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 1
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 1
- ZVZRQKJOQQAFCF-ULQDDVLXSA-N Lys-Tyr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZVZRQKJOQQAFCF-ULQDDVLXSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- OHMKUHXCDSCOMT-QXEWZRGKSA-N Met-Asn-Val Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHMKUHXCDSCOMT-QXEWZRGKSA-N 0.000 description 1
- SQUTUWHAAWJYES-GUBZILKMSA-N Met-Asp-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SQUTUWHAAWJYES-GUBZILKMSA-N 0.000 description 1
- AVTWKENDGGUWDC-BQBZGAKWSA-N Met-Cys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O AVTWKENDGGUWDC-BQBZGAKWSA-N 0.000 description 1
- PTYVBBNIAQWUFV-DCAQKATOSA-N Met-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N PTYVBBNIAQWUFV-DCAQKATOSA-N 0.000 description 1
- MYKLINMAGAIRPJ-CIUDSAMLSA-N Met-Gln-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MYKLINMAGAIRPJ-CIUDSAMLSA-N 0.000 description 1
- YCUSPBPZVJDMII-YUMQZZPRSA-N Met-Gly-Glu Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O YCUSPBPZVJDMII-YUMQZZPRSA-N 0.000 description 1
- QZPXMHVKPHJNTR-DCAQKATOSA-N Met-Leu-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O QZPXMHVKPHJNTR-DCAQKATOSA-N 0.000 description 1
- MIAZEQZXAFTCCG-UBHSHLNASA-N Met-Phe-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 MIAZEQZXAFTCCG-UBHSHLNASA-N 0.000 description 1
- RMLLCGYYVZKKRT-CIUDSAMLSA-N Met-Ser-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O RMLLCGYYVZKKRT-CIUDSAMLSA-N 0.000 description 1
- FXBKQTOGURNXSL-HJGDQZAQSA-N Met-Thr-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCC(O)=O FXBKQTOGURNXSL-HJGDQZAQSA-N 0.000 description 1
- TWEWRDAAIYBJTO-ULQDDVLXSA-N Met-Tyr-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N TWEWRDAAIYBJTO-ULQDDVLXSA-N 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 101100078999 Mus musculus Mx1 gene Proteins 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 201000004458 Myoma Diseases 0.000 description 1
- AFCARXCZXQIEQB-UHFFFAOYSA-N N-[3-oxo-3-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propyl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(CCNC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 AFCARXCZXQIEQB-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- KIEPQOIQHFKQLK-PCBIJLKTSA-N Phe-Asn-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KIEPQOIQHFKQLK-PCBIJLKTSA-N 0.000 description 1
- KAHUBGWSIQNZQQ-KKUMJFAQSA-N Phe-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KAHUBGWSIQNZQQ-KKUMJFAQSA-N 0.000 description 1
- MQVFHOPCKNTHGT-MELADBBJSA-N Phe-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O MQVFHOPCKNTHGT-MELADBBJSA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- UAMFZRNCIFFMLE-FHWLQOOXSA-N Phe-Glu-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N UAMFZRNCIFFMLE-FHWLQOOXSA-N 0.000 description 1
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- FINLZXKJWTYYLC-ACRUOGEOSA-N Phe-His-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FINLZXKJWTYYLC-ACRUOGEOSA-N 0.000 description 1
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 1
- KAJLHCWRWDSROH-BZSNNMDCSA-N Phe-Phe-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=CC=C1 KAJLHCWRWDSROH-BZSNNMDCSA-N 0.000 description 1
- MGLBSROLWAWCKN-FCLVOEFKSA-N Phe-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MGLBSROLWAWCKN-FCLVOEFKSA-N 0.000 description 1
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 1
- GZGPMBKUJDRICD-ULQDDVLXSA-N Phe-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O GZGPMBKUJDRICD-ULQDDVLXSA-N 0.000 description 1
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- QUUCAHIYARMNBL-FHWLQOOXSA-N Phe-Tyr-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N QUUCAHIYARMNBL-FHWLQOOXSA-N 0.000 description 1
- 102000012338 Poly(ADP-ribose) Polymerases Human genes 0.000 description 1
- 108010061844 Poly(ADP-ribose) Polymerases Proteins 0.000 description 1
- 229920000776 Poly(Adenosine diphosphate-ribose) polymerase Polymers 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 1
- WWAQEUOYCYMGHB-FXQIFTODSA-N Pro-Asn-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 WWAQEUOYCYMGHB-FXQIFTODSA-N 0.000 description 1
- SWXSLPHTJVAWDF-VEVYYDQMSA-N Pro-Asn-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWXSLPHTJVAWDF-VEVYYDQMSA-N 0.000 description 1
- SKICPQLTOXGWGO-GARJFASQSA-N Pro-Gln-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O SKICPQLTOXGWGO-GARJFASQSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- XQHGISDMVBTGAL-ULQDDVLXSA-N Pro-His-Phe Chemical compound C([C@@H](C(=O)[O-])NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H]1[NH2+]CCC1)C1=CC=CC=C1 XQHGISDMVBTGAL-ULQDDVLXSA-N 0.000 description 1
- KWMUAKQOVYCQJQ-ZPFDUUQYSA-N Pro-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@@H]1CCCN1 KWMUAKQOVYCQJQ-ZPFDUUQYSA-N 0.000 description 1
- FKVNLUZHSFCNGY-RVMXOQNASA-N Pro-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 FKVNLUZHSFCNGY-RVMXOQNASA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- KLSOMAFWRISSNI-OSUNSFLBSA-N Pro-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 KLSOMAFWRISSNI-OSUNSFLBSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- INDVYIOKMXFQFM-SRVKXCTJSA-N Pro-Lys-Gln Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O INDVYIOKMXFQFM-SRVKXCTJSA-N 0.000 description 1
- VWHJZETTZDAGOM-XUXIUFHCSA-N Pro-Lys-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VWHJZETTZDAGOM-XUXIUFHCSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- HWLKHNDRXWTFTN-GUBZILKMSA-N Pro-Pro-Cys Chemical compound C1C[C@H](NC1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CS)C(=O)O HWLKHNDRXWTFTN-GUBZILKMSA-N 0.000 description 1
- SVXXJYJCRNKDDE-AVGNSLFASA-N Pro-Pro-His Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NCCC1)C1=CN=CN1 SVXXJYJCRNKDDE-AVGNSLFASA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- ITUDDXVFGFEKPD-NAKRPEOUSA-N Pro-Ser-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ITUDDXVFGFEKPD-NAKRPEOUSA-N 0.000 description 1
- GZNYIXWOIUFLGO-ZJDVBMNYSA-N Pro-Thr-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZNYIXWOIUFLGO-ZJDVBMNYSA-N 0.000 description 1
- VVAWNPIOYXAMAL-KJEVXHAQSA-N Pro-Thr-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VVAWNPIOYXAMAL-KJEVXHAQSA-N 0.000 description 1
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 1
- QHSSUIHLAIWXEE-IHRRRGAJSA-N Pro-Tyr-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O QHSSUIHLAIWXEE-IHRRRGAJSA-N 0.000 description 1
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 1
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- SRTCFKGBYBZRHA-ACZMJKKPSA-N Ser-Ala-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SRTCFKGBYBZRHA-ACZMJKKPSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- IDCKUIWEIZYVSO-WFBYXXMGSA-N Ser-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C)C(O)=O)=CNC2=C1 IDCKUIWEIZYVSO-WFBYXXMGSA-N 0.000 description 1
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 1
- QGMLKFGTGXWAHF-IHRRRGAJSA-N Ser-Arg-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QGMLKFGTGXWAHF-IHRRRGAJSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- WXWDPFVKQRVJBJ-CIUDSAMLSA-N Ser-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N WXWDPFVKQRVJBJ-CIUDSAMLSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- COLJZWUVZIXSSS-CIUDSAMLSA-N Ser-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N COLJZWUVZIXSSS-CIUDSAMLSA-N 0.000 description 1
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 1
- CDVFZMOFNJPUDD-ACZMJKKPSA-N Ser-Gln-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CDVFZMOFNJPUDD-ACZMJKKPSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- BKZYBLLIBOBOOW-GHCJXIJMSA-N Ser-Ile-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O BKZYBLLIBOBOOW-GHCJXIJMSA-N 0.000 description 1
- CJINPXGSKSZQNE-KBIXCLLPSA-N Ser-Ile-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O CJINPXGSKSZQNE-KBIXCLLPSA-N 0.000 description 1
- HBTCFCHYALPXME-HTFCKZLJSA-N Ser-Ile-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HBTCFCHYALPXME-HTFCKZLJSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- FKZSXTKZLPPHQU-GQGQLFGLSA-N Ser-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CO)N FKZSXTKZLPPHQU-GQGQLFGLSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 1
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 1
- FPCGZYMRFFIYIH-CIUDSAMLSA-N Ser-Lys-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O FPCGZYMRFFIYIH-CIUDSAMLSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- XQAPEISNMXNKGE-FXQIFTODSA-N Ser-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CS)C(=O)O XQAPEISNMXNKGE-FXQIFTODSA-N 0.000 description 1
- AZWNCEBQZXELEZ-FXQIFTODSA-N Ser-Pro-Ser Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O AZWNCEBQZXELEZ-FXQIFTODSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- FZXOPYUEQGDGMS-ACZMJKKPSA-N Ser-Ser-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZXOPYUEQGDGMS-ACZMJKKPSA-N 0.000 description 1
- OLKICIBQRVSQMA-SRVKXCTJSA-N Ser-Ser-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OLKICIBQRVSQMA-SRVKXCTJSA-N 0.000 description 1
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 1
- ZSDXEKUKQAKZFE-XAVMHZPKSA-N Ser-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N)O ZSDXEKUKQAKZFE-XAVMHZPKSA-N 0.000 description 1
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 241000601368 Syntrophomonas palmitatica Species 0.000 description 1
- 239000008051 TBE buffer Substances 0.000 description 1
- 108010076818 TEV protease Proteins 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- JMQUAZXYFAEOIH-XGEHTFHBSA-N Thr-Arg-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O JMQUAZXYFAEOIH-XGEHTFHBSA-N 0.000 description 1
- XVNZSJIKGJLQLH-RCWTZXSCSA-N Thr-Arg-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCSC)C(=O)O)N)O XVNZSJIKGJLQLH-RCWTZXSCSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- PAOYNIKMYOGBMR-PBCZWWQYSA-N Thr-Asn-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PAOYNIKMYOGBMR-PBCZWWQYSA-N 0.000 description 1
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- YAAPRMFURSENOZ-KATARQTJSA-N Thr-Cys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N)O YAAPRMFURSENOZ-KATARQTJSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- VGYBYGQXZJDZJU-XQXXSGGOSA-N Thr-Glu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VGYBYGQXZJDZJU-XQXXSGGOSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- DDDLIMCZFKOERC-SVSWQMSJSA-N Thr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N DDDLIMCZFKOERC-SVSWQMSJSA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- JWQNAFHCXKVZKZ-UVOCVTCTSA-N Thr-Lys-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWQNAFHCXKVZKZ-UVOCVTCTSA-N 0.000 description 1
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 1
- IQPWNQRRAJHOKV-KATARQTJSA-N Thr-Ser-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN IQPWNQRRAJHOKV-KATARQTJSA-N 0.000 description 1
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 101800005109 Triakontatetraneuropeptide Proteins 0.000 description 1
- GHXXDFDIDHIEIL-WFBYXXMGSA-N Trp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GHXXDFDIDHIEIL-WFBYXXMGSA-N 0.000 description 1
- PEYSVKMXSLPQRU-FJHTZYQYSA-N Trp-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O PEYSVKMXSLPQRU-FJHTZYQYSA-N 0.000 description 1
- KZIQDVNORJKTMO-WDSOQIARSA-N Trp-Arg-His Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N KZIQDVNORJKTMO-WDSOQIARSA-N 0.000 description 1
- JLTQXEOXIJMCLZ-ZVZYQTTQSA-N Trp-Gln-Val Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O)=CNC2=C1 JLTQXEOXIJMCLZ-ZVZYQTTQSA-N 0.000 description 1
- HJXOFWKCWLHYIJ-SZMVWBNQSA-N Trp-Lys-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HJXOFWKCWLHYIJ-SZMVWBNQSA-N 0.000 description 1
- RERRMBXDSFMBQE-ZFWWWQNUSA-N Trp-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RERRMBXDSFMBQE-ZFWWWQNUSA-N 0.000 description 1
- PWPJLBWYRTVYQS-PMVMPFDFSA-N Trp-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PWPJLBWYRTVYQS-PMVMPFDFSA-N 0.000 description 1
- UHXOYRWHIQZAKV-SZMVWBNQSA-N Trp-Pro-Arg Chemical compound O=C([C@H](CC=1C2=CC=CC=C2NC=1)N)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O UHXOYRWHIQZAKV-SZMVWBNQSA-N 0.000 description 1
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 1
- GEGYPBOPIGNZIF-CWRNSKLLSA-N Trp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)O GEGYPBOPIGNZIF-CWRNSKLLSA-N 0.000 description 1
- WTRQBSSQBKRNKV-MNSWYVGCSA-N Trp-Thr-Tyr Chemical compound C([C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)[C@H](O)C)C(O)=O)C1=CC=C(O)C=C1 WTRQBSSQBKRNKV-MNSWYVGCSA-N 0.000 description 1
- MBLJBGZWLHTJBH-SZMVWBNQSA-N Trp-Val-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 MBLJBGZWLHTJBH-SZMVWBNQSA-N 0.000 description 1
- JONPRIHUYSPIMA-UWJYBYFXSA-N Tyr-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JONPRIHUYSPIMA-UWJYBYFXSA-N 0.000 description 1
- KSVMDJJCYKIXTK-IGNZVWTISA-N Tyr-Ala-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 KSVMDJJCYKIXTK-IGNZVWTISA-N 0.000 description 1
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 1
- ADBDQGBDNUTRDB-ULQDDVLXSA-N Tyr-Arg-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O ADBDQGBDNUTRDB-ULQDDVLXSA-N 0.000 description 1
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- YWXMGBUGMLJMIP-IHPCNDPISA-N Tyr-Cys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC3=CC=C(C=C3)O)N YWXMGBUGMLJMIP-IHPCNDPISA-N 0.000 description 1
- ARPONUQDNWLXOZ-KKUMJFAQSA-N Tyr-Gln-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ARPONUQDNWLXOZ-KKUMJFAQSA-N 0.000 description 1
- USYGMBIIUDLYHJ-GVARAGBVSA-N Tyr-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 USYGMBIIUDLYHJ-GVARAGBVSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- HHFMNAVFGBYSAT-IGISWZIWSA-N Tyr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HHFMNAVFGBYSAT-IGISWZIWSA-N 0.000 description 1
- FJBCEFPCVPHPPM-STECZYCISA-N Tyr-Ile-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O FJBCEFPCVPHPPM-STECZYCISA-N 0.000 description 1
- MVFQLSPDMMFCMW-KKUMJFAQSA-N Tyr-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O MVFQLSPDMMFCMW-KKUMJFAQSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- UPODKYBYUBTWSV-BZSNNMDCSA-N Tyr-Phe-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=C(O)C=C1 UPODKYBYUBTWSV-BZSNNMDCSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- NHOVZGFNTGMYMI-KKUMJFAQSA-N Tyr-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NHOVZGFNTGMYMI-KKUMJFAQSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 1
- RIVVDNTUSRVTQT-IRIUXVKKSA-N Tyr-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O RIVVDNTUSRVTQT-IRIUXVKKSA-N 0.000 description 1
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 1
- JQOMHZMWQHXALX-FHWLQOOXSA-N Tyr-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JQOMHZMWQHXALX-FHWLQOOXSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 1
- QGFPYRPIUXBYGR-YDHLFZDLSA-N Val-Asn-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N QGFPYRPIUXBYGR-YDHLFZDLSA-N 0.000 description 1
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- QHDXUYOYTPWCSK-RCOVLWMOSA-N Val-Asp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)NCC(=O)O)N QHDXUYOYTPWCSK-RCOVLWMOSA-N 0.000 description 1
- FPCIBLUVDNXPJO-XPUUQOCRSA-N Val-Cys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FPCIBLUVDNXPJO-XPUUQOCRSA-N 0.000 description 1
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 1
- PGBJAZDAEWPDAA-NHCYSSNCSA-N Val-Gln-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCSC)C(=O)O)N PGBJAZDAEWPDAA-NHCYSSNCSA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- UEHRGZCNLSWGHK-DLOVCJGASA-N Val-Glu-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UEHRGZCNLSWGHK-DLOVCJGASA-N 0.000 description 1
- PMDOQZFYGWZSTK-LSJOCFKGSA-N Val-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C PMDOQZFYGWZSTK-LSJOCFKGSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- PTFPUAXGIKTVNN-ONGXEEELSA-N Val-His-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N PTFPUAXGIKTVNN-ONGXEEELSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- MBGFDZDWMDLXHQ-GUBZILKMSA-N Val-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](C(C)C)N MBGFDZDWMDLXHQ-GUBZILKMSA-N 0.000 description 1
- YLRAFVVWZRSZQC-DZKIICNBSA-N Val-Phe-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YLRAFVVWZRSZQC-DZKIICNBSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- QTXGUIMEHKCPBH-FHWLQOOXSA-N Val-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 QTXGUIMEHKCPBH-FHWLQOOXSA-N 0.000 description 1
- LPQOADBMXVRBNX-UHFFFAOYSA-N ac1ldcw0 Chemical compound Cl.C1CN(C)CCN1C1=C(F)C=C2C(=O)C(C(O)=O)=CN3CCSC1=C32 LPQOADBMXVRBNX-UHFFFAOYSA-N 0.000 description 1
- 239000000370 acceptor Substances 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 102000009899 alpha Karyopherins Human genes 0.000 description 1
- 108010077099 alpha Karyopherins Proteins 0.000 description 1
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- -1 aryl amide Chemical class 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- KNHUKKLJHYUCFP-UHFFFAOYSA-N clofibrate Chemical class CCOC(=O)C(C)(C)OC1=CC=C(Cl)C=C1 KNHUKKLJHYUCFP-UHFFFAOYSA-N 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 108010060199 cysteinylproline Proteins 0.000 description 1
- 108010009297 diglycyl-histidine Proteins 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 238000001125 extrusion Methods 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 1
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 108700032552 influenza virus INS1 Proteins 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 1
- 229960004359 iodixanol Drugs 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- HOVAGTYPODGVJG-UHFFFAOYSA-N methyl beta-galactoside Natural products COC1OC(CO)C(O)C(O)C1O HOVAGTYPODGVJG-UHFFFAOYSA-N 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 235000001968 nicotinic acid Nutrition 0.000 description 1
- 230000030147 nuclear export Effects 0.000 description 1
- 239000011824 nuclear material Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 108010091617 pentalysine Proteins 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 239000013646 rAAV2 vector Substances 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- NMEHNETUFHBYEG-IHKSMFQHSA-N tttn Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 NMEHNETUFHBYEG-IHKSMFQHSA-N 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 108010000998 wheylin-2 peptide Proteins 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3519—Fusion with another nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/50—Methods for regulating/modulating their activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本申请文件提供了具有增强的编辑效率的工程化CRISPR/Cas12f1系统及其用途。具体而言,本申请文件提供了富含U的尾序列,可将所述富含U的尾序列掺入工程化的引导RNA中,以增强CRISPR/Cas12f1系统的编辑效率。富含U的尾序列的特征在于含有丰富的尿苷,并且根据引导RNA的表达环境和实际使用环境,可进一步包含除尿苷之外的其它核酸。本发明人实验性地阐释了富含U的尾序列的结构、掺入位置及效果,并在本申请文件中予以公开。
Description
技术领域
本公开涉及用于其中将CRISPR/Cas系统、特别是CRISPR/Cas12f1系统用于基因编辑的领域中的技术。
背景技术
CRISPR/Cas12f1系统是一种被归类为2类V型的CRISPR/Cas系统。之前的研究(Harrington等,Programmed DNA destruction by miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018))首次报道了作为CRISPR/Cas14的CRISPR/Cas系统,这是一种由古细菌衍生而来的CRISPR/Cas系统。此后,随后的研究(Karvelis等,Nucleic AcidsResearch,Vol.48,No.9 5017(2020))将CRISPR/Cas14系统归类为CRISPR/Cas12f系统。CRISPR/Cas12f1系统属于V-F1系统(CRISPR/Cas系统中的一个亚型,被归类为2类V型),并且包括具有Cas14a作为效应蛋白的CRISPR/Cas14a系统。与CRISPR/Cas9系统相比,CRISPR/Cas12f1系统的特征在于效应蛋白的尺寸紧凑。然而,正如之前的研究(Harington等,Programmed DNA destruction by miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018),US 2020/0190494 A1)所揭示的,CRISPR/Cas12f1系统、特别是CRISPR/Cas14a系统表现出切割单链DNA的能力,但对双链DNA没有或有极低的切割活性,使其在基因编辑技术中的应用受到限制。
发明内容
技术问题
本公开的方面提供了基因编辑效率提高的工程化的CRISPR/Cas12f1系统。
本公开的方面提供了工程化的CRISPR/Cas12f1系统,所述工程化的CRISPR/Cas12f1系统具有富含尿嘧啶(U)的尾序列。
本公开的方面提供了用于工程化CRISPR/Cas12f1系统的工程化的crRNA,所述工程化的crRNA具有富含U的尾序列。
本公开的方面提供了用于工程化CRISPR/Cas12f1系统的工程化的引导RNA,所述工程化的引导RNA具有富含U的尾序列。
本公开的方面提供了工程化CRISPR/Cas12f1复合体,所述工程化的CRISPR/Cas12f1复合体用于工程化的CRISPR/Cas12f1系统,所述工程化CRISPR/Cas12f1复合体具有富含U的尾序列。
本公开的方面提供了具有编码工程化的CRISPR/Cas12f1系统的各组分的核酸序列的载体。
本公开的方面提供了使用工程化的CRISPR/Cas12f1系统的基因编辑方法。
本公开的方面提供了工程化的CRISPR/Cas12f1系统的用途。
技术方案
在实施方式中,本公开的方面提供了用于CRISPR/Cas12f1系统的工程化的CRISPRRNA(crRNA),所述CRISPR/Cas12f1系统能够编辑包含靶序列的核酸,所述工程化的CRISPRRNA包含:
CRISPR RNA重复序列;
间隔序列,所述间隔序列与所述靶序列互补;以及
富含U的尾序列,所述富含U的尾序列连接至所述间隔序列的3'末端,
其中,所述富含U的尾序列由(UaN)nUb表示,
N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种,
a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数,并且
所述工程化的CRISPR RNA包含在5'-3'方向上按顺序连接的所述CRISPR RNA重复序列、所述间隔序列和所述富含U的尾序列。
在实施方式中,本公开的方面提供了具有编码所述工程化的crRNA的序列的DNA。
在实施方式中,富含U的尾序列可为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。
在实施方式中,所述CRISPR RNA重复序列可为SEQ ID NO:58的序列。
在实施方式中,本公开的方面提供了能够编辑包含靶序列的核酸的CRISPR/Cas12f1系统的工程化的引导RNA,所述工程化的引导RNA包含:
tracrRNA序列;
crRNA序列,所述crRNA序列包含CRISPR RNA重复序列和与所述靶序列互补的间隔序列;以及
富含U的尾序列,所述富含U的尾序列连接至所述间隔序列的3'-末端,
其中,所述富含U的尾序列由(UaN)nUb表示,
N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种,
a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
在实施方式中,所述工程化的引导RNA进一步包含接头序列,所述tracrRNA序列和所述crRNA序列通过所述接头序列连接。
在实施方式中,所述接头序列可为5'-gaaa-3'。
在实施方式中,所述富含U的尾序列可为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。
在实施方式中,本公开的方面提供了具有编码所述工程化的引导RNA的序列的DNA。
在实施方式中,本公开的方面提供了工程化CRISPR/Cas12f1复合体,所述工程化CRISPR/Cas12f1复合体能够编辑包含靶序列的核酸,所述工程化CRISPR/Cas12f1复合体包含Cas12f1蛋白以及工程化的引导RNA,
所述Cas12f1蛋白属于CRISPR14系统类型;
所述工程化的引导RNA包含:支架序列,所述支架序列与所述Cas12f1蛋白相互作用;间隔序列,所述间隔序列与所述靶序列互补;以及富含U的尾序列,
其中,所述富含U的尾序列由(UaN)nUb表示,
N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种,并且
a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
在实施方式中,本公开的方面提供了用于表达工程化CRISPR/Cas12f1复合体的载体,所述工程化CRISPR/Cas12f1复合体能够编辑包含靶序列的核酸,所述载体包含:
第一序列,所述第一序列包含编码Cas12f1蛋白的序列;
第一启动子序列,所述第一启动子序列可操作地连接至所述第一序列;
第二序列,所述第二序列包含编码工程化的引导RNA的序列,以及
第二启动子序列,所述第二启动子序列可操作地连接至所述第二序列,
其中,所述工程化的引导RNA具有与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列、以及连接至所述间隔序列的3'-末端的富含U的尾序列,
所述富含U的尾序列由(UaN)nUb表示,
N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种,并且
a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数,
其中,将所述载体构建为表达所述Cas12fl蛋白和所述工程化的引导RNA,
因此,所述Cas12f1蛋白和所述工程化的引导RNA在细胞中形成CRISPR/Cas12f1复合体,并且
所述包含靶序列的核酸可被所述CRISPR/Cas12f1复合体编辑。
在实施方式中,所述第二启动子序列可为U6启动子序列。
在实施方式中,所述载体可为质粒载体。
在实施方式中,所述载体可为病毒载体。
在实施方式中,所述载体可为选自于由以下所组成的组中的一种或多种:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。
在实施方式中,所述载体可为线性PCR扩增子。
本公开的方面提供了用于表达工程化CRISPR/Cas12f1复合体的载体,所述工程化CRISPR/Cas12f1复合体能够编辑包含第一靶序列和第二靶序列的核酸,所述载体包含:
第一序列,所述第一序列包含编码Cas12f1蛋白的序列;
第一启动子序列,所述第一启动子序列可操作地连接至所述第一序列;
第二序列,所述第二序列包含编码第一工程化的引导RNA的序列;
第二启动子序列,所述第二启动子序列可操作地连接至所述第二序列;
第三序列,所述第三序列包含编码第二工程化的引导RNA的序列;以及
第三启动子序列,所述第三启动子序列可操作地连接至所述第三序列,
其中,所述第一工程化的引导RNA具有与所述Cas12f1蛋白相互作用的第一支架序列、与所述第一靶序列互补的第一间隔序列以及第一富含U的尾序列,其中
所述第一富含U的尾序列由(UaN)nUb表示,
N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种,并且
a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数;
其中,所述第二工程化的引导RNA具有可与所述Cas12f1蛋白相互作用的第二支架序列、与所述第二靶序列互补的第二间隔序列以及第二富含U的尾序列,
所述第二富含U的尾序列由(UaN)nUb表示,
N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种,并且
a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
在实施方式中,所述第二启动子序列和所述第三启动子序列可为相同的启动子序列。
在实施方式中,所述第二启动子序列可为H1启动子序列,所述第三启动子序列可为U6启动子序列。
在实施方式中,本公开的方面提供了用于在细胞中对包含靶序列的核酸进行编辑的方法,所述方法包括:
将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸和工程化的引导RNA或编码所述工程化的引导RNA的核酸递送至所述细胞内,
使得可在所述细胞中形成CRISPR/Cas12f1复合体,并且
所述包含所述靶序列的核酸可被所述CRISPR/Cas12f1复合体编辑,
其中,所述工程化的引导RNA具有与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列以及连接至所述间隔序列的3'-末端的富含U的尾序列,
其中,所述富含U的尾序列由(UaN)nUb表示,
N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种,以及
a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
在实施方式中,在所述递送中,可将所述Cas12f1蛋白和所述工程化的引导RNA以CRISPR/Cas12f1复合体的形式引入所述细胞中。
在实施方式中,在所述递送中,可将包含编码所述Cas12f1蛋白的核酸和编码所述工程化的引导RNA的核酸的载体引入所述细胞中。
在实施方式中,所述载体可选自于由以下所组成的组:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。
在实施方式中,本公开的方面提供了用于在细胞中对包含靶序列的核酸进行编辑的方法,所述方法包括:
使CRISPR/Cas12f1复合体与所述包含所述靶序列的核酸接触,
其中,所述CRISPR/Cas12f1复合体包含Cas12f1蛋白和工程化的引导RNA,
所述工程化的引导RNA包含与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列以及富含U的尾序列,
所述富含U的尾序列由(UaN)nUb表示,
N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种,以及
其中,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
有益效果
本公开提供的具有富含U的尾序列的工程化CRISPR/Cas12f1系统在用于基因编辑时表现出比使用野生型CRISPR/Cas12f1系统时更高的基因编辑效率。
附图说明
图1显示了本公开提供的工程化的引导RNA的示例结构。(a)显示了双引导RNA的结构的示例,其包含CRISPR RNA(crRNA)的重复序列和tracrRNA的一部分。互补序列彼此结合以形成双链RNA。阐述了crRNA部分(CRISPR RNA重复序列部分、间隔序列部分以及富含U的尾序列部分)的名称。(b)显示了单引导RNA的结构示例,其中tracrRNA和crRNA通过接头连接。阐述了CRISPR RNA重复序列部分、间隔序列部分和富含U的尾序列部分的位置。图中所示的各个序列为示例序列。
图2为显示实验例3的结果的图表。(a)为显示在HEK293 T细胞中,携带3'-U4AU6富含U的尾的crRNA序列的CRISPR/Cas12f1系统针对DYTarget2、DYtarget10和DYtarget13的插入缺失效率的图表。就此而言,具有富含U的尾序列的工程化CRISPR/Cas12f1系统的插入缺失效率明显高于野生型CRISPR/Cas12f1系统的插入缺失效率。(b)为显示在HEK293T细胞中,携带U6或U4AU6序列的Cas12f1引导RNA对Intergenic-22显示的插入缺失效率的图表。
图3为显示实验例4的结果的图表。其显示了在HEK293 T细胞中,工程化CRISPR/Cas12f1系统针对靶标1(DYtarget2)、靶标2(DYtarget10)、靶标3(Intergenic-22)的插入缺失效率。无crRNA、标准gRNA和gRNA(MS1)分别是指未经crRNA处理的对照、野生型CRISPR/Cas12f1系统和具有携带U4AU6结构的crRNA的工程化CRISPR/Cas12f1系统的插入缺失效率。
图4为显示实验例7的结果的图表。其显示了在HEK293 T细胞中,CRISPR/Cas12f1系统针对DYtarget2或DYtarget10的插入缺失效率。(a)显示了HEK293 T细胞中DYtarget2的插入缺失效率。WT显示了未处理sgRNA的实验组的插入缺失效率。Ux显示了无U添加到sgRNA间隔序列的3'-末端的实验组的插入缺失效率。U6、U4AU6、U3AU6和U3AU3AU6是指sgRNA的3'-尾序列。
图5为显示实验例8的结果的图表。其显示了在HEK293 T细胞中,工程化CRISPR/Cas12f1系统针对DYtarget2的插入缺失效率。None显示无U添加到sgRNA的实验组的插入缺失效率。T、T2、T3、T4、T4A、T4AT、T4AT2、T4AT3、T4AT4、T4AT5、T4AT6、T4AT7、T4AT8、T4AT4AT和T4AT4AT2是指使用具有分别有U、U2、U3、U4、U4A、U4AU、U4AU2、U4AU3、U4AU4、U4AU5、U4AU6、U4AU7、U4AU8、U4AU4AU和U4AU4AU2结构的3'端序列的工程化sgRNA的实验组的插入缺失效率。
图6为显示实验例9的结果的图表。其显示了在HEK293 T细胞中,CRISPR/Cas12f1系统针对CSMD1的插入缺失效率。None显示无U添加到sgRNA的实验组的插入缺失效率。U、U2、U3、U4、U5、U6、U4A、U4AU、U4AU2、U4AU3、U4AU4、U4AU5、U4AU6、U4AU7、U4AU8、U4AU9和U4AU10示出了在3'-末端显示相应序列的sgRNA的实验组的插入缺失效率。
图7为显示实验例10的结果的图表。其显示了在HEK293 T细胞中,CRISPR/Cas12f1系统针对DYtarget2的插入缺失效率。None是指无U添加到sgRNA的实验组的插入缺失效率。T4AT6和T4GT6分别是指使用具有U4AU6结构的富含U的尾序列的工程化sgRNA的实验组的插入缺失效率,以及使用具有U4GU6结构的富含U的尾序列的工程化sgRNA的实验组的插入缺失效率。
图8为显示实验例11的结果的图表。其显示了在HEK293 T细胞中,工程化CRISPR/Cas12f1系统针对DYtarget2和DYtarget10的插入缺失效率。(a)表明在HEK293 T细胞中,所有实验组中具有U4AU6富含U的尾序列的sgRNA的插入缺失效率。就此而言,图表的水平轴上的18mer、19mer、20mer、21mer、25mer和30mer表明sgRNA的间隔序列的长度。在实验例11的表25中显示了所述间隔序列。(b)表明在HEK293 T细胞中,所有实验组中具有U4AU6富含U的尾序列的sgRNA针对DYtarget10的插入缺失效率。就此而言,图表的水平轴上的17mer、18mer、19mer、20mer、21mer、25mer和30mer表明sgRNA的间隔序列的长度。在实验例11的表24中显示了所述间隔序列。
图9显示了在实验例12-1中使用HA抗体的蛋白质印迹分析结果。就此而言,证实了HEK293 T细胞中AsCas12f1和SpCas12f1效应蛋白得到表达。AsCas12f1和SpCas12f1蛋白的分子量分别显示为56.55kDa和64.65kDa。
具体实施方式
约
如本文所用,术语“约”是指相对于参比的量、水平、值、数目、频率、百分比、尺寸、大小、数量、重量或长度的变化程度为30%、25%、20%、25%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的量、水平、值、数目、频率、百分比、尺寸、大小、数量、重量或长度。
可操作地连接
如本文所用,术语“可操作地连接”是指被连接起来从而使得在基因表达技术中,特定组分容许另一组分以预期方式起作用的状态。例如,启动子序列可操作地连接至编码序列的情况是指连接所述启动子以影响所述编码序列的细胞内转录和/或表达。此外,该术语包括能够为本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
靶基因或靶核酸
如本文所用,“靶基因”或“靶核酸”基本上是指可被CRISPR系统靶向的细胞内基因或核酸。靶基因或靶核酸可互换使用,并且可指同一对象。除非另有描述,靶基因或靶核酸可指靶细胞所具有的独特基因或核酸,也可为外部衍生的基因或核酸,并且只要其可为基因编辑的靶标,就没有特别限制。靶基因或靶核酸可为单链DNA、双链DNA和/或RNA。此外,该术语包括能够为本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
靶序列
如本文所用,“靶序列”是指CRISPR/Cas复合体识别以对靶基因或靶核酸进行切割的特定序列。可根据其目的适当地选择靶序列。具体而言,“靶序列”为靶基因或靶核酸序列中包含的序列,是指与本说明书中提供的工程化的引导RNA或引导RNA中包含的间隔序列互补的序列。通常,间隔序列是考虑靶基因或靶核酸序列以及被CRISPR/Cas系统的效应蛋白识别的PAM序列来确定的。靶序列可仅指互补结合至CRISPR/Cas复合体的引导RNA的特定链,也可指包含特定链部分的整个靶双链,可根据上下文对其进行适当解释。此外,该术语包括能够为本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
载体
如本文所用,除非另有规定,“载体”统指所有能够将遗传物质携带至细胞中的物质。例如,载体可为DNA分子,包括感兴趣的遗传物质,例如编码CRISPR/Cas系统的效应蛋白的核酸,和/或编码引导RNA的核酸,但不限于此。该术语包括能够为本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
工程化的
如本文所用,“工程化的”是用于与具有自然界已经存在的结构的材料、分子等进行区分的术语,并指其中的材料、分子等经人工修饰的材料、分子等。例如,“工程化的引导RNA”的情况是指其中的自然界中存在的引导RNA的组成经人工修饰的引导RNA。此外,该术语包括能够为本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
核定位序列或信号(NLS)
如本文所用,“NLS”是指在通过核运输行动将细胞核外的物质运输至核内时通过附着至待运输的蛋白来充当一种“标签”的具有一定长度的肽或其序列。具体而言,NLS可为:具有氨基酸序列PKKKRKV(SEQ ID NO:237)的SV40病毒大T抗原的NLS;来自核质蛋白的NLS(例如,具有序列KRPAATKKAGQAKKKK(SEQ ID NO:238)的双分型核质蛋白(nucleoplasmin bipartite)NLS);具有氨基酸序列PAAKRVKLD(SEQ ID NO:239)或RQRRNELKRSP(SEQ ID NO:240)的c-myc NLS;具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:241)的hRNPA1M9NLS;来自输入蛋白-α(importin-α)的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:242);肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:243)和PPKKARED(SEQ ID NO:244);人p53的序列PQPKKKPL(SEQ IDNO:245);小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:246);流感病毒NS1的序列DRLRR(SEQ ID NO:247)和PKQKKRK(SEQ ID NO:248);肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ IDNO:249);小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:250);人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:251);或由类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:252)衍生而来的NLS序列,但不限于此。如本文所用,术语“NLS”包括能够为本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
核输出序列或信号(NES)
如本文所用,“NES”是指当通过核运输行动将细胞核中的物质运输到核外时通过附着至待运输的蛋白来充当一种“标签”的具有一定长度的肽或其序列。如本文所用,术语“NES”包括能够为本领域技术人员认可的所有含义,并且可根据上下文适当地解释。
标签
如本文所用,“标签”统指添加以便于肽或蛋白质的示踪和/或分离和纯化的功能结构域。具体而言,标签包括:标签蛋白,如组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx);自体荧光蛋白,如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、青色荧光蛋白(CFP)、蓝色荧光蛋白(BFP)、HcRED和DsRed;以及报告基因,如谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶和荧光素酶,但不限于此。如本文所用,术语“标签”包括能够为本领域技术人员认可的所有含义,并且可根据上下文进行适当解释。
背景技术-CRISPR/Cas12f1系统
概述
自然界中存在各种类型的CRISPR/Cas系统,并且仍在发现新的CRISPR/Cas系统。其中,本公开中提供的CRISPR/Cas12f1系统具体属于2类,V型的分类,是属于Cas14家族的CRISPR/Cas系统(Harrington等,Programmed DNA destruction by miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018))。下面,对本公开中提供的CRISPR/Cas12f1系统属于何种分类进行说明。
2类CRISPR/Cas系统
CRISPR/Cas系统大致分为1类和2类。其中,2类CRISPR/Cas系统的特征在于其效应复合体包含具有多个结构域的大的单个蛋白。在2类CRISPR/Cas系统中,II型CRISPR/Cas9系统具有代表性,而正在积极研究的用于基因编辑应用的CRISPR/Cas系统(例如CRISPR/Cpf1系统)通常属于2类。
V型CRISPR/Cas系统
2类CRISPR/Cas系统分为II型、V型和VI型。其中,本公开中提供的CRISPR/Cas12f1系统属于V型CRISPR/Cas系统。V型CRISPR/Cas系统的一种效应蛋白命名为Cas12,根据详细分类命名为Cas12a、Cas12b等。Cas12蛋白具有一个核酸酶结构域(RuvC样核酸酶),这是与具有两个核酸酶结构域(HNH和RuvC结构域)的II型效应蛋白(例如Cas9蛋白)不同的特征。迄今为止,V型CRISPR/Cas系统分为11个亚型,其中本公开中提供的CRISPR/Cas12f1系统属于V-F1,是V-F亚型中的一种的变体(Makarova等,Nature Reviews,Microbiology,第18卷,67(2020))。
CRISPR/Cas12f1系统
CRISPR/Cas12f系统属于V型CRISPR/Cas系统的V-F亚型,进一步细分为V-F1至V-F3的变体。CRISPR/Cas12f系统包括CRISPR/Cas14系统,包括在先前的研究中命名为Cas14的效应蛋白中的Cas14a、Cas14b和Cas14c变体(Harrington等,Programmed DNAdestruction by miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018))。其中,包含Cas14a效应蛋白的CRISPR/Cas14a系统被归类为CRISPR/Cas12f1系统(Makarova等,Nature Reviews,Microbiology,第18卷,67(2020))。然而,CRISPR/Cas12f1不仅包括Cas14a家族(Harrington等,Programmed DNA destruction by miniature CRISPR-Cas14enzymes,Science 362,839-842(2018)),还包括其中的效应系统被命名为c2c10的CRISPR/Cas系统(Karvelis等,Nucleic Acids Research,Vol.48,No.9,5017(2020);Makarova等,Nature Reviews,Microbiology,第18卷,67(2020))。因此,在本公开中,除非另有描述,CRISPR/Cas12f1系统为包括CRISPR/Cas14a系统和CRISPR/c2c10系统的概念,其中,在提及CRISPR/Cas14a系统时,是指“CRISPR/Cas14a系统”或“属于Cas14家族的CRISPR/Cas12f1系统”。该术语具有本领域技术人员可以根据上下文适当解释的含义。
背景技术-CRISPR/Cas系统表达载体的设计
概述
为了使用CRISPR/Cas系统进行基因编辑,如下方法已被广泛使用:其中,通过将具有编码CRISPR/Cas系统的各组分的序列的载体引入细胞中,在所述细胞中表达CRISPR/Cas系统的各组分。在下文中,将对允许CRISPR/Cas系统在细胞中得以表达的载体的组分进行描述。
CRISPR/Cas系统的核酸编码组分
由于载体的目的是在细胞中表达CRISPR/Cas系统的各组分,载体的序列应该大体上包含编码CRISPR/Cas系统的各组分的一个或多个核酸序列。具体而言,载体的序列包含编码待表达的CRISPR/Cas系统中所包含的Cas蛋白、和/或引导RNA的核酸序列。在这点上,根据其目的,载体的序列不仅可包含编码野生型引导RNA和野生型Cas蛋白的核酸序列,还可包含编码工程化的引导RNA和密码子优化的Cas蛋白的核酸序列、或编码工程化的Cas蛋白的核酸序列。
调节/控制组分
为了在细胞中表达载体,应包含一种或多种调节/控制组分。具体而言,调节/控制成分可包括启动子、增强子、内含子、多聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、剪接受体、2A序列和/或复制起点,但不限于此。在这点上,复制起点可为f1复制起点、SV40复制起点、pMB1复制起点、腺病毒(adeno)复制起点、AAV复制起点和/或BBV复制起点,但不限于此。
启动子
为了在细胞中对载体的表达靶标进行表达,应通过将启动子序列可操作地连接至编码各组分的序列以在细胞中激活RNA转录因子。启动子序列可根据对应的RNA转录因子或表达环境进行不同的设计,只要启动子序列能够在细胞中适当表达CRISPR/Cas系统的组分,对其不做限定。启动子序列可为促进RNA聚合酶(例如,RNA Pol I、Pol II或Pol III)转录的启动子。例如,启动子可为如下启动子中的一种:SV40初始启动子、小鼠乳腺肿瘤病毒长末端重复(LTR)启动子、腺病毒主要晚期启动子(Ad MLP)、单纯疱疹病毒(HSV)启动子、巨细胞病毒(CMV)启动子(例如CMV立即早期启动子区域(CMVIE))、劳斯肉瘤病毒(RSV)启动子、人U6小核启动子(U6)(Miyagishi等,Nature Biotechnology 20,497-500(2002))、增强的U6启动子(例如,Xia等,Nucleic Acids Res.,2003Sep,1;31(17))和人H1启动子(H1),但不限于此。
终止信号
当载体序列包含启动子序列时,与启动子可操作地连接的序列的转录由RNA转录因子诱导,诱导RNA转录因子的转录终止的序列称为终止信号。终止信号可因启动子序列的类型而异。例如,当启动子为U6或H1启动子时,启动子识别连续的胸苷序列(例如,TTTTTT(T6)序列)作为终止信号。
额外的表达组分
如果需要,除了野生型CRISPR/Cas系统配置和/或工程化的CRISPR/Cas系统之外,载体可包含编码旨在由本领域技术人员表达的额外的表达组分的核酸序列。例如,额外的表达组分可为<术语的描述>部分的“标签”部分中描述的标签之一,但不限于此。例如,额外的表达组分可为除草剂抗性基因(如草甘膦(glyphosate)、草铵膦(glufosinateammonium)或膦丝菌素(phosphinothricin))以及抗生素抗性基因(如氨苄青霉素、卡那霉素、G418、博来霉素、潮霉素和氯霉素),但不限于此。
表达载体的形式
表达载体可设计成线性或环状载体的形式。
相关技术的局限
CRISPR/Cas12f1系统、尤其是属于Cas14家族的CRISPR/Cas14a系统的主要局限在于细胞内的基因编辑活性未出现或过低。在先前首次报道的关于CRISPR/Cas14系统的文献中(Harrington等,Programmed DNA destruction by miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018)),先前的研究人员已发现CRISPR/Cas14系统在原核细胞中表现出对单链DNA的切割活性,但对细胞中的双链DNA未表现出切割活性。对此,先前的研究人员认为,当考虑到CRISPR/Cas14系统是在古细菌中发现的系统时,进化早期的CRISPR/Cas系统仅表现出对单链DNA的切割活性,而后在进化过程中获得了对双链DNA的切割活性(例如,CRISPR/Cas9系统)。在另一份先前的文献(US 2020/0190494 A1)中,先前的研究人员报告了如下事实:CRISPR/Cas14系统对真核细胞中的双链DNA表现出切割活性,但切割效率为0.1%或更低,这似乎是非常低的。因此,根据先前的文献,属于Cas14家族的CRISPR/Cas12f1系统对细胞中的双链DNA不显示切割活性,或者即使当CRISPR/Cas12f1系统显示切割活性时,其效率也很低,从而使CRISPR/Cas12f1系统存在局限性,即很难在基因编辑中积极利用CRISPR/Cas12f1系统。
富含U的尾序列
富含U的尾序列-概述
本公开的方面提供了富含U的尾序列以提高CRISPR/Cas12f1系统的基因编辑效率。富含U的尾序列的基本特征为存在丰富的尿苷,其中包括一个或多个尿苷。在实施方式中,富含U的尾序列可包括1-10个重复尿苷的序列。根据工程化的CRISPR/Cas12f1系统的实际使用和表达环境(例如,真核或原核内部环境),富含U的尾序列可进一步包含除尿苷之外的额外核苷酸。在实施方式中,富含U的尾序列可包括其中有UV、UUV、UUUV和/或UUUUV中的一个或多个重复的序列。就这一点而言,V为腺苷(A)、胞苷(C)和鸟苷(G)中的任一种。富含U的尾序列的特征在于与CRISPR/Cas12f1系统中包含的crRNA序列的3'-末端相连。在本公开中,富含U的尾序列用于提高工程化的CRISPR-Cas12f1系统对靶核酸的插入缺失(indel)效率。就此而言,靶核酸可为单链DNA、双链DNA和/或RNA。本文使用的术语“富含U的尾序列”是指包含丰富尿苷的RNA序列或编码其的DNA序列,并根据上下文来适当解释。在本公开中,对富含U的尾序列的结构及其作用进行了详细描述,将在以下段落中进一步描述。
引入富含U的尾序列的背景-CRISPR/Cpf1系统的相关研究
在先前的研究中,本发明人发现当富含U的尾序列连接至CRISPR/Cpf1系统中包含的crRNA序列的3'-末端时,CRISPR/Cpf1系统的核酸切割效率显著增加(Moon等,Highlyefficient genome editing by CRISPR-Cpf1 using CRISPR RNA with a uridinylate-rich 3'-overhang,Nature Commun 9,3651(2018))。本发明人关注到以下事实:Cpf1属于V型CRISPR/Cas系统(下文,CRISPR/Cas12系统),并且CRISPR/Cas12系统共享几个特征。因此,我们探讨了通过将连续的尿苷序列添加至CRISPR/Cas12系统中包含的crRNA 3'端是否提高CRISPR/Cas12复合体的基因编辑效率。
引入富含U的尾序列的背景-在CRISPR/Cas12f1系统中有效
本发明人通过实验发现,当将富含U的尾序列连接至Cas12f1、特别是属于Cas14家族的CRISPR/Cas12f1系统的crRNA的3'端时,基因编辑效率显著提高。此外,研究了富含U的尾序列的各种配置对插入缺失效率的影响,并在本公开中提供了富含U的尾序列的最佳结构。
引入富含U的尾序列的背景-不适用于所有CRISPR/Cas12系统
然而,作为将富含U的尾序列引入其它CRISPR/Cas12系统的结果,发现仅仅属于V型CRISPR/Cas系统并未增强CRISPR/Cas12复合体的基因编辑效率(见实验示例00)。可推断,对于富含U的尾序列而言这带来了不同的结果,因为即使是相同的V型组,在tracrRNA的存在、Cas蛋白的结构等方面也表现出不同的方面。就本发明人所知,添加至crRNA的3'-末端的富含U的尾序列通过何种功能和机制提高了CRISPR/Cas系统中的核酸切割效率,目前还没有阐明,并且也很难确定添加至crRNA的3'-末端的富含U的尾序列是否仅基于引导RNA和/或Cas蛋白的结构来影响基因切割活性。因此,阐明富含U的尾序列的作用及其对CRISPR/Cas系统的影响将是未来研究的课题。在下文中,将更详细地描述引入CRISPR/Cas12f1系统、特别是属于Cas14家族的系统中的富含U的尾序列。
富含U的尾序列结构-连续尿苷序列
设计富含U的尾序列的重点之一是大量包含其中有连续的一个或多个尿苷的序列。本发明人通过实验发现,当将富含U的尾序列引入CRISPR/Cas12f1系统中时,改善了CRISPR/Cas12f1复合体的基因编辑效率,所述富含U的尾序列为其中有连续的一个或多个尿苷的序列。因此,本公开中提供的富含U的尾序列包含其中有连续的一个或多个尿苷的序列。在实施方式中,富含U的尾序列可包含其中有连续的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个尿苷的序列。
富含U的尾序列结构-单独包含连续尿苷序列时可能出现的问题
当富含U的尾序列包含长的连续(例如,其中有连续的5个以上尿苷的序列)尿苷序列时,在通过将载体等引入细胞中来表达crRNA时,可能会出现以下问题。在设计表达上述连续的尿苷序列的载体时,载体中不可避免地包含对应于连续的尿苷序列的连续胸苷序列。在这点上,由于用于在真核细胞中使载体表达的一些启动子(例如,U6启动子等)使用连续的胸苷序列(例如T6序列)作为终止信号,所以对应于连续尿苷序列的连续胸苷序列可被识别为终止信号。当连续尿苷序列包含1-4个尿苷时,载体中包含1-4个连续胸苷的序列,其无法充当终止信号,因此在表达其中包含最多4个连续胸苷的富含U的尾序列中没有特别的问题。然而,当连续的尿苷序列包含6个以上的尿苷时,载体中包含充当终止信号的T6序列,因此包含5个以上连续尿苷的富含U的尾序列不太可能按预期表达。因此,为了在使用识别连续的胸苷序列作为终止序列的启动子的同时在富含U的尾部序列中包含丰富的尿苷,需要避免其中有连续的6个以上尿苷的结构。
富含U的尾序列结构-修饰的连续尿苷序列
为了解决如上所述的问题,本公开中提供的富含U的尾序列可包含修饰的尿苷重复序列,在所述修饰的尿苷重复序列中每1-5个尿苷中掺入一个核糖核苷(A、C、G)。在实施方式中,富含U的尾序列可包含其中有重复的一个或多个UV、UUV、UUUV、UUUUV和/或UUUUUV的序列。就此而言,V为腺苷(A)、胞苷(C)和鸟苷(G)中的一种。修饰的连续尿苷序列在设计表达工程化的crRNA的载体中可能有用。
富含U的尾序列的实例-Ux形式
在实施方式中,富含U的尾序列可由Ux表示。在实施方式中,x可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在实施方式中,x可为这些数字中的两个之间的数值范围内的整数。例如,x可为1-6的整数。在实施方式中,x可为1-20的整数。在实施方式中,x可为20或更大的整数。
富含U的尾序列的实例-(UaN)nUb形式
在实施方式中,富含U的尾序列可由(UaN)nUb表示。就此而言,N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言,a为1-5的整数,n为0或更大的整数。在实施方式中,n可为0-2之间的整数。在实施方式中,b可为1、2、3、4、5、6、7、8、9或10。在实施方式中,b可为这些数字中的两个之间的数值范围内的整数。例如,b可为1-6之间的整数。
富含U的尾序列的示例性实施方式-(UaV)n形式
在实施方式中,富含U的尾序列可由(UaV)n表示。就此而言,V为腺苷(A)、胞苷(C)和鸟苷(G)中的一种。就此而言,a可为1-4之间的整数,并且n可为1或更大的整数。
在实施方式中,富含U的尾序列可由(UaM)n表示。就此而言,M为腺苷(A)或胞苷(C)。就此而言,a可为1-4之间的整数,并且n可为1或更大的整数。
在实施方式中,富含U的尾序列可由(UaR)n表示。就此而言,R为腺苷(A)或鸟苷(G)。就此而言,a可为1-4之间的整数,并且n可为1或更大的整数。
在实施方式中,富含U的尾序列可由(UaS)n表示。就此而言,S为胞苷(C)或鸟苷(G)。就此而言,a可为1-4之间的整数,并且n可为1或更大的整数。
在实施方式中,富含U的尾序列可由(UaA)n表示。就此而言,a可为1-4之间的整数,并且n可为1或更大的整数。
在实施方式中,富含U的尾序列可由(UaC)n表示。就此而言,a可为1-4之间的整数,并且n可为1或更大的整数。
在实施方式中,富含U的尾序列可由(UaG)n表示。就此而言,a可为1-4之间的整数,并且n可为1或更大的整数。
富含U的尾序列的实例-(UaV)nUb形式
在实施方式中,富含U的尾序列可由(UaV)nUb表示。就此而言,V为腺苷(A)、胞苷(C)和鸟苷(G)中的一种。就此而言,a为1-4之间的整数,n为0或更大的整数。在实施方式中,n可为1或2。在实施方式中,b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在实施方式中,b可为这些数字中的两个之间的数值范围内的整数。例如,b可为1-6之间的整数。在实施方式中,b可为1-20之间的整数。在实施方式中,b可为20或更大的整数。
在实施方式中,富含U的尾序列可由(UaM)n表示。就此而言,M为腺苷(A)或胞苷(C)。就此而言,a为1-4之间的整数,n为0或更大的整数。在实施方式中,n可为1或2。在实施方式中,b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在实施方式中,b可为这些数字中的两个之间的数值范围内的整数。在实施方式中,b可为1-6之间的整数。在实施方式中,b可为1-20之间的整数。在实施方式中,b可为20或更大的整数。
在实施方式中,富含U的尾序列可由(UaR)n表示。就此而言,R为腺苷(A)或鸟苷(G)。就此而言,a为1-4之间的整数,n为0或更大的整数。在实施方式中,n可为1或2。在实施方式中,b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。在实施方式中,b可为这些数字中的两个之间的数值范围内的整数。在实施方式中,b可为1-6之间的整数。在实施方式中,b可为1-20之间的整数。在实施方式中,b可为20或更大的整数。
在实施方式中,富含U的尾序列可由(UaS)n表示。就此而言,S为胞苷(C)或鸟苷(G)。就此而言,a为1-4之间的整数,n为0或更大的整数。在实施方式中,n可为1或2。在实施方式中,b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。就此而言,b可为这些数字中的两个之间的数值范围内的整数。在实施方式中,b可为1-6之间的整数。在实施方式中,b可为1-20之间的整数。在实施方式中,b可为20或更大的整数。
在实施方式中,富含U的尾序列可由(UaA)nUb表示。就此而言,a为1-4之间的整数,n为0或更大的整数。在实施方式中,n可为1或2。在实施方式中,b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。就此而言,b可为这些数字中的两个之间的数值范围内的整数。在实施方式中,b可为1-6之间的整数。在实施方式中,b可为1-20之间的整数。在实施方式中,b可为20或更大的整数。
在实施方式中,富含U的尾序列可由(UaC)nUb表示。就此而言,a为1-4之间的整数,n为0或更大的整数。在实施方式中,n可为1或2。在实施方式中,b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。就此而言,b可为在这些数字中的两个之间的数值范围内的整数。在实施方式中,b可为1-6之间的整数。在实施方式中,b可为1-20之间的整数。在实施方式中,b可为20或更大的整数。
在实施方式中,富含U的尾序列可由(UaG)nUb表示。就此而言,a为1-4之间的整数,n为0或更大的整数。在实施方式中,n可为1或2。在实施方式中,b可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。就此而言,b可为这些数字中的两个之间的数值范围内的整数。在实施方式中,b可为1-6之间的整数。在实施方式中,b可为1-20之间的整数。在实施方式中,b可为20或更大的整数。
富含U的尾序列的实例-Ux和(UaV)n的组合
在实施方式中,富含U的尾序列可为由Ux表示的序列和由(UaV)n表示的序列的组合形式。在实施方式中,富含U的尾序列可由(U)n1-V1-(U)n2-V2-Ux表示。就此而言,V1和V2可各自为腺苷(A)、胞苷(C)和鸟苷(G)中的一种。就此而言,n1和n2可各自为1-4之间的整数。就此而言,x可为1-20之间的整数。
富含U的尾序列-总长度
在实施方式中,富含U的尾序列的长度可为1nt、2nt、3nt、4nt、5nt、6nt、7nt、8nt、9nt、10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt或20nt。在实施方式中,富含U的尾序列的长度可为20nt以上。
富含U的尾序列-示例性序列
在实施方式中,富含U的尾序列可为U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUAUUU、UUUAUUUAUUU(SEQ ID NO:11)、UUUUAU、UUUUAUU、UUUUAUUU、UUUUAUUUU、UUUUAUUUUU(SEQ IDNO:4)、UUUUAUUUUUU(SEQ ID NO:5)、UUUGUUU、UUUGUUUGUUU(SEQ ID NO:29)、UUUUGU、UUUUGUU、UUUUGUUU、UUUUGUUUU、UUUUGUUUUU(SEQ ID NO:22)或UUUUGUUUUUU(SEQ ID NO:23)。
在实施方式中,富含U的尾序列可为选自于由SEQ ID NO:3-SEQ ID NO:57所组成的组中的任一个。
在实施方式中,富含U的尾序列可为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。
引入富含U的尾序列的优势1-基因编辑效率增加
当将本公开中提供的富含U的尾序列引入CRISPR/Cas12f1系统中时,可显著增加所得的工程化CRISPR/Cas12f1复合体的基因编辑效率。具体而言,所述工程化CRISPR/Cas12f1复合体对真核细胞中不能被野生型CRISPR/Cas12f1复合体切割的双链DNA表现出切割活性,或与野生型CRISPR/Cas12f1复合体相比,对真核细胞中的双链DNA的切割活性显著增加。这由本发明人通过实验证明,并且在本公开的实验例的部分中予以详细解释。
引入富含U的尾序列的优势2-可利用Cas12f1的优势
如上所述,Cas12f1蛋白的大小明显小于目前积极研究的Cas9和Cpf1。因此,编码Cas12f1蛋白及其引导RNA的序列长度很短,从而可将所述序列全部插入到一个AAV载体中。此外,即使在将碱基编辑器或prime编辑器等功能结构域添加至Cas12f1蛋白时,这些序列可全部包含在一个AAV载体中。由于AAV载体具有高细胞内递送效率并被批准为用于人的基因治疗剂,当CRISPR/Cas系统或添加了适当功能结构域的CRISPR/Cas系统完全包含在一个AAV载体中时,所述AAV载体可用于更广泛的基因编辑技术。CRISPR/Cas9系统的总序列太长,从而使得CRISPR/Cas9系统无法插入到一个AAV载体中。就这方面而言,CRISPR/Cas12f1系统作为基因编辑工具可能颇具吸引力。然而,先前的研究表明,Cas12f1蛋白、特别是属于Cas14家族的蛋白不能切割双链DNA或具有显著降低的切割效率。然而,本发明人已经表明,可将富含U的尾序列引入CRISPR/Cas12f1系统,从而显著提高CRISPR/Cas12f1复合体的基因编辑效率。综上所述,由于其中引入本公开提供的富含U的尾序列的工程化CRISPR/Cas12f1复合体在具有上述Cas12f1蛋白的优点的同时,表现出高的核酸切割效率,因此所述工程化CRISPR/Cas12f1复合体可应用于各种基因编辑技术中。
用于CRISPR/Cas12f1系统的工程化的CRISPR RNA(crRNA)
工程化的crRNA-概述
本公开的方面提供了用于CRISPR/Cas12f1系统的工程化的CRISPR RNA(下文中为crRNA)。所述工程化的crRNA是其中富含U的尾部序列连接至CRISPR/Cas12f1系统的crRNA序列的3'-末端的crRNA。就此而言,在本公开中描述的没有任何其它修饰的“CRISPR RNA”或“crRNA”的情况是区别于所述工程化的crRNA的概念,并且基本上是指具有自然界存在的配置的CRISPR RNA,特别是CRISPR/Cas12f1系统中所包含的CRISPR RNA。富含U的尾序列具有与<富含U的尾序列>部分中描述的特征和结构相同的特征和结构。所述crRNA包含CRISPRRNA重复序列和间隔序列。所述间隔序列是与包含在待由所述工程化CRISPR/Cas12f1复合体编辑的靶核酸中的靶序列相关的序列。本公开中提供的工程化的crRNA的序列包含CRISPR RNA重复序列、间隔序列和富含U的尾序列。
在实施方式中,在所述工程化的crRNA的序列中,所述CRISPR RNA重复序列、间隔序列和富含U的尾序列可在5'-3'方向上顺序连接。
在实施方式中,所述间隔序列可为与靶核酸的靶序列互补的序列。
在实施方式中,富含U的尾序列可由(UaN)nUb表示。就此而言,N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
在实施方式中,富含U的尾序列可由(UaN)nUb表示。就此而言,a、n和b可为整数,a可为1-4,n可为0以上,b可为1-10。另外,本公开的方面提供了编码所述工程化的crRNA的DNA。在下文中,将更详细地描述所述工程化的crRNA的配置。
CRISPR RNA重复序列-定义
CRISPR RNA重复序列是由CRISPR/Cas12f1系统的Cas12f1蛋白类型决定的序列,是指连接至所述间隔序列的5'端的序列。CRISPR RNA重复序列可因CRISPR/Cas12f1系统中包含的Cas12f1蛋白的类型而异。CRISPR RNA重复序列可与CRISPR/Cas12f1系统的至少一些tracrRNA相互作用,也可与Cas12f1蛋白相互作用。
CRISPR RNA重复序列-序列实例
在实施方式中,CRISPR RNA重复序列可为SEQ ID NO:58的序列。
CRISPR RNA重复序列-可对序列进行修饰
如本文所用,“CRISPR RNA重复序列”是指自然界中普遍存在的CRISPR RNA重复序列,但不限于此,并且可指在自然界中发现的CRISPR RNA重复序列中的部分或全部被修饰的CRISPR RNA重复序列,所述修饰在不损害CRISPR/Cas12f1系统功能的范围内进行。
在实施方式中,所述CRISPR RNA重复序列可为野生型CRISPR RNA的全部或部分被修饰的CRISPR RNA重复序列。
在实施方式中,所述CRISPR RNA重复序列可为与野生型CRISPR RNA重复序列具有100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%或50%的同一性或同源性的序列。在实施方式中,所述CRISPRRNA重复序列可为与野生型CRISPR RNA重复序列具有在这些值中的两个之间的数值范围内的同一性的序列。例如,所述CRISPR RNA重复序列可为与野生型CRISPR RNA重复序列具有90%-100%同一性的序列。在实施方式中,所述CRISPR RNA重复序列可为与野生型CRISPRRNA重复序列具有60%-80%同一性的序列。
在实施方式中,野生型CRISPR RNA重复序列可为SEQ ID NO:58的序列。
间隔序列-定义
间隔序列是在允许CRISPR/Cas复合体表现出靶特异性基因编辑活性中起核心作用的序列。如本文所用,除非另有规定,间隔序列是指CRISPR/Cas12f1复合体中包含的crRNA(或工程化的crRNA)中的间隔序列。所述间隔序列被设计为定位至包含在待使用CRISPR/Cas12f1复合体编辑的靶核酸序列中的靶序列。换言之,本公开提供的工程化的crRNA序列可根据靶序列具有不同的间隔序列。就此而言,靶核酸可为单链DNA、双链DNA或RNA。
间隔序列-靶核酸和靶序列之间的关系
间隔序列是与靶序列互补的序列,并连接至CRISPR RNA重复序列的3'-末端侧。所述间隔序列是与原间隔序列(所述原间隔序列邻近于由Cas12f1蛋白所识别的原间隔序列临近基序(PAM))同源的序列,并且具有原间隔序列的胸苷被置换为尿苷的序列。就此而言,在与靶核酸中包含的PAM序列邻近的序列中确定靶序列和原间隔序列,因此,所述间隔序列被确定。
在实施方式中,crRNA的间隔序列部分可与靶核酸互补结合。在实施方式中,crRNA的间隔序列部分可与靶核酸的靶序列部分互补结合。在实施方式中,当靶核酸为双链DNA时,间隔序列可为与双链DNA的靶链上包含的靶序列互补的序列。在实施方式中,当靶核酸为双链DNA时,间隔序列可为与双链DNA的非靶链上包含的原间隔序列同源的序列。具体而言,间隔序列具有与原间隔序列相同的碱基序列,但也可具有碱基序列中所含的每个胸苷(T)被置换为尿嘧啶(U)的序列。在实施方式中,间隔序列可为对应于原间隔区的DNA序列的RNA序列。
间隔序列-序列长度
在实施方式中,间隔序列的长度可为10nt、11nt、12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、25nt、26nt、27nt、28nt、29nt、30nt、31nt、32nt、33nt、34nt、35nt、36nt、37nt、38nt、39nt或40nt。在实施方式中,间隔序列可具有这些数字中的两个之间的数字范围内的长度。例如,间隔序列的长度可为17nt-23nt。在实施方式中,间隔序列的长度可为17nt-30nt。
富含U的尾序列
工程化的crRNA的特征在于富含U的尾序列连接至crRNA序列中包含的间隔序列的3'-末端部分。富含U的尾序列具有与<富含U的尾序列>部分中描述的配置和特征相同的配置和特征。
编码工程化的crRNA的DNA
本公开的方面提供了编码所述工程化的crRNA的DNA。在实施方式中,DNA序列可具有其中所述工程化的crRNA的序列中所有尿苷被置换为胸苷的序列。
工程化的crRNA的使用
所述工程化的crRNA可与用于Cas12f1的tracrRNA一起构成用于CRISPR/Cas12f1系统的工程化的引导RNA。包含所述工程化的crRNA的工程化的引导RNA可与Cas12f1蛋白结合,从而形成CRISPR/Cas12f1复合体。
用于CRISPR/Cas12f1系统的工程化的引导RNA
工程化的引导RNA-概述
本公开的方面提供了用于CRISPR/Cas12f1系统的工程化的引导RNA。所述工程化的引导RNA的序列包含tracrRNA序列、crRNA序列和富含U的尾序列。就此而言,富含U的尾序列连接至所述crRNA序列的3'-末端。换言之,所述工程化的引导RNA的序列包含tracrRNA序列和工程化的crRNA序列。所述crRNA包含CRISPR RNA重复序列和间隔序列。就此而言,所述CRISPR RNA重复序列和间隔序列具有与<用于CRISPR/Cas12f1系统的工程化的CRISPR RNA>部分中描述的各组成相同的特征和结构。所述富含U的尾序列具有与<富含U的尾序列>部分中描述的特征和结构相同的特征和结构。
在实施方式中,富含U的尾序列可由(UaN)nUb表示。就此而言,N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言,a为1-4之间的整数,n为选自0、1和2的整数,b为1-10的整数。
在实施方式中,富含U的尾序列可由(UaV)nUb表示,并且就此而言,a、n和b为整数,a可为1-4,n可为0以上,b可为1-10。
所述工程化的引导RNA中包含的tracrRNA的至少一部分和所述crRNA的至少一部分可具有彼此互补以形成双链RNA的序列。具体而言,所述tracrRNA的至少一部分和所述crRNA序列中包含的CRISPR RNA重复序列的至少一部分可彼此互补,从而形成双链RNA。所述工程化的引导RNA可与Cas12f1蛋白结合以形成CRISPR/Cas12f1复合体,并识别与所述crRNA序列中包含的间隔序列互补的靶序列,从而允许所述CRISRP/Cas12f1复合体对包含靶序列的靶核酸进行编辑。
tracrRNA-定义
tracrRNA与crRNA一起是构成CRISPR/Cas系统的引导RNA的重要组分。如本文所用,除非另有描述,所述tracrRNA是指构成CRISPR/Cas12f1系统的引导RNA的tracrRNA。所述tracrRNA的至少一部分可与crRNA的至少一部分互补结合以形成双链。更具体而言,所述tracrRNA的部分序列具有与所述crRNA中包含的CRISPR RNA重复序列的全部或部分互补的序列。
tracrRNA-tracrRNA和CRISPR RNA重复序列的互补性
在实施方式中,所述tracrRNA的序列可包含与CRISPR RNA重复序列60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%互补的序列。在实施方式中,所述tracrRNA的序列可包含与CRISPR RNA重复序列在这些数字中的两个之间的数值范围内互补的序列。例如,所述tracrRNA的序列可包含与CRISPR RNA重复序列60%-90%互补的序列。在实施方式中,所述tracrRNA的序列可包含与CRISPR RNA重复序列70%-100%互补的序列。
tracrRNA-tracrRNA和CRISPR RNA重复序列中的错配数
在实施方式中,tracrRNA的序列可包含与CRISPR RNA重复序列具有0个、1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个错配的互补序列。在实施方式中,tracrRNA的互补序列可与CRISPR RNA重复序列具有在前面的句子中选择的数值范围内的错配。例如,tracrRNA可包含与CRISPR RNA重复序列具有0-8个错配的互补序列。在实施方式中,tracrRNA序列可包含与CRISPR RNA重复序列具有8-12个错配的互补序列。
tracrRNA-序列的实例
在实施方式中,所述tracrRNA序列可为SEQ ID NO:60的序列。
tracrRNA-可对序列进行修饰
如本文所用,“tracrRNA”是指自然界中普遍存在的tracrRNA,但不限于此,并且可指在自然界中发现的tracrRNA序列中的部分或全部被修饰的tracrRNA,所述修饰在不损害CRISPR/Cas12f1系统功能的范围内进行。
在实施方式中,所述tracrRNA序列可为野生型tracrRNA序列的全部或部分被修饰的tracrRNA序列。
在实施方式中,所述tracrRNA序列可为与野生型tracrRNA序列具有100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%或50%的同一性或同源性的序列。在实施方式中,所述tracrRNA序列可为与野生型tracrRNA序列具有在这些数字中的两个之间的数值范围内的同一性的序列。例如,tracrRNA序列可为与野生型tracrRNA序列具有90%-100%同一性的序列。在实施方式中,tracrRNA序列可为与野生型tracrRNA序列具有60%-80%同一性的序列。
在实施方式中,野生型tracrRNA序列可为SEQ ID NO:60的序列。
双引导RNA(Dual guide RNA)-定义和结构
本公开中提供的工程化的引导RNA可为双引导RNA。这意味着tracrRNA和crRNA形成单独的RNA分子。tracrRNA的一部分和crRNA的一部分彼此互补结合以形成双链。具体而言,在双引导RNA中,包含tracrRNA的3'-末端的部分与包含crRNA的CRISPR RNA重复序列的部分可形成双链。
在实施方式中,所述工程化的引导RNA可为双引导RNA。在实施方式中,当所述工程化的引导RNA为双引导RNA时,所述tracrRNA和所述crRNA是单独的RNA分子。
双引导RNA-序列的实例
在实施方式中,tracrRNA可为SEQ ID NO:60的序列。在实施方式中,crRNA中包含的CRISPR RNA重复序列可为SEQ ID NO:58的序列。在实施方式中,具有序列SEQ ID NO:60的trancrRNA的至少一部分和具有序列SEQ ID NO:58的CRISPR RNA重复序列可彼此互补结合以形成双链。
单引导RNA-定义
为了便于形成引导RNA,tracrRNA和crRNA为一个分子的设计被称为单引导RNA。本公开提供的工程化的引导RNA可为单引导RNA。当所述工程化的引导RNA为单引导RNA时,所述单引导RNA为包含tracrRNA、crRNA和富含U的尾序列全部的一个RNA分子。在实施方式中,当所述工程化的引导RNA为单引导RNA时,tracrRNA的序列和crRNA的序列可同时包含在一个RNA分子的序列中。
单引导RNA-接头和序列的实例
在实施方式中,当所述工程化的引导RNA为单引导RNA时,所述工程化的引导RNA的序列进一步包含接头序列,并且所述tracrRNA序列和所述crRNA序列可通过所述接头序列连接。在实施方式中,所述接头序列可为5'-gaaa-3'。
单引导RNA-结构
在所述单引导RNA的序列中,tracrRNA序列、接头序列、crRNA序列以及富含U的尾序列在5'-3'方向上顺序连接。tracrRNA序列的一部分和crRNA序列中包含的CRISPR RNA重复序列的全部或一部分具有彼此互补的序列。因此,tracrRNA的一部分与crRNA中的CRISPRRNA重复序列部分彼此互补结合以形成双链RNA。
单引导RNA-序列的实例
所述单引导RNA可具有选自于由SEQ ID NO:75-SEQ ID NO:125以及SEQ ID NO:261-SEQ ID NO:280所组成的组中的序列。
支架序列
当对本公开中提供的工程化的引导RNA的序列进行功能划分时,所述序列可分为:1)与Cas12f1蛋白相互作用以形成CRISPR/Cas12f1复合体的序列部分,2)允许CRISPR/Cas12f1复合体寻找靶核酸的序列部分,以及3)富含U的尾序列部分。就此而言,与Cas12f1蛋白相互作用以形成CRISPR/Cas12f1复合体的序列部分可以说是支架序列。就此而言,所述支架序列统指与Cas12f1蛋白相互作用的部分,并且不限于一个分子的RNA序列。具体而言,所述支架序列可包含两个以上RNA分子的序列。
在实施方式中,当所述工程化的引导RNA为双引导RNA时,所述支架序列可包含所述工程化的引导RNA序列中的tracrRNA序列和crRNA中包含的CRISPR RNA重复序列。在实施方式中,所述tracrRNA序列可为其中天然存在的tracrRNA序列的全部或部分被修饰的tracrRNA序列。在实施方式中,CRISPR RNA重复序列可为在自然界中发现的CRISPR RNA重复序列的全部或部分被修饰的CRISPR RNA序列。
在实施方式中,当所述工程化的引导RNA为单引导RNA时,所述支架序列可包括tracrRNA序列、接头序列以及crRNA序列中包含的CRISPR RNA重复序列。在实施方式中,所述tracrRNA序列可为其中天然存在的tracrRNA序列的全部或部分被修饰的tracrRNA序列。在实施方式中,所述CRISPR RNA重复序列可为在自然界中发现的CRISPR RNA重复序列的全部或部分被修饰的CRISPR RNA重复序列。
在实施方式中,所述支架序列可为选自于由SEQ ID NO:253和SEQ ID NO:254所组成的组中的序列。在实施方式中,所述支架序列可为与选自于由SEQ ID NO:253和SEQ IDNO:254所组成的组中的序列具有100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%或50%同一性或同源性的序列。在实施方式中,所述支架序列可为与选自于由SEQ ID NO:253和SEQ ID NO:254所组成的组中的序列具有在这些数字中的两个之间的数值范围内的同一性的序列。例如,所述支架序列可为与选自于由SEQ ID NO:253和SEQ ID NO:254所组成的组中的支架序列具有90%-100%同一性的序列。在实施方式中,所述支架序列可为与选自于由SEQ ID NO:253和SEQ ID NO:254所组成的组中的支架序列具有60%-80%同一性的序列。
工程化CRISPR/Cas12f1复合体
CRISPR/Cas12f1复合体-概述
本公开的方面提供了工程化的CRISPR/Cas12f1复合体。所述工程化的CRISPR/Cas12f1复合体包含Cas12f1蛋白和工程化的引导RNA。在实施方式中,所述Cas12f1蛋白可由Cas14家族衍生而来。所述工程化的引导RNA序列包含tracrRNA序列、crRNA序列和富含U的尾序列。换言之,所述工程化的引导RNA序列包含支架序列、间隔序列和富含U的尾序列。富含U的尾序列可连接至所述crRNA序列的3'-末端。富含U的尾序列具有与<富含U的尾序列>部分中描述的特征和结构相同的特征和结构。
在实施方式中,富含U的尾序列可由(UaN)nUb表示。就此而言,N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
在实施方式中,富含U的尾序列可由(UaV)nUb表示,就此而言,a、n和b为整数,a可为1-4,n可为0或更大,并且b可为1-10。
所述支架序列可与Cas12f1蛋白相互作用,并在所述工程化的引导RNA和Cas12f1蛋白形成复合体时发挥重要作用。
Cas12f1蛋白-概述
工程化CRISPR/Cas12f1复合体可包含Cas12f1蛋白。Cas12f1蛋白基本上可为自然界中存在的野生型Cas12f1蛋白。编码Cas12f1蛋白的序列可为针对野生型Cas12f1蛋白的人密码子优化的Cas12f1序列。此外,所述Cas12f1蛋白可具有与自然界中存在的野生型Cas12f1蛋白相同的功能。然而,除非另有规定,如本文所用,“Cas12f1蛋白”不仅可以指野生型或密码子优化的Cas12f1蛋白,还可以指修饰的Cas12f1蛋白或Cas12f1融合蛋白。此外,所述Cas12f1蛋白不仅可统指具有与野生型Cas12f1蛋白相同功能的Cas12f1蛋白,还可统指功能全部或部分被修饰的Cas12f1蛋白、全部或部分功能丧失的Cas12f1蛋白、和/或添加了额外功能的Cas12f1蛋白。Cas12f1蛋白的含义可根据上下文进行适当解释,除非有特殊情况,否则以最广义解释。在下文中,将详细描述Cas12f1蛋白的配置或功能。
Cas12f1蛋白-野生型Cas12f1蛋白
所述工程化CRISPR/Cas12f1复合体可包含Cas12f1蛋白。在实施方式中,所述Cas12f1蛋白可为野生型Cas12f1蛋白。在实施方式中,所述Cas12f1蛋白可由Cas14家族衍生而来(Harrington等,Programmed DNA destruction by miniature CRISPR-Cas14enzymes,Science 362,839-842(2018))。在实施方式中,所述Cas12f1蛋白可为由未培养的古细菌衍生而来的Cas14a蛋白(Harrington等,Programmed DNA destruction byminiature CRISPR-Cas14 enzymes,Science 362,839-842(2018))。在实施方式中,所述Cas12f1蛋白可为Cas14a1蛋白。
Cas12f1蛋白-修饰的Cas12f1蛋白
所述工程化CRISPR/Cas12f1复合体可包含修饰的Cas12f1蛋白。修饰的Cas12f1是指其中野生型或密码子优化的Cas12f1蛋白序列中的至少一些序列被修饰的Cas12f1。Cas12f1蛋白修饰可由单个氨基酸单元组成,也可由蛋白的功能结构域单元组成。在实施方式中,蛋白质的修饰可为如下修饰:野生型或密码子优化的Cas12f1蛋白序列的一个或多个氨基酸、肽、多肽、蛋白质和/或结构域被单独取代,将一个或多个氨基酸、肽、多肽、蛋白质和/或结构域单独地从野生型或密码子优化的Cas12f1蛋白序列中删除,和/或将一个或多个氨基酸、肽、多肽、蛋白质和/或结构域单独地添加至野生型或密码子优化的Cas12f1蛋白序列。在实施方式中,所述Cas12f1蛋白可为包含在野生型Cas12f1蛋白中的RuvC结构域中的一个或多个氨基酸、肽和/或多肽被置换、删除和添加的Cas12f1蛋白。
Cas12f1蛋白-Cas12f1融合蛋白
本公开中提供的工程化CRISPR/Cas12f1复合体可包含Cas12f1融合蛋白。就此而言,Cas12f1融合蛋白是指其中野生型或修饰的Cas12f1蛋白与额外的氨基酸、肽、多肽、蛋白质或结构域融合的蛋白。
在实施方式中,Cas12f1蛋白可为野生型Cas12f1蛋白与碱基编辑器和/或逆转录酶的融合物。在实施方式中,所述碱基编辑器可为腺苷脱氨酶和/或胞嘧啶脱氨酶。在实施方式中,所述逆转录酶可为莫洛尼鼠白血病病毒(M-MLV)逆转录酶或其变体。就此而言,与所述逆转录酶融合的Cas12f1蛋白可充当prime编辑器。
在实施方式中,Cas12f1蛋白可为野生型Cas12f1蛋白与能够参与细胞内基因表达过程的各种酶的融合物。就此而言,与所述酶融合的Cas12f1蛋白可能会带来细胞中基因表达的各种量和质的变化。在实施方式中,所述酶可为DNMT、TET、KRAB、DHAC、LSD和/或p300。
Cas12f1蛋白-功能变化
本公开中提供的工程化CRISPR/Cas12f1复合体中包含的Cas12f1蛋白可具有与野生型Cas12f1蛋白相似的功能。本公开中提供的工程化CRISPR/Cas12f1复合体中包含的Cas12f1蛋白可为与野生型Cas12f1蛋白相比时具有改变的功能的Cas12f1蛋白。具体而言,所述改变可为全部或部分功能的修饰、全部或部分功能的丧失、或增加额外功能。在实施方式中,所述Cas12f1蛋白只要具有本领域技术人员进行的适用于CRISPR/Cas系统的Cas蛋白的修饰即可,没有特别限制。就此而言,可通过已知技术进行改变。在实施方式中,可对所述Cas12f1蛋白进行修饰,以仅切割靶核酸的双链中的一条链。此外,可对Cas12f1蛋白进行改变,以使得仅靶核酸的双链中的一条链可被切割,并且可在未切割的链上进行碱基编辑或prime编辑。在实施方式中,可对所述Cas12f1蛋白进行改变,以使得靶核酸的两条链都不能被切割。此外,可对所述Cas12f1蛋白进行改变,以使得靶核酸的两条链都不能被切割,并且可在所述靶核酸上进行碱基编辑、prime编辑或基因表达调控功能。
Cas12f1蛋白-其它修饰的实例
在实施方式中,所述Cas12f1蛋白可包含核定位序列(NLS)或核输出序列(NES)。具体而言,所述NLS可为<术语的定义>中NLS部分中示例的NLS中的任一种,但不限于此。在实施方式中,所述Cas12f1蛋白可包含标签。具体而言,所述标签可为<术语的定义>中标签部分中示例的标签中的任一种,但不限于此。
Cas12f1蛋白-PAM序列
CRISPR/Cas12f1复合体切割靶基因或靶核酸需要两个条件。首先,靶基因或靶核酸中必须有Cas12f1蛋白可识别的具有一定长度的碱基序列。其次,在所述具有一定长度的碱基序列周围,必须有能够与引导RNA中包含的间隔序列互补结合的序列。当满足这两个条件以允许1)Cas12f1蛋白识别所述具有一定长度的碱基序列,以及2)间隔序列部分与所述具有一定长度的碱基序列周围的序列部分互补结合时,所述靶基因或靶核酸被切割。就此而言,Cas12f1蛋白识别的具有一定长度的碱基序列称为原间隔序列临近基序(PAM)序列。PAM序列是根据Cas12f1蛋白确定的独特序列,在确定CRISPR/Cas12f1复合体的靶序列时,伴随着如下约束:必须在与PAM序列邻近的序列中确定所述靶序列。
Cas12f1蛋白-PAM序列的实例
在实施方式中,Cas12f1蛋白的PAM序列可为富含T的序列。在实施方式中,Cas12f1蛋白的PAM序列以5'-3'的方向可为TTTN。就此而言,N为脱氧胸苷(T)、脱氧腺苷(A)、脱氧胞苷(C)或脱氧鸟苷(G)中的一种。在实施方式中,Cas12f1蛋白的PAM序列以5'-3'的方向可为TTTA、TTTT、TTTC或TTTG。在实施方式中,Cas12f1蛋白的PAM序列以5'-3'的方向可为TTTA或TTTG。在实施方式中,Cas12f1蛋白的PAM序列可不同于野生型Cas12f1蛋白的PAM序列。
Cas12f1蛋白-示例序列
在实施方式中,所述Cas12f1蛋白可具有选自于由SEQ ID NO:281、SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321和SEQ ID NO:323所组成的组中的氨基酸序列。
在实施方式中,编码所述Cas12f1蛋白的DNA序列可为人密码子优化的序列。
在实施方式中,编码所述Cas12f1蛋白的DNA序列可为选自于由SEQ ID NO:1、SEQID NO:2、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320和SEQ ID NO:322所组成的组中的DNA序列。
工程化的引导RNA
本公开中提供的构成CRISPR/Cas12f1复合体的工程化的引导RNA具有与<用于CRISPR/Cas12f1系统的工程化的引导RNA>部分中描述的特征和结构相同的特征和结构。
CRISPR/Cas12f1复合体-配置的实例
在实施方式中,所述Cas12f1蛋白可具有SEQ ID NO:281的氨基酸序列,所述工程化的引导RNA可具有选自于由SEQ ID NO:75-SEQ ID NO:125所组成的组中的氨基酸序列,并且所述Cas12f1蛋白和所述工程化的引导RNA可彼此结合以形成CRISPR/Cas12f1复合体。
在实施方式中,所述Cas12f1蛋白可具有选自于由SEQ ID NO:317、SEQ ID NO:319、SEQ ID NO:321和SEQ ID NO:323所组成的组中的氨基酸序列,所述工程化的引导RNA可具有选自于由SEQ ID NO:75-SEQ ID NO:125以及SEQ ID NO:261-SEQ ID NO:280所组成的组中的序列,并且通过将所述Cas12f1蛋白与所述工程化的引导RNA结合所形成的CRISPR/Cas12f1复合体可具有碱基编辑功能。
表达CRISPR/Cas12f1系统的载体
概述
本公开的方面提供了用于表达CRISPR/Cas12f1系统的组分的载体。将载体构建为表达Cas12f1蛋白和/或工程化的引导RNA。载体的序列可包含编码CRISPR/Cas12f1系统的组分之一的核酸序列,或者可包含编码两种以上组分的核酸序列。载体的序列包含编码所述Cas12f1蛋白的核酸序列和/或编码所述工程化的引导RNA的核酸序列。载体的序列包含一个或多个启动子序列。所述启动子与编码所述Cas12f1蛋白的核酸序列和/或编码所述工程化的引导RNA的核酸序列可操作地连接,以促进所述核酸序列在细胞中的转录。所述Cas12f1蛋白具有与<工程化CRISPR/Cas12f1复合体>部分中描述的Cas12f1蛋白、修饰的Cas12f1蛋白或Cas12f1融合蛋白的特征和配置相同的特征和配置。所述工程化的引导RNA具有与<用于CRISPR/Cas12f1系统的工程化的引导RNA>部分中描述的工程化的引导RNA的特征和配置相同的特征和配置。
载体的序列可包含编码所述Cas12f1蛋白的核酸序列和编码所述工程化的引导RNA的核酸序列。在实施方式中,载体的序列可包含第一序列以及第二序列,所述第一序列包含编码所述Cas12f1蛋白的核酸序列,所述第二序列包含编码所述工程化的引导RNA的核酸序列。载体的序列包含用于在细胞中表达编码Cas12f1蛋白的核酸序列的启动子序列,以及用于在细胞中表达编码工程化的引导RNA的核酸序列的启动子序列,所述启动子可操作地连接至各个表达靶标。在实施方式中,载体的序列可包含与所述第一序列可操作地连接的第一启动子序列,以及与所述第二序列可操作地连接的第二启动子序列。
载体的序列可包含编码Cas12f1蛋白的核酸序列以及编码两种以上不同的工程化的引导RNA的核酸序列。在实施方式中,载体的序列可包含第一序列、第二序列以及第三序列,所述第一序列包含编码Cas12f1蛋白的核酸序列,所述第二序列包含编码工程化的引导RNA的核酸序列,所述第三序列包含编码第二工程化的引导RNA的核酸序列。此外,载体的序列可包含与所述第一序列可操作地连接的第一启动子序列、与所述第二序列可操作地连接的第二启动子序列和与所述第三序列可操作地连接的第三启动子序列。
表达靶标-Cas12f1蛋白
可将载体构建为表达Cas12f1蛋白。就此而言,所述Cas12f1蛋白具有与<工程化CRISPR/Cas12f1复合体>部分中描述的配置和特征相同的配置和特征。在实施方式中,可将载体构建为表达野生型Cas12f1蛋白。就此而言,所述野生型Cas12f1蛋白可为Cas14a1。在实施方式中,可将载体构建为表达已被改变为仅切割靶核酸双链中的一条链的Cas12f1蛋白。此外,经改变的Cas12f1蛋白可被改变,从而使得仅靶核酸的双链中的一条链可被切割,并且可在未切割的链上进行碱基编辑或prime编辑。在实施方式中,Cas12f1蛋白可能已经改变,从而使得靶核酸双链的两条链都不能被切割。此外,可对Cas12f1蛋白进行改变从而使得靶核酸双链的两条链都不能被切割,并且可在所述靶核酸上进行碱基编辑、prime编辑或基因表达调控功能。
表达靶标-工程化的引导RNA
可将载体构建为表达工程化的引导RNA。所述工程化的引导RNA具有与<用于CRISPR/Cas12f1系统的工程化的引导RNA>部分中描述的工程化的引导RNA的特征和配置相同的特征和配置。在实施方式中,可将载体构建为表达工程化的引导RNA。在实施方式中,所述工程化的引导RNA序列可包含支架序列、间隔序列和富含U的尾序列。在实施方式中,所述工程化的引导RNA序列可包含tracrRNA序列、crRNA序列和富含U的尾序列。在实施方式中,富含U的尾序列可由(UaN)nUb表示。就此而言,N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。在实施方式中,富含U的尾序列可由(UaV)nUb表示。就此而言,a、n和b可为整数,a可为1-4,n可为0或更大,b可为1-10。
可将载体构建为表达两种以上工程化的引导RNA。在实施方式中,可将载体构建为表达第一工程化的引导RNA和第二工程化的引导RNA。在实施方式中,第一工程化的引导RNA序列可包含第一支架序列、第一间隔序列和第一富含U的尾序列,第二工程化的引导RNA序列可包含第二支架序列、第二间隔序列和第二个富含U的尾序列。
表达靶标-额外组分
除了上述所述的表达靶标之外,可将载体构建为表达额外组分,例如NLS和标签蛋白。在实施方式中,额外组分可独立于Cas12f1、修饰的Cas12f1和/或工程化的引导RNA来表达。在实施方式中,可表达额外组分,同时使其连接至Cas12f1、修饰的Cas12f1和/或工程化的引导RNA。就此而言,所述额外组分可为在期望表达CRISPR/Cas系统时通常表达的组分,可参考已知技术。所述额外组分可为<相关技术-CRISPR/Cas系统表达载体的设计>部分中描述的组分中的一种或多种。
载体组分-Cas12f1蛋白表达序列
载体序列可包含编码Cas12f1蛋白的核酸序列。就此而言,Cas12f1蛋白具有与<工程化CRISPR/Cas12f1复合体>部分中描述的配置和特征相同的配置和特征。在实施方式中,载体的序列可包含编码野生型Cas12f1蛋白的序列。就此而言,野生型Cas12f1蛋白可为Cas14a1。在实施方式中,载体的序列可包含编码Cas12f1蛋白的人密码子优化的核酸序列。就此而言,编码Cas12f1蛋白的人密码子优化的核酸序列可为编码Cas14a1蛋白的人密码子优化的核酸序列。在实施方式中,载体的序列可为编码Cas12f1蛋白或Cas12f1融合蛋白的序列。在实施方式中,载体的序列可包含编码Cas12f1蛋白的序列,所述Cas12f1蛋白被改变使得仅靶核酸的双链中的一条链可被切割,并且可在未切割的链上进行碱基编辑或prime编辑。在实施方式中,Cas12f1蛋白可包含编码Cas12f1蛋白的序列,该Cas12f1蛋白被改变使得靶核酸双链的两条链都不能被切割,并且可在靶核酸上进行碱基编辑、prime编辑或基因表达调控功能。
载体组分-工程化的引导RNA表达序列
在实施方式中,载体的序列可包含编码工程化的引导RNA的序列。在实施方式中,所述工程化的引导RNA的序列可包含支架序列、间隔序列和富含U的尾序列。在实施方式中,所述工程化的引导RNA序列的序列可包含tracrRNA序列、crRNA序列和富含U的尾序列。在实施方式中,富含U的尾序列可由(UaN)nUb表示。就此而言,N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。在实施方式中,富含U的尾序列可由(UaV)nUb表示。就此而言,a、n和b可为整数,a可为1-4,n可为0或更大,b可为1-10。
在实施方式中,载体的序列可包含编码两种以上不同的工程化引导RNA的序列。在实施方式中,载体的序列可包含编码第一工程化的引导RNA的序列和编码第二工程化的引导RNA的序列。就此而言,包含在第一工程化的引导RNA序列中的间隔序列可不同于包含在第二工程化的引导RNA序列中的间隔序列。此外,包含在第一工程化的引导RNA序列中的富含U的尾序列可不同于包含在第二工程化的引导RNA序列中的富含U的尾序列。在实施方式中,第一工程化的引导RNA序列可包含第一支架序列、第一间隔序列和第一富含U的尾序列,第二工程化的引导RNA序列可包含第二支架序列、第二间隔序列和第二富含U的尾序列。
载体组分-启动子序列
载体序列包含与编码各组分的序列可操作地连接的启动子序列。具体而言,所述启动子序列可为<相关技术-CRISPR/Cas系统表达载体的设计>部分的启动子部分中公开的启动子之一,但不限于此。
在实施方式中,载体序列可包含编码Cas12f1蛋白的序列和启动子序列。就此而言,所述启动子序列可操作地连接至编码Cas12f1蛋白的序列。在实施方式中,载体序列可包含编码工程化的引导RNA的序列和启动子序列。就此而言,所述启动子序列可操作地连接至编码工程化的引导RNA的序列。在实施方式中,载体序列可包含编码Cas12f1蛋白的序列、编码工程化的引导RNA的序列和启动子序列。就此而言,所述启动子序列可操作地连接至编码Cas12f1蛋白的序列以及编码工程化的引导RNA的序列,并且由所述启动子序列激活的转录因子表达所述Cas12f1蛋白和所述工程化的引导RNA。
载体配置-可包含两个或多个启动子序列
在实施方式中,载体序列可包含编码Cas12f1蛋白的第一序列、第一启动子序列、编码工程化的引导RNA的第二序列以及第二启动子序列。就此而言,第一启动子序列可操作地连接至第一序列,第二启动子序列可操作地连接至第二序列,第一序列的转录由第一启动子序列诱导,第二序列的转录由第二启动子序列诱导。就此而言,第一启动子和第二启动子可为相同类型的启动子。就此而言,第一启动子和第二启动子可为不同类型的启动子。
在实施方式中,载体序列可包含编码Cas12f1蛋白的第一序列、第一启动子序列、编码第一工程化的引导RNA的第二序列、第二启动子序列、包含编码第二工程化的引导RNA的序列的第三序列以及第三启动子序列。就此而言,第一启动子序列可操作地连接至第一序列,第二启动子序列可操作地连接至第二序列,第三启动子序列可操作地连接至第三序列,第一序列的转录由第一启动子序列诱导,第二序列的转录由第二启动子序列诱导,第三序列的转录由第三启动子序列诱导。就此而言,第二启动子和第三启动子可为相同类型的启动子。具体而言,第二启动子序列和第三启动子序列可为U6启动子序列,但不限于此。就此而言,第二启动子和第三启动子可为不同类型的启动子。具体而言,第二启动子序列和第三启动子序列可分别为U6启动子序列和H1启动子序列,但不限于此。
载体组分-终止信号
载体可包含与启动子序列可操作地连接的终止信号。就此而言,终止信号可为在<相关技术-CRISPR/Cas系统表达载体的设计>部分的终止信号部分中公开的终止信号之一,但不限于此。终止信号可根据启动子序列的类型而异。在实施方式中,当载体序列包含U6启动子序列时,与U6启动子序列可操作地连接的连续胸苷序列可充当终止信号。在实施方式中,所述胸苷序列可为其中有五个以上胸苷连续连接的序列。在实施方式中,当载体序列包含H1启动子序列时,与H1启动子序列可操作地连接的连续胸苷序列可充当终止信号。在实施方式中,所述胸苷序列可为其中有五个以上胸苷连续连接的序列。
载体组分-编码富含U的尾序列的序列与终止信号之间的关系
本公开中提供的工程化的引导RNA的序列在其3'-末端包含富含U的尾序列。因此,编码所述工程化的引导RNA的序列将在其3'-末端包含对应于富含U的尾序列的富含T的序列。如上所述,由于一些启动子序列识别连续的胸苷序列(例如,其中5个以上胸苷连续连接的序列)作为终止信号,因此在一些情况下可将富含T的序列识别为终止信号。换言之,当根据本公开的载体序列包含编码工程化的引导RNA的序列时,编码所述工程化的引导RNA序列中包含的富含U的尾序列的序列可用作终止信号。在实施方式中,当载体序列包含U6或H1启动子序列并且包含与U6或H1启动子序列可操作连接的编码所述工程化的引导RNA的序列时,编码所述工程化的引导RNA序列中包含的富含U的尾序列的序列部分可被识别为终止信号。就此而言,富含U的尾序列包含其中具有五个以上尿苷连续连接的序列。
载体组分-其它组分
除了所述配置之外,根据目的,载体序列可包含所需的组分。在实施方式中,载体序列可包含调节/控制组分序列和/或额外组分序列。在实施方式中,为了区分转染细胞和非转染细胞的目的,可添加额外组分。就此而言,所述调节/控制组分序列和额外组分可为<相关技术-CRISPR/Cas系统表达载体的设计>中公开的那些成分中的一种,但不限于此。
载体类型-病毒载体
载体可为病毒载体。在实施方式中,所述病毒载体可为选自于由以下病毒所组成的组中的一种或多种:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。在实施方式中,所述病毒载体可为腺相关病毒(AAV)。
载体类型-非病毒载体
载体可为非病毒载体。在实施方式中,非病毒载体可为选自于由以下所组成的组中的一种或多种:质粒、噬菌体、裸DNA、DNA复合体和mRNA。在实施方式中,质粒可选自于由以下所组成的组:pcDNA系列、pSC101、pGV1106、pACYC177、ColE1、pKT230、pME290、pBR322、pUC8/9、pUC6、pBD9、pHC79、pIJ61、pLAFR1、pHV14、pGEX系列、pET系列和pUC19。在实施方式中,噬菌体可选自于由以下所组成的组:λgt4λB、λ-Charon、λΔz1和M13。在实施方式中,载体可为PCR扩增子。
载体形式-环状载体或线性载体
载体可为环状或线性形式。当载体为线性载体时,即使线性载体序列不单独包含终止信号,RNA转录在其3'-末端终止。相比之下,当载体为环状载体时,除非环状载体序列单独包含终止信号,否则RNA转录不终止。因此,当使用环状载体作为载体时,必须包含对应于与每个启动子序列相关的转录因子的终止信号,以表达预期的靶标。在实施方式中,载体可为线性载体。在实施方式中,载体可为线性扩增子。在实施方式中,所述载体可为包含选自于由如下所组成的组中的序列的线性载体:SEQ ID NO:1、SEQ ID NO:2以及SEQ ID NO:127-SEQ ID NO:177。在实施方式中,载体可为环状载体。在实施方式中,所述载体可为包含选自于由如下所组成的组中的序列的环状载体:SEQ ID NO:1、SEQ ID NO:2以及SEQ IDNO:127-SEQ ID NO:177。
载体-序列的实例
在实施方式中,所述载体序列可包含选自于由SEQ ID NO:1、SEQ ID NO:2以及SEQID NO:127-SEQ ID NO:177所组成的组中的一种或多种序列。在实施方式中,载体序列可包含选自于由SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:316、SEQ ID NO:318、SEQ ID NO:320和SEQ ID NO:322所组成的组中的一种或多种序列。
核酸的化学修饰
本公开的方面提供了包含如下或由如下组成的组分:工程化的crRNA或编码所述工程化的crRNA的核酸、工程化的引导RNA或编码所述工程化的引导RNA的核酸,和/或诸如用于表达CRISPR/Cas12f1系统的组分等的核酸。就此而言,本文所用的“核酸”可为自然界中存在的DNA或RNA,并且可为其中核酸的部分或全部被化学修饰的修饰核酸。在实施方式中,所述核酸可为自然界中存在的DNA和/或RNA。在实施方式中,所述核酸可为其中一个或多个核苷酸被化学修饰的核酸。就此而言,所述化学修饰包括本领域已知的所有核酸修饰。具体而言,所述化学修饰可包括(WO 2019/089820 A1)中描述的所有核酸修饰,但不限于此。
使用工程化的crRNA的基因编辑方法
概述
本公开的方面提供了使用工程化的crRNA在靶细胞中编辑靶基因或靶核酸的方法。所述靶基因或靶核酸包含靶序列。所述靶核酸可为单链DNA、双链DNA和/或RNA。所述基因编辑方法包括:将工程化的引导RNA、Cas12f1蛋白、或者编码所述工程化的引导RNA和所述Cas12f1蛋白中的每一个的核酸递送到包含靶基因或靶核酸的靶细胞中。因此,将工程化的CRISPR/Cas12f1复合体注入所述靶细胞中,或诱导所述工程化的CRISPR/Cas12f1复合体的形成,以及通过所述工程化的CRISPR/Cas12f1复合体对靶基因进行编辑。所述工程化的引导RNA具有与<用于CRISPR/Cas12f1系统的工程化的引导RNA>部分中描述的特征和结构相同的特征和结构。所述Cas12f1蛋白具有与<工程化CRISPR/Cas12f1复合体>部分中描述的Cas12f1蛋白和/或修饰的Cas12f1蛋白相同的特征和配置。
在实施方式中,所述基因编辑方法可包括:将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送到靶细胞中。就此而言,所述工程化的引导RNA序列包含支架序列、间隔序列和富含U的尾序列。就此而言,所述间隔序列可互补结合至靶细胞中包含的靶基因或靶核酸。在实施方式中,富含U的尾序列可由(UaV)nUb表示。就此而言,a、n和b为整数,a为1-4,n为0或更大,b为1-10。在实施方式中,富含U的尾序列可由(UaN)nUb表示。就此而言,N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
靶细胞
在实施方式中,所述靶细胞可为原核细胞。在实施方式中,所述靶细胞可为真核细胞。具体而言,所述真核细胞可为植物细胞、动物细胞和/或人细胞,但不限于此。
靶序列的确定
可考虑基因编辑的目的、靶细胞环境、Cas12f1蛋白识别的PAM序列和/或其它变量来确定要使用CRISPR/Cas12f1复合体编辑的靶基因或核酸和靶序列。就此而言,只要可确定具有适当长度的靶序列,所述方法就没有特别限制,并且可利用已知技术。
根据靶序列确定间隔序列
一旦确定了靶序列,相应的间隔序列就被设计。所述间隔序列被设计为能够与靶序列互补结合的序列。在实施方式中,所述间隔序列被设计为能够与靶基因互补结合的序列。在实施方式中,所述间隔序列被设计为能够与靶核酸互补结合。在实施方式中,所述间隔序列被设计为与包含在靶核酸的靶链序列中的靶序列互补的序列。在实施方式中,所述间隔序列被设计为对应于如下的RNA序列:包含在靶核酸的非靶链序列中的原间隔区的DNA序列。具体而言,所述间隔序列具有与原间隔序列相同的碱基序列,但被设计为碱基序列中所含的各胸苷被置换为尿苷的序列。
靶序列和间隔序列的互补性
在实施方式中,所述间隔序列可为与靶序列具有60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%互补性的序列。在实施方式中,所述间隔序列可为与靶序列具有在紧接在前的句子中选择的数值范围内的互补性的序列。例如,所述间隔序列可为与靶序列具有60%-90%互补性的序列。在实施方式中,所述间隔序列可为与靶序列具有90%-100%互补性的序列。
靶序列和间隔序列之间的错配数
在实施方式中,间隔序列可为与靶序列具有0个、1个、2个、3个、4个、5个、6个、7个、8个、9个或10个错配的互补序列。在实施方式中,间隔序列可具有在这些值中的两个的数值范围内的错配。例如,间隔序列可与靶序列有1-5个错配。在实施方式中,间隔序列可与靶序列有6-10个错配。
CRISPR/Cas12f1复合体的使用
本公开中提供的基因编辑方法利用所述工程化CRISPR/Cas12f1复合体具有以靶特异性方式切割基因或核酸的活性这一事实。所述工程化CRISPR/Cas12f1复合体与<工程化CRISPR/Cas12f1复合体>部分中描述的工程化CRISPR/Cas12f1复合体具有相同的特征和配置。
将CRISRP/Cas12f1复合体的各组分递送至细胞中
在本公开中提供的基因编辑方法中,假定在靶细胞内使工程化的CRISPR/Cas12f1复合体与靶基因或核酸接触。因此,为了诱导工程化CRISPR/Cas12f1复合体与靶基因或靶核酸接触,所述基因编辑方法包括:将工程化CRISPR/Cas12f1复合体的各组分递送到靶细胞中。在实施方式中,所述基因编辑方法可包括将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送到靶细胞中。在实施方式中,所述基因编辑方法可包括将工程化的引导RNA和Cas12f1蛋白递送到靶细胞中。在实施方式中,所述基因编辑方法可包括将编码工程化的引导RNA和Cas12f1蛋白的核酸递送到靶细胞中。在实施方式中,所述基因编辑方法可包括将工程化的引导RNA和编码Cas12f1蛋白的核酸递送到靶细胞中。在实施方式中,所述基因编辑方法可包括将编码工程化的引导RNA的核酸和编码Cas12f1蛋白的核酸递送到靶细胞中。可使用各种递送方法以各种递送形式将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送到靶细胞中。
递送形式-RNP
作为递送形式,可使用工程化的引导RNA和Cas12f1蛋白相组合的核糖核蛋白颗粒(RNP)。在实施方式中,所述基因编辑方法可包括将其中组合了工程化的引导RNA和Cas12f1蛋白的CRISPR/Cas12f1复合体注射到靶细胞中。
递送形式-非病毒载体
作为另一递送形式,可使用包含编码工程化的引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列的非病毒载体。在实施方式中,所述基因编辑方法可包括将包含编码工程化的引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列的非病毒载体注射到靶细胞中。具体而言,所述非病毒载体可为质粒、裸DNA、DNA复合体或mRNA,但不限于此。在实施方式中,所述基因编辑方法可包括将包含编码工程化的引导RNA的核酸序列的第一非病毒载体和包含编码Cas12f1蛋白的核酸序列的第二非病毒载体注射到靶细胞中。具体而言,第一非病毒载体和第二非病毒载体可分别选自于由质粒、裸DNA、DNA复合体和mRNA所组成的组中的一种,但不限于此。
递送形式-病毒载体
作为又一递送形式,可使用包含编码工程化的引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列的病毒载体。在实施方式中,所述基因编辑方法可包括:将编码工程化的引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列注射到靶细胞中。具体而言,所述病毒载体可为选自于由以下病毒所组成的组中的一种:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒,但不限于此。在实施方式中,所述病毒载体可为腺相关病毒(AAV)。
在实施方式中,所述基因编辑方法可包括:将包含编码工程化的引导RNA的核酸序列的第一病毒载体和包含编码Cas12f1蛋白的核酸序列的第二病毒载体注射到靶细胞中。具体而言,第一病毒载体和第二病毒载体可分别选自于由以下病毒所组成的组中的一种:逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒,但不限于此。
递送方式-一般递送方式
只要其能够以适当的递送形式将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送到细胞中,递送方法不受特别限制。在实施方式中,所述递送方法可为电穿孔、基因枪法、超声穿孔、磁转染和/或瞬时细胞压缩或挤压。
递送方法-纳米颗粒
所述递送方法可为使用纳米颗粒递送CRISPR/Cas12f1系统中所含的至少一种组分。就此而言,递送方法可为已知方法,能够由本领域技术人员恰当选择。例如,纳米颗粒递送方法可为(WO 2019/089820A1)中公开的方法,但不限于此。
在实施方式中,所述递送方法可为使用纳米颗粒递送Cas12f1蛋白或编码所述Cas12f1蛋白的核酸和/或工程化的引导RNA或编码所述工程化的引导RNA的核酸。在实施方式中,所述递送方法可为使用纳米颗粒递送Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、第一工程化的引导RNA或编码所述第一工程化的引导RNA的核酸、和/或第二工程化的引导RNA或编码所述第二工程化的引导RNA的核酸。就此而言,所述递送方法可为阳离子脂质体法、乙酸锂-DMSO法、脂质介导的转染、磷酸钙沉淀法、脂质转染、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染和/或纳米颗粒介导的核酸递送(参见Panyam等,Adv DrugDeliv Rev.,2012年9月13,pii:S0169-409X(12)00283-9.doi:10.1016/j.addr.2012.09.023),但不限于此。就此而言,CRISPR/Cas12f1系统的组分可为RNP、非病毒载体和/或病毒载体的形式。例如,CRISPR/Cas12f1系统的组分可为编码各组分的mRNA的形式,但不限于此。
递送形式和方法-可能的组合
所述基因编辑方法包括:将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送到细胞中,就此而言,所述组分的递送形式和/或递送方法可彼此相同也可不同。在实施方式中,所述基因编辑方法可包括:以第一递送形式递送工程化的引导RNA或编码所述工程化的引导RNA的核酸,以及以第二递送形式递送Cas12f1蛋白或编码所述Cas12f1蛋白的核酸。就此而言,第一递送形式和第二递送形式可各自为上述递送形式中的任一种。在实施方式中,所述基因编辑方法可包括:通过第一递送方法递送工程化的引导RNA或编码所述工程化的引导RNA的核酸,以及通过第二递送方法递送Cas12f1蛋白或编码所述Cas12f1蛋白的核酸。就此而言,第一递送方法和第二递送方法可各自为上述递送方法中的任一种。
递送顺序
所述基因编辑方法包括:将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至细胞中,并且就此而言,可同时将所述组分递送至细胞中,但也可按其间的时间间隔顺序递送。
在实施方式中,所述基因编辑方法可包括:同时递送工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸。在实施方式中,所述基因编辑方法可包括:将工程化的引导RNA或编码所述工程化的引导RNA的核酸递送至细胞中,然后在一段时间间隔后将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至所述细胞中。在实施方式中,所述基因编辑方法可包括:将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至细胞中,然后在一段时间间隔后将工程化的引导RNA递送至所述细胞中。在实施方式中,所述基因编辑方法可包括:将编码Cas12f1蛋白的核酸递送至细胞中,然后在一段时间间隔后将工程化的引导RNA递送至所述细胞中。
多个工程化的引导RNA或编码所述多个工程化的引导RNA的核酸的递送
本公开中提供的基因编辑方法可包括:将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、以及两种以上的工程化的引导RNA或编码所述两种以上的工程化的引导RNA的核酸递送至靶细胞中。通过所述方法,可将靶向不同序列的两种以上的CRISPR/Cas12f1复合体注射到靶细胞中,或者可在靶细胞中形成靶向不同序列的两种以上的CRISPR/Cas12f1复合体。因此,可对细胞中包含的两个以上的靶基因或靶核酸进行编辑。在实施方式中,所述基因编辑方法包括:将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、第一工程化的引导RNA或编码所述第一工程化的引导RNA的核酸、以及第二工程化的引导RNA或编码所述第二工程化的引导RNA的核酸递送至包含靶基因或靶核酸的靶细胞中。就此而言,可使用上述所述的递送形式和方法中的一种或多种将各种组分递送至细胞中。就此而言,可将两种以上的组分同时递送至细胞中,或者可将它们按其间的时间间隔顺序递送至细胞中。
使CRISPR/Cas12f1复合体和靶核酸彼此接触
在本公开中提供的基因编辑方法中,在使靶细胞中的工程化CRISPR/Cas12f1复合体与靶基因或靶核酸接触的同时进行靶基因或靶核酸的编辑。因此,所述基因编辑方法可包括将工程化CRISPR/Cas12f1复合体在靶细胞中接触,或诱导所述接触。在实施方式中,所述基因编辑方法可包括:使工程化CRISPR/Cas12f1复合体与靶细胞中的靶核酸接触。在实施方式中,所述基因编辑方法可包括:诱导工程化CRISPR/Cas12f1复合体与靶细胞中的靶核酸接触。就此而言,诱导不受特别限制,只要它是使工程化CRISPR/Cas12f1复合体与细胞中的靶核酸接触的方法即可。在实施方式中,所述诱导可包括:将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至细胞中。
基因编辑结果-插入缺失
作为执行本公开中提供的基因编辑方法的结果,可在靶基因或靶核酸中产生插入缺失。就此而言,插入缺失可出现在靶序列部分和/或原间隔序列部分的内部和/或外部。插入缺失是指核酸的核苷酸序列中的突变,其中核苷酸序列中的一部分被删除,任意核苷酸被插入,和/或从预先编辑的序列开始组合插入和删除。通常,靶基因或靶核酸序列中插入缺失的出现会使相应基因或核酸失活。在实施方式中,作为执行所述基因编辑方法的结果,可在靶基因或靶核酸中删除和/或添加一个或多个核苷酸。
基因编辑结果-碱基编辑
作为执行本公开中提供的基因编辑方法的结果,可在靶基因或靶核酸内发生碱基编辑。这意味着与其中删除或添加靶基因或靶核酸中的任何碱基的插入缺失不同,核酸中的一个或多个特定碱基按预期改变。换言之,碱基编辑在靶基因或核酸的特定位置处引起预定的点突变。在实施方式中,作为执行所述基因编辑方法的结果,靶基因或靶核酸中的一个或多个碱基可被置换为其它碱基。
基因编辑结果-插入
作为执行本公开中提供的基因编辑方法的结果,可在靶基因或靶核酸中发生敲入(knock-in)。敲入是指在靶基因或靶核酸序列中插入额外的核酸序列。除了CRISPR/Cas12f1复合体外,还需要包含额外的核酸序列的供体来进行敲入。当CRISPR/Cas12f1复合体切割细胞中的靶基因或靶核酸时,将发生被切割的靶基因或靶核酸的修复。就此而言,所述供体参与修复过程,从而将所述额外的核酸序列插入靶基因或靶核酸中。在实施方式中,所述基因编辑方法还可包括:将供体递送至靶细胞中。就此而言,所述供体包含额外的靶核酸,并且所述供体诱导所述额外的靶核酸插入到靶基因或靶核酸中。就此而言,当将所述供体递送至靶细胞中时,可使用上述所述的递送形式和/或递送方法。
基因编辑结果-删除
作为执行本公开中提供的基因编辑方法的结果,靶基因或靶核酸序列的全部或部分可被删除。删除是指将靶基因或靶核酸中的部分碱基序列删除。在实施方式中,所述基因编辑方法包括:将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、第一工程化的引导RNA或编码所述第一工程化的引导RNA的核酸、以及第二工程化的引导RNA或编码所述第二工程化的引导RNA的核酸引入包含靶基因或靶核酸的细胞中。因此,所述靶基因或靶核酸中特定序列部分的删除由于基因编辑而发生。
基因编辑方法的实例
在实施方式中,所述基因编辑方法可包括:以核糖核蛋白颗粒的形式将CRISPR/Cas12f1复合体递送至真核细胞中,在所述核糖核蛋白颗粒中工程化的引导RNA和Cas12f1蛋白相组合。就此而言,可通过电穿孔或脂质转染进行所述递送。
在实施方式中,所述基因编辑方法可包括:将编码工程化的引导RNA的核酸和编码Cas12f1蛋白的核酸递送到真核细胞中。就此而言,可通过电穿孔或脂质转染进行所述递送。
在实施方式中,所述基因编辑方法可包括:将腺相关病毒(AAV)载体递送到真核细胞中,所述腺相关病毒(AAV)载体包含编码工程化的引导RNA的核酸序列和编码Cas12f1蛋白的核酸序列。
在实施方式中,所述基因编辑方法可包括:将腺相关病毒(AAV)递送到真核细胞中,所述腺相关病毒(AAV)包含编码第一工程化的引导RNA的核酸序列、编码第二工程化的引导RNA的核酸序列以及编码Cas12f1蛋白的核酸序列。
工程化的crRNA的用途
工程化的crRNA的基因编辑用途
在实施方式中,所述工程化的crRNA可用于包含靶序列的靶基因或靶核酸的基因编辑。
在实施方式中,所述工程化的引导RNA可用于包含靶序列的靶基因或靶核酸的基因编辑。
在实施方式中,所述工程化CRISPR/Cas12f1复合体可用于包含靶序列的靶基因或靶核酸的基因编辑。
就此而言,所述工程化的crRNA、工程化的引导RNA和工程化CRISPR/Cas12f1复合体具有与各部分中描述的特征和配置相同的特征和配置。
在实施方式中,可使用靶基因或靶核酸的基因编辑的用途来执行<使用工程化的crRNA的基因编辑方法>部分中描述的方法。
在实施方式中,所述用途可包括:将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至靶细胞中。就此而言,所述工程化的引导RNA序列包含支架序列、间隔序列和富含U的尾序列。就此而言,所述间隔序列可与靶细胞中包含的靶基因或靶核酸互补结合。在实施方式中,富含U的尾序列可由(UaV)nUb表示。就此而言,a、n和b为整数,a为1-4,n为0或更大,b为1-10。在实施方式中,富含U的尾序列可由(UaN)nUb表示。就此而言,N为腺苷(A)、尿嘧啶(U)、胞苷(C)和鸟苷(G)中的一种。就此而言,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
在实施方式中,所述用途可包括使工程化CRISPR/Cas12f1复合体与靶细胞中的靶核酸接触。
就此而言,所述工程化CRISPR/Cas12f1复合体具有与<工程化CRISPR/Cas12f1复合体>部分中描述的特征和结构相同的特征和结构。
在实施方式中,所述用途可包括:诱导工程化CRISPR/Cas12f1复合体与靶细胞中的靶核酸接触。就此而言,诱导不受特别限制,只要它是使工程化CRISPR/Cas12f1复合体与细胞中的靶核酸接触的方法即可。在实施方式中,所述诱导可包括:将工程化的引导RNA或编码所述工程化的引导RNA的核酸以及Cas12f1蛋白或编码所述Cas12f1蛋白的核酸递送至细胞中。
工程化的crRNA用于制备基因编辑组合物的用途
在实施方式中,工程化的crRNA可用于制备用于基因编辑的组合物。
在实施方式中,工程化的引导RNA可用于制备用于基因编辑的组合物。
在实施方式中,工程化CRISPR/Cas12f1复合体可用作制备用于基因编辑的组合物的用途。
在实施方式中,用于基因编辑的组合物可包含Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、工程化的crRNA或编码所述工程化的crRNA的核酸、以及tracrRNA或编码所述tracrRNA的核酸。
在实施方式中,用于基因编辑的组合物可包含Cas12f1蛋白或编码所述Cas12f1蛋白的核酸、以及工程化的引导RNA或编码所述工程化的引导RNA的核酸。
在实施方式中,用于基因编辑的组合物可包含CRISPR/Cas12f1复合体。
在实施方式中,用于基因编辑的组合物可包含具有编码Cas12f1蛋白的核酸序列和编码工程化的引导RNA的核酸序列的载体。
实施例
在下文中,将通过实验例和实施例更详细地描述本公开中所提供的发明。这些实施例仅用于例示本公开中所公开的内容,并且对于本领域技术人员来说将显而易见的是,本公开所公开的内容的范围不应被解释为受这些实施例的限制。
实验例1实验材料的制备及实验方法
实验例1-1人密码子优化的Cas14a1序列
使用密码子优化程序对属于Cas14家族的Cas12f1蛋白(以下称为Cas14a1,Doudna等,Programmed DNA destruction by miniature CRISPR-Cas14 enzymes,Science 362,839-842(2018))进行密码子优化,并且基因合成其中5'端和3'-末端添加有NLS序列的序列以确保CDS。使用合成的基因作为模板来进行PCR扩增,并通过Gibson组装法,对于具有能够在真核系统中表达的启动子和polyA信号序列的载体根据所需克隆序列进行克隆。最终通过Sanger测序法确认克隆完成后得到的质粒载体的序列。Cas14a1蛋白的氨基酸序列和编码所述Cas14a1蛋白的人密码子优化核酸序列示于表1中。
[表1]
NLS-Cas14a1-NLS蛋白的序列信息
实验例1-2质粒载体的制备
合成了本实验中使用的包含人密码子优化的Cas14a1DNA序列的寡核苷酸(Bionics)。将用于Cas14a1蛋白序列的寡核苷酸克隆到包含鸡β-肌动蛋白启动子、5'端和3'端处的NLS以及T2A连接的eGFP的质粒中。合成了本实验中使用的标准引导RNA的模板DNA(Twist Bioscience),并克隆到pTwist Amp质粒中进行复制。使用酶克隆技术构建用于工程化的引导RNA的模板DNA,并克隆到pTwist Amp质粒中进行复制。如有必要,通过使用质粒作为模板,使用U6互补的正向引物和原间隔序列互补的反向引物来制备引导RNA或工程化的引导RNA的扩增子。此外,如有必要,将制备的扩增子克隆到T-平端质粒(Biofact)中进行复制。为了制备(工程化的)双引导RNA,使用BamHI和HindIII限制性酶(New EnglandBiolabs)在pSilencer 2.0(ThermoFisher Scientific)中对编码tracrRNA和(工程化的)crRNA的寡核苷酸进行复制。
实验例1-3病毒载体的制备
制备了包含如下的腺相关病毒(AAV)反向末端重复载体:引导RNA(或工程化的引导RNA)序列以及通过NLS和自切割T2A序列与增强型绿色荧光蛋白(eGFP)连接的Cas12f1蛋白序列。分别通过鸡β-肌动蛋白启动子和U6启动子促进了Cas12f1和引导RNA的转录。为了制备rAAV2载体,将pAAV-ITR-sgRNA-Cas12f1、pAAVED29和辅助质粒转染到HEK293 T细胞中。在含有2%FBS的DMEM培养基中培养转染的HEK293T细胞。使用Polyplus转染(PEIpro)和PEI共沉淀以相同的摩尔比使用对质粒的三次转染,来生产重组假型AAV载体原液。培养72小时后,裂解细胞,并通过碘克沙醇(Sigma-Aldrich)逐步梯度超速离心纯化裂解物。
实验例1-4引导RNA扩增子的制备
为了制备引导RNA和工程化的引导扩增子,使用KAPA HiFi HotStart DNA聚合酶(Roche)或Pfu DNA聚合酶(Biofact),用U6互补的正向引物和原间隔序列互补的反向引物,针对用于标准引导RNA的模板DNA质粒和工程化引导RNA的模板DNA质粒,进行PCR扩增。使用Higene Gel&PCR纯化系统(Biofact)纯化PCR扩增产物以获得引导RNA和工程化引导RNA扩增子。
实验例1-5引导RNA的制备
使用以下方法之一来制备引导RNA(或工程化的引导RNA)。
引导RNA通过化学合成预先设计的引导RNA来制备。
制备了包含预先设计的引导RNA序列和T7启动子序列的PCR扩增子。使用NEB T7聚合酶,以PCR扩增子为模板进行体外转录。用NEBDNase I处理通过进行体外转录所得到的产物,然后使用Monarch RNA Cleanup Kit(NEB)纯化经处理的产物,然后得到引导RNA。
通过实验例1-2中的Tblunt质粒克隆方法制备了包含预先设计的引导RNA序列和T7启动子序列的质粒载体。通过双剪切包含T7启动子序列的引导RNA序列的两端来纯化所述载体,然后使用NEB T7聚合酶在所得的产物上进行体外转录。用NEB DNase I处理通过进行体外转录所得到的产物后,使用Monarch RNA Cleanup Kit(NEB)纯化经处理的产物,然后得到引导RNA。
实验例1-6重组Cas12f1蛋白的制备
在pMAL-c2质粒载体中复制本实验中使用的人密码子优化的Cas14a1DNA序列。所述质粒载体用于转化BL21(DE3)大肠杆菌(E.coli)细胞。使转化的大肠杆菌菌落在37℃下在LB肉汤中生长,直至光密度达到0.7。将转化的大肠杆菌细胞在0.1mM异丙硫基-β-D-半乳糖苷存在下于18℃培养过夜。然后将细胞以3500g离心30分钟并收集。将细胞重新悬浮在20mM Tris-HCl(pH 7.6)、500mM NaCl、5mMβ-巯基乙醇、5%甘油中。对细胞进行裂解,通过超声对裂解的细胞进行破碎。将包含破碎细胞的样品以15000g离心30分钟后,通过0.4μm注射器过滤器(Millipore)过滤上清液。使用FPLC纯化系统(AKTA Purifier,GE Healthcare)将过滤后的上清液加载到Ni2+亲和柱上。以80-400mM咪唑、20mM Tris-HCl(pH 7.5)的梯度洗脱结合的级分。用TEV蛋白酶处理洗脱的蛋白16小时。在肝素柱中以0.15-1.6M NaCl线性浓度梯度纯化切割的蛋白。以20mM Tris pH 7.6、150mM NaCl、5mMβ-巯基乙醇和5%甘油为背景对在肝素柱中纯化的重组Cas12f1蛋白进行透析。通过穿过MBP柱对透析的蛋白进行纯化,然后在monoS柱(GE Healthcare)或Enrich S中以0.5-1.2M NaCl的线性梯度再纯化。收集再纯化的蛋白并以20mM Tris pH 7.6、150mM NaCl、5mMβ-巯基乙醇和5%甘油为背景进行透析以制备Cas12f1蛋白。使用牛血清白蛋白作为标准品,通过Bradford量化对产生的蛋白浓度进行量化,并在考马斯蓝染色的SDS-PAGE凝胶上进行电泳测量。
实验例1-7RNP的制备
通过将根据实验例1-6制备的重组Cas12f1蛋白和根据实验例1-5制备的引导RNA(或工程化的引导RNA)在室温下分别以300nM和900nM孵育10分钟来制备核糖核蛋白颗粒(RNP)。
实验例1-8细胞培养
在37℃和5%CO2条件下,在DMEM培养基中培养HEK-293 T细胞(ATCC CRL-11269),其中添加有10%热灭活FBS(Corning)和1%青霉素/链霉素。
实验例1-9质粒载体或PCR扩增子转染细胞
通过电穿孔或脂质转染进行细胞转染。在电穿孔的情况下,使用Neon转染系统(Invitrogen),用各自为2-5μg的在实验例1-2中制备的编码Cas12f1蛋白的质粒载体和编码引导RNA(和工程化的引导RNA)的DNA对4×105HEK-293 T细胞进行转染。在1300V、10mA和3脉冲的条件下进行电穿孔。对于脂质转染,将3-15μL FuGene试剂(Promega)与1-5μg编码Cas12f1蛋白的质粒载体以及0.3-2μg PCR扩增子混合15分钟。在转染前1天,将混合物添加到1mL铺有1×106个细胞的DMEM培养基中。在混合物存在下培养细胞72-96小时。培养后,收集细胞并使用PureHelixTM基因组DNA制备试剂盒(NanoHelix)或Maxwell RSC培养细胞DNA试剂盒(Promega)手动分离细胞的基因组DNA。
实验例1-10细胞内RNP转染
在转染引导RNA(和工程化的引导RNA)前1天,使用实验例1-9中的电穿孔转染实验例1-7中制备的核糖核蛋白颗粒(RNP),或通过实验例1-9中的脂质转染法转染实验例1-2中制备的编码Cas12f1蛋白的质粒,并且在1天后,使用实验例1-9中的电穿孔转染实验例1-5制备的引导RNA(和工程化的引导RNA)。
实验例1-11细胞中的病毒载体转染
用不同感染复数(MOI)(1、5、10、50和100)的rAAV2-Cas12f1-sgRNA感染人HEK293T细胞,所述MOI由定量PCR测定。在含有2%FBS的DMEM培养基中培养转染的HEK293T细胞。在不同的时间点,收集细胞以分离基因组DNA。
实验例1-12定量实时PCR(定量rtPCR)
使用RNeasy Miniprep试剂盒(Qiagen)或Maxwell RSC miRNA Tissue Kit(Promega)或DNeasy Blood&Tissue Kit(Qiagen)从HEK293 T细胞中分别提取引导RNA(或工程化的引导RNA)或基因组DNA。为了量化引导RNA,连接了RNA特异性引物,并使用crRNA特异性引物合成了cDNA。将所述cDNA用作定量实时PCR的模板。使用KAPA SYBR FAST qPCRMaster Mix(2×)Kit(KapaBiosystems)对实时PCR进行分析。
实验例1-13确认Cas蛋白表达的蛋白质印迹
制备实验例1-2所制备的编码Cas蛋白的质粒载体。关于这一点,该质粒进一步具有编码HA标签的序列(5'-TACCCATACGATGTTCCAGATTACGCTTATCCCTACGACGTGCCTGATTATGCATACCCATATGATGTCCCCGACTATGCC-3',SEQ ID NO:315),使得当Cas蛋白在细胞中表达时可连接和表达HA标签。通过实验例1-9中公开的方法用所述质粒载体对实验例1-8中培养的HEK293 T细胞进行转染。将所述HEK293T细胞接种到含有青霉素/链霉素的DMEM培养基中,在37℃和5%CO2的培养箱中静置培养48小时。然后,用PBS稀释HEK293 T细胞,然后通过超声破碎。将含有破碎细胞的样品在15000g和4℃下离心10分钟后,通过Bradford量化方法对上清液进行量化。通过蛋白质印迹检测所量化的HA抗体是否在体内表达。
实验例1-14插入缺失效率分析
在从HEK-293T细胞中分离的基因组DNA中,在KAPA HiFi HotStart DNA聚合酶(Roche)存在下,使用靶特异性引物对含有原间隔区的区域进行PCR。扩增方法遵循制造商的说明。使用Illumina iSeq 100对作为扩增所得的产物的PCR扩增子(包含IlluminaTruSeq HT双索引)进行150bp配对末端测序。使用MAUND计算插入缺失频率。MAUND在https://github.com/ibscge/maund上提供。
实验例1-15T7核酸内切酶I(T7E1)分析
使用BioFACTTM Lamp Pfu DNA聚合酶获得PCR产物。在37℃下,将PCR产物(100-300μg)与10单位的T7E1酶(New England Biolabs)在25μg反应混合物中反应30分钟。将20μL反应混合物直接加载到10%芳基酰胺凝胶上,将切割的PCR产物在TBE缓冲系统中运行。用溴化乙锭溶液对凝胶图像进行染色,然后使用Printgraph 2M凝胶成像系统(Atto)进行数字化。通过分析数字化结果来评价基因编辑效率。
实验例1-16统计分析
通过Sigma Plot软件(版本14.0),用双尾学生t检验进行统计学显著性验证。当出现小于0.05的p值时,认为统计学上显著,p值在每张图中都有说明。在箱线图和点图中,数据点表示值的完整范围,每个方框跨越四分位数范围(25-75百分位数)。中值和平均值分别由黑色和红色的平行线表示。所有点图和条形图数据的误差棒均使用Sigmaplot(v.41.0)进行表明,并表示每个数据的标准偏差值。样本量不是基于统计方法预先确定的。
实验例2具有富含U的尾的工程化CRISPR/Cas14a1系统的插入缺失效率比较1
使用各种基因序列作为靶核酸进行了实验,以评价具有富含U的尾序列的工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和各PAM序列在表2中公开。
[表2]
实验例2的靶核酸
靶核酸 | 靶核酸的原间隔序列(5′至3′) | PAM |
RNF2 | CACGTCTCATATGCCCCTTG(SEQ ID NO:62) | TTTA |
DYtarget2 | CACACACACAGTGGGCTACC(SEQ ID NO:63) | TTTG |
DYtarget9 | GACGTGGGAGACACACACAC(SEQ ID NO:64) | TTTA |
DYtarget10 | CATCCCCAGGACACACACAC(SEQ ID NO:65) | TTTG |
DYtarget13 | AGCACATGTGCACACACACA(SEQ ID NO:66) | TTTG |
1)根据实验例1-2制备包含编码Cas14a1蛋白的人密码子优化序列的质粒载体。
2)根据实验例1-4制备能够表达野生型单引导RNA或具有富含U的尾序列的(工程化的)单引导RNA的扩增子。编码单引导RNA的DNA序列和用于制备扩增子的引物序列在表3-表5中公开。
[表3]
编码实验例2中使用的野生型(WT)sgRNA的DNA序列
在上表中,对于编码每个靶核酸的sgRNA的DNA序列,sgRNA共有序列-原间隔序列-富含U的尾序列以5'-3'的方向连接,sgRNA共有序列中的支架序列为SEQ ID NO:254的一部分序列。能够表达(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。
[表4]
编码实验例2中使用的工程化的sgRNA的DNA序列
在上表中,对于编码每个靶核酸的sgRNA的DNA序列,sgRNA共有序列-原间隔序列-富含U的尾序列以5'-3'的方向连接,sgRNA共有序列中的支架序列为SEQ ID NO:254的一部分序列。能够表达(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。
[表5]
实验例2中使用的引物序列
3)通过实验例1-9中公开的方法,用能够表达单引导RNA的扩增子和包含Cas14a1序列的质粒载体,对按照实验例1-8培养的HEK-293 T细胞进行转染。
4)通过实验例1-12至实验例1-15中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果示于下表6中。
[表6]
实验例2的插入缺失效率分析结果
靶核酸 | 对照 | WT | 工程化的sgRNA |
RNF2 | 0 | 0 | 0.029 |
DYtarget2 | 0 | 0.028 | 0.749 |
DYtarget9 | 0 | 0 | 0.238 |
DYtarget10 | 0.029 | 0.031 | 1.076 |
DYtarget13 | 0.529 | 0.526 | 1.176 |
就这方面而言,仅用包含Cas14a1蛋白序列的质粒载体转染且不具有sgRNA的那些细胞用作对照。
实验例3具有富含U的尾的工程化CRISPR/Cas14a1系统的插入缺失效率比较2
使用DYtarget2、DYtarget10、DYtarget13和Intergenic-22作为靶核酸进行了实验,以评价具有富含U的尾序列的工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和各PAM序列公开于表7中。
[表7]
实验例3中使用的靶核酸序列
1)根据实验例1-2制备包含人密码子优化的Cas14a1序列的质粒载体。
2)根据实验例1-2制备能够表达野生型单引导RNA或具有富含U的尾序列的(工程化的)单引导RNA的扩增子。编码单引导RNA的DNA序列和用于制备扩增子的引物序列在表8和表9中示出。
[表8]
实验例3的编码sgRNA的DNA序列
在上表中,对于编码每个靶核酸的sgRNA的DNA序列,sgRNA共有序列-原间隔序列-富含U的尾序列以5'-3'的方向连接,sgRNA共有序列中的支架序列为SEQ ID NO:254的一部分序列。能够表达(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。
[表9]
实验例3中使用的引物序列
3)通过实验例1-9中公开的方法,用包含Cas14a1序列的质粒载体和单引导RNA的扩增子对按照实验例1-8培养的HEK-293 T细胞进行转染。
4)通过实验例1-12至实验例1-13中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果示于图2中。
如图2所公开,包含工程化的引导RNA的CRISPR/Cas14a1系统显示出比野生型更高的插入缺失效率,所述工程化的引导RNA具有连接至其3'-末端的富含U的尾序列。
实验例4具有富含U的尾的工程化CRISPR/Cas14a1系统的插入缺失效率比较3
使用DYtarget2、DYtarget10和Intergenic-22作为靶核酸进行了实验,以评价具有富含U的尾序列的工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和各PAM序列在表10中公开。
[表10]
实验例4中使用的靶核酸序列
靶核酸 | 靶核酸的原间隔序列(5′-3′) | PAM |
DYtarget2 | CACACACACAGTGGGCTACC(SEQ ID NO:63) | TTTG |
DYtarget10 | CATCCCCAGGACACACACAC(SEQ ID NO:65) | TTTG |
Intergenic-22 | AGAACACATACCCCTGGGCC(SEQ ID NO:67) | TTTA |
1)根据实验例1-2制备包含人密码子优化的Cas14a1序列的质粒载体。
2)根据实验例1-2和实验例1-4,制备了能够表达tracrRNA的质粒载体和扩增子,以及能够表达具有野生型序列或富含U的尾序列的(工程化的)crRNA的质粒载体和扩增子。编码tracrRNA和crRNA的DNA序列,以及用于制备质粒载体和扩增子的引物序列在表11-表13中示出。
[表11]
实验例4的编码tracrRNA的DNA序列
就这一方面而言,能够表达tracrRNA的扩增子序列或质粒载体序列为其中U6启动子可操作地连接至编码tracrRNA的DNA序列的扩增子序列或质粒载体序列。
[表12]
实验例4的编码crRNA的DNA序列
在上表中,对于编码每个靶核酸的crRNA的DNA序列,crRNA共有序列-原间隔序列-富含U的尾序列以5'-3'的方向连接,crRNA共有序列中的CRISPR RNA重复序列为SEQ IDNO:58的序列。能够表达(工程化的)crRNA的扩增子序列或质粒序列为其中U6启动子可操作地连接至编码所述crRNA的DNA序列的扩增子序列或质粒序列。
[表13]
实验例4中使用的引物序列
3)通过实验例1-9中公开的方法,用包含Cas14a1序列的质粒载体、tracrRNA的质粒载体或扩增子、以及crRNA的质粒载体或扩增子对按照实验例1-8培养的HEK-293 T细胞进行转染。在这方面,其中未注射crRNA的细胞用作对照(图3中No crRNA数据)。
4)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果示于图3。
如图3中所公开,包含具有连接至3'末端的富含U的尾序列的工程化引导RNA的CRISPR/Cas14a1系统显示出比野生型更高的插入缺失效率。
实验例5具有富含U的尾的工程化CRISPR/Cas14a1系统的插入缺失效率比较4
使用各种靶序列作为靶核酸进行实验,以评价具有富含U的尾序列的工程化CRISPR/Cas14a1系统的插入缺失效率。
对实验例3或实验例4中公开的靶核酸进行实验,实验按照以下方法进行,而不是用包含Cas14a1序列的质粒载体和单引导RNA的扩增子转染HEK-293 T细胞。
1)根据实验例1-5制备具有实验例3和实验例4中公开的sgRNA序列的单引导RNA。
2)根据实验例1-6制备Cas14a1蛋白。
3)根据实验例1-7,由1)和2)所得的产物制备RNP。
4)用根据实验例1-10的RNP对根据实验例1-8制备的HEK-293 T细胞进行转染。
5)以下插入缺失效率分析方法如实验例2或实验例3所述。
实验例6具有富含U的尾的工程化CRISPR/Cas14a1系统的插入缺失效率比较5
使用各种靶基因作为靶核酸进行实验,以评价具有富含U的尾序列的工程化CRISPR/Cas14a1系统的插入缺失效率。
对实验例3或实验例4中公开的靶核酸进行实验,实验按照以下方法进行,而不是用包含Cas14a1序列的质粒载体和单引导RNA的扩增子转染HEK-293 T细胞。
1)根据实验例1-3制备具有实验例3和实验例4中公开的sgRNA序列和编码Cas14a1蛋白的序列的病毒载体。
4)用根据实验例1-11的病毒载体对根据实验例1-8制备的HEK-293 T细胞进行转染。
5)以下插入缺失效率分析方法如实验例2或实验例3所述。
实验例7根据富含U的尾的结构的插入缺失效率比较1
使用DYtarget2和DYtarget10作为靶核酸进行实验,根据富含U的尾序列的结构来评价工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和各PAM序列在表14中公开。
[表14]
实验例7中使用的靶核酸序列
靶核酸 | 靶核酸的原间隔序列(5′-3′) | PAM |
DYtarget2 | CACACACACAGTGGGCTACC(SEQ ID NO:63) | TTTG |
DYtarget10 | CATCCCCAGGACACACACAC(SEQ ID NO:65) | TTTG |
1)根据实验例1-2制备包含人密码子优化的Cas14a1序列的质粒载体。
2)根据实验例1-4制备能够表达野生型或(工程化的)具有富含U的尾序列的单引导RNA的扩增子。编码单引导RNA的DNA序列和用于制备扩增子的引物序列在表15和表16中示出。
[表15]
实验例7的编码sgRNA的DNA序列
在上表中,对于编码每个靶核酸的sgRNA的DNA序列,sgRNA共有序列-原间隔序列-富含U的尾序列以5′-3′的方向连接,sgRNA共有序列中的支架序列为SEQ ID NO:254的一部分序列。能够表达(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。
[表16]
实验例7中使用的引物序列
3)通过实验例1-9中公开的方法,用包含Cas14a1序列的质粒载体和单引导RNA扩增子对根据实验例1-8培养的HEK-293 T细胞进行转染。
4)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在图4中示出。在这方面而言,未进行任何处理的HEK-293T细胞用作对照(参见图4中的WT数据)。
实验例8根据富含U的尾的结构的插入缺失效率比较2
使用DYTarget2作为靶核酸进行实验,根据富含U的尾序列的结构来评价工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和PAM序列如实验例7的表14中的“DYTarget2”所示。
1)根据实验例1-2制备包含人密码子优化的Cas14a1序列的质粒载体。
2)根据实验例1-4制备能够表达野生型单引导RNA或具有富含U的尾序列的(工程化的)单引导RNA的扩增子。编码所述单引导RNA的DNA序列和用于制备扩增子的引物序列在表17和表18中示出。
[表17]
实验例8的编码sgRNA的DNA序列
在上表中,对于编码每个靶核酸的sgRNA的扩增子序列,sgRNA共有序列-原间隔序列-富含U的尾序列以5'-3'的方向连接,sgRNA共有序列中的支架序列为SEQ ID NO:254的一部分序列。能够表达所述(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。
[表18]
实验例8中使用的引物序列
1)通过实验例1-9中公开的方法,用包含Cas14a1序列的质粒载体和单引导RNA的扩增子对根据实验例1-8培养的HEK-293 T细胞进行转染。
2)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在图5中示出。
实验例9根据富含U的尾的结构的插入缺失效率比较3
使用CSMD1作为靶核酸进行实验,根据富含U的尾序列的结构来评价工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和PAM序列在表19中示出。
[表19]
实验例9中使用的靶核酸序列
靶核酸 | 靶核酸的原间隔序列(5′-3′) | PAM |
CSMD1 | GAATACCCCCATTCTTCAGG(SEQ ID NO:260) | TTTA |
1)根据实验例1-6制备重组Cas12f1蛋白。
2)根据实验例1-5合成野生型单引导RNA或具有富含U的尾序列的(工程化的)单引导RNA。单引导RNA的序列在下表20中示出。
[表20]
实验例9的sgRNA序列
在上表中,对于每个靶核酸的sgRNA序列,sgRNA共有序列-间隔序列-富含U的尾字列以5′-3′的方向连接,sgRNA共有序列中的支架序列为SEQ ID NO:253的一部分序列。
3)使用重组Cas14a1和单引导RNA根据实验例1-7制备RNP,并且通过实验例1-7中公开的方法,用RNP对根据实验例1-8培养的HEK293 T细胞进行转染。
2)通过实验例1-12至实验例1-13中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在图6中示出。
作为实验的结果,可以看出具有连接至3′-末端的富含U的尾序列的工程化的引导RNA显示出比不具有富含U的尾序列的野生型引导RNA显著更高的插入缺失效率。
特别是,可以看出,与野生型引导RNA相比,具有10个以上连接的尿苷的序列的工程化引导RNA显示出出色的插入缺失效率。
实验例10根据富含U的尾的结构的插入缺失效率比较3
使用DYtarget2作为靶核酸进行实验,根据富含U的尾序列中修饰的连续尿苷序列的结构来评价工程化CRISPR/Cas14a1系统的插入缺失效率。靶核酸的原间隔序列和PAM序列如实验例7的表14中的“DYTarget2”所示。
1)根据实验例1-2制备包含人密码子优化的Cas14a1序列的质粒载体。
2)根据实验例1-4制备能够表达野生型单引导RNA或具有富含U的尾序列的(工程化的)单引导RNA的扩增子。编码所述单引导RNA的DNA序列和用于制备扩增子的引物序列在表21和表22中示出。
[表21]
实验例10的编码sgRNA的DNA序列
在上表中,对于编码每个靶核酸的sgRNA的DNA序列,sgRNA共有序列-原间隔序列-富含U的尾序列以5'-3'的方向连接,sgRNA共有序列中的支架序列为SEQ ID NO:254的一部分序列。能够表达所述(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。
[表22]
实验例10中使用的引物序列
3)通过实验例1-9中公开的方法,用包含编码Cas14a1序列的核酸序列的质粒载体和单引导RNA的扩增子对根据实验例1-8培养的HEK-293 T细胞进行转染。
4)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在图7中示出。
实验的结果表明,当工程化的引导RNA具有修饰的连续尿苷序列结构时,真核细胞中的插入缺失效率明显高于不具有富含U的尾序列的野生型引导RNA,所述连续尿苷序列结构可由(UaV)nUb表示(就此而言,V为胞苷(C)、鸟苷(G)或腺苷(A)中的一种)。
实验例11根据间隔序列长度的插入缺失效率比较
为了根据间隔序列的长度比较插入缺失效率,将DYtarget2和DYtarget10用作靶核酸,将富含U的尾序列固定为U4AU6,然后通过改变间隔序列长度进行实验。靶核酸的原间隔序列和各PAM序列在表23中公开。
[表23]
实验例11中使用的靶核酸序列
靶核酸 | 靶核酸的原间隔序列(5′-3′) | PAM |
DYtarget2 | CACACACACAGTGGGCTACC(SEQ ID NO:63) | TTTG |
DYtarget10 | CATCCCCAGGACACACACAC(SEQ ID NO:65) | TTTG |
1)根据实验例1-2制备了包含编码人密码子优化的Cas14a1序列的核酸序列的质粒载体。
2)根据实验例1-4制备了能够表达具有各种不同间隔序列长度的工程化单引导RNA的扩增子。编码所述单引导RNA的DNA序列和用于制备扩增子的引物序列在表24和表25中示出。
[表24]
实验例11中使用的编码sgRNA的DNA序列
在上表中,对于编码每个靶核酸的sgRNA的DNA序列,sgRNA共有序列-原间隔序列-富含U的尾序列以5′-3′的方向连接,sgRNA共有序列中的支架序列为SEQ ID NO:254的一部分序列。能够表达所述(工程化的)单引导RNA的扩增子序列为其中U6启动子可操作地连接至编码所述sgRNA的DNA序列的扩增子序列。
[表25]
实验例11中使用的引物序列
3)通过实验例1-9中公开的方法,用包含Cas14a1序列的质粒载体和单引导RNA的扩增子对根据实验例1-8培养的HEK-293 T细胞进行转染。
4)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在图8中示出。
实验例12确认具有富含U的尾的V型CRISPR/Cas系统的细胞内基因切割活性
为了确认在实验例中使用的工程化CRISPR/Cas14a系统以外的V型CRISPR/Cas系统中引入富含U的尾序列时,基因切割活性是否增强,在归类为CRISPR/Cas 12f1系统的CRISPR/SpCas 12f1系统和CRISPR/AsCas 12f1系统(Karvelis等,Nucleic AcidsResearch,Vol.48,No.9 5017(2020))上进行了以下实验。
实验例12-1确认SpCas12f1和AsCas12f1蛋白的细胞内表达
为了确认将编码SpCas12f1和AsCas12f1蛋白的载体引入真核细胞中时,SpCas12f1和AsCas12f1蛋白在真核细胞中是否正常表达,通过实验例1-13中公开的方法确认SpCas12f1和AsCas12f1蛋白的表达。在这方面,SpCas12f1和AsCas12f1蛋白的氨基酸序列和编码所述氨基酸序列的人密码子优化核酸序列在表26中示出。
[表26]
SpCas12f1和AsCas12f1蛋白的序列信息
作为实验的结果,确认了SpCas12f1蛋白和AsCas12f1蛋白在HEK293T细胞中正确表达(图9)。
实验例12-2确认具有富含U的尾的工程化CRISPR/SpCas12f1和CRISPR/AsCas12f1
系统的细胞内基因切割活性
为了确认具有富含U的尾序列的工程化CRISPR/SpCas12f1系统和CRISPR/AsCas12f1系统的基因切割活性,使用各种基因序列作为靶核酸进行实验。靶核酸的原间隔序列和各PAM序列在表27中公开。
[表27]
实验例12中使用的靶核酸
靶核酸 | 靶核酸的原间隔序列(5′-3′) | PAM |
DYtarget2 | CACACACACAGTGGGCTACC(SEQ ID NO:63) | TTTG |
VEGFA-3 | GGGGTGACCGCCGGAGCGCG(SEQ ID NO:286) | TTTG |
1)根据实验例1-2制备包含编码SpCas12f1和AsCas12f1蛋白的人密码子优化序列的质粒载体。
2)根据实验例1-2,制备表达tracrRNA的质粒载体和表达野生型crRNA或具有富含U的尾序列的(工程化的)crRNA的质粒载体。编码所述tracrRNA和crRNA的DNA序列以及用于制备质粒载体的引物序列示于表28-表30。
[表28]
实验例12的编码tracrRNA的DNA序列
CRISPR/SpCas12f1和CRISPR/AsCas12f1系统具有相同的tracrRNA序列。表达所述tracrRNA的质粒载体序列为其中U6启动子可操作地连接至编码所述tracrRNA的DNA序列的质粒载体序列。
[表29]
实验例12的编码crRNA的DNA序列
在上表中,对于编码每个靶核酸的crRNA的DNA序列,crRNA共有序列-原间隔序列-富含U的尾序列以5′-3′的方向连接。表达所述crRNA的质粒载体序列为其中U6启动子可操作地连接至编码所述crRNA的DNA 序列的质粒载体序列。
[表30]
实验例12中使用的引物序列
3)通过实验例1-9中公开的方法,用含有编码SpCas12f1蛋白和AsCas12f1蛋白的核酸序列的质粒载体、tracrRNA的质粒载体以及crRNA的质粒载体对根据实验例1-8培养的HEK-293 T细胞进行转染。
4)通过实验例1-12至实验例1-14中公开的方法分析每个实施例的靶核酸的插入缺失效率。插入缺失效率分析结果在表31中示出。
[表31]
实验例12的插入缺失效率分析结果
作为实验的结果,在其中引入了富含U的尾序列的工程化CRISPR/SpCas12f1系统或工程化CRISPR/AsCas12f1系统中没有观测到显著的插入缺失效率。总之,虽然证实了SpCas12f1和AsCas12f1蛋白在真核细胞中表达(图9),但没有显示出显著的插入缺失效率,因此可看出,即使将富含U的尾引入CRISPR/SpCas12f1系统和CRISPR/AsCas12f1系统时,基因切割活性不受影响。
[工业适用性]
本公开提供了可用于基因编辑技术的CRISPR/Cas12f1系统,特别是通过引入富含U的尾序列来提高基因编辑效率的工程化CRISPR/Cas12f1系统。
当用于基因编辑时,根据本公开的具有富含U的尾序列的工程化CRISPR/Cas12f1系统表现出比野生型CRISPR/Cas12f1系统更高的基因编辑效率。
<110> 基恩科雷有限责任公司
<120> 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途
<130> CP20-201
<160> 325
<170> KoPatentIn 3.0
<210> 1
<211> 1680
<212> DNA
<213> 人工序列
<220>
<223> 人密码子优化的Cas14a1
<400> 1
ccaaagaaga agcggaaggt cggtatccac ggagtcccag cagccatggc caagaacaca 60
attacaaaga cactgaagct gaggatcgtg agaccataca acagcgctga ggtcgagaag 120
attgtggctg atgaaaagaa caacagggaa aagatcgccc tcgagaagaa caaggataag 180
gtgaaggagg cctgctctaa gcacctgaaa gtggccgcct actgcaccac acaggtggag 240
aggaacgcct gtctgttttg taaagctcgg aagctggatg ataagtttta ccagaagctg 300
cggggccagt tccccgatgc cgtcttttgg caggagatta gcgagatctt cagacagctg 360
cagaagcagg ccgccgagat ctacaaccag agcctgatcg agctctacta cgagatcttc 420
atcaagggca agggcattgc caacgcctcc tccgtggagc actacctgag cgacgtgtgc 480
tacacaagag ccgccgagct ctttaagaac gccgctatcg cttccgggct gaggagcaag 540
attaagagta acttccggct caaggagctg aagaacatga agagcggcct gcccactaca 600
aagagcgaca acttcccaat tccactggtg aagcagaagg ggggccagta cacagggttc 660
gagatttcca accacaacag cgactttatt attaagatcc cctttggcag gtggcaggtc 720
aagaaggaga ttgacaagta caggccctgg gagaagtttg atttcgagca ggtgcagaag 780
agccccaagc ctatttccct gctgctgtcc acacagcggc ggaagaggaa caaggggtgg 840
tctaaggatg aggggaccga ggccgagatt aagaaagtga tgaacggcga ctaccagaca 900
agctacatcg aggtcaagcg gggcagtaag attggcgaga agagcgcctg gatgctgaac 960
ctgagcattg acgtgccaaa gattgataag ggcgtggatc ccagcatcat cggagggatc 1020
gatgtggggg tcaagagccc cctcgtgtgc gccatcaaca acgccttcag caggtacagc 1080
atctccgata acgacctgtt ccactttaac aagaagatgt tcgcccggcg gaggattttg 1140
ctcaagaaga accggcacaa gcgggccgga cacggggcca agaacaagct caagcccatc 1200
actatcctga ccgagaagag cgagaggttc aggaagaagc tcatcgagag atgggcctgc 1260
gagatcgccg atttctttat taagaacaag gtcggaacag tgcagatgga gaacctcgag 1320
agcatgaaga ggaaggagga ttcctacttc aacattcggc tgagggggtt ctggccctac 1380
gctgagatgc agaacaagat tgagtttaag ctgaagcagt acgggattga gatccggaag 1440
gtggccccca acaacaccag caagacctgc agcaagtgcg ggcacctcaa caactacttc 1500
aacttcgagt accggaagaa gaacaagttc ccacacttca agtgcgagaa gtgcaacttt 1560
aaggagaacg ccgattacaa cgccgccctg aacatcagca accctaagct gaagagcact 1620
aaggaggagc ccaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag 1680
1680
<210> 2
<211> 3009
<212> DNA
<213> 人工序列
<220>
<223> 脱氨酶融合Cas14a1
<400> 2
ccaaagaaga agcggaaagt ctcctcagag actgggcctg tcgccgtcga tccaaccctg 60
cgccgccgga ttgaacctca cgagtttgaa gtgttctttg acccccggga gctgagaaag 120
gagacatgcc tgctgtacga gatcaactgg ggaggcaggc actccatctg gaggcacacc 180
tctcagaaca caaataagca cgtggaggtg aacttcatcg agaagtttac cacagagcgg 240
tacttctgcc ccaataccag atgtagcatc acatggtttc tgagctggtc cccttgcgga 300
gagtgtagca gggccatcac cgagttcctg tccagatatc cacacgtgac actgtttatc 360
tacatcgcca ggctgtatca ccacgcagac ccaaggaata ggcagggcct gcgcgatctg 420
atcagctccg gcgtgaccat ccagatcatg acagagcagg agtccggcta ctgctggcgg 480
aacttcgtga attattctcc tagcaacgag gcccactggc ctaggtaccc acacctgtgg 540
gtgcgcctgt acgtgctgga gctgtattgc atcatcctgg gcctgccccc ttgtctgaat 600
atcctgcgga gaaagcagcc ccagctgacc ttctttacaa tcgccctgca gtcttgtcac 660
tatcagaggc tgccacccca catcctgtgg gccacaggcc tgaagtctgg aggatctagc 720
ggaggatcct ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagcagt 780
ggcggcagca gcggcggcag catggccaag aacacaatta caaagacact gaagctgagg 840
atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 900
agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 960
ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 1020
gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 1080
ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 1140
aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 1200
gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 1260
aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 1320
gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 1380
ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 1440
tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 1500
ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 1560
ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 1620
gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 1680
agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 1740
gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1800
gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1860
tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1920
gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1980
aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 2040
aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 2100
tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 2160
tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 2220
acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 2280
aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 2340
gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcccag cggcgggagc 2400
ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460
ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520
aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580
atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640
aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700
aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760
ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820
gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880
ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940
atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000
aggaaagtc 3009
<210> 3
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 3
uuuuuuuuuu 10
<210> 4
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 4
uuuuauuuuu 10
<210> 5
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 5
uuuuauuuuu u 11
<210> 6
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 6
uuuuauuuuu uu 12
<210> 7
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 7
uuuuauuuuu uuu 13
<210> 8
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 8
uuuuauuuuu uuuu 14
<210> 9
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 9
uuuuauuuuu uuuuu 15
<210> 10
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 10
uuuauuuauu 10
<210> 11
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 11
uuuauuuauu u 11
<210> 12
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 12
uuuauuuauu uu 12
<210> 13
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 13
uuuauuuauu uuu 13
<210> 14
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 14
uuuauuuauu uuuu 14
<210> 15
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 15
uuuuauuuua 10
<210> 16
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 16
uuuuauuuua u 11
<210> 17
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 17
uuuuauuuua uu 12
<210> 18
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 18
uuuuauuuua uuu 13
<210> 19
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 19
uuuuauuuua uuuu 14
<210> 20
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 20
uuuuauuuua uuuuu 15
<210> 21
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 21
uuuuauuuua uuuuuu 16
<210> 22
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 22
uuuuguuuuu 10
<210> 23
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 23
uuuuguuuuu u 11
<210> 24
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 24
uuuuguuuuu uu 12
<210> 25
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 25
uuuuguuuuu uuu 13
<210> 26
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 26
uuuuguuuuu uuuu 14
<210> 27
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 27
uuuuguuuuu uuuuu 15
<210> 28
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 28
uuuguuuguu 10
<210> 29
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 29
uuuguuuguu u 11
<210> 30
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 30
uuuguuuguu uu 12
<210> 31
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 31
uuuguuuguu uuu 13
<210> 32
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 32
uuuguuuguu uuuu 14
<210> 33
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 33
uuuuguuuug 10
<210> 34
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 34
uuuuguuuug u 11
<210> 35
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 35
uuuuguuuug uu 12
<210> 36
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 36
uuuuguuuug uuu 13
<210> 37
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 37
uuuuguuuug uuuu 14
<210> 38
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 38
uuuuguuuug uuuuu 15
<210> 39
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 39
uuuuguuuug uuuuuu 16
<210> 40
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 40
uuuucuuuuu 10
<210> 41
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 41
uuuucuuuuu u 11
<210> 42
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 42
uuuucuuuuu uu 12
<210> 43
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 43
uuuucuuuuu uuu 13
<210> 44
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 44
uuuucuuuuu uuuu 14
<210> 45
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 45
uuuucuuuuu uuuuu 15
<210> 46
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 46
uuucuuucuu 10
<210> 47
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 47
uuucuuucuu u 11
<210> 48
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 48
uuucuuucuu uu 12
<210> 49
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 49
uuucuuucuu uuu 13
<210> 50
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 50
uuucuuucuu uuuu 14
<210> 51
<211> 10
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 51
uuuucuuuuc 10
<210> 52
<211> 11
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 52
uuuucuuuuc u 11
<210> 53
<211> 12
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 53
uuuucuuuuc uu 12
<210> 54
<211> 13
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 54
uuuucuuuuc uuu 13
<210> 55
<211> 14
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 55
uuuucuuuuc uuuu 14
<210> 56
<211> 15
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 56
uuuucuuuuc uuuuu 15
<210> 57
<211> 16
<212> RNA
<213> 人工序列
<220>
<223> 富含U的尾序列
<400> 57
uuuucuuuuc uuuuuu 16
<210> 58
<211> 37
<212> RNA
<213> 未鉴别的古细菌
<400> 58
guugcagaac ccgaauagac gaaugaagga augcaac 37
<210> 59
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 用于CRISPR/Cas14a1系统的编码CRISPR RNA重复序列的DNA序列
<400> 59
gttgcagaac ccgaatagac gaatgaagga atgcaac 37
<210> 60
<211> 161
<212> RNA
<213> 未鉴别的古细菌
<400> 60
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca a 161
<210> 61
<211> 161
<212> DNA
<213> 人工序列
<220>
<223> 用于CRISPR/Cas14a1系统的编码tracrRNA序列的DNA序列
<400> 61
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca a 161
<210> 62
<211> 20
<212> DNA
<213> 智人
<400> 62
cacgtctcat atgccccttg 20
<210> 63
<211> 20
<212> DNA
<213> 智人
<400> 63
cacacacaca gtgggctacc 20
<210> 64
<211> 20
<212> DNA
<213> 智人
<400> 64
gacgtgggag acacacacac 20
<210> 65
<211> 20
<212> DNA
<213> 智人
<400> 65
catccccagg acacacacac 20
<210> 66
<211> 20
<212> DNA
<213> 智人
<400> 66
agcacatgtg cacacacaca 20
<210> 67
<211> 20
<212> DNA
<213> 智人
<400> 67
agaacacata cccctgggcc 20
<210> 68
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 用于RNF2的间隔序列
<400> 68
cacgucucau augccccuug 20
<210> 69
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的间隔序列
<400> 69
cacacacaca gugggcuacc 20
<210> 70
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget9的间隔序列
<400> 70
gacgugggag acacacacac 20
<210> 71
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的间隔序列
<400> 71
cauccccagg acacacacac 20
<210> 72
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget13的间隔序列
<400> 72
agcacaugug cacacacaca 20
<210> 73
<211> 20
<212> RNA
<213> 人工序列
<220>
<223> 用于Intergenic-22的间隔序列
<400> 73
agaacacaua ccccugggcc 20
<210> 74
<211> 202
<212> RNA
<213> 人工序列
<220>
<223> 共有sgRNA序列,除了间隔序列和富含U的尾序列
<400> 74
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca ac 202
<210> 75
<211> 222
<212> RNA
<213> 人工序列
<220>
<223> 用于RNF2的sgRNA(WT)
<400> 75
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacgucuc auaugccccu ug 222
<210> 76
<211> 233
<212> RNA
<213> 人工序列
<220>
<223> 用于RNF2的sgRNA(U4AU6)
<400> 76
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacgucuc auaugccccu uguuuuauuu uuu 233
<210> 77
<211> 222
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(WT)
<400> 77
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua cc 222
<210> 78
<211> 223
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U)
<400> 78
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccu 223
<210> 79
<211> 224
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U2)
<400> 79
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuu 224
<210> 80
<211> 225
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U3)
<400> 80
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuu 225
<210> 81
<211> 226
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4)
<400> 81
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuu 226
<210> 82
<211> 227
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U5)
<400> 82
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuu 227
<210> 83
<211> 228
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U6)
<400> 83
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuuu 228
<210> 84
<211> 227
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4A)
<400> 84
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuua 227
<210> 85
<211> 228
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4AU)
<400> 85
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuau 228
<210> 86
<211> 229
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4AU2)
<400> 86
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauu 229
<210> 87
<211> 230
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4AU3)
<400> 87
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu 230
<210> 88
<211> 231
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4AU4)
<400> 88
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu u 231
<210> 89
<211> 232
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4AU5)
<400> 89
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uu 232
<210> 90
<211> 233
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4AU6)
<400> 90
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuu 233
<210> 91
<211> 234
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4AU7)
<400> 91
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuu 234
<210> 92
<211> 235
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4AU8)
<400> 92
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuuu 235
<210> 93
<211> 236
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4AU9)
<400> 93
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuuuu 236
<210> 94
<211> 237
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U4AU10)
<400> 94
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uuuuuuu 237
<210> 95
<211> 232
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U3AU6)
<400> 95
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuauuuu uu 232
<210> 96
<211> 236
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(U3AU3AU6)
<400> 96
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuauuua uuuuuu 236
<210> 97
<211> 57
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的crRNA(WT)
<400> 97
guugcagaac ccgaauagac gaaugaagga augcaaccac acacacagug ggcuacc 57
<210> 98
<211> 68
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的crRNA(U4AU6)
<400> 98
guugcagaac ccgaauagac gaaugaagga augcaaccac acacacagug ggcuaccuuu 60
uauuuuuu 68
<210> 99
<211> 231
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(间隔区18nt, U4AU6)
<400> 99
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua uuuuauuuuu u 231
<210> 100
<211> 232
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(间隔区19nt, U4AU6)
<400> 100
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua cuuuuauuuu uu 232
<210> 101
<211> 234
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(间隔区21nt, U4AU6)
<400> 101
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccauuuuauu uuuu 234
<210> 102
<211> 238
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(间隔区25nt, U4AU6)
<400> 102
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccauuuauuu uauuuuuu 238
<210> 103
<211> 243
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA(间隔区30nt, U4AU6)
<400> 103
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccauuuaagg aguuuuauuu 240
uuu 243
<210> 104
<211> 222
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget9的sgRNA(WT)
<400> 104
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgacguggg agacacacac ac 222
<210> 105
<211> 233
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget9的sgRNA(U4AU6)
<400> 105
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgacguggg agacacacac acuuuuauuu uuu 233
<210> 106
<211> 222
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(WT)
<400> 106
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacac ac 222
<210> 107
<211> 233
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(U4AU6)
<400> 107
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacac acuuuuauuu uuu 233
<210> 108
<211> 228
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(U6)
<400> 108
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacac acuuuuuu 228
<210> 109
<211> 232
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(U3AU6)
<400> 109
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacac acuuuauuuu uu 232
<210> 110
<211> 236
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(U3AU3AU6)
<400> 110
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacac acuuuauuua uuuuuu 236
<210> 111
<211> 57
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的crRNA(WT)
<400> 111
guugcagaac ccgaauagac gaaugaagga augcaaccau ccccaggaca cacacac 57
<210> 112
<211> 68
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的crRNA(U4AU6)
<400> 112
guugcagaac ccgaauagac gaaugaagga augcaaccau ccccaggaca cacacacuuu 60
uauuuuuu 68
<210> 113
<211> 230
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(间隔区17nt, U4AU6)
<400> 113
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacau uuuauuuuuu 230
<210> 114
<211> 230
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(间隔区18nt, U4AU6)
<400> 114
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacau uuuauuuuuu 230
<210> 115
<211> 232
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(间隔区19nt, U4AU6)
<400> 115
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacac auuuuauuuu uu 232
<210> 116
<211> 234
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(间隔区21nt, U4AU6)
<400> 116
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacac acauuuuauu uuuu 234
<210> 117
<211> 238
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(间隔区25nt, U4AU6)
<400> 117
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacac acauuucuuu uauuuuuu 238
<210> 118
<211> 243
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget10的sgRNA(间隔区30nt, U4AU6)
<400> 118
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accaucccca ggacacacac acauuucaaa aguuuuauuu 240
uuu 243
<210> 119
<211> 222
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget13的sgRNA(WT)
<400> 119
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acagcacaug ugcacacaca ca 222
<210> 120
<211> 233
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget13的sgRNA(U4AU6)
<400> 120
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acagcacaug ugcacacaca cauuuuauuu uuu 233
<210> 121
<211> 222
<212> RNA
<213> 人工序列
<220>
<223> 用于Intergenic-22的sgRNA(WT)
<400> 121
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acagaacaca uaccccuggg cc 222
<210> 122
<211> 228
<212> RNA
<213> 人工序列
<220>
<223> 用于Intergenic-22的sgRNA(U6)
<400> 122
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acagaacaca uaccccuggg ccuuuuuu 228
<210> 123
<211> 233
<212> RNA
<213> 人工序列
<220>
<223> 用于Intergenic-22的sgRNA(U4AU6)
<400> 123
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acagaacaca uaccccuggg ccuuuuauuu uuu 233
<210> 124
<211> 57
<212> RNA
<213> 人工序列
<220>
<223> 用于Intergenic-22的crRNA(WT)
<400> 124
guugcagaac ccgaauagac gaaugaagga augcaacaga acacauaccc cugggcc 57
<210> 125
<211> 68
<212> RNA
<213> 人工序列
<220>
<223> 用于Intergenic-22的crRNA(U4AU6)
<400> 125
guugcagaac ccgaauagac gaaugaagga augcaacaga acacauaccc cugggccuuu 60
uauuuuuu 68
<210> 126
<211> 202
<212> DNA
<213> 人工序列
<220>
<223> 编码共有sgRNA的DNA序列,除间隔序列和富含U的尾序列外
<400> 126
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca ac 202
<210> 127
<211> 222
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向RNF2(WT)
<400> 127
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacgtctc atatgcccct tg 222
<210> 128
<211> 233
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向RNF2(U4AU6)
<400> 128
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacgtctc atatgcccct tgttttattt ttt 233
<210> 129
<211> 222
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(WT)
<400> 129
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta cc 222
<210> 130
<211> 223
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U)
<400> 130
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta cct 223
<210> 131
<211> 224
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U2)
<400> 131
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta cctt 224
<210> 132
<211> 225
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U3)
<400> 132
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttt 225
<210> 133
<211> 226
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4)
<400> 133
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta cctttt 226
<210> 134
<211> 227
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U5)
<400> 134
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttt 227
<210> 135
<211> 228
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U6)
<400> 135
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta cctttttt 228
<210> 136
<211> 227
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4A)
<400> 136
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta cctttta 227
<210> 137
<211> 228
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU)
<400> 137
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttat 228
<210> 138
<211> 229
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU2)
<400> 138
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttatt 229
<210> 139
<211> 230
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU3)
<400> 139
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt 230
<210> 140
<211> 231
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU4)
<400> 140
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt t 231
<210> 141
<211> 232
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU5)
<400> 141
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tt 232
<210> 142
<211> 233
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU6)
<400> 142
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt ttt 233
<210> 143
<211> 234
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU7)
<400> 143
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tttt 234
<210> 144
<211> 235
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU8)
<400> 144
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt ttttt 235
<210> 145
<211> 236
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU9)
<400> 145
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tttttt 236
<210> 146
<211> 237
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U4AU10)
<400> 146
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt ttttttt 237
<210> 147
<211> 232
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U3AU6)
<400> 147
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta cctttatttt tt 232
<210> 148
<211> 236
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(U3AU3AU6)
<400> 148
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta cctttattta tttttt 236
<210> 149
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 编码crRNA的DNA序列, 靶向DYtarget2(WT)
<400> 149
gttgcagaac ccgaatagac gaatgaagga atgcaaccac acacacagtg ggctacc 57
<210> 150
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 编码crRNA的DNA序列, 靶向DYtarget2(U4AU6)
<400> 150
gttgcagaac ccgaatagac gaatgaagga atgcaaccac acacacagtg ggctaccttt 60
tatttttt 68
<210> 151
<211> 231
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(间隔区18nt,
U4AU6)
<400> 151
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ttttattttt t 231
<210> 152
<211> 232
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(间隔区19nt,
U4AU6)
<400> 152
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta cttttatttt tt 232
<210> 153
<211> 234
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(间隔区21nt,
U4AU6)
<400> 153
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccattttatt tttt 234
<210> 154
<211> 238
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(间隔区25nt,
U4AU6)
<400> 154
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccatttattt tatttttt 238
<210> 155
<211> 243
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget2(间隔区30nt,
U4AU6)
<400> 155
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccatttaagg agttttattt 240
ttt 243
<210> 156
<211> 222
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget9(WT)
<400> 156
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca acgacgtggg agacacacac ac 222
<210> 157
<211> 233
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget9(U4AU6)
<400> 157
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca acgacgtggg agacacacac acttttattt ttt 233
<210> 158
<211> 222
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(WT)
<400> 158
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacac ac 222
<210> 159
<211> 233
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(U4AU6)
<400> 159
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacac acttttattt ttt 233
<210> 160
<211> 228
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(U6)
<400> 160
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacac actttttt 228
<210> 161
<211> 232
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(U3AU6)
<400> 161
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacac actttatttt tt 232
<210> 162
<211> 236
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(U3AU3AU6)
<400> 162
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacac actttattta tttttt 236
<210> 163
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 编码crRNA的DNA序列, 靶向DYtarget10(WT)
<400> 163
gttgcagaac ccgaatagac gaatgaagga atgcaaccat ccccaggaca cacacac 57
<210> 164
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 编码crRNA的DNA序列, 靶向DYtarget10(U4AU6)
<400> 164
gttgcagaac ccgaatagac gaatgaagga atgcaaccat ccccaggaca cacacacttt 60
tatttttt 68
<210> 165
<211> 230
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区17nt,
U4AU6)
<400> 165
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacat tttatttttt 230
<210> 166
<211> 231
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区18nt,
U4AU6)
<400> 166
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacac ttttattttt t 231
<210> 167
<211> 232
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区19nt,
U4AU6)
<400> 167
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacac attttatttt tt 232
<210> 168
<211> 234
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区21nt,
U4AU6)
<400> 168
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacac acattttatt tttt 234
<210> 169
<211> 238
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区25nt,
U4AU6)
<400> 169
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacac acatttcttt tatttttt 238
<210> 170
<211> 243
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget10(间隔区30nt,
U4AU6)
<400> 170
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accatcccca ggacacacac acatttcaaa agttttattt 240
ttt 243
<210> 171
<211> 222
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget13(WT)
<400> 171
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca acagcacatg tgcacacaca ca 222
<210> 172
<211> 233
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向DYtarget13(U4AU6)
<400> 172
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca acagcacatg tgcacacaca cattttattt ttt 233
<210> 173
<211> 222
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向Intergenic-22(WT)
<400> 173
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca acagaacaca tacccctggg cc 222
<210> 174
<211> 228
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向Intergenic-22(U6)
<400> 174
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca acagaacaca tacccctggg cctttttt 228
<210> 175
<211> 233
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列, 靶向Intergenic-22(U4AU6)
<400> 175
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca acagaacaca tacccctggg ccttttattt ttt 233
<210> 176
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 编码crRNA的DNA序列, 靶向Intergenic-22(WT)
<400> 176
gttgcagaac ccgaatagac gaatgaagga atgcaacaga acacataccc ctgggcc 57
<210> 177
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 编码crRNA的DNA序列, 靶向Intergenic-22(U4AU6)
<400> 177
gttgcagaac ccgaatagac gaatgaagga atgcaacaga acacataccc ctgggccttt 60
tatttttt 68
<210> 178
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 正向引物,以合成用于RNF2的sgRNA
<400> 178
gccaacatac agaagtcagg aa 22
<210> 179
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物,以合成用于DYtarget2的sgRNA扩增子
<400> 179
ccaggccatt tctcagggtt 20
<210> 180
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物,以合成用于DYtarget9的sgRNA扩增子
<400> 180
gtacagcttc ccagactccg 20
<210> 181
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物,以合成用于DYtarget10的sgRNA扩增子
<400> 181
tgctccagga acctcaccta 20
<210> 182
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 正向引物,以合成用于DYtarget13的sgRNA扩增子
<400> 182
gccttccccc acctttcttt 20
<210> 183
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> U6正向引物,以合成sgRNA
<400> 183
gagggcctat ttcccatgat t 21
<210> 184
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 正向引物,以合成tracrRNA
<400> 184
gagggcctat ttcccatgat t 21
<210> 185
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于RNF2的sgRNA扩增子(WT)
<400> 185
tgtgcagaca aacggaactc 20
<210> 186
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于RNF2的sgRNA扩增子(U4AU6)
<400> 186
aaaaaataaa atgtgcagac aaacggaact c 31
<210> 187
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(WT)
<400> 187
ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 45
<210> 188
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U)
<400> 188
aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 46
<210> 189
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U2)
<400> 189
aaggtagccc actgtgtgtg tggttgcatt ccttcattcg tctattc 47
<210> 190
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U3)
<400> 190
aaaggtagcc cactgtgtgt gtggttgcat tccttcattc gtctattc 48
<210> 191
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4)
<400> 191
aaaaggtagc ccactgtgtg tgtggttgca ttccttcatt cgtctattc 49
<210> 192
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U5)
<400> 192
aaaaaggtag cccactgtgt gtgtggttgc attccttcat tcgtctattc 50
<210> 193
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U6)
<400> 193
aaaaaaggta gcccactgtg tgtgtggttg cattccttca ttcgtctatt c 51
<210> 194
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4A)
<400> 194
taaaaggtag cccactgtgt gtgtggttgc attccttcat tcgtctattc 50
<210> 195
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4AU)
<400> 195
ataaaaggta gcccactgtg tgtgtggttg cattccttca ttcgtctatt c 51
<210> 196
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4AU2)
<400> 196
aataaaaggt agcccactgt gtgtgtggtt gcattccttc attcgtctat tc 52
<210> 197
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4AU3)
<400> 197
aaataaaagg tagcccactg tgtgtgtggt tgcattcctt cattcgtcta ttc 53
<210> 198
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4AU4)
<400> 198
aaaataaaag gtagcccact gtgtgtgtgg ttgcattcct tcattcgtct attc 54
<210> 199
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4AU5)
<400> 199
aaaaataaaa ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 55
<210> 200
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4AU6)
<400> 200
aaaaaataaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56
<210> 201
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4AU7)
<400> 201
aaaaaaataa aaggtagccc actgtgtgtg tggttgcatt ccttcattcg tctattc 57
<210> 202
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4AU8)
<400> 202
aaaaaaaata aaaggtagcc cactgtgtgt gtggttgcat tccttcattc gtctattc 58
<210> 203
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4AU9)
<400> 203
aaaaaaaaat aaaaggtagc ccactgtgtg tgtggttgca ttccttcatt cgtctattc 59
<210> 204
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U4AU10)
<400> 204
aaaaaaaaaa taaaaggtag cccactgtgt gtgtggttgc attccttcat tcgtctattc 60
60
<210> 205
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U3AU6)
<400> 205
aaaaaataaa ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 55
<210> 206
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(U3AU3AU6)
<400> 206
aaaaaataaa taaaggtagc ccactgtgtg tgtggttgca ttccttcatt cgtctattc 59
<210> 207
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的crRNA扩增子(WT)
<400> 207
ggtagcccac tgtgtgtgtg gttgcattcc ttcattcgtc tattc 45
<210> 208
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的crRNA扩增子(U4AU6)
<400> 208
aaaaaataaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56
<210> 209
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(间隔区
18nt, U4AU6)
<400> 209
aaaaaataaa atagcccact gtgtgtgtgg ttgcattcct 40
<210> 210
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(间隔区
19nt, U4AU6)
<400> 210
aaaaaataaa agtagcccac tgtgtgtgtg gttgcattcc t 41
<210> 211
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(间隔区
21nt, U4AU6)
<400> 211
aaaaaataaa atggtagccc actgtgtgtg tggttgcatt cct 43
<210> 212
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(间隔区
25nt, U4AU6)
<400> 212
aaaaaataaa ataaatggta gcccactgtg tgtgtggttg cattcct 47
<210> 213
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget2的sgRNA扩增子(间隔区
30nt, U4AU6)
<400> 213
aaaaaataaa actccttaaa tggtagccca ctgtgtgtgt ggttgcattc ct 52
<210> 214
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget9的sgRNA扩增子(WT)
<400> 214
gtgtgtgtgt ctcccacgtc gttgcattcc ttcattcgtc tattc 45
<210> 215
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget9的sgRNA扩增子(U4AU6)
<400> 215
aaaaaataaa atgtgtgtgt ctcccacgtc gttgcattcc ttcattcgtc tattc 55
<210> 216
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(WT)
<400> 216
gtgtgtgtgt cctggggatg gttgcattcc ttcattcgtc tattc 45
<210> 217
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(U4AU6)
<400> 217
aaaaaataaa atgtgtgtgt cctggggatg gttgcattcc ttcattcgtc tattc 55
<210> 218
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(U6)
<400> 218
aaaaaatgtg tgtgtcctgg ggatggttgc attccttcat tcgtctattc 50
<210> 219
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(U3AU6)
<400> 219
aaaaaataaa tgtgtgtgtc ctggggatgg ttgcattcct tcattcgtct attc 54
<210> 220
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(U3AU3AU6)
<400> 220
aaaaaataaa taaatgtgtg tgtcctgggg atggttgcat tccttcattc gtctattc 58
<210> 221
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的crRNA扩增子(WT)
<400> 221
gtgtgtgtgt cctggggatg gttgcattcc ttcattcgtc tattc 45
<210> 222
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的crRNA扩增子(U4AU6)
<400> 222
aaaaataaaa gtgtgtgtgt cctggggatg gttgcattcc ttcattcgtc atattc 56
<210> 223
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(间隔区
17nt, U4AU6)
<400> 223
aaaaaataaa atgtgtgtcc tggggatggt tgcattcct 39
<210> 224
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(间隔区
18nt, U4AU6)
<400> 224
aaaaaataaa agtgtgtgtc ctggggatgg ttgcattcct 40
<210> 225
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(间隔区
19nt, U4AU6)
<400> 225
aaaaaataaa atgtgtgtgt cctggggatg gttgcattcc t 41
<210> 226
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(间隔区
21nt, U4AU6)
<400> 226
aaaaaataaa atgtgtgtgt gtcctgggga tggttgcatt cct 43
<210> 227
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(间隔区
25nt, U4AU6)
<400> 227
aaaaaataaa agaaatgtgt gtgtgtcctg gggatggttg cattcct 47
<210> 228
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget10的sgRNA扩增子(间隔区
30nt, U4AU6)
<400> 228
aaaaaataaa acttttgaaa tgtgtgtgtg tcctggggat ggttgcattc ct 52
<210> 229
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget13的sgRNA扩增子(WT)
<400> 229
tgtgtgtgtg cacatgtgct gttgcattcc ttcattcgtc tattc 45
<210> 230
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于DYtarget13的sgRNA扩增子(U4AU6)
<400> 230
aaaaaataaa agtgtgtgtg cacatgtgct gttgcattcc ttcattcgtc tattc 55
<210> 231
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于Intergenic-22的sgRNA扩增子(WT)
<400> 231
ggcccagggg tatgtgttct gttgcattcc t 31
<210> 232
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于Intergenic-22的sgRNA扩增子(U6)
<400> 232
aaaaaaggcc caggggtatg tgttctgttg cattcct 37
<210> 233
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于Intergenic-22的sgRNA扩增子(U4AU6)
<400> 233
aaaaaataaa aggcccaggg gtatgtgttc tgttgcattc ct 42
<210> 234
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于Intergenic-22的crRNA扩增子(WT)
<400> 234
ggcccagggg tatgtgttct gttgcattcc t 31
<210> 235
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成用于Intergenic-22的crRNA扩增子(U4AU6)
<400> 235
aaaaaataaa aggcccaggg gtatgtgttc tgttgcattc ct 42
<210> 236
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,以合成tracrRNA扩增子
<400> 236
ttgtgcagaa ttggagagga 20
<210> 237
<211> 7
<212> PRT
<213> 猴病毒40
<400> 237
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 238
<211> 16
<212> PRT
<213> 小家鼠
<400> 238
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 239
<211> 9
<212> PRT
<213> 智人
<400> 239
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 240
<211> 11
<212> PRT
<213> 智人
<400> 240
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 241
<211> 38
<212> PRT
<213> 小家鼠
<400> 241
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 242
<211> 42
<212> PRT
<213> 智人
<400> 242
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 243
<211> 8
<212> PRT
<213> 智人
<400> 243
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 244
<211> 8
<212> PRT
<213> 智人
<400> 244
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 245
<211> 8
<212> PRT
<213> 智人
<400> 245
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 246
<211> 12
<212> PRT
<213> 小家鼠
<400> 246
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 247
<211> 5
<212> PRT
<213> 流感病毒
<400> 247
Asp Arg Leu Arg Arg
1 5
<210> 248
<211> 7
<212> PRT
<213> 流感病毒
<400> 248
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 249
<211> 10
<212> PRT
<213> 丁型肝炎病毒
<400> 249
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 250
<211> 10
<212> PRT
<213> 小家鼠
<400> 250
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 251
<211> 20
<212> PRT
<213> 智人
<400> 251
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 252
<211> 17
<212> PRT
<213> 智人
<400> 252
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 253
<211> 69
<212> RNA
<213> 人工序列
<220>
<223> 用于sgRNA的支架序列
<400> 253
uucauuuuuc cucuccaauu cugcacaaga aaguugcaga acccgaauag acgaaugaag 60
gaaugcaac 69
<210> 254
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 编码支架序列的DNA序列, 用于sgRNA
<400> 254
ttcatttttc ctctccaatt ctgcacaaga aaguugcaga acccgaauag acgaaugaag 60
gaaugcaac 69
<210> 255
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 共有crRNA序列
<400> 255
gttgcagaac ccgaatagac gaatgaagga atgcaac 37
<210> 256
<211> 233
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列,用于DYtarget2(T4AT4AT)
<400> 256
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tat 233
<210> 257
<211> 234
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列,用于DYtarget2(T4AT4AT2)
<400> 257
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttattt tatt 234
<210> 258
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于DYtarget2的sgRNA扩增子(T4AT4AT)
<400> 258
ataaaataaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56
<210> 259
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于DYtarget2的sgRNA扩增子(T4AT4AT2)
<400> 259
aataaaataa aaggtagccc actgtgtgtg tggttgcatt ccttcattcg tctattc 57
<210> 260
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于CSMD1的原间隔序列
<400> 260
gaataccccc attcttcagg 20
<210> 261
<211> 222
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(WT)
<400> 261
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gg 222
<210> 262
<211> 223
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA(U)
<400> 262
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca ggu 223
<210> 263
<211> 224
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U2)
<400> 263
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguu 224
<210> 264
<211> 225
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U3)
<400> 264
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuu 225
<210> 265
<211> 226
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4)
<400> 265
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuu 226
<210> 266
<211> 227
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U5)
<400> 266
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuu 227
<210> 267
<211> 228
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U6)
<400> 267
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuuu 228
<210> 268
<211> 227
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4A)
<400> 268
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuua 227
<210> 269
<211> 228
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4AU)
<400> 269
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuau 228
<210> 270
<211> 229
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4AU)
<400> 270
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauu 229
<210> 271
<211> 230
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4AU3)
<400> 271
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu 230
<210> 272
<211> 231
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4AU5)
<400> 272
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu u 231
<210> 273
<211> 232
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4AU5)
<400> 273
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uu 232
<210> 274
<211> 233
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4AU6)
<400> 274
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuu 233
<210> 275
<211> 234
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4AU7)
<400> 275
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuu 234
<210> 276
<211> 235
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4AU8)
<400> 276
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuuu 235
<210> 277
<211> 236
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4AU9)
<400> 277
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuuuu 236
<210> 278
<211> 237
<212> RNA
<213> 人工序列
<220>
<223> 用于CSMD1的sgRNA序列(U4AU10)
<400> 278
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca acgaauaccc ccauucuuca gguuuuauuu uuuuuuu 237
<210> 279
<211> 233
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA序列(U4AU4AU)
<400> 279
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uau 233
<210> 280
<211> 234
<212> RNA
<213> 人工序列
<220>
<223> 用于DYtarget2的sgRNA序列(U4AU4AU2)
<400> 280
cuucacugau aaaguggaga accgcuucac caaaagcugu cccuuagggg auuagaacuu 60
gagugaaggu gggcugcuug caucagccua augucgagaa gugcuuucuu cggaaaguaa 120
cccucgaaac aaauucauuu uuccucucca auucugcaca agaaaguugc agaacccgaa 180
uagacgaaug aaggaaugca accacacaca cagugggcua ccuuuuauuu uauu 234
<210> 281
<211> 560
<212> PRT
<213> 未鉴别的古细菌ICHT
<400> 281
Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala Met
1 5 10 15
Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro
20 25 30
Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn
35 40 45
Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala
50 55 60
Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu
65 70 75 80
Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe
85 90 95
Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu
100 105 110
Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr
115 120 125
Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys
130 135 140
Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys
145 150 155 160
Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly
165 170 175
Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn
180 185 190
Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro
195 200 205
Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn
210 215 220
His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val
225 230 235 240
Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu
245 250 255
Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln
260 265 270
Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala
275 280 285
Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu
290 295 300
Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn
305 310 315 320
Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile
325 330 335
Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile
340 345 350
Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His
355 360 365
Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn
370 375 380
Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile
385 390 395 400
Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu
405 410 415
Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly
420 425 430
Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser
435 440 445
Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln
450 455 460
Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys
465 470 475 480
Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu
485 490 495
Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His
500 505 510
Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala
515 520 525
Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro
530 535 540
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
545 550 555 560
<210> 282
<211> 497
<212> PRT
<213> 人工序列
<220>
<223> 用于Syntrophomonas palmitatica的效应蛋白的多肽序列
<400> 282
Met Gly Glu Ser Val Lys Ala Ile Lys Leu Lys Ile Leu Asp Met Phe
1 5 10 15
Leu Asp Pro Glu Cys Thr Lys Gln Asp Asp Asn Trp Arg Lys Asp Leu
20 25 30
Ser Thr Met Ser Arg Phe Cys Ala Glu Ala Gly Asn Met Cys Leu Arg
35 40 45
Asp Leu Tyr Asn Tyr Phe Ser Met Pro Lys Glu Asp Arg Ile Ser Ser
50 55 60
Lys Asp Leu Tyr Asn Ala Met Tyr His Lys Thr Lys Leu Leu His Pro
65 70 75 80
Glu Leu Pro Gly Lys Val Ala Asn Gln Ile Val Asn His Ala Lys Asp
85 90 95
Val Trp Lys Arg Asn Ala Lys Leu Ile Tyr Arg Asn Gln Ile Ser Met
100 105 110
Pro Thr Tyr Lys Ile Thr Thr Ala Pro Ile Arg Leu Gln Asn Asn Ile
115 120 125
Tyr Lys Leu Ile Lys Asn Lys Asn Lys Tyr Ile Ile Asp Val Gln Leu
130 135 140
Tyr Ser Lys Glu Tyr Ser Lys Asp Ser Gly Lys Gly Thr His Arg Tyr
145 150 155 160
Phe Leu Val Ala Val Arg Asp Ser Ser Thr Arg Met Ile Phe Asp Arg
165 170 175
Ile Met Ser Lys Asp His Ile Asp Ser Ser Lys Ser Tyr Thr Gln Gly
180 185 190
Gln Leu Gln Ile Lys Lys Asp His Gln Gly Lys Trp Tyr Cys Ile Ile
195 200 205
Pro Tyr Thr Phe Pro Thr His Glu Thr Val Leu Asp Pro Asp Lys Val
210 215 220
Met Gly Val Asp Leu Gly Val Ala Lys Ala Val Tyr Trp Ala Phe Asn
225 230 235 240
Ser Ser Tyr Lys Arg Gly Cys Ile Asp Gly Gly Glu Ile Glu His Phe
245 250 255
Arg Lys Met Ile Arg Ala Arg Arg Val Ser Ile Gln Asn Gln Ile Lys
260 265 270
His Ser Gly Asp Ala Arg Lys Gly His Gly Arg Lys Arg Ala Leu Lys
275 280 285
Pro Ile Glu Thr Leu Ser Glu Lys Glu Lys Asn Phe Arg Asp Thr Ile
290 295 300
Asn His Arg Tyr Ala Asn Arg Ile Val Glu Ala Ala Ile Lys Gln Gly
305 310 315 320
Cys Gly Thr Ile Gln Ile Glu Asn Leu Glu Gly Ile Ala Asp Thr Thr
325 330 335
Gly Ser Lys Phe Leu Lys Asn Trp Pro Tyr Tyr Asp Leu Gln Thr Lys
340 345 350
Ile Val Asn Lys Ala Lys Glu His Gly Ile Thr Val Val Ala Ile Asn
355 360 365
Pro Gln Tyr Thr Ser Gln Arg Cys Ser Met Cys Gly Tyr Ile Glu Lys
370 375 380
Thr Asn Arg Ser Ser Gln Ala Val Phe Glu Cys Lys Gln Cys Gly Tyr
385 390 395 400
Gly Ser Arg Thr Ile Cys Ile Asn Cys Arg His Val Gln Val Ser Gly
405 410 415
Asp Val Cys Glu Glu Cys Gly Gly Ile Val Lys Lys Glu Asn Val Asn
420 425 430
Ala Asp Tyr Asn Ala Ala Lys Asn Ile Ser Thr Pro Tyr Ile Asp Gln
435 440 445
Ile Ile Met Glu Lys Cys Leu Glu Leu Gly Ile Pro Tyr Arg Ser Ile
450 455 460
Thr Cys Lys Glu Cys Gly His Ile Gln Ala Ser Gly Asn Thr Cys Glu
465 470 475 480
Val Cys Gly Ser Thr Asn Ile Leu Lys Pro Lys Lys Ile Arg Lys Ala
485 490 495
Lys
<210> 283
<211> 422
<212> PRT
<213> 人工序列
<220>
<223> 用于acidibacillus sulfuroxidans的效应蛋白的多肽序列
<400> 283
Met Ile Lys Val Tyr Arg Tyr Glu Ile Val Lys Pro Leu Asp Leu Asp
1 5 10 15
Trp Lys Glu Phe Gly Thr Ile Leu Arg Gln Leu Gln Gln Glu Thr Arg
20 25 30
Phe Ala Leu Asn Lys Ala Thr Gln Leu Ala Trp Glu Trp Met Gly Phe
35 40 45
Ser Ser Asp Tyr Lys Asp Asn His Gly Glu Tyr Pro Lys Ser Lys Asp
50 55 60
Ile Leu Gly Tyr Thr Asn Val His Gly Tyr Ala Tyr His Thr Ile Lys
65 70 75 80
Thr Lys Ala Tyr Arg Leu Asn Ser Gly Asn Leu Ser Gln Thr Ile Lys
85 90 95
Arg Ala Thr Asp Arg Phe Lys Ala Tyr Gln Lys Glu Ile Leu Arg Gly
100 105 110
Asp Met Ser Ile Pro Ser Tyr Lys Arg Asp Ile Pro Leu Asp Leu Ile
115 120 125
Lys Glu Asn Ile Ser Val Asn Arg Met Asn His Gly Asp Tyr Ile Ala
130 135 140
Ser Leu Ser Leu Leu Ser Asn Pro Ala Lys Gln Glu Met Asn Val Lys
145 150 155 160
Arg Lys Ile Ser Val Ile Ile Ile Val Arg Gly Ala Gly Lys Thr Ile
165 170 175
Met Asp Arg Ile Leu Ser Gly Glu Tyr Gln Val Ser Ala Ser Gln Ile
180 185 190
Ile His Asp Asp Arg Lys Asn Lys Trp Tyr Leu Asn Ile Ser Tyr Asp
195 200 205
Phe Glu Pro Gln Thr Arg Val Leu Asp Leu Asn Lys Ile Met Gly Ile
210 215 220
Asp Leu Gly Val Ala Val Ala Val Tyr Met Ala Phe Gln His Thr Pro
225 230 235 240
Ala Arg Tyr Lys Leu Glu Gly Gly Glu Ile Glu Asn Phe Arg Arg Gln
245 250 255
Val Glu Ser Arg Arg Ile Ser Met Leu Arg Gln Gly Lys Tyr Ala Gly
260 265 270
Gly Ala Arg Gly Gly His Gly Arg Asp Lys Arg Ile Lys Pro Ile Glu
275 280 285
Gln Leu Arg Asp Lys Ile Ala Asn Phe Arg Asp Thr Thr Asn His Arg
290 295 300
Tyr Ser Arg Tyr Ile Val Asp Met Ala Ile Lys Glu Gly Cys Gly Thr
305 310 315 320
Ile Gln Met Glu Asp Leu Thr Asn Ile Arg Asp Ile Gly Ser Arg Phe
325 330 335
Leu Gln Asn Trp Thr Tyr Tyr Asp Leu Gln Gln Lys Ile Ile Tyr Lys
340 345 350
Ala Glu Glu Ala Gly Ile Lys Val Ile Lys Ile Asp Pro Gln Tyr Thr
355 360 365
Ser Gln Arg Cys Ser Glu Cys Gly Asn Ile Asp Ser Gly Asn Arg Ile
370 375 380
Gly Gln Ala Ile Phe Lys Cys Arg Ala Cys Gly Tyr Glu Ala Asn Ala
385 390 395 400
Asp Tyr Asn Ala Ala Arg Asn Ile Ala Ile Pro Asn Ile Asp Lys Ile
405 410 415
Ile Ala Glu Ser Ile Lys
420
<210> 284
<211> 1491
<212> DNA
<213> 人工序列
<220>
<223> 编码人密码子优化的SpCas12f1的DNA序列
<400> 284
atgggcgaga gcgttaaagc aatcaaactg aagatcctgg acatgttcct ggacccggag 60
tgcactaaac aggacgataa ctggcgtaaa gacctgtcta ccatgtctcg tttctgcgca 120
gaggcgggta acatgtgcct gcgcgacctg tacaattact tttctatgcc gaaagaagac 180
cgtattagct ccaaggatct gtacaacgcc atgtaccaca aaactaaact gctgcacccg 240
gaactgccgg gtaaagtggc gaaccagatc gtcaaccacg ctaaagatgt gtggaaacgc 300
aacgcgaagc tgatctatcg taatcagatc tctatgccga cttacaagat caccaccgca 360
ccgattcgcc tgcaaaacaa catctataaa ctgatcaaaa acaagaacaa atatatcatc 420
gatgtccagc tgtacagcaa agaatactct aaagacagcg gcaaaggcac ccaccgctac 480
ttcctggttg cagtgcgcga ttctagcacg cgtatgatct tcgaccgcat catgagcaaa 540
gaccacatcg atagctccaa atcctacacc cagggtcagc tgcagattaa aaaagaccat 600
cagggcaaat ggtactgtat cattccgtac accttcccga ctcatgagac cgtcctggat 660
ccggacaaag ttatgggtgt ggacctgggc gtggctaaag cagtgtattg ggcgttcaac 720
tcctcttaca aacgcggttg tatcgatggt ggtgaaattg aacacttccg caaaatgatc 780
cgtgctcgtc gtgtctccat tcagaaccag attaaacatt ctggcgacgc gcgcaagggt 840
catggtcgta aacgtgcact gaagccgatt gaaaccctgt ctgaaaaaga aaaaaacttc 900
cgcgatacta tcaaccatcg ttacgcaaac cgtatcgtgg aggcagcgat taagcagggc 960
tgcggcacca tccagatcga aaatctggag ggtatcgccg atactacggg ttccaaattt 1020
ctgaaaaact ggccatacta tgacctgcag accaaaatcg tgaacaaagc gaaggaacat 1080
ggcatcaccg tcgttgcgat caacccgcag tatacttctc aacgttgctc catgtgtggt 1140
tacattgaaa aaaccaaccg ttcctctcag gcagtgttcg agtgcaaaca gtgcggctat 1200
ggttcccgta ccatctgcat caactgccgc cacgttcagg taagcggtga tgtctgcgaa 1260
gaatgcggcg gcatcgttaa aaaagaaaac gttaacgcgg actataacgc ggcgaaaaac 1320
atctccaccc catatatcga tcagatcatc atggagaaat gtctggagct gggtatcccg 1380
taccgtagca tcacttgcaa agaatgcggt catatccagg cgtctggtaa cacttgtgag 1440
gtgtgcggtt ccaccaacat tctgaaaccg aaaaaaatcc gtaaagctaa a 1491
<210> 285
<211> 1266
<212> DNA
<213> 人工序列
<220>
<223> 编码人密码子优化的AsCas12f1的DNA序列
<400> 285
atgatcaagg tttatcgcta tgaaattgtg aaaccgctgg acctggactg gaaagagttc 60
ggtactatcc tgcgtcagct gcagcaggaa acgcgtttcg cactgaacaa agcgacgcag 120
ctggcttggg aatggatggg cttcagctct gattacaaag acaaccacgg cgaataccct 180
aaatccaaag atatcctggg ttacaccaac gtgcacggtt atgcgtacca caccatcaaa 240
actaaagcgt accgcctgaa ctccggtaat ctgtctcaga ccatcaagcg tgcgaccgac 300
cgtttcaaag cgtaccagaa ggaaatcctg cgcggtgaca tgagcatccc gtcctataag 360
cgtgacatcc cgctggatct gatcaaagaa aacatcagcg taaaccgcat gaaccacggt 420
gactacatcg cctccctgtc tctgctgtct aacccggcaa agcaagagat gaacgttaaa 480
cgcaaaatct ccgttatcat tatcgttcgt ggcgcaggca aaaccatcat ggatcgtatt 540
ctgtccggtg aatatcaagt gtccgcaagc cagatcatcc atgacgatcg taaaaataaa 600
tggtatctga acatctctta tgatttcgaa ccgcagaccc gcgtactgga cctgaacaaa 660
atcatgggta tcgatctggg cgttgcagta gcggtgtaca tggctttcca gcacaccccg 720
gcacgctaca aactggaagg tggtgagatc gaaaacttcc gtcgtcaagt ggaatctcgt 780
cgcatctcta tgctgcgtca gggtaaatat gcaggtggtg cgcgtggtgg tcatggtcgt 840
gacaaacgta ttaaaccaat cgaacagctg cgcgataaaa tcgccaactt ccgtgatacc 900
accaaccacc gctactctcg ttatatcgtt gatatggcaa tcaaagaggg ttgtggtact 960
atccagatgg aagacctgac gaacatccgc gatatcggtt ctcgtttcct gcagaactgg 1020
acctactacg atctgcagca gaaaattatc tacaaagcgg aggaagcagg tatcaaagtc 1080
attaaaatcg atccgcagta tactagccag cgctgcagcg aatgtggtaa cattgatagc 1140
ggcaaccgca ttggtcaggc aatctttaaa tgccgcgctt gtggctacga agcgaacgca 1200
gactacaacg cggcgcgtaa catcgccatc ccgaatattg acaaaatcat tgccgaatct 1260
attaaa 1266
<210> 286
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> VEGFA-3基因的原间隔序列
<400> 286
ggggtgaccg ccggagcgcg 20
<210> 287
<211> 161
<212> DNA
<213> 人工序列
<220>
<223> 编码tracrRNA的DNA序列,用于SpCas12f1和AsCas12f1
<400> 287
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca a 161
<210> 288
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 编码crRNA重复序列的DNA序列,用于SpCas12f1
<400> 288
gtcgcatctt gcgtaagcgc gtggattgaa ac 32
<210> 289
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 编码crRNA重复序列的DNA序列,用于AsCas12f1
<400> 289
gtttgcgagc tagcttgtgg agtgtgaac 29
<210> 290
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 编码SpCas12f1 crRNA的DNA,用于DYtarget2(WT)
<400> 290
gtcgcatctt gcgtaagcgc gtggattgaa accacacaca cagtgggcta cc 52
<210> 291
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 编码SpCas12f1 crRNA的DNA,用于DYtarget2(U6)
<400> 291
gtcgcatctt gcgtaagcgc gtggattgaa accacacaca cagtgggcta cctttttt 58
<210> 292
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 编码SpCas12f1 crRNA的DNA,用于DYtarget2(U4AU6)
<400> 292
gtcgcatctt gcgtaagcgc gtggattgaa accacacaca cagtgggcta ccttttattt 60
ttt 63
<210> 293
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 编码SpCas12f1 crRNA的DNA,用于VEGFA-3(WT)
<400> 293
gtcgcatctt gcgtaagcgc gtggattgaa acggggtgac cgccggagcg cg 52
<210> 294
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 编码SpCas12f1 crRNA的DNA,用于VEGFA-3(U6)
<400> 294
gtcgcatctt gcgtaagcgc gtggattgaa acggggtgac cgccggagcg cgtttttt 58
<210> 295
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 编码SpCas12f1 crRNA的DNA,用于VEGFA-3(U4AU6)
<400> 295
gtcgcatctt gcgtaagcgc gtggattgaa acggggtgac cgccggagcg cgttttattt 60
ttt 63
<210> 296
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 编码AsCas12f1 crRNA的DNA,用于DYtarget2(WT)
<400> 296
gtttgcgagc tagcttgtgg agtgtgaacc acacacacag tgggctacc 49
<210> 297
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 编码AsCas12f1 crRNA的DNA序列,用于DYtarget2(U6)
<400> 297
gtttgcgagc tagcttgtgg agtgtgaacc acacacacag tgggctacct ttttt 55
<210> 298
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 编码AsCas12f1 crRNA的DNA,用于DYtarget2(U4AU6)
<400> 298
gtttgcgagc tagcttgtgg agtgtgaacc acacacacag tgggctacct tttatttttt 60
60
<210> 299
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 编码AsCas12f1 crRNA的DNA,用于VEGFA-3(WT)
<400> 299
gtttgcgagc tagcttgtgg agtgtgaacg gggtgaccgc cggagcgcg 49
<210> 300
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 编码AsCas12f1 crRNA的DNA,用于VEGFA-3(U6)
<400> 300
gtttgcgagc tagcttgtgg agtgtgaacg gggtgaccgc cggagcgcgt ttttt 55
<210> 301
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 编码AsCas12f1 crRNA的DNA,用于VEGFA-3(U4AU6)
<400> 301
gtttgcgagc tagcttgtgg agtgtgaacg gggtgaccgc cggagcgcgt tttatttttt 60
60
<210> 302
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于合成tracrRNA扩增子
<400> 302
ttgtgcagaa ttggagagga 20
<210> 303
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于SpCas12f1的crRNA (DYtarget2, WT)
<400> 303
ggtagcccac tgtgtgtgtg gtttcaatcc a 31
<210> 304
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于SpCas12f1的crRNA(DYtarget2, U6)
<400> 304
aaaaaaggta gcccactgtg tgtgtggttt caatcca 37
<210> 305
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于SpCas12f1的crRNA(DYtarget2, U4AU6)
<400> 305
aaaaaataaa aggtagccca ctgtgtgtgt ggtttcaatc ca 42
<210> 306
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于SpCas12f1的crRNA(VEGFA-3, WT)
<400> 306
cgcgctccgg cggtcacccc gtttcaatcc a 31
<210> 307
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于SpCas12f1的crRNA(VEGFA-3, U6)
<400> 307
aaaaaacgcg ctccggcggt caccccgttt caatcca 37
<210> 308
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于SpCas12f1的crRNA(VEGFA-3, U4AU6)
<400> 308
aaaaaataaa acgcgctccg gcggtcaccc cgtttcaatc ca 42
<210> 309
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于AsCas12f1的crRNA(DYtarget2, WT)
<400> 309
ggtagcccac tgtgtgtgtg gttcacactc c 31
<210> 310
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于AsCas12f1的crRNA(DYtarget2, U6)
<400> 310
aaaaaaggta gcccactgtg tgtgtggttc acactcc 37
<210> 311
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于AsCas12f1的crRNA(DYtarget2, U4AU6)
<400> 311
aaaaaataaa aggtagccca ctgtgtgtgt ggttcacact cc 42
<210> 312
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于AsCas12f1的crRNA(VEGFA-3, WT)
<400> 312
cgcgctccgg cggtcacccc gttcacactc c 31
<210> 313
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于AsCas12f1的crRNA(VEGFA-3, U6)
<400> 313
aaaaaacgcg ctccggcggt caccccgttc acactcc 37
<210> 314
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于AsCas12f1的crRNA(VEGFA-3, U4AU6)
<400> 314
aaaaaataaa acgcgctccg gcggtcaccc cgttcacact cc 42
<210> 315
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> HA标签序列
<400> 315
tacccatacg atgttccaga ttacgcttat ccctacgacg tgcctgatta tgcataccca 60
tatgatgtcc ccgactatgc c 81
<210> 316
<211> 3009
<212> DNA
<213> 人工序列
<220>
<223> Cas14a1和胞苷脱氨酶融合的蛋白
<400> 316
ccaaagaaga agcggaaagt ctcctcagag actgggcctg tcgccgtcga tccaaccctg 60
cgccgccgga ttgaacctca cgagtttgaa gtgttctttg acccccggga gctgagaaag 120
gagacatgcc tgctgtacga gatcaactgg ggaggcaggc actccatctg gaggcacacc 180
tctcagaaca caaataagca cgtggaggtg aacttcatcg agaagtttac cacagagcgg 240
tacttctgcc ccaataccag atgtagcatc acatggtttc tgagctggtc cccttgcgga 300
gagtgtagca gggccatcac cgagttcctg tccagatatc cacacgtgac actgtttatc 360
tacatcgcca ggctgtatca ccacgcagac ccaaggaata ggcagggcct gcgcgatctg 420
atcagctccg gcgtgaccat ccagatcatg acagagcagg agtccggcta ctgctggcgg 480
aacttcgtga attattctcc tagcaacgag gcccactggc ctaggtaccc acacctgtgg 540
gtgcgcctgt acgtgctgga gctgtattgc atcatcctgg gcctgccccc ttgtctgaat 600
atcctgcgga gaaagcagcc ccagctgacc ttctttacaa tcgccctgca gtcttgtcac 660
tatcagaggc tgccacccca catcctgtgg gccacaggcc tgaagtctgg aggatctagc 720
ggaggatcct ctggcagcga gacaccagga acaagcgagt cagcaacacc agagagcagt 780
ggcggcagca gcggcggcag catggccaag aacacaatta caaagacact gaagctgagg 840
atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 900
agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 960
ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 1020
gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 1080
ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 1140
aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 1200
gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 1260
aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 1320
gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 1380
ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 1440
tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 1500
ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 1560
ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 1620
gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 1680
agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 1740
gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1800
gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1860
tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1920
gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1980
aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 2040
aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 2100
tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 2160
tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 2220
acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 2280
aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 2340
gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagcccag cggcgggagc 2400
ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460
ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520
aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580
atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640
aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700
aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760
ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820
gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880
ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940
atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000
aggaaagtc 3009
<210> 317
<211> 1003
<212> PRT
<213> 人工序列
<220>
<223> Cas14a1与CBE融合蛋白(N末端-胞苷脱氨酶)
<400> 317
Pro Lys Lys Lys Arg Lys Val Ser Ser Glu Thr Gly Pro Val Ala Val
1 5 10 15
Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe
20 25 30
Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile
35 40 45
Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr
50 55 60
Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg
65 70 75 80
Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp
85 90 95
Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg
100 105 110
Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His
115 120 125
Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly
130 135 140
Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg
145 150 155 160
Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr
165 170 175
Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile
180 185 190
Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln
195 200 205
Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu
210 215 220
Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser Ser
225 230 235 240
Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr
245 250 255
Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Met Ala Lys Asn Thr
260 265 270
Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala
275 280 285
Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile
290 295 300
Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His
305 310 315 320
Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys
325 330 335
Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu
340 345 350
Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile
355 360 365
Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu
370 375 380
Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn
385 390 395 400
Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala
405 410 415
Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys
420 425 430
Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly
435 440 445
Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln
450 455 460
Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp
465 470 475 480
Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile
485 490 495
Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys
500 505 510
Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg
515 520 525
Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys
530 535 540
Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly
545 550 555 560
Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp
565 570 575
Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile
580 585 590
Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe
595 600 605
Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys
610 615 620
Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg
625 630 635 640
Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr
645 650 655
Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys
660 665 670
Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met
675 680 685
Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile
690 695 700
Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu
705 710 715 720
Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn
725 730 735
Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe
740 745 750
Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu
755 760 765
Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile
770 775 780
Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser
785 790 795 800
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
805 810 815
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
820 825 830
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
835 840 845
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
850 855 860
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
865 870 875 880
Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser
885 890 895
Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
900 905 910
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu
915 920 925
Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala
930 935 940
Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
945 950 955 960
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
965 970 975
Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly
980 985 990
Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
995 1000
<210> 318
<211> 3009
<212> DNA
<213> 人工序列
<220>
<223> 编码Cas14a1和CBE融合蛋白(C末端-胞苷脱氨酶)的DNA
<400> 318
ccaaagaaga agcggaaagt catggccaag aacacaatta caaagacact gaagctgagg 60
atcgtgagac catacaacag cgctgaggtc gagaagattg tggctgatga aaagaacaac 120
agggaaaaga tcgccctcga gaagaacaag gataaggtga aggaggcctg ctctaagcac 180
ctgaaagtgg ccgcctactg caccacacag gtggagagga acgcctgtct gttttgtaaa 240
gctcggaagc tggatgataa gttttaccag aagctgcggg gccagttccc cgatgccgtc 300
ttttggcagg agattagcga gatcttcaga cagctgcaga agcaggccgc cgagatctac 360
aaccagagcc tgatcgagct ctactacgag atcttcatca agggcaaggg cattgccaac 420
gcctcctccg tggagcacta cctgagcgac gtgtgctaca caagagccgc cgagctcttt 480
aagaacgccg ctatcgcttc cgggctgagg agcaagatta agagtaactt ccggctcaag 540
gagctgaaga acatgaagag cggcctgccc actacaaaga gcgacaactt cccaattcca 600
ctggtgaagc agaagggggg ccagtacaca gggttcgaga tttccaacca caacagcgac 660
tttattatta agatcccctt tggcaggtgg caggtcaaga aggagattga caagtacagg 720
ccctgggaga agtttgattt cgagcaggtg cagaagagcc ccaagcctat ttccctgctg 780
ctgtccacac agcggcggaa gaggaacaag gggtggtcta aggatgaggg gaccgaggcc 840
gagattaaga aagtgatgaa cggcgactac cagacaagct acatcgaggt caagcggggc 900
agtaagattg gcgagaagag cgcctggatg ctgaacctga gcattgacgt gccaaagatt 960
gataagggcg tggatcccag catcatcgga gggatcgatg tgggggtcaa gagccccctc 1020
gtgtgcgcca tcaacaacgc cttcagcagg tacagcatct ccgataacga cctgttccac 1080
tttaacaaga agatgttcgc ccggcggagg attttgctca agaagaaccg gcacaagcgg 1140
gccggacacg gggccaagaa caagctcaag cccatcacta tcctgaccga gaagagcgag 1200
aggttcagga agaagctcat cgagagatgg gcctgcgaga tcgccgattt ctttattaag 1260
aacaaggtcg gaacagtgca gatggagaac ctcgagagca tgaagaggaa ggaggattcc 1320
tacttcaaca ttcggctgag ggggttctgg ccctacgctg agatgcagaa caagattgag 1380
tttaagctga agcagtacgg gattgagatc cggaaggtgg cccccaacaa caccagcaag 1440
acctgcagca agtgcgggca cctcaacaac tacttcaact tcgagtaccg gaagaagaac 1500
aagttcccac acttcaagtg cgagaagtgc aactttaagg agaacgccga ttacaacgcc 1560
gccctgaaca tcagcaaccc taagctgaag agcactaagg aggagccctc tggaggatct 1620
agcggaggat cctctggcag cgagacacca ggaacaagcg agtcagcaac accagagagc 1680
agtggcggca gcagcggcgg cagctcctca gagactgggc ctgtcgccgt cgatccaacc 1740
ctgcgccgcc ggattgaacc tcacgagttt gaagtgttct ttgacccccg ggagctgaga 1800
aaggagacat gcctgctgta cgagatcaac tggggaggca ggcactccat ctggaggcac 1860
acctctcaga acacaaataa gcacgtggag gtgaacttca tcgagaagtt taccacagag 1920
cggtacttct gccccaatac cagatgtagc atcacatggt ttctgagctg gtccccttgc 1980
ggagagtgta gcagggccat caccgagttc ctgtccagat atccacacgt gacactgttt 2040
atctacatcg ccaggctgta tcaccacgca gacccaagga ataggcaggg cctgcgcgat 2100
ctgatcagct ccggcgtgac catccagatc atgacagagc aggagtccgg ctactgctgg 2160
cggaacttcg tgaattattc tcctagcaac gaggcccact ggcctaggta cccacacctg 2220
tgggtgcgcc tgtacgtgct ggagctgtat tgcatcatcc tgggcctgcc cccttgtctg 2280
aatatcctgc ggagaaagca gccccagctg accttcttta caatcgccct gcagtcttgt 2340
cactatcaga ggctgccacc ccacatcctg tgggccacag gcctgaagag cggcgggagc 2400
ggcgggagcg gggggagcac taatctgagc gacatcattg agaaggagac tgggaaacag 2460
ctggtcattc aggagtccat cctgatgctg cctgaggagg tggaggaagt gatcggcaac 2520
aagccagagt ctgacatcct ggtgcacacc gcctacgacg agtccacaga tgagaatgtg 2580
atgctgctga cctctgacgc ccccgagtat aagccttggg ccctggtcat ccaggattct 2640
aacggcgaga ataagatcaa gatgctgagc ggaggatccg gaggatctgg aggcagcacc 2700
aacctgtctg acatcatcga gaaggagaca ggcaagcagc tggtcatcca ggagagcatc 2760
ctgatgctgc ccgaagaagt cgaagaagtg atcggaaaca agcctgagag cgatatcctg 2820
gtccataccg cctacgacga gagtaccgac gaaaatgtga tgctgctgac atccgacgcc 2880
ccagagtata agccctgggc tctggtcatc caggattcca acggagagaa caaaatcaaa 2940
atgctgtctg gcggctcaaa aagaaccgcc gacggcagcg aattcgagcc caagaagaag 3000
aggaaagtc 3009
<210> 319
<211> 1003
<212> PRT
<213> 人工序列
<220>
<223> Cas14a1和CBE融合蛋白(C末端 -胞苷脱氨酶)
<400> 319
Pro Lys Lys Lys Arg Lys Val Met Ala Lys Asn Thr Ile Thr Lys Thr
1 5 10 15
Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser Ala Glu Val Glu Lys
20 25 30
Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys Ile Ala Leu Glu Lys
35 40 45
Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys His Leu Lys Val Ala
50 55 60
Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala Cys Leu Phe Cys Lys
65 70 75 80
Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys Leu Arg Gly Gln Phe
85 90 95
Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu Ile Phe Arg Gln Leu
100 105 110
Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser Leu Ile Glu Leu Tyr
115 120 125
Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala Asn Ala Ser Ser Val
130 135 140
Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg Ala Ala Glu Leu Phe
145 150 155 160
Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser Lys Ile Lys Ser Asn
165 170 175
Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser Gly Leu Pro Thr Thr
180 185 190
Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys Gln Lys Gly Gly Gln
195 200 205
Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser Asp Phe Ile Ile Lys
210 215 220
Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu Ile Asp Lys Tyr Arg
225 230 235 240
Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln Lys Ser Pro Lys Pro
245 250 255
Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys Arg Asn Lys Gly Trp
260 265 270
Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys Lys Val Met Asn Gly
275 280 285
Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg Gly Ser Lys Ile Gly
290 295 300
Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile Asp Val Pro Lys Ile
305 310 315 320
Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly Ile Asp Val Gly Val
325 330 335
Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala Phe Ser Arg Tyr Ser
340 345 350
Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys Lys Met Phe Ala Arg
355 360 365
Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys Arg Ala Gly His Gly
370 375 380
Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu Thr Glu Lys Ser Glu
385 390 395 400
Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala Cys Glu Ile Ala Asp
405 410 415
Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln Met Glu Asn Leu Glu
420 425 430
Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn Ile Arg Leu Arg Gly
435 440 445
Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile Glu Phe Lys Leu Lys
450 455 460
Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro Asn Asn Thr Ser Lys
465 470 475 480
Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr Phe Asn Phe Glu Tyr
485 490 495
Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys Glu Lys Cys Asn Phe
500 505 510
Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn Ile Ser Asn Pro Lys
515 520 525
Leu Lys Ser Thr Lys Glu Glu Pro Ser Gly Gly Ser Ser Gly Gly Ser
530 535 540
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
545 550 555 560
Ser Gly Gly Ser Ser Gly Gly Ser Ser Ser Glu Thr Gly Pro Val Ala
565 570 575
Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val
580 585 590
Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu
595 600 605
Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn
610 615 620
Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu
625 630 635 640
Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser
645 650 655
Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser
660 665 670
Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His
675 680 685
His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser
690 695 700
Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp
705 710 715 720
Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg
725 730 735
Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile
740 745 750
Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro
755 760 765
Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg
770 775 780
Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Ser Gly Gly Ser
785 790 795 800
Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu
805 810 815
Thr Gly Lys Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu
820 825 830
Glu Val Glu Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val
835 840 845
His Thr Ala Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr
850 855 860
Ser Asp Ala Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser
865 870 875 880
Asn Gly Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser
885 890 895
Gly Gly Ser Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys
900 905 910
Gln Leu Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu
915 920 925
Glu Val Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala
930 935 940
Tyr Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
945 950 955 960
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
965 970 975
Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala Asp Gly
980 985 990
Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
995 1000
<210> 320
<211> 2823
<212> DNA
<213> 人工序列
<220>
<223> 编码Cas14a1和ABE融合蛋白(N末端 -腺嘌呤脱氨酶)的DNA
<400> 320
atgtccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 60
agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 120
atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 180
atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 240
tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 300
cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 360
ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 420
tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 480
aaagcacaat cctctactga ctctggtggt tcttctggtg gttctagcgg cagcgagact 540
cccgggacct cagagtccgc cacacccgaa agttctggtg gttcttctgg tggttcttcc 600
gaagtcgagt tttcccatga gtactggatg agacacgcat tgactctcgc aaagagggct 660
cgagatgaac gcgaggtgcc cgtgggggca gtactcgtgc tcaacaatcg cgtaatcggc 720
gaaggttgga atagggcaat cggactccac gaccccactg cacatgcgga aatcatggcc 780
cttcgacagg gagggcttgt gatgcagaat tatcgactta tcgatgcgac gctgtacgtc 840
acgtttgaac cttgcgtaat gtgcgcggga gctatgattc actcccgcat tggacgagtt 900
gtattcggtg ttcgcaacgc caagacgggt gccgcaggtt cactgatgga cgtgctgcat 960
tacccaggca tgaaccaccg ggtagaaatc acagaaggca tattggcgga cgaatgtgcg 1020
gcgctgttgt gttacttttt tcgcatgccc aggcaggtct ttaacgccca gaaaaaagca 1080
caatcctcta ctgactctgg tggttcttct ggtggttcta gcggcagcga gactcccggg 1140
acctcagagt ccgccacacc cgaaagttct ggtggttctt ctggtggttc tgccaagaac 1200
acaattacaa agacactgaa gctgaggatc gtgagaccat acaacagcgc tgaggtcgag 1260
aagattgtgg ctgatgaaaa gaacaacagg gaaaagatcg ccctcgagaa gaacaaggat 1320
aaggtgaagg aggcctgctc taagcacctg aaagtggccg cctactgcac cacacaggtg 1380
gagaggaacg cctgtctgtt ttgtaaagct cggaagctgg atgataagtt ttaccagaag 1440
ctgcggggcc agttccccga tgccgtcttt tggcaggaga ttagcgagat cttcagacag 1500
ctgcagaagc aggccgccga gatctacaac cagagcctga tcgagctcta ctacgagatc 1560
ttcatcaagg gcaagggcat tgccaacgcc tcctccgtgg agcactacct gagcgacgtg 1620
tgctacacaa gagccgccga gctctttaag aacgccgcta tcgcttccgg gctgaggagc 1680
aagattaaga gtaacttccg gctcaaggag ctgaagaaca tgaagagcgg cctgcccact 1740
acaaagagcg acaacttccc aattccactg gtgaagcaga aggggggcca gtacacaggg 1800
ttcgagattt ccaaccacaa cagcgacttt attattaaga tcccctttgg caggtggcag 1860
gtcaagaagg agattgacaa gtacaggccc tgggagaagt ttgatttcga gcaggtgcag 1920
aagagcccca agcctatttc cctgctgctg tccacacagc ggcggaagag gaacaagggg 1980
tggtctaagg atgaggggac cgaggccgag attaagaaag tgatgaacgg cgactaccag 2040
acaagctaca tcgaggtcaa gcggggcagt aagattggcg agaagagcgc ctggatgctg 2100
aacctgagca ttgacgtgcc aaagattgat aagggcgtgg atcccagcat catcggaggg 2160
atcgatgtgg gggtcaagag ccccctcgtg tgcgccatca acaacgcctt cagcaggtac 2220
agcatctccg ataacgacct gttccacttt aacaagaaga tgttcgcccg gcggaggatt 2280
ttgctcaaga agaaccggca caagcgggcc ggacacgggg ccaagaacaa gctcaagccc 2340
atcactatcc tgaccgagaa gagcgagagg ttcaggaaga agctcatcga gagatgggcc 2400
tgcgagatcg ccgatttctt tattaagaac aaggtcggaa cagtgcagat ggagaacctc 2460
gagagcatga agaggaagga ggattcctac ttcaacattc ggctgagggg gttctggccc 2520
tacgctgaga tgcagaacaa gattgagttt aagctgaagc agtacgggat tgagatccgg 2580
aaggtggccc ccaacaacac cagcaagacc tgcagcaagt gcgggcacct caacaactac 2640
ttcaacttcg agtaccggaa gaagaacaag ttcccacact tcaagtgcga gaagtgcaac 2700
tttaaggaga acgccgatta caacgccgcc ctgaacatca gcaaccctaa gctgaagagc 2760
actaaggagg agcccaaaag gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa 2820
aag 2823
<210> 321
<211> 941
<212> PRT
<213> 人工序列
<220>
<223> Cas14a1和ABE融合蛋白(N末端-腺嘌呤脱氨酶)
<400> 321
Met Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
1 5 10 15
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
20 25 30
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
35 40 45
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
50 55 60
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
65 70 75 80
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
85 90 95
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
100 105 110
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
115 120 125
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
130 135 140
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
145 150 155 160
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
165 170 175
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
180 185 190
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
195 200 205
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
210 215 220
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
225 230 235 240
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
245 250 255
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
260 265 270
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
275 280 285
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
290 295 300
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
305 310 315 320
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
325 330 335
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
340 345 350
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly
355 360 365
Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser
370 375 380
Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly Ser Ala Lys Asn
385 390 395 400
Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg Pro Tyr Asn Ser
405 410 415
Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn Asn Arg Glu Lys
420 425 430
Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu Ala Cys Ser Lys
435 440 445
His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val Glu Arg Asn Ala
450 455 460
Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys Phe Tyr Gln Lys
465 470 475 480
Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln Glu Ile Ser Glu
485 490 495
Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile Tyr Asn Gln Ser
500 505 510
Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly Lys Gly Ile Ala
515 520 525
Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val Cys Tyr Thr Arg
530 535 540
Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser Gly Leu Arg Ser
545 550 555 560
Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys Asn Met Lys Ser
565 570 575
Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile Pro Leu Val Lys
580 585 590
Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser Asn His Asn Ser
595 600 605
Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln Val Lys Lys Glu
610 615 620
Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe Glu Gln Val Gln
625 630 635 640
Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr Gln Arg Arg Lys
645 650 655
Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu Ala Glu Ile Lys
660 665 670
Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile Glu Val Lys Arg
675 680 685
Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu Asn Leu Ser Ile
690 695 700
Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser Ile Ile Gly Gly
705 710 715 720
Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala Ile Asn Asn Ala
725 730 735
Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe His Phe Asn Lys
740 745 750
Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys Asn Arg His Lys
755 760 765
Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro Ile Thr Ile Leu
770 775 780
Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile Glu Arg Trp Ala
785 790 795 800
Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val Gly Thr Val Gln
805 810 815
Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp Ser Tyr Phe Asn
820 825 830
Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met Gln Asn Lys Ile
835 840 845
Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg Lys Val Ala Pro
850 855 860
Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His Leu Asn Asn Tyr
865 870 875 880
Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro His Phe Lys Cys
885 890 895
Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn Ala Ala Leu Asn
900 905 910
Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu Pro Lys Arg Pro
915 920 925
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
930 935 940
<210> 322
<211> 2823
<212> DNA
<213> 人工序列
<220>
<223> 编码Cas14a1和ABE融合蛋白(C末端-腺嘌呤脱氨酶)的DNA
<400> 322
atggccaaga acacaattac aaagacactg aagctgagga tcgtgagacc atacaacagc 60
gctgaggtcg agaagattgt ggctgatgaa aagaacaaca gggaaaagat cgccctcgag 120
aagaacaagg ataaggtgaa ggaggcctgc tctaagcacc tgaaagtggc cgcctactgc 180
accacacagg tggagaggaa cgcctgtctg ttttgtaaag ctcggaagct ggatgataag 240
ttttaccaga agctgcgggg ccagttcccc gatgccgtct tttggcagga gattagcgag 300
atcttcagac agctgcagaa gcaggccgcc gagatctaca accagagcct gatcgagctc 360
tactacgaga tcttcatcaa gggcaagggc attgccaacg cctcctccgt ggagcactac 420
ctgagcgacg tgtgctacac aagagccgcc gagctcttta agaacgccgc tatcgcttcc 480
gggctgagga gcaagattaa gagtaacttc cggctcaagg agctgaagaa catgaagagc 540
ggcctgccca ctacaaagag cgacaacttc ccaattccac tggtgaagca gaaggggggc 600
cagtacacag ggttcgagat ttccaaccac aacagcgact ttattattaa gatccccttt 660
ggcaggtggc aggtcaagaa ggagattgac aagtacaggc cctgggagaa gtttgatttc 720
gagcaggtgc agaagagccc caagcctatt tccctgctgc tgtccacaca gcggcggaag 780
aggaacaagg ggtggtctaa ggatgagggg accgaggccg agattaagaa agtgatgaac 840
ggcgactacc agacaagcta catcgaggtc aagcggggca gtaagattgg cgagaagagc 900
gcctggatgc tgaacctgag cattgacgtg ccaaagattg ataagggcgt ggatcccagc 960
atcatcggag ggatcgatgt gggggtcaag agccccctcg tgtgcgccat caacaacgcc 1020
ttcagcaggt acagcatctc cgataacgac ctgttccact ttaacaagaa gatgttcgcc 1080
cggcggagga ttttgctcaa gaagaaccgg cacaagcggg ccggacacgg ggccaagaac 1140
aagctcaagc ccatcactat cctgaccgag aagagcgaga ggttcaggaa gaagctcatc 1200
gagagatggg cctgcgagat cgccgatttc tttattaaga acaaggtcgg aacagtgcag 1260
atggagaacc tcgagagcat gaagaggaag gaggattcct acttcaacat tcggctgagg 1320
gggttctggc cctacgctga gatgcagaac aagattgagt ttaagctgaa gcagtacggg 1380
attgagatcc ggaaggtggc ccccaacaac accagcaaga cctgcagcaa gtgcgggcac 1440
ctcaacaact acttcaactt cgagtaccgg aagaagaaca agttcccaca cttcaagtgc 1500
gagaagtgca actttaagga gaacgccgat tacaacgccg ccctgaacat cagcaaccct 1560
aagctgaaga gcactaagga ggagccctct ggaggatcta gcggaggatc ctctggcagc 1620
gagacaccag gaacaagcga gtcagcaaca ccagagagca gtggcggcag cagcggcggc 1680
agctccgaag tcgagttttc ccatgagtac tggatgagac acgcattgac tctcgcaaag 1740
agggcttggg atgaacgcga ggtgcccgtg ggggcagtac tcgtgcataa caatcgcgta 1800
atcggcgaag gttggaatag gccgatcgga cgccacgacc ccactgcaca tgcggaaatc 1860
atggcccttc gacagggagg gcttgtgatg cagaattatc gacttatcga tgcgacgctg 1920
tacgtcacgc ttgaaccttg cgtaatgtgc gcgggagcta tgattcactc ccgcattgga 1980
cgagttgtat tcggtgcccg cgacgccaag acgggtgccg caggttcact gatggacgtg 2040
ctgcatcacc caggcatgaa ccaccgggta gaaatcacag aaggcatatt ggcggacgaa 2100
tgtgcggcgc tgttgtccga cttttttcgc atgcggaggc aggagatcaa ggcccagaaa 2160
aaagcacaat cctctactga ctctggtggt tcttctggtg gttctagcgg cagcgagact 2220
cccgggacct cagagtccgc cacacccgaa agttcaggtg gatcttcagg tggatcttcg 2280
gaagtggaat tttcgcacga gtattggatg aggcacgctt taactctcgc taagagagca 2340
cgagacgaac gggaagtgcc ggttggggct gtcctcgtac tcaataatcg agttatcgga 2400
gaaggctgga acagggcaat cggactccac gatcccacag ctcatgccga gataatggcg 2460
cttcgacaag gaggcctagt catgcaaaat tatcgtctta ttgacgcgac cctctacgtg 2520
acctttgagc catgcgttat gtgtgcgggt gcaatgatac attcccggat aggacgtgta 2580
gtatttggag ttcgcaacgc gaagaccggt gcggctggtt ctctcatgga tgtcctgcac 2640
taccctggga tgaatcaccg cgttgaaatc actgaaggca ttttggccga tgaatgcgcg 2700
gccctgttat gttacttttt tcgcatgccc aggcaggtct ttaacgcaca gaagaaagcc 2760
caatcgtcca ctgataaaag gccggcggcc acgaaaaagg ccggccaggc aaaaaagaaa 2820
aag 2823
<210> 323
<211> 941
<212> PRT
<213> 人工序列
<220>
<223> Cas14a1和ABE融合蛋白(C末端-腺嘌呤脱氨酶)
<400> 323
Met Ala Lys Asn Thr Ile Thr Lys Thr Leu Lys Leu Arg Ile Val Arg
1 5 10 15
Pro Tyr Asn Ser Ala Glu Val Glu Lys Ile Val Ala Asp Glu Lys Asn
20 25 30
Asn Arg Glu Lys Ile Ala Leu Glu Lys Asn Lys Asp Lys Val Lys Glu
35 40 45
Ala Cys Ser Lys His Leu Lys Val Ala Ala Tyr Cys Thr Thr Gln Val
50 55 60
Glu Arg Asn Ala Cys Leu Phe Cys Lys Ala Arg Lys Leu Asp Asp Lys
65 70 75 80
Phe Tyr Gln Lys Leu Arg Gly Gln Phe Pro Asp Ala Val Phe Trp Gln
85 90 95
Glu Ile Ser Glu Ile Phe Arg Gln Leu Gln Lys Gln Ala Ala Glu Ile
100 105 110
Tyr Asn Gln Ser Leu Ile Glu Leu Tyr Tyr Glu Ile Phe Ile Lys Gly
115 120 125
Lys Gly Ile Ala Asn Ala Ser Ser Val Glu His Tyr Leu Ser Asp Val
130 135 140
Cys Tyr Thr Arg Ala Ala Glu Leu Phe Lys Asn Ala Ala Ile Ala Ser
145 150 155 160
Gly Leu Arg Ser Lys Ile Lys Ser Asn Phe Arg Leu Lys Glu Leu Lys
165 170 175
Asn Met Lys Ser Gly Leu Pro Thr Thr Lys Ser Asp Asn Phe Pro Ile
180 185 190
Pro Leu Val Lys Gln Lys Gly Gly Gln Tyr Thr Gly Phe Glu Ile Ser
195 200 205
Asn His Asn Ser Asp Phe Ile Ile Lys Ile Pro Phe Gly Arg Trp Gln
210 215 220
Val Lys Lys Glu Ile Asp Lys Tyr Arg Pro Trp Glu Lys Phe Asp Phe
225 230 235 240
Glu Gln Val Gln Lys Ser Pro Lys Pro Ile Ser Leu Leu Leu Ser Thr
245 250 255
Gln Arg Arg Lys Arg Asn Lys Gly Trp Ser Lys Asp Glu Gly Thr Glu
260 265 270
Ala Glu Ile Lys Lys Val Met Asn Gly Asp Tyr Gln Thr Ser Tyr Ile
275 280 285
Glu Val Lys Arg Gly Ser Lys Ile Gly Glu Lys Ser Ala Trp Met Leu
290 295 300
Asn Leu Ser Ile Asp Val Pro Lys Ile Asp Lys Gly Val Asp Pro Ser
305 310 315 320
Ile Ile Gly Gly Ile Asp Val Gly Val Lys Ser Pro Leu Val Cys Ala
325 330 335
Ile Asn Asn Ala Phe Ser Arg Tyr Ser Ile Ser Asp Asn Asp Leu Phe
340 345 350
His Phe Asn Lys Lys Met Phe Ala Arg Arg Arg Ile Leu Leu Lys Lys
355 360 365
Asn Arg His Lys Arg Ala Gly His Gly Ala Lys Asn Lys Leu Lys Pro
370 375 380
Ile Thr Ile Leu Thr Glu Lys Ser Glu Arg Phe Arg Lys Lys Leu Ile
385 390 395 400
Glu Arg Trp Ala Cys Glu Ile Ala Asp Phe Phe Ile Lys Asn Lys Val
405 410 415
Gly Thr Val Gln Met Glu Asn Leu Glu Ser Met Lys Arg Lys Glu Asp
420 425 430
Ser Tyr Phe Asn Ile Arg Leu Arg Gly Phe Trp Pro Tyr Ala Glu Met
435 440 445
Gln Asn Lys Ile Glu Phe Lys Leu Lys Gln Tyr Gly Ile Glu Ile Arg
450 455 460
Lys Val Ala Pro Asn Asn Thr Ser Lys Thr Cys Ser Lys Cys Gly His
465 470 475 480
Leu Asn Asn Tyr Phe Asn Phe Glu Tyr Arg Lys Lys Asn Lys Phe Pro
485 490 495
His Phe Lys Cys Glu Lys Cys Asn Phe Lys Glu Asn Ala Asp Tyr Asn
500 505 510
Ala Ala Leu Asn Ile Ser Asn Pro Lys Leu Lys Ser Thr Lys Glu Glu
515 520 525
Pro Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly Ser Glu Thr Pro Gly
530 535 540
Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly Gly Ser Ser Gly Gly
545 550 555 560
Ser Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu
565 570 575
Thr Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala
580 585 590
Val Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro
595 600 605
Ile Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg
610 615 620
Gln Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu
625 630 635 640
Tyr Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His
645 650 655
Ser Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly
660 665 670
Ala Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His
675 680 685
Arg Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu
690 695 700
Leu Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys
705 710 715 720
Lys Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser
725 730 735
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser
740 745 750
Gly Gly Ser Ser Gly Gly Ser Ser Glu Val Glu Phe Ser His Glu Tyr
755 760 765
Trp Met Arg His Ala Leu Thr Leu Ala Lys Arg Ala Arg Asp Glu Arg
770 775 780
Glu Val Pro Val Gly Ala Val Leu Val Leu Asn Asn Arg Val Ile Gly
785 790 795 800
Glu Gly Trp Asn Arg Ala Ile Gly Leu His Asp Pro Thr Ala His Ala
805 810 815
Glu Ile Met Ala Leu Arg Gln Gly Gly Leu Val Met Gln Asn Tyr Arg
820 825 830
Leu Ile Asp Ala Thr Leu Tyr Val Thr Phe Glu Pro Cys Val Met Cys
835 840 845
Ala Gly Ala Met Ile His Ser Arg Ile Gly Arg Val Val Phe Gly Val
850 855 860
Arg Asn Ala Lys Thr Gly Ala Ala Gly Ser Leu Met Asp Val Leu His
865 870 875 880
Tyr Pro Gly Met Asn His Arg Val Glu Ile Thr Glu Gly Ile Leu Ala
885 890 895
Asp Glu Cys Ala Ala Leu Leu Cys Tyr Phe Phe Arg Met Pro Arg Gln
900 905 910
Val Phe Asn Ala Gln Lys Lys Ala Gln Ser Ser Thr Asp Lys Arg Pro
915 920 925
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
930 935 940
<210> 324
<211> 233
<212> DNA
<213> 人工序列
<220>
<223> 编码sgRNA的DNA序列,用于DYtarget2(T4GT6)
<400> 324
cttcactgat aaagtggaga accgcttcac caaaagctgt cccttagggg attagaactt 60
gagtgaaggt gggctgcttg catcagccta atgtcgagaa gtgctttctt cggaaagtaa 120
ccctcgaaac aaattcattt ttcctctcca attctgcaca agaaagttgc agaacccgaa 180
tagacgaatg aaggaatgca accacacaca cagtgggcta ccttttgttt ttt 233
<210> 325
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 反向引物,用于DYtarget2的sgRNA(T4GT6)
<400> 325
aaaaaacaaa aggtagccca ctgtgtgtgt ggttgcattc cttcattcgt ctattc 56
Claims (39)
1.一种用于CRISPR/Cas12f1系统的工程化的CRISPR RNA(crRNA),所述CRISPR/Cas12f1系统能够编辑包含靶序列的核酸,所述工程化的crRNA包含:
CRISPR RNA重复序列;
间隔序列,所述间隔序列与所述靶序列互补;以及
富含U的尾序列,所述富含U的尾序列连接至所述间隔序列的3'-末端,
其中,所述富含U的尾序列由(UaN)nUb表示,N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种,
a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数,并且
所述工程化的crRNA的序列包含所述CRISPR RNA重复序列、所述间隔序列和所述富含U的尾序列,它们以5'-3'的方向顺序连接。
2.一种核酸,所述核酸具有编码如权利要求1所述的工程化的crRNA的序列。
3.如权利要求1所述的工程化的crRNA,其中,所述富含U的尾序列为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。
4.一种用于CRISPR/Cas12f1系统的工程化的引导RNA,所述CRISPR/Cas12f1系统能够编辑包含靶序列的核酸,所述工程化的引导RNA具有包含如下的序列:
tracrRNA序列;
crRNA序列,所述crRNA序列包含CRISPR RNA重复序列以及间隔序列,所述间隔序列与所述靶序列互补;以及
富含U的尾序列,所述富含U的尾序列连接至所述CRISPR RNA序列的3'-末端,其中,所述富含U的尾序列由(UaN)nUb表示,N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
5.如权利要求4所述的工程化的引导RNA,其中,所述工程化的引导RNA进一步包含接头序列,其中,所述tracrRNA序列和所述crRNA序列通过所述接头序列连接。
6.如权利要求5所述的工程化的引导RNA,其中,所述接头序列为5'-gaaa-3'。
7.如权利要求4所述的工程化的引导RNA,其中,所述富含U的尾序列为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。
8.一种核酸,所述核酸具有编码如权利要求4-7中任一项所述的工程化的引导RNA的序列。
9.一种能够编辑包含靶序列的核酸的工程化CRISPR/Cas12f1复合体,所述工程化CRISPR/Cas12f1复合体包含:
Cas12f1蛋白,所述Cas12f1蛋白属于Cas14家族;以及
工程化的引导RNA,所述工程化的引导RNA包含支架序列、间隔序列和富含U的尾序列,
所述支架序列与所述Cas12f1蛋白相互作用,
所述间隔序列与所述靶序列互补,
其中,所述富含U的尾序列由(UaN)nUb表示,
N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种,并且
a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
10.一种用于表达工程化CRISPR/Cas12f1复合体的载体,所述工程化CRISPR/Cas12f1复合体能够编辑包含靶序列的核酸,所述载体包含:
第一序列,所述第一序列包含编码Cas12f1蛋白的序列;
第一启动子序列,所述第一启动子序列可操作地连接至所述第一序列;
第二序列,所述第二序列包含编码工程化的引导RNA的序列;以及
第二启动子序列,所述第二启动子序列可操作地连接至所述第二序列,
其中,所述工程化的引导RNA具有与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列以及连接至所述间隔序列的3'-末端的富含U的尾序列,所述富含U的尾序列由(UaN)nUb表示,N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数,
其中,所述载体被构建为表达所述Cas12f1蛋白和所述工程化的引导RNA,从而使所述Cas12f1蛋白和所述工程化的引导RNA在细胞中形成CRISPR/Cas12f1复合体,并通过所述CRISPR/Cas12f1复合体对包含所述靶序列的核酸进行编辑。
11.如权利要求10所述的载体,其中,所述第二启动子序列为U6启动子序列。
12.如权利要求10所述的载体,其中,所述载体为病毒载体。
13.如权利要求10所述的载体,其中,所述载体为质粒载体。
14.如权利要求12所述的载体,其中,所述载体为选自于由以下病毒所组成的组中的一种或多种:逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘病毒和单纯疱疹病毒。
15.如权利要求12所述的载体,其中,所述载体选自于痘苗病毒。
16.如权利要求10所述的载体,其中,所述载体为线性PCR扩增子。
17.一种用于表达工程化CRISPR/Cas12f1复合体的载体,所述工程化CRISPR/Cas12f1复合体能够编辑包含第一靶序列和第二靶序列的核酸,所述载体包含:
第一序列,所述第一序列包含编码Cas12f1蛋白的序列;
第一启动子序列,所述第一启动子序列可操作地连接至所述第一序列;
第二序列,所述第二序列包含编码第一工程化的引导RNA的序列,其中,所述第一工程化的引导RNA具有与所述Cas12f1蛋白相互作用的第一支架序列、与所述第一靶序列互补的第一间隔序列、以及第一富含U的尾序列,其中,所述第一富含U的尾序列由(UaN)nUb表示,N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数;以及
第二启动子序列,所述第二启动子序列可操作地连接至所述第二序列;
第三序列,所述第三序列包含编码第二工程化的引导RNA的序列,其中,所述第二工程化的引导RNA具有与所述Cas12f1蛋白相互作用的第二支架序列、与所述第二靶序列互补的第二间隔序列、以及第二富含U的尾序列,其中,所述第二富含U的尾序列由(UaN)nUb表示,N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数;以及
第三启动子序列,所述第三启动子可操作地连接至所述第三序列。
18.如权利要求17所述的载体,其中,所述第二启动子序列和所述第三启动子序列为相同的启动子序列。
19.如权利要求17所述的载体,其中,所述第二启动子序列为H1启动子序列,所述第三启动子序列为U6启动子序列。
20.一种在细胞中编辑包含靶序列的核酸的体外方法,所述方法包括:
将Cas12f1蛋白或编码所述Cas12f1蛋白的核酸和工程化的引导RNA或编码所述工程化的引导RNA的核酸递送至所述细胞内,从而使得
在所述细胞中形成CRISPR/Cas12f1复合体,以及
通过所述CRISPR/Cas12f1复合体对包含所述靶序列的核酸进行编辑,其中,所述工程化的引导RNA包含与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列、以及连接至所述间隔序列的3'-末端的富含U的尾序列,其中,所述富含U的尾序列由(UaN)nUb表示,N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
21.如权利要求20所述的方法,其中,在所述递送中,将所述Cas12f1蛋白和所述工程化的引导RNA以核糖核蛋白复合体的形式引入所述细胞中。
22.如权利要求20所述的方法,其中,在所述递送中,将包含编码所述Cas12f1蛋白的核酸和编码所述工程化的引导RNA的核酸的载体引入所述细胞中。
23.如权利要求22所述的方法,其中,所述载体为选自于由以下病毒所组成的组中的一种或多种:逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘病毒和单纯疱疹病毒。
24.如权利要求22所述的方法,其中,所述载体选自于痘苗病毒。
25.一种在细胞中编辑包含靶序列的核酸的体外方法,所述方法包括:
使CRISPR/Cas12f1复合体与包含所述靶序列的核酸接触,其中
所述CRISPR/Cas12f1复合体包含Cas12f1蛋白和工程化的引导RNA,
所述工程化的引导RNA包含与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列、以及富含U的尾序列,其中,所述富含U的尾序列由(UaN)nUb表示,N为腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G)中的一种,a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
26.一种工程化的CRISPR RNA(crRNA),所述工程化的crRNA以5'-3'的方向包含:
crRNA重复序列;
间隔序列,所述间隔序列与所述靶序列互补;以及
富含U的尾序列,
其中,所述crRNA重复序列为SEQ ID NO:58;以及,所述富含U的尾序列由下式表示:(UaN)nUb,N选自腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G),a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
27.如权利要求26所述的工程化的crRNA,其中,所述富含U的尾序列为UUUUUU、UUUUAUUUUUU或UUUUGUUUUUU。
28.一种核酸,所述核酸具有编码如权利要求26或27所述的工程化的crRNA的序列。
29.一种工程化的引导RNA,所述工程化的引导RNA包含:
tracrRNA序列;
如权利要求26或27所述的工程化的crRNA。
30.如权利要求29所述的工程化的引导RNA,其中,所述tracrRNA序列为SEQ ID NO:60。
31.一种核酸,所述核酸具有编码如权利要求29或30所述的工程化的引导RNA的序列。
32.一种包含如权利要求28或31所述的核酸的载体。
33.一种用于在细胞中编辑包含靶序列的核酸的体外方法,所述方法包括:
将如权利要求29或30所述的工程化的引导RNA或编码所述工程化的引导RNA的核酸递送至所述细胞内。
34.一种用于在细胞中编辑包含靶序列的核酸的组合物,所述组合物包含:
Cas12f1蛋白或编码所述Cas12f1蛋白的核酸,以及工程化的引导RNA或编码所述工程化的引导RNA的核酸,其中,所述Cas12f1蛋白和所述工程化的引导RNA形成CRISPR/Cas12f1复合体,并且通过所述CRISPR/Cas12f1复合体对所述核酸进行编辑,
其中,所述工程化的引导RNA包含与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列、以及连接至所述间隔序列的3'-末端的富含U的尾序列,
其中,所述富含U的尾序列由下式表示:(UaN)nUb,N选自腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G),a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
35.如权利要求34所述的组合物,其中,编码所述Cas12f1蛋白的核酸和/或编码所述工程化的引导RNA的核酸包含在载体中。
36.如权利要求35所述的组合物,其中,所述载体为选自于由以下所组成的组中的一种或多种:逆转录病毒、慢病毒、腺病毒、腺相关病毒、痘病毒和单纯疱疹病毒。
37.如权利要求35所述的组合物,其中,所述载体选自于痘苗病毒。
38.一种用于在细胞中编辑包含靶序列的核酸的组合物,所述组合物包含CRISPR/Cas12f1复合体,其中
所述CRISPR/Cas12f1复合体包含Cas12f1蛋白和工程化的引导RNA,
其中,所述工程化的引导RNA包含与所述Cas12f1蛋白相互作用的支架序列、与所述靶序列互补的间隔序列、以及富含U的尾序列,其中,所述富含U的尾序列由(UaN)nUb表示,其中,N选自腺苷(A)、尿苷(U)、胞苷(C)和鸟苷(G),a为1-4的整数,n为选自0、1和2的整数,b为1-10的整数。
39.一种用于在细胞中编辑包含靶序列的核酸的组合物,所述组合物包含如权利要求29或30所述的工程化的引导RNA或编码所述工程化的引导RNA的核酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190135935 | 2019-10-29 | ||
KR10-2019-0135935 | 2019-10-29 | ||
PCT/KR2020/014961 WO2021086083A2 (ko) | 2019-10-29 | 2020-10-29 | CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114846146A CN114846146A (zh) | 2022-08-02 |
CN114846146B true CN114846146B (zh) | 2024-04-12 |
Family
ID=75715490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080089323.6A Active CN114846146B (zh) | 2019-10-29 | 2020-10-29 | 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220307018A1 (zh) |
EP (1) | EP4053285A4 (zh) |
JP (1) | JP2023500188A (zh) |
KR (2) | KR102455623B1 (zh) |
CN (1) | CN114846146B (zh) |
WO (1) | WO2021086083A2 (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114846146B (zh) * | 2019-10-29 | 2024-04-12 | 基恩科雷有限责任公司 | 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途 |
WO2022240262A1 (ko) * | 2021-05-14 | 2022-11-17 | 주식회사 진코어 | Rna-guided nuclease를 이용한 lca10 치료용 조성물 및 치료방법 |
EP4355869A1 (en) * | 2021-06-17 | 2024-04-24 | Massachusetts Institute of Technology | Systems, methods, and compositions comprising miniature crispr nucleases for gene editing and programmable gene activation and inhibition |
KR20240133781A (ko) * | 2021-07-05 | 2024-09-04 | 주식회사 진코어 | 절단비활성 cas12f1, 절단비활성 cas12f1 기반 융합 단백질, 이를 포함하는 crispr 유전자 조절 시스템, 그 제조방법 및 용도 |
KR102703683B1 (ko) * | 2021-10-06 | 2024-09-09 | 주식회사 진코어 | 유전자 편집을 위한 TaRGET 시스템 및 이의 용도 |
WO2023153845A2 (ko) * | 2022-02-09 | 2023-08-17 | 주식회사 진코어 | 상동지정복구를 위한 target 시스템 및 이를 이용한 유전자 편집 방법 |
US20230265421A1 (en) * | 2022-02-21 | 2023-08-24 | Zhuhai Shu Tong Medical Technology Co., Ltd. | Type ii crispr/cas9 genome editing system and the application thereof |
WO2023168242A1 (en) | 2022-03-01 | 2023-09-07 | Epicrispr Biotechnologies, Inc. | Engineered nucleases, compositions, and methods of use thereof |
WO2023172115A1 (ko) * | 2022-03-10 | 2023-09-14 | 주식회사 진코어 | Nhej 복구 경로 조절을 통해 핵산 세그먼트의 결실 효율을 증가시키기 위한 조성물 및 방법 |
KR20230142365A (ko) * | 2022-03-30 | 2023-10-11 | 주식회사 진코어 | 어셔 증후군 치료를 위한 유전자 편집 시스템 |
WO2023229222A1 (ko) * | 2022-05-27 | 2023-11-30 | 주식회사 진코어 | 확장된 표적 범위를 갖는 엔지니어링된 cas12f 단백질 및 이의 용도 |
CN116622810B (zh) * | 2023-01-10 | 2024-06-28 | 南华大学 | 一种新型的工程化CRISPR-Cas14a1检测系统、方法及应用 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106460003A (zh) * | 2014-04-08 | 2017-02-22 | 北卡罗来纳州立大学 | 用于使用crispr相关基因rna引导阻遏转录的方法和组合物 |
WO2021086083A2 (ko) * | 2019-10-29 | 2021-05-06 | 주식회사 진코어 | CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3452499A2 (en) * | 2016-05-06 | 2019-03-13 | Juno Therapeutics, Inc. | Genetically engineered cells and methods of making the same |
JOP20190166A1 (ar) * | 2017-01-05 | 2019-07-02 | Univ Texas | استراتيجية مثلى من أجل تعديلات تخطي إكسون باستخدام crispr/cas9 مع متواليات توجيه ثلاثي |
WO2019046540A1 (en) * | 2017-08-31 | 2019-03-07 | New York Genome Center, Inc. | METHODS AND COMPOSITIONS COMPRISING CRISPR-CPF1 AND APPROVED GUIDING CRISPR RNAES FOR PROGRAMMABLE GENOMIC DELETIONS |
WO2019089808A1 (en) * | 2017-11-01 | 2019-05-09 | The Regents Of The University Of California | Class 2 crispr/cas compositions and methods of use |
SG11202003863VA (en) | 2017-11-01 | 2020-05-28 | Univ California | Casz compositions and methods of use |
WO2019103442A2 (ko) * | 2017-11-21 | 2019-05-31 | 한국생명공학연구원 | CRISPR/Cpf1 시스템을 이용한 유전체 편집용 조성물 및 이의 용도 |
JP2022514493A (ja) | 2018-12-14 | 2022-02-14 | パイオニア ハイ-ブレッド インターナショナル, インコーポレイテッド | ゲノム編集のための新規なcrispr-casシステム |
WO2022075808A1 (ko) * | 2020-10-08 | 2022-04-14 | 주식회사 진코어 | Crispr/cas12f1 시스템 효율화를 위한 u-rich tail을 포함하는 엔지니어링 된 가이드 rna 및 그 용도 |
EP4227412A1 (en) * | 2020-10-08 | 2023-08-16 | Genkore Inc | Engineered guide rna for increasing efficiency of crispr/cas12f1 (cas14a1) system, and use thereof |
-
2020
- 2020-10-29 CN CN202080089323.6A patent/CN114846146B/zh active Active
- 2020-10-29 EP EP20883082.8A patent/EP4053285A4/en active Pending
- 2020-10-29 JP JP2022520279A patent/JP2023500188A/ja active Pending
- 2020-10-29 WO PCT/KR2020/014961 patent/WO2021086083A2/ko unknown
- 2020-10-29 KR KR1020200142308A patent/KR102455623B1/ko active IP Right Grant
-
2022
- 2022-03-29 US US17/707,254 patent/US20220307018A1/en active Pending
- 2022-10-11 KR KR1020220129329A patent/KR20220141777A/ko not_active Application Discontinuation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106460003A (zh) * | 2014-04-08 | 2017-02-22 | 北卡罗来纳州立大学 | 用于使用crispr相关基因rna引导阻遏转录的方法和组合物 |
WO2021086083A2 (ko) * | 2019-10-29 | 2021-05-06 | 주식회사 진코어 | CRISPR/Cas12f1 시스템 효율화를 위한 엔지니어링 된 가이드 RNA 및 그 용도 |
Non-Patent Citations (3)
Title |
---|
"Highly efficient and safe genome editing by CRISPR-Cas12a using CRISPR RNA with a ribosyl-2′-O-methylated uridinylate-rich 3′-overhang in mouse zygotes";Dae-In Ha et al.;《nature》;第52卷(第11期);第1823-1830页 * |
"Highly efficient genome editing by CRISPR-Cpf1 using CRISPR RNA with a uridinylate-rich 3′-overhang";Su Bin Moon et al.;《nature communications》;第9卷(第1期);第1-11页 * |
"Programmed DNA destruction by miniature CRISPR-Cas14 enzymes";Lucas B Harrington et al.;《Science》;第362卷(第6416期);第839-842页 * |
Also Published As
Publication number | Publication date |
---|---|
EP4053285A2 (en) | 2022-09-07 |
WO2021086083A3 (ko) | 2021-06-24 |
EP4053285A4 (en) | 2024-06-19 |
CN114846146A (zh) | 2022-08-02 |
KR20210053228A (ko) | 2021-05-11 |
KR20220141777A (ko) | 2022-10-20 |
JP2023500188A (ja) | 2023-01-05 |
WO2021086083A2 (ko) | 2021-05-06 |
US20220307018A1 (en) | 2022-09-29 |
KR102455623B1 (ko) | 2022-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114846146B (zh) | 用于增加CRISPR/Cas12f1系统的效率的工程化引导RNA及其用途 | |
CN113286880A (zh) | 调控基因组的方法和组合物 | |
CN109790527A (zh) | 普氏菌属和弗朗西斯氏菌属的CRISPR1(Cpf1)的变体 | |
KR102690083B1 (ko) | CRISPR/Cas12f1 시스템 효율화를 위한 U-rich tail을 포함하는 엔지니어링 된 가이드 RNA 및 그 용도 | |
GB2617658A (en) | Class II, type V CRISPR systems | |
EP4227412A1 (en) | Engineered guide rna for increasing efficiency of crispr/cas12f1 (cas14a1) system, and use thereof | |
EP4227411A1 (en) | Engineered guide rna for increasing efficiency of crispr/cas12f1 system, and use of same | |
CN109152808A (zh) | 用于核酸序列的特异性靶向的二聚蛋白质 | |
CN116162609A (zh) | Cas13蛋白、CRISPR-Cas系统及其应用 | |
US20230374500A1 (en) | Engineered guide rna comprising u-rich tail for optimized crispr/cas12f1 system and use thereof | |
CN115052986A (zh) | 包含核酸酶的组合物及其用途 | |
KR102703683B1 (ko) | 유전자 편집을 위한 TaRGET 시스템 및 이의 용도 | |
KR20230007218A (ko) | 초소형 염기교정 시스템 및 이의 용도 | |
KR102638799B1 (ko) | CRISPR/Cas12f1(Cas14a1) system 효율화를 위한 engineered guide RNA 및 이의 용도 | |
CN116806261A (zh) | 用于增加CRISPR/Cas12f1系统的效率的经工程化的引导RNA及其用途 | |
KR20230121569A (ko) | 상동지정복구를 위한 TaRGET 시스템 및 이를 이용한 유전자 편집 방법 | |
JP5246904B2 (ja) | 外来遺伝子導入用ベクター及び外来遺伝子が導入されたベクターの製造方法 | |
CN116568806A (zh) | 用于增加crispr/cas12f1(cas14a1)系统的效率的经工程化的引导rna及其用途 | |
CN108977442B (zh) | 用于dna编辑的系统及其应用 | |
WO2024197086A1 (en) | Improved methods and compositions for crispr interference and activation | |
WO2024089629A1 (en) | Cas12 protein, crispr-cas system and uses thereof | |
WO2024121790A2 (en) | Cas12 protein, crispr-cas system and uses thereof | |
KR20240034661A (ko) | 캄필로박터 제주니 유래 Cas9의 가이드 RNA 구조변화를 통한 유전자교정 향상 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |