KR20230002611A - 세포 분류기 회로 및 그의 사용 방법 - Google Patents
세포 분류기 회로 및 그의 사용 방법 Download PDFInfo
- Publication number
- KR20230002611A KR20230002611A KR1020227039223A KR20227039223A KR20230002611A KR 20230002611 A KR20230002611 A KR 20230002611A KR 1020227039223 A KR1020227039223 A KR 1020227039223A KR 20227039223 A KR20227039223 A KR 20227039223A KR 20230002611 A KR20230002611 A KR 20230002611A
- Authority
- KR
- South Korea
- Prior art keywords
- target site
- leu
- mir
- asp
- ala
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 117
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 146
- 201000010099 disease Diseases 0.000 claims abstract description 58
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 58
- 238000001727 in vivo Methods 0.000 claims abstract description 41
- 230000008685 targeting Effects 0.000 claims abstract description 17
- 210000004027 cell Anatomy 0.000 claims description 405
- 102000040945 Transcription factor Human genes 0.000 claims description 234
- 108091023040 Transcription factor Proteins 0.000 claims description 234
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 207
- 102000040430 polynucleotide Human genes 0.000 claims description 198
- 108091033319 polynucleotide Proteins 0.000 claims description 198
- 239000002679 microRNA Substances 0.000 claims description 195
- 108091070501 miRNA Proteins 0.000 claims description 194
- 108091027981 Response element Proteins 0.000 claims description 189
- 150000007523 nucleic acids Chemical group 0.000 claims description 162
- 230000014509 gene expression Effects 0.000 claims description 155
- 108090000623 proteins and genes Proteins 0.000 claims description 121
- 206010028980 Neoplasm Diseases 0.000 claims description 103
- 108091006106 transcriptional activators Proteins 0.000 claims description 95
- 206010073071 hepatocellular carcinoma Diseases 0.000 claims description 88
- 231100000844 hepatocellular carcinoma Toxicity 0.000 claims description 83
- 230000001105 regulatory effect Effects 0.000 claims description 83
- 108091007772 MIRLET7C Proteins 0.000 claims description 79
- 239000013598 vector Substances 0.000 claims description 76
- 235000018102 proteins Nutrition 0.000 claims description 70
- 102000004169 proteins and genes Human genes 0.000 claims description 70
- 108091007780 MiR-122 Proteins 0.000 claims description 54
- 108091051828 miR-122 stem-loop Proteins 0.000 claims description 54
- 230000000694 effects Effects 0.000 claims description 44
- 108091062170 Mir-22 Proteins 0.000 claims description 40
- 108091083275 miR-26b stem-loop Proteins 0.000 claims description 40
- 230000003612 virological effect Effects 0.000 claims description 39
- 210000004185 liver Anatomy 0.000 claims description 37
- 239000000203 mixture Substances 0.000 claims description 33
- 239000012634 fragment Substances 0.000 claims description 31
- IRSCQMHQWWYFCW-UHFFFAOYSA-N ganciclovir Chemical compound O=C1NC(N)=NC2=C1N=CN2COC(CO)CO IRSCQMHQWWYFCW-UHFFFAOYSA-N 0.000 claims description 29
- 229940002612 prodrug Drugs 0.000 claims description 29
- 239000000651 prodrug Substances 0.000 claims description 29
- 201000011510 cancer Diseases 0.000 claims description 28
- 238000011144 upstream manufacturing Methods 0.000 claims description 27
- 108020005345 3' Untranslated Regions Proteins 0.000 claims description 24
- 108091071651 miR-208 stem-loop Proteins 0.000 claims description 23
- 108091084446 miR-208a stem-loop Proteins 0.000 claims description 23
- 108091062547 miR-208a-1 stem-loop Proteins 0.000 claims description 23
- 108091055375 miR-208a-2 stem-loop Proteins 0.000 claims description 23
- 108091035328 miR-217 stem-loop Proteins 0.000 claims description 23
- 108091039135 miR-217-1 stem-loop Proteins 0.000 claims description 23
- 108091029206 miR-217-2 stem-loop Proteins 0.000 claims description 23
- 210000002845 virion Anatomy 0.000 claims description 23
- 108091047268 miR-208b stem-loop Proteins 0.000 claims description 22
- 108091074368 miR-216 stem-loop Proteins 0.000 claims description 22
- 108091086642 miR-216a stem-loop Proteins 0.000 claims description 22
- 108091091807 let-7a stem-loop Proteins 0.000 claims description 21
- 108091057746 let-7a-4 stem-loop Proteins 0.000 claims description 21
- 108091028376 let-7a-5 stem-loop Proteins 0.000 claims description 21
- 108091024393 let-7a-6 stem-loop Proteins 0.000 claims description 21
- 108091091174 let-7a-7 stem-loop Proteins 0.000 claims description 21
- 108091007423 let-7b Proteins 0.000 claims description 21
- 108091033753 let-7d stem-loop Proteins 0.000 claims description 21
- 108091024449 let-7e stem-loop Proteins 0.000 claims description 21
- 108091044227 let-7e-1 stem-loop Proteins 0.000 claims description 21
- 108091071181 let-7e-2 stem-loop Proteins 0.000 claims description 21
- 108091063986 let-7f stem-loop Proteins 0.000 claims description 21
- 108091007427 let-7g Proteins 0.000 claims description 21
- 108091042844 let-7i stem-loop Proteins 0.000 claims description 21
- 108091028606 miR-1 stem-loop Proteins 0.000 claims description 21
- 230000001225 therapeutic effect Effects 0.000 claims description 21
- 108020003589 5' Untranslated Regions Proteins 0.000 claims description 20
- 102000004190 Enzymes Human genes 0.000 claims description 19
- 108090000790 Enzymes Proteins 0.000 claims description 19
- 241001465754 Metazoa Species 0.000 claims description 18
- 102000039446 nucleic acids Human genes 0.000 claims description 17
- 108020004707 nucleic acids Proteins 0.000 claims description 17
- 230000004936 stimulating effect Effects 0.000 claims description 17
- 210000000234 capsid Anatomy 0.000 claims description 16
- 230000002519 immonomodulatory effect Effects 0.000 claims description 14
- 108020004999 messenger RNA Proteins 0.000 claims description 13
- 206010052358 Colorectal cancer metastatic Diseases 0.000 claims description 12
- 241000282414 Homo sapiens Species 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 12
- 230000030833 cell death Effects 0.000 claims description 12
- 201000000582 Retinoblastoma Diseases 0.000 claims description 11
- 229960002963 ganciclovir Drugs 0.000 claims description 11
- 239000012212 insulator Substances 0.000 claims description 11
- 206010006187 Breast cancer Diseases 0.000 claims description 10
- 208000026310 Breast neoplasm Diseases 0.000 claims description 10
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 10
- 208000005017 glioblastoma Diseases 0.000 claims description 10
- 201000005202 lung cancer Diseases 0.000 claims description 10
- 208000020816 lung neoplasm Diseases 0.000 claims description 10
- 210000004881 tumor cell Anatomy 0.000 claims description 10
- 241000700605 Viruses Species 0.000 claims description 9
- 230000001404 mediated effect Effects 0.000 claims description 9
- 206010061289 metastatic neoplasm Diseases 0.000 claims description 9
- 208000024891 symptom Diseases 0.000 claims description 9
- 102000004127 Cytokines Human genes 0.000 claims description 8
- 108090000695 Cytokines Proteins 0.000 claims description 8
- 241000700584 Simplexvirus Species 0.000 claims description 7
- 239000003795 chemical substances by application Substances 0.000 claims description 7
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 7
- 241000711404 Avian avulavirus 1 Species 0.000 claims description 6
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 6
- 101710112752 Cytotoxin Proteins 0.000 claims description 6
- 108010042407 Endonucleases Proteins 0.000 claims description 6
- 241000124008 Mammalia Species 0.000 claims description 6
- 241000711975 Vesicular stomatitis virus Species 0.000 claims description 6
- 231100000599 cytotoxic agent Toxicity 0.000 claims description 6
- 239000002619 cytotoxin Substances 0.000 claims description 6
- 230000001747 exhibiting effect Effects 0.000 claims description 6
- 108091006047 fluorescent proteins Proteins 0.000 claims description 6
- 102000034287 fluorescent proteins Human genes 0.000 claims description 6
- 230000001939 inductive effect Effects 0.000 claims description 6
- 230000010076 replication Effects 0.000 claims description 6
- 108010001857 Cell Surface Receptors Proteins 0.000 claims description 5
- 108010071942 Colony-Stimulating Factors Proteins 0.000 claims description 5
- 102000007644 Colony-Stimulating Factors Human genes 0.000 claims description 5
- 108010052160 Site-specific recombinase Proteins 0.000 claims description 5
- 102000006601 Thymidine Kinase Human genes 0.000 claims description 5
- 108020004440 Thymidine kinase Proteins 0.000 claims description 5
- 230000000890 antigenic effect Effects 0.000 claims description 5
- 230000001973 epigenetic effect Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 claims description 5
- 230000009395 genetic defect Effects 0.000 claims description 5
- 102000006240 membrane receptors Human genes 0.000 claims description 5
- 239000003607 modifier Substances 0.000 claims description 5
- 244000052769 pathogen Species 0.000 claims description 5
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 5
- 235000004252 protein component Nutrition 0.000 claims description 5
- 241000702421 Dependoparvovirus Species 0.000 claims description 4
- 108700011259 MicroRNAs Proteins 0.000 claims description 4
- 102000001253 Protein Kinase Human genes 0.000 claims description 4
- 230000003213 activating effect Effects 0.000 claims description 4
- 239000000427 antigen Substances 0.000 claims description 4
- 108091007433 antigens Proteins 0.000 claims description 4
- 102000036639 antigens Human genes 0.000 claims description 4
- 239000003446 ligand Substances 0.000 claims description 4
- 229920001184 polypeptide Polymers 0.000 claims description 4
- 108060006633 protein kinase Proteins 0.000 claims description 4
- 230000004083 survival effect Effects 0.000 claims description 4
- 241000701161 unidentified adenovirus Species 0.000 claims description 4
- 241001529453 unidentified herpesvirus Species 0.000 claims description 4
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 3
- 241001164825 Adeno-associated virus - 8 Species 0.000 claims description 3
- 241000709687 Coxsackievirus Species 0.000 claims description 3
- 230000008836 DNA modification Effects 0.000 claims description 3
- 241000713666 Lentivirus Species 0.000 claims description 3
- 241001372913 Maraba virus Species 0.000 claims description 3
- 241000712079 Measles morbillivirus Species 0.000 claims description 3
- 241000125945 Protoparvovirus Species 0.000 claims description 3
- 241000702263 Reovirus sp. Species 0.000 claims description 3
- 241000837158 Senecavirus A Species 0.000 claims description 3
- 241000700618 Vaccinia virus Species 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 231100000252 nontoxic Toxicity 0.000 claims description 3
- 230000003000 nontoxic effect Effects 0.000 claims description 3
- 239000002243 precursor Substances 0.000 claims description 3
- 102000005962 receptors Human genes 0.000 claims description 3
- 108020003175 receptors Proteins 0.000 claims description 3
- 231100000167 toxic agent Toxicity 0.000 claims description 3
- 239000003440 toxic substance Substances 0.000 claims description 3
- 230000022534 cell killing Effects 0.000 claims description 2
- 239000003814 drug Substances 0.000 claims description 2
- 229940124597 therapeutic agent Drugs 0.000 claims description 2
- 102000004533 Endonucleases Human genes 0.000 claims 2
- 241000709661 Enterovirus Species 0.000 claims 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 1
- 229910052698 phosphorus Inorganic materials 0.000 claims 1
- 239000011574 phosphorus Substances 0.000 claims 1
- 238000012384 transportation and delivery Methods 0.000 abstract description 17
- 230000002068 genetic effect Effects 0.000 abstract description 13
- 230000001413 cellular effect Effects 0.000 abstract description 5
- 108020004414 DNA Proteins 0.000 description 68
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 38
- GHBSKQGCIYSCNS-NAKRPEOUSA-N Ala-Leu-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O GHBSKQGCIYSCNS-NAKRPEOUSA-N 0.000 description 37
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 35
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 29
- 210000003494 hepatocyte Anatomy 0.000 description 28
- 210000000056 organ Anatomy 0.000 description 26
- 108010050848 glycylleucine Proteins 0.000 description 25
- 241000588724 Escherichia coli Species 0.000 description 24
- 108010057821 leucylproline Proteins 0.000 description 23
- 241000699670 Mus sp. Species 0.000 description 22
- 238000005516 engineering process Methods 0.000 description 22
- 238000002347 injection Methods 0.000 description 21
- 239000007924 injection Substances 0.000 description 21
- 108091030938 miR-424 stem-loop Proteins 0.000 description 21
- 230000004044 response Effects 0.000 description 21
- 238000002560 therapeutic procedure Methods 0.000 description 19
- 239000013607 AAV vector Substances 0.000 description 18
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 18
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 18
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 18
- 229940090044 injection Drugs 0.000 description 18
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 17
- 230000004568 DNA-binding Effects 0.000 description 17
- 238000001415 gene therapy Methods 0.000 description 17
- 238000000338 in vitro Methods 0.000 description 17
- 238000011282 treatment Methods 0.000 description 17
- 108010087924 alanylproline Proteins 0.000 description 16
- 108010041407 alanylaspartic acid Proteins 0.000 description 15
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 15
- 239000002953 phosphate buffered saline Substances 0.000 description 15
- 102100022057 Hepatocyte nuclear factor 1-alpha Human genes 0.000 description 14
- 101001045751 Homo sapiens Hepatocyte nuclear factor 1-alpha Proteins 0.000 description 14
- 101000711846 Homo sapiens Transcription factor SOX-9 Proteins 0.000 description 14
- 102100034204 Transcription factor SOX-9 Human genes 0.000 description 14
- 238000013459 approach Methods 0.000 description 14
- 239000013612 plasmid Substances 0.000 description 14
- AWGBEIYZPAXXSX-RWMBFGLXSA-N Met-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N AWGBEIYZPAXXSX-RWMBFGLXSA-N 0.000 description 13
- 238000005415 bioluminescence Methods 0.000 description 13
- 230000029918 bioluminescence Effects 0.000 description 13
- 230000000295 complement effect Effects 0.000 description 13
- 229940088598 enzyme Drugs 0.000 description 13
- 238000002474 experimental method Methods 0.000 description 13
- 238000011156 evaluation Methods 0.000 description 12
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 12
- 230000005764 inhibitory process Effects 0.000 description 12
- 239000013603 viral vector Substances 0.000 description 12
- 108010034529 leucyl-lysine Proteins 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 230000035897 transcription Effects 0.000 description 11
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 10
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 10
- 229930182555 Penicillin Natural products 0.000 description 10
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 10
- CGBYDGAJHSOGFQ-LPEHRKFASA-N Pro-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 CGBYDGAJHSOGFQ-LPEHRKFASA-N 0.000 description 10
- 229940049954 penicillin Drugs 0.000 description 10
- QTENRWWVYAAPBI-YZTFXSNBSA-N Streptomycin sulfate Chemical compound OS(O)(=O)=O.OS(O)(=O)=O.OS(O)(=O)=O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@H]1[C@H](N=C(N)N)[C@@H](O)[C@H](N=C(N)N)[C@@H](O)[C@@H]1O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@H]1[C@H](N=C(N)N)[C@@H](O)[C@H](N=C(N)N)[C@@H](O)[C@@H]1O QTENRWWVYAAPBI-YZTFXSNBSA-N 0.000 description 9
- 108010093581 aspartyl-proline Proteins 0.000 description 9
- 108010077515 glycylproline Proteins 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- HJCMDXDYPOUFDY-WHFBIAKZSA-N Ala-Gln Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O HJCMDXDYPOUFDY-WHFBIAKZSA-N 0.000 description 8
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 8
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 8
- XVSJMWYYLHPDKY-DCAQKATOSA-N Leu-Asp-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O XVSJMWYYLHPDKY-DCAQKATOSA-N 0.000 description 8
- 108010079364 N-glycylalanine Proteins 0.000 description 8
- 230000000259 anti-tumor effect Effects 0.000 description 8
- 108010062796 arginyllysine Proteins 0.000 description 8
- 108010038633 aspartylglutamate Proteins 0.000 description 8
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- 108010061238 threonyl-glycine Proteins 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 7
- 108091028066 Mir-126 Proteins 0.000 description 7
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 7
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 7
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 7
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 108010049041 glutamylalanine Proteins 0.000 description 7
- 108010012581 phenylalanylglutamate Proteins 0.000 description 7
- 108010053725 prolylvaline Proteins 0.000 description 7
- 230000002829 reductive effect Effects 0.000 description 7
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 6
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 6
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 6
- 239000006285 cell suspension Substances 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 238000003384 imaging method Methods 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 210000000496 pancreas Anatomy 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 5
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 5
- 108090000565 Capsid Proteins Proteins 0.000 description 5
- 102100023321 Ceruloplasmin Human genes 0.000 description 5
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 5
- 241000880493 Leptailurus serval Species 0.000 description 5
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 5
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 5
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 5
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 5
- RRVCZCNFXIFGRA-DCAQKATOSA-N Leu-Pro-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RRVCZCNFXIFGRA-DCAQKATOSA-N 0.000 description 5
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 5
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 5
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 5
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 5
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 5
- -1 allopurinaol Chemical compound 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 108010013835 arginine glutamate Proteins 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010089804 glycyl-threonine Proteins 0.000 description 5
- 210000002216 heart Anatomy 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 210000003734 kidney Anatomy 0.000 description 5
- 230000036961 partial effect Effects 0.000 description 5
- 108010051242 phenylalanylserine Proteins 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- 108010071207 serylmethionine Proteins 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 230000026683 transduction Effects 0.000 description 5
- 238000010361 transduction Methods 0.000 description 5
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 5
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 4
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 4
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 4
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 4
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 4
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 4
- 102100031780 Endonuclease Human genes 0.000 description 4
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 4
- JWNZHMSRZXXGTM-XKBZYTNZSA-N Glu-Ser-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JWNZHMSRZXXGTM-XKBZYTNZSA-N 0.000 description 4
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 4
- 108010065920 Insulin Lispro Proteins 0.000 description 4
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 4
- DLFAACQHIRSQGG-CIUDSAMLSA-N Leu-Asp-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O DLFAACQHIRSQGG-CIUDSAMLSA-N 0.000 description 4
- CCQLQKZTXZBXTN-NHCYSSNCSA-N Leu-Gly-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CCQLQKZTXZBXTN-NHCYSSNCSA-N 0.000 description 4
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 4
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 4
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 4
- 108060001084 Luciferase Proteins 0.000 description 4
- 239000005089 Luciferase Substances 0.000 description 4
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 4
- IHCXPSYCHXFXKT-DCAQKATOSA-N Pro-Arg-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O IHCXPSYCHXFXKT-DCAQKATOSA-N 0.000 description 4
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 4
- 239000006146 Roswell Park Memorial Institute medium Substances 0.000 description 4
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 4
- 238000010459 TALEN Methods 0.000 description 4
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 4
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 108010047495 alanylglycine Proteins 0.000 description 4
- 108010070944 alanylhistidine Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 231100000673 dose–response relationship Toxicity 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 4
- 230000002601 intratumoral effect Effects 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 108010009298 lysylglutamic acid Proteins 0.000 description 4
- 230000010534 mechanism of action Effects 0.000 description 4
- 108091023084 miR-126 stem-loop Proteins 0.000 description 4
- 108091065272 miR-126-1 stem-loop Proteins 0.000 description 4
- 108091081187 miR-126-2 stem-loop Proteins 0.000 description 4
- 108091030790 miR-126-3 stem-loop Proteins 0.000 description 4
- 108091092317 miR-126-4 stem-loop Proteins 0.000 description 4
- 238000010172 mouse model Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 108010031719 prolyl-serine Proteins 0.000 description 4
- 108010048818 seryl-histidine Proteins 0.000 description 4
- 125000006850 spacer group Chemical group 0.000 description 4
- 210000000952 spleen Anatomy 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000004614 tumor growth Effects 0.000 description 4
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 3
- XUCHENWTTBFODJ-FXQIFTODSA-N Ala-Met-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O XUCHENWTTBFODJ-FXQIFTODSA-N 0.000 description 3
- SSQHYGLFYWZWDV-UVBJJODRSA-N Ala-Val-Trp Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O SSQHYGLFYWZWDV-UVBJJODRSA-N 0.000 description 3
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 3
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 3
- FFEUXEAKYRCACT-PEDHHIEDSA-N Arg-Ile-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(O)=O FFEUXEAKYRCACT-PEDHHIEDSA-N 0.000 description 3
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 3
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 3
- ULBHWNVWSCJLCO-NHCYSSNCSA-N Arg-Val-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N ULBHWNVWSCJLCO-NHCYSSNCSA-N 0.000 description 3
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 3
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 3
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 3
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 3
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 3
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 3
- PLOKOIJSGCISHE-BYULHYEWSA-N Asp-Val-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PLOKOIJSGCISHE-BYULHYEWSA-N 0.000 description 3
- JSYULGSPLTZDHM-NRPADANISA-N Gln-Ala-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O JSYULGSPLTZDHM-NRPADANISA-N 0.000 description 3
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 3
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 3
- DFRYZTUPVZNRLG-KKUMJFAQSA-N Gln-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DFRYZTUPVZNRLG-KKUMJFAQSA-N 0.000 description 3
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 3
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 3
- WATXSTJXNBOHKD-LAEOZQHASA-N Glu-Asp-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O WATXSTJXNBOHKD-LAEOZQHASA-N 0.000 description 3
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 3
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 3
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 3
- WNRZUESNGGDCJX-JYJNAYRXSA-N Glu-Leu-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WNRZUESNGGDCJX-JYJNAYRXSA-N 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 3
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 3
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 3
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 3
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 3
- 206010019695 Hepatic neoplasm Diseases 0.000 description 3
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 3
- 102100030690 Histone H2B type 1-C/E/F/G/I Human genes 0.000 description 3
- 101001084682 Homo sapiens Histone H2B type 1-C/E/F/G/I Proteins 0.000 description 3
- 101000664703 Homo sapiens Transcription factor SOX-10 Proteins 0.000 description 3
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 3
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 3
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 3
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 3
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 3
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 3
- KYIIALJHAOIAHF-KKUMJFAQSA-N Leu-Leu-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KYIIALJHAOIAHF-KKUMJFAQSA-N 0.000 description 3
- 108010063860 Leu-Ser-Glu-Ala-Leu Proteins 0.000 description 3
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 3
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 3
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 3
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 3
- WWEWGPOLIJXGNX-XUXIUFHCSA-N Lys-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N WWEWGPOLIJXGNX-XUXIUFHCSA-N 0.000 description 3
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 3
- HUKLXYYPZWPXCC-KZVJFYERSA-N Met-Ala-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HUKLXYYPZWPXCC-KZVJFYERSA-N 0.000 description 3
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 3
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 3
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 3
- RAGOJJCBGXARPO-XVSYOHENSA-N Phe-Thr-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RAGOJJCBGXARPO-XVSYOHENSA-N 0.000 description 3
- 229920002873 Polyethylenimine Polymers 0.000 description 3
- FCCBQBZXIAZNIG-LSJOCFKGSA-N Pro-Ala-His Chemical compound C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O FCCBQBZXIAZNIG-LSJOCFKGSA-N 0.000 description 3
- SFECXGVELZFBFJ-VEVYYDQMSA-N Pro-Asp-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SFECXGVELZFBFJ-VEVYYDQMSA-N 0.000 description 3
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 3
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 3
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 3
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 3
- LZHHZYDPMZEMRX-STQMWFEESA-N Pro-Tyr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O LZHHZYDPMZEMRX-STQMWFEESA-N 0.000 description 3
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 3
- 108010079005 RDV peptide Proteins 0.000 description 3
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 3
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 3
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 3
- LMMDEZPNUTZJAY-GCJQMDKQSA-N Thr-Asp-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O LMMDEZPNUTZJAY-GCJQMDKQSA-N 0.000 description 3
- ZUUDNCOCILSYAM-KKHAAJSZSA-N Thr-Asp-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ZUUDNCOCILSYAM-KKHAAJSZSA-N 0.000 description 3
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 3
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 3
- JAJOFWABAUKAEJ-QTKMDUPCSA-N Thr-Pro-His Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O JAJOFWABAUKAEJ-QTKMDUPCSA-N 0.000 description 3
- 101710195626 Transcriptional activator protein Proteins 0.000 description 3
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 3
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 3
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 3
- SDSCOOZQQGUQFC-GVXVVHGQSA-N Val-His-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N SDSCOOZQQGUQFC-GVXVVHGQSA-N 0.000 description 3
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 3
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 3
- 230000002411 adverse Effects 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 3
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 108010021908 aspartyl-aspartyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000009510 drug design Methods 0.000 description 3
- 230000004049 epigenetic modification Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000003197 gene knockdown Methods 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 3
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 3
- 108010087823 glycyltyrosine Proteins 0.000 description 3
- 108010085325 histidylproline Proteins 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 238000011081 inoculation Methods 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- NBQNWMBBSKPBAY-UHFFFAOYSA-N iodixanol Chemical compound IC=1C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C(I)C=1N(C(=O)C)CC(O)CN(C(C)=O)C1=C(I)C(C(=O)NCC(O)CO)=C(I)C(C(=O)NCC(O)CO)=C1I NBQNWMBBSKPBAY-UHFFFAOYSA-N 0.000 description 3
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 3
- 108010091871 leucylmethionine Proteins 0.000 description 3
- 208000014018 liver neoplasm Diseases 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 108091027963 non-coding RNA Proteins 0.000 description 3
- 102000042567 non-coding RNA Human genes 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 108010077112 prolyl-proline Proteins 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 230000002588 toxic effect Effects 0.000 description 3
- 238000003146 transient transfection Methods 0.000 description 3
- 210000003462 vein Anatomy 0.000 description 3
- PQFMROVJTOPVDF-JBDRJPRFSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]-4-carboxybutanoyl]amino]butanedioic acid Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O PQFMROVJTOPVDF-JBDRJPRFSA-N 0.000 description 2
- UZDMJOILBYFRMP-UHFFFAOYSA-N 2-[2-[2-[(2-amino-3-methylpentanoyl)amino]propanoylamino]propanoylamino]-3-methylpentanoic acid Chemical compound CCC(C)C(N)C(=O)NC(C)C(=O)NC(C)C(=O)NC(C(O)=O)C(C)CC UZDMJOILBYFRMP-UHFFFAOYSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 2
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 2
- PXKLCFFSVLKOJM-ACZMJKKPSA-N Ala-Asn-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PXKLCFFSVLKOJM-ACZMJKKPSA-N 0.000 description 2
- MKZCBYZBCINNJN-DLOVCJGASA-N Ala-Asp-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MKZCBYZBCINNJN-DLOVCJGASA-N 0.000 description 2
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 2
- NKJBKNVQHBZUIX-ACZMJKKPSA-N Ala-Gln-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKJBKNVQHBZUIX-ACZMJKKPSA-N 0.000 description 2
- UHMQKOBNPRAZGB-CIUDSAMLSA-N Ala-Glu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N UHMQKOBNPRAZGB-CIUDSAMLSA-N 0.000 description 2
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 2
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 2
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 2
- MQIGTEQXYCRLGK-BQBZGAKWSA-N Ala-Gly-Pro Chemical compound C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O MQIGTEQXYCRLGK-BQBZGAKWSA-N 0.000 description 2
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 2
- GSHKMNKPMLXSQW-KBIXCLLPSA-N Ala-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C)N GSHKMNKPMLXSQW-KBIXCLLPSA-N 0.000 description 2
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 2
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 2
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 2
- DCVYRWFAMZFSDA-ZLUOBGJFSA-N Ala-Ser-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DCVYRWFAMZFSDA-ZLUOBGJFSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 2
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- 208000031873 Animal Disease Models Diseases 0.000 description 2
- VBFJESQBIWCWRL-DCAQKATOSA-N Arg-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCNC(N)=N VBFJESQBIWCWRL-DCAQKATOSA-N 0.000 description 2
- DPXDVGDLWJYZBH-GUBZILKMSA-N Arg-Asn-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DPXDVGDLWJYZBH-GUBZILKMSA-N 0.000 description 2
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 2
- HKRXJBBCQBAGIM-FXQIFTODSA-N Arg-Asp-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N HKRXJBBCQBAGIM-FXQIFTODSA-N 0.000 description 2
- KBBKCNHWCDJPGN-GUBZILKMSA-N Arg-Gln-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KBBKCNHWCDJPGN-GUBZILKMSA-N 0.000 description 2
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 2
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 2
- NKBQZKVMKJJDLX-SRVKXCTJSA-N Arg-Glu-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NKBQZKVMKJJDLX-SRVKXCTJSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- PHHRSPBBQUFULD-UWVGGRQHSA-N Arg-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N PHHRSPBBQUFULD-UWVGGRQHSA-N 0.000 description 2
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 2
- FNXCAFKDGBROCU-STECZYCISA-N Arg-Ile-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FNXCAFKDGBROCU-STECZYCISA-N 0.000 description 2
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 2
- JEOCWTUOMKEEMF-RHYQMDGZSA-N Arg-Leu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEOCWTUOMKEEMF-RHYQMDGZSA-N 0.000 description 2
- CLICCYPMVFGUOF-IHRRRGAJSA-N Arg-Lys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O CLICCYPMVFGUOF-IHRRRGAJSA-N 0.000 description 2
- JOADBFCFJGNIKF-GUBZILKMSA-N Arg-Met-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O JOADBFCFJGNIKF-GUBZILKMSA-N 0.000 description 2
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 2
- CGWVCWFQGXOUSJ-ULQDDVLXSA-N Arg-Tyr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O CGWVCWFQGXOUSJ-ULQDDVLXSA-N 0.000 description 2
- KEZVOBAKAXHMOF-GUBZILKMSA-N Arg-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N KEZVOBAKAXHMOF-GUBZILKMSA-N 0.000 description 2
- JZRLLSOWDYUKOK-SRVKXCTJSA-N Asn-Asp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N JZRLLSOWDYUKOK-SRVKXCTJSA-N 0.000 description 2
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 2
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 2
- GZXOUBTUAUAVHD-ACZMJKKPSA-N Asn-Ser-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GZXOUBTUAUAVHD-ACZMJKKPSA-N 0.000 description 2
- WQAOZCVOOYUWKG-LSJOCFKGSA-N Asn-Val-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC(=O)N)N WQAOZCVOOYUWKG-LSJOCFKGSA-N 0.000 description 2
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 2
- HRGGPWBIMIQANI-GUBZILKMSA-N Asp-Gln-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HRGGPWBIMIQANI-GUBZILKMSA-N 0.000 description 2
- XAJRHVUUVUPFQL-ACZMJKKPSA-N Asp-Glu-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XAJRHVUUVUPFQL-ACZMJKKPSA-N 0.000 description 2
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 2
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 2
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 2
- YRBGRUOSJROZEI-NHCYSSNCSA-N Asp-His-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O YRBGRUOSJROZEI-NHCYSSNCSA-N 0.000 description 2
- SPWXXPFDTMYTRI-IUKAMOBKSA-N Asp-Ile-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SPWXXPFDTMYTRI-IUKAMOBKSA-N 0.000 description 2
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 2
- IVPNEDNYYYFAGI-GARJFASQSA-N Asp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N IVPNEDNYYYFAGI-GARJFASQSA-N 0.000 description 2
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 2
- YRZIYQGXTSBRLT-AVGNSLFASA-N Asp-Phe-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YRZIYQGXTSBRLT-AVGNSLFASA-N 0.000 description 2
- GWIJZUVQVDJHDI-AVGNSLFASA-N Asp-Phe-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O GWIJZUVQVDJHDI-AVGNSLFASA-N 0.000 description 2
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 2
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 2
- ITGFVUYOLWBPQW-KKHAAJSZSA-N Asp-Thr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ITGFVUYOLWBPQW-KKHAAJSZSA-N 0.000 description 2
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 2
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 2
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 2
- HHWQMFIGMMOVFK-WDSKDSINSA-N Gln-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O HHWQMFIGMMOVFK-WDSKDSINSA-N 0.000 description 2
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 2
- AAOBFSKXAVIORT-GUBZILKMSA-N Gln-Asn-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O AAOBFSKXAVIORT-GUBZILKMSA-N 0.000 description 2
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 2
- GNMQDOGFWYWPNM-LAEOZQHASA-N Gln-Gly-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)CNC(=O)[C@@H](N)CCC(N)=O)C(O)=O GNMQDOGFWYWPNM-LAEOZQHASA-N 0.000 description 2
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 2
- ZGHMRONFHDVXEF-AVGNSLFASA-N Gln-Ser-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZGHMRONFHDVXEF-AVGNSLFASA-N 0.000 description 2
- OACPJRQRAHMQEQ-NHCYSSNCSA-N Gln-Val-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OACPJRQRAHMQEQ-NHCYSSNCSA-N 0.000 description 2
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 2
- FLLRAEJOLZPSMN-CIUDSAMLSA-N Glu-Asn-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLLRAEJOLZPSMN-CIUDSAMLSA-N 0.000 description 2
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 2
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 2
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 2
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 2
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 2
- ZJFNRQHUIHKZJF-GUBZILKMSA-N Glu-His-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O ZJFNRQHUIHKZJF-GUBZILKMSA-N 0.000 description 2
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 2
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 2
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 2
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 2
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 2
- XEKAJTCACGEBOK-KKUMJFAQSA-N Glu-Met-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XEKAJTCACGEBOK-KKUMJFAQSA-N 0.000 description 2
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 2
- WZAYJXZPSJOXCP-QAETUUGQSA-N Glu-Phe-Gln-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCC(O)=O)N)CC1=CC=CC=C1 WZAYJXZPSJOXCP-QAETUUGQSA-N 0.000 description 2
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 2
- QNJNPKSWAHPYGI-JYJNAYRXSA-N Glu-Phe-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 QNJNPKSWAHPYGI-JYJNAYRXSA-N 0.000 description 2
- ZKONLKQGTNVAPR-DCAQKATOSA-N Glu-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)O)N ZKONLKQGTNVAPR-DCAQKATOSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 2
- PMSDOVISAARGAV-FHWLQOOXSA-N Glu-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 PMSDOVISAARGAV-FHWLQOOXSA-N 0.000 description 2
- KXRORHJIRAOQPG-SOUVJXGZSA-N Glu-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KXRORHJIRAOQPG-SOUVJXGZSA-N 0.000 description 2
- HQTDNEZTGZUWSY-XVKPBYJWSA-N Glu-Val-Gly Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCC(O)=O)C(=O)NCC(O)=O HQTDNEZTGZUWSY-XVKPBYJWSA-N 0.000 description 2
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 2
- YMUFWNJHVPQNQD-ZKWXMUAHSA-N Gly-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN YMUFWNJHVPQNQD-ZKWXMUAHSA-N 0.000 description 2
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 2
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 2
- UPOJUWHGMDJUQZ-IUCAKERBSA-N Gly-Arg-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UPOJUWHGMDJUQZ-IUCAKERBSA-N 0.000 description 2
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 2
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 2
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 2
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 2
- UTYGDAHJBBDPBA-BYULHYEWSA-N Gly-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN UTYGDAHJBBDPBA-BYULHYEWSA-N 0.000 description 2
- BHPQOIPBLYJNAW-NGZCFLSTSA-N Gly-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN BHPQOIPBLYJNAW-NGZCFLSTSA-N 0.000 description 2
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- JPAACTMBBBGAAR-HOTGVXAUSA-N Gly-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)CC(C)C)C(O)=O)=CNC2=C1 JPAACTMBBBGAAR-HOTGVXAUSA-N 0.000 description 2
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 2
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 2
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 2
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 2
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 2
- HUFUVTYGPOUCBN-MBLNEYKQSA-N Gly-Thr-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HUFUVTYGPOUCBN-MBLNEYKQSA-N 0.000 description 2
- GWNIGUKSRJBIHX-STQMWFEESA-N Gly-Tyr-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)CN)O GWNIGUKSRJBIHX-STQMWFEESA-N 0.000 description 2
- 102100022123 Hepatocyte nuclear factor 1-beta Human genes 0.000 description 2
- DZMVESFTHXSSPZ-XVYDVKMFSA-N His-Ala-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DZMVESFTHXSSPZ-XVYDVKMFSA-N 0.000 description 2
- LYSMQLXUCAKELQ-DCAQKATOSA-N His-Asp-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N LYSMQLXUCAKELQ-DCAQKATOSA-N 0.000 description 2
- RXVOMIADLXPJGW-GUBZILKMSA-N His-Asp-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RXVOMIADLXPJGW-GUBZILKMSA-N 0.000 description 2
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 2
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 2
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 2
- PUFNQIPSRXVLQJ-IHRRRGAJSA-N His-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N PUFNQIPSRXVLQJ-IHRRRGAJSA-N 0.000 description 2
- 101001045758 Homo sapiens Hepatocyte nuclear factor 1-beta Proteins 0.000 description 2
- 101000642514 Homo sapiens Transcription factor SOX-4 Proteins 0.000 description 2
- 241000700588 Human alphaherpesvirus 1 Species 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 2
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 2
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 2
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 2
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 2
- KIMHKBDJQQYLHU-PEFMBERDSA-N Ile-Glu-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N KIMHKBDJQQYLHU-PEFMBERDSA-N 0.000 description 2
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 2
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 2
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 2
- JHNJNTMTZHEDLJ-NAKRPEOUSA-N Ile-Ser-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O JHNJNTMTZHEDLJ-NAKRPEOUSA-N 0.000 description 2
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 2
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 2
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 2
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 2
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 2
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 2
- RFUBXQQFJFGJFV-GUBZILKMSA-N Leu-Asn-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RFUBXQQFJFGJFV-GUBZILKMSA-N 0.000 description 2
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 2
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 2
- PPBKJAQJAUHZKX-SRVKXCTJSA-N Leu-Cys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC(C)C PPBKJAQJAUHZKX-SRVKXCTJSA-N 0.000 description 2
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 2
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 2
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 2
- FMEICTQWUKNAGC-YUMQZZPRSA-N Leu-Gly-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O FMEICTQWUKNAGC-YUMQZZPRSA-N 0.000 description 2
- AUBMZAMQCOYSIC-MNXVOIDGSA-N Leu-Ile-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O AUBMZAMQCOYSIC-MNXVOIDGSA-N 0.000 description 2
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- WXZOHBVPVKABQN-DCAQKATOSA-N Leu-Met-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N WXZOHBVPVKABQN-DCAQKATOSA-N 0.000 description 2
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 2
- QMKFDEUJGYNFMC-AVGNSLFASA-N Leu-Pro-Arg Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QMKFDEUJGYNFMC-AVGNSLFASA-N 0.000 description 2
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 2
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 2
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 2
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 2
- LOGFVTREOLYCPF-RHYQMDGZSA-N Lys-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-RHYQMDGZSA-N 0.000 description 2
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 2
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 2
- 108010018650 MEF2 Transcription Factors Proteins 0.000 description 2
- YRAWWKUTNBILNT-FXQIFTODSA-N Met-Ala-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YRAWWKUTNBILNT-FXQIFTODSA-N 0.000 description 2
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 2
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 2
- XOMXAVJBLRROMC-IHRRRGAJSA-N Met-Asp-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XOMXAVJBLRROMC-IHRRRGAJSA-N 0.000 description 2
- OXHSZBRPUGNMKW-DCAQKATOSA-N Met-Gln-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OXHSZBRPUGNMKW-DCAQKATOSA-N 0.000 description 2
- FWTBMGAKKPSTBT-GUBZILKMSA-N Met-Gln-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FWTBMGAKKPSTBT-GUBZILKMSA-N 0.000 description 2
- STTRPDDKDVKIDF-KKUMJFAQSA-N Met-Glu-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 STTRPDDKDVKIDF-KKUMJFAQSA-N 0.000 description 2
- HZVXPUHLTZRQEL-UWVGGRQHSA-N Met-Leu-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O HZVXPUHLTZRQEL-UWVGGRQHSA-N 0.000 description 2
- LBNFTWKGISQVEE-AVGNSLFASA-N Met-Leu-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCSC LBNFTWKGISQVEE-AVGNSLFASA-N 0.000 description 2
- UDOYVQQKQHZYMB-DCAQKATOSA-N Met-Met-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDOYVQQKQHZYMB-DCAQKATOSA-N 0.000 description 2
- NTYQUVLERIHPMU-HRCADAONSA-N Met-Phe-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N NTYQUVLERIHPMU-HRCADAONSA-N 0.000 description 2
- PHKBGZKVOJCIMZ-SRVKXCTJSA-N Met-Pro-Arg Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PHKBGZKVOJCIMZ-SRVKXCTJSA-N 0.000 description 2
- XPVCDCMPKCERFT-GUBZILKMSA-N Met-Ser-Arg Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XPVCDCMPKCERFT-GUBZILKMSA-N 0.000 description 2
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 2
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 2
- 108091093189 Mir-375 Proteins 0.000 description 2
- 241001529936 Murinae Species 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 2
- UHRNIXJAGGLKHP-DLOVCJGASA-N Phe-Ala-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O UHRNIXJAGGLKHP-DLOVCJGASA-N 0.000 description 2
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 2
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 2
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 2
- XOHJOMKCRLHGCY-UNQGMJICSA-N Phe-Pro-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOHJOMKCRLHGCY-UNQGMJICSA-N 0.000 description 2
- AFNJAQVMTIQTCB-DLOVCJGASA-N Phe-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 AFNJAQVMTIQTCB-DLOVCJGASA-N 0.000 description 2
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 2
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 2
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 2
- LHALYDBUDCWMDY-CIUDSAMLSA-N Pro-Glu-Ala Chemical compound C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O LHALYDBUDCWMDY-CIUDSAMLSA-N 0.000 description 2
- NXEYSLRNNPWCRN-SRVKXCTJSA-N Pro-Glu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXEYSLRNNPWCRN-SRVKXCTJSA-N 0.000 description 2
- DMKWYMWNEKIPFC-IUCAKERBSA-N Pro-Gly-Arg Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O DMKWYMWNEKIPFC-IUCAKERBSA-N 0.000 description 2
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 2
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 2
- BODDREDDDRZUCF-QTKMDUPCSA-N Pro-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@@H]2CCCN2)O BODDREDDDRZUCF-QTKMDUPCSA-N 0.000 description 2
- XYHMFGGWNOFUOU-QXEWZRGKSA-N Pro-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H]1CCCN1 XYHMFGGWNOFUOU-QXEWZRGKSA-N 0.000 description 2
- LNOWDSPAYBWJOR-PEDHHIEDSA-N Pro-Ile-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LNOWDSPAYBWJOR-PEDHHIEDSA-N 0.000 description 2
- RPLMFKUKFZOTER-AVGNSLFASA-N Pro-Met-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@@H]1CCCN1 RPLMFKUKFZOTER-AVGNSLFASA-N 0.000 description 2
- FHZJRBVMLGOHBX-GUBZILKMSA-N Pro-Pro-Asp Chemical compound OC(=O)C[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H]1CCCN1)C(O)=O FHZJRBVMLGOHBX-GUBZILKMSA-N 0.000 description 2
- LEIKGVHQTKHOLM-IUCAKERBSA-N Pro-Pro-Gly Chemical compound OC(=O)CNC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 LEIKGVHQTKHOLM-IUCAKERBSA-N 0.000 description 2
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 2
- HRIXMVRZRGFKNQ-HJGDQZAQSA-N Pro-Thr-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HRIXMVRZRGFKNQ-HJGDQZAQSA-N 0.000 description 2
- GXWRTSIVLSQACD-RCWTZXSCSA-N Pro-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1)O GXWRTSIVLSQACD-RCWTZXSCSA-N 0.000 description 2
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 2
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 2
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 2
- CRZRTKAVUUGKEQ-ACZMJKKPSA-N Ser-Gln-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O CRZRTKAVUUGKEQ-ACZMJKKPSA-N 0.000 description 2
- ZOHGLPQGEHSLPD-FXQIFTODSA-N Ser-Gln-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZOHGLPQGEHSLPD-FXQIFTODSA-N 0.000 description 2
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 2
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 2
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- SFTZTYBXIXLRGQ-JBDRJPRFSA-N Ser-Ile-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SFTZTYBXIXLRGQ-JBDRJPRFSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- RQXDSYQXBCRXBT-GUBZILKMSA-N Ser-Met-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RQXDSYQXBCRXBT-GUBZILKMSA-N 0.000 description 2
- BSXKBOUZDAZXHE-CIUDSAMLSA-N Ser-Pro-Glu Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O BSXKBOUZDAZXHE-CIUDSAMLSA-N 0.000 description 2
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 2
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 2
- RTXKJFWHEBTABY-IHPCNDPISA-N Ser-Trp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)NC(=O)[C@H](CO)N RTXKJFWHEBTABY-IHPCNDPISA-N 0.000 description 2
- PCMZJFMUYWIERL-ZKWXMUAHSA-N Ser-Val-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PCMZJFMUYWIERL-ZKWXMUAHSA-N 0.000 description 2
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 2
- MFQMZDPAZRZAPV-NAKRPEOUSA-N Ser-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CO)N MFQMZDPAZRZAPV-NAKRPEOUSA-N 0.000 description 2
- ODRUTDLAONAVDV-IHRRRGAJSA-N Ser-Val-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ODRUTDLAONAVDV-IHRRRGAJSA-N 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 2
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 2
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- KBLYJPQSNGTDIU-LOKLDPHHSA-N Thr-Glu-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O KBLYJPQSNGTDIU-LOKLDPHHSA-N 0.000 description 2
- BNGDYRRHRGOPHX-IFFSRLJSSA-N Thr-Glu-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O BNGDYRRHRGOPHX-IFFSRLJSSA-N 0.000 description 2
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 2
- JKGGPMOUIAAJAA-YEPSODPASA-N Thr-Gly-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O JKGGPMOUIAAJAA-YEPSODPASA-N 0.000 description 2
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 2
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 2
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 2
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 2
- NDZYTIMDOZMECO-SHGPDSBTSA-N Thr-Thr-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O NDZYTIMDOZMECO-SHGPDSBTSA-N 0.000 description 2
- VBMOVTMNHWPZJR-SUSMZKCASA-N Thr-Thr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VBMOVTMNHWPZJR-SUSMZKCASA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 2
- VYVBSMCZNHOZGD-RCWTZXSCSA-N Thr-Val-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O VYVBSMCZNHOZGD-RCWTZXSCSA-N 0.000 description 2
- 102100038808 Transcription factor SOX-10 Human genes 0.000 description 2
- 102100036693 Transcription factor SOX-4 Human genes 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- HYNAKPYFEYJMAS-XIRDDKMYSA-N Trp-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HYNAKPYFEYJMAS-XIRDDKMYSA-N 0.000 description 2
- ARKBYVBCEOWRNR-UBHSHLNASA-N Trp-Ser-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O ARKBYVBCEOWRNR-UBHSHLNASA-N 0.000 description 2
- SSSDKJMQMZTMJP-BVSLBCMMSA-N Trp-Tyr-Val Chemical compound C([C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C2=CC=CC=C2NC=1)C1=CC=C(O)C=C1 SSSDKJMQMZTMJP-BVSLBCMMSA-N 0.000 description 2
- 102000004142 Trypsin Human genes 0.000 description 2
- 108090000631 Trypsin Proteins 0.000 description 2
- NMKJPMCEKQHRPD-IRXDYDNUSA-N Tyr-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 NMKJPMCEKQHRPD-IRXDYDNUSA-N 0.000 description 2
- QHLIUFUEUDFAOT-MGHWNKPDSA-N Tyr-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QHLIUFUEUDFAOT-MGHWNKPDSA-N 0.000 description 2
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 2
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 2
- SMKXLHVZIFKQRB-GUBZILKMSA-N Val-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](C(C)C)N SMKXLHVZIFKQRB-GUBZILKMSA-N 0.000 description 2
- SCBITHMBEJNRHC-LSJOCFKGSA-N Val-Asp-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C(C)C)C(=O)O)N SCBITHMBEJNRHC-LSJOCFKGSA-N 0.000 description 2
- CKTMJBPRVQWPHU-JSGCOSHPSA-N Val-Phe-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)O)N CKTMJBPRVQWPHU-JSGCOSHPSA-N 0.000 description 2
- VCIYTVOBLZHFSC-XHSDSOJGSA-N Val-Phe-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N2CCC[C@@H]2C(=O)O)N VCIYTVOBLZHFSC-XHSDSOJGSA-N 0.000 description 2
- YKNOJPJWNVHORX-UNQGMJICSA-N Val-Phe-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YKNOJPJWNVHORX-UNQGMJICSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- ZLMFVXMJFIWIRE-FHWLQOOXSA-N Val-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N ZLMFVXMJFIWIRE-FHWLQOOXSA-N 0.000 description 2
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 2
- NLNCNKIVJPEFBC-DLOVCJGASA-N Val-Val-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O NLNCNKIVJPEFBC-DLOVCJGASA-N 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 150000001413 amino acids Chemical group 0.000 description 2
- 238000011558 animal model by disease Methods 0.000 description 2
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 2
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 2
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000002659 cell therapy Methods 0.000 description 2
- 230000003833 cell viability Effects 0.000 description 2
- 230000003081 coactivator Effects 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 108010054812 diprotin A Proteins 0.000 description 2
- 230000005014 ectopic expression Effects 0.000 description 2
- 238000000799 fluorescence microscopy Methods 0.000 description 2
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 2
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 210000000987 immune system Anatomy 0.000 description 2
- 230000003308 immunostimulating effect Effects 0.000 description 2
- 239000007943 implant Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 229960004359 iodixanol Drugs 0.000 description 2
- 108010053037 kyotorphin Proteins 0.000 description 2
- 108091073704 let-7c stem-loop Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000013173 literature analysis Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000000464 low-speed centrifugation Methods 0.000 description 2
- 238000004020 luminiscence type Methods 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 108010068488 methionylphenylalanine Proteins 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 210000000663 muscle cell Anatomy 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- CPJSUEIXXCENMM-UHFFFAOYSA-N phenacetin Chemical compound CCOC1=CC=C(NC(C)=O)C=C1 CPJSUEIXXCENMM-UHFFFAOYSA-N 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000004445 quantitative analysis Methods 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000003393 splenic effect Effects 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 230000002195 synergetic effect Effects 0.000 description 2
- 229940124598 therapeutic candidate Drugs 0.000 description 2
- 239000012588 trypsin Substances 0.000 description 2
- 108010084932 tryptophyl-proline Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 238000000108 ultra-filtration Methods 0.000 description 2
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 2
- 108010073969 valyllysine Proteins 0.000 description 2
- HBOMLICNUCNMMY-XLPZGREQSA-N zidovudine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](N=[N+]=[N-])C1 HBOMLICNUCNMMY-XLPZGREQSA-N 0.000 description 2
- 229960002555 zidovudine Drugs 0.000 description 2
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- KXSKAZFMTGADIV-UHFFFAOYSA-N 2-[3-(2-hydroxyethoxy)propoxy]ethanol Chemical compound OCCOCCCOCCO KXSKAZFMTGADIV-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- PMXMIIMHBWHSKN-UHFFFAOYSA-N 3-{2-[4-(6-fluoro-1,2-benzoxazol-3-yl)piperidin-1-yl]ethyl}-9-hydroxy-2-methyl-6,7,8,9-tetrahydropyrido[1,2-a]pyrimidin-4-one Chemical compound FC1=CC=C2C(C3CCN(CC3)CCC=3C(=O)N4CCCC(O)C4=NC=3C)=NOC2=C1 PMXMIIMHBWHSKN-UHFFFAOYSA-N 0.000 description 1
- BGDLEQXJCCFSCU-UHFFFAOYSA-N 4-[[2-[(2-acetamido-4-methylpentanoyl)amino]-3-hydroxypropanoyl]amino]-5-[[1-[(1-amino-4-methyl-1-oxopentan-2-yl)amino]-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;2,2,2-trifluoroacetic acid Chemical compound OC(=O)C(F)(F)F.CC(C)CC(C(N)=O)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(CO)NC(=O)C(CC(C)C)NC(C)=O BGDLEQXJCCFSCU-UHFFFAOYSA-N 0.000 description 1
- SUBDBMMJDZJVOS-UHFFFAOYSA-N 5-methoxy-2-{[(4-methoxy-3,5-dimethylpyridin-2-yl)methyl]sulfinyl}-1H-benzimidazole Chemical compound N=1C2=CC(OC)=CC=C2NC=1S(=O)CC1=NC=C(C)C(OC)=C1C SUBDBMMJDZJVOS-UHFFFAOYSA-N 0.000 description 1
- 102100024379 AF4/FMR2 family member 1 Human genes 0.000 description 1
- 102100024387 AF4/FMR2 family member 3 Human genes 0.000 description 1
- 102100024381 AF4/FMR2 family member 4 Human genes 0.000 description 1
- 102100034580 AT-rich interactive domain-containing protein 1A Human genes 0.000 description 1
- 102100034571 AT-rich interactive domain-containing protein 1B Human genes 0.000 description 1
- 102100038507 AT-rich interactive domain-containing protein 3B Human genes 0.000 description 1
- 102100030835 AT-rich interactive domain-containing protein 5B Human genes 0.000 description 1
- 102000000872 ATM Human genes 0.000 description 1
- 101150020330 ATRX gene Proteins 0.000 description 1
- 102100033639 Acetylcholinesterase Human genes 0.000 description 1
- 108010022752 Acetylcholinesterase Proteins 0.000 description 1
- 102100030963 Activating transcription factor 7-interacting protein 1 Human genes 0.000 description 1
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 1
- 102100034540 Adenomatous polyposis coli protein Human genes 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- PBAMJJXWDQXOJA-FXQIFTODSA-N Ala-Asp-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PBAMJJXWDQXOJA-FXQIFTODSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- FOWHQTWRLFTELJ-FXQIFTODSA-N Ala-Asp-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N FOWHQTWRLFTELJ-FXQIFTODSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- OQCPATDFWYYDDX-HGNGGELXSA-N Ala-Gln-His Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OQCPATDFWYYDDX-HGNGGELXSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 1
- SFNFGFDRYJKZKN-XQXXSGGOSA-N Ala-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C)N)O SFNFGFDRYJKZKN-XQXXSGGOSA-N 0.000 description 1
- PWYFCPCBOYMOGB-LKTVYLICSA-N Ala-Gln-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N PWYFCPCBOYMOGB-LKTVYLICSA-N 0.000 description 1
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 1
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 1
- IFKQPMZRDQZSHI-GHCJXIJMSA-N Ala-Ile-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O IFKQPMZRDQZSHI-GHCJXIJMSA-N 0.000 description 1
- NMXKFWOEASXOGB-QSFUFRPTSA-N Ala-Ile-His Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NMXKFWOEASXOGB-QSFUFRPTSA-N 0.000 description 1
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- ZKEHTYWGPMMGBC-XUXIUFHCSA-N Ala-Leu-Leu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O ZKEHTYWGPMMGBC-XUXIUFHCSA-N 0.000 description 1
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- OMFMCIVBKCEMAK-CYDGBPFRSA-N Ala-Leu-Val-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O OMFMCIVBKCEMAK-CYDGBPFRSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- PMQXMXAASGFUDX-SRVKXCTJSA-N Ala-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCCN PMQXMXAASGFUDX-SRVKXCTJSA-N 0.000 description 1
- DWYROCSXOOMOEU-CIUDSAMLSA-N Ala-Met-Glu Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N DWYROCSXOOMOEU-CIUDSAMLSA-N 0.000 description 1
- XSTZMVAYYCJTNR-DCAQKATOSA-N Ala-Met-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O XSTZMVAYYCJTNR-DCAQKATOSA-N 0.000 description 1
- DRARURMRLANNLS-GUBZILKMSA-N Ala-Met-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O DRARURMRLANNLS-GUBZILKMSA-N 0.000 description 1
- IHMCQESUJVZTKW-UBHSHLNASA-N Ala-Phe-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 IHMCQESUJVZTKW-UBHSHLNASA-N 0.000 description 1
- FEGOCLZUJUFCHP-CIUDSAMLSA-N Ala-Pro-Gln Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FEGOCLZUJUFCHP-CIUDSAMLSA-N 0.000 description 1
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- UCDOXFBTMLKASE-HERUPUMHSA-N Ala-Ser-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N UCDOXFBTMLKASE-HERUPUMHSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- AAWLEICNDUHIJM-MBLNEYKQSA-N Ala-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C)N)O AAWLEICNDUHIJM-MBLNEYKQSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 1
- LYILPUNCKACNGF-NAKRPEOUSA-N Ala-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)N LYILPUNCKACNGF-NAKRPEOUSA-N 0.000 description 1
- 108010080691 Alcohol O-acetyltransferase Proteins 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 108700023418 Amidases Proteins 0.000 description 1
- 102100033895 Ankyrin repeat and SOCS box protein 15 Human genes 0.000 description 1
- 241000239290 Araneae Species 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- DFCIPNHFKOQAME-FXQIFTODSA-N Arg-Ala-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O DFCIPNHFKOQAME-FXQIFTODSA-N 0.000 description 1
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 1
- PEFFAAKJGBZBKL-NAKRPEOUSA-N Arg-Ala-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PEFFAAKJGBZBKL-NAKRPEOUSA-N 0.000 description 1
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- IASNWHAGGYTEKX-IUCAKERBSA-N Arg-Arg-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(O)=O IASNWHAGGYTEKX-IUCAKERBSA-N 0.000 description 1
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- HJWQFFYRVFEWRM-SRVKXCTJSA-N Arg-Arg-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O HJWQFFYRVFEWRM-SRVKXCTJSA-N 0.000 description 1
- YUIGJDNAGKJLDO-JYJNAYRXSA-N Arg-Arg-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YUIGJDNAGKJLDO-JYJNAYRXSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- MAISCYVJLBBRNU-DCAQKATOSA-N Arg-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N MAISCYVJLBBRNU-DCAQKATOSA-N 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- FEZJJKXNPSEYEV-CIUDSAMLSA-N Arg-Gln-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FEZJJKXNPSEYEV-CIUDSAMLSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 1
- SKTGPBFTMNLIHQ-KKUMJFAQSA-N Arg-Glu-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SKTGPBFTMNLIHQ-KKUMJFAQSA-N 0.000 description 1
- HPSVTWMFWCHKFN-GARJFASQSA-N Arg-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O HPSVTWMFWCHKFN-GARJFASQSA-N 0.000 description 1
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 1
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 1
- OCDJOVKIUJVUMO-SRVKXCTJSA-N Arg-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N OCDJOVKIUJVUMO-SRVKXCTJSA-N 0.000 description 1
- CRCCTGPNZUCAHE-DCAQKATOSA-N Arg-His-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 CRCCTGPNZUCAHE-DCAQKATOSA-N 0.000 description 1
- CVKOQHYVDVYJSI-QTKMDUPCSA-N Arg-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N)O CVKOQHYVDVYJSI-QTKMDUPCSA-N 0.000 description 1
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 1
- UHFUZWSZQKMDSX-DCAQKATOSA-N Arg-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N UHFUZWSZQKMDSX-DCAQKATOSA-N 0.000 description 1
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- URAUIUGLHBRPMF-NAKRPEOUSA-N Arg-Ser-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O URAUIUGLHBRPMF-NAKRPEOUSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- QUBKBPZGMZWOKQ-SZMVWBNQSA-N Arg-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 QUBKBPZGMZWOKQ-SZMVWBNQSA-N 0.000 description 1
- YHZQOSXDTFRZKU-WDSOQIARSA-N Arg-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 YHZQOSXDTFRZKU-WDSOQIARSA-N 0.000 description 1
- QMQZYILAWUOLPV-JYJNAYRXSA-N Arg-Tyr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)CC1=CC=C(O)C=C1 QMQZYILAWUOLPV-JYJNAYRXSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- 102100030907 Aryl hydrocarbon receptor nuclear translocator Human genes 0.000 description 1
- 102100027839 Aryl hydrocarbon receptor nuclear translocator 2 Human genes 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- AKEBUSZTMQLNIX-UWJYBYFXSA-N Asn-Ala-Tyr Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N AKEBUSZTMQLNIX-UWJYBYFXSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- KGCUOPPQTPZILL-CIUDSAMLSA-N Asn-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N KGCUOPPQTPZILL-CIUDSAMLSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- JREOBWLIZLXRIS-GUBZILKMSA-N Asn-Glu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JREOBWLIZLXRIS-GUBZILKMSA-N 0.000 description 1
- BKDDABUWNKGZCK-XHNCKOQMSA-N Asn-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N)C(=O)O BKDDABUWNKGZCK-XHNCKOQMSA-N 0.000 description 1
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 1
- IKLAUGBIDCDFOY-SRVKXCTJSA-N Asn-His-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O IKLAUGBIDCDFOY-SRVKXCTJSA-N 0.000 description 1
- JGIAYNNXZKKKOW-KKUMJFAQSA-N Asn-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)N)N JGIAYNNXZKKKOW-KKUMJFAQSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- MYVBTYXSWILFCG-BQBZGAKWSA-N Asn-Met-Gly Chemical compound CSCC[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC(=O)N)N MYVBTYXSWILFCG-BQBZGAKWSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- UWFOMGUWGPRVBW-GUBZILKMSA-N Asn-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N UWFOMGUWGPRVBW-GUBZILKMSA-N 0.000 description 1
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 1
- HPNDKUOLNRVRAY-BIIVOSGPSA-N Asn-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N)C(=O)O HPNDKUOLNRVRAY-BIIVOSGPSA-N 0.000 description 1
- GOPFMQJUQDLUFW-LKXGYXEUSA-N Asn-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O GOPFMQJUQDLUFW-LKXGYXEUSA-N 0.000 description 1
- HCZQKHSRYHCPSD-IUKAMOBKSA-N Asn-Thr-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HCZQKHSRYHCPSD-IUKAMOBKSA-N 0.000 description 1
- BIGRHVNFFJTHEB-UBHSHLNASA-N Asn-Trp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(O)=O BIGRHVNFFJTHEB-UBHSHLNASA-N 0.000 description 1
- YSYTWUMRHSFODC-QWRGUYRKSA-N Asn-Tyr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O YSYTWUMRHSFODC-QWRGUYRKSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- VTYQAQFKMQTKQD-ACZMJKKPSA-N Asp-Ala-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O VTYQAQFKMQTKQD-ACZMJKKPSA-N 0.000 description 1
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 1
- SLHOOKXYTYAJGQ-XVYDVKMFSA-N Asp-Ala-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CNC=N1 SLHOOKXYTYAJGQ-XVYDVKMFSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- VHWNKSJHQFZJTH-FXQIFTODSA-N Asp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N VHWNKSJHQFZJTH-FXQIFTODSA-N 0.000 description 1
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 1
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 1
- JHFNSBBHKSZXKB-VKHMYHEASA-N Asp-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(O)=O JHFNSBBHKSZXKB-VKHMYHEASA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- TZOZNVLBTAFJRW-UGYAYLCHSA-N Asp-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N TZOZNVLBTAFJRW-UGYAYLCHSA-N 0.000 description 1
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- KFAFUJMGHVVYRC-DCAQKATOSA-N Asp-Leu-Met Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O KFAFUJMGHVVYRC-DCAQKATOSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- XFQOQUWGVCVYON-DCAQKATOSA-N Asp-Met-His Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 XFQOQUWGVCVYON-DCAQKATOSA-N 0.000 description 1
- RRUWMFBLFLUZSI-LPEHRKFASA-N Asp-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N RRUWMFBLFLUZSI-LPEHRKFASA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- YFGUZQQCSDZRBN-DCAQKATOSA-N Asp-Pro-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O YFGUZQQCSDZRBN-DCAQKATOSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- HRVQDZOWMLFAOD-BIIVOSGPSA-N Asp-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N)C(=O)O HRVQDZOWMLFAOD-BIIVOSGPSA-N 0.000 description 1
- OZBXOELNJBSJOA-UBHSHLNASA-N Asp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N OZBXOELNJBSJOA-UBHSHLNASA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- XWKBWZXGNXTDKY-ZKWXMUAHSA-N Asp-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O XWKBWZXGNXTDKY-ZKWXMUAHSA-N 0.000 description 1
- GIKOVDMXBAFXDF-NHCYSSNCSA-N Asp-Val-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GIKOVDMXBAFXDF-NHCYSSNCSA-N 0.000 description 1
- 108010004586 Ataxia Telangiectasia Mutated Proteins Proteins 0.000 description 1
- 102100022718 Atypical chemokine receptor 2 Human genes 0.000 description 1
- 108700009171 B-Cell Lymphoma 3 Proteins 0.000 description 1
- 102100021570 B-cell lymphoma 3 protein Human genes 0.000 description 1
- 102100021631 B-cell lymphoma 6 protein Human genes 0.000 description 1
- 102100022976 B-cell lymphoma/leukemia 11A Human genes 0.000 description 1
- 102100022983 B-cell lymphoma/leukemia 11B Human genes 0.000 description 1
- 102100021247 BCL-6 corepressor Human genes 0.000 description 1
- 108700020463 BRCA1 Proteins 0.000 description 1
- 101150072950 BRCA1 gene Proteins 0.000 description 1
- 108700020462 BRCA2 Proteins 0.000 description 1
- 102000052609 BRCA2 Human genes 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 102100032423 Bcl-2-associated transcription factor 1 Human genes 0.000 description 1
- 101150072667 Bcl3 gene Proteins 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 101150008921 Brca2 gene Proteins 0.000 description 1
- 102100025401 Breast cancer type 1 susceptibility protein Human genes 0.000 description 1
- 102100021574 Bromodomain adjacent to zinc finger domain protein 2B Human genes 0.000 description 1
- 102100021743 Bromodomain and PHD finger-containing protein 3 Human genes 0.000 description 1
- 102100029897 Bromodomain-containing protein 7 Human genes 0.000 description 1
- 102100029896 Bromodomain-containing protein 8 Human genes 0.000 description 1
- 108010053652 Butyrylcholinesterase Proteins 0.000 description 1
- 102100024167 C-C chemokine receptor type 3 Human genes 0.000 description 1
- 101710149862 C-C chemokine receptor type 3 Proteins 0.000 description 1
- 102100028990 C-X-C chemokine receptor type 3 Human genes 0.000 description 1
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 1
- 238000011357 CAR T-cell therapy Methods 0.000 description 1
- 102100034808 CCAAT/enhancer-binding protein alpha Human genes 0.000 description 1
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 1
- 102100031033 CCR4-NOT transcription complex subunit 3 Human genes 0.000 description 1
- 102100021975 CREB-binding protein Human genes 0.000 description 1
- 102100040775 CREB-regulated transcription coactivator 1 Human genes 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 101000690445 Caenorhabditis elegans Aryl hydrocarbon receptor nuclear translocator homolog Proteins 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 102100038700 Calcium-responsive transactivator Human genes 0.000 description 1
- 102000013392 Carboxylesterase Human genes 0.000 description 1
- 108010051152 Carboxylesterase Proteins 0.000 description 1
- 102000005367 Carboxypeptidases Human genes 0.000 description 1
- 108010006303 Carboxypeptidases Proteins 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 102100028914 Catenin beta-1 Human genes 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102100032404 Cholinesterase Human genes 0.000 description 1
- 102100031235 Chromodomain-helicase-DNA-binding protein 1 Human genes 0.000 description 1
- 102100031265 Chromodomain-helicase-DNA-binding protein 2 Human genes 0.000 description 1
- 102100038214 Chromodomain-helicase-DNA-binding protein 4 Human genes 0.000 description 1
- 102100038220 Chromodomain-helicase-DNA-binding protein 6 Human genes 0.000 description 1
- 102100038215 Chromodomain-helicase-DNA-binding protein 7 Human genes 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102100031634 Cold shock domain-containing protein E1 Human genes 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- 108010043471 Core Binding Factor Alpha 2 Subunit Proteins 0.000 description 1
- 108010060313 Core Binding Factor beta Subunit Proteins 0.000 description 1
- 102000008147 Core Binding Factor beta Subunit Human genes 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 102100026359 Cyclic AMP-responsive element-binding protein 1 Human genes 0.000 description 1
- 102100039297 Cyclic AMP-responsive element-binding protein 3-like protein 1 Human genes 0.000 description 1
- CMSMOCZEIVJLDB-UHFFFAOYSA-N Cyclophosphamide Chemical compound ClCCN(CCCl)P1(=O)NCCCO1 CMSMOCZEIVJLDB-UHFFFAOYSA-N 0.000 description 1
- HRJLVSQKBLZHSR-ZLUOBGJFSA-N Cys-Asn-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O HRJLVSQKBLZHSR-ZLUOBGJFSA-N 0.000 description 1
- NIXHTNJAGGFBAW-CIUDSAMLSA-N Cys-Lys-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N NIXHTNJAGGFBAW-CIUDSAMLSA-N 0.000 description 1
- 102000000311 Cytosine Deaminase Human genes 0.000 description 1
- 108010080611 Cytosine Deaminase Proteins 0.000 description 1
- 101700026669 DACH1 Proteins 0.000 description 1
- 101700024220 DACH2 Proteins 0.000 description 1
- 101150077031 DAXX gene Proteins 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 102100021122 DNA damage-binding protein 2 Human genes 0.000 description 1
- 102100029145 DNA damage-inducible transcript 3 protein Human genes 0.000 description 1
- 102100031867 DNA excision repair protein ERCC-6 Human genes 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 102100022477 DNA repair protein complementing XP-C cells Human genes 0.000 description 1
- 102100032883 DNA-binding protein SATB2 Human genes 0.000 description 1
- 102100039436 DNA-binding protein inhibitor ID-3 Human genes 0.000 description 1
- 102100028735 Dachshund homolog 1 Human genes 0.000 description 1
- 102100025694 Dachshund homolog 2 Human genes 0.000 description 1
- 101100107081 Danio rerio zbtb16a gene Proteins 0.000 description 1
- 102100028559 Death domain-associated protein 6 Human genes 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101100226017 Dictyostelium discoideum repD gene Proteins 0.000 description 1
- 102100020743 Dipeptidase 1 Human genes 0.000 description 1
- 108090000204 Dipeptidase 1 Proteins 0.000 description 1
- 102100037928 Disco-interacting protein 2 homolog C Human genes 0.000 description 1
- 102100023227 E3 SUMO-protein ligase EGR2 Human genes 0.000 description 1
- 102100038662 E3 ubiquitin-protein ligase SMURF2 Human genes 0.000 description 1
- 102100029505 E3 ubiquitin-protein ligase TRIM33 Human genes 0.000 description 1
- 108010008795 ELAV-Like Protein 2 Proteins 0.000 description 1
- 102000007303 ELAV-Like Protein 2 Human genes 0.000 description 1
- 101150105460 ERCC2 gene Proteins 0.000 description 1
- 102100023792 ETS domain-containing protein Elk-4 Human genes 0.000 description 1
- 102100039563 ETS translocation variant 1 Human genes 0.000 description 1
- 102100039578 ETS translocation variant 4 Human genes 0.000 description 1
- 102100039577 ETS translocation variant 5 Human genes 0.000 description 1
- 102100035079 ETS-related transcription factor Elf-3 Human genes 0.000 description 1
- 102100039247 ETS-related transcription factor Elf-4 Human genes 0.000 description 1
- 102100030801 Elongation factor 1-alpha 1 Human genes 0.000 description 1
- 102100037114 Elongin-C Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010061435 Enalapril Proteins 0.000 description 1
- 102100031785 Endothelial transcription factor GATA-2 Human genes 0.000 description 1
- 102100031948 Enhancer of polycomb homolog 1 Human genes 0.000 description 1
- 102100031690 Erythroid transcription factor Human genes 0.000 description 1
- 102100038595 Estrogen receptor Human genes 0.000 description 1
- 102100030667 Eukaryotic peptide chain release factor subunit 1 Human genes 0.000 description 1
- 108091007413 Extracellular RNA Proteins 0.000 description 1
- 102100030910 Eyes absent homolog 4 Human genes 0.000 description 1
- 102100034553 Fanconi anemia group J protein Human genes 0.000 description 1
- 102100036118 Far upstream element-binding protein 1 Human genes 0.000 description 1
- 102100036123 Far upstream element-binding protein 2 Human genes 0.000 description 1
- 108090000331 Firefly luciferases Proteins 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 108010010285 Forkhead Box Protein L2 Proteins 0.000 description 1
- 102100037042 Forkhead box protein E1 Human genes 0.000 description 1
- 102100035137 Forkhead box protein L2 Human genes 0.000 description 1
- 102100028122 Forkhead box protein P1 Human genes 0.000 description 1
- 102100027570 Forkhead box protein Q1 Human genes 0.000 description 1
- 102100036334 Fragile X mental retardation syndrome-related protein 1 Human genes 0.000 description 1
- 102100030334 Friend leukemia integration 1 transcription factor Human genes 0.000 description 1
- 101001077417 Gallus gallus Potassium voltage-gated channel subfamily H member 6 Proteins 0.000 description 1
- 102100031885 General transcription and DNA repair factor IIH helicase subunit XPB Human genes 0.000 description 1
- 102100035184 General transcription and DNA repair factor IIH helicase subunit XPD Human genes 0.000 description 1
- 102100038073 General transcription factor II-I Human genes 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 102100033295 Glial cell line-derived neurotrophic factor Human genes 0.000 description 1
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 1
- SOBBAYVQSNXYPQ-ACZMJKKPSA-N Gln-Asn-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SOBBAYVQSNXYPQ-ACZMJKKPSA-N 0.000 description 1
- OFPWCBGRYAOLMU-AVGNSLFASA-N Gln-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O OFPWCBGRYAOLMU-AVGNSLFASA-N 0.000 description 1
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 1
- QYKBTDOAMKORGL-FXQIFTODSA-N Gln-Gln-Asp Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N QYKBTDOAMKORGL-FXQIFTODSA-N 0.000 description 1
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 1
- JHPFPROFOAJRFN-IHRRRGAJSA-N Gln-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N)O JHPFPROFOAJRFN-IHRRRGAJSA-N 0.000 description 1
- LVSYIKGMLRHKME-IUCAKERBSA-N Gln-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N LVSYIKGMLRHKME-IUCAKERBSA-N 0.000 description 1
- KQOPMGBHNQBCEL-HVTMNAMFSA-N Gln-His-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KQOPMGBHNQBCEL-HVTMNAMFSA-N 0.000 description 1
- HDUDGCZEOZEFOA-KBIXCLLPSA-N Gln-Ile-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HDUDGCZEOZEFOA-KBIXCLLPSA-N 0.000 description 1
- JXBZEDIQFFCHPZ-PEFMBERDSA-N Gln-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JXBZEDIQFFCHPZ-PEFMBERDSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 1
- XBWGJWXGUNSZAT-CIUDSAMLSA-N Gln-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N XBWGJWXGUNSZAT-CIUDSAMLSA-N 0.000 description 1
- SWDSRANUCKNBLA-AVGNSLFASA-N Gln-Phe-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SWDSRANUCKNBLA-AVGNSLFASA-N 0.000 description 1
- HHRAEXBUNGTOGZ-IHRRRGAJSA-N Gln-Phe-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O HHRAEXBUNGTOGZ-IHRRRGAJSA-N 0.000 description 1
- FNAJNWPDTIXYJN-CIUDSAMLSA-N Gln-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O FNAJNWPDTIXYJN-CIUDSAMLSA-N 0.000 description 1
- HMIXCETWRYDVMO-GUBZILKMSA-N Gln-Pro-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O HMIXCETWRYDVMO-GUBZILKMSA-N 0.000 description 1
- YPFFHGRJCUBXPX-NHCYSSNCSA-N Gln-Pro-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O)C(O)=O YPFFHGRJCUBXPX-NHCYSSNCSA-N 0.000 description 1
- OKQLXOYFUPVEHI-CIUDSAMLSA-N Gln-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N OKQLXOYFUPVEHI-CIUDSAMLSA-N 0.000 description 1
- UEILCTONAMOGBR-RWRJDSDZSA-N Gln-Thr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UEILCTONAMOGBR-RWRJDSDZSA-N 0.000 description 1
- NHMRJKKAVMENKJ-WDCWCFNPSA-N Gln-Thr-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NHMRJKKAVMENKJ-WDCWCFNPSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- YMCPEHDGTRUOHO-SXNHZJKMSA-N Gln-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CCC(=O)N)N YMCPEHDGTRUOHO-SXNHZJKMSA-N 0.000 description 1
- YLABFXCRQQMMHS-AVGNSLFASA-N Gln-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YLABFXCRQQMMHS-AVGNSLFASA-N 0.000 description 1
- VCUNGPMMPNJSGS-JYJNAYRXSA-N Gln-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O VCUNGPMMPNJSGS-JYJNAYRXSA-N 0.000 description 1
- ZZLDMBMFKZFQMU-NRPADANISA-N Gln-Val-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O ZZLDMBMFKZFQMU-NRPADANISA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- IESFZVCAVACGPH-PEFMBERDSA-N Glu-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O IESFZVCAVACGPH-PEFMBERDSA-N 0.000 description 1
- GFLQTABMFBXRIY-GUBZILKMSA-N Glu-Gln-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GFLQTABMFBXRIY-GUBZILKMSA-N 0.000 description 1
- CLROYXHHUZELFX-FXQIFTODSA-N Glu-Gln-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CLROYXHHUZELFX-FXQIFTODSA-N 0.000 description 1
- GYCPQVFKCPPRQB-GUBZILKMSA-N Glu-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N GYCPQVFKCPPRQB-GUBZILKMSA-N 0.000 description 1
- VFZIDQZAEBORGY-GLLZPBPUSA-N Glu-Gln-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VFZIDQZAEBORGY-GLLZPBPUSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 1
- QJCKNLPMTPXXEM-AUTRQRHGSA-N Glu-Glu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O QJCKNLPMTPXXEM-AUTRQRHGSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- CAVMESABQIKFKT-IUCAKERBSA-N Glu-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N CAVMESABQIKFKT-IUCAKERBSA-N 0.000 description 1
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 1
- ZMVCLTGPGWJAEE-JYJNAYRXSA-N Glu-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)O ZMVCLTGPGWJAEE-JYJNAYRXSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 1
- DWBBKNPKDHXIAC-SRVKXCTJSA-N Glu-Leu-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCC(O)=O DWBBKNPKDHXIAC-SRVKXCTJSA-N 0.000 description 1
- UGSVSNXPJJDJKL-SDDRHHMPSA-N Glu-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UGSVSNXPJJDJKL-SDDRHHMPSA-N 0.000 description 1
- UMHRCVCZUPBBQW-GARJFASQSA-N Glu-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)O)N UMHRCVCZUPBBQW-GARJFASQSA-N 0.000 description 1
- YTRBQAQSUDSIQE-FHWLQOOXSA-N Glu-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 YTRBQAQSUDSIQE-FHWLQOOXSA-N 0.000 description 1
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 1
- QJVZSVUYZFYLFQ-CIUDSAMLSA-N Glu-Pro-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O QJVZSVUYZFYLFQ-CIUDSAMLSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 1
- BFEZQZKEPRKKHV-SRVKXCTJSA-N Glu-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O BFEZQZKEPRKKHV-SRVKXCTJSA-N 0.000 description 1
- WIKMTDVSCUJIPJ-CIUDSAMLSA-N Glu-Ser-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WIKMTDVSCUJIPJ-CIUDSAMLSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- VXEFAWJTFAUDJK-AVGNSLFASA-N Glu-Tyr-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O VXEFAWJTFAUDJK-AVGNSLFASA-N 0.000 description 1
- FVGOGEGGQLNZGH-DZKIICNBSA-N Glu-Val-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FVGOGEGGQLNZGH-DZKIICNBSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- 102000053187 Glucuronidase Human genes 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- BGVYNAQWHSTTSP-BYULHYEWSA-N Gly-Asn-Ile Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BGVYNAQWHSTTSP-BYULHYEWSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- BPQYBFAXRGMGGY-LAEOZQHASA-N Gly-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN BPQYBFAXRGMGGY-LAEOZQHASA-N 0.000 description 1
- JUGQPPOVWXSPKJ-RYUDHWBXSA-N Gly-Gln-Phe Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JUGQPPOVWXSPKJ-RYUDHWBXSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- XTQFHTHIAKKCTM-YFKPBYRVSA-N Gly-Glu-Gly Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O XTQFHTHIAKKCTM-YFKPBYRVSA-N 0.000 description 1
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 1
- QSVCIFZPGLOZGH-WDSKDSINSA-N Gly-Glu-Ser Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O QSVCIFZPGLOZGH-WDSKDSINSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- HPAIKDPJURGQLN-KBPBESRZSA-N Gly-His-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 HPAIKDPJURGQLN-KBPBESRZSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- LOEANKRDMMVOGZ-YUMQZZPRSA-N Gly-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O LOEANKRDMMVOGZ-YUMQZZPRSA-N 0.000 description 1
- PTIIBFKSLCYQBO-NHCYSSNCSA-N Gly-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)CN PTIIBFKSLCYQBO-NHCYSSNCSA-N 0.000 description 1
- OQQKUTVULYLCDG-ONGXEEELSA-N Gly-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)CN)C(O)=O OQQKUTVULYLCDG-ONGXEEELSA-N 0.000 description 1
- SJLKKOZFHSJJAW-YUMQZZPRSA-N Gly-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)CN SJLKKOZFHSJJAW-YUMQZZPRSA-N 0.000 description 1
- HHRODZSXDXMUHS-LURJTMIESA-N Gly-Met-Gly Chemical compound CSCC[C@H](NC(=O)C[NH3+])C(=O)NCC([O-])=O HHRODZSXDXMUHS-LURJTMIESA-N 0.000 description 1
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 1
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 1
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 1
- YYXJFBMCOUSYSF-RYUDHWBXSA-N Gly-Phe-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYXJFBMCOUSYSF-RYUDHWBXSA-N 0.000 description 1
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 1
- IXHQLZIWBCQBLQ-STQMWFEESA-N Gly-Pro-Phe Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IXHQLZIWBCQBLQ-STQMWFEESA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- FKESCSGWBPUTPN-FOHZUACHSA-N Gly-Thr-Asn Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O FKESCSGWBPUTPN-FOHZUACHSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 1
- LLWQVJNHMYBLLK-CDMKHQONSA-N Gly-Thr-Phe Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LLWQVJNHMYBLLK-CDMKHQONSA-N 0.000 description 1
- UIQGJYUEQDOODF-KWQFWETISA-N Gly-Tyr-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 UIQGJYUEQDOODF-KWQFWETISA-N 0.000 description 1
- IHDKKJVBLGXLEL-STQMWFEESA-N Gly-Tyr-Met Chemical compound CSCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)CN)C(O)=O IHDKKJVBLGXLEL-STQMWFEESA-N 0.000 description 1
- ZVXMEWXHFBYJPI-LSJOCFKGSA-N Gly-Val-Ile Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZVXMEWXHFBYJPI-LSJOCFKGSA-N 0.000 description 1
- 102000001398 Granzyme Human genes 0.000 description 1
- 108060005986 Granzyme Proteins 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 101150101189 HCC gene Proteins 0.000 description 1
- 108700039143 HMGA2 Proteins 0.000 description 1
- 108010081348 HRT1 protein Hairy Proteins 0.000 description 1
- 102100021881 Hairy/enhancer-of-split related with YRPW motif protein 1 Human genes 0.000 description 1
- 239000012981 Hank's balanced salt solution Substances 0.000 description 1
- 102100031880 Helicase SRCAP Human genes 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 102100024001 Hepatic leukemia factor Human genes 0.000 description 1
- 102100029283 Hepatocyte nuclear factor 3-alpha Human genes 0.000 description 1
- 102100029009 High mobility group protein HMG-I/HMG-Y Human genes 0.000 description 1
- 102100028999 High mobility group protein HMGI-C Human genes 0.000 description 1
- 238000012893 Hill function Methods 0.000 description 1
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 1
- YPLYIXGKCRQZGW-SRVKXCTJSA-N His-Arg-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YPLYIXGKCRQZGW-SRVKXCTJSA-N 0.000 description 1
- TTZAWSKKNCEINZ-AVGNSLFASA-N His-Arg-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O TTZAWSKKNCEINZ-AVGNSLFASA-N 0.000 description 1
- ZZLWLWSUIBSMNP-CIUDSAMLSA-N His-Asp-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZZLWLWSUIBSMNP-CIUDSAMLSA-N 0.000 description 1
- FMRKUXFLLPKVPG-JYJNAYRXSA-N His-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)O FMRKUXFLLPKVPG-JYJNAYRXSA-N 0.000 description 1
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 1
- OSZUPUINVNPCOE-SDDRHHMPSA-N His-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O OSZUPUINVNPCOE-SDDRHHMPSA-N 0.000 description 1
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 1
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 1
- QMUHTRISZMFKAY-MXAVVETBSA-N His-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N QMUHTRISZMFKAY-MXAVVETBSA-N 0.000 description 1
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 1
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- WPUAVVXYEJAWIV-KKUMJFAQSA-N His-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N WPUAVVXYEJAWIV-KKUMJFAQSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- PYNPBMCLAKTHJL-SRVKXCTJSA-N His-Pro-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O PYNPBMCLAKTHJL-SRVKXCTJSA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 1
- YBDOQKVAGTWZMI-XIRDDKMYSA-N His-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N YBDOQKVAGTWZMI-XIRDDKMYSA-N 0.000 description 1
- PZUZIHRPOVVHOT-KBPBESRZSA-N His-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CN=CN1 PZUZIHRPOVVHOT-KBPBESRZSA-N 0.000 description 1
- CMPHFUWXKBPNRS-WDSOQIARSA-N His-Val-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CNC=N1 CMPHFUWXKBPNRS-WDSOQIARSA-N 0.000 description 1
- 102100039855 Histone H1.2 Human genes 0.000 description 1
- 102100027368 Histone H1.3 Human genes 0.000 description 1
- 102100027369 Histone H1.4 Human genes 0.000 description 1
- 102100022653 Histone H1.5 Human genes 0.000 description 1
- 102100030689 Histone H2B type 1-D Human genes 0.000 description 1
- 102100038885 Histone acetyltransferase p300 Human genes 0.000 description 1
- 102100038720 Histone deacetylase 9 Human genes 0.000 description 1
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 description 1
- 102100029234 Histone-lysine N-methyltransferase NSD2 Human genes 0.000 description 1
- 102100029235 Histone-lysine N-methyltransferase NSD3 Human genes 0.000 description 1
- 102100024594 Histone-lysine N-methyltransferase PRDM16 Human genes 0.000 description 1
- 102100029144 Histone-lysine N-methyltransferase PRDM9 Human genes 0.000 description 1
- 102100029239 Histone-lysine N-methyltransferase, H3 lysine-36 specific Human genes 0.000 description 1
- 102100039489 Histone-lysine N-methyltransferase, H3 lysine-79 specific Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101150073387 Hmga2 gene Proteins 0.000 description 1
- 102100031670 Homeobox protein CDX-4 Human genes 0.000 description 1
- 102100030308 Homeobox protein Hox-A11 Human genes 0.000 description 1
- 102100030307 Homeobox protein Hox-A13 Human genes 0.000 description 1
- 102100022650 Homeobox protein Hox-A7 Human genes 0.000 description 1
- 102100021090 Homeobox protein Hox-A9 Human genes 0.000 description 1
- 102100020766 Homeobox protein Hox-C11 Human genes 0.000 description 1
- 102100020761 Homeobox protein Hox-C13 Human genes 0.000 description 1
- 102100039545 Homeobox protein Hox-D11 Human genes 0.000 description 1
- 102100040227 Homeobox protein Hox-D13 Human genes 0.000 description 1
- 101000833180 Homo sapiens AF4/FMR2 family member 1 Proteins 0.000 description 1
- 101000833166 Homo sapiens AF4/FMR2 family member 3 Proteins 0.000 description 1
- 101000833170 Homo sapiens AF4/FMR2 family member 4 Proteins 0.000 description 1
- 101000924266 Homo sapiens AT-rich interactive domain-containing protein 1A Proteins 0.000 description 1
- 101000924255 Homo sapiens AT-rich interactive domain-containing protein 1B Proteins 0.000 description 1
- 101000808906 Homo sapiens AT-rich interactive domain-containing protein 3B Proteins 0.000 description 1
- 101000792947 Homo sapiens AT-rich interactive domain-containing protein 5B Proteins 0.000 description 1
- 101000583854 Homo sapiens Activating transcription factor 7-interacting protein 1 Proteins 0.000 description 1
- 101000924577 Homo sapiens Adenomatous polyposis coli protein Proteins 0.000 description 1
- 101000925522 Homo sapiens Ankyrin repeat and SOCS box protein 15 Proteins 0.000 description 1
- 101000793115 Homo sapiens Aryl hydrocarbon receptor nuclear translocator Proteins 0.000 description 1
- 101000768838 Homo sapiens Aryl hydrocarbon receptor nuclear translocator 2 Proteins 0.000 description 1
- 101000678892 Homo sapiens Atypical chemokine receptor 2 Proteins 0.000 description 1
- 101000971234 Homo sapiens B-cell lymphoma 6 protein Proteins 0.000 description 1
- 101000903703 Homo sapiens B-cell lymphoma/leukemia 11A Proteins 0.000 description 1
- 101000903697 Homo sapiens B-cell lymphoma/leukemia 11B Proteins 0.000 description 1
- 101100165236 Homo sapiens BCOR gene Proteins 0.000 description 1
- 101000798490 Homo sapiens Bcl-2-associated transcription factor 1 Proteins 0.000 description 1
- 101000971143 Homo sapiens Bromodomain adjacent to zinc finger domain protein 2B Proteins 0.000 description 1
- 101000896771 Homo sapiens Bromodomain and PHD finger-containing protein 3 Proteins 0.000 description 1
- 101000794019 Homo sapiens Bromodomain-containing protein 7 Proteins 0.000 description 1
- 101000794020 Homo sapiens Bromodomain-containing protein 8 Proteins 0.000 description 1
- 101000777558 Homo sapiens C-C chemokine receptor type 10 Proteins 0.000 description 1
- 101000916050 Homo sapiens C-X-C chemokine receptor type 3 Proteins 0.000 description 1
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 1
- 101000945515 Homo sapiens CCAAT/enhancer-binding protein alpha Proteins 0.000 description 1
- 101000919663 Homo sapiens CCR4-NOT transcription complex subunit 3 Proteins 0.000 description 1
- 101100382122 Homo sapiens CIITA gene Proteins 0.000 description 1
- 101000896987 Homo sapiens CREB-binding protein Proteins 0.000 description 1
- 101000891939 Homo sapiens CREB-regulated transcription coactivator 1 Proteins 0.000 description 1
- 101000957728 Homo sapiens Calcium-responsive transactivator Proteins 0.000 description 1
- 101000916173 Homo sapiens Catenin beta-1 Proteins 0.000 description 1
- 101000851684 Homo sapiens Chimeric ERCC6-PGBD3 protein Proteins 0.000 description 1
- 101000777047 Homo sapiens Chromodomain-helicase-DNA-binding protein 1 Proteins 0.000 description 1
- 101000777079 Homo sapiens Chromodomain-helicase-DNA-binding protein 2 Proteins 0.000 description 1
- 101000883749 Homo sapiens Chromodomain-helicase-DNA-binding protein 4 Proteins 0.000 description 1
- 101000883731 Homo sapiens Chromodomain-helicase-DNA-binding protein 5 Proteins 0.000 description 1
- 101000883736 Homo sapiens Chromodomain-helicase-DNA-binding protein 6 Proteins 0.000 description 1
- 101000883739 Homo sapiens Chromodomain-helicase-DNA-binding protein 7 Proteins 0.000 description 1
- 101000940535 Homo sapiens Cold shock domain-containing protein E1 Proteins 0.000 description 1
- 101000855516 Homo sapiens Cyclic AMP-responsive element-binding protein 1 Proteins 0.000 description 1
- 101000745631 Homo sapiens Cyclic AMP-responsive element-binding protein 3-like protein 1 Proteins 0.000 description 1
- 101001041466 Homo sapiens DNA damage-binding protein 2 Proteins 0.000 description 1
- 101000920783 Homo sapiens DNA excision repair protein ERCC-6 Proteins 0.000 description 1
- 101000618535 Homo sapiens DNA repair protein complementing XP-C cells Proteins 0.000 description 1
- 101000655236 Homo sapiens DNA-binding protein SATB2 Proteins 0.000 description 1
- 101001036287 Homo sapiens DNA-binding protein inhibitor ID-3 Proteins 0.000 description 1
- 101000805870 Homo sapiens Disco-interacting protein 2 homolog C Proteins 0.000 description 1
- 101000880945 Homo sapiens Down syndrome cell adhesion molecule Proteins 0.000 description 1
- 101001049692 Homo sapiens E3 SUMO-protein ligase EGR2 Proteins 0.000 description 1
- 101000664952 Homo sapiens E3 ubiquitin-protein ligase SMURF2 Proteins 0.000 description 1
- 101000634991 Homo sapiens E3 ubiquitin-protein ligase TRIM33 Proteins 0.000 description 1
- 101001048716 Homo sapiens ETS domain-containing protein Elk-4 Proteins 0.000 description 1
- 101000938776 Homo sapiens ETS domain-containing transcription factor ERF Proteins 0.000 description 1
- 101000813729 Homo sapiens ETS translocation variant 1 Proteins 0.000 description 1
- 101000813747 Homo sapiens ETS translocation variant 4 Proteins 0.000 description 1
- 101000813745 Homo sapiens ETS translocation variant 5 Proteins 0.000 description 1
- 101000877379 Homo sapiens ETS-related transcription factor Elf-3 Proteins 0.000 description 1
- 101000813135 Homo sapiens ETS-related transcription factor Elf-4 Proteins 0.000 description 1
- 101000920078 Homo sapiens Elongation factor 1-alpha 1 Proteins 0.000 description 1
- 101000881731 Homo sapiens Elongin-C Proteins 0.000 description 1
- 101001066265 Homo sapiens Endothelial transcription factor GATA-2 Proteins 0.000 description 1
- 101000920634 Homo sapiens Enhancer of polycomb homolog 1 Proteins 0.000 description 1
- 101001066268 Homo sapiens Erythroid transcription factor Proteins 0.000 description 1
- 101000882584 Homo sapiens Estrogen receptor Proteins 0.000 description 1
- 101000938790 Homo sapiens Eukaryotic peptide chain release factor subunit 1 Proteins 0.000 description 1
- 101000938422 Homo sapiens Eyes absent homolog 4 Proteins 0.000 description 1
- 101000848171 Homo sapiens Fanconi anemia group J protein Proteins 0.000 description 1
- 101000930770 Homo sapiens Far upstream element-binding protein 1 Proteins 0.000 description 1
- 101000930766 Homo sapiens Far upstream element-binding protein 2 Proteins 0.000 description 1
- 101001029304 Homo sapiens Forkhead box protein E1 Proteins 0.000 description 1
- 101001059893 Homo sapiens Forkhead box protein P1 Proteins 0.000 description 1
- 101000861406 Homo sapiens Forkhead box protein Q1 Proteins 0.000 description 1
- 101000930945 Homo sapiens Fragile X mental retardation syndrome-related protein 1 Proteins 0.000 description 1
- 101001062996 Homo sapiens Friend leukemia integration 1 transcription factor Proteins 0.000 description 1
- 101000920748 Homo sapiens General transcription and DNA repair factor IIH helicase subunit XPB Proteins 0.000 description 1
- 101001032427 Homo sapiens General transcription factor II-I Proteins 0.000 description 1
- 101001038390 Homo sapiens Guided entry of tail-anchored proteins factor 1 Proteins 0.000 description 1
- 101000704158 Homo sapiens Helicase SRCAP Proteins 0.000 description 1
- 101001062353 Homo sapiens Hepatocyte nuclear factor 3-alpha Proteins 0.000 description 1
- 101000986380 Homo sapiens High mobility group protein HMG-I/HMG-Y Proteins 0.000 description 1
- 101001035375 Homo sapiens Histone H1.2 Proteins 0.000 description 1
- 101001009450 Homo sapiens Histone H1.3 Proteins 0.000 description 1
- 101001009443 Homo sapiens Histone H1.4 Proteins 0.000 description 1
- 101000899879 Homo sapiens Histone H1.5 Proteins 0.000 description 1
- 101001084684 Homo sapiens Histone H2B type 1-D Proteins 0.000 description 1
- 101000882390 Homo sapiens Histone acetyltransferase p300 Proteins 0.000 description 1
- 101001032092 Homo sapiens Histone deacetylase 9 Proteins 0.000 description 1
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 1
- 101000634048 Homo sapiens Histone-lysine N-methyltransferase NSD2 Proteins 0.000 description 1
- 101000634046 Homo sapiens Histone-lysine N-methyltransferase NSD3 Proteins 0.000 description 1
- 101000686942 Homo sapiens Histone-lysine N-methyltransferase PRDM16 Proteins 0.000 description 1
- 101001124887 Homo sapiens Histone-lysine N-methyltransferase PRDM9 Proteins 0.000 description 1
- 101000634050 Homo sapiens Histone-lysine N-methyltransferase, H3 lysine-36 specific Proteins 0.000 description 1
- 101000963360 Homo sapiens Histone-lysine N-methyltransferase, H3 lysine-79 specific Proteins 0.000 description 1
- 101000777790 Homo sapiens Homeobox protein CDX-4 Proteins 0.000 description 1
- 101001083158 Homo sapiens Homeobox protein Hox-A11 Proteins 0.000 description 1
- 101001045116 Homo sapiens Homeobox protein Hox-A7 Proteins 0.000 description 1
- 101001003015 Homo sapiens Homeobox protein Hox-C11 Proteins 0.000 description 1
- 101001002988 Homo sapiens Homeobox protein Hox-C13 Proteins 0.000 description 1
- 101000962591 Homo sapiens Homeobox protein Hox-D11 Proteins 0.000 description 1
- 101001037168 Homo sapiens Homeobox protein Hox-D13 Proteins 0.000 description 1
- 101001040800 Homo sapiens Integral membrane protein GPR180 Proteins 0.000 description 1
- 101001011393 Homo sapiens Interferon regulatory factor 2 Proteins 0.000 description 1
- 101001011441 Homo sapiens Interferon regulatory factor 4 Proteins 0.000 description 1
- 101001011446 Homo sapiens Interferon regulatory factor 6 Proteins 0.000 description 1
- 101001032345 Homo sapiens Interferon regulatory factor 8 Proteins 0.000 description 1
- 101000977692 Homo sapiens Iroquois-class homeodomain protein IRX-6 Proteins 0.000 description 1
- 101001050622 Homo sapiens KH domain-containing, RNA-binding, signal transduction-associated protein 2 Proteins 0.000 description 1
- 101000971533 Homo sapiens Killer cell lectin-like receptor subfamily G member 1 Proteins 0.000 description 1
- 101001139146 Homo sapiens Krueppel-like factor 2 Proteins 0.000 description 1
- 101001139134 Homo sapiens Krueppel-like factor 4 Proteins 0.000 description 1
- 101001139130 Homo sapiens Krueppel-like factor 5 Proteins 0.000 description 1
- 101001139126 Homo sapiens Krueppel-like factor 6 Proteins 0.000 description 1
- 101001022957 Homo sapiens LIM domain-binding protein 1 Proteins 0.000 description 1
- 101001022948 Homo sapiens LIM domain-binding protein 2 Proteins 0.000 description 1
- 101001038339 Homo sapiens LIM homeobox transcription factor 1-alpha Proteins 0.000 description 1
- 101001038435 Homo sapiens Leucine-zipper-like transcriptional regulator 1 Proteins 0.000 description 1
- 101001005664 Homo sapiens Mastermind-like protein 1 Proteins 0.000 description 1
- 101000614988 Homo sapiens Mediator of RNA polymerase II transcription subunit 12 Proteins 0.000 description 1
- 101000582631 Homo sapiens Menin Proteins 0.000 description 1
- 101000615613 Homo sapiens Mineralocorticoid receptor Proteins 0.000 description 1
- 101000593398 Homo sapiens Myb-related protein A Proteins 0.000 description 1
- 101000593405 Homo sapiens Myb-related protein B Proteins 0.000 description 1
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 1
- 101001023043 Homo sapiens Myoblast determination protein 1 Proteins 0.000 description 1
- 101000591286 Homo sapiens Myocardin-related transcription factor A Proteins 0.000 description 1
- 101000650158 Homo sapiens NEDD4-like E3 ubiquitin-protein ligase WWP1 Proteins 0.000 description 1
- 101000961071 Homo sapiens NF-kappa-B inhibitor alpha Proteins 0.000 description 1
- 101000603698 Homo sapiens Neurogenin-2 Proteins 0.000 description 1
- 101000578287 Homo sapiens Non-POU domain-containing octamer-binding protein Proteins 0.000 description 1
- 101000973211 Homo sapiens Nuclear factor 1 B-type Proteins 0.000 description 1
- 101000979338 Homo sapiens Nuclear factor NF-kappa-B p100 subunit Proteins 0.000 description 1
- 101000588303 Homo sapiens Nuclear factor erythroid 2-related factor 3 Proteins 0.000 description 1
- 101000602926 Homo sapiens Nuclear receptor coactivator 1 Proteins 0.000 description 1
- 101000602930 Homo sapiens Nuclear receptor coactivator 2 Proteins 0.000 description 1
- 101000974343 Homo sapiens Nuclear receptor coactivator 4 Proteins 0.000 description 1
- 101000974340 Homo sapiens Nuclear receptor corepressor 1 Proteins 0.000 description 1
- 101000582254 Homo sapiens Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 101001109689 Homo sapiens Nuclear receptor subfamily 4 group A member 3 Proteins 0.000 description 1
- 101001109719 Homo sapiens Nucleophosmin Proteins 0.000 description 1
- 101000736088 Homo sapiens PC4 and SFRS1-interacting protein Proteins 0.000 description 1
- 101000692946 Homo sapiens PHD finger protein 3 Proteins 0.000 description 1
- 101000692980 Homo sapiens PHD finger protein 6 Proteins 0.000 description 1
- 101000738901 Homo sapiens PMS1 protein homolog 1 Proteins 0.000 description 1
- 101001000773 Homo sapiens POU domain, class 2, transcription factor 2 Proteins 0.000 description 1
- 101001094700 Homo sapiens POU domain, class 5, transcription factor 1 Proteins 0.000 description 1
- 101000651906 Homo sapiens Paired amphipathic helix protein Sin3a Proteins 0.000 description 1
- 101000613490 Homo sapiens Paired box protein Pax-3 Proteins 0.000 description 1
- 101000601724 Homo sapiens Paired box protein Pax-5 Proteins 0.000 description 1
- 101000601661 Homo sapiens Paired box protein Pax-7 Proteins 0.000 description 1
- 101000601664 Homo sapiens Paired box protein Pax-8 Proteins 0.000 description 1
- 101001069727 Homo sapiens Paired mesoderm homeobox protein 1 Proteins 0.000 description 1
- 101000692768 Homo sapiens Paired mesoderm homeobox protein 2B Proteins 0.000 description 1
- 101000693243 Homo sapiens Paternally-expressed gene 3 protein Proteins 0.000 description 1
- 101000579484 Homo sapiens Period circadian protein homolog 1 Proteins 0.000 description 1
- 101000741790 Homo sapiens Peroxisome proliferator-activated receptor gamma Proteins 0.000 description 1
- 101000605827 Homo sapiens Pinin Proteins 0.000 description 1
- 101000728236 Homo sapiens Polycomb group protein ASXL1 Proteins 0.000 description 1
- 101000866766 Homo sapiens Polycomb protein EED Proteins 0.000 description 1
- 101000584499 Homo sapiens Polycomb protein SUZ12 Proteins 0.000 description 1
- 101001126582 Homo sapiens Post-GPI attachment to proteins factor 3 Proteins 0.000 description 1
- 101000610107 Homo sapiens Pre-B-cell leukemia transcription factor 1 Proteins 0.000 description 1
- 101000952113 Homo sapiens Probable ATP-dependent RNA helicase DDX5 Proteins 0.000 description 1
- 101000702560 Homo sapiens Probable global transcription activator SNF2L1 Proteins 0.000 description 1
- 101000614345 Homo sapiens Prolyl 4-hydroxylase subunit alpha-1 Proteins 0.000 description 1
- 101000718497 Homo sapiens Protein AF-10 Proteins 0.000 description 1
- 101000892360 Homo sapiens Protein AF-17 Proteins 0.000 description 1
- 101000959489 Homo sapiens Protein AF-9 Proteins 0.000 description 1
- 101000933601 Homo sapiens Protein BTG1 Proteins 0.000 description 1
- 101000933604 Homo sapiens Protein BTG2 Proteins 0.000 description 1
- 101000876829 Homo sapiens Protein C-ets-1 Proteins 0.000 description 1
- 101001132819 Homo sapiens Protein CBFA2T3 Proteins 0.000 description 1
- 101000912957 Homo sapiens Protein DEK Proteins 0.000 description 1
- 101000925651 Homo sapiens Protein ENL Proteins 0.000 description 1
- 101000573199 Homo sapiens Protein PML Proteins 0.000 description 1
- 101000880769 Homo sapiens Protein SSX1 Proteins 0.000 description 1
- 101000880770 Homo sapiens Protein SSX2 Proteins 0.000 description 1
- 101000880774 Homo sapiens Protein SSX4 Proteins 0.000 description 1
- 101000883014 Homo sapiens Protein capicua homolog Proteins 0.000 description 1
- 101000893493 Homo sapiens Protein flightless-1 homolog Proteins 0.000 description 1
- 101000958299 Homo sapiens Protein lyl-1 Proteins 0.000 description 1
- 101001048695 Homo sapiens RNA polymerase II elongation factor ELL Proteins 0.000 description 1
- 101000687317 Homo sapiens RNA-binding motif protein, X chromosome Proteins 0.000 description 1
- 101001062093 Homo sapiens RNA-binding protein 15 Proteins 0.000 description 1
- 101100078258 Homo sapiens RUNX1T1 gene Proteins 0.000 description 1
- 101000742859 Homo sapiens Retinoblastoma-associated protein Proteins 0.000 description 1
- 101001093899 Homo sapiens Retinoic acid receptor RXR-alpha Proteins 0.000 description 1
- 101001112293 Homo sapiens Retinoic acid receptor alpha Proteins 0.000 description 1
- 101000687474 Homo sapiens Rhombotin-1 Proteins 0.000 description 1
- 101001111742 Homo sapiens Rhombotin-2 Proteins 0.000 description 1
- 101000654718 Homo sapiens SET-binding protein Proteins 0.000 description 1
- 101000687737 Homo sapiens SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily D member 1 Proteins 0.000 description 1
- 101000702542 Homo sapiens SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily E member 1 Proteins 0.000 description 1
- 101000740180 Homo sapiens Sal-like protein 3 Proteins 0.000 description 1
- 101000851593 Homo sapiens Separin Proteins 0.000 description 1
- 101000826130 Homo sapiens Sex-determining region Y protein Proteins 0.000 description 1
- 101000628885 Homo sapiens Suppressor of fused homolog Proteins 0.000 description 1
- 101000653635 Homo sapiens T-box transcription factor TBX18 Proteins 0.000 description 1
- 101000713600 Homo sapiens T-box transcription factor TBX22 Proteins 0.000 description 1
- 101000666775 Homo sapiens T-box transcription factor TBX3 Proteins 0.000 description 1
- 101000891113 Homo sapiens T-cell acute lymphocytic leukemia protein 1 Proteins 0.000 description 1
- 101000625330 Homo sapiens T-cell acute lymphocytic leukemia protein 2 Proteins 0.000 description 1
- 101000800488 Homo sapiens T-cell leukemia homeobox protein 1 Proteins 0.000 description 1
- 101000655119 Homo sapiens T-cell leukemia homeobox protein 3 Proteins 0.000 description 1
- 101001099181 Homo sapiens TATA-binding protein-associated factor 2N Proteins 0.000 description 1
- 101000835082 Homo sapiens TCF3 fusion partner Proteins 0.000 description 1
- 101000596334 Homo sapiens TSC22 domain family protein 1 Proteins 0.000 description 1
- 101000633632 Homo sapiens Teashirt homolog 3 Proteins 0.000 description 1
- 101000795185 Homo sapiens Thyroid hormone receptor-associated protein 3 Proteins 0.000 description 1
- 101000649022 Homo sapiens Thyroid receptor-interacting protein 11 Proteins 0.000 description 1
- 101000819111 Homo sapiens Trans-acting T-cell-specific transcription factor GATA-3 Proteins 0.000 description 1
- 101000702545 Homo sapiens Transcription activator BRG1 Proteins 0.000 description 1
- 101000835720 Homo sapiens Transcription elongation factor A protein 1 Proteins 0.000 description 1
- 101000891371 Homo sapiens Transcription elongation regulator 1 Proteins 0.000 description 1
- 101001041525 Homo sapiens Transcription factor 12 Proteins 0.000 description 1
- 101000596772 Homo sapiens Transcription factor 7-like 1 Proteins 0.000 description 1
- 101000596771 Homo sapiens Transcription factor 7-like 2 Proteins 0.000 description 1
- 101000732353 Homo sapiens Transcription factor AP-2-delta Proteins 0.000 description 1
- 101000666382 Homo sapiens Transcription factor E2-alpha Proteins 0.000 description 1
- 101000837845 Homo sapiens Transcription factor E3 Proteins 0.000 description 1
- 101000837841 Homo sapiens Transcription factor EB Proteins 0.000 description 1
- 101000813738 Homo sapiens Transcription factor ETV6 Proteins 0.000 description 1
- 101000962461 Homo sapiens Transcription factor Maf Proteins 0.000 description 1
- 101000979205 Homo sapiens Transcription factor MafA Proteins 0.000 description 1
- 101000979190 Homo sapiens Transcription factor MafB Proteins 0.000 description 1
- 101000652324 Homo sapiens Transcription factor SOX-17 Proteins 0.000 description 1
- 101000652326 Homo sapiens Transcription factor SOX-18 Proteins 0.000 description 1
- 101000687905 Homo sapiens Transcription factor SOX-2 Proteins 0.000 description 1
- 101000652337 Homo sapiens Transcription factor SOX-21 Proteins 0.000 description 1
- 101000687907 Homo sapiens Transcription factor SOX-30 Proteins 0.000 description 1
- 101000642512 Homo sapiens Transcription factor SOX-5 Proteins 0.000 description 1
- 101000596093 Homo sapiens Transcription initiation factor TFIID subunit 1 Proteins 0.000 description 1
- 101001074042 Homo sapiens Transcriptional activator GLI3 Proteins 0.000 description 1
- 101000636213 Homo sapiens Transcriptional activator Myb Proteins 0.000 description 1
- 101001010792 Homo sapiens Transcriptional regulator ERG Proteins 0.000 description 1
- 101000796673 Homo sapiens Transformation/transcription domain-associated protein Proteins 0.000 description 1
- 101000823316 Homo sapiens Tyrosine-protein kinase ABL1 Proteins 0.000 description 1
- 101000650162 Homo sapiens WW domain-containing transcription regulator protein 1 Proteins 0.000 description 1
- 101000666295 Homo sapiens X-box-binding protein 1 Proteins 0.000 description 1
- 101100377226 Homo sapiens ZBTB16 gene Proteins 0.000 description 1
- 101000759185 Homo sapiens Zinc finger X-chromosomal protein Proteins 0.000 description 1
- 101000818532 Homo sapiens Zinc finger and BTB domain-containing protein 20 Proteins 0.000 description 1
- 101000818631 Homo sapiens Zinc finger imprinted 2 Proteins 0.000 description 1
- 101000744932 Homo sapiens Zinc finger protein 208 Proteins 0.000 description 1
- 101000782145 Homo sapiens Zinc finger protein 226 Proteins 0.000 description 1
- 101000760207 Homo sapiens Zinc finger protein 331 Proteins 0.000 description 1
- 101000964718 Homo sapiens Zinc finger protein 384 Proteins 0.000 description 1
- 101000915642 Homo sapiens Zinc finger protein 469 Proteins 0.000 description 1
- 101000976471 Homo sapiens Zinc finger protein 595 Proteins 0.000 description 1
- 101000782294 Homo sapiens Zinc finger protein 638 Proteins 0.000 description 1
- 101000691578 Homo sapiens Zinc finger protein PLAG1 Proteins 0.000 description 1
- 101000976645 Homo sapiens Zinc finger protein ZIC 3 Proteins 0.000 description 1
- 101000772560 Homo sapiens Zinc finger transcription factor Trps1 Proteins 0.000 description 1
- 101000788664 Homo sapiens Zinc fingers and homeoboxes protein 2 Proteins 0.000 description 1
- 108091070511 Homo sapiens let-7c stem-loop Proteins 0.000 description 1
- 101000802094 Homo sapiens mRNA decay activator protein ZFP36L1 Proteins 0.000 description 1
- JRHFQUPIZOYKQP-KBIXCLLPSA-N Ile-Ala-Glu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O JRHFQUPIZOYKQP-KBIXCLLPSA-N 0.000 description 1
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 1
- CYHYBSGMHMHKOA-CIQUZCHMSA-N Ile-Ala-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CYHYBSGMHMHKOA-CIQUZCHMSA-N 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 1
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 1
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 1
- NPROWIBAWYMPAZ-GUDRVLHUSA-N Ile-Asp-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N NPROWIBAWYMPAZ-GUDRVLHUSA-N 0.000 description 1
- AWTDTFXPVCTHAK-BJDJZHNGSA-N Ile-Cys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N AWTDTFXPVCTHAK-BJDJZHNGSA-N 0.000 description 1
- ZDNORQNHCJUVOV-KBIXCLLPSA-N Ile-Gln-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O ZDNORQNHCJUVOV-KBIXCLLPSA-N 0.000 description 1
- GECLQMBTZCPAFY-PEFMBERDSA-N Ile-Gln-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GECLQMBTZCPAFY-PEFMBERDSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- JDAWAWXGAUZPNJ-ZPFDUUQYSA-N Ile-Glu-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JDAWAWXGAUZPNJ-ZPFDUUQYSA-N 0.000 description 1
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 1
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 1
- NHJKZMDIMMTVCK-QXEWZRGKSA-N Ile-Gly-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N NHJKZMDIMMTVCK-QXEWZRGKSA-N 0.000 description 1
- LPFBXFILACZHIB-LAEOZQHASA-N Ile-Gly-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)O)C(=O)O)N LPFBXFILACZHIB-LAEOZQHASA-N 0.000 description 1
- MQFGXJNSUJTXDT-QSFUFRPTSA-N Ile-Gly-Ile Chemical compound N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)O MQFGXJNSUJTXDT-QSFUFRPTSA-N 0.000 description 1
- DJQUZZAFLFQVFL-UHFFFAOYSA-N Ile-Gly-Leu-Pro Chemical compound CCC(C)C(N)C(=O)NCC(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O DJQUZZAFLFQVFL-UHFFFAOYSA-N 0.000 description 1
- UASTVUQJMLZWGG-PEXQALLHSA-N Ile-His-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)NCC(=O)O)N UASTVUQJMLZWGG-PEXQALLHSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- IOVUXUSIGXCREV-DKIMLUQUSA-N Ile-Leu-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IOVUXUSIGXCREV-DKIMLUQUSA-N 0.000 description 1
- PMMMQRVUMVURGJ-XUXIUFHCSA-N Ile-Leu-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O PMMMQRVUMVURGJ-XUXIUFHCSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- MLSUZXHSNRBDCI-CYDGBPFRSA-N Ile-Pro-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)O)N MLSUZXHSNRBDCI-CYDGBPFRSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- XMYURPUVJSKTMC-KBIXCLLPSA-N Ile-Ser-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XMYURPUVJSKTMC-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- JCGMFFQQHJQASB-PYJNHQTQSA-N Ile-Val-His Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O JCGMFFQQHJQASB-PYJNHQTQSA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 1
- 102100029838 Interferon regulatory factor 2 Human genes 0.000 description 1
- 102100030126 Interferon regulatory factor 4 Human genes 0.000 description 1
- 102100030130 Interferon regulatory factor 6 Human genes 0.000 description 1
- 102100038069 Interferon regulatory factor 8 Human genes 0.000 description 1
- 108090000174 Interleukin-10 Proteins 0.000 description 1
- 108010065805 Interleukin-12 Proteins 0.000 description 1
- 108090000176 Interleukin-13 Proteins 0.000 description 1
- 108090000172 Interleukin-15 Proteins 0.000 description 1
- 108090000171 Interleukin-18 Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 108010002616 Interleukin-5 Proteins 0.000 description 1
- 108090001005 Interleukin-6 Proteins 0.000 description 1
- 102100023527 Iroquois-class homeodomain protein IRX-6 Human genes 0.000 description 1
- PIWKPBJCKXDKJR-UHFFFAOYSA-N Isoflurane Chemical compound FC(F)OC(Cl)C(F)(F)F PIWKPBJCKXDKJR-UHFFFAOYSA-N 0.000 description 1
- 241000581650 Ivesia Species 0.000 description 1
- UETNIIAIRMUTSM-UHFFFAOYSA-N Jacareubin Natural products CC1(C)OC2=CC3Oc4c(O)c(O)ccc4C(=O)C3C(=C2C=C1)O UETNIIAIRMUTSM-UHFFFAOYSA-N 0.000 description 1
- 102100023411 KH domain-containing, RNA-binding, signal transduction-associated protein 2 Human genes 0.000 description 1
- 102100021457 Killer cell lectin-like receptor subfamily G member 1 Human genes 0.000 description 1
- 102100020675 Krueppel-like factor 2 Human genes 0.000 description 1
- 102100020677 Krueppel-like factor 4 Human genes 0.000 description 1
- 102100020680 Krueppel-like factor 5 Human genes 0.000 description 1
- 102100020679 Krueppel-like factor 6 Human genes 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- WTDRDQBEARUVNC-LURJTMIESA-N L-DOPA Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-LURJTMIESA-N 0.000 description 1
- WTDRDQBEARUVNC-UHFFFAOYSA-N L-Dopa Natural products OC(=O)C(N)CC1=CC=C(O)C(O)=C1 WTDRDQBEARUVNC-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 102100035114 LIM domain-binding protein 1 Human genes 0.000 description 1
- 102100040290 LIM homeobox transcription factor 1-alpha Human genes 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- HXWALXSAVBLTPK-NUTKFTJISA-N Leu-Ala-Trp Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(C)C)N HXWALXSAVBLTPK-NUTKFTJISA-N 0.000 description 1
- CNNQBZRGQATKNY-DCAQKATOSA-N Leu-Arg-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N CNNQBZRGQATKNY-DCAQKATOSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- DUBAVOVZNZKEQQ-AVGNSLFASA-N Leu-Arg-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCN=C(N)N DUBAVOVZNZKEQQ-AVGNSLFASA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- RIMMMMYKGIBOSN-DCAQKATOSA-N Leu-Asn-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O RIMMMMYKGIBOSN-DCAQKATOSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- KAFOIVJDVSZUMD-UHFFFAOYSA-N Leu-Gln-Gln Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)NC(CCC(N)=O)C(O)=O KAFOIVJDVSZUMD-UHFFFAOYSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- AXZGZMGRBDQTEY-SRVKXCTJSA-N Leu-Gln-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O AXZGZMGRBDQTEY-SRVKXCTJSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 1
- PRZVBIAOPFGAQF-SRVKXCTJSA-N Leu-Glu-Met Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O PRZVBIAOPFGAQF-SRVKXCTJSA-N 0.000 description 1
- LLBQJYDYOLIQAI-JYJNAYRXSA-N Leu-Glu-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O LLBQJYDYOLIQAI-JYJNAYRXSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- FIYMBBHGYNQFOP-IUCAKERBSA-N Leu-Gly-Gln Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N FIYMBBHGYNQFOP-IUCAKERBSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- BKTXKJMNTSMJDQ-AVGNSLFASA-N Leu-His-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BKTXKJMNTSMJDQ-AVGNSLFASA-N 0.000 description 1
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 1
- XBCWOTOCBXXJDG-BZSNNMDCSA-N Leu-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 XBCWOTOCBXXJDG-BZSNNMDCSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- BJWKOATWNQJPSK-SRVKXCTJSA-N Leu-Met-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N BJWKOATWNQJPSK-SRVKXCTJSA-N 0.000 description 1
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 1
- NJMXCOOEFLMZSR-AVGNSLFASA-N Leu-Met-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NJMXCOOEFLMZSR-AVGNSLFASA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- MVVSHHJKJRZVNY-ACRUOGEOSA-N Leu-Phe-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MVVSHHJKJRZVNY-ACRUOGEOSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 1
- VULJUQZPSOASBZ-SRVKXCTJSA-N Leu-Pro-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O VULJUQZPSOASBZ-SRVKXCTJSA-N 0.000 description 1
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- BGGTYDNTOYRTTR-MEYUZBJRSA-N Leu-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(C)C)N)O BGGTYDNTOYRTTR-MEYUZBJRSA-N 0.000 description 1
- XZNJZXJZBMBGGS-NHCYSSNCSA-N Leu-Val-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XZNJZXJZBMBGGS-NHCYSSNCSA-N 0.000 description 1
- 102100040274 Leucine-zipper-like transcriptional regulator 1 Human genes 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- 102100022742 Lupus La protein Human genes 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 1
- HWMZUBUEOYAQSC-DCAQKATOSA-N Lys-Gln-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O HWMZUBUEOYAQSC-DCAQKATOSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- DUTMKEAPLLUGNO-JYJNAYRXSA-N Lys-Glu-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DUTMKEAPLLUGNO-JYJNAYRXSA-N 0.000 description 1
- ITWQLSZTLBKWJM-YUMQZZPRSA-N Lys-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCCN ITWQLSZTLBKWJM-YUMQZZPRSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- HAUUXTXKJNVIFY-ONGXEEELSA-N Lys-Gly-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAUUXTXKJNVIFY-ONGXEEELSA-N 0.000 description 1
- YXTKSLRSRXKXNV-IHRRRGAJSA-N Lys-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N YXTKSLRSRXKXNV-IHRRRGAJSA-N 0.000 description 1
- ZMMDPRTXLAEMOD-BZSNNMDCSA-N Lys-His-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZMMDPRTXLAEMOD-BZSNNMDCSA-N 0.000 description 1
- SLQJJFAVWSZLBL-BJDJZHNGSA-N Lys-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN SLQJJFAVWSZLBL-BJDJZHNGSA-N 0.000 description 1
- NJNRBRKHOWSGMN-SRVKXCTJSA-N Lys-Leu-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O NJNRBRKHOWSGMN-SRVKXCTJSA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- URGPVYGVWLIRGT-DCAQKATOSA-N Lys-Met-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O URGPVYGVWLIRGT-DCAQKATOSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- UWHCKWNPWKTMBM-WDCWCFNPSA-N Lys-Thr-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O UWHCKWNPWKTMBM-WDCWCFNPSA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- QLFAPXUXEBAWEK-NHCYSSNCSA-N Lys-Val-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QLFAPXUXEBAWEK-NHCYSSNCSA-N 0.000 description 1
- BWECSLVQIWEMSC-IHRRRGAJSA-N Lys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N BWECSLVQIWEMSC-IHRRRGAJSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 102000017274 MDM4 Human genes 0.000 description 1
- 108050005300 MDM4 Proteins 0.000 description 1
- 102000055120 MEF2 Transcription Factors Human genes 0.000 description 1
- 108700002010 MHC class II transactivator Proteins 0.000 description 1
- 102100026371 MHC class II transactivator Human genes 0.000 description 1
- 231100000070 MTS assay Toxicity 0.000 description 1
- 238000000719 MTS assay Methods 0.000 description 1
- 108700012912 MYCN Proteins 0.000 description 1
- 101150022024 MYCN gene Proteins 0.000 description 1
- 102100025129 Mastermind-like protein 1 Human genes 0.000 description 1
- 102100025169 Max-binding protein MNT Human genes 0.000 description 1
- 102100021070 Mediator of RNA polymerase II transcription subunit 12 Human genes 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 102100030550 Menin Human genes 0.000 description 1
- GAELMDJMQDUDLJ-BQBZGAKWSA-N Met-Ala-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O GAELMDJMQDUDLJ-BQBZGAKWSA-N 0.000 description 1
- JQEBITVYKUCBMC-SRVKXCTJSA-N Met-Arg-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JQEBITVYKUCBMC-SRVKXCTJSA-N 0.000 description 1
- PJWDQHNOJIBMRY-JYJNAYRXSA-N Met-Arg-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PJWDQHNOJIBMRY-JYJNAYRXSA-N 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- YNOVBMBQSQTLFM-DCAQKATOSA-N Met-Asn-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O YNOVBMBQSQTLFM-DCAQKATOSA-N 0.000 description 1
- FJVJLMZUIGMFFU-BQBZGAKWSA-N Met-Asp-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O FJVJLMZUIGMFFU-BQBZGAKWSA-N 0.000 description 1
- HLYIDXAXQIJYIG-CIUDSAMLSA-N Met-Gln-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HLYIDXAXQIJYIG-CIUDSAMLSA-N 0.000 description 1
- UOENBSHXYCHSAU-YUMQZZPRSA-N Met-Gln-Gly Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O UOENBSHXYCHSAU-YUMQZZPRSA-N 0.000 description 1
- VOOINLQYUZOREH-SRVKXCTJSA-N Met-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N VOOINLQYUZOREH-SRVKXCTJSA-N 0.000 description 1
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 1
- CRGKLOXHKICQOL-GARJFASQSA-N Met-Gln-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N CRGKLOXHKICQOL-GARJFASQSA-N 0.000 description 1
- RZJOHSFAEZBWLK-CIUDSAMLSA-N Met-Gln-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N RZJOHSFAEZBWLK-CIUDSAMLSA-N 0.000 description 1
- IECZNARPMKQGJC-XIRDDKMYSA-N Met-Gln-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N IECZNARPMKQGJC-XIRDDKMYSA-N 0.000 description 1
- GPAHWYRSHCKICP-GUBZILKMSA-N Met-Glu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O GPAHWYRSHCKICP-GUBZILKMSA-N 0.000 description 1
- LRALLISKBZNSKN-BQBZGAKWSA-N Met-Gly-Ser Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LRALLISKBZNSKN-BQBZGAKWSA-N 0.000 description 1
- UROWNMBTQGGTHB-DCAQKATOSA-N Met-Leu-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UROWNMBTQGGTHB-DCAQKATOSA-N 0.000 description 1
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 1
- UNPGTBHYKJOCCZ-DCAQKATOSA-N Met-Lys-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O UNPGTBHYKJOCCZ-DCAQKATOSA-N 0.000 description 1
- YYEIFXZOBZVDPH-DCAQKATOSA-N Met-Lys-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O YYEIFXZOBZVDPH-DCAQKATOSA-N 0.000 description 1
- JKXVPNCSAMWUEJ-GUBZILKMSA-N Met-Met-Asp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O JKXVPNCSAMWUEJ-GUBZILKMSA-N 0.000 description 1
- RSOMVHWMIAZNLE-HJWJTTGWSA-N Met-Phe-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RSOMVHWMIAZNLE-HJWJTTGWSA-N 0.000 description 1
- LQTGGXSOMDSWTQ-UNQGMJICSA-N Met-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](CCSC)N)O LQTGGXSOMDSWTQ-UNQGMJICSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- LHXFNWBNRBWMNV-DCAQKATOSA-N Met-Ser-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LHXFNWBNRBWMNV-DCAQKATOSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 1
- FSTWDRPCQQUJIT-NHCYSSNCSA-N Met-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCSC)N FSTWDRPCQQUJIT-NHCYSSNCSA-N 0.000 description 1
- QAVZUKIPOMBLMC-AVGNSLFASA-N Met-Val-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(C)C QAVZUKIPOMBLMC-AVGNSLFASA-N 0.000 description 1
- LPNWWHBFXPNHJG-AVGNSLFASA-N Met-Val-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN LPNWWHBFXPNHJG-AVGNSLFASA-N 0.000 description 1
- JACMWNXOOUYXCD-JYJNAYRXSA-N Met-Val-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JACMWNXOOUYXCD-JYJNAYRXSA-N 0.000 description 1
- IIHMNTBFPMRJCN-RCWTZXSCSA-N Met-Val-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IIHMNTBFPMRJCN-RCWTZXSCSA-N 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- BAVYZALUXZFZLV-UHFFFAOYSA-N Methylamine Chemical compound NC BAVYZALUXZFZLV-UHFFFAOYSA-N 0.000 description 1
- 108091092539 MiR-208 Proteins 0.000 description 1
- 108010050345 Microphthalmia-Associated Transcription Factor Proteins 0.000 description 1
- 102100030157 Microphthalmia-associated transcription factor Human genes 0.000 description 1
- 102100021316 Mineralocorticoid receptor Human genes 0.000 description 1
- 229930192392 Mitomycin Natural products 0.000 description 1
- 102100025751 Mothers against decapentaplegic homolog 2 Human genes 0.000 description 1
- 101710143123 Mothers against decapentaplegic homolog 2 Proteins 0.000 description 1
- 102100025725 Mothers against decapentaplegic homolog 4 Human genes 0.000 description 1
- 101710143112 Mothers against decapentaplegic homolog 4 Proteins 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 102100034711 Myb-related protein A Human genes 0.000 description 1
- 102100034670 Myb-related protein B Human genes 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 102100035077 Myoblast determination protein 1 Human genes 0.000 description 1
- 102100034099 Myocardin-related transcription factor A Human genes 0.000 description 1
- 102100039229 Myocyte-specific enhancer factor 2C Human genes 0.000 description 1
- NWIBSHFKIJFRCO-WUDYKRTCSA-N Mytomycin Chemical compound C1N2C(C(C(C)=C(N)C3=O)=O)=C3[C@@H](COC(N)=O)[C@@]2(OC)[C@@H]2[C@H]1N2 NWIBSHFKIJFRCO-WUDYKRTCSA-N 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- 108700026495 N-Myc Proto-Oncogene Proteins 0.000 description 1
- 102100030124 N-myc proto-oncogene protein Human genes 0.000 description 1
- 102100027550 NEDD4-like E3 ubiquitin-protein ligase WWP1 Human genes 0.000 description 1
- 108010071382 NF-E2-Related Factor 2 Proteins 0.000 description 1
- 102100039337 NF-kappa-B inhibitor alpha Human genes 0.000 description 1
- BLXXJMDCKKHMKV-UHFFFAOYSA-N Nabumetone Chemical compound C1=C(CCC(C)=O)C=CC2=CC(OC)=CC=C21 BLXXJMDCKKHMKV-UHFFFAOYSA-N 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 102100038554 Neurogenin-2 Human genes 0.000 description 1
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 1
- 102100028102 Non-POU domain-containing octamer-binding protein Human genes 0.000 description 1
- 102000001756 Notch2 Receptor Human genes 0.000 description 1
- 108010029751 Notch2 Receptor Proteins 0.000 description 1
- 102000001760 Notch3 Receptor Human genes 0.000 description 1
- 108010029756 Notch3 Receptor Proteins 0.000 description 1
- 102100022165 Nuclear factor 1 B-type Human genes 0.000 description 1
- 102100023059 Nuclear factor NF-kappa-B p100 subunit Human genes 0.000 description 1
- 102100031701 Nuclear factor erythroid 2-related factor 2 Human genes 0.000 description 1
- 102100031700 Nuclear factor erythroid 2-related factor 3 Human genes 0.000 description 1
- 102100037223 Nuclear receptor coactivator 1 Human genes 0.000 description 1
- 102100037226 Nuclear receptor coactivator 2 Human genes 0.000 description 1
- 102100022927 Nuclear receptor coactivator 4 Human genes 0.000 description 1
- 102100022935 Nuclear receptor corepressor 1 Human genes 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 102100022673 Nuclear receptor subfamily 4 group A member 3 Human genes 0.000 description 1
- 102100022678 Nucleophosmin Human genes 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 102100036220 PC4 and SFRS1-interacting protein Human genes 0.000 description 1
- 102100026391 PHD finger protein 3 Human genes 0.000 description 1
- 102100026365 PHD finger protein 6 Human genes 0.000 description 1
- 102100037482 PMS1 protein homolog 1 Human genes 0.000 description 1
- 102100035591 POU domain, class 2, transcription factor 2 Human genes 0.000 description 1
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 description 1
- 108060006456 POU2AF1 Proteins 0.000 description 1
- 102000036938 POU2AF1 Human genes 0.000 description 1
- 102100024894 PR domain zinc finger protein 1 Human genes 0.000 description 1
- 108010047613 PTB-Associated Splicing Factor Proteins 0.000 description 1
- 102100027334 Paired amphipathic helix protein Sin3a Human genes 0.000 description 1
- 102100040891 Paired box protein Pax-3 Human genes 0.000 description 1
- 102100037504 Paired box protein Pax-5 Human genes 0.000 description 1
- 102100037503 Paired box protein Pax-7 Human genes 0.000 description 1
- 102100037502 Paired box protein Pax-8 Human genes 0.000 description 1
- 102100033786 Paired mesoderm homeobox protein 1 Human genes 0.000 description 1
- 102100026354 Paired mesoderm homeobox protein 2B Human genes 0.000 description 1
- 102100025757 Paternally-expressed gene 3 protein Human genes 0.000 description 1
- KHGNFPUMBJSZSM-UHFFFAOYSA-N Perforine Natural products COC1=C2CCC(O)C(CCC(C)(C)O)(OC)C2=NC2=C1C=CO2 KHGNFPUMBJSZSM-UHFFFAOYSA-N 0.000 description 1
- 102100028293 Period circadian protein homolog 1 Human genes 0.000 description 1
- 102100038825 Peroxisome proliferator-activated receptor gamma Human genes 0.000 description 1
- AJOKKVTWEMXZHC-DRZSPHRISA-N Phe-Ala-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 AJOKKVTWEMXZHC-DRZSPHRISA-N 0.000 description 1
- LGBVMDMZZFYSFW-HJWJTTGWSA-N Phe-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CC=CC=C1)N LGBVMDMZZFYSFW-HJWJTTGWSA-N 0.000 description 1
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 1
- CDQCFGOQNYOICK-IHRRRGAJSA-N Phe-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CDQCFGOQNYOICK-IHRRRGAJSA-N 0.000 description 1
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 1
- NPLGQVKZFGJWAI-QWHCGFSZSA-N Phe-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O NPLGQVKZFGJWAI-QWHCGFSZSA-N 0.000 description 1
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 1
- SWCOXQLDICUYOL-ULQDDVLXSA-N Phe-His-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SWCOXQLDICUYOL-ULQDDVLXSA-N 0.000 description 1
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 1
- VZFPYFRVHMSSNA-JURCDPSOSA-N Phe-Ile-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=CC=C1 VZFPYFRVHMSSNA-JURCDPSOSA-N 0.000 description 1
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 1
- RSPUIENXSJYZQO-JYJNAYRXSA-N Phe-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 RSPUIENXSJYZQO-JYJNAYRXSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- BNRFQGLWLQESBG-YESZJQIVSA-N Phe-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O BNRFQGLWLQESBG-YESZJQIVSA-N 0.000 description 1
- WURZLPSMYZLEGH-UNQGMJICSA-N Phe-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N)O WURZLPSMYZLEGH-UNQGMJICSA-N 0.000 description 1
- CKJACGQPCPMWIT-UFYCRDLUSA-N Phe-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CKJACGQPCPMWIT-UFYCRDLUSA-N 0.000 description 1
- NJJBATPLUQHRBM-IHRRRGAJSA-N Phe-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CO)C(=O)O NJJBATPLUQHRBM-IHRRRGAJSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- IAOZOFPONWDXNT-IXOXFDKPSA-N Phe-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IAOZOFPONWDXNT-IXOXFDKPSA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- SHUFSZDAIPLZLF-BEAPCOKYSA-N Phe-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N)O SHUFSZDAIPLZLF-BEAPCOKYSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 102100038374 Pinin Human genes 0.000 description 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 1
- 101710093976 Plasmid-derived single-stranded DNA-binding protein Proteins 0.000 description 1
- 102100029799 Polycomb group protein ASXL1 Human genes 0.000 description 1
- 102100031338 Polycomb protein EED Human genes 0.000 description 1
- 102100030702 Polycomb protein SUZ12 Human genes 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- 108010009975 Positive Regulatory Domain I-Binding Factor 1 Proteins 0.000 description 1
- 102100022807 Potassium voltage-gated channel subfamily H member 2 Human genes 0.000 description 1
- 102100040171 Pre-B-cell leukemia transcription factor 1 Human genes 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- OYEUSRAZOGIDBY-JYJNAYRXSA-N Pro-Arg-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OYEUSRAZOGIDBY-JYJNAYRXSA-N 0.000 description 1
- UVKNEILZSJMKSR-FXQIFTODSA-N Pro-Asn-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1 UVKNEILZSJMKSR-FXQIFTODSA-N 0.000 description 1
- ILMLVTGTUJPQFP-FXQIFTODSA-N Pro-Asp-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ILMLVTGTUJPQFP-FXQIFTODSA-N 0.000 description 1
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 1
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- XJROSHJRQTXWAE-XGEHTFHBSA-N Pro-Cys-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XJROSHJRQTXWAE-XGEHTFHBSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- GBRUQFBAJOKCTF-DCAQKATOSA-N Pro-His-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O GBRUQFBAJOKCTF-DCAQKATOSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- PKHDJFHFMGQMPS-RCWTZXSCSA-N Pro-Thr-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PKHDJFHFMGQMPS-RCWTZXSCSA-N 0.000 description 1
- IALSFJSONJZBKB-HRCADAONSA-N Pro-Tyr-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N3CCC[C@@H]3C(=O)O IALSFJSONJZBKB-HRCADAONSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- PGSWNLRYYONGPE-JYJNAYRXSA-N Pro-Val-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PGSWNLRYYONGPE-JYJNAYRXSA-N 0.000 description 1
- 101710101148 Probable 6-oxopurine nucleoside phosphorylase Proteins 0.000 description 1
- 102100037434 Probable ATP-dependent RNA helicase DDX5 Human genes 0.000 description 1
- 102100031031 Probable global transcription activator SNF2L1 Human genes 0.000 description 1
- 102100040477 Prolyl 4-hydroxylase subunit alpha-1 Human genes 0.000 description 1
- 108700003766 Promyelocytic Leukemia Zinc Finger Proteins 0.000 description 1
- 108010072866 Prostate-Specific Antigen Proteins 0.000 description 1
- 102100038358 Prostate-specific antigen Human genes 0.000 description 1
- 102100026286 Protein AF-10 Human genes 0.000 description 1
- 102100040638 Protein AF-17 Human genes 0.000 description 1
- 102100039686 Protein AF-9 Human genes 0.000 description 1
- 102100026036 Protein BTG1 Human genes 0.000 description 1
- 102100026034 Protein BTG2 Human genes 0.000 description 1
- 102100035251 Protein C-ets-1 Human genes 0.000 description 1
- 102100024952 Protein CBFA2T1 Human genes 0.000 description 1
- 102100033812 Protein CBFA2T3 Human genes 0.000 description 1
- 102100026113 Protein DEK Human genes 0.000 description 1
- 102100033813 Protein ENL Human genes 0.000 description 1
- 102100026375 Protein PML Human genes 0.000 description 1
- 108010078762 Protein Precursors Proteins 0.000 description 1
- 102000014961 Protein Precursors Human genes 0.000 description 1
- 102100037687 Protein SSX1 Human genes 0.000 description 1
- 102100037686 Protein SSX2 Human genes 0.000 description 1
- 102100037727 Protein SSX4 Human genes 0.000 description 1
- 102100038777 Protein capicua homolog Human genes 0.000 description 1
- 102100038231 Protein lyl-1 Human genes 0.000 description 1
- QVDSEJDULKLHCG-UHFFFAOYSA-N Psilocybine Natural products C1=CC(OP(O)(O)=O)=C2C(CCN(C)C)=CNC2=C1 QVDSEJDULKLHCG-UHFFFAOYSA-N 0.000 description 1
- 102000030764 Purine-nucleoside phosphorylase Human genes 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 102100023449 RNA polymerase II elongation factor ELL Human genes 0.000 description 1
- 102100024939 RNA-binding motif protein, X chromosome Human genes 0.000 description 1
- 102100029244 RNA-binding protein 15 Human genes 0.000 description 1
- 108090000740 RNA-binding protein EWS Proteins 0.000 description 1
- 102000004229 RNA-binding protein EWS Human genes 0.000 description 1
- 102000003890 RNA-binding protein FUS Human genes 0.000 description 1
- 108090000292 RNA-binding protein FUS Proteins 0.000 description 1
- 108700040655 RUNX1 Translocation Partner 1 Proteins 0.000 description 1
- 101000613608 Rattus norvegicus Monocyte to macrophage differentiation factor Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102100038042 Retinoblastoma-associated protein Human genes 0.000 description 1
- 102100035178 Retinoic acid receptor RXR-alpha Human genes 0.000 description 1
- 102100023606 Retinoic acid receptor alpha Human genes 0.000 description 1
- 102100024869 Rhombotin-1 Human genes 0.000 description 1
- 102100023876 Rhombotin-2 Human genes 0.000 description 1
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 1
- 102100032741 SET-binding protein Human genes 0.000 description 1
- RYMZZMVNJRMUDD-UHFFFAOYSA-N SJ000286063 Natural products C12C(OC(=O)C(C)(C)CC)CC(C)C=C2C=CC(C)C1CCC1CC(O)CC(=O)O1 RYMZZMVNJRMUDD-UHFFFAOYSA-N 0.000 description 1
- 108700028341 SMARCB1 Proteins 0.000 description 1
- 101150008214 SMARCB1 gene Proteins 0.000 description 1
- 108010017324 STAT3 Transcription Factor Proteins 0.000 description 1
- 108010019992 STAT4 Transcription Factor Proteins 0.000 description 1
- 102000005886 STAT4 Transcription Factor Human genes 0.000 description 1
- 101150063267 STAT5B gene Proteins 0.000 description 1
- 108010011005 STAT6 Transcription Factor Proteins 0.000 description 1
- 102000013968 STAT6 Transcription Factor Human genes 0.000 description 1
- 102100025746 SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily B member 1 Human genes 0.000 description 1
- 102100024777 SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily D member 1 Human genes 0.000 description 1
- 102100031029 SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily E member 1 Human genes 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 102100037191 Sal-like protein 3 Human genes 0.000 description 1
- 101000702553 Schistosoma mansoni Antigen Sm21.7 Proteins 0.000 description 1
- 101000714192 Schistosoma mansoni Tegument antigen Proteins 0.000 description 1
- 102100036750 Separin Human genes 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- NLQUOHDCLSFABG-GUBZILKMSA-N Ser-Arg-Arg Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NLQUOHDCLSFABG-GUBZILKMSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- HBOABDXGTMMDSE-GUBZILKMSA-N Ser-Arg-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O HBOABDXGTMMDSE-GUBZILKMSA-N 0.000 description 1
- VGNYHOBZJKWRGI-CIUDSAMLSA-N Ser-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO VGNYHOBZJKWRGI-CIUDSAMLSA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- VAIZFHMTBFYJIA-ACZMJKKPSA-N Ser-Asp-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O VAIZFHMTBFYJIA-ACZMJKKPSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- BLPYXIXXCFVIIF-FXQIFTODSA-N Ser-Cys-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N)CN=C(N)N BLPYXIXXCFVIIF-FXQIFTODSA-N 0.000 description 1
- FMDHKPRACUXATF-ACZMJKKPSA-N Ser-Gln-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O FMDHKPRACUXATF-ACZMJKKPSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- SMIDBHKWSYUBRZ-ACZMJKKPSA-N Ser-Glu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O SMIDBHKWSYUBRZ-ACZMJKKPSA-N 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- HMRAQFJFTOLDKW-GUBZILKMSA-N Ser-His-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMRAQFJFTOLDKW-GUBZILKMSA-N 0.000 description 1
- DLPXTCTVNDTYGJ-JBDRJPRFSA-N Ser-Ile-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(O)=O DLPXTCTVNDTYGJ-JBDRJPRFSA-N 0.000 description 1
- KCNSGAMPBPYUAI-CIUDSAMLSA-N Ser-Leu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KCNSGAMPBPYUAI-CIUDSAMLSA-N 0.000 description 1
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 1
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- CKDXFSPMIDSMGV-GUBZILKMSA-N Ser-Pro-Val Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O CKDXFSPMIDSMGV-GUBZILKMSA-N 0.000 description 1
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 1
- FZNNGIHSIPKFRE-QEJZJMRPSA-N Ser-Trp-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O FZNNGIHSIPKFRE-QEJZJMRPSA-N 0.000 description 1
- VAIWUNAAPZZGRI-IHPCNDPISA-N Ser-Trp-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)NC(=O)[C@H](CO)N VAIWUNAAPZZGRI-IHPCNDPISA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- PMTWIUBUQRGCSB-FXQIFTODSA-N Ser-Val-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O PMTWIUBUQRGCSB-FXQIFTODSA-N 0.000 description 1
- 102100022978 Sex-determining region Y protein Human genes 0.000 description 1
- 102100024040 Signal transducer and activator of transcription 3 Human genes 0.000 description 1
- 102100024474 Signal transducer and activator of transcription 5B Human genes 0.000 description 1
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 1
- 108091007415 Small Cajal body-specific RNA Proteins 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020003224 Small Nucleolar RNA Proteins 0.000 description 1
- 102000042773 Small Nucleolar RNA Human genes 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 102100027780 Splicing factor, proline- and glutamine-rich Human genes 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 102100026939 Suppressor of fused homolog Human genes 0.000 description 1
- 102100029848 T-box transcription factor TBX18 Human genes 0.000 description 1
- 102100036839 T-box transcription factor TBX22 Human genes 0.000 description 1
- 102100038409 T-box transcription factor TBX3 Human genes 0.000 description 1
- 102100040365 T-cell acute lymphocytic leukemia protein 1 Human genes 0.000 description 1
- 102100025039 T-cell acute lymphocytic leukemia protein 2 Human genes 0.000 description 1
- 102100033111 T-cell leukemia homeobox protein 1 Human genes 0.000 description 1
- 102100032568 T-cell leukemia homeobox protein 3 Human genes 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 102100026140 TCF3 fusion partner Human genes 0.000 description 1
- 108091007283 TRIM24 Proteins 0.000 description 1
- 102100035051 TSC22 domain family protein 1 Human genes 0.000 description 1
- 102100029222 Teashirt homolog 3 Human genes 0.000 description 1
- GUGOEEXESWIERI-UHFFFAOYSA-N Terfenadine Chemical compound C1=CC(C(C)(C)C)=CC=C1C(O)CCCN1CCC(C(O)(C=2C=CC=CC=2)C=2C=CC=CC=2)CC1 GUGOEEXESWIERI-UHFFFAOYSA-N 0.000 description 1
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- XYEXCEPTALHNEV-RCWTZXSCSA-N Thr-Arg-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XYEXCEPTALHNEV-RCWTZXSCSA-N 0.000 description 1
- GKMYGVQDGVYCPC-IUKAMOBKSA-N Thr-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H]([C@@H](C)O)N GKMYGVQDGVYCPC-IUKAMOBKSA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- GKWNLDNXMMLRMC-GLLZPBPUSA-N Thr-Glu-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O GKWNLDNXMMLRMC-GLLZPBPUSA-N 0.000 description 1
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- NQVDGKYAUHTCME-QTKMDUPCSA-N Thr-His-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O NQVDGKYAUHTCME-QTKMDUPCSA-N 0.000 description 1
- ADPHPKGWVDHWML-PPCPHDFISA-N Thr-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N ADPHPKGWVDHWML-PPCPHDFISA-N 0.000 description 1
- IMDMLDSVUSMAEJ-HJGDQZAQSA-N Thr-Leu-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IMDMLDSVUSMAEJ-HJGDQZAQSA-N 0.000 description 1
- ODXKUIGEPAGKKV-KATARQTJSA-N Thr-Leu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N)O ODXKUIGEPAGKKV-KATARQTJSA-N 0.000 description 1
- VTVVYQOXJCZVEB-WDCWCFNPSA-N Thr-Leu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O VTVVYQOXJCZVEB-WDCWCFNPSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- PUEWAXRPXOEQOW-HJGDQZAQSA-N Thr-Met-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O PUEWAXRPXOEQOW-HJGDQZAQSA-N 0.000 description 1
- LKJCABTUFGTPPY-HJGDQZAQSA-N Thr-Pro-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O LKJCABTUFGTPPY-HJGDQZAQSA-N 0.000 description 1
- GFRIEEKFXOVPIR-RHYQMDGZSA-N Thr-Pro-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O GFRIEEKFXOVPIR-RHYQMDGZSA-N 0.000 description 1
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 1
- DOBIBIXIHJKVJF-XKBZYTNZSA-N Thr-Ser-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DOBIBIXIHJKVJF-XKBZYTNZSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- CJEHCEOXPLASCK-MEYUZBJRSA-N Thr-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=C(O)C=C1 CJEHCEOXPLASCK-MEYUZBJRSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- FYBFTPLPAXZBOY-KKHAAJSZSA-N Thr-Val-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O FYBFTPLPAXZBOY-KKHAAJSZSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- MNYNCKZAEIAONY-XGEHTFHBSA-N Thr-Val-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O MNYNCKZAEIAONY-XGEHTFHBSA-N 0.000 description 1
- 102100029689 Thyroid hormone receptor-associated protein 3 Human genes 0.000 description 1
- 102100028094 Thyroid receptor-interacting protein 11 Human genes 0.000 description 1
- 102100021386 Trans-acting T-cell-specific transcription factor GATA-3 Human genes 0.000 description 1
- 108010057666 Transcription Factor CHOP Proteins 0.000 description 1
- 102000004853 Transcription Factor DP1 Human genes 0.000 description 1
- 108090001097 Transcription Factor DP1 Proteins 0.000 description 1
- 102100031027 Transcription activator BRG1 Human genes 0.000 description 1
- 102100026430 Transcription elongation factor A protein 1 Human genes 0.000 description 1
- 102100040393 Transcription elongation regulator 1 Human genes 0.000 description 1
- 102100021123 Transcription factor 12 Human genes 0.000 description 1
- 102100035101 Transcription factor 7-like 2 Human genes 0.000 description 1
- 102100033331 Transcription factor AP-2-delta Human genes 0.000 description 1
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 1
- 102100028507 Transcription factor E3 Human genes 0.000 description 1
- 102100028502 Transcription factor EB Human genes 0.000 description 1
- 102100039580 Transcription factor ETV6 Human genes 0.000 description 1
- 102100039189 Transcription factor Maf Human genes 0.000 description 1
- 102100023234 Transcription factor MafB Human genes 0.000 description 1
- 102100030243 Transcription factor SOX-17 Human genes 0.000 description 1
- 102100030249 Transcription factor SOX-18 Human genes 0.000 description 1
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 1
- 102100030247 Transcription factor SOX-21 Human genes 0.000 description 1
- 102100024271 Transcription factor SOX-30 Human genes 0.000 description 1
- 102100036692 Transcription factor SOX-5 Human genes 0.000 description 1
- 102100035222 Transcription initiation factor TFIID subunit 1 Human genes 0.000 description 1
- 102100025171 Transcription initiation factor TFIID subunit 12 Human genes 0.000 description 1
- 102100022011 Transcription intermediary factor 1-alpha Human genes 0.000 description 1
- 102100035559 Transcriptional activator GLI3 Human genes 0.000 description 1
- 102100030780 Transcriptional activator Myb Human genes 0.000 description 1
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 1
- 102100032762 Transformation/transcription domain-associated protein Human genes 0.000 description 1
- BIJDDZBDSJLWJY-PJODQICGSA-N Trp-Ala-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O BIJDDZBDSJLWJY-PJODQICGSA-N 0.000 description 1
- PMIJXCLOQFMOKZ-BPUTZDHNSA-N Trp-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N PMIJXCLOQFMOKZ-BPUTZDHNSA-N 0.000 description 1
- NXJZCPKZIKTYLX-XEGUGMAKSA-N Trp-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NXJZCPKZIKTYLX-XEGUGMAKSA-N 0.000 description 1
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 1
- OZUJUVFWMHTWCZ-HOCLYGCPSA-N Trp-Gly-His Chemical compound N[C@@H](Cc1c[nH]c2ccccc12)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O OZUJUVFWMHTWCZ-HOCLYGCPSA-N 0.000 description 1
- WMBFONUKQXGLMU-WDSOQIARSA-N Trp-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WMBFONUKQXGLMU-WDSOQIARSA-N 0.000 description 1
- JZSLIZLZGWOJBJ-PMVMPFDFSA-N Trp-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N JZSLIZLZGWOJBJ-PMVMPFDFSA-N 0.000 description 1
- HWCBFXAWVTXXHZ-NYVOZVTQSA-N Trp-Ser-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N HWCBFXAWVTXXHZ-NYVOZVTQSA-N 0.000 description 1
- GLNADSQYFUSGOU-GPTZEZBUSA-J Trypan blue Chemical compound [Na+].[Na+].[Na+].[Na+].C1=C(S([O-])(=O)=O)C=C2C=C(S([O-])(=O)=O)C(/N=N/C3=CC=C(C=C3C)C=3C=C(C(=CC=3)\N=N\C=3C(=CC4=CC(=CC(N)=C4C=3O)S([O-])(=O)=O)S([O-])(=O)=O)C)=C(O)C2=C1N GLNADSQYFUSGOU-GPTZEZBUSA-J 0.000 description 1
- 108010047933 Tumor Necrosis Factor alpha-Induced Protein 3 Proteins 0.000 description 1
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 1
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 1
- 102100024596 Tumor necrosis factor alpha-induced protein 3 Human genes 0.000 description 1
- SCCKSNREWHMKOJ-SRVKXCTJSA-N Tyr-Asn-Ser Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O SCCKSNREWHMKOJ-SRVKXCTJSA-N 0.000 description 1
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 1
- IXTQGBGHWQEEDE-AVGNSLFASA-N Tyr-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IXTQGBGHWQEEDE-AVGNSLFASA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- BODHJXJNRVRKFA-BZSNNMDCSA-N Tyr-Cys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BODHJXJNRVRKFA-BZSNNMDCSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- KEHKBBUYZWAMHL-DZKIICNBSA-N Tyr-Gln-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O KEHKBBUYZWAMHL-DZKIICNBSA-N 0.000 description 1
- CNLKDWSAORJEMW-KWQFWETISA-N Tyr-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O CNLKDWSAORJEMW-KWQFWETISA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- QKXAEWMHAAVVGS-KKUMJFAQSA-N Tyr-Pro-Glu Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O QKXAEWMHAAVVGS-KKUMJFAQSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- 102100022596 Tyrosine-protein kinase ABL1 Human genes 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- REJBPZVUHYNMEN-LSJOCFKGSA-N Val-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N REJBPZVUHYNMEN-LSJOCFKGSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- DCOOGDCRFXXQNW-ZKWXMUAHSA-N Val-Asn-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DCOOGDCRFXXQNW-ZKWXMUAHSA-N 0.000 description 1
- GXAZTLJYINLMJL-LAEOZQHASA-N Val-Asn-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GXAZTLJYINLMJL-LAEOZQHASA-N 0.000 description 1
- LIQJSDDOULTANC-QSFUFRPTSA-N Val-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N LIQJSDDOULTANC-QSFUFRPTSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- TZVUSFMQWPWHON-NHCYSSNCSA-N Val-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N TZVUSFMQWPWHON-NHCYSSNCSA-N 0.000 description 1
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- IWZYXFRGWKEKBJ-GVXVVHGQSA-N Val-Gln-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N IWZYXFRGWKEKBJ-GVXVVHGQSA-N 0.000 description 1
- VFOHXOLPLACADK-GVXVVHGQSA-N Val-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N VFOHXOLPLACADK-GVXVVHGQSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 1
- DLMNFMXSNGTSNJ-PYJNHQTQSA-N Val-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](C(C)C)N DLMNFMXSNGTSNJ-PYJNHQTQSA-N 0.000 description 1
- KDKLLPMFFGYQJD-CYDGBPFRSA-N Val-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N KDKLLPMFFGYQJD-CYDGBPFRSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- KNYHAWKHFQRYOX-PYJNHQTQSA-N Val-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N KNYHAWKHFQRYOX-PYJNHQTQSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- MLADEWAIYAPAAU-IHRRRGAJSA-N Val-Lys-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N MLADEWAIYAPAAU-IHRRRGAJSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- AJNUKMZFHXUBMK-GUBZILKMSA-N Val-Ser-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N AJNUKMZFHXUBMK-GUBZILKMSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- WUFHZIRMAZZWRS-OSUNSFLBSA-N Val-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C(C)C)N WUFHZIRMAZZWRS-OSUNSFLBSA-N 0.000 description 1
- UFCHCOKFAGOQSF-BQFCYCMXSA-N Val-Trp-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N UFCHCOKFAGOQSF-BQFCYCMXSA-N 0.000 description 1
- QHSSPPHOHJSTML-HOCLYGCPSA-N Val-Trp-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)NCC(=O)O)N QHSSPPHOHJSTML-HOCLYGCPSA-N 0.000 description 1
- RFZFBOQPPFCOKG-BZSNNMDCSA-N Val-Trp-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCSC)C(=O)O)N RFZFBOQPPFCOKG-BZSNNMDCSA-N 0.000 description 1
- SVLAAUGFIHSJPK-JYJNAYRXSA-N Val-Trp-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CO)C(=O)O)N SVLAAUGFIHSJPK-JYJNAYRXSA-N 0.000 description 1
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- LLJLBRRXKZTTRD-GUBZILKMSA-N Val-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N LLJLBRRXKZTTRD-GUBZILKMSA-N 0.000 description 1
- JVGDAEKKZKKZFO-RCWTZXSCSA-N Val-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C(C)C)N)O JVGDAEKKZKKZFO-RCWTZXSCSA-N 0.000 description 1
- HDOVUKNUBWVHOX-QMMMGPOBSA-N Valacyclovir Chemical compound N1C(N)=NC(=O)C2=C1N(COCCOC(=O)[C@@H](N)C(C)C)C=N2 HDOVUKNUBWVHOX-QMMMGPOBSA-N 0.000 description 1
- 102100025139 Valacyclovir hydrolase Human genes 0.000 description 1
- 101710130607 Valacyclovir hydrolase Proteins 0.000 description 1
- WPVFJKSGQUFQAP-GKAPJAKFSA-N Valcyte Chemical compound N1C(N)=NC(=O)C2=C1N(COC(CO)COC(=O)[C@@H](N)C(C)C)C=N2 WPVFJKSGQUFQAP-GKAPJAKFSA-N 0.000 description 1
- 102000040856 WT1 Human genes 0.000 description 1
- 108700020467 WT1 Proteins 0.000 description 1
- 101150084041 WT1 gene Proteins 0.000 description 1
- 102100027548 WW domain-containing transcription regulator protein 1 Human genes 0.000 description 1
- 102100038151 X-box-binding protein 1 Human genes 0.000 description 1
- 102000056014 X-linked Nuclear Human genes 0.000 description 1
- 108700042462 X-linked Nuclear Proteins 0.000 description 1
- 108700031763 Xeroderma Pigmentosum Group D Proteins 0.000 description 1
- 102100023405 Zinc finger X-chromosomal protein Human genes 0.000 description 1
- 102100040314 Zinc finger and BTB domain-containing protein 16 Human genes 0.000 description 1
- 102100021146 Zinc finger and BTB domain-containing protein 20 Human genes 0.000 description 1
- 102100021114 Zinc finger imprinted 2 Human genes 0.000 description 1
- 102100039975 Zinc finger protein 208 Human genes 0.000 description 1
- 102100036559 Zinc finger protein 226 Human genes 0.000 description 1
- 102100024661 Zinc finger protein 331 Human genes 0.000 description 1
- 102100040731 Zinc finger protein 384 Human genes 0.000 description 1
- 102100029042 Zinc finger protein 469 Human genes 0.000 description 1
- 102100023632 Zinc finger protein 595 Human genes 0.000 description 1
- 102100035806 Zinc finger protein 638 Human genes 0.000 description 1
- 102100026200 Zinc finger protein PLAG1 Human genes 0.000 description 1
- 102100023495 Zinc finger protein ZIC 3 Human genes 0.000 description 1
- 102100030619 Zinc finger transcription factor Trps1 Human genes 0.000 description 1
- 102100025093 Zinc fingers and homeoboxes protein 2 Human genes 0.000 description 1
- PIOKUWLZUXUBCO-FJFJXFQQSA-N [[(2R,3S,4S,5R)-5-(6-amino-2-fluoropurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=NC=2C(N)=NC(F)=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@@H]1O PIOKUWLZUXUBCO-FJFJXFQQSA-N 0.000 description 1
- 230000003187 abdominal effect Effects 0.000 description 1
- 229940022698 acetylcholinesterase Drugs 0.000 description 1
- 229960004150 aciclovir Drugs 0.000 description 1
- MKUXAQIIEYXACX-UHFFFAOYSA-N aciclovir Chemical compound N1C(N)=NC(=O)C2=C1N(COCCO)C=N2 MKUXAQIIEYXACX-UHFFFAOYSA-N 0.000 description 1
- 230000002730 additional effect Effects 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 102000005922 amidase Human genes 0.000 description 1
- 230000001093 anti-cancer Effects 0.000 description 1
- 230000003110 anti-inflammatory effect Effects 0.000 description 1
- 229940082992 antihypertensives mao inhibitors Drugs 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010094001 arginyl-tryptophyl-arginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- ANZXOIAKUNOVQU-UHFFFAOYSA-N bambuterol Chemical compound CN(C)C(=O)OC1=CC(OC(=O)N(C)C)=CC(C(O)CNC(C)(C)C)=C1 ANZXOIAKUNOVQU-UHFFFAOYSA-N 0.000 description 1
- 229960003060 bambuterol Drugs 0.000 description 1
- WQZGKKKJIJFFOK-FPRJBGLDSA-N beta-D-galactose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-FPRJBGLDSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000000981 bystander Effects 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 229960000830 captopril Drugs 0.000 description 1
- FAKRSMQSSFJEIM-RQJHMYQMSA-N captopril Chemical compound SC[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O FAKRSMQSSFJEIM-RQJHMYQMSA-N 0.000 description 1
- FFGPTBGBLSHEPO-UHFFFAOYSA-N carbamazepine Chemical compound C1=CC2=CC=CC=C2N(C(=O)N)C2=CC=CC=C21 FFGPTBGBLSHEPO-UHFFFAOYSA-N 0.000 description 1
- 229960000623 carbamazepine Drugs 0.000 description 1
- OFZCIYFFPZCNJE-UHFFFAOYSA-N carisoprodol Chemical compound NC(=O)OCC(C)(CCC)COC(=O)NC(C)C OFZCIYFFPZCNJE-UHFFFAOYSA-N 0.000 description 1
- 229960004587 carisoprodol Drugs 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 229940083181 centrally acting adntiadrenergic agent methyldopa Drugs 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 208000006990 cholangiocarcinoma Diseases 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 229960004397 cyclophosphamide Drugs 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 239000003145 cytotoxic factor Substances 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000011026 diafiltration Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- NLORYLAYLIXTID-ISLYRVAYSA-N diethylstilbestrol diphosphate Chemical compound C=1C=C(OP(O)(O)=O)C=CC=1C(/CC)=C(\CC)C1=CC=C(OP(O)(O)=O)C=C1 NLORYLAYLIXTID-ISLYRVAYSA-N 0.000 description 1
- 108010009297 diglycyl-histidine Proteins 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000002900 effect on cell Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 229960000873 enalapril Drugs 0.000 description 1
- GBXSMTUPTTWBMN-XIRDDKMYSA-N enalapril Chemical compound C([C@@H](C(=O)OCC)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(O)=O)CC1=CC=CC=C1 GBXSMTUPTTWBMN-XIRDDKMYSA-N 0.000 description 1
- 108010018033 endothelial PAS domain-containing protein 1 Proteins 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 229960004396 famciclovir Drugs 0.000 description 1
- GGXKWVWZWMLJEH-UHFFFAOYSA-N famcyclovir Chemical compound N1=C(N)N=C2N(CCC(COC(=O)C)COC(C)=O)C=NC2=C1 GGXKWVWZWMLJEH-UHFFFAOYSA-N 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000000684 flow cytometry Methods 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 229960000297 fosfestrol Drugs 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- TZDUHAJSIBHXDL-UHFFFAOYSA-N gabapentin enacarbil Chemical compound CC(C)C(=O)OC(C)OC(=O)NCC1(CC(O)=O)CCCCC1 TZDUHAJSIBHXDL-UHFFFAOYSA-N 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 229940077374 ganciclovir injection Drugs 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 1
- 108010073628 glutamyl-valyl-phenylalanine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000009931 harmful effect Effects 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 230000002443 hepatoprotective effect Effects 0.000 description 1
- 231100000086 high toxicity Toxicity 0.000 description 1
- 108010045383 histidyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010021685 homeobox protein HOXA13 Proteins 0.000 description 1
- 108010027263 homeobox protein HOXA9 Proteins 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000003301 hydrolyzing effect Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 239000002955 immunomodulating agent Substances 0.000 description 1
- 229940121354 immunomodulator Drugs 0.000 description 1
- 229960001438 immunostimulant agent Drugs 0.000 description 1
- 239000003022 immunostimulating agent Substances 0.000 description 1
- 230000001506 immunosuppresive effect Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- OGQSCIYDJSNCMY-UHFFFAOYSA-H iron(3+);methyl-dioxido-oxo-$l^{5}-arsane Chemical compound [Fe+3].[Fe+3].C[As]([O-])([O-])=O.C[As]([O-])([O-])=O.C[As]([O-])([O-])=O OGQSCIYDJSNCMY-UHFFFAOYSA-H 0.000 description 1
- 229960002725 isoflurane Drugs 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 210000001865 kupffer cell Anatomy 0.000 description 1
- VHOGYURTWQBHIL-UHFFFAOYSA-N leflunomide Chemical compound O1N=CC(C(=O)NC=2C=CC(=CC=2)C(F)(F)F)=C1C VHOGYURTWQBHIL-UHFFFAOYSA-N 0.000 description 1
- 229960000681 leflunomide Drugs 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010090333 leucyl-lysyl-proline Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 229960004502 levodopa Drugs 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000013332 literature search Methods 0.000 description 1
- 238000010859 live-cell imaging Methods 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 210000005228 liver tissue Anatomy 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 102100034702 mRNA decay activator protein ZFP36L1 Human genes 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- GLVAUDGFNGKCSF-UHFFFAOYSA-N mercaptopurine Chemical compound S=C1NC=NC2=C1NC=N2 GLVAUDGFNGKCSF-UHFFFAOYSA-N 0.000 description 1
- 229960001428 mercaptopurine Drugs 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 108010063431 methionyl-aspartyl-glycine Proteins 0.000 description 1
- 108010005942 methionylglycine Proteins 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 229960004857 mitomycin Drugs 0.000 description 1
- XLFWDASMENKTKL-UHFFFAOYSA-N molsidomine Chemical compound O1C(N=C([O-])OCC)=C[N+](N2CCOCC2)=N1 XLFWDASMENKTKL-UHFFFAOYSA-N 0.000 description 1
- 229960004027 molsidomine Drugs 0.000 description 1
- 239000002899 monoamine oxidase inhibitor Substances 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- 229960004270 nabumetone Drugs 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 210000004882 non-tumor cell Anatomy 0.000 description 1
- QQBDLJCYGRGAKP-FOCLMDBBSA-N olsalazine Chemical compound C1=C(O)C(C(=O)O)=CC(\N=N\C=2C=C(C(O)=CC=2)C(O)=O)=C1 QQBDLJCYGRGAKP-FOCLMDBBSA-N 0.000 description 1
- 229960004110 olsalazine Drugs 0.000 description 1
- 229960000381 omeprazole Drugs 0.000 description 1
- 230000002246 oncogenic effect Effects 0.000 description 1
- 230000000174 oncolytic effect Effects 0.000 description 1
- 230000002669 organ and tissue protective effect Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000000242 pagocytic effect Effects 0.000 description 1
- 229960001057 paliperidone Drugs 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229930192851 perforin Natural products 0.000 description 1
- 210000003200 peritoneal cavity Anatomy 0.000 description 1
- 229940124531 pharmaceutical excipient Drugs 0.000 description 1
- 229960003893 phenacetin Drugs 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000013105 post hoc analysis Methods 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- DQMZLTXERSFNPB-UHFFFAOYSA-N primidone Chemical compound C=1C=CC=CC=1C1(CC)C(=O)NCNC1=O DQMZLTXERSFNPB-UHFFFAOYSA-N 0.000 description 1
- 229960002393 primidone Drugs 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- SSOLNOMRVKKSON-UHFFFAOYSA-N proguanil Chemical compound CC(C)\N=C(/N)N=C(N)NC1=CC=C(Cl)C=C1 SSOLNOMRVKKSON-UHFFFAOYSA-N 0.000 description 1
- 229960005385 proguanil Drugs 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 230000009993 protective function Effects 0.000 description 1
- QKTAAWLCLHMUTJ-UHFFFAOYSA-N psilocybin Chemical compound C1C=CC(OP(O)(O)=O)=C2C(CCN(C)C)=CN=C21 QKTAAWLCLHMUTJ-UHFFFAOYSA-N 0.000 description 1
- 229960003401 ramipril Drugs 0.000 description 1
- HDACQVRGBOVJII-JBDAPHQKSA-N ramipril Chemical compound C([C@@H](C(=O)OCC)N[C@@H](C)C(=O)N1[C@@H](C[C@@H]2CCC[C@@H]21)C(O)=O)CC1=CC=CC=C1 HDACQVRGBOVJII-JBDAPHQKSA-N 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 108091008020 response regulators Proteins 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 108010063779 seryl-tyrosyl-prolyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000002924 silencing RNA Substances 0.000 description 1
- 229960002855 simvastatin Drugs 0.000 description 1
- RYMZZMVNJRMUDD-HGQWONQESA-N simvastatin Chemical compound C([C@H]1[C@@H](C)C=CC2=C[C@H](C)C[C@@H]([C@H]12)OC(=O)C(C)(C)CC)C[C@@H]1C[C@@H](O)CC(=O)O1 RYMZZMVNJRMUDD-HGQWONQESA-N 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 210000004872 soft tissue Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000010911 splenectomy Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- NCEXYHBECQHGNR-QZQOTICOSA-N sulfasalazine Chemical compound C1=C(O)C(C(=O)O)=CC(\N=N\C=2C=CC(=CC=2)S(=O)(=O)NC=2N=CC=CC=2)=C1 NCEXYHBECQHGNR-QZQOTICOSA-N 0.000 description 1
- 229960001940 sulfasalazine Drugs 0.000 description 1
- NCEXYHBECQHGNR-UHFFFAOYSA-N sulfasalazine Natural products C1=C(O)C(C(=O)O)=CC(N=NC=2C=CC(=CC=2)S(=O)(=O)NC=2N=CC=CC=2)=C1 NCEXYHBECQHGNR-UHFFFAOYSA-N 0.000 description 1
- 229960000894 sulindac Drugs 0.000 description 1
- MLKXDPUZXIRXEP-MFOYZWKCSA-N sulindac Chemical compound CC1=C(CC(O)=O)C2=CC(F)=CC=C2\C1=C/C1=CC=C(S(C)=O)C=C1 MLKXDPUZXIRXEP-MFOYZWKCSA-N 0.000 description 1
- 238000012385 systemic delivery Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- WFWLQNSHRPWKFK-ZCFIWIBFSA-N tegafur Chemical compound O=C1NC(=O)C(F)=CN1[C@@H]1OCCC1 WFWLQNSHRPWKFK-ZCFIWIBFSA-N 0.000 description 1
- 229960001674 tegafur Drugs 0.000 description 1
- 229960000351 terfenadine Drugs 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 235000019157 thiamine Nutrition 0.000 description 1
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 1
- 229960003495 thiamine Drugs 0.000 description 1
- 239000011721 thiamine Substances 0.000 description 1
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 1
- 230000008791 toxic response Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 210000003437 trachea Anatomy 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 230000009752 translational inhibition Effects 0.000 description 1
- 238000011277 treatment modality Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 238000005199 ultracentrifugation Methods 0.000 description 1
- 229940093257 valacyclovir Drugs 0.000 description 1
- 229960002149 valganciclovir Drugs 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 210000005166 vasculature Anatomy 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000036642 wellbeing Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K45/00—Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
- A61K45/06—Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
- C12N2330/10—Production naturally occurring
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/001—Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/20—Vector systems having a special element relevant for transcription transcription of more than one cistron
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2830/00—Vector systems having a special element relevant for transcription
- C12N2830/50—Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Public Health (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Virology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Epidemiology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Steroid Compounds (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본원에 개시되는 것은 정밀한 생체내 세포 표적화를 위한 고도로 콤팩트한 다중-입력 유전자 논리 게이트를 코딩하는 인접 DNA 서열, 및 생체내 전달 및 이러한 인접 DNA 서열의 조합을 사용하여 질환을 치료하는 방법이다.
Description
본원에 개시되는 것은 정밀한 생체내 세포 표적화를 위한 고도로 콤팩트한 다중-입력 유전자 논리 게이트를 코딩하는 인접 DNA 서열, 및 생체내 전달 및 이러한 인접 DNA 서열의 조합을 사용하여 질환을 치료하는 방법이다.
유전자 요법이 유전자 질환 및 암의 차세대 치료 옵션으로 부상하고 있다. 그러나, 현재의 유전자 요법 벡터는 낮은 효능, 높은 독성, 그리고 치료를 선도하기에는 긴 개발 일정으로 어려움을 겪고 있다. 이들 결점의 한 가지 이유는 (i) 의도하지 않은 세포 유형 및 조직에서의 유전자 발현 또는 (ii) 불충분하거나 너무 높은 것 중 어느 하나인 투여량의 유전자 발현으로 이어지는, 유전자 요법 벡터에서의 치료 유전자 발현의 견고한 제어의 불충분성이다. 달리 말하면, 유전자 산물 투여량 (즉, 세포당 단백질 분자의 수) 및 세포 유형-제한 발현 양쪽 면에서의 유전자 발현의 정밀한 제어가 유전자 요법에 공공연한 과제로 남아 있다.
생체분자 컴퓨팅 및 합성 생물학에서의 연구는 (i) 분자 질환 지표의 다중-입력 센싱; (ii) 치료 반응의 강도를 결정하는 분자 수준 계산; 및 (iii) 고도로 정밀하고 조화된 방식으로의 계내에서의 요법의 강화에 기반한 새로운 유형의 치료 접근법을 가능하게 하기 위해 오래도록 추구되었다. 본원에 기재되는 것은 다수의 세포 입력의 복잡한 논리적 통합을 통한 이질적 세포 유형의 정밀한 확인을 가능하게 하는 세포 분류기 유전자 회로이다. 또한 본원에 기재되는 것은 질환을 치료하기 위해 분류기 유전자 회로를 사용하는 방법이다. 암은 건강한 세포와의 종양 유사성, 종양 이질성, 및 1차 및 2차 로커스 둘 다에서의 그의 전파로 인하여 세포 분류기 접근법으로부터 가장 이익을 얻을 질환의 부류로 간주되었다. 본원에 기재된 연구는 정밀한 세포 표적화를 위한 다중-입력 유전자 회로가 차세대의 유전자 요법을 위한 이상적인 방안이라는 개념을 지지한다.
따라서, 일부 측면에서 본 개시내용은 인접 폴리핵산 분자에 관한 것이다. 일부 실시양태에서, 인접 폴리핵산 분자는 a) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 제1 RNA를 코딩하며, 여기서 제1 RNA는 (i) 출력의 핵산 서열; 및 (ii) 표 1에 열거된 miRNA에 대한 표적 부위 또는 이들의 조합을 포함하는 것인 제1 카세트; 및 b) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트를 포함하며; 여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 제1 RNA는 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제1 RNA는 3' UTR을 포함하며, 여기서 3' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제1 RNA는 5' UTR을 포함하며, 여기서 5' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제2 RNA는 표 1에 열거된 마이크로RNA에 대한 표적 부위 또는 이들의 조합을 추가로 포함한다.
일부 실시양태에서, 여기서 제2 RNA는 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 추가로 포함한다.
일부 실시양태에서, 제2 RNA는 3' UTR을 포함하며, 여기서 3' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제2 RNA는 5' UTR을 포함하며, 여기서 5' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제1 카세트의 적어도 하나의 miRNA 표적 부위 및 제2 카세트의 적어도 하나의 miRNA 표적 부위는 동일한 핵산 서열이거나 또는 동일한 miRNA에 의해 조절되는 상이한 서열이다.
일부 실시양태에서, 제1 RNA 및 제2 RNA는 각각 let-7c 표적 부위를 포함한다.
일부 실시양태에서, 전사활성인자 반응 요소는 표 3에 열거된 핵산 서열 또는 이들의 조합을 포함한다.
일부 실시양태에서, 제2 RNA의 발현은 전사 인자 반응 요소에 작동가능하게 연결된다. 일부 실시양태에서, 전사 인자 반응 요소는 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함한다.
일부 실시양태에서, 전사활성인자는 독립적으로 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 제1 RNA의 발현은 전사 인자 반응 요소에 작동가능하게 연결된다. 일부 실시양태에서, 전사 인자 반응 요소는 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함한다.
일부 실시양태에서, 전사활성인자는 전사 인자 반응 요소에 결합된 전사 인자의 존재 하에서만 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 제1 카세트 및/또는 제2 카세트는 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 표 5에 열거된 핵산 서열 또는 이들의 조합을 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 제1 카세트는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고; 제2 카세트는 5'에서 3'으로: (i) 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소는 동일한 핵산 서열로 이루어진다.
일부 실시양태에서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소는 상이한 핵산 서열로 이루어진다.
일부 실시양태에서, 제1 카세트 및/또는 제2 카세트는 2개 이상의 전사 인자 반응 요소를 포함한다.
일부 실시양태에서, 제1 카세트 및/또는 제2 카세트는 2개의 상이한 전사 인자 반응 요소를 포함한다.
일부 실시양태에서, 제1 카세트의 상류 조절 구성요소는 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 제2 카세트의 상류 조절 구성요소는 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 제1 카세트 및 제2 카세트는 수렴형 배향으로 존재한다. 일부 실시양태에서, 제1 카세트 및 제2 카세트는 발산형 배향으로 존재한다. 일부 실시양태에서, 제1 카세트 및 제2 카세트는 머리-대-꼬리 배향으로 존재한다.
일부 실시양태에서, 제1 카세트 및/또는 제2 카세트는 인슐레이터에 의해 플랭킹된다.
일부 실시양태에서, 제2 카세트의 전사활성인자는 tTA, rtTA, PIT-RelA, PIT-VP16, ET-VP16, ET-RelA, NarLc-VP16, 또는 NarLc-RelA이다.
일부 실시양태에서, 제2 카세트의 전사활성인자는 표 2에 열거된 핵산 서열을 포함한다.
일부 실시양태에서, 출력은 단백질 또는 RNA 분자이다. 일부 실시양태에서, 출력은 치료제이다. 일부 실시양태에서, 출력은 형광 단백질, 세포독소, 전구약물 활성화를 촉매하는 효소, 면역조정 단백질 및/또는 RNA, DNA-변형 인자, 세포-표면 수용체, 유전자 발현-조절 인자, 키나제, 후성적 변형인자, 및/또는 벡터 복제에 필요한 인자, 및/또는 병원체의 항원 폴리펩티드를 코딩하는 서열이다. 일부 실시양태에서, 출력은 인간 심플렉스 헤르페스 바이러스 1로부터의 티미딘 키나제 효소 (HSV-TK)이다. 일부 실시양태에서, 상기 면역조정 단백질 및/또는 RNA는 시토카인 또는 콜로니 자극 인자이다. 일부 실시양태에서, DNA-변형 인자는 유전자 결함을 보정하도록 되어 있는 단백질을 코딩하는 유전자, DNA-변형 효소, 및/또는 DNA-변형 시스템의 구성요소이다. 일부 실시양태에서, DNA-변형 효소는 부위-특이적 레콤비나제, 귀소 엔도뉴클레아제, 또는 CRISPR/Cas DNA 변형 시스템의 단백질 구성요소이다. 일부 실시양태에서, 유전자 발현-조절 인자는 유전자 발현을 조절할 수 있는 단백질, 또는 유전자 발현을 조절할 수 있는 다중-구성요소 시스템의 구성요소이다.
일부 실시양태에서, 인접 폴리핵산 분자는 표 6에 열거된 핵산 서열을 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 (i) 출력의 핵산 서열; (ii) 전사활성인자의 핵산 서열; 및 (iii) 표 1에 열거된 miRNA에 대한 표적 부위 또는 이들의 조합을 포함하며; 여기서 전사활성인자는, 단백질로서 발현되는 경우, 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 제1 RNA는 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, RNA는 출력 및 전사활성인자의 핵산 서열들을 분리하는 폴리시스트론성 발현 요소의 핵산 서열을 추가로 포함한다.
일부 실시양태에서, RNA는 3' UTR을 포함하며, 여기서 3' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, RNA는 5' UTR을 포함하며, 여기서 5' UTR은 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함한다.
일부 실시양태에서, RNA는 let-7c 표적 부위를 포함한다.
일부 실시양태에서, 전사활성인자 반응 요소는 표 3에 열거된 핵산 서열 또는 이들의 조합을 포함한다.
일부 실시양태에서, 전사활성인자는 독립적으로 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, RNA의 발현은 전사활성인자 반응 요소 및 전사 인자 반응 요소에 작동가능하게 연결된다. 일부 실시양태에서, 전사 인자 반응 요소는 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함한다.
일부 실시양태에서, 전사활성인자는 전사 인자 반응 요소에 결합된 전사 인자의 존재 하에서만 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 카세트는 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 표 5에 열거된 핵산 서열 또는 이들의 조합을 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력 및 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, (i)에서의 상류 조절 구성요소는 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 적어도 하나의 카세트의 전사활성인자는 tTA, rtTA, PIT-RelA, PIT-VP16, ET-VP16, ET-RelA, NarLc-VP16, 또는 NarLc-RelA이다.
일부 실시양태에서, 출력은 단백질 또는 RNA 분자이다. 일부 실시양태에서, 출력은 치료 단백질 또는 RNA 분자이다. 일부 실시양태에서, 출력은 형광 단백질, 세포독소, 전구약물 활성화를 촉매하는 효소, 면역조정 단백질 및/또는 RNA, DNA-변형 인자, 세포-표면 수용체, 유전자 발현-조절 인자, 키나제, 후성적 변형인자, 및/또는 벡터 복제에 필요한 인자, 및/또는 병원체의 항원 폴리펩티드를 코딩하는 서열이다. 일부 실시양태에서, 출력은 인간 심플렉스 헤르페스 바이러스 1로부터의 티미딘 키나제 효소 (HSV-TK)이다. 일부 실시양태에서, 면역조정 단백질 및/또는 RNA는 시토카인 또는 콜로니 자극 인자이다. 일부 실시양태에서, DNA-변형 인자는 유전자 결함을 보정하도록 되어 있는 단백질을 코딩하는 유전자, DNA-변형 효소, 및/또는 DNA-변형 시스템의 구성요소이다. 일부 실시양태에서, DNA-변형 효소는 부위-특이적 레콤비나제, 귀소 엔도뉴클레아제, 또는 CRISPR/Cas 시스템의 단백질 구성요소이다. 일부 실시양태에서, 유전자 발현-조절 인자는 유전자 발현을 조절할 수 있는 단백질, 또는 유전자 발현을 조절할 수 있는 다중-구성요소 시스템의 구성요소이다.
다른 측면에서, 본 개시내용은 본원에 기재된 인접 폴리핵산을 포함하는 벡터에 관한 것이다.
다른 측면에서, 본 개시내용은 본원에 기재된 인접 폴리핵산을 포함하는 조작된 바이러스 게놈에 관한 것이다. 일부 실시양태에서, 조작된 바이러스 게놈은 아데노-연관 바이러스 (AAV) 게놈, 렌티바이러스 게놈, 아데노바이러스 게놈, 헤르페스 심플렉스 바이러스 (HSV) 게놈, 백시니아 바이러스 게놈, 폭스바이러스 게놈, 뉴캐슬병 바이러스 (NDV) 게놈, 콕사키바이러스 게놈, 레오바이러스 게놈, 홍역 바이러스 게놈, 소포성 구내염 바이러스 (VSV) 게놈, 파르보바이러스 게놈, 세네카 밸리 바이러스 게놈, 마라바 바이러스 게놈, 또는 감기 바이러스 게놈으로부터 유래된다.
다른 측면에서, 본 개시내용은 본원에 개시된 조작된 바이러스 게놈을 포함하는 비리온에 관한 것이다. 일부 실시양태에서, 비리온은 AAV-DJ, AAV8, AAV6, 또는 AAV-B1 캡시드를 포함한다.
다른 측면에서, 본 개시내용은 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법에 관한 것이다. 일부 실시양태에서, 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법은 세포의 집단을 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온과 접촉시키는 것을 포함하며, 여기서 세포의 집단은 적어도 하나의 표적 세포 유형 및 하나 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준 및/또는 활성에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준 및/또는 활성은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; 여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절된다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함한다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 이 프로모터 단편을 추가로 포함한다.
다른 측면에서, 본 개시내용은 질환 또는 병태를 진단하는 방법에 관한 것이다. 일부 실시양태에서, 질환 또는 병태를 진단하는 방법은 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온을 질환 또는 병태와 연관된 하나 이상의 징후 또는 증상을 나타내는 대상체에게 투여하는 것을 포함하며, 여기서 출력의 수준은 질환 및 또는 병태의 존재 또는 부재를 지시한다.
일부 실시양태에서, 질환은 암이다. 일부 실시양태에서, 암은 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종이다.
다른 측면에서, 본 개시내용은 질환 또는 병태를 치료하는 방법에 관한 것이다. 일부 실시양태에서, 질환 또는 병태를 치료하는 방법은 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온을 질환 또는 병태를 갖는 대상체에게 투여하는 것을 포함한다.
일부 실시양태에서, 방법은 전구약물을 투여하는 것을 추가로 포함하며, 임의적으로 여기서 전구약물은 간시클로비르이고, 여기서 임의적으로 인접 폴리핵산 분자는 표 6에 열거된 핵산 서열을 포함한다.
일부 실시양태에서, 질환은 암이다. 일부 실시양태에서, 암은 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종이다.
일부 측면에서, 본 개시내용은 세포-특이적 이벤트를 자극하는 방법에 사용하기 위한 방법에 관한 것이다. 일부 실시양태에서, 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법에 사용하기 위한 조성물은 세포의 집단을 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온과 접촉시키는 것을 포함하며, 여기서 세포의 집단은 적어도 하나의 표적 세포 유형 및 하나 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준 및/또는 활성에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준 및/또는 활성은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; 여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절된다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함한다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 이 프로모터 단편을 추가로 포함한다.
다른 측면에서, 본 개시내용은 질환 또는 병태를 진단하는 방법에 사용하기 위한 조성물에 관한 것이다. 일부 실시양태에서, 질환 또는 병태를 진단하는 방법에 사용하기 위한 조성물은 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온을 질환 또는 병태와 연관된 하나 이상의 징후 또는 증상을 나타내는 대상체에게 투여하는 것을 포함하며, 여기서 출력의 수준은 질환 및 또는 병태의 존재 또는 부재를 지시한다.
일부 실시양태에서, 질환은 암이다. 일부 실시양태에서, 암은 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종이다.
다른 측면에서, 본 개시내용은 질환 또는 병태를 치료하는 방법에 사용하기 위한 조성물에 관한 것이다. 일부 실시양태에서, 질환 또는 병태를 치료하는 방법에 사용하기 위한 조성물은 본원에 기재된 인접 폴리핵산 분자, 본원에 기재된 벡터, 본원에 기재된 조작된 바이러스 게놈, 또는 본원에 기재된 비리온을 질환 또는 병태를 갖는 대상체에게 투여하는 것을 포함한다.
일부 실시양태에서, 방법은 전구약물을 투여하는 것을 추가로 포함하며, 임의적으로 여기서 전구약물은 간시클로비르이고, 임의적으로 여기서 인접 폴리핵산 분자는 표 6에 열거된 핵산 서열을 포함한다.
일부 실시양태에서, 질환은 암이다. 일부 실시양태에서, 암은 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종이다.
다른 측면에서, 본 개시내용은 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법에 관한 것이다. 일부 실시양태에서, 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법은 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하며, 여기서: a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 비-표적 세포의 적어도 하위세트, 예컨대 적어도 2개 및 임의적으로 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; b) 인접 폴리핵산 분자는 (i) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하며, 여기서 제1 RNA는 출력의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하는 것인 제1 카세트; 및 (ii) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트를 포함하며; 여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키고; 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절된다. 일부 실시양태에서, 인접 폴리핵산 분자는 표 6에 열거된 핵산 서열을 포함한다.
일부 실시양태에서, 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법은 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하며, 여기서: a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 비-표적 세포의 적어도 하위세트, 예컨대 적어도 2개 및 임의적으로 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; b) 인접 폴리핵산 분자는 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 mRNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 출력의 핵산 서열; 전사활성인자의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하며; 여기서 전사활성인자는, 단백질로서 발현되는 경우, 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키고; 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절된다.
일부 실시양태에서, 인접 폴리핵산 분자를 포함하는 조성물은 인접 폴리핵산을 포함하는 벡터, 인접 폴리핵산을 포함하는 조작된 바이러스 게놈, 또는 폴리핵산을 포함하는 비리온을 포함한다.
일부 실시양태에서, 내인성 miRNA는 표 1에 열거된 miRNA 또는 표 1에 열거된 miRNA의 조합으로부터 선택된다. 일부 실시양태에서, 내인성 miRNA는 let-7c, let-7a, let-7b, let-7d, let-7e, let-7f, let-7g, let-7i, miR-22, miR-26b, miR-122, miR-208a, miR-208b, miR-1, miR-217, miR-216a, 또는 이들의 조합으로 이루어진 군으로부터 선택된다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함한다.
일부 실시양태에서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트는 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자는 이 프로모터 단편을 추가로 포함한다.
일부 실시양태에서, 표적 세포는 종양 세포이고, 세포-특이적 이벤트는 종양 세포 사멸이다. 일부 실시양태에서, 종양 세포 사멸은 활성화 수용체 리간드, 특이적 항원, 자극 시토카인 또는 이들의 임의의 조합의 발현을 통한 면역 표적화에 의해 매개된다.
일부 실시양태에서, 표적 세포는 노화 세포이고, 세포-특이적 이벤트는 노화 세포 사멸이다.
일부 실시양태에서, 방법은 세포의 집단을 출력에 의해 치료제 또는 독성 화합물로 대사되는 전구약물 또는 비-독성 전구체 화합물과 접촉시키는 것을 추가로 포함한다.
일부 실시양태에서, 출력 발현은, 비-표적 세포가 출력 발현의 결여로 인하여 그리고 무관하며 비특이적인 세포 사멸-유도 작용제의 존재 하에서 제거되는 동안, 표적 세포 집단의 생존을 보장한다.
일부 실시양태에서, 표적 세포는 관심의 특정한 표현형을 포함하며, 그에 따라 출력 발현은 이 특정한 표현형의 세포에 제한된다.
일부 실시양태에서, 표적 세포는 선택되는 세포 유형이고, 세포-특이적 이벤트는 자연적으로는 선택되는 세포 유형에서는 부재하거나 불활성인 유전자의 발현을 통한 신규 기능의 코딩이다.
일부 실시양태에서, 세포의 집단은 다세포 유기체를 포함한다. 일부 실시양태에서, 다세포 유기체는 동물이다. 일부 실시양태에서, 동물은 인간이다.
일부 실시양태에서, 세포의 집단은 생체외에서 접촉된다. 일부 실시양태에서, 세포의 집단은 생체내에서 접촉된다.
다른 측면에서, 본 개시내용은 인접 폴리핵산 분자에 관한 것이다. 일부 실시양태에서, 인접 폴리핵산 분자는 a) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 제1 RNA를 코딩하며, 여기서 제1 RNA는 (i) 출력의 핵산 서열; 및 (ii) miRNA에 대한 표적 부위를 포함하며, 여기서 상기 miRNA는 포유동물의 적어도 2개의 상이한 건강한 조직에서 고도로 발현되고/거나 활성이고, 표적 세포의 하나 이상의 유형에서 낮은 수준으로 발현되는 것인 제1 카세트; b) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트를 포함하며, 여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
하기하는 도면은 본 명세서의 일부를 형성하는 것으로서, 본원에 제시된 구체적인 실시양태에 대한 상세한 설명과 함께 해당 도면 중 하나 이상을 참조하면 더 잘 이해될 수 있는 본 개시내용의 특정 측면을 추가로 설명하기 위하여 포함된다. 도면에 예시되어 있는 데이터가 어떠한 방식으로도 본 개시내용의 범주를 제한하는 것은 아니라는 것이 이해되어야 한다.
도 1a-1n. 바이러스 벡터에 대한 다중-플라스미드 회로 아키텍처의 번역. 도 1a. 유전자 배열의 개략도. 발산형 (상부) 및 수렴형 (하부) 배열을 생성하였으며; 2개의 변이체를 보조 전사활성인자 PIT의 상이한 변이체를 사용하여 각각에 대해 생성하였다 (발산형: D-P2: PIT=PIT::RelA; D-PV: PIT=PIT::VPI6; 수렴형: C-P2: PIT=PIT::RelA; C-PV: PIT=PIT::VPI6). 도 1b. HeLa 세포에서의 일시적 형질감염 및 이소성 입력 발현을 사용한 백본 DNA 성능의 시험. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: C-P2, D-P2, C-PV, D-PV. 도 1c. HuH-7 및 HeLa 세포에서의 내인성 입력에 대한 구축물의 반응의 평가. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: C-P2, D-P2, C-PV, D-PV. 도 1d. miR-424 표적 서열을 사용하여 예시된 강건한 오프 스위치로서 miRNA 표적을 혼입하는 구축물의 개략도. 발산형 (상부) 및 수렴형 (하부) 배열을 생성하였으며; 2개의 변이체를 보조 전사활성인자 PIT의 상이한 변이체를 사용하여 각각에 대해 생성하였다 (발산형: D-P2: PIT=PIT::RelA-T424; D-PV: PIT=PIT::VPI6-T424; 수렴형: C-P2: PIT=PIT::RelA-T424; C-PV: PIT=PIT::VPI6-T424). 도 1e. TF 입력의 이소성 발현을 통한 HeLa 세포에서의 논리 프로그램의 AND-게이트 구성요소의 확인. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: C-P2-T424, D-P2-T424, C-PV-T424, D-PV-T424. 도 1f. HuH-7 및 HeLa 세포에서의 내인성 전사 입력에 대한 회로 반응의 평가. 막대의 순서는 도 1e와 동일하다. 도 1g. 이소성 입력 전달을 사용한 HeLa 세포에서의 발산형 배향 상에 코딩된 3-입력 프로그램의 완전한 평가. 모든 입력의 부재 하에서의 발현의 결여 및 miR-424가 음성 조절인자라는 사실을 고려하여, miR-424만이 존재하는 입력 조합은 자명한 무용으로 인하여 평가되지 않았다. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: D-P2-T424, D-PV-T424. 도 1h. 유도 TF 입력의 존재 하에서의 miRNA 스위치의 기능성. 회로 출력은 miR-424 모방체의 이소성 형질감염을 갖는 및 갖지 않는 HuH-7 세포에서 시험된다 (X 축 아래에 지시됨). 막대의 순서는 도 1g와 동일하다. 도 1i. 내인적으로 발현된 유도 TF 입력의 존재 하에서의 그들의 억제성에 관한 miR-126 표적을 갖는 회로의 평가. 막대의 순서는 도 1g와 동일하다. 도 1j. 2개의 HCC 세포주 및 음성 대조군으로서 HeLa 세포로의 세포 분류 성능에 대한 miRNA 표적 효과의 평가. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: D-P2, D-PV, D-P2-T424, D-PV-T424, C-PV-T126, D-PV-T126. 도 1k. HCC 세포주 HepG2 및 HuH-7에서의 DJ-위형화된 AAV 벡터 내로 패키징된 혼입된 miRNA 센서를 갖는 및 갖지 않는 회로 패널의 평가. HeLa 및 HCT-116 세포주는 카운터 샘플로서 사용된다. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: CMV, D-P2, D-PV, D-P2-T424, D-PV-T424, C-PV-T126, D-PV-T126. 도 1l. 건강한 1차 간세포를 HCC 세포주로부터 구별하는 그들의 능력에 대한 miRNA의 패널의 시험관내 평가. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: TFF5, T424, T126, T122. 도 1m-1n. 상이한 miRNA 표적 배열 및 출력 억제의 규모에 대한 그들의 영향의 탐구. 도 1m. 상이한 구축물 및 그들의 약칭 표기의 개략도. 도 1n. HepG2 세포 (miR-122 발현 없음) 및 HuH-7 세포 (중간 수준의 miR-122 발현)에서 생성된 출력. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: HepG2, Huh-7. 약어: ITR: AAV2의 내부 말단 반복부; pA: SV40 폴리아데닐화 신호 (수렴형 배향), 발산형 배향으로 mCherry 다음 hGH 및 PIT 유전자 다음 SV40 pA; Cherry: mCherry 형광 단백질을 코딩하는 서열; TATA: 최소 TATA 박스 (Angelici et al., 2016); HNF1 RE: HNF1A 및 HNF1B에 결합하는 반응 요소; PIT RE: PIT::RelA 및 PIT::VP16 전사활성인자에 결합하는 반응 요소; SOX RE: SOX9 및 SOX10 전사 인자, 및 가능하게는 SOX 패밀리 SOX1-SOX15, SOX17, SOX18, SOX21, SOX30, 및 SRY로부터의 다른 전사 인자에 결합하는 DNA 서열; PIT: PIT:RelA 또는 PIT::VP16 융합물 중 어느 하나를 나타내는 프리스티노마이신-유도성 전사활성인자 (Fussenegger et al., 2000). 차트 디자인: 출력 mCherry의 정규화된 발현은 Y 축 상에 제시된다.
도 2a-2f. HCC의 동소성 마우스 모델에서의 특이성 및 효능의 파일럿 평가. 도 2a. DJ-위형화된 바이러스 벡터 내로 패키징된 선택된 회로의 세포 분류 능력의 시험관내 확인. 도 2b. 구성적 대조군 벡터에 비해 HSV-TK 출력을 갖는 회로에 의한 시험관내 세포 제거. 여기서 채용된 회로의 개략도는 막대 차트 위에 제시된다. 모든 세포주 또는 1차 간세포에 대해, 간시클로비르에 대한 용량-반응 (X 축)은 구성적 HSV-TK 벡터, 회로의 존재 하에서, 및 GCV 단독으로 측정된다. 세포 생존율 MTS 판독은 Y 축 상에 제시된다. 도 2c. 패널에서 지시된 바와 같은, 파일럿 실험 (n=2)의 상이한 실험 부문에 대해 제시된 종양-보유 마우스에서의 종양 부담의 진행. 도 2d. 발광에 의해 정량화된 종결 시의 간에서의 종양 부담, 좌측의 화상은 간의 중첩 (그레이스케일) 및 생물발광 신호이다. 도 2e. 종결 후 간에서의 종양 부담의 정량적 분석. 도 2f. 접종 바로 후의 종양 부담 및 종결 시의 종양 부담 사이의 상관관계. 치료 부문으로부터의 2마리의 마우스는 2개의 적색 점에 의해 나타내어진다.
도 3a-3f. 종양-표적화 프로그램을 위한 선택적이고 폭넓게 적용가능한 miRNA 입력의 확인. 도 3a. 건강한 간에서의 그들의 높은 발현 및 HCC 샘플에서의 낮은 발현에 기반한 miRNA 후보의 세포 프로파일링 및 순위화의 개략도. 도 3b. 미리 선택된 miRNA 입력의 기능적 확인의 개략도. 리포터 바이러스 벡터는 모든 입력에 대해 생성되고, 모든 벡터는 입력의 생물학적 활성을 평가하기 위해 모든 관심의 샘플에 (하나씩) 전달된다. 도 3c. 2개의 HCC 세포주 및 1차 건강한 간세포에서의 miRNA 패널의 기능적 평가의 결과. 낮은 리포터 발현은 높은 miRNA 활성에 상응한다. FF5는 대조군 표적이다. 도 3d. NGS 프로파일링 실험 (Dastor et al., 2018)에서 확인된 miRNA 발현 카운트 및 선택된 miRNA 센서의 기능적 반응 사이의 상관관계. 추세선은 리프레서 힐(Hill) 함수에 피팅된다. 도 3e. 전신 전달 후 상이한 마우스 기관에서의 miRNA 리포터 벡터의 패널의 정량화된 발현. 동일한 기관에서의 상이한 리포터의 발현 (차트 위에 지시됨)은 함께 그룹핑된다. 막대 음영은 어느 기관에서 리포터가 문헌 분석 및 프로파일링 데이터에 기반하여 반응할 것으로 예상되었는지를 지시한다. 값은 TFF5 표적을 보유하는 대조군 벡터에 대해 정규화되며; 그것으로, 이 표적은 생체내에서 난해한 입력에 반응하고 있으며 많은 리포터는 1 초과의 출력 값을 초래함이 명백하다. 도 3f. 다양한 기관에서의 리포터 발현의 대표적 화상. 리포터의 명칭은 좌측에 지시된다. Cerulean 패널은 구성적 mCerulean 내부 대조군의 발현을 제시한다. Cherry 패널은 지시된 miRNA 표적이 제공된 mCherry 리포터의 잔류 발현을 제시한다.
도 4a-4c. 시험관내에서의 회로 특이성의 확인. 도 4a. 회로의 작용의 메커니즘을 평가하는데 사용된 대조군 구축물의 패널. 약어는 도 1a, 1d 및 1m에서와 동일하다. 도 4b. 10개의 세포주 및 1차 간세포에서의 내인성 입력에 대한 C.TF-AND 하위-회로 반응의 맵핑. 모든 세포주에 대해, 이들 세포에서 구성적 출력에 대해 정규화된 SOX9/10 및 HNF1A/B에 대한 피드백-증폭된 센서의 로그-변환된 출력이 각각 X 및 Y 축 상에 제시된다. C.TF-AND 회로의 출력은 Z 축 상에 제시된다. 도 4c. 10개의 세포주 및 1차 간세포에서의 HCC.V2 회로 반응의 맵핑. C.TF-AND 회로의 로그-변환된 출력 및 로그-변환된 C.let-7c 리포터 회로 반응 규모가 축 X 및 Y 상에 플롯팅되는 반면, 모든 세포주에서의 완전한 회로의 출력은 축 Z 상에 제시된다. 주어진 세포 유형에 대한 모든 값은 그 세포 유형에서의 구성적 발현에 대해 정규화된다.
도 5a-5d. 회로 표적화 특이성의 생체내 특징규명. 도 5a. 다양한 기관에서의 B1-위형화된 AAV 벡터를 사용하여 수득된, 선택된 하위-프로그램, 대조군 벡터, 전체 프로그램, 및 배경의 출력. 값은 정량적 화상 분석에 의해 수득된다. 도 5b. 지시된 바와 같은 상이한 벡터로부터의 mCherry의 발현을 제시하는, 상이한 기관을 나타내는 조직 슬라이스의 화상. 위상 화상 및 mCherry 채널이 제시된다. 2개의 상이한 노출을 사용하여 mCherry 변화의 큰 동적 범위를 반영하는 췌장 슬라이스를 나타낸다. 도 5c. 종양에서의 및 HepG2-종양 보유 마우스의 기관에서의 HCC.V2 회로로부터의 mCherry 출력의 발현. 종양은 mCitrine으로 안정하게 형질도입되고, 황색 형광 채널에서 제시하고 있다. 도 5d. 화상 프로세싱을 사용하여 수득된 종양-보유 마우스의 종양 및 다양한 기관에서의 mCherry 발현의 정량적 분석.
도 6a-6b. 2개의 HCC 세포주 및 1차 간세포에서의 회로 및 대조군의 시험관내 효능. 도 6a. 임의의 AAV 벡터의 부재 하에서의 (정사각형), 구성적 HSV-TK 발현 카세트 (삼각형) 또는 완전한 회로 (원)의 존재 하에서의 GCV에 대한 용량-반응. MTS 검정을 사용하여 측정된 세포 생존율은 Y 축 상에 제시된다. 회로 및 그들의 ID의 개략적 제시는 상부에 제시된다. 도 6b. 구성적 HSV-TK 카세트 및 2개의 상이한 종양 표적화 프로그램의 상이한 벡터 투여량에 대한 HuH-7 세포주의 민감도. 상부 차트, 2개의 회로 변이체 사이의 비교; 하부, 구성적 벡터 및 제2 회로 변이체 사이의 비교.
도 7a-7f. 동소성 마우스 모델에서의 HCC-표적화 회로의 효능. 도 7a. 종양 확립 및 치료 요법의 개략도. 도 7b. 다양한 실험 부문에서의 시간 경과에 따른 종양 부담. 생체내 전신 생물발광을 통해 측정된 종양 부담은 시간 경과에 따라 화상화된다. 각각의 동물에 대해, 부담은 GCV 주사 요법을 개시하기 전의 날에서의 부담에 대해 정규화된다. 도 7c. GCV 주사 요법을 개시하기 전의 날에서의 종양 부담에 대해 정규화된, 주요 실험 부문에서의 개별적 동물에 대한 종양 부담 발달을 제시하는 스파이더 플롯. 도 7d. 다수의 실험 부문으로부터의 개별적 동물의 전신 발광의 대표적 화상. 도 7e. 다수의 실험 부문에 대한 개별적 간의 화상 및 종결 시의 전체-기관 생물발광에 의해 측정된 간에서의 종양 부담. 도 7f. 도 7e에서의 종양 부담의 정량화.
도 8a-8c. AAV-B1 종양 형질도입의 생체내 평가. 도 8a. 대조군 벡터, C.TF-AND 하위프로그램 및 DJ-위형화된 AAV 벡터에서 패키징된 전체 프로그램의 출력은 간 및 HepG2-종양에서의 B1-위형화된 AAV 벡터에서 패키징된 전체 회로의 출력과 비교된다. 종양은 mCitrine으로 안정하게 형질도입되고, 황색 형광 채널에서 제시하고 있다. 도 8b. AAV-DJ 및 AAV-B1 전달 시 종양에서의 HCC.V2 유도된 출력 수준 (mCherry)의 정량화. 값은 정량적 화상 분석에 의해 수득된다. 도 8c. 큰 종양 결절의 코어 섹션에서의 B1-위형화된 AAV에 의해 전달된 HCC.V2 회로로부터의 출력.
도 9a-9b. 다수의 간 보호 miRNA를 조합하는 최적화된 회로의 합리적인 디자인. 도 9a. 강한 miR-let7c 및 약한 miR-122 억제를 조합하는 후보 회로 (HCC.V3)의 개략도. 강한 miR-let7c 억제는 HCC.V2에 기재된 표적 배열구조를 사용함으로써 수득된다. miR-122에 의해 유발된 억제 강도는 miRNA 표적의 수, 배열 또는 서열을 다양화함으로써 조정될 수 있다. HCC.V1에 비해 miR-122 억제 수준을 감소시키는 3가지 상이한 전략이 제시된다: (i) 회로의 전사활성인자 분지 상에서만 완벽한 miR-122 표적 (T-122*)의 사용; (ii) 불완전한 상보성을 갖는 miR-122 표적 (T-122*)을 사용한 전사활성인자 및 출력의 이중 억제; 또는 (iii) 전사활성인자를 억제하는 완벽한 표적 및 출력을 억제하는 불완전한 miRNA 표적에 의존하는 혼합된 접근법. HCC 세포주 (특히 HUH-7)의 패널에서의 발현의 소실을 최소화하면서 간 주에서의 억제를 최대화하는 후보가 선택된다. 각각의 후보는 위치화 변이체에 비해 둘 다의 가능한 miRNA 표적에서 시험된다. 도 9b. miR-122에 의해 조절되는 내인성 유전자 (P4HA1)의 보존된 UTR 영역으로부터 유래된 불완전한 miR-122 표적 (T-122*)의 예 (서열식별번호(SEQ ID NO): 305 및 306, 각각 상부 및 하부). 불완전한 상보성을 갖는 표적은 내인성 유전자에서 발생하는 서열을 사용함으로써 또는 miRNA 시드 서열을 플랭킹하는 영역에서 무작위 돌연변이를 도입함으로써 수득된다. 둘 다의 접근법은 상이한 용량-반응 프로파일을 갖는 표적의 선택을 생성하는데 사용될 것이다.
도 1a-1n. 바이러스 벡터에 대한 다중-플라스미드 회로 아키텍처의 번역. 도 1a. 유전자 배열의 개략도. 발산형 (상부) 및 수렴형 (하부) 배열을 생성하였으며; 2개의 변이체를 보조 전사활성인자 PIT의 상이한 변이체를 사용하여 각각에 대해 생성하였다 (발산형: D-P2: PIT=PIT::RelA; D-PV: PIT=PIT::VPI6; 수렴형: C-P2: PIT=PIT::RelA; C-PV: PIT=PIT::VPI6). 도 1b. HeLa 세포에서의 일시적 형질감염 및 이소성 입력 발현을 사용한 백본 DNA 성능의 시험. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: C-P2, D-P2, C-PV, D-PV. 도 1c. HuH-7 및 HeLa 세포에서의 내인성 입력에 대한 구축물의 반응의 평가. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: C-P2, D-P2, C-PV, D-PV. 도 1d. miR-424 표적 서열을 사용하여 예시된 강건한 오프 스위치로서 miRNA 표적을 혼입하는 구축물의 개략도. 발산형 (상부) 및 수렴형 (하부) 배열을 생성하였으며; 2개의 변이체를 보조 전사활성인자 PIT의 상이한 변이체를 사용하여 각각에 대해 생성하였다 (발산형: D-P2: PIT=PIT::RelA-T424; D-PV: PIT=PIT::VPI6-T424; 수렴형: C-P2: PIT=PIT::RelA-T424; C-PV: PIT=PIT::VPI6-T424). 도 1e. TF 입력의 이소성 발현을 통한 HeLa 세포에서의 논리 프로그램의 AND-게이트 구성요소의 확인. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: C-P2-T424, D-P2-T424, C-PV-T424, D-PV-T424. 도 1f. HuH-7 및 HeLa 세포에서의 내인성 전사 입력에 대한 회로 반응의 평가. 막대의 순서는 도 1e와 동일하다. 도 1g. 이소성 입력 전달을 사용한 HeLa 세포에서의 발산형 배향 상에 코딩된 3-입력 프로그램의 완전한 평가. 모든 입력의 부재 하에서의 발현의 결여 및 miR-424가 음성 조절인자라는 사실을 고려하여, miR-424만이 존재하는 입력 조합은 자명한 무용으로 인하여 평가되지 않았다. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: D-P2-T424, D-PV-T424. 도 1h. 유도 TF 입력의 존재 하에서의 miRNA 스위치의 기능성. 회로 출력은 miR-424 모방체의 이소성 형질감염을 갖는 및 갖지 않는 HuH-7 세포에서 시험된다 (X 축 아래에 지시됨). 막대의 순서는 도 1g와 동일하다. 도 1i. 내인적으로 발현된 유도 TF 입력의 존재 하에서의 그들의 억제성에 관한 miR-126 표적을 갖는 회로의 평가. 막대의 순서는 도 1g와 동일하다. 도 1j. 2개의 HCC 세포주 및 음성 대조군으로서 HeLa 세포로의 세포 분류 성능에 대한 miRNA 표적 효과의 평가. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: D-P2, D-PV, D-P2-T424, D-PV-T424, C-PV-T126, D-PV-T126. 도 1k. HCC 세포주 HepG2 및 HuH-7에서의 DJ-위형화된 AAV 벡터 내로 패키징된 혼입된 miRNA 센서를 갖는 및 갖지 않는 회로 패널의 평가. HeLa 및 HCT-116 세포주는 카운터 샘플로서 사용된다. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: CMV, D-P2, D-PV, D-P2-T424, D-PV-T424, C-PV-T126, D-PV-T126. 도 1l. 건강한 1차 간세포를 HCC 세포주로부터 구별하는 그들의 능력에 대한 miRNA의 패널의 시험관내 평가. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: TFF5, T424, T126, T122. 도 1m-1n. 상이한 miRNA 표적 배열 및 출력 억제의 규모에 대한 그들의 영향의 탐구. 도 1m. 상이한 구축물 및 그들의 약칭 표기의 개략도. 도 1n. HepG2 세포 (miR-122 발현 없음) 및 HuH-7 세포 (중간 수준의 miR-122 발현)에서 생성된 출력. 각각의 그룹핑에서의 막대, 좌측에서 우측으로: HepG2, Huh-7. 약어: ITR: AAV2의 내부 말단 반복부; pA: SV40 폴리아데닐화 신호 (수렴형 배향), 발산형 배향으로 mCherry 다음 hGH 및 PIT 유전자 다음 SV40 pA; Cherry: mCherry 형광 단백질을 코딩하는 서열; TATA: 최소 TATA 박스 (Angelici et al., 2016); HNF1 RE: HNF1A 및 HNF1B에 결합하는 반응 요소; PIT RE: PIT::RelA 및 PIT::VP16 전사활성인자에 결합하는 반응 요소; SOX RE: SOX9 및 SOX10 전사 인자, 및 가능하게는 SOX 패밀리 SOX1-SOX15, SOX17, SOX18, SOX21, SOX30, 및 SRY로부터의 다른 전사 인자에 결합하는 DNA 서열; PIT: PIT:RelA 또는 PIT::VP16 융합물 중 어느 하나를 나타내는 프리스티노마이신-유도성 전사활성인자 (Fussenegger et al., 2000). 차트 디자인: 출력 mCherry의 정규화된 발현은 Y 축 상에 제시된다.
도 2a-2f. HCC의 동소성 마우스 모델에서의 특이성 및 효능의 파일럿 평가. 도 2a. DJ-위형화된 바이러스 벡터 내로 패키징된 선택된 회로의 세포 분류 능력의 시험관내 확인. 도 2b. 구성적 대조군 벡터에 비해 HSV-TK 출력을 갖는 회로에 의한 시험관내 세포 제거. 여기서 채용된 회로의 개략도는 막대 차트 위에 제시된다. 모든 세포주 또는 1차 간세포에 대해, 간시클로비르에 대한 용량-반응 (X 축)은 구성적 HSV-TK 벡터, 회로의 존재 하에서, 및 GCV 단독으로 측정된다. 세포 생존율 MTS 판독은 Y 축 상에 제시된다. 도 2c. 패널에서 지시된 바와 같은, 파일럿 실험 (n=2)의 상이한 실험 부문에 대해 제시된 종양-보유 마우스에서의 종양 부담의 진행. 도 2d. 발광에 의해 정량화된 종결 시의 간에서의 종양 부담, 좌측의 화상은 간의 중첩 (그레이스케일) 및 생물발광 신호이다. 도 2e. 종결 후 간에서의 종양 부담의 정량적 분석. 도 2f. 접종 바로 후의 종양 부담 및 종결 시의 종양 부담 사이의 상관관계. 치료 부문으로부터의 2마리의 마우스는 2개의 적색 점에 의해 나타내어진다.
도 3a-3f. 종양-표적화 프로그램을 위한 선택적이고 폭넓게 적용가능한 miRNA 입력의 확인. 도 3a. 건강한 간에서의 그들의 높은 발현 및 HCC 샘플에서의 낮은 발현에 기반한 miRNA 후보의 세포 프로파일링 및 순위화의 개략도. 도 3b. 미리 선택된 miRNA 입력의 기능적 확인의 개략도. 리포터 바이러스 벡터는 모든 입력에 대해 생성되고, 모든 벡터는 입력의 생물학적 활성을 평가하기 위해 모든 관심의 샘플에 (하나씩) 전달된다. 도 3c. 2개의 HCC 세포주 및 1차 건강한 간세포에서의 miRNA 패널의 기능적 평가의 결과. 낮은 리포터 발현은 높은 miRNA 활성에 상응한다. FF5는 대조군 표적이다. 도 3d. NGS 프로파일링 실험 (Dastor et al., 2018)에서 확인된 miRNA 발현 카운트 및 선택된 miRNA 센서의 기능적 반응 사이의 상관관계. 추세선은 리프레서 힐(Hill) 함수에 피팅된다. 도 3e. 전신 전달 후 상이한 마우스 기관에서의 miRNA 리포터 벡터의 패널의 정량화된 발현. 동일한 기관에서의 상이한 리포터의 발현 (차트 위에 지시됨)은 함께 그룹핑된다. 막대 음영은 어느 기관에서 리포터가 문헌 분석 및 프로파일링 데이터에 기반하여 반응할 것으로 예상되었는지를 지시한다. 값은 TFF5 표적을 보유하는 대조군 벡터에 대해 정규화되며; 그것으로, 이 표적은 생체내에서 난해한 입력에 반응하고 있으며 많은 리포터는 1 초과의 출력 값을 초래함이 명백하다. 도 3f. 다양한 기관에서의 리포터 발현의 대표적 화상. 리포터의 명칭은 좌측에 지시된다. Cerulean 패널은 구성적 mCerulean 내부 대조군의 발현을 제시한다. Cherry 패널은 지시된 miRNA 표적이 제공된 mCherry 리포터의 잔류 발현을 제시한다.
도 4a-4c. 시험관내에서의 회로 특이성의 확인. 도 4a. 회로의 작용의 메커니즘을 평가하는데 사용된 대조군 구축물의 패널. 약어는 도 1a, 1d 및 1m에서와 동일하다. 도 4b. 10개의 세포주 및 1차 간세포에서의 내인성 입력에 대한 C.TF-AND 하위-회로 반응의 맵핑. 모든 세포주에 대해, 이들 세포에서 구성적 출력에 대해 정규화된 SOX9/10 및 HNF1A/B에 대한 피드백-증폭된 센서의 로그-변환된 출력이 각각 X 및 Y 축 상에 제시된다. C.TF-AND 회로의 출력은 Z 축 상에 제시된다. 도 4c. 10개의 세포주 및 1차 간세포에서의 HCC.V2 회로 반응의 맵핑. C.TF-AND 회로의 로그-변환된 출력 및 로그-변환된 C.let-7c 리포터 회로 반응 규모가 축 X 및 Y 상에 플롯팅되는 반면, 모든 세포주에서의 완전한 회로의 출력은 축 Z 상에 제시된다. 주어진 세포 유형에 대한 모든 값은 그 세포 유형에서의 구성적 발현에 대해 정규화된다.
도 5a-5d. 회로 표적화 특이성의 생체내 특징규명. 도 5a. 다양한 기관에서의 B1-위형화된 AAV 벡터를 사용하여 수득된, 선택된 하위-프로그램, 대조군 벡터, 전체 프로그램, 및 배경의 출력. 값은 정량적 화상 분석에 의해 수득된다. 도 5b. 지시된 바와 같은 상이한 벡터로부터의 mCherry의 발현을 제시하는, 상이한 기관을 나타내는 조직 슬라이스의 화상. 위상 화상 및 mCherry 채널이 제시된다. 2개의 상이한 노출을 사용하여 mCherry 변화의 큰 동적 범위를 반영하는 췌장 슬라이스를 나타낸다. 도 5c. 종양에서의 및 HepG2-종양 보유 마우스의 기관에서의 HCC.V2 회로로부터의 mCherry 출력의 발현. 종양은 mCitrine으로 안정하게 형질도입되고, 황색 형광 채널에서 제시하고 있다. 도 5d. 화상 프로세싱을 사용하여 수득된 종양-보유 마우스의 종양 및 다양한 기관에서의 mCherry 발현의 정량적 분석.
도 6a-6b. 2개의 HCC 세포주 및 1차 간세포에서의 회로 및 대조군의 시험관내 효능. 도 6a. 임의의 AAV 벡터의 부재 하에서의 (정사각형), 구성적 HSV-TK 발현 카세트 (삼각형) 또는 완전한 회로 (원)의 존재 하에서의 GCV에 대한 용량-반응. MTS 검정을 사용하여 측정된 세포 생존율은 Y 축 상에 제시된다. 회로 및 그들의 ID의 개략적 제시는 상부에 제시된다. 도 6b. 구성적 HSV-TK 카세트 및 2개의 상이한 종양 표적화 프로그램의 상이한 벡터 투여량에 대한 HuH-7 세포주의 민감도. 상부 차트, 2개의 회로 변이체 사이의 비교; 하부, 구성적 벡터 및 제2 회로 변이체 사이의 비교.
도 7a-7f. 동소성 마우스 모델에서의 HCC-표적화 회로의 효능. 도 7a. 종양 확립 및 치료 요법의 개략도. 도 7b. 다양한 실험 부문에서의 시간 경과에 따른 종양 부담. 생체내 전신 생물발광을 통해 측정된 종양 부담은 시간 경과에 따라 화상화된다. 각각의 동물에 대해, 부담은 GCV 주사 요법을 개시하기 전의 날에서의 부담에 대해 정규화된다. 도 7c. GCV 주사 요법을 개시하기 전의 날에서의 종양 부담에 대해 정규화된, 주요 실험 부문에서의 개별적 동물에 대한 종양 부담 발달을 제시하는 스파이더 플롯. 도 7d. 다수의 실험 부문으로부터의 개별적 동물의 전신 발광의 대표적 화상. 도 7e. 다수의 실험 부문에 대한 개별적 간의 화상 및 종결 시의 전체-기관 생물발광에 의해 측정된 간에서의 종양 부담. 도 7f. 도 7e에서의 종양 부담의 정량화.
도 8a-8c. AAV-B1 종양 형질도입의 생체내 평가. 도 8a. 대조군 벡터, C.TF-AND 하위프로그램 및 DJ-위형화된 AAV 벡터에서 패키징된 전체 프로그램의 출력은 간 및 HepG2-종양에서의 B1-위형화된 AAV 벡터에서 패키징된 전체 회로의 출력과 비교된다. 종양은 mCitrine으로 안정하게 형질도입되고, 황색 형광 채널에서 제시하고 있다. 도 8b. AAV-DJ 및 AAV-B1 전달 시 종양에서의 HCC.V2 유도된 출력 수준 (mCherry)의 정량화. 값은 정량적 화상 분석에 의해 수득된다. 도 8c. 큰 종양 결절의 코어 섹션에서의 B1-위형화된 AAV에 의해 전달된 HCC.V2 회로로부터의 출력.
도 9a-9b. 다수의 간 보호 miRNA를 조합하는 최적화된 회로의 합리적인 디자인. 도 9a. 강한 miR-let7c 및 약한 miR-122 억제를 조합하는 후보 회로 (HCC.V3)의 개략도. 강한 miR-let7c 억제는 HCC.V2에 기재된 표적 배열구조를 사용함으로써 수득된다. miR-122에 의해 유발된 억제 강도는 miRNA 표적의 수, 배열 또는 서열을 다양화함으로써 조정될 수 있다. HCC.V1에 비해 miR-122 억제 수준을 감소시키는 3가지 상이한 전략이 제시된다: (i) 회로의 전사활성인자 분지 상에서만 완벽한 miR-122 표적 (T-122*)의 사용; (ii) 불완전한 상보성을 갖는 miR-122 표적 (T-122*)을 사용한 전사활성인자 및 출력의 이중 억제; 또는 (iii) 전사활성인자를 억제하는 완벽한 표적 및 출력을 억제하는 불완전한 miRNA 표적에 의존하는 혼합된 접근법. HCC 세포주 (특히 HUH-7)의 패널에서의 발현의 소실을 최소화하면서 간 주에서의 억제를 최대화하는 후보가 선택된다. 각각의 후보는 위치화 변이체에 비해 둘 다의 가능한 miRNA 표적에서 시험된다. 도 9b. miR-122에 의해 조절되는 내인성 유전자 (P4HA1)의 보존된 UTR 영역으로부터 유래된 불완전한 miR-122 표적 (T-122*)의 예 (서열식별번호(SEQ ID NO): 305 및 306, 각각 상부 및 하부). 불완전한 상보성을 갖는 표적은 내인성 유전자에서 발생하는 서열을 사용함으로써 또는 miRNA 시드 서열을 플랭킹하는 영역에서 무작위 돌연변이를 도입함으로써 수득된다. 둘 다의 접근법은 상이한 용량-반응 프로파일을 갖는 표적의 선택을 생성하는데 사용될 것이다.
분자 컴퓨팅 (Benenson, 2012) 및 합성 생물학 (Weber and Fussenegger, 2012)의 약속 중 하나는 질환-관련 신호를 복잡한 방식으로 및 실시간으로 감지하고 그에 반응하여 정밀하고 "주문형" 치료 작용을 초래하는 "스마트한" 요법의 합리적인 디자인이었다 (Benenson et al., 2004). 이 약속을 이행하기 위해, 3가지 별개의 과제가 다루어진다. 첫째로, 치료적으로 관련된 감지-계산-반응 캐스케이드를 위한 청사진을 디자인하기 위해 질환 메커니즘이 충분히 이해된다. 특히, 관련된 입력이 확인되고, 가장 효율적이고 가장 적은 독성 반응을 초래할 프로그램이 바람직하게 결정된다. 둘째로, 이들 치료 캐스케이드를 실행할 수 있는 강건한 합성 생물학 플랫폼이 존재하거나, 또는 상기 목적을 위해 데 노보 개발된다. 셋째로, 이들 플랫폼은 임상적으로 관련된 치료 양상에 적응된다. 후자 중에서, 세포 및 유전자 요법은 이들 양상 둘 다가 조작된 유전자 탑재물의 혼입을 가능하게 하고, 종종 이를 요구한다는 사실을 고려하여, 합성 유전자 회로의 임상적 번역에 가장 적합한 것으로 확인되었다.
모든 3가지 과제를 다루는 것은 번역 설정에서의 접근법을 개발하기 위한 잠재적인 의학적 징후의 분야를 좁힌다. 한 가지 연구는 세포-기반 이식물에 초점을 맞추었는데, 여기서 유전자 변형된 세포는 혈액 순환에서 특정한 질환-관련 신호를 감지하고, 이에 반응하여 치료 특성을 갖는 분자 작용제를 분비할 수 있다. 이 연구에서, 세포 이식물은 유기체 질환 상태를 감지하고, 이에 반응하여 전체 유기체에 영향을 미치는 요법을 생성하는 감시병 및 "공장"으로서 역할을 한다 (Auslander et al., 2014; Tastanova et al., 2018; Ye et al., 2017). 두번째 연구는 CAR-T 세포 요법 접근법에 대해 수립되었고, 다중-입력 조합적 감지 특성을 갖는 이들 세포를 증대시켜 표면 항원의 조합을 발현하는 암 세포에 대한 그들의 특이성을 개선시키고, 온-표적, 오프-종양 효과를 감소시켰다 (Cho et al., 2018; Kloss et al., 2013; Roybal et al., 2016; Zah et al., 2016).
유전자 요법의 분야에서 합성 생물학 적용은 또한 동물 질환 모델에서 초기 성공을 제시하였다. 난소암 세포를 다루고 이들 세포에서 면역조정인자를 발현하는 렌티바이러스 벡터의 세트, 및 조작된 T-세포를 조합하는 혼성 접근법은 복강으로의 난소 전이의 마우스 모델에서 효능을 나타내었다. 세포 표적화는 그의 조합이 종양 특이적인 것으로 나타난 2개의 프로모터 사이의 miRNA 스폰지-가능화된 AND 게이트로서 실행되었다 (Nissim et al., 2017). 또 다른 최근의 연구에서, 종양용해성 아데노바이러스는 그의 생활 주기의 다중-입력 논리적 제어에 기반하여 복제하도록 조작되었고, 피하 종양 내로의 종양내 주사 시 효능을 나타내었다 (Huang et al., 2019).
유전자 및 세포 요법에 대한 합성 유전자 회로의 주요 부가 가치는 치료 반응을 "프로그래밍"하는, 즉, 치료 작용의 특이성, 시기, 및 투여량을 미리 결정된 방식으로, 잠재적으로 동적 방식으로 및 다양한 피드백 조절 모티프와 조합으로 조절하는 정교한 접근법으로부터 발생한다 (Angelici et al., 2016; Xie et al., 2011). 그러나, 그의 발현을 조절하는 유전자 회로를 갖는 알려진 치료 트랜스진을 제공하는 것은 그의 캡시드를 통해 어느 정도의 기관 또는 세포 유형 특이성을 추가로 갖는 바이러스 벡터 내로 패키징된 구성적으로-유도된 또는 조직-특이적 프로모터-유도된 치료 유전자를 종종 사용하는 보다 확립된 접근법보다 반드시 더 낫다고 할 수 없다 (Al-Zaidy et al., 2019; Landegger et al., 2017; Scholl et al., 2016). 대안적으로, 바이러스 벡터는 관심의 조직 또는 기관 내로 직접적으로 주사되어 (Juttner et al., 2019; Nelson et al., 2016), 특이적으로 다루어질 필요가 있는 세포 유형의 다양성을 감소시킨다. 사실, 이 접근법에 기반하여 조작된 임상적으로 승인된 CAR-T 세포 (June et al., 2018) 및 많은 유전자 요법 (Keeler and Flotte, 2019)을 포함하는 대다수의 승인된 요법은 만족할 만한 효능 및 안전성 프로파일을 나타낸다. 따라서, 이 이점을 입증하는 것은 합성 생물학 커뮤니티에게 부담이다.
암은 합성 생물학에 의해 공급된 요법으로부터 이익을 얻을 엄청난 잠재성을 갖는 질환이다. 심지어 좁게 정의된 암은 환자 그룹 사이 및 심지어 동일한 환자에서의 개별적 종양 사이 둘 다에서 이질성 질환이다 (Dagogo-Jack and Shaw, 2018). 환자에서의 종양은 종종 원발성 및 전이성 로커스 사이에 확산되어, 종양내 주사를 사례의 하위세트에 대해서만 가능하게 만든다. 마지막으로, 항-종양 요법은 매우 독성이며, 이는 비-종양 세포에서의 그들의 활성화가 종종 극적인 유해 효과를 초래할 것임을 의미한다. 함께, 종양의 확산된 집단을 다루기 위해 전신적으로 작용제를 전달할 필요와 조합되어 복잡한 이질적 세포 집단을 정밀하게 다루어야 할 필요는 합성 생물학 접근법의 사용이 유익할 수 있음을 시사한다.
본원에 개시되는 것은 통상적으로 사용되는 유전자 요법 바이러스 및 비-바이러스 벡터와 혼화성인 분류기 유전자 회로를 코딩하는 인접 폴리핵산 분자이다. 또한 본원에 개시되는 것은 세포의 집단에서 출력 (즉, 관심의 유전자)의 발현에 대한 복잡한 다중-입력 제어를 실행하는 방법이다. 이들 방법은 질환, 예컨대 암 (예를 들어, 간세포 암종 (HCC))의 진단 및 치료를 위한 유전자 요법을 포함한다.
I. 인접 폴리핵산 분자의 조성
일부 측면에서, 본 개시내용은 유전자 회로를 포함하는 인접 폴리핵산 분자에 관한 것이다. 본원에 사용된 바와 같이, "인접 폴리핵산 분자"라는 용어는 단일 연속 핵산 분자 (즉, 단일-가닥 폴리핵산 분자) 또는 2개의 상보적인 연속 핵산 분자 (즉, 2개의 상보적인 가닥을 포함하는 이중-가닥 폴리핵산 분자)를 지칭한다. 일부 실시양태에서, 인접 폴리핵산은 RNA (예를 들어, 단일-가닥 또는 이중-가닥)이다. 일부 실시양태에서, 인접 폴리핵산은 DNA (예를 들어, 단일-가닥 또는 이중-가닥)이다. 일부 실시양태에서, 인접 폴리핵산은 DNA:RNA 혼성체이다.
본원에 기재된 인접 폴리핵산은 코딩된 하나 이상의 발현 카세트인 유전자 회로를 포함한다. 본원에 사용된 바와 같이, "발현 카세트" 및 "카세트"라는 용어는 상호교환가능하게 사용되며, (i) RNA를 코딩하는 (예를 들어, 출력 및/또는 전사활성인자의 핵산 서열을 포함하는) 핵산 서열; 및 (ii) RNA의 발현 수준을 조절하는 핵산 서열 (예를 들어, 전사활성인자 반응 요소, 전사 인자 반응 요소, 최소 프로모터, 및/또는 프로모터 요소)을 포함하는 폴리핵산을 지칭한다.
일부 실시양태에서, 인접 폴리핵산 분자는 단일 카세트로 이루어진 유전자 회로를 포함한다. 다른 실시양태에서, 인접 폴리핵산 분자는 2개 이상의 카세트를 포함하는 유전자 회로를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 2개 이상의 카세트를 포함하고, 적어도 2개의 카세트는 발산형 배향으로 존재한다. 본원에 사용된 바와 같이, "발산형 배향"이라는 용어는 하기인 배열구조를 지칭한다: (i) 제1 카세트 및 제2 카세트의 전사가 인접 폴리핵산 분자의 상이한 가닥 상에서 진행되며, (ii) 제1 카세트의 전사는 제2 카세트로부터 멀리 지향되고, 제2 카세트의 전사는 제1 카세트로부터 멀리 지향됨. 도 1a (상부 개략도)는 다양한 발산형 배열구조의 예를 제공한다.
일부 실시양태에서, 인접 폴리핵산 분자는 2개 이상의 카세트를 포함하고, 적어도 2개의 카세트는 수렴형 배향으로 존재한다. 본원에 사용된 바와 같이, "수렴형 배향"이라는 용어는 하기인 배열구조를 지칭한다: (i) 제1 카세트 및 제2 카세트의 전사가 인접 폴리핵산 분자의 상이한 가닥 상에서 진행되며, (ii) 제1 카세트의 전사는 제2 카세트를 향해 지향되고, 제2 카세트의 전사는 제1 카세트를 향해 지향됨. 일부 실시양태에서, 2개의 수렴형 카세트는 폴리아데닐화 서열을 공유한다. 도 1a (하부 개략도)는 다양한 수렴형 배열구조의 예를 제공한다.
일부 실시양태에서, 인접 폴리핵산 분자는 2개 이상의 카세트를 포함하고, 적어도 2개의 카세트는 머리-대-꼬리 배향으로 존재한다. 본원에 사용된 바와 같이, "머리-대-꼬리"라는 용어는 하기인 배열구조를 지칭한다: (i) 제1 카세트 및 제2 카세트의 전사 또는 번역이 인접 폴리핵산 분자의 동일한 가닥 상에서 진행되며, (ii) 제1 카세트의 전사 또는 번역은 제2 카세트를 향해 지향되고, 제2 카세트의 전사 또는 번역은 제1 카세트로부터 멀리 지향됨 (5'...→...→...3').
일부 실시양태에서, 2개의 카세트는 1개 이상의 인슐레이터에 의해 분리된다. 인슐레이터는 인슐레이터-결합 단백질에 의해 결합되는 경우 조절 구성요소 또는 반응 구성요소를 다른 인접 조절 요소의 효과로부터 차단하는 핵산 서열이다. 예를 들어, 인접 폴리핵산 분자의 카세트를 플랭킹하는 것은 각각의 카세트를 다른 카세트의 조절 요소의 효과로부터 차단할 수 있다. 인슐레이터의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있다.
본원에 기재된 유전자 회로는 출력 분자 (즉, 관심의 유전자)의 발현 수준을 조절하는 하나 이상의 메커니즘을 이용한다. 따라서, 본원에 기재된 인접 폴리핵산의 각각은 출력의 핵산 서열을 포함하는 RNA를 코딩하는 카세트를 포함한다. 예시적인 출력 분자는 하기에 제공된다. 출력의 핵산 서열을 포함하는 RNA는 전사활성인자 반응 요소 (및, 임의적으로, RNA의 발현을 조절하는 하나 이상의 추가의 핵산 서열, 예컨대 전사 인자 반응 요소, 최소 프로모터, 및/또는 프로모터 요소)에 작동가능하게 연결된다.
출력 분자 (즉, 관심의 유전자)의 발현 수준을 조절하기 위해, 본원에 기재된 인접 폴리핵산의 각각은 (i) 전사활성인자의 핵산 서열을 포함하는 RNA (예를 들어, mRNA)를 코딩하는 카세트; 및 (ii) miRNA 표적 부위를 포함하는 RNA를 코딩하는 카세트를 추가로 포함한다. 예시적인 전사활성인자 및 miRNA 표적 부위는 하기에 제공된다.
전사활성인자의 핵산 서열을 포함하는 RNA (예를 들어, mRNA)를 코딩하는 카세트는 RNA의 발현을 조절하는 핵산 서열 (예를 들어, 전사활성인자 반응 요소, 전사 인자 반응 요소, 최소 프로모터, 및/또는 프로모터 및/또는 인핸서 요소)에 작동가능하게 연결될 수 있다. 일부 실시양태에서, 전사활성인자의 핵산 서열을 포함하는 RNA를 코딩하는 카세트는 출력의 핵산 서열을 포함하는 RNA를 코딩하는 동일한 카세트이다 (즉, 단일 RNA가 전사활성인자 및 출력 둘 다의 핵산 서열을 포함함).
miRNA 표적 부위를 포함하는 RNA를 코딩하는 카세트는 출력의 핵산 서열을 포함하는 RNA를 코딩하는 동일한 카세트일 수 있다 (즉, 출력의 핵산 서열을 포함하는 RNA가 miRNA 표적 부위를 추가로 포함함). 대안적으로 또는 추가로, miRNA 표적 부위를 포함하는 RNA를 코딩하는 카세트는 전사활성인자의 핵산 서열을 포함하는 RNA를 코딩하는 동일한 카세트일 수 있다 (즉, 전사활성인자의 핵산 서열이 miRNA 표적 부위를 추가로 포함함).
일부 실시양태에서, 카세트에 의해 코딩되는 RNA의 핵산 서열은 폴리아데닐화 서열을 추가로 포함한다. 일부 실시양태에서, 폴리아데닐화 서열은 포유동물 세포에서의 전사 종결 및 폴리아데닐화에 적합하다.
(i)
MiRNA 표적 부위
본원에 기재된 인접 폴리핵산의 각각은 miRNA 표적 부위를 포함하는 RNA (예를 들어, 출력을 코딩하는 핵산 서열을 포함하는 RNA 및/또는 전사활성인자의 핵산 서열을 포함하는 RNA)를 코딩하는 하나 이상의 카세트를 포함한다. MiRNA는 번역 억제, mRNA 절단, 및 탈아데닐화를 포함하는 이들이 다양한 방식으로 결합하는 RNA의 수준을 하향조절하는 전형적으로 길이가 21-25개의 뉴클레오티드인 작은 비-코딩 RNA의 부류이다. 본원에 사용된 바와 같이, "miRNA 표적 부위"라는 용어는 miRNA에 상보적이고 그에 의해 조절되는 서열을 지칭한다. miRNA 표적 부위는 miRNA 표적 부위에 결합하여 그를 조절하는 miRNA와 적어도 25%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 상보성을 가질 수 있다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 또는 적어도 20개의 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 2-3, 2-4, 2-5, 2-6, 2-7, 2-8, 2-9, 2-10, 3-4, 3-5, 3-6, 3-7, 3-8, 3-9, 3-10, 4-5, 4-6, 4-7, 4-8, 4-9, 4-10, 5-6, 5-7, 5-8, 5-9, 5-10, 6-7, 6-8, 6-9, 6-10, 7-8, 7-9, 7-10, 8-9, 8-10, 또는 9-10개의 miRNA 표적 부위를 포함한다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 다수의 miRNA 표적 부위를 포함하고, miRNA 표적 부위의 각각은 동일한 서열을 갖거나, 또는 동일한 miRNA에 의해 조절되는 상이한 핵산 서열을 포함한다. 다른 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 별개의 miRNA 표적 부위를 포함하는 별개의 miRNA에 의해 조절되는 2개 이상의 miRNA 표적 부위 (즉, 별개의 miRNA 표적 부위)를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 별개의 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 2-3, 2-4, 2-5, 2-6, 2-7, 2-8, 2-9, 2-10, 3-4, 3-5, 3-6, 3-7, 3-8, 3-9, 3-10, 4-5, 4-6, 4-7, 4-8, 4-9, 4-10, 5-6, 5-7, 5-8, 5-9, 5-10, 6-7, 6-8, 6-9, 6-10, 7-8, 7-9, 7-10, 8-9, 8-10, 또는 9-10개의 별개의 miRNA 표적 부위를 포함한다.
본원에 기재된 카세트에 의해 코딩되는 RNA의 miRNA 표적 부위는 RNA의 서열 내의 어디에나 위치할 수 있다. 예를 들어, 일부 실시양태에서 본원에 기재된 카세트에 의해 코딩되는 RNA는 3' UTR을 포함하고, 3' UTR은 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 인트론을 포함하고, 인트론은 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 5' UTR을 포함하고, 5' UTR은 miRNA 표적 부위를 포함한다.
예시적인 miRNA 및 miRNA 표적 부위는 표 1에 열거된다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 표 1에 열거된 miRNA에 대한 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 표 1에 열거된 miRNA에 상응하는 다수의 miRNA 표적 부위 (예를 들어, let-7c 표적 부위 및 miR-122 표적 부위를 포함하는 조합)를 포함한다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 표 1에 열거된 miRNA 표적 부위와 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 표 1에 열거된 miRNA 표적 부위와 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 다수의 miRNA 표적 부위를 포함한다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 let-7a 표적 부위, let-7b 표적 부위, let-7c 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합 (예를 들어, let7c 표적 부위 및 miR-122 표적 부위의 조합)을 포함한다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 let-7c 표적 부위 (즉, hsa-let-7c에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 let-7c 표적 부위는 핵산 서열 AACCATACAACCTACTACCTCA (서열식별번호: 42)로 이루어진다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 miR-22 표적 부위 (즉, miR-22에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 miR-22 표적 부위는 핵산 서열 ACAGTTCTTCAACTGGCAGCTT (서열식별번호: 43)로 이루어진다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 miR-26b 표적 부위 (즉, miR-26b에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 miR-26b 표적 부위는 핵산 서열 ACCTATCCTGAATTACTTGAA (서열식별번호: 44)로 이루어진다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 miR-126-5p 표적 부위 (즉, miR-126-5p에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 miR-126-5p 표적 부위는 핵산 서열 CGTGTTCACAGCGGACCTTGAT (서열식별번호: 45)로 이루어진다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 miR-424 표적 부위 (즉, miR-424에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 miR-424 표적 부위는 핵산 서열 GTCCAAAACATGAATTGCTGCT (서열식별번호: 48)로 이루어진다.
일부 실시양태에서, 본원에 기재된 카세트에 의해 코딩되는 RNA는 miR-122 표적 부위 (즉, miR-122에 상보적이고 그에 의해 조절되는 핵산 서열)를 포함한다. 일부 실시양태에서 miR-122 표적 부위는 핵산 서열 CAAACACCATTGTCACACTCCA (서열식별번호: 46)로 이루어진다.
표 1. 예시적인 miRNA 및 예시적인 miRNA 표적 부위.
일부 실시양태에서, 본원에 기재된 인접 폴리핵산은 단일 카세트로 이루어지며, 여기서 단일 카세트는 (출력의 핵산 서열 및 전사활성인자의 핵산 서열을 포함하는 것에 추가로) miRNA 표적 부위를 포함하는 RNA를 코딩한다.
다른 실시양태에서, 인접 폴리핵산은 2개 이상의 카세트를 포함하며, 이 중 적어도 하나는 miRNA 표적 부위를 포함하는 RNA를 코딩한다.
일부 실시양태에서, 인접 폴리핵산 분자의 다수의 카세트는 적어도 하나의 miRNA 표적 부위를 포함한다. 일부 실시양태에서, 인접 폴리핵산의 각각의 miRNA 표적 부위는 유일한 것이다 (즉, 인접 폴리핵산은 miRNA 표적의 1개의 카피만을 포함함). 일부 실시양태에서, 인접 폴리핵산 분자는 동일한 핵산 서열인 적어도 하나의 miRNA 표적 부위를 각각 포함하는 적어도 2개의 카세트를 포함한다. 일부 실시양태에서, 인접 폴리핵산 분자는 적어도 하나의 miRNA 표적 부위를 각각 포함하는 적어도 2개의 카세트를 포함하며, 여기서 각각의 카세트의 적어도 하나의 miRNA 표적 부위는 동일한 miRNA에 의해 조절되는 상이한 핵산 서열을 포함한다. 예를 들어, 제1 카세트는 miRNA 표적 부위 X를 포함할 수 있고, 제2 카세트는 miRNA 표적 부위 Y를 포함할 수 있고, miRNA Z는 표적 부위 X 및 표적 부위 Y를 조절한다.
일부 실시양태에서, 본원에 기재된 인접 폴리핵산의 miRNA 표적 부위를 조절하는 miRNA (즉, 적어도 하나의 miRNA)는 출력 발현이 낮아야 하는 (예를 들어, 다세포 유기체, 예컨대 포유동물의) 적어도 하나의 세포 유형에서 고도로 발현되고/거나 활성이다. miRNA는 본원에 기재된 바와 같이, 출력 발현이 상기 조직 세포 유형에서 참조 인접 폴리핵산 (즉, miRNA에 의해 조절되는 miRNA 표적 부위(들)를 결여하지만, 그렇지 않다면 동일한 핵산 서열을 함유함)의 출력 발현의 수준에 비해 적어도 50% 감소되는 경우, 고도로 발현되고/거나 활성이다. 일부 실시양태에서, 출력은 참조 인접 폴리핵산에 비해 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 적어도 99.9% 감소된다.
일부 실시양태에서, 본원에 기재된 인접 폴리핵산의 miRNA 표적 부위를 조절하는 miRNA (즉, 적어도 하나의 miRNA)는 출력 발현이 낮아야 하는 (예를 들어, 다세포 유기체, 예컨대 포유동물의) 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 500, 적어도 1000개의 세포 유형에서 고도로 발현되고/거나 활성이다.
일부 실시양태에서, 본원에 기재된 인접 폴리핵산의 miRNA 표적을 조절하는 miRNA (즉, 적어도 하나의 miRNA)는 출력 발현이 높아야 하는 (예를 들어, 다세포 유기체, 예컨대 포유동물의) 적어도 하나의 표적 세포 유형에서 낮은 발현을 갖고/거나 불활성이다. miRNA는 출력 발현이 상기 표적 세포 유형에서 참조 인접 폴리핵산 (즉, miRNA에 의해 조절되는 miRNA 표적 부위(들)를 결여하지만, 그렇지 않다면 동일한 핵산 서열을 함유함)의 출력 발현의 수준에 비해 40% 미만 감소되는 경우, 본원에 기재된 바와 같이 낮은 발현을 갖고/거나 불활성이다. 일부 실시양태에서, 출력은 참조 인접 폴리핵산에 비해 35% 미만, 30% 미만, 25% 미만, 20% 미만, 15% 미만, 10% 미만, 5% 미만, 4% 미만, 3% 미만, 2% 미만, 또는 1% 미만 감소된다. 일부 실시양태에서, miRNA 표적을 포함하는 인접 폴리핵산 및 참조 연속 폴리핵산 분자로부터의 출력 발현의 수준 사이에 통계적 차이가 없다.
일부 실시양태에서, 본원에 기재된 인접 폴리핵산의 miRNA 표적 부위를 조절하는 miRNA (즉, 적어도 하나의 miRNA)는 출력 발현이 높아야 하는 (예를 들어, 다세포 유기체, 예컨대 포유동물의) 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 150, 적어도 200, 적어도 500, 적어도 1000개의 표적 세포 유형에서 낮은 수준으로 발현되고/거나 불활성이다.
(ii)
예시적인 전사활성인자
본원에 기재된 인접 폴리핵산의 각각은 전사활성인자의 핵산 서열을 포함하는 RNA (예를 들어, mRNA)를 코딩하는 카세트를 포함한다. 일부 실시양태에서, 인접 폴리핵산은 단일 전사활성인자의 핵산 서열을 포함한다. 다른 실시양태에서, 인접 폴리핵산은 다수의 전사활성인자 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 전사활성인자)의 핵산 서열을 포함한다.
본원에 사용된 바와 같이, "전사활성인자" 또는 "전사활성인자 단백질"이라는 용어는 출력 (즉, 관심의 유전자)의 발현을 전사활성화시키며 출력 (즉, 관심의 유전자)을 코딩하는 핵산에 작동가능하게 연결된 전사활성인자 반응 요소에 결합하는, 인접 폴리핵산 분자 상에 코딩되는 단백질을 지칭한다. 일부 실시양태에서, 전사활성인자는 독립적으로 (즉, 임의의 추가의 인자의 부재 하에서) 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다. 다른 실시양태에서, 전사활성인자는 전사 인자 반응 요소에 결합된 전사 인자의 존재 하에서만 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 전사활성인자 단백질은 DNA-결합 도메인을 포함한다. 일부 실시양태에서, DNA-결합 도메인은 자연-발생 서열과 구별되는 DNA 서열에 결합하도록 조작된다 (즉, 자연-발생이 아님). DNA-결합 도메인의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, 아연-핑거 기술 또는 TALEN 기술을 사용하여 유도되거나, 또는 박테리아로부터의 2-구성요소 신호전달 경로의 돌연변이 반응 조절인자로부터 유래하는 DNA-결합 도메인이 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, DNA-결합 도메인은 포유동물 단백질로부터 유래된다. 다른 실시양태에서, DNA 결합 도메인은 비-포유동물 단백질로부터 유래된다. 예를 들어, 일부 실시양태에서, DNA-결합 도메인은 박테리아, 효모, 또는 식물에서 기원하는 단백질로부터 유래된다. 일부 실시양태에서, DNA-결합 도메인은 전사활성인자 반응 요소를 표적화하기 위한 추가의 구성요소 (예를 들어, 단백질 또는 RNA)를 필요로 한다. 예를 들어, 일부 실시양태에서, DNA-결합 도메인은 전사활성인자 반응 요소를 표적화하기 위한 가이드 RNA의 추가의 구성요소를 필요로 하는 CRISPR/Cas 단백질 (예를 들어, Cas1, Cas2, Cas3, Cas5, Cas4, Cas6, Cas7, Cas8a, Cas8b, Cas8c, Cas9, Cas10, Cas10d, Cse1, Cse2, Csy1, Csy2, Csy3, Csm2, Cmr5, Csx10, Csx11, Csf1, Cpf1, C2c1, C2c2, C2c3)의 것이다.
일부 실시양태에서, 전사활성인자 단백질은 자연-발생 전사 인자로부터 유래되며, 여기서 자연-발생 전사 인자의 DNA-결합 도메인이 돌연변이되어 야생형 전사 인자에 비해 변경된 DNA 결합 특이성을 초래한다. 일부 실시양태에서, 전사활성인자는 자연-발생 전사 인자이다.
일부 실시양태에서, 전사활성인자 단백질은 전사활성화 도메인을 추가로 포함한다 (즉, DNA 결합 도메인 및 전사활성화 도메인을 포함하는 융합 단백질). 본원에 사용된 바와 같이, "전사활성화 도메인"이라는 용어는 최소 프로모터로 전사 기구를 동원하는 기능을 하는 단백질 도메인을 지칭한다. 일부 실시양태에서, 전사활성화 도메인은 독립적으로는 유전자 활성화를 촉발시키지 않는다. 일부 실시양태에서, 전사활성화 도메인은 자연-발생이다. 다른 실시양태에서, 전사활성화 도메인은 조작된다. 전사활성화 도메인의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, RelA 전사활성화 도메인, VP16, VP48 및 VP64가 포함되나, 이에 제한되는 것은 아니다.
예시적인 전사활성인자는 표 2에 열거된다. 일부 실시양태에서, 적어도 하나의 카세트의 전사활성인자는 표 2에 열거된 전사활성인자 또는 표 2에 열거된 하나 이상의 전사활성인자와 그의 아미노산 서열의 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일성을 갖는 전사활성인자이다. 일부 실시양태에서, 본원에 기재된 인접 폴리핵산 분자는 표 2에 열거된 전사활성인자의 조합 또는 표 2에 열거된 하나 이상의 전사활성인자와 그의 아미노산 서열의 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일성을 갖는 전사활성인자의 조합을 코딩한다.
일부 실시양태에서, 적어도 하나의 카세트의 전사활성인자는 tTA, rtTA, PIT-RelA, PIT-VP16, ET-VP16, ET-RelA, NarLc-VP16 또는 NarLc-RelA이다. 예를 들어, 문헌 [Angelici B. et al., Cell Rep. 2016 Aug 30; 16(9): 2525-2537]을 참조한다.
표 2. 예시적인 전사활성인자. DNA 서열은 나타내어진 단백질 서열을 코딩할 수 있는 예일 뿐이며; 축중성 코돈으로 인하여, DNA 서열의 매우 많은 세트는 동일한 단백질 서열을 코딩할 수 있다. 전사활성인자 도메인, 예컨대 RelA 및 VP16은 가능한 전사활성인자 도메인 (TAD)의 예일 뿐이다. "VP16 TAD"는 헤르페스 심플렉스 바이러스의 VP16 유전자로부터 유래된 전사활성인자 도메인을 나타내며; 다수의 도메인 및 그들의 조합 및 그들의 돌연변이체는 DNA 결합 도메인에 융합되는 경우 전사활성인자 도메인으로서 역할을 할 수 있다. 전사활성인자의 DNA 결합 도메인 (DBD)은, 전장 단백질로부터 유래되는 경우, 이러한 도메인의 예일 뿐이며; 이들은 그들의 전장 단백질 전구체로부터 보다 많은 아미노산을 포함하도록 추가로 감소되거나 증가될 수 있다. 원핵생물 2 구성요소 신호전달 시스템의 반응 조절인자로부터 유래된 DBD는 이. 콜라이(E. coli)에서의 그들의 단백질 서열에 기반하여 제시되지만, 다른 원핵생물 균주 및 종으로부터의 이들 유전자의 이종상동체는 또한 사용될 수 있다. 추가로, 이. 콜라이에서 이종상동체를 갖지 않는 2-구성요소 신호전달 경로로부터의 반응 조절인자의 DNA 결합 도메인은 또한 동일한 목적을 위해 사용될 수 있다. M (밑줄표시됨)은 그들의 번역을 가능하게 하는 다양한 DBD 앞에 도입된 시작 코돈을 나타낸다. "::"는 DBD 및 TAD 사이의 융합점을 나타낸다.
(iii)
예시적인 출력 분자
본원에 기재된 인접 폴리핵산의 각각은 출력 (즉, 관심의 유전자)의 핵산 서열을 포함하는 RNA (예를 들어, mRNA)를 코딩하는 카세트를 포함한다. 일부 실시양태에서, 인접 폴리핵산은 단일 출력의 핵산 서열을 포함한다. 다른 실시양태에서, 인접 폴리핵산은 다수의 출력 (예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 출력)의 핵산 서열을 포함한다.
일부 실시양태에서, 출력은 RNA 분자이다. 일부 실시양태에서, RNA 분자는 단백질을 코딩하는 mRNA이다. 일부 실시양태에서, 출력은 비-코딩 RNA 분자이다. 비-코딩 RNA 분자의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, 전달 RNA (tRNA), 리보솜 RNA (rRNA), miRNA, siRNA, piRNA, snoRNA, snRNA, exRNA, scaRNA, 및 긴 ncRNA가 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 출력은 치료 분자 (즉, 질환의 치료에 관련됨), 예컨대 치료 단백질 또는 RNA 분자이다. 치료 분자의 예에 대해서는 항체 (예를 들어, 모노클로날 또는 폴리클로날; 키메라; 인간화; 항체 단편 및 항체 유도체 (이중특이적, 삼중특이적, scFv, 및 Fab)를 포함함), 효소, 호르몬, 염증 분자, 항-염증 분자, 면역조정 분자, 항암 분자, 짧은-헤어핀 RNA, 짧은 간섭 RNA 및 miRNA가 포함되나, 이에 제한되는 것은 아니다. 치료 분자의 상기 부류의 구체적인 예에 대해서는 관련 기술분야에 알려져 있으며, 이들 중 임의의 것은 본 개시내용에 따라 사용될 수 있다.
일부 실시양태에서, 출력은 병원체로부터 유래되고 신체에서 생성되는 경우 면역 반응을 유발하는 것으로 알려진 항원 단백질, 단백질 도메인, 또는 펩티드를 코딩한다.
일부 실시양태에서, 출력은 검출가능한 단백질, 예컨대 형광 단백질이다.
일부 실시양태에서, 출력은 세포독소이다. 본원에 사용된 바와 같이, "세포독소"라는 용어는 세포에 대해 독성인 물질을 지칭한다. 예를 들어, 일부 실시양태에서, 출력은 세포독성 단백질이다. 세포독성 단백질의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, 그라눌리신, 퍼포린/그란자임 B, 및 Fas/Fas 리간드가 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 출력은 전구약물의 활성화를 촉매하는 효소이다. 전구약물 활성화를 촉매하는 효소의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, 카르복실에스테라제, 아세틸콜린에스테라제, 부티릴콜린에스테라제, 파락소나제, 매트릭스 메탈로프로테이나제, 알칼리성 포스파타제, β-글루쿠로니다제, 발라시클로비라제, 전립선-특이적 항원, 퓨린-뉴클레오시드 포스포릴라제, 카르복시펩티다제, 아미다제, β-락타마제, β-갈락토시다제, 및 시토신 데아미나제가 포함되나, 이에 제한되는 것은 아니다. 예를 들어, 문헌 [Yang Y. et al., Enzyme-mediated hydrolytic activation of prodrugs. Acta. Pharmaceutica. Sinica B. 2011 Oct; 1(3): 143-159]을 참조한다. 마찬가지로, 다양한 전구약물이 관련 기술분야의 통상의 기술자에게 알려져 있으며, 아시클로비르, 알로퓨리나올, 아지도티미딘, 밤부테롤, 베캄피실린, 카페세타빈, 캅토프릴, 카르바마제핀, 카리소프로돌, 시클로포스파미드, 디에틸스틸베스트롤 디포스페이트, 디피베프린, 에날라프릴, 팜시클로비르, 플루다라빈 트리포스페이트, 플루오로우라실, 포스마프레나비르, 포스펜토인, 푸르술티아민, 가바펜틴 엔카르빌, 간시클로비르, 겜시타빈, 히드라지드 MAO 억제제, 레플루노미드, 레보도파, 메탄아민, 메르캅토퓨린, 미토마이신, 몰시도민, 나부메톤, 올살라진, 오메프라졸, 팔리페리돈, 페나세틴, 피밤피실린, 프리미돈, 프로구아닐, 실로시빈, 라미프릴, S-메틸도파, 심바스타틴, 술파살라진, 술린닥, 테가푸르, 테르페나딘, 발라시클로비르, 발간시클로비르 및 지도부딘이 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 출력은 HSV-TK, 즉, 인간 알파헤르페스바이러스 1 (HHV-1), 유니프롯(UniProt)KB - Q9QNF7 (KITH_HHV1)로부터의 티미딘 키나제이다.
일부 실시양태에서, 출력은 면역조정 단백질 및/또는 RNA이다. 본원에 사용된 바와 같이, "면역조정 단백질" (또는 면역조정 RNA)이라는 용어는 면역 시스템 구성요소의 활성화를 유도하고/거나 활성을 증가시킴으로써 면역 시스템을 조정하는 (자극하거나 (즉, 면역자극 단백질 또는 RNA) 억제하는 (즉, 면역억제 단백질 또는 RNA)) 단백질 (또는 RNA)을 지칭한다. 다양한 면역조정 단백질은 관련 기술분야의 통상의 기술자에게 알려져 있다. 예를 들어, 문헌 [Shahbazi S. and Bolhassani A. Immunostimulants: Types and Funtions. J. Med. Microbiol. Infec. Dis. 2016; 4(3-4): 45-51]을 참조한다. 일부 실시양태에서, 면역조정 단백질은 시토카인 또는 케모카인 (예를 들어, IL-2, IL-5, IL-6, IL-10, IL-12, IL-13, IL-15, IL-18, CCR3, CXCR3, CXCR4, 및 CCR10) 또는 콜로니 자극 인자이다.
일부 실시양태에서, 출력은 DNA-변형 인자이다. 본원에 사용된 바와 같이, "DNA-변형 인자"라는 용어는 (예를 들어, 재조합 또는 돌연변이의 도입을 유도함으로써) DNA의 구조를 변경하고/거나 DNA의 서열을 변경하는 인자를 지칭한다. 일부 실시양태에서, 상기 DNA-변형 인자는 유전자 결함을 보정하도록 되어 있는 단백질을 코딩하는 유전자, DNA-변형 효소, 및/또는 DNA-변형 시스템의 구성요소이다. 일부 실시양태에서, DNA-변형 효소는 부위-특이적 레콤비나제, 귀소 엔도뉴클레아제, 또는 CRISPR/Cas DNA 변형 시스템의 단백질 구성요소이다.
일부 실시양태에서, 출력은 세포-표면 수용체이다. 일부 실시양태에서, 출력은 키나제이다.
일부 실시양태에서, 출력은 유전자 발현-조절 인자이다. 본원에 사용된 바와 같이, "유전자 발현-조절 인자"라는 용어는 존재할 경우 적어도 하나의 유전자의 전사를 증가시키거나 감소시키는 임의의 인자를 지칭한다. 일부 실시양태에서, 유전자 발현-조절 인자는 단백질이다. 일부 실시양태에서, 유전자 발현-조절 인자는 RNA이다. 일부 실시양태에서, 유전자 발현-조절 인자는 유전자 발현을 조절할 수 있는 다중-구성요소 시스템의 구성요소이다.
일부 실시양태에서, 출력은 후성적 변형인자이다. 본원에 사용된 바와 같이, "후성적 변형인자"라는 용어는 후성적 변형을 증가시키거나, 감소시키거나, 또는 변경하는 인자 (예를 들어, 단백질 또는 RNA)를 지칭한다. 후성적 변형인자의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있으며, DNA 메틸화 및 히스톤 변형이 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 출력은 벡터 복제에 필요한 인자이다. 벡터 복제에 필요한 인자의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있다.
(iv)
조절 구성요소
RNA (예를 들어, 출력 및/또는 전사활성인자의 핵산 서열을 포함함)를 코딩하는 카세트는 조절 구성요소를 추가로 포함할 수 있다. 본원에 기재된 바와 같이, 조절 구성요소는 RNA의 발현을 제어하는 (즉, 그의 증가된 또는 감소된 발현을 조절하는) 핵산 서열이다. 예를 들어, 일부 실시양태에서, 본원에 기재된 카세트는 전사활성인자 반응 요소, 전사 인자 반응 요소, 최소 프로모터, 및/또는 프로모터 요소에 작동가능하게 연결된 RNA를 코딩할 수 있다. 조절 구성요소는 그것이 핵산 서열에 관하여 정확한 기능적 위치 및 배향으로 존재하며, 그에 따라 그것이 전사 개시 및/또는 그 서열의 발현을 조절하는 (또는 유도하는) 경우 RNA를 코딩하는 핵산에 "작동가능하게 연결된다."
일부 실시양태에서, 조절 구성요소는 전사활성인자 반응 요소를 포함한다. "전사활성인자 반응 요소"는 전사활성인자 단백질이 결합 및 인식하는 최소 DNA 서열을 포함할 수 있다. 일부 실시양태에서, 전사활성인자 반응 요소는 전사활성인자 단백질이 결합 및 인식하는 최소 DNA 서열의 1개 초과의 카피 (즉, 반복체)를 포함한다. 일부 실시양태에서, 전사활성인자 반응 요소는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 전사활성인자 단백질이 결합 및 인식하는 최소 DNA 서열 반복체를 포함한다. 일부 실시양태에서, 상기 반복체는 탠덤 반복체이다. 일부 실시양태에서, 전사활성인자 반응 요소는 최소 DNA 서열의 조합을 포함한다. 일부 실시양태에서, 최소 DNA 서열은 스페이서 서열에 의해 점재된다. 일부 실시양태에서, 스페이서 서열은 길이가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 20개 초과의 뉴클레오티드이다.
일부 실시양태에서, 전사활성인자 반응 요소는 최소 DNA 서열로부터의 편차를 포함하거나, 또는 추가의 DNA 서열에 의해 플랭킹되지만, 여전히 전사활성인자 단백질에 결합할 수 있다. 일부 실시양태에서, 상이한 전사활성인자 반응 요소는 나란히 놓일 수 있지만, 모두는 동일한 전사활성인자 단백질에 결합할 수 있다.
예시적인 전사활성인자 반응 요소는 표 3에 열거된다. 일부 실시양태에서, 전사활성인자 반응 요소는 표 3에 열거된 핵산 서열 또는 표 3에 열거된 핵산 서열과 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 핵산 서열로 이루어진다.
표 3. 예시적인 전사활성인자 반응 요소. "::"는 전사활성인자 도메인 (TAD) 및 DNA 결합 도메인 (DBD) 사이의 융합점을 나타낸다. TAD 및 DBD의 서열의 약칭 표기는 표 2에 상응한다. DNA 서열은 하기 명명법을 사용한다: W= A 또는 T; S = C 또는 G; K = A 또는 C; M = G 또는 T; Y = A 또는 G; R = C 또는 T; V = C,G, 또는 T; H = A, G 또는 T; D = A, C 또는 T; B = A, C, 또는 G; N = A,C,G, 또는 T. 대문자는 강한 보존을 나타내고; 소문자 기호는 약한 보존을 나타낸다.
일부 실시양태에서, 조절 구성요소는 전사 인자 반응 요소를 포함한다. "전사 인자 반응 요소"라는 용어는 전사인자가 결합 및 인식하는 DNA 서열을 지칭한다. 본원에 사용된 바와 같이, "전사 인자"라는 용어는 유전자 전사를 조정하는 인접 폴리핵산 상에 코딩되어 있지 않은 단백질을 지칭한다. 일부 실시양태에서, 전사 인자는 전사 활성인자이다 (즉, 전사를 증가시킴). 다른 실시양태에서, 전사 인자는 전사 억제인자이다 (즉, 전사를 억제함). 일부 실시양태에서, 전사 인자는 세포의 내인성 전사 인자이다.
일부 실시양태에서, 전사 인자 반응 요소는 하기 전사 인자 중 하나 이상에 의해 직접적으로 결합되거나, 또는 간접적으로 영향을 받도록 조작된다: ABL1, CEBPA, ERCC3, HIST1H2BE, MDM4, PAX7, SMARCA4, TFPT, AFF1, CHD1, ERCC6, HIST1H2BG, MED12, PAX8, SMARCB1, THRAP3, AFF3, CHD2, ERF, HLF, MEF2B, PBX1, SMARCD1, TLX1, AFF4, CHD4, ERG, HMGA1, MEF2C, PEG3, SMARCE1, TLX3, APC, CHD5, ESPL1, HMGA2, MEN1, PER1, SMURF2, TNFAIP3, AR, CHD7, ESR1, HOXA11, MITF, PHF3, SOX2, SOX4, TP53, ARID1A, CIC, ETS1, HOXA13, MKL1, PHF6, SOX5, TRIM24, ARID1B, CIITA, ETV1, HOXA7, MLLT1, PHOX2B, SOX9, TRIM33, ARID3B, CNOT3, ETV4, HOXA9, MLLT10, PLAG1, SRCAP, TRIP11,ARID5B, CREB1, ETV5, HOXC11, MLLT3, PML, SS18L1, TRPS1, ARNT, CREB3L1, ETV6, HOXC13, MLLT6, PMS1, SSB, TRRAP, ARNT2, CREBBP, EWSR1, HOXD11, MYB, PNN, SSX1, TSC22D1, ASB15, CRTC1, EYA4, HOXD13, MYBL1, MYBL2, POU2AF1, SSX2, TSHZ3, ASXL1, CSDE1, EZH2, ID3, MYC, POU2F2, SSX4, VHL, ATF1, CTCF, FEV, IRF2, MYCN, POU5F1, STAT3, WHSC1, ATF7IP, CTNNB1, FLI1, IRF4, MYOD1, PPARG, STAT4, WHSC1L1, ATM, DACH1, FOXA1, IRF6, NCOA1, PRDM1, STAT5B, WT1, ATRX, DACH2, FOXE1, IRF8, NCOA2, PRDM16, STAT6, WWP1, BAZ2B, DAXX, FOXL2, IRX6, NCOA4, PRDM9, SUFU, WWTR1, BCL11A, DDB2, FOXP1, JUN, NCOR1, PRRX1, SUZ12, XBP1, BCL11B, DDIT3, FOXQ1, KHDRBS2, NCOR2, PSIP1, TAF1, XPC, BCL3, DDX5, FUBP1, KHSRP, NEUROG2, RARA, TAF15, ZBTB16, BCL6, DEK, FUS, KLF2, NFE2L2, RB1, TAL1, ZBTB20, BCLAF1, DIP2C, FXR1, KLF4, NFE2L3, RBM15, TAL2, ZFP36L1, BCOR, DNMT1, GATA1, KLF5, NFIB, RBMX, TBX18, ZFX, BRCA1, DNMT3A, GATA2, KLF6, NFKB2, REL, TBX22, ZHX2, BRCA2, DOT1L, GATA3, LDB1, NFKBIA, RUNX1, TBX3, ZIC3, BRD7, EED, GLI3, LMO1, NONO, RUNX1T1, TCEA1, ZIM2, BRD8, EGR2, GTF2I, LMO2, NOTCH2, RXRA, TCEB1, ZNF208, BRIP1, ELAVL2, HDAC9, LMX1A, NOTCH3, SALL3, TCERG1, ZNF226, BRPF3, ELF3, HEY1, LYL1, NPM1, SATB2, TCF12, ZNF331, BTG1, ELF4, HIST1H1B, LZTR1, NR3C2, SETBP1, TCF3, ZNF384, BTG2, ELK4, HIST1H1C, MAF, NR4A3, SFPQ, TCF7L2, ZNF469, CBFA2T3, ELL, HIST1H1D, MAFA, NSD1, SIN3A, TFAP2D, ZNF595, CBFB, EP300, HIST1H1E, MAFB, OLIG2, SMAD2, TFDP1, ZNF638, CDX2, EPC1, HIST1H2BC, MAML1, PAX3, SMAD4, TFE3, CDX4, ERCC2, HIST1H2BD, MAX, PAX5, SMARCA1, 및 TFEB.
"전사 인자 반응 요소"는 전사 인자가 결합 및 인식하는 최소 DNA 서열을 포함할 수 있다. 일부 실시양태에서, 전사 인자 반응 요소는 전사 인자가 결합 및 인식하는 최소 DNA 서열의 1개 초과의 카피 (즉, 반복체)를 포함한다. 일부 실시양태에서, 전사 인자 반응 요소는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10개의 전사 인자가 결합 및 인식하는 최소 DNA 서열의 반복체를 포함한다. 일부 실시양태에서, 상기 반복체는 탠덤 반복체이다. 일부 실시양태에서, 전사 인자 반응 요소는 최소 DNA 서열의 조합을 포함한다. 일부 실시양태에서, 최소 DNA 서열은 스페이서 서열에 의해 점재된다. 일부 실시양태에서, 스페이서 서열은 길이가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 또는 20개 초과의 뉴클레오티드이다. 일부 실시양태에서, 전사활성인자 반응 요소는 최소 DNA 서열로부터의 편차를 포함하거나, 또는 추가의 DNA 서열에 의해 플랭킹되지만, 여전히 전사활성인자 단백질에 결합할 수 있다. 일부 실시양태에서, 상이한 전사활성인자 반응 요소는 나란히 놓일 수 있지만, 모두는 동일한 전사활성인자 단백질에 결합할 수 있다.
일부 실시양태에서, 전사 인자 반응 요소는 유일한 것이다 (즉, 인접 폴리핵산은 전사 인자 반응 요소의 1개의 카피만을 포함함). 다른 실시양태에서, 전사 인자 반응 요소는 유일하지 않다. 일부 실시양태에서, 전사 인자 반응 요소에 결합하는 전사 인자는 그것이 작동가능하게 연결된 RNA의 발현을 활성화시킨다. 다른 실시양태에서, 전사 인자 반응 요소에 결합하는 전사 인자는 그것이 작동가능하게 연결된 RNA의 발현을 억제한다.
일부 실시양태에서, 조절 구성요소는 각각 상이한 전사 인자에 의해 결합된 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 상이한 전사 인자 반응 요소를 포함한다. 일부 실시양태에서, 조절 구성요소는 각각 상이한 전사 인자에 의해 결합된 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 상이한 전사 인자 반응 요소를 포함한다.
예시적인 전사 인자 반응 요소는 표 4에 열거된다. 일부 실시양태에서, 전사 인자 반응 요소는 표 4에 열거된 핵산 서열 또는 표 4에 열거된 핵산 서열과 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 핵산 서열로 이루어진다.
표 4. 예시적인 전사 인자 반응 요소.
일부 실시양태에서, 조절 구성요소는 프로모터 요소 (또는 프로모터 단편)를 포함한다. 예시적인 프로모터 요소는 표 5에 열거된다. 일부 실시양태에서, 프로모터 요소는 표 5에 열거된 핵산 서열 또는 표 5에 열거된 핵산 서열과 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 핵산 서열로 이루어진다.
표 5. 예시적인 프로모터 요소.
일부 실시양태에서, 프로모터 요소는 전사 인자 반응 요소 및 최소 프로모터를 포함한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다. 일부 실시양태에서, 포유동물 프로모터 또는 프로모터 단편은 유일한 것이다 (즉, 인접 폴리핵산이 포유동물 프로모터 또는 프로모터 단편의 1개의 카피만을 포함함). 다른 실시양태에서, 포유동물 프로모터 또는 프로모터 단편은 유일하지 않다.
일부 실시양태에서, 조절 구성요소는 최소 프로모터를 포함한다. 본원에 사용된 바와 같이, "최소 프로모터"라는 용어는 출력의 발현을 개시하는데 필요하나 충분하지는 않은 핵산 서열을 지칭한다. 일부 실시양태에서, 최소 프로모터는 자연 발생이다. 다른 실시양태에서, 최소 프로모터는 예컨대 자연 발생 서열을 변경하고/거나 단축하는 것, 자연 발생 서열을 조합하는 것, 또는 자연 발생 서열을 비-자연 발생 서열과 조합하는 것에 의해 조작되는데; 각각의 경우 조작되는 최소 프로모터는 비-자연 발생 서열이다. 일부 실시양태에서, 최소 프로모터는 바이러스 또는 비-바이러스 공급원으로부터 조작된다. 최소 프로모터의 예에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있다.
일부 실시양태에서, 조절 구성요소는 전사활성인자 반응 요소, 전사 인자 반응 요소, 및 최소 프로모터를 포함한다. 관련 기술분야의 통상의 기술자는 이들 요소가 다양한 배열구조로 배향될 수 있음을 인식할 것이다. 예를 들어, 전사활성인자 반응 요소는 프로모터 요소 및/또는 전사 인자 반응 요소에 대해 5' 또는 3'일 수 있고; 전사 인자 반응 요소는 프로모터 요소 및/또는 전사활성인자 반응 요소에 대해 5' 또는 3'일 수 있고; 프로모터 요소는 전사 인자 반응 요소 및/또는 전사활성인자 반응 요소에 대해 5' 또는 3'일 수 있다.
일부 실시양태에서, 카세트의 조절 구성요소는 5'에서 3'으로: 전사활성인자 반응 요소, 전사 인자 반응 요소, 및 최소 프로모터를 포함한다. 일부 실시양태에서, 조절 구성요소는 5'에서 3'으로: 전사 인자 반응 요소, 전사활성인자 반응 요소, 및 최소 프로모터를 포함한다.
일부 실시양태에서, 카세트의 조절 구성요소는 전사활성인자 반응 요소 및 프로모터 요소를 포함한다. 일부 실시양태에서, 카세트의 조절 구성요소는 5'에서 3'으로: 전사활성인자 반응 요소 및 프로모터 요소를 포함한다. 일부 실시양태에서, 카세트의 조절 구성요소는 전사활성인자 반응 요소, 프로모터 요소 및 최소 프로모터를 포함한다. 일부 실시양태에서, 카세트의 조절 구성요소는 5'에서 3'으로: 전사활성인자 반응 요소, 프로모터 요소 및 최소 프로모터를 포함한다. 일부 실시양태에서, 카세트의 조절 구성요소는 5'에서 3'으로: 프로모터 요소 및 전사활성인자 반응 요소를 포함한다. 일부 실시양태에서, 카세트의 조절 구성요소는 5'에서 3'으로: 프로모터 요소, 전사활성인자 반응 요소 및 최소 프로모터를 포함한다. 일부 실시양태에서, 상기 프로모터 요소는 포유동물 프로모터이다. 일부 실시양태에서, 프로모터 요소는 프로모터 단편이다.
(v)
예시적인 인접 폴리핵산
일부 실시양태에서, 인접 폴리핵산 분자는 단일 카세트를 갖는 유전자 회로를 포함한다. 예를 들어, 일부 실시양태에서, 인접 폴리핵산 분자는 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 (i) 출력의 핵산 서열; (ii) 전사활성인자의 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하며; 여기서 전사활성인자는, 단백질로서 발현되는 경우, 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, mRNA는 폴리시스트론성 발현 요소의 핵산 서열을 추가로 포함한다. 본원에 사용된 바와 같이, "폴리시스트론성 반응 요소"라는 용어는 단일 mRNA로부터의 2개 이상의 단백질의 생성을 촉진하는 핵산 서열을 지칭한다. 폴리시스트론성 반응 요소는 내부 인식 서열 (IRES) 또는 2A 펩티드를 코딩하는 폴리핵산을 포함할 수 있다. 예를 들어, 문헌 [Liu et al., Systematic comparison of 2A peptides for cloning multi-genes in a polycistronic vector. Sci. Rep. 2017 May 19; 7(1): 2193]을 참조한다. 일부 실시양태에서, 폴리시스트론성 발현 요소는 출력 및 전사활성인자의 핵산 서열들을 분리한다.
일부 실시양태에서, mRNA는 3' UTR을 포함하며, 여기서 3' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, mRNA는 5' UTR을 포함하며, 여기서 5' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력 및 전사활성인자를 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사 인자 반응 요소 및 전사활성인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력 및 전사활성인자를 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자 및 출력을 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사 인자 반응 요소 및 전사활성인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자 및 출력을 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 프로모터 요소 및 전사활성인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자 및 출력을 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 프로모터 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자 및 출력을 코딩하는 핵산 서열; 및 (iii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 인접 폴리핵산 분자는 다수의 카세트를 갖는 유전자 회로를 포함한다. 예를 들어, 일부 실시양태에서, 인접 폴리핵산 분자는 a) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 제1 RNA를 코딩하며, 여기서 제1 RNA는 (i) 출력의 핵산 서열; 및 (ii) miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함하는 것인 제1 카세트; 및 b) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트를 포함하며; 여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 제1 RNA는 3' UTR을 포함하고, 3' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, 제1 RNA는 5' UTR을 포함하고, 5' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다.
일부 실시양태에서, 제2 RNA는 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, 제2 RNA는 3' UTR을 포함하고, 3' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, 제2 RNA는 5' UTR을 포함하고, 5' UTR은 miRNA 표적 부위 (예를 들어, let-7c 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, 또는 이들의 조합)를 포함한다. 일부 실시양태에서, 제1 카세트의 적어도 하나의 miRNA 표적 부위 및 제2 카세트의 적어도 하나의 miRNA 표적 부위는 동일한 핵산 서열이거나 또는 동일한 miRNA에 의해 조절되는 상이한 서열이다.
일부 실시양태에서, 제1 RNA는 전사 인자 반응 요소에 작동가능하게 연결된다. 일부 실시양태에서, 제2 RNA는 전사 인자 반응 요소에 작동가능하게 연결된다. 일부 실시양태에서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소는 동일한 핵산 서열로 이루어진다. 일부 실시양태에서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소는 상이한 핵산 서열로 이루어진다. 일부 실시양태에서, 제1 카세트 또는 제2 카세트 중 어느 하나 또는 둘 다는 적어도 2개, 적어도 3개...의 유형의 전사 인자 반응 요소를 포함한다.
일부 실시양태에서, 제1 카세트는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고; 제2 카세트는 5'에서 3'으로: (i) 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 제1 카세트는 5'에서 3'으로: (i) 전사 인자 반응 요소 및 전사활성인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고; 제2 카세트는 5'에서 3'으로: (i) 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 제1 카세트는 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고; 제2 카세트는 5'에서 3'으로: (i) 프로모터 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 제1 카세트는 5'에서 3'으로: (i) 전사 인자 반응 요소 및 전사활성인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고; 제2 카세트는 5'에서 3'으로: (i) 프로모터 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함한다.
일부 실시양태에서, 제1 카세트의 상류 조절 구성요소는 전사 인자 반응 요소에 추가로 프로모터 요소를 포함한다. 일부 실시양태에서, 프로모터 요소는 전사 인자 반응 요소를 대체한다. 일부 실시양태에서, 프로모터 요소는 포유동물 프로모터 또는 프로모터 단편을 포함한다.
일부 실시양태에서, 제1 카세트 및 제2 카세트는 수렴형 배향으로 존재한다. 일부 실시양태에서, 제1 카세트 및 제2 카세트는 발산형 배향으로 존재한다. 일부 실시양태에서, 제1 카세트 및 제2 카세트는 머리-대-꼬리 배향으로 존재한다.
제1 및/또는 제2 카세트는 하나 이상의 인슐레이터 (예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 인슐레이터)에 의해 플랭킹될 수 있다. 예를 들어, 일부 실시양태에서, 제1 카세트 또는 제2 카세트는 인슐레이터에 의해 플랭킹된다. 일부 실시양태에서, 제1 카세트 및 제2 카세트 둘 다는 인슐레이터에 의해 플랭킹된다. 일부 실시양태에서, 제1 카세트 또는 제2 카세트는 인슐레이터에 의해 둘 다의 측 상에 플랭킹된다.
예시적인 인접 폴리핵산은 표 6에 열거된다. 일부 실시양태에서, 인접 폴리핵산은 표 6에 열거된 핵산 서열 또는 표 6에 열거된 핵산 서열과 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성을 갖는 핵산 서열을 포함한다.
표 6. 예시적인 인접 폴리핵산.
II. 다른 조성물
다른 측면에서, 본 개시내용은 벡터의 조성물에 관한 것이다. 일부 실시양태에서, 벡터는 상기 기재된 인접 폴리핵산 분자를 포함한다.
다른 측면에서, 본 개시내용은 조작된 바이러스 게놈의 조성물에 관한 것이다. 일부 실시양태에서, 바이러스 게놈은 상기 기재된 인접 폴리핵산 분자를 포함한다. 일부 실시양태에서, 바이러스 게놈은 아데노-연관 바이러스 (AAV) 게놈, 렌티바이러스 게놈, 아데노바이러스 게놈, 헤르페스 심플렉스 바이러스 (HSV) 게놈, 백시니아 바이러스 게놈, 폭스바이러스 게놈, 뉴캐슬병 바이러스 (NDV) 게놈, 콕사키바이러스 게놈, 레오바이러스 게놈, 홍역 바이러스 게놈, 소포성 구내염 바이러스 (VSV) 게놈, 파르보바이러스 게놈, 세네카 밸리 바이러스 게놈, 마라바 바이러스 게놈, 또는 감기 바이러스 게놈이다.
다른 측면에서, 본 개시내용은 비리온의 조성물에 관한 것이다. 본원에 사용된 바와 같이, "비리온"이라는 용어는 숙주 세포의 외부에 있는 (예를 들어, DNA/RNA 게놈 및 캡시드 단백질을 포함하는) 바이러스의 감염성 형태를 지칭한다. 일부 실시양태에서, 비리온은 상기 기재된 조작된 바이러스 게놈을 포함한다. 일부 실시양태에서, 비리온은 AAV-DJ 캡시드 단백질을 포함한다. 일부 실시양태에서, 비리온은 AAV-B1 캡시드 단백질, AAV8 캡시드 단백질, 또는 AAV6 캡시드 단백질을 포함한다.
다른 측면에서, 본 개시내용은 상기 기재된 인접 폴리핵산 분자, 상기 기재된 벡터, 상기 기재된 조작된 바이러스 게놈, 또는 상기 기재된 비리온을 포함하는 조성물에 관한 것이다. 일부 실시양태에서, 조성물은 제약상-허용되는 부형제 또는 완충제를 추가로 포함하는 치료 조성물이다. 예시적인 제약 부형제 및 완충제에 대해서는 관련 기술분야의 통상의 기술자에게 알려져 있다.
III. 세포-특이적 이벤트를 자극하는 방법
다른 측면에서, 본 개시내용은 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법에 관한 것이다. 일부 실시양태에서, 세포-특이적 이벤트를 자극하는 방법은 세포의 집단을 상기 기재된 인접 폴리핵산 분자, 상기 기재된 벡터, 상기 기재된 조작된 바이러스 게놈, 또는 상기 기재된 비리온과 접촉시키는 것을 포함하며, 여기서 세포-특이적 이벤트는 세포의 집단의 세포에서 발현되는 출력의 수준을 통해 유발된다.
일부 실시양태에서, 세포의 집단은 적어도 하나의 표적 세포 및 적어도 하나의 비-표적 세포를 포함한다. 표적 세포 및 비-표적 세포 유형은 적어도 하나의 내인성 전사 인자의 수준 및/또는 적어도 하나의 내인성 프로모터 또는 그의 단편 및/또는 적어도 하나의 내인성 miRNA의 발현 강도에 있어서 상이하다. 일부 실시양태에서, 출력의 발현 수준은 표적 세포 및 비-표적 세포 사이에 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 적어도 100, 적어도 500, 적어도 1,000, 또는 적어도 10,000배 상이하다.
일부 실시양태에서, 방법은 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하며, 여기서: a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA (예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 20개의 내인성 miRNA)의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고 (예를 들어, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 15배, 적어도 20배, 적어도 50배, 적어도 100배, 적어도 1000배 더 높고); b) 인접 폴리핵산 분자는 (i) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하며, 여기서 제1 RNA는 출력의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하는 것인 제1 카세트; 및 (ii) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트를 포함하며; 여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 방법은 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하며, 여기서: a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA (예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 20개의 내인성 miRNA)의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고 (예를 들어, 적어도 2배, 적어도 3배, 적어도 4배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 15배, 적어도 20배, 적어도 50배, 적어도 100배, 적어도 1000배 더 높고); b) 인접 폴리핵산 분자는 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 mRNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 출력의 핵산 서열; 전사활성인자의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하며; 여기서 전사활성인자는, 단백질로서 발현되는 경우, 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시킨다.
일부 실시양태에서, 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 전사 인자 (예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 20개의 내인성 전사 인자)의 수준에 있어서 상이하며, 여기서 인접 핵산 분자는 내인성 전사 인자(들)에 상응하는 하나 이상의 전사 인자 반응 요소를 추가로 포함한다.
일부 실시양태에서, 숙주 세포를 상기 기재된 인접 폴리핵산 분자 또는 상기 기재된 벡터와 접촉시키는 것은 비-바이러스 전달 방법을 통해 일어난다. 예로는 형질감염 (예를 들어, DEAE 덱스트란-매개 형질감염, CaPO4-매개 형질감염, 지질-매개 흡수, PEI-매개 흡수, 및 레이저 형질감염), 형질전환 (예를 들어, 칼슘 클로라이드, 전기천공 및 열-충격), 유전자 전달, 및 입자 충격이 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 세포의 집단은 생체외에서 접촉된다 (즉, 세포의 집단이 유기체로부터 단리되고, 세포의 집단이 유기체의 외부에서 접촉됨). 일부 실시양태에서, 세포의 집단은 생체내에서 접촉된다.
본원에 사용된 바와 같이, "내인성"이라는 용어는 - 세포의 맥락에서 - 그의 자연 상태에 있는 세포 내에서 발견되는 인자 (예를 들어, 단백질 또는 RNA)를 지칭한다. 일부 실시양태에서, 내인성 전사 인자는 적어도 하나의 카세트의 조절 구성요소 (예를 들어, 전사 인자 반응 요소)의 프로모터 요소에 결합하여 그를 활성화시킬 수 있다. 일부 실시양태에서, 내인성 miRNA는 적어도 하나의 카세트의 조절 구성요소 또는 반응 구성요소의 miRNA 표적 부위에 상보적일 수 있다.
일부 실시양태에서, "전사활성인자" 및 상응하는 "전사활성인자 반응 요소"는 전사활성인자가 "전사활성인자 반응 요소"에 특이적으로 결합하기는 하나 세포 내에 자연적으로 존재하는 반응 요소에는 가능한 한 적게 결합하게 되도록 선택될 것이다. 일부 실시양태에서, 전사활성인자 단백질의 DNA 결합 도메인은 세포에 존재하는 고유한 조절 서열에는 효율적으로 결합하지 않을 것이며, 따라서 과도한 부작용을 촉발시키지 않을 것이다.
일부 실시양태에서, 표적 세포 및 비-표적 세포는 상이한 세포 유형이다.
일부 실시양태에서, 표적 세포는 암성 세포이고, 비-표적 세포는 비-암성 세포이다. 일부 실시양태에서, 표적 세포는 암성 간세포 암종 세포 또는 담관암종 세포일 수 있고, 비-표적 세포는 간세포, 포식작용적 쿠퍼 세포, 성상 세포, 굴모양 내피 세포를 포함하는 실질 및 비-실질 간 세포일 수 있다.
일부 실시양태에서, 표적 세포는 간세포이고, 비-표적 세포는 비-간세포 (예를 들어, 근세포)이다. 다른 실시양태에서, 표적 세포 및 비-표적 세포는 동일한 세포-유형의 것이나 (예를 들어, 둘 다가 간세포임), 그럼에도 불구하고 적어도 하나의 내인성 전사 인자 및/또는 적어도 하나의 내인성 miRNA의 수준에 있어서 상이하다. 예를 들어, 표적 세포는 노화 근육 세포일 수 있고, 비-표적 세포는 비-노화 근육 세포일 수 있다.
일부 실시양태에서, 표적 세포는 종양 세포이고, 세포-특이적 이벤트는 세포 사멸이다. 일부 실시양태에서, 표적 세포는 노화 세포이고, 세포-특이적 이벤트는 세포 사멸이다. 일부 실시양태에서, 세포 사멸은 활성화 수용체 리간드, 특이적 항원, 자극 시토카인, 또는 이들의 임의의 조합의 발현을 통한 면역 표적화에 의해 매개된다. 일부 실시양태에서, 방법은 세포의 집단을 출력에 의해 치료제 또는 독성 화합물로 대사되는 전구약물 또는 비-독성 전구체 화합물과 접촉시키는 것을 추가로 포함한다.
일부 실시양태에서, 표적 세포는 동일한 유형의 야생형 세포 (예를 들어, 건강한 및/또는 비-질환에 걸린)에 비해 인자를 차등적으로 발현하고, 세포-특이적 이벤트는 인자의 발현 수준을 조정하는 것이다.
일부 실시양태에서, 출력 발현은, 비-표적 세포가 출력 발현의 결여로 인하여 그리고 세포 사멸-유도 작용제의 존재 하에서 제거되는 동안, 표적 세포 집단의 생존을 보장한다. 다른 실시양태에서, 출력은 표적 세포가 출력 발현으로 인하여 그리고 세포 사멸-유도제의 존재 하에서 제거되는 동안, 비-표적 세포 집단의 생존을 보장한다.
일부 실시양태에서, 표적 세포는 관심의 특정한 표현형을 포함하며, 그에 따라 출력 발현은 이 특정한 표현형의 세포에 제한된다.
일부 실시양태에서, 표적 세포는 선택되는 세포 유형이고, 세포-특이적 이벤트는 자연적으로는 선택되는 세포 유형에서는 부재하거나 불활성인 유전자의 발현을 통한 신규 기능의 코딩이다.
일부 실시양태에서, 세포의 집단은 다세포 유기체를 포함한다. 일부 실시양태에서, 다세포 유기체는 동물이다. 일부 실시양태에서, 동물은 인간이다.
IV. 질환 또는 병태를 진단하고/거나 치료하는 방법
일부 측면에서, 본 개시내용은 질환 또는 병태의 하나 이상의 징후 또는 증상을 나타내는 대상체에서 질환 또는 병태 (예를 들어, 암)를 진단하는 방법에 관한 것이다. 본원에 사용된 바와 같이, "진단하다"라는 용어는 질환 또는 병태의 성질 및/또는 원인을 확인하거나 결정하는 과정을 지칭한다. 일부 실시양태에서, 방법은 상기 기재된 인접 폴리핵산 분자, 상기 기재된 벡터, 상기 기재된 조작된 바이러스 게놈, 또는 상기 기재된 비리온을 질환 또는 병태와 연관된 하나 이상의 징후 또는 증상을 나타내는 대상체에게 투여하는 것을 포함하며, 여기서 출력의 수준은 질환 또는 병태의 존재 또는 부재를 지시한다.
일부 측면에서, 본 개시내용은 질환 또는 병태 (예를 들어, 암)를 치료하는 방법에 관한 것이다. 본원에 사용된 바와 같이, "치료하다"라는 용어는 질환 또는 병태와 연관된 하나 이상의 증상의 악화를 예방하는 활동 및/또는 질환 또는 병태와 연관된 하나 이상의 증상을 완화시키는 활동을 지칭한다. 일부 실시양태에서, 방법은 상기 기재된 인접 폴리핵산 분자, 상기 기재된 벡터, 상기 기재된 조작된 바이러스 게놈, 또는 상기 기재된 비리온을 질환 또는 병태를 갖는 대상체에게 투여하는 것을 포함한다.
질환 또는 병태를 치료하는 것에 관한 일부 실시양태에서, 투여의 방법은 상기 기재된 벡터의 정맥내 전달을 포함한다. 일부 실시양태에서, 투여의 방법은 상기 기재된 벡터의 정맥내 전달의 하나 초과의 활동을 포함한다. 일부 실시양태에서, 투여의 방법은 하나 이상의 투여로 상기 기재된 벡터의 종양내 전달을 포함한다. 일부 실시양태에서, 투여의 방법은 하나 이상의 투여로 상기 기재된 벡터의 경동맥 전달을 포함한다. 일부 실시양태에서, 투여의 방법은 근육내 전달, 비내 전달, 망막하 전달, 또는 경구 전달을 포함한다.
일부 실시양태에서, 질환을 치료하는 방법은 하나 이상의 투여로 전구약물의 투여를 추가로 포함한다. 일부 실시양태에서, 전구약물의 전달은 정맥내, 경동맥, 또는 복강내이다. 일부 실시양태에서, 전구약물은 간시클로비르이다.
일부 실시양태에서, 질환을 치료하는 방법은 또 다른 요법, 예컨대 소분자, 생물제제, 모노클로날 항체, 또 다른 유전자 요법 산물, 또는 세포-기반 치료 산물의 투여를 추가로 포함한다.
일부 실시양태에서, 질환 또는 병태는 암이다. 본원에 기재된 방법에 의해 치료될 수 있는 예시적인 암에는 간세포 암종 (HCC), 전이성 결장직장암 (mCRC), 간으로 전이된 임의의 다른 암, 폐암, 유방암, 망막모세포종, 및 교모세포종이 포함되나, 이에 제한되는 것은 아니다.
본원에 기재된 방법에 의해 치료될 수 있는 예시적인 암에는 간세포 암종 (HCC), 전이성 결장직장암 (mCRC), 폐암, 유방암, 망막모세포종, 교모세포종이 포함되나, 이에 제한되는 것은 아니다.
일부 실시양태에서, 암은 간세포 암종 (HCC))이다. 사실, HCC에 대한 치료 옵션은 제한되므로 (Llovet and Lencioni, 2020), 돌파구를 위한 신규 양상을 탐구할 긴급한 필요가 생기게 한다. 본원에 기재된 방법은 현재의 HCC 치료 방법론을 상당히 진전시킨다.
실시예
실시예 1. 다중화 진단 회로는 유전자 요법 벡터로 번역한다.
다수의 해체된 구성요소 (즉, 플라스미드당 하나의 유전자 및 세포주의 일시적 형질감염에서 특징규명됨)로부터 함께 놓인 논리 게이트가 치료적으로 관련된 벡터 내로 피팅되도록 재-조작되고 동물 질환 모델에서 치료 후보로서 연구될 수 있는지 여부를 평가하기 위한 실험을 디자인하였다. 전사 인자 (TF) SOX9/10 및 HNF1A/B에 대한 센서의 이들 센서의 활성 사이의 AND 논리를 실행하는 다중-플라스미드 시스템에 의한 통합은 HuH-7 세포 내로 일시적으로 형질감염되는 경우 강한 반응을 유발하였음이 이전에 제시되었다 (Angelici et al., 2016). SOX9는 진행성 HCC와 연관된 예후적 마커이다 (Richtig et al., 2017). 흥미롭게도, SOX9 반응 요소는 그의 과발현이 악성 HCC 표현형과 연관되는 또 다른 TF인 SOX4에 의해 결합될 가능성이 있다 (Liao et al., 2008; Uhlen et al., 2017). HNF1A 및 HNF1B는 알려진 간 하우스키핑 인자이지만 (Harries et al., 2009); 이들은 또한 GI 관의 다른 기관에서 발현된다.
이전에 기재된 다중-플라스미드 시스템이 인접 DNA 카세트에 적응되고 결국 바이러스 벡터에서 패키징될 수 있는지 여부를 판단하기 위한 실험을 디자인하였다. 이를 위해, SOX9/10-유도된 PIT-기반 활성인자 (PIT::RelA 또는 PIT::VP16) (Fussenegger et al., 2000), 뿐만 아니라 PIT 및 HNF1A/B에 의해 상승작용적으로 유도된 형광 출력 단백질을 포함하는 다중-플라스미드 설정 (Angelici et al., 2016)에서 논리 "SOX9/10 AND HNF1A/B"를 실행하는 것으로 제시된 회로 구성요소를 발산형 또는 수렴형 배향 중 어느 하나의 아데노-연관 바이러스 (AAV) 전달 벡터에서 ITR 사이에 클로닝하였다 (도 1a). 생성된 플라스미드를 HEK293 세포 내로 일시적으로 형질감염시키고, TF 입력 SOX10 및 HNF1A를 TRE-유도된 플라스미드로부터 이소적으로 발현하여 이 게이트에 대한 모든 4개의 논리 입력 조합을 생성하였다. 흥미롭게도, 추세는 모든 4개의 경우에 보존되었지만, 상이한 변이체는 둘 다의 입력이 존재하는 경우 그들의 절대 ON 수준에 있어서 현저하게 상이하다 (도 1b). 동일한 구축물을 또한 HuH-7 및 HeLa 세포 내로 형질감염시켰으며, 여기서 SOX9/10 및 HNF1A/B의 내인성 발현은 전자에서는 회로를 유도하고, 후자에서는 이를 활성화시키지 않을 것으로 예상된다. 이 경우, 차이는 덜 현저하지만, 발산형 배향은 다소 더 높은 출력을 생성하였다.
AND 게이트 전략은 목적하는 세포 유형에서 출력을 활성화시키는 방식이며, 이 활성화의 증대는 요법의 맥락에서 추가의 안전성 층을 포함할 NOT 게이트와 등가의 의도적인 "오프" 스위치의 혼입에 의해 디자인된다. 이를 위해, 마이크로RNA 표적을 출력 유전자의 3'-UTR에, 뿐만 아니라 PIT-유래 구성요소의 3'-UTR에 혼입시켰다. miR-424, miR-126 및 miR-122를 포함하는 특이적 입력의 선택을 이전에 수행된 프로파일링 (Dastor et al., 2018)에 기반하여 행하였다. miR-424 표적은 초기에 도입되었으며, 4개의 생성된 구축물 (도 1d)을 HEK 세포 (도 1e)에서 및 HuH-7 및 HeLa 세포에서 내인성 입력의 존재 하에서 (도 1f) 이소성 TF 조합에 대한 그들의 반응에 대해 다시 시험하였다. 성능에 있어서 현저하고 일관된 차이가 관찰되었다. 수렴형 구축물은 HEK 세포에서 이소성 입력에 반응하는데 실패하였으며, 발산형의 것에 비해 HuH-7 세포에서 크게 감소된 강도로 반응하였다. 이 사실은 유전자 요법 전달 벡터와 혼화성인 인접 백본 상에 통합된 이질적인 플라스미드 및 회로 상에 운반되는 회로로부터의 전이의 복잡성을 강조한다. 다음으로, 2개의 발산형 카세트는 TF 및 miR-424 모방체 입력 둘 다를 포함하는 보다 광범위한 논리 특징규명을 겪었다. 둘 다의 구축물은 예상된 바와 같이 반응하여, 논리 "SOX10 AND HNF1A AND NOT(miR-424)"를 실행하였다 (도 1g). 높은 miR-424 발현이 또한 내인성 TF 입력을 갖는 출력 활성화를 무효화함을 확인하기 위해, miR-424 모방체를 HuH-7 세포 내로 형질감염시켰으며, 출력 발현을 거의 배경 수준으로 끄는 것으로 밝혀졌다 (도 1h). 다음으로, miR-424 표적을 miR-126 표적으로 대체하였다. 구축물의 새로운 세트를 외인성 miR-126에 대한 그의 반응에 관하여 HuH-7 세포에서만 시험하였으며, 결과는 miR-424와 유사하고 예상과 일치하였다 (도 1i). 이 디자인 단계를 결론내리기 위해, miR-424 또는 miR-126 표적을 갖는, miRNA 표적을 갖지 않는 발산형 구축물을 HCC 세포주 HuH-7 및 HepG2를 HeLa 세포로부터 구별하는 그들의 능력에 대해 평가하였다 (도 1j).
다음 단계는 바이러스 벡터 내로의 카세트의 혼입 및 전임상 번역 전에 논리 성능에 관한 그들의 평가이다. AAV-전달된 게놈은 인간 세포에서 연쇄체를 형성하고 (Duan et al., 2003), 이는 AAV 게놈을 코딩하지만 AAV 캡시드의 도움으로 패키징 및 전달되지 않는 DNA 카세트에 비해 복잡성의 추가의 층을 포함할 것임이 알려져 있다. 이를 위해, ITR-플랭킹된 게놈을 사용하고, 소량의 DJ-위형화된 (Grimm et al., 2008) AAV 벡터를 제조하였다. 벡터를 사용하여 2개의 HCC 세포주, HepG2 및 HuH-7, 및 2개의 비-HCC 세포주, HeLa 및 HCT-116을 형질도입하였다. 결과는 표적 세포에서 높은 발현 및 비-표적 세포에서 매우 낮은 발현을 제시하였다 (도 1k). 일부 추가의 효과, 예를 들어 miRNA 표적을 갖지 않는 벡터에 비해 HuH-7 세포에서 T424 표적을 보유하는 벡터로 수득된 출력 발현의 감소가 명백하며, 이는 네이키드 DNA 카세트로 관찰된 감소보다 훨씬 더 강하다.
2개의 miRNA 표적 (T424 또는 T126) 중 어느 것이 생체내에서 더 양호할 것인지 예비 정보를 얻기 위해, 이들 중 어느 것이 핵심적인 보호 기능을 수행할 (즉, HCC 세포 및 건강한 간세포 사이의 식별을 가능하게 할) 것인지를 평가하기 위한 실험을 디자인하였다. 1차 마우스 간세포를 시험관내 배양을 위해 단리하였다. 1차 간세포 및 HCC 세포를 miR-424, miR-126 뿐만 아니라 miR-122에 대한 AAV-DJ 패키징된 유전자 리포터 (Dastor et al., 2018), 즉, 생체내에서 간에서 유전자 발현을 효과적으로 끄는 것으로 제시되었고 (Dastor et al., 2018; Della Peruta et al., 2015), HCC 종양의 하위세트에서 하향조절되는 것으로 알려진 (Coulouarn et al., 2009) 공지된 간 miRNA로 형질도입하였다. 이 시험의 결과 (도 1l)는 놀랍게도, 간에서 miR-424 및 miR-126의 높은 발현 카운트가 간세포에서 높은 생물학적 넉-다운 활성으로 번역되지 않았음을 제시한다. miR-122만이 일관되게 활성이었다. miR-122는 HepG2 세포주에서 불활성이었지만, 이는 HuH-7 세포주에서 부분적 활성을 나타내었으며, 이는 이 miRNA 표적의 포함이 HCC 종양의 하위세트에 대해 유익할 것이지만, 이들 모두에 대해 그렇지는 않음을 시사한다. 이 사실에도 불구하고, 회로를 파일럿 실험 설정에서 그의 특이성 및 항종양 잠재성에 대해 miR-122로 추가로 조사하였다. 상이한 miRNA 표적 배열의 영향을 또한 시험하여 그들의 수가 얼마나 miRNA 입력의 존재 하에서 전체 출력 억제에 영향을 미치는지 평가하였다. 4개의 상이한 카세트를 시험하였으며, 표적의 수를 증가시키고, 출력 및 PIT 3'-UTR 둘 다에서 표적을 정치하는 것은 억제를 증가시킴이 밝혀졌다 (도 1m-1n). 이는 2가지 방식으로 사용될 수 있는 또 다른 마디를 제공한다: 비-표적 세포에서 출력의 넉다운을 증가시키지만, 또한 miRNA 입력의 부분적 수준을 발현하는 표적 세포에서 넉다운을 감소시키는 것.
실시예 2. 번역 맥락에서의 제1 HCC-표적화 회로 변이체의 초기 평가.
리포터 조사에 기반하여, miR-122 표적을 보유하는 회로 변이체를 구축하였다. PIT::VP16 활성인자 변이체를 그의 보다 낮은 DNA 탑재물 및 출력 유전자에 대한 증가된 이용가능한 풋프린트로 인하여 사용하였다. mCherry 출력을 갖는 회로, 더빙된 HCC.V1-mCherry를 DJ-위형화된 AAV 벡터 내로 패키징하고, HCC 세포주를 1차 뮤린 간세포로부터 식별하는 그의 능력에 있어서 재-시험하였다. 데이터는 전체 회로가 1차 간세포에 비해 HepG2 및 Hep3B 세포주에서 고도로 특이적 발현을 생성하는 반면, HuH-7에서 회로는 이들 세포주에서 miR-122의 중간 활성으로 인하여 감소된 출력을 생성함을 강조한다 (도 2a). 따라서, 이 종양-표적화 프로그램을 NSG 마우스에서 HepG2 세포를 채용하는 동소성 이종이식편 종양 모델의 맥락에서 파일럿 실험에서 평가하였다. 종양 확립 및 추적의 목적을 위해, HepG2 세포를 mCitrine 형광 단백질 및 반딧불이 루시페라제 유전자를 코딩하는 렌티바이러스 벡터로 안정하게 변형시키고, 균질한 mCitrine 발현에 대해 분류하였다. 종양을 1M HepG2-LC 세포의 비장 주사 및 후속 비장 절제에 의해 확립하였다.
생체내 실험 전에, 또 다른 음성 대조군 세포주로서 1차 간세포, HepG2 세포 및 HeLa 세포를 비교하는 시험관내 효능 시험을 수행하였다. HSV-TK 출력 유전자 및 더빙된 AAV-DJ-HCC.V1-HSV-TK를 보유하는 벡터는 현저한 구경꾼 효과를 갖는 세포독성을 유발하기 위해 전구약물로서 GCV를 요구한다 (Freeman et al., 1993). 데이터 (도 2b)는 사실, HepG2 세포는 회로 뿐만 아니라 대조군 구성적 벡터에 의해 선택적으로 제거된 반면, 1차 간세포 및 HeLa 세포는 구성적 벡터에 의해 제거되었지만, 회로-보유 벡터에 의해서는 영향을 받지 않았음을 제시하였다. 특히, 회로는 HepG2 세포를 구성적 대조군보다 더 잘 제거하였으며, 이는 비-맞춤 구성적 벡터에 비해 맞춤 TF 논리에 의해 유도된 높은 출력 발현의 중요성을 강조한다.
생체내에서 항종양 효능을 판단하기 위해, AAV-DJ-HCC.V1-HSV-TK를 3일 떨어진 2회의 연속적 주사에서 HepG2 종양 보유 마우스에게 전달하였다. 4개의 실험 그룹 (이 파일럿에서 n=2)은 GCV 요법과 조합으로 AAV-DJ-HCC.V1-HSV-TK (치료 부문), GCV를 갖지 않는 동일한 벡터 단독, GCV 요법으로 보충된 모의 주사, 및 모의 PBS 주사 및 GCV 없음을 포함하였다. 처리된 동물에서의 종양 진행의 라이브 영상화 (도 2c), 및 생물발광을 사용한 간에서의 총 종양 부담의 사후 분석 (도 2d-2e)은 HSV-TK 출력 및 GCV 요법과 조합으로 전체 회로 프로그램을 보유하는 유전자 요법 벡터가 강한 항종양 활성을 가지며, 이는 임의의 대조군 부문에서는 부재함을 명백하게 입증하였다. PBS 대조군 부문에서의 동물 중 하나에서의 낮은 종양 부담은 초기의 빈약한 종양 이식으로부터 초래되었고 (도 2f), 일반적으로 모든 3개의 대조군 부문은 동일하게 거동하여, 초기 부담에 비례하는 최종 종양 부담을 초래하였으며, 이는 종양 성장이 동일한 역학에 의해 지배되었음을 의미한다. 파일럿의 치료 부문에서의 동물은 자명한 이상치이며, 이는 치료가 종양 부담을 감소시키는데 효율적이었다는 또 다른 증거를 제공한다.
실시예 3. 보다 높은 특이성 및 보다 폭넓은 범위를 갖는 종양-표적화 프로그램의 조작.
파일럿 실험의 결과에 의해 고무되어, 종양 표적화 프로그램을 변형시키고 병행하여 시험관내에서 및 생체내에서 회로 작용의 메커니즘의 보다 철저한 평가를 수행하는 것을 추구하였다. SOX9/10 및 HNF1A/B 입력의 조합은 발현을 간 및 간 종양에 제한하는 양호한 시작점인 것으로 가설화되었지만, 생체내에서 miR-122 활성에 대한 이전의 데이터는 그의 활성이 간에 제한되었음을 제시하였고 (Dastor et al., 2018), 따라서 모든 다른 기관에 대해 회로의 TF-단독 구성요소에 의존해야 할 것이었는데, 이는 폭넓은 기관 특이성을 갖는 벡터 캡시드가 사용될 경우 문제가 될 수 있다. 추가로, miR-122는 일부 HCC 하위유형으로부터 건강한 간세포를 분리하는 양호한 분류 마커이지만, 이는 보편적인 HCC 특색은 아니다. 따라서, 검색은 간 대 간 종양의 보다 폭넓은 분류 능력을 가능하게 할 뿐만 아니라 추가의 기관을 보호할 수 있는 miRNA 입력에 초점을 맞추었다. 이 검색에 대한 기원점은 1) 이전에 수득된 miRNA 프로파일링 데이터세트 (Dastor et al., 2018) 및 2) 상이한 기관에서의 고도로-발현된 마이크로RNA에 대한 광범위한 문헌 분석이었다. HuH-7 세포 및 건강한 간세포를 보다 앞선 실험에서 프로파일링하였으며, 간세포에서 고도로 발현되지만 HuH-7 세포에서는 하향조절된 miRNA를 확인하기 위한 시도가 먼저 이루어졌다 (도 3a). NGS 프로파일링 데이터세트에서의 카운트 비에 기반하여 선택된 miRNA 세트는 miR-122 (참조물로서), miR-424, miR-126-5p, miR-22, miR-26b 및 let-7c를 포함하였다. 양방향성 miRNA 리포터 (Dastor et al., 2018)를 구축하고, AAV-DJ 벡터 내로 패키징하여, 시험관내에서 1차 간세포에 대한 높은 전달 효율을 보장하였다 (도 3b). miRNA 후보의 생물학적 활성을 HuH-7, HepG2, 및 1차 단리된 뮤린 간세포에서 측정하였다. 시험된 miRNA 중에서, let-7c는 가장 높은 차등적 활성을 나타내었으며; 더욱이, 이는 HuH-7 및 HepG2 세포 둘 다에서 하향조절되었다 (도 3c). 흥미롭게도, NGS 카운트를 생물학적 활성과 비교하는 소급적 분석 (도 3d)은 매우 표면적인 상관관계만을 제시하며, 이는 후보 입력의 기능적 시험의 중요성을 강조한다.
문헌 검색 및 잠재적 기관-보호 miRNA에 대한 프로파일링 데이터세트의 조사는 miRNA의 세트를 초래하였다: miR-424 (신장 및 다른 기관), miR-208a 및 miR-208 (심장), miR-216A, miR-217, 및 miR-375 (췌장). 시험관내 스크리닝 작전에 기반하여 발견된 간 보호르 위한 후보인 Let-7c는 이 목록에 첨가되었다. 이들 miRNA의 각각에 대해, 양방향성 리포터를 조작하고, 그의 폭넓은 생체분포로 인하여 선택된 B1-위형화된 AAV 벡터 (Choudhury et al., 2016)에서 패키징하였다. 짐작건대 중성 miRNA 표적 ("TFF5")을 보유하는 대조군 벡터를 제조하였다. (그러나, 데이터가 밝혀낸 바와 같이, 이 표적은 적어도 일부 기관에서 miRNA 입력에 대해 반응하고 있었음.) 벡터를 건강한 마우스 내로 전신적으로 주사하고, 리포터 발현을 주사 후 3주에 다양한 기관에서 평가하였다. 강한 생체분포가 간, 췌장, 심장 및 신장에서 발견되었으며, 분석은 이들 기관에 초점이 맞추어졌다. Let-7c는 생체내에서 건강한 간-특이적 입력으로서 잠재성을 나타낸 세트로부터의 유일한 miRNA였다. 생체내에서 췌장에서, miR-217 및 miR-375 둘 다는 문헌으로부터 예상된 바와 같은 활성을 나타내었지만; let-7c는 가장 강한 반응을 가졌다. 심장에서, miR-208a 및 miR-208b는 사전 데이터와 일치하는 활성을 나타내었지만, 다시 let-7c는 가장 강한 반응을 가졌다. 마지막으로, miR-424는 예상된 바와 같이 신장에서 활성이었지만, 이 기관에서 또한 let-7c는 가장 강한 효과를 제공하였다 (도 3ef).
요약하면, 시험관내 및 생체내 데이터의 조합은 이 연구의 목적을 위해, let-7c가 한꺼번에 및 동시에 다수의 기관에 대한 보호적 miRNA 입력의 역할을 하고, 종양 연구에 사용된 둘 다의 HCC 세포주에서 강하게 하향조절되는 "보편적인" 입력으로서 역할을 할 수 있음을 제시하였다. 따라서, 회로의 다음 반복, 더빙된 HCC.V2는 프로그램 "SOX9/10 AND HNF1A/B AND NOT(let-7c)"를 실행한다.
실시예 4. 시험관내에서의 및 생체내에서의 작용의 메커니즘.
시험관내에서의 세포 형질도입을 위한 효율적인 비히클로서 AAV-DJ 캡시드, 및 생체내에서의 폭넓은 생체분포를 갖는 캡시드로서 AAV-B1을 사용하여, AAV-패키징된 회로의 광범위한 기계론적 연구를 수행하였다. 연구에서 보다 먼저, 논리 프로그램을 분석하고, 회로-운반 플라스미드 DNA를 임의의 입력을 발현하지 않는 배경 세포주 내로 형질감염시키고; 이어서 결과를 예상과 비교하는 모든 가능한 입력 조합의 체계적 이소성 발현에 의해 확인하였다. 바이러스 벡터의 경우, 이 전략은 더 이상 유효하지 않은데, 이는 회로 자체가 AAV 형질도입을 통해 전달되는 경우 개별적 이소성 입력을 공동-전달하는 것이 거의 불가능하기 때문이다. 사실, 보다 흥미로운 질문은 어떻게 벡터가 내인적으로 발현된 입력에 반응하는가 하는 것인데, 이는 요법의 맥락에서 세포 분류가 내인성 입력에 의존하고, 그에 적당하게 반응해야 하기 때문이다. 따라서, 메커니즘의 증거는 세포 유형에서의 전체 회로의 출력이 이들 세포에서의 개별적 회로 입력의 활성 및 회로의 논리 프로그램과 일치하는지 여부의 질문을 포함한다.
따라서, 개별적 유전자 센서를 생성하고, 모든 회로 입력 (SOX9/10 및 HNF1A/B 피드백-증폭된 센서에 대해 각각 AAV-DJ.C.SOX-FB.mCherry 및 AAV-DJ.C.HNF1-FB.mCherry); let-7c 센서 (AAV-DJ.C.let-7c.mCherry); AND 게이트만을 실행하는 부분적 회로 (AAV-DJ.C.TF-AND.mCherry); 전체 회로 (AAV-DJ.HCC.V2.mCherry); 및 참조물로서 역할을 하는 구성적 리포터 (AAV-DJ.C.CMV.mCherry)에 대해 AAV-DJ 내로 패키징하였다 (도 4a). 이들 구축물의 출력을 10개의 세포주 및 1차 간세포에서 측정하였다. 결과 (도 4b-4c)는 다중 입력 회로의 반응이 개별적 입력의 발현과 일치함을 제시하며, 이는 작용의 메커니즘이 플라스미드-기반 및 바이러스 벡터-패키징된 시스템 사이에 보존됨을 확인시켜 준다. SOX9/10 및 HNF1A/B에 대한 둘 다의 개별적 센서의 강한 반응은 TF-AND 게이트의 높은 반응을 촉발시키는데 필요하고; TF-AND 게이트의 강한 반응 및 let-7c 센서의 반응의 결여는 완전한 프로그램의 높은 출력을 달성하는데 요구된다.
생체내 특징규명을 위해, 각각 구성적 대조군 AAV-B1.C.CMV.mCherry, TF-단독 AND 게이트 AAV-B1.C.TF-AND.mCherry, let-7c 리포터 AAV-B1.C.let-7c.mCherry, 및 전체 회로 AAV-B1.HCC.V2.mCherry를 패키징하고, 출력으로서 mCherry를 발현하는 B1-위형화된 벡터를 마우스 꼬리 정맥 내로 전신적으로 주사하고, mCherry 발현을 주사 후 3주에 다양한 기관에서 평가하였다. 발현을 신선한 기관 슬라이스에서 화상 프로세싱에 의해 정량화하였다. 결과 (도 5a-5b)는 다수의 입력의 복잡한 상승작용적 작용 및 상이한 기관에서의 그들의 다양한 역할을 강조한다. 간에서, AND-게이트는 구성적 대조군에 비해 양성 세포의 수의 감소를 초래하였지만, 양성 발현을 나타낸 세포 상의 상승된 발현을 초래하였다. let-7c 리포터는 대조군에 비해 감소된 발현을 나타내었지만, 잔류 발현은 명백하게 배경 초과였다. 완전한 회로는 배경으로부터 사실상 구별불가능한 발현을 초래하였다. 췌장에서, AND 게이트-제어된 발현 및 let-7c 제어된 발현은 출력 발현의 큰 감소를 발생시켰지만, 각각의 경우 발현은 배경 초과였다. 간에서와 같이, 완전한 표적화 프로그램은 배경 초과의 임의의 검출가능한 발현을 생성하지 않았다. 심장에서, AND 게이트 또는 let-7c 중 어느 하나는 그 자신 상의, 및 완전한 회로에서 조합되는 경우 배경-수준 발현을 제공하였다. 신장에서, AND 게이트도 let-7c 조절도 발현을 배경으로 하향시키지 않은 반면, 완전한 프로그램은 그러하다는 점에서, 상황은 췌장과 유사하다. 요약하면, 데이터세트는 다중-입력 논리 회로가 생체내에서 건강한 기관으로부터의 고도로 효율적인 탈-표적화를 달성하는데 요구된다는 가설을 강하게 지지하며; 논리 프로그램 "SOX9/10 AND HNF1A/B AND NOT(let-7c)"에 의해 추상화된 바와 같이, 다수의 입력의 상승작용적 효과가 4가지 경우 중 3가지에서 명백하다. 이어서 동일한 프로그램이 생체내에서 종양을 효율적으로 표적화할 수 있는지를 결정하기 위한 실험을 디자인하고, mCherry 출력을 갖는 B1-유형 AAV-B1.HCC.V2.mCherry 회로를 종양-보유 NSG 마우스에게 주사하였다. 데이터 (도 5c)는 도 5a-5b에서의 데이터와 일치하게, 사실, 종양은 생체내에서 특이적으로 및 효율적으로 표적화되는 반면, 다른 기관은 출력을 발현하지 않음을 제시한다.
실시예 5. 시험관내에서의 및 생체내에서의 항종양 효능.
회로 프로그램은 생체내에서 우수한 종양-특이적 발현 및 주요 기관으로부터의 탈-표적화를 제시하였기 때문에, 그의 항종양 활성의 상세한 평가를 기준점 항종양 작동인자로서 전구약물 간시클로비르와 조합으로 HSV-TK 효소를 사용하여 수행하였다. 회로는 더빙된 HCC.V2-HSV-TK였다. 시험을 파일럿 실험 (도 2)과 유사하지만, 보다 큰 동물 그룹 및 연장된 수의 실험 부문을 갖는 라인에 따라 수행하였다. 구성적 대조군 및 완전한 회로를 포함하는 DJ-위형화된 벡터를 제조하고, 간시클로비르에 대한 그들의 용량-반응을 HuH-7, HepG2, 및 HeLa 세포주에서 및 시험관내에서 배양된 1차 간세포에서 평가하였다. 예상된 바와 같이, Huh-7 및 HepG2 세포는 구성적 벡터 및 회로 AAV-DJ.HCC.V2-HSV-TK에 의해 동등하게 표적화된 반면, HeLa 음성 대조군 세포 및 1차 간세포 둘 다는 구성적 벡터에 대해 민감하였지만 완전히 제공된 회로에 의해서는 제거되지 않았다 (도 6a). 추가로, AAV-DJ.HCC.V2-HSV-TK는 HuH-7 세포에서, 이들 세포에서 하향조절되지 않는 let-7c 센서의 사용으로 인하여 AAV-DJ.HCC.V1-HSV-TK보다 더 강력하다. 그러나, AAV-DJ.HCC.V1-HSV-TK는 miR-122에 의한 불완전한 셧-다운으로 인하여 HuH-7 세포에서 여 전히 활성이었다 (도 6b).
다음으로, 회로를 갖는 DJ-위형화된 AAV 벡터를 HepG2-LC 종양-보유 마우스에게 전신적으로 전달하였다 (도 7a). 간시클로비르를 갖지 않는 실험 부문은 모의 주사 (염수); TF-AND 프로그램을 코딩하는 벡터 AAV-DJ.C.TF-AND-HSV-TK; 및 전체 회로 AAV-DJ.HCC.V2-HSV-TK를 코딩하는 벡터를 포함하였다. 간시클로비르를 갖는 부문은 벡터 또는 모의의 꼬리 정맥 전달, 이어서 간시클로비르 주사의 요법에 관하여 상기 부분을 반영하였으며; 즉: 모의 주사 + GCV; AND-게이트 회로 + GCV; 및 완전한 회로 + GCV를 포함하였다. 동물 (부문 당 n=4)을 생체내 생물발광을 사용하여 그들의 종양 부담에 대해, 및 점수 시트 기준을 사용하여 그들의 안녕에 대해 추적하였다. 데이터 (도 7b-7f)는 HSV-TK 출력이 제공되고 GCV 요법으로 보충된 전체 HCC.V2-HSV-TK 프로그램을 갖는 벡터로 처리된 마우스가 강건하고 재현가능한 봉쇄 및 이어서 그들의 종양 부담의 퇴행을 나타내는 반면, GCV를 갖지 않는 대조군 그룹, 또는 GCV로만 주사된 그룹은 시간 경과에 따라 지수적인 종양 부담 증가를 나타냄을 지시한다. HSV-TK 출력을 갖는 AND 게이트를 코딩하는 벡터, AAV-DJ-C.TF-AND-HSV-TK는 AAV-DJ.HCC.V2-HSV-TK에 비해 유사한 항종양 효과를 나타내었지만, 또한 강한 유해 효과를 촉발시켰으며, 따라서 이 부문에서의 동물은 예정된 완결 전에 안락사되어야 했다. 한편, 완전한 AAV-DJ.HCC.V2-HSV-TK 회로로 처리된 부문은 자명한 유해 효과 없이 종양 부담의 연장된 감소를 나타내었다. 이들 결과는 생체내에서의 표적화 특이성 (도 5a-5d) 및 생체내에서의 유해 효과의 규모 사이의 긴밀한 연관을 명백하게 예시한다. 따라서, 장래에 형광 출력 발현으로부터 판단된 바와 같은 종양의 외부의 출력 발현의 존재는 기능적 출력을 갖는 그들의 독성에 대해 평가될 필요가 없는 사전-스크리닝 단계를 구성할 것이다.
실시예 6. AAV-B1 및 AAV-DJ 위형 회로 유도된 HCC 표적화의 생체내 비교.
B1-유형 AAV 캡시드에 대해 관찰된 폭넓은 향성 및 강한 생체내 형질도입 및 유전자 발현을 HCC.V2 프로그램의 제어 하에 놓음으로 달성된 광범위한 다중-기관 탈표적화를 고려하여, 생성된 B1-유형 AAV-B1.HCC.V2 회로는 선택성을 손상시키지 않으면서 높은 종양 형질도입을 생성할 수 있다고 판단되었다. 이 가능성을 조사하기 위해, AAV-B1.HCC.V2-mCherry 전체 회로 출력이 이전의 효능 연구에 사용된 DJ 캡시드 대신 B1 캡시드를 사용하여 전달되는 경우 회로 출력 (mCherry)을 비교하였다. 데이터 (도 8a)는 동일한 투여량으로 투여되는 경우, B1 유형 회로가 이웃하는 간 조직에 대한 그의 선택성을 유지하면서 모든 DJ 변이체 (AAV-DJ.HCC.V2.mCherry, TF-단독 AND 게이트 AAV-DJ.C.TF-AND.mCherry 또는 AAV-DJ.C.CMV.mCherry)의 종양 발현 수준을 크게 능가함을 제시한다. 종양내 출력 발현은 약 40배 더 높았으며 (도 8b), 심지어 큰 종양 결절의 코어 섹션에서도 강한 형광을 초래하였다. 종양 침투와 조합된 강한 선택적 발현은 HCC 유전자 요법에 대한 유망한 후보로서 B1-유형 캡시드에 결합된 회로 표적화를 시사한다.
실시예 7. miR-let-7c 및 miR-122의 조합.
시험관내 효능 데이터는 HCC.V1이 심지어 높은 투여량에서도 간세포를 완전히 보호하는 반면 (도 2b), 동일한 프로그램은 HCC.V2와 비교할 경우 HUH-7 세포 살해 효율의 부분적 감소만을 나타내며 (도 5b), 높은 바이러스 투여량에 대해 거의 필적하는 성능을 초래함을 제시한다. 이 차이는 HUH-7 세포에 비해 간세포에서 관찰된 보다 견고한 유전자 억제와 일치한다 (도 2a).
본원에서 확립된 바와 같이, miR-122 표적의 수 및 배열의 변화는 억제 강도를 조정하여 상이한 miR-122 수준을 갖는 세포주에서 상이한 발현 수준을 초래하는데 사용될 수 있다 (도 1m). 표적 수, 배열의 변화를 통한, 또는 불완전하게 상보적인 표적의 사용을 통한 miR-122 억제 효율의 감소는 간 탈표적화의 부분적 감소의 위험에도, (심지어 보다 낮은 바이러스 투여량에서도) HUH-7에서의 회로 효능을 증가시키는데 사용될 수 있다고 가설화되었다.
이들 데이터로부터, 보다 약한 miR-122 억제를 갖는 HCC.V2로부터의 miR-Let7c 표적을 조합하는 HCC.V3 회로 (도 9a)는 HCC.V3 회로 및 HCC.V2 회로 둘 다를 능가할 것으로 예상된다. miR-122에 의해 유발된 억제 강도는 T-122 표적의 수 및 위치화를 변화시킴으로써, 불완전하게 상보적인 표적을 도입함으로써 또는 2가지 접근법의 조합에 의해 조정될 수 있다. 불완전하게 상보적인 표적은 miRNA 시드 서열을 플랭킹하는 서열에서 무작위 돌연변이를 도입함으로써 또는 miRNA에 의해 조절되는 유전자의 보존된 3' UTR로부터 유래된 miR-122 표적을 사용함으로써 수득될 수 있다 (도 9b). HCC 세포 (특히 HUH-7)에 대한 간 보호 및 효능의 목적하는 조합을 최대화하는 후보가 선택될 수 있다.
HCC.V3은 주요 기관 (Let-7c)으로부터의 일반화된 miRNA 탈표적화를 나타내고, HepG2 및 HUH-7 둘 다에서 그의 효능의 유의한 감소 없이 간에서 조합된 보호 (Let7c 및 miR-122)로부터 이익을 얻을 것으로 예상된다. 대부분의 바이러스 벡터에 대한 가장 높은 생체분포를 갖는 기관이므로, 가장 견고한 가능한 간 탈표적화를 달성하는 것은 특히 바람직하며, 치료 창의 추가의 증가를 초래할 수 있다.
실시예 8. 논의.
본 개시내용은 논리 유전자 회로 접근법의 임상적 번역에 대한 길을 제시한다. 3가지 기저의 기둥이 이러한 번역을 지지하는데 필요하며, 즉: (1) 질환의 분자 구성의 지식; (2) 이 지식을 이용하는 것을 가능하게 하는 플랫폼의 이용가능성; 및 (3) 이 플랫폼의 임상적으로 관련된 치료 양상으로의 번역가능성은 함께 모여 유망한 시험관내 및 생체내 효능 및 안전성 프로파일을 갖는 실행가능한 치료 후보를 전달한다. 본원에 기재된 광범위한 기계론적 특징규명은 그의 개별적 구성요소에 비해, 체계적인 절차에 따라 합리적인 상향식 방식으로 구축된 다중-입력 세포 분류기의 고유한 특성을 강조한다. 중요하게는, 리포터 출력에 의해 판단된 바와 같은 표적화 특이성은 생체내에서 효능 및 유해 효과 둘 다와 긴밀하게 상관됨이 본원에서 입증된다.
특이적 발현 및 치료 제어의 다른 양상, 예컨대 시기 및 투여량은 암에 대한 뿐만 아니라 다른 적응증에 대한 유전자 요법의 차기 첨단분야이다. 우선적 조직 표적화, 뿐만 아니라 특이적 조직 발현을 위한 프로모터 요소를 갖는 신규 캡시드의 개발에 많은 노력이 투자되었다. 특히, 둘 다의 연구는 큰 라이브러리의 광범위한 스크리닝에 의존하고, 이들은 성공을 보장하지 않으며; 더욱이, 특이성의 주장은 카운터 샘플의 큰 패널의 존재 하에서만 이루어질 수 있다. 인간 요법을 위해, 이들 샘플은 인간 기원의 것이어야 한다. 인간 조직의 큰 다양성으로 인하여, 캡시드 및/또는 프로모터 스크린에 대한 큰 라이브러리 크기에 중첩되어, 이 노력을 엄청나게 복잡하게 만들 것이다. 본원에 기재된 상향식 접근법은 다수의 개별적 입력으로부터 조합적 특이성을 생성하는 합리적인 디자인을 사용한다. 프로파일링에 의한 후보 입력 공간을 좁히는 것은 복잡한 프로그램의 조작을 합리적인 전방향 디자인 배경에 대한 이질적 세포 집단 (Huh-7 및 HepG2 세포의 본 발명자들의 예에서와 같이)을 다루는 것을 가능하게 한다. 이 접근법은 표적화된 캡시드 또는 특이적 프로모터의 사용을 배제하지 않는다: 이들은 필요에 따라 적용될 수 있다. 그러나, 파종성 질환, 예컨대 암에 대해, 폭넓은 향성 캡시드는 우선적일 수 있으며; 특이적 발현의 부담은 이어서 요법의 유전자 탑재물에서 코딩되는 분류된 프로그램으로 이동된다. 다른 경우, 캡시드 특이성 및 분류기 프로그램은 가장 양호한 목적하는 효과를 달성하기 위해 상승작용적으로 사용될 수 있다.
간에서의 큰 다초점성 종양의 효율적인 침투는 단일 전신 주사 후 생체내에서 달성되었으며 (도 5c-5d 및 도 8a-8c), 이는 심지어 단일 주사도 탑재물을 파종성 및 잘-혈관화된 종양, 예컨대 HCC에 전달할 수 있다는 강한 증거를 제공한다. 구경꾼 효과를 갖는 출력은 이어서 이들 종양을 효율적으로 치료할 수 있다.
실시예 9. 실시예 1-8에 대한 재료 및 방법.
세포주: HuH-7 세포를 일본 보건 과학 재단(Japan Health Sciences Foundation)의 보건 과학 연구 자원(Health Science Research Resources) 은행 (Cat-# JCRB0403)으로부터 구입하고, 37 ℃, 5% CO2에서 10% FBS (시그마-알드리치(Sigma-Aldrich), Cat #F9665 또는 라이프 테크놀로지스(Life technologies), Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM, 저 글루코스, 글루타맥스(GlutaMAX) (라이프 테크놀로지스, Cat #21885-025)에서 배양하였다. Hep G2 세포를 ATCC (Cat# HB-8065)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 RPMI (깁코(Gibco) A10491-01)에서 배양하였다. HeLa 세포를 ATCC (Cat # CCL-2)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM, 고 글루코스 (라이프 테크놀로지스, Cat #41966)에서 배양하였다. Hep3B 세포를 ATCC (Cat# HB-8064)로부터 구입하고, 37 ℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM, 저 글루코스, 글루타맥스 (라이프 테크놀로지스, Cat #21885-025)에서 배양하였다. HCT-116 세포를 도이체 잠룽 폰 미크로오르가니스멘 운드 첼쿨투렌(Deutsche Sammlung Von Microorganismen and Zellkulturen) (DMZ), DMZ No ACC-581로부터 구입하고, 37 ℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM 글루타맥스 (라이프 테크놀로지스, Cat #31966-021)에서 배양하였다. SW-620 세포를 ATCC (Cat # CCL-227)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM 글루타맥스 (라이프 테크놀로지스, Cat #31966-021)에서 배양하였다. LoVo 세포를 ATCC (Cat # CCL-229)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM 글루타맥스 (라이프 테크놀로지스, Cat #31966-021)에서 배양하였다. A549 세포를 ATCC (Cat # CCL-185)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM 글루타맥스 (라이프 테크놀로지스, Cat #31966-021)에서 배양하였다. SH4 세포를 ATCC (Cat # CCL-185)로부터 구입하고, 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 DMEM 글루타맥스 (라이프 테크놀로지스, Cat #31966-021)에서 배양하였다. IGROV1 세포는 NCI-60 패널의 일부이며, NCI (NIH)에 의해 수득하였다. 세포를 37℃, 5% CO2에서 10% FBS (시그마-알드리치, Cat #F9665 또는 라이프 테크놀로지스, Cat #10270106) 및 1% 페니실린/스트렙토마이신 용액 (시그마-알드리치, P4333)으로 보충된 RPMI (깁코 A10491-01)에서 배양하였다.
루시페라제 및 mCitrine 안정한 세포주 (HepG2 LC)의 생성: mCitrine 및 루시페라제를 안정하게 발현하는 HepG2 세포주 (HepG2 LC)를 AAVS 로커스의 TALEN 편집을 통해 생성하였다. 4x105개의 HepG2 세포를 6-웰 플레이트에 시딩하고, 24시간 후에 리포펙타민 2000을 갖는 총 2 μg DNA로 형질감염시켰다. 형질감염 믹스는 하기와 같이 구성되었다: EF1A 프로모터 (pIK014)의 제어 하에서 500 ng hAAVS1 1L TALEN (pIK11), 500 ng hAAVS1 1R TALEN (pIK12) 및 1 μg의 루시페라제 2A Citrine. 형질전환된 세포를 확장시키고, 일시적 형질감염으로부터 발생하는 발현을 희석하기 위해 3주 동안 배양에서 유지하였다. 3주 후, mCitrine+ 벌크 집단 (< 1%)을 BD FACS 아리아(Aria) III을 사용하여 분류하였다. 생성된 20,000개의 세포를 초기 회수를 촉진하기 위해 제1 주 동안 20% FBS로 보충된 RPMI에서 24-웰 플레이트에 시딩하였다. 세포를 2주 동안 배양하고 확장시켜 안정한 트랜스진 발현을 갖는 세포에 대해 선택하고 침묵인 경향이 있는 클론을 회피하였다. 단일 mCitrine+ 클론을 96-웰 플레이트에서 분류하고, 20% FBS로 보충된 RPMI에서 배양하고, 확장시켰다. 3개의 상이한 고 발현 클론을 선택하고, 가장 양호한 것을 연속적 실험에 사용하였다. 클론의 생물발광을 포톤이미저(PhotonIMAGER) RT (바이오스페이스 래보러토리즈(Biospace Laboratories))를 사용하여 5분 동안 측정하여 루시페라제 발현을 확인하였다.
바이러스 벡터 플라스미드 및 바이러스 생성: 단일-가닥 (ss) AAV 벡터를 이전에 기재된 바와 같이 생성하고 정제하였다 (Paterna 2004, Conway 1999). 간략하게, 시미안 바이러스 대형 T-항원 (293T)을 발현하는 인간 배아 신장 세포 (HEK293)를 폴리에틸렌이민 (PEI)-매개 AAV 벡터 플라스미드 (패키징될 AAV 벡터 게놈을 제공함), AAV 헬퍼 플라스미드 (관심의 AAV 혈청형의 AAV 혈청형 2 rep 단백질 및 cap 단백질을 제공함) 및 아데노바이러스 (AV) 헬퍼 플라스미드 pBS-E2A-VA-E4 (Glatzel 2000)로 1:1:1 몰 비로 공동형질감염시켰다. 형질감염 후 96 내지 120시간에 HEK293T 세포를 수집하고, 저속 원심분리 (1500g/4 ℃에서 15분)에 의해 그들의 상청액으로부터 분리하였다. 상청액 내로 방출된 AAV 벡터를 PEG 8000 용액 (최종: 8% v/v) 및 NaCl (최종: 0.5 M)을 첨가함으로써 4 ℃에서 밤새 PEG-침전시켰다. PEG-침전을 저속 원심분리 (3488g/4 ℃에서 60분)에 의해 완결하였다. 투명화된 상청액을 버리고, 펠릿화된 AAV 벡터를 AAV 현탁 완충제 (150 mM NaCl, 50 mM 트리스(Tris)-HCl, pH 8.5)에 재현탁시켰다. HEK293T 세포를 AAV 현탁 완충제에 재현탁시키고, 7 mL 연조직 균질화 CK14 튜브와 조합으로 베르틴 미닐리스 균질화기(Bertin's Minilys Homogenizer)에 의해 용해시켰다 (5000 rpm/RT에서 2회의 1분 사이클, -20 ℃에서 >4분 냉각에 의해 일시멈춤). 조 세포 용해물을 비트뉴클레아제(BitNuclease) 엔도뉴클레아제 (75 U/mL, 37 ℃에서 30 내지 90분)로 처리하고, 원심분리 (17000g/4 ℃에서 10분)에 의해 투명화하였다. PEG-펠릿화된 AAV 벡터를 투명화된 용해물과 합하고, 불연속적 밀도 아이오딕산올 (옵티프렙(OptiPrep), 액시스-쉴드(Axis-Shield)) 구배 (등밀도) 초원심분리 (365929g/15 ℃에서 2시간 15분)로 처리하였다. 이어서, 아이오딕산올을 비바스핀(Vivaspin) 20 한외여과 장치 (100000 MWCO, PES 막, 사르토리우스(Sartorius)) 및 1 mM MgCl2 및 2.5 mM KCl로 보충된 1x 포스페이트 완충 염수 (PBS)를 사용하여 제조업체의 지시서에 따라 투석여과 (한외여과)의 3 라운드에 의해 AAV 벡터 함유 분획으로부터 제거하였다. AAV 벡터를 저장하고, -80 ℃에서 분취하였다. 캡시드화된 바이러스 벡터 게놈 (vg)을 큐빗(Qubit) dsDNA HS 검정 키트와 조합으로 큐빗 3.0 형광계 (둘 다 라이프 테크놀로지스)를 사용하여 정량화하였다. 간략하게, 5 μL의 비희석된 (또는 1:10 희석된) AAV 벡터를 중복으로 제조하였다. 하나의 샘플을 열-변성시키고 (95 ℃에서 5분), 비처리된 및 열-변성된 샘플을 제조업체의 지시서에 따라 정량화하였다. 바이러스외 (비캡시드화된; 비처리된 샘플)를 총 바이러스내 및 바이러스외 (캡시드화된 및 비캡시드화된; 열-변성된 샘플)로부터 차감함으로써 바이러스내 (캡시드화된) vg/mL를 계산하였다.
생체내 주사를 위한 세포 제조: HepG2 LC 세포를 배양하고, T-75 또는 T-150 플라스크에서 70-80% 전면생장률까지 계대하였다. 생체내 주사를 위해 본 발명자들은 리포터 유전자의 침묵화를 최소화하기 위해 낮은 계대 수 (계대 12 이하)를 갖는 세포를 사용하였다. 성장 배지를 제거하고, PBS (T-75에 대해 10 ml 또는 T-150에 대해 20ml)로 세척하고, 세포를 트립신 (깁코, 25200056) (T-75에 대해 2ml 또는 T-150 플라스크에 대해 6ml)으로 37 ℃에서 5분 동안 해리함으로써 세포를 분리하였다. 세포 현탁액을 8 mL (T-75) 또는 24 ml (T-150)의 PBS로 희석하고, 피펫팅에 의해 부드럽게 재현탁시키고, 이어서 100 μm 필터를 사용하여 50ml 팔콘(Falcon) 튜브에서 여과하여 단일 세포 현탁액을 수득하였다. 추가의 PBS를 사용하여 필터 10ml (T-75) 또는 T-150에 대해 20 ml를 세척하고, 세포를 20 ml (T-75) 또는 50 ml (T-150)의 총 부피로 추가로 희석하였다. 세포 현탁액을 498 rpm에서 4 ℃에서 9분 동안 원심분리하였다. 세포 펠릿을 20 ml의 PBS로 세척하고, 498 rpm에서 4 ℃에서 6분 동안 2회 더 원심분리하여 트립신의 임의의 자취를 제거하였다. 실험에 필요한 세포의 수에 따라 절차를 하나 이상의 플라스크 및 튜브로 수행한다. 각각의 펠릿을 소량의 PBS (각각의 펠릿에 대해 250-300ul)에 재현탁시키고, 작은 분취물을 뉴바우어(Neubauer) 챔버 및 트리판 블루를 사용하여 살아 있는 세포의 수동 카운팅을 위해 희석한다 (1:50 및 1:100). 적어도 4개의 독립적 카운트를 세포 현탁액당 취하고, 평균 값을 사용하여 주사될 세포의 수를 결정하였다. 세포 현탁액을 현미경 하에서 육안으로 검사하여 큰 무리의 부재를 확인하였다. 마지막에 부피를 PBS로 약 2x 107개의 세포/mL로 조정하였다. 세포 현탁액을 수술의 지속기간 동안 얼음 상에서 유지하였으며, 높은 세포 농도를 고려하여 세포는 각각의 주사 전에 재현탁을 요구한다. 조작을 최소화하고 생존율을 개선시키기 위해, 세포를 다수의 스톡 (2-3개의 튜브)에서 나눈다. 본 발명자들은 세포 무리의 존재 및 잔류 트립신 또는 다른 세포-해리 시약의 존재 둘 다가 독성이며 잠재적으로 동물의 생명을 위협함을 주목한다.
이종이식편 마우스 간 마우스 모델: 모든 동물 절차는 스위스 연방법 및 아이드제노시쉐 테크니쉐 훽슐레(Eidgenossische Technische Hochschule)(ETH) 취리히의 기관 지침에 따라 수행하였으며, 바젤-슈타츠 주의 동물 윤리 위원회에 의해 승인되었다. 8 내지 10-주령 면역결핍성 NSG 마우스 (NOD.Cg-Prkdcscid Il2rgtm1Wjl /SzJ, 찰스 리버(Charles River), 독일 슐츠펠트)를 특이적-병원체-무함유 시설에서 하우징하였다. 인간 종양 세포로부터 유래된 마우스 간 종양을 생성하기 위해, NSG 마우스를 흡입용 이소플루란으로 마취시켰다. 무균 수술 기술을 사용하여, 1-1.5cm의 좌측 늑골하 절개를 행하고, 비장을 노출시켰다. 50μl PBS 중 105개의 HepG2 세포를 27-게이지 바늘을 사용하여 비장의 하엽 내로 주사하였다. 바늘의 제거 즉시, 비장의 하극을 결찰시켰다. 대다수의 세포가 콜로니화를 위해 간에 도달하기 위해 10-분 배수를 허용한 후, 주요 비장 혈관구조를 결찰시키고 비장을 제거하였다. 이어서 복부 절개를 봉합선으로 닫았다. 마우스에서의 종양 성장을 주당 2-3회 생물발광 영상화에 의해 모니터링하였다 (포톤이미저 RT, 바이오스페이스 랩).
리포터 AAV의 생체내 전달 및 형광 현미경검사 및 유동 세포계측법에 의한 유전자 발현 분석: 생체내에서 회로 출력 발현을 시각화하기 위해, mCherry 출력을 코딩하는 AAV의 2x1012개의 vg (바이러스 게놈) 또는 PBS를 종양 세포 이식 후 2주에 꼬리 정맥을 통해 단일 용량으로서 투여하였다. 3주 후, 마우스를 안락사시키고, 즉시 10 또는 25U/mL 헤파린 (시그마-알드리치)을 함유하는 50-70 mL HBSS로 경심장적으로 관류시켜 자가형광 적혈구를 제거하였다. 기관 및 조직 (간, 폐, 뇌, 췌장, 골격근, 심장 및 신장)을 수거하고, 신선한 조직 슬라이스를 제조하고, PBS에서 얼음 상에서 유지하였다. mCherry의 발현을 형광 현미경검사에 의해 즉시 분석하였다.
치료 AAV의 생체내 전달 및 전구약물 치료: 종양 세포 접종 후 2주에, 종양-보유 마우스를 먼저 생물발광 강도 (높음 대 낮음)에 의해 반영된 종양 부담에 기반하여 계층화하고, 이어서 그룹 중에서의 종양 부담 비교가능성을 보장하기 위해 다양한 치료 그룹으로 무작위화하였다. AAV-회로 구축물의 4x1012개의 vg (바이러스 게놈) 또는 PBS를 1주 떨어진 2회의 별개의 주사를 통해 정맥내로 투여하였다. 전구약물 GCV (50 mg/kg, 인비보젠(InvivoGen)) 또는 염수 처리를 제1 AAV 주사 후 제3일에 개시하고, 마우스를 2-주 지속기간 동안 일당 1회 복강내로 주사하였다. 종양 성장을 주당 2-3회 생물발광 영상화로 평가하였다. 마우스를 점수 시트로 모니터링하고, 종점이 달성된 경우 안락사시켰다. 모든 마우스는 14일의 전구약물 처리 후 종결되었다. 간을 종양 부담의 생체외 생물발광 영상화 분석을 위해 수거하였다. 종양 세포 접종 후 2주에, 종양-보유 마우스를 먼저 생물발광 강도 (높음 대 낮음)에 의해 반영된 종양 부담에 기반하여 계층화하고, 이어서 그룹 중에서의 종양 부담 비교가능성을 보장하기 위해 다양한 치료 그룹으로 무작위화하였다. AAV-회로 구축물의 4x1012개의 vg (바이러스 게놈) 또는 PBS를 1주 떨어진 2회의 별개의 주사를 통해 정맥내로 투여하였다. 전구약물 GCV (50 mg/kg, 인비보젠) 또는 염수 처리를 제1 AAV 주사 후 제3일에 개시하고, 마우스를 2-주 지속기간 동안 일당 1회 복강내로 주사하였다. 종양 성장을 주당 2-3회 생물발광 영상화로 평가하였다. 마우스를 점수 시트로 모니터링하고, 종점이 달성된 경우 안락사시켰다. 모든 마우스는 14일의 전구약물 처리 후 종결되었다. 간을 종양 부담의 생체외 생물발광 영상화 분석을 위해 수거하였다.
다른 실시양태
본 명세서에서 개시되는 모든 특색은 어떠한 조합으로도 조합될 수 있다. 본 명세서에서 개시되는 각각의 특색은 동일하거나, 등가이거나, 또는 유사한 목적에 기여하는 대안적인 특색에 의해 대체될 수 있다. 따라서, 명시적으로 달리 언급되지 않는 한, 개시되는 각각의 특색은 일반적인 일련의 등가이거나 유사한 특색의 예일 뿐이다.
관련 기술분야의 통상의 기술자라면, 상기 상세한 설명으로부터 본 개시내용의 본질적인 특징을 용이하게 확인할 수 있으며, 그의 취지 및 범주에서 벗어나지 않고도 다양한 용도 및 조건에 그를 적합화하기 위하여 개시내용의 다양한 변화 및 변형을 만들어 낼 수 있다. 따라서, 다른 실시양태가 또한 청구범위에 속하는 것이다.
등가물
본원에서 여러 발명 실시양태가 기재되고 예시되기는 하였지만, 관련 기술분야의 통상의 기술자라면, 본원에 기재된 기능을 수행하고/거나, 결과 및/또는 장점 중 하나 이상을 수득하기 위한 다양한 다른 수단 및/또는 구조를 용이하게 떠올리게 될 것이므로, 그와 같은 변이 및/또는 변형의 각각은 본원에 기재된 발명 실시양태의 범주에 속하는 것으로 간주된다. 더 일반적으로, 관련 기술분야의 통상의 기술자라면, 본원에 기재된 모든 파라미터, 치수, 재료 및 배열구조가 예시적인 것을 의미한다는 것, 그리고 실제 파라미터, 치수, 재료 및/또는 배열구조는 본 발명의 교시가 사용되는 구체적인 적용분야 또는 적용분야들에 따라 달라지게 된다는 것을 잘 알고 있을 것이다. 관련 기술분야의 통상의 기술자라면, 일상적인 것을 초과하지 않는 실험을 사용하여 본원에 기재된 구체적인 발명 실시양태의 많은 등가물을 인지하거나 확인할 수 있을 것이다. 따라서, 전기한 실시양태가 단지 예로서 제시되었다는 것, 그리고 첨부된 청구범위 및 그의 등가물의 범주 내에서 구체적으로 기재되고 청구된 것과 달리 발명 실시양태가 실시될 수 있다는 것이 이해되어야 한다. 본 개시내용의 발명 실시양태는 본원에 기재된 각각의 개별적 특색, 시스템, 물품, 재료, 키트 및/또는 방법에 관한 것이다. 추가로, 2종 이상의 그와 같은 특색, 시스템, 물품, 재료, 키트 및/또는 방법의 어떠한 조합도, 그와 같은 특색, 시스템, 물품, 재료, 키트 및/또는 방법이 상호 모순되지 않는다면, 본 개시내용의 발명의 범주 내에 포함된다.
본원에서 정의되어 사용되는 바와 같은 모든 정의는 사전상의 정의, 참조로 포함되는 문헌상의 정의 및/또는 정의되는 용어의 일반적인 의미에 우선하는 것으로 이해되어야 한다.
본원에 개시되는 모든 참고문헌, 특허 및 특허 출원은 각각이 인용되는 주제와 관련하여 참조로 포함되는 바, 일부 경우에서 이는 문헌 전체를 포괄할 수 있다.
본원의 명세서 및 청구범위에 사용된 바와 같이, 단수형은 분명하게 달리 표시되지 않는 한, "적어도 하나"를 의미하는 것으로 이해되어야 한다.
본원의 명세서 및 청구범위에 사용된 바와 같이, "및/또는"이라는 어구는 그렇게 결합되는 요소 중 "어느 하나 또는 둘 다", 즉, 일부 경우에는 합동으로 존재하며 다른 경우에는 분리되어 존재하는 요소를 의미하는 것으로 이해되어야 한다. "및/또는"을 사용하여 열거되는 다수의 요소도 동일한 방식으로, 즉, 그렇게 결합되는 요소 중 "하나 이상"으로 해석되어야 한다. 임의적으로, 구체적으로 식별되는 요소와 관련되는지 또는 무관한지와 관계없이, "및/또는"이라는 문구에 의해 구체적으로 식별되는 요소 이외의 다른 요소가 존재할 수도 있다. 따라서, 비-제한적인 예로서, "포함하는"과 같은 개방형 언어와 함께 사용될 때의 "A 및/또는 B"라는 언급은 하나의 실시양태에서는 A 단독 (임의적으로는 B가 아닌 다른 요소 포함)을; 또 다른 실시양태에서는 B 단독 (임의적으로는 A가 아닌 다른 요소 포함)을; 또 다른 실시양태에서는 A 및 B 둘 다 (임의적으로는 다른 요소 포함)를 지칭할 수 있는 등이다.
본원의 명세서 및 청구범위에 사용된 바와 같이, "또는"은 상기에서 정의된 바와 같은 "및/또는"과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목을 분리할 때, "또는" 또는 "및/또는"은 포괄적인 것으로, 즉, 적어도 하나의 포함으로는 물론, 수많은 요소 또는 목록 요소 중 하나 초과, 및 임의적으로 추가의 열거되지 않은 항목을 포함하는 것으로 해석되어야 한다. "중 오로지 하나" 또는 "중 정확하게 하나", 또는 청구범위에 사용될 때 "로 이루어진"과 같이 분명하게 달리 표시되는 용어만이 수많은 요소 또는 목록 요소 중 정확히 하나의 요소의 포함을 지칭할 것이다. 일반적으로, 본원에 사용된 바와 같이 "또는"이라는 용어는 "중 어느 하나", "중 하나", "중 오로지 하나" 또는 "중 정확히 하나"와 같이 배제성을 갖는 용어가 선행하는 경우, 오로지 포괄적인 대안 (즉, "하나 또는 다른 것, 그러나 둘 다는 아님")을 지시하는 것으로 해석되어야 한다. 청구범위에 사용될 때, "로 본질적으로 이루어진"은 특허법 분야에 사용된 바와 같은 그의 통상적인 의미를 가져야 한다.
본원의 명세서 및 청구범위에 사용된 바와 같이, 하나 이상의 요소의 목록에 대한 언급에서의 "적어도 하나"라는 구는 요소 목록의 요소 중 임의의 하나 이상으로부터 선택되는 적어도 하나의 요소를 의미하지만, 요소 목록 내에서 구체적으로 열거되는 각각의 모든 요소 중 적어도 하나를 반드시 포함하는 것은 아니며 요소 목록 중 요소의 임의의 조합을 배제하는 것은 아닌 것으로 이해되어야 한다. 이와 같은 정의는 또한 구체적으로 식별되는 요소와 관련되는지 또는 무관한지에 관계없이 "적어도 하나"라는 구가 지칭하는 요소 목록 내에서 구체적으로 식별되는 요소가 아닌 다른 요소가 임의적으로 존재할 수도 있다는 것을 가능하게 한다. 따라서, 비-제한적인 예로서, "A 및 B 중 적어도 하나" (또는 동등하게 "A 또는 B 중 적어도 하나", 또는 동등하게 "A 및/또는 B 중 적어도 하나")는 하나의 실시양태에서는 B가 존재하지 않는 (및 임의적으로 B가 아닌 다른 요소를 포함하는), 임의적으로 하나 초과를 포함한 적어도 하나의 A를; 또 다른 실시양태에서는 A가 존재하지 않는 (및 임의적으로 A가 아닌 다른 요소를 포함하는), 임의적으로 하나 초과를 포함한 적어도 하나의 B를; 또 다른 실시양태에서는 임의적으로 하나 초과를 포함한 적어도 하나의 A 및 임의적으로 하나 초과를 포함한 적어도 하나의 B (및 임의적으로 다른 요소 포함)를 지칭할 수 있는 등이다.
분명하게 달리 지시되지 않는 한, 하나를 초과하는 단계 또는 작용을 포함하는 본원에서 청구되는 임의의 방법에서, 방법 중 단계 또는 작용의 순서가 반드시 방법 중 단계 또는 작용이 언급되는 순서에 제한되는 것은 아니라는 것 역시 이해되어야 한다.
상기 명세서 뿐만 아니라 청구범위에서, "포함하는", "포함한", "보유하는", "갖는", "함유하는", "수반하는", "수용하는", "로 구성된" 등과 같은 모든 전이 구는 개방형인 것으로, 즉, 포함하나 그에 제한되지는 않음을 의미하는 것으로 이해되어야 한다. 미국 특허청 특허 심사 절차 매뉴얼(United States Patent Office Manual of Patent Examining Procedures) 섹션 2111.03에 제시되어 있는 바와 같이, "로 이루어진" 및 "로 본질적으로 이루어진"이라는 전이 구만이 각각 폐쇄형 또는 반-폐쇄형 전이 구일 수 있다. 개방형 전이 구 (예를 들어, "포함하는")를 사용하여 본 문서에서 기재된 실시양태가 대안적인 실시양태에서는 개방형 전이 구에 의해 기재된 특색"으로 이루어진" 및 그"로 본질적으로 이루어진" 것으로도 고려된다는 것이 이해되어야 한다. 예를 들어, 본 개시내용이 "A 및 B를 포함하는 조성물"을 기재하는 경우, 본 개시내용은 대안적인 실시양태인 "A 및 B로 이루어진 조성물" 및 "본질적으로 A 및 B로 이루어진 조성물"도 고려하는 것이다.
SEQUENCE LISTING
<110> Eidgenossische Technische Hochschule Zurich
<120> CELL CLASSIFIER CIRCUITS AND METHODS OF USE THEREOF
<130> E0583.70001WO00
<140> Not Yet Assigned
<141> Concurrently Herewith
<150> US 63/009,736
<151> 2020-04-14
<160> 306
<170> PatentIn version 3.5
<210> 1
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 1
ugagguagua gguuguaugg uu 22
<210> 2
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 2
aagcugccag uugaagaacu gu 22
<210> 3
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 3
uucaaguaau ucaggauagg u 21
<210> 4
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 4
cauuauuacu uuugguacgc g 21
<210> 5
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 5
uggaguguga caaugguguu ug 22
<210> 6
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 6
cagcagcaau ucauguuuug ga 22
<210> 7
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 7
cagcagcaau ucauguuuug aa 22
<210> 8
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 8
auaagacgag caaaaagcuu gu 22
<210> 9
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 9
auaagacgaa caaaagguuu gu 22
<210> 10
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 10
uaaucucagc uggcaacugu ga 22
<210> 11
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 11
uacugcauca ggaacugacu gga 23
<210> 12
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 12
uacugcauca ggaacugauu gga 23
<210> 13
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 13
uuuguucguu cggcucgcgu ga 22
<210> 14
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 14
uaaggcacgc ggugaaugcc aa 22
<210> 15
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 15
uggaauguaa agaaguaugu au 22
<210> 16
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 16
uuuggucccc uucaaccagc ug 22
<210> 17
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 17
uuuggucccc uucaaccagc ua 22
<210> 18
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 18
ucuuugguua ucuagcugua uga 23
<210> 19
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 19
uccagcauca gugauuuugu ug 22
<210> 20
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 20
ugauugucca aacgcaauuc u 21
<210> 21
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 21
uuuugcaccu uuuggaguga a 21
<210> 22
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 22
auugacacuu cugugaguag a 21
<210> 23
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 23
uacugcagac aguggcaauc a 21
<210> 24
<211> 24
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 24
uggaagacua gugauuuugu uguu 24
<210> 25
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 25
uccuucauuc caccggaguc ug 22
<210> 26
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 26
uguaguguuu ccuacuuuau gga 23
<210> 27
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 27
acaguagucu gcacauuggu ua 22
<210> 28
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 28
uaacacuguc ugguaacgau gu 22
<210> 29
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 29
uaauacugcc ugguaaugau ga 22
<210> 30
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 30
cugaccuaug aauugacagc c 21
<210> 31
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 31
uguaacagca acuccaugug ga 22
<210> 32
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 32
uggcagugua uuguuagcug gu 22
<210> 33
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 33
ugagguagua gguuguauag uu 22
<210> 34
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 34
ugagguagua gguugugugg uu 22
<210> 35
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 35
agagguagua gguugcauag uu 22
<210> 36
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 36
ugagguagga gguuguauag uu 22
<210> 37
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 37
ugagguagua gauuguauag uu 22
<210> 38
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 38
ugagguagua guuuguacag uu 22
<210> 39
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 39
ugagguagua guuugugcug uu 22
<210> 40
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 40
ugagaugaag cacuguagcu c 21
<210> 41
<211> 22
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 41
ucagugcacu acagaacuuu gu 22
<210> 42
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 42
aaccatacaa cctactacct ca 22
<210> 43
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 43
acagttcttc aactggcagc tt 22
<210> 44
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 44
acctatcctg aattacttga a 21
<210> 45
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 45
cgcgtaccaa aagtaataat g 21
<210> 46
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 46
caaacaccat tgtcacactc ca 22
<210> 47
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 47
gtccaaaaca tgaattgctg ct 22
<210> 48
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 48
gtccaaaaca tgaattgctg ct 22
<210> 49
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 49
acaagctttt tgctcgtctt at 22
<210> 50
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 50
acaaaccttt tgttcgtctt at 22
<210> 51
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 51
tcacagttgc cagctgagat ta 22
<210> 52
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 52
tccagtcagt tcctgatgca gta 23
<210> 53
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 53
tccaatcagt tcctgatgca gta 23
<210> 54
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 54
tcacgcgagc cgaacgaaca aa 22
<210> 55
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 55
ttggcattca ccgcgtgcct ta 22
<210> 56
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 56
atacatactt ctttacattc ca 22
<210> 57
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 57
cagctggttg aaggggacca aa 22
<210> 58
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 58
tagctggttg aaggggacca aa 22
<210> 59
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 59
tcatacagct agataaccaa aga 23
<210> 60
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 60
tccagcatca gtgattttgt tg 22
<210> 61
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 61
tgattgtcca aacgcaattc t 21
<210> 62
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 62
ttcactccaa aaggtgcaaa a 21
<210> 63
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 63
attgacactt ctgtgagtag a 21
<210> 64
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 64
tactgcagac agtggcaatc a 21
<210> 65
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 65
aacaacaaaa tcactagtct tcca 24
<210> 66
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 66
cagactccgg tggaatgaag ga 22
<210> 67
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 67
tccataaagt aggaaacact aca 23
<210> 68
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 68
taaccaatgt gcagactact gt 22
<210> 69
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 69
acatcgttac cagacagtgt ta 22
<210> 70
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 70
tcatcattac caggcagtat ta 22
<210> 71
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 71
ggctgtcaat tcataggtca g 21
<210> 72
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 72
tccacatgga gttgctgtta ca 22
<210> 73
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 73
accagctaac aatacactgc ca 22
<210> 74
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 74
aactatacaa cctactacct ca 22
<210> 75
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 75
aaccacacaa cctactacct ca 22
<210> 76
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 76
aactatgcaa cctactacct ct 22
<210> 77
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 77
aactatacaa cctcctacct ca 22
<210> 78
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 78
aactatacaa tctactacct ca 22
<210> 79
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 79
aactgtacaa actactacct ca 22
<210> 80
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 80
aacagcacaa actactacct ca 22
<210> 81
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 81
gagctacagt gcttcatctc at 22
<210> 82
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 82
acaaagttct gtagtgcact ga 22
<210> 83
<211> 578
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 83
atgatgagtt tcccaccatg gtgtttcctt ctgggcagat cagccaggcc tcggccttgg 60
ccccggcccc tccccaagtc ctgccccagg ctccagcccc tgcccctgct ccagccatgg 120
tatcagctct ggcccaggcc ccagcccctg tcccagtcct agccccaggc cctcctcagg 180
ctgtggcccc acctgccccc aagcccaccc aggctgggga aggaacgctg tcagaggccc 240
tgctgcagct gcagtttgat gatgaagacc tgggggcctt gcttggcaac agcacagacc 300
cagctgtgtt cacagacctg gcatccgtcg acaactccga gtttcagcag ctgctgaacc 360
agggcatacc tgtggccccc cacacaactg agcccatgct gatggagtac cctgaggcta 420
taactcgcct agtgacaggg gcccagaggc cccccgaccc agctcctgct ccactggggg 480
ccccggggct ccccaatggc ctcctttcag gagatgaaga cttctcctcc attgcggaca 540
tggacttctc agccctgctg agtcagatca gctcctaa 578
<210> 84
<211> 192
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 84
His Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln
1 5 10 15
Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro
20 25 30
Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro
35 40 45
Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro
50 55 60
Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala
65 70 75 80
Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly
85 90 95
Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn
100 105 110
Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His
115 120 125
Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu
130 135 140
Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly
145 150 155 160
Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser
165 170 175
Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser
180 185 190
<210> 85
<211> 366
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 85
caggctgggg aaggaacgct gtcagaggcc ctgctgcagc tgcagtttga tgatgaagac 60
ctgggggcct tgcttggcaa cagcacagac ccagctgtgt tcacagacct ggcatccgtc 120
gacaactccg agtttcagca gctgctgaac cagggcatac ctgtggcccc ccacacaact 180
gagcccatgc tgatggagta ccctgaggct ataactcgcc tagtgacagg cgcacaacgc 240
ccacctgatc cggcaccagc accccttgga gctcccggtc tccccaatgg cctcctttca 300
ggagatgaag acttctcctc cattgcggac atggacttct cagccctgct gagtcagatc 360
agctcc 366
<210> 86
<211> 122
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 86
Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe
1 5 10 15
Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala
20 25 30
Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu
35 40 45
Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu
50 55 60
Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg
65 70 75 80
Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn
85 90 95
Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp
100 105 110
Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser
115 120
<210> 87
<211> 630
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 87
cccaagccag caccccagcc ctatcccttt acgtcatccc tgagcaccat caactatgat 60
gagtttccca ccatggtgtt tccttctggg cagatcagcc aggcctcggc cttggccccg 120
gcccctcccc aagtcctgcc ccaggctcca gcccctgccc ctgctccagc catggtatca 180
gctctggccc aggccccagc ccctgtccca gtcctagccc caggccctcc tcaggctgtg 240
gccccacctg cccccaagcc cacccaggct ggggaaggaa cgctgtcaga ggccctgctg 300
cagctgcagt ttgatgatga agacctgggg gccttgcttg gcaacagcac agacccagct 360
gtgttcacag acctggcatc cgtcgacaac tccgagtttc agcagctgct gaaccagggc 420
atacctgtgg ccccccacac aactgagccc atgctgatgg agtaccctga ggctataact 480
cgcctagtga caggggccca gaggcccccc gacccagctc ctgctccact gggggccccg 540
gggctcccca atggcctcct ttcaggagat gaagacttct cctccattgc ggacatggac 600
ttctcagccc tgctgagtca gatcagctcc 630
<210> 88
<211> 210
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 88
Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr
1 5 10 15
Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile
20 25 30
Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln
35 40 45
Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln
50 55 60
Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val
65 70 75 80
Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser
85 90 95
Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu
100 105 110
Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val
115 120 125
Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala
130 135 140
Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr
145 150 155 160
Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro
165 170 175
Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp
180 185 190
Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile
195 200 205
Ser Ser
210
<210> 89
<211> 234
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 89
gcccccccga ccgatgtcag cctgggggac gagctccact tagacggcga ggacgtggcg 60
atggcgcatg ccgacgcgct agacgatttc gatctggaca tgttggggga cggggattcc 120
ccgggtccgg gatttacccc ccacgactcc gccccctacg gcgctctgga tatggccgac 180
ttcgagtttg agcagatgtt taccgatgcc cttggaattg acgagtacgg tggg 234
<210> 90
<211> 78
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 90
Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly
1 5 10 15
Glu Asp Val Ala Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu
20 25 30
Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His
35 40 45
Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu
50 55 60
Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly
65 70 75
<210> 91
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 91
ccggcagatg cccttgatga cttcgatttg gacatgctcc cagcggatgc cttggacgat 60
tttgatctcg atatgcttcc cgccgacgca ctcgatgatt tcgatctgga tatgctcccg 120
ggt 123
<210> 92
<211> 41
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 92
Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp
1 5 10 15
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp
20 25 30
Asp Phe Asp Leu Asp Met Leu Pro Gly
35 40
<210> 93
<211> 126
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 93
ggtccggcag atgcccttga tgacttcgat ttggacatgc tcccagcgga tgccttggac 60
gattttgatc tcgatatgct tcccgccgac gcactcgatg atttcgatct ggatatgctc 120
ccgggt 126
<210> 94
<211> 42
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 94
Gly Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala
1 5 10 15
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu
20 25 30
Asp Asp Phe Asp Leu Asp Met Leu Pro Gly
35 40
<210> 95
<211> 1374
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 95
atgagtcgag gagaggtgcg catggcgaag gcagggcggg aggggccgcg ggacagcgtg 60
tggctgtcgg gggaggggcg gcgcggcggt cgccgtgggg ggcagccgtc cgggctcgac 120
cgggaccgga tcaccggggt caccgtccgg ctgctggaca cggagggcct gacggggttc 180
tcgatgcgcc gcctggccgc cgagctgaac gtcaccgcga tgtccgtgta ctggtacgtc 240
gacaccaagg accagttgct cgagctcgcc ctggacgccg tcttcggcga gctgcgccac 300
ccggacccgg acgccgggct cgactggcgc gaggaactgc gggccctggc ccgggagaac 360
cgggcgctgc tggtgcgcca cccctggtcg tcccggctgg tcggcaccta cctcaacatc 420
ggcccgcact cgctggcctt ctcccgcgcg gtgcagaacg tcgtgcgccg cagcgggctg 480
cccgcgcacc gcctgaccgg cgccatctcg gccgtcttcc agttcgtcta cggctacggc 540
accatcgagg gccgcttcct cgcccgggtg gcggacaccg ggctgagtcc ggaggagtac 600
ttccaggact cgatgaccgc ggtgaccgag gtgccggaca ccgcgggcgt catcgaggac 660
gcgcaggaca tcatggcggc ccggggcggc gacaccgtgg cggagatgct ggaccgggac 720
ttcgagttcg ccctcgacct gctcgtcgcg ggcatcgacg cgatggtcga acaggcctcc 780
gcgtacagcc gcgcgcatga tgagtttccc accatggtgt ttccttctgg gcagatcagc 840
caggcctcgg ccttggcccc ggcccctccc caagtcctgc cccaggctcc agcccctgcc 900
cctgctccag ccatggtatc agctctggcc caggccccag cccctgtccc agtcctagcc 960
ccaggccctc ctcaggctgt ggccccacct gcccccaagc ccacccaggc tggggaagga 1020
acgctgtcag aggccctgct gcagctgcag tttgatgatg aagacctggg ggccttgctt 1080
ggcaacagca cagacccagc tgtgttcaca gacctggcat ccgtcgacaa ctccgagttt 1140
cagcagctgc tgaaccaggg catacctgtg gccccccaca caactgagcc catgctgatg 1200
gagtaccctg aggctataac tcgcctagtg acaggggccc agaggccccc cgacccagct 1260
cctgctccac tgggggcccc ggggctcccc aatggcctcc tttcaggaga tgaagacttc 1320
tcctccattg cggacatgga cttctcagcc ctgctgagtc agatcagctc ctaa 1374
<210> 96
<211> 457
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 96
Met Ser Arg Gly Glu Val Arg Met Ala Lys Ala Gly Arg Glu Gly Pro
1 5 10 15
Arg Asp Ser Val Trp Leu Ser Gly Glu Gly Arg Arg Gly Gly Arg Arg
20 25 30
Gly Gly Gln Pro Ser Gly Leu Asp Arg Asp Arg Ile Thr Gly Val Thr
35 40 45
Val Arg Leu Leu Asp Thr Glu Gly Leu Thr Gly Phe Ser Met Arg Arg
50 55 60
Leu Ala Ala Glu Leu Asn Val Thr Ala Met Ser Val Tyr Trp Tyr Val
65 70 75 80
Asp Thr Lys Asp Gln Leu Leu Glu Leu Ala Leu Asp Ala Val Phe Gly
85 90 95
Glu Leu Arg His Pro Asp Pro Asp Ala Gly Leu Asp Trp Arg Glu Glu
100 105 110
Leu Arg Ala Leu Ala Arg Glu Asn Arg Ala Leu Leu Val Arg His Pro
115 120 125
Trp Ser Ser Arg Leu Val Gly Thr Tyr Leu Asn Ile Gly Pro His Ser
130 135 140
Leu Ala Phe Ser Arg Ala Val Gln Asn Val Val Arg Arg Ser Gly Leu
145 150 155 160
Pro Ala His Arg Leu Thr Gly Ala Ile Ser Ala Val Phe Gln Phe Val
165 170 175
Tyr Gly Tyr Gly Thr Ile Glu Gly Arg Phe Leu Ala Arg Val Ala Asp
180 185 190
Thr Gly Leu Ser Pro Glu Glu Tyr Phe Gln Asp Ser Met Thr Ala Val
195 200 205
Thr Glu Val Pro Asp Thr Ala Gly Val Ile Glu Asp Ala Gln Asp Ile
210 215 220
Met Ala Ala Arg Gly Gly Asp Thr Val Ala Glu Met Leu Asp Arg Asp
225 230 235 240
Phe Glu Phe Ala Leu Asp Leu Leu Val Ala Gly Ile Asp Ala Met Val
245 250 255
Glu Gln Ala Ser Ala Tyr Ser Arg Ala His Asp Glu Phe Pro Thr Met
260 265 270
Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala
275 280 285
Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala
290 295 300
Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala
305 310 315 320
Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln
325 330 335
Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp
340 345 350
Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val
355 360 365
Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu
370 375 380
Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met
385 390 395 400
Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro
405 410 415
Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly
420 425 430
Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe
435 440 445
Ser Ala Leu Leu Ser Gln Ile Ser Ser
450 455
<210> 97
<211> 1164
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 97
atgagtcgag gagaggtgcg catggcgaag gcagggcggg aggggccgcg ggacagcgtg 60
tggctgtcgg gggaggggcg gcgcggcggt cgccgtgggg ggcagccgtc cgggctcgac 120
cgggaccgga tcaccggggt caccgtccgg ctgctggaca cggagggcct gacggggttc 180
tcgatgcgcc gcctggccgc cgagctgaac gtcaccgcga tgtccgtgta ctggtacgtc 240
gacaccaagg accagttgct cgagctcgcc ctggacgccg tcttcggcga gctgcgccac 300
ccggacccgg acgccgggct cgactggcgc gaggaactgc gggccctggc ccgggagaac 360
cgggcgctgc tggtgcgcca cccctggtcg tcccggctgg tcggcaccta cctcaacatc 420
ggcccgcact cgctggcctt ctcccgcgcg gtgcagaacg tcgtgcgccg cagcgggctg 480
cccgcgcacc gcctgaccgg cgccatctcg gccgtcttcc agttcgtcta cggctacggc 540
accatcgagg gccgcttcct cgcccgggtg gcggacaccg ggctgagtcc ggaggagtac 600
ttccaggact cgatgaccgc ggtgaccgag gtgccggaca ccgcgggcgt catcgaggac 660
gcgcaggaca tcatggcggc ccggggcggc gacaccgtgg cggagatgct ggaccgggac 720
ttcgagttcg ccctcgacct gctcgtcgcg ggcatcgacg cgatggtcga acaggcctcc 780
gcgtacagcc gcgcgcgtac gaaaaacaat tacgggtcta ccatcgaggg cctgctcgat 840
ctcccggacg acgacgcccc cgaagaggcg gggctggcgg ctccgcgcct gtcctttctc 900
cccgcgggac acacgcgcag actgtcgacg gcccccccga ccgatgtcag cctgggggac 960
gagctccact tagacggcga ggacgtggcg atggcgcatg ccgacgcgct agacgatttc 1020
gatctggaca tgttggggga cggggattcc ccgggtccgg gatttacccc ccacgactcc 1080
gccccctacg gcgctctgga tatggccgac ttcgagtttg agcagatgtt taccgatgcc 1140
cttggaattg acgagtacgg tggg 1164
<210> 98
<211> 388
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 98
Met Ser Arg Gly Glu Val Arg Met Ala Lys Ala Gly Arg Glu Gly Pro
1 5 10 15
Arg Asp Ser Val Trp Leu Ser Gly Glu Gly Arg Arg Gly Gly Arg Arg
20 25 30
Gly Gly Gln Pro Ser Gly Leu Asp Arg Asp Arg Ile Thr Gly Val Thr
35 40 45
Val Arg Leu Leu Asp Thr Glu Gly Leu Thr Gly Phe Ser Met Arg Arg
50 55 60
Leu Ala Ala Glu Leu Asn Val Thr Ala Met Ser Val Tyr Trp Tyr Val
65 70 75 80
Asp Thr Lys Asp Gln Leu Leu Glu Leu Ala Leu Asp Ala Val Phe Gly
85 90 95
Glu Leu Arg His Pro Asp Pro Asp Ala Gly Leu Asp Trp Arg Glu Glu
100 105 110
Leu Arg Ala Leu Ala Arg Glu Asn Arg Ala Leu Leu Val Arg His Pro
115 120 125
Trp Ser Ser Arg Leu Val Gly Thr Tyr Leu Asn Ile Gly Pro His Ser
130 135 140
Leu Ala Phe Ser Arg Ala Val Gln Asn Val Val Arg Arg Ser Gly Leu
145 150 155 160
Pro Ala His Arg Leu Thr Gly Ala Ile Ser Ala Val Phe Gln Phe Val
165 170 175
Tyr Gly Tyr Gly Thr Ile Glu Gly Arg Phe Leu Ala Arg Val Ala Asp
180 185 190
Thr Gly Leu Ser Pro Glu Glu Tyr Phe Gln Asp Ser Met Thr Ala Val
195 200 205
Thr Glu Val Pro Asp Thr Ala Gly Val Ile Glu Asp Ala Gln Asp Ile
210 215 220
Met Ala Ala Arg Gly Gly Asp Thr Val Ala Glu Met Leu Asp Arg Asp
225 230 235 240
Phe Glu Phe Ala Leu Asp Leu Leu Val Ala Gly Ile Asp Ala Met Val
245 250 255
Glu Gln Ala Ser Ala Tyr Ser Arg Ala Arg Thr Lys Asn Asn Tyr Gly
260 265 270
Ser Thr Ile Glu Gly Leu Leu Asp Leu Pro Asp Asp Asp Ala Pro Glu
275 280 285
Glu Ala Gly Leu Ala Ala Pro Arg Leu Ser Phe Leu Pro Ala Gly His
290 295 300
Thr Arg Arg Leu Ser Thr Ala Pro Pro Thr Asp Val Ser Leu Gly Asp
305 310 315 320
Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala
325 330 335
Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly
340 345 350
Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met
355 360 365
Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp
370 375 380
Glu Tyr Gly Gly
385
<210> 99
<211> 1179
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 99
atgccccgcc ccaagctcaa gtccgatgac gaggtactcg aggccgccac cgtagtgctg 60
aagcgttgcg gtcccataga gttcacgctc agcggagtag caaaggaggt ggggctctcc 120
cgcgcagcgt taatccagcg cttcaccaac cgcgatacgc tgctggtgag gatgatggag 180
cgcggcgtcg agcaggtgcg gcattacctg aatgcgatac cgataggcgc agggccgcaa 240
gggctctggg aatttttgca ggtgctcgtt cggagcatga acactcgcaa cgacttctcg 300
gtgaactatc tcatctcctg gtacgagctc caggtgccgg agctacgcac gcttgcgatc 360
cagcggaacc gcgcggtggt ggaggggatc cgcaagcgac tgcccccagg tgctcctgcg 420
gcagctgagt tgctcctgca ctcggtcatc gctggcgcga cgatgcagtg ggccgtcgat 480
ccggatggtg agctagctga tcatgtgctg gctcagatcg ctgccatcct gtgtttaatg 540
tttcccgaac acgacgattt ccaactcctc caggcacatg cgtccgcgta cagccgcgcg 600
catgatgagt ttcccaccat ggtgtttcct tctgggcaga tcagccaggc ctcggccttg 660
gccccggccc ctccccaagt cctgccccag gctccagccc ctgcccctgc tccagccatg 720
gtatcagctc tggcccaggc cccagcccct gtcccagtcc tagccccagg ccctcctcag 780
gctgtggccc cacctgcccc caagcccacc caggctgggg aaggaacgct gtcagaggcc 840
ctgctgcagc tgcagtttga tgatgaagac ctgggggcct tgcttggcaa cagcacagac 900
ccagctgtgt tcacagacct ggcatccgtc gacaactccg agtttcagca gctgctgaac 960
cagggcatac ctgtggcccc ccacacaact gagcccatgc tgatggagta ccctgaggct 1020
ataactcgcc tagtgacagg ggcccagagg ccccccgacc cagctcctgc tccactgggg 1080
gccccggggc tccccaatgg cctcctttca ggagatgaag acttctcctc cattgcggac 1140
atggacttct cagccctgct gagtcagatc agctcctaa 1179
<210> 100
<211> 392
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 100
Met Pro Arg Pro Lys Leu Lys Ser Asp Asp Glu Val Leu Glu Ala Ala
1 5 10 15
Thr Val Val Leu Lys Arg Cys Gly Pro Ile Glu Phe Thr Leu Ser Gly
20 25 30
Val Ala Lys Glu Val Gly Leu Ser Arg Ala Ala Leu Ile Gln Arg Phe
35 40 45
Thr Asn Arg Asp Thr Leu Leu Val Arg Met Met Glu Arg Gly Val Glu
50 55 60
Gln Val Arg His Tyr Leu Asn Ala Ile Pro Ile Gly Ala Gly Pro Gln
65 70 75 80
Gly Leu Trp Glu Phe Leu Gln Val Leu Val Arg Ser Met Asn Thr Arg
85 90 95
Asn Asp Phe Ser Val Asn Tyr Leu Ile Ser Trp Tyr Glu Leu Gln Val
100 105 110
Pro Glu Leu Arg Thr Leu Ala Ile Gln Arg Asn Arg Ala Val Val Glu
115 120 125
Gly Ile Arg Lys Arg Leu Pro Pro Gly Ala Pro Ala Ala Ala Glu Leu
130 135 140
Leu Leu His Ser Val Ile Ala Gly Ala Thr Met Gln Trp Ala Val Asp
145 150 155 160
Pro Asp Gly Glu Leu Ala Asp His Val Leu Ala Gln Ile Ala Ala Ile
165 170 175
Leu Cys Leu Met Phe Pro Glu His Asp Asp Phe Gln Leu Leu Gln Ala
180 185 190
His Ala Ser Ala Tyr Ser Arg Ala His Asp Glu Phe Pro Thr Met Val
195 200 205
Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro
210 215 220
Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met
225 230 235 240
Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro
245 250 255
Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala
260 265 270
Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp
275 280 285
Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe
290 295 300
Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn
305 310 315 320
Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu
325 330 335
Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro
340 345 350
Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu
355 360 365
Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser
370 375 380
Ala Leu Leu Ser Gln Ile Ser Ser
385 390
<210> 101
<211> 969
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 101
atgccccgcc ccaagctcaa gtccgatgac gaggtactcg aggccgccac cgtagtgctg 60
aagcgttgcg gtcccataga gttcacgctc agcggagtag caaaggaggt ggggctctcc 120
cgcgcagcgt taatccagcg cttcaccaac cgcgatacgc tgctggtgag gatgatggag 180
cgcggcgtcg agcaggtgcg gcattacctg aatgcgatac cgataggcgc agggccgcaa 240
gggctctggg aatttttgca ggtgctcgtt cggagcatga acactcgcaa cgacttctcg 300
gtgaactatc tcatctcctg gtacgagctc caggtgccgg agctacgcac gcttgcgatc 360
cagcggaacc gcgcggtggt ggaggggatc cgcaagcgac tgcccccagg tgctcctgcg 420
gcagctgagt tgctcctgca ctcggtcatc gctggcgcga cgatgcagtg ggccgtcgat 480
ccggatggtg agctagctga tcatgtgctg gctcagatcg ctgccatcct gtgtttaatg 540
tttcccgaac acgacgattt ccaactcctc caggcacatg cgtccgcgta cagccgcgcg 600
cgtacgaaaa acaattacgg gtctaccatc gagggcctgc tcgatctccc ggacgacgac 660
gcccccgaag aggcggggct ggcggctccg cgcctgtcct ttctccccgc gggacacacg 720
cgcagactgt cgacggcccc cccgaccgat gtcagcctgg gggacgagct ccacttagac 780
ggcgaggacg tggcgatggc gcatgccgac gcgctagacg atttcgatct ggacatgttg 840
ggggacgggg attccccggg tccgggattt accccccacg actccgcccc ctacggcgct 900
ctggatatgg ccgacttcga gtttgagcag atgtttaccg atgcccttgg aattgacgag 960
tacggtggg 969
<210> 102
<211> 323
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 102
Met Pro Arg Pro Lys Leu Lys Ser Asp Asp Glu Val Leu Glu Ala Ala
1 5 10 15
Thr Val Val Leu Lys Arg Cys Gly Pro Ile Glu Phe Thr Leu Ser Gly
20 25 30
Val Ala Lys Glu Val Gly Leu Ser Arg Ala Ala Leu Ile Gln Arg Phe
35 40 45
Thr Asn Arg Asp Thr Leu Leu Val Arg Met Met Glu Arg Gly Val Glu
50 55 60
Gln Val Arg His Tyr Leu Asn Ala Ile Pro Ile Gly Ala Gly Pro Gln
65 70 75 80
Gly Leu Trp Glu Phe Leu Gln Val Leu Val Arg Ser Met Asn Thr Arg
85 90 95
Asn Asp Phe Ser Val Asn Tyr Leu Ile Ser Trp Tyr Glu Leu Gln Val
100 105 110
Pro Glu Leu Arg Thr Leu Ala Ile Gln Arg Asn Arg Ala Val Val Glu
115 120 125
Gly Ile Arg Lys Arg Leu Pro Pro Gly Ala Pro Ala Ala Ala Glu Leu
130 135 140
Leu Leu His Ser Val Ile Ala Gly Ala Thr Met Gln Trp Ala Val Asp
145 150 155 160
Pro Asp Gly Glu Leu Ala Asp His Val Leu Ala Gln Ile Ala Ala Ile
165 170 175
Leu Cys Leu Met Phe Pro Glu His Asp Asp Phe Gln Leu Leu Gln Ala
180 185 190
His Ala Ser Ala Tyr Ser Arg Ala Arg Thr Lys Asn Asn Tyr Gly Ser
195 200 205
Thr Ile Glu Gly Leu Leu Asp Leu Pro Asp Asp Asp Ala Pro Glu Glu
210 215 220
Ala Gly Leu Ala Ala Pro Arg Leu Ser Phe Leu Pro Ala Gly His Thr
225 230 235 240
Arg Arg Leu Ser Thr Ala Pro Pro Thr Asp Val Ser Leu Gly Asp Glu
245 250 255
Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His Ala Asp Ala Leu
260 265 270
Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp Ser Pro Gly Pro
275 280 285
Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala Leu Asp Met Ala
290 295 300
Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu Gly Ile Asp Glu
305 310 315 320
Tyr Gly Gly
<210> 103
<211> 896
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (128)..(128)
<223> n is a, c, g, or t
<400> 103
atgaaagcgt taacggccag gcaacaagag gtgtttgatc tcatccgtga tcacatcagc 60
cagacaggta tgccgccgac gcgtgcggaa atcgcgcagc gtttggggtt ccgttcccca 120
aacgcggntg aagaacatct gaaggcgctg gcacgcaaag gcgttattga aattgtttcc 180
ggcgcatcac gcgggattcg tctgttgcag gaagaggaag aagggttgcc gctggtaggt 240
cgtgtggctg ccggtgaacc acttctggcg caacagcata ttgaaggtca ttatcaggtc 300
gatccttcct tattcaagcc gaatgctgat ttcctgctgc gcgtcagcgg gatgtcgatg 360
aaagatatcg gcattatgga tggtgacttg ctggcagtgc ataaaactca ggatgtacgt 420
aacggtcagg tcgttgtcgc acgtattgat gacgaagtta ccgttaagcg cctgaaaaaa 480
cagggcaata aagtcgaact gttgccagaa aatagcgagt ttaaaccaat tgtcgttgac 540
cttcgtcagc agagcttcac cattgaaggt ctggcggttg gggttattcg caacggcgac 600
tggctgtcta gctatcctta tgacgtgcct gactatgcca gcctgggagg atctagagcc 660
cccccgaccg atgtcagcct gggggacgag ctccacttag acggcgagga cgtggcgatg 720
gcgcatgccg acgcgctaga cgatttcgat ctggacatgt tgggggacgg ggattccccg 780
ggtccgggat ttacccccca cgactccgcc ccctacggcg ctctggatat ggccgacttc 840
gagtttgagc agatgtttac cgatgccctt ggaattgacg agtacggtgg gtagtg 896
<210> 104
<211> 296
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 104
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Glu Glu His Leu Lys Ala
35 40 45
Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg Gly
50 55 60
Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly Arg
65 70 75 80
Val Ala Ala Gly Glu Pro Leu Leu Ala Gln Gln His Ile Glu Gly His
85 90 95
Tyr Gln Val Asp Pro Ser Leu Phe Lys Pro Asn Ala Asp Phe Leu Leu
100 105 110
Arg Val Ser Gly Met Ser Met Lys Asp Ile Gly Ile Met Asp Gly Asp
115 120 125
Leu Leu Ala Val His Lys Thr Gln Asp Val Arg Asn Gly Gln Val Val
130 135 140
Val Ala Arg Ile Asp Asp Glu Val Thr Val Lys Arg Leu Lys Lys Gln
145 150 155 160
Gly Asn Lys Val Glu Leu Leu Pro Glu Asn Ser Glu Phe Lys Pro Ile
165 170 175
Val Val Asp Leu Arg Gln Gln Ser Phe Thr Ile Glu Gly Leu Ala Val
180 185 190
Gly Val Ile Arg Asn Gly Asp Trp Leu Ser Ser Tyr Pro Tyr Asp Val
195 200 205
Pro Asp Tyr Ala Ser Leu Gly Gly Ser Arg Ala Pro Pro Thr Asp Val
210 215 220
Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala
225 230 235 240
His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly
245 250 255
Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly
260 265 270
Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala
275 280 285
Leu Gly Ile Asp Glu Tyr Gly Gly
290 295
<210> 105
<211> 339
<212> DNA
<213> Escherichia coli
<400> 105
atggctacga ccgagcggga cgtaaaccag cttactccga gagagaggga cattttgaag 60
ctgattgcgc aggggcttcc caataagatg attgccagac gccttgatat cacggaaagc 120
actgtgaaag tccacgtgaa acacatgctc aaaaagatga aactcaagtc ccgcgtggaa 180
gctgcggtct gggtacatca ggagcgaatc tttggtccgg cagatgccct tgatgacttc 240
gatttggaca tgctcccagc ggatgccttg gacgattttg atctcgatat gcttcccgcc 300
gacgcactcg atgatttcga tctggatatg ctcccgggt 339
<210> 106
<211> 113
<212> PRT
<213> Escherichia coli
<400> 106
Met Ala Thr Thr Glu Arg Asp Val Asn Gln Leu Thr Pro Arg Glu Arg
1 5 10 15
Asp Ile Leu Lys Leu Ile Ala Gln Gly Leu Pro Asn Lys Met Ile Ala
20 25 30
Arg Arg Leu Asp Ile Thr Glu Ser Thr Val Lys Val His Val Lys His
35 40 45
Met Leu Lys Lys Met Lys Leu Lys Ser Arg Val Glu Ala Ala Val Trp
50 55 60
Val His Gln Glu Arg Ile Phe Gly Pro Ala Asp Ala Leu Asp Asp Phe
65 70 75 80
Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp
85 90 95
Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro
100 105 110
Gly
<210> 107
<211> 456
<212> DNA
<213> Escherichia coli
<400> 107
atggctacga ccgagcggga cgtaaaccag cttactccga gagagaggga cattttgaag 60
ctgattgcgc aggggcttcc caataagatg attgccagac gccttgatat cacggaaagc 120
actgtgaaag tccacgtgaa acacatgctc aaaaagatga aactcaagtc ccgcgtggaa 180
gctgcggtct gggtacatca ggagcgaatc tttgccagcg cccccccgac cgatgtcagc 240
ctgggggacg agctccactt agacggcgag gacgtggcga tggcgcatgc cgacgcgcta 300
gacgatttcg atctggacat gttgggggac ggggattccc cgggtccggg atttaccccc 360
cacgactccg ccccctacgg cgctctggat atggccgact tcgagtttga gcagatgttt 420
accgatgccc ttggaattga cgagtacggt gggtga 456
<210> 108
<211> 151
<212> PRT
<213> Escherichia coli
<400> 108
Met Ala Thr Thr Glu Arg Asp Val Asn Gln Leu Thr Pro Arg Glu Arg
1 5 10 15
Asp Ile Leu Lys Leu Ile Ala Gln Gly Leu Pro Asn Lys Met Ile Ala
20 25 30
Arg Arg Leu Asp Ile Thr Glu Ser Thr Val Lys Val His Val Lys His
35 40 45
Met Leu Lys Lys Met Lys Leu Lys Ser Arg Val Glu Ala Ala Val Trp
50 55 60
Val His Gln Glu Arg Ile Phe Ala Ser Ala Pro Pro Thr Asp Val Ser
65 70 75 80
Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala Met Ala His
85 90 95
Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Asp Gly Asp
100 105 110
Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro Tyr Gly Ala
115 120 125
Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr Asp Ala Leu
130 135 140
Gly Ile Asp Glu Tyr Gly Gly
145 150
<210> 109
<211> 348
<212> DNA
<213> Escherichia coli
<400> 109
atggctacga ccgagcggga cgtaaaccag cttactccga gagagaggga cattttgaag 60
ctgattgcgc aggggcttcc caataagatg attgccagac gccttgatat cacggaaagc 120
actgtgaaag tccacgtgaa acacatgctc aaaaagatga aactcaagtc ccgcgtggaa 180
gctgcggtct gggtacatca ggagcgaatc tttgccagcg gtccggcaga tgcccttgat 240
gacttcgatt tggacatgct cccagcggat gccttggacg attttgatct cgatatgctt 300
cccgccgacg cactcgatga tttcgatctg gatatgctcc cgggttga 348
<210> 110
<211> 115
<212> PRT
<213> Escherichia coli
<400> 110
Met Ala Thr Thr Glu Arg Asp Val Asn Gln Leu Thr Pro Arg Glu Arg
1 5 10 15
Asp Ile Leu Lys Leu Ile Ala Gln Gly Leu Pro Asn Lys Met Ile Ala
20 25 30
Arg Arg Leu Asp Ile Thr Glu Ser Thr Val Lys Val His Val Lys His
35 40 45
Met Leu Lys Lys Met Lys Leu Lys Ser Arg Val Glu Ala Ala Val Trp
50 55 60
Val His Gln Glu Arg Ile Phe Ala Ser Gly Pro Ala Asp Ala Leu Asp
65 70 75 80
Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp
85 90 95
Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
100 105 110
Leu Pro Gly
115
<210> 111
<211> 843
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 111
atgcaagaaa actacaagat tctcgtggtg gatgatgaca tgcgacttcg cgcattgctc 60
gaaagatatc tgaccgagca gggatttcaa gtgcgctccg tggccaatgc cgagcagatg 120
gataggctct tgacgaggga gtcgttccat ctgatggtgc tggaattgat gcttcccggt 180
gaggacggat tgtccatttg ccggagactt aggtcgcagt caaaccccat gccgatcatc 240
atggtcacag cgaagggaga ggaggtcgat agaattgtag gtcttgagat tggggcagac 300
gactacatcc ccaagccgtt caatccccgg gaacttcttg cgcgaatccg agccgtgctc 360
aggcgacagg ccaacgagct gcccggagct ccatcgcaag aggaagcggt catcgcgttc 420
gggaagttca agttgaacct cggcacgaga gagatgtttc gggaagatga acctatgccg 480
ctcacatcgg gggagtttgc ggtcttgaaa gcacttgtct cacacccgag agaacctctg 540
tcgcgggata aactcatgaa tctggcgaga ggcagagagt atagcgcgat ggaaaggtcc 600
atcgatgtcc agattagccg cctccgccgc atggtggagg aagatccagc ccaccctcgg 660
tacatccaga ctgtatgggg attggggtat gtgttcgtac cggatgggtc aaaagcagga 720
ccggcggacg cactggatga ctttgacttg gatatgctcc cagcggatgc gttggacgat 780
tttgaccttg acatgttgcc tgccgacgcg cttgacgact tcgacttgga catgctgccc 840
ggt 843
<210> 112
<211> 281
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 112
Met Gln Glu Asn Tyr Lys Ile Leu Val Val Asp Asp Asp Met Arg Leu
1 5 10 15
Arg Ala Leu Leu Glu Arg Tyr Leu Thr Glu Gln Gly Phe Gln Val Arg
20 25 30
Ser Val Ala Asn Ala Glu Gln Met Asp Arg Leu Leu Thr Arg Glu Ser
35 40 45
Phe His Leu Met Val Leu Glu Leu Met Leu Pro Gly Glu Asp Gly Leu
50 55 60
Ser Ile Cys Arg Arg Leu Arg Ser Gln Ser Asn Pro Met Pro Ile Ile
65 70 75 80
Met Val Thr Ala Lys Gly Glu Glu Val Asp Arg Ile Val Gly Leu Glu
85 90 95
Ile Gly Ala Asp Asp Tyr Ile Pro Lys Pro Phe Asn Pro Arg Glu Leu
100 105 110
Leu Ala Arg Ile Arg Ala Val Leu Arg Arg Gln Ala Asn Glu Leu Pro
115 120 125
Gly Ala Pro Ser Gln Glu Glu Ala Val Ile Ala Phe Gly Lys Phe Lys
130 135 140
Leu Asn Leu Gly Thr Arg Glu Met Phe Arg Glu Asp Glu Pro Met Pro
145 150 155 160
Leu Thr Ser Gly Glu Phe Ala Val Leu Lys Ala Leu Val Ser His Pro
165 170 175
Arg Glu Pro Leu Ser Arg Asp Lys Leu Met Asn Leu Ala Arg Gly Arg
180 185 190
Glu Tyr Ser Ala Met Glu Arg Ser Ile Asp Val Gln Ile Ser Arg Leu
195 200 205
Arg Arg Met Val Glu Glu Asp Pro Ala His Pro Arg Tyr Ile Gln Thr
210 215 220
Val Trp Gly Leu Gly Tyr Val Phe Val Pro Asp Gly Ser Lys Ala Gly
225 230 235 240
Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp
245 250 255
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp
260 265 270
Asp Phe Asp Leu Asp Met Leu Pro Gly
275 280
<210> 113
<211> 141
<212> PRT
<213> Escherichia coli
<400> 113
Met Val Glu Ser Tyr Lys Phe Asn Gly Trp Glu Leu Asp Ile Asn Ser
1 5 10 15
Arg Ser Leu Ile Gly Pro Asp Gly Glu Gln Tyr Lys Leu Pro Arg Ser
20 25 30
Glu Phe Arg Ala Met Leu His Phe Cys Glu Asn Pro Gly Lys Ile Gln
35 40 45
Ser Arg Ala Glu Leu Leu Lys Lys Met Thr Gly Arg Glu Leu Lys Pro
50 55 60
His Asp Arg Thr Val Asp Val Thr Ile Arg Arg Ile Arg Lys His Phe
65 70 75 80
Glu Ser Thr Pro Asp Thr Pro Glu Ile Ile Ala Thr Ile His Gly Glu
85 90 95
Gly Tyr Arg Phe Cys Gly Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
100 105 110
Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
115 120 125
Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
130 135 140
<210> 114
<211> 381
<212> PRT
<213> Escherichia coli
<400> 114
Met Gln Leu Gln Ser Met Lys Lys Glu Ile Arg His Leu His Gln Ala
1 5 10 15
Leu Ser Thr Ser Trp Gln Trp Gly His Ile Leu Thr Asn Ser Pro Ala
20 25 30
Met Met Asp Ile Cys Lys Asp Thr Ala Lys Ile Ala Leu Ser Gln Ala
35 40 45
Ser Val Leu Ile Ser Gly Glu Ser Gly Thr Gly Lys Glu Leu Ile Ala
50 55 60
Arg Ala Ile His Tyr Asn Ser Arg Arg Ala Lys Gly Pro Phe Ile Lys
65 70 75 80
Val Asn Cys Ala Ala Leu Pro Glu Ser Leu Leu Glu Ser Glu Leu Phe
85 90 95
Gly His Glu Lys Gly Ala Phe Thr Gly Ala Gln Thr Leu Arg Gln Gly
100 105 110
Leu Phe Glu Arg Ala Asn Glu Gly Thr Leu Leu Leu Asp Glu Ile Gly
115 120 125
Glu Met Pro Leu Val Leu Gln Ala Lys Leu Leu Arg Ile Leu Gln Glu
130 135 140
Arg Glu Phe Glu Arg Ile Gly Gly His Gln Thr Ile Lys Val Asp Ile
145 150 155 160
Arg Ile Ile Ala Ala Thr Asn Arg Asp Leu Gln Ala Met Val Lys Glu
165 170 175
Gly Thr Phe Arg Glu Asp Leu Phe Tyr Arg Leu Asn Val Ile His Leu
180 185 190
Ile Leu Pro Pro Leu Arg Asp Arg Arg Glu Asp Ile Ser Leu Leu Ala
195 200 205
Asn His Phe Leu Gln Lys Phe Ser Ser Glu Asn Gln Arg Asp Ile Ile
210 215 220
Asp Ile Asp Pro Met Ala Met Ser Leu Leu Thr Ala Trp Ser Trp Pro
225 230 235 240
Gly Asn Ile Arg Glu Leu Ser Asn Val Ile Glu Arg Ala Val Val Met
245 250 255
Asn Ser Gly Pro Ile Ile Phe Ser Glu Asp Leu Pro Pro Gln Ile Arg
260 265 270
Gln Pro Val Cys Asn Ala Gly Glu Val Lys Thr Ala Pro Val Gly Glu
275 280 285
Arg Asn Leu Lys Glu Glu Ile Lys Arg Val Glu Lys Arg Ile Ile Met
290 295 300
Glu Val Leu Glu Gln Gln Glu Gly Asn Arg Thr Arg Thr Ala Leu Met
305 310 315 320
Leu Gly Ile Ser Arg Arg Ala Leu Met Tyr Lys Leu Gln Glu Tyr Gly
325 330 335
Ile Asp Pro Ala Asp Val Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
340 345 350
Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
355 360 365
Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
370 375 380
<210> 115
<211> 144
<212> PRT
<213> Escherichia coli
<400> 115
Met Gln Arg Glu Leu Gln Gln Gln Asp Ala Glu Ser Pro Leu Ile Ile
1 5 10 15
Asp Glu Gly Arg Phe Gln Ala Ser Trp Arg Gly Lys Met Leu Asp Leu
20 25 30
Thr Pro Ala Glu Phe Arg Leu Leu Lys Thr Leu Ser His Glu Pro Gly
35 40 45
Lys Val Phe Ser Arg Glu Gln Leu Leu Asn His Leu Tyr Asp Asp Tyr
50 55 60
Arg Val Val Thr Asp Arg Thr Ile Asp Ser His Ile Lys Asn Leu Arg
65 70 75 80
Arg Lys Leu Glu Ser Leu Asp Ala Glu Gln Ser Phe Ile Arg Ala Val
85 90 95
Tyr Gly Val Gly Tyr Arg Trp Glu Ala Pro Ala Asp Ala Leu Asp Asp
100 105 110
Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
115 120 125
Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
130 135 140
<210> 116
<211> 139
<212> PRT
<213> Escherichia coli
<400> 116
Met Glu Glu Val Ile Glu Met Gln Gly Leu Ser Leu Asp Pro Thr Ser
1 5 10 15
His Arg Val Met Ala Gly Glu Glu Pro Leu Glu Met Gly Pro Thr Glu
20 25 30
Phe Lys Leu Leu His Phe Phe Met Thr His Pro Glu Arg Val Tyr Ser
35 40 45
Arg Glu Gln Leu Leu Asn His Val Trp Gly Thr Asn Val Tyr Val Glu
50 55 60
Asp Arg Thr Val Asp Val His Ile Arg Arg Leu Arg Lys Ala Leu Glu
65 70 75 80
Pro Gly Gly His Asp Arg Met Val Gln Thr Val Arg Gly Thr Gly Tyr
85 90 95
Arg Phe Ser Thr Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
100 105 110
Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala
115 120 125
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
130 135
<210> 117
<211> 127
<212> PRT
<213> Escherichia coli
<400> 117
Met Asn Gly Tyr Cys Tyr Phe Pro Phe Ser Leu Asn Arg Phe Val Gly
1 5 10 15
Ser Leu Thr Ser Asp Gln Gln Lys Leu Asp Ser Leu Ser Lys Gln Glu
20 25 30
Ile Ser Val Met Arg Tyr Ile Leu Asp Gly Lys Asp Asn Asn Asp Ile
35 40 45
Ala Glu Lys Met Phe Ile Ser Asn Lys Thr Val Ser Thr Tyr Lys Ser
50 55 60
Arg Leu Met Glu Lys Leu Glu Cys Lys Ser Leu Met Asp Leu Tyr Thr
65 70 75 80
Phe Ala Gln Arg Asn Lys Ile Gly Pro Ala Asp Ala Leu Asp Asp Phe
85 90 95
Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp
100 105 110
Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
115 120 125
<210> 118
<211> 390
<212> PRT
<213> Escherichia coli
<400> 118
Met Ser His Tyr Gln Glu Gln Gln Gln Pro Arg Asn Val Gln Leu Asn
1 5 10 15
Gly Pro Thr Thr Asp Ile Ile Gly Glu Ala Pro Ala Met Gln Asp Val
20 25 30
Phe Arg Ile Ile Gly Arg Leu Ser Arg Ser Ser Ile Ser Val Leu Ile
35 40 45
Asn Gly Glu Ser Gly Thr Gly Lys Glu Leu Val Ala His Ala Leu His
50 55 60
Arg His Ser Pro Arg Ala Lys Ala Pro Phe Ile Ala Leu Asn Met Ala
65 70 75 80
Ala Ile Pro Lys Asp Leu Ile Glu Ser Glu Leu Phe Gly His Glu Lys
85 90 95
Gly Ala Phe Thr Gly Ala Asn Thr Ile Arg Gln Gly Arg Phe Glu Gln
100 105 110
Ala Asp Gly Gly Thr Leu Phe Leu Asp Glu Ile Gly Asp Met Pro Leu
115 120 125
Asp Val Gln Thr Arg Leu Leu Arg Val Leu Ala Asp Gly Gln Phe Tyr
130 135 140
Arg Val Gly Gly Tyr Ala Pro Val Lys Val Asp Val Arg Ile Ile Ala
145 150 155 160
Ala Thr His Gln Asn Leu Glu Gln Arg Val Gln Glu Gly Lys Phe Arg
165 170 175
Glu Asp Leu Phe His Arg Leu Asn Val Ile Arg Val His Leu Pro Pro
180 185 190
Leu Arg Glu Arg Arg Glu Asp Ile Pro Arg Leu Ala Arg His Phe Leu
195 200 205
Gln Val Ala Ala Arg Glu Leu Gly Val Glu Ala Lys Leu Leu His Pro
210 215 220
Glu Thr Glu Ala Ala Leu Thr Arg Leu Ala Trp Pro Gly Asn Val Arg
225 230 235 240
Gln Leu Glu Asn Thr Cys Arg Trp Leu Thr Val Met Ala Ala Gly Gln
245 250 255
Glu Val Leu Ile Gln Asp Leu Pro Gly Glu Leu Phe Glu Ser Thr Val
260 265 270
Ala Glu Ser Thr Ser Gln Met Gln Pro Asp Ser Trp Ala Thr Leu Leu
275 280 285
Ala Gln Trp Ala Asp Arg Ala Leu Arg Ser Gly His Gln Asn Leu Leu
290 295 300
Ser Glu Ala Gln Pro Glu Leu Glu Arg Thr Leu Leu Thr Thr Ala Leu
305 310 315 320
Arg His Thr Gln Gly His Lys Gln Glu Ala Ala Arg Leu Leu Gly Trp
325 330 335
Gly Arg Asn Thr Leu Thr Arg Lys Leu Lys Glu Leu Gly Met Glu Pro
340 345 350
Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala
355 360 365
Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp
370 375 380
Phe Asp Leu Asp Met Leu
385 390
<210> 119
<211> 130
<212> PRT
<213> Escherichia coli
<400> 119
Met Gly Ser Lys Val Phe Ser Glu Arg Val Asn Gln Tyr Leu Arg Glu
1 5 10 15
Arg Glu Met Phe Gly Ala Glu Glu Asp Pro Phe Ser Val Leu Thr Glu
20 25 30
Arg Glu Leu Asp Val Leu His Glu Leu Ala Gln Gly Leu Ser Asn Lys
35 40 45
Gln Ile Ala Ser Val Leu Asn Ile Ser Glu Gln Thr Val Lys Val His
50 55 60
Ile Arg Asn Leu Leu Arg Lys Leu Asn Val Arg Ser Arg Val Ala Ala
65 70 75 80
Thr Ile Leu Phe Leu Gln Gln Arg Gly Ala Gln Pro Ala Asp Ala Leu
85 90 95
Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe
100 105 110
Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp
115 120 125
Met Leu
130
<210> 120
<211> 146
<212> PRT
<213> Escherichia coli
<400> 120
Met Arg Arg His Asn Asn Gln Gly Glu Ser Glu Leu Ile Val Gly Asn
1 5 10 15
Leu Thr Leu Asn Met Gly Arg Arg Gln Val Trp Met Gly Gly Glu Glu
20 25 30
Leu Ile Leu Thr Pro Lys Glu Tyr Ala Leu Leu Ser Arg Leu Met Leu
35 40 45
Lys Ala Gly Ser Pro Val His Arg Glu Ile Leu Tyr Asn Asp Ile Tyr
50 55 60
Asn Trp Asp Asn Glu Pro Ser Thr Asn Thr Leu Glu Val His Ile His
65 70 75 80
Asn Leu Arg Asp Lys Val Gly Lys Ala Arg Ile Arg Thr Val Arg Gly
85 90 95
Phe Gly Tyr Met Leu Val Ala Asn Glu Glu Asn Pro Ala Asp Ala Leu
100 105 110
Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe
115 120 125
Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp
130 135 140
Met Leu
145
<210> 121
<211> 163
<212> PRT
<213> Escherichia coli
<400> 121
Met Gln Glu Arg Ser Lys Gln Asp Val Ser Leu Leu Pro Glu Asn Gln
1 5 10 15
Gln Ala Leu Lys Phe Ile Pro Cys Thr Gly His Ser Arg Ile Tyr Leu
20 25 30
Leu Gln Met Lys Asp Val Ala Phe Val Ser Ser Arg Met Ser Gly Val
35 40 45
Tyr Val Thr Ser His Glu Gly Lys Glu Gly Phe Thr Glu Leu Thr Leu
50 55 60
Arg Thr Leu Glu Ser Arg Thr Pro Leu Leu Arg Cys His Arg Gln Tyr
65 70 75 80
Leu Val Asn Leu Ala His Leu Gln Glu Ile Arg Leu Glu Asp Asn Gly
85 90 95
Gln Ala Glu Leu Ile Leu Arg Asn Gly Leu Thr Val Pro Val Ser Arg
100 105 110
Arg Tyr Leu Lys Ser Leu Lys Glu Ala Ile Gly Leu Pro Ala Asp Ala
115 120 125
Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp
130 135 140
Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
145 150 155 160
Asp Met Leu
<210> 122
<211> 157
<212> PRT
<213> Escherichia coli
<400> 122
Met Arg Arg Ser His Trp Ser Glu Gln Gln Gln Asn Asn Asp Asn Gly
1 5 10 15
Ser Pro Thr Leu Glu Val Asp Ala Leu Val Leu Asn Pro Gly Arg Gln
20 25 30
Glu Ala Ser Phe Asp Gly Gln Thr Leu Glu Leu Thr Gly Thr Glu Phe
35 40 45
Thr Leu Leu Tyr Leu Leu Ala Gln His Leu Gly Gln Val Val Ser Arg
50 55 60
Glu His Leu Ser Gln Glu Val Leu Gly Lys Arg Leu Thr Pro Phe Asp
65 70 75 80
Arg Ala Ile Asp Met His Ile Ser Asn Leu Arg Arg Lys Leu Pro Asp
85 90 95
Arg Lys Asp Gly His Pro Trp Phe Lys Thr Leu Arg Gly Arg Gly Tyr
100 105 110
Leu Met Val Ser Ala Ser Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
115 120 125
Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
130 135 140
Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
145 150 155
<210> 123
<211> 150
<212> PRT
<213> Escherichia coli
<400> 123
Met Arg Arg Val Lys Lys Phe Ser Thr Pro Ser Pro Val Ile Arg Ile
1 5 10 15
Gly His Phe Glu Leu Asn Glu Pro Ala Ala Gln Ile Ser Trp Phe Asp
20 25 30
Thr Pro Leu Ala Leu Thr Arg Tyr Glu Phe Leu Leu Leu Lys Thr Leu
35 40 45
Leu Lys Ser Pro Gly Arg Val Trp Ser Arg Gln Gln Leu Met Asp Ser
50 55 60
Val Trp Glu Asp Ala Gln Asp Thr Tyr Asp Arg Thr Val Asp Thr His
65 70 75 80
Ile Lys Thr Leu Arg Ala Lys Leu Arg Ala Ile Asn Pro Asp Leu Ser
85 90 95
Pro Ile Asn Thr His Arg Gly Met Gly Tyr Ser Leu Arg Gly Leu Pro
100 105 110
Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala
115 120 125
Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp
130 135 140
Phe Asp Leu Asp Met Leu
145 150
<210> 124
<211> 151
<212> PRT
<213> Escherichia coli
<400> 124
Met Arg Arg Gly Ala Ala Val Ile Ile Glu Ser Gln Phe Gln Val Ala
1 5 10 15
Asp Leu Met Val Asp Leu Val Ser Arg Lys Val Thr Arg Ser Gly Thr
20 25 30
Arg Ile Thr Leu Thr Ser Lys Glu Phe Thr Leu Leu Glu Phe Phe Leu
35 40 45
Arg His Gln Gly Glu Val Leu Pro Arg Ser Leu Ile Ala Ser Gln Val
50 55 60
Trp Asp Met Asn Phe Asp Ser Asp Thr Asn Ala Ile Asp Val Ala Val
65 70 75 80
Lys Arg Leu Arg Gly Lys Ile Asp Asn Asp Phe Glu Pro Lys Leu Ile
85 90 95
Gln Thr Val Arg Gly Val Gly Tyr Met Leu Glu Val Pro Asp Gly Gln
100 105 110
Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp
115 120 125
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp
130 135 140
Asp Phe Asp Leu Asp Met Leu
145 150
<210> 125
<211> 158
<212> PRT
<213> Escherichia coli
<400> 125
Met Gln Lys Lys Met Ala Leu Glu Lys His Gln Tyr Tyr Asp Gln Ala
1 5 10 15
Glu Leu Asp Gln Leu Ile His Gly Ser Ser Ser Asn Glu Gln Asp Pro
20 25 30
Arg Arg Leu Pro Lys Gly Leu Thr Pro Gln Thr Leu Arg Thr Leu Cys
35 40 45
Gln Trp Ile Asp Ala His Gln Asp Tyr Glu Phe Ser Thr Asp Glu Leu
50 55 60
Ala Asn Glu Val Asn Ile Ser Arg Val Ser Cys Arg Lys Tyr Leu Ile
65 70 75 80
Trp Leu Val Asn Cys His Ile Leu Phe Thr Ser Ile His Tyr Gly Val
85 90 95
Thr Gly Arg Pro Val Tyr Arg Tyr Arg Ile Gln Ala Glu His Tyr Ser
100 105 110
Leu Leu Lys Gln Tyr Cys Gln Pro Ala Asp Ala Leu Asp Asp Phe Asp
115 120 125
Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
130 135 140
Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
145 150 155
<210> 126
<211> 144
<212> PRT
<213> Escherichia coli
<400> 126
Met Gln Arg Lys His Met Leu Glu Ser Ile Asp Ser Ala Ser Gln Lys
1 5 10 15
Gln Ile Asp Glu Met Phe Asn Ala Tyr Ala Arg Gly Glu Pro Lys Asp
20 25 30
Glu Leu Pro Thr Gly Ile Asp Pro Leu Thr Leu Asn Ala Val Arg Lys
35 40 45
Leu Phe Lys Glu Pro Gly Val Gln His Thr Ala Glu Thr Val Ala Gln
50 55 60
Ala Leu Thr Ile Ser Arg Thr Thr Ala Arg Arg Tyr Leu Glu Tyr Cys
65 70 75 80
Ala Ser Arg His Leu Ile Ile Ala Glu Ile Val His Gly Lys Val Gly
85 90 95
Arg Pro Gln Arg Ile Tyr His Ser Gly Pro Ala Asp Ala Leu Asp Asp
100 105 110
Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
115 120 125
Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
130 135 140
<210> 127
<211> 362
<212> PRT
<213> Escherichia coli
<400> 127
Met Gln Ser Ala Pro Ala Thr Asp Glu Arg Trp Arg Glu Ala Ile Val
1 5 10 15
Thr Arg Ser Pro Leu Met Leu Arg Leu Leu Glu Gln Ala Arg Leu Val
20 25 30
Ala Gln Ser Asp Val Ser Val Leu Ile Asn Gly Gln Ser Gly Thr Gly
35 40 45
Lys Glu Ile Phe Ala Gln Ala Ile His Asn Ala Ser Pro Arg Asn Ser
50 55 60
Lys Pro Phe Ile Ala Ile Asn Cys Gly Ala Leu Pro Glu Gln Leu Leu
65 70 75 80
Glu Ser Glu Leu Phe Gly His Ala Arg Gly Ala Phe Thr Gly Ala Val
85 90 95
Ser Asn Arg Glu Gly Leu Phe Gln Ala Ala Glu Gly Gly Thr Leu Phe
100 105 110
Leu Asp Glu Ile Gly Asp Met Pro Ala Pro Leu Gln Val Lys Leu Leu
115 120 125
Arg Val Leu Gln Glu Arg Lys Val Arg Pro Leu Gly Ser Asn Arg Asp
130 135 140
Ile Asp Ile Asn Val Arg Ile Ile Ser Ala Thr His Arg Asp Leu Pro
145 150 155 160
Lys Ala Met Ala Arg Gly Glu Phe Arg Glu Asp Leu Tyr Tyr Arg Leu
165 170 175
Asn Val Val Ser Leu Lys Ile Pro Ala Leu Ala Glu Arg Thr Glu Asp
180 185 190
Ile Pro Leu Leu Ala Asn His Leu Leu Arg Gln Ala Ala Glu Arg His
195 200 205
Lys Pro Phe Val Arg Ala Phe Ser Thr Asp Ala Met Lys Arg Leu Met
210 215 220
Thr Ala Ser Trp Pro Gly Asn Val Arg Gln Leu Val Asn Val Ile Glu
225 230 235 240
Gln Cys Val Ala Leu Thr Ser Ser Pro Val Ile Ser Asp Ala Leu Val
245 250 255
Glu Gln Ala Leu Glu Gly Glu Asn Thr Ala Leu Pro Thr Phe Val Glu
260 265 270
Ala Arg Asn Gln Phe Glu Leu Asn Tyr Leu Arg Lys Leu Leu Gln Ile
275 280 285
Thr Lys Gly Asn Val Thr His Ala Ala Arg Met Ala Gly Arg Asn Arg
290 295 300
Thr Glu Phe Tyr Lys Leu Leu Ser Arg His Glu Leu Asp Ala Asn Asp
305 310 315 320
Phe Lys Glu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
325 330 335
Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp
340 345 350
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
355 360
<210> 128
<211> 147
<212> PRT
<213> Escherichia coli
<400> 128
Met Gln His His Ala Leu Asn Ser Thr Leu Glu Ile Ser Gly Leu Arg
1 5 10 15
Met Asp Ser Val Ser His Ser Val Ser Arg Asp Asn Ile Ser Ile Thr
20 25 30
Leu Thr Arg Lys Glu Phe Gln Leu Leu Trp Leu Leu Ala Ser Arg Ala
35 40 45
Gly Glu Ile Ile Pro Arg Thr Val Ile Ala Ser Glu Ile Trp Gly Ile
50 55 60
Asn Phe Asp Ser Asp Thr Asn Thr Val Asp Val Ala Ile Arg Arg Leu
65 70 75 80
Arg Ala Lys Val Asp Asp Pro Phe Pro Glu Lys Leu Ile Ala Thr Ile
85 90 95
Arg Gly Met Gly Tyr Ser Phe Val Ala Val Lys Lys Pro Ala Asp Ala
100 105 110
Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp
115 120 125
Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
130 135 140
Asp Met Leu
145
<210> 129
<211> 147
<212> PRT
<213> Escherichia coli
<400> 129
Met Arg Arg Asn Ser Gly Leu Ala Ser Gln Val Ile Ser Leu Pro Pro
1 5 10 15
Phe Gln Val Asp Leu Ser Arg Arg Glu Leu Ser Ile Asn Asp Glu Val
20 25 30
Ile Lys Leu Thr Ala Phe Glu Tyr Thr Ile Met Glu Thr Leu Ile Arg
35 40 45
Asn Asn Gly Lys Val Val Ser Lys Asp Ser Leu Met Leu Gln Leu Tyr
50 55 60
Pro Asp Ala Glu Leu Arg Glu Ser His Thr Ile Asp Val Leu Met Gly
65 70 75 80
Arg Leu Arg Lys Lys Ile Gln Ala Gln Tyr Pro Gln Glu Val Ile Thr
85 90 95
Thr Val Arg Gly Gln Gly Tyr Leu Phe Glu Leu Arg Pro Ala Asp Ala
100 105 110
Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp
115 120 125
Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
130 135 140
Asp Met Leu
145
<210> 130
<211> 142
<212> PRT
<213> Escherichia coli
<400> 130
Met Arg Thr Asn Gly Gln Ala Ser Asn Glu Leu Arg His Gly Asn Val
1 5 10 15
Met Leu Asp Pro Gly Lys Arg Ile Ala Thr Leu Ala Gly Glu Pro Leu
20 25 30
Thr Leu Lys Pro Lys Glu Phe Ala Leu Leu Glu Leu Leu Met Arg Asn
35 40 45
Ala Gly Arg Val Leu Ser Arg Lys Leu Ile Glu Glu Lys Leu Tyr Thr
50 55 60
Trp Asp Glu Glu Val Thr Ser Asn Ala Val Glu Val His Val His His
65 70 75 80
Leu Arg Arg Lys Leu Gly Ser Asp Phe Ile Arg Thr Val His Gly Ile
85 90 95
Gly Tyr Thr Leu Gly Glu Lys Pro Ala Asp Ala Leu Asp Asp Phe Asp
100 105 110
Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met
115 120 125
Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
130 135 140
<210> 131
<211> 131
<212> PRT
<213> Escherichia coli
<400> 131
Met Gly Lys Lys Phe Thr Pro Glu Ser Val Ser Arg Leu Leu Glu Lys
1 5 10 15
Ile Ser Ala Gly Gly Tyr Gly Asp Lys Arg Leu Ser Pro Lys Glu Ser
20 25 30
Glu Val Leu Arg Leu Phe Ala Glu Gly Phe Leu Val Thr Glu Ile Ala
35 40 45
Lys Lys Leu Asn Arg Ser Ile Lys Thr Ile Ser Ser Gln Lys Lys Ser
50 55 60
Ala Met Met Lys Leu Gly Val Glu Asn Asp Ile Ala Leu Leu Asn Tyr
65 70 75 80
Leu Ser Ser Val Thr Leu Ser Pro Ala Asp Lys Asp Pro Ala Asp Ala
85 90 95
Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp
100 105 110
Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
115 120 125
Asp Met Leu
130
<210> 132
<211> 163
<212> PRT
<213> Escherichia coli
<400> 132
Met Arg Gln Asn Glu Gln Ala Thr Leu Thr Lys Gly Leu Gln Glu Thr
1 5 10 15
Ser Leu Thr Pro Tyr Lys Ala Leu His Phe Gly Thr Leu Thr Ile Asp
20 25 30
Pro Ile Asn Arg Val Val Thr Leu Ala Asn Thr Glu Ile Ser Leu Ser
35 40 45
Thr Ala Asp Phe Glu Leu Leu Trp Glu Leu Ala Thr His Ala Gly Gln
50 55 60
Ile Met Asp Arg Asp Ala Leu Leu Lys Asn Leu Arg Gly Val Ser Tyr
65 70 75 80
Asp Gly Leu Asp Arg Ser Val Asp Val Ala Ile Ser Arg Leu Arg Lys
85 90 95
Lys Leu Leu Asp Asn Ala Ala Glu Pro Tyr Arg Ile Lys Thr Val Arg
100 105 110
Asn Lys Gly Tyr Leu Phe Ala Pro His Ala Trp Glu Pro Ala Asp Ala
115 120 125
Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp
130 135 140
Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu
145 150 155 160
Asp Met Leu
<210> 133
<211> 120
<212> PRT
<213> Escherichia coli
<400> 133
Met Thr Gly Gly Cys Tyr Leu Thr Pro Asp Ile Ala Ile Lys Leu Ala
1 5 10 15
Ser Gly Arg Gln Asp Pro Leu Thr Lys Arg Glu Arg Gln Val Ala Glu
20 25 30
Lys Leu Ala Gln Gly Met Ala Val Lys Glu Ile Ala Ala Glu Leu Gly
35 40 45
Leu Ser Pro Lys Thr Val His Val His Arg Ala Asn Leu Met Glu Lys
50 55 60
Leu Gly Val Ser Asn Asp Val Glu Leu Ala Arg Arg Met Phe Asp Gly
65 70 75 80
Trp Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala
85 90 95
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu
100 105 110
Asp Asp Phe Asp Leu Asp Met Leu
115 120
<210> 134
<211> 168
<212> PRT
<213> Escherichia coli
<400> 134
Met Ala Ala Trp Gln Gln Gln Gln Thr Ser Ser Thr Pro Ala Ala Thr
1 5 10 15
Val Thr Arg Glu Asn Asp Thr Ile Asn Leu Val Lys Asp Glu Arg Ile
20 25 30
Ile Val Thr Pro Ile Asn Asp Ile Tyr Tyr Ala Glu Ala His Glu Lys
35 40 45
Met Thr Phe Val Tyr Thr Arg Arg Glu Ser Tyr Val Met Pro Met Asn
50 55 60
Ile Thr Glu Phe Cys Ser Lys Leu Pro Pro Ser His Phe Phe Arg Cys
65 70 75 80
His Arg Ser Phe Cys Val Asn Leu Asn Lys Ile Arg Glu Ile Glu Pro
85 90 95
Trp Phe Asn Asn Thr Tyr Ile Leu Arg Leu Lys Asp Leu Asp Phe Glu
100 105 110
Val Pro Val Ser Arg Ser Lys Val Lys Glu Phe Arg Gln Leu Met His
115 120 125
Leu Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala
130 135 140
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu
145 150 155 160
Asp Asp Phe Asp Leu Asp Met Leu
165
<210> 135
<211> 359
<212> PRT
<213> Escherichia coli
<400> 135
Met His Thr His Ser Ile Asp Ala Glu Thr Pro Ala Val Thr Ala Ser
1 5 10 15
Gln Phe Gly Met Val Gly Lys Ser Pro Ala Met Gln His Leu Leu Ser
20 25 30
Glu Ile Ala Leu Val Ala Pro Ser Glu Ala Thr Val Leu Ile His Gly
35 40 45
Asp Ser Gly Thr Gly Lys Glu Leu Val Ala Arg Ala Ile His Ala Ser
50 55 60
Ser Ala Arg Ser Glu Lys Pro Leu Val Thr Leu Asn Cys Ala Ala Leu
65 70 75 80
Asn Glu Ser Leu Leu Glu Ser Glu Leu Phe Gly His Glu Lys Gly Ala
85 90 95
Phe Thr Gly Ala Asp Lys Arg Arg Glu Gly Arg Phe Val Glu Ala Asp
100 105 110
Gly Gly Thr Leu Phe Leu Asp Glu Ile Gly Asp Ile Ser Pro Met Met
115 120 125
Gln Val Arg Leu Leu Arg Ala Ile Gln Glu Arg Glu Val Gln Arg Val
130 135 140
Gly Ser Asn Gln Ile Ile Ser Val Asp Val Arg Leu Ile Ala Ala Thr
145 150 155 160
His Arg Asp Leu Ala Ala Glu Val Asn Ala Gly Arg Phe Arg Gln Asp
165 170 175
Leu Tyr Tyr Arg Leu Asn Val Val Ala Ile Glu Val Pro Ser Leu Arg
180 185 190
Gln Arg Arg Glu Asp Ile Pro Leu Leu Ala Gly His Phe Leu Gln Arg
195 200 205
Phe Ala Glu Arg Asn Arg Lys Ala Val Lys Gly Phe Thr Pro Gln Ala
210 215 220
Met Asp Leu Leu Ile His Tyr Asp Trp Pro Gly Asn Ile Arg Glu Leu
225 230 235 240
Glu Asn Ala Val Glu Arg Ala Val Val Leu Leu Thr Gly Glu Tyr Ile
245 250 255
Ser Glu Arg Glu Leu Pro Leu Ala Ile Ala Ser Thr Pro Ile Pro Leu
260 265 270
Gly Gln Ser Gln Asp Ile Gln Pro Leu Val Glu Val Glu Lys Glu Val
275 280 285
Ile Leu Ala Ala Leu Glu Lys Thr Gly Gly Asn Lys Thr Glu Ala Ala
290 295 300
Arg Gln Leu Gly Ile Thr Arg Lys Thr Leu Leu Ala Lys Leu Ser Arg
305 310 315 320
Pro Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp
325 330 335
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Pro Ala Asp Ala Leu Asp
340 345 350
Asp Phe Asp Leu Asp Met Leu
355
<210> 136
<211> 401
<212> PRT
<213> Homo sapiens
<400> 136
Met Ala His Val Ser Ser Glu Thr Gln Asp Val Ser Pro Lys Asp Glu
1 5 10 15
Leu Thr Ala Ser Glu Ala Ser Thr Arg Ser Pro Leu Cys Glu His Thr
20 25 30
Phe Pro Gly Asp Ser Asp Leu Arg Ser Met Ile Glu Glu His Ala Phe
35 40 45
Gln Val Leu Ser Gln Gly Ser Leu Leu Glu Ser Pro Ser Tyr Thr Val
50 55 60
Cys Val Ser Glu Pro Asp Lys Asp Asp Asp Phe Leu Ser Leu Asn Phe
65 70 75 80
Pro Arg Lys Leu Trp Lys Ile Val Glu Ser Asp Gln Phe Lys Ser Ile
85 90 95
Ser Trp Asp Glu Asn Gly Thr Cys Ile Val Ile Asn Glu Glu Leu Phe
100 105 110
Lys Lys Glu Ile Leu Glu Thr Lys Ala Pro Tyr Arg Ile Phe Gln Thr
115 120 125
Asp Ala Ile Lys Ser Phe Val Arg Gln Leu Asn Leu Tyr Gly Phe Ser
130 135 140
Lys Ile Gln Gln Asn Phe Gln Arg Ser Ala Phe Leu Ala Thr Phe Leu
145 150 155 160
Ser Glu Glu Lys Glu Ser Ser Val Leu Ser Lys Leu Lys Phe Tyr Tyr
165 170 175
Asn Pro Asn Phe Lys Arg Gly Tyr Pro Gln Leu Leu Val Arg Val Lys
180 185 190
Arg Arg Ile Gly Val Lys Asn Ala Ser Pro Ile Ser Thr Leu Phe Asn
195 200 205
Glu Asp Phe Asn Lys Lys His Phe Arg Ala Gly Ala Asn Met Glu Asn
210 215 220
His Asn Ser Ala Leu Ala Ala Glu Ala Ser Glu Glu Ser Leu Phe Ser
225 230 235 240
Ala Ser Lys Asn Leu Asn Met Pro Leu Thr Arg Glu Ser Ser Val Arg
245 250 255
Gln Ile Ile Ala Asn Ser Ser Val Pro Ile Arg Ser Gly Phe Pro Pro
260 265 270
Pro Ser Pro Ser Thr Ser Val Gly Pro Ser Glu Gln Ile Ala Thr Asp
275 280 285
Gln His Ala Ile Leu Asn Gln Leu Thr Thr Ile His Met His Ser His
290 295 300
Ser Thr Tyr Met Gln Ala Arg Gly His Ile Val Asn Phe Ile Thr Thr
305 310 315 320
Thr Thr Ser Gln Tyr His Ile Ile Ser Pro Leu Gln Asn Gly Tyr Phe
325 330 335
Gly Leu Thr Val Glu Pro Ser Ala Val Pro Thr Arg Tyr Pro Leu Val
340 345 350
Ser Val Asn Glu Ala Pro Tyr Arg Asn Met Leu Pro Ala Gly Asn Pro
355 360 365
Trp Leu Gln Met Pro Thr Ile Ala Asp Arg Ser Ala Ala Pro His Ser
370 375 380
Arg Leu Ala Leu Gln Pro Ser Pro Leu Asp Lys Tyr His Pro Asn Tyr
385 390 395 400
Asn
<210> 137
<211> 272
<212> PRT
<213> Homo sapiens
<400> 137
Met Asn Ser Asp Ser Ser Ser Val Ser Ser Arg Ala Ser Ser Pro Asp
1 5 10 15
Met Asp Glu Met Tyr Leu Arg Asp His His His Arg His His His His
20 25 30
Gln Glu Ser Arg Leu Asn Ser Val Ser Ser Thr Gln Gly Asp Met Met
35 40 45
Gln Lys Met Pro Gly Glu Ser Leu Ser Arg Ala Gly Ala Lys Ala Ala
50 55 60
Gly Glu Ser Ser Lys Tyr Lys Ile Lys Lys Gln Leu Ser Glu Gln Asp
65 70 75 80
Leu Gln Gln Leu Arg Leu Lys Ile Asn Gly Arg Glu Arg Lys Arg Met
85 90 95
His Asp Leu Asn Leu Ala Met Asp Gly Leu Arg Glu Val Met Pro Tyr
100 105 110
Ala His Gly Pro Ser Val Arg Lys Leu Ser Lys Ile Ala Thr Leu Leu
115 120 125
Leu Ala Arg Asn Tyr Ile Leu Met Leu Thr Ser Ser Leu Glu Glu Met
130 135 140
Lys Arg Leu Val Gly Glu Ile Tyr Gly Gly His His Ser Ala Phe His
145 150 155 160
Cys Gly Thr Val Gly His Ser Ala Gly His Pro Ala His Ala Ala Asn
165 170 175
Ser Val His Pro Val His Pro Ile Leu Gly Gly Ala Leu Ser Ser Gly
180 185 190
Asn Ala Ser Ser Pro Leu Ser Ala Ala Ser Leu Pro Ala Ile Gly Thr
195 200 205
Ile Arg Pro Pro His Ser Leu Leu Lys Ala Pro Ser Thr Pro Pro Ala
210 215 220
Leu Gln Leu Gly Ser Gly Phe Gln His Trp Ala Gly Leu Pro Cys Pro
225 230 235 240
Cys Thr Ile Cys Gln Met Pro Pro Pro Pro His Leu Ser Ala Leu Ser
245 250 255
Thr Ala Asn Met Ala Arg Leu Ser Ala Glu Ser Lys Asp Leu Leu Lys
260 265 270
<210> 138
<211> 193
<212> PRT
<213> Homo sapiens
<400> 138
Met Asp Asn Leu Arg Glu Thr Phe Leu Ser Leu Glu Asp Gly Leu Gly
1 5 10 15
Ser Ser Asp Ser Pro Gly Leu Leu Ser Ser Trp Asp Trp Lys Asp Arg
20 25 30
Ala Gly Pro Phe Glu Leu Asn Gln Ala Ser Pro Ser Gln Ser Leu Ser
35 40 45
Pro Ala Pro Ser Leu Glu Ser Tyr Ser Ser Ser Pro Cys Pro Ala Val
50 55 60
Ala Gly Leu Pro Cys Glu His Gly Gly Ala Ser Ser Gly Gly Ser Glu
65 70 75 80
Gly Cys Ser Val Gly Gly Ala Ser Gly Leu Val Glu Val Asp Tyr Asn
85 90 95
Met Leu Ala Phe Gln Pro Thr His Leu Gln Gly Gly Gly Gly Pro Lys
100 105 110
Ala Gln Lys Gly Thr Lys Val Arg Met Ser Val Gln Arg Arg Arg Lys
115 120 125
Ala Ser Glu Arg Glu Lys Leu Arg Met Arg Thr Leu Ala Asp Ala Leu
130 135 140
His Thr Leu Arg Asn Tyr Leu Pro Pro Val Tyr Ser Gln Arg Gly Gln
145 150 155 160
Pro Leu Thr Lys Ile Gln Thr Leu Lys Tyr Thr Ile Lys Tyr Ile Gly
165 170 175
Glu Leu Thr Asp Leu Leu Asn Arg Gly Arg Glu Pro Arg Ala Gln Ser
180 185 190
Ala
<210> 139
<211> 67
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 139
gaaatagcgc tgtacagcgt atgggaatct cttgtacggt gtacgagtat cttcccgtac 60
accgtac 67
<210> 140
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 140
catgtgattg aatataaccg acgtgactgt tacatttagg gg 42
<210> 141
<211> 40
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 141
tactgtatat atatacagta tactgtatat atatacagta 40
<210> 142
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 142
tacccctata ggggtatagc gccggctacc cctatagggg tat 43
<210> 143
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 143
tacccctata ggggtatagc gccggctacc cctatagggg tattacccct ataggggtat 60
agcgccggct acccctatag gggta 85
<210> 144
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 144
wakrrkta 8
<210> 145
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 145
atttacattt tgaaacatct a 21
<210> 146
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 146
wahatgwwac maarwdtww 19
<210> 147
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 147
atgttaataa 10
<210> 148
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 148
atgttaataa tatgtggcat aagcgttaaa tg 32
<210> 149
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 149
wamawwtwrt taama 15
<210> 150
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 150
gctatgcaga aatttgcaca 20
<210> 151
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 151
ttctycmyda tyksyks 17
<210> 152
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 152
tgtcataaaa ctgtcatatt ccttacatat aactgtca 38
<210> 153
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 153
ctgwcayaaa wctgwm 16
<210> 154
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 154
ttcttacgcc tgtaggatta gtaagaa 27
<210> 155
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 155
tkcytacamc tgtarga 17
<210> 156
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 156
tgcaccawww tggtgca 17
<210> 157
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 157
tgcmcyaaaa tsgtgca 17
<210> 158
<211> 9
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(1)
<223> n is a, c, g, or t
<400> 158
ntaccccta 9
<210> 159
<211> 8
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 159
mtacyyct 8
<210> 160
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (10)..(11)
<223> n is a, c, g, or t
<400> 160
cttaaggttn ncttaaggtt 20
<210> 161
<211> 11
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (2)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (4)..(4)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (10)..(10)
<223> n is a, c, g, or t
<400> 161
ancnctaaan t 11
<210> 162
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (6)..(10)
<223> n is a, c, g, or t
<400> 162
gtaaannnnn gtaaa 15
<210> 163
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 163
gtaaarmwry gwaar 15
<210> 164
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (6)..(11)
<223> n is a, c, g, or t
<400> 164
ttcacnnnnn nttcac 16
<210> 165
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (11)..(12)
<223> n is a, c, g, or t
<400> 165
aaaatgacaa nnttgtcatt ttt 23
<210> 166
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 166
tgattacaaa actttaaaaa gtgctg 26
<210> 167
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 167
tgattacaaa actttaaaaa gtgctgcata gcgccggccg cgcctgatta caaaacttta 60
aaaagtgctg 70
<210> 168
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 168
tgattacaaa actttaaaaa gtgctgtagc gccggctgat tacaaaactt taaaaagtgc 60
tg 62
<210> 169
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 169
tkwwttwaat twykwwa 17
<210> 170
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 170
gatctattct ttt 13
<210> 171
<211> 13
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 171
tatctttttt tat 13
<210> 172
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (5)..(14)
<223> n is a, c, g, or t
<400> 172
tgtcnnnnnn nnnngaca 18
<210> 173
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (9)..(9)
<223> n is a, c, g, or t
<400> 173
cattacaant tgtaatg 17
<210> 174
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (7)..(11)
<223> n is a, c, g, or t
<400> 174
catgaannnn ntgttta 17
<210> 175
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 175
wrtttaksww yygttta 17
<210> 176
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (7)..(11)
<223> n is a, c, g, or t
<400> 176
rttaamnnnn nrttaam 17
<210> 177
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 177
taagaatatt ccta 14
<210> 178
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 178
awymrgaykw wtyt 14
<210> 179
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (1)..(2)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (7)..(12)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (17)..(18)
<223> n is a, c, g, or t
<400> 179
nntacannnn nntactnn 18
<210> 180
<211> 14
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 180
kwcwtwtvgt taca 14
<210> 181
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 181
ggcaaaacta agaaattttc caggttttgc c 31
<210> 182
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 182
ggcatttcat 10
<210> 183
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 183
gcgagtcaaa aaaactca 18
<210> 184
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<220>
<221> misc_feature
<222> (7)..(9)
<223> n is a, c, g, or t
<400> 184
ttcgaannnt tcgaa 15
<210> 185
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 185
rcrttcgaaa crttcgaww 19
<210> 186
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 186
rttcgaahsd ttcgaay 17
<210> 187
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 187
rcattcyaaa cattcyahw 19
<210> 188
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 188
rttcgaaysd ttcgaay 17
<210> 189
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 189
accatatgtt 10
<210> 190
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 190
rccatatgkt 10
<210> 191
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 191
avcakmtgtt 10
<210> 192
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 192
rccatatgkt 10
<210> 193
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 193
accatatgkt 10
<210> 194
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 194
amcakmtgtt 10
<210> 195
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 195
accatatgkt 10
<210> 196
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 196
amcatatgby 10
<210> 197
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 197
srccawwtgk ys 12
<210> 198
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 198
brccawwtgk yv 12
<210> 199
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 199
agatcaaagg gggta 15
<210> 200
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 200
agatcaaagg gggtaagatc aaagggggta agatcaaagg gggta 45
<210> 201
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 201
agatcaaagg gggtaagatc aaagggggta agatcaaagg gggtaagatc aaagggggta 60
agatcaaagg gggtaagatc aaagggggta 90
<210> 202
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 202
cgcgccgacc acgtggtcca 20
<210> 203
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 203
cgcgccgacc acgtggtcga ccacgtggtc ca 32
<210> 204
<211> 44
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 204
cgcgccgacc acgtggtcga ccacgtggtc gaccacgtgg tcca 44
<210> 205
<211> 31
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 205
gaccttgagt acgtgcgtct ctgcacgtat g 31
<210> 206
<211> 62
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 206
gaccttgagt acgtgcgtct ctgcacgtat ggaccttgag tacgtgcgtc tctgcacgta 60
tg 62
<210> 207
<211> 93
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 207
gaccttgagt acgtgcgtct ctgcacgtat ggaccttgag tacgtgcgtc tctgcacgta 60
tggaccttga gtacgtgcgt ctctgcacgt atg 93
<210> 208
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 208
tgtttattgt ttattgttta t 21
<210> 209
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 209
tgtttattgt ttattgttta ttgtttattg tttattgttt at 42
<210> 210
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 210
gcaaagcaaa cagcaaagca aacagcaaag caaaca 36
<210> 211
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 211
gcaaagcaaa cagcaaagca aacagcaaag caaacagcaa agcaaacagc aaagcaaaca 60
gcaaagcaaa ca 72
<210> 212
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 212
tgtttgcttt gctgtttgct ttgctgtttg ctttgc 36
<210> 213
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 213
tgtttgcttt gctgtttgct ttgctgtttg ctttgctgtt tgctttgctg tttgctttgc 60
tgtttgcttt gc 72
<210> 214
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 214
gaacacccag aacacccaga acacccagaa cacccagaac acccagaaca cccagaacac 60
ccagaacacc ca 72
<210> 215
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 215
gaacacccag aacacccaga acacccagaa cacccagaac acccagaaca ccca 54
<210> 216
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 216
agttaataat ttaac 15
<210> 217
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 217
agttaataat ttaacagtta ataatttaac 30
<210> 218
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 218
agttaataat ttaacagtta ataatttaac agttaataat ttaac 45
<210> 219
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 219
agttaataat ttaacagtta ataatttaac agttaataat ttaacagtta ataatttaac 60
<210> 220
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 220
ctacacaaag ccctctgtgt aagactacac aaagccctct gtgtaaga 48
<210> 221
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 221
ctacacaaag ccctctgtgt aagactacac aaagccctct gtgtaagact acacaaagcc 60
ctctgtgtaa ga 72
<210> 222
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 222
ctacacaaag ccctctttgt gagactacac aaagccctct ttgtgaga 48
<210> 223
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 223
ctacacaaag ccctctttgt gagactacac aaagccctct ttgtgagact acacaaagcc 60
ctctttgtga ga 72
<210> 224
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 224
ccattgttct ccattgttct ccattgttct 30
<210> 225
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 225
ccattgttct ccattgttct ccattgttct ccattgttct ccattgttct ccattgttct 60
<210> 226
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 226
aacaaagaac aaagaacaaa gaacaaag 28
<210> 227
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 227
aaccgttaaa cggttaaccg ttaaacggtt aaccgttaaa cggtt 45
<210> 228
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 228
agagatattt agtgaatcag caagtggaac caaaaagact tgaggactga ttggatgagg 60
agaggttag 69
<210> 229
<211> 138
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 229
agagatattt agtgaatcag caagtggaac caaaaagact tgaggactga ttggatgagg 60
agaggttaga gagatattta gtgaatcagc aagtggaacc aaaaagactt gaggactgat 120
tggatgagga gaggttag 138
<210> 230
<211> 91
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 230
actggtgccc tcctcaactc ccacctgcat ctggggccca tactggttgg ctcccgcggt 60
gccatgtctg cagtgtgccc cccagccccg g 91
<210> 231
<211> 182
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 231
actggtgccc tcctcaactc ccacctgcat ctggggccca tactggttgg ctcccgcggt 60
gccatgtctg cagtgtgccc cccagccccg gactggtgcc ctcctcaact cccacctgca 120
tctggggccc atactggttg gctcccgcgg tgccatgtct gcagtgtgcc ccccagcccc 180
gg 182
<210> 232
<211> 128
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 232
cgcgccgacc acgtggtcga ccacgtggtc cacgcgccga ccacgtggtc gaccacgtgg 60
tccacgcgcc gaccacgtgg tcgaccacgt ggtccacgcg ccgaccacgt ggtcgaccac 120
gtggtcca 128
<210> 233
<211> 49
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 233
gtcacgtggc tcagtcacgt ggctcagtca cgtggctcag tcacgtggc 49
<210> 234
<211> 98
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 234
gtcacgtggc tcagtcacgt ggctcagtca cgtggctcag tcacgtggcg tcacgtggct 60
cagtcacgtg gctcagtcac gtggctcagt cacgtggc 98
<210> 235
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 235
gaccacgtgg tcgaccacgt ggtcgaccac gtggtcgacc acgtggtc 48
<210> 236
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 236
gaccacgtgg tcgaccacgt ggtcgaccac gtggtcgacc acgtggtcga ccacgtggtc 60
gaccacgtgg tcgaccacgt ggtcgaccac gtggtc 96
<210> 237
<211> 124
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 237
cctctacccc ctttgatctt accccctttg atcttacccc ctttgatctt accccctttg 60
atcttacccc ctttgatctt accccctttg atcttacccc ctttgatctt accccctttg 120
atct 124
<210> 238
<211> 514
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 238
ggcctgaaat aacctctgaa agaggaactt ggttaggtac cttctgaggc tgaaagaacc 60
agctgtggaa tgtgtgtcag ttagggtgtg gaaagtcccc aggctcccca gcaggcagaa 120
gtatgcaaag catgcatctc aattagtcag caaccaggtg tggaaagtcc ccaggctccc 180
cagcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccata gtcccactgc 240
agtttgagga gaatatttgt tatatttgca aaataaaata agtttgcaag tttttttttt 300
ctgccccaaa gagctctgtg tccttgaaca taaaatacaa ataaccgcta tgctgttaat 360
tattggcaaa tgtcccattt tcaacctaag gaaataccat aaagtaacag atataccaac 420
aaaaggttac tagttaacag gcattgcctg aaaagagtat aaaagaattt cagcatgatt 480
ttccatattg tgcttccacc actgccaata acac 514
<210> 239
<211> 199
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 239
ctgtgtcctt gaacataaaa tacaaataac cgctatgctg ttaattattg gcaaatgtcc 60
cattttcaac ctaaggaaat accataaagt aacagatata ccaacaaaag gttactagtt 120
aacaggcatt gcctgaaaag agtataaaag aatttcagca tgattttcca tattgtgctt 180
ccaccactgc caataacac 199
<210> 240
<211> 1150
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 240
aaattagttt tgaatctttc taataccaaa gttcagttta ctgttccatg ttgcttctga 60
gtggcttcac agacttatga aaaagtaaac ggaatcagaa ttacatcaat gcaaaagcat 120
tgctgtgaac tctgtactta ggactaaact ttgagcaata acacatatag attgaggatt 180
gtttgctgtt agtatacaaa ctctggttca aagctcctct ttattgcttg tcttggaaaa 240
tttgctgttc ttcatggttt ctcttttcac tgctatctat ttttctcaac cactcacatg 300
gctacaataa ctgtctgcaa gcttatgatt cccaaatatc tatctctagc ctcaatcttg 360
ttccagaaga taaaaagtag tattcaaatg cacatcaacg tctccacttg gagggcttaa 420
agacgtttca acatacaaac cggggagttt tgcctggaat gtttcctaaa atgtgtcctg 480
tagcacatag ggtcctcttg ttccttaaaa tctaattact tttagcccag tgctcatccc 540
acctatgggg agatgagagt gaaaagggag cctgattaat aattacacta agtcaatagg 600
catagagcca ggactgtttg ggtaaactgg tcactttatc ttaaactaaa tatatccaaa 660
actgaacatg tacttagtta ctaagtcttt gactttatct cattcatacc actcagcttt 720
atccaggcca cttatttgac agtattattg cgaaaacttc ctaactggtc tccttatcat 780
agtcttatcc ccttttgaaa caaaagagac agtttcaaaa tacaaatatg atttttatta 840
gctccctttt gttgtctata atagtcccag aaggagttat aaactccatt taaaaagtct 900
ttgagatgtg gcccttgcca actttgccag gctgtgtcct tgaacataaa atacaaataa 960
ccgctatgct gttaattatt ggcaaatgtc ccattttcaa cctaaggaaa taccataaag 1020
taacagatat accaacaaaa ggttactagt taacaggcat tgcctgaaaa gagtataaaa 1080
gaatttcagc atgattttcc caagtttgct tatttatgaa aagttatcga taatttcttt 1140
agttttgtat 1150
<210> 241
<211> 609
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 241
tccctgccca cccgcggaaa ccgccccagg tgggccgcgc cccctcccca gcagccagca 60
gggcgccagg gctgagccgg ccgtggaggg gagcgggtcc cgcgggttat acaggcgccg 120
gggctccgcg gcaggcaaga gaagctgagg cctgagaacg gcccgggcct tggcgtacgg 180
caggggacga cctgggatgg gggcagcggg cggcggcgca gggagtgggc cgggggccgg 240
tgtgcgcggg cgggacgggg cccggggtcg ggagaccacc gctcggaaga tggggccggg 300
agaggccgcc gtcgcagcgc agagggcacc ggcggggaga cgcgaggacg cggggccggg 360
aacacggacg ccggagtaga agcgcggggg gcgcgggctg gagcgggggc ggggacgccg 420
gggtcggggg cggtgcgggt ttgaggggag ggggcggggc gggtccttcc ctgggggggt 480
ggggagaggg ggcgggggcc catgtgaccg gctcagaccg gttctggaga caaaaggggc 540
cgcggcggcc ggagcgggac gggcccggcg cgggagggag cgaagcagcg cgggcagcga 600
gcgagtgag 609
<210> 242
<211> 319
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 242
accaccgctc ggaagatggg gccgggagag gccgccgtcg cagcgcagag ggcaccggcg 60
gggagacgcg aggacgcggg gccgggaaca cggacgccgg agtagaagcg cggggggcgc 120
gggctggagc gggggcgggg acgccggggt cgggggcggt gcgggtttga ggggaggggg 180
cggggcgggt ccttccctgg gggggtgggg agagggggcg ggggcccatg tgaccggctc 240
agaccggttc tggagacaaa aggggccgcg gcggccggag cgggacgggc ccggcgcggg 300
agggagcgaa gcagcgcgg 319
<210> 243
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 243
ccgcggcggc cggagcggga cgggcccggc gcgggaggga gcgaagcagc gcgggcagcg 60
agcgagtgag 70
<210> 244
<211> 1511
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 244
ggagtctcac tctgtcgccc aagctggagt gcagtagtgc gatctcagct cactgcaacc 60
tctgccctct gagttcaagt gattctcctg cctcagcctc ccgagtagct gggattacag 120
gcgcctgcca ccgcgcccag ctaatttttt gtatttttgg tagagacggg gtttcaccat 180
cttggccagg ctggtcttga actcctgacc tcatgatcca cccgcctcgg cttcccaaag 240
tgctgggatt acaggcgtga gccaccgtgc ctggcctaaa gaactggatt tctaatggtg 300
aaatctaagc aggagaggtg ggatttgggt gtaggatacc tttcaaatag ccttctactc 360
catctatgaa ataggctagc tttggctcag taaatttgct gtgtaatgat tttctaatga 420
gttaggctgg ctttaagccc ctggttattt cgttgtaacc agttaggctt tgcctcttga 480
agggccacct gggactgtcg tgcagtagat tttcttttaa cgccccagaa tcaggtgctt 540
tctctgactt tgtgtggctc tactgaatca aatctagcaa gccacagagg ctttcagact 600
tttaagatac aatattcaaa ggtgaggcag gctgtgaaaa gcccagcggt ccctggctgt 660
ccctgaacgc gactatttgc aggttggctt tgagaacccg gtcagagctg cgttaggaaa 720
acggttcccg ggaagctcct cagagagtag aatgaggagg tggattttgt gtgaaggaac 780
accttgtgtg gctctggtgg ccaggaaaga gctggcacaa gctgaaagaa ggcctgtggc 840
gaagcggagg gggacctaag tcagggaccc ccacctgccc ccaggaagga tgaaaaggag 900
acaaaaatcc taaagggaaa agccctccag gctgtaggcc aatgagcggc gggaaggagg 960
agtgaggctg gggaacttct cccagagcca gtcagagcgg acggctgctg ggaagccaat 1020
cagcgcgctc gagcctgcag cccctctgca gtagttatgc cagagcgccc tgtgtagagc 1080
ggctgcgagc gggcagctgg gctcggctgc cgggagccac cgcgcgggct ccgcaccctc 1140
ctctcgcact gccttcgccc ggtccccgcg ccgcggtgcc ccagtggccc ccgccgcgct 1200
ccacgccgcg cccccgcacc ccgccggcta ccggccgcac aaccgccacc gccccctggc 1260
cgcgcggctc gcctcgcccc gccccgtccc tcctcgcccc gccccacccc agtcagcccc 1320
gccctgcccc gcgccgccaa gcggttcccg ccctcgccca gcgcccaggt agctgcgagg 1380
aaacttttgc agcggctggg tagcagcacg tctcttgctc ctcagggcca ctgccaggct 1440
tgccgagtcc tgggactgct ctcgctccgg ctgccactct cccgcgctct cctagctccc 1500
tgcgaagcag g 1511
<210> 245
<211> 1200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 245
ggagaggtgg gatttgggtg taggatacct ttcaaatagc cttctactcc atctatgaaa 60
taggctagct ttggctcagt aaatttgctg tgtaatgatt ttctaatgag ttaggctggc 120
tttaagcccc tggttatttc gttgtaacca gttaggcttt gcctcttgaa gggccacctg 180
ggactgtcgt gcagtagatt ttcttttaac gccccagaat caggtgcttt ctctgacttt 240
gtgtggctct actgaatcaa atctagcaag ccacagaggc tttcagactt ttaagataca 300
atattcaaag gtgaggcagg ctgtgaaaag cccagcggtc cctggctgtc cctgaacgcg 360
actatttgca ggttggcttt gagaacccgg tcagagctgc gttaggaaaa cggttcccgg 420
gaagctcctc agagagtaga atgaggaggt ggattttgtg tgaaggaaca ccttgtgtgg 480
ctctggtggc caggaaagag ctggcacaag ctgaaagaag gcctgtggcg aagcggaggg 540
ggacctaagt cagggacccc cacctgcccc caggaaggat gaaaaggaga caaaaatcct 600
aaagggaaaa gccctccagg ctgtaggcca atgagcggcg ggaaggagga gtgaggctgg 660
ggaacttctc ccagagccag tcagagcgga cggctgctgg gaagccaatc agcgcgctcg 720
agcctgcagc ccctctgcag tagttatgcc agagcgccct gtgtagagcg gctgcgagcg 780
ggcagctggg ctcggctgcc gggagccacc gcgcgggctc cgcaccctcc tctcgcactg 840
ccttcgcccg gtccccgcgc cgcggtgccc cagtggcccc cgccgcgctc cacgccgcgc 900
ccccgcaccc cgccggctac cggccgcaca accgccaccg ccccctggcc gcgcggctcg 960
cctcgccccg ccccgtccct cctcgccccg ccccacccca gtcagccccg ccctgccccg 1020
cgccgccaag cggttcccgc cctcgcccag cgcccaggta gctgcgagga aacttttgca 1080
gcggctgggt agcagcacgt ctcttgctcc tcagggccac tgccaggctt gccgagtcct 1140
gggactgctc tcgctccggc tgccactctc ccgcgctctc ctagctccct gcgaagcagg 1200
<210> 246
<211> 600
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 246
aaagggaaaa gccctccagg ctgtaggcca atgagcggcg ggaaggagga gtgaggctgg 60
ggaacttctc ccagagccag tcagagcgga cggctgctgg gaagccaatc agcgcgctcg 120
agcctgcagc ccctctgcag tagttatgcc agagcgccct gtgtagagcg gctgcgagcg 180
ggcagctggg ctcggctgcc gggagccacc gcgcgggctc cgcaccctcc tctcgcactg 240
ccttcgcccg gtccccgcgc cgcggtgccc cagtggcccc cgccgcgctc cacgccgcgc 300
ccccgcaccc cgccggctac cggccgcaca accgccaccg ccccctggcc gcgcggctcg 360
cctcgccccg ccccgtccct cctcgccccg ccccacccca gtcagccccg ccctgccccg 420
cgccgccaag cggttcccgc cctcgcccag cgcccaggta gctgcgagga aacttttgca 480
gcggctgggt agcagcacgt ctcttgctcc tcagggccac tgccaggctt gccgagtcct 540
gggactgctc tcgctccggc tgccactctc ccgcgctctc ctagctccct gcgaagcagg 600
<210> 247
<211> 300
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 247
ccccgcaccc cgccggctac cggccgcaca accgccaccg ccccctggcc gcgcggctcg 60
cctcgccccg ccccgtccct cctcgccccg ccccacccca gtcagccccg ccctgccccg 120
cgccgccaag cggttcccgc cctcgcccag cgcccaggta gctgcgagga aacttttgca 180
gcggctgggt agcagcacgt ctcttgctcc tcagggccac tgccaggctt gccgagtcct 240
gggactgctc tcgctccggc tgccactctc ccgcgctctc ctagctccct gcgaagcagg 300
<210> 248
<211> 200
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 248
gtcagccccg ccctgccccg cgccgccaag cggttcccgc cctcgcccag cgcccaggta 60
gctgcgagga aacttttgca gcggctgggt agcagcacgt ctcttgctcc tcagggccac 120
tgccaggctt gccgagtcct gggactgctc tcgctccggc tgccactctc ccgcgctctc 180
ctagctccct gcgaagcagg 200
<210> 249
<211> 150
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 249
cgcccaggta gctgcgagga aacttttgca gcggctgggt agcagcacgt ctcttgctcc 60
tcagggccac tgccaggctt gccgagtcct gggactgctc tcgctccggc tgccactctc 120
ccgcgctctc ctagctccct gcgaagcagg 150
<210> 250
<211> 455
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 250
tggcccctcc ctcgggttac cccacagcct aggccgattc gacctctctc cgctggggcc 60
ctcgctggcg tccctgcacc ctgggagcgc gagcggcgcg cgggcgggga agcgcggccc 120
agacccccgg gtccgcccgg agcagctgcg ctgtcggggc caggccgggc tcccagtgga 180
ttcgcgggca cagacgccca ggaccgcgct tcccacgtgg cggagggact ggggacccgg 240
gcacccgtcc tgccccttca ccttccagct ccgcctcctc cgcgcggacc ccgccccgtc 300
ccgacccctc ccgggtcccc ggcccagccc cctccgggcc ctcccagccc ctccccttcc 360
tttccgcggc cccgccctct cctcgcggcg cgagtttcag gcagcgctgc gtcctgctgc 420
gcacgtggga agccctggcc ccggccaccc ccgcg 455
<210> 251
<211> 258
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 251
ccaggaccgc gcttcccacg tggcggaggg actggggacc cgggcacccg tcctgcccct 60
tcaccttcca gctccgcctc ctccgcgcgg accccgcccc gtcccgaccc ctcccgggtc 120
cccggcccag ccccctccgg gccctcccag cccctcccct tcctttccgc ggccccgccc 180
tctcctcgcg gcgcgagttt caggcagcgc tgcgtcctgc tgcgcacgtg ggaagccctg 240
gccccggcca cccccgcg 258
<210> 252
<211> 159
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 252
cgtcccgacc cctcccgggt ccccggccca gccccctccg ggccctccca gcccctcccc 60
ttcctttccg cggccccgcc ctctcctcgc ggcgcgagtt tcaggcagcg ctgcgtcctg 120
ctgcgcacgt gggaagccct ggccccggcc acccccgcg 159
<210> 253
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 253
cccctcccct tcctttccgc ggccccgccc tctcctcgcg gcgcgagttt caggcagcgc 60
tgcgtcctgc tgcgcacgtg ggaagccctg gccccggcca cccccgcg 108
<210> 254
<211> 83
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 254
cccgggtccc cggcccagcc ccctccgggc cctcccagcc cctccccttc ctttccgcgg 60
ccccgccctc tcctcgcggc gcg 83
<210> 255
<211> 976
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 255
ccatagaacc agagaagtga gtggatgtga tgcccagctc cagaagtgac tccagaacac 60
cctgttccaa agcagaggac acactgattt tttttttaat aggctgcagg acttactgtt 120
ggtgggacgc cctgctttgc gaagggaaag gaggagtttg ccctgagcac aggcccccac 180
cctccactgg gctttcccca gctcccttgt cttcttatca cggtagtggc ccagtccctg 240
gcccctgact ccagaaggtg gccctcctgg aaacccaggt cgtgcagtca acgatgtact 300
cgccgggaca gcgatgtctg ctgcactcca tccctcccct gttcatttgt ccttcatgcc 360
cgtctggagt agatgctttt tgcagaggtg gcaccctgta aagctctcct gtctgacttt 420
tttttttttt ttagactgag ttttgctctt gttgcctagg ctggagtgca atggcacaat 480
ctcagctcac tgcaccctct gcctcccggg ttcaagcgat tctcctgcct cagcctcccg 540
agtagttggg attacaggca tgcaccacca cgcccagcta atttttgtat ttttagtaga 600
gacaaggttt caccgtgatg gccaggctgg tcttgaactc caggactcaa gtgatgctcc 660
tgcctaggcc tctcaaagtg ttgggattac aggcgtgagc cactgcaccc ggcctgcacg 720
cgttctttga aagcagtcga gggggcgcta ggtgtgggca gggacgagct ggcgcggcgt 780
cgctgggtgc accgcgacca cgggcagagc cacgcggcgg gaggactaca actcccggca 840
caccccgcgc cgccccgcct ctactcccag aaggccgcgg ggggtggacc gcctaagagg 900
gcgtgcgctc ccgacatgcc ccgcggcgcg ccattaaccg ccagatttga atcgcgggac 960
ccgttggcag aggtgg 976
<210> 256
<211> 500
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 256
caatctcagc tcactgcacc ctctgcctcc cgggttcaag cgattctcct gcctcagcct 60
cccgagtagt tgggattaca ggcatgcacc accacgccca gctaattttt gtatttttag 120
tagagacaag gtttcaccgt gatggccagg ctggtcttga actccaggac tcaagtgatg 180
ctcctgccta ggcctctcaa agtgttggga ttacaggcgt gagccactgc acccggcctg 240
cacgcgttct ttgaaagcag tcgagggggc gctaggtgtg ggcagggacg agctggcgcg 300
gcgtcgctgg gtgcaccgcg accacgggca gagccacgcg gcgggaggac tacaactccc 360
ggcacacccc gcgccgcccc gcctctactc ccagaaggcc gcggggggtg gaccgcctaa 420
gagggcgtgc gctcccgaca tgccccgcgg cgcgccatta accgccagat ttgaatcgcg 480
ggacccgttg gcagaggtgg 500
<210> 257
<211> 250
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 257
ttgaaagcag tcgagggggc gctaggtgtg ggcagggacg agctggcgcg gcgtcgctgg 60
gtgcaccgcg accacgggca gagccacgcg gcgggaggac tacaactccc ggcacacccc 120
gcgccgcccc gcctctactc ccagaaggcc gcggggggtg gaccgcctaa gagggcgtgc 180
gctcccgaca tgccccgcgg cgcgccatta accgccagat ttgaatcgcg ggacccgttg 240
gcagaggtgg 250
<210> 258
<211> 150
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 258
tacaactccc ggcacacccc gcgccgcccc gcctctactc ccagaaggcc gcggggggtg 60
gaccgcctaa gagggcgtgc gctcccgaca tgccccgcgg cgcgccatta accgccagat 120
ttgaatcgcg ggacccgttg gcagaggtgg 150
<210> 259
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 259
cctaagaggg cgtgcgctcc cgacatgccc cgcggcgcgc cattaaccgc cagatttgaa 60
tcgcgggacc cgttggcaga ggtgg 85
<210> 260
<211> 860
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 260
aattctagtt tggtcctaga tgaccacata tccattgttc cttcaacgag cacatggtaa 60
agagcctaga acacagagac acagaacaca gtggagaaaa gggagtgaaa tgtctttaat 120
gacacttact atatatggga ttttgtgaca atatacaagg atggttaaga catataaggt 180
gatgcaaaaa aacatattaa caattatagt gacaaaaaat gaggagcata taattataca 240
ttgatttata cagagtacca gaggaacaca gcattgagag ccgtaacacc acctgaggga 300
gtggagaaag gcttcagaga gaaagtgttt tttggaatgg atcactgttt ccaaaagaac 360
taaagtacag tttgagaaat gcatacttaa ttcattactt ttttcccctc aactttaata 420
ataaatttac ccaacaaaaa agtttatttt tgacttgtaa atctcttaaa atcataaaaa 480
agtaaaatta gcttttaaaa acaggtagtc accatagcat tgaatgtgta gtttataata 540
cagcaaagtt aaatacaatt tcaaattacc tattaagtta gttgctcatt tctttgattt 600
catttagcat tgatctaact caatgtggaa gaaggttaca ttcgtgcaag ttaacacggc 660
ttaatgatta actatgttca cctaccaacc ttaccttttc tgggcaaata ttggtatata 720
tagagttaag aagtctaggt ctgcttccag aagaaaacag ttccacgttg cttgaaattg 780
aaaatcaaga taaaaatgtt cacaattaag ctccttcttt ttattgttcc tctagttatt 840
tcctccagaa ttgatcaaga 860
<210> 261
<211> 347
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 261
atagcattga atgtgtagtt tataatacag caaagttaaa tacaatttca aattacctat 60
taagttagtt gctcatttct ttgatttcat ttagcattga tctaactcaa tgtggaagaa 120
ggttacattc gtgcaagtta acacggctta atgattaact atgttcacct accaacctta 180
ccttttctgg gcaaatattg gtatatatag agttaagaag tctaggtctg cttccagaag 240
aaaacagttc cacgttgctt gaaattgaaa atcaagataa aaatgttcac aattaagctc 300
cttcttttta ttgttcctct agttatttcc tccagaattg atcaaga 347
<210> 262
<211> 241
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 262
tcaatgtgga agaaggttac attcgtgcaa gttaacacgg cttaatgatt aactatgttc 60
acctaccaac cttacctttt ctgggcaaat attggtatat atagagttaa gaagtctagg 120
tctgcttcca gaagaaaaca gttccacgtt gcttgaaatt gaaaatcaag ataaaaatgt 180
tcacaattaa gctccttctt tttattgttc ctctagttat ttcctccaga attgatcaag 240
a 241
<210> 263
<211> 404
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 263
tgggatgttt cgagcagtcc tgctgaagtc cttttatatc ctgtttaagg gatgcctgtt 60
aactagtaac cttcagtgag caaacatatg actctatttc cttacgttga agttaggcaa 120
tttgccaata attaacagag caggggtcac ttgtatccta tgttcaagga caaagaccac 180
ttcagagtgg aaaaaaaatc taaactgttc aaatagatta tttcccctga agaataattc 240
attcatctca acataagaca tagatatagc cataaagaaa aggtagcaga cttactatgt 300
aactccaaat acaagttcag gctattcatt agtggatata tttcttgatt atccagttat 360
agtatatttt attttattta gtgtatcgca tctggtttaa cata 404
<210> 264
<211> 470
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 264
atgagggaag cgggtgtgat ccacttgaaa actgctggtt ccttcaccgc aggcagtgct 60
ggaagtggga tgtttcgagc agtcctgctg aagtcctttt atatcctgtt taagggatgc 120
ctgttaacta gtaaccttca gtgagcaaac atatgactct atttccttac gttgaagtta 180
ggcaatttgc caataattaa cagagcaggg gtcacttgta tcctatgttc aaggacaaag 240
accacttcag agtggaaaaa aaatctaaac tgttcaaata gattatttcc cctgaagaat 300
aattcattca tctcaacata agacatagat atagccataa agaaaaggta gcagacttac 360
tatgtaactc caaatacaag ttcaggctat tcattagtgg atatatttct tgattatcca 420
gttatagtat attttatttt atttagtgta tcgcatctgg tttaacatag 470
<210> 265
<211> 800
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 265
atgagggaag cgggtgtgat ccacttgaaa actgctggtt ccttcaccgc aggcagtgct 60
ggaagtggga tgtttcgagc agtcctgctg aagtcctttt atatcctgtt taagggatgc 120
ctgttaacta gtaaccttca gtgagcaaac atatgactct atttccttac gttgaagtta 180
ggcaatttgc caataattaa cagagcaggg gtcacttgta tcctatgttc aaggacaaag 240
accacttcag agtggaaaaa aaatctaaac tgttcaaata gattatttcc cctgaagaat 300
aattcattca tctcaacata agacatagat atagccataa agaaaaggta gcagacttac 360
tatgtaactc caaatacaag ttcaggctat tcattagtgg atatatttct tgattatcca 420
gttatagtat attttatttt atttagtgta tcgcatctgg tttaacatag aaaacttaca 480
gcacaaaacc tgatgagcca gctcccattc taattttatg tgccaaagaa taattccata 540
tgtatgtcac aggtgcatgg gtcagctgca acatcctctc aagccctaag atgatgatgc 600
taacagcaac aaatgggcac tgatagtttc catttctcta cacattagag ttgatggaaa 660
acttttaaaa cttcccagtg cgtatcgaaa ctagaactca gacgttggcg tgtcagagtc 720
tgtgtgtcta gaggtccaga catgtttgct aaggcttcat atgtagttga gtttattttt 780
tattttttta aattcatggc 800
<210> 266
<211> 1104
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 266
atgagggaag cgggtgtgat ccacttgaaa actgctggtt ccttcaccgc aggcagtgct 60
ggaagtggga tgtttcgagc agtcctgctg aagtcctttt atatcctgtt taagggatgc 120
ctgttaacta gtaaccttca gtgagcaaac atatgactct atttccttac gttgaagtta 180
ggcaatttgc caataattaa cagagcaggg gtcacttgta tcctatgttc aaggacaaag 240
accacttcag agtggaaaaa aaatctaaac tgttcaaata gattatttcc cctgaagaat 300
aattcattca tctcaacata agacatagat atagccataa agaaaaggta gcagacttac 360
tatgtaactc caaatacaag ttcaggctat tcattagtgg atatatttct tgattatcca 420
gttatagtat attttatttt atttagtgta tcgcatctgg tttaacatag aaaacttaca 480
gcacaaaacc tgatgagcca gctcccattc taattttatg tgccaaagaa taattccata 540
tgtatgtcac aggtgcatgg gtcagctgca acatcctctc aagccctaag atgatgatgc 600
taacagcaac aaatgggcac tgatagtttc catttctcta cacattagag ttgatggaaa 660
acttttaaaa cttcccagtg cgtatcgaaa ctagaactca gacgttggcg tgtcagagtc 720
tgtgtgtcta gaggtccaga catgtttgct aaggcttcat atgtagttga gtttattttt 780
tattttttta aattcaggcg actgggtttg aattttgccc tctccgttat ctgccacatg 840
actttgtgtg aggtttctaa taccaactgc aaacaaccct aagcccacgt gtgctgttgc 900
tcaaagcttt gtcgcaaata ctgagctcac accacatacc tctcatagct ctatgtctgg 960
ttctgtttgt cacttcctga gcccatgaaa cctctcagaa gcaatatggt taaacaaact 1020
ggactttagt ctatgaaagg ctctaccctt gactattcaa actgtcagcc agatgacaaa 1080
aactcaaacc agctttattc tggc 1104
<210> 267
<211> 942
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 267
atgagggaag cgggtgtgat ccacttgaaa actgctggtt ccttcaccgc aggcagtgct 60
ggaagtggga tgtttcgagc agtcctgctg aagtcctttt atatcctgtt taagggatgc 120
ctgttaacta gtaaccttca gtgagcaaac atatgactct atttccttac gttgaagtta 180
ggcaatttgc caataattaa cagagcaggg gtcacttgta tcctatgttc aaggacaaag 240
accacttcag agtggaaaaa aatcttgcaa atgctgcaaa tgttcttcac catctaaact 300
gttcaaatag attatttccc ctgaagaata attcattcat ctcaacataa gacatagata 360
tagccataaa gaaaaggtag cagacttact atgtaactcc aaatacattc tttttgaaag 420
aaataataaa atgcacacca tatgctaggc actgaacaaa ttgtttcagt agttcaggct 480
attcattagt ggatatattt cttgattatc cagttattat ttcgctcaaa accatcggtc 540
aagtatattt tattttattt agtgtatcgc atctggttta acatagaaaa cttacagcac 600
aaaacctgat gagccagctc ccattctaat tttatgtgcc aaagaataat tccatatgta 660
tgtcacaggt gcatgggtca gctgcaacat cctctcaagc cctaagatga tgatgctaac 720
agcaacaaat gggcactgac atacttctga ccctaagagt gcttcactca taccttcacc 780
ctcaatgccg tagagtctat gatagtttcc atttctctac acattagagt tgatggaaaa 840
cttttaaaac ttcccagtgc gtatcgaaac tagaactcag acgttggcgt gtcagagtct 900
gtgtgtctag aggtccagac atgtttgcta aggcttcata tg 942
<210> 268
<211> 1097
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 268
tagcccgaca gagcaagaga ggagccgcta cccagccgcc gcaaaagttt cctcgcagct 60
acctgggcgc tgggcgaggg cgggaacagc ttggcggtgc ggggcggccc ggggcggagc 120
cttgtgggcg tggcgaggag ggacggggcg gggcgaggca aggcgagccg cgctgcctgg 180
aggacggcgt ggggtcgtgt agctgctggc ctgcgggatg cggggcgtgg caaggagctt 240
agctgggaga ttgggtttac caaggtggcg ggcaagcctt ggtgggagag gcgcgggaag 300
aggataagga gcgtgtgcgg tggctcccgg caatcctgcc ctgacactcg ctcgccgctg 360
ctctacactg ggcgctctgg cataactact gcagaggggc tgcaggctca ggcacgctga 420
ttggcttccc agcagcagtc ccctctgact ggctctggga gaagttcccc agcctcactc 480
ctcctttccg cctccctttg gcctacagcc gggagggctt ttccttttca gcctttgcaa 540
gctctccatc ttccttggag tggagtggag gtctgcggtt taggtacccg actcgaccct 600
aggccttctc ccacccagat ctggctcctt ctggccacca gagcccacac aaggtttcct 660
aagcacaaaa tccctctcct tgctgttttc tgagaaaggt ttcttgggaa ccctttccca 720
atgcagctgt ggccaagccc tcaaagccta cccacaaata gtcacgttcc agagcgctgg 780
ggacctctgg atttcacagc ctggctcatc tttgtaccta aaaggtctgg aagcccgtgt 840
agcttgctgg gtttcattca atagaaccac acaaagtaaa tgtgtgcaaa tttaggcact 900
tgatcctgat tcctaggtga atcatatcat ctacaggata atcacgggcg accctcataa 960
agcaaagtgt agctggtgag agtaactcat tcaggaaatc attttacaga tgaaattcat 1020
taagtcatgg ttagtctgtt tcatacctgg agtagagccc tatttagaag atttcctgga 1080
tgtcaatcca cgtttct 1097
<210> 269
<211> 3793
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 269
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatccaa gcactctgat ttgacaatta aagcactctg 3060
atttgacaat taaagcactc tgatttgaca attaaagcac tctgatttga caattagtcg 3120
acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300
gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600
cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780
agctgcctgc agg 3793
<210> 270
<211> 3793
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 270
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatccaa ccatacaacc tactacctca aaccatacaa 3060
cctactacct caaaccatac aacctactac ctcaaaccat acaacctact acctcagtcg 3120
acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300
gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600
cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780
agctgcctgc agg 3793
<210> 271
<211> 3782
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 271
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctaggct 720
tcgaatcgat gaattcgaag cttctaccca ccgtactcgt caattccaag ggcatcggta 780
aacatctgct caaactcgaa gtcggccata tccagagcgc cgtagggggc ggagtcgtgg 840
ggggtaaatc ccggacccgg ggaatccccg tcccccaaca tgtccagatc gaaatcgtct 900
agcgcgtcgg catgcgccat cgccacgtcc tcgccgtcta agtggagctc gtcccccagg 960
ctgacatcgg tcgggggggc cgtcgacagt ctgcgcgtgt gtcccgcggg gagaaaggac 1020
aggcgcggag ccgccagccc cgcctcttcg ggggcgtcgt cgtccgggag atcgagcagg 1080
ccctcgatgg tagacccgta attgtttttc gtacgcgcgc ggctgtacgc ggaggcctgt 1140
tcgaccatcg cgtcgatgcc cgcgacgagc aggtcgaggg cgaactcgaa gtcccggtcc 1200
agcatctccg ccacggtgtc gccgccccgg gccgccatga tgtcctgcgc gtcctcgatg 1260
acgcccgcgg tgtccggcac ctcggtcacc gcggtcatcg agtcctggaa gtactcctcc 1320
ggactcagcc cggtgtccgc cacccgggcg aggaagcggc cctcgatggt gccgtagccg 1380
tagacgaact ggaagacggc cgagatggcg ccggtcaggc ggtgcgcggg cagcccgctg 1440
cggcgcacga cgttctgcac cgcgcgggag aaggccagcg agtgcgggcc gatgttgagg 1500
taggtgccga ccagccggga cgaccagggg tggcgcacca gcagcgcccg gttctcccgg 1560
gccagggccc gcagttcctc gcgccagtcg agcccggcgt ccgggtccgg gtggcgcagc 1620
tcgccgaaga cggcgtccag ggcgagctcg agcaactggt ccttggtgtc gacgtaccag 1680
tacacggaca tcgcggtgac gttcagctcg gcggccaggc ggcgcatcga gaaccccgtc 1740
aggccctccg tgtccagcag ccggacggtg accccggtga tccggtcccg gtcgagcccg 1800
gacggctgcc ccccacggcg accgccgcgc cgcccctccc ccgacagcca cacgctgtcc 1860
cgcggcccct cccgccctgc cttcgccatg cgcacctctc ctcgactcat accggtagcg 1920
ctagcgatga gctctggtag tagactagtg gcccccatta tataccctct agagcatatg 1980
tctcacaaag agggctttgt gtagtctcac aaagagggct ttgtgtagtc tcacaaagag 2040
ggctttgtgt agggcgcgcc cccgtagctt ggcgtaatca catgtccgtc gttttacaac 2100
gtcgtgactg ggaaaaccct ggcctgcaag gcgattaagt tgggtaacgc cagggttttc 2160
ccagtcacga cgttgtaaaa cgacggacat gtgaaatagc gctgtacagc gtatgggaat 2220
ctcttgtacg gtgtacgagt atcttcccgt acaccgtacg gcgcgccagt taataattaa 2280
ctagttaata attaactagt taataattaa ctcatatgct ctagagggta tataatgggg 2340
gccactagtc tactaccaga gctcatcgct agcgctggat ccgccaccat ggtgagcaag 2400
ggcgaggagg ataacatggc catcatcaag gagttcatgc gcttcaaggt gcacatggag 2460
ggctccgtga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 2520
ggcacccaga ccgccaagct gaaggtgacc aagggtggcc ccctgccctt cgcctgggac 2580
atcctgtccc ctcagttcat gtacggctcc aaggcctacg tgaagcaccc cgccgacatc 2640
cccgactact tgaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 2700
gaggacggcg gcgtggtgac cgtgacccag gactcctccc tccaggacgg cgagttcatc 2760
tacaaggtga agctgcgcgg caccaacttc ccctccgacg gccccgtaat gcagaagaag 2820
accatgggct gggaggcctc ctccgagcgg atgtaccccg aggacggcgc cctgaagggc 2880
gagatcaagc agcggctgaa gctgaaggac ggcggccact acgacgctga ggtcaagacc 2940
acctacaagg ccaagaagcc cgtgcagctg cccggcgcct acaacgtcaa catcaagttg 3000
gacatcacct cccacaacga ggactacacc atcgtggaac agtacgaacg cgccgagggc 3060
cgccactcca ccggcggcat ggacgagctg tacaagtagg gtaccgtcga cctcgagaga 3120
tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg gaagttgcca 3180
ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg 3240
tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga 3300
agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat 3360
cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg 3420
agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga 3480
gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc 3540
caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc 3600
ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc tagtgatgga 3660
gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 3720
ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 3780
gg 3782
<210> 272
<211> 3940
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 272
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctaggtg 720
aggtagtagg ttgtatggtt tgaggtagta ggttgtatgg tttgaggtag taggttgtat 780
ggtttgaggt agtaggttgt atggttatcg atgaattcga agcttctacc caccgtactc 840
gtcaattcca agggcatcgg taaacatctg ctcaaactcg aagtcggcca tatccagagc 900
gccgtagggg gcggagtcgt ggggggtaaa tcccggaccc ggggaatccc cgtcccccaa 960
catgtccaga tcgaaatcgt ctagcgcgtc ggcatgcgcc atcgccacgt cctcgccgtc 1020
taagtggagc tcgtccccca ggctgacatc ggtcgggggg gccgtcgaca gtctgcgcgt 1080
gtgtcccgcg gggagaaagg acaggcgcgg agccgccagc cccgcctctt cgggggcgtc 1140
gtcgtccggg agatcgagca ggccctcgat ggtagacccg taattgtttt tcgtacgcgc 1200
gcggctgtac gcggaggcct gttcgaccat cgcgtcgatg cccgcgacga gcaggtcgag 1260
ggcgaactcg aagtcccggt ccagcatctc cgccacggtg tcgccgcccc gggccgccat 1320
gatgtcctgc gcgtcctcga tgacgcccgc ggtgtccggc acctcggtca ccgcggtcat 1380
cgagtcctgg aagtactcct ccggactcag cccggtgtcc gccacccggg cgaggaagcg 1440
gccctcgatg gtgccgtagc cgtagacgaa ctggaagacg gccgagatgg cgccggtcag 1500
gcggtgcgcg ggcagcccgc tgcggcgcac gacgttctgc accgcgcggg agaaggccag 1560
cgagtgcggg ccgatgttga ggtaggtgcc gaccagccgg gacgaccagg ggtggcgcac 1620
cagcagcgcc cggttctccc gggccagggc ccgcagttcc tcgcgccagt cgagcccggc 1680
gtccgggtcc gggtggcgca gctcgccgaa gacggcgtcc agggcgagct cgagcaactg 1740
gtccttggtg tcgacgtacc agtacacgga catcgcggtg acgttcagct cggcggccag 1800
gcggcgcatc gagaaccccg tcaggccctc cgtgtccagc agccggacgg tgaccccggt 1860
gatccggtcc cggtcgagcc cggacggctg ccccccacgg cgaccgccgc gccgcccctc 1920
ccccgacagc cacacgctgt cccgcggccc ctcccgccct gccttcgcca tgcgcacctc 1980
tcctcgactc ataccggtag cgctagcgat gagctctggt agtagactag tggcccccat 2040
tatataccct ctagagcata tgtctcacaa agagggcttt gtgtagtctc acaaagaggg 2100
ctttgtgtag tctcacaaag agggctttgt gtagggcgcg cccccgtagc ttggcgtaat 2160
cacatgtccg tcgttttaca acgtcgtgac tgggaaaacc ctggcctgca aggcgattaa 2220
gttgggtaac gccagggttt tcccagtcac gacgttgtaa aacgacggac atgtgaaata 2280
gcgctgtaca gcgtatggga atctcttgta cggtgtacga gtatcttccc gtacaccgta 2340
cggcgcgcca gttaataatt aactagttaa taattaacta gttaataatt aactcatatg 2400
ctctagaggg tatataatgg gggccactag tctactacca gagctcatcg ctagcgctgg 2460
atccgccacc atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat 2520
gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga 2580
gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg 2640
ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta 2700
cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa 2760
gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc 2820
cctccaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga 2880
cggccccgta atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc 2940
cgaggacggc gccctgaagg gcgagatcaa gcagcggctg aagctgaagg acggcggcca 3000
ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc 3060
ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga 3120
acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta 3180
gggtaccaac catacaacct actacctcaa accatacaac ctactacctc aaaccataca 3240
acctactacc tcaaaccata caacctacta cctcaagatc tacgggtggc atccctgtga 3300
cccctcccca gtgcctctcc tggccctgga agttgccact ccagtgccca ccagccttgt 3360
cctaataaaa ttaagttgca tcattttgtc tgactaggtg tccttctata atattatggg 3420
gtggaggggg gtggtatgga gcaaggggca agttgggaag acaacctgta gggcctgcgg 3480
ggtctattgg gaaccaagct ggagtgcagt ggcacaatct tggctcactg caatctccgc 3540
ctcctgggtt caagcgattc tcctgcctca gcctcccgag ttgttgggat tccaggcatg 3600
catgaccagg ctcagctaat ttttgttttt ttggtagaga cggggtttca ccatattggc 3660
caggctggtc tccaactcct aatctcaggt gatctaccca ccttggcctc ccaaattgct 3720
gggattacag gcgtgaacca ctgctccctt ccctgtcctt ctgattttgt aggtaaccac 3780
gtgcggaccg agcggccgca ggaaccccta gtgatggagt tggccactcc ctctctgcgc 3840
gctcgctcgc tcactgaggc cgggcgacca aaggtcgccc gacgcccggg ctttgcccgg 3900
gcggcctcag tgagcgagcg agcgcgcagc tgcctgcagg 3940
<210> 273
<211> 4107
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 273
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctagggg 720
gtccacttgc tcctgggccc acacagtcct gcagtattgt gtatataagg ccagggcaaa 780
gaggagcagg ttttaaagtg aaaggcaggc aggtgttggg gaggcagtta ccggggcaac 840
gggaacaggg cgtttcggag gtggttgcca tggggacctg gatgctgttc cattcgccat 900
tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 960
tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 1020
cacgacgttg taaaacgacg gaattcgaag cttacgacgg acatgtgaaa tagcgctgta 1080
cagcgtatgg gaatctcttg tacggtgtac gagtatcttc ccgtacaccg tacggcgcgc 1140
cagttaataa ttaactagtt aataattaac tagttaataa ttaactcata tgctctagag 1200
ggtatataat gggggccact agtctactac cagagctcat cgctagcgct ggatccgcca 1260
ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc atgcgcttca 1320
aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc gagggcgagg 1380
gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt ggccccctgc 1440
ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc tacgtgaagc 1500
accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc aagtgggagc 1560
gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc tccctccagg 1620
acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc gacggccccg 1680
taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac cccgaggacg 1740
gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc cactacgacg 1800
ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc gcctacaacg 1860
tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg gaacagtacg 1920
aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag tccggaagag 1980
ccgagggcag gggaagtctt ctaacatgcg gggacgtgga ggaaaatccc gggcccagat 2040
ctatgagtcg aggagaggtg cgcatggcga aggcagggcg ggaggggccg cgggacagcg 2100
tgtggctgtc gggggagggg cggcgcggcg gtcgccgtgg ggggcagccg tccgggctcg 2160
accgggaccg gatcaccggg gtcaccgtcc ggctgctgga cacggagggc ctgacggggt 2220
tctcgatgcg ccgcctggcc gccgagctga acgtcaccgc gatgtccgtg tactggtacg 2280
tcgacaccaa ggaccagttg ctcgagctcg ccctggacgc cgtcttcggc gagctgcgcc 2340
acccggaccc ggacgccggg ctcgactggc gcgaggaact gcgggccctg gcccgggaga 2400
accgggcgct gctggtgcgc cacccctggt cgtcccggct ggtcggcacc tacctcaaca 2460
tcggcccgca ctcgctggcc ttctcccgcg cggtgcagaa cgtcgtgcgc cgcagcgggc 2520
tgcccgcgca ccgcctgacc ggcgccatct cggccgtctt ccagttcgtc tacggctacg 2580
gcaccatcga gggccgcttc ctcgcccggg tggcggacac cgggctgagt ccggaggagt 2640
acttccagga ctcgatgacc gcggtgaccg aggtgccgga caccgcgggc gtcatcgagg 2700
acgcgcagga catcatggcg gcccggggcg gcgacaccgt ggcggagatg ctggaccggg 2760
acttcgagtt cgccctcgac ctgctcgtcg cgggcatcga cgcgatggtc gaacaggcct 2820
ccgcgtacag ccgcgcgcat gatgagtttc ccaccatggt gtttccttct gggcagatca 2880
gccaggcctc ggccttggcc ccggcccctc cccaagtcct gccccaggct ccagcccctg 2940
cccctgctcc agccatggta tcagctctgg cccaggcccc agcccctgtc ccagtcctag 3000
ccccaggccc tcctcaggct gtggccccac ctgcccccaa gcccacccag gctggggaag 3060
gaacgctgtc agaggccctg ctgcagctgc agtttgatga tgaagacctg ggggccttgc 3120
ttggcaacag cacagaccca gctgtgttca cagacctggc atccgtcgac aactccgagt 3180
ttcagcagct gctgaaccag ggcatacctg tggcccccca cacaactgag cccatgctga 3240
tggagtaccc tgaggctata actcgcctag tgacaggggc ccagaggccc cccgacccag 3300
ctcctgctcc actgggggcc ccggggctcc ccaatggcct cctttcagga gatgaagact 3360
tctcctccat tgcggacatg gacttctcag ccctgctgag tcagatcagc tcctaaggaa 3420
gcttggtacc gtcgacctcg agagatctac gggtggcatc cctgtgaccc ctccccagtg 3480
cctctcctgg ccctggaagt tgccactcca gtgcccacca gccttgtcct aataaaatta 3540
agttgcatca ttttgtctga ctaggtgtcc ttctataata ttatggggtg gaggggggtg 3600
gtatggagca aggggcaagt tgggaagaca acctgtaggg cctgcggggt ctattgggaa 3660
ccaagctgga gtgcagtggc acaatcttgg ctcactgcaa tctccgcctc ctgggttcaa 3720
gcgattctcc tgcctcagcc tcccgagttg ttgggattcc aggcatgcat gaccaggctc 3780
agctaatttt tgtttttttg gtagagacgg ggtttcacca tattggccag gctggtctcc 3840
aactcctaat ctcaggtgat ctacccacct tggcctccca aattgctggg attacaggcg 3900
tgaaccactg ctcccttccc tgtccttctg attttgtagg taaccacgtg cggaccgagc 3960
ggccgcagga acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca 4020
ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga 4080
gcgagcgagc gcgcagctgc ctgcagg 4107
<210> 274
<211> 4134
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 274
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctagggg 720
gtccacttgc tcctgggccc acacagtcct gcagtattgt gtatataagg ccagggcaaa 780
gaggagcagg ttttaaagtg aaaggcaggc aggtgttggg gaggcagtta ccggggcaac 840
gggaacaggg cgtttcggag gtggttgcca tggggacctg gatgctgttc cattcgccat 900
tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta ttacgccagc 960
tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg ttttcccagt 1020
cacgacgttg taaaacgacg gaattcgaag cttacgacgg acatgtgaaa tagcgctgta 1080
cagcgtatgg gaatctcttg tacggtgtac gagtatcttc ccgtacaccg tacggcgcgc 1140
cctacacaaa gccctctttg tgagactaca caaagccctc tttgtgagac tacacaaagc 1200
cctctttgtg agacatatgc tctagagggt atataatggg ggccactagt ctactaccag 1260
agctcatcgc tagcgctgga tccgccacca tggtgagcaa gggcgaggag gataacatgg 1320
ccatcatcaa ggagttcatg cgcttcaagg tgcacatgga gggctccgtg aacggccacg 1380
agttcgagat cgagggcgag ggcgagggcc gcccctacga gggcacccag accgccaagc 1440
tgaaggtgac caagggtggc cccctgccct tcgcctggga catcctgtcc cctcagttca 1500
tgtacggctc caaggcctac gtgaagcacc ccgccgacat ccccgactac ttgaagctgt 1560
ccttccccga gggcttcaag tgggagcgcg tgatgaactt cgaggacggc ggcgtggtga 1620
ccgtgaccca ggactcctcc ctccaggacg gcgagttcat ctacaaggtg aagctgcgcg 1680
gcaccaactt cccctccgac ggccccgtaa tgcagaagaa gaccatgggc tgggaggcct 1740
cctccgagcg gatgtacccc gaggacggcg ccctgaaggg cgagatcaag cagcggctga 1800
agctgaagga cggcggccac tacgacgctg aggtcaagac cacctacaag gccaagaagc 1860
ccgtgcagct gcccggcgcc tacaacgtca acatcaagtt ggacatcacc tcccacaacg 1920
aggactacac catcgtggaa cagtacgaac gcgccgaggg ccgccactcc accggcggca 1980
tggacgagct gtacaagtcc ggaagagccg agggcagggg aagtcttcta acatgcgggg 2040
acgtggagga aaatcccggg cccagatcta tgagtcgagg agaggtgcgc atggcgaagg 2100
cagggcggga ggggccgcgg gacagcgtgt ggctgtcggg ggaggggcgg cgcggcggtc 2160
gccgtggggg gcagccgtcc gggctcgacc gggaccggat caccggggtc accgtccggc 2220
tgctggacac ggagggcctg acggggttct cgatgcgccg cctggccgcc gagctgaacg 2280
tcaccgcgat gtccgtgtac tggtacgtcg acaccaagga ccagttgctc gagctcgccc 2340
tggacgccgt cttcggcgag ctgcgccacc cggacccgga cgccgggctc gactggcgcg 2400
aggaactgcg ggccctggcc cgggagaacc gggcgctgct ggtgcgccac ccctggtcgt 2460
cccggctggt cggcacctac ctcaacatcg gcccgcactc gctggccttc tcccgcgcgg 2520
tgcagaacgt cgtgcgccgc agcgggctgc ccgcgcaccg cctgaccggc gccatctcgg 2580
ccgtcttcca gttcgtctac ggctacggca ccatcgaggg ccgcttcctc gcccgggtgg 2640
cggacaccgg gctgagtccg gaggagtact tccaggactc gatgaccgcg gtgaccgagg 2700
tgccggacac cgcgggcgtc atcgaggacg cgcaggacat catggcggcc cggggcggcg 2760
acaccgtggc ggagatgctg gaccgggact tcgagttcgc cctcgacctg ctcgtcgcgg 2820
gcatcgacgc gatggtcgaa caggcctccg cgtacagccg cgcgcatgat gagtttccca 2880
ccatggtgtt tccttctggg cagatcagcc aggcctcggc cttggccccg gcccctcccc 2940
aagtcctgcc ccaggctcca gcccctgccc ctgctccagc catggtatca gctctggccc 3000
aggccccagc ccctgtccca gtcctagccc caggccctcc tcaggctgtg gccccacctg 3060
cccccaagcc cacccaggct ggggaaggaa cgctgtcaga ggccctgctg cagctgcagt 3120
ttgatgatga agacctgggg gccttgcttg gcaacagcac agacccagct gtgttcacag 3180
acctggcatc cgtcgacaac tccgagtttc agcagctgct gaaccagggc atacctgtgg 3240
ccccccacac aactgagccc atgctgatgg agtaccctga ggctataact cgcctagtga 3300
caggggccca gaggcccccc gacccagctc ctgctccact gggggccccg gggctcccca 3360
atggcctcct ttcaggagat gaagacttct cctccattgc ggacatggac ttctcagccc 3420
tgctgagtca gatcagctcc taaggaagct tggtaccgtc gacctcgaga gatctacggg 3480
tggcatccct gtgacccctc cccagtgcct ctcctggccc tggaagttgc cactccagtg 3540
cccaccagcc ttgtcctaat aaaattaagt tgcatcattt tgtctgacta ggtgtccttc 3600
tataatatta tggggtggag gggggtggta tggagcaagg ggcaagttgg gaagacaacc 3660
tgtagggcct gcggggtcta ttgggaacca agctggagtg cagtggcaca atcttggctc 3720
actgcaatct ccgcctcctg ggttcaagcg attctcctgc ctcagcctcc cgagttgttg 3780
ggattccagg catgcatgac caggctcagc taatttttgt ttttttggta gagacggggt 3840
ttcaccatat tggccaggct ggtctccaac tcctaatctc aggtgatcta cccaccttgg 3900
cctcccaaat tgctgggatt acaggcgtga accactgctc ccttccctgt ccttctgatt 3960
ttgtaggtaa ccacgtgcgg accgagcggc cgcaggaacc cctagtgatg gagttggcca 4020
ctccctctct gcgcgctcgc tcgctcactg aggccgggcg accaaaggtc gcccgacgcc 4080
cgggctttgc ccgggcggcc tcagtgagcg agcgagcgcg cagctgcctg cagg 4134
<210> 275
<211> 3789
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 275
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatccac ctatcctgaa ttacttgaaa cctatcctga 3060
attacttgaa acctatcctg aattacttga aacctatcct gaattacttg aagtcgacct 3120
cgagagatct acgggtggca tccctgtgac ccctccccag tgcctctcct ggccctggaa 3180
gttgccactc cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct 3240
gactaggtgt ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa 3300
gttgggaaga caacctgtag ggcctgcggg gtctattggg aaccaagctg gagtgcagtg 3360
gcacaatctt ggctcactgc aatctccgcc tcctgggttc aagcgattct cctgcctcag 3420
cctcccgagt tgttgggatt ccaggcatgc atgaccaggc tcagctaatt tttgtttttt 3480
tggtagagac ggggtttcac catattggcc aggctggtct ccaactccta atctcaggtg 3540
atctacccac cttggcctcc caaattgctg ggattacagg cgtgaaccac tgctcccttc 3600
cctgtccttc tgattttgta ggtaaccacg tgcggaccga gcggccgcag gaacccctag 3660
tgatggagtt ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa 3720
aggtcgcccg acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagct 3780
gcctgcagg 3789
<210> 276
<211> 3793
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 276
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatccac agttcttcaa ctggcagctt acagttcttc 3060
aactggcagc ttacagttct tcaactggca gcttacagtt cttcaactgg cagcttgtcg 3120
acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300
gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600
cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780
agctgcctgc agg 3793
<210> 277
<211> 3793
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 277
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatcccg tgttcacagc ggaccttgat cgtgttcaca 3060
gcggaccttg atcgtgttca cagcggacct tgatcgtgtt cacagcggac cttgatgtcg 3120
acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300
gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600
cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780
agctgcctgc agg 3793
<210> 278
<211> 3792
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 278
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatctcc aaaacatgaa ttgctgctgt ccaaaacatg 3060
aattgctgct gtccaaaaca tgaattgctg ctgtccaaaa catgaattgc tgctggtcga 3120
cctcgagaga tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg 3180
gaagttgcca ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg 3240
tctgactagg tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg 3300
caagttggga agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca 3360
gtggcacaat cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct 3420
cagcctcccg agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt 3480
ttttggtaga gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag 3540
gtgatctacc caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc 3600
ttccctgtcc ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc 3660
tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 3720
caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 3780
gctgcctgca gg 3792
<210> 279
<211> 3793
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 279
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatccca aacaccattg tcacactcca caaacaccat 3060
tgtcacactc cacaaacacc attgtcacac tccacaaaca ccattgtcac actccagtcg 3120
acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300
gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600
cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780
agctgcctgc agg 3793
<210> 280
<211> 3797
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 280
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatcctc cagtcagttc ctgatgcagt atccagtcag 3060
ttcctgatgc agtatccagt cagttcctga tgcagtatcc agtcagttcc tgatgcagta 3120
gtcgacctcg agagatctac gggtggcatc cctgtgaccc ctccccagtg cctctcctgg 3180
ccctggaagt tgccactcca gtgcccacca gccttgtcct aataaaatta agttgcatca 3240
ttttgtctga ctaggtgtcc ttctataata ttatggggtg gaggggggtg gtatggagca 3300
aggggcaagt tgggaagaca acctgtaggg cctgcggggt ctattgggaa ccaagctgga 3360
gtgcagtggc acaatcttgg ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc 3420
tgcctcagcc tcccgagttg ttgggattcc aggcatgcat gaccaggctc agctaatttt 3480
tgtttttttg gtagagacgg ggtttcacca tattggccag gctggtctcc aactcctaat 3540
ctcaggtgat ctacccacct tggcctccca aattgctggg attacaggcg tgaaccactg 3600
ctcccttccc tgtccttctg attttgtagg taaccacgtg cggaccgagc ggccgcagga 3660
acccctagtg atggagttgg ccactccctc tctgcgcgct cgctcgctca ctgaggccgg 3720
gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg gcctcagtga gcgagcgagc 3780
gcgcagctgc ctgcagg 3797
<210> 281
<211> 3793
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 281
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatcctc acagttgcca gctgagatta tcacagttgc 3060
cagctgagat tatcacagtt gccagctgag attatcacag ttgccagctg agattagtcg 3120
acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300
gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600
cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780
agctgcctgc agg 3793
<210> 282
<211> 3793
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 282
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatccac aagctttttg ctcgtcttat acaagctttt 3060
tgctcgtctt atacaagctt tttgctcgtc ttatacaagc tttttgctcg tcttatgtcg 3120
acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300
gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600
cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780
agctgcctgc agg 3793
<210> 283
<211> 3793
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 283
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctctagactg 720
cagcctcagg agatctgggc ccccgcggca tatgttactt gtacagctcg tccatgccga 780
gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 840
ggtctttgct cagcttggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 900
cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 960
tgttgtggcg gatcttgaag ttggccttga tgccgttctt ctgcttgtcg gcggtgatat 1020
agacgttgtc gctgatggcg ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 1080
tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 1140
cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 1200
cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcgggcga 1260
agcactgcac gccccaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 1320
cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 1380
cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 1440
ccccggtgaa cagctcctcg cccttgctca ccatggtggc gaattcgcgg atctgacggt 1500
tcactaaacc agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1560
tcaatggggc ggagttgtta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1620
aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1680
cacgcccatt gatgtactgc caaaaccgca tcacactagt tattaatagt aatcaattac 1740
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg 1800
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc 1860
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac 1920
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa 1980
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac 2040
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta 2100
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga 2160
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa 2220
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag 2280
agctcgtttc gtacgttcga agccaccatg gtgagcaagg gcgaggagga taacatggcc 2340
atcatcaagg agttcatgcg cttcaaggtg cacatggagg gctccgtgaa cggccacgag 2400
ttcgagatcg agggcgaggg cgagggccgc ccctacgagg gcacccagac cgccaagctg 2460
aaggtgacca agggtggccc cctgcccttc gcctgggaca tcctgtcccc tcagttcatg 2520
tacggctcca aggcctacgt gaagcacccc gccgacatcc ccgactactt gaagctgtcc 2580
ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg aggacggcgg cgtggtgacc 2640
gtgacccagg actcctccct ccaggacggc gagttcatct acaaggtgaa gctgcgcggc 2700
accaacttcc cctccgacgg ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc 2760
tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg agatcaagca gcggctgaag 2820
ctgaaggacg gcggccacta cgacgctgag gtcaagacca cctacaaggc caagaagccc 2880
gtgcagctgc ccggcgccta caacgtcaac atcaagttgg acatcacctc ccacaacgag 2940
gactacacca tcgtggaaca gtacgaacgc gccgagggcc gccactccac cggcggcatg 3000
gacgagctgt acaagtagac gcggatccac aaaccttttg ttcgtcttat acaaaccttt 3060
tgttcgtctt atacaaacct tttgttcgtc ttatacaaac cttttgttcg tcttatgtcg 3120
acctcgagag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3180
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3240
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3300
gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3360
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3420
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3480
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3540
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 3600
cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 3660
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 3720
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 3780
agctgcctgc agg 3793
<210> 284
<211> 3792
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 284
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctaggct 720
tcgaatcgat gaattcgaag cttctaccca ccgtactcgt caattccaag ggcatcggta 780
aacatctgct caaactcgaa gtcggccata tccagagcgc cgtagggggc ggagtcgtgg 840
ggggtaaatc ccggacccgg ggaatccccg tcccccaaca tgtccagatc gaaatcgtct 900
agcgcgtcgg catgcgccat cgccacgtcc tcgccgtcta agtggagctc gtcccccagg 960
ctgacatcgg tcgggggggc cgtcgacagt ctgcgcgtgt gtcccgcggg gagaaaggac 1020
aggcgcggag ccgccagccc cgcctcttcg ggggcgtcgt cgtccgggag atcgagcagg 1080
ccctcgatgg tagacccgta attgtttttc gtacgcgcgc ggctgtacgc ggaggcctgt 1140
tcgaccatcg cgtcgatgcc cgcgacgagc aggtcgaggg cgaactcgaa gtcccggtcc 1200
agcatctccg ccacggtgtc gccgccccgg gccgccatga tgtcctgcgc gtcctcgatg 1260
acgcccgcgg tgtccggcac ctcggtcacc gcggtcatcg agtcctggaa gtactcctcc 1320
ggactcagcc cggtgtccgc cacccgggcg aggaagcggc cctcgatggt gccgtagccg 1380
tagacgaact ggaagacggc cgagatggcg ccggtcaggc ggtgcgcggg cagcccgctg 1440
cggcgcacga cgttctgcac cgcgcgggag aaggccagcg agtgcgggcc gatgttgagg 1500
taggtgccga ccagccggga cgaccagggg tggcgcacca gcagcgcccg gttctcccgg 1560
gccagggccc gcagttcctc gcgccagtcg agcccggcgt ccgggtccgg gtggcgcagc 1620
tcgccgaaga cggcgtccag ggcgagctcg agcaactggt ccttggtgtc gacgtaccag 1680
tacacggaca tcgcggtgac gttcagctcg gcggccaggc ggcgcatcga gaaccccgtc 1740
aggccctccg tgtccagcag ccggacggtg accccggtga tccggtcccg gtcgagcccg 1800
gacggctgcc ccccacggcg accgccgcgc cgcccctccc ccgacagcca cacgctgtcc 1860
cgcggcccct cccgccctgc cttcgccatg cgcacctctc ctcgactcat accggtagcg 1920
ctagcgatga gctctggtag tagactagtg gcccccatta tataccctct agagcatatg 1980
tctcacaaag agggctttgt gtagtctcac aaagagggct ttgtgtagtc tcacaaagag 2040
ggctttgtgt agggcgcgcc cccgtagctt ggcgtaatca catgtccgtc gttttacaac 2100
gtcgtgactg ggaaaaccct ggcctgcaag gcgattaagt tgggtaacgc cagggttttc 2160
ccagtcacga cgttgtaaaa cgacggacat gtgaaatagc gctgtacagc gtatgggaat 2220
ctcttgtacg gtgtacgagt atcttcccgt acaccgtacg gcgcgccagt taataattaa 2280
ctagttaata attaactagt taataattaa ctcatatgct ctagagggta tataatgggg 2340
gccactagtc tactaccaga gctcatcgct agcgctggat ccgccaccat ggtgagcaag 2400
ggcgaggagg ataacatggc catcatcaag gagttcatgc gcttcaaggt gcacatggag 2460
ggctccgtga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 2520
ggcacccaga ccgccaagct gaaggtgacc aagggtggcc ccctgccctt cgcctgggac 2580
atcctgtccc ctcagttcat gtacggctcc aaggcctacg tgaagcaccc cgccgacatc 2640
cccgactact tgaagctgtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 2700
gaggacggcg gcgtggtgac cgtgacccag gactcctccc tccaggacgg cgagttcatc 2760
tacaaggtga agctgcgcgg caccaacttc ccctccgacg gccccgtaat gcagaagaag 2820
accatgggct gggaggcctc ctccgagcgg atgtaccccg aggacggcgc cctgaagggc 2880
gagatcaagc agcggctgaa gctgaaggac ggcggccact acgacgctga ggtcaagacc 2940
acctacaagg ccaagaagcc cgtgcagctg cccggcgcct acaacgtcaa catcaagttg 3000
gacatcacct cccacaacga ggactacacc atcgtggaac agtacgaacg cgccgagggc 3060
cgccactcca ccggcggcat ggacgagctg tacaagtagg gtacccaaac accattgtca 3120
cactccaaga tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg 3180
gaagttgcca ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg 3240
tctgactagg tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg 3300
caagttggga agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca 3360
gtggcacaat cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct 3420
cagcctcccg agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt 3480
ttttggtaga gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag 3540
gtgatctacc caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc 3600
ttccctgtcc ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc 3660
tagtgatgga gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac 3720
caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca 3780
gctgcctgca gg 3792
<210> 285
<211> 4213
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 285
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctaggct 720
tcgaatcgat gaattcgaag cttctaccca ccgtactcgt caattccaag ggcatcggta 780
aacatctgct caaactcgaa gtcggccata tccagagcgc cgtagggggc ggagtcgtgg 840
ggggtaaatc ccggacccgg ggaatccccg tcccccaaca tgtccagatc gaaatcgtct 900
agcgcgtcgg catgcgccat cgccacgtcc tcgccgtcta agtggagctc gtcccccagg 960
ctgacatcgg tcgggggggc cgtcgacagt ctgcgcgtgt gtcccgcggg gagaaaggac 1020
aggcgcggag ccgccagccc cgcctcttcg ggggcgtcgt cgtccgggag atcgagcagg 1080
ccctcgatgg tagacccgta attgtttttc gtacgcgcgc ggctgtacgc ggaggcctgt 1140
tcgaccatcg cgtcgatgcc cgcgacgagc aggtcgaggg cgaactcgaa gtcccggtcc 1200
agcatctccg ccacggtgtc gccgccccgg gccgccatga tgtcctgcgc gtcctcgatg 1260
acgcccgcgg tgtccggcac ctcggtcacc gcggtcatcg agtcctggaa gtactcctcc 1320
ggactcagcc cggtgtccgc cacccgggcg aggaagcggc cctcgatggt gccgtagccg 1380
tagacgaact ggaagacggc cgagatggcg ccggtcaggc ggtgcgcggg cagcccgctg 1440
cggcgcacga cgttctgcac cgcgcgggag aaggccagcg agtgcgggcc gatgttgagg 1500
taggtgccga ccagccggga cgaccagggg tggcgcacca gcagcgcccg gttctcccgg 1560
gccagggccc gcagttcctc gcgccagtcg agcccggcgt ccgggtccgg gtggcgcagc 1620
tcgccgaaga cggcgtccag ggcgagctcg agcaactggt ccttggtgtc gacgtaccag 1680
tacacggaca tcgcggtgac gttcagctcg gcggccaggc ggcgcatcga gaaccccgtc 1740
aggccctccg tgtccagcag ccggacggtg accccggtga tccggtcccg gtcgagcccg 1800
gacggctgcc ccccacggcg accgccgcgc cgcccctccc ccgacagcca cacgctgtcc 1860
cgcggcccct cccgccctgc cttcgccatg cgcacctctc ctcgactcat accggtagcg 1920
ctagcgatga gctctggtag tagactagtg gcccccatta tataccctct agagcatatg 1980
tctcacaaag agggctttgt gtagtctcac aaagagggct ttgtgtagtc tcacaaagag 2040
ggctttgtgt agggcgcgcc cccgtagctt ggcgtaatca catgtccgtc gttttacaac 2100
gtcgtgactg ggaaaaccct ggcctgcaag gcgattaagt tgggtaacgc cagggttttc 2160
ccagtcacga cgttgtaaaa cgacggacat gtgaaatagc gctgtacagc gtatgggaat 2220
ctcttgtacg gtgtacgagt atcttcccgt acaccgtacg gcgcgccagt taataattaa 2280
ctagttaata attaactagt taataattaa ctcatatgct ctagagggta tataatgggg 2340
gccactagtc tactaccaga gctcatcgct agcgctggat cccgccacca tggcttcgta 2400
cccctgccat caacacgcgt ctgcgttcga ccaggctgcg cgttctcgcg gccatagcaa 2460
ccgacgtacg gcgttgcgcc ctcgccggca gcaagaagcc acggaagtcc gcctggagca 2520
gaaaatgccc acgctactgc gggtttatat agacggtcct cacgggatgg ggaaaaccac 2580
caccacgcaa ctgctggtgg ccctgggttc gcgcgacgat atcgtctacg tacccgagcc 2640
gatgacttac tggcaggtgc tgggggcttc cgagacaatc gcgaacatct acaccacaca 2700
acaccgcctc gaccagggtg agatatcggc cggggacgcg gcggtggtaa tgacaagcgc 2760
ccagataaca atgggcatgc cttatgccgt gaccgacgcc gttctggctc ctcatatcgg 2820
gggggaggct gggagctcac atgccccgcc cccggccctc accctcatct tcgaccgcca 2880
tcccatcgcc gccctcctgt gctacccggc cgcgcgatac cttatgggca gcatgacccc 2940
ccaggccgtg ctggcgttcg tggccctcat cccgccgacc ttgcccggca caaacatcgt 3000
gttgggggcc cttccggagg acagacacat cgaccgcctg gccaaacgcc agcgccccgg 3060
cgagcggctt gacctggcta tgctggccgc gattcgccgc gtttacgggc tgcttgccaa 3120
tacggtgcgg tatctgcagg gcggcgggtc gtggcgggag gattggggac agctttcggg 3180
gacggccgtg ccgccccagg gtgccgagcc ccagagcaac gcgggcccac gaccccatat 3240
cggggacacg ttatttaccc tgtttcgggc ccccgagttg ctggccccca acggcgacct 3300
gtacaacgtg tttgcctggg ccttggacgt cttggccaaa cgcctccgtc ccatgcacgt 3360
ctttatcctg gattacgacc aatcgcccgc cggctgccgg gacgccctgc tgcaacttac 3420
ctccgggatg gtccagaccc acgtcaccac ccccggctcc ataccgacga tctgcgacct 3480
ggcgcgcacg tttgcccggg agatggggga ggctaactga ggtacccaaa caccattgtc 3540
acactccaag atctacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 3600
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 3660
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 3720
gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 3780
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 3840
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 3900
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 3960
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 4020
cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 4080
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 4140
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 4200
agctgcctgc agg 4213
<210> 286
<211> 4361
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 286
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc tgcggccgca cgcgtaactt gtggactaag tttgttcaca 180
tccccttctc caaccccctc agtacatcac cctgggggaa cagggtccac ttgctcctgg 240
gcccacacag tcctgcagta ttgtgtatat aaggccaggg caaagaggag caggttttaa 300
agtgaaaggc aggcaggtgt tggggaggca gttaccgggg caacgggaac agggcgtttc 360
ggaggtggtt gccatgggga cctggatgct gacgaaggct cgattattga agcatttatc 420
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 480
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt cggcagtgaa aaaaatgctt 540
tatttgtgaa atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca 600
agttaacaac aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt 660
tttttaaagc aagtaaaacc tctacaaatg tggtatggct gattatgatc ctcctaggtg 720
aggtagtagg ttgtatggtt tgaggtagta ggttgtatgg tttgaggtag taggttgtat 780
ggtttgaggt agtaggttgt atggttatcg atgaattcga agcttctacc caccgtactc 840
gtcaattcca agggcatcgg taaacatctg ctcaaactcg aagtcggcca tatccagagc 900
gccgtagggg gcggagtcgt ggggggtaaa tcccggaccc ggggaatccc cgtcccccaa 960
catgtccaga tcgaaatcgt ctagcgcgtc ggcatgcgcc atcgccacgt cctcgccgtc 1020
taagtggagc tcgtccccca ggctgacatc ggtcgggggg gccgtcgaca gtctgcgcgt 1080
gtgtcccgcg gggagaaagg acaggcgcgg agccgccagc cccgcctctt cgggggcgtc 1140
gtcgtccggg agatcgagca ggccctcgat ggtagacccg taattgtttt tcgtacgcgc 1200
gcggctgtac gcggaggcct gttcgaccat cgcgtcgatg cccgcgacga gcaggtcgag 1260
ggcgaactcg aagtcccggt ccagcatctc cgccacggtg tcgccgcccc gggccgccat 1320
gatgtcctgc gcgtcctcga tgacgcccgc ggtgtccggc acctcggtca ccgcggtcat 1380
cgagtcctgg aagtactcct ccggactcag cccggtgtcc gccacccggg cgaggaagcg 1440
gccctcgatg gtgccgtagc cgtagacgaa ctggaagacg gccgagatgg cgccggtcag 1500
gcggtgcgcg ggcagcccgc tgcggcgcac gacgttctgc accgcgcggg agaaggccag 1560
cgagtgcggg ccgatgttga ggtaggtgcc gaccagccgg gacgaccagg ggtggcgcac 1620
cagcagcgcc cggttctccc gggccagggc ccgcagttcc tcgcgccagt cgagcccggc 1680
gtccgggtcc gggtggcgca gctcgccgaa gacggcgtcc agggcgagct cgagcaactg 1740
gtccttggtg tcgacgtacc agtacacgga catcgcggtg acgttcagct cggcggccag 1800
gcggcgcatc gagaaccccg tcaggccctc cgtgtccagc agccggacgg tgaccccggt 1860
gatccggtcc cggtcgagcc cggacggctg ccccccacgg cgaccgccgc gccgcccctc 1920
ccccgacagc cacacgctgt cccgcggccc ctcccgccct gccttcgcca tgcgcacctc 1980
tcctcgactc ataccggtag cgctagcgat gagctctggt agtagactag tggcccccat 2040
tatataccct ctagagcata tgtctcacaa agagggcttt gtgtagtctc acaaagaggg 2100
ctttgtgtag tctcacaaag agggctttgt gtagggcgcg cccccgtagc ttggcgtaat 2160
cacatgtccg tcgttttaca acgtcgtgac tgggaaaacc ctggcctgca aggcgattaa 2220
gttgggtaac gccagggttt tcccagtcac gacgttgtaa aacgacggac atgtgaaata 2280
gcgctgtaca gcgtatggga atctcttgta cggtgtacga gtatcttccc gtacaccgta 2340
cggcgcgcca gttaataatt aactagttaa taattaacta gttaataatt aactcatatg 2400
ctctagaggg tatataatgg gggccactag tctactacca gagctcatcg ctagcgctgg 2460
atcccgccac catggcttcg tacccctgcc atcaacacgc gtctgcgttc gaccaggctg 2520
cgcgttctcg cggccatagc aaccgacgta cggcgttgcg ccctcgccgg cagcaagaag 2580
ccacggaagt ccgcctggag cagaaaatgc ccacgctact gcgggtttat atagacggtc 2640
ctcacgggat ggggaaaacc accaccacgc aactgctggt ggccctgggt tcgcgcgacg 2700
atatcgtcta cgtacccgag ccgatgactt actggcaggt gctgggggct tccgagacaa 2760
tcgcgaacat ctacaccaca caacaccgcc tcgaccaggg tgagatatcg gccggggacg 2820
cggcggtggt aatgacaagc gcccagataa caatgggcat gccttatgcc gtgaccgacg 2880
ccgttctggc tcctcatatc gggggggagg ctgggagctc acatgccccg cccccggccc 2940
tcaccctcat cttcgaccgc catcccatcg ccgccctcct gtgctacccg gccgcgcgat 3000
accttatggg cagcatgacc ccccaggccg tgctggcgtt cgtggccctc atcccgccga 3060
ccttgcccgg cacaaacatc gtgttggggg cccttccgga ggacagacac atcgaccgcc 3120
tggccaaacg ccagcgcccc ggcgagcggc ttgacctggc tatgctggcc gcgattcgcc 3180
gcgtttacgg gctgcttgcc aatacggtgc ggtatctgca gggcggcggg tcgtggcggg 3240
aggattgggg acagctttcg gggacggccg tgccgcccca gggtgccgag ccccagagca 3300
acgcgggccc acgaccccat atcggggaca cgttatttac cctgtttcgg gcccccgagt 3360
tgctggcccc caacggcgac ctgtacaacg tgtttgcctg ggccttggac gtcttggcca 3420
aacgcctccg tcccatgcac gtctttatcc tggattacga ccaatcgccc gccggctgcc 3480
gggacgccct gctgcaactt acctccggga tggtccagac ccacgtcacc acccccggct 3540
ccataccgac gatctgcgac ctggcgcgca cgtttgcccg ggagatgggg gaggctaact 3600
gaggtaccaa ccatacaacc tactacctca aaccatacaa cctactacct caaaccatac 3660
aacctactac ctcaaaccat acaacctact acctcaagat ctacgggtgg catccctgtg 3720
acccctcccc agtgcctctc ctggccctgg aagttgccac tccagtgccc accagccttg 3780
tcctaataaa attaagttgc atcattttgt ctgactaggt gtccttctat aatattatgg 3840
ggtggagggg ggtggtatgg agcaaggggc aagttgggaa gacaacctgt agggcctgcg 3900
gggtctattg ggaaccaagc tggagtgcag tggcacaatc ttggctcact gcaatctccg 3960
cctcctgggt tcaagcgatt ctcctgcctc agcctcccga gttgttggga ttccaggcat 4020
gcatgaccag gctcagctaa tttttgtttt tttggtagag acggggtttc accatattgg 4080
ccaggctggt ctccaactcc taatctcagg tgatctaccc accttggcct cccaaattgc 4140
tgggattaca ggcgtgaacc actgctccct tccctgtcct tctgattttg taggtaacca 4200
cgtgcggacc gagcggccgc aggaacccct agtgatggag ttggccactc cctctctgcg 4260
cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg 4320
ggcggcctca gtgagcgagc gagcgcgcag ctgcctgcag g 4361
<210> 287
<211> 3358
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 287
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tccaagcact ctgatttgac aattaaagca ctctgatttg acaattaaag 2820
cactctgatt tgacaattaa agcactctga tttgacaatt agtcgacctc gagagatcta 2880
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000
cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060
aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120
gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180
gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240
gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300
ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358
<210> 288
<211> 3358
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 288
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tccaaccata caacctacta cctcaaacca tacaacctac tacctcaaac 2820
catacaacct actacctcaa accatacaac ctactacctc agtcgacctc gagagatcta 2880
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000
cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060
aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120
gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180
gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240
gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300
ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358
<210> 289
<211> 3347
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 289
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcct aggcttcgaa tcgatgaatt 480
cgaagcttct acccaccgta ctcgtcaatt ccaagggcat cggtaaacat ctgctcaaac 540
tcgaagtcgg ccatatccag agcgccgtag ggggcggagt cgtggggggt aaatcccgga 600
cccggggaat ccccgtcccc caacatgtcc agatcgaaat cgtctagcgc gtcggcatgc 660
gccatcgcca cgtcctcgcc gtctaagtgg agctcgtccc ccaggctgac atcggtcggg 720
ggggccgtcg acagtctgcg cgtgtgtccc gcggggagaa aggacaggcg cggagccgcc 780
agccccgcct cttcgggggc gtcgtcgtcc gggagatcga gcaggccctc gatggtagac 840
ccgtaattgt ttttcgtacg cgcgcggctg tacgcggagg cctgttcgac catcgcgtcg 900
atgcccgcga cgagcaggtc gagggcgaac tcgaagtccc ggtccagcat ctccgccacg 960
gtgtcgccgc cccgggccgc catgatgtcc tgcgcgtcct cgatgacgcc cgcggtgtcc 1020
ggcacctcgg tcaccgcggt catcgagtcc tggaagtact cctccggact cagcccggtg 1080
tccgccaccc gggcgaggaa gcggccctcg atggtgccgt agccgtagac gaactggaag 1140
acggccgaga tggcgccggt caggcggtgc gcgggcagcc cgctgcggcg cacgacgttc 1200
tgcaccgcgc gggagaaggc cagcgagtgc gggccgatgt tgaggtaggt gccgaccagc 1260
cgggacgacc aggggtggcg caccagcagc gcccggttct cccgggccag ggcccgcagt 1320
tcctcgcgcc agtcgagccc ggcgtccggg tccgggtggc gcagctcgcc gaagacggcg 1380
tccagggcga gctcgagcaa ctggtccttg gtgtcgacgt accagtacac ggacatcgcg 1440
gtgacgttca gctcggcggc caggcggcgc atcgagaacc ccgtcaggcc ctccgtgtcc 1500
agcagccgga cggtgacccc ggtgatccgg tcccggtcga gcccggacgg ctgcccccca 1560
cggcgaccgc cgcgccgccc ctcccccgac agccacacgc tgtcccgcgg cccctcccgc 1620
cctgccttcg ccatgcgcac ctctcctcga ctcataccgg tagcgctagc gatgagctct 1680
ggtagtagac tagtggcccc cattatatac cctctagagc atatgtctca caaagagggc 1740
tttgtgtagt ctcacaaaga gggctttgtg tagtctcaca aagagggctt tgtgtagggc 1800
gcgcccccgt agcttggcgt aatcacatgt ccgtcgtttt acaacgtcgt gactgggaaa 1860
accctggcct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 1920
taaaacgacg gacatgtgaa atagcgctgt acagcgtatg ggaatctctt gtacggtgta 1980
cgagtatctt cccgtacacc gtacggcgcg ccagttaata attaactagt taataattaa 2040
ctagttaata attaactcat atgctctaga gggtatataa tgggggccac tagtctacta 2100
ccagagctca tcgctagcgc tggatccgcc accatggtga gcaagggcga ggaggataac 2160
atggccatca tcaaggagtt catgcgcttc aaggtgcaca tggagggctc cgtgaacggc 2220
cacgagttcg agatcgaggg cgagggcgag ggccgcccct acgagggcac ccagaccgcc 2280
aagctgaagg tgaccaaggg tggccccctg cccttcgcct gggacatcct gtcccctcag 2340
ttcatgtacg gctccaaggc ctacgtgaag caccccgccg acatccccga ctacttgaag 2400
ctgtccttcc ccgagggctt caagtgggag cgcgtgatga acttcgagga cggcggcgtg 2460
gtgaccgtga cccaggactc ctccctccag gacggcgagt tcatctacaa ggtgaagctg 2520
cgcggcacca acttcccctc cgacggcccc gtaatgcaga agaagaccat gggctgggag 2580
gcctcctccg agcggatgta ccccgaggac ggcgccctga agggcgagat caagcagcgg 2640
ctgaagctga aggacggcgg ccactacgac gctgaggtca agaccaccta caaggccaag 2700
aagcccgtgc agctgcccgg cgcctacaac gtcaacatca agttggacat cacctcccac 2760
aacgaggact acaccatcgt ggaacagtac gaacgcgccg agggccgcca ctccaccggc 2820
ggcatggacg agctgtacaa gtagggtacc gtcgacctcg agagatctac gggtggcatc 2880
cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca gtgcccacca 2940
gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc ttctataata 3000
ttatggggtg gaggggggtg gtatggagca aggggcaagt tgggaagaca acctgtaggg 3060
cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg ctcactgcaa 3120
tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc tcccgagttg ttgggattcc 3180
aggcatgcat gaccaggctc agctaatttt tgtttttttg gtagagacgg ggtttcacca 3240
tattggccag gctggtctcc aactcctaat ctcaggtgat ctacccacct tggcctccca 3300
aattgctggg attacaggcg tgaaccactg ctcccttccc tgtcctt 3347
<210> 290
<211> 3505
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 290
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcct aggtgaggta gtaggttgta 480
tggtttgagg tagtaggttg tatggtttga ggtagtaggt tgtatggttt gaggtagtag 540
gttgtatggt tatcgatgaa ttcgaagctt ctacccaccg tactcgtcaa ttccaagggc 600
atcggtaaac atctgctcaa actcgaagtc ggccatatcc agagcgccgt agggggcgga 660
gtcgtggggg gtaaatcccg gacccgggga atccccgtcc cccaacatgt ccagatcgaa 720
atcgtctagc gcgtcggcat gcgccatcgc cacgtcctcg ccgtctaagt ggagctcgtc 780
ccccaggctg acatcggtcg ggggggccgt cgacagtctg cgcgtgtgtc ccgcggggag 840
aaaggacagg cgcggagccg ccagccccgc ctcttcgggg gcgtcgtcgt ccgggagatc 900
gagcaggccc tcgatggtag acccgtaatt gtttttcgta cgcgcgcggc tgtacgcgga 960
ggcctgttcg accatcgcgt cgatgcccgc gacgagcagg tcgagggcga actcgaagtc 1020
ccggtccagc atctccgcca cggtgtcgcc gccccgggcc gccatgatgt cctgcgcgtc 1080
ctcgatgacg cccgcggtgt ccggcacctc ggtcaccgcg gtcatcgagt cctggaagta 1140
ctcctccgga ctcagcccgg tgtccgccac ccgggcgagg aagcggccct cgatggtgcc 1200
gtagccgtag acgaactgga agacggccga gatggcgccg gtcaggcggt gcgcgggcag 1260
cccgctgcgg cgcacgacgt tctgcaccgc gcgggagaag gccagcgagt gcgggccgat 1320
gttgaggtag gtgccgacca gccgggacga ccaggggtgg cgcaccagca gcgcccggtt 1380
ctcccgggcc agggcccgca gttcctcgcg ccagtcgagc ccggcgtccg ggtccgggtg 1440
gcgcagctcg ccgaagacgg cgtccagggc gagctcgagc aactggtcct tggtgtcgac 1500
gtaccagtac acggacatcg cggtgacgtt cagctcggcg gccaggcggc gcatcgagaa 1560
ccccgtcagg ccctccgtgt ccagcagccg gacggtgacc ccggtgatcc ggtcccggtc 1620
gagcccggac ggctgccccc cacggcgacc gccgcgccgc ccctcccccg acagccacac 1680
gctgtcccgc ggcccctccc gccctgcctt cgccatgcgc acctctcctc gactcatacc 1740
ggtagcgcta gcgatgagct ctggtagtag actagtggcc cccattatat accctctaga 1800
gcatatgtct cacaaagagg gctttgtgta gtctcacaaa gagggctttg tgtagtctca 1860
caaagagggc tttgtgtagg gcgcgccccc gtagcttggc gtaatcacat gtccgtcgtt 1920
ttacaacgtc gtgactggga aaaccctggc ctgcaaggcg attaagttgg gtaacgccag 1980
ggttttccca gtcacgacgt tgtaaaacga cggacatgtg aaatagcgct gtacagcgta 2040
tgggaatctc ttgtacggtg tacgagtatc ttcccgtaca ccgtacggcg cgccagttaa 2100
taattaacta gttaataatt aactagttaa taattaactc atatgctcta gagggtatat 2160
aatgggggcc actagtctac taccagagct catcgctagc gctggatccg ccaccatggt 2220
gagcaagggc gaggaggata acatggccat catcaaggag ttcatgcgct tcaaggtgca 2280
catggagggc tccgtgaacg gccacgagtt cgagatcgag ggcgagggcg agggccgccc 2340
ctacgagggc acccagaccg ccaagctgaa ggtgaccaag ggtggccccc tgcccttcgc 2400
ctgggacatc ctgtcccctc agttcatgta cggctccaag gcctacgtga agcaccccgc 2460
cgacatcccc gactacttga agctgtcctt ccccgagggc ttcaagtggg agcgcgtgat 2520
gaacttcgag gacggcggcg tggtgaccgt gacccaggac tcctccctcc aggacggcga 2580
gttcatctac aaggtgaagc tgcgcggcac caacttcccc tccgacggcc ccgtaatgca 2640
gaagaagacc atgggctggg aggcctcctc cgagcggatg taccccgagg acggcgccct 2700
gaagggcgag atcaagcagc ggctgaagct gaaggacggc ggccactacg acgctgaggt 2760
caagaccacc tacaaggcca agaagcccgt gcagctgccc ggcgcctaca acgtcaacat 2820
caagttggac atcacctccc acaacgagga ctacaccatc gtggaacagt acgaacgcgc 2880
cgagggccgc cactccaccg gcggcatgga cgagctgtac aagtagggta ccaaccatac 2940
aacctactac ctcaaaccat acaacctact acctcaaacc atacaaccta ctacctcaaa 3000
ccatacaacc tactacctca agatctacgg gtggcatccc tgtgacccct ccccagtgcc 3060
tctcctggcc ctggaagttg ccactccagt gcccaccagc cttgtcctaa taaaattaag 3120
ttgcatcatt ttgtctgact aggtgtcctt ctataatatt atggggtgga ggggggtggt 3180
atggagcaag gggcaagttg ggaagacaac ctgtagggcc tgcggggtct attgggaacc 3240
aagctggagt gcagtggcac aatcttggct cactgcaatc tccgcctcct gggttcaagc 3300
gattctcctg cctcagcctc ccgagttgtt gggattccag gcatgcatga ccaggctcag 3360
ctaatttttg tttttttggt agagacgggg tttcaccata ttggccaggc tggtctccaa 3420
ctcctaatct caggtgatct acccaccttg gcctcccaaa ttgctgggat tacaggcgtg 3480
aaccactgct cccttccctg tcctt 3505
<210> 291
<211> 3672
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 291
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcct agggggtcca cttgctcctg 480
ggcccacaca gtcctgcagt attgtgtata taaggccagg gcaaagagga gcaggtttta 540
aagtgaaagg caggcaggtg ttggggaggc agttaccggg gcaacgggaa cagggcgttt 600
cggaggtggt tgccatgggg acctggatgc tgttccattc gccattcagg ctgcgcaact 660
gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat 720
gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa 780
cgacggaatt cgaagcttac gacggacatg tgaaatagcg ctgtacagcg tatgggaatc 840
tcttgtacgg tgtacgagta tcttcccgta caccgtacgg cgcgccagtt aataattaac 900
tagttaataa ttaactagtt aataattaac tcatatgctc tagagggtat ataatggggg 960
ccactagtct actaccagag ctcatcgcta gcgctggatc cgccaccatg gtgagcaagg 1020
gcgaggagga taacatggcc atcatcaagg agttcatgcg cttcaaggtg cacatggagg 1080
gctccgtgaa cggccacgag ttcgagatcg agggcgaggg cgagggccgc ccctacgagg 1140
gcacccagac cgccaagctg aaggtgacca agggtggccc cctgcccttc gcctgggaca 1200
tcctgtcccc tcagttcatg tacggctcca aggcctacgt gaagcacccc gccgacatcc 1260
ccgactactt gaagctgtcc ttccccgagg gcttcaagtg ggagcgcgtg atgaacttcg 1320
aggacggcgg cgtggtgacc gtgacccagg actcctccct ccaggacggc gagttcatct 1380
acaaggtgaa gctgcgcggc accaacttcc cctccgacgg ccccgtaatg cagaagaaga 1440
ccatgggctg ggaggcctcc tccgagcgga tgtaccccga ggacggcgcc ctgaagggcg 1500
agatcaagca gcggctgaag ctgaaggacg gcggccacta cgacgctgag gtcaagacca 1560
cctacaaggc caagaagccc gtgcagctgc ccggcgccta caacgtcaac atcaagttgg 1620
acatcacctc ccacaacgag gactacacca tcgtggaaca gtacgaacgc gccgagggcc 1680
gccactccac cggcggcatg gacgagctgt acaagtccgg aagagccgag ggcaggggaa 1740
gtcttctaac atgcggggac gtggaggaaa atcccgggcc cagatctatg agtcgaggag 1800
aggtgcgcat ggcgaaggca gggcgggagg ggccgcggga cagcgtgtgg ctgtcggggg 1860
aggggcggcg cggcggtcgc cgtggggggc agccgtccgg gctcgaccgg gaccggatca 1920
ccggggtcac cgtccggctg ctggacacgg agggcctgac ggggttctcg atgcgccgcc 1980
tggccgccga gctgaacgtc accgcgatgt ccgtgtactg gtacgtcgac accaaggacc 2040
agttgctcga gctcgccctg gacgccgtct tcggcgagct gcgccacccg gacccggacg 2100
ccgggctcga ctggcgcgag gaactgcggg ccctggcccg ggagaaccgg gcgctgctgg 2160
tgcgccaccc ctggtcgtcc cggctggtcg gcacctacct caacatcggc ccgcactcgc 2220
tggccttctc ccgcgcggtg cagaacgtcg tgcgccgcag cgggctgccc gcgcaccgcc 2280
tgaccggcgc catctcggcc gtcttccagt tcgtctacgg ctacggcacc atcgagggcc 2340
gcttcctcgc ccgggtggcg gacaccgggc tgagtccgga ggagtacttc caggactcga 2400
tgaccgcggt gaccgaggtg ccggacaccg cgggcgtcat cgaggacgcg caggacatca 2460
tggcggcccg gggcggcgac accgtggcgg agatgctgga ccgggacttc gagttcgccc 2520
tcgacctgct cgtcgcgggc atcgacgcga tggtcgaaca ggcctccgcg tacagccgcg 2580
cgcatgatga gtttcccacc atggtgtttc cttctgggca gatcagccag gcctcggcct 2640
tggccccggc ccctccccaa gtcctgcccc aggctccagc ccctgcccct gctccagcca 2700
tggtatcagc tctggcccag gccccagccc ctgtcccagt cctagcccca ggccctcctc 2760
aggctgtggc cccacctgcc cccaagccca cccaggctgg ggaaggaacg ctgtcagagg 2820
ccctgctgca gctgcagttt gatgatgaag acctgggggc cttgcttggc aacagcacag 2880
acccagctgt gttcacagac ctggcatccg tcgacaactc cgagtttcag cagctgctga 2940
accagggcat acctgtggcc ccccacacaa ctgagcccat gctgatggag taccctgagg 3000
ctataactcg cctagtgaca ggggcccaga ggccccccga cccagctcct gctccactgg 3060
gggccccggg gctccccaat ggcctccttt caggagatga agacttctcc tccattgcgg 3120
acatggactt ctcagccctg ctgagtcaga tcagctccta aggaagcttg gtaccgtcga 3180
cctcgagaga tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg 3240
gaagttgcca ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg 3300
tctgactagg tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg 3360
caagttggga agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca 3420
gtggcacaat cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct 3480
cagcctcccg agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt 3540
ttttggtaga gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag 3600
gtgatctacc caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc 3660
ttccctgtcc tt 3672
<210> 292
<211> 3699
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 292
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcct agggggtcca cttgctcctg 480
ggcccacaca gtcctgcagt attgtgtata taaggccagg gcaaagagga gcaggtttta 540
aagtgaaagg caggcaggtg ttggggaggc agttaccggg gcaacgggaa cagggcgttt 600
cggaggtggt tgccatgggg acctggatgc tgttccattc gccattcagg ctgcgcaact 660
gttgggaagg gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat 720
gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa 780
cgacggaatt cgaagcttac gacggacatg tgaaatagcg ctgtacagcg tatgggaatc 840
tcttgtacgg tgtacgagta tcttcccgta caccgtacgg cgcgccctac acaaagccct 900
ctttgtgaga ctacacaaag ccctctttgt gagactacac aaagccctct ttgtgagaca 960
tatgctctag agggtatata atgggggcca ctagtctact accagagctc atcgctagcg 1020
ctggatccgc caccatggtg agcaagggcg aggaggataa catggccatc atcaaggagt 1080
tcatgcgctt caaggtgcac atggagggct ccgtgaacgg ccacgagttc gagatcgagg 1140
gcgagggcga gggccgcccc tacgagggca cccagaccgc caagctgaag gtgaccaagg 1200
gtggccccct gcccttcgcc tgggacatcc tgtcccctca gttcatgtac ggctccaagg 1260
cctacgtgaa gcaccccgcc gacatccccg actacttgaa gctgtccttc cccgagggct 1320
tcaagtggga gcgcgtgatg aacttcgagg acggcggcgt ggtgaccgtg acccaggact 1380
cctccctcca ggacggcgag ttcatctaca aggtgaagct gcgcggcacc aacttcccct 1440
ccgacggccc cgtaatgcag aagaagacca tgggctggga ggcctcctcc gagcggatgt 1500
accccgagga cggcgccctg aagggcgaga tcaagcagcg gctgaagctg aaggacggcg 1560
gccactacga cgctgaggtc aagaccacct acaaggccaa gaagcccgtg cagctgcccg 1620
gcgcctacaa cgtcaacatc aagttggaca tcacctccca caacgaggac tacaccatcg 1680
tggaacagta cgaacgcgcc gagggccgcc actccaccgg cggcatggac gagctgtaca 1740
agtccggaag agccgagggc aggggaagtc ttctaacatg cggggacgtg gaggaaaatc 1800
ccgggcccag atctatgagt cgaggagagg tgcgcatggc gaaggcaggg cgggaggggc 1860
cgcgggacag cgtgtggctg tcgggggagg ggcggcgcgg cggtcgccgt ggggggcagc 1920
cgtccgggct cgaccgggac cggatcaccg gggtcaccgt ccggctgctg gacacggagg 1980
gcctgacggg gttctcgatg cgccgcctgg ccgccgagct gaacgtcacc gcgatgtccg 2040
tgtactggta cgtcgacacc aaggaccagt tgctcgagct cgccctggac gccgtcttcg 2100
gcgagctgcg ccacccggac ccggacgccg ggctcgactg gcgcgaggaa ctgcgggccc 2160
tggcccggga gaaccgggcg ctgctggtgc gccacccctg gtcgtcccgg ctggtcggca 2220
cctacctcaa catcggcccg cactcgctgg ccttctcccg cgcggtgcag aacgtcgtgc 2280
gccgcagcgg gctgcccgcg caccgcctga ccggcgccat ctcggccgtc ttccagttcg 2340
tctacggcta cggcaccatc gagggccgct tcctcgcccg ggtggcggac accgggctga 2400
gtccggagga gtacttccag gactcgatga ccgcggtgac cgaggtgccg gacaccgcgg 2460
gcgtcatcga ggacgcgcag gacatcatgg cggcccgggg cggcgacacc gtggcggaga 2520
tgctggaccg ggacttcgag ttcgccctcg acctgctcgt cgcgggcatc gacgcgatgg 2580
tcgaacaggc ctccgcgtac agccgcgcgc atgatgagtt tcccaccatg gtgtttcctt 2640
ctgggcagat cagccaggcc tcggccttgg ccccggcccc tccccaagtc ctgccccagg 2700
ctccagcccc tgcccctgct ccagccatgg tatcagctct ggcccaggcc ccagcccctg 2760
tcccagtcct agccccaggc cctcctcagg ctgtggcccc acctgccccc aagcccaccc 2820
aggctgggga aggaacgctg tcagaggccc tgctgcagct gcagtttgat gatgaagacc 2880
tgggggcctt gcttggcaac agcacagacc cagctgtgtt cacagacctg gcatccgtcg 2940
acaactccga gtttcagcag ctgctgaacc agggcatacc tgtggccccc cacacaactg 3000
agcccatgct gatggagtac cctgaggcta taactcgcct agtgacaggg gcccagaggc 3060
cccccgaccc agctcctgct ccactggggg ccccggggct ccccaatggc ctcctttcag 3120
gagatgaaga cttctcctcc attgcggaca tggacttctc agccctgctg agtcagatca 3180
gctcctaagg aagcttggta ccgtcgacct cgagagatct acgggtggca tccctgtgac 3240
ccctccccag tgcctctcct ggccctggaa gttgccactc cagtgcccac cagccttgtc 3300
ctaataaaat taagttgcat cattttgtct gactaggtgt ccttctataa tattatgggg 3360
tggagggggg tggtatggag caaggggcaa gttgggaaga caacctgtag ggcctgcggg 3420
gtctattggg aaccaagctg gagtgcagtg gcacaatctt ggctcactgc aatctccgcc 3480
tcctgggttc aagcgattct cctgcctcag cctcccgagt tgttgggatt ccaggcatgc 3540
atgaccaggc tcagctaatt tttgtttttt tggtagagac ggggtttcac catattggcc 3600
aggctggtct ccaactccta atctcaggtg atctacccac cttggcctcc caaattgctg 3660
ggattacagg cgtgaaccac tgctcccttc cctgtcctt 3699
<210> 293
<211> 3354
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 293
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tccacctatc ctgaattact tgaaacctat cctgaattac ttgaaaccta 2820
tcctgaatta cttgaaacct atcctgaatt acttgaagtc gacctcgaga gatctacggg 2880
tggcatccct gtgacccctc cccagtgcct ctcctggccc tggaagttgc cactccagtg 2940
cccaccagcc ttgtcctaat aaaattaagt tgcatcattt tgtctgacta ggtgtccttc 3000
tataatatta tggggtggag gggggtggta tggagcaagg ggcaagttgg gaagacaacc 3060
tgtagggcct gcggggtcta ttgggaacca agctggagtg cagtggcaca atcttggctc 3120
actgcaatct ccgcctcctg ggttcaagcg attctcctgc ctcagcctcc cgagttgttg 3180
ggattccagg catgcatgac caggctcagc taatttttgt ttttttggta gagacggggt 3240
ttcaccatat tggccaggct ggtctccaac tcctaatctc aggtgatcta cccaccttgg 3300
cctcccaaat tgctgggatt acaggcgtga accactgctc ccttccctgt cctt 3354
<210> 294
<211> 3358
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 294
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tccacagttc ttcaactggc agcttacagt tcttcaactg gcagcttaca 2820
gttcttcaac tggcagctta cagttcttca actggcagct tgtcgacctc gagagatcta 2880
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000
cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060
aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120
gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180
gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240
gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300
ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358
<210> 295
<211> 3358
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 295
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tcccgtgttc acagcggacc ttgatcgtgt tcacagcgga ccttgatcgt 2820
gttcacagcg gaccttgatc gtgttcacag cggaccttga tgtcgacctc gagagatcta 2880
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000
cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060
aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120
gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180
gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240
gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300
ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358
<210> 296
<211> 3357
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 296
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tctccaaaac atgaattgct gctgtccaaa acatgaattg ctgctgtcca 2820
aaacatgaat tgctgctgtc caaaacatga attgctgctg gtcgacctcg agagatctac 2880
gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca 2940
gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc 3000
ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagt tgggaagaca 3060
acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg 3120
ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc tcccgagttg 3180
ttgggattcc aggcatgcat gaccaggctc agctaatttt tgtttttttg gtagagacgg 3240
ggtttcacca tattggccag gctggtctcc aactcctaat ctcaggtgat ctacccacct 3300
tggcctccca aattgctggg attacaggcg tgaaccactg ctcccttccc tgtcctt 3357
<210> 297
<211> 3358
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 297
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tcccaaacac cattgtcaca ctccacaaac accattgtca cactccacaa 2820
acaccattgt cacactccac aaacaccatt gtcacactcc agtcgacctc gagagatcta 2880
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000
cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060
aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120
gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180
gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240
gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300
ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358
<210> 298
<211> 3362
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 298
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tcctccagtc agttcctgat gcagtatcca gtcagttcct gatgcagtat 2820
ccagtcagtt cctgatgcag tatccagtca gttcctgatg cagtagtcga cctcgagaga 2880
tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg gaagttgcca 2940
ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg 3000
tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga 3060
agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat 3120
cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg 3180
agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga 3240
gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc 3300
caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc 3360
tt 3362
<210> 299
<211> 3358
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 299
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tcctcacagt tgccagctga gattatcaca gttgccagct gagattatca 2820
cagttgccag ctgagattat cacagttgcc agctgagatt agtcgacctc gagagatcta 2880
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000
cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060
aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120
gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180
gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240
gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300
ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358
<210> 300
<211> 3358
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 300
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tccacaagct ttttgctcgt cttatacaag ctttttgctc gtcttataca 2820
agctttttgc tcgtcttata caagcttttt gctcgtctta tgtcgacctc gagagatcta 2880
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000
cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060
aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120
gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180
gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240
gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300
ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358
<210> 301
<211> 3358
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 301
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcta gactgcagcc tcaggagatc 480
tgggcccccg cggcatatgt tacttgtaca gctcgtccat gccgagagtg atcccggcgg 540
cggtcacgaa ctccagcagg accatgtgat cgcgcttctc gttggggtct ttgctcagct 600
tggactgggt gctcaggtag tggttgtcgg gcagcagcac ggggccgtcg ccgatggggg 660
tgttctgctg gtagtggtcg gcgagctgca cgctgccgtc ctcgatgttg tggcggatct 720
tgaagttggc cttgatgccg ttcttctgct tgtcggcggt gatatagacg ttgtcgctga 780
tggcgttgta ctccagcttg tgccccagga tgttgccgtc ctccttgaag tcgatgccct 840
tcagctcgat gcggttcacc agggtgtcgc cctcgaactt cacctcggcg cgggtcttgt 900
agttgccgtc gtccttgaag aagatggtgc gctcctggac gtagccttcg ggcatggcgg 960
acttgaagaa gtcgtgctgc ttcatgtggt cggggtagcg ggcgaagcac tgcacgcccc 1020
aggtcagggt ggtcacgagg gtgggccagg gcacgggcag cttgccggtg gtgcagatga 1080
acttcagggt cagcttgccg taggtggcat cgccctcgcc ctcgccggac acgctgaact 1140
tgtggccgtt tacgtcgccg tccagctcga ccaggatggg caccaccccg gtgaacagct 1200
cctcgccctt gctcaccatg gtggcgaatt cgcggatctg acggttcact aaaccagctc 1260
tgcttatata gacctcccac cgtacacgcc taccgcccat ttgcgtcaat ggggcggagt 1320
tgttacgaca ttttggaaag tcccgttgat tttggtgcca aaacaaactc ccattgacgt 1380
caatggggtg gagacttgga aatccccgtg agtcaaaccg ctatccacgc ccattgatgt 1440
actgccaaaa ccgcatcaca ctagttatta atagtaatca attacggggt cattagttca 1500
tagcccatat atggagttcc gcgttacata acttacggta aatggcccgc ctggctgacc 1560
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 1620
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 1680
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 1740
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 1800
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 1860
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 1920
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 1980
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttcgtacg 2040
ttcgaagcca ccatggtgag caagggcgag gaggataaca tggccatcat caaggagttc 2100
atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc 2160
gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt 2220
ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc 2280
tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc 2340
aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc 2400
tccctccagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc 2460
gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac 2520
cccgaggacg gcgccctgaa gggcgagatc aagcagcggc tgaagctgaa ggacggcggc 2580
cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc 2640
gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg 2700
gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag 2760
tagacgcgga tccacaaacc ttttgttcgt cttatacaaa ccttttgttc gtcttataca 2820
aaccttttgt tcgtcttata caaacctttt gttcgtctta tgtcgacctc gagagatcta 2880
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2940
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3000
cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3060
aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3120
gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3180
gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3240
gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3300
ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3358
<210> 302
<211> 3357
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 302
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcct aggcttcgaa tcgatgaatt 480
cgaagcttct acccaccgta ctcgtcaatt ccaagggcat cggtaaacat ctgctcaaac 540
tcgaagtcgg ccatatccag agcgccgtag ggggcggagt cgtggggggt aaatcccgga 600
cccggggaat ccccgtcccc caacatgtcc agatcgaaat cgtctagcgc gtcggcatgc 660
gccatcgcca cgtcctcgcc gtctaagtgg agctcgtccc ccaggctgac atcggtcggg 720
ggggccgtcg acagtctgcg cgtgtgtccc gcggggagaa aggacaggcg cggagccgcc 780
agccccgcct cttcgggggc gtcgtcgtcc gggagatcga gcaggccctc gatggtagac 840
ccgtaattgt ttttcgtacg cgcgcggctg tacgcggagg cctgttcgac catcgcgtcg 900
atgcccgcga cgagcaggtc gagggcgaac tcgaagtccc ggtccagcat ctccgccacg 960
gtgtcgccgc cccgggccgc catgatgtcc tgcgcgtcct cgatgacgcc cgcggtgtcc 1020
ggcacctcgg tcaccgcggt catcgagtcc tggaagtact cctccggact cagcccggtg 1080
tccgccaccc gggcgaggaa gcggccctcg atggtgccgt agccgtagac gaactggaag 1140
acggccgaga tggcgccggt caggcggtgc gcgggcagcc cgctgcggcg cacgacgttc 1200
tgcaccgcgc gggagaaggc cagcgagtgc gggccgatgt tgaggtaggt gccgaccagc 1260
cgggacgacc aggggtggcg caccagcagc gcccggttct cccgggccag ggcccgcagt 1320
tcctcgcgcc agtcgagccc ggcgtccggg tccgggtggc gcagctcgcc gaagacggcg 1380
tccagggcga gctcgagcaa ctggtccttg gtgtcgacgt accagtacac ggacatcgcg 1440
gtgacgttca gctcggcggc caggcggcgc atcgagaacc ccgtcaggcc ctccgtgtcc 1500
agcagccgga cggtgacccc ggtgatccgg tcccggtcga gcccggacgg ctgcccccca 1560
cggcgaccgc cgcgccgccc ctcccccgac agccacacgc tgtcccgcgg cccctcccgc 1620
cctgccttcg ccatgcgcac ctctcctcga ctcataccgg tagcgctagc gatgagctct 1680
ggtagtagac tagtggcccc cattatatac cctctagagc atatgtctca caaagagggc 1740
tttgtgtagt ctcacaaaga gggctttgtg tagtctcaca aagagggctt tgtgtagggc 1800
gcgcccccgt agcttggcgt aatcacatgt ccgtcgtttt acaacgtcgt gactgggaaa 1860
accctggcct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 1920
taaaacgacg gacatgtgaa atagcgctgt acagcgtatg ggaatctctt gtacggtgta 1980
cgagtatctt cccgtacacc gtacggcgcg ccagttaata attaactagt taataattaa 2040
ctagttaata attaactcat atgctctaga gggtatataa tgggggccac tagtctacta 2100
ccagagctca tcgctagcgc tggatccgcc accatggtga gcaagggcga ggaggataac 2160
atggccatca tcaaggagtt catgcgcttc aaggtgcaca tggagggctc cgtgaacggc 2220
cacgagttcg agatcgaggg cgagggcgag ggccgcccct acgagggcac ccagaccgcc 2280
aagctgaagg tgaccaaggg tggccccctg cccttcgcct gggacatcct gtcccctcag 2340
ttcatgtacg gctccaaggc ctacgtgaag caccccgccg acatccccga ctacttgaag 2400
ctgtccttcc ccgagggctt caagtgggag cgcgtgatga acttcgagga cggcggcgtg 2460
gtgaccgtga cccaggactc ctccctccag gacggcgagt tcatctacaa ggtgaagctg 2520
cgcggcacca acttcccctc cgacggcccc gtaatgcaga agaagaccat gggctgggag 2580
gcctcctccg agcggatgta ccccgaggac ggcgccctga agggcgagat caagcagcgg 2640
ctgaagctga aggacggcgg ccactacgac gctgaggtca agaccaccta caaggccaag 2700
aagcccgtgc agctgcccgg cgcctacaac gtcaacatca agttggacat cacctcccac 2760
aacgaggact acaccatcgt ggaacagtac gaacgcgccg agggccgcca ctccaccggc 2820
ggcatggacg agctgtacaa gtagggtacc caaacaccat tgtcacactc caagatctac 2880
gggtggcatc cctgtgaccc ctccccagtg cctctcctgg ccctggaagt tgccactcca 2940
gtgcccacca gccttgtcct aataaaatta agttgcatca ttttgtctga ctaggtgtcc 3000
ttctataata ttatggggtg gaggggggtg gtatggagca aggggcaagt tgggaagaca 3060
acctgtaggg cctgcggggt ctattgggaa ccaagctgga gtgcagtggc acaatcttgg 3120
ctcactgcaa tctccgcctc ctgggttcaa gcgattctcc tgcctcagcc tcccgagttg 3180
ttgggattcc aggcatgcat gaccaggctc agctaatttt tgtttttttg gtagagacgg 3240
ggtttcacca tattggccag gctggtctcc aactcctaat ctcaggtgat ctacccacct 3300
tggcctccca aattgctggg attacaggcg tgaaccactg ctcccttccc tgtcctt 3357
<210> 303
<211> 3778
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 303
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcct aggcttcgaa tcgatgaatt 480
cgaagcttct acccaccgta ctcgtcaatt ccaagggcat cggtaaacat ctgctcaaac 540
tcgaagtcgg ccatatccag agcgccgtag ggggcggagt cgtggggggt aaatcccgga 600
cccggggaat ccccgtcccc caacatgtcc agatcgaaat cgtctagcgc gtcggcatgc 660
gccatcgcca cgtcctcgcc gtctaagtgg agctcgtccc ccaggctgac atcggtcggg 720
ggggccgtcg acagtctgcg cgtgtgtccc gcggggagaa aggacaggcg cggagccgcc 780
agccccgcct cttcgggggc gtcgtcgtcc gggagatcga gcaggccctc gatggtagac 840
ccgtaattgt ttttcgtacg cgcgcggctg tacgcggagg cctgttcgac catcgcgtcg 900
atgcccgcga cgagcaggtc gagggcgaac tcgaagtccc ggtccagcat ctccgccacg 960
gtgtcgccgc cccgggccgc catgatgtcc tgcgcgtcct cgatgacgcc cgcggtgtcc 1020
ggcacctcgg tcaccgcggt catcgagtcc tggaagtact cctccggact cagcccggtg 1080
tccgccaccc gggcgaggaa gcggccctcg atggtgccgt agccgtagac gaactggaag 1140
acggccgaga tggcgccggt caggcggtgc gcgggcagcc cgctgcggcg cacgacgttc 1200
tgcaccgcgc gggagaaggc cagcgagtgc gggccgatgt tgaggtaggt gccgaccagc 1260
cgggacgacc aggggtggcg caccagcagc gcccggttct cccgggccag ggcccgcagt 1320
tcctcgcgcc agtcgagccc ggcgtccggg tccgggtggc gcagctcgcc gaagacggcg 1380
tccagggcga gctcgagcaa ctggtccttg gtgtcgacgt accagtacac ggacatcgcg 1440
gtgacgttca gctcggcggc caggcggcgc atcgagaacc ccgtcaggcc ctccgtgtcc 1500
agcagccgga cggtgacccc ggtgatccgg tcccggtcga gcccggacgg ctgcccccca 1560
cggcgaccgc cgcgccgccc ctcccccgac agccacacgc tgtcccgcgg cccctcccgc 1620
cctgccttcg ccatgcgcac ctctcctcga ctcataccgg tagcgctagc gatgagctct 1680
ggtagtagac tagtggcccc cattatatac cctctagagc atatgtctca caaagagggc 1740
tttgtgtagt ctcacaaaga gggctttgtg tagtctcaca aagagggctt tgtgtagggc 1800
gcgcccccgt agcttggcgt aatcacatgt ccgtcgtttt acaacgtcgt gactgggaaa 1860
accctggcct gcaaggcgat taagttgggt aacgccaggg ttttcccagt cacgacgttg 1920
taaaacgacg gacatgtgaa atagcgctgt acagcgtatg ggaatctctt gtacggtgta 1980
cgagtatctt cccgtacacc gtacggcgcg ccagttaata attaactagt taataattaa 2040
ctagttaata attaactcat atgctctaga gggtatataa tgggggccac tagtctacta 2100
ccagagctca tcgctagcgc tggatcccgc caccatggct tcgtacccct gccatcaaca 2160
cgcgtctgcg ttcgaccagg ctgcgcgttc tcgcggccat agcaaccgac gtacggcgtt 2220
gcgccctcgc cggcagcaag aagccacgga agtccgcctg gagcagaaaa tgcccacgct 2280
actgcgggtt tatatagacg gtcctcacgg gatggggaaa accaccacca cgcaactgct 2340
ggtggccctg ggttcgcgcg acgatatcgt ctacgtaccc gagccgatga cttactggca 2400
ggtgctgggg gcttccgaga caatcgcgaa catctacacc acacaacacc gcctcgacca 2460
gggtgagata tcggccgggg acgcggcggt ggtaatgaca agcgcccaga taacaatggg 2520
catgccttat gccgtgaccg acgccgttct ggctcctcat atcggggggg aggctgggag 2580
ctcacatgcc ccgcccccgg ccctcaccct catcttcgac cgccatccca tcgccgccct 2640
cctgtgctac ccggccgcgc gataccttat gggcagcatg accccccagg ccgtgctggc 2700
gttcgtggcc ctcatcccgc cgaccttgcc cggcacaaac atcgtgttgg gggcccttcc 2760
ggaggacaga cacatcgacc gcctggccaa acgccagcgc cccggcgagc ggcttgacct 2820
ggctatgctg gccgcgattc gccgcgttta cgggctgctt gccaatacgg tgcggtatct 2880
gcagggcggc gggtcgtggc gggaggattg gggacagctt tcggggacgg ccgtgccgcc 2940
ccagggtgcc gagccccaga gcaacgcggg cccacgaccc catatcgggg acacgttatt 3000
taccctgttt cgggcccccg agttgctggc ccccaacggc gacctgtaca acgtgtttgc 3060
ctgggccttg gacgtcttgg ccaaacgcct ccgtcccatg cacgtcttta tcctggatta 3120
cgaccaatcg cccgccggct gccgggacgc cctgctgcaa cttacctccg ggatggtcca 3180
gacccacgtc accacccccg gctccatacc gacgatctgc gacctggcgc gcacgtttgc 3240
ccgggagatg ggggaggcta actgaggtac ccaaacacca ttgtcacact ccaagatcta 3300
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 3360
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 3420
cttctataat attatggggt ggaggggggt ggtatggagc aaggggcaag ttgggaagac 3480
aacctgtagg gcctgcgggg tctattggga accaagctgg agtgcagtgg cacaatcttg 3540
gctcactgca atctccgcct cctgggttca agcgattctc ctgcctcagc ctcccgagtt 3600
gttgggattc caggcatgca tgaccaggct cagctaattt ttgttttttt ggtagagacg 3660
gggtttcacc atattggcca ggctggtctc caactcctaa tctcaggtga tctacccacc 3720
ttggcctccc aaattgctgg gattacaggc gtgaaccact gctcccttcc ctgtcctt 3778
<210> 304
<211> 3926
<212> DNA
<213> 305
<400> 304
cagtattgtg tatataaggc cagggcaaag aggagcaggt tttaaagtga aaggcaggca 60
ggtgttgggg aggcagttac cggggcaacg ggaacagggc gtttcggagg tggttgccat 120
ggggacctgg atgctgacga aggctcgatt attgaagcat ttatcagggt tattgtctca 180
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 240
ttccccgaaa agtgccacct gacgtcggca gtgaaaaaaa tgctttattt gtgaaatttg 300
tgatgctatt gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa 360
ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt aaagcaagta 420
aaacctctac aaatgtggta tggctgatta tgatcctcct aggtgaggta gtaggttgta 480
tggtttgagg tagtaggttg tatggtttga ggtagtaggt tgtatggttt gaggtagtag 540
gttgtatggt tatcgatgaa ttcgaagctt ctacccaccg tactcgtcaa ttccaagggc 600
atcggtaaac atctgctcaa actcgaagtc ggccatatcc agagcgccgt agggggcgga 660
gtcgtggggg gtaaatcccg gacccgggga atccccgtcc cccaacatgt ccagatcgaa 720
atcgtctagc gcgtcggcat gcgccatcgc cacgtcctcg ccgtctaagt ggagctcgtc 780
ccccaggctg acatcggtcg ggggggccgt cgacagtctg cgcgtgtgtc ccgcggggag 840
aaaggacagg cgcggagccg ccagccccgc ctcttcgggg gcgtcgtcgt ccgggagatc 900
gagcaggccc tcgatggtag acccgtaatt gtttttcgta cgcgcgcggc tgtacgcgga 960
ggcctgttcg accatcgcgt cgatgcccgc gacgagcagg tcgagggcga actcgaagtc 1020
ccggtccagc atctccgcca cggtgtcgcc gccccgggcc gccatgatgt cctgcgcgtc 1080
ctcgatgacg cccgcggtgt ccggcacctc ggtcaccgcg gtcatcgagt cctggaagta 1140
ctcctccgga ctcagcccgg tgtccgccac ccgggcgagg aagcggccct cgatggtgcc 1200
gtagccgtag acgaactgga agacggccga gatggcgccg gtcaggcggt gcgcgggcag 1260
cccgctgcgg cgcacgacgt tctgcaccgc gcgggagaag gccagcgagt gcgggccgat 1320
gttgaggtag gtgccgacca gccgggacga ccaggggtgg cgcaccagca gcgcccggtt 1380
ctcccgggcc agggcccgca gttcctcgcg ccagtcgagc ccggcgtccg ggtccgggtg 1440
gcgcagctcg ccgaagacgg cgtccagggc gagctcgagc aactggtcct tggtgtcgac 1500
gtaccagtac acggacatcg cggtgacgtt cagctcggcg gccaggcggc gcatcgagaa 1560
ccccgtcagg ccctccgtgt ccagcagccg gacggtgacc ccggtgatcc ggtcccggtc 1620
gagcccggac ggctgccccc cacggcgacc gccgcgccgc ccctcccccg acagccacac 1680
gctgtcccgc ggcccctccc gccctgcctt cgccatgcgc acctctcctc gactcatacc 1740
ggtagcgcta gcgatgagct ctggtagtag actagtggcc cccattatat accctctaga 1800
gcatatgtct cacaaagagg gctttgtgta gtctcacaaa gagggctttg tgtagtctca 1860
caaagagggc tttgtgtagg gcgcgccccc gtagcttggc gtaatcacat gtccgtcgtt 1920
ttacaacgtc gtgactggga aaaccctggc ctgcaaggcg attaagttgg gtaacgccag 1980
ggttttccca gtcacgacgt tgtaaaacga cggacatgtg aaatagcgct gtacagcgta 2040
tgggaatctc ttgtacggtg tacgagtatc ttcccgtaca ccgtacggcg cgccagttaa 2100
taattaacta gttaataatt aactagttaa taattaactc atatgctcta gagggtatat 2160
aatgggggcc actagtctac taccagagct catcgctagc gctggatccc gccaccatgg 2220
cttcgtaccc ctgccatcaa cacgcgtctg cgttcgacca ggctgcgcgt tctcgcggcc 2280
atagcaaccg acgtacggcg ttgcgccctc gccggcagca agaagccacg gaagtccgcc 2340
tggagcagaa aatgcccacg ctactgcggg tttatataga cggtcctcac gggatgggga 2400
aaaccaccac cacgcaactg ctggtggccc tgggttcgcg cgacgatatc gtctacgtac 2460
ccgagccgat gacttactgg caggtgctgg gggcttccga gacaatcgcg aacatctaca 2520
ccacacaaca ccgcctcgac cagggtgaga tatcggccgg ggacgcggcg gtggtaatga 2580
caagcgccca gataacaatg ggcatgcctt atgccgtgac cgacgccgtt ctggctcctc 2640
atatcggggg ggaggctggg agctcacatg ccccgccccc ggccctcacc ctcatcttcg 2700
accgccatcc catcgccgcc ctcctgtgct acccggccgc gcgatacctt atgggcagca 2760
tgacccccca ggccgtgctg gcgttcgtgg ccctcatccc gccgaccttg cccggcacaa 2820
acatcgtgtt gggggccctt ccggaggaca gacacatcga ccgcctggcc aaacgccagc 2880
gccccggcga gcggcttgac ctggctatgc tggccgcgat tcgccgcgtt tacgggctgc 2940
ttgccaatac ggtgcggtat ctgcagggcg gcgggtcgtg gcgggaggat tggggacagc 3000
tttcggggac ggccgtgccg ccccagggtg ccgagcccca gagcaacgcg ggcccacgac 3060
cccatatcgg ggacacgtta tttaccctgt ttcgggcccc cgagttgctg gcccccaacg 3120
gcgacctgta caacgtgttt gcctgggcct tggacgtctt ggccaaacgc ctccgtccca 3180
tgcacgtctt tatcctggat tacgaccaat cgcccgccgg ctgccgggac gccctgctgc 3240
aacttacctc cgggatggtc cagacccacg tcaccacccc cggctccata ccgacgatct 3300
gcgacctggc gcgcacgttt gcccgggaga tgggggaggc taactgaggt accaaccata 3360
caacctacta cctcaaacca tacaacctac tacctcaaac catacaacct actacctcaa 3420
accatacaac ctactacctc aagatctacg ggtggcatcc ctgtgacccc tccccagtgc 3480
ctctcctggc cctggaagtt gccactccag tgcccaccag ccttgtccta ataaaattaa 3540
gttgcatcat tttgtctgac taggtgtcct tctataatat tatggggtgg aggggggtgg 3600
tatggagcaa ggggcaagtt gggaagacaa cctgtagggc ctgcggggtc tattgggaac 3660
caagctggag tgcagtggca caatcttggc tcactgcaat ctccgcctcc tgggttcaag 3720
cgattctcct gcctcagcct cccgagttgt tgggattcca ggcatgcatg accaggctca 3780
gctaattttt gtttttttgg tagagacggg gtttcaccat attggccagg ctggtctcca 3840
actcctaatc tcaggtgatc tacccacctt ggcctcccaa attgctggga ttacaggcgt 3900
gaaccactgc tcccttccct gtcctt 3926
<210> 305
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 305
guuuacaauu gacuaacacu cca 23
<210> 306
<211> 23
<212> RNA
<213> Artificial Sequence
<220>
<223> Synthetic
<400> 306
uggaguguga caaugguguu ugu 23
Claims (117)
- 하기를 포함하는 인접 폴리핵산 분자로서:
a) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 제1 RNA를 코딩하며, 여기서 제1 RNA는 (i) 출력의 핵산 서열; 및 (ii) 표 1에 열거된 miRNA에 대한 표적 부위 또는 이들의 조합을 포함하는 것인 제1 카세트; 및
b) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트;
여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인
인접 폴리핵산 분자. - 제1항에 있어서, 제1 RNA가 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제1항 또는 제2항에 있어서, 제1 RNA가 3' UTR을 포함하며, 여기서 3' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 제1 RNA가 5' UTR을 포함하며, 여기서 5' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 제2 RNA가 표 1에 열거된 마이크로RNA에 대한 표적 부위 또는 이들의 조합을 추가로 포함하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 제2 RNA가 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 추가로 포함하는 것인 인접 폴리핵산 분자.
- 제6항에 있어서, 제2 RNA가 3' UTR을 포함하며, 여기서 3' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제6항 또는 제7항에 있어서, 제2 RNA가 5' UTR을 포함하며, 여기서 5' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제6항 내지 제8항 중 어느 한 항에 있어서, 제1 카세트의 적어도 하나의 miRNA 표적 부위 및 제2 카세트의 적어도 하나의 miRNA 표적 부위가 동일한 핵산 서열이거나 또는 동일한 miRNA에 의해 조절되는 상이한 서열인 인접 폴리핵산 분자.
- 제6항 내지 제9항 중 어느 한 항에 있어서, 제1 RNA 및 제2 RNA가 각각 let-7c 표적 부위를 포함하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 전사활성인자 반응 요소가 표 3에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제10항 중 어느 한 항에 있어서, 제2 RNA의 발현이 전사 인자 반응 요소에 작동가능하게 연결된 것인 인접 폴리핵산 분자.
- 제12항에 있어서, 전사 인자 반응 요소가 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 전사활성인자가 독립적으로 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인 인접 폴리핵산 분자.
- 제1항 내지 제13항 중 어느 한 항에 있어서, 제1 RNA의 발현이 전사 인자 반응 요소에 작동가능하게 연결된 것인 인접 폴리핵산 분자.
- 제15항에 있어서, 전사 인자 반응 요소가 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제12항, 제13항 및 제16항 중 어느 한 항에 있어서, 전사활성인자가 전사 인자 반응 요소에 결합된 전사 인자의 존재 하에서만 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인 인접 폴리핵산 분자.
- 제1항 내지 제17항 중 어느 한 항에 있어서, 제1 카세트 및/또는 제2 카세트가 프로모터 요소를 포함하는 것인 인접 폴리핵산 분자.
- 제18항에 있어서, 프로모터 요소가 표 5에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제18항에 있어서, 프로모터 요소가 포유동물 프로모터 또는 프로모터 단편을 포함하는 것인 인접 폴리핵산 분자.
- 제15항 내지 제17항 중 어느 한 항에 있어서,
제1 카세트가 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력을 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하고;
제2 카세트가 5'에서 3'으로: (i) 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하는 것인
인접 폴리핵산 분자. - 제21항에 있어서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소가 동일한 핵산 서열로 이루어진 것인 인접 폴리핵산 분자.
- 제21항에 있어서, 제1 카세트의 전사 인자 반응 요소 및 제2 카세트의 전사 인자 반응 요소가 상이한 핵산 서열로 이루어진 것인 인접 폴리핵산 분자.
- 제15항 내지 제23항 중 어느 한 항에 있어서, 제1 카세트 및/또는 제2 카세트가 2개 이상의 전사 인자 반응 요소를 포함하는 것인 인접 폴리핵산 분자.
- 제24항에 있어서, 제1 카세트 및/또는 제2 카세트가 2개의 상이한 전사 인자 반응 요소를 포함하는 것인 인접 폴리핵산 분자.
- 제21항 내지 제25항 중 어느 한 항에 있어서, 제1 카세트의 상류 조절 구성요소가 프로모터 요소를 포함하는 것인 인접 폴리핵산 분자.
- 제26항에 있어서, 프로모터 요소가 포유동물 프로모터 또는 프로모터 단편을 포함하는 것인 인접 폴리핵산 분자.
- 제21항 내지 제27항 중 어느 한 항에 있어서, 제2 카세트의 상류 조절 구성요소가 프로모터 요소를 포함하는 것인 인접 폴리핵산 분자.
- 제28항에 있어서, 프로모터 요소가 포유동물 프로모터 또는 프로모터 단편을 포함하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 제1 카세트 및 제2 카세트가 수렴형 배향으로 존재하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 제1 카세트 및 제2 카세트가 발산형 배향으로 존재하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제29항 중 어느 한 항에 있어서, 제1 카세트 및 제2 카세트가 머리-대-꼬리 배향으로 존재하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제32항 중 어느 한 항에 있어서, 제1 카세트 및/또는 제2 카세트가 인슐레이터에 의해 플랭킹되는 것인 인접 폴리핵산 분자.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 제2 카세트의 전사활성인자가 tTA, rtTA, PIT-RelA, PIT-VP16, ET-VP16, ET-RelA, NarLc-VP16, 또는 NarLc-RelA인 인접 폴리핵산 분자.
- 제1항 내지 제33항 중 어느 한 항에 있어서, 제2 카세트의 전사활성인자가 표 2에 열거된 핵산 서열을 포함하는 것인 인접 폴리핵산 분자.
- 제1항 내지 제35항 중 어느 한 항에 있어서, 출력이 단백질 또는 RNA 분자인 인접 폴리핵산 분자.
- 제1항 내지 제36항 중 어느 한 항에 있어서, 출력이 치료제인 인접 폴리핵산 분자.
- 제36항 또는 제37항에 있어서, 출력이 형광 단백질, 세포독소, 전구약물 활성화를 촉매하는 효소, 면역조정 단백질 및/또는 RNA, DNA-변형 인자, 세포-표면 수용체, 유전자 발현-조절 인자, 키나제, 후성적 변형인자, 및/또는 벡터 복제에 필요한 인자, 및/또는 병원체의 항원 폴리펩티드를 코딩하는 서열인 인접 폴리핵산 분자.
- 제36항 또는 제37항에 있어서, 출력이 인간 심플렉스 헤르페스 바이러스 1로부터의 티미딘 키나제 효소 (HSV-TK)인 인접 폴리핵산 분자.
- 제38항에 있어서, 면역조정 단백질 및/또는 RNA가 시토카인 또는 콜로니 자극 인자인 인접 폴리핵산 분자.
- 제38항에 있어서, DNA-변형 인자가 유전자 결함을 보정하도록 되어 있는 단백질을 코딩하는 유전자, DNA-변형 효소, 및/또는 DNA-변형 시스템의 구성요소인 인접 폴리핵산 분자.
- 제41항에 있어서, DNA-변형 효소가 부위-특이적 레콤비나제, 귀소 엔도뉴클레아제, 또는 CRISPR/Cas DNA 변형 시스템의 단백질 구성요소인 인접 폴리핵산 분자.
- 제38항에 있어서, 유전자 발현-조절 인자가 유전자 발현을 조절할 수 있는 단백질, 또는 유전자 발현을 조절할 수 있는 다중-구성요소 시스템의 구성요소인 인접 폴리핵산 분자.
- 표 6에 열거된 핵산 서열을 포함하는 인접 폴리핵산 분자.
- 인접 폴리핵산 분자로서, 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 (i) 출력의 핵산 서열; (ii) 전사활성인자의 핵산 서열; 및 (iii) 표 1에 열거된 miRNA에 대한 표적 부위 또는 이들의 조합을 포함하며; 여기서 전사활성인자는, 단백질로서 발현되는 경우, 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인 인접 폴리핵산 분자.
- 제45항에 있어서, 제1 RNA가 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제45항 또는 제46항에 있어서, RNA가 출력 및 전사활성인자의 핵산 서열들을 분리하는 폴리시스트론성 발현 요소의 핵산 서열을 추가로 포함하는 것인 인접 폴리핵산 분자.
- 제45항 내지 제47항 중 어느 한 항에 있어서, RNA가 3' UTR을 포함하며, 여기서 3' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제45항 내지 제48항 중 어느 한 항에 있어서, RNA가 5' UTR을 포함하며, 여기서 5' UTR이 let-7c 표적 부위, let-7a 표적 부위, let-7b 표적 부위, let-7d 표적 부위, let-7e 표적 부위, let-7f 표적 부위, let-7g 표적 부위, let-7i 표적 부위, miR-22 표적 부위, miR-26b 표적 부위, miR-122 표적 부위, miR-208a 표적 부위, miR-208b 표적 부위, miR-1 표적 부위, miR-217 표적 부위, miR-216a 표적 부위, 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제45항 내지 제49항 중 어느 한 항에 있어서, RNA가 let-7c 표적 부위를 포함하는 것인 인접 폴리핵산 분자.
- 제45항 내지 제50항 중 어느 한 항에 있어서, 전사활성인자 반응 요소가 표 3에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제45항 내지 제50항 중 어느 한 항에 있어서, 전사활성인자가 독립적으로 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인 인접 폴리핵산 분자.
- 제45항 내지 제52항 중 어느 한 항에 있어서, RNA의 발현이 전사활성인자 반응 요소 및 전사 인자 반응 요소에 작동가능하게 연결된 것인 인접 폴리핵산 분자.
- 제53항에 있어서, 전사 인자 반응 요소가 표 4에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제53항에 있어서, 전사활성인자가 전사 인자 반응 요소에 결합된 전사 인자의 존재 하에서만 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인 인접 폴리핵산 분자.
- 제45항 내지 제55항 중 어느 한 항에 있어서, 카세트가 프로모터 요소를 포함하는 것인 인접 폴리핵산 분자.
- 제56항에 있어서, 프로모터 요소가 표 5에 열거된 핵산 서열 또는 이들의 조합을 포함하는 것인 인접 폴리핵산 분자.
- 제56항에 있어서, 프로모터 요소가 포유동물 프로모터 또는 프로모터 단편을 포함하는 것인 인접 폴리핵산 분자.
- 제53항 또는 제55항에 있어서, 인접 폴리핵산 분자가 5'에서 3'으로: (i) 전사활성인자 반응 요소 및 전사 인자 반응 요소를 포함하는 상류 조절 구성요소; (ii) 출력 및 전사활성인자를 코딩하는 핵산 서열; 및 (iii) let-7c 표적 부위를 포함하는 하류 구성요소를 포함하는 것인 인접 폴리핵산 분자.
- 제59항에 있어서, (i)에서의 상류 조절 구성요소가 프로모터 요소를 포함하는 것인 인접 폴리핵산 분자.
- 제60항에 있어서, 프로모터 요소가 포유동물 프로모터 또는 프로모터 단편을 포함하는 것인 인접 폴리핵산 분자.
- 제45항 내지 제61항 중 어느 한 항에 있어서, 적어도 하나의 카세트의 전사활성인자가 tTA, rtTA, PIT-RelA, PIT-VP16, ET-VP16, ET-RelA, NarLc-VP16, 또는 NarLc-RelA인 인접 폴리핵산 분자.
- 제45항 내지 제61항 중 어느 한 항에 있어서, 제2 카세트의 전사활성인자가 표 2에 열거된 핵산 서열을 포함하는 것인 인접 폴리핵산 분자.
- 제45항 내지 제62항 중 어느 한 항에 있어서, 출력이 단백질 또는 RNA 분자인 인접 폴리핵산 분자.
- 제45항 내지 제64항 중 어느 한 항에 있어서, 출력이 치료 단백질 또는 RNA 분자인 인접 폴리핵산 분자.
- 제64항 또는 제65항에 있어서, 출력이 형광 단백질, 세포독소, 전구약물 활성화를 촉매하는 효소, 면역조정 단백질 및/또는 RNA, DNA-변형 인자, 세포-표면 수용체, 유전자 발현-조절 인자, 키나제, 후성적 변형인자, 및/또는 벡터 복제에 필요한 인자, 및/또는 병원체의 항원 폴리펩티드를 코딩하는 서열인 인접 폴리핵산 분자.
- 제64항 또는 제65항에 있어서, 출력이 인간 심플렉스 헤르페스 바이러스 1로부터의 티미딘 키나제 효소 (HSV-TK)인 인접 폴리핵산 분자.
- 제66항에 있어서, 면역조정 단백질 및/또는 RNA가 시토카인 또는 콜로니 자극 인자인 인접 폴리핵산 분자.
- 제66항에 있어서, DNA-변형 인자가 유전자 결함을 보정하도록 되어 있는 단백질을 코딩하는 유전자, DNA-변형 효소, 및/또는 DNA-변형 시스템의 구성요소인 인접 폴리핵산 분자.
- 제69항에 있어서, DNA-변형 효소가 부위-특이적 레콤비나제, 귀소 엔도뉴클레아제, 또는 CRISPR/Cas 시스템의 단백질 구성요소인 인접 폴리핵산 분자.
- 제66항에 있어서, 유전자 발현-조절 인자가 유전자 발현을 조절할 수 있는 단백질, 또는 유전자 발현을 조절할 수 있는 다중-구성요소 시스템의 구성요소인 인접 폴리핵산 분자.
- 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자를 포함하는 벡터.
- 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자를 포함하는 조작된 바이러스 게놈.
- 제73항에 있어서, 바이러스 게놈이 아데노-연관 바이러스 (AAV) 게놈, 렌티바이러스 게놈, 아데노바이러스 게놈, 헤르페스 심플렉스 바이러스 (HSV) 게놈, 백시니아 바이러스 게놈, 폭스바이러스 게놈, 뉴캐슬병 바이러스 (NDV) 게놈, 콕사키바이러스 게놈, 레오바이러스 게놈, 홍역 바이러스 게놈, 소포성 구내염 바이러스 (VSV) 게놈, 파르보바이러스 게놈, 세네카 밸리 바이러스 게놈, 마라바 바이러스 게놈, 또는 감기 바이러스 게놈인 조작된 바이러스 게놈.
- 제73항 또는 제74항의 조작된 바이러스 게놈을 포함하는 비리온.
- 제75항에 있어서, AAV-DJ, AAV8, AAV6, 또는 AAV-B1 캡시드를 추가로 포함하는 비리온.
- 세포의 집단을 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온과 접촉시키는 것을 포함하는 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법으로서, 여기서 세포의 집단은 적어도 하나의 표적 세포 유형 및 하나 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준 및/또는 활성에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준 및/또는 활성은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; 여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절되는 것인 방법.
- 제77항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함하는 것인 방법.
- 제77항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 이 프로모터 단편을 추가로 포함하는 것인 방법.
- 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온을 질환 또는 병태와 연관된 하나 이상의 징후 또는 증상을 나타내는 대상체에게 투여하는 것을 포함하는 질환 또는 병태를 진단하는 방법으로서, 여기서 출력의 수준은 질환 및 또는 병태의 존재 또는 부재를 지시하는 것인 방법.
- 제80항에 있어서, 질환이 암인 방법.
- 제81항에 있어서, 암이 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종인 방법.
- 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온을 질환 또는 병태를 갖는 대상체에게 투여하는 것을 포함하는 질환 또는 병태를 치료하는 방법.
- 제83항에 있어서, 전구약물을 투여하는 것을 추가로 포함하며, 임의적으로 여기서 전구약물이 간시클로비르이고, 임의적으로 여기서 인접 폴리핵산 분자가 표 6에 열거된 핵산 서열을 포함하는 것인 방법.
- 제83항에 있어서, 질환이 암인 방법.
- 제85항에 있어서, 암이 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종인 방법.
- 세포의 집단을 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온과 접촉시키는 것을 포함하는 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법에 사용하기 위한 조성물로서, 여기서 세포의 집단은 적어도 하나의 표적 세포 유형 및 하나 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준 및/또는 활성에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준 및/또는 활성은 표적 세포의 각각에 비해 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고; 여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절되는 것인 조성물.
- 제87항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함하는 것인 방법.
- 제87항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 이 프로모터 단편을 추가로 포함하는 것인 방법.
- 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온을 질환 또는 병태와 연관된 하나 이상의 징후 또는 증상을 나타내는 대상체에게 투여하는 것을 포함하는 질환 또는 병태를 진단하는 방법에 사용하기 위한 조성물로서, 여기서 출력의 수준은 질환 및 또는 병태의 존재 또는 부재를 지시하는 것인 조성물.
- 제90항에 있어서, 질환이 암인 사용하기 위한 조성물.
- 제91항에 있어서, 암이 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종인 사용하기 위한 조성물.
- 제1항 내지 제44항 및 제45항 내지 제71항 중 어느 한 항의 인접 폴리핵산 분자, 제72항의 벡터, 제73항 또는 제74항의 조작된 바이러스 게놈, 또는 제75항 또는 제76항의 비리온을 질환 또는 병태를 갖는 대상체에게 투여하는 것을 포함하는 질환 또는 병태를 치료하는 방법에 사용하기 위한 조성물.
- 제93항에 있어서, 전구약물을 투여하는 것을 추가로 포함하며, 임의적으로 여기서 전구약물이 간시클로비르이고, 임의적으로 여기서 인접 폴리핵산 분자가 표 6에 열거된 핵산 서열을 포함하는 것인 방법.
- 제93항에 있어서, 질환이 암인 사용하기 위한 조성물.
- 제95항에 있어서, 암이 간세포 암종 (HCC), 전이성 결장직장암, 간에서의 전이성 종양, 유방암, 폐암, 망막모세포종, 및 교모세포종인 사용하기 위한 조성물.
- 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하는 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법으로서, 여기서:
a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 비-표적 세포의 적어도 하위세트, 예컨대 적어도 2개 및 임의적으로 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고;
b) 인접 폴리핵산 분자는 하기를 포함하고:
(i) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 RNA를 코딩하며, 여기서 제1 RNA는 출력의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하는 것인 제1 카세트; 및
(ii) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트;
여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키고;
여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절되는 것인
방법. - 제97항에 있어서, 인접 폴리핵산 분자가 표 6에 열거된 핵산 서열을 포함하는 것인 방법.
- 세포의 집단을 인접 폴리핵산 분자 또는 상기 인접 폴리핵산 분자를 포함하는 조성물과 접촉시키는 것을 포함하는 세포의 집단에서 세포-특이적 이벤트를 자극하는 방법으로서, 여기서:
a) 세포의 집단은 적어도 하나의 표적 세포 유형 및 2개 이상의 비-표적 세포 유형을 포함하며, 여기서 표적 세포 유형(들) 및 비-표적 세포 유형은 하나 이상의 내인성 miRNA의 수준에 있어서 상이하며, 그에 따라 하나 이상의 내인성 miRNA의 수준은 표적 세포의 각각에 비해 비-표적 세포의 적어도 하위세트, 예컨대 적어도 2개 및 임의적으로 2개 이상의 비-표적 세포의 각각에서 적어도 2배 더 높고;
b) 인접 폴리핵산 분자는 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 mRNA를 코딩하는 카세트를 포함하며, 여기서 RNA는 출력의 핵산 서열; 전사활성인자의 핵산 서열; 및 하나 이상의 내인성 miRNA에 상응하는 하나 이상의 miRNA 표적 부위를 포함하고;
여기서 전사활성인자는, 단백질로서 발현되는 경우, 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키고;
여기서 세포-특이적 이벤트는 세포의 집단의 세포에서의 출력의 발현 수준에 의해 조절되는 것인
방법. - 제97항 또는 제99항에 있어서, 인접 폴리핵산 분자를 포함하는 조성물이 인접 폴리핵산을 포함하는 벡터, 인접 폴리핵산을 포함하는 조작된 바이러스 게놈, 또는 폴리핵산을 포함하는 비리온을 포함하는 것인 방법.
- 제97항 내지 제100항 중 어느 한 항에 있어서, 내인성 miRNA가 표 1에 열거된 miRNA 또는 표 1에 열거된 miRNA의 조합으로부터 선택되는 것인 방법.
- 제97항 내지 제101항 중 어느 한 항에 있어서, 내인성 miRNA가 let-7c, let-7a, let-7b, let-7d, let-7e, let-7f, let-7g, let-7i, miR-22, miR-26b, miR-122, miR-208a, miR-208b, miR-1, miR-217, miR-216a, 또는 이들의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
- 제97항 내지 제101항 중 어느 한 항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 내인성 전사 인자의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 내인성 전사 인자에 상응하는 전사 인자 반응 요소를 추가로 포함하는 것인 방법.
- 제97항 내지 제101항 중 어느 한 항에 있어서, 표적 세포의 적어도 하위세트 및 비-표적 세포의 적어도 하위세트가 프로모터 단편의 수준 또는 활성에 있어서 상이하며, 여기서 인접 핵산 분자가 이 프로모터 단편을 추가로 포함하는 것인 방법.
- 제97항 내지 제103항 중 어느 한 항에 있어서, 표적 세포가 종양 세포이고, 세포-특이적 이벤트가 종양 세포 사멸인 방법.
- 제105항에 있어서, 종양 세포 사멸이 활성화 수용체 리간드, 특이적 항원, 자극 시토카인 또는 이들의 임의의 조합의 발현을 통한 면역 표적화에 의해 매개되는 것인 방법.
- 제97항 내지 제103항 중 어느 한 항에 있어서, 표적 세포가 노화 세포이고, 세포-특이적 이벤트가 노화 세포 사멸인 방법.
- 제97항 내지 제107항 중 어느 한 항에 있어서, 세포의 집단을 출력에 의해 치료제 또는 독성 화합물로 대사되는 전구약물 또는 비-독성 전구체 화합물과 접촉시키는 것을 추가로 포함하는 방법.
- 제97항 내지 제103항 중 어느 한 항에 있어서, 출력 발현이, 비-표적 세포가 출력 발현의 결여로 인하여 그리고 무관하며 비특이적인 세포 사멸-유도 작용제의 존재 하에서 제거되는 동안, 표적 세포 집단의 생존을 보장하는 것인 방법.
- 제97항 내지 제103항 중 어느 한 항에 있어서, 표적 세포가 관심의 특정한 표현형을 포함하며, 그에 따라 출력 발현이 이 특정한 표현형의 세포에 제한되는 것인 방법.
- 제97항 내지 제102항 중 어느 한 항에 있어서, 표적 세포가 선택되는 세포 유형이고, 세포-특이적 이벤트가 자연적으로는 선택되는 세포 유형에서는 부재하거나 불활성인 유전자의 발현을 통한 신규 기능의 코딩인 방법.
- 제97항 내지 제111항 중 어느 한 항에 있어서, 세포의 집단이 다세포 유기체를 포함하는 것인 방법.
- 제112항에 있어서, 다세포 유기체가 동물인 방법.
- 제113항에 있어서, 동물이 인간인 방법.
- 제97항 내지 제114항 중 어느 한 항에 있어서, 세포의 집단이 생체외에서 접촉되는 것인 방법.
- 제97항 내지 제114항 중 어느 한 항에 있어서, 세포의 집단이 생체내에서 접촉되는 것인 방법.
- 하기를 포함하는 인접 폴리핵산 분자로서:
a) 그의 발현이 전사활성인자 반응 요소에 작동가능하게 연결된 제1 RNA를 코딩하며, 여기서 제1 RNA는 (i) 출력의 핵산 서열; 및 (ii) miRNA에 대한 표적 부위를 포함하며, 여기서 상기 miRNA는 포유동물의 적어도 2개의 상이한 건강한 조직에서 고도로 발현되고/거나 활성이고, 표적 세포의 하나 이상의 유형에서 낮은 수준으로 발현되는 것인 제1 카세트;
b) 제2 RNA를 코딩하며, 여기서 제2 RNA는 전사활성인자의 핵산 서열을 포함하는 것인 제2 카세트,
여기서 제2 카세트의 전사활성인자는, 단백질로서 발현되는 경우, 제1 카세트의 전사활성인자 반응 요소에 결합하여 그를 전사활성화시키는 것인
인접 폴리핵산 분자.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063009736P | 2020-04-14 | 2020-04-14 | |
US63/009,736 | 2020-04-14 | ||
PCT/IB2021/000246 WO2021209813A2 (en) | 2020-04-14 | 2021-04-14 | Cell classifier circuits and methods of use thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230002611A true KR20230002611A (ko) | 2023-01-05 |
Family
ID=75919340
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227039223A KR20230002611A (ko) | 2020-04-14 | 2021-04-14 | 세포 분류기 회로 및 그의 사용 방법 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20230133209A1 (ko) |
EP (1) | EP4136241A2 (ko) |
JP (1) | JP2023522025A (ko) |
KR (1) | KR20230002611A (ko) |
CN (1) | CN115702247A (ko) |
AU (1) | AU2021256845A1 (ko) |
CA (1) | CA3179339A1 (ko) |
WO (1) | WO2021209813A2 (ko) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108884448B (zh) * | 2016-01-27 | 2022-12-30 | 昂克诺斯公司 | 溶瘤病毒载体及其用途 |
CN112823209A (zh) * | 2018-10-11 | 2021-05-18 | 瑞士苏黎世联邦理工大学 | 使用编码高度紧凑的多输入逻辑门的核酸载体治疗疾病的方法 |
-
2021
- 2021-04-14 CA CA3179339A patent/CA3179339A1/en active Pending
- 2021-04-14 JP JP2022562636A patent/JP2023522025A/ja active Pending
- 2021-04-14 EP EP21725810.2A patent/EP4136241A2/en active Pending
- 2021-04-14 KR KR1020227039223A patent/KR20230002611A/ko active Search and Examination
- 2021-04-14 AU AU2021256845A patent/AU2021256845A1/en active Pending
- 2021-04-14 CN CN202180040866.3A patent/CN115702247A/zh active Pending
- 2021-04-14 US US17/918,147 patent/US20230133209A1/en active Pending
- 2021-04-14 WO PCT/IB2021/000246 patent/WO2021209813A2/en unknown
Also Published As
Publication number | Publication date |
---|---|
WO2021209813A3 (en) | 2021-12-30 |
CN115702247A (zh) | 2023-02-14 |
US20230133209A1 (en) | 2023-05-04 |
AU2021256845A1 (en) | 2022-11-24 |
EP4136241A2 (en) | 2023-02-22 |
CA3179339A1 (en) | 2021-10-21 |
WO2021209813A2 (en) | 2021-10-21 |
JP2023522025A (ja) | 2023-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102271675B1 (ko) | 헌팅톤병의 aav 치료 | |
US20210388389A1 (en) | Compositions and methods for rapid and modular generation of chimeric antigen receptor t cells | |
CN113271955A (zh) | 用于细胞介导的溶瘤病毒疗法的增强的系统 | |
KR20210068485A (ko) | 노화를 역전시키고 기관 및 조직 재생을 촉진시키기 위한 세포 재프로그래밍 | |
KR102249982B1 (ko) | 트랜스포존 시스템, 이를 포함한 키트, 및 이들의 용도 | |
CN112585277A (zh) | 表达重组受体的t细胞、相关多核苷酸和方法 | |
BR122020025496B1 (pt) | Método de produção de uma célula imune modificada, em que a célula imune é uma célula t alogênica ou autóloga | |
CA3096708A1 (en) | Compositions and methods for multiplexed tumor vaccination with endogenous gene activation | |
JP2022545461A (ja) | 細胞型運命指定の調節因子を同定するための組成物および方法 | |
KR20230029603A (ko) | 필수 유전자 녹-인에 의한 선택 | |
KR20230137399A (ko) | 기능성 핵산 분자 및 방법 | |
CN113559134B (zh) | 一种用于肿瘤治疗的药物 | |
JP2023521410A (ja) | 大型のアデノウイルスペイロードの組み込み | |
KR20230002611A (ko) | 세포 분류기 회로 및 그의 사용 방법 | |
US20220387626A1 (en) | Compositions and methods comprising viral vector systems for multiplexed activation of endogenous genes as immunotherapy and viral-based immune-gene therapy | |
CN111683673A (zh) | 肌营养不良症的治疗 | |
US20230002756A1 (en) | High Performance Platform for Combinatorial Genetic Screening | |
TW202308669A (zh) | 嵌合共刺激性受體、趨化激素受體及彼等於細胞免疫治療之用途 | |
JP2022513347A (ja) | 高度にコンパクトな多入力論理ゲートをコードする核酸ベクターを使用して疾患を処置する方法 | |
WO2023196880A2 (en) | Human t-cell lymphotropic virus type 1 targeting proteins and methods of use | |
WO2024023530A1 (en) | Functional nucleic acid molecule and method | |
CA3209126A1 (en) | Small molecule-regulated cell signaling expression system | |
CA3164622A1 (en) | Adeno-associated viral vector, compositions, methods of promoting muscle regeneration, and treatment methods | |
CN117062912A (zh) | 用于基于crispr的转录抑制的融合蛋白 | |
CN117580941A (zh) | 多重CRISPR/Cas9介导的靶基因激活系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |