KR20230120138A - Myc 발현을 조절하기 위한 조성물 및 방법 - Google Patents
Myc 발현을 조절하기 위한 조성물 및 방법 Download PDFInfo
- Publication number
- KR20230120138A KR20230120138A KR1020237024060A KR20237024060A KR20230120138A KR 20230120138 A KR20230120138 A KR 20230120138A KR 1020237024060 A KR1020237024060 A KR 1020237024060A KR 20237024060 A KR20237024060 A KR 20237024060A KR 20230120138 A KR20230120138 A KR 20230120138A
- Authority
- KR
- South Korea
- Prior art keywords
- expression
- repressor
- sequence
- seq
- nucleic acid
- Prior art date
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 940
- 238000000034 method Methods 0.000 title claims abstract description 357
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 title claims abstract description 263
- 102100038895 Myc proto-oncogene protein Human genes 0.000 title claims abstract description 262
- 239000000203 mixture Substances 0.000 title abstract description 27
- 239000012636 effector Substances 0.000 claims abstract description 391
- 230000008685 targeting Effects 0.000 claims abstract description 301
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 122
- 201000011510 cancer Diseases 0.000 claims abstract description 84
- 108020004414 DNA Proteins 0.000 claims abstract description 57
- 208000002154 non-small cell lung carcinoma Diseases 0.000 claims abstract description 10
- 150000007523 nucleic acids Chemical class 0.000 claims description 338
- 102000039446 nucleic acids Human genes 0.000 claims description 317
- 108020004707 nucleic acids Proteins 0.000 claims description 317
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 118
- 239000002773 nucleotide Substances 0.000 claims description 118
- 125000003729 nucleotide group Chemical group 0.000 claims description 118
- 230000027455 binding Effects 0.000 claims description 104
- 239000011701 zinc Substances 0.000 claims description 77
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 71
- 230000035899 viability Effects 0.000 claims description 71
- 229910052725 zinc Inorganic materials 0.000 claims description 71
- 239000012634 fragment Substances 0.000 claims description 68
- 238000011282 treatment Methods 0.000 claims description 68
- 230000002829 reductive effect Effects 0.000 claims description 61
- -1 system Proteins 0.000 claims description 43
- 239000003814 drug Substances 0.000 claims description 36
- 206010073071 hepatocellular carcinoma Diseases 0.000 claims description 32
- 231100000844 hepatocellular carcinoma Toxicity 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 29
- 229940124597 therapeutic agent Drugs 0.000 claims description 28
- 230000005764 inhibitory process Effects 0.000 claims description 26
- 239000008194 pharmaceutical composition Substances 0.000 claims description 26
- 108020001507 fusion proteins Proteins 0.000 claims description 24
- 230000001629 suppression Effects 0.000 claims description 24
- 102000037865 fusion proteins Human genes 0.000 claims description 23
- MLDQJTXFUGDVEO-UHFFFAOYSA-N BAY-43-9006 Chemical compound C1=NC(C(=O)NC)=CC(OC=2C=CC(NC(=O)NC=3C=C(C(Cl)=CC=3)C(F)(F)F)=CC=2)=C1 MLDQJTXFUGDVEO-UHFFFAOYSA-N 0.000 claims description 22
- 239000005511 L01XE05 - Sorafenib Substances 0.000 claims description 22
- 108060004795 Methyltransferase Proteins 0.000 claims description 22
- 102000016397 Methyltransferase Human genes 0.000 claims description 22
- 229960003787 sorafenib Drugs 0.000 claims description 22
- 230000004614 tumor growth Effects 0.000 claims description 18
- 230000001965 increasing effect Effects 0.000 claims description 17
- 229940125763 bromodomain inhibitor Drugs 0.000 claims description 15
- 238000002965 ELISA Methods 0.000 claims description 13
- 239000011541 reaction mixture Substances 0.000 claims description 13
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 12
- 229940043355 kinase inhibitor Drugs 0.000 claims description 11
- 201000005202 lung cancer Diseases 0.000 claims description 11
- 208000020816 lung neoplasm Diseases 0.000 claims description 11
- 239000003757 phosphotransferase inhibitor Substances 0.000 claims description 11
- 238000003776 cleavage reaction Methods 0.000 claims description 8
- 229940079593 drug Drugs 0.000 claims description 8
- 230000007017 scission Effects 0.000 claims description 8
- 208000000587 small cell lung carcinoma Diseases 0.000 claims description 8
- LIRYPHYGHXZJBZ-UHFFFAOYSA-N trametinib Chemical compound CC(=O)NC1=CC=CC(N2C(N(C3CC3)C(=O)C3=C(NC=4C(=CC(I)=CC=4)F)N(C)C(=O)C(C)=C32)=O)=C1 LIRYPHYGHXZJBZ-UHFFFAOYSA-N 0.000 claims description 8
- 229960004066 trametinib Drugs 0.000 claims description 8
- 230000006907 apoptotic process Effects 0.000 claims description 7
- 201000007270 liver cancer Diseases 0.000 claims description 7
- 208000014018 liver neoplasm Diseases 0.000 claims description 7
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 claims description 7
- 208000007300 Fibrolamellar hepatocellular carcinoma Diseases 0.000 claims description 6
- 229940124647 MEK inhibitor Drugs 0.000 claims description 6
- 206010041067 Small cell lung cancer Diseases 0.000 claims description 6
- 238000003570 cell viability assay Methods 0.000 claims description 6
- 201000004098 fibrolamellar carcinoma Diseases 0.000 claims description 6
- 239000002829 mitogen activated protein kinase inhibitor Substances 0.000 claims description 6
- 206010014733 Endometrial cancer Diseases 0.000 claims description 5
- 206010014759 Endometrial neoplasm Diseases 0.000 claims description 5
- 230000002018 overexpression Effects 0.000 claims description 5
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 5
- 230000035945 sensitivity Effects 0.000 claims description 5
- 238000002560 therapeutic procedure Methods 0.000 claims description 5
- 208000006454 hepatitis Diseases 0.000 claims description 4
- 231100000283 hepatitis Toxicity 0.000 claims description 4
- 201000003076 Angiosarcoma Diseases 0.000 claims description 3
- 201000009030 Carcinoma Diseases 0.000 claims description 3
- 208000001258 Hemangiosarcoma Diseases 0.000 claims description 3
- 102000004232 Mitogen-Activated Protein Kinase Kinases Human genes 0.000 claims description 3
- 108090000744 Mitogen-Activated Protein Kinase Kinases Proteins 0.000 claims description 3
- 208000003721 Triple Negative Breast Neoplasms Diseases 0.000 claims description 3
- 208000009956 adenocarcinoma Diseases 0.000 claims description 3
- 208000006990 cholangiocarcinoma Diseases 0.000 claims description 3
- 201000003914 endometrial carcinoma Diseases 0.000 claims description 3
- 208000021045 exocrine pancreatic carcinoma Diseases 0.000 claims description 3
- 201000006585 gastric adenocarcinoma Diseases 0.000 claims description 3
- 208000022679 triple-negative breast carcinoma Diseases 0.000 claims description 3
- 229940121358 tyrosine kinase inhibitor Drugs 0.000 claims description 3
- 239000005483 tyrosine kinase inhibitor Substances 0.000 claims description 3
- 150000004917 tyrosine kinase inhibitor derivatives Chemical class 0.000 claims description 3
- 102000037982 Immune checkpoint proteins Human genes 0.000 claims description 2
- 108091008036 Immune checkpoint proteins Proteins 0.000 claims description 2
- 239000003102 growth factor Substances 0.000 claims description 2
- 238000009169 immunotherapy Methods 0.000 claims description 2
- 238000011521 systemic chemotherapy Methods 0.000 claims description 2
- 239000003623 enhancer Substances 0.000 abstract description 66
- 101150039798 MYC gene Proteins 0.000 abstract description 53
- 230000035897 transcription Effects 0.000 abstract description 10
- 238000013518 transcription Methods 0.000 abstract description 10
- 210000004027 cell Anatomy 0.000 description 263
- 108090000623 proteins and genes Proteins 0.000 description 193
- 230000000694 effects Effects 0.000 description 84
- 108090000765 processed proteins & peptides Proteins 0.000 description 78
- 108091028043 Nucleic acid sequence Proteins 0.000 description 67
- 108020004999 messenger RNA Proteins 0.000 description 67
- 102000004169 proteins and genes Human genes 0.000 description 61
- 235000018102 proteins Nutrition 0.000 description 56
- 102000004196 processed proteins & peptides Human genes 0.000 description 52
- 229920001184 polypeptide Polymers 0.000 description 51
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 50
- 238000010453 CRISPR/Cas method Methods 0.000 description 47
- 102000011252 Krueppel-associated box Human genes 0.000 description 41
- 108050001491 Krueppel-associated box Proteins 0.000 description 41
- 108700009124 Transcription Initiation Site Proteins 0.000 description 40
- 230000009467 reduction Effects 0.000 description 40
- 150000002632 lipids Chemical class 0.000 description 33
- 102100025169 Max-binding protein MNT Human genes 0.000 description 32
- 108091006107 transcriptional repressors Proteins 0.000 description 32
- 229940024606 amino acid Drugs 0.000 description 31
- 235000001014 amino acid Nutrition 0.000 description 31
- 230000001404 mediated effect Effects 0.000 description 31
- 230000001105 regulatory effect Effects 0.000 description 31
- 108020005004 Guide RNA Proteins 0.000 description 26
- 239000003795 chemical substances by application Substances 0.000 description 26
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 25
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 24
- 150000001413 amino acids Chemical class 0.000 description 23
- 239000002105 nanoparticle Substances 0.000 description 23
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 21
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 21
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 21
- 230000003828 downregulation Effects 0.000 description 20
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 description 19
- 230000003833 cell viability Effects 0.000 description 19
- 102100038720 Histone deacetylase 9 Human genes 0.000 description 18
- 230000004927 fusion Effects 0.000 description 18
- 102100035043 Histone-lysine N-methyltransferase EHMT1 Human genes 0.000 description 16
- 102100035042 Histone-lysine N-methyltransferase EHMT2 Human genes 0.000 description 16
- 101000877312 Homo sapiens Histone-lysine N-methyltransferase EHMT2 Proteins 0.000 description 16
- 101000613960 Homo sapiens Lysine-specific histone demethylase 1B Proteins 0.000 description 16
- 102100040596 Lysine-specific histone demethylase 1B Human genes 0.000 description 16
- 230000037396 body weight Effects 0.000 description 16
- 241000282414 Homo sapiens Species 0.000 description 14
- 201000010099 disease Diseases 0.000 description 14
- 150000003384 small molecules Chemical class 0.000 description 14
- 102000003964 Histone deacetylase Human genes 0.000 description 13
- 108090000353 Histone deacetylase Proteins 0.000 description 13
- 102000055027 Protein Methyltransferases Human genes 0.000 description 13
- 108700040121 Protein Methyltransferases Proteins 0.000 description 13
- 150000001875 compounds Chemical class 0.000 description 13
- 230000004049 epigenetic modification Effects 0.000 description 13
- 208000019423 liver disease Diseases 0.000 description 13
- 102000002488 Nucleoplasmin Human genes 0.000 description 12
- 239000002246 antineoplastic agent Substances 0.000 description 12
- 238000003556 assay Methods 0.000 description 12
- 229940127089 cytotoxic agent Drugs 0.000 description 12
- 108060005597 nucleoplasmin Proteins 0.000 description 12
- 229920002477 rna polymer Polymers 0.000 description 12
- 238000011144 upstream manufacturing Methods 0.000 description 12
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 11
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 11
- 101710160287 Heterochromatin protein 1 Proteins 0.000 description 11
- 101710196274 Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 11
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 11
- 101000584499 Homo sapiens Polycomb protein SUZ12 Proteins 0.000 description 11
- 101000931374 Homo sapiens Zinc finger protein ZFPM1 Proteins 0.000 description 11
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 11
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 11
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 11
- 102100029494 Neutrophil defensin 1 Human genes 0.000 description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 11
- 102100030702 Polycomb protein SUZ12 Human genes 0.000 description 11
- 108010071034 Retinoblastoma-Binding Protein 4 Proteins 0.000 description 11
- 102000007508 Retinoblastoma-Binding Protein 4 Human genes 0.000 description 11
- 102100020993 Zinc finger protein ZFPM1 Human genes 0.000 description 11
- 239000002585 base Substances 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 11
- 230000001973 epigenetic effect Effects 0.000 description 11
- 230000011987 methylation Effects 0.000 description 11
- 238000007069 methylation reaction Methods 0.000 description 11
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 11
- VSDFDVBYONIJLD-UHFFFAOYSA-N 3-[(4-chlorophenyl)methoxy]-2-[4-chloro-3-(trifluoromethyl)phenyl]-6-[2-methyl-5-(trifluoromethyl)pyrazol-3-yl]phenol Chemical group CN1N=C(C=C1C1=C(O)C(=C(OCC2=CC=C(Cl)C=C2)C=C1)C1=CC=C(Cl)C(=C1)C(F)(F)F)C(F)(F)F VSDFDVBYONIJLD-UHFFFAOYSA-N 0.000 description 10
- 108091033409 CRISPR Proteins 0.000 description 10
- 102100024811 DNA (cytosine-5)-methyltransferase 3-like Human genes 0.000 description 10
- 108010074870 Histone Demethylases Proteins 0.000 description 10
- 102000008157 Histone Demethylases Human genes 0.000 description 10
- 101000909250 Homo sapiens DNA (cytosine-5)-methyltransferase 3-like Proteins 0.000 description 10
- 208000035475 disorder Diseases 0.000 description 10
- 239000000126 substance Substances 0.000 description 10
- 238000012384 transportation and delivery Methods 0.000 description 10
- 108091005772 HDAC11 Proteins 0.000 description 9
- 102000011787 Histone Methyltransferases Human genes 0.000 description 9
- 108010036115 Histone Methyltransferases Proteins 0.000 description 9
- 102100039996 Histone deacetylase 1 Human genes 0.000 description 9
- 102100039385 Histone deacetylase 11 Human genes 0.000 description 9
- 102100039999 Histone deacetylase 2 Human genes 0.000 description 9
- 102100021455 Histone deacetylase 3 Human genes 0.000 description 9
- 102100021454 Histone deacetylase 4 Human genes 0.000 description 9
- 102100021453 Histone deacetylase 5 Human genes 0.000 description 9
- 102100022537 Histone deacetylase 6 Human genes 0.000 description 9
- 102100038715 Histone deacetylase 8 Human genes 0.000 description 9
- 108010033040 Histones Proteins 0.000 description 9
- 101001035024 Homo sapiens Histone deacetylase 1 Proteins 0.000 description 9
- 101001035011 Homo sapiens Histone deacetylase 2 Proteins 0.000 description 9
- 101000899282 Homo sapiens Histone deacetylase 3 Proteins 0.000 description 9
- 101000899259 Homo sapiens Histone deacetylase 4 Proteins 0.000 description 9
- 101000899255 Homo sapiens Histone deacetylase 5 Proteins 0.000 description 9
- 101000899330 Homo sapiens Histone deacetylase 6 Proteins 0.000 description 9
- 101001032113 Homo sapiens Histone deacetylase 7 Proteins 0.000 description 9
- 101001032118 Homo sapiens Histone deacetylase 8 Proteins 0.000 description 9
- 101001032092 Homo sapiens Histone deacetylase 9 Proteins 0.000 description 9
- 101000616738 Homo sapiens NAD-dependent protein deacetylase sirtuin-6 Proteins 0.000 description 9
- 101000709248 Homo sapiens NAD-dependent protein deacetylase sirtuin-7 Proteins 0.000 description 9
- 101000616727 Homo sapiens NAD-dependent protein deacylase sirtuin-5, mitochondrial Proteins 0.000 description 9
- 101000863629 Homo sapiens NAD-dependent protein lipoamidase sirtuin-4, mitochondrial Proteins 0.000 description 9
- 101001035694 Homo sapiens Polyamine deacetylase HDAC10 Proteins 0.000 description 9
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 9
- WWGBHDIHIVGYLZ-UHFFFAOYSA-N N-[4-[3-[[[7-(hydroxyamino)-7-oxoheptyl]amino]-oxomethyl]-5-isoxazolyl]phenyl]carbamic acid tert-butyl ester Chemical compound C1=CC(NC(=O)OC(C)(C)C)=CC=C1C1=CC(C(=O)NCCCCCCC(=O)NO)=NO1 WWGBHDIHIVGYLZ-UHFFFAOYSA-N 0.000 description 9
- 102100031455 NAD-dependent protein deacetylase sirtuin-1 Human genes 0.000 description 9
- 102100022913 NAD-dependent protein deacetylase sirtuin-2 Human genes 0.000 description 9
- 102100021840 NAD-dependent protein deacetylase sirtuin-6 Human genes 0.000 description 9
- 102100034376 NAD-dependent protein deacetylase sirtuin-7 Human genes 0.000 description 9
- 102100021839 NAD-dependent protein deacylase sirtuin-5, mitochondrial Human genes 0.000 description 9
- 102100030709 NAD-dependent protein lipoamidase sirtuin-4, mitochondrial Human genes 0.000 description 9
- 102100039388 Polyamine deacetylase HDAC10 Human genes 0.000 description 9
- 108010041191 Sirtuin 1 Proteins 0.000 description 9
- 108010041216 Sirtuin 2 Proteins 0.000 description 9
- 230000032823 cell division Effects 0.000 description 9
- 230000007423 decrease Effects 0.000 description 9
- 101000619676 Drosophila melanogaster Lipid storage droplets surface-binding protein 2 Proteins 0.000 description 8
- 108091016366 Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 description 8
- 102100027770 Histone-lysine N-methyltransferase KMT5B Human genes 0.000 description 8
- 102100027788 Histone-lysine N-methyltransferase KMT5C Human genes 0.000 description 8
- 102100023696 Histone-lysine N-methyltransferase SETDB1 Human genes 0.000 description 8
- 102100023676 Histone-lysine N-methyltransferase SETDB2 Human genes 0.000 description 8
- 102100028998 Histone-lysine N-methyltransferase SUV39H1 Human genes 0.000 description 8
- 102100028988 Histone-lysine N-methyltransferase SUV39H2 Human genes 0.000 description 8
- 101000877314 Homo sapiens Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 description 8
- 101001028782 Homo sapiens Histone-lysine N-methyltransferase EZH1 Proteins 0.000 description 8
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 8
- 101001008821 Homo sapiens Histone-lysine N-methyltransferase KMT5B Proteins 0.000 description 8
- 101001008824 Homo sapiens Histone-lysine N-methyltransferase KMT5C Proteins 0.000 description 8
- 101000684609 Homo sapiens Histone-lysine N-methyltransferase SETDB1 Proteins 0.000 description 8
- 101000684615 Homo sapiens Histone-lysine N-methyltransferase SETDB2 Proteins 0.000 description 8
- 101000696705 Homo sapiens Histone-lysine N-methyltransferase SUV39H1 Proteins 0.000 description 8
- 101000696699 Homo sapiens Histone-lysine N-methyltransferase SUV39H2 Proteins 0.000 description 8
- 101000613958 Homo sapiens Lysine-specific demethylase 2A Proteins 0.000 description 8
- 101000614013 Homo sapiens Lysine-specific demethylase 2B Proteins 0.000 description 8
- 101000613629 Homo sapiens Lysine-specific demethylase 4B Proteins 0.000 description 8
- 101001088892 Homo sapiens Lysine-specific demethylase 5A Proteins 0.000 description 8
- 101001088883 Homo sapiens Lysine-specific demethylase 5B Proteins 0.000 description 8
- 101001088887 Homo sapiens Lysine-specific demethylase 5C Proteins 0.000 description 8
- 101001088879 Homo sapiens Lysine-specific demethylase 5D Proteins 0.000 description 8
- 101001050886 Homo sapiens Lysine-specific histone demethylase 1A Proteins 0.000 description 8
- 101001008816 Homo sapiens N-lysine methyltransferase KMT5A Proteins 0.000 description 8
- 101000754924 Homo sapiens Ribosomal oxygenase 1 Proteins 0.000 description 8
- 102100040598 Lysine-specific demethylase 2A Human genes 0.000 description 8
- 102100040584 Lysine-specific demethylase 2B Human genes 0.000 description 8
- 102100040860 Lysine-specific demethylase 4B Human genes 0.000 description 8
- 102100033246 Lysine-specific demethylase 5A Human genes 0.000 description 8
- 102100033247 Lysine-specific demethylase 5B Human genes 0.000 description 8
- 102100033249 Lysine-specific demethylase 5C Human genes 0.000 description 8
- 102100033143 Lysine-specific demethylase 5D Human genes 0.000 description 8
- 101710096379 Lysine-specific histone demethylase 1 Proteins 0.000 description 8
- 102100024985 Lysine-specific histone demethylase 1A Human genes 0.000 description 8
- 241000699670 Mus sp. Species 0.000 description 8
- 229940124160 Myc inhibitor Drugs 0.000 description 8
- 101710150912 Myc protein Proteins 0.000 description 8
- 102100027771 N-lysine methyltransferase KMT5A Human genes 0.000 description 8
- 102100030710 NAD-dependent protein deacetylase sirtuin-3, mitochondrial Human genes 0.000 description 8
- 102100022091 Ribosomal oxygenase 1 Human genes 0.000 description 8
- 108091005770 SIRT3 Proteins 0.000 description 8
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 8
- 230000000996 additive effect Effects 0.000 description 8
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 8
- DQLATGHUWYMOKM-UHFFFAOYSA-L cisplatin Chemical compound N[Pt](N)(Cl)Cl DQLATGHUWYMOKM-UHFFFAOYSA-L 0.000 description 8
- 229960004316 cisplatin Drugs 0.000 description 8
- 230000002255 enzymatic effect Effects 0.000 description 8
- 210000003494 hepatocyte Anatomy 0.000 description 8
- 208000024891 symptom Diseases 0.000 description 8
- 241001465754 Metazoa Species 0.000 description 7
- 241000699666 Mus <mouse, genus> Species 0.000 description 7
- 102000035195 Peptidases Human genes 0.000 description 7
- 108091005804 Peptidases Proteins 0.000 description 7
- 239000004365 Protease Substances 0.000 description 7
- 230000001640 apoptogenic effect Effects 0.000 description 7
- 239000011230 binding agent Substances 0.000 description 7
- 230000000875 corresponding effect Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 102220079741 rs797045487 Human genes 0.000 description 7
- 230000009870 specific binding Effects 0.000 description 7
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical class C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 6
- 208000019693 Lung disease Diseases 0.000 description 6
- 108091093037 Peptide nucleic acid Proteins 0.000 description 6
- 102000040945 Transcription factor Human genes 0.000 description 6
- 108091023040 Transcription factor Proteins 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 239000013642 negative control Substances 0.000 description 6
- 239000002777 nucleoside Substances 0.000 description 6
- 150000004713 phosphodiesters Chemical class 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 6
- 102100033636 Histone H3.2 Human genes 0.000 description 5
- 239000002202 Polyethylene glycol Substances 0.000 description 5
- 230000033228 biological regulation Effects 0.000 description 5
- 230000002209 hydrophobic effect Effects 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 210000004072 lung Anatomy 0.000 description 5
- 230000006911 nucleation Effects 0.000 description 5
- 229920001223 polyethylene glycol Polymers 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 230000014616 translation Effects 0.000 description 5
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 206010009944 Colon cancer Diseases 0.000 description 4
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 4
- 101150022024 MYCN gene Proteins 0.000 description 4
- 108700026495 N-Myc Proto-Oncogene Proteins 0.000 description 4
- 102100030124 N-myc proto-oncogene protein Human genes 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- 238000011374 additional therapy Methods 0.000 description 4
- 230000004075 alteration Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000012054 celltiter-glo Methods 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 238000010899 nucleation Methods 0.000 description 4
- 125000003835 nucleoside group Chemical group 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 101150061166 tetR gene Proteins 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 108020003589 5' Untranslated Regions Proteins 0.000 description 3
- 208000005623 Carcinogenesis Diseases 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 208000005718 Stomach Neoplasms Diseases 0.000 description 3
- 108090000190 Thrombin Proteins 0.000 description 3
- 208000036142 Viral infection Diseases 0.000 description 3
- 239000013543 active substance Substances 0.000 description 3
- 102000013529 alpha-Fetoproteins Human genes 0.000 description 3
- 108010026331 alpha-Fetoproteins Proteins 0.000 description 3
- 230000036952 cancer formation Effects 0.000 description 3
- 231100000504 carcinogenesis Toxicity 0.000 description 3
- 239000003054 catalyst Substances 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 231100000673 dose–response relationship Toxicity 0.000 description 3
- 230000002222 downregulating effect Effects 0.000 description 3
- 230000008482 dysregulation Effects 0.000 description 3
- 206010017758 gastric cancer Diseases 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 208000002672 hepatitis B Diseases 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 230000003584 silencer Effects 0.000 description 3
- 201000011549 stomach cancer Diseases 0.000 description 3
- 229960004072 thrombin Drugs 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- 230000009385 viral infection Effects 0.000 description 3
- 208000016261 weight loss Diseases 0.000 description 3
- 239000012130 whole-cell lysate Substances 0.000 description 3
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 description 2
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 2
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 2
- PISWNSOQFZRVJK-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 PISWNSOQFZRVJK-XLPZGREQSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 2
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 2
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- LMMLLWZHCKCFQA-UGKPPGOTSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-prop-1-ynyloxolan-2-yl]pyrimidin-2-one Chemical compound C1=CC(N)=NC(=O)N1[C@]1(C#CC)O[C@H](CO)[C@@H](O)[C@H]1O LMMLLWZHCKCFQA-UGKPPGOTSA-N 0.000 description 2
- XXSIICQLPUAUDF-TURQNECASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidin-2-one Chemical compound O=C1N=C(N)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XXSIICQLPUAUDF-TURQNECASA-N 0.000 description 2
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 2
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 2
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 2
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 2
- UEHOMUNTZPIBIL-UUOKFMHZSA-N 6-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7h-purin-8-one Chemical compound O=C1NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UEHOMUNTZPIBIL-UUOKFMHZSA-N 0.000 description 2
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 2
- HDZZVAMISRMYHH-UHFFFAOYSA-N 9beta-Ribofuranosyl-7-deazaadenin Natural products C1=CC=2C(N)=NC=NC=2N1C1OC(CO)C(O)C1O HDZZVAMISRMYHH-UHFFFAOYSA-N 0.000 description 2
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 108010040163 CREB-Binding Protein Proteins 0.000 description 2
- 102100021975 CREB-binding protein Human genes 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 102000003952 Caspase 3 Human genes 0.000 description 2
- 108090000397 Caspase 3 Proteins 0.000 description 2
- 102000011022 Chorionic Gonadotropin Human genes 0.000 description 2
- 108010062540 Chorionic Gonadotropin Proteins 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical class OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- 230000007067 DNA methylation Effects 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 206010017993 Gastrointestinal neoplasms Diseases 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 2
- 101000692455 Homo sapiens Platelet-derived growth factor receptor beta Proteins 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 206010029260 Neuroblastoma Diseases 0.000 description 2
- 208000008589 Obesity Diseases 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 2
- 101150084935 PTER gene Proteins 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 102100026547 Platelet-derived growth factor receptor beta Human genes 0.000 description 2
- 206010060862 Prostate cancer Diseases 0.000 description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 2
- 101800001494 Protease 2A Proteins 0.000 description 2
- 101800001066 Protein 2A Proteins 0.000 description 2
- 102000009572 RNA Polymerase II Human genes 0.000 description 2
- 108010009460 RNA Polymerase II Proteins 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 102000051614 SET domains Human genes 0.000 description 2
- 108700039010 SET domains Proteins 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 102100031142 Transcriptional repressor protein YY1 Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 108091008605 VEGF receptors Proteins 0.000 description 2
- 102100033177 Vascular endothelial growth factor receptor 2 Human genes 0.000 description 2
- NRLNQCOGCKAESA-KWXKLSQISA-N [(6z,9z,28z,31z)-heptatriaconta-6,9,28,31-tetraen-19-yl] 4-(dimethylamino)butanoate Chemical compound CCCCC\C=C/C\C=C/CCCCCCCCC(OC(=O)CCCN(C)C)CCCCCCCC\C=C/C\C=C/CCCCC NRLNQCOGCKAESA-KWXKLSQISA-N 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical class OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 210000004899 c-terminal region Anatomy 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 108010045512 cohesins Proteins 0.000 description 2
- 239000006071 cream Substances 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- 235000019441 ethanol Nutrition 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 150000002402 hexoses Chemical class 0.000 description 2
- 229940084986 human chorionic gonadotropin Drugs 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 238000003032 molecular docking Methods 0.000 description 2
- 239000002667 nucleating agent Substances 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 235000020824 obesity Nutrition 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 235000004252 protein component Nutrition 0.000 description 2
- 108010077182 raf Kinases Proteins 0.000 description 2
- 102000009929 raf Kinases Human genes 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 208000016691 refractory malignant neoplasm Diseases 0.000 description 2
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 125000001273 sulfonato group Chemical group [O-]S(*)(=O)=O 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 230000004580 weight loss Effects 0.000 description 2
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 101100058320 Arabidopsis thaliana BHLH12 gene Proteins 0.000 description 1
- 208000011691 Burkitt lymphomas Diseases 0.000 description 1
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 101100459256 Cyprinus carpio myca gene Proteins 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 102100026662 Delta and Notch-like epidermal growth factor-related receptor Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102100033840 General transcription factor IIF subunit 1 Human genes 0.000 description 1
- 102100032863 General transcription factor IIH subunit 3 Human genes 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000666405 Homo sapiens General transcription factor IIH subunit 1 Proteins 0.000 description 1
- 101000655398 Homo sapiens General transcription factor IIH subunit 2 Proteins 0.000 description 1
- 101000655391 Homo sapiens General transcription factor IIH subunit 3 Proteins 0.000 description 1
- 101000655406 Homo sapiens General transcription factor IIH subunit 4 Proteins 0.000 description 1
- 101000655402 Homo sapiens General transcription factor IIH subunit 5 Proteins 0.000 description 1
- 229940076838 Immune checkpoint inhibitor Drugs 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- 101100293199 Mus musculus Myc gene Proteins 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 208000037581 Persistent Infection Diseases 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 102000052575 Proto-Oncogene Human genes 0.000 description 1
- 108700020978 Proto-Oncogene Proteins 0.000 description 1
- 230000014632 RNA localization Effects 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 206010070308 Refractory cancer Diseases 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 101100459257 Solanum lycopersicum MYC1 gene Proteins 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- 102100040296 TATA-box-binding protein Human genes 0.000 description 1
- 108010083262 Transcription Factor TFIIA Proteins 0.000 description 1
- 102000006289 Transcription Factor TFIIA Human genes 0.000 description 1
- 108010083268 Transcription Factor TFIID Proteins 0.000 description 1
- 108090000941 Transcription factor TFIIB Proteins 0.000 description 1
- 102000004408 Transcription factor TFIIB Human genes 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 101100459258 Xenopus laevis myc-a gene Proteins 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 210000001552 airway epithelial cell Anatomy 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 230000005775 apoptotic pathway Effects 0.000 description 1
- 230000005784 autoimmunity Effects 0.000 description 1
- 230000001042 autoregulative effect Effects 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 238000001369 bisulfite sequencing Methods 0.000 description 1
- 238000002725 brachytherapy Methods 0.000 description 1
- 230000009702 cancer cell proliferation Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 230000008045 co-localization Effects 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 108010051779 histone H3 trimethyl Lys4 Proteins 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 125000001183 hydrocarbyl group Chemical group 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 239000012274 immune-checkpoint protein inhibitor Substances 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 230000002601 intratumoral effect Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 238000002647 laser therapy Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 201000005296 lung carcinoma Diseases 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Chemical class 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 108700024542 myc Genes Proteins 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- 230000009826 neoplastic cell growth Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 239000012457 nonaqueous media Substances 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 108091008820 oncogenic transcription factors Proteins 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 239000006072 paste Substances 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000002428 photodynamic therapy Methods 0.000 description 1
- 230000010399 physical interaction Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000012743 protein tagging Effects 0.000 description 1
- 230000002685 pulmonary effect Effects 0.000 description 1
- 230000010110 radioembolization Effects 0.000 description 1
- 238000007674 radiofrequency ablation Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000007781 signaling event Effects 0.000 description 1
- 238000009097 single-agent therapy Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 230000010473 stable expression Effects 0.000 description 1
- 238000009199 stereotactic radiation therapy Methods 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000011285 therapeutic regimen Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 108010014677 transcription factor TFIIE Proteins 0.000 description 1
- 108010014678 transcription factor TFIIF Proteins 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 230000005760 tumorsuppression Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
- C07K14/4703—Inhibitors; Suppressors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/635—Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K45/00—Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
- A61K45/06—Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/12—Antivirals
- A61P31/14—Antivirals for RNA viruses
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
Abstract
본 개시내용은 세포에서 MYC 유전자의 발현을 감소시키는 조성물 및 방법에 관한 것이다. 일부 구현예에서, 발현 리프레서는 MYC 프로모터, 앵커 서열, 또는 슈퍼-인핸서에 결합하는 표적화 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 전사를 억제하거나 DNA를 메틸화하는 이펙터 모이어티를 포함한다. 2개 발현 리프레서를 포함하는 시스템이 또한 개시되어 있다. 조성물은, 예를 들어 암, 예컨대 HCC 또는 NSCLC를 치료하는 데 사용될 수 있다.
Description
관련 출원에 대한 상호 참조
본 출원은 2020년 12월 15일에 출원된 미국 가출원 63/125,833, 2021년 1월 13일에 출원된 미국 가출원 63/137,097, 2021년 6월 21일에 출원된 미국 가출원 63/212,991, 및 2021년 11월 18일에 출원된 미국 가출원 63/281,022에 대한 우선권을 주장하며, 이들 전체 내용은 본 명세서에 참조로 포함된다.
서열 목록
본 출원은 ASCII 서식으로 전자적으로 제출된 서열 목록을 포함하며, 이는 본 명세서에 전문이 참조로 포함된다. 2021년 12월 6일에 생성된 상기 ASCII 사본은 파일명이 O2057-7029WO_SL.txt이며, 크기가 624,274 바이트이다.
유전자 발현의 오조절(mis-regulation)은 (예를 들어, 포유동물, 예를 들어 인간에서) 많은 질환, 예를 들어 신생물, 신경 장애, 대사 장애 및 비만의 기저 원인이다. 전사 인자인 MYC의 오조절은 다양한 인간 종양 및 만성 간 질환에서 중요한 역할을 한다. MYC 단백질은 다양한 요인, 예를 들어 한정된 리간드 결합 부위, 정상 조직의 유지에 필수적인 생리학적 기능의 결여로 인해 "약물 치료 불가능(undruggable)"인 것으로 고려된다. MYC 유전자 발현을 조절하기 위해 적합화된 기법은 이들 질환을 치료하는 데 실행 가능한 대안적인 접근법을 제공한다. 질환 연관 유전자, 예컨대 MYC의 발현을 안정적으로 변경시키는, 예를 들어 감소시키는 신규 도구, 시스템, 및 방법에 대한 필요성이 있다.
본 개시내용은 특히 표적 유전자, 예를 들어 MYC의 발현을 조정하는, 예를 들어 감소시키는 데 사용될 수 있는 발현 리프레서 및 발현 리프레서 시스템을 제공한다.
일부 양태에서, 본 개시내용은 표적 유전자 프로모터, 예를 들어 MYC 프로모터에 결합하는 표적화 모이어티, 및 선택적으로 이펙터 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 구현예에서, 본 개시내용은 표적 유전자 유전자좌, 예를 들어 MYC에 결합하는 표적화 모이어티, 및 MQ1 또는 이의 단편 또는 변이체를 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 MYC의 슈퍼 인핸서 영역에 위치하는 조절 요소에 결합하는 표적화 모이어티, 및 선택적으로 이펙터 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 조절 요소에 결합하는 표적화 모이어티, 및 이펙터 모이어티(예를 들어, KRAB, 또는 MQ1, 또는 이의 단편 또는 변이체)를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 조절 요소에 결합하는 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 징크 핑거 도메인을 포함하고, 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 MYC의 슈퍼 인핸서 영역에 위치하는 조절 요소에 결합하는 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 징크 핑거 도메인 또는 TAL 이펙터 도메인, 및 이펙터 모이어티를 포함하고, 이펙터 모이어티는 전사 리프레서(예를 들어, KRAB 또는 이의 단편 또는 변이체) 또는 DNA 메틸트랜스퍼라제(예를 들어, MQ1 또는 이의 단편 또는 변이체)를 포함하며; 발현 리프레서는 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 표적 유전자 유전자좌, 예를 들어 MYC에 결합하는 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 징크 핑거 도메인을 포함하고, 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 서열번호 1, 3, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 109, 110, 또는 75, 76, 78, 79, 80, 81, 84, 85, 86의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 서열번호 2 또는 77, 82, 83의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다. 일부 구현예에서, 발현 발현자(expressor)는 이펙터 모이어티를 포함한다.
일부 양태에서, 본 개시내용은 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 서열번호 4의 1400 nt 상류 또는 하류 내에 있는 게놈 유전자좌에 결합한다.
일부 양태에서, 본 개시내용은 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 서열번호 4, 77, 82, 또는 83의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합한다.
일부 양태에서, 본 개시내용은 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 서열번호 83, 96, 또는 108의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합한다.
일부 양태에서, 본 개시내용은 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)) 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서(여기서 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합함)를 포함하는 시스템을 제공한다.
일부 양태에서, 본 개시내용은 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합함)를 포함하는 시스템을 제공한다.
일부 구현예에서, 제1 표적화 모이어티는 제1 DNA 서열에 특이적으로 결합하고 제2 표적화 모이어티는 제1 DNA 서열과 상이한 제2 DNA 서열에 특이적으로 결합한다. 일부 구현예에서, 제1 이펙터 모이어티는 제2 이펙터 모이어티와 상이하다.
일부 양태에서, 본 개시내용은, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 CRISPR/Cas 분자를 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및 MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합하는 CRISPR/Cas 분자를 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티, 및 KRAB, MQ1, 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는 CRISPR/Cas 분자를 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및 KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다.
일부 양태에서, 본 개시내용은, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 징크 핑거 분자를 포함하는 표적화 모이어티; 및 MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는 징크 핑거 분자를 포함하는 표적화 모이어티; 및 KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합하는 징크 핑거 분자를 포함하는 표적화 모이어티, 및 KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다.
일부 양태에서, 본 개시내용은 제1 발현 리프레서, 제2 발현 리프레서, 이들 둘 다, 또는 이들의 성분(예를 들어, gRNA, mRNA)을 인코딩하는 핵산에 관한 것이다. 일부 구현예에서, 발현 리프레서 시스템을 인코딩하는 핵산은 다중-시스트론(multi-cistronic) 서열이다. 일부 구현예에서, 다중-시스트론 서열은 이중-시스트론(bi-cistronic) 서열이다.
일부 양태에서, 본 개시내용은 본 명세서에 기재된 핵산, 시스템, 또는 발현 리프레서를 포함하는 벡터에 관한 것이다. 또 다른 양태에서, 본 개시내용은 본 명세서에 기재된 벡터, 핵산, 시스템, 또는 발현 리프레서를 포함하는 지질 나노입자에 관한 것이다. 또 다른 양태에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서, 시스템, 핵산, 벡터, 또는 지질 나노입자를 포함하는 반응 혼합물에 관한 것이다. 또 다른 양태에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 반응 혼합물을 포함하는 약제학적 조성물에 관한 것이다.
일부 양태에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템을 제공하는 단계, 및 표적 유전자 및/또는 하나 이상의 작동가능하게 연결된 전사 제어 요소를 발현 리프레서 또는 발현 억제 시스템과 접촉시키는 단계를 포함하며, 이에 의해 표적 유전자의 발현을 감소시키는, 표적 유전자의 발현을 감소시키는 방법에 관한 것이다.
일부 양태에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서, 또는 시스템, 핵산, 또는 벡터를 대상체에게 투여하는 단계를 포함하며, 이에 의해 병태를 치료하는, 대상체에서 표적 유전자, 예를 들어 MYC의 과발현과 연관된 병태를 치료하는 방법에 관한 것이다.
일부 양태에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서, 시스템, 핵산, 또는 벡터를 대상체에게 투여하는 단계를 포함하며, 이에 의해 병태를 치료하는, 대상체에서 표적 유전자, 예를 들어 MYC의 오조절과 연관된 병태를 치료하는 방법에 관한 것이다.
일부 양태에서, 본 개시내용은 세포에서 표적 유전자, 예를 들어 MYC의 발현을 감소시키는 방법을 제공하며, 상기 방법은 세포를, 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS))에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합함)를 포함하는 시스템과 접촉시키는 단계를 포함하며, 이에 의해 세포에서 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다.
일부 양태에서, 본 개시내용은 세포에서 표적 유전자, 예를 들어 MYC의 발현을 감소시키는 방법을 제공하며, 세포를, 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS))에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합함)를 포함하는 시스템과 접촉시키는 단계를 포함하며, 이에 의해 세포에서 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다.
본 개시내용은 부분적으로, a) 표적 유전자, 프로모터, 예를 들어 MYC에 결합하는 표적화 모이어티, 및 표적 유전자, 예를 들어 MYC의 발현을 조절할 수 있는, 예를 들어 감소시킬 수 있는 이펙터 모이어티를 포함하는 발현 리프레서를 포함하는 조성물을 포함하는 용기, 및 b) 상기 조성물을 이용하여 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한 적어도 하나의 방법을 포함하는 한 세트의 설명서를 포함하는 키트를 추가로 제공한다.
본 개시내용은 부분적으로, a) 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 유전자좌에 결합하는 표적화 모이어티, 및 표적 유전자, 예를 들어 MYC의 발현을 조절할 수 있는, 예를 들어 감소시킬 수 있는 이펙터 모이어티를 포함하는 발현 리프레서를 포함하는 조성물을 포함하는 용기, 및 b) 상기 조성물을 이용하여 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한 적어도 하나의 방법을 포함하는 한 세트의 설명서를 포함하는 키트를 추가로 제공한다.
일부 양태에서, 키트는 a) 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합함)를 포함하는, 2개의 발현 리프레서를 포함하는 시스템을 포함하는 조성물을 포함하는 용기를 포함한다.
일부 양태에서, 키트는 a) 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합함)를 포함하는, 2개의 발현 리프레서를 포함하는 시스템을 포함하는 조성물을 포함하는 용기를 포함한다.
일부 구현예에서, 키트는 b) 상기 조성물을 이용하여 질환을 치료하거나 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한, 예를 들어 감소시키기 위한 적어도 하나의 방법을 포함하는 한 세트의 설명서을 추가로 포함한다. 일 구현예에서, 키트는 선택적으로 상기 조성물을 위한 전달 비히클(예를 들어, 지질 나노입자)을 포함할 수 있다. 시약은 부형제 및/또는 전달 비히클 중에 현탁된 상태로 제공될 수 있거나, 별개의 성분으로서 제공될 수 있는데, 이는 나중에 부형제 및/또는 전달 비히클과 배합될 수 있다. 일부 구현예에서, 키트는 조성물과 공동투여되는 추가의 치료제를 선택적으로 함유하여 원하는 표적 유전자 발현, 예를 들어 MYC 유전자 발현 조절에 영향을 미칠 수 있다. 설명 자료는 통상적으로 서면 자료 또는 인쇄 자료를 포함하지만, 이들은 그러한 것으로 제한되지 않는다. 그러한 설명서를 저장하고 이를 최종 사용자에게 전달할 수 있는 임의의 매체가 본 발명에 의해 상정된다. 그러한 매체는 전자 저장 매체(예를 들어, 자기 디스크, 테이프, 카트리지, 칩), 광학 매체(예를 들어, CD ROM) 등을 포함하지만 이에 제한되지 않는다. 그러한 매체는 그러한 설명 자료를 제공하는 인터넷 사이트에 대한 주소를 포함할 수 있다.
상기 방법 또는 조성물 중 임의의 것의 추가의 특징은 하기 열거된 구현예 중 하나 이상을 포함한다.
당업자는 단지 일상적인 실험을 사용하여, 본 명세서에서 기재된 본 개시내용의 구체적인 구현예에 대한 많은 균등물을 인식하거나 확인할 수 있을 것이다. 그러한 균등물은 하기 열거된 구현예에 의해 포함되는 것으로 의도된다.
본 명세서에서 언급된 모든 간행물, 특허 출원, 특허 및 기타 참고 문헌(예를 들어, 서열 데이터베이스 참조 번호)은 전체적으로 참조로 포함된다. 예를 들어, 본 명세서에 언급된, 예를 들어 본 명세서의 임의의 표에 있는 모든 GenBank, Unigene, 및 Entrez 서열은 참조로 포함된다. 달리 명시되지 않는 한, 본 명세서의 임의의 표에 있는 것을 포함한 본 명세서에 명시된 서열 수탁 번호는 2020년 12월 15일 현재 시점에서 최신의 데이터베이스 등록물을 지칭한다. 하나의 유전자 또는 단백질이 복수의 서열 수탁 번호를 참조할 때, 모든 서열 변이체가 포함된다.
열거된 구현예
1.
발현 리프레서로서,
MYC 프로모터에 결합하는 표적화 모이어티, 및
선택적으로, 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
2.
구현예 1에 있어서, 상기 표적화 모이어티는 서열번호 4, 199, 또는 201의 1400, 1200, 1000, 800, 600, 400, 또는 200 nt 상류 또는 하류 내에 있는 게놈 유전자좌에 결합하는, 발현 리프레서.
3.
구현예 1에 있어서, 상기 표적화 모이어티는 서열번호 4, 77, 82, 83, 85, 199, 또는 201의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는, 발현 리프레서.
4.
발현 리프레서로서,
서열번호 3, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 109, 110, 75, 76, 78, 79, 80, 81, 84, 85, 86, 190, 191, 192, 200, 또는 202의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티 및
선택적으로, 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
5.
발현 리프레서로서,
서열번호 2, 77, 82, 83, 199, 또는 201의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티 및
선택적으로, 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
6.
발현 리프레서로서,
MYC 유전자좌에 결합하는 표적화 모이어티, 및
MQ1 또는 이의 단편 또는 변이체를 포함하는 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
7.
발현 리프레서로서,
MYC 슈퍼 인핸서 영역에서 유전자좌에 결합하는 표적화 모이어티,
선택적으로 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제를 포함하는 이펙터 모이어티이되, 선택적으로 MQ1 또는 이의 단편 또는 변이체를 포함하는, 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
8.
발현 리프레서로서,
MYC 슈퍼 인핸서 영역에서 유전자좌에 결합하는 표적화 모이어티,
전사 리프레서를 포함하는 이펙터 모이어티이되, 선택적으로 KRAB 또는 이의 단편 또는 변이체를 포함하는, 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
9.
구현예 7 또는 8에 있어서, 상기 표적화 모이어티는 서열번호 96 내지 110, 83, 199, 201 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는, 발현 리프레서.
10.
구현예 7 내지 9 중 어느 하나에 있어서, 상기 표적화 모이어티는 hg19 참조 게놈을 사용하여, GRCh37: chr8:129162465-129212140의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는, 발현 리프레서.
11.
구현예 7 내지 10 중 어느 하나에 있어서, 상기 표적화 모이어티는 서열번호 96 또는 108의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는, 발현 리프레서.
12.
구현예 7 내지 11 중 어느 하나에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인 또는 TAL 이펙터 도메인을 포함하는, 발현 리프레서.
13.
발현 리프레서로서,
유전자좌, 예를 들어 MYC 유전자좌에 결합하는 표적화 모이어티,
EZH2 또는 이의 단편 또는 변이체를 포함하는 제1 이펙터 모이어티, 및
KRAB 또는 이의 단편 또는 변이체를 포함하는 제2 이펙터 모이어티를 포함하며,
상기 유전자좌에서 발현을 감소시킬 수 있는, 예를 들어 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
14.
구현예 13에 있어서, 상기 표적화 모이어티는 MYC 프로모터, 슈퍼 인핸서 영역, 또는 앵커 서열에 결합하는, 발현 리프레서.
15.
구현예 13 또는 14에 있어서, 상기 표적화 모이어티는 TAL 이펙터 도메인, CRISPR/Cas 도메인, 또는 징크 핑거 도메인을 포함하는, 발현 리프레서.
16.
구현예 13 내지 15 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 제2 이펙터의 N-말단에 있거나, 제1 이펙터는 제2 이펙터 모이어티의 C-말단에 있는, 발현 리프레서.
17.
발현 리프레서로서,
MYC 유전자좌에 결합하되, 징크 핑거 도메인을 포함하는, 표적화 모이어티, 및
선택적으로, 이펙터 모이어티
를 포함하며,
상기 발현 리프레서는 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
18.
발현 리프레서로서,
MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 슈퍼 인핸서, 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 CRISPR/Cas 도메인을 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및
MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
19.
발현 리프레서로서,
MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 CRISPR/Cas 도메인을 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및
MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
20.
발현 리프레서로서,
MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 CRISPR/Cas 도메인을 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및
KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
21.
발현 리프레서로서,
MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는 CRISPR/Cas 도메인을 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및
KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
22.
발현 리프레서로서,
MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 징크 핑거 도메인을 포함하는 표적화 모이어티; 및
MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
23.
발현 리프레서로서,
MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 징크 핑거 도메인을 포함하는 표적화 모이어티; 및
KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
24.
발현 리프레서로서,
서열번호 190 내지 192 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 마우스 게놈 유전자좌에 결합하는 표적화 모이어티 및
선택적으로, 이펙터 모이어티
를 포함하며,
상기 발현 리프레서는 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
25.
제24항에 있어서, 상기 이펙터 모이어티는 DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
26.
구현예 24 또는 25에 있어서, 상기 표적화 모이어티는 TAL 이펙터 도메인, CRISPR/Cas 도메인, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제 도메인, 또는 올리고뉴클레오타이드를 포함하는, 발현 리프레서.
27.
구현예 24 내지 26 중 어느 하나에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인 또는 TAL 이펙터 도메인을 포함하는, 발현 리프레서.
28.
구현예 24 내지 27 중 어느 하나에 있어서, 상기 발현 리프레서는 서열번호 160 내지 165 중 임의의 것으로부터 선택되는 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
29.
구현예 24 내지 28 중 어느 하나에 있어서, 상기 발현 리프레서는 서열번호 166 내지 168 중 임의의 것으로부터 선택되는 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열에 의해 인코딩되는, 발현 리프레서.
30.
구현예 24 내지 29 중 어느 하나에 있어서, 상기 표적화 모이어티는 서열번호 154 내지 156 중 임의의 것에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
31.
구현예 24 내지 30 중 어느 하나에 있어서, 상기 표적화 모이어티는 서열번호 157 내지 159 중 임의의 것에 따른 핵산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
32.
구현예 24 내지 31 중 어느 하나에 있어서, 상기 이펙터 모이어티는 지속 가능한 이펙터 모이어티인, 발현 리프레서.
33.
구현예 24 내지 32 중 어느 하나에 있어서, 상기 이펙터 모이어티는 일시적인 이펙터 모이어티인, 발현 리프레서.
34. 구현예 24 내지 33 중 어느 하나에 있어서, 상기 발현 리프레서는 융합 분자인, 발현 리프레서.
35.
구현예 24 내지 34 중 어느 하나에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인을 포함하고, 이펙터 모이어티는 후성유전학적 변형 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
36.
구현예 18 내지 20, 22, 또는 23 중 어느 하나에 있어서, 상기 조절 요소는 조절 요소 클러스터의 일부인, 발현 리프레서.
37.
구현예 18 내지 20, 22, 또는 23 중 어느 하나에 있어서, 상기 조절 요소는 비-코딩 영역에 위치하는, 발현 리프레서.
38.
구현예 18 내지 20, 22, 또는 23 중 어느 하나에 있어서, 상기 조절 요소는, 예를 들어 표적 유전자 프로모터, 예를 들어 MYC로부터 적어도 1,000 nt 떨어져 위치한 원위 인핸서인, 발현 리프레서.
39.
구현예 18 내지 20, 22, 23 또는 36 내지 38 중 어느 하나에 있어서, 상기 조절 요소는 표적 유전자, 예를 들어 MYC의 발현을 증가시키는, 발현 리프레서.
40.
구현예 18 내지 20, 22, 23, 또는 36 내지 39 중 어느 하나에 있어서, 상기 조절 요소는 하나 이상의 돌연변이를 포함하는, 발현 리프레서.
41.
구현예 18 내지 20, 22, 23, 또는 36 내지 40 중 어느 하나에 있어서, 상기 조절 요소는 적어도 하나의 질환-연관 단일 뉴클레오타이드 다형성(SNP)을 포함하는, 발현 리프레서.
42.
구현예 18 내지 20, 22, 23, 또는 36 내지 41 중 어느 하나에 있어서, 상기 전사 조절 요소는 인핸서 도킹(docking) 부위를 통해 표적 유전자, 예를 들어 MYC의 프로모터와 상호작용하는, 발현 리프레서.
43.
구현예 42에 있어서, 상기 인핸서 도킹 부위는 서열번호 71 내지 74 중 임의의 것에 따른 뉴클레오타이드 서열을 포함하는, 발현 리프레서.
44.
발현 리프레서로서,
MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는 징크 핑거 도메인을 포함하는 표적화 모이어티; 및
KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
45.
구현예 1 내지 23 또는 36 내지 43 중 어느 하나에 있어서, 상기 발현 리프레서는 서열번호 22 내지 37, 129, 133, 134, 139 내지 149, 또는 177 내지 186 중 임의의 것으로부터 선택되는 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
46.
구현예 1 내지 23 또는 36 내지 45 중 어느 하나에 있어서, 상기 발현 리프레서는 서열번호 55 내지 70, 130, 189, 또는 193 내지 197 중 임의의 것으로부터 선택되는 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열에 의해 인코딩되는, 발현 리프레서.
47.
구현예 1 내지 23 또는 36 내지 46 중 어느 하나에 있어서, 상기 표적화 모이어티는 서열번호 5 내지 16, 또는 169 내지 172 중 임의의 것에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
48.
선행하는 구현예 중 어느 하나에 있어서, 상기 이펙터 모이어티는 서열번호 18 19, 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
49.
구현예 1 내지 12, 17 내지 19, 22, 36 내지 42, 또는 44 내지 47 중 어느 하나에 있어서, 상기 이펙터 모이어티는 지속 가능한 이펙터 모이어티인, 발현 리프레서.
50.
구현예 1 내지 23, 또는 36 내지 48 중 어느 하나에 있어서, 상기 이펙터 모이어티는 일시적인 이펙터 모이어티인, 발현 리프레서.
51.
구현예 1 내지 12, 17 내지 19, 22, 36 내지 42, 또는 44 내지 48에 있어서, 상기 이펙터 모이어티는 DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
52.
구현예 1 내지 23, 36 내지 47 또는 49에 있어서, 상기 이펙터 모이어티는 전사 리프레서를 포함하고, 예를 들어 KRAB 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
53.
선행하는 구현예 중 어느 하나에 있어서, 상기 표적화 모이어티는 TAL 이펙터 도메인, CRISPR/Cas 도메인, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제 도메인, 또는 올리고뉴클레오타이드를 포함하는, 발현 리프레서.
54.
구현예 53에 있어서, 상기 CRISPR/Cas 도메인은 gRNA, 예를 들어 서열번호 1 내지 4 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 gRNA에 결합하며, gRNA는 서열번호 1 내지 4 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 서열을 포함하는, 발현 리프레서.
55.
구현예 53에 있어서, 상기 CRISPR/Cas 도메인은 gRNA, 예를 들어 서열번호 96 내지 110 중 어느 하나의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 gRNA에 결합하며, gRNA는 서열번호 96 내지 110 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 서열을 포함하는, 발현 리프레서.
56.
구현예 53 내지 55에 있어서, 상기 CRISPR/Cas 도메인은 표 1로부터 선택되는 Cas 단백질 또는 Cpf1 단백질 또는 이들 중 임의의 변이체(예를 들어, 돌연변이체)를 포함하는, 발현 리프레서.
57.
구현예 53 내지 56 중 어느 하나에 있어서, 상기 CRISPR/Cas 도메인은 촉매적으로 비활성인 CRISPR/Cas 단백질, 예를 들어 dCas9를 포함하는, 발현 리프레서.
58.
구현예 53에 있어서, 상기 징크 핑거 도메인은 서열번호 96 내지 110 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하며, 예를 들어 gRNA는 서열번호 96 내지 110 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 서열을 포함하는, 발현 리프레서.
59.
구현예 17, 22, 26 내지 53, 또는 57 중 어느 하나에 있어서, 상기 징크 핑거 도메인은 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 징크 핑거(및 선택적으로 11, 10, 9, 8, 7, 6, 또는 5개 이하의 징크 핑거)를 포함하는, 발현 리프레서.
60.
구현예 17, 22, 26 내지 53, 57, 또는 58 중 어느 하나에 있어서, 상기 징크 핑거 도메인은 1 내지 10, 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 1 내지 2, 2 내지 10, 2 내지 9, 2 내지 8, 2 내지 7, 2 내지 6, 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 10, 3 내지 9, 3 내지 8, 3 내지 7, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 10, 4 내지 9, 4 내지 8, 4 내지 7, 4 내지 6, 4 내지 5, 5 내지 10, 5 내지 9, 5 내지 8, 5 내지 7, 5 내지 6, 6 내지 10, 6 내지 9, 6 내지 8, 6 내지 7, 7 내지 10, 7 내지 9, 7 내지 8, 8 내지 10, 8 내지 9, 또는 9 내지 10개의 징크 핑거를 포함하는, 발현 리프레서.
61.
구현예 17, 22, 26 내지 53, 또는 57 내지 59에 있어서, 상기 징크 핑거 도메인은 3 또는 9개의 징크 핑거를 포함하는, 발현 리프레서.
62.
선행하는 구현예 중 어느 하나에 있어서, 융합 분자인, 발현 리프레서.
63.
선행하는 구현예 중 어느 하나에 있어서, 표적화 도메인과 이펙터 도메인 사이에 위치하는 링커를 포함하며, 선택적으로 링커는 서열번호 137 또는 서열번호 138에 따른 아미노산 서열을 포함하는, 발현 리프레서.
64.
구현예 1 내지 17, 20, 21, 23, 44 내지 48, 50, 또는 52 내지 57에 있어서, 상기 표적화 모이어티는 촉매적으로 비활성인 CRISPR/Cas 도메인(예를 들어, dCas9)을 포함하고, 이펙터 모이어티는 전사 리프레서, 예를 들어 KRAB 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
65.
구현예 1 내지 17, 20, 21, 23, 44 내지 48, 50, 52, 또는 53 내지 64에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인을 포함하고, 이펙터 모이어티는 전사 리프레서, 예를 들어 KRAB 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
66.
구현예 17, 36 내지 43, 45 내지 47, 53, 또는 58 내지 63에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인을 포함하고, 발현 리프레서는 이펙터 모이어티를 포함하지 않는, 발현 리프레서.
67.
구현예 1 내지 12, 18 내지 19, 22, 36 내지 43, 45 내지 49, 51, 또는 53 내지 57에 있어서, 상기 표적화 모이어티는 촉매적으로 비활성인 CRISPR/Cas 도메인(예를 들어, dCas9)을 포함하고 이펙터 모이어티는 후성유전학적 변형 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
68.
구현예 1 내지 12, 17 내지 19, 22, 36 내지 43, 45 내지 49, 51, 53, 또는 58 내지 63에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인을 포함하고, 이펙터 모이어티는 후성유전학적 변형 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
69.
선행하는 구현예 중 어느 하나에 있어서, 서열번호 22 내지 37, 129, 133, 134, 139 내지 149, 또는 177 내지 186 중 임의의 것의 아미노산 서열, 또는 이와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 동일성을 갖는 서열을 포함하는, 발현 리프레서.
70.
선행하는 구현예 중 어느 하나에 있어서, (i) 하나 이상의 핵 국재화 신호 서열(NLS)을 포함하거나, (ii) NLS를 포함하지 않는, 발현 리프레서.
71.
선행하는 구현예 중 어느 하나에 있어서, N 말단에 제1 NLS를 포함하며, 예를 들어 제1 NLS는 서열번호 88의 서열을 갖는, 발현 리프레서.
72.
선행하는 구현예 중 어느 하나에 있어서, C-말단에 NLS, 예를 들어 제2 NLS를 포함하며, 예를 들어 서열번호 89의 서열을 갖는, 발현 리프레서.
73. 선행하는 구현예 중 어느 하나에 있어서, 제1 및 제2 NLS는 동일한 서열을 갖는, 발현 리프레서.
74.
구현예 71 내지 73 중 어느 하나에 있어서, 제1 및 제2 NLS는 상이한 서열을 갖는, 발현 리프레서.
75.
선행하는 구현예 중 어느 하나에 있어서, 에피토프 태그를 포함하는, 발현 리프레서.
76.
구현예 75에 있어서, 상기 에피토프 태그는 HA 태그인, 발현 리프레서.
77.
선행하는 구현예 중 어느 하나에 있어서, 상기 앵커 서열은 서열번호 71 또는 72의 서열, 또는 이에 대해 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 변경을 갖는 서열을 포함하는, 발현 리프레서.
78.
구현예 1 내지 77 중 어느 하나에 있어서, 상기 앵커 서열은 서열번호 73 또는 74에 따른 서열, 또는 이에 대해 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 변경을 갖는 서열을 포함하는, 발현 리프레서.
79.
선행하는 구현예 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자와 동일한 염색체 상에 있는, 발현 리프레서.
80.
선행하는 구현예 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자의 상류(예를 들어, TSS의 상류 또는 프로모터의 상류)에 있는, 발현 리프레서.
81.
선행하는 구현예 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자로부터(예를 들어, MYC 유전자의 TSS 또는 프로모터로부터) 적어도 1, 5, 10, 50, 100, 또는 1000 킬로베이스 떨어져 있는, 발현 리프레서.
82.
선행하는 구현예 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자로부터(예를 들어, TSS 또는 MYC 유전자의 프로모터로부터) 0.1 내지 0.5, 0.1 내지 1, 0.1 내지 5, 0.1 내지 10, 0.1 내지 50, 0.1 내지 100, 0.1 내지 500, 0.1 내지 1000, 0.5 내지 1, 0.5 내지 5, 0.5 내지 10, 0.5 내지 50, 0.5 내지 100, 0.5 내지 500, 0.5 내지 1000, 1 내지 5, 1 내지 10, 1 내지 50, 1 내지 100, 1 내지 500, 1 내지 1000, 5 내지 10, 5 내지 50, 5 내지 100, 5 내지 500, 5 내지 1000, 10 내지 50, 10 내지 100, 10 내지 500, 10 내지 1000, 50 내지 100, 50 내지 500, 50 내지 1000, 100 내지 500, 100 내지 1000, 또는 500 내지 1000 킬로베이스 떨어져 있는, 발현 리프레서.
83.
구현예 1 내지 79 또는 81 내지 82 중 어느 하나에 있어서, 상기 표적 서열은 MYC 유전자의 하류(예를 들어, TSS의 하류 또는 프로모터의 상류)에 있는, 발현 리프레서.
84.
선행하는 구현예 중 어느 하나에 있어서, 상기 표적화 모이어티는 염색체 좌표 128746342-128746364, 128746321-128746343, 128746525-128746547, 128748014-128748036, 129188878-129188900, 129188958-129188980, 129188960-129188982, 129189067-129189089, 129189457-129189479, 129189554-129189576, 129189679-129189701, 129209511-129209533, 129209643-129209665, 129209658-129209680, 129209856-129209878, 129189452-129189474, 129189190-129189212, 129189274-129189296, 129189421-129189443, 128746405-128746425, 128748069-128748089, 129188825-129188845, 또는 129188822-129188842에서의 서열, 또는 이에 근접한 서열에 결합하는, 발현 리프레서.
85.
선행하는 구현예 중 어느 하나에 있어서, 표적 유전자 유전자좌, 예를 들어 MYC에 대한 발현 리프레서의 결합은, 예를 들어 ELISA에 의해 측정 시 또는 실시예 7 또는 28 중 임의의 것에 기재된 바와 같이, 발현 리프레서의 부재 시 메틸화와 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 표적 유전자 유전자좌, 예를 들어 MYC에서의 부위에서 메틸화를 증가시키며, 선택적으로 메틸화에 대해 분석되는 부위는 hg19 참조 게놈에 따른 chr8:129188693-129189048이고, 예를 들어 서열번호 123에 따른 서열을 포함하는, 발현 리프레서.
86.
선행하는 구현예 중 어느 하나에 있어서, 상기 표적 유전자 유전자좌, 예를 들어 MYC에 대한 발현 리프레서의 결합은, 실시예 28에 기재된 바와 같이 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 표적 유전자 유전자좌, 예를 들어 MYC의 부위에서 메틸화를 증가시키는, 발현 리프레서.
87.
선행하는 구현예 중 어느 하나에 있어서, MYC 유전자좌에 대한 발현 리프레서의 결합은, 예를 들어 ELISA에 의해 측정 시 또는 실시예 2 내지 7 또는 9 중 임의의 것에 기재된 바와 같이, 발현 리프레서의 부재 시 발현과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 세포에서 MYC의 발현을 감소시키는, 발현 리프레서.
88.
선행하는 구현예 중 어느 하나에 있어서, 상기 MYC 유전자좌에 대한 발현 리프레서의 결합은, ELISA에 의해 측정 시 또는 실시예 2 내지 7 또는 9 중 임의의 것에 기재된 바와 같이, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 발현 리프레서.
89.
선행하는 구현예 중 어느 하나에 있어서, 상기 MYC 유전자좌에 대한 발현 리프레서의 결합은 형질감염 후 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 80, 또는 96시간 후에 MYC의 발현을 상당히 감소시키는, 발현 리프레서.
90.
구현예 1 내지 23 또는 36 내지 89 중 어느 하나에 있어서, 상기 표적화 모이어티는 인간 게놈 유전자좌에 결합하는, 발현 리프레서.
91.
구현예 24 내지 43 49, 51, 53, 56 내지 57, 59 내지 62, 66 내지 68, 70 내지 89 중 어느 하나에 있어서, 상기 표적화 모이어티는 마우스 게놈 유전자좌에 결합하는, 발현 리프레서.
92.
선행하는 구현예 중 어느 하나에 있어서, 상기 MYC 유전자좌에 대한 발현 리프레서의 결합은 MYC 유전자좌를 포함하는 세포(예를 들어, 암 세포)의 생존능을 감소시키는, 발현 리프레서.
93.
선행하는 구현예 중 어느 하나에 있어서, 복수의 세포를 발현 리프레서 또는 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것은 복수의 세포의 생존능을 감소시키는, 발현 리프레서.
94.
선행하는 구현예 중 어느 하나에 있어서, 생존능은, 예를 들어 CellTiter Glo에 의해 측정 시 또는 실시예 2 내지 7 중 임의의 것에 기재된 바와 같은, 제1 발현 리프레서의 부재 시 생존능과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 발현 리프레서.
95.
선행하는 구현예 중 어느 하나에 있어서, 상기 발현 리프레서의 투여는 적어도 5%, 6%, 7%, 8%, 9% 10%, 12%, 15%, 17%, 20%, 25% 30%, 40%, 45%, 50%, 55%, 60%, 65%, 75%의 표적 세포(예를 들어, 암 세포)의 아폽토시스를 초래하는, 발현 리프레서.
96.
선행하는 구현예 중 어느 하나에 있어서, 상기 복수의 세포는 복수의 암 세포 및 복수의 비-암 세포 및/또는 복수의 감염 세포 및 복수의 비감염 세포를 포함하는, 발현 리프레서.
97.
선행하는 구현예 중 어느 하나에 있어서, 상기 복수의 세포를 발현 리프레서 또는 발현 리프레서를 인코딩하는 핵산을 접촉시키는 것은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 더 많이 감소시키는, 발현 리프레서.
98.
선행하는 구현예 중 어느 하나에 있어서, 상기 복수의 세포를 발현 리프레서 또는 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 많이 감소시키는, 발현 리프레서.
99.
구현예 92 내지 97 중 어느 하나에 있어서, 상기 암 세포는 폐암 세포, 위암 세포, 위장관암 세포, 결장직장암 세포, 췌장암 세포, 또는 간암 세포인, 발현 리프레서.
100.
구현예 92 내지 99 중 어느 하나에 있어서, 상기 암은 간세포 암종 (HCC), 섬유층판 간세포 암종(FHCC), 담관암종, 혈관육종, 2차 간암, 비소세포 폐암(NSCLC), 선암종, 소세포 폐암(SCLC), 대세포 (미분화) 암종, 삼중 음성 유방암, 위 선암종, 자궁내막 암종, 또는 췌 암종인, 발현 리프레서.
101.
선행하는 구현예 중 어느 하나에 있어서, 복수의 감염 세포 및 복수의 비감염 세포와 접촉될 때, 복수의 비감염 세포의 생존능을 감소시키는 것보다 복수의 감염 세포의 생존능을 더 많이 감소시키는, 발현 리프레서.
102.
선행하는 구현예 중 어느 하나에 있어서, 상기 감염은 바이러스성인, 발현 리프레서.
103.
구현예 102에 있어서, 상기 바이러스 감염은 간염, 예를 들어 B형 간염인, 발현 리프레서.
104.
구현예 92 내지 103 중 어느 하나에 있어서, 상기 감염 세포는 인간 간세포인, 발현 리프레서.
105.
선행하는 구현예 중 어느 하나에 있어서, 발현 리프레서를 인코딩하는 mRNA의 LNP 전달을 사용하여 암 세포(예를 들어, HCC 세포)의 생존력에 대한 분석에서, 예를 들어 실시예 12에 따른 분석에서 테스트될 때 EC50이 0.04 내지 0.4, 0.04 내지 0.1, 0.1 내지 0.2, 0.2 내지 0.3, 또는 0.3 내지 0.4 μg/mL인, 발현 리프레서.
106.
구현예 1 내지 104 중 어느 하나에 있어서, 발현 리프레서를 인코딩하는 mRNA의 LNP 전달을 사용하여 암 세포(예를 들어, 폐암 세포)의 생존력에 대한 분석에서, 예를 들어 실시예 18에 따른 분석에서 테스트될 때 EC50이 0.1 내지 2.5, 0.5 내지 2.2, 1.0 내지 1.5, 1.2 내지 2 μg/mL인, 발현 리프레서.
107.
선행하는 구현예 중 어느 하나에 있어서, 발현 리프레서를 인코딩하는 mRNA의 LNP 전달을 사용하여 암 세포(예를 들어, HCC 세포)에서 MYC mRNA 수준을 감소시키는 것에 대한 분석에서, 예를 들어 실시예 12에 따른 분석에서 테스트될 때 EC50이 0.004 내지 0.08, 0.004 내지 0.01, 0.01 내지 0.02, 0.02 내지 0.04, 또는 0.04 내지 0.08 μg/mL인, 발현 리프레서.
108.
선행하는 구현예 중 어느 하나에 있어서, 발현 리프레서를 인코딩하는 mRNA의 LNP 전달을 사용하여 암 세포(예를 들어, 폐암 세포)에서 MYC mRNA 수준을 감소시키는 것에 대한 분석에서, 예를 들어 실시예 18에 따른 분석에서 테스트될 때 EC50이 0.04 내지 0.1, 0.04 내지 0.09, 0.05 내지 0.09, 또는 0.06 내지 0.8 μg/mL인, 발현 리프레서.
109.
선행하는 구현예 중 어느 하나에 있어서, 세포에서 표적 유전자, 예를 들어 MYC에 의해 인코딩되는 단백질의 수준을 비처리 세포에서 단백질 수준과 비교하여 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%만큼 감소시키는, 발현 리프레서.
110.
선행하는 구현예 중 어느 하나에 있어서, 예를 들어 인간 대상체 또는 포유동물 모델에서, 종양 부피를 감소시킬 수 있는, 발현 리프레서.
111.
선행하는 구현예 중 어느 하나에 있어서, 상기 발현 리프레서는, 예를 들어 치료 개시 후 20일째에 측정될 때, 예를 들어 포유동물 모델에서 화학요법제와 비교하여 유사하거나 더 큰 정도로 종양 부피를 감소시킬 수 있으며, 예를 들어 발현 리프레서는 3 mg/kg의 용량으로 5일마다 투여되는, 발현 리프레서.
112.
선행하는 구현예 중 어느 하나에 있어서, 상기 발현 리프레서는, 예를 들어 치료 개시 후 20일째에 측정될 때, 예를 들어 포유동물 모델에서 PBS 대조군과 비교하여 종양 부피를 감소시킬 수 있으며, 예를 들어 발현 리프레서는 4회 용량으로 5일마다 투여한 후 1 mg/kg, 1.5 mg/kg, 또는 3 mg/kg의 3회 용량으로 3일마다 투여되는, 발현 리프레서.
113.
선행하는 구현예 중 어느 하나에 있어서, 상기 종양 부피는, 예를 들어 치료 시작 후 20일째에, PBS로 처리된 대조군과 비교하여 적어도 약 10%, 20%, 30%, 또는 40%만큼 감소되는, 발현 리프레서.
114.
구현예 111 내지 113 중 어느 하나에 있어서, 상기 화학요법제는 소라페닙 또는 시스플라틴인, 발현 리프레서.
115.
선행하는 구현예 중 어느 하나에 있어서, 상기 시스템은 소분자 MYC 억제제와 비교하여 유사하거나 더 큰 정도로 종양 부피를 감소시킬 수 있는, 발현 리프레서.
116.
구현예 115에 있어서, 상기 소분자 MYC 억제제는 MYCi975이며, 선택적으로 종양 부피는, 예를 들어 치료 시작 후 20일째에, MYCi975로 처리된 대조군과 비교하여 적어도 약 10%, 20%, 30%, 또는 40%만큼 감소되는, 발현 리프레서.
117.
선행하는 구현예 중 어느 하나에 있어서, 치료 시작 시와 비교하여 체중의 감소를 유발하지 않거나, 3%, 2%, 또는 1% 미만의 체중 감소를 유발하는, 발현 리프레서.
118.
시스템으로서,
선행하는 구현예 중 어느 하나에 있어서의 제1 발현 리프레서, 및
제2 발현 리프레서, 예를 들어 본 명세서에 기재된 제2 발현 리프레서, 예를 들어 선행하는 구현예 중 어느 하나의 제2 발현 리프레서
를 포함하는 시스템.
119.
시스템으로서,
제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하되, MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합하는, 제1 발현 리프레서, 및
제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하되, MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는 제2 발현 리프레서
를 포함하는, 시스템.
120.
구현예 118 또는 119에 있어서,
상기 전사 조절 요소는 프로모터를 포함하고,
상기 앵커 서열은 CTCF 결합 모티프를 포함하는, 시스템.
121.
구현예 118 내지 120 중 어느 하나에 있어서, 제2 발현 리프레서는 CTCF 결합 모티프에 인접한 하류 영역에 결합하는, 시스템.
122.
구현예 118 내지 120 중 어느 하나에 있어서, 제2 발현 리프레서는 CTCF 결합 모티프에 인접한 상류 영역에 결합하는, 시스템.
123.
구현예 118 내지 122 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 서열번호 2, 3, 4, 71 내지 86, 또는 200 내지 206의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하고;
상기 제2 발현 리프레서는 서열번호 2, 3, 4, 71 내지 86, 또는 200 내지 206의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는, 시스템.
124.
구현예 118 내지 123 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 서열번호 96 내지 110 중 임의의 것의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는, 시스템.
125.
구현예 118 내지 124 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 서열번호 71, 서열번호 72, 또는 서열번호 83의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하고;
상기 제2 발현 리프레서는 서열번호 77의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는, 시스템.
126.
시스템으로서,
제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하며, MYC 유전자에 작동가능하게 연결된 프로모터 또는 프로모터에 근접한 서열에 결합하는 제1 발현 리프레서, 및
제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하며, MYC 유전자의 인핸서(예를 들어, 슈퍼-인핸서)에 결합하는, 제2 발현 리프레서
를 포함하는 시스템.
127.
구현예 126에 있어서,
제1 발현 리프레서는 서열번호 204의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하고,
제2 발현 리프레서는 서열번호 199 또는 201 중 임의의 것의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는, 시스템.
128.
MYC 발현을 감소시키는 시스템으로서,
a)
i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는 제1 발현 리프레서: 및
b)
i) 서열번호 7, 169, 또는 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는 제2 발현 리프레서
를 포함하는, 시스템.
129.
구현예 128에 있어서, 제1 발현 리프레서는, 예를 들어 제1 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
130.
구현예 128 또는 129에 있어서, 상기 제1 발현 리프레서는, 예를 들어 제1 이펙터 모이어티의 C-말단에 위치하는, 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
131.
구현예 128 내지 130 중 어느 하나에 있어서, 상기 제2 발현 리프레서는, 예를 들어 제2 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
132.
구현예 128 내지 131 중 어느 하나에 있어서, 상기 제2 발현 리프레서는, 예를 들어 제2 이펙터 모이어티의 C-말단에 위치하는, 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
133.
구현예 128 내지 132 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 제1 표적화 모이어티와 제1 이펙터 모이어티 사이에 위치하는 제1 링커를 추가로 포함하되, 선택적으로 제1 링커는 서열번호 137에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
134.
구현예 128 내지 133 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 제2 표적화 모이어티와 제2 이펙터 모이어티 사이에 위치하는 제2 링커를 추가로 포함하되, 선택적으로 제2 링커는 서열번호 138에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
135.
구현예 128 내지 134 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 제1 이펙터 모이어티의 C-말단에 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 126에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
136.
구현예 128 내지 132 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 제2 표적화 모이어티의 N-말단에 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 128에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
137.
구현예 128 내지 136 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
138.
구현예 128 내지 137 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 24에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
139.
구현예 128 내지 137 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 서열번호 169에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
140.
구현예 128 내지 137 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 서열번호 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
141.
구현예 128 내지 140 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 177 또는 183에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
142.
구현예 128 내지 140 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 179, 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
143.
구현예 128 내지 142 중 어느 하나의 시스템의 제1 발현 리프레서 및 제2 리프레서를 인코딩하는 핵산.
144.
MYC 발현을 감소시키는 시스템을 인코딩하는 핵산으로서,
a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서, 상기 제1 발현 리프레서는
i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는, 제1 영역, 및
b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서, 제2 발현 리프레서는
i) 서열번호 7에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는, 제2 영역
을 포함하는, 핵산.
145.
구현예 144에 있어서, 상기 제1 영역은 제2 영역의 5'인, 핵산.
146.
구현예 144에 있어서, 상기 제1 영역은 제2 영역의 3'인, 핵산.
147.
구현예 145 또는 146에 있어서, 상기 제1 영역은, 예를 들어 제1 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
148.
구현예 145 내지 147 중 어느 하나에 있어서, 상기 제1 영역은, 예를 들어 제1 이펙터 모이어티의 C-말단에 위치하는, 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
149.
구현예 145 내지 148 중 어느 하나에 있어서, 상기 제2 영역은, 예를 들어 제2 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
150.
구현예 145 내지 149 중 어느 하나에 있어서, 상기 제2 영역은, 예를 들어 제2 이펙터 모이어티의 C-말단에 위치하는, 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
151.
구현예 145 내지 150 중 어느 하나에 있어서, 상기 제1 영역은 제1 표적화 모이어티와 제1 이펙터 모이어티 사이에 위치하는 제1 링커를 인코딩하는 뉴클레오타이드 서열을 추가로 포함하며, 선택적으로 제1 링커는 서열번호 137에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
152.
구현예 145 내지 151 중 어느 하나에 있어서, 상기 제2 영역은 제2 표적화 모이어티와 제2 이펙터 모이어티 사이에 위치하는 제2 링커를 인코딩하는 뉴클레오타이드 서열을 추가로 포함하며, 선택적으로 제2 링커는 서열번호 138에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
153.
구현예 145 내지 152 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티의 C-말단의 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 126에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 인코딩하는 뉴클레오타이드 서열을 추가로 포함하는, 핵산.
154.
구현예 145 내지 153에 있어서, 상기 제2 영역은 제2 표적화 모이어티의 N-말단의 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 128에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 인코딩하는 뉴클레오타이드 서열을 추가로 포함하는, 핵산.
155.
구현예 145 내지 154 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
156.
구현예 145 내지 155 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 24에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
157.
구현예 145 내지 156 중 어느 하나에 있어서, 상기 제1 영역은 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 46 또는 131에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
158.
구현예 145 내지 157 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 52 또는 132에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
159.
구현예 145 내지 158 중 어느 하나에 있어서, 상기 제2 영역은 제2 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제2 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 40에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
160.
구현예 145 내지 159 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 51에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
161.
구현예 145 내지 160 중 어느 하나에 있어서, 상기 제1 영역은 서열번호 63 또는 130에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
162.
구현예 145 내지 161 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 57에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
163.
MYC 발현을 감소시키는 시스템을 인코딩하는 핵산으로서,
a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서, 상기 제1 발현 리프레서는
i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는, 제1 영역, 및
b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서, 제2 발현 리프레서는
i) 서열번호 169에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는, 제2 영역
을 포함하는, 핵산.
164.
MYC 발현을 감소시키는 시스템을 인코딩하는 핵산으로서,
a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서, 상기 제1 발현 리프레서는
i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는, 제1 영역:, 및
b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서, 상기 제2 발현 리프레서는
i) 서열번호 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는, 제2 영역
을 포함하는, 핵산.
165.
구현예 163 또는 164에 있어서, 상기 제1 영역은 제2 영역의 5'인, 핵산.
166.
구현예 163 또는 164에 있어서, 상기 제1 영역은 제2 영역의 3'인, 핵산.
167.
구현예 163 내지 166 중 어느 하나에 있어서, 상기 제1 영역은, 예를 들어 제1 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
168.
구현예 163 내지 167 중 어느 하나에 있어서, 상기 제1 영역은, 예를 들어 제1 이펙터 모이어티의 C-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
169.
구현예 163 내지 168 중 어느 하나에 있어서, 상기 제2 영역은, 예를 들어 제2 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
170.
구현예 163 내지 169 중 어느 하나에 있어서, 상기 제2 영역은, 예를 들어 제2 이펙터 모이어티의 C-말단에 위치하는, 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
171.
구현예 163 내지 170 중 어느 하나에 있어서, 상기 제1 영역은 제1 표적화 모이어티와 제1 이펙터 모이어티 사이에 위치하는 제1 링커를 인코딩하는 뉴클레오타이드 서열을 추가로 포함하며, 선택적으로 제1 링커는 서열번호 137에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
172.
구현예 163 내지 171 중 어느 하나에 있어서, 상기 제2 영역은 제2 표적화 모이어티와 제2 이펙터 모이어티 사이에 위치하는 제2 링커를 인코딩하는 뉴클레오타이드 서열을 추가로 포함하며, 선택적으로 제2 링커는 서열번호 138에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
173.
구현예 163 내지 171 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티의 C-말단의 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 126에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 인코딩하는 뉴클레오타이드 서열을 추가로 포함하는, 핵산.
174.
구현예 163 내지 173에 있어서, 상기 제2 영역은 제2 표적화 모이어티의 N-말단의 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 128에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 인코딩하는 뉴클레오타이드 서열을 추가로 포함하는, 핵산.
175.
구현예 163 내지 174 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
176.
구현예 144 내지 175 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 177, 또는 183에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
177.
구현예 144 내지 176 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 179, 또는 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
178.
구현예 144 내지 177 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하고, 제2 발현 리프레서는 서열번호 24, 141, 177, 179, 183, 또는 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
179.
구현예 144 내지 178 중 어느 하나에 있어서, 상기 제1 영역은 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 46 또는 131에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
180.
구현예 144 내지 179 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 52 또는 132에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
181.
구현예 144 내지 180 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 173에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
182.
구현예 144 내지 181 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 175에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
183.
구현예 144 내지 182 중 어느 하나에 있어서, 상기 제2 영역은 제2 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제2 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 51에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
184.
구현예 144 내지 183 중 어느 하나에 있어서, 상기 제1 영역은 서열번호 63 또는 130에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
185.
구현예 144 내지 184 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 189에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
186. 구현예 144 내지 185 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 194에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
187.
구현예 144 내지 186 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 52 또는 132에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
188.
구현예 144 내지 187 중 어느 하나에 있어서, 상기 제1 영역은 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 46 또는 131에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
189.
구현예 144 내지 188 중 어느 하나에 있어서, 상기 제2 영역은 제2 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제2 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 51에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
190.
구현예 144 내지 189 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 189에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
191.
구현예 144 내지 190 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 194에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
192.
구현예 144 내지 191 중 어느 하나에 있어서, 서열번호 93, 112에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는 서열을 갖는, 핵산.
193.
구현예 144 내지 192 중 어느 하나에 있어서, 서열번호 196 또는 197에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 핵산.
194.
구현예 118 내지 193 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 제1 이펙터 모이어티를 포함하는, 시스템 또는 핵산.
195.
구현예 118 내지 194 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 제2 이펙터 모이어티를 포함하는, 시스템 또는 핵산.
196.
구현예 118 내지 195 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 제2 이펙터 모이어티와 상이한 아미노산 서열을 갖는, 시스템 또는 핵산.
197.
구현예 118 내지 196 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 지속 가능한 이펙터 모이어티인, 시스템 또는 핵산.
198.
구현예 118 내지 125 또는 144 내지 197 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 일시적인 이펙터 모이어티인, 시스템 또는 핵산.
199.
구현예 118 내지 198 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 후성유전학적 변형 모이어티인, 시스템 또는 핵산.
200.
구현예 118 내지 143, 163 내지 197 또는 199 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 히스톤 메틸트랜스퍼라제를 포함하는, 시스템 또는 핵산.
201.
구현예 200에 있어서, 상기 제1 이펙터 모이어티는 SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편, 예를 들어 이들 중 임의의 것의 SET 도메인으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
202.
구현예 118 내지 143, 163 내지 197 또는 199 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 히스톤 데메틸라제(예를 들어, 리신 데메틸라제)를 포함하는, 시스템 또는 핵산.
203.
구현예 202에 있어서, 상기 제1 이펙터 모이어티는 KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66(또는 이들 중 임의의 것의 기능성 변이체 또는 단편)으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
204.
구현예 118 내지 143, 163 내지 197 또는 199 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 히스톤 데아세틸라제를 포함하는, 시스템 또는 핵산.
205.
구현예 204에 있어서, 상기 제1 이펙터 모이어티는 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
206.
구현예 118 내지 197 또는 200 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제를 포함하는, 시스템 또는 핵산.
207.
구현예 206에 있어서, 상기 제1 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
208.
구현예 118 내지 143, 160 내지 196, 또는 198 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는, 예를 들어 전사 리프레서를 포함하는, 전사 리프레서 모이어티인, 시스템 또는 핵산.
209.
구현예 198 또는 199에 있어서, 상기 제1 이펙터 모이어티는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
210.
구현예 118 내지 209 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 전사 조절 요소 또는 이에 근접한 서열의 후성유전학적 변형을 촉진시키는, 시스템 또는 핵산.
211.
구현예 118 내지 210 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 전사 조절 요소 또는 이에 근접한 서열의 후성유전학적 변형을 촉매하는, 시스템 또는 핵산.
212.
구현예 118 내지 125, 194, 또는 197 내지 211 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 이펙터 모이어티를 포함하지 않는, 시스템 또는 핵산.
213.
구현예 118 내지 212 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 일시적인 이펙터 모이어티인, 시스템 또는 핵산.
214.
구현예 118 내지 125 또는 194 내지 211 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 지속 가능한 이펙터 모이어티인, 시스템 또는 핵산.
215.
구현예 118 내지 211 또는 214 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 후성유전학적 변형 모이어티인, 시스템 또는 핵산.
216.
구현예 118 내지 125, 194 내지 211, 또는 214 내지 215 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 히스톤 메틸트랜스퍼라제를 포함하는, 시스템 또는 핵산.
217.
구현예 216에 있어서, 상기 제2 이펙터 모이어티는 SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편, 예를 들어 이들 중 임의의 것의 SET 도메인으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
218.
구현예 118 내지 125, 194 내지 211, 또는 214 내지 215 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 히스톤 데메틸라제(예를 들어, 리신 데메틸라제)를 포함하는, 시스템 또는 핵산.
219.
구현예 218에 있어서, 상기 제2 이펙터 모이어티는 KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66(또는 이들 중 임의의 것의 기능성 변이체 또는 단편)으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
220.
구현예 118 내지 125, 194 내지 211, 또는 214 내지 215 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 히스톤 데아세틸라제를 포함하는, 시스템 또는 핵산.
221.
구현예 220에 있어서, 상기 제2 이펙터 모이어티는 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
222.
구현예 118 내지 125, 194 내지 211, 또는 214 내지 215 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제를 포함하는, 시스템 또는 핵산.
223.
구현예 222에 있어서, 상기 제2 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
224.
구현예 118 내지 211 또는 213 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 전사 리프레서 모이어티인, 시스템 또는 핵산.
225.
구현예 224에 있어서, 상기 제2 이펙터 모이어티는 앵커 서열 또는 이에 근접한 서열의 후성유전학적 변형을 촉진시키는, 시스템 또는 핵산.
226.
구현예 223 또는 224에 있어서, 상기 제2 이펙터 모이어티는 하나 이상의 내인성 후성유전학적 변형 단백질 또는 하나 이상의 내인성 전사 변형 단백질에 결합하는, 시스템 또는 핵산.
227.
구현예 223 내지 226 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 시스템 또는 핵산.
228.
구현예 118 내지 197, 199 내지 207, 210 내지 211, 213, 또는 224 내지 227 중 어느 하나에 있어서,
상기 제1 이펙터 모이어티는 지속 가능한 이펙터 모이어티이고,
제2 이펙터 모이어티는 일시적인 이펙터 모이어티인, 시스템 또는 핵산.
229.
구현예 228에 있어서, 상기 제1 이펙터 모이어티는 후성유전학적 변형 모이어티인, 시스템 또는 핵산.
230.
구현예 227 또는 228에 있어서, 상기 제2 이펙터 모이어티는 전사 리프레서 모이어티인, 시스템 또는 핵산.
231.
구현예 227 내지 230 중 어느 하나에 있어서,
상기 제1 이펙터 모이어티는 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 히스톤 데아세틸라제, DNA 메틸트랜스퍼라제, 이들 중 임의의 것의 기능성 변이체 또는 단편, 또는 이들 중 임의의 것의 조합을 포함하고,
제2 이펙터 모이어티는 전사 리프레서 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 시스템 또는 핵산.
232.
구현예 118 내지 125, 194, 197, 199 내지 207, 210 또는 212, 또는 190 중 어느 하나에 있어서,
상기 제1 이펙터 모이어티는 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 히스톤 데아세틸라제, DNA 메틸트랜스퍼라제, 이들 중 임의의 것의 기능성 변이체 또는 단편, 또는 이들 중 임의의 것의 조합을 포함하고,
제2 발현 리프레서는 제2 이펙터 모이어티를 포함하지 않는, 시스템 또는 핵산.
233.
구현예 118 내지 125, 199 내지 207, 210 내지 211, 213, 214, 또는 224 내지 231 중 어느 하나에 있어서,
제1 이펙터 모이어티는 SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 이들 중 임의의 것의 기능성 변이체 또는 단편, 또는 이들 중 임의의 것의 조합을 포함하고,
제2 이펙터 모이어티는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 이들 중 임의의 것의 기능성 변이체 또는 단편, 또는 이들 중 임의의 것의 조합을 포함하는, 시스템 또는 핵산.
234.
구현예 118 내지 197, 199, 206 내지 207, 210 내지 211, 213, 215, 224 내지 231, 또는 233 중 어느 하나에 있어서,
상기 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제를 포함하고,
제2 이펙터 모이어티는 전사 리프레서를 포함하는, 시스템 또는 핵산.
235.
구현예 118 내지 125, 194, 197, 200, 206 내지 207, 210 내지 212, 또는 232에 있어서,
상기 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제를 포함하고,
제2 발현 리프레서는 제2 이펙터 모이어티를 포함하지 않는, 시스템 또는 핵산.
236.
구현예 118 내지 125, 200, 206 내지 207, 210 내지 235 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
237.
구현예 118 내지 211, 214, 224 내지 234, 또는 236 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 시스템 또는 핵산.
238.
구현예 118 내지 211, 199, 206 내지 207, 210 내지 211, 213, 224 내지 234, 또는 236 내지 237 중 어느 하나에 있어서,
제1 이펙터 모이어티는 MQ1 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하고,
제2 이펙터는 KRAB 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 시스템 또는 핵산.
239.
구현예 118 내지 125, 194, 197, 199 내지 207, 또는 210 내지 212, 229, 232, 235, 또는 236 중 어느 하나에 있어서,
제1 이펙터 모이어티는 MQ1 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하고,
제2 발현 리프레서는 제2 이펙터 모이어티를 포함하지 않는, 시스템 또는 핵산.
240.
구현예 118 내지 200 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 22 내지 37, 129, 133, 134, 139 내지 149, 177 내지 180, 또는 183 내지 186 중 임의의 것으로부터 선택되는 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템 또는 핵산.
241.
구현예 118 내지 198, 200, 206 내지 211, 213 내지 216, 222 내지 223, 236 내지 237, 또는 240 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 22 내지 37, 129, 133, 134, 139 내지 149, 177 내지 180, 또는 183 내지 186 중 임의의 것으로부터 선택되는 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템 또는 핵산.
242.
구현예 118 내지 198, 200, 206 내지 211, 213 내지 216, 222 내지 223, 236 내지 237, 또는 240 내지 241 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 30, 129, 133의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하고, 제2 발현 리프레서는 서열번호 24, 134, 141, 177, 179, 183, 또는 185의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템 또는 핵산.
243.
구현예 118 내지 198, 200, 206 내지 211, 213 내지 216, 222 내지 223, 236 내지 237, 또는 240 내지 242 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 63 또는 130의 제1 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열에 의해 인코딩되고, 제2 발현 리프레서는 서열번호 57, 189, 또는 194의 제2 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열에 의해 인코딩되는, 시스템 또는 핵산.
244.
구현예 118 내지 198, 200, 206 내지 211, 213 내지 216, 222 내지 223, 236 내지 237, 또는 240 내지 243 중 어느 하나에 있어서, 상기 제1 및 제2 리프레서는 서열번호 93, 94, 112, 113, 196, 또는 197 의 핵산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열에 의해 인코딩되는, 시스템 또는 핵산.
245.
구현예 244에 있어서, 서열번호 91, 92, 121, 122, 181, 182, 187, 또는 188의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템 또는 핵산.
246.
구현예 118 내지 197, 199, 206 내지 207, 210 내지 211, 213, 215, 224 내지 231, 233 내지 234, 236 내지 237, 또는 240 내지 244 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 N-말단에서 C-말단으로
(i) 제1 핵 국재화 신호, 예를 들어 SV40 NLS; 예를 들어 서열번호 135에 따른 서열;
(ii) 제1 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF9; 예를 들어 서열번호 13에 따른 서열;
(iii) 제1 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1; 예를 들어, 서열번호 19 또는 87에 따른 서열;
(iv) 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하고;
상기 제2 발현 리프레서는 N-말단에서 C-말단으로
(v) 제3 핵 국재화 신호, 예를 들어 SV40NLS; 예를 들어 서열번호 135에 따른 서열;
(vi) 제2 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF3; 예를 들어, 서열번호 7에 따른 서열;
(vii) 제2 이펙터 모이어티, 예를 들어 KRAB, 예를 들어 서열번호 18에 따른 서열; 및
(viii) 제4 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하는, 시스템 또는 핵산.
247.
구현예 118 내지 197, 199, 206 내지 207, 210 내지 211, 213, 215, 224 내지 231, 233 내지 234, 236 내지 237, 또는 240 내지 244 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 N-말단에서 C-말단으로
(i) 제1 핵 국재화 신호, 예를 들어 SV40 NLS; 예를 들어 서열번호 135에 따른 서열;
(ii) 제1 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF9; 예를 들어 서열번호 13에 따른 서열;
(iii) 제1 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1; 예를 들어, 서열번호 19 또는 87에 따른 서열;
(iv) 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하고;
상기 제2 발현 리프레서는 N-말단에서 C-말단으로
(v) 제3 핵 국재화 신호, 예를 들어 SV40NLS; 예를 들어 서열번호 135에 따른 서열;
(vi) 제2 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF54; 예를 들어, 서열번호 169에 따른 서열;
(vii) 제2 이펙터 모이어티, 예를 들어 KRAB, 예를 들어 서열번호 18에 따른 서열; 및
(viii) 제4 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하는, 시스템 또는 핵산.
248.
구현예 118 내지 197, 199, 206 내지 207, 210 내지 211, 213, 215, 224 내지 231, 233 내지 234, 236 내지 237, 또는 240 내지 244 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 N-말단에서 C-말단으로
(i) 제1 핵 국재화 신호, 예를 들어 SV40 NLS; 예를 들어 서열번호 135에 따른 서열;
(ii) 제1 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF9; 예를 들어 서열번호 13에 따른 서열;
(iii) 제1 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1; 예를 들어, 서열번호 19 또는 87에 따른 서열;
(iv) 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하고;
상기 제2 발현 리프레서는 N-말단에서 C-말단으로
(v) 제3 핵 국재화 신호, 예를 들어 SV40NLS; 예를 들어 서열번호 135에 따른 서열;
(vi) 제2 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF67; 예를 들어, 서열번호 171에 따른 서열;
(vii) 제2 이펙터 모이어티, 예를 들어 KRAB, 예를 들어 서열번호 18에 따른 서열; 및
(viii) 제4 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하는, 시스템 또는 핵산.
249.
구현예 118 내지 248 중 어느 하나에 있어서, 상기 시스템은 제1 발현 리프레서 단독 또는 제2 발현 리프레서 단독과 비교하여 더 큰 정도로 MYC의 발현을 감소시킬 수 있는, 시스템.
250.
구현예 128 내지 194, 또는 242 내지 249에 있어서, 상기 시스템은 서열번호 22, 23, 25 내지 29, 31 내지 37 단독 또는 조합의 발현 리프레서 중 임의의 것과 비교하여 더 큰 정도로 MYC의 발현을 감소시킬 수 있는, 시스템.
251.
구현예 118 내지 250 중 어느 하나에 있어서, 예를 들어 인간 대상체 또는 포유동물 모델에서, 종양 부피를 감소시킬 수 있는, 시스템.
252.
구현예 128 내지 193 또는 242 내지 209 중 어느 하나에 있어서, 상기 시스템은, 예를 들어 치료 개시 후 20일째에 측정될 때, 예를 들어 포유동물 모델에서 화학요법제와 비교하여 유사하거나 더 큰 정도로 종양 부피를 감소시킬 수 있으며, 예를 들어 발현 리프레서는, 예를 들어 실시예 15에 기재된 바와 같은 모델 시스템에서, 3 mg/kg의 용량으로 5일마다 투여되는, 시스템.
253.
구현예 128 내지 193 또는 242 내지 252 중 어느 하나에 있어서, 상기 시스템은, 예를 들어 치료 개시 후 15일째에 측정될 때, 예를 들어 포유동물 모델에서 화학요법제와 비교하여 더 큰 정도로 종양 부피를 감소시킬 수 있으며, 예를 들어 발현 리프레서는, 예를 들어 실시예 14에 기재된 바와 같은 모델 시스템에서, 6 mg/kg의 용량으로 5일마다 투여되는, 시스템.
254.
구현예 128 내지 193 또는 242 내지 253 중 어느 하나에 있어서, 상기 종양 부피는, 예를 들어 치료 시작 후 20일째에, PBS로 처리된 대조군과 비교하여 적어도 약 10%, 20%, 30%, 40%, 50%, 또는 60%만큼 감소되는, 시스템.
255.
구현예 254에 있어서, 상기 화학요법제는 소라페닙 또는 시스플라틴인, 시스템.
256.
구현예 128 내지 193 또는 242 내지 253 중 어느 하나에 있어서, 상기 시스템은 소분자 MYC 억제제와 비교하여 유사하거나 더 큰 정도로 종양 부피를 감소시킬 수 있는, 시스템.
257.
구현예 256에 있어서, 상기 소분자 MYC 억제제는 MYCi975이며, 선택적으로 종양 부피는, 예를 들어 치료 시작 후 20일째에, MYCi975로 처리된 대조군과 비교하여 적어도 약 10%, 20%, 30%, 또는 40%만큼 감소되는, 시스템.
258.
구현예 118 내지 257 중 어느 하나에 있어서, 치료 시작 시와 비교하여 체중의 감소를 유발하지 않거나, 3%, 2%, 또는 1% 미만의 체중 감소를 유발하는, 시스템.
259.
구현예 118 내지 258 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 TAL 이펙터 도메인, CRISPR/Cas 도메인, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제, 또는 올리고뉴클레오타이드로부터 선택되는, 시스템 또는 핵산.
260.
구현예 118 내지 260 어느 하나에 있어서, 상기 제2표적화 모이어티는 TAL 이펙터 도메인, CRISPR/Cas 도메인, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제, 또는 올리고뉴클레오타이드로부터 선택되는, 시스템 또는 핵산.
261.
구현예 118 내지 260 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 CRISPR/Cas 도메인(예를 들어, 제1 CRISPR/Cas 도메인)을 포함하는, 시스템 또는 핵산.
262.
구현예 118 내지 261중 어느 하나에 있어서, 상기 제2표적화 모이어티는 제2 CRISPR/Cas 도메인(예를 들어, 제2 CRISPR/Cas 도메인)을 포함하는, 시스템 또는 핵산.
263.
구현예 262에 있어서, i) 제1 CRISPR/Cas 도메인은 제1 가이드 RNA에 결합하거나, ii) 제2 CRISPR/Cas 도메인은 제2 가이드 RNA에 결합하거나, iii) (i) 및 (ii) 둘 다인, 시스템 또는 핵산.
264.
구현예 262 또는 263에 있어서, 상기 제1 CRISPR/Cas 도메인은 제2 가이드 RNA에 결합하지 않거나 적어도 10, 20, 50, 100, 1000, 또는 10,000 nM의 KD로 결합하고, 제2 CRISPR/Cas 도메인은 제1 가이드 RNA에 결합하지 않거나 적어도 10, 20, 50, 100, 1000, 또는 10,000 nM의 KD로 결합하는, 시스템 또는 핵산.
265.
구현예 260 내지 264 중 어느 하나에 있어서, 상기 제1 CRISPR/Cas 도메인은 제2 CRISPR/Cas 도메인과 상이한 아미노산 서열을 포함하는, 시스템 또는 핵산.
266.
구현예 260 내지 265 중 어느 하나에 있어서, 상기 제1 또는 제2 CRISPR/Cas 도메인은 표 1로부터 선택되는 Cas 단백질 또는 Cpf1 단백질 또는 이들 중 임의의 것의 변이체(예를 들어, 돌연변이체)의 아미노산 서열을 포함하는, 시스템 또는 핵산.
267.
구현예 260 내지 266 중 어느 하나에 있어서, 상기 제1 CRISPR/Cas 도메인은 표 1로부터 선택되는 Cas 단백질 또는 Cpf1 단백질 또는 이들 중 임의의 것의 변이체(예를 들어, 돌연변이체)의 아미노산 서열을 포함하고, 상기 제2 CRISPR/Cas 도메인은 표 1로부터 선택되는 상이한 Cas 단백질 또는 Cpf1 단백질 또는 이들 중 임의의 것의 변이체(예를 들어, 돌연변이체)의 아미노산 서열을 포함하는, 시스템 또는 핵산.
268.
구현예 118 내지 260 중 어느 하나에 있어서, 제1 표적화 모이어티는 징크 핑거 도메인(예를 들어, 제1 징크 핑거 도메인)을 포함하는, 시스템 또는 핵산.
269.
구현예 118 내지 260 또는 268 중 어느 하나에 있어서, 제2 표적화 모이어티는 징크 핑거 도메인(예를 들어, 제2 징크 핑거 도메인)을 포함하는, 시스템 또는 핵산.
270.
구현예 118 내지 261 또는 268 내지 269 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 제1 징크 핑거 도메인을 포함하고 제2 표적화 모이어티는 제2 징크 핑거 도메인을 포함하는, 시스템 또는 핵산.
271.
구현예 268 내지 270 중 어느 하나에 있어서, 상기 제1 징크 핑거 도메인 및 제2 징크 핑거 도메인은 동일한 게놈 유전자좌에 결합하고, 예를 들어 동일한 아미노산 서열을 갖는, 시스템 또는 핵산.
272.
구현예 268 내지 271 중 어느 하나에 있어서, 상기 제1 징크 핑거 도메인 및 제2 징크 핑거 도메인은 상이한 아미노산 서열을 갖거나 상이한 게놈 유전자좌에 결합하는, 시스템 또는 핵산.
273.
구현예 118 내지 261 또는 267 내지 272 중 어느 하나에 있어서, 상기 제1 징크 핑거 분자는 적어도 1, 2, 3, 4, 5, 7, 8, 9, 또는 10개의 징크 핑거(및 선택적으로 11, 10, 9, 8, 7, 6, 또는 5개 이하의 징크 핑거)를 포함하는, 시스템 또는 핵산.
274.
구현예 267 내지 273 중 어느 하나에 있어서, 상기 제1 징크 핑거 분자는 1 내지 10, 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 1 내지 2, 2 내지 10, 2 내지 9, 2 내지 8, 2 내지 7, 2 내지 6, 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 10, 3 내지 9, 3 내지 8, 3 내지 7, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 10, 4 내지 9, 4 내지 8, 4 내지 7, 4 내지 6, 4 내지 5, 5 내지 10, 5 내지 9, 5 내지 8, 5 내지 7, 5 내지 6, 6 내지 10, 6 내지 9, 6 내지 8, 6 내지 7, 7 내지 10, 7 내지 9, 7 내지 8, 8 내지 10, 8 내지 9, 또는 9 내지 10개의 징크 핑거를 포함하는, 시스템 또는 핵산.
275.
구현예 268 내지 274 중 어느 하나에 있어서, 상기 제1 징크 핑거 도메인은 3 또는 9개의 징크 핑거를 포함하는, 시스템 또는 핵산.
276.
구현예 268 내지 275 중 어느 하나에 있어서, 상기 제2 징크 핑거 도메인은 적어도 1, 2, 3, 4, 5, 7, 8, 9, 또는 10개의 징크 핑거(및 선택적으로 11, 10, 9, 8, 7, 6, 또는 5개 이하의 징크 핑거)를 포함하는, 시스템 또는 핵산.
277.
구현예 268 내지 276 중 어느 하나에 있어서, 상기 제2 징크 핑거 도메인은 1 내지 10, 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 1 내지 2, 2 내지 10, 2 내지 9, 2 내지 8, 2 내지 7, 2 내지 6, 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 10, 3 내지 9, 3 내지 8, 3 내지 7, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 10, 4 내지 9, 4 내지 8, 4 내지 7, 4 내지 6, 4 내지 5, 5 내지 10, 5 내지 9, 5 내지 8, 5 내지 7, 5 내지 6, 6 내지 10, 6 내지 9, 6 내지 8, 6 내지 7, 7 내지 10, 7 내지 9, 7 내지 8, 8 내지 10, 8 내지 9, 또는 9 내지 10개의 징크 핑거를 포함하는, 시스템 또는 핵산.
278.
구현예 268 내지 277 중 어느 하나에 있어서, 상기 제2 징크 핑거 도메인은 3 또는 9개의 징크 핑거를 포함하는, 시스템 또는 핵산.
279.
구현예 118 내지 278 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 TAL 이펙터 도메인(예를 들어, 제1 TAL 이펙터 도메인)을 포함하는, 시스템 또는 핵산.
280.
구현예 118 내지 260 또는 279 중 어느 하나에 있어서, 제2 표적화 모이어티는 TAL 이펙터 도메인(예를 들어, 제2 TAL 이펙터 도메인)을 포함하는, 시스템 또는 핵산.
281.
구현예 279 또는 280 중 어느 하나에 있어서, 상기 제1 TAL 이펙터 도메인은 적어도 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 40개의 중심 반복부(및 선택적으로, 45, 40, 35, 30, 25, 20, 15, 또는 10개 이하의 중심 반복부)를 포함하는, 시스템 또는 핵산.
282.
구현예 279 내지 281 중 어느 하나에 있어서, 상기 제1 TAL 이펙터 도메인은 2 내지 40, 5 내지 40, 10 내지 40, 15 내지 40, 20 내지 40, 25 내지 40, 30 내지 40, 35 내지 40, 2 내지 35, 5 내지 35, 10 내지 35, 15 내지 35, 20 내지 35, 25 내지 35, 30 내지 35, 2 내지 30, 5 내지 30, 10 내지 30, 15 내지 30, 20 내지 30, 25 내지 30, 2 내지 25, 5 내지 25, 10 내지 25, 15 내지 25, 20 내지 25, 2 내지 20, 5 내지 20, 10 내지 20, 15 내지 20, 2 내지 15, 5 내지 15, 10 내지 15, 2 내지 10, 5 내지 10, 또는 2 내지 5개의 중심 반복부를 포함하는, 시스템 또는 핵산.
283.
구현예 279 또는 282 중 어느 하나에 있어서, 상기 제2 TAL 이펙터 도메인은 적어도 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 40개의 중심 반복부(및 선택적으로, 45, 40, 35, 30, 25, 20, 15, 또는 10개 이하의 중심 반복부)를 포함하는, 시스템 또는 핵산.
284.
구현예 279 내지 283 중 어느 하나에 있어서, 상기 제2 TAL 이펙터 도메인은 2 내지 40, 5 내지 40, 10 내지 40, 15 내지 40, 20 내지 40, 25 내지 40, 30 내지 40, 35 내지 40, 2 내지 35, 5 내지 35, 10 내지 35, 15 내지 35, 20 내지 35, 25 내지 35, 30 내지 35, 2 내지 30, 5 내지 30, 10 내지 30, 15 내지 30, 20 내지 30, 25 내지 30, 2 내지 25, 5 내지 25, 10 내지 25, 15 내지 25, 20 내지 25, 2 내지 20, 5 내지 20, 10 내지 20, 15 내지 20, 2 내지 15, 5 내지 15, 10 내지 15, 2 내지 10, 5 내지 10, 또는 2 내지 5개의 중심 반복부를 포함하는, 시스템 또는 핵산.
285.
구현예 118 내지 284 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 핵산(예를 들어, 제1 핵산)을 포함하는, 시스템 또는 핵산.
286.
구현예 129 내지 285 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 핵산(예를 들어, 제2 핵산)을 포함하는, 시스템 또는 핵산.
287.
구현예 129 내지 286 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 폴리펩타이드(예를 들어, 제1 폴리펩타이드)를 포함하는, 시스템 또는 핵산.
288.
구현예 129 내지 287 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 폴리펩타이드(예를 들어, 제2 폴리펩타이드)를 포함하는, 시스템 또는 핵산.
289.
구현예 287 또는 288에 있어서, 상기 핵산은 폴리펩타이드에 공유 부착된, 시스템.
290.
구현예 288 또는 289에 있어서, 상기 핵산은 폴리펩타이드와 비-공유 회합된, 시스템.
291.
구현예 275 내지 290 중 어느 하나에 있어서, 상기 핵산은 전사 조절 요소에 상보적인 서열 또는 이에 근접한 서열을 포함하거나, 전사 조절 요소 또는 이에 근접한 서열에 비해 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 불일치를 포함하는, 시스템 또는 핵산.
292.
구현예 275 내지 291 중 어느 하나에 있어서, 상기 핵산은 앵커 서열에 상보적인 서열 또는 이에 근접한 서열을 포함하거나, 앵커 서열 또는 이에 근접한 서열에 비해 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 불일치를 포함하는, 시스템 또는 핵산.
293.
구현예 275 내지 292 중 어느 하나에 있어서, 상기 핵산은 DNA, 펩타이드 핵산(PNA), 펩타이드-올리고뉴클레오타이드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체-형성 올리고뉴클레오타이드, 안티센스 올리고뉴클레오타이드, tRNA, mRNA, rRNA, miRNA, gRNA, siRNA, 또는 다른 RNAi 분자를 포함하는, 시스템.
294.
구현예 275 내지 293 중 어느 하나에 있어서, 상기 핵산은 gRNA를 포함하는, 시스템.
295.
구현예 275 내지 294 중 어느 하나에 있어서, 상기 핵산은 서열번호 1 내지 4 중 임의의 것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하거나, 이와 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 위치에서 상이한, 시스템.
296.
구현예 275 내지 295 중 어느 하나에 있어서, 상기 제1 핵산은 서열번호 1 내지 4 중 임의의 것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하거나 이와 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 위치에서 상이하고, 상기 제2 핵산은 서열번호 1 내지 4 중 임의의 것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하거나 이와 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 위치에서 상이한, 시스템.
297.
구현예 275 내지 295 중 어느 하나에 있어서, 상기 제1 핵산은 서열번호 96 내지 110 중 임의의 것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하거나 이와 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 위치에서 상이하고, 상기 제2 핵산은 서열번호 96 내지 110 중 임의의 것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하거나 이와 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 위치에서 상이한, 시스템.
298.
구현예 118 내지 297 중 어느 하나에 있어서, 상기 전사 조절 요소는 프로모터를 포함하는, 시스템.
299.
구현예 118 내지 298 중 어느 하나에 있어서, 상기 전사 조절 요소는 인핸서, 예를 들어 슈퍼 인핸서를 포함하는, 시스템.
300.
구현예 118 내지 299 중 어느 하나에 있어서, 상기 앵커 서열은 CTCF 결합 모티프를 포함하는, 시스템.
301.
구현예 118 내지 300 중 어느 하나에 있어서, 상기 앵커 서열은 YY1 결합 모티프를 포함하는, 시스템.
302.
구현예 118 내지 301 중 어느 하나에 있어서, 상기 앵커 서열은 서열번호 71 또는 72의 서열, 또는 이에 대해 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 변경을 갖는 서열을 포함하는, 시스템.
303.
구현예 118 내지 302 중 어느 하나에 있어서, 상기 앵커 서열은 서열번호 73 또는 74에 따른 서열, 또는 이에 대해 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 변경을 갖는 서열을 포함하는, 시스템.
304.
구현예 118 내지 303 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자와 동일한 염색체 상에 있는, 시스템.
305.
구현예 118 내지 303 중 어느 하나에 있어서, 상기 앵커 서열은 MYC의 상류(예를 들어, TSS의 상류 또는 프로모터의 상류)에 있는, 시스템.
306.
구현예 118 내지 305 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자로부터(예를 들어, MYC 유전자의 TSS 또는 프로모터로부터) 적어도 1, 5, 10, 50, 100, 또는 1000 킬로베이스 떨어져 있는, 시스템.
307.
구현예 118 내지 306 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자로부터(예를 들어, TSS 또는 MYC 유전자의 프로모터로부터) 0.1 내지 0.5, 0.1 내지 1, 0.1 내지 5, 0.1 내지 10, 0.1 내지 50, 0.1 내지 100, 0.1 내지 500, 0.1 내지 1000, 0.5 내지 1, 0.5 내지 5, 0.5 내지 10, 0.5 내지 50, 0.5 내지 100, 0.5 내지 500, 0.5 내지 1000, 1 내지 5, 1 내지 10, 1 내지 50, 1 내지 100, 1 내지 500, 1 내지 1000, 5 내지 10, 5 내지 50, 5 내지 100, 5 내지 500, 5 내지 1000, 10 내지 50, 10 내지 100, 10 내지 500, 10 내지 1000, 50 내지 100, 50 내지 500, 50 내지 1000, 100 내지 500, 100 내지 1000, 또는 500 내지 1000 킬로베이스 떨어져 있는, 시스템.
308.
구현예 118 내지 303 또는 305 내지 307 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자와 상이한 염색체 상에 있는, 시스템.
309.
구현예 118 내지 308 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 결합에 대해 내인성 폴리펩타이드(예를 들어, CTCF 또는 YY1)와 경쟁하기에 충분한 친화도로 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는, 시스템.
310.
구현예 118 내지 309 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 염색체 좌표 128746342-128746364, 128746321-128746343, 또는 128746525-128746547에서의 서열, 또는 이에 근접한 서열에 결합하는, 시스템.
311.
구현예 118 내지 309 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 염색체 좌표 128746405-128746425, 128748069-128748089, 129188825-129188845, 또는 129188822-129188842에서의 서열, 또는 이에 근접한 서열에 결합하는, 시스템.
312.
구현예 118 내지 311 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 염색체 좌표 128748014-128748036에서의 서열, 또는 이에 근접한 서열에 결합하는, 시스템.
313.
구현예 118 내지 311 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 염색체 좌표 128746405-128746425, 128748069-128748089, 129188825-129188845, 또는 129188822-129188842에서의 서열, 또는 이에 근접한 서열에 결합하는, 시스템.
314.
구현예 118 내지 314 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 융합 분자인, 시스템.
315.
구현예 118 내지 314 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 융합 분자인, 시스템.
316.
구현예 118 내지 315 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 링커를 포함하는, 시스템.
317.
구현예 118 내지 316 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 링커를 포함하는, 시스템.
318.
구현예 118 내지 267 또는 285 내지 317 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 제1 CRISPR/Cas 분자를 포함하는, 예를 들어 제1 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티, 및 후성유전학적 변형 모이어티를 포함하는 이펙터 모이어티를 포함하고;
상기 제2 발현 리프레서는 제2 CRISPR/Cas 분자를 포함하는, 예를 들어 제2 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티, 및 선택적으로 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 시스템.
319.
구현예 118 내지 260, 268 내지 278, 또는 285 내지 317 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 제1 징크 핑거 도메인을 포함하는 표적화 모이어티, 및 후성유전학적 변형 모이어티를 포함하는 이펙터 모이어티를 포함하고,
상기 제2 발현 리프레서는 제2 징크 핑거 도메인을 포함하는 표적화 모이어티, 및 선택적으로 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 시스템.
320.
구현예 118 내지 120, 262, 268, 또는 275 내지 318 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 CRISPR/Cas 분자를 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티, 및 후성유전학적 변형 모이어티를 포함하는 이펙터 모이어티를 포함하고;
상기 제2 발현 리프레서는 징크 핑거 도메인을 포함하는 표적화 모이어티, 및 선택적으로 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 시스템.
321.
구현예 118 내지 260, 268, 또는 275 내지 318 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 징크 핑거 도메인을 포함하는 표적화 모이어티, 및 후성유전학적 변형 모이어티를 포함하는 이펙터 모이어티를 포함하고;
상기 제2 발현 리프레서는 CRISPR/Cas 도메인을 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티, 및 선택적으로 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 시스템.
322.
구현예 260, 268 내지 278, 또는 275 내지 318 중 어느 하나에 있어서, 상기 징크 핑거 도메인(예를 들어, 제1 또는 제2 징크 핑거 도메인)은 1 내지 10, 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 1 내지 2, 2 내지 10, 2 내지 9, 2 내지 8, 2 내지 7, 2 내지 6, 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 10, 3 내지 9, 3 내지 8, 3 내지 7, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 10, 4 내지 9, 4 내지 8, 4 내지 7, 4 내지 6, 4 내지 5, 5 내지 10, 5 내지 9, 5 내지 8, 5 내지 7, 5 내지 6, 6 내지 10, 6 내지 9, 6 내지 8, 6 내지 7, 7 내지 10, 7 내지 9, 7 내지 8, 8 내지 10, 8 내지 9, 또는 9 내지 10개의 징크 핑거, 예를 들어 3 또는 9개의 징크 핑거를 포함하는, 시스템.
323.
구현예 322에 있어서, 상기 후성유전학적 변형 모이어티는 DNA 메틸트랜스퍼라제를 포함하는, 시스템.
324.
구현예 118 내지 323 중 어느 하나에 있어서, 상기 후성유전학적 변형 모이어티는 MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는, 시스템.
325.
구현예 118 내지 324 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 시스템.
326.
구현예 118 내지 323 중 어느 하나에 있어서, 상기 전사 리프레서는 KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는, 시스템.
327.
구현예 118 내지 326 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 28 내지 33 또는 35 내지 37, 145 내지 149, 151, 152 중 임의의 것의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템.
328.
구현예 118 내지 327 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 22 내지 27, 34, 139 내지 144, 150, 177 내지 180, 183 내지 186 중 임의의 것의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템.
329.
구현예 118 내지 328 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합은 세포에서 MYC의 발현을 감소시키는, 시스템.
330.
구현예 327에 있어서, 발현은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 제1 발현 리프레서의 부재 시 발현과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
331.
구현예 326 또는 327에 있어서, 상기 전사 조절 요소에 대한 제1 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 시스템.
332.
구현예 329 내지 331 중 어느 하나에 있어서, 상기 전사 조절 요소에 대한 제1 발현 리프레서의 결합은 형질감염 후 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 80, 또는 96 시간 후에 MYC의 발현을 상당히 감소시키는, 시스템.
333.
구현예 328 내지 332 중 어느 하나에 있어서, 상기 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 세포에서 MYC의 발현을 감소시키는, 시스템.
334.
구현예 333에 있어서, 발현은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 제2 발현 리프레서의 부재 시 발현과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
335.
구현예 333 또는 334에 있어서, 상기 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 시스템.
336.
구현예 334 내지 335 중 어느 하나에 있어서, 상기 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 형질감염 후 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 80, 또는 96시간 후에 MYC의 발현을 상당히 감소시키는, 시스템.
337.
구현예 329 내지 336 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서는 세포에서 MYC의 발현을 감소시키는, 시스템.
338.
구현예 392 내지 337 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 형질감염 후 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 80, 또는 96시간 후에 MYC의 발현을 상당히 감소시키는, 시스템.
339.
구현예 337 또는 338에 있어서, 발현은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 제1 및 제2 발현 리프레서의 부재 시 발현과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
340.
구현예 329 내지 339 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 시스템.
341.
구현예 329 내지 340 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소는 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소보다 더 큰, 시스템.
342.
구현예 341에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 발현을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 크게 감소시키는, 시스템.
343.
구현예 329 내지 342 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소는 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소보다 더 오랜 시간(예를 들어, 더 많은 시간, 일, 또는 세포 분열) 동안 지속되는, 시스템.
344.
구현예 343에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 (예를 들어, 시간, 일, 또는 세포 분열로 측정 시) 발현을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 오래 감소시키는, 시스템.
345.
구현예 329 내지 344 중 어느 하나에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 시스템.
346.
구현예 329 내지 345 중 어느 하나에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소는 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소보다 더 큰, 시스템.
347.
구현예 346에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 발현을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 크게 감소시키는, 시스템.
348.
구현예 329 내지 347 중 어느 하나에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소는 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소보다 더 오랜 시간(예를 들어, 더 많은 시간, 일, 또는 세포 분열) 동안 지속되는, 시스템.
349.
구현예 348에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 발현을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 오랜 시간(예를 들어, 더 많은 시간, 일, 또는 세포 분열) 동안 지속되는, 시스템.
350.
구현예 329 내지 349 중 어느 하나에 있어서, 발현은 (예를 들어, 실험적으로 측정될 수 있는 것보다 더 긴 기간 동안) 무기한으로 상당히 감소되는, 시스템.
351.
구현예 329 내지 350 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합은 전사 조절 요소 또는 이에 근접한 서열을 포함하는 서열의 생존능을 감소시키는, 시스템.
352.
구현예 329 내지 351 중 어느 하나에 있어서, 복수의 세포를 제1 발현 리프레서 또는 제1 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것은 복수의 세포의 생존능을 감소시키며, 선택적으로 복수의 세포는 암성 및 비-암성 세포 및/또는 감염 세포 및 비감염 세포를 포함하는, 시스템.
353.
구현예 352에 있어서, 생존능은, 예를 들어 CellTiter Glo에 의해 측정 시, 제1 발현 리프레서의 부재 시 생존능과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
354.
구현예 329 내지 353 중 어느 하나에 있어서, 상기 제1 발현 리프레서의 투여는 적어도 5%, 6%, 7%, 8%, 9% 10%, 12%, 15%, 17%, 20%, 25% 30%, 40%, 45%, 50%, 55%, 60%, 65%, 75%의 표적 세포(예를 들어, 암 세포)의 아폽토시스를 초래하는, 발현 리프레서.
355.
구현예 329 내지 354 중 어느 하나에 있어서, 상기 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 앵커 서열 또는 이에 근접한 서열을 포함하는 서열의 생존능을 감소시키는, 시스템.
356.
구현예 329 내지 355 중 어느 하나에 있어서, 복수의 세포를 제2 발현 리프레서 또는 제2 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것은 복수의 세포의 생존능을 감소시키는, 시스템.
357.
구현예 329 내지 356 중 어느 하나에 있어서, 상기 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 전사 조절 요소 또는 이에 근접한 서열을 포함하는 서열의 생존능을 감소시키는, 시스템.
358.
구현예 329 내지 357 중 어느 하나에 있어서, 복수의 세포를 제2 발현 리프레서 또는 제1 발현 리프레서를 인코딩하는 핵산을 접촉시키는 것은 복수의 세포의 생존능을 감소시키며, 선택적으로 복수의 세포는 암성 및 비-암성 세포 및/또는 감염 세포 및 비감염 세포를 포함하는, 시스템.
359.
구현예 358에 있어서, 생존능은, 예를 들어 CellTiter Glo에 의해 측정 시, 제2 발현 리프레서의 부재 시 생존능과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
360.
구현예 329 내지 359 중 어느 하나에 있어서, 상기 제2 발현 리프레서의 투여는 적어도 5%, 6%, 7%, 8%, 9% 10%, 12%, 15%, 17%, 20%, 25% 30%, 40%, 45%, 50%, 55%, 60%, 65%, 75%의 표적 세포(예를 들어, 암 세포)의 아폽토시스를 초래하는, 발현 리프레서.
361.
구현예 329 내지 360 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 앵커 서열 또는 이에 근접한 서열을 포함하는 서열의 생존능을 감소시키는, 시스템.
362.
구현예 329 내지 361 중 어느 하나에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 세포의 생존능을 감소시키는, 시스템.
363.
구현예 329 내지 362 중 어느 하나에 있어서, 복수의 세포를 시스템 또는 시스템을 인코딩하는 핵산과 접촉시키는 것은 복수의 세포의 생존능을 감소시키는, 시스템.
364.
구현예 329 내지 363에 있어서, 생존능은, 예를 들어 CellTiter Glo에 의해 측정 시, 시스템의 부재 시 생존능과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
365.
구현예 329 내지 364 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 생존능 감소는 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 생존능 감소보다 더 큰, 시스템.
366.
구현예 329 내지 365 중 어느 하나에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 생존능 감소는 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 생존능 감소보다 더 큰, 시스템.
367.
구현예 366에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 CellTiter Glo에 의해 측정 시, 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 크게 감소시키는, 시스템.
368.
구현예 366 또는 367에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 CellTiter Glo에 의해 측정 시, 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 크게 감소시키는, 시스템.
369.
구현예 329 내지 368 중 어느 하나에 있어서, 상기 제1 발현 리프레서 및 제2 발현 리프레서의 투여는 적어도 5%, 6%, 7%, 8%, 9% 10%, 12%, 15%, 17%, 20%, 25% 30%, 40%, 45%, 50%, 55%, 60%, 65%, 75%의 표적 세포(예를 들어, 암 세포)의 아폽토시스를 초래하는, 발현 리프레서.
370.
구현예 329 내지 369에 있어서, 상기 복수의 세포는 복수의 암 세포 및 복수의 비-암 세포를 포함하는, 시스템.
371.
구현예 370에 있어서, 상기 복수의 세포를 시스템 또는 시스템을 인코딩하는 핵산과 접촉시키는 것은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 더 많이 감소시키는, 시스템.
372.
구현예 370 또는 371에 있어서, 상기 복수의 세포를 시스템 또는 시스템을 인코딩하는 핵산과 접촉시키는 것은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 많이 감소시키는, 발현 리프레서.
373.
임의의 선행하는 구현예에 있어서, 예를 들어 실시예 29에 따라 분석될 때, 비-암 세포(예를 들어, 1차 간세포)의 생존능을 5, 10, 15, 또는 20% 초과만큼 감소시키지 않는, 발현 리프레서 또는 시스템.
374.
구현예 320에 있어서, 생존능은 세포를 발현 리프레서 또는 시스템과 접촉시킨 후 72시간 후에 분석되는, 발현 리프레서 또는 시스템.
375.
구현예 374에 있어서, 상기 분석은 비-암 세포를 2.5, 2, 1.25, 1, 0.6, 또는 0.5 ug/ml의 발현 리프레서 또는 시스템과 접촉시키는 것을 포함하는, 발현 리프레서 또는 시스템.
376.
구현예 352 내지 375 중 어느 하나에 있어서, 복수의 감염 세포 및 복수의 비감염 세포와 접촉될 때, 복수의 비감염 세포의 생존능을 감소시키는 것보다 복수의 감염 세포의 생존능을 더 많이 감소시키고/시키거나 복수의 비-암성 세포의 생존능을 감소시키는 것보다 복수의 암성 세포의 생존능을 더 많이 감소시키는, 시스템.
377.
구현예 352 내지 376 중 어느 하나에 있어서, 상기 암은 간세포 암종(HCC), 섬유층판 간세포 암종(FHCC), 담관암종, 혈관육종, 2차 간암, 비소세포 폐암(NSCLC), 선암종, 소세포 폐암(SCLC), 대세포 (미분화) 암종, 삼중 음성 유방암, 위 선암종, 자궁내막 암종, 또는 췌 암종인, 시스템.
378.
구현예 352 내지 377 중 어느 하나에 있어서, 상기 암 세포는 폐암 세포, 위암 세포, 위장관암 세포, 결장직장암 세포, 췌장암 세포, 또는 간암 세포인, 시스템.
379.
구현예 352 내지 378 중 어느 하나에 있어서, 상기 세포는 인간 폐 상피 세포 또는 인간 폐 섬유아세포 세포인, 시스템.
380.
구현예 352 내지 379 중 어느 하나에 있어서, 상기 감염은 바이러스성인, 시스템.
381.
구현예 380에 있어서, 상기 바이러스 감염은 간염, 예를 들어 B형 간염인, 발현 리프레서.
382.
구현예 378 내지 381 중 어느 하나에 있어서, 상기 감염 세포는 인간 간세포인, 시스템.
383.
구현예 352 내지 382 중 어느 하나에 있어서, 상기 바이러스 감염은 만성 감염인, 시스템.
384.
융합 단백질로서,
구현예 118 내지 383 중 어느 하나의 시스템의 제1 발현 리프레서를 인코딩하는 서열을 포함하는 제1 아미노산 영역; 및
구현예 118 내지 383 중 어느 하나의 시스템의 제2 발현 리프레서를 인코딩하는 서열을 포함하는 제2 아미노산 영역
을 포함하는, 융합 단백질.
385.
구현예 384에 있어서, 제3 아미노산 영역을 포함하며, 상기 제3 아미노산 영역은 제1 아미노산 영역과 제2 아미노산 영역 사이에 위치하는, 융합 단백질.
386.
구현예 385에 있어서, 상기 제3 아미노산 영역은 프로테아제 절단 펩타이드 서열, 예를 들어 자가-절단 펩타이드 서열, 예를 들어 T2A 자가-절단 펩타이드 서열, 예를 들어 서열번호 120에 따른 서열을 포함하는, 융합 단백질.
387.
구현예 386에 있어서, 상기 제3 아미노산 영역은 프로테아제 절단 펩타이드 서열, 예를 들어 자가-절단 펩타이드 서열, 예를 들어 탠덤(tandem) 2A 펩타이드 서열, 예를 들어 tPT2A 서열, 예를 들어 서열번호 124에 따른 서열을 포함하는, 융합 단백질.
388.
구현예 385에 있어서, 상기 펩타이드 서열은 T2A 펩타이드 서열 및 P2A 펩타이드 서열을 포함하는, 융합 단백질.
389.
구현예 384 내지 388 중 어느 하나에 있어서,
제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하고,
제2 발현 리프레서는 서열번호 24 또는 142에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하는, 융합 단백질.
390.
구현예 384 내지 388 중 어느 하나에 있어서,
제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하고,
제2 발현 리프레서는 서열번호 177 또는 183에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하는, 융합 단백질.
391.
구현예 384 내지 388 중 어느 하나에 있어서,
제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하고,
2 발현 리프레서는 서열번호 179 또는 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하는, 융합 단백질.
392.
구현예 384 내지 391 중 어느 하나에 있어서, 서열번호 91, 92, 121, 또는 122의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 융합 단백질.
393.
구현예 384 내지 392 중 어느 하나에 있어서, 서열번호 181, 182, 187, 또는 188의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 융합 단백질.
394.
구현예 118 내지 393 중 어느 하나의 시스템을 인코딩하는 서열을 포함하는 핵산.
395.
구현예 394의 시스템을 인코딩하는 서열을 포함하는 핵산.
396.
구현예 394 또는 395의 핵산으로서,
구현예 118 내지 393 중 어느 하나의 시스템의 제1 발현 리프레서를 인코딩하는 서열을 포함하는 제1 영역; 및
구현예 118 내지 393 중 어느 하나의 시스템의 제2 발현 리프레서를 인코딩하는 서열을 포함하는 제2 영역
을 포함하는, 핵산.
397.
구현예 394 내지 396 중 어느 하나에 있어서, 제3 영역을 포함하며, 제3 영역은 제1 영역과 제2 영역 사이에 위치하는, 핵산.
398.
구현예 394 내지 397 중 어느 하나에 있어서, 제3 영역은 리보솜-스킵핑(ribosome-skipping) 서열을 인코딩하는, 핵산.
399.
구현예 397 또는 398에 있어서, 상기 제3 영역은 tPT2A 펩타이드 서열, 예를 들어 서열번호 124에 따른 서열을 인코딩하는, 핵산.
400.
구현예 397 내지 399 중 어느 하나에 있어서, 상기 제3 영역은 프로테아제 절단 펩타이드 서열, 예를 들어 자가-절단 펩타이드 서열, 예를 들어 T2A 자가-절단 펩타이드 서열, 예를 들어 서열번호 95에 따른 서열을 인코딩하는, 핵산.
401.
구현예 397 내지 400 중 어느 하나에 있어서, 상기 제3 영역은 프로테아제 절단 펩타이드 서열, 예를 들어 자가-절단 펩타이드 서열, 예를 들어 탠덤 2A 펩타이드 서열, 예를 들어 tPT2A 펩타이드 서열, 예를 들어 서열번호 124에 따른 서열을 인코딩하는, 핵산.
402.
구현예 394 내지 401 중 어느 하나에 있어서,
제1 발현 리프레서는 서열번호 30, 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하고;
제2 발현 리프레서는 서열번호 24, 142에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하는, 핵산.
403.
구현예 394 내지 401 중 어느 하나에 있어서,
제1 발현 리프레서는 서열번호 30, 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하고;
제2 발현 리프레서는 서열번호 177, 179, 183, 또는 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하는, 핵산.
404.
구현예 394 내지 403 중 어느 하나에 있어서, 서열번호 91, 92, 121, 122의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 인코딩하는, 핵산.
405.
구현예 394 내지 404 중 어느 하나에 있어서, 서열번호 181, 182, 187, 188의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 인코딩하는, 핵산.
406.
구현예 394 내지 405 중 어느 하나에 있어서, 서열번호 93, 94, 112, 또는 113의 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
407.
구현예 394 내지 406 중 어느 하나에 있어서, 서열번호 196, 197의 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
408.
구현예 1 내지 407 중 어느 하나의 발현 리프레서 또는 발현 리프레서 시스템을 인코딩하는 서열을 포함하는 핵산.
409. 구현예 394 내지 408 중 어느 하나에 있어서, RNA, 예를 들어 mRNA인, 핵산.
410.
구현예 394 내지 409 중 어느 하나에 있어서, 예를 들어 역 5' 대 5' 트리포스페이트 연결을 통해, RNA의 5' 말단에 연결되는, N7-메틸화 구아노신을 포함하는, 핵산.
411.
구현예 394 내지 410 중 어느 하나에 있어서, 5' UTR을 포함하는, 핵산.
412.
구현예 394 내지 411 중 어느 하나에 있어서, 예를 들어 5' UTR과 발현 리프레서를 인코딩하는 서열 사이에, 코작(Kozak) 서열을 포함하는, 핵산.
413.
시스템으로서,
구현예 118 내지 393 중 어느 하나의 시스템의 제1 발현 리프레서를 인코딩하는 서열을 포함하는 제1 핵산; 및
제2 발현 리프레서, 예를 들어 구현예 118 내지 393 중 어느 하나의 시스템의 제2 발현 리프레서를 인코딩하는 서열을 포함하는 제2 핵산
을 포함하는, 시스템.
414.
구현예 413에 있어서, 상기 제1 핵산은 서열번호 63, 130의 제1 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖고, 제2 핵산은 서열번호 57의 제2 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 시스템.
415.
구현예 414에 있어서, 상기 제1 핵산은 서열번호 63, 130의 제1 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖고, 제2 핵산은 서열번호 189, 또는 194의 제2 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 시스템.
416.
구현예 415에 있어서, 상기 제1 핵산은 서열번호 189, 194의 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖고, 제2 핵산은 서열번호 63, 130의 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 시스템.
417.
구현예 394 내지 416 중 어느 하나에 있어서, 상기 핵산은 mRNA를 포함하는, 핵산 또는 시스템.
418.
선행하는 구현예 중 어느 하나의 시스템, 또는 발현 리프레서를 인코딩하는 핵산을 포함하는 벡터.
419.
선행하는 구현예 중 어느 하나의 시스템, 핵산, mRNA, 또는 벡터를 포함하는 지질 나노입자.
420.
구현예 419에 있어서, 이온화 가능한 지질, 예를 들어 양이온성 지질, 예를 들어 MC3, SSOP를 포함하는, 지질 나노입자.
421.
구현예 419 또는 420에 있어서, 중성 지질, 이온화 가능한 아민-함유 지질, 생분해성 알킨 지질, 스테로이드, 인지질, 다가불포화 지질, 구조 지질(예를 들어, 스테롤), PEG, 콜레스테롤, 또는 중합체 접합된 지질 중 하나 이상을 추가로 포함하는, 지질 나노입자.
422.
선행하는 구현예 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 또는 지질 나노입자를 포함하는 반응 혼합물.
423.
구현예 422에 있어서, 세포를 추가로 포함하는, 반응 혼합물.
424.
임의의 선행하는 구현예의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자 또는 반응 혼합물을 포함하는 약제학적 조성물.
425.
세포에서 MYC 유전자의 발현을 감소시키는 방법으로서, 상기 방법은
세포(예를 들어, 암 세포)를 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 상기 시스템 또는 발현 리프레서를 인코딩하는 하나 이상의 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물과 접촉시키는 단계
를 포함하여,
이에 의해 세포에서 MYC 유전자의 발현을 감소시키는, 방법.
426.
필요로 하는 대상체에서 암을 치료하는 방법으로서, 상기 방법은
구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물을 대상체에게 투여하는 단계
를 포함하며,
이에 의해 대상체에서 암을 치료하는, 방법.
427.
필요로 하는 대상체에서 종양 성장을 감소시키는 방법으로서, 상기 방법은
구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물을 대상체에게 투여하는 단계
를 포함하며,
이에 의해 대상체에서 종양 크기를 감소시키는, 방법.
428.
구현예 427에서, 상기 종양 성장의 감소는 치료 시작 시 종양 부피와 비교하여 종양 부피의 감소를 포함하는, 방법.
429.
구현예 428에 있어서, 상기 대상체에서 종양 성장의 감소는 비치료 대상체와 비교하여 더 큰, 방법.
430.
키나제 억제제, 예를 들어 소라페님에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 본 명세서에 기재된 발현 리프레서 또는 시스템을 암을 앓는 대상체에게 투여하는 단계를 포함하는, 방법.
431.
구현예 430에 있어서, 상기 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석, 예를 들어 실시예 38에 따른 분석에서 키나제 억제제의 IC50을 10%, 20%, 30%, 또는 40%만큼 낮추는, 방법.
432.
구현예 430 또는 431에 있어서, 상기 키나제 억제제는 VEGFR, PDGFR, RAF 키나제 중 하나 이상(예를 들어, 이의 전부)을 억제하는, 방법.
433.
브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 본 명세서에 기재된(예를 들어, 구현예 1 내지 423 중 어느 하나의) 발현 리프레서, 시스템, 또는 핵산을 암을 앓는 대상체에게 투여하는 단계를 포함하며, 선택적으로 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석, 예를 들어 실시예 39에 따른 분석에서 브로모도메인 억제제의 IC50를 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%만큼 낮추는, 방법.
434.
구현예 433에 있어서, 상기 브로모도메인 억제제는 JQ1, BET672, 또는 비라브레십이거나 이를 포함하는, 방법.
435.
MEK 억제제, 예를 들어 트라베티닙에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 본 명세서에 기재된(예를 들어, 구현예 1 내지 423 중 어느 하나의) 발현 리프레서, 시스템, 또는 핵산을 암을 앓는 대상체에게 투여하는 단계를 포함하며, 선택적으로 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석, 예를 들어 실시예 51에 따른 분석에서 MEK 억제제의 IC50를 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%만큼 낮추는, 방법.
436.
구현예 427 내지 435 중 어느 하나에 있어서, 상기 대상체에서 종양 성장의 감소는 대상체가 화학요법제 또는 소분자 MYC 억제제로 치료될 때 종양 크기 감소보다 크거나 이와 유사한, 방법.
437.
구현예 436에 있어서, 상기 화학요법제는 소라페닙 또는 시스플라틴인, 방법.
438.
구현예 437에 있어서, 상기 소분자 MYC 억제제는 MYCi975인, 방법.
439.
필요로 하는 대상체에서 종양 크기를 감소시키는 방법으로서, 상기 방법은
1 내지 424의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물을 대상체에게 투여하는 단계를 포함하며, 종양 크기의 감소는 대상체가 화학요법제로 치료될 때 종양 크기 감소보다 크거나 이와 유사한, 방법.
440.
구현예 439에 있어서, 상기 화학요법제는 소라페닙 또는 시스플라틴인, 방법.
441.
선행하는 구현예 중 어느 하나에 있어서, 상기 대상체는 화학요법제 또는 소분자 MYC 억제제로 치료될 때와 비교하여 임의의 유의한 부작용을 경함하지 않는, 방법.
442.
구현예 436 내지 441 중 어느 하나에 있어서, 상기 화학요법제는 소라페닙 또는 시스플라틴인, 방법.
443.
구현예 442에 있어서, 상기 소분자 MYC 억제제는 MYCi975인, 방법.
444.
구현예 426 내지 443 중 어느 하나에 있어서, 상기 암은 I기, II기, III기, 또는 IV기 암인, 방법.
445.
선행하는 구현예 중 어느 하나에 있어서, 상기 대상체의 체중은 치료 전 및 치료 후 거의 동일하게 유지되는, 방법.
446.
선행하는 구현예 중 어느 하나에 있어서, 상기 대상체는 체중의 감소를 경험하지 않거나, 대상체는 치료 시작 시와 비교하여 3%, 2%, 또는 1% 미만의 체중 감소를 경험하는, 방법.
447.
선행하는 구현예 중 어느 하나에 있어서, 상기 대상체는 대상체의 치료 전 체중과 비교하여 치료 후 체중의 감소 또는 증가를 경험하지 않는, 방법.
448.
필요로 하는 대상체에서 간 질환을 치료하는 방법으로서, 상기 방법은
발현 리프레서를 대상체에게 투여하되, 발현 리프레서는 MYC 유전자좌(예를 들어, MYC의 전사된 영역, MYC 프로모터, 또는 MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열)에 결합하는 표적화 모이어티, 및 선택적으로 이펙터 모이어티, 예를 들어 본 명세서에 기재된 이펙터 모이어티를 포함하는 단계
를 포함하며;
이에 의해 대상체에서 간 질환을 치료하는, 방법.
449.
구현예 447에 있어서, 대상체에게 제2 발현 리프레서를 투여하되, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열에 결합하는 표적화 모이어티, 및 선택적으로 제2 이펙터 모이어티, 예를 들어 본 명세서에 기재된 이펙터 모이어티; 예를 들어 KRAB를 포함하는 단계를 추가로 포함하며,
이에 의해 대상체에서 간 질환을 치료하는, 방법.
450.
필요로 하는 대상체에서 간 질환을 치료하는 방법으로서, 상기 방법은
구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물을 대상체에게 투여하는 단계
를 포함하며,
이에 의해 대상체에서 간 질환을 치료하는, 방법.
451.
구현예 450에 있어서, 상기 간 질환은 만성 간 질환인, 방법.
452.
구현예 450 또는 451에 있어서, 상기 간 질환은 바이러스성 또는 알코올 관련인, 방법.
453.
구현예 450 내지 452 중 어느 하나에 있어서, 상기 간 질환은 간염 또는 간세포 암종인, 방법.
454.
구현예 453에 있어서, 상기 간세포 암종은 HCC 하위유형 S1, HCC 하위유형 S2, 또는 HCC 하위유형 S3으로부터 선택되는, 방법.
455.
구현예 453 또는 454에 있어서, 상기 간세포 암종은 HCC S1인, 방법.
456.
구현예 453 또는 454에 있어서, 상기 간세포 암종은 HCC S2인, 방법.
457.
구현예 450 내지 456 중 어느 하나에 있어서, 상기 간 질환은 B형 간염 바이러스 또는 C형 간염 바이러스에 의해 유발되는, 방법.
458.
필요로 하는 대상체에서 폐 질환을 치료하는 방법으로서, 상기 방법은
발현 리프레서를 대상체에게 투여하되, 발현 리프레서는 MYC 유전자좌(예를 들어, MYC의 전사된 영역, MYC 프로모터, 또는 MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열)에 결합하는 표적화 모이어티, 및 선택적으로 이펙터 모이어티, 예를 들어 본 명세서에 기재된 이펙터 모이어티를 포함하는 단계
를 포함하며;
이에 의해 대상체에서 폐 질환을 치료하는, 방법.
459.
구현예 458에 있어서, 대상체에게 제2 발현 리프레서를 투여하되, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 앵커 영역에 위치하는 게놈 유전자좌에 결합하는 표적화 모이어티, 및 선택적으로 제2 이펙터 모이어티, 예를 들어 본 명세서에 기재된 이펙터 모이어티; 예를 들어 KRAB를 포함하는 단계를 추가로 포함하며;
이에 의해 대상체에서 폐 질환을 치료하는, 방법.
460.
필요로 하는 대상체에서 폐 질환을 치료하는 방법으로서, 상기 방법은
구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물을 대상체에게 투여하는 단계
를 포함하며,
이에 의해 대상체에서 폐 질환을 치료하는, 방법.
461.
구현예 459 또는 460에 있어서, 상기 폐 질환은 암, 예를 들어 폐암, 예를 들어 폐 암종, 예를 들어 비소세포 폐 암종 또는 소세포 폐 암종인, 방법.
462.
구현예 425 또는 461 중 어느 하나에 있어서, 접촉 또는 투여는 대상체에의 정맥내 투여를 포함하는, 방법.
463.
구현예 425 내지 462 중 어느 하나에 있어서, 접촉 또는 투여는 종양내 전달(예를 들어, 주사)을 포함하는, 방법.
464.
구현예 425 내지 463 중 어느 하나에 있어서, 상기 암은 참조 수준에 비해(예를 들어, 참조 세포의 MYC 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 증가된 MYC 발현을 특징으로 하는, 방법.
465.
구현예 426 내지 464 중 어느 하나에 있어서, 상기 암은 MYC 유전자의 일부 또는 전부의 복제를 특징으로 하는, 방법.
466.
구현예 426 내지 465 중 어느 하나에 있어서, 상기 암은 결장직장암, 유방암, AML, 전립선암, 신경모세포종, 폐암, 자궁내막암, 간암, 림프종(예를 들어, 버킷 림프종), 자궁경부 암종, 또는 또는 위암으로부터 선택되는, 방법.
467.
구현예 426 내지 466 중 어느 하나에 있어서, 상기 암은 인간 융모성 생식선 자극호르몬(hCG) 분비 암인, 방법.
468.
구현예 426 내지 467 중 어느 하나에 있어서, 상기 암은 간암종인, 방법.
469.
구현예 426 내지 468 중 어느 하나에 있어서, 상기 암은 비-반응성 암, 예를 들어 비-반응성 간암종인, 방법.
470.
구현예 426 내지 469 중 어느 하나에 있어서, 상기 암은 비소세포 폐 암종 또는 소세포 폐 암종인, 방법.
471.
구현예 426 내지 470 중 어느 하나에 있어서, 상기 암은 (예를 들어, 참조 세포의 AFP 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 알파-태아단백질(AFP)을 과발현하는, 방법.
472.
구현예 431 내지 471 중 어느 하나에 있어서, 상기 암의 세포는, 예를 들어 MYC 유전자를 포함하거나 MYC 유전자를 포함하는 앵커-서열 매개 연접부를 포함하는 슈퍼 인핸서의 존재를 특징으로 하고, 선택적으로 상기 암은 간암, 직장결장암, 유방암, AML, 전립선암, 신경모세포종, 폐암, 또는 자궁내막암으로부터 선택되는, 방법.
472.
구현예 471에 있어서, 상기 발현 리프레서(예를 들어, 제2 발현 리프레서)는 MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는, 방법.
473.
구현예 426 내지 472 중 어느 하나에 있어서, 상기 암의 세포는 MYC 유전자를 포함하거나 MYC 유전자를 포함하는 앵커-서열 매개 연접부를 포함하는 슈퍼 인핸서의 부재를 특징으로 하는, 방법.
474.
구현예 473에 있어서, 상기 발현 리프레서(예를 들어, 제1 발현 리프레서)는 MYC 프로모터에 결합하는, 방법.
475.
구현예 426 내지 474 중 어느 하나에 있어서, 상기 암은 MYC 유전자를 포함하거나 MYC 유전자를 포함하는 앵커-서열 매개 연접부를 포함하는 슈퍼 인핸서를 포함하는 세포, 및 MYC 유전자를 포함하거나 MYC 유전자를 포함하는 앵커-서열 매개 연접부를 포함하는 슈퍼 인핸서를 포함하지 않는 세포를 포함하는, 방법.
476.
구현예 426 내지 475 중 어느 하나에 있어서, 상기 암은 참조 수준에 비해(예를 들어, 참조 서열의 MYC 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 증가된 MYC 발현을 특징으로 하는 세포, 및 참조 수준에 비해(예를 들어, 참조 세포의 MYC 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 증가된 MYC 발현을 특징으로 하지 않는, 예를 들어 정상적인 MYC 발현을 갖는 세포를 포함하는, 방법.
477.
구현예 426 내지 476 중 어느 하나에 있어서, 상기 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물은 단일요법으로 투여되는, 방법.
478.
구현예 426 내지 477 중 어느 하나에 있어서, 대상체에게 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물의 복수 용량, 예를 들어 적어도 2, 3, 4, 5, 또는 6회 용량을 투여하는 단계를 포함하는, 방법.
479.
구현예 426 내지 479 중 어느 하나에 있어서, 대상체에게 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물의 복수 용량을 5일 간격으로 투여하는 단계를 포함하는, 방법.
480.
구현예 426 내지 479 중 어느 하나에 있어서,
a) 첫째, 대상체에게 본 명세서에 기재된(예를 들어, 구현예 1 내지 424 중 어느 하나의) 발현 리프레서 또는 시스템의 제1 복수의 용량을 투여하되, 선택적으로 제1 복수의 용량의 각각의 후속 용량은 제1 복수의 용량의 이전 용량으로부터 5일 후에 투여되는, 단계;
b) 둘째, 일정 기간(예를 들어, "약물 휴지기") 동안, 예를 들어 약 2주 동안 발현 리프레서 또는 시스템을 중단시키는 단계, 및
c) 셋째, 대상체에게 발현 리프레서 또는 시스템의 제2 복수의 용량을 투여하되, 선택적으로 제2 복수의 용량의 후속 용량은 제2 복수의 용량의 이전 용량으로부터 5일 후에 투여되는, 단계
를 포함하는, 방법.
481.
구현예 480에 있어서, 상기 제1 복수의 용량은 4회 용량을 포함하는, 방법.
482.
구현예 479 또는 480에 있어서, 상기 제2 복수의 용량은 2회 용량을 포함하는, 방법.
483.
구현예 480 내지 482 중 어느 하나에 있어서, 상기 대상체는 약물 휴지기 동안 전혀 치료제를 받지 않는, 방법.
484.
구현예 480 내지 483 중 어느 하나에 있어서, 상기 대상체는 약물 휴지기 동안 제2 치료제를 받는, 방법.
485.
구현예 480 내지 484 중 어느 하나에 있어서, 상기 약물 휴지기는 제1 복수의 용량의 용량 투여 사이의 시간의 적어도 2배인, 방법.
486.
구현예 480 내지 486 중 어느 하나에 있어서, 상기 약물 휴지기는 제2 복수의 용량의 용량 투여 사이의 시간의 적어도 2배인, 방법.
487.
구현예 426 내지 486 중 어느 하나에 있어서, 상기 종양의 부피는 발현 리프레서 또는 시스템으로 치료 후 검출 가능하지 않은 수준으로 감소되는, 방법.
488.
구현예 426 내지 487 중 어느 하나에 있어서, 종양 부피는 발현 리프레서 또는 시스템으로의 치료 중단 후 (예를 들어, 검출 가능하지 않은 수준으로) 감소되는, 방법.
489.
구현예 425 내지 488 중 어느 하나에 있어서, 상기 암은 발현 리프레서 또는 시스템에 대해 내성이 되지 않거나, 10, 20, 30, 40, 50, 또는 60일 내에 발현 리프레서 또는 시스템에 대해 내성이 되지 않는, 방법.
490.
구현예 425 내지 489 중 어느 하나에 있어서, 상기 암 세포는 기능성 아폽토시스 경로를 갖는, 방법.
491.
구현예 425 내지 490 중 어느 하나에 있어서, 상기 암 세포는 기능성 카스파제 3을 갖는, 방법.
492.
구현예 491에 있어서, 카스파제 3은 대상체에의 발현 리프레서 또는 시스템의 투여 시 암 세포에서 상향조절되는, 방법.
493.
구현예 425 내지 492 중 어느 하나에 있어서, Ki67은 대상체에의 발현 리프레서 또는 시스템의 투여 시 암 세포에서 하향조절되는, 방법.
494.
구현예 425 내지 493 중 어느 하나에 있어서, 암 세포 증식은 대상체에의 발현 리프레서 또는 시스템의 투여 시 감소되는, 방법.
495.
구현예 425 내지 494 중 어느 하나에 있어서, 상기 방법은
a. 세포를 제2 치료제와 접촉시키는 단계, 또는
b. 대상체에게 제2 치료제를 투여하는 단
계를 추가로 포함하는, 방법.
496.
구현예 495에 있어서, 상기 제2 치료제는 MYC 프로모터에 대해 결합하는 발현 리프레서가 아닌, 방법.
497.
구현예 495 또는 496에 있어서, 상기 제2 치료제는 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 융합 단백질, 핵산, 벡터, 반응 혼합물, 약제학적 조성물, 또는 지질 나노입자가 아닌, 방법.
498.
구현예 494 내지 496 중 어느 하나에 있어서, 상기 제2 치료제는 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 융합 단백질, 핵산, 벡터, 반응 혼합물, 약제학적 조성물, 또는 지질 나노입자인, 방법.
499.
구현예 495 내지 497 중 어느 하나에 있어서, 상기 제2 치료제는 면역요법, 면역 관문 및 항-혈관-내피-성장 인자 요법 중 하나 또는 둘 다, 전신 화학요법, 타이로신 키나제 억제제, 예를 들어 소라페닙, 미토겐-활성화 단백질 키나제 키나제 억제제(MEK 억제제), 예를 들어 트라메티닙, 또는 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1 또는 비라브레십인, 방법.
500.
구현예 495 내지 499 중 어느 하나에 있어서, 상기 제2 치료제는 타이로신 키나제 억제제, 예를 들어 소라페닙인, 방법.
501.
구현예 495 내지 499 중 어느 하나에 있어서, 상기 제2 치료제는 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1, 비라브레십, 또는 BET 672인, 방법.
502.
구현예 495 내지 499 중 어느 하나에 있어서, 상기 제2 치료제는 미토겐-활성화 단백질 키나제 키나제 억제제(MEK 억제제), 예를 들어 트라메티닙인, 방법.
503.
구현예 495 내지 502 중 어느 하나에 있어서, 상기 방법은 대상체에게 추가 요법을 투여하는 단계를 추가로 포함하는, 방법.
504.
구현예 504에 있어서, 상기 추가 요법은 외과적 절제 동소(orthotopic) 간 이식, 고주파 절제, 광역동 치료(PDT), 레이저 치료, 근접치료, 방사선 치료, 경-카테터 동맥 화학- 또는 방사선-색전술, 또는 정위 방사선 치료를 포함하는, 방법.
505.
구현예 495 내지 504 중 어느 하나에 있어서, 상기 제2 치료제는 관문 억제제 또는 소분자로부터 선택되는, 방법.
506.
구현예 495 내지 505 중 어느 하나에 있어서, 상기 제2 치료제는 화학요법제, 예를 들어 키나제 억제제 또는 브로모도메인 억제제, 예를 들어 BET 억제제인, 방법.
507.
구현예 505 또는 506에 있어서, 상기 제2 치료제는 소라페닙, JQ1, BET672, 비라브레십, 또는 트라메티닙으로부터 선택되는, 방법.
508.
구현예 495 내지 506 중 어느 하나에 있어서, 상기 발현 리프레서, 시스템, 또는 핵산 및 제2 치료제는 동시에 투여되는, 방법.
509.
구현예 495 내지 508 중 어느 하나에 있어서, 상기 발현 리프레서, 시스템, 또는 핵산 및 제2 치료제는 순차적으로 투여되는, 방법.
509.
구현예 503 내지 509 중 어느 하나에 있어서, 상기 추가 요법은 동시에 투여되는, 방법.
511.
구현예 503 내지 510 중 어느 하나에 있어서, 상기 추가 요법은 순차적으로 투여되는, 방법.
512.
구현예 495 내지 511 중 어느 하나에 있어서, 상기 제2 치료제는 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 약제학적 조성물, 또는 반응 혼합물과 동시에 투여되는, 방법.
513.
구현예 495 내지 512 중 어느 하나에 있어서, 상기 제2 치료제는 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 약제학적 조성물, 또는 반응 혼합물과 연속적으로 투여되는, 방법.
514.
구현예 495 내지 513 중 어느 하나에 있어서, 상기 발현 리프레서, 시스템, 또는 핵산은 정맥내로 투여되고, 제2 요법은 경구로 투여되는, 방법.
515.
선행하는 구현예 중 어느 하나에 있어서, 상기 암은 저항성 또는 불응성 암인, 방법.
516.
선행하는 구현예 중 어느 하나에 있어서, 상기 암은 키나제 억제제, 예를 들어 VEGFR, PDGFR, 또는 RAF 키나제, 예를 들어 소라페닙 중 하나 이상을 억제하는 키나제 억제제인, 방법.
517.
선행하는 구현예 중 어느 하나에 있어서, 상기 대상체는 MYC 슈퍼-인핸서의 증폭을 갖는, 방법.
518.
구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 상기 시스템 또는 발현 리프레서를 인코딩하는 하나 이상의 핵산, 벡터, 지질 나노입자, 반응 혼합물, 또는 약제학적 조성물을 포함하는 조성물을 포함하는 용기, 및 상기 조성물을 이용하여 세포 내의 MYC 유전자의 발현을 조절하는, 예를 들어 감소시키는 적어도 하나의 방법을 포함하는 한 세트의 설명서를 포함하는 키트.
정의
하나 : 본 명세서에 사용되는 바와 같이, 단수 형태("a", "an", 및 "the")는 문맥이 명백하게 달리 지시하지 않는 한 복수 지시대상을 포함한다.
작용제(agent) : 본 명세서에 사용되는 바와 같이, 용어 "작용제"는, 예를 들어 폴리펩타이드, 핵산, 당류, 지질, 소분자, 금속, 또는 이들의 조합 또는 복합체를 포함하는 임의의 화학 부류의 화합물 또는 실체(entity)를 지칭하는 데 사용될 수 있다. 문맥으로부터 당업자에게 명백할 바와 같이, 일부 구현예에서, 상기 용어는 세포 또는 유기체, 또는 이의 분획, 추출물, 또는 성분이거나 이를 포함하는 실체를 지칭하는 데 이용될 수 있다. 대안적으로, 또는 추가적으로, 문맥에 비추어 당업자가 이해할 바와 같이, 일부 구현예에서, 상기 용어는 자연에서 발견되고/되거나 자연으로부터 얻어진다는 점에서 천연 제품을 지칭하는 데 사용될 수 있다. 일부 구현예에서, 다시 문맥에 비추어 당업자가 이해할 바와 같이, 상기 용어는 사람의 손의 작용을 통해 설계, 조작, 및/또는 생산되고/되거나 자연에서 발견되지 않는다는 점에서 인공적인 하나 이상의 실체를 지칭하는 데 사용될 수 있다. 일부 구현예에서, 작용제는 단리되거나 순수한 형태로 이용될 수 있고; 일부 구현예에서, 작용제는 미정제 형태로 이용될 수 있다. 일부 구현예에서, 잠재적인 작용제는, 예를 들어 이들 내의 활성제를 식별하거나 특성화하기 위해 스크리닝될 수 있는, 컬렉션 또는 라이브러리로 제공될 수 있다. 일부 구현예에서, 용어 "작용제"는 중합체이거나 이를 포함하는 화합물 또는 실체를 지칭할 수 있고; 일부 구현예에서, 상기 용어는 하나 이상의 중합체 모이어티를 포함하는 화합물 또는 실체를 지칭할 수 있다. 일부 구현예에서, 용어 "작용제"는 중합체가 아니고/아니거나 임의의 중합체 및/또는 하나 이상의 특정 중합체 모이어티가 실질적으로 없는 화합물 또는 실체를 지칭할 수 있다. 일부 구현예에서, 상기 용어는 임의의 중합체 모이어티가 결여되어 있거나 실질적으로 없는 화합물 또는 실체를 지칭할 수 있다.
앵커 서열: 본 명세서에 사용되는 바와 같이, 용어 "앵커 서열"은 앵커 서열-매개 연접부, 예를 들어 복합체를 형성하도록 충분히 결합하는 핵형성제(nucleating agent)에 의해 인식되는 핵산 서열을 지칭한다. 일부 구현예에서, 앵커 서열은 하나 이상의 CTCF 결합 모티프를 포함한다. 일부 구현예에서, 앵커 서열은 유전자 코딩 영역 내에 위치되어 있지 않다. 일부 구현예에서, 앵커 서열은 유전자간 영역 내에 위치되어 있다. 일부 구현예에서, 앵커 서열은 인핸서 또는 프로모터 중 어느 것에도 위치되어 있지 않다. 일부 구현예에서, 앵커 서열은 임의의 전사 개시 부위로부터 적어도 400 bp, 적어도 450 bp, 적어도 500 bp, 적어도 550 bp, 적어도 600 bp, 적어도 650 bp, 적어도 700 bp, 적어도 750 bp, 적어도 800 bp, 적어도 850 bp, 적어도 900 bp, 적어도 950 bp, 또는 적어도 1kb 떨어져 위치되어 있다. 일부 구현예에서, 앵커 서열은 게놈 각인, 단일대립유전자 발현, 및/또는 단일대립유전자 후성유전학적 마크와 연관되어 있지 않은 영역 내에 위치되어 있다. 일부 구현예에서, 앵커 서열은 내인성 핵형성 폴리펩타이드(예를 들어, CTCF)에 결합하는 기능, 제2 앵커 서열과 상호작용하여 앵커 서열-매개 연접부를 형성하는 기능, 또는 앵커 서열-매개 연접부 외부에 있는 인핸서에 대해 절연하는 기능으로부터 선택되는 하나 이상의 기능을 갖는다. 본 개시내용의 일부 구현예에서, 기타 다른 앵커 서열(예를 들어, 상이한 상황에서 핵형성제(예를 들어, CTCF) 결합 모티프를 함유할 수 있는 서열)을 표적화하지 않고서, 특정 앵커 서열 또는 앵커 서열들을 특이적으로 표적화할 수 있는 기술이 제공되며; 그러한 표적화된 앵커 서열은 "표적 앵커 서열"로 지칭될 수 있다. 일부 구현예에서, 표적 앵커 서열의 서열 및/또는 활성은 조절되는 반면, 표적화된 앵커 서열과 동일한 시스템 내에(예를 들어, 동일한 세포 내에 그리고/또는 일부 구현예에서는 동일한 핵산 분자(예를 들어, 동일한 염색체) 상에) 존재할 수 있는 하나 이상의 다른 앵커 서열의 서열 및/또는 활성은 조절되지 않는다. 일부 구현예에서, 앵커 서열은 핵형성 폴리펩타이드 결합 모티프이거나 이를 포함한다. 일부 구현예에서, 앵커 서열은 핵형성 폴리펩타이드 결합 모티프에 인접한다.
앵커 서열-매개 연접부: 본 명세서에 사용되는 바와 같이, 용어 "앵커 서열-매개 연접부"는 DNA 내의 적어도 2개의 앵커 서열이, 이들 앵커 서열에 결합하여 앵커 서열들 사이의 공간적 근접 및 기능성 결합을 가능하게 하는 하나 이상의 폴리펩타이드, 예컨대 핵형성 폴리펩타이드, 또는 하나 이상의 단백질 및/또는 핵산 실체(entity)(예컨대, RNA 또는 DNA)에 의한, 이들 적어도 2개의 앵커 서열의 물리적 상호작용 또는 결합을 통해 일어나고/나거나 유지되는 DNA 구조, 일부 경우에는 복합체를 지칭한다(예를 들어, 도 1 참조).
~와 연관된: 2개의 사건 또는 실체는, 그 용어가 본 명세서에 사용되는 바와 같이, 하나의 존재, 수준, 형태 및/또는 기능이 나머지 다른 하나의 것과 상관 관계가 있다면, 서로 "연관되어" 있다. 예를 들어, 일부 구현예에서, 특정 실체(예를 들어, 폴리펩타이드, 유전자적 시그니처, 대사물, 미생물 등)는 그의 존재, 수준, 형태 및/또는 기능이 (예를 들어, 관련 집단에 걸쳐) 특정 질환, 장애, 또는 병태의 발병률 및/또는 감수성과 상관 관계가 있다면, 그러한 질환, 장애, 또는 병태과 연관되어 있는 것으로 여겨진다. 일부 구현예에서, 2개 이상의 실체는, 그들이 직접적으로 또는 간접적으로 상호작용하여 서로 물리적 근접 상태에 있거나 이 상태를 유지한다면, 서로 물리적으로 "연관되어" 있다. 일부 구현예에서, 서로 물리적으로 연관된 2개 이상의 실체는 서로 공유적으로 연결되어 있으며; 일부 구현예에서, 서로 물리적으로 관련된 2개 이상의 실체는 서로 공유적으로 연결되어 있지 않고, 예를 들어 수소 결합, 반데르발스 상호작용, 소수성 상호작용, 자기력(magnetism), 및 이들의 조합에 의해 비공유적으로 회합되어 있다. 일부 구현예에서, DNA 서열은, 핵산이 적어도 부분적으로 표적 게놈 또는 전사 복합체 내에 있고, DNA 서열 내의 유전자의 발현이 표적 게놈 또는 전사 복합체의 형성 또는 파괴에 의해 영향을 받을 때, 표적 게놈 또는 전사 복합체"와 연관되어" 있다.
도메인: 본 명세서에 사용되는 바와 같이, 용어 "도메인"은 실체의 섹션 또는 일부분을 지칭한다. 일부 구현예에서, "도메인"은 실체의 특정 구조적 및/또는 기능적 특징과 관련되어 있으며, 이로써 도메인이 그의 모 실체의 나머지로부터 물리적으로 분리되어 있을 때, 그것은 특정 구조적 및/또는 기능적 특징을 실질적으로 또는 전체적으로 유지한다. 대안적으로 또는 추가적으로, 일부 구현예에서, 도메인은, 그러한 (모) 실체로부터 분리되고 상이한 (수용자) 실체와 연결될 때, 모 실체에서 특징이 되게 한 하나 이상의 구조적 및/또는 기능적 특징을 수용자 실체 상에 실질적으로 유지하고/하거나 부여하는 실체의 일부분일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 도메인은 분자(예를 들어, 소분자, 탄수화물, 지질, 핵산, 폴리펩타이드 등)의 섹션 또는 일부분이거나 이를 포함한다. 일부 구현예에서, 도메인은 폴리펩타이드의 섹션이거나 이를 포함한다. 일부 그러한 구현예에서, 도메인은 특정 구조 요소(예를 들어, 특정 아미노산 서열 또는 서열 모티프, 알파-나선 특성, 베타-시트 특성, 코일드-코일(coiled-coil) 특성, 랜덤 코일 특성 등)에 의해, 그리고/또는 특정 기능적 특징(예를 들어, 결합 활성, 효소 활성, 접힘 활성, 신호전달 활성 등)에 의해 특성화된다.
이펙터 모이어티: 본 명세서에 사용되는 바와 같이, 용어 "이펙터 모이어티"는 세포의 핵 내에 적절하게 국재화될 때 표적 유전자의 발현을 변경시킬 수 있는 도메인을 지칭한다. 일부 구현예에서, 이펙터 모이어티는 전사 기구(transcription machinery)의 성분을 동원한다. 일부 구현예에서, 이펙터 모이어티는 전사 인자 또는 발현 억제 인자의 성분의 동원을 억제한다. 일부 구현예에서, 이펙터 모이어티는 후성유전학적 변형 모이어티를 포함한다(예를 들어, 표적 DNA 서열을 후성유전학적으로 변형시킴).
후성유전학적 변형 모이어티: 본 명세서에 사용되는 바와 같이, "후성유전학적 변형 모이어티"는 i) 염색질의 구조, 예를 들어 2차원 구조; 및/또는 ii) 후성유전학적 변형 모이어티가 (예를 들어, 표적화 모이어티에 의해) 핵산에 적절하게 국재화될 때, 후성유전학적 마커(예를 들어, DNA 메틸화, 히스톤 메틸화, 히스톤 아세틸화, 히스톤 수모화(sumoylation), 히스톤 인산화, 및 RNA-연관 침묵 중 하나 이상)를 변경시키는 도메인을 지칭한다. 일부 구현예에서, 후성유전학적 변형 모이어티는 하나 이상의 후성유전학적 마커에 영향을 미치는(예를 들어, 이의 수준을 증가시키거나 감소시키는) 효소, 또는 이의 기능성 단편 또는 변이체를 포함한다. 일부 구현예에서, 후성유전학적 변형 모이어티는 DNA 메틸트랜스퍼라제, 히스톤 메틸트랜스퍼라제, CREB-결합 단백질(CBP), 또는 이들 중 임의의 것의 기능성 단편을 포함한다.
발현 제어 서열: 본 명세서에 사용되는 바와 같이, 용어 "발현 제어 서열"은 유전자의 전사를 증가시키거나 감소시키는 핵산 서열을 지칭하며 프로모터 및 인핸서를 포함한다(그러나 이에 제한되지 않음). "인핸싱 서열"은 발현 제어 서열의 하위유형을 지칭하며 유전자 전사의 가능성을 증가시킨다. "침묵 또는 리프레서 서열"은 발현 제어 서열의 하위유형을 지칭하며 유전자 전사의 가능성을 감소시킨다.
발현 리프레서: 본 명세서에 사용되는 바와 같이, 용어 "발현 리프레서"는, 세포 내의 표적 유전자의 발현을 감소시키고, DNA 서열(예를 들어, 표적 유전자, 또는 표적 유전자에 작동가능하게 연결된 전사 제어 요소와 연관된 DNA 서열)에 특이적으로 결합하는 하나 이상의 기능성을 갖는 작용제 또는 실체를 지칭한다. 발현 리프레서는 적어도 하나의 표적화 모이어티 및 선택적으로 하나의 이펙터 모이어티를 포함한다.
발현 억제 시스템: 본 명세서에 사용되는 바와 같이, 용어 "발현 억제 시스템"은 세포 내의 표적 유전자의 발현을 감소시키는 복수의 발현 리프레서를 지칭한다. 일부 구현예에서, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함하며, 제1 발현 리프레서 및 제2 발현 리프레서(또는 제1 발현 리프레서 및 제2 발현 리프레서를 인코딩하는 핵산)는 단일 조성물, 혼합물, 또는 약제학적 조성물 내에 함께 존재한다. 일부 구현예에서, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함하며, 제1 발현 리프레서 및 제2 발현 리프레서(또는 제1 발현 리프레서 및 제2 발현 리프레서를 인코딩하는 핵산)는 별개의 조성물 또는 약제학적 조성물 내에 존재한다. 일부 구현예에서, 제1 발현 리프레서와 제2 발현 리프레서는 동일한 세포 내에 동시에 존재한다. 일부 구현예에서, 제1 발현 리프레서와 제2 발현 리프레서는 동일한 세포 내에 동시에 존재하지 않으며, 예를 들어 이들은 순차적으로 존재한다. 예를 들어, 제1 발현 리프레서가 제1 기간 동안 세포 내에 존재할 수 있고, 이어서 제2 발현 리프레서가 제2 기간 동안 세포 내에 존재할 수 있으며, 여기서 제1 기간 및 제2 기간은 중첩 또는 비중첩될 수 있다.
융합 분자 : 본 명세서에 사용되는 바와 같이, 용어 "융합 분자"는 공유 결합된 2개 이상의 모이어티, 예를 들어 표적화 모이어티 및 이펙터 모이어티를 포함하는 화합물을 지칭한다. 융합 분자 및 이의 모이어티는 폴리펩타이드, 핵산, 글리칸, 소분자, 또는 본 명세서에 기재된 다른 성분의 임의의 조합을 포함할 수 있다(예를 들어, 표적화 모이어티는 핵산을 포함할 수 있고 이펙터 모이어티는 폴리펩타이드를 포함할 수 있다). 일부 구현예에서, 융합 분자는, 예를 들어 펩타이드 결합을 통해 공유 연결되는 하나 이상의 폴리펩타이드 도메인을 포함하는 융합 단백질이다. 일부 구현예에서, 융합 단백질은 펩타이드 결합 또는 포스포디에스테르 결합 이외의 공유 결합에 의해 연결되는 표적화 모이어티 및 이펙터 모이어티(예를 들어, 핵산을 포함하는 표적화 모이어티 및 펩타이드 결합 또는 포스포디에스테르 결합 이외의 공유 결합에 의해 연결되는 폴리펩타이드를 포함하는 이펙터 모이어티)를 포함하는 접합체 분자이다. 일부 구현예에서, 발현 리프레서는 융합 분자이거나 이를 포함한다.
게놈 복합체 : 본 명세서에 사용되는 바와 같이, 용어 "게놈 복합체"는 복수의 단백질 및/또는 기타 다른 성분(잠재적으로, 게놈 서열 요소를 포함함) 사이의 상호작용을 통해, 하나 이상의 염색체 상의 서로 이격된 2개의 게놈 서열 요소를 합친 복합체이다. 일부 구현예에서, 게놈 서열 요소는 복합체의 하나 이상의 단백질 성분이 결합하는 앵커 서열이다. 일부 구현예에서, 게놈 복합체는 앵커 서열-매개 연접부를 포함할 수 있다. 일부 구현예에서, 게놈 서열 요소는 CTCF 결합 모티프, 프로모터 및/또는 인핸서일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 게놈 서열 요소는 프로모터 및/또는 조절 부위(예를 들어, 인핸서) 중 적어도 하나 또는 둘 다를 포함한다. 일부 구현예에서, 복합체 형성은 게놈 서열 요소(들)에서 그리고/또는 게놈 서열 요소(들)에 대한 단백질 성분(들) 중 하나 이상의 결합에 의해 핵형성된다. 당업자에 의해 이해되는 바와 같이, 일부 구현예에서 복합체의 형성을 통한 게놈 부위들의 공국재화(예를 들어, 연접)는 게놈 서열 요소(들)에서 또는 그 부근에서(일부 구현예에서는, 이들 사이를 포함함), DNA 토폴로지를 변경시킨다. 일부 구현예에서, 게놈 복합체는 하나 이상의 루프를 포함하는 앵커 서열-매개 연접부를 포함한다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체는 핵형성 폴리펩타이드, 예컨대 CTCF 및/또는 코헤신(Cohesin)에 의해 핵형성된다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체는, 예를 들어 CTCF, 코헤신, 비-코딩 RNA(예를 들어, eRNA), 전사 기구 단백질(예를 들어, RNA 폴리머라제, 하나 이상의 전사 인자, 예를 들어 TFIIA, TFIIB, TFIID, TFIIE, TFIIF, TFIIH 등으로 구성되는 군으로부터 선택된 것), 전사 조절인자(예를 들어, 메디에이터(Mediator), P300, 인핸서-결합 단백질, 리프레서-결합 단백질, 히스톤 변형제 등) 등 중 하나 이상을 포함할 수 있다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체는 하나 이상의 폴리펩타이드 성분 및/또는 하나 이상의 핵산 성분(예를 들어, 하나 이상의 RNA 성분)을 포함하며, 이들은, 일부 구현예에서, 복합체가 형성되지 않을 때 채택하지 않는 토폴로지 형상(예를 들어, 루프) 내로의 게놈 DNA의 신장(stretch)을 구속하도록 서로 그리고/또는 하나 이상의 게놈 서열 요소(예를 들어, 앵커 서열, 프로모터 서열, 조절 서열(예를 들어, 인핸서 서열))과 상호작용할 수 있다.
모이어티 : 본 명세서에 사용되는 바와 같이, 용어 "모이어티"는 본 명세서에 기재된 바와 같은 특정 구조 및/또는 활성을 갖는 정의된 화학 기 또는 실체를 지칭한다.
조절제: 본 명세서에 사용되는 바와 같이, 용어 "조절제"는 표적 유전자, 예를 들어 MYC의 발현을 변경(예를 들어, 증가 또는 감소)시킬 수 있는 하나 이상의 이펙터 모이어티 및 하나 이상의 표적화 모이어티를 포함하는 작용제를 지칭한다.
MYC: 본 명세서에 사용되는 바와 같이, 용어 "MYC 유전자좌"는 MYC 폴리펩타이드(예를 들어, NCBI 수탁 번호 NP002458.2에 개시된 폴리펩타이드, 또는 이의 돌연변이체), MYC에 작동가능하게 연결된 프로모터("MYC 프로모터"), 및 MYC 유전자를 포함하는 ASMC를 형성하는 앵커 서열을 인코딩하는 인간 게놈의 일부를 지칭한다. 일부 구현예에서, MYC 유전자좌는 NCBI 수탁 번호 NM―002467을 갖는 핵산을 인코딩한다. 일부 구현예에서, MYC 유전자는 원종양유전자이고, 일부 구현예에서 MYC 유전자는 종양유전자이다. 특정 경우에, MYC 유전자는 8번 염색체의 8q24.21에서 발견된다. 특정 경우에, MYC 유전자는 pter의 128,816,862 bp에서 시작하고 pter의 128,822,856 bp에서 끝난다. 특정 경우에, MYC 유전자는 약 6 kb이다. 특정 경우에, MYC 유전자는 적어도 8개의 분리된 mRNA 서열(5개의 선택적 스플라이싱된 변이체 및 3개의 스플라이싱되지 않은 변이체)을 인코딩한다.
핵산 : 본 명세서에 사용되는 바와 같이, 용어 "핵산"은, 그의 가장 넓은 의미에서, 올리고뉴클레오타이드 사슬 내로 도입되거나 도입될 수 있는 임의의 화합물 및/또는 물질을 지칭한다. 일부 구현예에서, 핵산은 포스포디에스테르 결합을 통해 올리고뉴클레오타이드 사슬 내로 도입되거나 도입될 수 있는 화합물 및/또는 물질이다. 맥락으로부터 명백한 바와 같이, 일부 구현예에서 "핵산"은 개별 핵산 잔기(예를 들어, 뉴클레오타이드 및/또는 뉴클레오시드)를 지칭하고; 일부 구현예에서, "핵산"은 개별 핵산 잔기들을 포함하는 올리고뉴클레오타이드 사슬을 지칭한다. 일부 구현예에서, "핵산"은 RNA이거나 이를 포함하고; 일부 구현예에서, "핵산"은 DNA이거나 이를 포함한다. 일부 구현예에서, 핵산은 하나 이상의 천연 핵산 잔기이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 하나 이상의 핵산 유사체이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산 유사체는 포스포디에스테르 백본을 이용하지 않는다는 점에서 핵산과 상이하다. 예를 들어, 일부 구현예에서, 핵산은 하나 이상의 "펩타이드 핵산"이거나, 이를 포함하거나, 이로 구성되는데, 펩타이드 핵산은 당업계에 알려져 있고, 백본 내에 포스포디에스테르 결합 대신에 펩타이드 결합을 가지며, 본 개시내용의 범주 내에 있는 것으로 여겨진다. 대안적으로 또는 추가적으로, 일부 구현예에서, 핵산은 포스포디에스테르 결합 대신에 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포르아미다이트 결합을 갖는다. 일부 구현예에서, 핵산은 하나 이상의 천연 뉴클레오시드(예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시 구아노신, 및 데옥시시티딘)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 하나 이상의 뉴클레오시드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, C-5 프로피닐-시티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, 0(6)-메틸구아닌, 2-티오시티딘, 메틸화 염기, 삽입된 염기, 및 이들의 조합)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 천연 핵산 내의 것들과 비교할 때 하나 이상의 변형된 당(예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스)을 포함한다. 일부 구현예에서, 핵산은 기능성 유전자 산물, 예컨대 RNA 또는 단백질을 인코딩하는 뉴클레오타이드 서열을 갖는다. 일부 구현예에서, 핵산은 하나 이상의 인트론을 포함한다. 일부 구현예에서, 핵산은 천연 공급원로부터의 단리, 상보적 주형을 기반으로 한 중합에 의한 효소적 합성(생체내 또는 시험관내), 재조합 세포 또는 시스템에서의 재생산, 및 화학적 합성 중 하나 이상에 의해 제조된다. 일부 구현예에서, 핵산은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 20, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000개 또는 그 이상의 잔기 길이이다. 일부 구현예에서, 핵산은 부분적으로 또는 전적으로 단일 가닥이고; 일부 구현예에서, 핵산은 부분적으로 또는 전체적으로 이중 가닥이다. 일부 구현예에서, 핵산은, 폴리펩타이드를 인코딩하는 서열의 상보체이거나 폴리펩타이드를 인코딩하는 적어도 하나의 요소를 포함하는 뉴클레오타이드 서열을 갖는다. 일부 구현예에서, 핵산은 효소 활성을 갖는다.
핵형성 폴리펩타이드 : 본 명세서에 사용되는 바와 같이, 용어 "핵형성 폴리펩타이드" 또는 "연접부 핵형성 폴리펩타이드"는 본 명세서에 사용되는 바와 같이 앵커 서열과 직접적으로 또는 간접적으로 회합하는 단백질을 지칭하며 (앵커 서열 또는 다른 핵산과 상호작용할 수 있는) 하나 이상의 연접부 핵형성 폴리펩타이드와 상호작용하여, 서로 동일하거나 동일하지 않을 수 있는 2개 이상의 그러한 연접부 핵형성 폴리펩타이드로 구성된 이량체(또는 고차 구조)를 형성할 수 있다. 상이한 앵커 서열과 회합된 연접부 핵형성 폴리펩타이드가 서로 회합하여 상이한 앵커 서열이 서로 물리적으로 근접하게 유지될 때, 이에 의해 생성된 구조는 앵커-서열-매개 연접부이다. 즉, 또 다른 핵형성 폴리펩타이드-앵커 서열과 상호작용하는 핵형성 폴리펩타이드-앵커 서열의 가까운 물리적 근접성은 앵커 서열에서 시작하고 끝나는 앵커 서열-매개 연접부(예를 들어, 일부 경우에는 DNA 루프)를 생성한다. 본 명세서를 읽으면 당업자는 "핵형성 폴리펩타이드", "핵형성 분자", "핵형성 단백질", "연접부 핵형성 단백질"과 같은 용어가 때때로 연접부 핵형성 폴리펩타이드를 지칭하는 데 사용될 수 있음을 즉시 이해할 것이다. 유사하게 본 명세서를 읽는 당업자에 의해 즉시 이해될 바와 같이, 2개 이상의 연접부 핵형성 폴리펩타이드의 집합체(일부 구현예에서, 동일한 작용제의 여러 카피 및/또는 일부 구현예에서 복수의 상이한 작용물질 각각 중 하나 이상을 포함할 수 있음)는 "복합체", "이량체", "다량체" 등으로 지칭될 수 있다.
작동가능하게 연결된 : 본 명세서에 사용되는 바와 같이, 어구 "작동가능하게 연결된"은 기재된 성분들이 그들의 의도된 방식으로 기능할 수 있게 하는 관계에 있게 하는 병치(juxtaposition)를 지칭한다. 기능성 요소, 예를 들어 유전자에 "작동가능하게 연결된" 전사 제어 요소는 기능성 요소, 예를 들어 유전자의 발현 및/또는 활성이 전사 제어 요소와 양립가능한 조건 하에서 달성되도록 하는 방식으로 연관되어 있다. 일부 구현예에서, "작동가능하게 연결된" 전사 제어 요소는 관심 코딩 요소, 예를 들어 유전자와 연속적이며(예를 들어, 공유적으로 연결되어 있으며); 일부 구현예에서, 작동가능하게 연결된 전사 제어 요소는 관심 기능성 요소, 예를 들어 유전자에 대해 트랜스(trans)로 작용하거나 아니면 이로부터 떨어진 거리에서 작용한다. 일부 구현예에서, '작동가능하게 연결된'은 2개의 핵산 서열이 동일한 핵산 분자 상에 포함되어 있음을 의미한다. 추가의 구현예에서, '작동가능하게 연결된'은 2개의 핵산 서열이 동일한 핵산 분자 상에서, 예를 들어 1000, 500, 100, 50, 또는 10개의 서로의 염기쌍 이내에 서로 근접해 있거나 서로 직접 인접해 있음을 추가로 의미할 수 있다.
펩타이드, 폴리펩타이드, 단백질 : 본 명세서에 사용되는 바와 같이, 용어 "펩타이드", "폴리펩타이드", 및 "단백질"은 펩타이드 결합에 의해, 또는 펩타이드 결합 이외의 수단에 의해 공유적으로 연결된 아미노산 잔기들로 구성된 화합물을 지칭한다. 단백질 또는 펩타이드는 적어도 2개의 아미노산을 함유해야 하며, 단백질 또는 펩타이드의 서열을 구성할 수 있는 아미노산의 최대수에 대한 제한은 없다. 폴리펩타이드는 펩타이드 결합에 의해 또는 펩타이드 결합 이외의 수단에 의해 서로 결합된 2개 이상의 아미노산을 포함하는 임의의 펩타이드 또는 단백질을 포함한다. 본 명세서에 사용되는 바와 같이, 이 용어는 당업계에서, 예를 들어 펩타이드, 올리고펩타이드 및 올리고머로 일반적으로 지칭되는 짧은 사슬, 및 당업계에서 단백질(이에는 많은 유형이 있음)로 일반적으로 지칭되는 더 긴 사슬 둘 다를 지칭한다.
약제학적 조성물: 본 명세서에 사용되는 바와 같이, 용어 "약제학적 조성물"은 하나 이상의 약제학적으로 허용되는 담체와 함께 제형화된 활성제(예를 들어, 조절제, 예를 들어 파괴제)를 지칭한다. 일부 구현예에서, 활성제는 관련 집단에 투여될 때 사전결정된 치료적 효과를 달성할 통계학적으로 유의한 확률을 나타내는 치료 투약계획에서 투여하기에 적절한 단위 용량으로 존재한다. 일부 구현예에서, 약제학적 조성물은 고체 또는 액체 형태로의 투여를 위해 특수하게 제형화될 수 있으며, 이에는 하기에 맞게 구성된 것들이 포함된다: 경구 투여, 예를 들어 드렌치(drench)(수성 또는 비수성 용액 또는 현탁액), 정제, 예를 들어 협측, 설하, 및 전신 흡수를 목표로 한 것들, 볼루스, 분말, 과립, 혀에 적용하기 위한 페이스트; 비경구 투여, 예를 들어 피하, 근육내, 정맥내 또는 경막외 주사에 의한 투여, 예를 들어 멸균 용액 또는 현탁액, 또는 지속-방출 제형으로서의 주사; 국소 적용, 예를 들어 피부, 폐, 또는 구강에 적용되는 크림, 연고, 또는 제어-방출 패치 또는 스프레이로서의 적용; 질내 또는 직장내 투여, 예를 들어 페서리(pessary), 크림, 또는 폼(foam)으로서의 투여; 설하 투여; 안내 투여(ocularly); 경피 투여; 또는 비강, 폐, 및/또는 기타 다른 점막 표면 투여.
근접한 : 본 명세서에 사용되는 바와 같이, 용어 "근접"은 제1 부위에서 발현 리프레서의 결합 및/또는 발현 리프레서에 의한 제1 부위의 변형이 다른 한쪽 부위의 결합 및/또는 변형과 동일하거나 실질적으로 동일한 효과를 생성하도록 할 2개의 부위, 예를 들어 핵산 부위의 접근성을 지칭한다. 예를 들어, 표적화 모이어티는 인핸서(제2 부위)에 근접한 제1 부위에 결합할 수 있고, 상기 표적화 모이어티와 연관된 이펙터 모이어티는, 표적 유전자의 발현에 대한 인핸서의 효과가 마치 제2 부위(인핸서 서열)가 결합되고/되거나 변형된 것처럼 실질적으로 동일하게 변형되도록 제1 부위를 후성유전학적으로 변형시킬 수 있다. 일부 구현예에서, 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위)에 근접한 부위, 표적 유전자에 작동가능하게 연결된 전사 제어 요소에 근접한 부위, 또는 앵커 서열에 근접한 부위는 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위), 전사 제어 요소, 또는 앵커 서열로부터 5000, 5000, 4000, 3000, 2000, 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 50, 또는 25개의 염기쌍(그리고 선택적으로, 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위), 전사 제어 요소, 또는 앵커 서열)로부터 적어도 적어도 20, 25, 50, 100, 200, 또는 300개의 염기쌍) 미만에 있다.
특이적 : 본 명세서에 사용되는 바와 같이, 활성을 갖는 작용제를 지칭하는 용어 "특이적"은 작용제가 잠제적인 표적 실체 또는 상태를 구별하는 것을 의미하는 것으로 당업자에 의해 이해된다. 예를 들어, 일부 구현예에서, 작용제는 하나 이상의 경쟁하는 대안적인 표적의 존재 하에 작용제의 표적과 우선적으로 결합하는 경우 상기 표적에 "특이적으로" 결합한다고 한다. 일부 구현예에서, 특이적 상호작용은 표적 실체(예를 들어, 에피토프, 갈라진 틈(cleft), 결합 부위)의 특정한 구조적 특징의 존재에 따라 다르다. 특이성이 절대적일 필요가 없다는 것을 이해하여야 한다. 일부 구현예에서, 특이성은 하나 이상의 잠재적인 표적 실체(예를 들어, 경쟁자)에 대한 결합제의 특이성에 비해 평가될 수 있다. 일부 구현예에서, 특이성은 참조 특이적 결합제의 특이성에 비해 평가된다. 일부 구현예에서, 특이성은 참조 비-특이적 결합제의 특이성에 비해 평가된다. 일부 구현예에서, 작용제 또는 실체는 표적 실체에 대한 결합의 조건 하에 경쟁하는 대안적인 표적에 검출 가능하게 결합하지 않는다. 일부 구현예에서, 결합제는 경쟁하는 대안적인 표적(들)과 비교하여, 표적 실체에 대해 더 높은 온-레이트(on-rate), 더 낮은 오프-레이트(off-rate), 증가된 친화도, 감소된 해리, 및/또는 증가된 안정성으로 결합한다.
특이적 결합: 본 명세서에 사용되는 바와 같이, 용어 "특이적 결합"은 결합이 일어나게 될 환경에서, 가능한 결합 파트너들 사이를 구별하는 능력을 지칭한다. 일부 구현예에서, 다른 잠재적인 표적들이 존재할 때 하나의 특정 표적과 상호작용하는 결합제는 그것이 상호작용하는 표적에 "특이적으로 결합한다"라고 한다. 일부 구현예에서, 특이적 결합은 결합제와 이의 파트너 사이의 회합도(degree of association)를 검출하거나 결정함으로써 평가되고; 일부 구현예에서, 특이적 결합은 결합제-파트너 복합체의 해리도(degree of dissociation)를 검출하거나 결정함으로써 평가된다. 일부 구현예에서, 특이적 결합은 이의 파트너와 또 다른 실체 사이의 대체 상호작용과 경쟁할 수 있는 결합제의 능력을 검출하거나 결정함으로써 평가된다. 일부 구현예에서, 특이적 결합은 일정 범위의 농도에 걸쳐 그러한 검출 또는 결정을 수행함으로써 평가된다.
실질적으로 : 본 명세서에 사용되는 바와 같이, 용어 "실질적으로"는 관심 특징 또는 특성의 전체적인 또는 거의 전체적인 범위 또는 정도를 나타내는 정성적인 조건을 지칭한다. 당업자는 생물학적 및 화학적 현상이, 설사 가능하다 하더라도, 거의 완료되지 않고/않거나 완료로 진행되지 않거나 절대적인 결과를 달성하거나 피하지 못한다는 것을 이해할 것이다. 따라서, 용어 "실질적으로"는, 일부 구현예에서, 많은 생물학적 및 화학적 현상에 내재되어 있는 완료의 잠재적인 결여를 포착하는 데 사용될 수 있다.
증상이 감소된다 : 본 명세서에 사용되는 바와 같이, 어구 "증상이 감소된다"는 특정 질환, 장애 또는 병태의 하나 이상의 증상이 크기(예를 들어, 강도, 중증도 등) 및/또는 빈도가 감소될 때 사용될 수 있다. 일부 구현예에서, 특정 증상의 개시의 지연은 그러한 증상의 빈도를 감소시키는 한 가지 형태인 것으로 여겨진다.
표적화 : 작용제 또는 실체는, 서로 접촉되게 한 조건 하에서 또 다른 표적화된 작용제 또는 실체에 특이적으로 결합한다면, 본 개시내용에 따라 그러한 또 다른 작용제 또는 실체를 "표적화"하는 것으로 여겨진다. 일부 구현예에서, 예를 들어, 항체(또는 이의 항원-결합 단편)는 그의 동종 에피토프 또는 항원을 표적화한다. 일부 구현예에서, 특정 서열을 갖는 핵산은 실질적으로 상보적인 서열의 핵산을 표적화한다.
표적 유전자: 본 명세서에 사용되는 바와 같이, 용어 "표적 유전자"는, 예를 들어 발현의 조절을 위해 표적화된 유전자를 의미한다. 일부 구현예에서, 표적 유전자는 표적화된 게놈 복합체의 일부(예를 들어, 표적 게놈 복합체, 예를 들어 앵커 서열-매개 연접부 내부에 있는 것의 일부로서 게놈 서열의 적어도 일부를 갖는 유전자)이며, 이러한 게놈 복합체는 본 명세서에 기재된 바와 같은 하나 이상의 조절제에 의해 표적화된다. 일부 구현예에서, 조절은 표적 유전자의 발현의 억제를 포함한다. 일부 구현예에서, 표적 유전자는, 표적 유전자, 또는 표적 유전자에 작동가능하게 연결된 전사 제어 요소를 본 명세서에 기재된 발현 억제 시스템, 예를 들어 발현 리프레서(들)와 접촉시킴으로써 조절된다. 일부 구현예에서, 표적 유전자는 세포, 예를 들어 대상체(예를 들어, 환자) 내의 세포에서 비정상적으로 발현된다(예를 들어, 과발현된다).
표적화 모이어티 : 본 명세서에 사용되는 바와 같이, 용어 "표적화 모이어티"는 게놈 서열 요소(예를 들어, 발현 제어 서열 또는 앵커 서열)를 특이적으로 표적화하는, 예를 들어 이에 결합하는 작용제 또는 실체를 의미한다. 일부 구현예에서, 게놈 서열 요소는 표적 유전자(예를 들어, MYC)에 근접하고/하거나 이에 작동가능하게 연결된다.
치료제: 본 명세서에 사용되는 바와 같이, 어구 "치료제"는 대상체에게 투여될 때, 치료적 효과를 갖고/갖거나 원하는 생물학적 및/또는 약리학적 효과를 이끌어내는 작용제를 지칭한다. 일부 구현예에서, 치료제는 질환, 장애, 및/또는 병태를 경감시키고/시키거나, 호전시키고/시키거나, 완화하고/하거나, 억제하고/하거나, 예방하고/하거나, 이의 발병을 지연시키고/시키거나, 이의 중증도를 감소시키고/시키거나, 이의 하나 이상의 증상 또는 특징의 발생률을 감소시키는 데 사용될 수 있는 임의의 물질이다. 일부 구현예에서, 치료제는 본 명세서에 기재된 발현 억제 시스템, 예를 들어 발현 리프레서를 포함한다. 일부 구현예에서, 치료제는 본 명세서에 기재된 발현 억제 시스템, 예를 들어 발현 리프레서를 인코딩하는 핵산을 포함한다. 일부 구현예에서, 치료제는 본 명세서에 기재된 약제학적 조성물을 포함한다.
치료적 유효량: 본 명세서에 사용되는 바와 같이, 용어 "치료적 유효량"은 치료 투약계획(therapeutic regimen)의 일부로서 투여될 때 원하는 생물학적 반응을 이끌어내는 물질(예를 들어, 치료제, 조성물, 및/또는 제형)의 양을 의미한다. 일부 구현예에서, 물질의 치료적 유효량은 질환, 장애, 및/또는 병태를 앓거나 이에 취약한 대상체에게 투여될 때 그러한 질환, 장애, 및/또는 병태를 치료하고/하거나, 진단하고/하거나, 예방하고/하거나, 그의 발병을 지연시키기에 충분한 양이다. 당업자에 의해 이해되는 바와 같이, 물질의 유효량은 원하는 생물학적 종점(들), 전달하려는 물질, 표적 세포(들) 또는 조직(들) 등과 같은 인자들에 따라 달라질 수 있다. 예를 들어, 일부 구현예에서, 질환, 장애, 및/또는 병태를 치료하기 위한 제형 내의 화합물의 유효량은 그러한 질환, 장애, 및/또는 병태를 경감시키고/시키거나, 호전시키고/시키거나, 완화하고/하거나, 억제하고/하거나, 예방하고/하거나, 이의 발병을 지연시키고/시키거나, 이의 중증도를 감소시키고/시키거나, 이의 하나 이상의 증상 또는 특징의 발생률을 감소시키는 양이다. 일부 구현예에서, 치료적 유효량은 단회 용량으로 투여되고; 일부 구현예에서는, 치료적 유효량을 전달하기 위해 다회 단위 용량이 요구된다.
본 개시내용의 구현예에 대한 하기의 상세한 설명은 첨부 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 개시내용을 설명할 목적으로, 도면에 현재 예시된 구현예가 나타나 있다. 그러나, 본 개시내용은 도면에 나타낸 구현예의 정밀한 배열 및 수단으로 한정되지 않음이 이해되어야 한다.
도 1a는 DNA 메틸트랜스퍼라제에 융합된 DBD를 사용하는 MYC 프로모터의 지속 가능한 블록, 및 DBD 또는 단기 이펙터에 융합된 DBD를 사용하는 CTCF/TF 부위의 일시적인(48/72시간) 블록에 기반한 이중 표적 접근법의 개략적인 표현을 도시한다.
도 1b는 MYC 유전자에 대한 표적 부위(CTCF 및 프로모터)의 가이드 RNA 국재화 및 염색질 맥락을 도시한다. 상부에서 하부로, 그래프는 HepG2 세포의 MYC 유전자좌에 대해, H3K4me3(히스톤 H3 Ky 트리메틸화) 수준; H3K9me3(히스톤 H3 K9 트리메틸화) 수준(복제물 1); H3K9me3(히스톤 H3 K9 트리메틸화) 수준(복제물 2); H3K27me3(히스톤 H3 K27 트리메틸화) 수준; H3K27ac(히스톤 H3 K27 아세틸화) 수준; GROseq_fwdStrand 수준(정방향 가닥에서 전사적으로 활성인 RNA pol II의 결합); GROseq_revStrand 수준(역방향 가닥에서 전사적으로 활성인 RNA pol II의 결합); RNAseq_rep2 수준(RNAseq를 사용하여 측정된 MYC 전사체 수준, 복제물 2); WGBS(whole-genome bisulfite sequencing; 전체-게놈 중아황산염 서열분석)에 의해 측정된 DNA 메틸화, 및 CTCF 결합 수준을 나타낸다. 4개의 gRNA의 위치는 화살표로 표시되어 있다. gRNAs GD-28859, GD-28616, GD-28862는 MYC의 상류에 있는 앵커 부위에서 또는 그 근처를 표적화하고, gRNA GD-28617은 MYC 프로모터를 표적화한다. 본 개시내용에서, GD-28859는 또한 GD-59로 지칭되고; GD-28616은 또한 GD-16으로 지칭되며; GD-28862는 또한 GD-62로 지칭되고; GD-28617은 또한 GD-17로 지칭된다.
도 1c는 예시적인 이중-시스트론 작제물의 개략도를 나타낸다. 작제물의 5' 말단은 역 5' 대 5' 트리포스페이트 연결을 통해 mRNA의 제1 뉴클레오타이드에 연결되는 N7-메틸화 구아노신에 의해 한정된 캡(cap) 구조를 가진다. 일부 구현예에서, 캡 구조는 단백질 번역 및 안정성을 촉진시킨다. 캡 구조의 하류에는 높은 수준의 단백질 번역을 촉진시키도록 설계된 비-번역 영역(5' UTR)이 있고, 이어서 단백질의 번역을 시작하기 위해 리보솜에 의해 인식되는 표준 "코작" 서열이 있다. "코작" 서열 다음에는 제1 표적화 모이어티와 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 tPT2A "리보솜 스킵핑" 서열(링커)로 분리되는 제2 표적화 모이어티와 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하는 단일 연속 서열인 CDS이다. 이론에 의해 구애되고자 함이 없이, 리보솜이 tPT2A 링커에 도달하면, 리보솜은 링커를 아미노산으로 번역하기 시작한다. P2A 링커로부터 생산된 처음 18개 아미노산은 제1 발현 리프레서(예를 들어, ZF DBD 및 MQ1을 포함함)의 C-말단 끝에 남아 있으며, 그 다음 리보솜은 이를 방출한다. 그 다음 리보솜은 T2A 링커에 도달할 때까지 계속 이동하고, T2A 링커의 처음 17개 잔기는 번역되어 방출된다. 다음으로, 단일 아미노산 및 그 다음 제2 발현 리프레서(예를 들어, 제2 ZF DBD 및 KRAB를 포함함)의 시작부를 포함하는 제2 폴리펩타이드가 번역된다. CDS 다음에는 높은 수준의 번역을 돕고 또한 mRNA를 안정화시키도록 설계된 3' UTR이 있다. 마지막으로, mRNA의 3' 최말단에는 폴리A 테일이 있다. 일부 구현예에서, 폴리A 테일은 단백질 번역 및 mRNA 안정성을 촉진시킨다.
도 2a는 CTCF 모티프의 Cas9-뉴클레아제 편집이 MYC 발현의 하향조절을 초래함을 나타낸다. (GD-28616과 함께) Cas9로 CTCF 모티프를 파괴하면 3가지 HCC 세포주(HepG2, Hep3B 및 SKHEP1) 모두에서 MYC 발현의 32 내지 39% 하향조절을 초래한다. CTCF 모티프(GD-28859)에 인접한 영역의 파괴는 3가지 세포주 중 2가지(HepG2 및 Hep3B)에서 MYC 발현을 35 내지 45% 조절하였다.
도 2b는 모든 세포주의 편집에서 AmpSeq에 의해 평가된 편집 효율이 77 내지 100%임을 확인했음을 나타낸다.
도 3은 dCas9-KRAB가 프로모터 또는 연관 CTCF 모티프로 유도될 때 MYC 발현을 하향조절함을 나타낸다. dCas9-KRAB/GD-28616의 LNP-매개 형질감염은 Hep3B 및 SKHEP1에서의 48/72시간 시점에서 11 내지 34%만큼 MYC 발현을 하향조절하였다. dCas9-KRAB/GD-28859의 LNP-매개 형질감염은 3가지 HCC 모델 모두에서의 48/72시간 시점에서 18 내지 44%만큼 MYC 발현을 하향조절하였다. dCas9-KRAB/GD-28617을 통해 dCas9-KRAB를 MYC 프로모터로 유도하면 3가지 HCC 모델 모두에서의 48/72시간 시점에서 24 내지 58%만큼 MYC 발현을 하향조절하였다.
도 4a는 프로모터 연관 CTCF 모티프에서 sgRNA 국재화 및 징크 핑거 디자인을 도시한다. 도면은 서열번호 208을 개시한다.
도 4b는 프로모터 연관 CTCF로 유도된 ZF-KRAB 작제물은 Hep3B에서 MYC 하향조절을 초래하였음을 나타낸다. ZF2-KRAB, ZF3-KRAB 및 ZF4-KRAB는 Hep3B 세포에서 dCas9-KRAB/GD-28859와 동등하거나 더 큰 정도로 MYC를 하향조절하며, 이 때 ZF3-KRAB는 가장 강한 하향조절 효과를 나타내었다.
도 4c는 ZF3-이펙터 없음(No-Effector) 및 ZF3-KRAB가 다수의 인간 HCC 모델(HepG2, Hep3B, 및 SKHEP1)에서 MYC 발현을 하향조절함을 나타낸다. ZF3-KRAB는 또한 다른 2가지 HCC 모델, 즉 HepG2 및 SKHEP1에서 ZF3-이펙터 없음 및 ZF5-이펙터 없음과 동등하거나 더 큰 정도로 MYC를 하향조절하는 것으로 나타났다.
도 4d는 ZF3-이펙터 없음 및 ZF3-KRAB가 상이한 시점(24시간, 72시간, 및 120시간)에서 Hep3B 세포의 MYC 발현 및 생존능에 대해 동등한 효과를 나타냄을 보여준다.
도 5는 dCas9-MQ1이 다수의 HCC 모델(HepG2, Hep3B, 및 SKHEP1)의 MYC 프로모터에서 유도될 때 MYC 발현을 하향조절함을 나타낸다.
도 6a는 MYC 프로모터에서 sgRNA 국재화 및 징크 핑거 디자인을 도시한다. 도면은 서열번호 209를 개시한다.
도 6b는 6개의 ZF-MQ1 작제물이 Hep3B에서 MYC 하향조절에 대한 효과에 대해 스크리닝된 MYC 프로모터에 대해 지시됨을 도시한다. ZF8-MQ1, ZF9-MQ1 및 ZF11-MQ1은 Hep3B 세포에서 가장 큰 정도로 MYC를 하향 조절하였으며, 이 때 ZF9-KRAB MQ1은 가장 강력한 하향조절 효과를 나타내었다.
도 7a는 ZF9-MQ1이 ZF12-MQ1과 비교하여 Hep3B에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7b는 ZF9-MQ1이 ZF12-MQ1과 비교하여 HepG2에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7c는 ZF9-MQ1이 ZF12-MQ1과 비교하여 SKHEP1에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7d는 ZF9-MQ1이 ZF8-MQ1과 비교하여 Hep3B에서 MYC 발현을 하향조절하고 생존능을 감소시키는 데 더 효율적임을 나타낸다.
도 7e는 ZF9-MQ1이 ZF8-MQ1과 비교하여 HepG2에서 MYC 발현을 하향조절하고 생존능을 감소시키는 데 더 효율적임을 나타낸다.
도 7f는 ZF9-MQ1이 ZF8-MQ1과 비교하여 SKHEP1에서 MYC 발현을 하향조절하고 생존능을 감소시키는 데 더 효율적임을 나타낸다.
도 7g는 ZF9-MQ1이 dCas9-MQ1/GD17과 비교하여 Hep3B에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7h는 ZF9-MQ1이 dCas9-MQ1/GD17과 비교하여 HepG2에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7i는 ZF9-MQ1이 dCas9-MQ1/GD17과 비교하여 SKHEP1에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 8a는 dCas9-MQ1이 3가지 세포주(Hep3B, HepG2, 및 SKHEP1) 전체에 걸쳐 72시간에 mRNA의 50 내지 90% 감소를 초래하였음을 나타낸다.
도 8b는 SK-HEP-1 생존능이 MYC 하향조절에 의해 최소로 영향을 받았지만, HepG2 및 Hep3B에서 72 및 168시간에 생존능을 극적으로 감소시켰음을 나타낸다.
도 8c는 7일 및 11일에 MYC mRNA가 각각 약 70% 및 약 55% 감소되었음을 나타낸다. 15일까지, 전사체에서 약 40% 하향 조절이 유지되었다.
도 8d는 dCas9-MQ1/GD-28617에 의한 처리가 표적화된 영역으로의 새로운(de novo) 메틸화를 지시하고 이러한 전사 변화가 표적 영역에서 CpG 메틸화의 백분율과 밀접한 상관관계가 있으며 확인된 메틸화가 15일까지 지속된다는 것을 나타낸다.
도 9는 dCas9-MQ1/GD-17에 의한 처리가 생체내에서 종양 성장을 억제함을 나타낸다.
도 10은 dCas9-MQ1/GD-17이 인간 간세포에서 B형 간염과 관련하여 MYC를 하향조절함을 나타낸다.
도 11은 CTCF 모티프(ZF3-NE 또는 ZF3-KRAB)에 직접 인접한 상류 영역에 대해 징크-핑거 도메인에 융합된 KRAB 이펙터(또는 이펙터 없음 또는 NE)를 표적화 하는 것 및 MYC 프로모터에 대해 징크-핑거 도메인에 융합된 MQ1 이펙터를 표적화하는 것이 MYC1 mRNA 발현을 하향조절함을 나타낸다.
도 12는 ZF3-KRAB와 ZF9-MQ1이 ZF9-MQ1 단독 또는 ZF3-NE와 ZF9-MQ1 조합보다 더 큰 정도로 MYC를 하향조절함을 나타낸다.
도 13a는 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1이 5가지 HCC 세포주, 즉 Hep3B, HepG2, SKHEP1, SNU-182 및 SNU-449에서 다수 농도로 투약되었음을 나타낸다.
도 13b 내지 f는 ZF9-MQ1이 테스트된 5가지 HCC 세포주 모두에서 MYC 발현을 하향조절하고 생존능을 감소시키며 ZF9-MQ1이 0.028 ug/ml LNP/mRNA의 중간 EC50으로 MYC 발현을 하향조절함을 나타내고, 이 때 HepG2 세포주에서 72시간째에 시험관내에서 생존능에 대해 약 10배 더 높은 중간 EC50(0.13 ug/ml)을 나타낸다.
도 14는 ZF9-MQ1이 PBS 대조군 처리 마우스와 비교할 때 (6일째부터 앞으로) 종양 성장을 상당히 감소시킬 수 있었고 ZF9-MQ1은 소분자 비교자(MYCi975)보다 종양 성장을 더 많이 감소시켰음을 나타낸다(A). ZF9-MQ1은 PBS 또는 MYCi975와 비교하여 전체 동물 체중에 대해 최소한의 영향을 미쳤다(B).
도 15a는 ZF9-MQ1과 ZF3-KRAB의 조합이 2회 용량 동안 5일마다 1.5 mg/kg, 3회 용량 동안 5일마다 3 mg/kg, 1회 용량 동안 3일마다 3 mg/kg으로 소라페닙과 비슷한 수준으로 종양 성장을 감소시켰음을 나타낸다.
도 15b는 소라페닙으로 처리될 때 전체 동물 체중에 대한 영향과 비교하여 ZF9-MQ1과 ZF3-KRAB의 조합이 전체 동물 체중에 대해 최소한의 영향을 미쳤음을 나타낸다.
도 16a는 1 mg/kg의 ZF9-MQ1(13일째부터 앞으로) 및 ZF9-MQ1과 ZF3-KRAB의 공제형(co-formulation)(6일째부터 앞으로)이 음성 대조군 처리 마우스와 비교할 때 종양 성장을 상당히 감소시킬 수 있었음을 나타낸다.
도 16b는 3 mg/kg의 ZF9-MQ1과 ZF3-KRAB의 개별 및 공제형이 음성 대조군 처리 마우스와 비교하여 종양 성장을 감소시킬 수 있었음을 나타낸다.
도 16c는 ZF9-MQ1과 ZF3-KRAB의 공제형이 1mg/kg 및 3 mg/kg 투약량 둘 다에서 시스플라틴 또는 소분자 비교자(MYCi975)보다 유사하거나 더 높은 수준으로 종양 성장을 감소시킬 수 있었음을 나타낸다.
도 16d는 시스플라틴 또는 MYCi975 중 어느 하나로 처리될 때 전체 동물 체중에 대한 영향과 비교하여 1 mg/kg 및 3 mg/kg 투약량 둘 다에서 ZF9-MQ1과 ZF3-KRAB의 공제형으로의 처리가 전체 동물 체중에 대해 최소한의 영향을 미쳤음을 나타낸다.
도 17a는 ZF9-MQ1이 처리 120시간 후 A549 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17b는 ZF9-MQ1이 처리 120시간 후 NCI-H2009 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17c는 ZF9-MQ1이 처리 120시간 후 NCI-H358 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17d는 ZF9-MQ1이 처리 72시간 후 HCC95 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17e는 ZF9-MQ1이 처리 120시간 후 A549 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 17f는 ZF9-MQ1이 처리 120시간 후 NCI-H2009 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 17g는 ZF9-MQ1이 처리 120시간 후 NCI-H358 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 17h는 ZF9-MQ1이 처리 72시간 후 HCC95 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 18a는 처리 96시간 후, 약 17.5%의 세포가 비처리 세포 집단에서 아폽토시스되었음을 나타낸다.
도 18b는 처리 96시간 후, 약 18%의 세포가 ZF9-NE로 처리된 세포 집단에서 아폽토시스되었음을 나타낸다.
도 18c는 처리 96시간 후, 약 38.9%의 세포가 ZF9-MQ1로 처리된 세포 집단에서 아폽토시스되었음을 나타낸다.
도 18d는 처리 96시간 후, 약 38.9%의 세포가 ZF9-MQ1로 처리된 세포 집단에서 아폽토시스된 반면, 비처리 세포 및 ZF9-NE로 처리된 세포 집단에서 약 18%의 아폽토시스 세포가 있음을 나타내며, 이는 ZF9-MQ1이 폐암 세포의 세포 아폽토시스를 유도할 수 있음을 나타낸다.
도 19a 및 b는 ZF9-MQ1이 0.08 ug/ml LNP/mRNA의 EC50로 MYC를 하향조절하며, 이들 A549(도 19a) 및 HCC95(도 19b) 세포주에서 72시간째에 시험관내 생존능(2 ug/ml)에 대해 약 25배 더 높은 EC50 효과를 갖는다는 것을 나타낸다.
도 20a 및 b는 ZF9-MQ1 처리가 폐암 세포주에서 처리 96시간 후 MYC 단백질 수준을 80% 초과로 감소시킴을 나타낸다.
도 21은 ZF9-MQ1이 PBS 대조군 처리 마우스와 비교할 때 (8일째부터 앞으로) 종양 성장을 상당히 감소시킬 수 있었음을 나타낸다. 또한 ZF9-MQ1이 전체 동물 체중에 대해 최소한의 영향을 미치는 것으로 관찰되었다.
도 22는 SSOP를 이용한 LNP 전달을 사용하여 dCAS9-KRAB 이펙터 mRNA와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타내며, 이는 이러한 원위 조절 요소를 사용하여 종양발생 MYC를 감소시키는 능력을 강조한다.
도 23은 MC3을 이용한 LNP 전달을 사용하여 dCAS9-KRAB 이펙터 mRNA와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타내며, 이는 이러한 원위 조절 요소를 사용하여 종양발생 MYC를 감소시키는 능력을 강조한다.
도 24a는 A549 세포주에서 3가지 이펙터 단백질(EZH2, EZH2-KRAB, 및 MQ1) 모두와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타낸다.
도 24b는 NCI-H2009 세포주에서 3가지 이펙터 단백질(EZH2, EZH2-KRAB, 및 MQ1) 모두와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타낸다.
도 25a는 KRAB 또는 MQ1과 함께 전달되는 가이드 RNA GD-29833 및 29914가 처리 120시간 후 A549 세포주에서 MYC mRNA 수준을 상당히 하향조절할 수 있었음을 나타낸다.
도 25b는 KRAB 또는 MQ1과 함께 전달되는 가이드 RNA GD-29833 및 29914가 처리 120시간 후 NCI-H2009 세포주에서 MYC mRNA 수준을 상당히 하향조절할 수 있었고 하향조절이 ZF9-MQ1 처리 후에 관찰되는 하향조절과 비슷하다는 것을 나타낸다.
도 26a는 dCas9-MQ1이 NSCLC에서 표적 부위 메틸화를 약 60%까지 증가시켰음을 나타낸다.
도 26b는 dCas9-MQ1이 원위 프로모터 영역으로 메틸화를 유도하였음을 나타낸다(약 50%까지 증가함).
도 27a 내지 b는 전사 리프레서를 갖는 MYC 폐 슈퍼-인핸서로 가이드를 유도하는 것은 NCI-H2009 폐암 세포주에서 96시간째에 MYC 단백질 수준을 감소시킨다는 것을 나타낸다.
도 28a는 전체 세포 용해물에서 ZF9-MQ1 단백질 존재가 Hep3B를 ZF9-MQ1로 처리한 후 점진적으로 감소됨을 나타낸다.
도 28b는 전체 세포 용해물에서 MYC 단백질 발현이 Hep3B를 ZF9-MQ1로 처리한 후 점진적으로 하향조절됨을 나타낸다.
도 28c는 전체 세포 용해물에서 ZF9-MQ1 단백질 존재가 Hep3B를 ZF9-MQ1로 처리한 후 MYC 단백질의 하향조절과 상관관계가 있음을 나타낸다.
도 29a는 ZF9-MQ1로 처리한 후 SK-HEP 세포주에서 15일까지 여러 시점에서 MYC 전사체에서 45% 하향조절과 함께 mRNA 발현의 하향조절을 나타낸다.
도 29b는 MYC 전사 변화가 15일째까지의 메틸화 백분율과 상관관계가 있음을 나타낸다.
도 30a는 GFP, ZF-NE, 또는 ZF3-KRAB 단독과 비교할 때 0.6 μg/ml, 1.25 μg/ml, 및 2.5 μg/ml의 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로 처리된 1차 간세포가 MYC mRNA 발현의 감소를 보였음을 나타낸다.
도 30b는 0.6 μg/ml, 1.25 μg/ml, 및 2.5 μg/ml 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로의 처리가 1차 간세포의 생존능에 대해 최소한의 영향을 미쳤으며, 이는 HCC 세포주와 비교할 때 MYC 발현의 감소가 정상 세포에 덜 중요하다는 것을 나타낸다.
도 30c는 GFP, ZF-NE, 또는 ZF3-KRAB 단독과 비교할 때 0.5 μg/ml, 1.0 μg/ml, 및 2.0 μg/ml의 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리된 1차 간세포가 MYC mRNA 발현의 감소를 모임을 나타낸다.
도 30d는 0.5 μg/ml, 1.0 μg/ml, 및 2.0 μg/ml 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로의 처리가 1차 간세포의 생존능에 대해 최소한의 영향을 미쳤으며, 이는 HCC 세포주와 비교할 때 MYC 발현의 감소가 정상 세포에 덜 중요하다는 것을 나타낸다.
도 31a는 ZF9-MQ1+ZF3-KRAB로의 처리가 3회 투여 후 종양 크기의 통계적으로 유의한 감소를 나타내었으며, 대조군과 비교하여 25일째에 종양 부피를 63% 감소를 초래하고, ZF9-MQ1+ZF3-KRAB 처리는 종양 부피에 대하여 시스플라틴으로의 처리에 대해 동등한 효과와 연관이 있었음을 나타낸다.
도 31b는 ZF9-MQ1+ZF3-KRAB로 처리된 마우스가 체중의 상당한 감소를 경험하지 않았음을 나타내었다.
도 32a는 1.5 mg/kg에서 ZF9-MQ1+ZF3-KRAB로의 처리가 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되었으며, 음성 대조군과 비교하여 23일째에 종양 성장의 63% 억제를 초래하였음을 나타낸다. 3 mg/kg의 ZF9-MQ1 + ZF3-KRAB는 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되었으며, 음성 대조군과 비교하여 23일째까지 종양 성장의 54% 억제를 초래하고, 6 mg/kg 용량의 ZF9-MQ1 + ZF3-KRAB로의 처리는 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되며, 음성 대조군과 비교하여 23일째에 종양 부피의 63% 감소를 초래한다.
도 32b는 ZF9-MQ1 + ZF3-KRAB로 처리된 마우스가 체중의 상당한 감소를 경험하지 않았음을 나타낸다. 소라페닙으로 처리된 마우스는 처음에 체중 감소를 경험하였고 이후에 종양 덩어리의 증가로 인해 잠재적으로 전체 체중이 증가하였다.
도 33a는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 단일 작제물(ZF3-KRAB 또는 ZF9-MQ1) 단독보다 더 큰 정도로 Hep 3B 세포에서 0.6 μg/ml 및 2.0 μg/ml의 농도에서 MYC mRNA 발현을 하향조절하였음을 나타낸다. 이중-시스트론 ZF9-MQ1_ ZF3-KRAB는 0.6 μg/ml 및 2 μg/ml 농도 둘 다에서 48시간째에 총 MYC mRNA 수준을 99%만큼 감소시켰다.
도 33b는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 단일 작제물(ZF3-KRAB 또는 ZF9-MQ1) 단독보다 더 큰 정도로 Hep 3B 세포에서 세포 생존능을 하향조절하였음을 나타낸다. 이중-시스트론 ZF9-MQ1_ ZF3-KRAB는 0.6 μg/ml 및 2 μg/ml 농도 둘 다에서 Hep3B 세포의 생존능을 각각 약 80% 및 27%만큼 감소시켰다.
도 34a는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 용량-의존적 방식으로 Hep3B 세포에서 MYC mRNA 및 세포 생존능을 하향조절하였음을 나타낸다.
도 34b는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 용량-의존적 방식으로 HepG2 세포에서 MYC mRNA 및 세포 생존능을 하향조절하였음을 나타낸다.
도 34c는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 용량-의존적 방식으로 SKHEP1 세포에서 MYC mRNA 및 세포 생존능을 하향조절하였음을 나타낸다.
도 34d는 이중-시스트론 ZF9-MQ1_ZF3-KRAB 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 HCC S1 및 S2 하위유형 둘 다에 대해 효과적이었음을 나타낸다.
도 35는 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리한 후 48시간째에 75% 초과의 아폽토시스 세포가 Hep 3B 및 Hep G2 세포주에서 검출되었고 약 15% 아폽토시스 세포가 SK-HEP-1 세포주에서 검출되었음을 나타낸다. 세포는 비처리 세포(5 내지 20% 배경 아폽토시스)와 비교하여 비-코딩 mRNA 대조군에 의해 영향을 받지 않았다.
도 36은 SKHEP1 세포에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB 작제물로 1회 처리한 후, MYC mRNA 수준이 1일째에 감소되었고 처리 후 최대 15일까지 억제된 상태를 유지하였음을 나타낸다.
도 37은 이중-시스트론 ZF9-MQ1_ZF3-KRAB 처리가 Hep3B 및 SKHEP1 세포주 둘 다에서 짧은 비-코딩 mRNA 또는 비처리 세포와 비교할 때 6시간째에 MYC mRNA 및 단백질 발현을 감소시켰으며, 96시간 후에 감소된 상태를 유지하였음을 나타낸다.
도 38은 형질감염 후 6 및 24시간 시점 둘 다에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB mRNA에 의해 인코딩된 OEC ZF3-KRAB 및 ZF9-MQ1 단백질 둘 다를 웨스턴 블롯 상의 HA 태그에 의해 시각화하였음을 나타낸다.
도 39a는 SKHEP1에서 0.6 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 소라페닙을 투여하였을 때 소라페닙의 IC50이 12.3 μM에서 10.7 μM로 감소되었음을 나타낸다. 소라페닙이 0.1 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 투여될 때 소라페닙의 IC50은 SKHEP1에서 별로 변하지 않았다.
도 39b는 Hep 3B에서 0.6 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 소라페닙을 투여하였을 때 소라페닙의 IC50이 4.4 μM에서 2.9 μM로 감소되었음을 나타낸다. 소라페닙이 0.1 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 투여될 때 소라페닙의 IC50은 Hep 3B에서 별로 변하지 않았다.
도 40a는 0.6 μg/ml 및 0.1 μg/ml 농도에서 각각 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리될 때 SKHEP1 세포에서 JQ1의 IC50이 감소하였음을 나타낸다.
도 40b는 0.6 μg/ml 및 0.1 μg/ml 농도에서 각각 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리될 때 Hep 3B 세포에서 JQ1의 IC50이 감소하였음을 나타낸다.
도 41a는 0.6 및 1.2 μg/ml 농도 둘 다에서 비처리 세포와 비교하여 ZF17-MQ1이 Hepa1-6 세포에서 마우스 MYC mRNA 발현을 하향조절할 수 있었음을 나타낸다.
도 41b는 0.6 및 1.2 μg/ml 농도 둘 다에서 비처리 세포와 비교하여 ZF17-MQ1이 마우스 Hepa1-6 세포에서 세포 생존능을 감소시킬 수 있었음을 나타낸다.
도 42a는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 24 및 48시간째에 MYC 단백질의 상당한 하향조절을 보였음을 나타낸다.
도 42b는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 24 및 48시간째에 MYC 단백질의 상당한 하향조절을 보였음을 나타낸다.
도 42c는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 96시간째에 MYC mRNA의 상당한 하향조절을 보였음을 나타낸다.
도 42d는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 96시간째에 세포 생존능의 상당한 손실을 보였음을 나타낸다.
도 43은 ZF17-MQ1이 4회 투약 후 동물 종양 부하를 현저하게 감소시켰고 2주의 약물 휴지기 후, ZF17-MQ1로 마우스를 재처리하여 약 4주 후에 전체 종양 고갈을 초래하였음을 나타낸다.
도 44a는 ZF17-MQ1로 처리된 세포가 비처리 세포 또는 GFP-처리된 세포와 비교하여 LL2 세포에서 MYC 단백질 수준 감소를 보였음을 나타낸다.
도 44b는 비처리 세포에서 관찰된 수준과 비교하여, ZF17-MQ1 및 ZF16-MQ1이 LL2 세포에서 MYC mRNA 수준을 각각 99.9% 초과 또는 74%만큼 감소시켰음을 나타낸다.
도 44c는 3가지 작제물 ZF15-MQ1, ZF16-MQ1, 및 ZF17-MQ1 모두 LL2 세포에서 비처리 세포 및 GFP-처리된 세포보다 더 큰 정도로 세포 생존능을 감소시킬 수 있었음을 나타낸다.
도 45a는 ZF17-MQ1이 1.25 μg/mL 및 2.5 μg/mL 농도 둘 다에서 MYC mRNA 수준을 감소시켰음을 나타낸다. 비처리 세포에서 관찰된 수준과 비교하여, 2.5 μg/mL에서 ZF17-MQ1은 LL2 및 CT26 세포에서 각각 93% 및 85%만큼 MYC mRNA 수준을 감소시켰다.
도 45b는 ZF17-MQ1이 2가지 농도 모두에서 세포 생존능을 감소시켰음을 나타낸다. 비처리 세포와 비교하여, 이러한 조건 하에, ZF17-MQ1은 LL2 및 CT26 세포에서 각각 87% 및 93%만큼 세포 생존능을 감소시켰다.
도 46은 ZF17-MQ1이 CMT167 및 LL2 세포에서 비처리 세포 및 GFP-처리된 세포(음성 대조군)보다 더 큰 정도로 MYC mRNA를 하향조절하였고 세포 생존능을 감소시킴을 나타낸다. 비처리 세포에서 관찰된 수준과 비교하여, ZF17-MQ1은 CMT167 및 LL2 세포에서 각각 62% 및 73%만큼 MYC mRNA 수준을 감소시켰다. 또한, 비처리 세포와 비교하여, 이러한 조건 하에, ZF17-MQ1은 CMT167 및 LL2 세포에서 각각 54% 및 57%만큼 세포 생존능을 감소시켰다.
도 47은 1차 소기도 상피 세포, 1차 엽 상피 세포, 및 1차 폐 섬유아세포 각각의 무처리 세포와 비교하여 MYC mRNA 수준을 94%, 96%, 96% 수준만큼 하향조절하였음을 나타낸다. 그러나, 대조군 세포와 비교하여 생존율이 단지 16%, 9%, 및 22%만큼 감소되었다.
도 48a는 ZF9-MQ1 및 JQ1이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 48b는 ZF9-MQ1(0.5 μg/ml) 및 JQ1(최대 6.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 48c는 ZF9-MQ1(1.0 μg/ml) 및 JQ1(최대 6.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 49a는 ZF9-MQ1 및 BET762가 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 49b는 ZF9-MQ1(0.5 μg/ml) 및 BET762(최대 1.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 49c는 ZF9-MQ1(1.0 μg/ml) 및 BET762(최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 50a는 ZF9-MQ1 및 비라브레십이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 50b는 ZF9-MQ1(0.5 μg/ml) 및 비라브레십(최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 50c는 ZF9-MQ1(1.0 μg/ml) 및 비라브레십(최대 313 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 51a는 ZF9-MQ1 및 트라메티닙이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 51b는 ZF9-MQ1(0.5 μg/ml) 및 트라메티닙(최대 0.05 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 51c는 ZF9-MQ1(1.0 μg/ml) 및 트라메티닙(최대 0.05 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 52a는 모든 작제물 ZF9-MQ1, ZF54-KRAB, ZF67-KRAB, 및 ZF68-KRAB가 비처리 세포와 비교하여 처리 후 72시간째에 H2009 세포에서 NMYC mRNA 수준을 적어도 42%만큼 하향조절할 수 있었음을 나타낸다.
도 52b는 작제물 ZF9-MQ1, ZF67-KRAB, 및 ZF68-KRAB가 비처리 세포와 비교하여 처리 후 72시간째에 H226 세포에서 NMYC mRNA 수준을 적어도 27%만큼 하향조절할 수 있었음을 나타낸다.
도 52c는 작제물 ZF9-MQ1 및 ZF54-KRAB 둘 다가 비처리 세포와 비교하여 처리 후 72시간째에 H226 세포에서 NMYC mRNA 수준을 적어도 27%만큼 하향조절할 수 있었음을 나타낸다.
도 52d는 작제물 ZF9-MQ1, ZF61-KRAB, ZF67-KRAB, 및 ZF68-KRAB가 비처리 세포와 비교하여 처리 후 72시간째에 H460 세포에서 NMYC mRNA 수준을 적어도 26%만큼 하향조절할 수 있었음을 나타낸다.
도 53은 테스트한 가장 높은 농도에서, ZF9-MQ1 및 ZF54-KRAB가 각각 개별적으로 비처리된 대조군 세포에 비해, H2009 세포에서 MYC mRNA를 각각 99% 또는 62%만큼 하향조절하였음을 나타낸다. 0.313 μg/mL 미만의 ZF9-MQ1이 1 또는 2 μg/mL ZF54-KRAB와 조합될 때, MYC mRNA가 단독 처리에 대해 관찰된 것보다 더 큰 정도로 하향조절된다.
도 54는 ZF9-MQ1이 48시간까지 비처리된 대조군 세포에 비해 H1299 세포에서 MYC mRNA를 95%만큼 하향조절하였고 144시간째에 대조군 수준의 90%로 하향조절을 유지하였음을 나타낸다. ZF9-MQ1과 ZF54-KRAB의 조합은 48시간째에 MYC mRNA 수준을 98%까지 감소시켰고 144시간째에 대조군 수준의 93%로 하향조절을 유지하였다(도 54). 또한, 데이터는 ZF54-KRAB와 조합된 ZF9-MQ1 및 ZF9-MQ1이 H1299 세포에서 적어도 6일 동안 MYC mRNA 수준을 하향조절하였음을 나타내었다.
도 55는 H2009 세포로의 도입 24시간 후, ZF9-MQ1 및 ZF54-KRAB가 비처리 세포와 비교하여 MYC mRNA 수준을 각각 최대 83% 및 55%까지 하향조절하였음을 나타낸다. MYC mRNA 수준은 처리 48시간 후 비처리된 대조군의 96%에 대해 ZF9-MQ1-처리 세포에서 추가 13%만큼 추가로 감소된 반면, ZF54-KRAB는 MYC 수준을 추가로 하향조절하지 않는다. ZF9-MQ1_ZF54-KRAB 및 ZF54-KRAB_ZF9-MQ1로 처리된 세포에서 MYC mRNA 수준은 처리 후 24시간째에 대조군 세포의 각각 95% 및 96%로 감소되었다. 데이터는 이들 컨트롤러가 ZF9-MQ1보다 더 일찍 MYC mRNA 수준을 감소시켜 H2009 세포에서 24시간째에 ZF9-MQ1 처리된 세포와 비교하여 처리된 세포에서 더 높은 수준의 MYC 하향조절로 이어질 수 있었음을 나타내었다.
도 56은 ZF9-MQ1 처리가 H460 피하 종양 모델에서 소라페닙 유도 종양 성장 억제와 비교하여 유사하거나 더 높은 수준으로 종양 성장을 억제하였음을 나타낸다.
도 1a는 DNA 메틸트랜스퍼라제에 융합된 DBD를 사용하는 MYC 프로모터의 지속 가능한 블록, 및 DBD 또는 단기 이펙터에 융합된 DBD를 사용하는 CTCF/TF 부위의 일시적인(48/72시간) 블록에 기반한 이중 표적 접근법의 개략적인 표현을 도시한다.
도 1b는 MYC 유전자에 대한 표적 부위(CTCF 및 프로모터)의 가이드 RNA 국재화 및 염색질 맥락을 도시한다. 상부에서 하부로, 그래프는 HepG2 세포의 MYC 유전자좌에 대해, H3K4me3(히스톤 H3 Ky 트리메틸화) 수준; H3K9me3(히스톤 H3 K9 트리메틸화) 수준(복제물 1); H3K9me3(히스톤 H3 K9 트리메틸화) 수준(복제물 2); H3K27me3(히스톤 H3 K27 트리메틸화) 수준; H3K27ac(히스톤 H3 K27 아세틸화) 수준; GROseq_fwdStrand 수준(정방향 가닥에서 전사적으로 활성인 RNA pol II의 결합); GROseq_revStrand 수준(역방향 가닥에서 전사적으로 활성인 RNA pol II의 결합); RNAseq_rep2 수준(RNAseq를 사용하여 측정된 MYC 전사체 수준, 복제물 2); WGBS(whole-genome bisulfite sequencing; 전체-게놈 중아황산염 서열분석)에 의해 측정된 DNA 메틸화, 및 CTCF 결합 수준을 나타낸다. 4개의 gRNA의 위치는 화살표로 표시되어 있다. gRNAs GD-28859, GD-28616, GD-28862는 MYC의 상류에 있는 앵커 부위에서 또는 그 근처를 표적화하고, gRNA GD-28617은 MYC 프로모터를 표적화한다. 본 개시내용에서, GD-28859는 또한 GD-59로 지칭되고; GD-28616은 또한 GD-16으로 지칭되며; GD-28862는 또한 GD-62로 지칭되고; GD-28617은 또한 GD-17로 지칭된다.
도 1c는 예시적인 이중-시스트론 작제물의 개략도를 나타낸다. 작제물의 5' 말단은 역 5' 대 5' 트리포스페이트 연결을 통해 mRNA의 제1 뉴클레오타이드에 연결되는 N7-메틸화 구아노신에 의해 한정된 캡(cap) 구조를 가진다. 일부 구현예에서, 캡 구조는 단백질 번역 및 안정성을 촉진시킨다. 캡 구조의 하류에는 높은 수준의 단백질 번역을 촉진시키도록 설계된 비-번역 영역(5' UTR)이 있고, 이어서 단백질의 번역을 시작하기 위해 리보솜에 의해 인식되는 표준 "코작" 서열이 있다. "코작" 서열 다음에는 제1 표적화 모이어티와 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 tPT2A "리보솜 스킵핑" 서열(링커)로 분리되는 제2 표적화 모이어티와 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하는 단일 연속 서열인 CDS이다. 이론에 의해 구애되고자 함이 없이, 리보솜이 tPT2A 링커에 도달하면, 리보솜은 링커를 아미노산으로 번역하기 시작한다. P2A 링커로부터 생산된 처음 18개 아미노산은 제1 발현 리프레서(예를 들어, ZF DBD 및 MQ1을 포함함)의 C-말단 끝에 남아 있으며, 그 다음 리보솜은 이를 방출한다. 그 다음 리보솜은 T2A 링커에 도달할 때까지 계속 이동하고, T2A 링커의 처음 17개 잔기는 번역되어 방출된다. 다음으로, 단일 아미노산 및 그 다음 제2 발현 리프레서(예를 들어, 제2 ZF DBD 및 KRAB를 포함함)의 시작부를 포함하는 제2 폴리펩타이드가 번역된다. CDS 다음에는 높은 수준의 번역을 돕고 또한 mRNA를 안정화시키도록 설계된 3' UTR이 있다. 마지막으로, mRNA의 3' 최말단에는 폴리A 테일이 있다. 일부 구현예에서, 폴리A 테일은 단백질 번역 및 mRNA 안정성을 촉진시킨다.
도 2a는 CTCF 모티프의 Cas9-뉴클레아제 편집이 MYC 발현의 하향조절을 초래함을 나타낸다. (GD-28616과 함께) Cas9로 CTCF 모티프를 파괴하면 3가지 HCC 세포주(HepG2, Hep3B 및 SKHEP1) 모두에서 MYC 발현의 32 내지 39% 하향조절을 초래한다. CTCF 모티프(GD-28859)에 인접한 영역의 파괴는 3가지 세포주 중 2가지(HepG2 및 Hep3B)에서 MYC 발현을 35 내지 45% 조절하였다.
도 2b는 모든 세포주의 편집에서 AmpSeq에 의해 평가된 편집 효율이 77 내지 100%임을 확인했음을 나타낸다.
도 3은 dCas9-KRAB가 프로모터 또는 연관 CTCF 모티프로 유도될 때 MYC 발현을 하향조절함을 나타낸다. dCas9-KRAB/GD-28616의 LNP-매개 형질감염은 Hep3B 및 SKHEP1에서의 48/72시간 시점에서 11 내지 34%만큼 MYC 발현을 하향조절하였다. dCas9-KRAB/GD-28859의 LNP-매개 형질감염은 3가지 HCC 모델 모두에서의 48/72시간 시점에서 18 내지 44%만큼 MYC 발현을 하향조절하였다. dCas9-KRAB/GD-28617을 통해 dCas9-KRAB를 MYC 프로모터로 유도하면 3가지 HCC 모델 모두에서의 48/72시간 시점에서 24 내지 58%만큼 MYC 발현을 하향조절하였다.
도 4a는 프로모터 연관 CTCF 모티프에서 sgRNA 국재화 및 징크 핑거 디자인을 도시한다. 도면은 서열번호 208을 개시한다.
도 4b는 프로모터 연관 CTCF로 유도된 ZF-KRAB 작제물은 Hep3B에서 MYC 하향조절을 초래하였음을 나타낸다. ZF2-KRAB, ZF3-KRAB 및 ZF4-KRAB는 Hep3B 세포에서 dCas9-KRAB/GD-28859와 동등하거나 더 큰 정도로 MYC를 하향조절하며, 이 때 ZF3-KRAB는 가장 강한 하향조절 효과를 나타내었다.
도 4c는 ZF3-이펙터 없음(No-Effector) 및 ZF3-KRAB가 다수의 인간 HCC 모델(HepG2, Hep3B, 및 SKHEP1)에서 MYC 발현을 하향조절함을 나타낸다. ZF3-KRAB는 또한 다른 2가지 HCC 모델, 즉 HepG2 및 SKHEP1에서 ZF3-이펙터 없음 및 ZF5-이펙터 없음과 동등하거나 더 큰 정도로 MYC를 하향조절하는 것으로 나타났다.
도 4d는 ZF3-이펙터 없음 및 ZF3-KRAB가 상이한 시점(24시간, 72시간, 및 120시간)에서 Hep3B 세포의 MYC 발현 및 생존능에 대해 동등한 효과를 나타냄을 보여준다.
도 5는 dCas9-MQ1이 다수의 HCC 모델(HepG2, Hep3B, 및 SKHEP1)의 MYC 프로모터에서 유도될 때 MYC 발현을 하향조절함을 나타낸다.
도 6a는 MYC 프로모터에서 sgRNA 국재화 및 징크 핑거 디자인을 도시한다. 도면은 서열번호 209를 개시한다.
도 6b는 6개의 ZF-MQ1 작제물이 Hep3B에서 MYC 하향조절에 대한 효과에 대해 스크리닝된 MYC 프로모터에 대해 지시됨을 도시한다. ZF8-MQ1, ZF9-MQ1 및 ZF11-MQ1은 Hep3B 세포에서 가장 큰 정도로 MYC를 하향 조절하였으며, 이 때 ZF9-KRAB MQ1은 가장 강력한 하향조절 효과를 나타내었다.
도 7a는 ZF9-MQ1이 ZF12-MQ1과 비교하여 Hep3B에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7b는 ZF9-MQ1이 ZF12-MQ1과 비교하여 HepG2에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7c는 ZF9-MQ1이 ZF12-MQ1과 비교하여 SKHEP1에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7d는 ZF9-MQ1이 ZF8-MQ1과 비교하여 Hep3B에서 MYC 발현을 하향조절하고 생존능을 감소시키는 데 더 효율적임을 나타낸다.
도 7e는 ZF9-MQ1이 ZF8-MQ1과 비교하여 HepG2에서 MYC 발현을 하향조절하고 생존능을 감소시키는 데 더 효율적임을 나타낸다.
도 7f는 ZF9-MQ1이 ZF8-MQ1과 비교하여 SKHEP1에서 MYC 발현을 하향조절하고 생존능을 감소시키는 데 더 효율적임을 나타낸다.
도 7g는 ZF9-MQ1이 dCas9-MQ1/GD17과 비교하여 Hep3B에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7h는 ZF9-MQ1이 dCas9-MQ1/GD17과 비교하여 HepG2에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7i는 ZF9-MQ1이 dCas9-MQ1/GD17과 비교하여 SKHEP1에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 8a는 dCas9-MQ1이 3가지 세포주(Hep3B, HepG2, 및 SKHEP1) 전체에 걸쳐 72시간에 mRNA의 50 내지 90% 감소를 초래하였음을 나타낸다.
도 8b는 SK-HEP-1 생존능이 MYC 하향조절에 의해 최소로 영향을 받았지만, HepG2 및 Hep3B에서 72 및 168시간에 생존능을 극적으로 감소시켰음을 나타낸다.
도 8c는 7일 및 11일에 MYC mRNA가 각각 약 70% 및 약 55% 감소되었음을 나타낸다. 15일까지, 전사체에서 약 40% 하향 조절이 유지되었다.
도 8d는 dCas9-MQ1/GD-28617에 의한 처리가 표적화된 영역으로의 새로운(de novo) 메틸화를 지시하고 이러한 전사 변화가 표적 영역에서 CpG 메틸화의 백분율과 밀접한 상관관계가 있으며 확인된 메틸화가 15일까지 지속된다는 것을 나타낸다.
도 9는 dCas9-MQ1/GD-17에 의한 처리가 생체내에서 종양 성장을 억제함을 나타낸다.
도 10은 dCas9-MQ1/GD-17이 인간 간세포에서 B형 간염과 관련하여 MYC를 하향조절함을 나타낸다.
도 11은 CTCF 모티프(ZF3-NE 또는 ZF3-KRAB)에 직접 인접한 상류 영역에 대해 징크-핑거 도메인에 융합된 KRAB 이펙터(또는 이펙터 없음 또는 NE)를 표적화 하는 것 및 MYC 프로모터에 대해 징크-핑거 도메인에 융합된 MQ1 이펙터를 표적화하는 것이 MYC1 mRNA 발현을 하향조절함을 나타낸다.
도 12는 ZF3-KRAB와 ZF9-MQ1이 ZF9-MQ1 단독 또는 ZF3-NE와 ZF9-MQ1 조합보다 더 큰 정도로 MYC를 하향조절함을 나타낸다.
도 13a는 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1이 5가지 HCC 세포주, 즉 Hep3B, HepG2, SKHEP1, SNU-182 및 SNU-449에서 다수 농도로 투약되었음을 나타낸다.
도 13b 내지 f는 ZF9-MQ1이 테스트된 5가지 HCC 세포주 모두에서 MYC 발현을 하향조절하고 생존능을 감소시키며 ZF9-MQ1이 0.028 ug/ml LNP/mRNA의 중간 EC50으로 MYC 발현을 하향조절함을 나타내고, 이 때 HepG2 세포주에서 72시간째에 시험관내에서 생존능에 대해 약 10배 더 높은 중간 EC50(0.13 ug/ml)을 나타낸다.
도 14는 ZF9-MQ1이 PBS 대조군 처리 마우스와 비교할 때 (6일째부터 앞으로) 종양 성장을 상당히 감소시킬 수 있었고 ZF9-MQ1은 소분자 비교자(MYCi975)보다 종양 성장을 더 많이 감소시켰음을 나타낸다(A). ZF9-MQ1은 PBS 또는 MYCi975와 비교하여 전체 동물 체중에 대해 최소한의 영향을 미쳤다(B).
도 15a는 ZF9-MQ1과 ZF3-KRAB의 조합이 2회 용량 동안 5일마다 1.5 mg/kg, 3회 용량 동안 5일마다 3 mg/kg, 1회 용량 동안 3일마다 3 mg/kg으로 소라페닙과 비슷한 수준으로 종양 성장을 감소시켰음을 나타낸다.
도 15b는 소라페닙으로 처리될 때 전체 동물 체중에 대한 영향과 비교하여 ZF9-MQ1과 ZF3-KRAB의 조합이 전체 동물 체중에 대해 최소한의 영향을 미쳤음을 나타낸다.
도 16a는 1 mg/kg의 ZF9-MQ1(13일째부터 앞으로) 및 ZF9-MQ1과 ZF3-KRAB의 공제형(co-formulation)(6일째부터 앞으로)이 음성 대조군 처리 마우스와 비교할 때 종양 성장을 상당히 감소시킬 수 있었음을 나타낸다.
도 16b는 3 mg/kg의 ZF9-MQ1과 ZF3-KRAB의 개별 및 공제형이 음성 대조군 처리 마우스와 비교하여 종양 성장을 감소시킬 수 있었음을 나타낸다.
도 16c는 ZF9-MQ1과 ZF3-KRAB의 공제형이 1mg/kg 및 3 mg/kg 투약량 둘 다에서 시스플라틴 또는 소분자 비교자(MYCi975)보다 유사하거나 더 높은 수준으로 종양 성장을 감소시킬 수 있었음을 나타낸다.
도 16d는 시스플라틴 또는 MYCi975 중 어느 하나로 처리될 때 전체 동물 체중에 대한 영향과 비교하여 1 mg/kg 및 3 mg/kg 투약량 둘 다에서 ZF9-MQ1과 ZF3-KRAB의 공제형으로의 처리가 전체 동물 체중에 대해 최소한의 영향을 미쳤음을 나타낸다.
도 17a는 ZF9-MQ1이 처리 120시간 후 A549 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17b는 ZF9-MQ1이 처리 120시간 후 NCI-H2009 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17c는 ZF9-MQ1이 처리 120시간 후 NCI-H358 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17d는 ZF9-MQ1이 처리 72시간 후 HCC95 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17e는 ZF9-MQ1이 처리 120시간 후 A549 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 17f는 ZF9-MQ1이 처리 120시간 후 NCI-H2009 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 17g는 ZF9-MQ1이 처리 120시간 후 NCI-H358 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 17h는 ZF9-MQ1이 처리 72시간 후 HCC95 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 18a는 처리 96시간 후, 약 17.5%의 세포가 비처리 세포 집단에서 아폽토시스되었음을 나타낸다.
도 18b는 처리 96시간 후, 약 18%의 세포가 ZF9-NE로 처리된 세포 집단에서 아폽토시스되었음을 나타낸다.
도 18c는 처리 96시간 후, 약 38.9%의 세포가 ZF9-MQ1로 처리된 세포 집단에서 아폽토시스되었음을 나타낸다.
도 18d는 처리 96시간 후, 약 38.9%의 세포가 ZF9-MQ1로 처리된 세포 집단에서 아폽토시스된 반면, 비처리 세포 및 ZF9-NE로 처리된 세포 집단에서 약 18%의 아폽토시스 세포가 있음을 나타내며, 이는 ZF9-MQ1이 폐암 세포의 세포 아폽토시스를 유도할 수 있음을 나타낸다.
도 19a 및 b는 ZF9-MQ1이 0.08 ug/ml LNP/mRNA의 EC50로 MYC를 하향조절하며, 이들 A549(도 19a) 및 HCC95(도 19b) 세포주에서 72시간째에 시험관내 생존능(2 ug/ml)에 대해 약 25배 더 높은 EC50 효과를 갖는다는 것을 나타낸다.
도 20a 및 b는 ZF9-MQ1 처리가 폐암 세포주에서 처리 96시간 후 MYC 단백질 수준을 80% 초과로 감소시킴을 나타낸다.
도 21은 ZF9-MQ1이 PBS 대조군 처리 마우스와 비교할 때 (8일째부터 앞으로) 종양 성장을 상당히 감소시킬 수 있었음을 나타낸다. 또한 ZF9-MQ1이 전체 동물 체중에 대해 최소한의 영향을 미치는 것으로 관찰되었다.
도 22는 SSOP를 이용한 LNP 전달을 사용하여 dCAS9-KRAB 이펙터 mRNA와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타내며, 이는 이러한 원위 조절 요소를 사용하여 종양발생 MYC를 감소시키는 능력을 강조한다.
도 23은 MC3을 이용한 LNP 전달을 사용하여 dCAS9-KRAB 이펙터 mRNA와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타내며, 이는 이러한 원위 조절 요소를 사용하여 종양발생 MYC를 감소시키는 능력을 강조한다.
도 24a는 A549 세포주에서 3가지 이펙터 단백질(EZH2, EZH2-KRAB, 및 MQ1) 모두와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타낸다.
도 24b는 NCI-H2009 세포주에서 3가지 이펙터 단백질(EZH2, EZH2-KRAB, 및 MQ1) 모두와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타낸다.
도 25a는 KRAB 또는 MQ1과 함께 전달되는 가이드 RNA GD-29833 및 29914가 처리 120시간 후 A549 세포주에서 MYC mRNA 수준을 상당히 하향조절할 수 있었음을 나타낸다.
도 25b는 KRAB 또는 MQ1과 함께 전달되는 가이드 RNA GD-29833 및 29914가 처리 120시간 후 NCI-H2009 세포주에서 MYC mRNA 수준을 상당히 하향조절할 수 있었고 하향조절이 ZF9-MQ1 처리 후에 관찰되는 하향조절과 비슷하다는 것을 나타낸다.
도 26a는 dCas9-MQ1이 NSCLC에서 표적 부위 메틸화를 약 60%까지 증가시켰음을 나타낸다.
도 26b는 dCas9-MQ1이 원위 프로모터 영역으로 메틸화를 유도하였음을 나타낸다(약 50%까지 증가함).
도 27a 내지 b는 전사 리프레서를 갖는 MYC 폐 슈퍼-인핸서로 가이드를 유도하는 것은 NCI-H2009 폐암 세포주에서 96시간째에 MYC 단백질 수준을 감소시킨다는 것을 나타낸다.
도 28a는 전체 세포 용해물에서 ZF9-MQ1 단백질 존재가 Hep3B를 ZF9-MQ1로 처리한 후 점진적으로 감소됨을 나타낸다.
도 28b는 전체 세포 용해물에서 MYC 단백질 발현이 Hep3B를 ZF9-MQ1로 처리한 후 점진적으로 하향조절됨을 나타낸다.
도 28c는 전체 세포 용해물에서 ZF9-MQ1 단백질 존재가 Hep3B를 ZF9-MQ1로 처리한 후 MYC 단백질의 하향조절과 상관관계가 있음을 나타낸다.
도 29a는 ZF9-MQ1로 처리한 후 SK-HEP 세포주에서 15일까지 여러 시점에서 MYC 전사체에서 45% 하향조절과 함께 mRNA 발현의 하향조절을 나타낸다.
도 29b는 MYC 전사 변화가 15일째까지의 메틸화 백분율과 상관관계가 있음을 나타낸다.
도 30a는 GFP, ZF-NE, 또는 ZF3-KRAB 단독과 비교할 때 0.6 μg/ml, 1.25 μg/ml, 및 2.5 μg/ml의 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로 처리된 1차 간세포가 MYC mRNA 발현의 감소를 보였음을 나타낸다.
도 30b는 0.6 μg/ml, 1.25 μg/ml, 및 2.5 μg/ml 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로의 처리가 1차 간세포의 생존능에 대해 최소한의 영향을 미쳤으며, 이는 HCC 세포주와 비교할 때 MYC 발현의 감소가 정상 세포에 덜 중요하다는 것을 나타낸다.
도 30c는 GFP, ZF-NE, 또는 ZF3-KRAB 단독과 비교할 때 0.5 μg/ml, 1.0 μg/ml, 및 2.0 μg/ml의 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리된 1차 간세포가 MYC mRNA 발현의 감소를 모임을 나타낸다.
도 30d는 0.5 μg/ml, 1.0 μg/ml, 및 2.0 μg/ml 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로의 처리가 1차 간세포의 생존능에 대해 최소한의 영향을 미쳤으며, 이는 HCC 세포주와 비교할 때 MYC 발현의 감소가 정상 세포에 덜 중요하다는 것을 나타낸다.
도 31a는 ZF9-MQ1+ZF3-KRAB로의 처리가 3회 투여 후 종양 크기의 통계적으로 유의한 감소를 나타내었으며, 대조군과 비교하여 25일째에 종양 부피를 63% 감소를 초래하고, ZF9-MQ1+ZF3-KRAB 처리는 종양 부피에 대하여 시스플라틴으로의 처리에 대해 동등한 효과와 연관이 있었음을 나타낸다.
도 31b는 ZF9-MQ1+ZF3-KRAB로 처리된 마우스가 체중의 상당한 감소를 경험하지 않았음을 나타내었다.
도 32a는 1.5 mg/kg에서 ZF9-MQ1+ZF3-KRAB로의 처리가 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되었으며, 음성 대조군과 비교하여 23일째에 종양 성장의 63% 억제를 초래하였음을 나타낸다. 3 mg/kg의 ZF9-MQ1 + ZF3-KRAB는 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되었으며, 음성 대조군과 비교하여 23일째까지 종양 성장의 54% 억제를 초래하고, 6 mg/kg 용량의 ZF9-MQ1 + ZF3-KRAB로의 처리는 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되며, 음성 대조군과 비교하여 23일째에 종양 부피의 63% 감소를 초래한다.
도 32b는 ZF9-MQ1 + ZF3-KRAB로 처리된 마우스가 체중의 상당한 감소를 경험하지 않았음을 나타낸다. 소라페닙으로 처리된 마우스는 처음에 체중 감소를 경험하였고 이후에 종양 덩어리의 증가로 인해 잠재적으로 전체 체중이 증가하였다.
도 33a는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 단일 작제물(ZF3-KRAB 또는 ZF9-MQ1) 단독보다 더 큰 정도로 Hep 3B 세포에서 0.6 μg/ml 및 2.0 μg/ml의 농도에서 MYC mRNA 발현을 하향조절하였음을 나타낸다. 이중-시스트론 ZF9-MQ1_ ZF3-KRAB는 0.6 μg/ml 및 2 μg/ml 농도 둘 다에서 48시간째에 총 MYC mRNA 수준을 99%만큼 감소시켰다.
도 33b는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 단일 작제물(ZF3-KRAB 또는 ZF9-MQ1) 단독보다 더 큰 정도로 Hep 3B 세포에서 세포 생존능을 하향조절하였음을 나타낸다. 이중-시스트론 ZF9-MQ1_ ZF3-KRAB는 0.6 μg/ml 및 2 μg/ml 농도 둘 다에서 Hep3B 세포의 생존능을 각각 약 80% 및 27%만큼 감소시켰다.
도 34a는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 용량-의존적 방식으로 Hep3B 세포에서 MYC mRNA 및 세포 생존능을 하향조절하였음을 나타낸다.
도 34b는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 용량-의존적 방식으로 HepG2 세포에서 MYC mRNA 및 세포 생존능을 하향조절하였음을 나타낸다.
도 34c는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 용량-의존적 방식으로 SKHEP1 세포에서 MYC mRNA 및 세포 생존능을 하향조절하였음을 나타낸다.
도 34d는 이중-시스트론 ZF9-MQ1_ZF3-KRAB 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 HCC S1 및 S2 하위유형 둘 다에 대해 효과적이었음을 나타낸다.
도 35는 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리한 후 48시간째에 75% 초과의 아폽토시스 세포가 Hep 3B 및 Hep G2 세포주에서 검출되었고 약 15% 아폽토시스 세포가 SK-HEP-1 세포주에서 검출되었음을 나타낸다. 세포는 비처리 세포(5 내지 20% 배경 아폽토시스)와 비교하여 비-코딩 mRNA 대조군에 의해 영향을 받지 않았다.
도 36은 SKHEP1 세포에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB 작제물로 1회 처리한 후, MYC mRNA 수준이 1일째에 감소되었고 처리 후 최대 15일까지 억제된 상태를 유지하였음을 나타낸다.
도 37은 이중-시스트론 ZF9-MQ1_ZF3-KRAB 처리가 Hep3B 및 SKHEP1 세포주 둘 다에서 짧은 비-코딩 mRNA 또는 비처리 세포와 비교할 때 6시간째에 MYC mRNA 및 단백질 발현을 감소시켰으며, 96시간 후에 감소된 상태를 유지하였음을 나타낸다.
도 38은 형질감염 후 6 및 24시간 시점 둘 다에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB mRNA에 의해 인코딩된 OEC ZF3-KRAB 및 ZF9-MQ1 단백질 둘 다를 웨스턴 블롯 상의 HA 태그에 의해 시각화하였음을 나타낸다.
도 39a는 SKHEP1에서 0.6 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 소라페닙을 투여하였을 때 소라페닙의 IC50이 12.3 μM에서 10.7 μM로 감소되었음을 나타낸다. 소라페닙이 0.1 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 투여될 때 소라페닙의 IC50은 SKHEP1에서 별로 변하지 않았다.
도 39b는 Hep 3B에서 0.6 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 소라페닙을 투여하였을 때 소라페닙의 IC50이 4.4 μM에서 2.9 μM로 감소되었음을 나타낸다. 소라페닙이 0.1 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 투여될 때 소라페닙의 IC50은 Hep 3B에서 별로 변하지 않았다.
도 40a는 0.6 μg/ml 및 0.1 μg/ml 농도에서 각각 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리될 때 SKHEP1 세포에서 JQ1의 IC50이 감소하였음을 나타낸다.
도 40b는 0.6 μg/ml 및 0.1 μg/ml 농도에서 각각 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리될 때 Hep 3B 세포에서 JQ1의 IC50이 감소하였음을 나타낸다.
도 41a는 0.6 및 1.2 μg/ml 농도 둘 다에서 비처리 세포와 비교하여 ZF17-MQ1이 Hepa1-6 세포에서 마우스 MYC mRNA 발현을 하향조절할 수 있었음을 나타낸다.
도 41b는 0.6 및 1.2 μg/ml 농도 둘 다에서 비처리 세포와 비교하여 ZF17-MQ1이 마우스 Hepa1-6 세포에서 세포 생존능을 감소시킬 수 있었음을 나타낸다.
도 42a는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 24 및 48시간째에 MYC 단백질의 상당한 하향조절을 보였음을 나타낸다.
도 42b는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 24 및 48시간째에 MYC 단백질의 상당한 하향조절을 보였음을 나타낸다.
도 42c는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 96시간째에 MYC mRNA의 상당한 하향조절을 보였음을 나타낸다.
도 42d는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 96시간째에 세포 생존능의 상당한 손실을 보였음을 나타낸다.
도 43은 ZF17-MQ1이 4회 투약 후 동물 종양 부하를 현저하게 감소시켰고 2주의 약물 휴지기 후, ZF17-MQ1로 마우스를 재처리하여 약 4주 후에 전체 종양 고갈을 초래하였음을 나타낸다.
도 44a는 ZF17-MQ1로 처리된 세포가 비처리 세포 또는 GFP-처리된 세포와 비교하여 LL2 세포에서 MYC 단백질 수준 감소를 보였음을 나타낸다.
도 44b는 비처리 세포에서 관찰된 수준과 비교하여, ZF17-MQ1 및 ZF16-MQ1이 LL2 세포에서 MYC mRNA 수준을 각각 99.9% 초과 또는 74%만큼 감소시켰음을 나타낸다.
도 44c는 3가지 작제물 ZF15-MQ1, ZF16-MQ1, 및 ZF17-MQ1 모두 LL2 세포에서 비처리 세포 및 GFP-처리된 세포보다 더 큰 정도로 세포 생존능을 감소시킬 수 있었음을 나타낸다.
도 45a는 ZF17-MQ1이 1.25 μg/mL 및 2.5 μg/mL 농도 둘 다에서 MYC mRNA 수준을 감소시켰음을 나타낸다. 비처리 세포에서 관찰된 수준과 비교하여, 2.5 μg/mL에서 ZF17-MQ1은 LL2 및 CT26 세포에서 각각 93% 및 85%만큼 MYC mRNA 수준을 감소시켰다.
도 45b는 ZF17-MQ1이 2가지 농도 모두에서 세포 생존능을 감소시켰음을 나타낸다. 비처리 세포와 비교하여, 이러한 조건 하에, ZF17-MQ1은 LL2 및 CT26 세포에서 각각 87% 및 93%만큼 세포 생존능을 감소시켰다.
도 46은 ZF17-MQ1이 CMT167 및 LL2 세포에서 비처리 세포 및 GFP-처리된 세포(음성 대조군)보다 더 큰 정도로 MYC mRNA를 하향조절하였고 세포 생존능을 감소시킴을 나타낸다. 비처리 세포에서 관찰된 수준과 비교하여, ZF17-MQ1은 CMT167 및 LL2 세포에서 각각 62% 및 73%만큼 MYC mRNA 수준을 감소시켰다. 또한, 비처리 세포와 비교하여, 이러한 조건 하에, ZF17-MQ1은 CMT167 및 LL2 세포에서 각각 54% 및 57%만큼 세포 생존능을 감소시켰다.
도 47은 1차 소기도 상피 세포, 1차 엽 상피 세포, 및 1차 폐 섬유아세포 각각의 무처리 세포와 비교하여 MYC mRNA 수준을 94%, 96%, 96% 수준만큼 하향조절하였음을 나타낸다. 그러나, 대조군 세포와 비교하여 생존율이 단지 16%, 9%, 및 22%만큼 감소되었다.
도 48a는 ZF9-MQ1 및 JQ1이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 48b는 ZF9-MQ1(0.5 μg/ml) 및 JQ1(최대 6.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 48c는 ZF9-MQ1(1.0 μg/ml) 및 JQ1(최대 6.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 49a는 ZF9-MQ1 및 BET762가 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 49b는 ZF9-MQ1(0.5 μg/ml) 및 BET762(최대 1.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 49c는 ZF9-MQ1(1.0 μg/ml) 및 BET762(최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 50a는 ZF9-MQ1 및 비라브레십이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 50b는 ZF9-MQ1(0.5 μg/ml) 및 비라브레십(최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 50c는 ZF9-MQ1(1.0 μg/ml) 및 비라브레십(최대 313 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 51a는 ZF9-MQ1 및 트라메티닙이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 51b는 ZF9-MQ1(0.5 μg/ml) 및 트라메티닙(최대 0.05 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 51c는 ZF9-MQ1(1.0 μg/ml) 및 트라메티닙(최대 0.05 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 52a는 모든 작제물 ZF9-MQ1, ZF54-KRAB, ZF67-KRAB, 및 ZF68-KRAB가 비처리 세포와 비교하여 처리 후 72시간째에 H2009 세포에서 NMYC mRNA 수준을 적어도 42%만큼 하향조절할 수 있었음을 나타낸다.
도 52b는 작제물 ZF9-MQ1, ZF67-KRAB, 및 ZF68-KRAB가 비처리 세포와 비교하여 처리 후 72시간째에 H226 세포에서 NMYC mRNA 수준을 적어도 27%만큼 하향조절할 수 있었음을 나타낸다.
도 52c는 작제물 ZF9-MQ1 및 ZF54-KRAB 둘 다가 비처리 세포와 비교하여 처리 후 72시간째에 H226 세포에서 NMYC mRNA 수준을 적어도 27%만큼 하향조절할 수 있었음을 나타낸다.
도 52d는 작제물 ZF9-MQ1, ZF61-KRAB, ZF67-KRAB, 및 ZF68-KRAB가 비처리 세포와 비교하여 처리 후 72시간째에 H460 세포에서 NMYC mRNA 수준을 적어도 26%만큼 하향조절할 수 있었음을 나타낸다.
도 53은 테스트한 가장 높은 농도에서, ZF9-MQ1 및 ZF54-KRAB가 각각 개별적으로 비처리된 대조군 세포에 비해, H2009 세포에서 MYC mRNA를 각각 99% 또는 62%만큼 하향조절하였음을 나타낸다. 0.313 μg/mL 미만의 ZF9-MQ1이 1 또는 2 μg/mL ZF54-KRAB와 조합될 때, MYC mRNA가 단독 처리에 대해 관찰된 것보다 더 큰 정도로 하향조절된다.
도 54는 ZF9-MQ1이 48시간까지 비처리된 대조군 세포에 비해 H1299 세포에서 MYC mRNA를 95%만큼 하향조절하였고 144시간째에 대조군 수준의 90%로 하향조절을 유지하였음을 나타낸다. ZF9-MQ1과 ZF54-KRAB의 조합은 48시간째에 MYC mRNA 수준을 98%까지 감소시켰고 144시간째에 대조군 수준의 93%로 하향조절을 유지하였다(도 54). 또한, 데이터는 ZF54-KRAB와 조합된 ZF9-MQ1 및 ZF9-MQ1이 H1299 세포에서 적어도 6일 동안 MYC mRNA 수준을 하향조절하였음을 나타내었다.
도 55는 H2009 세포로의 도입 24시간 후, ZF9-MQ1 및 ZF54-KRAB가 비처리 세포와 비교하여 MYC mRNA 수준을 각각 최대 83% 및 55%까지 하향조절하였음을 나타낸다. MYC mRNA 수준은 처리 48시간 후 비처리된 대조군의 96%에 대해 ZF9-MQ1-처리 세포에서 추가 13%만큼 추가로 감소된 반면, ZF54-KRAB는 MYC 수준을 추가로 하향조절하지 않는다. ZF9-MQ1_ZF54-KRAB 및 ZF54-KRAB_ZF9-MQ1로 처리된 세포에서 MYC mRNA 수준은 처리 후 24시간째에 대조군 세포의 각각 95% 및 96%로 감소되었다. 데이터는 이들 컨트롤러가 ZF9-MQ1보다 더 일찍 MYC mRNA 수준을 감소시켜 H2009 세포에서 24시간째에 ZF9-MQ1 처리된 세포와 비교하여 처리된 세포에서 더 높은 수준의 MYC 하향조절로 이어질 수 있었음을 나타내었다.
도 56은 ZF9-MQ1 처리가 H460 피하 종양 모델에서 소라페닙 유도 종양 성장 억제와 비교하여 유사하거나 더 높은 수준으로 종양 성장을 억제하였음을 나타낸다.
본 개시내용은 본 명세서에 기재된 발현 리프레서 또는 시스템의 사용을 통해 세포, 예를 들어 대상체 또는 환자의 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한, 예를 들어 감소시키기 위한 기술을 제공한다.
암, 자가면역, 심혈관 질환, 및 비만을 포함하여 많은 다양한 질환 및 증후군은 유전자 발현의 오조절에 의해 유발될 수 있다. 특히, 전사 인자의 과발현은 종양형성에 기여하는 것으로 오랫동안 알려져 왔으며, 최근 연구는 과발현된 종양발생 전사 인자가 세포의 핵심 자가조절 회로를 변경할 수 있음을 나타낸다.
전사 인자이며 마스터 세포 조절자인 MYC는 빈번하게 인간 암의 50% 초과에서 조절되지 않으며, 종양형성 과정의 거의 모든 측면에서 중심적인 역할을 한다. 초기 반응 유전자를 제외하고, MYC는 통상적으로 유전자 발현을 상향조절한다. MYC는 가장 빈번하게 증폭되는 종양유전자이며, 이의 유전자 산물의 발현 상승은 종양 공격성 및 불량한 임상 결과와 연관이 있다. 상승된 수준의 c-MYC는 광범위한 조직에서 종양형성을 촉진시킬 수 있다. 대부분의 종양 세포는 이의 성장 및 증식을 위해 전사 인자 c-MYC에 의존한다. MYC 과발현은 또한 만성 간 질환, 예를 들어 바이러스 및 알코올 관련 간 질환에서 연관이 있다. MYC 과발현 수준은 특정 암 하위유형에 따라 다르다. 이론에 의해 구애되고자 함이 없이, MYC 오조절 장애를 앓고 있는 대상체(예를 들어, 전체, 또는 특정 표적 조직 또는 조직들)에서 MYC의 수준을 조절하는 것, 예를 들어 감소시키는 것은 MYC 오조절 장애의 증상을 줄이거나 제거할 수 있다고 생각된다.
본 개시내용은 부분적으로 표적 유전자 프로모터, 예를 들어 MYC 프로모터에 결합하거나 표적 유전자, 예를 들어 MYC 유전자에 작동가능하게 연결된 표적화 모이어티, 및 표적화 모이어티에 의해 국재화될 때 표적 유전자, 예를 들어 MYC의 발현을 조절할 수 있는(예를 들어, 감소시킬 수 있는) 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다. 일부 구현예에서, 본 명세서에 개시된 발현 리프레서는 표적화 모이어티를 통해 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 발현 제어 요소(예를 들어, 프로모터 또는 인핸서, 리프레서 또는 사일런서)에 특이적으로 결합하고 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 조절한다. 일부 구현예에서, 본 명세서에 개시된 발현 리프레서는 표적화 모이어티를 통해 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 특이적으로 결합하고, 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 조절한다. 일부 구현예에서, 본 명세서에 개시된 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 특이적으로 결합하고, 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 조절한다.
본 개시내용은 부분적으로 2개 이상의 발현 리프레서를 포함하는 발현 억제 시스템을 추가로 제공하며, 각각 발현 리프레서는 표적화 모이어티 및 선택적으로 이펙터 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티는 2개 이상의 상이한 서열을 표적화한다(예를 들어, 각 발현 리프레서는 상이한 서열을 표적화할 수 있다). 일부 구현예에서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS))에 결합하고 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열에 결합한다. 일부 구현예에서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS))에 결합하고 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 발현 제어 요소(예를 들어, 인핸서, 슈퍼-인핸서, 리프레서, 또는 사일런서)에 결합한다. 일부 구현예에서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열에 결합하고 제2 발현 리프레서는 표적 유전자에 작동가능하게 연결된 발현 제어 요소(예를 들어, 인핸서, 슈퍼-인핸서, 리프레서, 또는 사일런서)에 결합한다. 일반적으로, 발현 억제 시스템에 의한 표적 유전자, 예를 들어 MYC의 발현 조절은 제1 및 제2 DNA 서열 각각에 대한 제1 발현 리프레서 및 제2 발현 리프레서의 결합을 포함한다. 제1 및 제2 DNA 서열의 결합은 제1 및 제2 이펙터 모이어티를 이들 부위로 국재화한다. 이론에 의해 구애되고자 함이 없이, 일부 구현예에서 제1 및 제2 발현자 모이어티 둘 다의 기능성을 이용하는 것은 제1 및/또는 제2 DNA 서열과 연관되거나 이를 포함하는 표적 유전자의 발현을 안정적으로 억제하며, 예를 들어 여기서 제1 및/또는 제2 DNA 서열은 표적 유전자 또는 하나 이상의 작동가능하게 연결된 전사 제어 요소의 서열이거나 이를 포함한다. 일부 구현예에서, 발현 리프레서 시스템은 이중-시스트론 핵산 서열에 의해 인코딩된다.
본 개시내용은 상기 발현 리프레서 및/또는 발현 리프레서 시스템을 인코딩하는 핵산, 발현 리프레서 및/또는 발현 리프레서 시스템을 포함하는 조성물, 및 상기 핵산을 전달하는 방법을 추가로 제공한다. 본 명세서에 기재된 발현 리프레서 또는 발현 리프레서 시스템을 사용하여 세포에서 표적 유전자 발현, 예를 들어 MYC 유전자 발현을 증가시키는 방법이 추가로 제공된다.
발현 리프레서
본 명세서에 기재된 바와 같이, 본 개시내용은 부분적으로 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한, 예를 들어 감소시키기 위한 발현 리프레서를 제공한다. 일부 구현예에서, 발현 리프레서는 표적 유전자 프로모터, 예를 들어 MYC 프로모터에 결합하는 표적화 모이어티 및 선택적으로 이펙터 모이어티를 포함할 수 있다. 일부 구현예에서, 표적화 모이어티는 표적 DNA 서열, 예를 들어 MYC DNA 서열에 특이적으로 결합하며, 이에 의해 발현 리프레서의 기능성을 DNA 서열로 국재화한다. 일부 구현예에서, 발현 리프레서는 표적화 모이어티 및 하나의 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 표적화 모이어티 및 복수의 이펙터 모이어티(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 또는 그 이상의 이펙터 도메인(및 선택적으로, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 또는 2개 미만의 이펙터 도메인))를 포함한다.
발현 리프레서는 복수의 이펙터 모이어티를 포함할 수 있으며, 각 이펙터 모이어티는 다른 이펙터 모이어티와 상이한 기능성을 포함한다. 예를 들어, 발현 리프레서는 2개의 이펙터 모이어티를 포함할 수 있으며, 제1 이펙터 모이어티는 DNA 메틸라제 기능성을 포함하고 제2 이펙터 모이어티는 전사 리프레서 기능성을 포함한다. 일부 구현예에서, 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현의 감소에 대해 서로 상보적인 기능성을 갖는 이펙터 모이어티를 포함하며, 이들 기능성은 함께, 발현을 억제할 수 있고, 선택적으로, 개별적으로 존재할 때에는 발현을 억제하지 않거나 무시할 만한 정도로 억제한다. 일부 구현예에서, 발현 리프레서는 복수의 이펙터 모이어티를 포함하며, 여기서 각 이펙터 모이어티는 기타 다른 이펙터 모이어티 각각과 상보적이고, 각 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다.
일부 구현예에서, 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현의 감소에 대해 서로 상승작용하는 기능성을 갖는 이펙터 모이어티의 조합을 포함한다. 이론에 의해 구애되고자 함이 없이, 일부 구현예에서, 다수의 전사 활성화 후성유전학적 마커(예를 들어, 다수의 상이한 유형의 후성유전학적 마커 및/또는 주어진 유형의 더 광범위한 마킹)가 개별적으로, 단독으로의 개별적인 변형보다 더 효과적으로 발현을 함께 억제한다는 점에서(예를 들어, 발현의 더 큰 감소 및/또는 발현의 더 오래 지속된 감소의 생성), 게놈 유전자좌에 대한 후성유전학적 변형은 누적된다. 일부 구현예에서, 발현 리프레서는 복수의 이펙터 모이어티를 포함하며, 여기서 각 이펙터 모이어티는 서로의 이펙터 모이어티와 상승작용하고, 예를 들어 각 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다. 일부 구현예에서, (서로 상승작용하는 복수의 이펙터 모이어티를 포함하는) 발현 리프레서는 개별 이펙터 모이어티를 포함하는 발현 리프레서보다 표적 유전자, 예를 들어 MYC의 발현을 억제하는 데 더 효과적이다. 일부 구현예에서, 상기 복수의 이펙터 모이어티를 포함하는 발현 리프레서는 개별 이펙터 모이어티를 포함하는 발현 리프레서보다 표적 유전자, 예를 들어 MYC의 발현을 감소시키는 데 적어도 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.55×, 1.6×, 1.65×, 1.7×, 1.75×, 1.8×, 1.85×, 1.9×, 1.95×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 30×, 40×, 50×, 60×, 70×, 80×, 90×, 또는 100×만큼 효과적이다.
일부 구현예에서, 발현 리프레서는 하나 이상의 표적화 모이어티, 예를 들어 Cas 도메인, TAL 이펙터 도메인, 또는 Zn 핑거 도메인을 포함한다. 일 구현예에서, 발현 리프레서 시스템이 동일한 유형의 2개 이상의 표적화 모이어티, 예를 들어 2개 이상의 Cas 도메인을 포함할 때, 표적화 모이어티는 2개 이상의 상이한 서열에 특이적으로 결합한다. 예를 들어, 2개 이상의 Cas 도메인을 포함하는 발현 리프레서 시스템에서, 2개 이상의 Cas 도메인은 이들 도메인이 단지 이들의 표적 서열에 상응하는 gRNA에만 상당히 결합하도록(예를 들어, 또 다른 Cas 도메인의 표적에 상응하는 gRNA에는 상당히 결합하지 않도록) 선택되거나 변경될 수 있다.
일부 구현예에서, 발현 리프레서는, 예를 들어 펩타이드 결합에 의해, 공유적으로 연결된 표적화 모이어티 및 이펙터 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티 및 이펙터 모이어티는, 예를 들어 하나 이상의 펩타이드 결합 및/또는 링커에 의해 연결되어, 동일한 폴리펩타이드 사슬 상에 위치한다. 일부 구현예에서, 발현 리프레서는, 예를 들어 펩타이드 결합 및/또는 링커에 의해 연결된 표적화 모이어티와 이펙터 모이어티를 포함하는, 융합 분자이거나 이를 포함한다. 일부 구현예에서, 발현 리프레서는 동일한 폴리펩타이드 사슬 상의 이펙터 모이어티의 N-말단에 배치된 표적화 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 동일한 폴리펩타이드 사슬 상의 이펙터 모이어티의 C-말단에 배치된 표적화 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 비-펩타이드 결합에 의해, 공유적으로 연결된 표적화 모이어티 및 이펙터 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티는 비-펩타이드 결합에 의해 이펙터 모이어티에 접합된다. 일부 구현예에서, 발현 리프레서는 표적화 모이어티 및 복수의 이펙터 모이어티를 포함하며, 표적화 모이어티와 복수의 이펙터 모이어티는, 예를 들어 펩타이드 결합에 의해, 공유적으로 연결된다(예를 들어, 표적화 모이어티와 복수의 이펙터 모이어티는 모두 일련의 공유 결합에 의해 연결되지만, 각 개별 모이어티는 기타 다른 모든 이펙터 모이어티와 공유 결합을 공유할 수 없다).
다른 구현예에서, 발현 리프레서는 공유적으로 연결되지 않은, 예를 들어 서로 비공유적으로 회합된 표적화 모이어티와 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 이펙터 모이어티에 비공유적으로 결합하는 표적화 모이어티를 포함하거나 그 반대로도 성립한다. 일부 구현예에서, 발현 리프레서는 표적화 모이어티 및 복수의 이펙터 모이어티를 포함하며, 표적화 모이어티와 적어도 하나의 이펙터 모이어티는 공유적으로 연결되지 않으며, 예를 들어 서로 비공유적으로 회합되고, 표적화 모이어티와 적어도 하나의 기타 다른 이펙터 모이어티는, 예를 들어 펩타이드 결합에 의해, 공유적으로 연결된다.
일반적으로, 본 명세서에 기재된 바와 같은 발현 리프레서는 (예를 들어, 표적화 모이어티를 통해) 표적 유전자, 예를 들어 MYC에 근접하고/하거나 이에 작동가능하게 연결된 게놈 서열 요소에 결합한다. 일부 구현예에서, 게놈 서열 요소에 대한 발현 리프레서의 결합은 표적 유전자, 예를 들어 MYC의 발현을 조절한다(예를 들어, 감소시킨다). 예를 들어, 게놈 서열 요소에 대한 전사 기구의 성분을 동원하거나 이의 동원을 억제하는 이펙터 모이어티를 포함하는 발현 리프레서의 결합은 표적 유전자, 예를 들어 MYC의 발현을 조절할(예를 들어, 감소시킬) 수 있다. 추가의 예로서, 효소 활성을 갖는 이펙터 모이어티(예를 들어, 후성유전학적 변형 모이어티)를 포함하는 발현 리프레서의 결합은 이펙터 모이어티의 국재화된 효소 활성을 통해 표적 유전자, 예를 들어 MYC의 발현을 조절할(예를 들어, 감소시킬) 수 있다. 추가의 예로서, 게놈 서열 요소에 대한 발현 리프레서의 결합 및 발현 리프레서의 국재화된 효소 활성 둘 다는 표적 유전자, 예를 들어 MYC의 발현에 있어서의 생성되는 조절(예를 들어, 감소)에 기여할 수 있다.
일부 구현예에서, 발현 리프레서는 이펙터 모이어티를 포함하며, 여기서 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KRAB(예를 들어, KRAB 도메인), MeCP2, HP1, RBBP4, REST, FOG1, SUZ12 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함한다.
일부 구현예에서, 발현 리프레서는 제1 이펙터 모이어티 및 제2 이펙터 모이어티를 포함하며, 여기서 제1 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KRAB(예를 들어, KRAB 도메인), MeCP2, HP1, RBBP4, REST, FOG1, SUZ12 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하고, 제2 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KRAB(예를 들어, KRAB 도메인), MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 상이한 단백질을 포함한다.
일부 구현예에서, 본 개시내용은 본 명세서에 기재된 바와 같은 발현 리프레서, 발현 리프레서 시스템, 표적화 모이어티 및/또는 이펙터 모이어티를 인코딩하는 핵산 서열을 제공한다. 당업자는 RNA의 핵산 서열은, 통상적으로 티민(T)이 우라실(U)로 대체된 것을 제외하고는, 상응하는 DNA 서열과 동일함을 인식하고 있다. 뉴클레오타이드 서열이 DNA 서열(예를 들어, A, T, G, C를 포함함)로 표현될 때, 본 개시내용은 또한 "U"가 "T"를 대체하는 상응하는 RNA 서열(예를 들어, A, U, G, C를 포함함)을 제공함이 이해될 것이다. 폴리뉴클레오타이드 서열을 기재하기 위해 본 명세서에서는 통상적인 표기가 사용된다: 단일 가닥 폴리뉴클레오타이드 서열의 좌측단은 5'-단부이고, 이중 가닥 폴리뉴클레오타이드 서열의 우측 방향은 5'-방향으로 지칭된다.
유전자 코드의 축퇴로 인해, 본 명세서에 기재된 바와 같은 표적화 모이어티 및/또는 이펙터 모이어티를 포함하는 발현 리프레서를 인코딩하는 다수의 뉴클레오타이드 서열이 생성될 수 있으며, 이들 중 일부는 본 명세서에 개시된 핵산 서열과 유사성, 예를 들어 90%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는다는 것이 당업자에 의해 이해될 것이다. 예를 들어, 코돈 AGA, AGG, CGA, CGC, CGG, 및 CGU 모두는 아미노산 아르기닌을 인코딩한다. 따라서, 아르기닌이 코돈에 의해 지정된 본 발명의 핵산 분자 내의 모든 위치에서, 그러한 코돈은 인코딩된 폴리펩타이드를 변경시키지 않고서 상기에 기재된 상응하는 코돈 중 임의의 것으로 변경될 수 있다.
일부 구현예에서, 표적화 모이어티 및/또는 이펙터 모이어티를 포함하는 발현 리프레서를 인코딩하는 핵산 응집물(cohesion)은 포유동물, 예를 들어 인간에서 코돈 사용빈도에 따라 최적화된, 코돈-최적화된 코딩 영역의 일부 또는 전부일 수 있다. 일부 구현예에서, 표적화 모이어티 및/또는 이펙터 모이어티를 인코딩하는 핵산 응집물은 단백질 발현을 증가시키고/시키거나 단백질 발현의 지속시간을 증가시키기 위해 코돈 최적화된다. 일부 구현예에서, 코돈 최적화된 핵산 서열에 의해 생성되는 단백질은 코돈 최적화되지 않은 핵산 서열에 의해 인코딩될 때의 단백질의 수준과 비교하여 적어도 1%, 적어도 2%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 30%, 적어도 40%, 또는 적어도 50% 더 높다.
발현 억제 시스템
본 개시내용의 발현 억제 시스템은 2개 이상의 발현 리프레서를 포함할 수 있다. 일부 구현예에서, 발현 억제 시스템은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개, 또는 그 이상(그리고 선택적으로 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 또는 2개 이하)의 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 2개 이상의 상이한 서열(예를 들어, 1번째 및 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 9번째, 10번째, 11번째, 12번째, 및/또는 그 이상의 DNA 서열, 및 선택적으로 20번째, 19번째, 18번째, 17번째, 16번째, 15번째, 14번째, 13번째, 12번째, 11번째, 10번째, 9번째, 8번째, 6번째, 5번째, 4번째, 3번째, 또는 2번째 이하의 DNA 서열)을 표적화한다. 일부 구현예에서, 발현 억제 시스템은 복수의 발현 리프레서를 포함하며, 여기서 복수의 발현 리프레서의 각 구성원은 복수의 발현 리프레서의 또 다른 구성원에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함하며, 여기서 제1 발현 리프레서는 제2 발현 리프레서에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다.
일부 구현예에서, 본 개시내용의 발현 억제 시스템은 2개 이상의 발현 리프레서를 포함하며, 여기서 발현 리프레서는 조성물, 약제학적 조성물, 또는 혼합물 형태로 함께 존재한다. 일부 구현예에서, 본 개시내용의 발현 억제 시스템은 2개 이상의 발현 리프레서를 포함하며, 여기서 하나 이상의 발현 리프레서는 적어도 하나의 기타 다른 발현 리프레서와 혼합되지 않는다. 예를 들어, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함할 수 있으며, 여기서 세포의 핵 내의 제1 발현 리프레서의 존재는 동일한 세포의 핵 내의 제2 발현 리프레서의 존재와 중첩되지 않고, 발현 억제 시스템은 제1 및 제2 발현 리프레서의 비중첩 존재를 통해 MYC 유전자의 발현의 감소를 달성한다. 일부 구현예에서, 발현 억제 시스템은 제1 또는 제2 발현 리프레서 단독에 의해 달성되는 MYC 유전자의 발현 감소와 비교하여 MYC 유전자의 더 큰 발현 감소를 달성한다.
일부 구현예에서, 발현 리프레서 시스템의 발현 리프레서는 각각 상이한 표적화 모이어티를 포함한다(예를 들어, 제1, 제2, 제3, 또는 추가의 발현 리프레서는 각각 서로 상이한 표적화 모이어티를 포함한다). 예를 들어, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함할 수 있으며, 여기서 제1 발현 리프레서는 제1 표적화 모이어티(예를 들어, Cas9 도메인, TAL 이펙터 도메인, 또는 Zn 핑거 도메인)를 포함하고, 제2 발현 리프레서는 제1 표적화 모이어티와 상이한 제2 표적화 모이어티(예를 들어, Cas9 도메인, TAL 이펙터 도메인, 또는 Zn 핑거 도메인)를 포함한다. 일부 구현예에서, '상이한'이란, 별개의 유형의 표적화 모이어티를 포함한다는 것을 의미할 수 있으며, 예를 들어 제1 표적화 모이어티는 Cas9 도메인을 포함하고, 제2 DNA-표적화 모이어티는 Zn 핑거 도메인을 포함한다. 다른 구현예에서, '상이한'이란, 동일한 유형의 표적화 모이어티의 별개의 변이체를 포함한다는 것을 의미할 수 있으며, 예를 들어 제1 표적화 모이어티는 (예를 들어, 제1 종으로부터의) 제1 Cas9 도메인을 포함하고, 제2 표적화 모이어티는 (예를 들어, 제2 종으로부터의) 제2 Cas9 도메인을 포함한다. 일 구현예에서, 발현 리프레서 시스템이 동일한 유형의 2개 이상의 표적화 모이어티, 예를 들어 2개 이상의 Cas9 또는 ZF 도메인을 포함할 때, 표적화 모이어티는 2개 이상의 상이한 서열에 특이적으로 결합한다. 예를 들어, 2개 이상의 Cas9 도메인을 포함하는 발현 리프레서 시스템에서, 2개 이상의 Cas9 도메인은 이들 도메인이 단지 이들의 표적 서열에 상응하는 gRNA에만 상당히 결합하도록(예를 들어, 또 다른 Cas9 도메인의 표적에 상응하는 gRNA에는 상당히 결합하지 않도록) 선택되거나 변경될 수 있다. 추가의 예에서, 2개 이상의 이펙터 모이어티를 포함하는 발현 리프레서 시스템에서, 2개 이상의 이펙터 모이어티는, 이들 모이어티가 단지 이들의 표적 서열에만 상당히 결합하도록(예를 들어, 또 다른 이펙터 모이어티의 표적 서열에는 상당히 결합하지 않도록) 선택되거나 변경될 수 있다.
일부 구현예에서, 발현 리프레서 시스템은 3개 이상의 발현 리프레서를 포함하며, 2개 이상의 발현 리프레서는 동일한 표적화 모이어티를 포함한다. 예를 들어, 발현 리프레서 시스템은 3개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 표적화 모이어티를 포함하고, 제3 발현 리프레서는 상이한 제2 표적화 모이어티를 포함한다. 추가의 예를 들어, 발현 리프레서 시스템은 4개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 표적화 모이어티를 포함하고, 제3 및 제4 발현 리프레서는 상이한 제2 표적화 모이어티를 포함한다. 추가의 예를 들어, 발현 리프레서 시스템은 5개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 표적화 모이어티를 포함하고, 제3 및 제4 발현 리프레서 둘 다는 상이한 제2 표적화 모이어티를 포함하고, 제5 발현 리프레서는 상이한 제3 표적화 모이어티를 포함한다. 상기에 기재된 바와 같이, '상이한'이란, 상이한 유형의 표적화 모이어티를 포함한다는 것, 또는 동일한 유형의 표적화 모이어티의 별개의 변이체를 포함한다는 것을 의미할 수 있다.
일부 구현예에서, 발현 리프레서 시스템의 발현 리프레서는 각각 상이한 DNA 서열에 결합한다(예를 들어, 제1, 제2, 제3, 또는 추가의 발현 리프레서는 각각 서로 상이한 DNA 서열에 결합한다). 예를 들어, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함할 수 있으며, 여기서 제1 발현 리프레서는 제1 DNA 서열에 결합하고, 제2 발현 리프레서는 제2 DNA 서열에 결합한다. 일부 구현예에서, '상이한'이란, 하나의 발현 리프레서에 의해 결합된 DNA 서열과 또 다른 발현 리프레서에 의해 결합된 DNA 서열 사이에 동일하지 않은 적어도 하나의 위치가 존재한다는 것, 또는 하나의 발현 리프레서에 의해 결합된 DNA 서열에 존재하는 적어도 하나의 위치가 또 다른 발현 리프레서에 의해 결합된 DNA 서열에 존재하지 않는다는 것을 의미할 수 있다.
일부 구현예에서, 제1 DNA 서열은 제1 게놈 DNA 가닥 상에 위치할 수 있고, 제2 DNA 서열은 제2 게놈 DNA 가닥 상에 위치할 수 있다. 일부 구현예에서, 제1 DNA 서열은 제2 DNA 서열과 동일한 게놈 DNA 가닥 상에 위치할 수 있다.
일부 구현예에서, 발현 리프레서 시스템은 3개 이상의 발현 리프레서를 포함하며, 2개 이상의 발현 리프레서는 동일한 DNA 서열에 결합한다. 예를 들어, 발현 리프레서 시스템은 3개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 DNA 서열에 결합하고, 제3 발현 리프레서는 상이한 제2 DNA 서열에 결합한다. 추가의 예를 들어, 발현 리프레서 시스템은 4개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 DNA 서열에 결합하고, 제3 및 제4 발현 리프레서 둘 다는 상이한 제2 DNA 서열에 결합한다. 추가의 예를 들어, 발현 리프레서 시스템은 5개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 DNA 서열에 결합하고, 제3 및 제4 발현 리프레서 둘 다는 제2 DNA 서열에 결합하고, 제5 발현 리프레서는 제3 DNA 서열에 결합한다. 상기 기재된 바와 같이, '상이한'이란, 하나의 발현 리프레서에 의해 결합된 DNA 서열과 또 다른 발현 리프레서에 의해 결합된 DNA 서열 사이에 동일하지 않은 적어도 하나의 위치가 존재한다는 것, 또는 하나의 발현 리프레서에 의해 결합된 DNA 서열에 존재하는 적어도 하나의 위치가 또 다른 발현 리프레서에 의해 결합된 DNA 서열에 존재하지 않는다는 것을 의미할 수 있다.
일부 구현예에서, 발현 억제 시스템은 2개 이상(예를 들어, 2개)의 발현 리프레서를 포함하며, 이들 발현 리프레서 중 복수개(예를 들어, 2개)는 상이한 DNA 서열에 결합하는 표적화 모이어티를 포함한다. 그러한 구현예에서, 제1 표적화 모이어티는 제1 DNA 서열에 결합할 수 있고, 제2 DNA-표적화 모이어티는 제2 DNA 서열에 결합할 수 있으며, 제1 및 제2 DNA 서열은 상이하고 중첩되지 않는다. 일부 그러한 구현예에서, 제1 DNA 서열은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100개의 염기쌍(그리고 선택적으로, 500, 400, 300, 200, 100, 95, 90, 85, 80, 75, 70, 65, 60, 55, 또는 50개 이하의 염기쌍)만큼 제2 DNA 서열로부터 분리되어 있다. 일부 그러한 구현예에서, 제1 DNA 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100개 이하의 염기쌍(그리고 선택적으로, 0개의 염기쌍, 예를 들어 제1 서열과 제2 서열이 서로 직접 인접함)만큼 제2 DNA 서열로부터 분리되어 있다.
일부 구현예에서, 발현 리프레서 시스템의 발현 리프레서는 각각 상이한 이펙터 모이어티를 포함한다(예를 들어, 제1, 제2, 제3, 또는 추가의 발현 리프레서는 각각 서로 상이한 이펙터 모이어티를 포함한다). 예를 들어, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함할 수 있으며, 여기서 제1 발현 리프레서는 제1 이펙터 모이어티(예를 들어, DNA 메틸트랜스퍼라제 또는 이의 기능성 단편을 포함함)를 포함하고, 제2 발현 리프레서는 제1 이펙터 모이어티와 상이한 제2 이펙터 모이어티(예를 들어, 전사 리프레서(예를 들어, KRAB) 또는 이의 기능성 단편을 포함함)를 포함한다. 일부 구현예에서, '상이한'이란, 별개의 유형의 이펙터 모이어티를 포함한다는 것을 의미할 수 있다. 다른 구현예에서, '상이한'이란, 동일한 유형의 이펙터 모이어티의 별개의 변이체를 포함한다는 것을 의미할 수 있으며, 예를 들어 제1 이펙터 모이어티는 (예를 들어, 제1 부위 특이성 또는 아미노산 서열을 갖는) 제1 DNA 메틸트랜스퍼라제를 포함하고, 제2 이펙터 모이어티는 (예를 들어, 제2 부위 특이성 또는 아미노산 서열을 갖는) 제2 DNA 메틸트랜스퍼라제를 포함한다.
일부 구현예에서, 발현 리프레서 시스템은 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하고, 제2 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉,, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 상이한 단백질을 포함한다.
일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성(예를 들어, MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편)을 포함하고, 다른 이펙터 모이어티는 전사 리프레서 활성(예를 들어, KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편)을 포함하며, 제1 또는 제2 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 히스톤 데아세틸라제 활성(예를 들어, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편)을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성(예를 들어, MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 또는 이들 중 임의의 것의 기능성 변이체)을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서 제1 또는 제2 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성(예를 들어, KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편)을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 전사 리프레서 활성을 포함하고 다른 이펙터 모이어티는 상이한 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 동일한 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 상이한 히스톤 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 동일한 히스톤 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 다른 이펙터 모이어티는 상이한 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 다른 이펙터 모이어티는 동일한 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 상이한 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 동일한 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 상이한 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 동일한 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 전사 리프레서 활성을 포함하고 다른 이펙터 모이어티는 상이한 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 전사 리프레서 활성을 포함하고 다른 이펙터 모이어티는 동일한 전사 리프레서 활성을 포함한다.
일부 구현예에서, 발현 리프레서 시스템은 3개 이상의 발현 리프레서를 포함하며, 2개 이상의 발현 리프레서는 동일한 DNA-표적화 모이어티를 포함한다. 예를 들어, 발현 리프레서 시스템은 3개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 이펙터 모이어티를 포함하고, 제3 발현 리프레서는 상이한 제2 이펙터 모이어티를 포함한다. 추가의 예를 들어, 발현 리프레서 시스템은 4개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 이펙터 모이어티를 포함하고, 제3 및 제4 발현 리프레서는 상이한 제2 이펙터 모이어티를 포함한다. 추가의 예를 들어, 발현 리프레서 시스템은 5개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 이펙터 모이어티를 포함하고, 제3 및 제4 발현 리프레서 둘 다는 상이한 제2 이펙터 모이어티를 포함하고, 제5 발현 리프레서는 상이한 제3 이펙터 모이어티를 포함한다. 상기에 기재된 바와 같이, '상이한'이란, 상이한 유형의 이펙터 모이어티를 포함한다는 것, 또는 동일한 유형의 이펙터 모이어티의 별개의 변이체를 포함한다는 것을 의미할 수 있다.
일부 구현예에서, 발현 리프레서 시스템의 2개 이상의(예를 들어, 모든) 발현 리프레서는 서로 공유적으로 회합되지 않으며, 예를 들어 각 발현 리프레서는 임의의 다른 발현 리프레서와 공유적으로 회합되지 않는다. 또 다른 구현예에서, 발현 리프레서 시스템의 2개 이상의 발현 리프레서는 서로 공유적으로 회합된다. 일 구현예에서, 발현 억제 시스템은, 예를 들어 융합 분자로서, 예를 들어 펩타이드 결합 및 선택적으로 링커에 의해 연결된 융합 분자로서, 동일한 폴리펩타이드 상에 배치된 제1 발현 리프레서 및 제2 발현 리프레서를 포함한다. 일부 구현예에서, 펩타이드는 자가-절단 펩타이드, 예를 들어 T2A 자가-절단 펩타이드이다. 일 구현예에서, 발현 억제 시스템은 비-펩타이드 결합에 의해 연결된, 예를 들어 서로 접합된 제1 발현 리프레서와 제2 발현 리프레서를 포함한다.
링커
본 명세서에 개시된 바와 같은 발현 리프레서 또는 발현 리프레서 시스템은 하나 이상의 링커를 포함할 수 있다. 링커는 표적화 모이어티를 이펙터 모이어티에, 이펙터 모이어티를 또 다른 이펙터 모이어티에, 또는 표적화 모이어티를 또 다른 표적화 모이어티에 연결할 수 있다. 링커는 화학 결합, 예를 들어 하나 이상의 공유 결합 또는 비공유 결합일 수 있다. 일부 구현예에서, 링커는 공유적이다. 일부 구현예에서, 링커는 비공유적이다. 일부 구현예에서, 링커는 펩타이드 링커이다. 그러한 링커는 2 내지 30개, 5 내지 30개, 10 내지 30개, 15 내지 30개, 20 내지 30개, 25 내지 30개, 2 내지 25개, 5 내지 25개, 10 내지 25개, 15 내지 25개, 20 내지 25개, 2 내지 20개, 5 내지 20개, 10 내지 20개, 15 내지 20개, 2 내지 15개, 5 내지 15개, 10 내지 15개, 2 내지 10개, 5 내지 10개, 또는 2 내지 5개의 아미노산 길이, 또는 2, 5, 10, 15, 20, 25, 또는 30개 이상의 아미노산 길이(및 선택적으로 최대 50, 40, 30, 25, 20, 15, 10, 또는 5개의 아미노산 길이)일 수 있다. 일부 구현예에서, 링커는 제1 도메인 또는 모이어티를 제2 도메인 또는 모이어티로부터, 예를 들어 DNA-표적화 모이어티를 이펙터 모이어티로부터 이격시키는 데 사용될 수 있다. 일부 구현예에서, 예를 들어, 링커는, 예를 들어 2차 및 3차 구조의 분자 가요성을 제공하기 위하여, DNA-표적화 모이어티와 이펙터 모이어티 사이에 위치될 수 있다. 링커는 본 명세서에 기재된 가요성, 강성, 및/또는 절단성 링커를 포함할 수 있다. 일부 구현예에서, 링커는 가요성을 제공하기 위하여 적어도 하나의 글리신, 알라닌, 및 세린 아미노산을 포함한다. 일부 구현예에서, 일부 구현예에서, 링커는 소수성 링커이며, 이에는, 예를 들어 음으로 하전된 설포네이트 기, 폴리에틸렌 글리콜(PEG) 기, 또는 피로포스페이트 디에스테르 기가 포함된다. 일부 구현예에서, 링커는 조절제로부터 모이어티(예를 들어, 폴리펩타이드)를 선택적으로 방출하도록 절단 가능하지만, 조기 절단을 방지하기에 충분히 안정적이어야 한다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서의 하나 이상의 모이어티 및/또는 도메인은 하나 이상의 링커와 연결된다. 일부 구현예에서, 발현 억제는 표적화 모이어티 및 이펙터 모이어티 사이에 위치된 링커를 포함할 수 있다. 일부 구현예에서, 링커는 ASGSGGGSGGARD(서열번호 137), 또는 ASGSGGGSGG(서열번호 138)의 서열을 가질 수 있다. 일부 구현예에서, 제1 및 제2 리프레서를 포함하는 시스템은 제1 표적화 모이어티와 제1 이펙터 모이어티 사이에 위치된 제1 링커, 및 제2 표적화 모이어티와 제2 이펙터 모이어티 사이에 위치된 제2 링커를 포함할 수 있다. 일부 구현예에서, 제1 및 제2 링커는 동일할 수 있다. 일부 구현예에서, 제1 및 제2 링커는 상이할 수 있다. 일부 구현예에서, 제1 링커는 서열번호 137에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함할 수 있고 제2 링커는 서열번호 138에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함할 수 있다.
당업자에 의해 알려진 바와 같이, 일반적으로 사용되는 가요성 링커는 Gly 및 Ser 잔기의 신장으로 주로 구성되는 서열을 갖는다("GS" 링커). 가요성 링커는 어느 정도의 이동 또는 상호작용을 필요로 하는 도메인/모이어티를 결합하는 데 유용할 수 있으며, 작은, 비극성(예를 들어, Gly) 또는 극성(예를 들어, Ser 또는 Thr) 아미노산을 포함할 수 있다. Ser 또는 Thr의 도입은 또한 물 분자와의 수소 결합을 형성함으로써 수용액 중에서의 링커의 안정성을 유지할 수 있으며, 이에 따라 링커와 모이어티/도메인 사이의 불리한 상호작용을 감소시킬 수 있다. 일부 구현예에서, 링커는 GS 링커 또는 이의 변이체, 예를 들어 G4S(서열번호 207)이다.
강성 링커는 도메인들/모이어티들 사이의 고정된 거리를 유지하는 데 그리고 그들의 독립적인 기능을 유지하는 데 유용하다. 강성 링커는 또한, 도메인들의 공간적 분리가 융합체 내의 하나 이상의 성분의 안정성 및 생물활성을 보존하는 데 중요할 때 유용할 수 있다. 강성 링커는 알파 나선-구조 또는 Pro-풍부 서열인 (XP)n을 가질 수 있으며, 여기서 X는 임의의 아미노산, 바람직하게는 Ala, Lys, 또는 Glu를 지정한다.
절단성 링커는 생체내에서 유리 기능성 도메인을 방출할 수 있다. 일부 구현예에서, 링커는 특정 조건 하에서, 예컨대 환원성 시약 또는 프로테아제의 존재 하에서 절단될 수 있다. 생체내 절단성 링커는 이황화물 결합의 가역적 성질을 이용할 수 있다. 한 예에는 2개의 Cys 잔기 사이의 트롬빈-감수성 서열(예를 들어, PRS)이 포함된다. CPRSC의 시험관내 트롬빈 처리는 트롬빈-감수성 서열의 절단을 초래하지만, 가역적 이황화물 결합은 온전하게 남아 있다. 그러한 링커는 알려져 있으며, 예를 들어 문헌[Chen et al. 2013. Fusion Protein Linkers: Property, Design and Functionality. Adv Drug Deliv Rev. 65(10): 1357-1369]에 기재되어 있다. 융합체 내의 링커의 생체내 절단은 또한, 특정 조건 하에 생체내에서, 특정 세포 또는 조직에서 발현되거나 특정 세포 구획 내에 구속된 프로테아제에 의해 수행될 수 있다. 많은 프로테아제의 특이성은 구속된 구획 내에서 링커의 더 느린 절단을 제공한다. 일부 구현예에서, 절단성 링커는 자가-절단성 링커, 예를 들어 T2A 펩타이드 링커일 수 있다. 일부 구현예에서, 링커는 "리보솜 스킵핑" 서열, 예를 들어 tPT2A 링커를 포함할 수 있다.
본 명세서에 기재된 링커에 사용하기에 적합한 분자의 예에는 음으로 하전된 설포네이트 기; 지질, 예컨대 폴리 (--CH2--) 탄화수소 사슬, 예컨대 폴리에틸렌 글리콜(PEG) 기, 이의 불포화 변이체, 이의 하이드록실화 변이체, 이의 아미드화 또는 다른 방식으로의 N-함유 변이체; 비탄소 링커; 탄수화물 링커; 포스포디에스테르 링커, 또는 발현 리프레서의 2개 이상의 성분을 공유적으로 연결할 수 있는 기타 다른 분자가 포함된다. 비공유성 링커가 또한 포함되며, 이에는, 예를 들어 폴리펩타이드가, 예를 들어, 류신, 이소류신, 발린, 또는 아마도 또한 알라닌, 페닐알라닌, 또는 심지어 티로신, 메티오닌, 글리신, 또는 기타 다른 소수성 잔기가 풍부한 일련의 잔기와 같은 폴리펩타이드의 소수성 영역 또는 폴리펩타이드의 소수성 확장을 통해 연결되는 소수성 지질 소구체가 포함된다. 발현 리프레서의 성분들은 전하-기반 화학을 사용하여 연결될 수 있으며, 이로써 발현 리프레서의 양으로 하전된 성분이 또 다른 성분의 음전하에 연결된다.
표적화 모이어티
본 개시내용은 표적 유전자에서, 이에 근접한, 및/또는 이에 작동가능하게 연결된 게놈 서열 요소(예를 들어, 프로모터, TSS, 또는 앵커 서열)를 특정으로 표적화하거나, 이에 결합하는 표적화 모이어티를 포함하는, 예를 들어 발현 리프레서를 제공한다. 표적화 모이어티는 DNA 서열, 예를 들어 표적 유전자, 예를 들어 MYC와 연관된 DNA 서열에 특이적으로 결합할 수 있다. DNA 서열에 특이적으로 결합하는 임의의 분자 또는 화합물이 표적화 모이어티로서 사용될 수 있다.
일부 구현예에서, 표적화 모이어티는 게놈 복합체(예를 들어, ASMC)의 성분을 표적화하고, 예를 들어 이에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자에 작동가능하게 연결된 발현 제어 서열(예를 들어, 프로모터 또는 인핸서)을 표적화하고, 예를 들어 이에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 또는 표적 유전자의 일부를 표적화하고, 예를 들어 이에 결합한다. 표적화 모이어티의 표적은 이의 표적화된 성분으로서 지칭될 수 있다. 표적화된 성분은 표적 유전자에 작동가능하게 연결된 임의의 게놈 서열 요소, 또는 표적 유전자 그 자체일 수 있으며, 이는 프로모터, 인핸서, 앵커 서열, 엑손, 인트론, UTR 인코딩 서열, 스플라이스 부위, 또는 전사 개시 부위를 포함하지만 이에 제한되지 않는다. 일부 구현예에서, 표적화 모이어티는 하나 이상의 표적 앵커 서열(예를 들어, 세포 내의 것)에 특이적으로 결합하고, 비표적화된 앵커 서열(예를 들어, 동일한 세포 내의 것)에는 특이적으로 결합하지 않는다.
일부 구현예에서, 표적화 모이어티는 CRISPR/Cas 도메인, TAL 이펙터 도메인, Zn 핑거 도메인, 펩타이드 핵산(PNA) 또는 핵산 분자일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 발현 리프레서는 하나의 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 복수의 표적화 모이어티를 포함하며, 여기서 각 표적화 모이어티는 또 다른 표적화 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 복수의 발현 리프레서를 포함하며, 여기서 복수의 발현 리프레서의 각 구성원은 표적화 모이어티를 포함하고, 각 표적화 모이어티는 또 다른 표적화 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 표적화 모이어티를 포함하는 제1 발현 리프레서 및 제2 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 표적화 모이어티는 제2 표적화 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 표적화 모이어티를 포함하는 제1 발현 리프레서 및 제2 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 제1 표적화 모이어티는 또 다른 제1 표적화 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않고, 제2 표적화 모이어티는 또 다른 제2 표적화 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다. 일부 구현예에서, 본 명세서에 기재된 조성물 및 방법에 사용하기 위한 표적화 모이어티는 단량체성 상태, 예를 들어 비이량체성 상태에서 기능성이다(예를 들어, DNA 서열에 결합한다).
일부 구현예에서, 표적화된 성분에 대한 표적화 모이어티의 결합은 또 다른 전사 인자, 게놈 복합체 성분, 또는 게놈 서열 요소에 대한 표적화된 성분의 결합 친화도를 감소시킨다. 일부 구현예에서, 표적화 모이어티는 500, 450, 400, 350, 300, 250, 200, 150, 100, 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1, 0.09, 0.08, 0.07, 0.06, 0.05, 0.04, 0.03, 0.02, 0.01, 0.005, 0.002, 또는 0.001 nM 이하의 KD(그리고 선택적으로, 적어도 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1, 0.09, 0.08, 0.07, 0.06, 0.05, 0.04, 0.03, 0.02, 0.01, 0.005, 0.002, 또는 0.001 nM의 KD)로 그의 표적 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 0.001 nM 내지 500 nM, 예를 들어 0.1 nM 내지 5 nM, 예를 들어 약 0.5 nM의 KD로 그의 표적 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 적어도 500, 600, 700, 800, 900, 1000, 2000, 5000, 10,000, 또는 100,000 nM의 KD로 비표적 서열에 결합한다(그리고 선택적으로, 비표적 서열에 상당히 결합하지 않는다). 일부 구현예에서, 표적화 모이어티는 비표적 서열에 결합하지 않는다.
일부 구현예에서, 표적화 모이어티는 표적화된 성분, 예를 들어 표적 유전자, 예를 들어 MYC의 조절 요소(예를 들어, 프로모터 또는 인핸서)에 상보적인 핵산 서열을 포함한다. 일부 구현예에서, 표적화 모이어티는 표적화된 성분에 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 상보적인 핵산 서열을 포함한다.
일부 구현예에서, 표적화 모이어티는 CRISPR/Cas 도메인, TAL 이펙터 도메인, Zn 핑거 도메인, 또는 핵산 분자일 수 있거나 이를 포함할 수 있다.
일부 구현예에서, 발현 리프레서의 표적화 모이어티는 100, 90, 80, 70, 60, 50, 40, 30, 또는 20개 이하의 뉴클레오타이드(그리고 선택적으로, 적어도 10, 20, 30, 40, 50, 60, 70, 80, 또는 90개의 뉴클레오타이드)를 포함한다. 일부 구현예에서, 융합 분자의 발현 리프레서 또는 이펙터 모이어티는 2000, 1900, 1800, 1700, 1600, 1500, 1400, 1300, 1200, 1100, 1000, 900, 800, 700, 600, 500, 400, 300, 200, 또는 100개 이하의 아미노산(그리고 선택적으로, 적어도 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 또는 1900개의 아미노산)을 포함한다. 일부 구현예에서, 융합 분자의 발현 리프레서 또는 이펙터 모이어티는 100 내지 2000개, 100 내지 1900개, 100 내지 1800개, 100 내지 1700개, 100 내지 1600개, 100 내지 1500개, 100 내지 1400개, 100 내지 1300개, 100 내지 1200개, 100 내지 1100개, 100 내지 1000개, 100 내지 900개, 100 내지 800개, 100 내지 700개, 100 내지 600개, 100 내지 500개, 100 내지 400개, 100 내지 300개, 100 내지 200개, 200 내지 2000개, 200 내지 1900개, 200 내지 1800개, 200 내지 1700개, 200 내지 1600개, 200 내지 1500개, 200 내지 1400개, 200 내지 1300개, 200 내지 1200개, 200 내지 1100개, 200 내지 1000개, 200 내지 900개, 200 내지 800개, 200 내지 700개, 200 내지 600개, 200 내지 500개, 200 내지 400개, 200 내지 300개, 300 내지 2000개, 300 내지 1900개, 300 내지 1800개, 300 내지 1700개, 300 내지 1600개, 300 내지 1500개, 300 내지 1400개, 300 내지 1300개, 300 내지 1200개, 300 내지 1100개, 300 내지 1000개, 300 내지 900개, 300 내지 800개, 300 내지 700개, 300 내지 600개, 300 내지 500개, 300 내지 400개, 400 내지 2000개, 400 내지 1900개, 400 내지 1800개, 400 내지 1700개, 400 내지 1600개, 400 내지 1500개, 400 내지 1400개, 400 내지 1300개, 400 내지 1200개, 400 내지 1100개, 400 내지 1000개, 400 내지 900개, 400 내지 800개, 400 내지 700개, 400 내지 600개, 400 내지 500개, 500 내지 2000개, 500 내지 1900개, 500 내지 1800개, 500 내지 1700개, 500 내지 1600개, 500 내지 1500개, 500 내지 1400개, 500 내지 1300개, 500 내지 1200개, 500 내지 1100개, 500 내지 1000개, 500 내지 900개, 500 내지 800개, 500 내지 700개, 500 내지 600개, 600 내지 2000개, 600 내지 1900개, 600 내지 1800개, 600 내지 1700개, 600 내지 1600개, 600 내지 1500개, 600 내지 1400개, 600 내지 1300개, 600 내지 1200개, 600 내지 1100개, 600 내지 1000개, 600 내지 900개, 600 내지 800개, 600 내지 700개, 700 내지 2000개, 700 내지 1900개, 700 내지 1800개, 700 내지 1700개, 700 내지 1600개, 700 내지 1500개, 700 내지 1400개, 700 내지 1300개, 700 내지 1200개, 700 내지 1100개, 700 내지 1000개, 700 내지 900개, 700 내지 800개, 800 내지 2000개, 800 내지 1900개, 800 내지 1800개, 800 내지 1700개, 800 내지 1600개, 800 내지 1500개, 800 내지 1400개, 800 내지 1300개, 800 내지 1200개, 800 내지 1100개, 800 내지 1000개, 800 내지 900개, 900 내지 2000개, 900 내지 1900개, 900 내지 1800개, 900 내지 1700개, 900 내지 1600개, 900 내지 1500개, 900 내지 1400개, 900 내지 1300개, 900 내지 1200개, 900 내지 1100개, 900 내지 1000개, 1000 내지 2000개, 1000 내지 1900개, 1000 내지 1800개, 1000 내지 1700개, 1000 내지 1600개, 1000 내지 1500개, 1000 내지 1400개, 1000 내지 1300개, 1000 내지 1200개, 1000 내지 1100개, 1100 내지 2000개, 1100 내지 1900개, 1100 내지 1800개, 1100 내지 1700개, 1100 내지 1600개, 1100 내지 1500개, 1100 내지 1400개, 1100 내지 1300개, 1100 내지 1200개, 1200 내지 2000개, 1200 내지 1900개, 1200 내지 1800개, 1200 내지 1700개, 1200 내지 1600개, 1200 내지 1500개, 1200 내지 1400개, 1200 내지 1300개, 1300 내지 2000개, 1300 내지 1900개, 1300 내지 1800개, 1300 내지 1700개, 1300 내지 1600개, 1300 내지 1500개, 1300 내지 1400개, 1400 내지 2000개, 1400 내지 1900개, 1400 내지 1800개, 1400 내지 1700개, 1400 내지 1600개, 1400 내지 1500개, 1500 내지 2000개, 1500 내지 1900개, 1500 내지 1800개, 1500 내지 1700개, 1500 내지 1600개, 1600 내지 2000개, 1600 내지 1900개, 1600 내지 1800개, 1600 내지 1700개, 1700 내지 2000개, 1700 내지 1900개, 1700 내지 1800개, 1800 내지 2000개, 1800 내지 1900개, 또는 1900 내지 2000개의 아미노산을 포함한다.
본 명세서에 개시된 바와 같은 발현 리프레서 또는 시스템은 핵산, 예를 들어 하나 이상의 핵산을 포함할 수 있다. 용어 "핵산"은 올리고뉴클레오타이드 사슬 내로 도입되거나 도입될 수 있는 임의의 화합물을 지칭한다. 일부 구현예에서, 핵산은 포스포디에스테르 결합을 통해 올리고뉴클레오타이드 사슬 내로 도입되거나 도입될 수 있는 화합물 및/또는 물질이다. 맥락으로부터 명백한 바와 같이, 일부 구현예에서 "핵산"은 개별 핵산 잔기(예를 들어, 뉴클레오타이드 및/또는 뉴클레오시드)를 지칭하고; 일부 구현예에서, "핵산"은 개별 핵산 잔기들을 포함하는 올리고뉴클레오타이드 사슬을 지칭한다. 일부 구현예에서, "핵산"은 RNA이거나 이를 포함하고; 일부 구현예에서, "핵산"은 DNA이거나 이를 포함한다. 일부 구현예에서, 핵산은 50% 초과의 리보뉴클레오타이드이거나 이를 포함하고 본 명세서에서 리보핵산(RNA)으로 지칭된다. 일부 구현예에서, 핵산은 하나 이상의 천연 핵산 잔기이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 하나 이상의 핵산 유사체이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산 유사체는 포스포디에스테르 백본을 이용하지 않는다는 점에서 핵산과 상이하다. 예를 들어, 일부 구현예에서, 핵산은 하나 이상의 "펩타이드 핵산"이거나, 이를 포함하거나, 이로 구성되는데, 펩타이드 핵산은 당업계에 알려져 있고, 백본 내에 포스포디에스테르 결합 대신에 펩타이드 결합을 가지며, 본 발명의 범주 내에 있는 것으로 여겨진다. 대안적으로 또는 추가적으로, 일부 구현예에서, 핵산은 포스포디에스테르 결합 대신에 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포르아미다이트 결합을 갖는다. 일부 구현예에서, 핵산은 하나 이상의 천연 뉴클레오시드(예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시 구아노신, 및 데옥시시티딘)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 하나 이상의 뉴클레오시드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, C-5 프로피닐-시티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, 0(6)-메틸구아닌, 2-티오시티딘, 메틸화 염기, 삽입된 염기, 및 이들의 조합)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 천연 핵산 내의 것들과 비교할 때 하나 이상의 변형된 당(예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스)을 포함한다. 일부 구현예에서, 핵산은 기능성 유전자 산물, 예컨대 RNA 또는 단백질을 인코딩하는 뉴클레오타이드 서열을 갖는다. 일부 구현예에서, 핵산은 하나 이상의 인트론을 포함한다. 일부 구현예에서, 핵산은 천연 공급원로부터의 단리, 상보적 주형을 기반으로 한 중합에 의한 효소적 합성(생체내 또는 시험관내), 재조합 세포 또는 시스템에서의 재생산, 및 화학적 합성 중 하나 이상에 의해 제조된다. 본 명세서에 사용되는 바와 같이, 핵산을 기재하는 데 사용될 때 "재조합"은 자연적으로 발생하지 않는 임의의 핵산을 지칭한다. 일부 구현예에서, 핵산은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 20, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000개 또는 그 이상의 잔기 길이이다. 일부 구현예에서, 핵산은 약 2 내지 약 5000개의 뉴클레오타이드, 약 10 내지 약 100개의 뉴클레오타이드, 약 50 내지 약 150개의 뉴클레오타이드, 약 100 내지 약 200개의 뉴클레오타이드, 약 150 내지 약 250개의 뉴클레오타이드, 약 200 내지 약 300개의 뉴클레오타이드, 약 250 내지 약 350개의 뉴클레오타이드, 약 300 내지 약 500개의 뉴클레오타이드, 약 10 내지 약 1000개의 뉴클레오타이드, 약 50 내지 약 1000개의 뉴클레오타이드, 약 100 내지 약 1000개의 뉴클레오타이드, 약 1000 내지 약 2000개의 뉴클레오타이드, 약 2000 내지 약 3000개의 뉴클레오타이드, 약 3000 내지 약 4000개의 뉴클레오타이드, 약 4000 내지 약 5000개의 뉴클레오타이드 또는 그 사이의 임의의 범위의 길이를 가질 수 있다. 일부 구현예에서, 핵산은 부분적으로 또는 전적으로 단일 가닥이고; 일부 구현예에서, 핵산은 부분적으로 또는 전체적으로 이중 가닥이다. 일부 구현예에서, 핵산은, 폴리펩타이드를 인코딩하는 서열의 상보체이거나 폴리펩타이드를 인코딩하는 적어도 하나의 요소를 포함하는 뉴클레오타이드 서열을 갖는다. 일부 구현예에서, 핵산은 효소 활성을 갖는다.
일부 구현예에서, 표적화 모이어티는 핵산 서열, 단백질, 단백질 융합, 또는 막 전좌 폴리펩타이드이거나 이를 포함한다. 일부 구현예에서, 표적화 모이어티는 외인성 연접부 핵형성 분자, 연접부 핵형성 분자를 인코딩하는 핵산, 또는 폴리펩타이드를 표적화하는 서열의 융합체 및 연접부 핵형성 분자로부터 선택된다. 연접부 핵형성 분자는, 예를 들어 CTCF, 코헤신, USF1, YY1, TATA-박스 결합 단백질 연관 인자 3(TAF3), ZNF143 결합 모티프일 수 있다. 일부 구현예에서, 표적화 모이어티는 중합체 또는 중합체 모이어티, 예를 들어 뉴클레오타이드의 중합체(예컨대, 올리고뉴클레오타이드), 펩타이드 핵산, 펩타이드-핵산 믹스머(mixmer), 펩타이드 또는 폴리펩타이드, 폴리아미드, 탄수화물 등이거나 이를 포함한다.
일부 구현예에서, 표적화 모이어티는 핵산이거나 이를 포함한다. 일부 구현예에서, 이펙터 모이어티는 핵산이거나 이를 포함한다. 일부 구현예에서, 모이어티 내에 포함될 수 있는 핵산은 DNA, RNA, 및/또는 인공 또는 합성 핵산 또는 핵산 유사체 또는 모방체이거나 이를 포함할 수 있다. 예를 들어, 일부 구현예에서, 핵산은 게놈 DNA(gDNA), 상보적 DNA(cDNA), 펩타이드 핵산(PNA), 펩타이드-핵산 믹스머(mixmer), 펩타이드- 올리고뉴클레오타이드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체-형성 올리고뉴클레오타이드, 안티센스 올리고뉴클레오타이드, tRNA, mRNA, rRNA, miRNA, gRNA, siRNA 또는 기타 다른 RNAi 분자(예를 들어, 본 명세서에 기재된 바와 같은 비코딩 RNA를 표적화하고/하거나 본 명세서에 기재된 바와 같은 표적화된 게놈 복합체와 연관된 특정 유전자의 발현 산물을 표적화하는 것들) 등 중 하나 이상이거나 이를 포함할 수 있다. 조절제에서 사용하기에 적합한 핵산 서열은 변형된 올리고뉴클레오타이드(예를 들어, 화학적 변형, 예컨대 백본 결합, 당 분자, 및/또는 핵산 염기를 변경시키는 변형) 및/또는 인공 핵산을 포함할 수 있다. 일부 구현예에서, 핵산 서열은 게놈 DNA, cDNA, 펩타이드 핵산(PNA) 또는 펩타이드 올리고뉴클레오타이드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체 형성 올리고뉴클레오타이드, 변형된 DNA, 안티센스 DNA 올리고뉴클레오타이드, tRNA, mRNA, rRNA, 변형된 RNA, miRNA, gRNA, 및 siRNA 또는 기타 다른 RNA 또는 DNA 분자를 포함하지만 이로 한정되지 않는다. 일부 구현예에서, 핵산은 자연-발생 DNA 또는 RNA 잔기가 아닌 하나 이상의 잔기를 포함할 수 있고/있거나, 포스포디에스테르 결합이 아닌(예를 들어, 이를 테면 포스포로티오에이트 결합 등일 수 있는) 하나 이상의 결합을 포함할 수 있고/있거나, 예를 들어 2'O 변형, 예컨대 2'-OmeP와 같은 하나 이상의 변형을 포함할 수 있다. 합성 핵산을 제조하는 데 유용한 다양한 핵산 구조가 당업계에 알려져 있으며(예를 들어, WO2017/062862l 및 WO2014/012081 참조), 당업자는 이들이 본 개시내용에 따라 이용될 수 있음을 이해할 것이다.
핵산의 일부 예는 표적 유전자, 예를 들어 MYC에 혼성화하는 핵산(예를 들어, 본 명세서의 다른 곳에 기재된 바와 같은 gRNA 또는 안티센스 ssDNA), 외인성 핵산, 예컨대 바이러스 DNA 또는 RNA에 혼성화하는 핵산, RNA에 혼성화하는 핵산, 유전자 전사를 간섭하는 핵산, RNA 번역을 간섭하는 핵산, RNA를 안정화시키거나, 예컨대 분해에 대한 표적화를 통하여 RNA를 불안정화시키는 핵산, 및 발현 또는 기능의 간섭을 통한 DNA 또는 RNA 결합 인자를 간섭하는 핵산, 세포내 단백질 또는 단백질 복합체에 연결되어 기능을 조절하는 핵산 등을 포함할 수 있지만, 이에 제한되지 않는다.
일부 구현예에서, 발현 리프레서는 하나 이상의 뉴클레오사이드 유사체를 포함한다. 일부 구현예에서, 핵산 서열은 하나 이상의 천연 뉴클레오사이드, 뉴클레오사이드, 예를 들어 퓨린 또는 피리미딘, 예를 들어 아데닌, 시토신, 구아닌, 티민 및 우라실에 추가하여 또는 그에 대한 대안으로서 하나 이상의 뉴클레오시드 유사체를 포함할 수 있다. 일부 구현예에서, 핵산 서열은 하나 이상의 뉴클레오시드 유사체를 포함한다. 뉴클레오시드 유사체는 5-플루오로우라실; 5-브로모우라실, 5-클로로우라실, 5-요오도우라실, 하이포잔틴, 잔틴, 4-아세틸시토신, 4-메틸벤즈이미다졸, 5-(카르복시하이드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 디하이드로우라실, 디하이드로우리딘, 베타-D-갈락토실퀘오신, 이노신, N6-이소펜테닐아데닌, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3-메틸시토신, 5-메틸시토신, N6-아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 베타-D-만노실퀘오신, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 2-메틸티오-N6-이소펜테닐아데닌, 우라실-5-옥시아세트산(v), 위부톡소신(wybutoxosine), 슈도우라실, 퀘오신, 2-티오시토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥시아세트산 메틸에스테르, 우라실-5-옥시아세트산(v), 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, (acp3)w, 2,6-디아미노퓨린, 3-니트로피롤, 이노신, 티오우리딘, 퀘우오신, 위오신, 디아미노퓨린, 이소구아닌, 이소시토신, 디아미노피리미딘, 2,4-디플루오로톨루엔, 이소퀴놀린, 피롤로[2,3-β]피리딘과 같은 뉴클레오시드 유사체, 및 퓨린 또는 피리미딘 측쇄와 염기쌍을 형성할 수 있는 임의의 기타 다른 물질을 포함할 수 있지만 이로 한정되지 않는다.
CRISPR/Cas 도메인
일부 구현예에서, 표적화 모이어티는 CRISPR/Cas 도메인이거나 이를 포함한다. CRISPR/Cas 단백질은 CRISPR/Cas 이펙터 및 선택적으로 하나 이상의 다른 도메인을 포함할 수 있다. CRISPR/Cas 도메인은 통상적으로 클러스터화된 규칙적으로 사이 공간을 둔 짧은 회문성 반복(clustered regulatory interspaced short palindromic repeat; CRISPR) 시스템에 관여하는 단백질, 예를 들어 Cas 단백질과 구조적 및/또는 기능적 유사성을 갖는다. CRISPR/Cas 도메인은 선택적으로 가이드 RNA, 예를 들어 단일 가이드 RNA(sgRNA)를 포함한다. 일부 구현예에서, CRISPR/Cas 도메인에 포함된 gRNA는 CRISPR/Cas 도메인에 의해 비공유적으로 결합된다.
CRISPR 시스템은 원래 박테리아 및 고세균에서 발견된 적응 방어 시스템이다. CRISPR 시스템은 CRISPR-연관 또는 "Cas" 엔도뉴클레아제(예를 들어, Cas9 또는 Cpf1)로 지칭되는 RNA-유도 뉴클레아제를 사용하여 외래 DNA를 절단한다. 예를 들어, 통상적인 CRISPR/Cas 시스템에서, 엔도뉴클레아제는 단일- 또는 이중-가닥 DNA 서열을 표적화하는 서열-특이적, 비-코딩 "가이드 RNA"에 의해 표적 뉴클레오타이드 서열(예를 들어, 서열-편집할 게놈 내의 부위)로 지시된다. CRISPR 시스템의 3가지 클래스(I 내지 III)가 확인되었다. 부류 II CRISPR 시스템은 (다수의 Cas 단백질이 아닌) 단일의 Cas 엔도뉴클레아제를 사용한다. 하나의 부류 II CRISPR 시스템은 II형 Cas 엔도뉴클레아제, 예컨대 Cas9, CRISPR RNA("crRNA"), 및 트랜스-활성화 crRNA("tracrRNA")를 포함한다. crRNA는 통상적으로 표적 DNA 서열에 상응하는 약 20개 뉴클레오타이드 RNA 서열인 "가이드 RNA"를 포함한다. crRNA는 또한 tracrRNA에 결합하여 Rnase III에 의해 절단되는 부분적으로 이중 가닥인 구조를 형성하여 crRNA/tracrRNA 하이브리드를 생성하는 영역을 포함한다. 그 다음 crRNA/tracrRNA 하이브리드는 Cas9 엔도뉴클레아제가 표적 DNA 서열을 인식하고 절단하도록 지시한다. 표적 DNA 서열은 일반적으로 주어진 Cas 엔도뉴클레아제에 특이적인 "프로토스페이서 인접 모티프"(protospacer adjacent motif; "PAM")에 인접하여야 하지만; PAM 서열은 주어진 게놈 전체에 걸쳐 나타난다. 다양한 원핵생물 종으로부터 확인된 CRISPR 엔도뉴클레아제는 고유한 PAM 서열 요건을 가지며; PAM 서열의 예로는 5'-NGG(스트렙토코커스 피오게네스(Streptococcus pyogenes)), 5'-NNAGAA(스트렙토코커스 써모필루스(Streptococcus thermophilus) CRISPR1), 5'-NGGNG(스트렙토코커스 써모필루스 CRISPR3), 및 5'-NNNGATT(네이세리아 메닝지디티스(Neisseria meningiditis))가 있다. 일부 엔도뉴클레아제, 예를 들어 Cas9 엔도뉴클레아제는 G-풍부 PAM 부위, 예를 들어 5'-NGG와 회합되며, PAM 부위(이로부터 5')로부터 3개 뉴클레오타이드 상류의 위치에서 표적 DNA의 평활-말단(blunt-end) 절단을 수행한다. 또 다른 부류 II CRISPR 시스템은 Cas9보다 더 작은 V형 엔도뉴클레아제 Cpf1을 포함하며; 예는 AsCpf1(아시드아미노코커스(Acidaminococcus) 종 유래) 및 LbCpf1(라크노스피라세아에(Lachnospiraceae) 종 유래)을 포함한다. Cpf1-연관 CRISPR 어레이는 tracrRNA의 필요 없이 성숙한 crRNA로 처리되며; 즉, Cpf1 시스템은 표적 DNA 서열을 절단하기 위해 Cpf1 뉴클레아제 및 crRNA만을 필요로 한다. Cpf1 엔도뉴클레아제는 T-풍부 PAM 부위, 예를 들어 5'-TTN과 회합된다. Cpf1은 또한 5'-CTA PAM 모티프를 인식할 수 있다. Cpf1은 4- 또는 5-뉴클레오타이드 5' 오버행(overhang)을 갖는 오프셋 또는 엇갈린 이중 가닥 파손을 도입함으로써, 예를 들어 코딩 가닥 상에서 PAM 부위로부터(이의 3'로부터) 18개 뉴클레오타이드 하류, 및 상보적 가닥 상에서 PAM 부위로부터 23개 뉴클레오타이드 하류에 위치한 5-뉴클레오타이드 오프셋 또는 엇갈린 절단물을 갖는 표적 DNA를 절단하며; 그러한 오프셋 절단으로 인한 5-뉴클레오타이드 오버행은 평활 말단 절단된 DNA에서의 삽입에 의한 것보다는, 상동성 재조합에 의한 DNA 삽입에 의해 더 정확한 유전체 편집을 가능하게 한다. 예를 들어 문헌[Zetsche et al. (2015) Cell, 163:759 - 771]을 참조한다.
다양한 CRISPR 연관(Cas) 유전자 또는 단백질이 본 개시내용에 의해 제공되는 기술에 사용될 수 있으며, Cas 단백질의 선택은 본 방법의 특정 조건에 따라 달라질 것이다. Cas 단백질의 특정 예는 Cas1, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Cpf1, C2C1, 또는 C2C3을 포함하는 클래스 II 시스템을 포함한다. 일부 구현예에서, Cas 단백질, 예를 들어 Cas9 단백질은 다양한 원핵생물 종들 중 임의의 것으로부터 유래될 수 있다. 일부 구현예에서, 특정 Cas 단백질, 예를 들어 특정 Cas9 단백질은 특정 프로토스페이서-인접 모티프(PAM) 서열을 인식하도록 선택된다. 일부 구현예에서, DNA-표적화 도메인은 서열 표적화 폴리펩타이드, 예컨대 Cas 단백질, 예를 들어 Cas9를 포함한다. 특정 구현예에서, Cas 단백질, 예를 들어 Cas9 단백질은 박테리아 또는 고세균으로부터 수득되거나, 또는 알려진 방법을 사용하여 합성될 수 있다. 특정 구현예에서, Cas 단백질은 그람-양성 박테리아 또는 그람-음성 박테리아에서 유래할 수 있다. 특정 구현예에서, Cas 단백질은 스트렙토코커스(예를 들어, S. 피오게네스, 또는 S. 써모필루스), 프란시셀라(Francisella)(예를 들어, F. 노비시다(novicida)), 스타필로코커스(예를 들어, S. 아우레우스(aureus)), 아시다미노코커스(예를 들어, 아시다미노코커스 BV3L6), 네이세리아(예를 들어, N. 메닝지티디스), 크립토코커스, 코리네박테리움, 헤모필루스(Haemophilus), 유박테리움(Eubacterium), 파스퉤렐라(Pasteurella), 프레보텔라(Prevotella), 베일로넬라(Veillonella), 또는 마리노박터(Marinobacter)에서 유래할 수 있다.
일부 구현예에서, Cas 단백질은 Cas 단백질이 결합 및/또는 기능하기 위한 표적 DNA 서열에 존재하거나 이에 인접하기 위해 프로토스페이서 인접 모티프(PAM)를 필요로 한다. 일부 구현예에서, PAM은 5'에서 3'으로 NGG, YG, NNGRRT, NNNRRT, NGA, TYCV, TATV, NTTN, 또는 NNNGATT이거나, 이를 포함하며, 여기서 N은 임의의 뉴클레오타이드를 나타내고, Y는 C 또는 T를 나타내고, R은 A 또는 G를 나타내고, V는 A 또는 C 또는 G를 나타낸다. 일부 구현예에서, Cas 단백질은 표 1에 열거된 단백질이다, 일부 구현예에서, Cas 단백질은 그의 PAM을 변경하는 하나 이상의 돌연변이를 포함한다 일부 구현예에서, Cas 단백질은 E1369R, E1449H, 및 R1556A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 E782K, N968K, 및 R1015H 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 D1135V, R1335Q, 및 T1337R 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 S542R 및 K607R 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 S542R, K548V, 및 N552R 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
명칭 | 효소 | 종 | Aas의 수 | PAM | PAM 인식을 변경시키기 위한 돌연변이 | 촉매적으로 사멸되게(catalytically dead) 하기 위한 돌연변이 |
FnCas9 | Cas9 | 프란시셀라 노비시다 | 1629 | 5'-NGG-3' | Wt | D11A/H969A/N995A |
FnCas9 RHA | Cas9 | 프란시셀라 노비시다 | 1629 | 5'-YG-3' | E1369R/E1449H/R1556A | D11A/H969A/N995A |
SaCas9 | Cas9 | 스타필로코커스 아우레우스 | 1053 | 5'-NNGRRT-3' | Wt | D10A/H557A |
SaCas9 KKH | Cas9 | 스타필로코커스 아우레우스 | 1053 | 5'-NNNRRT-3' | E782K/N968K/R1015H | D10A/H557A |
SpCas9 | Cas9 | 스트렙토코커스 피오게네스 | 1368 | 5'-NGG-3' | Wt | D10A/D839A/H840A/N863A |
SpCas9 VQR | Cas9 | 스트렙토코커스 피오게네스 | 1368 | 5'-NGA-3' | D1135V/R1335Q/T1337R | D10A/D839A/H840A/N863A |
AsCpf1 RR | Cpf1 | 아시다미노코커스 종 BV3L6 | 1307 | 5'-TYCV-3' | S542R/K607R | E993A |
AsCpf1 RVR | Cpf1 | 아시다미노코커스 종 BV3L6 | 1307 | 5'-TATV-3' | S542R/K548V/N552R | E993A |
FnCpf1 | Cpf1 | 프란시셀라 노비시다 | 1300 | 5'-NTTN-3' | Wt | D917A/E1006A/D1255A |
NmCas9 | Cas9 | 네이세리아 메닝지디티스 | 1082 | 5'-NNNGATT-3' | Wt | D16A/D587A/H588A/N611A |
일부 구현예에서, Cas 단백질은 뉴클레아제, 예를 들어 뉴클레아제-결핍 Cas를 탈활성화하도록 변형된다. 일부 구현예에서, Cas 단백질은 Cas9 단백질이다. 야생형 Cas9는 gRNA에 의해 표적화된 특이적인 DNA 서열에서 이중 가닥 파손(DSB)을 생성하는 반면, 변형된 기능기를 갖는 다수의 CRISPR 엔도뉴클레아제가 이용가능하며, 예를 들어, Cas9의 "닉카제" 형태는 단일-가닥 파손만을 생성하고; 촉매적으로 비활성인 Cas9("dCas9")는 표적 DNA를 절단하지 않는다. 일부 구현예에서, DNA 서열에 결합하는 dCas는 입체 장애에 의해 그 부위에서 전사를 방해할 수 있다. 일부 구현예에서, DNA-표적화 모이어티는 촉매적으로 비활성인 Cas, 예를 들어 dCas이거나 이를 포함한다. 많은 촉매적으로 비활성인 Cas 단백질이 당업계에 알려져 있다. 일부 구현예에서, dCas9는 Cas 단백질의 각 엔도뉴클레아제 도메인 내의 돌연변이, 예를 들어 D10A 및 H840A 돌연변이를 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D11A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H969A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 N995A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D11A, H969A, 및 N995A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D10A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H557A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D10A 및 H557A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D839A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H840A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 N863A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D10A, D839A, H840A, 및 N863A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 E993A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D917A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 E1006A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D1255A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D917A, E1006A, 및 D1255A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D16A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D587A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H588A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 N611A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D16A, D587A, H588A, 및 N611A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
또 다른 양태에서, 본 개시내용은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 발현 리프레서 또는 폴리펩타이드에 관한 것이며, 여기서 하나 이상의 표적화 모이어티는 Cas 단백질, 예를 들어 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9, 또는 이의 기능성 변이체 또는 단편을 포함하는 CRISPR/Cas 도메인이거나 이를 포함한다. 일부 구현예에서, dCas9는 서열번호 17의 아미노산 서열을 포함한다:
일부 구현예에서, dCas9는 서열번호 50의 핵산 서열에 의해 인코딩된다:
일부 구현예에서, 표적화 모이어티는 gRNA를 포함하거나 이에 (예를 들어, 공유적으로) 연결된 Cas 도메인을 포함할 수 있다. gRNA는 Cas-단백질 결합에 필요한 "스캐폴드" 서열, 및 게놈 표적을 위한 사용자-정의된 약 20개의 뉴클레오타이드 표적화 서열로 구성되는 짧은 합성 RNA이다. 실제로, 가이드 RNA 서열은 17 내지 24개의 뉴클레오타이드(예를 들어, 19, 20, 또는 21개의 뉴클레오타이드) 길이를 갖고 표적화된 핵산 서열에 상보적이 되도록 일반적으로 설계된다. 효과적인 가이드 RNA의 설계에 사용하기 위한 맞춤형 gRNA 생성기 및 알고리즘이 상업적으로 구매 가능하다. 유전자 편집은 또한, 자연 발생 crRNA-tracrRNA 복합체를 모방하고 tracrRNA(뉴클레아제에 결합하기 위함) 및 적어도 하나의 crRNA(뉴클레아제를 편집을 위해 표적화된 서열로 가이드함) 둘 다를 함유하는 엔지니어링된(합성) 단일 RNA 분자인, 키메라 "단일 가이드 RNA"("sgRNA")를 사용하여 달성되었다. 화학적으로 변형된 sgRNA가 또한 Cas 단백질과 함께 사용하기에 효과적인 것으로 입증되었으며; 예를 들어, 문헌[Hendel et al. (2015) Nature Biotechnol., 985 - 991]을 참조한다. 예시적인 가이드 RNA 서열은 표 2 및 표 13에 개시되어 있다.
일부 구현예에서, gRNA는 표적 유전자와 연관된 DNA 서열에 상보적인 핵산 서열을 포함한다. 일부 구현예에서, DNA 서열은 표적 유전자에 작동가능하게 연결된 발현 제어 요소이거나, 이를 포함하거나, 이와 중첩된다. 일부 구현예에서, gRNA는 표적 유전자와 연관된 DNA 서열에 적어도 90, 95, 99, 또는 100% 상보적인 핵산 서열을 포함한다. 일부 구현예에서, Cas 분자를 포함하는 DNA-표적화 모이어티와 함께 사용하기 위한 gRNA는 sgRNA이다.
일부 구현예에서, CRISPR/Cas 도메인과 함께 사용하기 위한 gRNA는 CTCF와 연관된 표적 서열에 특이적으로 결합한다. 일부 구현예에서, CRISPR/Cas 도메인과 함께 사용하기 위한 gRNA는 프로모터와 연관된 표적 서열에 특이적으로 결합한다. 일부 구현예에서, gRNA는 표 2 또는 표 13에 열거된 표적 서열에 결합한다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 표 2 또는 표 13에 열거된 표적 서열에 결합한다.
가이드 명칭 | 표적 부위 | 표적 서열 | 게놈 좌표 | 가닥 |
GD-28616 | CTCF | ATGATCTCTGCTGCCAGTAG (서열번호 1) | chr8:128746342-128746364 | + |
GD-28859 | CTCF | ATCGCGCCTGGATGTCAACG (서열번호 2) | chr8:128746321-128746343 | - |
GD-28862 | CTCF | ATTGTGCAGTGCATCGGATT (서열번호 3) | chr8:128746525-128746547 | + |
GD-28617 | 프로모터 | GTCAAACAGTACTGCTACGG (서열번호 4) | chr8:128748014-128748036 | + |
일부 구현예에서, 발현 억제 시스템은 제1 DNA-표적화 모이어티를 포함하는 제1 발현 리프레서 및 제2 DNA-표적화 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 DNA-표적화 모이어티는 제1 CRISPR/Cas 도메인이거나 이를 포함하고, 제2 DNA-표적화 모이어티는 제2 CRISPR/Cas 도메인이거나 이를 포함한다. 일부 구현예에서, 제1 CRISPR/Cas 도메인은 제1 CRISPR/Cas 단백질 및 제1 가이드 RNA를 포함하고, 제2 CRISPR/Cas 도메인은 제2 CRISPR/Cas 단백질 및 제2 가이드 RNA를 포함한다. 일부 구현예에서, 제1 CRISPR/Cas 단백질은 제2 가이드 RNA에 별로 결합하지 않으며(이것에 결합하지 않으며), 예를 들어 적어도 10, 20, 50, 100, 1000, 또는 10,000 nM의 KD로 결합하고, 제2 CRISPR/Cas 단백질은 제1 가이드 RNA에 별로 결합하지 않으며(예를 들어, 결합하지 않으며), 예를 들어 적어도 10, 20, 50, 100, 1000, 또는 10,000 nM의 KD로 결합한다.
TAL 이펙터 도메인
일부 구현예에서, DNA-표적화 모이어티는 TAL 이펙터 도메인이거나 이를 포함한다. TAL 이펙터 도메인, 예를 들어 DNA 서열에 특이적으로 결합하는 TAL 이펙터 도메인은 복수의 TAL 이펙터 반복부 또는 이의 단편들을 포함하고, 선택적으로 자연 발생 TAL 이펙터 반복부의 하나 이상의 추가의 부분(예를 들어, 복수의 TAL 이펙터 도메인들의 N- 및/또는 C-말단)을 포함하며, 여기서 각 TAL 이펙터 반복부는 뉴클레오타이드를 인식한다. TAL 이펙터 단백질은 TAL 이펙터 도메인 및 선택적으로 하나 이상의 다른 도메인을 포함할 수 있다. 많은 TAL 이펙터 도메인이 당업자에게 알려져 있으며, 예를 들어 Thermo Fisher Scientific으로부터 상업적으로 구매 가능하다.
TALE는 숙주 식물에서의 유전자 발현을 조절하고, 박테리아 콜로니화 및 생존을 용이하게 하는 식물 병원체 잔토모나스(Xanthomonas)를 포함하는 박테리아성 병원체의 다양한 종에 의해 분비된 천연 이펙터 단백질이다. TAL 이펙터의 특이적 결합은 통상적으로 33 또는 34개의 아미노산의 나란히 정렬된 거의 동일한 반복부들의 중심 반복 도메인을 기준으로 한다(반복부-가변 이(di)-잔기, RVD 도메인).
TAL 이펙터 패밀리의 구성원들은 그들의 반복부들의 수와 순서에서 주로 상이하다. 반복부들의 수는 1.5 내지 33.5개의 반복부 범위이며, C-말단 반복부는 보통 길이가 더 짧고(예를 들어, 약 20개 아미노산), 일반적으로 "절반-반복부"로서 지칭된다. TAL 이펙터의 각 반복부는 상이한 염기쌍 특이성을 나타내는 상이한 반복부 유형과 하나의 반복-대-하나의 염기쌍 상관관계를 특징으로 한다(하나의 반복부는 표적 유전자 서열 상에서 하나의 염기쌍을 인식함). 일반적으로, 반복부의 수가 더 적을수록, 단백질-DNA 상호작용은 더 약해진다. 다수의 6.5개 반복부는 리포터 유전자의 전사를 활성화하기에 충분한 것으로 나타났다(Scholze et al., 2010).
반복부 대 반복부 변이는 아미노산 위치 12 및 13에서 주로 발생하며, 따라서 이는 "초가변"으로 지칭되고, 표적 DNA 프로모터 서열과의 상호작용의 특이성을 담당하며, 이는 예시적인 반복부 가변 이-잔기(RVD) 및 이들의 핵산 염기 표적에 대한 상동성을 열거한 표 3에 나타낸 바와 같다.
표적 | 가능한 RVD 아미노산 조합 | ||||||||||||
A | NI | NN | CI | HI | KI | ||||||||
G | NN | GN | SN | VN | LN | DN | QN | EN | HN | RH | NK | AN | FN |
C | HD | RD | KD | ND | AD | ||||||||
T | NG | HG | VG | IG | EG | MG | YG | AA | EP | VA | QG | KG | RG |
이에 따라, TAL 이펙터의 반복부를 표적 특이적 DAN 서열로 변형하는 것이 가능하다. 추가의 연구는, RVD NK가 G를 표적화할 수 있음을 나타내었다. TAL 이펙터의 표적 부위는 또한 제1 반복부에 의해 표적화되는 5' 염기에 측접하는 T를 포함하는 경향도 있지만, 이러한 인식의 정확한 기작은 알려지지 않다. 113개가 넘는 TAL 이펙터 서열이 오늘날까지 알려져 있다. 잔토모나스로부터의 TAL 이펙터의 비제한적 예는 Hax2, Hax3, Hax4, AvrXa7, AvrXa10 및 AvrBs3를 포함한다.
이에 따라, 본 개시내용의 TAL 이펙터 도메인의 TAL 이펙터 반복부는 임의의 박테리아 종(예를 들어, 잔토모나스 종, 예컨대 아프리카 균주인, 잔토모나스 오리제 pv. 오리제(Xanthomonas oryzae pv. Oryzae)(Yu et al. 2011), 잔토모나스 캄페스트리스 pv. 라파니(Xanthomonas campestris pv. raphani) 균주 756C 및 잔토모나스오리제 pv. 오리지콜라(Xanthomonas oryzae pv. oryzicola) 균주 BLS256(Bogdanove et al. 2011)으로부터의 TAL 이펙터로부터 유래될 수 있다. 본 명세서에 사용되는 바와 같이, 본 개시내용에 따른 TAL 이펙터 도메인은 RVD 도메인뿐만 아니라 자연 발생 TAL 이펙터로부터의 측접 서열(들)(RVD 도메인의 N-말단 및/또는 C-말단 측부 상에서의 서열)도 포함한다. 이는 자연 발생 TAL 이펙터 도메인의 RVD보다 더 많거나 더 적은 반복부들을 포함할 수 있다. 본 개시내용의 TAL 이펙터 도메인은 상기 코드를 기반으로 한 소정의 DNA 서열 및 당업계에 알려진 다른 것들을 표적화하도록 설계된다. TAL 이펙터 반복부의 수(예를 들어, 단량체 또는 모듈) 및 그의 특이적 서열은 원하는 DNA 표적 서열을 기반으로 하여 선택된다. 예를 들어, TAL 이펙터 반복부는 특이적 표적 서열에 맞도록 제거 또는 부가될 수 있다. 일 구현예에서, 본 개시내용의 TAL 이펙터 도메인은 6.5 내지 33.5개의 TAL 이펙터 반복부를 포함한다. 일 구현예에서, 본 개시내용의 TAL 이펙터 도메인은 8 내지 33.5개의 TAL 이펙터 반복부, 예를 들어 10 내지 25개의 TAL 이펙터 반복부, 예를 들어 10 내지 14개의 TAL 이펙터 반복부를 포함한다.
일부 구현예에서, TAL 이펙터 도메인은 DNA 표적 서열에 대한 완전한 매치에 상응하는 TAL 이펙터 반복부를 포함한다. 일부 구현예에서, DNA 표적 서열 상에서 반복부와 표적 염기쌍 사이의 미스매치는 TAL 이펙터 도메인을 포함하는 발현 억제 시스템, 예를 들어 발현 리프레서의 기능을 가능하게 하는 한 허용된다. 일반적으로, TALE 결합은 미스매치의 수와 역의 상관관계를 갖는다. 일부 구현예에서, 본 개시내용의 발현 리프레서의 TAL 이펙터 도메인은 표적 DNA 서열과, 7개의 미스매치, 6개의 미스매치, 5개의 미스매치, 4개의 미스매치, 3개의 미스매치, 2개의 미스매치, 또는 1개의 미스매치 이하를 포함하고, 선택적으로는 미스매치가 없다. 이론에 의해 구애되고자 함이 없이, 일반적으로 TAL 이펙터 도메인 내 TAL 이펙터 반복부의 수가 더 적을수록, 더 적은 수의 미스매치가 용인될 것이고, TAL 이펙터 도메인을 포함하는 발현 억제 시스템, 예를 들어 발현 리프레서의 기능을 여전히 허용할 것이다. 결합 친화도는 매칭되는 반복부-DNA 조합의 합에 따라 달라지는 것으로 생각된다. 예를 들어, 25개 이상의 TAL 이펙터 반복부를 갖는 TAL 이펙터 도메인은 최대 7개의 미스매치를 용인할 수 있다.
TAL 이펙터 반복부에 더하여, 본 개시내용의 TAL 이펙터 도메인은 자연 발생 TAL 이펙터로부터 유래된 추가의 서열들을 포함할 수 있다. TAL 이펙터 도메인의 TAL 이펙터 반복부의 각각의 측면에 포함된 C-말단 및/또는 N-말단 서열(들)의 길이는 다양할 수 있으며, 예를 들어 문헌[Zhang et al. (2011)]의 연구를 기반으로 하여 당업자에 의해 선택될 수 있다. 상기 문헌[Zhang et al.]은 Hax3 유래된 TAL-이펙터를 기반으로 한 단백질에서 많은 C-말단 및 N-말단 절단 돌연변이체를 특성화하였으며, 표적 서열에 대한 최적 결합 및 이에 따라 전사 활성화에 기여하는, 주요 요소를 확인하였다. 일반적으로, 전사 활성은 N-말단의 길이와 역의 상관관계에 있는 것으로 밝혀졌다. C-말단에 대하여, Hax 3 서열의 최초 68개 아미노산 내 DNA 결합 잔기에 중요한 요소가 확인되었다. 이에 따라 일부 구현예에서, 자연 발생 TAL 이펙터의 TAL 이펙터 반복부의 C-말단부 상에서 최초 68개 아미노산은 본 개시내용의 발현 리프레서의 TAL 이펙터 도메인 내에 포함된다. 따라서, 일 구현예에서 본 개시내용의 TAL 이펙터 도메인은 1) 자연 발생 TAL 이펙터로부터 유래된 하나 이상의 TAL 이펙터 반복부; 2) TAL 이펙터 반복부의 N-말단부에 대한 자연 발생 TAL 이펙터로부터 적어도 70, 80, 90, 100, 110, 120, 130, 140, 150, 170, 180, 190, 200, 220, 230, 240, 250, 260, 270, 280개 이상의 아미노산; 및/또는 3) TAL 이펙터 반복부의 C-말단부 상에서 자연 발생 TAL 이펙터로부터의 적어도 68, 80, 90, 100, 110, 120, 130, 140, 150, 170, 180, 190, 200, 220, 230, 240, 250, 260개 이상의 아미노산을 포함한다.
일부 구현예에서, 조절제는 조작된 DNA 결합 도메인(DBD)을 포함하는 표적화 모이어티, 예를 들어 표적 서열, 예를 들어 표적 유전자(예를 들어, MYC)에 작동가능하게 연결된 프로모터 또는 전사 개시 부위(TSS) 서열, 전사 조절 요소에 근접한 서열, 예를 들어 표적 유전자(예를 들어, MYC)를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열, 예를 들어 앵커 서열에 근접한 서열에 결합하는 TAL 이펙터 반복부를 포함하는 TAL 이펙터를 포함한다. 일부 구현예에서, TAL 이펙터 도메인은 후성유전학적 이펙터 모이어티를 표적 부위로 운반하도록 조작될 수 있다.
Zn 핑거 도메인
일부 구현예에서, DNA-표적화 모이어티는 Zn 핑거 도메인이거나 이를 포함한다. Zn 핑거 도메인은 Zn 핑거, 예를 들어 자연 발생 Zn 핑거 또는 조작된 Zn 핑거, 또는 이의 단편을 포함한다. 많은 Zn 핑거가 당업자에게 알려져 있으며, 예를 들어 Sigma-Aldrich로부터 상업적으로 구매 가능하다. 일반적으로, Zn 핑거 도메인은 복수의 Zn 핑거를 포함하며, 여기서 각 Zn 핑거는 3개의 뉴클레오타이드를 인식한다. Zn 핑거 단백질은 Zn 핑거 도메인 및 선택적으로 하나 이상의 다른 도메인을 포함할 수 있다.
일부 구현예에서, Zn 핑거 도메인은, 선택된 표적 DNA 서열에 결합하도록 조작된, 비자연 발생 Zn 핑거 단백질을 포함한다. 예를 들어, 그 전체가 본 명세서에 참조로 포함된, 문헌[Beerli, et al. (2002) Nature Biotechnol. 20:135-141]; 문헌[Pabo, et al. (2001) Ann. Rev. Biochem. 70:313-340]; 문헌[Isalan, et al. (2001) Nature Biotechnol. 19:656-660]; 문헌[Segal, et al. (2001) Curr. Opin. Biotechnol. 12:632-637]; 문헌[Choo, et al. (2000) Curr. Opin. Struct. Biol. 10:411-416]; 미국 특허 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273; 및 미국 특허 공개 2005/0064474; 2007/0218528; 2005/0267061을 참조한다.
조작된 Zn 핑거는, 자연 발생 Zn 핑거와 비교하여, 새로운 결합 특이성을 가질 수 있다. 조작 방법은 합리적 설계(rational design) 및 다양한 유형의 선택을 포함하지만 이로 한정되지 않는다. 합리적 설계는, 예를 들어 삼중자(또는 사중자) 뉴클레오타이드 서열 및 개별적인 Zn 핑거 아미노산 서열을 포함하는 데이터베이스의 사용을 포함하며, 여기서 각각의 삼중자 또는 사중자 뉴클레오타이드 서열은, 특정 삼중자 또는 사중자 서열에 결합하는 징크 핑거의 아미노산 서열 하나 이상과 회합된다. 예를 들어, 그 전체가 본 명세서에 참조로 포함된, 미국 특허 6,453,242 및 6,534,261을 참조한다.
파지 디스플레이 및 2-하이브리드 시스템을 포함하여 예시적인 선택 방법이 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 국제 특허 공개 WO 98/37186; WO 98/53057; WO 00/27878; 및 WO 01/88197 및 GB 2,338,237에 개시되어 있다. 추가의 징크 핑거 단백질에 대한 결합 특이성의 향상은, 예를 들어 국제 특허 공개 WO 02/077227에 기재되어 있다.
추가적으로, 이들 및 기타 참고 문헌에 개시된 바와 같이, 징크 핑거 및/또는 다중-핑거의 징크 핑거 도메인은 임의의 적합한 링커 서열을 함께 사용하여 연결될 수 있으며, 이는 예를 들어 길이가 5개 이상의 아미노산인 링커를 포함한다. 또한, 길이가 6개 이상의 아미노산인 예시적인 링커 서열에 대해 미국 특허 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본 명세서에 기재된 단백질은 단백질의 개별적인 징크 핑거들간에 적합한 링커의 임의의 조합을 포함할 수 있다. 추가적으로, 징크 핑거 결합 도메인에 대한 결합 특이성의 향상은, 예를 들어 공동 소유된 국제 특허 공개 WO 02/077227에 기재되어 있다.
Zn 핑거 및 융합 단백질의 설계 및 구축 방법(및 이를 인코딩하는 폴리뉴클레오타이드)는 당업자에게 알려져 있으며, 미국 특허 6,140,0815; 789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 및 6,200,759; 국제 특허 공개 WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536; 및 WO 03/016496에 상세하게 기재되어 있다.
특정 구현예에서, DNA-표적화 모이어티는 표적 DNA 서열에 (서열-특이적 방식으로) 결합하는 조작된 징크 핑거를 포함하는 Zn 핑거 도메인을 포함한다. 일부 구현예에서, Zn 핑거 도메인은 하나의 Zn 핑거 또는 이의 단편을 포함한다. 일부 구현예에서, Zn 핑거 도메인은 복수의 Zn 핑거(또는 이의 단편), 예를 들어, 2, 3, 4, 5, 6개 이상의 Zn 핑거(및 선택적으로 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 또는 2 이하의 Zn 핑거)를 포함한다. 일부 구현예에서, Zn 핑거 도메인은 적어도 3개의 Zn 핑거를 포함한다. 일부 구현예에서, Zn 핑거 도메인은 4, 5, 또는 6개의 Zn 핑거를 포함한다. 일부 구현예에서, Zn 핑거 도메인은 8, 9, 10, 11 또는 12개의 Zn 핑거를 포함한다. 일부 구현예에서, 3개의 Zn 핑거를 포함하는 Zn 핑거 도메인은 9 또는 10개의 뉴클레오타이드를 포함하는 표적 DNA 서열을 인식한다. 일부 구현예에서, 4개의 Zn 핑거를 포함하는 Zn 핑거 도메인은 12 내지 14개의 뉴클레오타이드를 포함하는 표적 DNA 서열을 인식한다. 일부 구현예에서, 6개의 Zn 핑거를 포함하는 Zn 핑거 도메인은 18 내지 21개의 뉴클레오타이드를 포함하는 표적 DNA 서열을 인식한다.
일부 구현예에서, 표적화 도메인은 양손(two-handed) Zn 핑거 단백질을 포함한다. 양손 징크 핑거 단백질은, 징크 핑거의 2개의 클러스터가 개재하는 아미노산들에 의해 분리되어, 2개의 징크 핑거 도메인이 2개의 불연속적인 표적 DNA 서열에 결합되도록 하는 단백질들이다. 징크 핑거 결합 단백질의 양손 유형의 예는 SIP1며, 여기서 4개의 징크 핑거의 클러스터는 단백질의 아미노 말단에 위치되고, 3개의 Zn 핑거의 클러스터는 카르복실 말단에 위치한다(문헌[Remade, et al. (1999) EMBO Journal 18(18):5073-5084] 참조). 이들 도메인의 징크 핑거의 각 클러스터는 독특한 표적 서열에 결합할 수 있고, 2개의 표적 서열 사이의 간격은 많은 뉴클레오타이드를 포함할 수 있다.
일부 구현예에서, 발현 리프레서는 조작된 DNA 결합 도메인(DBD)을 포함하는 표적화 모이어티, 예를 들어 표적 서열, 예를 들어 표적 유전자(예를 들어, MYC)에 작동가능하게 연결된 프로모터 또는 전사 개시 부위(TSS) 서열, 전사 조절 요소에 근접한 서열, 예를 들어 표적 유전자(예를 들어, MYC)를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열, 예를 들어 앵커 서열에 근접한 서열에 결합하는 Zn 핑거(ZFN)를 포함하는 Zn 핑거 도메인을 포함한다. 일부 구현예에서, ZFN은 후성유전학적 이펙터 분자를 표적 부위로 운반하도록 조작될 수 있다. 일부 구현예에서, 표적화 모이어티는 2, 3, 4, 5, 6, 7, 또는 8개의 징크 핑거를 포함하는 Zn 핑거 도메인을 포함한다. 본 명세서에 개시된 예시적인 표적화 모이어티의 아미노산 서열은 표 4에 열거되어 있다. 본 명세서에 개시된 예시적인 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 표 5에 열거되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서 또는 시스템은 표 4에 제시된 서열, 또는 이와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일성을 갖는 서열을 갖는 표적화 모이어티를 포함한다. 일부 구현예에서, 본 명세서에 기재된 핵산은 표 5에 제시된 서열, 또는 이와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 발현 억제는 조작된 DNA 결합 도메인(DBD)을 포함하는 표적화 모이어티, 예를 들어 표적 서열, 예를 들어 표적 유전자(예를 들어, MYC)에 작동가능하게 연결된 프로모터 또는 전사 개시 부위(TSS) 서열, 전사 조절 요소에 근접한 서열, 예를 들어 표적 유전자(예를 들어, MYC)를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열, 예를 들어 마우스 게놈에서 앵커 서열에 근접한 서열에 결합하는 Zn 핑거(ZFN)를 포함하는 Zn 핑거 도메인을 포함한다. 일부 구현예에서, ZFN은 후성유전학적 이펙터 분자를 표적 부위로 운반하도록 조작될 수 있다. 일부 구현예에서, 표적화 모이어티는 2, 3, 4, 5, 6, 7, 또는 8개의 징크 핑거를 포함하는 Zn 핑거 도메인을 포함한다. 본 명세서에 개시된 예시적인 표적화 모이어티의 아미노산 서열은 표 14에 열거되어 있다. 본 명세서에 개시된 예시적인 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 표 15에 열거되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서 또는 시스템은 표 14에 제시된 서열, 또는 이와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일성을 갖는 서열을 갖는 표적화 모이어티를 포함한다. 일부 구현예에서, 본 명세서에 기재된 핵산은 표 15에 제시된 서열, 또는 이와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일성을 갖는 서열을 포함한다.
핵산 분자
일부 구현예에서, 표적화 모이어티는 뉴클레아제로부터의 DNA-결합 도메인이거나 이를 포함한다. 예를 들어, I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII과 같은 호밍 엔도뉴클레아제 및 메가뉴클레아제의 인식 서열이 알려져 있다. 또한, 미국 특허 5,420,032; 6,833,252; 문헌[Belfort, et al. (1997) Nucleic Acids Res. 25:3379-3388]; 문헌[Dujon, et al. (1989) Gene 82:115-118]; 문헌[Perler, et al. (1994) Nucleic Acids Res. 22:1125-1127]; 문헌[Jasin (1996) Trends Genet. 12:224-228]; 문헌[Gimble, et al. (1996) J. Mol. Biol. 263:163-180]; 문헌[Argast, et al. (1998) J. Mol. Biol. 280:345-353] 및 New England Biolabs 카탈로그를 참조한다. 추가적으로, 호밍 엔도뉴클레아제 및 메가뉴클레아제의 DNA-결합 특이성이 비천연 표적 부위에 결합하도록 조작될 수 있다. 예를 들어, 문헌[Chevalier, et al. (2002) Molec. Cell 10:895-905]; 문헌[Epinat, et al. (2003) Nucleic Acids Res. 31:2952-2962]; 문헌[Ashworth, et al. (2006) Nature 441:656-659]; 문헌[Paques, et al. (2007) Current Gene Therapy 7:49-66]; 미국 특허 공개 2007/0117128을 참조한다.
일부 구현예에서, DNA-표적화 모이어티는 핵산이거나 이를 포함한다. 일부 구현예에서, DNA-표적화 모이어티 내에 포함될 수 있는 핵산은 DNA, RNA, 및/또는 인공 또는 합성 핵산 또는 핵산 유사체 또는 모방체이거나 이를 포함할 수 있다. 예를 들어, 일부 구현예에서, 핵산은 게놈 DNA(gDNA), 상보적 DNA(cDNA), 펩타이드 핵산(PNA), 펩타이드- 올리고뉴클레오타이드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체-형성 올리고뉴클레오타이드, 안티센스 올리고뉴클레오타이드, tRNA, mRNA, rRNA, miRNA, gRNA, siRNA 또는 기타 다른 RNAi 분자(예를 들어, 본 명세서에 기재된 바와 같은 비코딩 RNA를 표적화하고/하거나 본 명세서에 기재된 바와 같은 표적화된 게놈 복합체와 연관된 특정 유전자의 발현 산물을 표적화하는 것들) 등 중 하나 이상이거나 이를 포함할 수 있다. 일부 구현예에서, 핵산은 자연-발생 DNA 또는 RNA 잔기가 아닌 하나 이상의 잔기를 포함할 수 있고/있거나, 포스포디에스테르 결합이 아닌(예를 들어, 이를 테면 포스포로티오에이트 결합 등일 수 있는) 하나 이상의 결합을 포함할 수 있고/있거나, 예를 들어 2'O 변형, 예컨대 2'-OmeP와 같은 하나 이상의 변형을 포함할 수 있다. 합성 핵산을 제조하는 데 유용한 다양한 핵산 구조가 당업계에 알려져 있으며(예를 들어, WO2017/062862l 및 WO2014/012081 참조), 당업자는 이들이 본 개시내용에 따라 이용될 수 있음을 이해할 것이다.
발현 리프레서에, 예를 들어 DNA-표적화 모이어티에 사용하기에 적합한 핵산은 DNA, RNA, 변형된 올리고뉴클레오타이드(예를 들어, 화학적 변형, 예컨대 백본 결합, 당 분자, 및/또는 핵산 염기를 변경시키는 변형), 및 인공 핵산을 포함할 수 있지만 이로 한정되지 않는다. 일부 구현예에서, 핵산은 게놈 DNA, cDNA, 펩타이드 핵산(PNA) 또는 펩타이드 올리고뉴클레오타이드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체 형성 올리고뉴클레오타이드, 변형된 DNA, 안티센스 DNA 올리고뉴클레오타이드, tRNA, mRNA, rRNA, 변형된 RNA, miRNA, gRNA, 및 siRNA 또는 기타 다른 RNA 또는 DNA 분자를 포함하지만 이로 한정되지 않는다.
일부 구현예에서, DNA-표적화 모이어티는 약 15 내지 200개, 20 내지 200개, 30 내지 200개, 40 내지 200개, 50 내지 200개, 60 내지 200개, 70 내지 200개, 80 내지 200개, 90 내지 200개, 100 내지 200개, 110 내지 200개, 120 내지 200개, 130 내지 200개, 140 내지 200개, 150 내지 200개, 160 내지 200개, 170 내지 200개, 180 내지 200개, 190 내지 200개, 215 내지 190개, 20 내지 190개, 30 내지 190개, 40 내지 190개, 50 내지 190개, 60 내지 190개, 70 내지 190개, 80 내지 190개, 90 내지 190개, 100 내지 190개, 110 내지 190개, 120 내지 190개, 130 내지 190개, 140 내지 190개, 150 내지 190개, 160 내지 190개, 170 내지 190개, 180 내지 190개, 15 내지 180개, 20 내지 180개, 30 내지 180개, 40 내지 180개, 50 내지 180개, 60 내지 180개, 70 내지 180개, 80 내지 180개, 90 내지 180개, 100 내지 180개, 110 내지 180개, 120 내지 180개, 130 내지 180개, 140 내지 180개, 150 내지 180개, 160 내지 180개, 170 내지 180개, 15 내지 170개, 20 내지 170개, 30 내지 170개, 40 내지 170개, 50 내지 170개, 60 내지 170개, 70 내지 170개, 80 내지 170개, 90 내지 170개, 100 내지 170개, 110 내지 170개, 120 내지 170개, 130 내지 170개, 140 내지 170개, 150 내지 170개, 160 내지 170개, 15 내지 160개, 20 내지 160개, 30 내지 160개, 40 내지 160개, 50 내지 160개, 60 내지 160개, 70 내지 160개, 80 내지 160개, 90 내지 160개, 100 내지 160개, 110 내지 160개, 120 내지 160개, 130 내지 160개, 140 내지 160개, 150 내지 160개, 215 내지 150개, 20 내지 150개, 30 내지 150개, 40 내지 150개, 50 내지 150개, 60 내지 150개, 70 내지 150개, 80 내지 150개, 90 내지 150개, 100 내지 150개, 110 내지 150개, 120 내지 150개, 130 내지 150개, 140 내지 150개, 15 내지 140개, 20 내지 140개, 30 내지 140개, 40 내지 140개, 50 내지 140개, 60 내지 140개, 70 내지 140개, 80 내지 140개, 90 내지 140개, 100 내지 140개, 110 내지 140개, 120 내지 140개, 130 내지 140개, 15 내지 130개, 20 내지 130개, 30 내지 130개, 40 내지 130개, 50 내지 130개, 60 내지 130개, 70 내지 130개, 80 내지 130개, 90 내지 130개, 100 내지 130개, 110 내지 130개, 120 내지 130개, 215 내지 120개, 20 내지 120개, 30 내지 120개, 40 내지 120개, 50 내지 120개, 60 내지 120개, 70 내지 120개, 80 내지 120개, 90 내지 120개, 100 내지 120개, 110 내지 120개, 15 내지 110개, 20 내지 110개, 30 내지 110개, 40 내지 110개, 50 내지 110개, 60 내지 110개, 70 내지 110개, 80 내지 110개, 90 내지 110개, 100 내지 110개, 15 내지 100개, 20 내지 100개, 30 내지 100개, 40 내지 100개, 50 내지 100개, 60 내지 100개, 70 내지 100개, 80 내지 100개, 90 내지 100개, 15 내지 90개, 20 내지 90개, 30 내지 90개, 40 내지 90개, 50 내지 90개, 60 내지 90개, 70 내지 90개, 80 내지 90개, 15 내지 80개, 20 내지 80개, 30 내지 80개, 40 내지 80개, 50 내지 80개, 60 내지 80개, 70 내지 80개, 15 내지 70개, 20 내지 70개, 30 내지 70개, 40 내지 70개, 50 내지 70개, 60 내지 70개, 15 내지 60개, 20 내지 60개, 30 내지 60개, 40 내지 60개, 50 내지 60개, 15 내지 50개, 20 내지 50개, 30 내지 50개, 40 내지 50개, 15 내지 40개, 20 내지 40개, 30 내지 40개, 15 내지 30개, 20 내지 30개, 또는 15 내지 20개의 뉴클레오타이드 길이, 또는 이들 사이의 임의의 범위의 뉴클레오타이드 길이를 갖는 핵산을 포함한다.
이펙터 모이어티
일부 구현예에서, 본 개시내용의 발현 리프레서는 하나 이상의 이펙터 모이어티를 포함한다. 일부 구현예에서, 이펙터 모이어티는 본 명세서에 기재된 발현자 리프레서 또는 발현 억제 시스템의 일부로서 사용될 때 세포에서 표적 유전자의 발현을 감소시킨다.
이펙터 모이어티는 표적화 모이어티의 결합과 관련이 없는 기능성을 갖는다. 예를 들어, 이펙터 모이어티는 표적화 모이어티에 의해 표적화된 게놈 서열 요소 또는 게놈 서열 요소에 근접한 게놈 복합체 성분을 표적화, 예를 들어 결합하거나 전사 요소를 동원할 수 있다. 추가의 예로서, 이펙터 모이어티는 효소 활성, 예를 들어 유전자 변형 기능성을 포함할 수 있다.
일부 구현예에서, 이펙터 모이어티는 후성유전학적 변형 모이어티를 포함한다. 일부 구현예에서, 이펙터 모이어티는 DNA 변형 기능성, 예를 들어 DNA 메틸트랜스퍼라제를 포함한다. 일부 구현예에서, 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질이거나 이를 포함한다.
일부 구현예에서, 이펙터 모이어티는 전사 리프레서를 포함한다. 일부 구현예에서, 전사 리프레서는 전사, 예를 들어 표적 유전자의 전사를 자극하거나 촉진하는 인자의 동원을 차단한다. 일부 구현예에서, 전사 리프레서는 전사, 예를 들어 표적 유전자의 전사를 억제하는 인자를 동원한다. 일부 구현예에서, 이펙터 모이어티, 예를 들어 전사 리프레서는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질이거나 이를 포함한다.
일부 구현예에서 이펙터 모이어티는 후성유전학적 변형을, 예를 들어 직접적으로 또는 간접적으로 촉진시킨다. 예를 들어, 이펙터 모이어티는 염색질을 후성유전학적으로 변형시키는 내인성 단백질을 동원함으로써 후성유전학적 변형을 간접적으로 촉진시킬 수 있다. 이펙터 모이어티는 후성유전학적 변형을 촉매함으로써 후성유전학적 변형을 직접적으로 촉진시킬 수 있으며, 여기서 이펙터 모이어티는 효소 활성을 포함하고, 후성유전학적 마크를 염색질 상에 직접 배치한다.
일부 구현예에서, 이펙터 모이어티는 히스톤 변형 기능성, 예를 들어 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 또는 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 이펙터 모이어티는 KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질이거나 이를 포함한다. 일부 구현예에서, 이펙터 모이어티는 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질이거나 이를 포함한다.
일부 구현예에서, 이펙터 모이어티는 본 명세서에 기재된 기능성을 갖는 단백질을 포함한다. 일부 구현예에서, 이펙터 모이어티는 하기로부터 선택되는 단백질이거나 이를 포함한다: KRAB(예를 들어, NP_056209.2에 따른 것 또는 NM_015394.5에 의해 인코딩된 단백질); SET 도메인(예를 들어, SETDB1(예를 들어, NP_001353347.1에 따른 것 또는 NM_001366418.1에 의해 인코딩된 단백질)의 SET 도메인); EZH2(예를 들어, NP-004447.2에 따른 것 또는 NM_004456.5에 의해 인코딩된 단백질); G9A(예를 들어, NP_001350618.1에 따른 것 또는 NM_001363689.1에 의해 인코딩된 단백질); 또는 SUV39H1(예를 들어, NP_003164.1에 따른 것 또는 NM_003173.4에 의해 인코딩된 단백질)); 히스톤 데메틸라제 LSD1(예를 들어, NP_055828.2에 따른 것 또는 NM_015013.4에 의해 인코딩된 단백질); FOG1(예를 들어, FOG1의 N-말단 잔기)(예를 들어, NP_722520.2에 따른 것 또는 NM_153813.3에 의해 인코딩된 단백질); 또는 KAP1(예를 들어, NP_005753.1에 따른 것 또는 NM_005762.3에 의해 인코딩된 단백질); 이들 중 임의의 것의 기능성 단편 또는 변이체, 또는 상기 언급된 임의의 서열과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 서열을 갖는 폴리펩타이드.
일부 구현예에서, 이펙터 모이어티는 하기로부터 선택되는 단백질이거나 이를 포함한다: DNMT3A(예를 들어, 인간 DNMT3A)(예를 들어, NP_072046.2에 따른 것 또는 NM_022552.4에 의해 인코딩된 단백질); DNMT3B(예를 들어, NP_008823.1에 따른 것 또는 NM_006892.4에 의해 인코딩된 단백질); DNMT3L(예를 들어, NP_787063.1에 따른 것 또는 NM_175867.3에 의해 인코딩된 단백질); DNMT3A/3L 복합체, 박테리아 MQ1(예를 들어, CAA35058.1 또는 P15840.3에 따른 것); 이들 중 임의의 것의 기능성 단편, 또는 상기 언급된 임의의 서열과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 서열을 갖는 폴리펩타이드.
또 다른 양태에서, 본 개시내용은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 발현 리프레서 또는 폴리펩타이드에 관한 것이며, 여기서 하나 이상의 이펙터 모이어티는 크루펠-연관 박스(Krueppel-associated box; KRAB), 예를 들어 NP_056209.2에 따른 것, 또는 NM_015394.5에 의해 인코딩된 단백질 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, KRAB는 합성 KRAB 작제물이다. 일부 구현예에서, KRAB는 서열번호 18의 아미노산 서열을 포함한다:
일부 구현예에서, KRAB 이펙터 모이어티는 서열번호 51의 뉴클레오타이드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 뉴클레오타이드 서열은 서열번호 51의 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 51, 17, 16, 15, 18, 13, 12, 11, 14, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 본 명세서에 기재된 폴리펩타이드 또는 발현 리프레서에 사용하기 위한 KRAB는, 예를 들어 서열번호 18의 KRAB 서열과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, KRAB 변이체는 서열번호 18과 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다.
일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는, KRAB이거나 이를 포함하는 이펙터 모이어티 및 DNA-표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 표적화 모이어티는, 예를 들어 CRISPR/Cas 단백질, 예를 들어 dCas9 단백질을 포함하는 징크 핑거 도메인, TAL 도메인, 또는 CRISPR/Cas 도메인이거나 이를 포함한다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는 본 명세서에 기재된 추가의 모이어티를 포함한다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는, 예를 들어 발현 억제 시스템 대신에, 본 명세서에 기재된 유전자 발현을 조절하는, 예를 들어 감소시키는 방법, 병태를 치료하는 방법, 또는 표적 유전자, 예를 들어 MYC 또는 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용될 수 있다. 일부 구현예에서, 발현 억제 시스템은 2개 이상(예를 들어, 2, 3, 또는 4개)의 발현 리프레서를 포함하며, 여기서 제1 발현 리프레서는 서열번호 18의 KRAB 서열, 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함한다.
또 다른 양태에서, 본 개시내용은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 발현 리프레서 또는 폴리펩타이드에 관한 것이며, 여기서 하나 이상의 이펙터 모이어티는 MQ1, 예를 들어 박테리아 MQ1, 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, MQ1은 몰리쿠테스 스피로플라스마(Mollicutes spiroplasma) MQ1이다. 일부 구현예에서, MQ1은 스피로플라스마 모노비아이(Spiroplasma monobiae) MQ1이다. 일부 구현예에서, MQ1은 균주 ATCC 33825로부터 유래되고/되거나 Uniprot ID P15840에 상응하는 MQ1이다. 일부 구현예에서, MQ1은 서열번호 19의 아미노산 서열을 포함한다. 일부 구현예에서, MQ1은 서열번호 87의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터 도메인은 서열번호 19 또는 87, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, MQ1은 서열번호 52 또는 132의 뉴클레오타이드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 52, 132의 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 52, 15, 16, 13, 12, 11, 14, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 본 명세서에 기재된 폴리펩타이드 또는 발현 리프레서에 사용하기 위한 MQ1은, 예를 들어 야생형 MQ1(서열번호 19)과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, MQ1 변이체는 야생형 MQ1, 예를 들어 서열번호 19의 MQ1과 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, MQ1 변이체는 K297P 치환을 포함한다. 일부 구현예에서, MQ1 변이체는 N299C 치환을 포함한다. 일부 구현예에서, MQ1 변이체는 E301Y 치환을 포함한다. 일부 구현예에서, MQ1 변이체는 Q147L 치환을 포함한다(예를 들어, 그리고 야생형 MQ1과 대비하여 감소된 DNA 메틸트랜스퍼라제 활성을 갖는다). 일부 구현예에서, MQ1 변이체는 K297P, N299C, 및 E301Y 치환을 포함한다(예를 들어, 그리고 야생형 MQ1과 대비하여 감소된 DNA 결합 친화도를 갖는다). 일부 구현예에서, MQ1 변이체는 Q147L, K297P, N299C, 및 E301Y 치환을 포함한다(예를 들어, 그리고 야생형 MQ1과 대비하여 감소된 DNA 메틸트랜스퍼라제 활성 및 DNA 결합 친화도를 갖는다).
일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는 MQ1이거나 이를 포함하는 이펙터 모이어티 및 징크 핑거 도메인, TAL 도메인, 또는 CRISPR/Cas 도메인, dCas9 도메인이거나 이를 포함하는 표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는 본 명세서에 기재된 추가의 모이어티를 포함한다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는, 예를 들어 발현 억제 시스템 대신에, 본 명세서에 기재된 유전자 발현을 조절하는, 예를 들어 감소시키는 방법, 병태를 치료하는 방법, 또는 표적 유전자, 예를 들어 MYC 또는 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용될 수 있다. 일부 구현예에서, 발현 억제 시스템은 2개 이상(예를 들어, 2, 3, 또는 4개)의 발현 리프레서를 포함하며, 여기서 제1 발현 리프레서는 MQ1, 예를 들어 박테리아 MQ1, 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함한다.
또 다른 양태에서, 본 개시내용은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 발현 리프레서 또는 폴리펩타이드에 관한 것이며, 여기서 하나 이상의 이펙터 모이어티는 DNMT1, 예를 들어 인간 DNMT1, 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, DNMT1은 인간 DNMT1, 예를 들어 Gene ID 1786에 상응하는 것, 예를 들어 UniPort ID P26358.2에 상응하는 것이다. 일부 구현예에서, DNMT1은 서열번호 20의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터 도메인은 서열번호 20에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다:
일부 구현예에서, DNMT1은 서열번호 53의 뉴클레오타이드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 53의 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 53, 15, 16, 13, 12, 11, 14, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 본 명세서에 기재된 폴리펩타이드 또는 발현 리프레서에 사용하기 위한 DNMT1은, 예를 들어 서열번호 20의 DNMT 서열과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, 이펙터 도메인은 야생형 DNMT1과 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, 폴리펩타이드는, DNMT1이거나 이를 포함하는 리프레서 도메인 및 표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 표적화 모이어티는 징크 핑거 도메인, TAL 도메인, 또는 CRISPR/Cas 도메인, 예를 들어 dCas9 도메인이거나 이를 포함한다. 일부 구현예에서, 발현 억제 시스템은 2개 이상(예를 들어, 2, 3, 또는 4개)의 발현 리프레서를 포함하며, 여기서 제1 발현 리프레서는 DNMT1, 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함한다.
또 다른 양태에서, 본 개시내용은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 발현 리프레서 또는 폴리펩타이드에 관한 것이며, 여기서 하나 이상의 이펙터 모이어티는 DNMT3a/3L 복합체, 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, DNMT3a/3L 복합체는 융합 작제물이다. 일부 구현예에서, DNMT3a/3L 복합체는 DNMT3A(예를 들어, 인간 DNMT3A)(예를 들어, NP_072046.2에 따른 것 또는 NM_022552.4에 의해 인코딩된 단백질)를 포함한다. 일부 구현예에서, DNMT3a/3L 복합체는 DNMT3L(예를 들어, NP_787063.1에 따른 것 또는 NM_175867.3에 의해 인코딩된 단백질)를 포함한다. 일부 구현예에서, DNMT3a/3L은 서열번호 21 또는 서열번호 114의 아미노산 서열을 포함한다: 일부 구현예에서, 본 명세서에 기재된 이펙터 도메인은 서열번호 21 또는 서열번호 114, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, DNMT3a/3L은 서열번호 54의 뉴클레오타이드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 54의 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 54, 15, 16, 13, 12, 11, 14, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 본 명세서에 기재된 폴리펩타이드 또는 발현 리프레서에 사용하기 위한 DNMT3a/3L은, 예를 들어 서열번호 21 또는 서열번호 114의 DNMT3a/3L과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, DNMT3a/3L 변이체는 서열번호 21 또는 서열번호 114와 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는, DNMT3a/3L이거나 이를 포함하는 이펙터 모이어티 및 표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 표적화 모이어티는 징크 핑거 도메인, TAL 도메인, 또는 CRISPR/Cas 도메인, 예를 들어 dCas9 도메인이거나 이를 포함한다. 일부 구현예에서, 발현 억제 시스템은 2개 이상(예를 들어, 2, 3, 또는 4개)의 발현 리프레서를 포함하며, 여기서 제1 발현 리프레서는 DNMT3a/3L, 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함한다.
일부 구현예에서, 이펙터 모이어티는 폴리펩타이드이거나 이를 포함한다. 일부 구현예에서, 이펙터 모이어티는 핵산이거나 이를 포함한다. 일부 구현예에서, 이펙터 모이어티는 화학물질, 예를 들어 시토신 I 또는 아데닌(A)을 조절하는 화학물질(예를 들어 중아황산나트륨, 중아황산암모늄)이다. 이펙터 모이어티는 효소 활성(예를 들어, 메틸 트랜스퍼라제, 데메틸라제, 뉴클레아제(예를 들어, Cas9), 또는 데아미나제 활성)을 갖는다. 이펙터 모이어티는 소분자, 펩타이드, 핵산, 나노입자, 앱타머, 또는 불량한 PK/PD를 갖는 약제(pharmaco-agent) 중 하나 이상이거나 이를 포함할 수 있다.
일부 구현예에서, 이펙터 모이어티는 펩타이드 리간드, 전장 단백질, 단백질 단편, 항체, 항체 단편, 및/또는 표적화 앱타머를 포함할 수 있다. 일부 구현예에서, 단백질은 수용체, 예컨대 세포외 수용체, 신경펩타이드, 호르몬 펩타이드, 펩타이드 약물, 독성 펩타이드, 바이러스 또는 미생물 펩타이드, 합성 펩타이드, 또는 효현제 또는 길항제에 결합할 수 있다.
일부 구현예에서, 이펙터 모이어티는 항원, 항체, 항체 단편, 예컨대 단일 도메인 항체, 리간드, 또는 수용체, 예컨대 글루카곤-유사 펩타이드-1(GLP-1), GLP-2 수용체 2, 콜레시스토키닌 B(CCKB), 또는 소마토스타틴 수용체, 펩타이드 치료제, 예컨대 특정 세포 표면 수용체, 예컨대 G 단백질-커플링 수용체(GPCR) 또는 이온 채널에 결합하는 것, 자연-생체활성 펩타이드의 합성 또는 유사 펩타이드, 항-미생물 펩타이드, 기공-형성 펩타이드, 종양 표적화 또는 세포독성 펩타이드, 또는 분해 또는 자가-파괴 펩타이드, 예컨대 아폽토시스-유도 펩타이드 신호 또는 광감작 펩타이드를 포함할 수 있다.
본 명세서에 기재된 바와 같은 이펙터 모이어티에 사용하기 위한 펩타이드 또는 단백질 모이어티는 또한, 작은 항원-결합 펩타이드, 예를 들어 항원 결합 항체 또는 항체-유사 단편, 예컨대 단일 사슬 항체, 나노바디를 포함한다(예를 들어, 문헌[Steeland et al. 2016. Nanobodies as therapeutics: big opportunities for small antibodies. Drug Discov Today: 21(7):1076-113] 참조). 그러한 작은 항원 결합 펩타이드는, 예를 들어 사이토졸 항원, 핵 항원, 세포소기관-내 항원에 결합할 수 있다.
일부 구현예에서, 이펙터 모이어티는 우성 음성 성분(예를 들어, 우성 음성 모이어티), 예를 들어 서열(예를 들어, 앵커 서열, 예를 들어 CTCF 결합 모티프)을 인식하고 이에 결합하지만, 비활성(예를 들어, 돌연변이된) 이량체화 도메인, 예를 들어 기능성 앵커 서열-매개 연접부를 형성할 수 없거나, 기능성 전사 인자의 형성을 방지하는 게놈 복합체(예를 들어, 전사 인자 서브유닛 등) 등의 성분에 결합하는 이량체화 도메인을 갖는 단백질을 포함한다. 예를 들어, CTCF의 징크 핑거 도메인은 (측접 핵산을 인식하는 징크 핑거를 추가함으로써) 특정 앵커 서열에 결합하도록 변경될 수 있는 한편, 동종-이량체화 도메인은 조작된 CTCF와 CTCF의 내인성 형태 사이의 상호작용을 방지하도록 변경된다. 일부 구현예에서, 우성 음성 성분은 표적 앵커 서열-매개 연접부 내의 앵커 서열에 대해 선택된 결합 친화도를 갖는 합성 핵형성 폴리펩타이드를 포함한다. 일부 구현예에서, 결합 친화도는 표적 앵커 서열과 회합하는 내인성 핵형성 폴리펩타이드(예를 들어, CTCF)의 결합 친화도보다 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 이상으로 더 높거나 이하로 더 낮을 수 있다. 합성 핵형성 폴리펩타이드는 상응하는 내인성 핵형성 폴리펩타이드와 30 내지 90%, 30 내지 85%, 30 내지 80%, 30 내지 70%, 50 내지 80%, 50 내지 90% 아미노산 서열 동일성을 가질 수 있다. 핵형성 폴리펩타이드는, 예컨대 경쟁적 결합, 예를 들어 앵커 서열에 대한 내인성 핵형성 폴리펩타이드의 결합과의 경쟁을 통해 조절(예를 들어, 파괴)할 수 있다.
일부 구현예에서, 이펙터 모이어티는 항체 또는 이의 단편을 포함할 수 있다. 일부 구현예에서, 표적 유전자(예를 들어, MYC) 발현은 하나 이상의 항체 또는 이의 단편이거나 이를 포함하는 이펙터 모이어티의 사용을 통해 변경된다. 일부 구현예에서, 유전자 발현은 하나 이상의 항체(또는 이의 단편) 및 dCas9이거나 이를 포함하는 이펙터 모이어티의 사용을 통해 변경된다.
일부 구현예에서, 이펙터 모이어티에 사용하기 위한 항체 또는 이의 단편은 모노클로날일 수 있다. 항체는 융합체, 키메라 항체, 비-인간화 항체, 부분적 또는 완전 인간화 항체 등일 수 있다. 당업자에 의해 이해될 바와 같이, 사용되는 항체(들)의 형식은 주어진 표적에 따라 동일하거나 상이할 수 있다.
일부 구현예에서, 이펙터 모이어티는 연접부 핵형성 분자, 연접부 핵형성 분자를 인코딩하는 핵산, 또는 이들의 조합을 포함한다. 연접부 핵형성 분자는, 예를 들어 CTCF, 코헤신, USF1, YY1, TATA-박스 결합 단백질 연관 인자 3(TAF3), ZNF143 결합 모티프, 또는 앵커 서열-매개 연접부의 형성을 촉진시키는 또 다른 폴리펩타이드일 수 있다. 연접부 핵형성 분자는 내인성 폴리펩타이드 또는 다른 단백질, 예컨대 전사 인자, 예를 들어 자가면역 조절제(AIRE), 또 다른 인자, 예를 들어 X-비활성화 특이적 전사체(XIST), 또는 관심이 있는 특정 DNA 서열을 인식하도록 조작된, 예를 들어 서열 인식을 위해 징크 핑거, 류신 지퍼 또는 bHLH 도메인을 갖는 조작된 폴리펩타이드일 수 있다. 연접부 핵형성 분자는 (예를 들어, 표적화 모이어티에 의해 표적화된 게놈 서열 요소와 회합되거나 이를 포함하는) 앵커 서열-매개 연접부 내 또는 그 주위에서 DNA 상호작용을 조절할 수 있다. 예를 들어, 연접부 핵형성 분자는 앵커 서열-매개 연접부 형성 또는 파괴를 변경시키는 앵커 서열로 다른 인자를 동원할 수 있다.
연접부 핵형성 분자는 또한 동종- 또는 이종이량체화를 위해 이량체화 도메인을 가질 수 있다. 예를 들어 내인성 및 조작된, 하나 이상의 연접부 핵형성 분자는 상호작용하여 앵커 서열-매개 연접부를 형성할 수 있다. 일부 구현예에서, 연접부 핵형성 분자는 안정화 도메인, 예를 들어 코헤신 상호작용 도메인을 추가로 포함하도록 조작되어, 앵커 서열-매개 연접부를 안정화시킨다. 일부 구현예에서, 연접부 핵형성 분자는 표적 서열에 결합하도록 조작되며, 예를 들어 표적 서열 결합 친화도가 조절된다. 일부 구현예에서, 연접부 핵형성 분자는 앵커 서열-매개 연접부 내의 앵커 서열에 대해 선택된 결합 친화도를 갖는 연접부 핵형성 분자가 선택되거나 조작된다.
연접부 핵형성 분자 및 이의 상응하는 앵커 서열은 CTCF의 비활성화 돌연변이를 보유하는 세포 및 염색체 형태 포획 또는 3C-기반 방법, 예를 들어 Hi-C 또는 고처리량 서열분석을 사용하여 위상학적으로 연관된 도메인, 예를 들어 CTCF의 부재 시 원위 DNA 영역 또는 유전자좌 사이의 위상학적 상호작용을 검사함으로써 확인될 수 있다. 장거리 DNA 상호작용도 또한 확인될 수 있다. 추가의 분석은 미끼, 예컨대 코헤신, YY1 또는 USF1, ZNF143 결합 모티프, 및 MS를 사용하는 ChIA-PET 분석을 포함하여 미끼와 회합되는 복합체를 확인할 수 있다.
일부 구현예에서, 이펙터 모이어티는 단백질의 DNA-결합 도메인을 포함한다. 일부 구현예에서, 이펙터 모이어티의 DNA 결합 도메인은 조절제의 표적화를 향상시키거나 변경시키지만 단독으로는 조절제에 의한 완전한 표적화를 달성하지 못한다(예를 들어, 표적화 모이어티는 여전히 조절제의 표적화를 달성하는 데 필요하다). 일부 구현예에서, DNA 결합 도메인은 조절제의 표적화를 향상시킨다. 일부 구현예에서, DNA 결합 도메인은 조절제의 효능을 향상시킨다. DNA-결합 단백질은, 예를 들어 당업자에게 공지된 DNA 결합에서 중요한 역할을 하는, 별개의 구조적 모티프를 갖는다. 일부 구현예에서, DNA-결합 도메인은 리프레서 단백질의 일반적인 DNA 인식 모티프인 나선-회전-나선(helix-turn-helix; HTH) 모티프를 포함한다. 그러한 모티프는 2개의 나선을 포함하며, 이들 나선 중 하나는 결합 특이성을 제공하는 측쇄를 갖는 DNA(일명, 인식 나선)를 인식한다. 그러한 모티프는 일반적으로 발달 과정에 관여하는 단백질을 조절하는 데 사용된다. 때때로 하나 초과의 단백질은 동일한 서열에 대해 경쟁하거나 동일한 DNA 단편을 인식한다. 상이한 단백질은 H-결합, 염 다리 및 반데르발스 상호작용을 통해 각각 동일한 서열 또는 DNA 형태에 대해 친화도가 상이할 수 있다.
DNA-결합 도메인은 나선-헤어핀-나선(HhH) 모티프를 포함한다. HhH 구조 모티프를 갖는 DNA-결합 단백질은 단백질 백본 질소와 DNA 포스페이트 기 사이의 수소 결합의 형성을 통해 일어나는 서열 비특이적 DNA 결합에 관여할 수 있다.
일부 구현예에서, DNA-결합 도메인은 나선-루프-나선(HLH) 모티프를 포함한다. HLH 구조 모티프를 갖는 DNA-결합 단백질은 전사 조절 단백질이며, 매우 다양한 개발 과정에 주로 관련되어 있다. 잔기의 관점에서 HTH 또는 HhH 모티프보다 HLH 구조 모티프가 더 길다. 이들 단백질 중 다수는 상호작용하여 동종- 및 이종-이량체를 형성한다. 구조 모티프는, N-말단 나선이 DNA에 결합되면서 2개의 긴 나선 영역으로 구성되지만, 복합체 영역은 단백질이 이량체화될 수 있게 한다.
일부 구현예에서, DNA-결합 도메인은 류신 지퍼 모티프를 포함한다. 일부 전사 인자에서는, 이량체 결합 부위가 DNA와 함께 류신 지퍼를 형성한다. 이 모티프는 2개의 양친매성 나선을 포함하며, 각 하위단위로부터 하나씩 유래되며, 서로 상호작용하여 왼손방향 코일드-코일 슈퍼 2차 구조를 발생시킨다. 류신 지퍼는 한쪽 나선 내의 규칙적으로 이격된 류신 잔기와 인접한 나선으로부터의 류신의 상호감합(interdigitation)이다. 대개, 류신 지퍼에 관여하는 나선은 헵타드(heptad) 서열(abcdefg)을 나타내며, 이때 잔기 a 및 d는 소수성이고, 기타 다른 잔기는 친수성이다. 류신 지퍼 모티프는 동종이량체 형성 또는 이종이량체 형성 중 어느 하나를 매개할 수 있다.
일부 구현예에서, DNA-결합 도메인은 Zn 핑거 도메인을 포함하며, 여기서 Zn++ 이온은 2개의 Cys 및 2개의 His 잔기에 의해 배위된다. 그러한 전사 인자는 화학량론 ββ'α를 갖는 삼량체를 포함한다. Zn++ 배위의 겉보기 효과는 소수성 코어 잔기 대신에 작은 복합체 구조의 안정화이다. 각 Zn-핑거는 이중 나선의 큰 홈(major groove) 내의 연속적인 삼중 염기쌍 세그먼트와 입체구조적으로 동일한 방식으로 상호작용한다. 단백질-DNA 상호작용은 다음 2개의 인자에 의해 결정된다: (i) α-나선과 DNA 세그먼트 사이, 대개 Arg 잔기와 구아닌 염기 사이의 H-결합 상호작용. (ii) DNA 포스페이트 백본과의, 대개 Arg 및 His와의 H-결합 상호작용. 대안적인 Zn-핑거 모티프는 Zn++를 6개의 Cys로 킬레이트화한다.
일부 구현예에서, DNA-결합 도메인인은 TATA 박스 결합 단백질(TBP)을 포함한다. TBP는 처음에 클래스 II 개시 인자 TFIID의 성분으로 확인되었다. 이들 결합 단백질은 핵 RNA 중합효소 각각의 서브유닛으로 작용하는 3개의 핵 RNA 중합효소 모두에 의한 전사에 참여한다. TBP의 구조는 89 내지 90개 아미노산으로 구성된 2개의 α/β 구조 도메인을 나타낸다. TBP의 C-말단 또는 코어 영역은 작은 홈(minor groove) 결정인자를 인식하고 DNA 굽힘을 촉진시키는 TATA 컨센서스 서열(TATAa/tAa/t, 서열번호 210)에 높은 친화도로 결합한다. TBP는 분자 안장과 비슷하다. 결합면에는 10개 가닥 역평행 β-시트 중 중심 8개 가닥으로 늘어서 있다. 상부 표면은 4개의 α-나선을 포함하고 전사 기구의 다양한 성분에 결합한다.
일부 구현예에서, DNA-결합 도메인은 전사 인자이거나 이를 포함한다. 전사 인자(RF)는 염기 서열의 특정 인식을 담당하는 DNA-결합 도메인 및 전사를 활성화시키거나 억제시킬 수 있는 하나 이상의 이펙터 도메인을 포함하는 모듈 단백질일 수 있다. TF는 염색질과 상호작용하고 보조활성화인자(coactivator) 또는 보조억제인자(corepressor)의 역할을 하는 단백질 복합체를 동원한다.
일부 구현예에서, 이펙터 모이어티는 하나 이상의 RNA(예를 들어, gRNA) 및 dCas9를 포함한다. 일부 구현예에서, 하나 이상의 RNA는 dCas9 및 표적-특이적 가이드 RNA를 통해 게놈 서열 요소에 표적화된다. 당업자에 의해 이해될 바와 같이, 표적화에 사용되는 RNA는 주어진 표적에 따라 동일하거나 상이할 수 있다. 이펙터 모이어티는 앱타머, 예컨대 올리고뉴클레오타이드 앱타머 또는 펩타이드 앱타머를 포함할 수 있다. 앱타머 모이어티는 올리고뉴클레오타이드 또는 펩타이드 앱타머이다.
이펙터 모이어티는 올리고뉴클레오타이드 앱타머를 포함할 수 있다. 올리고뉴클레오타이드 앱타머는 단백질 및 펩타이드를 포함하는 사전 선택된 표적에 높은 친화도 및 특이성으로 결합할 수 있는 단일-가닥 DNA 또는 RNA(ssDNA 또는 ssRNA) 분자이다.
올리고뉴클레오타이드 앱타머는 다양한 분자 표적, 예컨대 소분자, 단백질, 핵산, 및 심지어 세포, 조직 및 유기체에 결합하기 위해 반복된 라운드의 시험관내 선택 또는 동등하게 SELEX(systematic evolution of ligands by exponential enrichment; 지수적 농축에 의한 리간드의 계통적 진화)를 통해 조작될 수 있는 핵산 종이다. 앱타머는 차별적인 분자 인식을 제공하며, 화학적 합성에 의해 생성될 수 있다. 추가적으로, 앱타머는 바람직한 저장 특성을 가지며, 치료적 응용에서 면역원성을 거의 또는 전혀 이끌어내지 않는다.
DNA 및 RNA 앱타머는 둘 다 다양한 표적에 대하여 강력한 결합 친화성을 나타낸다. 예를 들어, DNA 및 RNA 앱타머는 t 리소자임, 트롬빈, 인간 면역결핍 바이러스 트랜스-작용 반응성 요소(HIV TAR), 헤민(hemin), 인터페론 γ, 혈관 내피 성장 인자(VEGF), 전립선 특이적 항원(PSA), 도파민, 및 비-고전적 종양유전자, 열 충격 인자 1(HSF1)에 대해 선택되었다.
앱타머-기반 혈장 단백질 프로파일링을 위한 진단 기법은 앱타머 혈장 프로테오믹스를 포함한다. 이 기술은 질환 대 건강한 상태의 진단적 구별을 도울 수 있는 미래의 다중-바이오마커 단백질 측정을 가능하게 할 것이다.
이펙터 모이어티는 펩타이드 앱타머 모이어티를 포함할 수 있다. 펩타이드 앱타머는 12 내지 14 kDa인 저분자량을 갖는 펩타이드를 포함하여, 하나(또는 그 이상)의 짧은 가변 펩타이드 도메인을 갖는다. 펩타이드 앱타머는 세포에 특이적으로 결합하고 세포 내부의 단백질-단백질 상호작용을 간섭하도록 설계될 수 있다.
펩타이드 앱타머는 특정 표적 분자에 결합하도록 선택되거나 조작된 인공 단백질이다. 이들 단백질은 가변 서열의 하나 이상의 펩타이드 복합체를 포함한다. 이들 단백질은 통상적으로 조합 라이브러리로부터 단리되며, 종종 유도된 돌연변이 또는 가변 영역 돌연변이유발 및 선택 라운드에 의해 후속적으로 개선된다. 생체내에서, 펩타이드 앱타머는 세포 단백질 표적에 결합할 수 있고, 이들의 표적화된 분자와 다른 단백질의 정상적인 단백질 상호작용을 방해하는 것을 포함하여, 생물학적 효과를 발휘할 수 있다. 구체적으로, 전사 인자 결합 도메인에 부착된 가변 펩타이드 앱타머 복합체는 전사 인자 활성화 도메인에 부착된 표적 단백질에 대해 스크리닝된다. 생체내에서 이러한 선택 전략을 통해 표적에 대한 펩타이드 앱타머의 결합은 하류 효모 마커 유전자의 발현으로 검출된다. 그러한 실험은 앱타머에 의해 결합되는 특정 단백질, 및 앱타머가 파괴하는 단백질 상호작용을 확인하여, 주어진 표현형을 유발한다. 추가적으로, 적절한 기능성 모이어티로 유도체화된 펩타이드 앱타머는 표적 단백질의 특정 번역후 변형을 유발하거나 표적의 세포내 국재화를 변경할 수 있다. 펩타이드 앱타머는 또한 시험관내에서 표적을 인식할 수 있다. 펩타이드 앱타머는 바이오센서에서 항체 대신에 사용되는 것을 발견하였으며, 비활성 및 활성 단백질 형태 둘 다를 포함하는 집단으로부터 단백질의 활성 이소형(isoform)을 검출하는 데 사용되었다. 펩타이드 앱타머 "헤드"가 독특한 서열의 이중-가닥 DNA "테일(tail)"에 공유적으로 연결된 태드폴(tadpole)로서 알려져 있는 유도체는 (예를 들어, 정량적 실시간 중합효소 연쇄 반응을 사용하여) 이들의 DNA 테일의 PCR에 의해 혼합물 중 드문 표적 분자의 정량화를 가능하게 한다.
펩타이드 앱타머 선택은 상이한 시스템을 사용하여 이루어질 수 있지만, 현재 효모 2-하이브리드 시스템이 가장 많이 사용된다. 펩타이드 앱타머는 또한 파지 디스플레이 및 다른 표면 디스플레이 기술, 예컨대 mRNA 디스플레이, 리보솜 디스플레이, 박테리아 디스플레이 및 효모 디스플레이에 의해 구축된 조합 펩타이드 라이브러리로부터 선택될 수 있다. 이들 실험 절차는 또한 바이오패닝(biopanning)으로서 알려져 있다. 바이오패닝으로부터 수득되는 펩타이드 중에, 미모토프(mimotope)는 펩타이드 앱타머의 한 종류로서 간주될 수 있다. 조합 펩타이드 라이브러리로부터 패닝된 펩타이드는 명칭이 MimoDB인 특수 데이터에 저장되었다.
예시적인 이펙터 모이어티는 하기를 포함할 수 있지만 이로 한정되지 않는다: 유비퀴틴, 유비퀴틴 리가제 억제제로서의 바이사이클릭 펩타이드, 전사 인자, DNA 및 단백질 변형 효소, 예컨대 토포이소머라제, 토포이소머라제 억제제, 예컨대 토포테칸, DNA 메틸트랜스퍼라제, 예컨대 DNMT 패밀리(예를 들어, DNMT3A, DNMT3B, DNMT3a/3L, MQ1), 단백질 메틸트랜스퍼라제(예를 들어, 바이러스 라이신 메틸트랜스퍼라제(vSET), 단백질-라이신 N-메틸트랜스퍼라제(SMYD2), 데아미나제(예를 들어, APOBEC, UG1), 히스톤 메틸트랜스퍼라제, 예컨대 제스트 인핸서 상동체 2(enhancer of zeste homolog 2, EZH2), PRMT1, 히스톤-라이신-N-메틸트랜스퍼라제(Setdb1), 히스톤 메틸트랜스퍼라제(SET2), 진정 염색질(euchromatic) 히스톤-라이신 N-메틸트랜스퍼라제 2(G9a), 히스톤-라이신 N-메틸트랜스퍼라제(SUV39H1), 및 G9a), 히스톤 데아세틸라제(예를 들어, HDAC1, HDAC2, HDAC3), DNA 탈메틸화에서 역할을 갖는 효소(예를 들어, TET 패밀리 효소는 5-메틸시토신의 5-하이드록시메틸시토신 및 더 고차의 산화적 유도체로의 산화를 촉매함), 단백질 데메틸라제, 예컨대 KDM1A 및 라이신-특이적 히스톤 데메틸라제 1(LSD1), 헬리카제, 예컨대 DHX9, 데아세틸라제(예를 들어, 시르투인(sirtuin) 1, 2, 3, 4, 5, 6, 또는 7), 키나제, 포스파타제, DNA 삽입제, 예컨대 에티듐 브로마이드, SYBR 그린, 및 프로플라빈, 유출 펌프(efflux pump) 억제제, 예컨대 페닐알라닌 아르기닐 β-나프틸아미드 또는 퀴놀린 유도체와 같은 펩타이드모방체, 핵 수용체 활성화제 및 억제제, 프로테아좀 억제제, 리소좀 저장 질환에 관여하는 것들과 같은 효소에 대한 경쟁적 억제제, 단백질 합성 억제제, 뉴클레아제(예를 들어, Cpf1, Cas9, 징크 핑거 뉴클레아제), 단백질 유래 도메인, 예컨대 KRAB 도메인, 및 이들 중 하나 이상의 융합체(예를 들어, dCas9-DNMT, dCas9-MQ1, dCas9-KRAB).
일부 구현예에서, 당업자에게 알려진 방법에 의해 이펙터 모이어티로서 사용하기에 적합한 것으로 후보 도메인이 결정될 수 있다. 예를 들어, 후보 이펙터 모이어티가 세포의 핵 내에 존재하고, (예를 들어, 표적 유전자 또는 상기 표적 유전자에 작동가능하게 연결된 전사 제어 요소에, 예를 들어 표적화 모이어티를 통해) 적절하게 국재화될 때, 후보 이펙터 모이어티가 세포 내의 표적 유전자의 발현을 감소시키는지, 예를 들어 표적 유전자에 의해 인코딩된 RNA 전사체의 수준을 감소시키는지(예를 들어, RNASeq 또는 노턴 블롯(Northern blot)에 의해 측정되는 바와 같음), 또는 표적 유전자에 의해 인코딩된 단백질의 수준을 감소시키는지(예를 들어, ELISA에 의해 측정되는 바와 같음)의 여부를 분석함으로써 후보 리프레서 도메인이 시험될 수 있다.
일부 구현예에서, 발현 리프레서는 복수의 이펙터 모이어티를 포함하며, 여기서 각 이펙터 모이어티는 또 다른 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 이펙터 모이어티는 제2 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다.
일부 구현예에서, 발현 억제 시스템은 복수의 발현 리프레서를 포함하며, 여기서 복수의 발현 리프레서의 각 구성원은 이펙터 모이어티를 포함하며, 여기서 각 이펙터 모이어티는 또 다른 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 이펙터 모이어티는 제2 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 이펙터 모이어티는 또 다른 제1 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않고, 제2 이펙터 모이어티는 제2 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 본 명세서에 기재된 조성물 및 방법에 사용하기 위한 이펙터 모이어티는 단량체성 상태, 예를 들어 비-이량체성 상태에서 기능성이다.
일부 구현예에서, 이펙터 모이어티는 후성유전학적 변형 모이어티, 예를 들어 염색질의 2차원 구조를 조절하는(즉, 염색질의 2차원 표현을 변경시키는 방식으로 염색질의 구조를 조절하는) 후성유전학적 변형 모이어티이거나 이를 포함한다.
본 개시내용의 방법 및 조성물에 유용한 후성유전학적 변형 모이어티는 후성유전학적 마커, 예를 들어 DNA 메틸화, 히스톤 메틸화, 히스톤 아세틸화, 히스톤 수모화, 히스톤 인산화, 및 RNA-연관 침묵에 영향을 주는 작용제를 포함한다. 본 명세서에 기재된 바와 같은 게놈 서열 요소에 표적화될 수 있는 예시적인 후성유전학적 효소는 DNA 메틸라제(예를 들어, DNMT3a, DNMT3b, DNMT3a/3L, MQ1), DNA 탈메틸화(예를 들어, TET 패밀리), 히스톤 메틸트랜스퍼라제, 히스톤 데아세틸라제(예를 들어, HDAC1, HDAC2, HDAC3), 시르투인 1, 2, 3, 4, 5, 6, 또는 7, 라이신-특이적 히스톤 데메틸라제 1(LSD1), 히스톤-라이신-N-메틸트랜스퍼라제(Setdb1), 진정 염색질 히스톤-라이신 N-메틸트랜스퍼라제 2(G9a), 히스톤-라이신 N-메틸트랜스퍼라제(SUV39H1), 제스트 인핸서 상동체 2(EZH2), 바이러스 라이신 메틸트랜스퍼라제(vSET), 히스톤 메틸트랜스퍼라제(SET2), 및 단백질-라이신 N-메틸트랜스퍼라제(SMYD2)를 포함한다. 그러한 후성유전학적 변형제의 예는, 예를 들어 문헌[de Groote et al. Nuc. Acids Res. (2012):1-18]에 기재되어 있다.
일부 구현예에서, 발현 리프레서, 예를 들어 본 발명에 유용한 후성유전학적 변형 모이어티를 포함하는 발현 리프레서는 문헌[Koferle et al. Genome Medicine 7.59 (2015):1-3]에 기재된 작제물이거나 이를 포함하며, 이는 본 명세서에 참조로 포함된다. 예를 들어, 일부 구현예에서, 발현 리프레서는 문헌[Koferle et al.]의 표 1에서 확인되는 작제물, 예를 들어 표 1에 기재된 히스톤 데아세틸라제, 히스톤 메틸트랜스퍼라제, DNA 탈메틸화, 또는 H3K4 및/또는 H3K9 히스톤 데메틸라제(예를 들어, dCas9-p300, TALE-TET1, ZF-DNMT3A, 또는 TALE-LSD1)이거나 이를 포함한다.
일부 구현예에서, 이펙터 모이어티는 유전자 편집 시스템의 성분, 예를 들어 CRISPR/Cas 도메인, 예를 들어 Zn 핑거 도메인, 예를 들어 TAL 이펙터 도메인을 포함한다. 일부 구현예에서, 후성유전학적 변형 모이어티는 gRNA에 연결되는 폴리펩타이드(예를 들어, 펩타이드 또는 단백질 모이어티) 및 표적화 뉴클레아제, 예를 들어 Cas9, 예를 들어 야생형 Cas9, 닉카제 Cas9(예를 들어, Cas9 D10A), 촉매적으로 비활성인 Cas9(dCas9), eSpCas9, Cpf1, C2C1, 또는 C2C3, 또는 그러한 뉴클레아제를 인코딩하는 핵산을 포함할 수 있다.
본 명세서에 사용되는 바와 같이, "이펙터 도메인의 생물학적 활성 부분"은 이펙터 도메인의 기능을 (예를 들어, 완전히, 부분적으로, 최소한으로) 유지하는 일부분(예를 들어, "최소" 또는 "코어" 도메인)이다. 일부 구현예에서, dCas9와 후성유전학적 변형제(예컨대, DNA 메틸화의 역할을 하는 DNA 메틸라제 또는 효소, 예를 들어 DNMT3a, DNMT3b, DNMT3L, DNMT 억제제, 이들의 조합, TET 패밀리 효소, 단백질 아세틸 트랜스퍼라제 또는 데아세틸라제, dCas9-DNMT3a/3L, dCas9-DNMT3a/3L/KRAB, dCas9/VP64)의 하나 이상의 이펙터 도메인의 전부 또는 일부와의 융합은 폴리펩타이드와 연결되고 본 명세서에 기재된 방법에 유용한 키메라 단백질을 형성한다. 그러한 키메라 단백질을 포함하는 이펙터 모이어티는 유전자 변형 모이어티(유전자 편집 시스템 성분인 Cas9의 사용으로 인함) 또는 후성유전학적 변형 모이어티(후성유전학적 변형제의 이펙터 도메인의 사용으로 인함)로 지칭된다.
일부 구현예에서, 제공된 기술은 표적 유전자를 특이적으로 표적화하는 gRNA를 포함하는 것으로 기재된다. 일부 구현예에서, 표적 유전자는 종양유전자, 종양 억제인자, 또는 MYC 오조절 장애 관련 유전자이다. 일부 구현예에서, 표적 유전자는 MYC이다.
일부 구현예에서, 본 명세서에서 제공되는 기술은 그러한 모이어티를 융합 분자의 일부로서 표적화 모이어티에 연결함으로써, 본 명세서에 기재된 하나 이상의 유전자 변형 모이어티(예를 들어, CRISPR 시스템 성분)를 대상체에게, 예를 들어 대상체의 세포 또는 조직의 핵에 전달하는 방법을 포함한다. 일부 구현예에서, 본 명세서에서 제공되는 기술은 지질 나노입자에서 하나 이상의 유전자 변형 모이어티(예를 들어, CRISPR 시스템 성분)를 캡슐화함으로써, 본 명세서에 기재된 하나 이상의 유전자 변형 모이어티(예를 들어, CRISPR 시스템 성분)를 대상체에게, 예를 들어 대상체의 세포 또는 조직의 핵에 전달하는 방법을 포함한다.
추가의 모이어티
발현 리프레서는 (예를 들어, 하나 이상의 표적화 모이어티 및 하나 이상의 이펙터 모이어티에 추가하여) 하나 이상의 추가의 모이어티를 추가로 포함할 수 있다. 일부 구현예에서, 추가의 모이어티는 태깅 또는 모니터링 모이어티, 절단성 모이어티(예를 들어, DNA-표적화 모이어티와 이펙터 모이어티 사이에 위치하거나, 폴리펩타이드의 N- 또는 C-말단 단부에 위치한 절단성 모이어티), 소분자, 막 전좌 폴리펩타이드, 또는 약제 모이어티로부터 선택된다.
예시적인 발현 리프레서
하기의 예시적인 발현 리프레서는 단지 예시 목적으로 제시되며, 제한적인 것으로 의도되지 않는다.
일부 구현예에서, 발현 리프레서는 dCas9, 예를 들어 S. 아우레우스 dCas9를 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 68(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 발현 리프레서는 서열번호 119의 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 68, 119의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-MQ1 뉴클레오타이드 서열:
일부 구현예에서, 발현 리프레서는 서열번호 35 또는 151의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 35 또는 151의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-MQ1 단백질 서열:
일부 구현예에서, 발현 리프레서는 dCas9, 예를 들어 S. 피오게네스 dCas9를 포함하는 표적화 모이어티, 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 67(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 67의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-KRAB 뉴클레오타이드 서열:
일부 구현예에서, 발현 리프레서는 서열번호 34 또는 150의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 34, 150의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-KRAB 단백질 서열:
일부 구현예에서, 발현 리프레서는 dCas9, 예를 들어 S. 아우레우스 dCas9를 포함하는 DNA-표적화 모이어티, 및 DNMT1, 예를 들어 인간 DNMT1을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 69(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 69의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-DNMT1 뉴클레오타이드 서열
일부 구현예에서, 발현 리프레서는 서열번호 36 또는 152의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 36 또는 152의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-DNMT1 단백질 서열:
일부 구현예에서, 발현 리프레서는 dCas9, 예를 들어 S. 아우레우스 dCas9를 포함하는 DNA-표적화 모이어티, 및 DNMT13a/3L을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 70(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 70의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-DNMT3a/3L 뉴클레오타이드 서열
일부 구현예에서, 발현 리프레서는 서열번호 37 또는 153의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 37의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-DNMT3a/3L 단백질 서열
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인을 포함하는 표적화 모이어티, 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 55, 56, 57, 58, 59, 60, 189, 194, 195, 및 196 중 임의의 것(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열에 의해 인코딩된다. 이러한 예시적인 발현 리프레서의 핵산 서열은 표 6에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 55 내지 60, 189, 194 내지 196 중 임의의 것의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다. 일부 구현예에서 핵산 서열은 폴리-A 서열을 포함하고, 다른 구현예에서 핵산은 폴리-A 서열이 결여되어 있다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 5 내지 10 또는 169 내지 172 중 임의의 것에 따른 아미노산 서열을 가짐)을 포함하는 표적화 모이어티, 및 KRAB(예를 들어, 서열번호 18의 아미노산 서열), 예를 들어 KRAB 도메인을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 22, 23, 24, 25, 26, 27, 139 내지 144, 177 내지 180, 또는 183 내지 186 중 임의의 것의 아미노산 서열을 포함한다. 이러한 예시적인 발현 리프레서의 단백질 서열은 표 7에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 22 내지 27, 139 내지 144, 177 내지 180, 183 내지 186 중 임의의 것의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 44 내지 49 또는 115 중 임의의 것의 뉴클레오타이드 서열에 의해 인코딩되는 것)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 52의 뉴클레오타이드 서열에 의해 인코딩되는 것)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 61, 62, 63, 64, 65, 66, 116, 117, 118, 또는 130의 핵산 서열에 의해 인코딩된다. 이러한 예시적인 발현 리프레서의 핵산 서열은 표 8에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 61 내지 66, 116 내지 118, 130 중 임의의 것의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다. 일부 구현예에서 핵산 서열은 폴리-A 서열을 포함하고, 다른 구현예에서 핵산은 폴리-A 서열이 결여되어 있다. 예를 들어, 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 61 내지 66, 116 내지 118, 또는 130 중 임의의 것에 따른 서열(또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열)을 포함하지만, 3' 폴리-A-서열이 결여되어 있거나, 더 짧은 길이의 3' 폴리-A-서열을 포함하는 서열을 포함한다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 11 내지 14 중 임의의 것의 아미노산 서열을 포함함)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 19)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 28, 29, 30, 31, 32, 33, 129, 및 145 내지 149 중 임의의 것의 아미노 서열을 포함한다. 이러한 예시적인 발현 리프레서의 단백질 서열은 표 9에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 28 내지 33, 129 중 임의의 것의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 11 내지 14 중 임의의 것의 아미노산 서열을 가짐)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 87)을 포함하는 이펙터 모이어티를 포함한다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 166 내지 168 중 임의의 것의 뉴클레오타이드 서열에 의해 인코딩되는 것)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 52의 뉴클레오타이드 서열에 의해 인코딩되는 것)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 157, 158, 또는 159의 핵산 서열에 의해 인코딩된다. 이러한 예시적인 발현 리프레서의 핵산 서열은 표 16에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 166 내지 168 중 임의의 것의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다. 일부 구현예에서 핵산 서열은 폴리-A 서열을 포함하고, 다른 구현예에서 핵산은 폴리-A 서열이 결여되어 있다. 예를 들어, 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 166 내지 168 중 임의의 것에 따른 서열(또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열)을 포함하지만, 3' 폴리-A-서열이 결여되어 있거나, 더 짧은 길이의 3' 폴리-A-서열을 포함하는 서열을 포함한다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 154 내지 156 중 임의의 것의 아미노산 서열을 포함함)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 19)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 160 내지 165 중 임의의 것의 아미노 서열을 포함한다. 이러한 예시적인 발현 리프레서의 단백질 서열은 표 17에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 160 내지 165 중 임의의 것의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 본 개시내용은 제1 ZF를 포함하는 제1 표적화 모이어티, DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 기능성 단편을 포함하는 제1 이펙터 모이어티, 제2 ZF를 포함하는 제2 표적화 모이어티, 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 제2 이펙터 모이어티를 포함하는 발현 리프레서 시스템을 제공한다. 일부 구현예에서, 발현 리프레서 시스템은 제1 표적화 모이어티 및 제1 이펙터 모이어티를 인코딩하는 제1 핵산(여기서, 발현은 제1 프로모터 또는 IRES에 의해 구동됨), 및 제2 표적화 모이어티 및 제2 이펙터 모이어티를 인코딩하는 제2 핵산(여기서, 발현은 제2 프로모터 또는 IRES에 의해 구동됨)에 의해 인코딩된다. 일부 구현예에서, 단일-시스트론(mono-cistronic) 서열이 사용된다. 일부 구현예에서, 발현 리프레서 시스템을 인코딩하는 핵산은 다중-시스트론(multi-cistronic) 서열이다. 일부 구현예에서, 다중-시스트론 서열은 이중-시스트론(bi-cistronic) 서열이다. 일부 구현예에서, 다중-시스트론 서열은 제1 발현 리프레서를 인코딩하는 서열 및 제2 발현 리프레서를 인코딩하는 서열을 포함한다. 일부 구현예에서, 다중-시스트론 서열은 자가-절단성 펩타이드 서열, 예를 들어 2A 펩타이드 서열, 예를 들어 T2A 펩타이드 서열, P2A 서열을 인코딩한다. 일부 구현예에서, 다중-시스트론 서열은 T2A 펩타이드 서열 및 P2A 펩타이드 서열을 인코딩한다. 일부 구현예에서, 다중-시스트론 서열은 탠덤 2A 서열, 예를 들어 tPT2A 서열을 인코딩한다. 일부 구현예에서, 다중-시스트론 작제물은 5'에서 3'으로, (i) 제1 핵 국재화 신호, 예를 들어 SV40 NLS, (ii) 제1 표적화 모이어티, 예를 들어 DNA 결합 도메인, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF-9, (iii) 제1 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1, (iv) 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS, (v) 링커, 예를 들어 tPT2A 링커, (vi) 제3 핵 국재화 신호, 예를 들어 SV40NLS, (vii) 제2 표적화 모이어티, 예를 들어 DNA 결합 도메인, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF-3, (viii) 제2 이펙터 모이어티, 예를 들어 전사 리프레서 모이어티, 예를 들어 KRAB, 및 (ix) 제4 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS를 인코딩한다. 일부 구현예에서, 이중-시스트론 작제물은 폴리A 테일을 추가로 포함한다. 일부 구현예에서, 이중-시스트론 작제물의 전사 시, 제1 발현 리프레서, 및 제2 발현 리프레서를 인코딩하는 단일 mRNA 전사체가 생산되며, 이는 번역 시, 예를 들어 2A 펩타이드 내의 글리신 잔기 이후에 절단되어, 2개의 별개의 단백질로서 제1 발현 리프레서 및 제2 발현 리프레서를 산출한다. 일부 구현예에서, 제1 및 제2 발현 리프레서는 "리보솜-스킵핑"에 의해 분리된다. 일부 구현예에서 제1 발현 리프레서 및/또는 제2 발현 리프레서는 리보솜 스킵핑 후 2A 펩타이드의 단편을 유지한다. 일부 구현예에서, 제1 및 제2 발현 리프레서의 발현 수준은 동일하다. 일부 구현예에서, 제1 및 제2 발현 리프레서의 발현 수준은 상이하다. 일부 구현예에서, 제1 발현 리프레서의 단백질 수준은 제2 발현 리프레서의 단백질 수준의 1%, 2%, 5%, 또는 10% 이내(더 크거나 더 작음)이다.
일부 구현예에서, 이중-시스트론 핵산에 의해 인코딩되는 시스템은 표적 유전자(예를 들어, MYC)의 발현을 다르게는 유사한 시스템보다 세포에서 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50% 감소시키며, 제1 및 제2 발현 리프레서는 단일-시스트론 핵산에 의해 인코딩된다.
일부 구현예에서, 이중-시스트론 서열은 서열번호 91, 92, 121, 122, 181, 182, 187, 188의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다. 일부 구현예에서, 발현 리프레서 시스템은 Zn 핑거 도메인(예를 들어, 서열번호 7 내지 13 중 임의의 것의 아미노산 서열을 포함함)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 19) 또는 KRAB, 예를 들어 KRAB 도메인(예를 들어, 서열번호 18)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 91, 92, 121, 122, 181, 182, 187, 188 중 임의의 것의 아미노 서열을 포함한다. 이러한 예시적인 발현 리프레서 시스템의 단백질 서열은 표 10에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서 시스템은 서열번호 91 내지 92, 121 내지 122, 181, 182, 187, 188 중 임의의 것의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 이중-시스트론 서열은 서열번호 93 또는 112(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA)) 또는 서열번호 94 또는 113(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열을 포함한다. 일부 구현예에서, 이중-시스트론 서열은 서열번호 196(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA)) 또는 서열번호 197(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 93, 94, 112, 113, 196, 또는 197의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다. 이러한 예시적인 발현 리프레서 시스템을 인코딩하는 핵산 서열은 표 10에 개시되어 있다. 일부 구현예에서 핵산 서열은 폴리-A 서열을 포함하고, 다른 구현예에서 핵산은 폴리-A 서열이 결여되어 있다.
일부 구현예에서, 발현 리프레서는 핵 국재화 서열(NLS)을 포함한다. 일부 구현예에서, 발현 리프레서는 NLS, 예를 들어 N-말단에 있는 SV40 NLS를 포함한다. 일부 구현예에서, 발현 리프레서는 NLS, 예를 들어 C-말단에 있는 뉴클레오플라스민 NLS를 포함한다. 일부 구현예에서, 발현 리프레서는 N-말단에 있는 제1 NLS 및 C-말단에 있는 제2 NLS를 포함한다. 일부 구현예에서, 제1 NLS와 제2 NLS는 동일한 서열을 갖는다. 일부 구현예에서, 제1 NLS와 제2 NLS는 상이한 서열을 갖는다. 일부 구현예에서, 발현 억제 리프레서는 SV40 NLS를 포함하며, 예를 들어 발현 리프레서는 PKKKRK(서열번호 135)에 따른 서열을 포함한다. 일부 구현예에서, N-말단 서열은, 예를 들어 MAPKKKRKVGIHGVPAAGSSGS(서열번호 88)에 따른 서열을 갖는 스페이서 및 NLS를 포함한다. 일부 구현예에서, 발현 리프레서는, 예를 들어 스페이서, 뉴클레오플라스민 핵 국재화 서열 및 HA-태그: 예를 들어 SGGKRPAATKKAGQAKKKGSYPYDVPDYA(서열번호 89) 중 하나 이상, 예를 들어 이들 중 임의의 2개 또는 3개 모두를 포함한다. 일부 구현예에서, 발현 리프레서는 에피토프 태그는 에피토프 태그, 예를 들어 HA 태그: YPYDVPDYA(서열번호 90)를 포함한다. 예를 들어, 발현 리프레서는 에피토프 태그의 2개의 카피를 포함할 수 있다.
에피토프 태그가 많은 연구 상황에서 유용하지만, 치료적 상황에서는 에피토프 태그를 생략하는 것이 때때로 바람직하다. 따라서, 일부 구현예에서, 발현 리프레서는 에피토프 태그가 결여되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 본 명세서에 제공된 서열(또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열)을 포함하지만, 서열번호 90의 HA 태그가 결여되어 있다. 일부 구현예에서, 본 명세서에 기재된 핵산은 본 명세서에 제공된 서열(또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열)을 포함하지만, 서열번호 90의 HA 태그를 인코딩하는 영역이 결여되어 있다. 일부 구현예에서, 발현 리프레서는 뉴클레오플라스민 NLS를 포함하며, 예를 들어 발현 리프레서는 KRPAATKKAGQAKKK(서열번호 136)의 서열을 포함한다. 일부 구현예에서, 발현 리프레서는 NLS를 포함하지 않는다. 일부 구현예에서, 발현 리프레서는 에피토프 태그를 포함하지 않는다. 일부 구현예에서 발현 리프레서는 HA 태그를 포함하지 않는다. 일부 구현예에서, 발현 리프레서는 서열번호 90에 따른 HA 태그 서열을 포함하지 않는다.
일부 구현예에서, 본 개시내용은 자가-절단 펩타이드를 포함하는 발현 리프레서 시스템을 제공한다. 피코르나바이러스에서 처음 발견된 자가-절단 펩타이드는 19 내지 22개 아미노산 길이의 펩타이드이며, 보통 피코르나바이러스 패밀리의 일부 구성원의 2가지 단백질 사이에서 발견된다. 자가-절단 단백질을 사용하여, 피코르나바이러스는 동일한 mRNA에서 등몰 수준의 여러 유전자를 생산할 수 있다. 그러한 자가-절단 단백질은 다른 종의 바이러스에서 발견되는 것으로 알려져 있으며, 본 명세서에 제공된 정보에 기반하여 당업자는 필요한 경우 본 명세서에 개시된 자가-절단 단백질에 대한 적합한 치환을 쉽게 결정할 수 있을 것이다. 일부 구현예에서, 발현 리프레서 시스템은 자가-절단 펩타이드, 예를 들어 2A 자가-절단 펩타이드를 포함한다. 일부 구현예에서, 2A 펩타이드는 단일 절단 부위, 예를 들어 2A 펩타이드, 예를 들어 P2A, T2A, E2A, 또는 F2A 펩타이드를 포함한다. 일부 구현예에서, 자가-절단 펩타이드, 예를 들어 2A 펩타이드는 2개 절단 부위, 예를 들어 pPT2A, 또는 P2A-T2A-E2A를 포함한다. 일부 구현예에서, 발현 리프레서 시스템은 복수의 절단 부위를 포함하는 자가-절단 펩타이드, 예를 들어 T2A 자가-절단 펩타이드 및 P2A 자가-절단 펩타이드를 포함한다. 일부 구현예에서, 2A 펩타이드는 번역 후에 절단된다. 일부 구현예에서, 자가-절단 펩타이드는 절단 후에 2개 이상의 단편을 생산한다. 일부 구현예에서, 2A 펩타이드 단편은 서열번호 126 내지 128의 서열을 포함한다. 일부 구현예에서, 2A 자가-절단 펩타이드는 서열번호 120, 124, 125의 서열 또는 이의 유도체를 포함한다. 일부 구현예에서, 서열번호 95는 자가-절단 펩타이드의 서열을 포함한다.
PSSGGKRPAATKKAGQAKKKKGSYPYDVPDYAGSYPYDVPDYAATNFSLLKQAGDVEENPGPTSAGKLGSGEGRGSLLTCGDVEENPGPLEGSSGSGSPKKKRKVGIHGVPAAGSSGS (서열번호 95)
EGRGSLLTCGDVEENPGP (서열번호 120)
ATNFSLLKQAGDVEENPGPTSAGKLGSGEGRGSLLTCGDVEENPGP (서열번호 124)
ATNFSLLKQAGDVEENPGP (서열번호125)
ATNFSLLKQAGDVEENPG (서열번호 126)
PTSAGKLGSGEGRGSLLTCGDVEENPG (서열번호 127)
P (서열번호 128)
2A 서열, 예를 들어 tPT2A 서열(예를 들어, 서열번호 124에 따름)은 과학 문헌 및 본 명세서에서 자가-절단 펩타이드로 지칭될 수 있지만, 이는 비-제한적인 이론에 따른 것임이 물론 이해된다. 또 다른 비-제한적인 이론에 따르면, 일부 구현예에서 2A 서열은 리보솜-스킵핑을 통해 작용한다. 예를 들어, 2A 서열을 인코딩하는 mRNA는 리보솜 스킵핑을 유도할 수 있으며, 여기서 리보솜은 2A 영역을 번역하는 동안 펩타이드 결합을 형성하지 못하여, 번역 산물의 첫 번째 부분을 방출하게 된다. 그 다음 리보솜은 번역 산물의 두 번째 부분을 생산한다. 전체적으로, 제1 서열과 제2 서열 사이에 위치한 2A 서열이 제1 서열을 포함하는 제1 단백질과, 제2 서열을 포함하는 별개의 제2 단백질의 생산을 야기할 것이라는 것은 잘 확립되어 있다. 본 개시내용은 이것이 달성되는 분자 메커니즘에 관한 임의의 특정 이론에 의해 구속되지 않는다.
기능적 특성
본 개시내용의 발현 리프레서 또는 시스템은 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 감소시키는 데 사용될 수 있다. 일반적으로, 본 명세서에 기재된 바와 같은 발현 리프레서 또는 시스템은 (예를 들어, 표적화 모이어티를 통해) 표적 유전자, 예를 들어 MYC에 근접하고/하거나 이에 작동가능하게 연결된 게놈 서열 요소에 결합한다. 일부 구현예에서, 게놈 서열 요소에 대한 발현 리프레서 또는 시스템의 결합은 표적 유전자, 예를 들어 MYC의 발현을 조절한다(예를 들어, 감소시킨다). 예를 들어, 게놈 서열 요소에 대한 전사 기구의 성분의 동원을 억제하는 이펙터 모이어티를 포함하는 발현 리프레서 또는 시스템의 결합은 표적 유전자, 예를 들어 MYC의 발현을 조절할(예를 들어, 감소시킬) 수 있다. 추가의 예로서, 효소 활성을 갖는 이펙터 모이어티(예를 들어, 후성유전학적 변형 모이어티)를 포함하는 발현 리프레서 또는 시스템의 결합은 이펙터 모이어티의 국재화된 효소 활성을 통해 표적 유전자, 예를 들어 MYC의 발현을 조절할(예를 들어, 감소시킬) 수 있다. 추가의 예로서, 게놈 서열 요소에 대한 발현 리프레서 또는 시스템의 결합 및 발현 리프레서 또는 시스템의 국재화된 효소 활성 둘 다는 표적 유전자, 예를 들어 MYC의 발현에 있어서의 생성되는 조절(예를 들어, 감소)에 기여할 수 있다.
일부 구현예에서, 발현의 감소는 표적 유전자, 예를 들어 MYC에 의해 인코딩되는 RNA, 예를 들어 mRNA의 수준의 감소를 포함한다. 일부 구현예에서, 발현의 감소는 표적 유전자, 예를 들어 MYC에 의해 인코딩되는 단백질의 수준의 감소를 포함한다. 일부 구현예에서, 발현의 감소는 표적 유전자, 예를 들어 MYC에 의해 인코딩되는 mRNA 및 단백질의 수준 둘 다의 감소를 포함한다. 일부 구현예에서, 본 명세서에 개시된 발현 리프레서 또는 발현 억제 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자의 발현은 본 명세서에 개시된 발현 리프레서 또는 발현 억제 시스템에 의해 접촉되지 않거나 이를 포함하지 않는 세포 내의 표적 유전자의 발현 수준보다 적어도 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.55×, 1.6×, 1.65×, 1.7×, 1.75×, 1.8×, 1.85×, 1.9×, 1.95×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 30×, 40×, 50×, 60×, 70×, 80×, 90×, 또는 100× 더 낮다. 표적 유전자, 예를 들어 MYC의 발현은 RT-PCR, ELISA, 웨스턴 블롯을 포함한 당업자에게 알려진 방법, 및 실시예 2 또는 9의 방법에 의해 분석될 수 있다. 대상체, 예를 들어 환자, 예를 들어 MYC 오조절 장애를 갖는 환자, 예를 들어 간 질환을 갖는 환자, 신생물 및/또는 바이러스 또는 알코올 관련 간 질환을 갖는 환자, 예를 들어 간암종을 갖는 환자, 예를 들어 간암종 하위유형 S1 또는 간암종 하위유형 S2를 갖는 환자에서 표적 유전자, 예를 들어 MYC의 발현 수준은 표적 유전자, 예를 들어 MYC의 혈액(예를 들어, 전혈) 수준을 평가함으로써, 예를 들어 문헌[Oglesbee et al. Clin Chem. 2013 Oct;59(10):1461-9. Doi: 10.1373/clinchem.2013.207472] 또는 [Deutsch et al. J Neurol Neurosurg Psychiatry. 2014 Sep;85(9):994-1002. Doi: 10.1136/jnnp-2013-306788]의 방법에 의해 평가될 수 있으며, 이의 내용은 전체적으로 본 명세서에 참조로 포함된다.
본 개시내용의 발현 리프레서 또는 시스템은 일정 기간 동안 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 감소시키는 데 사용될 수 있다. 일부 구현예에서, 발현 리프레서 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자, 예를 들어 MYC의 발현은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 14, 또는 15일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 상당히 감소된다. 선택적으로, 발현 리프레서 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자, 예를 들어 MYC의 발현은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하 동안 상당히 감소된다. 일부 구현예에서, 발현 리프레서 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자, 예를 들어 MYC의 발현은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10회 세포 분열 동안 상당히 감소된다. 본 개시내용의 발현 리프레서 또는 시스템은 표적 프로모터, 예를 들어 MYC 프로모터에서 CpG 뉴클레오타이드를 메틸화하는 데 사용될 수 있다. 일부 구현예에서, MYC 발현의 전사 변화는 CpG 메틸화의 백분율과 상관관계가 있다. 일부 구현예에서, 메틸화는 본 명세서에 개시된 발현 리프레서 또는 시스템으로 치료 후 적어도 1일, 적어도 2일, 적어도 5일, 적어도 7일, 적어도 10일, 적어도 15일, 또는 적어도 20일 동안 지속된다.
본 개시내용의 발현 리프레서 또는 시스템은 표적 유전자좌, 예를 들어 MYC 유전자좌를 포함하는 세포의 생존능을 감소시키는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 표적 유전자좌, 예를 들어 MYC 유전자좌를 포함하는 복수의 세포의 생존능을 감소시는 데 사용될 수 있다. 일부 구현예에서, 발현 리프레서, 또는 시스템에 의해 접촉되거나 이를 포함하는 생존 세포의 수는 발현 리프레서 또는 시스템에 의해 접촉되지 않거나 이를 포함하지 않는 세포의 대조군 집단의 생존 세포의 수와 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 상당히 감소된다.
일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 암 세포 및 비-암 세포를 포함하는 복수의 세포의 생존능을 감소시는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 더 많이 감소시키는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 많이 감소시키는 데 사용될 수 있다.
일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 감염 세포 및 비감염 세포를 포함하는 복수의 세포의 생존능을 감소시는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 복수의 비감염 세포의 생존능을 감소시키는 것보다 복수의 감염 세포의 생존능을 더 많이 감소시키는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 복수의 비감염 세포의 생존능을 감소시키는 것보다 복수의 감염 세포의 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 많이 감소시키는 데 사용될 수 있다.
발현 억제 시스템은 복수의 발현 리프레서를 포함할 수 있으며, 각 발현 리프레서는 다른 발현 리프레서의 이펙터 모이어티와 상이한 기능성을 갖는 이펙터 모이어티를 포함한다. 예를 들어, 발현 억제 시스템은 2개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 발현 리프레서는 후성유전학적 변형 모이어티를 포함하는 제1 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1을 포함하고 제2 발현 리프레서는 전사 리프레서, 예를 들어 KRAB를 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 제2 발현 리프레서는 제2 이펙터 모이어티를 포함하지 않는다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 MYC의 발현의 억제에 대해 서로 상보적인 기능성을 갖는 이펙터 모이어티의 조합을 포함하는 발현 리프레서를 포함하며, 이들 기능성은 함께, 발현을 억제할 수 있고, 선택적으로, 개별적으로 존재할 때에는 발현을 억제하지 않거나 무시할 만한 정도로 억제한다. 일부 구현예에서, 발현 억제 시스템은 복수의 발현 리프레서를 포함하며, 여기서 각 발현 리프레서는 서로의 발현 리프레서의 이펙터 모이어티를 보완하는 이펙터 모이어티를 포함하고, 예를 들어 각 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다.
일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 MYC의 발현의 억제에 대해 서로 상승작용하는 기능성을 갖는 이펙터 모이어티의 조합을 포함하는 발현 리프레서를 포함한다. 이론에 의해 구애되고자 함이 없이, 다수의 억제 후성유전학적 마커(예를 들어, 다수의 상이한 유형의 후성유전학적 마커 및/또는 주어진 유형의 더 광범위한 마킹)가 개별적으로, 단독으로의 개별적인 변형보다 더 효과적으로 발현을 함께 감소시킨다는 점에서(예를 들어, 발현의 더 큰 감소의 생성 및/또는 발현의 더 오래 지속된 감소), 게놈 유전자좌에 대한 후성유전학적 변형은 누적될 수 있다. 일부 구현예에서, 발현 억제 시스템은 복수의 발현 리프레서를 포함하며, 여기서 각 발현 리프레서는 서로의 발현 리프레서의 이펙터 모이어티와 상승작용하는 이펙터 모이어티를 포함하고, 예를 들어 각 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다.
일부 구현예에서, 발현 리프레서 또는 시스템은 표적 유전자, 예를 들어 MYC와 연관된 하나 이상의 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열을 변경시킴으로써 표적 유전자, 예를 들어 MYC의 발현을 조절한다(예를 들어, 감소시킨다). 일부 구현예에서, 변경시키는 것은 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열의 수준을 감소시키는 것을 포함한다. 후성유전학적 마커는 DNA 메틸화, 히스톤 메틸화, 및 히스톤 데아세틸화를 포함하지만 이에 제한되지 않는다.
일부 구현예에서, 후성유전학적 마커의 수준을 변경시키는 것은 리프레서 또는 시스템에 의해 접촉되지 않거나 이를 포함하지 않는 세포 내의 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열의 수준보다 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 대조군 서열의 수준을 적어도 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.55×, 1.6×, 1.65×, 1.7×, 1.75×, 1.8×, 1.85×, 1.9×, 1.95×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 30×, 40×, 50×, 60×, 70×, 80×, 90×, 또는 100× 더 낮게 감소시킨다. 후성유전학적 마커의 수준은 전체 게놈 중아황산염 서열분석, 감소된 표현의 중아황산염 서열분석, 중아황산염 앰플리콘 서열분석, 메틸화 어레이, 파이로시퀀싱, ChIP-seq, 또는 ChIP-qPCR을 포함한 당업자에게 알려진 방법에 의해 분석될 수 있다. 일부 구현예에서, 후성유전학적 마커, 예를 들어 DNA 메틸화의 변화(예를 들어, 증가 또는 감소)는, 예를 들어 hg19 참조 게놈에 따른 chr8:129188693-129189048 사이에서 hg19 참조 게놈에 따른 정확한 게놈 좌표에서 중아황산염 게놈 서열분석을 사용하여 분석될 수 있다. 일부 구현예에서, 후성유전학적 마커, 예를 들어 DNA 메틸화의 변화(예를 들어, 증가 또는 감소)는 서열번호 123에 따른 게놈 위치에서 중아황산염 게놈 서열분석을 사용하여 분석될 수 있다.
본 개시내용의 발현 리프레서 또는 시스템은 일정 기간 동안 세포 내의 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열의 수준을 변경시키는 데 사용될 수 있다. 일부 구현예에서, 발현 리프레서 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열의 수준은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 상당히 감소된다. 선택적으로, 발현 리프레서 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열의 수준은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하 동안 상당히 감소된다.
레프레서의 조합
일부 구현예에서, 발현 억제 시스템은 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 이펙터 모이어티 및 제2 이펙터 모이어티는 서로 상이하다. 일부 구현예에서, 제1 이펙터 모이어티는 제1 후성유전학적 변형 모이어티(예를 들어, 제1 후성유전학적 마커를 증가시키거나 감소시킴) 또는 이의 기능성 단편이거나 이를 포함하고 제2 이펙터 모이어티는 제2 후성유전학적 변형 모이어티(예를 들어, 제2 후성유전학적 마커를 증가시키거나 감소시킴) 또는 이의 기능성 단편이거나 이를 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제 또는 이의 기능성 단편이거나 이를 포함하고 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 단편이거나 이를 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데아세틸라제 또는 이의 기능성 단편이거나 이를 포함하고 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 단편이거나 이를 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 또는 이의 기능성 단편이거나 이를 포함하고 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 단편이거나 이를 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데메틸라제 또는 이의 기능성 단편이거나 이를 포함하고 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2 또는 이들 중 임의의 것의 기능성 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB(예를 들어, KRAB 도메인), MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 KRAB(예를 들어, KRAB 도메인), MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2 또는 이들 중 임의의 것의 기능성 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 박테리아 MQ1 또는 이의 기능성 변이체 또는 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 DNMT3A 또는 이의 기능성 변이체 또는 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 DNMT3B 또는 이의 기능성 변이체 또는 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 DNMT3L 또는 이의 기능성 변이체 또는 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 DNMT3a/3L 복합체 또는 이의 기능성 변이체 또는 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다.
표적 부위
본 명세서에 개시된 발현 리프레서 또는 발현 리프레서 시스템은 세포, 예를 들어 대상체 또는 환자의 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하는 데, 예를 들어 감소시키는 데 유용하다. 표적 유전자, 예를 들어 MYC는 당업자에게 알려진 임의의 유전자일 수 있다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC는 대상체, 예를 들어 포유동물, 예를 들어 인간, 소, 말, 양, 닭, 래트, 마우스, 고양이, 또는 개에서 질환 또는 병태와 연관되어 있다. 표적 유전자는 코딩 서열, 예를 들어 엑손, 및/또는 비-코딩 서열, 예를 들어 인트론, 3'UTR, 또는 5'UTR을 포함할 수 있다. 일부 구현예에서, 표적 유전자는 전사 제어 요소에 작동가능하게 연결된다.
본 명세서에 기재된 발현 리프레서 또는 시스템의 발현 리프레서에서 사용하기에 적합한 표적화 모이어티는 표적 유전자, 예를 들어 MYC 내 임의의 부위, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소, 앵커 서열(예를 들어 표적 유전자에 근접하거나 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부와 회합된 앵커 서열(예를 들어, 앵커 서열-매개 연접부는 연접부의 파괴가 표적 유전자, 예를 들어 MYC의 발현을 변경시키는 경우, 표적 유전자에 작동가능하게 연결됨)), 또는 슈퍼 인핸서 영역에 위치된 조절 요소(예를 들어, MYC의 슈퍼 인핸서에 위치한 조절 요소)에 결합, 예를 들어 특이적으로 결합할 수 있다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 부위에 근접한 부위에서 또는 위치에서 결합한다. 예를 들어, 표적화 모이어티는 리프레서(제2 부위)에 근접한 제1 부위에 결합할 수 있고, 상기 표적화 모이어티와 연관된 이펙터 모이어티는, 표적 유전자의 발현에 대한 인핸서의 효과가 마치 제2 부위(인핸서 서열)가 결합되고/되거나 변형된 것처럼 실질적으로 동일하게 변형되도록 제1 부위를 후성유전학적으로 변형시킬 수 있다. 일부 구현예에서, 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위)에 근접한 부위, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소에 근접한 부위, 또는 앵커 서열에 근접한 부위는 표적 유전자, 예를 들어 MYC(예를 들어, 표적 유전자, 예를 들어 MYC 내의 엑손, 인트론, 또는 스플라이스 부위), 전사 제어 요소, 또는 앵커 서열로부터 5000, 5000, 4000, 3000, 2000, 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 50, 또는 25개의 염기쌍(그리고 선택적으로, 표적 유전자, 예를 들어 MYC(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위), 전사 제어 요소, 또는 앵커 서열)로부터 적어도 적어도 20, 25, 50, 100, 200, 또는 300개의 염기쌍) 미만에 있다.
일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC에 결합한다. 일부 구현예에서, DNA-표적화 모이어티는 표적 유전자, 예를 들어 MYC의 엑손 내의 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC의 인트론 내의 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC의 엑손 및 인트론의 경계에 있는 부위, 예를 들어 스플라이스 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC의 5'UTR 내의 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC의 3'UTR 내의 부위에 결합한다. 표적 유전자는 MYC를 인코딩하는 유전자를 포함하지만 이에 제한되지 않는다.
일부 구현예에서, 표적화 모이어티는 표적 유전자(예를 들어, MYC)에 작동가능하게 연결된 전사 제어 요소, 예를 들어 프로모터 또는 인핸서에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적화 유전자, 예를 들어 MYC에 작동가능하게 연결된 프로모터의 일부분 또는 프로모터 내의 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC의 전사 개시 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적화 유전자, 예를 들어 MYC에 작동가능하게 연결된 프로모터의 일부분 또는 인핸서 내의 부위에 결합한다. 일부 구현예에서, 게놈 복합체(예를 들어, ASMC)는 2개 이상의 게놈 서열 요소를 공국재화하며, 여기서 2개 이상의 게놈 서열 요소는 프로모터를 포함한다. 프로모터는 통상적으로 연관된 유전자의 전사를 개시하는 서열 요소이다. 프로모터는 통상적으로 전사 개시 부위에서 멀지 않은 유전자의 5' 말단 근처에 있다. 당업자가 인식하는 바와 같이, 진핵 세포에서의 단백질-코딩 유전자의 전사는 통상적으로 RNA 중합효소 II를 전사 개시 부위로 유도하는 전개시 복합체(preinitiation complex)로서의 코어 프로모터 서열에 대한 일반적인 전사 인자(예를 들어, TFIID, TFIIE, TFIIH, FUSE, CT-요소 등) 및 메디에이터의 결합에 의해 개시되고, 많은 경우에 1차 전사체의 RNA 중합효소 탈출 및 신장이 개시된 후조차도 코어 프로모터 서열에 결합된 상태로 남아 있다. 일부 구현예에서, 프로모터는 서열 요소, 예컨대 TATA, Inr, DPE, 또는 BRE를 포함하지만, 당업자는 그러한 서열이 프로모터를 정의하는 데 반드시 필요한 것은 아님을 잘 알고 있다. 당업자는 유전자와 연관된 다양한 양성(예를 들어, 인핸서) 또는 음성(예를 들어, 리프레서 또는 사일런서) 전사 제어 요소에 익숙하다. 일부 구현예에서, 전사 제어 요소는 전사 인자 결합 부위이다. 통상적으로, 동족 조절 단백질이 그러한 전사 제어 요소에 결합될 때, 연관된 유전자(들)로부터의 전사는 변경된다(예를 들어, 증가되거나 감소된다). 일부 구현예에서, 표적화 모이어티는 게놈 좌표 GRCh37: chr8:129162465-129212140 내에 위치한 게놈 서열에 결합한다.
일부 구현예에서, 표적화 모이어티는 게놈 서열 요소에 의해 포함되거나 부분적으로 포함되는 표적 서열에 결합한다. 일부 구현예에서, 게놈 서열 요소는 발현 제어 서열이거나 이를 포함한다. 일부 구현예에서, 게놈 서열 요소는 표적 유전자, 예를 들어 MYC 또는 표적 유전자, 예를 들어 MYC의 일부이거나 이를 포함한다. 일부 구현예에서, 표적화 모이어티는 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35개 염기 길이(및 선택적으로 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 또는 20개 이하의 염기 길이)인 표적 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 10 내지 30, 15 내지 30, 15 내지 25, 18 내지 24, 19 내지 23, 20 내지 23, 21 내지 23, 또는 22 내지 23개 염기 길이인 표적 서열에 결합한다. 일부 구현예에서, 표적 서열은 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개 염기 길이이다. 일부 구현예에서, 게놈 서열 요소는 앵커 서열이거나 이를 포함한다.
각 ASMC는 하나 이상, 예를 들어 복수의 앵커 서열을 포함한다. 일부 구현예에서, 앵커 서열은 자연 발생 게놈 복합체(예를 들어, ASMC)를 조절(예를 들어, 파괴)하거나 새로운 게놈 복합체(예를 들어, ASMC)를 형성(예를 들어, 외인성 또는 변경된 앵커 서열을 갖는 비-자연 발생 게놈 복합체(예를 들어, SMC)를 형성)하도록 조작되거나 변경될 수 있다. 일부 구현예에서, 앵커 서열-매개 연접부는 표적 유전자의 발현을 변경시키도록, 예를 들어 억제하도록, 예를 들어 감소시키도록 파괴될 수 있다. 그러한 파괴는, 예를 들어 DNA의 토폴로지 구조를 변경시킴으로써, 예를 들어 전사 제어 요소(예를 들어, 인핸싱 및 침묵/억제 서열)와 상호작용할 수 있는 표적 유전자의 능력을 조절함으로써, 유전자 발현을 조절할 수 있다.
일부 구현예에서, 표적화 모이어티는 앵커 서열, 예를 들어 표적 유전자, 예를 들어 MYC에 근접하거나 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부(ASMC)와 회합된 앵커 서열(예를 들어, 앵커 서열-매개 연접부는 연접부의 파괴가 표적 유전자, 예를 들어 MYC의 발현을 변경시키는 경우, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결됨)에 결합할 수 있다. 일반적으로, 앵커 서열은 게놈 복합체 성분, 예를 들어 핵형성 폴리펩타이드가 특이적으로 결합하는 게놈 서열 요소이다. 일부 구현예에서, 앵커 서열에 대한 게놈 복합체 성분의 결합은 복합체 형성, 예를 들어 ASMC 형성을 핵형성한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC에 유전자좌 결합한다. 유전자좌는 일반적으로 표적 유전자, 예를 들어 MYC를 포함하는 ASMC의 전사된 영역, 프로모터, 및 앵커 부위를 포함하는 것으로 정의된다. 일부 구현예에서, 표적화 모이어티는 서열번호 75 내지 86 또는 199 내지 206 중 어느 하나를 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 75 내지 86 중 어느 하나를 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 75 내지 86 중 어느 하나를 포함하는 서열에 결합하며, 여기서 제1 및 제2 표적화 모이어티는 동일한 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 75 내지 86 중 어느 하나를 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 75 내지 86 중 어느 하나를 포함하는 서열에 결합하며, 여기서 제1 및 제2 표적화 모이어티는 상이한 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 83, 203, 또는 206 중 임의의 것을 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 77을 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 77을 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 83, 203, 또는 206 중 임의의 것을 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 83, 203, 또는 206 중 임의의 것을 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 199, 204, 또는 205 중 임의의 것을 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 199, 204, 또는 205 중 임의의 것을 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 83, 203, 또는 206 중 임의의 것을 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 83, 203, 또는 206 중 임의의 것을 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 201을 포함하는 서열에 결합한다. 일부 구현예에서, 제1 및 제2 발현 리프레서를 인코딩하는 핵산은 제1 발현 리프레서를 인코딩하는 제1 영역을 포함하며, 여기서 제1 영역은 제2 발현 리프레서를 인코딩하는 제2 영역의 상류에 있다. 일부 구현예에서, 제1 및 제2 발현 리프레서를 인코딩하는 핵산은 제1 발현 리프레서를 인코딩하는 제1 영역을 포함하며, 여기서 제1 영역은 제2 발현 리프레서를 인코딩하는 제2 영역의 하류에 있다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 75 내지 86 또는 199 내지 206 중 어느 하나를 포함하는 서열에 결합하고, 제2 표적화 모이어티(예를 들어 gRNA를 포함하는 CRISPR/Cas 도메인)는 서열번호 1 내지 4 중 어느 하나를 포함하는 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합하며, 여기서 제1 및 제2 표적화 모이어티는 동일한 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합하며, 여기서 제1 및 제2 표적화 모이어티는 상이한 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합하고, 제2 표적화 모이어티(예를 들어 gRNA를 포함하는 CRISPR/Cas 도메인)는 서열번호 1 내지 4 중 어느 하나를 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 표 2, 12, 또는 13에 개시된 서열번호 중 어느 하나를 포함하는 서열에 결합하고, 제2 표적화 모이어티(예를 들어 gRNA를 포함하는 CRISPR/Cas 도메인)는 표 2, 12, 또는 13에 개시된 서열번호 중 어느 하나를 포함하는 서열에 결합한다.
예시적인 표적 서열은 표 12에 개시되어 있다.
일부 구현예에서, 발현 리프레서는 본 명세서에 제시된 서열, 예를 들어 서열번호 1 내지 4, 75 내지 86, 96 내지 110, 또는 199 내지 206 중 어느 하나를 갖는 게놈 유전자좌에 결합한다. 많은 경우에, 결합되는 게놈 유전자좌는 이중 가닥 DNA를 포함하고, 이 유전자좌는 그의 센스 가닥 또는 그의 안티센스 가닥의 서열을 제공함으로써 기재될 수 있음이 이해된다. 따라서, 제공된 스페이서 서열을 갖는 gRNA는 발현 리프레서가 특정 게놈 유전자좌에 결합되게 할 수 있으며, 여기서 게놈 유전자좌의 한쪽 가닥은 스페이서 서열과 유사하거나 동일한 서열을 갖고, 게놈 유전자좌의 나머지 다른 한쪽 가닥은 상보적 서열을 갖는다. 통상적으로, 게놈 유전자좌에 대한 gRNA 결합은 게놈 유전자좌의 약간의 풀림(unwinding) 및 gRNA 스페이서와 이 스페이서와 상보적인 가닥의 쌍형성을 수반할 것이다.
일부 구현예에서, 표적화 모이어티는 마우스 게놈에서 앵커 서열, 예를 들어 표적 유전자, 예를 들어 MYC에 근접하거나 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부(ASMC)와 회합된 앵커 서열(예를 들어, 앵커 서열-매개 연접부는 연접부의 파괴가 표적 유전자, 예를 들어 MYC의 발현을 변경시키는 경우, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결됨)에 결합할 수 있다. 일반적으로, 앵커 서열은 게놈 복합체 성분, 예를 들어 핵형성 폴리펩타이드가 특이적으로 결합하는 게놈 서열 요소이다. 일부 구현예에서, 앵커 서열에 대한 게놈 복합체 성분의 결합은 복합체 형성, 예를 들어 ASMC 형성을 핵형성한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC에 유전자좌 결합한다. 유전자좌는 일반적으로 표적 유전자, 예를 들어 MYC를 포함하는 ASMC의 전사된 영역, 프로모터, 및 앵커 부위를 포함하는 것으로 정의된다. 일부 구현예에서, 표적화 모이어티는 서열번호 190 내지 192 중 어느 하나를 포함하는 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 표 18에 개시된 서열번호 중 어느 하나를 포함하는 서열에 결합한다. 마우스 게놈에서 예시적인 표적 서열은 표 18에 개시되어 있다.
일부 구현예에서, 발현 리프레서는 본 명세서에 제시된 서열, 예를 들어 서열번호 190 내지 192 중 어느 하나를 갖는 게놈 유전자좌에 결합한다. 많은 경우에, 결합되는 게놈 유전자좌는 이중 가닥 DNA를 포함하고, 이 유전자좌는 그의 센스 가닥 또는 그의 안티센스 가닥의 서열을 제공함으로써 기재될 수 있음이 이해된다.
일 구현예에서, 앵커 서열-매개 연접부는 루프, 예컨대 염색체내 루프를 포함한다. 특정 구현예에서, 앵커 서열-매개 연접부는 복수의 루프를 갖는다. 하나 이상의 루프는 제1 앵커 서열, 핵산 서열, 전사 제어 서열, 및 제2 앵커 서열을 포함할 수 있다. 또 다른 구현예에서, 적어도 하나의 루프는 제1 앵커 서열, 전사 제어 서열, 및 제2 앵커 서열, 또는 제1 앵커 서열, 핵산 서열, 및 제2 앵커 서열을 순서대로 포함한다. 또 다른 구현예에서, 핵산 서열 및 전사 제어 서열 중 하나 또는 둘 다는 루프 내부 또는 외부에 위치한다. 또 다른 구현예에서, 루프 중 하나 이상은 전사 제어 서열을 포함한다.
일부 구현예에서, 앵커 서열-매개 연접부는 TATA 박스, CAAT 박스, GC 박스, 또는 CAP 부위를 포함한다. 일부 구현예에서, 앵커 서열-매개 연접부는 복수의 루프를 포함하고, 앵커 서열-매개 연접부는 하나 이상의 루프에 앵커 서열, 핵산 서열, 및 전사 제어 서열 중 적어도 하나를 포함한다.
일부 구현예에서, 염색질 구조는 앵커 서열 내에서 하나 이상의 뉴클레오타이드를 치환하거나, 추가하거나, 결실시킴으로써 변형된다. 일부 구현예에서, 염색질 구조는 앵커 서열-매개 연접부의 앵커 서열 내에서 하나 이상의 뉴클레오타이드를 치환하거나, 추가하거나, 결실시킴으로써 변형된다. 일부 구현예에서, 전사는 활성화 루프의 포함 또는 억제 루프의 배제에 의해 개시된다. 그러한 일 구현예에서, 앵커 서열-매개 연접부는 핵산 서열의 전사를 감소시키는 전사 제어 서열을 배제한다. 일부 구현예에서, 전사는 억제 루프의 포함 또는 활성화 루프의 배제에 의해 억제된다. 그러한 일 구현예에서, 앵커 서열-매개 연접부는 핵산 서열의 전사를 감소시키는 전사 제어 서열을 포함한다.
앵커 서열은 서로 인접하지 않을 수 있다. 비인접 앵커 서열을 갖는 구현예에서, 제1 앵커 서열은 제2 앵커 서열로부터 약 500 bp 내지 약 500 Mb, 약 750 bp 내지 약 200 Mb, 약 1 kb 내지 약 100 Mb, 약 25 kb 내지 약 50 Mb, 약 50 kb 내지 약 1 Mb, 약 100 kb 내지 약 750 kb, 약 150 kb 내지 약 15 500 kb, 또는 약 175 kb 내지 약 500 kb만큼 떨어져 있을 수 있다. 일부 구현예에서, 제1 앵커 서열은 제2 앵커 서열로부터 약 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1 kb, 5 kb, 10 kb, 15 kb, 20 kb, 25 kb, 30 kb, 35 kb, 40 kb, 45 kb, 50 kb, 55 kb, 60 kb, 65 kb, 70 kb, 75 kb, 80 kb, 85 kb, 90 kb, 95 kb, 100 kb, 125 kb, 150 kb, 175 kb, 200 kb, 225 kb, 250 kb, 275 kb, 300 kb, 350 kb, 400 kb, 500 kb, 600 kb, 700 kb, 800 kb, 900 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb, 10 Mb, 15 Mb, 20 Mb, 25 Mb, 50 Mb, 75 Mb, 20 100 Mb, 200 Mb, 300 Mb, 400 Mb, 500 Mb, 또는 이 사이의 임의의 크기만큼 떨어져 있다.
일부 더 많은 구현예에서, 표적화 모이어티는 다음 중 적어도 하나를 도입한다: 적어도 하나의 외인성 앵커 서열; 예컨대 연접부 핵형성 분자에 대한 결합 친화도의 변경에 의한, 적어도 하나의 연접부 핵형성 분자 결합 부위의 변경; 적어도 하나의 공통 뉴클레오타이드 서열, 예컨대 CTCF 결합 모티프, YY1 결합 모티프, ZNF143 결합 모티프, 또는 본 명세서에 언급된 다른 결합 모티프의 배향의 변화; 및 적어도 하나의 앵커 서열, 예컨대 CTCF 결합 모티프, YY1 결합 모티프, ZNF143 결합 모티프, 또는 본 명세서에 언급된 다른 결합 모티프의 치환, 추가 또는 결실.
일부 구현예에서, 앵커 서열은 핵형성 폴리펩타이드 결합 모티프, 예를 들어 CTCF-결합 모티프를 포함한다: N(T/C/G)N(G/A/T)CC(A/T/G)(C/G)(C/T/A)AG(G/A)(G/T)GG(C/A/T)(G/A)(C/G)(C/T/A)(G/A/C)(서열번호 71)(여기서, N은 임의의 뉴클레오타이드임).
CTCF-결합 모티프는 또한 반대 배향일 수 있으며, 예를 들어 (G/A/C)(C/T/A)(C/G)(G/A)(C/A/T)GG(G/T)(G/A)GA(C/T/A)(C/G)(A/T/G)CC(G/A/T)N(T/C/G)N(서열번호 72)이다. 여기서, N은 임의의 뉴클레오타이드이다.
일부 구현예에서, 앵커 서열은 서열번호 71 또는 서열번호 72를 포함하거나, 서열번호 71 또는 서열번호 72 중 어느 하나와 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일한 서열을 포함한다.
일부 구현예에서, 앵커 서열은 핵형성 폴리펩타이드 결합 모티프, 예를 들어 YY1-결합 모티프를 포함한다: CCGCCATNTT(서열번호 73)(여기서, N은 임의의 뉴클레오타이드임).
YY1-결합 모티프는 또한 반대 배향일 수 있으며, 예를 들어 AANATGGCGG(서열번호 74)(여기서, N은 임의의 뉴클레오타이드임)이다.
일부 구현예에서, 앵커 서열-매개 연접부는 적어도 제1 앵커 서열 및 제2 앵커 서열을 포함한다. 예를 들어, 일부 구현예에서, 제1 앵커 서열 및 제2 앵커 서열은 각각 핵형성 폴리펩타이드 결합 모티프를 포함할 수 있으며, 예를 들어 각각은 CTCF 결합 모티프를 포함한다.
일부 구현예에서, 제1 앵커 서열 및 제2 앵커 서열은 상이한 서열을 포함하며, 예를 들어 제1 앵커 서열은 CTCF 결합 모티프를 포함하고, 제2 앵커 서열은 CTCF 결합 모티프 이외의 앵커 서열을 포함한다. 일부 구현예에서, 각 앵커 서열은 핵형성 폴리펩타이드 결합 모티프 및 핵형성 폴리펩타이드 결합 모티프의 한쪽 또는 양쪽에 하나 이상의 측접 뉴클레오타이드를 포함한다.
ASMC를 형성할 수 있는 2개의 CTCF-결합 모티프(예를 들어, 연속 또는 비연속 CTCF 결합 모티프)는 임의의 배향으로, 예를 들어 5'-3'(좌측 탠덤, 예를 들어 서열번호 71을 포함하는 2개의 CTCF-결합 모티프) 또는 3'-5'(우측 탠덤, 예를 들어 서열번호 72를 포함하는 2개의 CTCF-결합 모티프) 중 어느 하나의 동일한 배향(탠덤)으로, 또는 하나의 CTCF-결합 모티프는 서열번호 71을 포함하고 또 다른 하나는 서열번호 72를 포함하는 수렴 배향으로 게놈에 존재할 수 있다.
일부 구현예에서, 앵커 서열은 표적 유전자(예를 들어, MYC)와 연관된 CTCF 결합 모티프를 포함하며, 표적 유전자는 질환, 장애 및/또는 병태, 예를 들어 MYC 오조절 장애, 예를 들어 간 장애(예를 들어, 간암종) 또는 폐암과 연관되어 있다.
일부 구현예에서, 본 개시내용의 방법은, 예를 들어 염색질 구조를 변형함으로써, 앵커 서열, 예를 들어 핵형성 폴리펩타이드 결합 모티프 내에서 하나 이상의 뉴클레오타이드를 치환하거나, 추가하거나, 결실시킴으로써, 게놈 복합체(예를 들어, ASMC)를 조절하는 것, 예를 들어 파괴하는 것을 포함한다. 하나 이상의 뉴클레오타이드는 앵커 서열, 예를 들어 핵형성 폴리펩타이드 결합 모티프 내에서 치환, 추가 또는 결실을 위해 특이적으로 표적화될 수 있으며, 예를 들어 표적화된 변경일 수 있다.
일부 구현예에서, 게놈 복합체(예를 들어, ASMC)는 적어도 하나의 핵형성 폴리펩타이드 결합 모티프의 배향을 변화시킴으로써 변경될 수 있다. 앵커 서열은 핵형성 폴리펩타이드 결합 모티프, 예를 들어 CTCF 결합 모티프를 포함하고, 표적화 모이어티는 적어도 하나의 핵형성 폴리펩타이드 결합 모티프에 변경을 도입하여, 예를 들어 핵형성 폴리펩타이드에 대한 결합 친화도를 변경시킨다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서 또는 시스템의 투여 전, 표적 유전자, 예를 들어 MYC는, 예를 들어 이환된 상태에서, 규정된 발현 상태를 갖는다. 예를 들어, 표적 유전자, 예를 들어 MYC는 질환 세포에서 높은 수준의 발현을 가질 수 있다. 앵커 서열-매개 연접부를 파괴함으로써, 표적 유전자, 예를 들어 MYC의 발현은 감소될 수 있다.
본 명세서에 기재된 발현 억제 시스템의 발현 리프레서에 사용하기에 적합한 표적화 모이어티는 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개의 뉴클레오타이드 또는 염기쌍(그리고 선택적으로, 50, 49, 48, 47, 46, 45, 44, 43, 42, 41, 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 또는 10개 이하의 뉴클레오타이드 또는 염기쌍)을 포함하는 부위에 결합할, 예를 들어 특이적으로 결합할 수 있다. 일부 구현예에서, DNA-표적화 모이어티는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개의 뉴클레오타이드 또는 염기쌍을 포함하는 부위에 결합한다.
본 개시내용의 발현 억제 시스템은 2개 이상의 발현 리프레서를 포함할 수 있다. 일부 구현예에서, 발현 리프레서 시스템의 발현 리프레서는 각각 상이한 표적화 모이어티를 포함한다.
일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 엑손, 인트론, 또는 엑손 인트론 경계(예를 들어, 스플라이스 부위)에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자, 예를 들어 엑손, 인트론, 또는 엑손 인트론 경계(예를 들어, 스플라이스 부위)에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 엑손, 인트론, 또는 엑손 인트론 경계(예를 들어, 스플라이스 부위)에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소(예를 들어, 프로모터 또는 인핸서)에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자에 작동가능하게 연결된 전사 제어 요소(예를 들어, 프로모터 또는 인핸서)에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자에 작동가능하게 연결된 전사 제어 요소(예를 들어, 프로모터 또는 인핸서)에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 MYC에 근접하거나, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소(예를 들어, 프로모터 또는 인핸서)에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 MYC에 근접하거나, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자(예를 들어, MYC), 예를 들어 엑손, 인트론, 또는 엑손 인트론 경계(예를 들어, 스플라이스 부위)에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 MYC에 근접하거나, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자, 예를 들어 MYC에 근접하거나, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다.
일부 구현예에서, 발현 억제 시스템은, 예를 들어 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 프로모터에서, 제1 부위에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 프로모터에서, 제2 부위에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 제1 부위 및 제2 부위는 상이하고 비-중첩 부위일 수 있으며, 예를 들어 제1 부위 및 제2 부위는 공통으로 어떤 서열도 공유하지 않는다. 제1 부위 및 제2 부위는 상이하지만 중첩 부위일 수 있으며, 예를 들어 제1 부위 및 제2 부위는 상이한 서열을 포함할 수 있지만 공통으로 일부 서열을 공유한다.
일부 구현예에서, 표적 유전자는 MYC이다. 일부 구현예에서, MYC는 인간 8번 염색체 상에 위치한다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 발현자 리프레서 또는 발현 리프레서 시스템은 MYC의 전사 개시 부위(TSS)에 결합한다.
기타 구성
핵산 및 벡터
본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템을 인코딩하는 핵산에 관한 것이다. 일부 구현예에서, 발현 리프레서는 발현 리프레서를 인코딩하는 핵산을 포함하는 조성물을 통해 제공될 수 있으며, 여기서 핵산은 관심 시스템 내에서(예를 들어, 특정 세포, 조직, 유기체 등 내에서) 발현 리프레서의 발현을 달성하기에 충분한 다른 서열과 연관되어 있다. 일부 구현예에서, 발현 억제 시스템은 발현 억제 시스템의 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 인코딩하는 핵산을 포함하는 조성물을 통해 제공될 수 있으며, 여기서 핵산은 관심 시스템 내에서(예를 들어, 특정 세포, 조직, 유기체 등 내에서) 발현 억제 시스템의 발현 억제 시스템, 예를 들어 발현 리프레서(들)의 발현을 달성하기에 충분한 다른 서열과 연관되어 있다.
일부 특정 구현예에서, 본 개시내용은 발현 리프레서 또는 이의 폴리펩타이드 부분을 인코딩하는 핵산의 조성물을 제공한다. 일부 그러한 구현예에서, 제공된 핵산은 DNA, RNA, 또는 본 명세서에 기재된 바와 같은 임의의 다른 핵산 모이어티 또는 실체이거나 이를 포함할 수 있으며, 본 명세서에 기재된 임의의 기술 또는 당업계에서 달리 이용가능한 기술(예를 들어, 합성, 클로닝, 증폭, 시험관내 또는 생체내 전사 등)에 의해 제조될 수 있다. 일부 구현예에서, 발현 리프레서를 인코딩하는 제공된 핵산, 또는 이의 폴리펩타이드는 관심 시스템에서(예를 들어, 특정 세포, 조직, 유기체 등에서) 제공된 핵산의 통합, 복제, 및/또는 발현을 달성하기에 적절한 및/또는 충분한 하나 이상의 복제, 통합, 및/또는 발현 신호와 작동적으로 연관될 수 있다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서를 전달하기 위한 조성물은 본 명세서에 기재된 바와 같은 발현 리프레서 또는 발현 리프레서의 하나 이상의 성분을 인코딩하는 하나 이상의 핵산을 포함하는 벡터, 예를 들어 바이러스 벡터이거나 이를 포함한다.
일부 특정 구현예에서, 본 개시내용은 발현 억제 시스템, 하나 이상의 발현 리프레서 또는 이의 폴리펩타이드 부분을 인코딩하는 핵산의 조성물을 제공한다. 일부 그러한 구현예에서, 제공된 핵산은 DNA, RNA, 또는 본 명세서에 기재된 바와 같은 임의의 다른 핵산 모이어티 또는 실체이거나 이를 포함할 수 있으며, 본 명세서에 기재된 임의의 기술 또는 당업계에서 달리 이용가능한 기술(예를 들어, 합성, 클로닝, 증폭, 시험관내 또는 생체내 전사 등)에 의해 제조될 수 있다. 일부 구현예에서, 발현 억제 시스템, 하나 이상의 발현 리프레서를 인코딩하는 제공된 핵산, 또는 이의 폴리펩타이드 부분은 관심 시스템에서(예를 들어, 특정 세포, 조직, 유기체 등에서) 제공된 핵산의 통합, 복제, 및/또는 발현을 달성하기에 적절한 및/또는 충분한 하나 이상의 복제, 통합, 및/또는 발현 신호와 작동적으로 연관될 수 있다.
일부 구현예에서, 본 명세서에 기재된 발현 억제 시스템을 전달하기 위한 조성물은 본 명세서에 기재된 바와 같은 발현 억제 시스템, 예를 들어 발현 억제 시스템의 발현 리프레서(들)의 하나 이상의 성분을 인코딩하는 하나 이상의 핵산을 포함하는 벡터, 예를 들어 바이러스 벡터이거나 이를 포함한다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서를 전달하기 위한 조성물은 본 명세서에 기재된 바와 같은 발현 리프레서 또는 발현 리프레서의 하나 이상의 성분을 인코딩하는 하나 이상의 핵산을 포함하는 RNA, 예를 들어 mRNA이거나 이를 포함한다.
일부 구현예에서, 본 명세서에 기재된 발현 억제 시스템을 전달하기 위한 조성물은 본 명세서에 기재된 바와 같은 발현 억제 시스템, 예를 들어 발현 억제 시스템의 발현 리프레서(들)의 하나 이상의 성분을 인코딩하는 하나 이상의 핵산을 포함하는 RNA, 예를 들어 mRNA이거나 이를 포함한다.
본 명세서에 기재된 바와 같은 핵산 또는 본 명세서에 기재된 단백질을 인코딩하는 핵산이 벡터 내로 도입될 수 있다. 레트로바이러스, 예컨대 렌티바이러스로부터 유래된 것들을 포함한 벡터가 장기간 유전자 전달을 달성하기에 적합한 도구인데, 그 이유는, 이들 벡터가 이식유전자의 장기간의 안정적인 통합 및 딸 세포에서의 그의 증식을 가능하게 하기 때문이다. 벡터의 예에는 발현 벡터, 복제 벡터, 프로브 생성 벡터 및 시퀀싱 벡터가 포함된다. 발현 벡터는 바이러스 벡터의 형태로 세포에 제공될 수 있다. 바이러스 벡터 기술은 당업계에 잘 알려져 있으며, 다양한 바이러스학 및 분자 생물학 매뉴얼에 기재되어 있다. 벡터로서 유용한 바이러스는 레트로바이러스, 아데노바이러스, 아데노-연관 바이러스, 헤르페스 바이러스, 및 렌티바이러스를 포함하지만 이로 한정되지 않는다. 일반적으로, 적합한 벡터는 적어도 하나의 유기체에서 기능성인 복제 기점, 프로모터 서열, 편리한 제한 엔도뉴클레아제 부위, 및 하나 이상의 선택가능한 마커를 포함한다.
천연 또는 합성 핵산의 발현은 통상적으로 관심 유전자를 인코딩하는 핵산을 프로모터에 작동가능하게 연결하고 작제물을 발현 벡터 내로 도입함으로써 달성된다. 벡터는 진핵세포에서 복제 및 통합에 적합할 수 있다. 통상적인 클로닝 벡터는 전사 및 번역 종결자, 개시 서열, 및 원하는 핵산 서열의 발현에 유용한 프로모터를 포함한다.
추가적인 프로모터 요소, 예를 들어 인핸싱 서열은 전사 개시의 빈도를 조절할 수 있다. 통상적으로, 이들 서열은 전사 개시 부위의 30 내지 110 bp 상류 영역 내에 위치되지만, 다수의 프로모터가 마찬가지로 전사 개시 부위의 하류에 기능성 요소를 포함하는 것으로 최근에 밝혀졌다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서 또는 시스템은 인핸싱 서열에서 작용한다. 일부 구현예에서, 인핸싱 서열은 인핸서, 스트레치(stretch) 인핸서, 섀도우(shadow) 인핸서, 유전자좌 제어 영역(LCR), 또는 슈퍼 인핸서이다. 일부 구현예에서, 슈퍼 인핸서는 인핸서의 클러스터 및 다른 조절 요소를 포함한다. 일부 구현예에서, 이러한 서열은 전사 개시 부위의 .2 내지 2 Mb 상류 또는 하류 영역 내에 위치한다. 일부 구현예에서, 영역은 비-코딩 영역이다. 일부 구현예에서, 영역은 암 발병 위험이 더 높은 것과 연관된 적어도 하나의 SNP를 포함한다. 일부 구현예에서, 영역은 표적 유전자, 예를 들어 MYC의 장거리 조절과 연관되어 있다. 일부 구현예에서, 영역은 세포-유형 특이적이다. 일부 구현예에서, 슈퍼-인핸서는 표적 유전자 프로모터, 예를 들어 MYC 프로모터를 동원함으로써, 표적 유전자 발현, 예를 들어 MYC 발현을 변형한다(예를 들어, 증가시키거나 감소시킨다). 일부 구현예에서, 슈퍼 인핸서는 인핸서 도킹(docking) 부위를 통해 표적 유전자 프로모터, 예를 들어 MYC 프로모터와 상호작용한다. 일부 구현예에서, 인핸서 도킹 부위는 앵커 서열이다. 일부 구현예에서, 인핸서 도킹 부위는 표적 유전자 프로모터, 예를 들어 MYC 프로모터로부터 적어도 100 bp, 200 bp, 500 bp, 1000 bp, 1500 bp, 2000 bp, 또는 3000 bp 떨어져 위치한다. 일부 구현예에서, 슈퍼 인핸서 영역은 적어도 100 bp, 적어도 200 bp, 적어도 300 bp, 적어도 500 bp, 적어도 1 kb, 적어도 2 kb, 적어도 3 kb, 적어도 5 kb, 적어도 10 kb, 적어도 15 kb, 적어도 20 kb, 또는 적어도 25 kb 길이이다.
프로모터 요소간의 간격은 빈번하게 가요성이어서, 요소들이 서로에 대해 역전되거나 이동될 때 프로모터 기능이 보존된다. 티미딘 키나제(tk) 프로모터에서는, 활성의 감소가 시작되기 전에 프로모터 요소간의 간격이 증가되어 50 bp로 떨어질 수 있다. 프로모터에 따라, 개별 요소들이 전사를 활성화하도록 협동적으로 또는 독립적으로 기능할 수 있는 것으로 나타난다.
적합한 프로모터의 한 예는 전초기 사이토메갈로바이러스(CMV) 프로모터 서열이다. 이러한 프로모터 서열은 강력한 구성적 프로모터 서열로서, 이것에 작동가능하게 연결된 임의의 폴리뉴클레오타이드 서열의 고수준의 발현을 유도할 수 있다. 일부 구현예에서, 적합한 프로모터는 연장 성장 인자-1α(EF-1α)이다. 그러나, 다른 구성적 프로모터 서열이 또한 사용될 수 있으며, 이에는 유인원 바이러스 40(SV40) 초기 프로모터, 마우스 유선 종양 바이러스(MMTV), 인간 면역결핍 바이러스(HIV) 긴 말단 반복부(LTR) 프로모터, MoMuLV 프로모터, 조류 백혈병 바이러스 프로모터, 엡스타인-바(Epstein-Barr) 바이러스 전초기 프로모터, 라우스 육종 바이러스 프로모터뿐만 아니라, 인간 유전자 프로모터, 예컨대 제한 없이, 액틴 프로모터, 미오신 프로모터, 헤모글로빈 프로모터, 및 크레아틴 키나제 프로모터가 포함되지만 이로 한정되지 않는다.
본 개시내용은 임의의 특정 프로모터 또는 프로모터 카테고리(예를 들어, 구성적 프로모터)의 사용으로 제한되는 것으로 해석되어서는 안 된다. 예를 들어, 일부 구현예에서, 유도성 프로모터가 본 개시내용의 일부로서 고려된다. 일부 구현예에서, 유도성 프로모터의 사용은, 그것에 작동가능하게 연결된 폴리뉴클레오타이드 서열의 발현이 요구될 때, 그러한 발현을 켤 수 있는 분자 스위치를 제공한다. 일부 구현예에서, 유도성 프로모터의 사용은, 발현이 요구되지 않을 때 발현을 끌 수 있는 분자 스위치를 제공한다. 유도성 프로모터의 예에는 메탈로티오닌(metallothionine) 프로모터, 글루코코르티코이드 프로모터, 프로게스테론 프로모터, 및 테트라사이클린 프로모터가 포함되지만 이로 한정되지 않는다.
일부 구현예에서, 도입하려는 발현 벡터는 또한 선택가능한 마커 유전자 또는 리포터 유전자 중 어느 하나 또는 둘 다를 함유하여, 바이러스 벡터를 통해 형질감염시키거나 감염시키고자 하는 세포 집단으로부터의 발현 세포의 확인 및 선택을 용이하게 할 수 있다. 일부 양태에서, 선택가능한 마커는 별개의 DNA 조각 상에서 운반되어 공동-형질감염 절차에 사용될 수 있다. 선택가능한 마커 및 리포터 유전자 둘 다에는 숙주 세포에서의 발현을 가능하게 하기에 적절한 전사 제어 서열이 측접될 수 있다. 유용한 선택가능한 마커는, 예를 들어 항생제-저항성 유전자, 예컨대 neo 등을 포함할 수 있다.
일부 구현예에서, 리포터 유전자는 잠재적으로 형질감염 세포를 확인하는 데 그리고/또는 전사 제어 서열의 기능성을 평가하는 데 사용될 수 있다. 일반적으로, 리포터 유전자는, (리포터 유전자의) 수용자 공급원에 존재하지 않거나 그에 의해 발현되지 않고, 어떠한 용이하게 검출가능한 특성, 예를 들어 효소 활성 또는 시각화 가능한 형광에 의해 발현이 나타나는 폴리펩타이드를 인코딩하는 유전자이다. 리포터 유전자의 발현은 DNA가 수용자 세포 내로 도입된 후 적합한 시간에 분석된다. 적합한 리포터 유전자는 루시퍼라제, 베타-갈락토시다제, 클로람페니콜 아세틸 트랜스퍼라제, 분비 알칼리성 포스파타제, 또는 녹색 형광 단백질 유전자를 인코딩하는 유전자를 포함할 수 있다(예를 들어, 문헌[Ui-Tei et al., 2000 FEBS Letters 479: 79-82]). 적합한 발현 시스템은 널리 알려져 있으며, 알려진 기법을 사용하여 제조되거나 상업적으로 입수될 수 있다. 일반적으로, 최고 수준의 리포터 유전자 발현을 나타내는 최소 5' 측접 영역을 갖는 작제물이 프로모터로서 확인된다. 그러한 프로모터 영역은 리포터 유전자에 연결되어, 프로모터-구동 전사를 조절하는 능력에 대하여 작용제를 평가하는 데 사용될 수 있다.
세포
본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템을 포함하는 세포에 관한 것이다. 당업자에게 알려진 임의의 세포, 예를 들어 세포주, 예를 들어 재조합 폴리펩타이드의 발현에 적합한 세포주가 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템을 포함하기에 적합하다. 일부 구현예에서, 세포, 예를 들어 세포주는 본 명세서에 기재된 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 발현하는 데 사용될 수 있다. 일부 구현예에서, 세포, 예를 들어 세포주가 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 인코딩하는 핵산, 예를 들어 벡터를 발현하거나 증폭시키는 데 사용될 수 있다. 일부 구현예에서, 세포는 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 인코딩하는 핵산을 포함한다.
일부 구현예에서, 세포는 발현 억제 시스템, 예를 들어 제1 발현 리프레서의 제1 성분을 인코딩하는 제1 핵산, 및 발현 억제 시스템, 예를 들어 제2 발현 리프레서의 제2 성분을 인코딩하는 제2 핵산을 포함한다. 일부 구현예에서, 세포가 2개 이상의 발현 리프레서를 포함하는 발현 억제 시스템을 인코딩하는 핵산을 포함하는 경우, 각 발현 리프레서를 인코딩하는 서열은 별개의 핵산 분자 상에, 예를 들어 상이한 벡터 상에, 예를 들어 제1 발현 리프레서를 인코딩하는 제1 벡터 및 제2 발현 리프레서를 인코딩하는 제2 백터 상에 배치된다. 일부 구현예에서, 각 발현 리프레서를 인코딩하는 서열은 동일한 핵산 분자 상에, 예를 들어 동일한 벡터 상에 배치된다. 일부 구현예에서, 발현 억제 시스템을 인코딩하는 핵산 중 일부 또는 전부는 세포의 게놈 DNA 내로 통합된다. 일부 구현예에서, 발현 억제 시스템의 제1 발현 리프레서를 인코딩하는 핵산은 세포의 게놈 DNA 내로 통합되고, 발현 억제 시스템의 제2 발현 리프레서를 인코딩하는 핵산은 세포의 게놈 DNA 내로 통합되지 않는다(예를 들어, 벡터 상에 위치한다). 일부 구현예에서, 발현 억제 시스템의 제1 및 제2 발현 리프레서를 인코딩하는 핵산(들)은, 예를 들어 게놈 DNA 내의 동일한(예를 들어, 인접하거나 공국재화된) 또는 상이한 부위에서 세포의 게놈 DNA 내로 통합된다.
본 명세서에 기재된 발현 억제 시스템 또는 발현 리프레서를 포함하고/하거나 발현할 수 있는 세포의 예에는 간세포, 뉴런 세포, 내피 세포, 근세포, 및 림프구가 포함되지만 이로 한정되지 않는다.
추가로 본 개시내용은, 부분적으로, 본 명세서에 기재된 방법 또는 공정에 의해 제조된 세포에 관한 것이다. 일부 구현예에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템을 제공하는 단계, 세포를 제공하는 단계, 및 세포를 발현 리프레서(또는 발현 리프레서를 인코딩하는 핵산, 또는 상기 발현 리프레서 또는 핵산을 포함하는 조성물) 또는 발현 억제 시스템(또는 발현 억제 시스템을 인코딩하는 핵산, 또는 상기 발현 억제 시스템 또는 핵산을 포함하는 조성물)와 접촉시키는 단계에 의해 생산되는 세포를 제공한다. 일부 구현예에서, 세포를 발현 리프레서와 접촉시키는 것은 세포를, 세포가 발현 리프레서를 생산할 수 있게 하는 조건 하에서 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것을 포함한다. 일부 구현예에서, 세포를 발현 리프레서와 접촉시키는 것은 세포를 포함하는 유기체를, 세포가 발현 리프레서를 생산할 수 있게 하는 조건 하에서 발현 리프레서 또는 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것을 포함한다.
이론에 의해 구애되고자 함이 없이, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템과 접촉된 세포는 발현 리프레서 또는 발현 억제 시스템에 의해 접촉되지 않은 유사한 세포와 비교하여, 표적 유전자(예를 들어, MYC)의 발현의 감소 및/또는 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소, 또는 표적 유전자에 근접하거나 표적 유전자, 예를 들어 MYC에 작동 가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열의 변형을 나타낼 수 있다. 일부 구현예에서, 상기 표적 유전자, 예를 들어 MYC의 발현의 감소 및/또는 후성유전학적 마커의 변형을 나타내는 세포는 발현 리프레서 또는 발현 억제 시스템을 포함하지 않는다. 후성유전학적 마커의 발현 및/또는 변형의 감소는 발현 리프레서 또는 발현 억제 시스템과의 접촉 후에, 예를 들어 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 지속될 수 있다.
일부 구현예에서, 발현 리프레서 또는 발현 억제 시스템에 의해 이전에 접촉된 세포는 발현 리프레서 또는 발현 억제 시스템이 세포에 더 이상 존재하지 않은 후에, 예를 들어 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안, 발현 리프레서 또는 발현 억제 시스템이 세포에 더 이상 존재하지 않은 후 후성유전학적의 발현의 감소 및/또는 변형을 유지한다.
발현 억제 시스템 및/또는 발현 리프레서의 제조 방법
일부 구현예에서, 발현 리프레서는 단백질이거나 이를 포함하며, 이에 따라 단백질의 제조 방법에 의해 생성될 수 있다. 일부 구현예에서, 발현 억제 시스템, 예를 들어 발현 억제 시스템의 발현 리프레서(들)는 하나 이상의 단백질을 포함하며, 이에 따라 단백질의 제조 방법에 의해 생성될 수 있다. 당업자에 의해 이해되는 바와 같이, (본 명세서에 기재된 바와 같은 조절제 내에 포함될 수 있는) 단백질 또는 폴리펩타이드의 제조 방법은 당업계에서 일상적이다. 일반적으로, 문헌[males & James (Eds.), Therapeutic Proteins: Methods and Protocols (Methods in Molecular Biology), Humana Press (2005)]; 및 [Crommelin, Sindelar & Meibohm (Eds.), Pharmaceutical Biotechnology: Fundamentals and Applications, Springer (2013).]을 참조한다.
본 개시내용의 조성물의 단백질 또는 폴리펩타이드는 표준 고상(solid phase) 기법을 사용함으로써 생화학적으로 합성될 수 있다. 그러한 방법은 전체 고상 합성 방법, 부분 고상 합성 방법, 단편 축합, 고전적 용액 합성을 포함한다. 이들 방법은 펩타이드가 비교적 짧을 때(예를 들어, 10 kDa) 그리고/또는 그것이 재조합 기법에 의해 생성될 수 없을 때(즉, 핵산 서열에 의해 인코딩되지 않을 때) 사용될 수 있으며, 이에 따라 상이한 화학을 수반한다.
고상 합성 절차는 당업계에 잘 알려져 있으며, 문헌[John Morrow Stewart and Janis Dillaha Young, Solid Phase Peptide Syntheses, 2nd Ed., Pierce Chemical Company, 1984]; 및 문헌[Coin, I., et al., Nature Protocols, 2:3247-3256, 2007]에 의해 추가로 기재되어 있다.
더 긴 펩타이드의 경우, 재조합 방법이 사용될 수 있다. 재조합 치료용 폴리펩타이드의 제조 방법은 당업계에서 일상적이다. 일반적으로, 문헌[males & James (Eds.), Therapeutic Proteins: Methods and Protocols (Methods in Molecular Biology), Humana Press (2005)]; 및 [Crommelin, Sindelar & Meibohm (Eds.), Pharmaceutical Biotechnology: Fundamentals and Applications, Springer (2013).]을 참조한다.
재조합 단백질은 또한 곤충 세포, 효모, 박테리아 또는 기타 세포를 사용하여 적절한 프로모터 제어 하에 생산될 수도 있지만, 치료적 약학 단백질 또는 폴리펩타이드를 생산하기 위한 예시적인 방법은 포유동물 세포에서의 발현을 포함한다. 포유동물 발현 벡터는 복제 기점, 적합한 프로모터, 및 기타 5' 또는 3' 측접하는 비-전사 서열과 같은 비-전사 요소들, 및 필요한 리보솜 결합 부위, 폴리아데닐화 부위, 스플라이스 공여체 및 수용체 부위, 및 종료 서열과 같은 5' 또는 3' 비번역 서열을 포함할 수 있다. SV40 바이러스 게놈, 예를 들어 SV40 기원으로부터 유래된 DNA 서열, 초기 프로모터, 스플라이스 및 폴리아데닐화 부위는 이종 DNA 서열의 발현에 필요한 기타 유전자 요소를 제공하는 데 사용될 수 있다. 박테리아, 진균, 효모, 및 포유동물 세포 숙주와의 사용을 위한 적절한 클로닝과 발현 벡터가 문헌[Green & Sambrook, Molecular Cloning: A Laboratory Manual (Fourth Edition), Cold Spring Harbor Laboratory Press (2012)]에 기재되어 있다.
대량의 단백질 또는 폴리펩타이드가 필요한 경우, 그것은 문헌[Brian Bray, Nature Reviews Drug Discovery, 2:587-593, 2003]; 및 문헌[Weissbach & Weissbach, 1988, Methods for Plant Molecular Biology, Academic Press, NY, Section VIII, pp 421-463]에 기재된 바와 같은 기법을 사용하여 생성될 수 있다.
다양한 포유동물 세포 배양 시스템이 재조합 단백질 발현 및 제조를 위해 사용될 수 있다. 포유동물 발현 시스템의 예에는 CHO 세포, COS 세포, HeLA 및 BHK 세포주가 포함된다. 단백질 치료제의 생산을 위한 숙주 세포 배양의 과정은 문헌[Zhou and Kantardjieff (Eds.), Mammalian Cell Cultures for Biologics Manufacturing (Advances in Biochemical Engineering/Biotechnology), Springer (2014)]에 기재되어 있다. 본 명세서에 기재된 조성물은 재조합 단백질을 인코딩하는, 벡터, 예컨대 바이러스 벡터, 예를 들어 렌티바이러스 벡터를 포함할 수 있다. 일부 구현예에서, 벡터, 예를 들어 바이러스 벡터는 재조합 단백질을 인코딩하는 핵산을 포함할 수 있다. 본 명세서에 기재된 조성물은 재조합 단백질을 인코딩하는, 벡터, 예컨대 바이러스 벡터, 예를 들어 렌티바이러스 벡터를 캡슐화하는 지질 나노입자를 포함할 수 있다. 일부 구현예에서, 벡터, 예를 들어 바이러스 벡터를 캡슐화하는 지질 나노입자는 재조합 단백질을 인코딩하는 핵산을 포함할 수 있다.
단백질 치료제의 정제는 문헌[Franks, Protein Biotechnology: Isolation, Characterization, and Stabilization, Humana Press (2013)]; 및 문헌[Cutler, Protein Purification Protocols (Methods in Molecular Biology), Humana Press (2010)]에 기재되어 있다. 단백질 치료제의 제형은 문헌[eyer (Ed.), Therapeutic Protein Drug Products: Practical Approaches to formulation in the Laboratory, Manufacturing, and the Clinic, Woodhead Publishing Series (2012)]에 기재되어 있다.
단백질은 하나 이상의 아미노산을 포함한다. 아미노산은, 예를 들어 하나 이상의 펩타이드 결합의 형성을 통해 폴리펩타이드 사슬 내로 도입될 수 있는 임의의 화합물 및/또는 물질을 포함한다. 일부 구현예에서, 아미노산은 일반 구조 H2N-C(H)I-COOH를 갖는다. 일부 구현예에서, 아미노산은 자연 발생 아미노산이다. 일부 구현예에서, 아미노산은 비천연 아미노산이고; 일부 구현예에서, 아미노산은 D-아미노산이며; 일부 구현예에서, 아미노산은 L-아미노산이다. "표준 아미노산"은 자연 발생 펩타이드에서 일반적으로 발견되는 20개의 표준 L-아미노산 중 임의의 것을 지칭한다. "비표준 아미노산"은 그것이 합성에 의해 제조되는지 또는 천연 공급원으로부터 수득되는지의 여부에 관계 없이 표준 아미노산 이외의 임의의 아미노산을 지칭한다. 일부 구현예에서, 폴리펩타이드 내의 카르복시- 및/또는 아미노-말단 아미노산을 포함한 아미노산은 상기 일반적인 구조와 비교하여 구조적 변형을 포함할 수 있다. 예를 들어, 일부 구현예에서, 아미노산은 일반적인 구조와 비교하여 메틸화, 아미드화, 아세틸화, PEG화, 글리코실화, 인산화, 및/또는 치환(예를 들어, 아미노 기, 카르복실산 기, 하나 이상의 양성자, 및/또는 하이드록실 기의 치환)에 의해 변형될 수 있다. 일부 구현예에서, 그러한 변형은, 예를 들어 달리 동일한 비변형된 아미노산을 함유하는 것와 비교하여, 변형된 아미노산을 함유하는 폴리펩타이드의 순환 반감기를 변경시킬 수 있다. 일부 구현예에서, 그러한 변형은, 달리 동일한 비변형된 아미노산을 함유하는 것와 비교하여, 변형된 아미노산을 함유하는 폴리펩타이드의 관련 활성을 유의하게 변경시키지 않는다. 맥락으로부터 명백한 바와 같이, 일부 구현예에서, 용어 "아미노산"은 유리 아미노산을 지칭하는 데 사용될 수 있으며; 일부 구현예에서 그것은 폴리펩타이드의 아미노산 잔기를 지칭하는 데 사용될 수 있다.
약제학적 조성물, 제형, 전달, 및 투여
추가로 본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 포함하는 약제학적 조성물, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 인코딩하는 핵산을 포함하는 약제학적 조성물, 및/또는 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 세포, 조직, 기관, 및/또는 대상체에게 전달하는 조성물에 관한 것이다.
본 명세서에 사용되는 바와 같이, 용어 "약제학적 조성물"은 하나 이상의 약제학적으로 허용되는 담체(예를 들어, 당업자에게 알려진 약제학적으로 허용되는 담체)와 함께 제형화된 활성제(예를 들어, 발현 리프레서 또는 발현 수용체의 핵산, 예를 들어 발현 억제 시스템, 예를 들어 발현 리프레서 시스템의 발현 리프레서(들), 또는 이를 인코딩하는 핵산)를 지칭한다. 일부 구현예에서, 활성제는 관련 집단에 투여될 때 사전결정된 치료적 효과를 달성할 통계학적으로 유의한 확률을 나타내는 치료 투약계획에서 투여하기에 적절한 단위 용량으로 존재한다. 일부 구현예에서, 본 개시내용의 발현 리프레서를 포함하는 약제학적 조성물은 발현 리프레서 또는 이를 인코딩하는 핵산(들)을 포함한다. 일부 구현예에서, 본 개시내용의 발현 억제 시스템을 포함하는 약제학적 조성물은 발현 억제 시스템의 각각의 발현 리프레서 또는 이를 인코딩하는 핵산(들)을 포함한다(예를 들어, 발현 억제 시스템이 제1 발현 리프레서 및 제2 발현 리프레서를 포함한다면, 약제학적 조성물은 제1 및 제2 발현 리프레서를 포함한다). 일부 구현예에서, 약제학적 조성물은 복수의 발현 리프레서를 포함하는 발현 억제 시스템의 발현 리프레서 전부보다 적게 포함한다. 예를 들어, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함할 수 있으며, 제1 약제학적 조성물은 제1 발현 리프레서 또는 이를 인코딩하는 핵산를 포함할 수 있고 제2 약제학적 조성물은 제2 발현 리프레서 또는 이를 인코딩하는 핵산을 포함할 수 있다. 일부 구현예에서, 약제학적 조성물은 하나 이상의 발현 리프레서, 또는 이를 인코딩하는 핵산(들)의 공제형을 포함할 수 있다.
일부 구현예에서, 약제학적 조성물은 고체 또는 액체 형태로의 투여를 위해 특수하게 제형화될 수 있으며, 이에는 하기에 맞게 구성된 것들이 포함된다: 경구 투여, 예를 들어 드렌치(drench)(수성 또는 비수성 용액 또는 현탁액), 정제, 예를 들어 협측, 설하, 및 전신 흡수를 목표로 한 것들, 볼루스, 분말, 과립, 혀에 적용하기 위한 페이스트; 비경구 투여, 예를 들어 피하, 근육내, 정맥내 또는 경막외 주사에 의한 투여, 예를 들어 멸균 용액 또는 현탁액, 또는 지속-방출 제형으로서의 주사; 국소 적용, 예를 들어 피부, 폐, 또는 구강에 적용되는 크림, 연고, 또는 제어-방출 패치 또는 스프레이로서의 적용; 질내 또는 직장내 투여, 예를 들어 페서리(pessary), 크림, 또는 폼(foam)으로서의 투여; 설하 투여; 안내 투여(ocularly); 경피 투여; 또는 비강, 폐, 및/또는 기타 다른 점막 표면 투여.
본 명세서에 사용되는 바와 같이, 용어 "약제학적으로 허용되는"은, 적절한 의학적 판단의 범주 내에서, 합리적인 이득/위험 비에 부합하면서, 과도한 독성, 자극, 알러지 반응, 또는 다른 문제 또는 합병증 없이 인간 및 동물의 조직과 접촉하여 사용하기에 적합한 화합물, 물질, 조성물, 및/또는 투여 형태를 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "약제학적으로 허용되는 담체"는 대상 화합물을 하나의 기관, 또는 신체의 일부분을 또 다른 기관, 또는 신체의 일부분으로 운반 또는 수송하는 데 관여하는 약제학적으로 허용되는 물질, 조성물, 또는 비히클, 예컨대 액체 또는 고체 충전제, 희석제, 부형제, 또는 용매 캡슐화 물질을 의미한다. 각 담체는, 제형의 나머지 다른 성분들과 상용성이고 환자에게 해롭지 않다는 의미에서 "허용되어야" 한다. 일부 구현예에서, 예를 들어, 약제학적으로 허용되는 담체로서의 역할을 할 수 있는 물질은 하기를 포함한다: 당, 예컨대 락토스, 글루코스 및 수크로스; 전분, 예컨대 옥수수 전분 및 감자 전분; 셀룰로스, 및 이의 유도체, 예컨대 나트륨 카르복시메틸 셀룰로스, 에틸 셀룰로스 및 셀룰로스 아세테이트; 분말형 트래거캔스; 맥아; 젤라틴; 활석; 부형제, 예컨대 코코아 버터 및 좌제 왁스; 오일, 예컨대 땅콩유, 면실유, 홍화유, 참깨유, 올리브유, 옥수수유 및 대두유; 글리콜, 예컨대 프로필렌 글리콜; 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜; 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; 한천; 완충제, 예컨대 수산화마그네슘 및 수산화알루미늄; 알긴산; 무발열성 물(pyrogen-free water); 등장 식염수; 링거 용액; 에틸 알코올; pH 완충 용액; 폴리에스테르, 폴리카르보네이트 및/또는 폴리무수물; 및 약제학적 제형에 사용되는 기타 다른 무독성 상용성 물질.
본 명세서에 사용되는 바와 같이, "약제학적으로 허용되는 염"은 약제학적 맥락에서 사용하기에 적절한 그러한 화합물의 염, 즉, 올바른 의학적 판단의 범주 내에서, 과도한 독성, 자극, 알러지 반응 등 없이 인간 및 하등 동물의 조직과 접촉하여 사용하기에 적합하고, 합리적인 효과/위험 비에 부합하는 염을 지칭한다. 약제학적으로 허용되는 염은 당업계에 잘 알려져 있다. 예를 들어, S. M. Berge외 다수는 문헌[J. Pharmaceutical Sciences, 66: 1-19 (1977)]에서 약제학적으로 허용되는 염을 상세히 기재한다. 일부 구현예에서, 약제학적으로 허용되는 염은 비독성 산 부가 염을 포함하지만 이로 한정되지 않으며, 이때 비독성 산 부가 염은 무기 산, 예컨대 염산, 브롬화수소산, 인산, 황산 및 과염소산과 함께 또는 유기 산, 예컨대 아세트산, 말레산, 타르타르산, 시트르산, 석신산, 또는 말론산과 함께 형성되는 아미노 기의 염이거나, 당업계에서 사용되는 다른 방법, 예컨대 이온 교환을 사용함으로써 형성된 것이다. 일부 구현예에서, 약제학적으로 허용되는 염은 아디페이트, 알기네이트, 아스코르베이트, 아스파르테이트, 벤젠설포네이트, 벤조에이트, 바이셀페이트, 보레이트, 부티레이트, 캄퍼레이트, 캄퍼설포네이트, 시트레이트, 사이클로펜탄프로피오네이트, 디글루코네이트, 도데실설페이트, 에탄설포네이트, 포르메이트, 푸마레이트, 글루코헵토네이트, 글리세로포스페이트, 글루코네이트, 헤미설페이트, 헵타노에이트, 헥사노에이트, 하이드로요오다이드, 2-하이드록시-에탄설포네이트, 락토바이오네이트, 락테이트, 라우레이트, 라우릴 설페이트, 말레이트, 말레에이트, 말로네이트, 메탄설포네이트, 2-나프탈렌설포네이트, 니코티네이트, 니트레이트, 올레에이트, 옥살레이트, 팔미테이트, 파모에이트, 펙티네이트, 퍼설페이트, 3-페닐프로피오네이트, 포스페이트, 피크레이트, 피발레이트, 프로피오네이트, 스테아레이트, 석시네이트, 설페이트, 타르트레이트, 티오시아네이트, p-톨루엔설포네이트, 운데카노에이트, 발레레이트 염 등을 포함하지만 이로 한정되지 않는다. 대표적인 알칼리 금속 또는 알칼리 토금속 염은 나트륨, 리튬, 칼륨, 칼슘, 마그네슘 등을 포함한다. 일부 구현예에서, 약제학적으로 허용되는 염은 적절한 경우, 비독성 암모늄, 4차 암모늄, 및 할라이드, 하이드록사이드, 카르복실레이트, 설페이트, 포스페이트, 니트레이트, 1 내지 6개의 탄소 원자를 갖는 알킬, 설포네이트, 및 아릴 설포네이트와 같은 반대이온을 사용하여 형성된 아민 양이온을 포함한다.
다양한 구현예에서, 본 개시내용은 약제학적으로 허용되는 부형제와 함께 본 명세서에 기재된 약제학적 조성물을 제공한다. 약제학적으로 허용되는 부형제는, 일반적으로 안전하고, 비독성이고, 바람직한 약제학적 조성물을 제조하는 데 유용한 부형제를 포함하고, 인간의 약제학적 용도뿐만 아니라 수의용 용도에 허용되는 부형제를 포함한다. 그러한 부형제는 고체, 액체, 반고체이거나, 에어로졸 조성물의 경우에는 가스상일 수 있다.
약제학적 제제는, 정제 형태에 대해서는 필요에 따라 밀링, 혼합, 과립화, 및 압축을; 또는 경질 젤라틴 캡슐 형태에 대해서는 밀링, 혼합, 및 충전을 수반하는 통상적인 조제 기법에 따라 제조될 수 있다. 액체 담체가 사용될 때, 제제는 시럽, 엘릭서, 에멀젼 또는 수성 또는 비수성 용액 또는 현탁액의 형태일 수 있다. 그러한 액체 제형은 직접 os(경구) 투여될 수 있다.
일부 구현예에서, 약제학적 조성물은 임의의 투여 경로를 통한 세포 및/또는 대상체에 대한 전달을 위해 제형화될 수 있다. 대상체에 대한 투여 방식은 주사, 주입, 흡입, 비강내, 안내(intraocular), 국소 전달, 캐뉼러내 전달, 또는 섭취를 포함할 수 있다. 주사는, 제한 없이, 정맥내, 근육내, 동맥내, 수강내, 뇌실내, 관절낭내, 안와내, 심장내, 피내, 복막내, 경기관(transtracheal), 피하, 표피하, 관절내, 피막하, 지주막하, 척수내, 뇌척수내, 및 흉골내 주사 및 주입을 포함한다. 일부 구현예에서, 투여는 에어로졸 흡입, 예를 들어 네뷸라이제이션에 의한 에어로졸 흡입을 포함한다. 일부 구현예에서, 투여는 전신(예를 들어, 경구, 직장, 비강, 설하, 협측, 또는 비경구), 장내(예를 들어, 전신에 미치는 효과를 갖지만, 위장관을 통해 전달됨), 또는 국부(예를 들어, 피부 상에의 국부 적용, 유리체강내 주사) 투여이다. 일부 구현예에서, 하나 이상의 조성물이 전신 투여된다. 일부 구현예에서, 투여는 비경구외(non-parenteral) 투여이고, 치료제는 비경구 치료제이다. 일부 구현예에서, 투여는 기관지(예를 들어, 기관지 점적주입에 의함), 협측, 진피(이는, 예를 들어 진피, 피내, 피간, 경피 등에 대한 국소 투여 중 하나 이상일 수 있거나 이를 포함할 수 있음), 장내, 동맥내, 피내, 위내, 수내, 근육내, 비강내, 복막내, 수강내, 정맥내, 뇌실내, 특정 기관 내(예를 들어, 간내), 점막, 비강, 경구, 직장, 피하, 설하, 국소, 기관(tracheal)(예를 들어, 기관내 점적주입에 의함), 질내, 유리체 투여 등일 수 있다. 일부 구현예에서, 투여는 단회 용량일 수 있다. 일부 구현예에서, 투여는 간헐적(예를 들어, 복수의 용량이 시간적으로 분리됨) 및/또는 주기적(예를 들어, 개별 용량이 공통된 기간에 의해 분리됨) 투약을 수반할 수 있다. 일부 구현예에서, 투여는 적어도 선택된 기간 동안 연속 투약(예를 들어, 관류)을 수반할 수 있다. 일부 구현예에서, 6, 8, 10, 12, 15 또는 20회, 또는 그 이상의 투여가 1회 치료 동안 또는 치료 투약계획으로서 일정 기간에 걸쳐 대상체에게 제공될 수 있다.
일부 구현예에서, 예를 들어 질환, 장애 또는 병태와 연관된 증상이 지속되는 한, 필요에 따라 투여가 제공될 수 있다. 일부 구현예에서, 반복 투여는 대상체의 남은 생애 동안 필요할 수 있다. 치료 기간은 다양할 수 있으며, 예를 들어 1일, 2일, 3일, 1주, 2주, 1개월, 2개월, 3개월, 6개월, 1년, 또는 그 이상일 수 있다.
투약량
투여되는 작용제 또는 조성물의 투약량은, 예를 들어 치료되는 병태, 질환의 중증도, 대상체의 개별 파라미터(연령, 생리학적 조건, 크기 및 체중을 포함함), 치료 지속기간, (존재하는 경우) 수행될 치료의 유형, 특정 투여 경로 및 유사한 인자에 기반하여 달라질 수 있다. 따라서, 본 명세서에 기재된 작용제의 투여되는 용량은 그러한 다양한 파라미터에 좌우될 수 있다. 투여되는 조성물의 투약량은 또한 대상체의 성별, 전반적인 의학적 상태, 및 치료하려는 장애의 중증도와 같은 기타 다른 인자에 따라 달라질 수 있다. 또한 더 낮거나 더 높은 투약량이 상황에 따라 투여될 수 있지만 단일 정맥내 주입으로서 약 1 mg/kg 내지 6 mg/kg의 범위인 본 명세서에 개시된 조절제 또는 조절제의 조합의 투약량을 대상체에게 제공하는 것이 바람직할 수 있다. 투약량은 필요에 따라, 예를 들어 매일 1회(예를 들어, 1 내지 30일 동안), 3일마다 1회(예를 들어, 1 내지 30일 동안), 5일마다 1회(예를 들어, 1 내지 30일 동안), 1주마다 1회(예를 들어, 1 내지 6주 동안 또는 2 내지 5주 동안) 반복될 수 있다. 일부 구현예에서, 투약량은 1.0 mg/kg 내지 6 mg/kg, 1.0 mg/kg 내지 5 mg/kg, 1.0 mg/kg 내지 4 mg/kg, 1.0 내지 3.0 mg/kg, 1.5 mg/kg 내지 3.0 mg/kg, 1.0 mg/kg 내지 1.5 mg/kg, 1.5 mg/kg 내지 3 mg/kg, 3 mg/kg 내지 4 mg/kg, 4 mg/kg 내지 5 mg/kg, 또는 5 mg/kg 내지 6 mg/kg을 포함할 수 있지만 이에 제한되지 않는다. 투약량은 다수 회, 예를 들어 1주마다 1회 또는 2회, 또는 1 또는 2주마다 1회 투여될 수 있다. 일부 구현예에서, 대상체는 또한 더 낮거나 더 높은 투약량이 상황에 따라 투여될 수 있지만 다중 정맥내 주입으로서 약 1 mg/kg 내지 6 mg/kg의 범위인 본 명세서에 개시된 조절제 또는 조절제의 조합의 투약량을 제공받는다.
본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 3 내지 5일마다 1회 투약량으로 투여될 수 있고, 총 적어도 3회 투약량에 대해 반복된다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 25일 동안 5일마다 3 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 1 내지 10회 용량에 대해 3 내지 5일마다 1.0 내지 5.0 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 3회 용량에 대해 5일마다, 그 다음 3회 용량에 대해 3일마다 1.0 내지 3.0 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 4회 용량에 대해 5일마다, 그 다음 3회 용량에 대해 3일마다 1.0 내지 3.0 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 1 내지 10회 용량에 대해 5일마다 6 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 1 내지 10회 용량에 대해 5일마다 3 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 2회 용량에 대해 5일마다 1.5 mg/kg, 3회 용량에 대해 5일마다 3 mg/kg, 1회 용량에 대해 3일마다 3 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 5일마다 6 mg/kg으로 투여될 수 있거나 5일 동안 1일 1회 1.5 mg/kg으로 투여되고 2일은 중단될 수 있다. 투약 일정은 선택적으로 다른 간격으로 반복될 수 있고 투약량은 용량과 일정을 적절하게 조정하여 다양한 비경구 경로를 통해 제공될 수 있다. 일부 구현예에서, 조절제 또는 조절제의 조합의 투약은 1.0 mg/kg 내지 6.0 mg/kg의 투약량을 포함할 수 있으며, 선택적으로 매주, 1주에 2회, 또는 격주로 제공될 수 있다. 당업자는 다양한 인자, 예컨대 연령, 성별, 체중, 치료될 장애의 중증도가 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합의 투약량을 선택하는 데 고려될 수 있으며, 투약량 및/또는 투여 빈도가 치료 과정 동안 증가 또는 감소될 수 있음을 인식할 것이다. 투약량은 필요에 따라 반복될 수 있으며, 2 내지 8회만큼의 투약 후 종양 부피의 감소의 증거가 관찰된다. 본 명세서에 개시된 투약량 및 투여 일정은 시스플라틴, 소라페닙, 또는 소분자 비교자와 비교하여 대상체의 전체 체중에 대한 최소한의 효과를 나타낸다. 대상 방법은 CT 및/또는 PET/CT를 사용하여 규칙적인 간격으로 종양 반응을 측정하는 것을 포함할 수 있다. 종양 마커의 혈중 수치도 또한 모니터링될 수 있다. 투약량 및/또는 투여 일정은 영상화 및/또는 마커 혈중 수치의 결과에 따라 필요에 따라 조정될 수 있다.
일부 구현예에서, 본 명세서에 개시된 조성물은 외과적 절제, 타이로신 키나제 억제제(TKI), 예를 들어 소라페닙, 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1, 예를 들어 BET672, 예를 들어 비라브레십, MEK 억제제, (예를 들어, 트라메티닙), 동소 간 이식, 고주파 절제, 면역요법, 면역 관문 및 항-혈관-내피-성장 인자 병용 요법, 광역동 치료(PDT), 레이저 치료, 근접치료, 방사선 치료, 경-카테터 동맥 화학- 또는 방사선-색전술, 정위 방사선 치료, 화학요법, 및/또는 전신 화학요법으로부터 선택되는 하나 이상의 치료제 또는 방법과 조합하여 투여되어 질환 또는 장애를 치료할 수 있다. 하기 표 21은 예시적인 치료제를 개시한다.
본 개시내용에 따른 약제학적 조성물은 치료적 유효량으로 전달될 수 있다. 정확한 치료적 유효량은 주어진 대상체에서 치료 효능의 관점에서 가장 효과적인 결과를 가져오게 될 조성물의 양이다. 이 양은 치료적 화합물의 특성(활성, 약동학적 특성, 약력학적 특성, 및 생체이용률을 포함함), 대상체의 생리학적 조건(연령, 성별, 질환 유형 및 병기, 전반적인 신체적 상태, 주어진 투약량에 대한 반응, 및 약제의 유형을 포함함), 제형에서의 약제학적으로 허용되는 담체 또는 담체들의 성질, 및/또는 투여 경로를 포함하지만 이로 한정되지 않는 다양한 인자에 따라 달라질 것이다.
일부 양태에서, 본 개시내용은 치료제를 전달하는 방법을 제공하며, 상기 방법은 본 명세서에 기재된 바와 같은 조성물을 대상체에게 투여하는 단계를 포함하며, 여기서 조절제는 치료제이고/이거나 치료제의 전달은 치료제의 부재 하에서의 유전자 발현과 대비하여 유전자 발현의 변화를 야기한다.
본 명세서의 다양한 구현예에 제공된 바와 같은 방법이 본 명세서에 기재된 임의의 일부 양태에서 이용될 수 있다. 일부 구현예에서, 하나 이상의 조성물은 특정 세포, 또는 하나 이상의 특정 조직에 표적화된다.
예를 들어, 일부 구현예에서 하나 이상의 조성물은 간, 상피, 결합, 근육, 생식, 및/또는 신경 조직 또는 세포에 표적화된다. 일부 구현예에서, 조성물은 특정 기관계의 세포 또는 조직, 예를 들어 심혈관계(심장, 혈관계); 소화계(식도, 위, 간, 담낭, 췌장, 장, 결장, 직장 및 항문); 내분비계(시상하부, 뇌하수체, 송과체 또는 송과선, 갑상선, 부갑상선, 부신); 배설계(신장, 요관, 방광); 림프계(림프, 림프절, 림프관, 편도선, 인두편도, 흉선, 비장); 외피계(피부, 모발, 손발톱); 근육계(예를 들어, 골격근); 신경계(뇌, 척수, 신경); 생식기계(난소, 자궁, 유선, 고환, 수정관, 정낭, 전립선); 호흡계(인두, 후두, 기관, 기관지, 폐, 횡격막); 골격계(뼈, 연골); 및/또는 이들의 조합에 표적화된다.
일부 구현예에서, 본 개시내용의 조성물은 혈액-뇌 장벽, 태반막, 또는 혈액-고환 장벽을 횡단한다.
일부 구현예에서, 본 명세서에 제공된 바와 같은 약제학적 조성물은 전신 투여된다.
일부 구현예에서, 투여는 비경구외(non-parenteral) 투여이고, 치료제는 비경구 치료제이다.
본 명세서에 제공된 방법 및 조성물은 질환, 장애, 및/또는 병태의 증상을 경감시키는 충분한 투약계획에 의해 투여되는 약제학적 조성물을 포함할 수 있다. 일부 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물을 투여함으로써 치료제를 전달하는 방법을 제공한다.
본 개시내용의 약제학적 용도는 본 명세서에 기재된 바와 같은 조성물(예를 들어, 조절제, 예를 들어 파괴제)을 포함할 수 있다.
일부 구현예에서, 본 개시내용의 약제학적 조성물은 활성제 단독과 비교하여 개선된 PK/PD, 예를 들어 증가된 약동학적 특성 또는 약력학적 특성, 예컨대 개선된 표적화, 흡수, 또는 수송(예를 들어, 적어도 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 75%, 80%, 90% 개선되거나 그 이상임)을 갖는다. 일부 구현예에서, 약제학적 조성물은 치료제 단독과 비교하여 바람직하지 않은 효과의 감소, 예컨대 비표적 위치로의 확산, 탈표적(off-target) 활성, 또는 독성 대사의 감소를 갖는다(예를 들어, 활성제 단독과 대비하여 적어도 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 75%, 80%, 90% 또는 그 이상이 감소됨). 일부 구현예에서, 조성물은 활성제 단독과 비교하여 (예를 들어, 적어도 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 75%, 80%, 90% 또는 그 이상) 치료제의 효능을 증가시키고/시키거나 독성을 감소시킨다.
본 명세서에 기재된 약제학적 조성물은, 예를 들어 담체, 예컨대 약제학적 담체 및/또는 중합체 담체, 예를 들어 나노입자, 리포좀 또는 소포를 포함하는 것으로 제형화되고, 알려진 방법에 의해 이를 필요로 하는 대상체(예를 들어, 인간 또는 비인간 농업용 동물 또는 가축 동물, 예를 들어 소, 개, 고양이, 말, 가금류)에게 전달될 수 있다. 그러한 방법은 형질감염(예를 들어, 지질-매개, 양이온성 중합체, 인산칼슘); 전기천공 또는 막 파괴(예를 들어, 뉴클레오펙션(nucleofection)) 및 바이러스 전달(예를 들어, 렌티바이러스, 레트로바이러스, 아데노바이러스, AAV)의 기타 다른 방법을 포함한다. 전달 방법은 또한, 예를 들어 문헌[Gori et al., Delivery and Specificity of CRISPR/Cas9 Genome Editing Technologies for Human Gene Therapy. Human Gene Therapy. July 2015, 26(7): 443-451. Doi:10.1089/hum.2015.074]; 및 문헌[Zuris et al. Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo. Nat Biotechnol. 2014 Oct 30;33(1):73-80]에 기재되어 있다.
지질 나노입자
본 명세서에 기재된 바와 같은 발현 리프레서 또는 발현 억제 시스템은 입자를 포함한 임의의 생물학적 전달 시스템/제형, 예를 들어 나노입자 전달 시스템을 사용하여 전달될 수 있다. 나노입자는 치수(예를 들어, 직경)가 약 1 내지 약 1000 나노미터, 약 1 내지 약 500 나노미터 크기, 약 1 내지 약 100 nm, 약 30 nm 내지 약 200 nm, 약 50 nm 내지 약 300 nm, 약 75 nm 내지 약 200 nm, 약 100 nm 내지 약 200 nm, 및 이들 사이의 임의의 범위인 입자를 포함한다. 나노입자는 나노규모 치수들의 복합 구조를 갖는다. 일부 구현예에서, 나노입자는 통상적으로 구형이지만, 나노입자 조성에 따라 상이한 모폴로지가 가능하다. 나노입자의 외부 환경과 접촉해 있는 나노입자의 일부분은 일반적으로 나노입자의 표면으로서 확인된다. 일부 구현예에서, 나노입자는 최대 치수가 25 nm 내지 200 nm의 범위이다. 본 명세서에 기재된 바와 같은 나노입자는 고체, 반고체, 에멀젼, 또는 콜로이드성 나노입자를 포함하지만 이로 한정되지 않는 임의의 형태로 제공될 수 있는 전달 시스템을 포함한다. 나노입자 전달 시스템은 지질-기반 시스템, 리포좀, 미셀, 마이크로소포, 엑소솜, 또는 유전자 총(gene gun)을 포함할 수 있지만 이로 한정되지 않는다. 일 구현예에서, 나노입자는 지질 나노입자(LNP)이다. 일부 구현예에서, LNP는 분자간력에 의해 서로 물리적으로 회합된 복수의 지질 분자를 포함하는 입자이다.
일부 구현예에서, LNP는 다수의 성분, 예를 들어 3개 또는 4개의 성분을 포함할 수 있다. 일 구현예에서, 발현 리프레서 또는 상기 리프레서를 포함하는 약제학적 조성물(또는 발현 리프레서를 인코딩하는 핵산, 또는 상기 발현 리프레서 핵산을 포함하는 약제학적 조성물)이 LNP 내에 캡슐화된다. 일 구현예에서, 발현 억제 시스템 또는 상기 발현 억제 시스템을 포함하는 약제학적 조성물(또는 발현 억제 시스템을 인코딩하는 핵산, 또는 상기 발현 억제 시스템 핵산을 포함하는 약제학적 조성물)이 LNP 내에 캡슐화된다. 일부 구현예에서, 제1 발현 리프레서를 인코딩하는 핵산 및 제2 발현 리프레서를 인코딩하는 핵산이 동일한 LNP에 존재한다. 일부 구현예에서, 제1 발현 리프레서를 인코딩하는 핵산 및 제2 발현 리프레서를 인코딩하는 핵산이 상이한 LNP에 존재한다. LNP의 제조 및 조절제 캡슐화가 사용될 수 있고/있거나 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, December 2011]으로부터 변형될 수 있다. 일부 구현예에서, 본 명세서에 개시된 지질 나노입자 조성물은 mRNA에 의해 인코딩된 단백질의 발현에 유용하다. 일부 구현예에서, 핵산은, 지질 나노입자 내에 존재할 때, 수용액 중에서 뉴클레아제에 의한 분해에 저항한다.
일부 구현예에서, LNP 제형은 CCD 지질, 중성 지질, 및/또는 헬퍼 지질을 포함할 수 있다. 일부 구현예에서, LNP 제형은 이온화 가능한 지질을 포함한다. 일부 구현예에서, 이온화 가능한 지질은 양이온성 지질, 이온화 가능한 양이온성 지질, 또는 용이하게 양성자화될 수 있는 아민-함유 지질일 수 있다. 일부 구현예에서, 지질은 pH에 따라 양으로 하전된 형태 또는 중성 형태로 존재할 수 있는 양이온성 지질이다. 일부 구현예에서, 양이온성 지질은, 예를 들어 생리학적 조건 하에서 양으로 하전될 수 있는 지질이다. 일부 구현예에서, 지질 입자는 중성 지질, 이온화 가능한 아민-함유 지질, 생분해성 알킨 지질, 스테로이드, 인지질(다가불포화 지질을 포함함), 구조 지질(예를 들어, 스테롤), PEG, 콜레스테롤, 및 중합체 접합된 지질 중 하나 이상과 함께 제형 내에 양이온성 지질을 포함한다.
일부 구현예에서, LNP 제형(예를 들어, MC3 및/또는 SSOP)은 콜레스테롤, PEG, 및/또는 헬퍼 지질을 포함한다. LNP는, 예를 들어 미소구체, 예컨대 단층 및 다층 소포, 라멜라 상 지질 이중층일 수 있으며, 이는 일부 구현예에서 실질적으로 구형이다.
일부 구현예에서, LNP는 수성 코어, 예를 들어 본 명세서에 개시된 바와 같은 발현 리프레서 또는 시스템을 인코딩하는 핵산을 포함하는 수성 코어를 포함할 수 있다. 본 개시내용의 일부 구현예에서, LNP 제형을 위한 카고는 적어도 하나의 가이드 RNA를 포함한다. 일부 구현예에서, 카고, 예를 들어 본 명세서에 개시된 바와 같은 발현 리프레서, 또는 시스템를을 인코딩하는 핵산은 LNP, 예를 들어 양이온성 지질을 포함하는 LNP의 표면에 흡착될 수 있다. 일부 구현예에서, 카고, 예를 들어 본 명세서에 개시된 바와 같은 발현 리프레서, 또는 시스템을 인코딩하는 핵산은 LNP와 회합될 수 있다. 일부 구현예에서, 카고, 예를 들어 본 명세서에 개시된 바와 같은 발현 리프레서, 또는 시스템을 인코딩하는 핵산은 LNP 내에 캡슐화되며, 예를 들어 완전 캡슐화 및/또는 부분 캡슐화될 수 있다.
일부 구현예에서, 카고를 포함하는 LNP는 전신 전달, 예를 들어 유기체 내에서 활성제의 폭넓은 노출을 초래할 수 있는 카고의 치료적 유효 용량의 전달을 위해 투여될 수 있다. 지질 나노입자의 전신 전달은, 예를 들어 정맥내, 동맥내, 피하, 및 복막내 전달을 포함한 당업계에 알려진 임의의 수단에 의해 수행될 수 있다. 일부 구현예에서, 지질 나노입자의 전신 전달은 정맥내 전달에 의해 수행된다. 일부 구현예에서, 카고를 포함하는 LNP는 국부 전달, 예를 들어 유기체 내의 표적 부위로의 활성제의 직접 전달을 위해 투여될 수 있다. 일부 구현예에서, LNP는 질환 부위, 예를 들어 종양, 기타 다른 표적 부위, 예를 들어 염증 부위, 또는 표적 기관, 예를 들어 간, 폐, 위, 결장, 췌장, 자궁, 유방, 림프절 등으로 국부 전달될 수 있다. 일부 구현예에서, 본 명세서에 개시된 바와 같은 LNP는 특정 세포, 예를 들어 간세포, 성상 세포, 쿠퍼 세포, 내피 세포, 폐포 세포, 및/또는 상피 세포로 국부 전달될 수 있다. 일부 구현예에서, 본 명세서에 개시된 바와 같은 LNP는 특정 종양 부위, 예를 들어 피하, 동소 부위로 국부 전달될 수 있다.
LNP는 에멀젼 중에 분산상으로서, 미셀로서, 또는 현탁액 중에 내부상으로서 제형화될 수 있다. 일부 구현예에서, LNP는 생분해성이다. 일부 구현예에서, LNP는 치료적 유효 용량에서 세포독성 수준으로 축적되지 않거나 생체내에서 독성을 야기하지 않는다. 일부 구현예에서, LNP는 치료적 유효 용량으로 반복 투여 후에 세포독성 수준으로 축적되지 않거나 생체내에서 독성을 야기하지 않는다. 일부 구현예에서, LNP는 치료적 유효 용량에서 실질적으로 유해한 효과로 이어지는 선천성 면역 반응을 야기하지 않는다.
일부 구현예에서, 사용되는 LNP는 화학식 (6Z,9Z,28Z,31Z)-헵타트리아콘트-6,9,28,31-테트라엔-19-일 4-(디메틸아미노) 부타노네이트 또는 ssPalmO-페닐-P4C2(ssPalmOPhe, SS-OP)를 포함한다. 일부 구현예에서, LNP 제형은 화학식 (6Z,9Z,28Z,31Z)-헵타트리아콘트-6,9,28,31-테트라엔-19-일 4-(디메틸아미노)부타노네이트(MC3), 1,2-디올레오일-sn-글리세로-3-포스포콜린(DOPC), 콜레스테롤, 1,2-디미리스토일-rac-글리세로-3-메톡시폴리에틸렌 글리콜-2000(PEG2k-DMG), 예를 들어 MC3 LNP 또는 ssPalmO-페닐-P4C2(ssPalmOPhe, SS-OP), 1,2-디올레오일-sn-글리세로-3-포스포콜린(DOPC), 콜레스테롤, 1,2-디미리스토일-rac-글리세로-3-메톡시폴리에틸렌 글리콜-2000(PEG2k-DMG), 예를 들어 SSOP-LNP를 포함한다.
리포좀은 내부 수성 구획을 둘러싸는 단층 또는 다층 지질 이중층 및 상대적으로 불투과성인 외측 친유성 인지질 이중층으로 구성된 구형의 소포 구조이다. 리포좀은 음이온성, 중성 또는 양이온성일 수 있다. 리포좀은 생체적합성이고, 비독성이며, 친수성 및 친유성 약물 분자 둘 다를 전달하고, 혈장 효소에 의한 분해로부터 그들의 카고(cargo)를 보호하고, 생물학적 막 및 혈액-뇌 장벽(BBB)을 가로질러 그들의 로드를 수송할 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. Doi:10.1155/2011/469679] 참조).
소포는 몇몇 상이한 유형의 지질로부터 제조될 수 있지만, 약물 담체로서 리포좀을 생성하는 데 인지질이 가장 일반적으로 사용된다. 소포는, 제한 없이, DOTMA, DOTAP, DOTIM, DDAB를 단독으로 또는 콜레스테롤과 함께 포함하여 DOTMA와 콜레스테롤, DOTAP와 콜레스테롤, DOTIM과 콜레스테롤, 및 DDAB와 콜레스테롤을 생성할 수 있다. 다중라멜라 소낭 지질의 제조 방법은 당업계에 알려져 있다(예를 들어, 다중라멜라 소낭 지질 제제에 관한 교시가 본 명세서에 참조로 포함되는 미국 특허 6,693,086 참조). 지질 필름이 수용액과 혼합되는 경우 소낭 형성은 자발적일 수 있지만, 이는 또한 균질화기, 초음파처리기, 또는 압출 장치를 사용함으로써 진탕 형태로 힘을 가함으로써 더 신속히 처리될 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. Doi:10.1155/2011/469679] 참조). 압출된 지질은 압출된 지질 제제에 관한 교시가 본 명세서에 참조로 포함되는 문헌[Templeton et al., Nature Biotech, 15:647-652, 1997]에 기재된 바와 같이 감소하는 크기의 필터를 통해 압출시킴으로써 제조될 수 있다.
본 명세서에 제공된 방법 및 조성물은 질환, 장애, 및/또는 병태의 증상을 경감시키는 충분한 투약계획에 의해 투여되는 약제학적 조성물을 포함할 수 있다. 일부 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물을 투여함으로써 치료제를 전달하는 방법을 제공한다.
용도
본 개시내용은 추가로 본 명세서에 개시된 발현 리프레서 또는 발현 리프레서 시스템의 용도에 관한 것이다. 특히, 일부 구현예에서 그러한 제공된 기술은 표적 유전자, 예를 들어 MYC 발현의 조절, 예를 들어 억제를 달성하는 데, 그리고 예를 들어, 이를 테면 세포 내에서의 표적 유전자, 예를 들어 MYC의 활성, 전달, 및 침투의 제어를 가능하게 하는 데 사용될 수 있다. 일부 구현예에서, 세포는 포유동물 세포, 예를 들어 인간 세포이다. 일부 구현예에서, 세포는 체세포이다. 일부 구현예에서, 세포는 1차 세포이다. 예를 들어, 일부 구현예에서, 세포는 포유동물 체세포이다. 일부 구현예에서, 포유동물 체세포는 1차 세포이다. 일부 구현예에서, 포유동물 체세포는 비배아 세포이다.
유전자 발현의 조절
본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서(또는 이를 인코딩하는 핵산, 또는 상기 발현 리프레서 핵산을 포함하는 약제학적 조성물) 또는 발현 억제 시스템(또는 이를 인코딩하는 핵산, 또는 상기 발현 억제 시스템 또는 핵산을 포함하는 약제학적 조성물)을 제공하는 단계, 및 표적 유전자, 예를 들어 MYC, 및/또는 작동가능하게 연결된 전사 제어 요소(들)를 발현 리프레서 또는 발현 억제 시스템과 접촉시키는 단계를 포함하는, 표적 유전자, 예를 들어 MYC의 발현을 조절하는, 예를 들어 감소시키는 방법에 관한 것이다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC의 발현을 조절하는, 예를 들어 감소시키는 것은 참조값, 예를 들어 발현 리프레서 또는 발현 억제 시스템의 부재 하에서의 표적 유전자, 예를 들어 MYC의 전사와 비교하여 표적 유전자, 예를 들어 MYC의 전사의 조절을 포함한다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC의 발현을 조절하는, 예를 들어 감소시키는 방법은 생체외에서, 예를 들어 대상체, 예를 들어 포유동물 대상체, 예를 들어 인간 대상체 유래의 세포 상에서 사용된다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC의 발현을 조절하는, 예를 들어 감소시키는 방법은 생체내에서, 예를 들어 포유동물 대상체, 예를 들어 인간 대상체에서 사용된다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC의 발현을 조절하는, 예를 들어 감소시키는 방법은 시험관내에서, 예를 들어 본 명세서에 기재된 세포 또는 세포주에서 사용된다.
본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서(또는 이를 인코딩하는 핵산, 또는 상기 발현 리프레서 핵산을 포함하는 약제학적 조성물) 또는 발현 억제 시스템(또는 이를 인코딩하는 핵산, 또는 상기 발현 억제 시스템 또는 핵산을 포함하는 약제학적 조성물)을 대상체에게 투여하는 단계를 포함하는, 대상체에서 표적 유전자, 예를 들어 MYC의 오조절, 예를 들어 과발현과 연관된 병태를 치료하는 방법에 관한 것이다. 특정 유전자의 과발현과 연관된 병태는 당업자에게 알려져 있다. 그러한 병태는 대사 장애, 암(예를 들어, 고형암), 및 간염을 포함하지만 이에 제한되지 않는다.
본 명세서에 제공된 바와 같은 방법 및 조성물은 표적 유전자, 예를 들어 MYC의 전사를 안정하게 또는 일시적으로 변경시킴으로써(예를 들어, 감소시킴으로써) 표적 유전자, 예를 들어 MYC의 과발현 또는 오조절과 연관된 병태를 치료할 수 있다. 일부 구현예에서, 그러한 조절은 적어도 약 1시간 내지 약 30일, 또는 적어도 약 2시간, 6시간, 12시간, 18시간, 24시간, 2일, 3,일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 16일, 17일, 18일, 19일, 20일, 21일, 22일, 23일, 24일, 25일, 26일, 27일, 28일, 29일, 30일, 또는 더 긴 시간 동안 또는 이들 사이의 임의의 시간 동안 지속된다. 일부 구현예에서, 그러한 조절은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 또는 7일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 영구적으로 또는 무기한으로) 동안 지속된다. 선택적으로, 그러한 조절은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하의 기간 동안 지속된다.
일부 구현예에서, 본 명세서에 제공된 방법 또는 조성물은 상기 조성물에 의해 접촉되지 않거나 상기 방법으로 처리되지 않은 세포 내의 표적 유전자, 예를 들어 MYC의 발현 대비 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%(그리고 선택적으로, 최대 100%)만큼 세포 내의 표적 유전자의 발현을 감소시킬 수 있다.
일부 구현예에서, 본 명세서에 제공된 방법은 상기 표적 유전자와 회합된 게놈 복합체, 예를 들어 앵커 서열-매개 연접부를 파괴함으로써 표적 유전자, 예를 들어 MYC의 발현을 조절할, 예를 들어 감소시킬 수 있다. 앵커 서열-매개 연접부와 연관된 유전자는 연접부 내에 적어도 부분적으로 존재할 수 있거나(즉, 제1 앵커 서열과 제2 앵커 서열 사이에 서열식(sequence-wise)으로 위치할 수 있거나), 제1 앵커 서열과 제2 앵커 서열 사이에 서열식으로 위치하지 않고 동일한 염색체 상에 그리고 적어도 제1 또는 제2 앵커 서열에 충분히 근접하여 위치하여 그의 발현이 앵커 서열-매개 연접부의 토폴로지를 제어함으로써 조절될 수 있게 한다는 점에서 상기 유전자는 연접부의 외부에 있을 수 있다. 당업자는 2개의 요소 사이의(예를 들어, 유전자와 앵커 서열-매개 연접부 사이의) 3차원 공간의 거리는 일부 구현예에서 염기쌍의 관점에서의 거리보다 더 많이 관련되어 있을 수 있음을 이해할 것이다. 일부 구현예에서, 외부에 있지만 연관된 유전자는 제1 또는 제2 앵커 서열의 2 Mb 이내, 1.9 Mb 이내, 1.8 Mb 이내, 1.7 Mb 이내, 1.6 Mb 이내, 1.5 Mb 이내, 1.4 Mb 이내, 1.3 Mb 이내, 1.3 Mb 이내, 1.2 Mb 이내, 1.1 Mb 이내, 1 Mb 이내, 900 kb 이내, 800 kb 이내, 700 kb 이내, 500 kb 이내, 400 kb 이내, 300 kb 이내, 200 kb 이내, 100 kb 이내, 50 kb 이내, 20 kb 이내, 10 kb 이내, 또는 5 kb 이내에 위치한다.
일부 구현예에서, 일부 구현예에서, 유전자, 예를 들어 MYC의 발현을 조절하는 것은 유전자, 예를 들어 MYC에 대한 전사 제어 서열의 접근성을 변경시키는 것을 포함한다. 전사 제어 서열은, 앵커 서열-매개 연접부의 내부에 있든 외부에 있든 관계없이, 인핸싱 서열 또는 침묵(또는 억제) 서열일 수 있다.
일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 유전자 오조절 장애, 예를 들어 MYC 유전자 오조절 장애, 예를 들어 MYC 유전자 오조절과 연관된 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 이러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 MYC 유전자 오조절 장애 또는 MYC 유전자 오조절 장애와 연관된 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 장애는 MYC 오조절, 예를 들어 MYC 과발현과 연관되어 있다. 일부 구현예에서, 장애는 AFP 오조절, 예를 들어 AFP 과발현과 연관되어 있다. 일부 구현예에서, 그러한 제공된 기술은 표적 유전자, 예를 들어 MYC의 프로모터를 메틸화하여 이를 필요로 하는 대상체, 예를 들어 환자에서 유전자 오조절 장애, 예를 들어 MYC 유전자 오조절 장애, 예를 들어 MYC 유전자 오조절과 연관된 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 표적 유전자, 예를 들어 MYC에 의해 인코딩된 폴리펩타이드를 비정상적으로 발현하는 세포의 생존력에 선택적으로 영향을 미칠 수 있다.
일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 간 장애 또는 간 장애와 연관된 증상의 장애를 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 폐 장애 또는 간 장애와 연관된 증상의 장애를 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 신생물 장애, 예를 들어 신생물 장애와 연관된 장애 또는 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 바이러스 감염 관련 장애, 예를 들어 바이러스 감염 관련 장애와 연관된 장애 또는 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 알코올 오용 관련 장애, 예를 들어 알코올 오용 관련 장애와 연관된 장애 또는 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 바이러스 감염 또는 알코올 오용과 연관된 신생물 장애, 예를 들어 바이러스 감염 또는 알코올 오용과 연관된 신생물 장애와 연관된 장애 또는 증상을 치료하는 데 사용될 수 있다.
일부 구현예에서, 치료되는 병태는 신생물이다. 일부 구현예에서, 치료되는 병태는 종양형성이다. 일부 구현예에서, 치료되는 병태는 암이다. 일부 구현예에서, 암은 불량한 예후와 연관된다. 일부 구현예에서, 암은 MYC 오조절, 예를 들어 MYC 과발현과 연관되어 있다. 일부 구현예에서, 암은 AFP 오조절, 예를 들어 AFP 과발현과 연관되어 있다. 일부 구현예에서, 암은 유방암, 간암, 결장직장암, 폐암, 췌장암, 위암, 및/또는 자궁암이다. 일부 구현예에서, 암은 감염, 예를 들어 바이러스, 예를 들어 박테리아와 연관되어 있다. 일부 구현예에서, 암은 알코올 오용과 연관되어 있다. 일부 구현예에서, 암은 간암종이다.
일부 구현예에서, 암 세포는 폐암 세포, 위암, 위장관암, 결장직장암, 췌장암 또는 간암 세포이다. 일부 구현예에서, 암은 간세포 암종(HCC), 섬유층판 간세포 암종(FHCC), 담관암종, 혈관육종, 2차 간암, 비소세포 폐암(NSCLC), 선암종, 소세포 폐암(SCLC), 대세포 (미분화) 암종, 삼중 음성 유방암, 위 선암종, 자궁내막 암종, 또는 췌 암종이다.
일부 구현예에서 치료되는 병태는 간 질환이다. 일부 구현예에서, 치료되는 병태는 MYC 오조절, 예를 들어 MYC 과발현과 연관되어 있다. 일부 구현예에서 치료되는 병태는 만성 질환이다. 일부 구현예에서 치료되는 병태는 만성 간 질환이다. 일부 구현예에서 치료되는 병태는 바이러스 감염이다. 일부 구현예에서, 치료되는 병태는 알코올 오용 연관 장애이다.
일부 구현예에서 치료되는 병태는 폐 질환이다. 일부 구현예에서, 치료되는 병태는 MYC 오조절, 예를 들어 MYC 과발현과 연관되어 있다. 일부 구현예에서 치료되는 병태는 만성 질환이다. 일부 구현예에서 치료되는 병태는 만성 폐 질환이다. 일부 구현예에서, 그러한 제공된 기술은 폐암 성장, 전이, 약물 내성, 및/또는 암 줄기 세포(CSC) 유지를 치료하거나 감소시키는 데 사용될 수 있다. 일부 구현예에서, 치료되는 병태는 암종, 예를 들어 비소세포 폐암(NSCLC)이다. 일부 구현예에서, 만성 폐 질환은 담배 오용과 연관되어 있다.
일부 구현예에서, 암은 간암종 하위유형 S1(HCC S1), 간암종 하위유형 S2(HCC S2), 또는 간암종 하위유형 S3(HCC S2)이다. 일부 구현예에서, HCC 하위유형은 MYC 과발현과 연관되어 있다. 일부 구현예에서, 암은 HCC S1 또는 HCC S2이다. 일부 구현예에서, 암 하위유형은 공격적인 종양 및 불량한 임상 결과와 연관되어 있다.
일부 구현예에서, 본 개시내용은 대상체에서 HCC 하위유형에 기초하여 대상체에 대해 고안될 수 있는 치료 요법, 예를 들어 대상체에 대한 HCC 하위유형에 기반하여 치료의 공격성을 맞춤화하기 위한 개인화된 접근법을 제공한다. 일부 구현예에서, 본 개시내용은 본 명세서에 개시된 발현 리프레서 또는 발현 리프레서 시스템을 사용하는 치료 방법을 제공하며, 방법은 환자에서 HCC 하위유형을 식별하는 단계를 포함하고, HCC 하위유형 확인에 기반하여 상기 발현 리프레서 및/또는 발현 리프레서 시스템의 투약량 및 투여 일정을 결정한다.
대상체가 화학요법 치료와 비교하여 최소한의 부작용 또는 전신 독성을 격도록 장애의 치료를 위해 대상체에게 본 명세서에 개시된 바와 같은 작용제, 또는 조성물을 전달하는 방법이 본 명세서에 기재되어 있다. 일부 구현예에서, 대상체는 본 명세서에 기재된 작용제 및/또는 조성물로 치료될 때 화학요법과 통상적으로 연관된 임의의 상당한 부작용을 경험허지 않는다. 일부 구현예에서, 대상체는 본 명세서에 기재된 작용제 및/또는 조성물로 치료될 때 탈모(alopecia), 구역, 구토, 식욕 부진, 통증, 백혈구감소증, 빈혈, 혈소판감소증, 어지럼증, 피로, 변비, 구강 궤양, 피부 가려움증, 피부 벗겨짐, 신경 및 근육 손상, 청각 변화, 체중 감소, 설사, 면역억제, 상처, 심장 이상, 출혈, 간 손상, 신경 손상, 부종, 입과 목 통증, 불임, 섬유증, 탈모(epilation), 습성 박리, 점막 건조, 현기증 및 뇌병증을 포함하지만 이에 제한되지 않는 상당한 부작용을 경험하지 않는다. 일부 구현예에서, 대상체는 본 명세서에 기재된 작용제 및/또는 조성물로 치료될 때 상당한 체중 감소를 나타내지 않는다.
본 명세서에 기재된 작용제 및 조성물은 본 명세서에 기재된 바와 같은 다양한 장애를 치료하거나 예방하기 위해, 대상체, 예를 들어 포유동물에게, 예를 들어 생체 내에서 투여될 수 있다. 이는 MYC의 변경된 발현 패턴을 특징으로 하는 세포와 관련된 장애를 포함한다.
후성유전학적 변형
본 개시내용은, 부분적으로, 표적 유전자, 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 또는 앵커 서열(예를 들어, 표적 유전자에 근접하거나 표적 유전자에 작동가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열)을 후성유전학적으로 변형시키는 방법에 관한 것이며, 방법은 발현 리프레서(또는 이를 인코딩하는 핵산) 또는 발현 억제 시스템(예를 들어, 발현 리프레서(들)), 또는 이를 인코딩하는 핵산 또는 상기 발현 리프레서(또는 이를 인코딩하는 핵산) 또는 발현 억제 시스템 또는 핵산을 포함하는 약제학적 조성물을 제공하는 단계; 및 표적 유전자 또는 표적 유전자에 작동가능하게 연결된 전사 제어 요소를 발현 리프레서 또는 발현 억제 시스템과 접촉시키는 단계를 포함하며, 이에 의해 표적 유전자, 예를 들어 MYC 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 것을 포함한다.
일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소의 DNA 메틸화를 증가 또는 감소시키는 단계를 포함한다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소와 연관된 히스톤의 히스톤 메틸화를 증가 또는 감소시키는 단계를 포함한다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소와 연관된 히스톤의 히스톤 아세틸화를 감소시키는 단계를 포함한다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소와 연관된 히스톤의 히스톤 수모화를 증가 또는 감소시키는 단계를 포함한다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소와 연관된 히스톤의 히스톤 인산화를 증가 또는 감소시키는 단계를 포함한다.
일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 상기 조성물에 의해 접촉되지 않거나 상기 방법으로 처리되지 않은 세포 내의 그러한 부위에서의 후성유전학적 변형의 수준 대비 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%(그리고 선택적으로, 최대 100%)만큼 후성유전학적 변형의 수준을 감소시킬 수 있다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 상기 조성물에 의해 접촉되지 않거나 상기 방법으로 처리되지 않은 세포 내의 그러한 부위에서의 후성유전학적 변형의 수준 대비 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1000%(그리고 선택적으로, 최대 200, 300, 400, 500, 600, 700, 800, 900, 1000, 또는 2000%)만큼 후성유전학적 변형의 수준을 증가시킬 수 있다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소의 후성유전학적 변형은, 예를 들어 본 명세서에 기재된 바와 같이, 표적 유전자, 예를 들어 MYC의 발현의 수준을 변형시킬 수 있다.
일부 구현예에서, 본 명세서에 기재된 방법에 의해 생성된 후성유전학적 변형은 적어도 약 1시간 내지 약 30일, 또는 적어도 약 2시간, 6시간, 12시간, 18시간, 24시간, 2일, 3,일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 16일, 17일, 18일, 19일, 20일, 21일, 22일, 23일, 24일, 25일, 26일, 27일, 28일, 29일, 30일, 또는 더 긴 시간 동안 또는 이들 사이의 임의의 시간 동안 지속된다. 일부 구현예에서, 그러한 조절은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 또는 7일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 지속된다. 선택적으로, 그러한 조절은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하의 기간 동안 지속된다.
일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용하기 위한 발현 리프레서, 또는 발현 억제 시스템은 후성유전학적 변형 모이어티이거나 이를 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 포함한다.
예를 들어, 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 갖는 후성유전학적 변형 모이어티이거나 이를 포함할 수 있으며, 내인성 또는 자연 발생 표적 서열(예를 들어, 표적 유전자, 예를 들어 MYC 또는 전사 제어 요소)이 그의 메틸화를 증가시키도록(예를 들어, 전사 인자와 표적 유전자, 예를 들어 MYC 또는 전사 제어 요소의 일부분과의 상호작용을 감소시키도록, 앵커 서열에 대한 핵형성 단백질의 결합을 감소시키도록, 그리고/또는 앵커 서열-매개 연접부를 파괴하거나 방해하도록) 변경될 수 있거나, 그의 메틸화를 감소시키도록(예를 들어, 전사 인자와 표적 유전자, 또는 MYC 또는 전사 제어 요소의 일부분의 상호작용을 증가시키도록, 앵커 서열에 대한 핵형성 단백질의 결합을 증가시키도록, 그리고/또는 앵커 서열-매개 연접부의 강도를 촉진하거나 증가시키도록) 변경될 수 있다.
키트
본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서를 포함하는 키트에 관한 것이다. 일부 구현예에서, 키트는 발현 리프레서 또는 발현 억제 시스템(예를 들어, 발현 억제 시스템의 발현 리프레서(들)), 및 상기 발현 리프레서 또는 발현 억제 시스템의 사용에 대한 설명서를 포함한다. 일부 구현예에서, 키트는 발현 리프레서를 인코딩하는 핵산 또는 발현 억제 시스템 또는 이의 성분(예를 들어, 발현 억제 시스템의 발현 리프레서(들))을 인코딩하는 핵산, 및 발현 리프레서(및/또는 상기 핵산) 및/또는 상기 발현 억제 시스템(및/또는 상기 핵산)의 사용에 대한 설명서를 포함한다. 일부 구현예에서, 키트는 발현 리프레서를 인코딩하는 핵산 또는 발현 억제 시스템 또는 이의 성분(예를 들어, 발현 억제 시스템의 발현 리프레서(들))을 인코딩하는 핵산을 포함하는 세포, 및 상기 세포, 핵산, 및/또는 상기 발현 리프레서 또는 발현 억제 시스템의 사용에 대한 설명서를 포함한다.
일부 양태에서, 키트는 a) 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합함)를 포함하는, 2개의 발현 리프레서를 포함하는 시스템을 포함하는 조성물을 포함하는 용기를 포함한다.
일부 양태에서, 본 키트는 a) 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합함)를 포함하는, 2개의 발현 리프레서를 포함하는 시스템을 포함하는 조성물을 포함하는 용기를 포함한다.
일부 구현예에서, 키트는 b) 상기 조성물을 이용하여 질환을 치료하거나 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한, 예를 들어 감소시키기 위한 적어도 하나의 방법을 포함하는 한 세트의 설명서을 추가로 포함한다. 일 구현예에서, 키트는 선택적으로 상기 조성물을 위한 전달 비히클(예를 들어, 지질 나노입자)을 포함할 수 있다. 시약은 부형제 및/또는 전달 비히클 중에 현탁된 상태로 제공될 수 있거나, 별개의 성분으로서 제공될 수 있는데, 이는 나중에 부형제 및/또는 전달 비히클과 배합될 수 있다. 일부 구현예에서, 키트는 조성물과 공동투여되는 추가의 치료제를 선택적으로 함유하여 원하는 표적 유전자 발현, 예를 들어 MYC 유전자 발현 조절에 영향을 미칠 수 있다. 설명 자료는 통상적으로 서면 자료 또는 인쇄 자료를 포함하지만, 이들은 그러한 것으로 제한되지 않는다. 그러한 설명서를 저장하고 이를 최종 사용자에게 전달할 수 있는 임의의 매체가 상정된다. 그러한 매체는 전자 저장 매체(예를 들어, 자기 디스크, 테이프, 카트리지, 칩), 광학 매체(예를 들어, CD ROM) 등을 포함하지만 이에 제한되지 않는다. 그러한 매체는 그러한 설명 자료를 제공하는 인터넷 사이트에 대한 주소를 포함할 수 있다.
일부 구현예에서, 키트는 본 명세서에 기재된 발현 리프레서, 발현 억제 시스템, 예를 들어 발현 리프레서(들)의 단위 투여량, 또는 본 명세서에 기재된 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 인코딩하는 핵산, 예를 들어 벡터의 단위 투여량을 포함한다.
하기 실시예는 본 개시내용의 일부 구현예를 추가로 설명하기 위해 제공되지만, 본 개시내용의 범주를 제한하고자 하지 않으며; 그들의 예시적인 성질로 인해 당업자에게 알려진 기타 다른 절차, 방법, 또는 기법이 대안적으로 사용될 수 있음이 이해될 것이다.
실시예
실시예 1: CTCF 모티프의 표적화된 변형은 MYC CTCF의 하향조절을 초래한다
이 실시예는 MYC 발현을 하향조절하기 위해 Cas9를 이용하는 CTCF 모티프 또는 CTCF 모티프에 인접한 영역의 뉴클레아제 편집을 설명한다.
이 실시예에서, 엑손 1에 포함된 프로모터 영역 CpG 섬에 상보적인 4개 sgRNA를 MYC 유전자의 후성유전학적 이펙터 매개 하향조절을 지시하는 최상의 표적 영역을 확인하도록 설계하였다. c-MYC 유전자는 길고 번역되지 않은 엑손 1을 포함하며(Spencer CA, Groudine M 1991), 엑손 2 및 3은 주요 코딩 영역을 포함한다. 적합한 하향조절 영역을 확인하기 위해 4개의 sgRNA에 의해 MYC 프로모터 CpG 섬의 영역에 대해 표적화된 CRISPR-dCas9-KRAB 및 CRISPR-dCas9-MQ1(박테리아 몰리쿠테스 스피로플라스마 유래의 DNMT) 이펙터를 사용하여 게놈 편집을 수행하였다. (1) sgRNA와 조합된 dCas9(이펙터 없음), 및 (2) 비처리 세포를 둘 다 대조군으로 사용하여 MYC 발현에 대한 변화를 평가하였다. 쉽게 성장되고 형질감염 가능한 세포 K562 및 HEK293에서 sgRNA를 선택하기 위한 이러한 초기 스크린을 수행하였고, sgRNA, GD-28617이 MYC mRNA 하향조절에 대해 가장 강력한 영향을 매개한 것으로 결정되었다(데이터는 나타내지 않음).
CTCF 모티프(GD-28616) 또는 CTCF 모티프(GD-28859)(CTCF 앵커 부위)에 직접 인접한 상류 영역으로 표적화된 Cas9를 2.5 ug/ml의 SSOP 제형으로 3가지 인간 HCC 모델로 형질감염시켰다(표 11 및 도 1a 내지 b). (GD-28616과 함께) Cas9로 CTCF 모티프를 파괴하면 3가지 HCC 세포주(HepG2, Hep3B 및 SKHEP1) 모두에서 MYC 발현의 32 내지 39% 하향조절을 초래한다. CTCF 모티프(GD-28859)에 인접한 영역의 파괴는 3가지 세포주 중 2가지(HepG2 및 Hep3B)에서 MYC 발현을 35 내지 45% 하향조절하였다(도 2a). 세포주의 편집에서 AmpSeq에 의해 평가된 편집 효율이 77 내지 100%임을 확인하였다(도 2b).
가이드 명칭 | 표적 부위 | 표적 서열 | 게놈 좌표 |
GD-28616 | CTCF | ATGATCTCTGCTGCCAGTAG (서열번호 1) |
chr8:128746342-128746364 |
GD-28859 | CTCF | ATCGCGCCTGGATGTCAACG (서열번호 2) |
chr8:128746321-128746343 |
GD-28862 | CTCF | ATTGTGCAGTGCATCGGATT (서열번호 3) |
chr8:128746525-128746547 |
GD-28617 | 프로모터 | GTCAAACAGTACTGCTACGG (서열번호 4) |
chr8:128748014-128748036 |
실시예 2: dCas9sgRNA에 융합된 KRAB 이펙터에 의한 MYC1 발현의 하향조절
이 실시예는 dCas9sgRNA에 융합된 KRAB 이펙터를 CTCF 모티프(GD-28616) 또는 CTCF 모티프(GD-28859)에 직접 인접한 상류 영역 또는 MYC 프로모터(GD-28617)에 대해 표적화함으로써 MYC1 발현을 하향조절하는 것을 설명한다. HCC에서 MYC 발현을 표적화하기 위해, CRISPR-dCas9 시스템을 KRAB에 테더링함으로써 CRISPR-dCas9 시스템을 변형시켰다.
이 실시예에서, CTCF 모티프(GD-28616), CTCF "앵커" 부위(GD-28859), 또는 MYC 프로모터(GD-28617)로 표적화하는 개별 sgRNA(표 1 및 도 1a 내지 b)와 함께 dCas9-KRAB mRNA를 인간 HCC 세포주(HepG2, Hep3B 및 SKHEP1)로 전달하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 sgRNA를 공동 전달하였다. 대조군의 경우, (1) sgRNA와 조합된 dCas9(이펙터 없음), 및 (2) 비처리 세포를 둘 다 사용하여 변화를 평가하였다. 성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(5000개 세포/웰). 그 다음 LNP 제형(2 내지 2.5 ug/ml)을 세포에 첨가하여 mRNA 및 sgRNA를 형질감염시켰다. 모든 처리를 생물학적으로 3중으로 수행하였다. 24 내지 168시간 범위의 시점을 MYC 발현 및 세포 생존능에 대해 평가하였다. 제조업체의 프로토콜에 따라 RNeasy® plus 96-웰 키트(Qiagen)를 사용하여 4개의 독립적인 실험에서 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다.
ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였다. 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물(calibrator)로서 사용하였다.
실험 데이터는 dCas9-KRAB/GD-28616의 LNP-매개 형질감염이 Hep3B 및 SKHEP1에서의 48/72시간 시점에서 11 내지 34%만큼 MYC 발현을 하향조절하였음을 나타내었다. dCas9-KRAB/GD-28859의 LNP-매개 형질감염은 3가지 HCC 모델 모두에서의 48/72시간 시점에서 18 내지 44%만큼 MYC 발현을 하향조절하였다(도 3). 이러한 효과는 2개 세포주(Hep3B 및 SKHEP1)에서 168시간까지 감소하였지만, MYC 발현은 HepG2 세포주에서 168시간째에 28%까지 감소를 유지하였다(도 3). dCas9-KRAB/GD-28617을 통해 dCas9-KRAB를 MYC 프로모터로 유도하면 3가지 HCC 모델 모두에서의 48/72시간 시점에서 24 내지 58%만큼 MYC 발현을 하향조절하였다. 이러한 효과는 2개 세포주(Hep3B 및 SKHEP1)에서 168시간까지 감소하였지만, MYC는 HepG2에서 168시간째에 43%까지 감소를 유지하였다(도 3).
실시예 3: 징크 핑거 도메인에 융합된 KRAB 이펙터에 의한 MYC1 발현의 하향조절
이 실시예는 징크 핑거 도메인에 융합된 KRAB 이펙터를 CTCF 모티프(GD-28859)에 직접 인접한 상류 영역에 대해 표적화함으로써 MYC1 발현을 하향조절하는 것을 설명한다.
이 실시예에서, GD-28859에 의해 표적화된 DNA 영역에서 앵커 부위에 결합하도록 징크 핑거-지시 KRAB 이펙터(ZF-KRAB 이펙터)를 설계하였다(도 4a). 7가지 작제물(dCas-KRAB/GD-59, ZF1-KRAB, ZF2-KRAB, ZF3-KRAB, ZF4-KRAB, ZF5-KRAB, 및 ZF6-KRAB)을 설계하고 인간 HCC 모델(HepG2, Hep3B, SKHEP1)에서 스크리닝하였다. 이 실험에 대한 음성 대조군은 비처리 세포를 포함하였고 dCas9-KRAB/GD-28859를 양성 대조군으로 사용하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여 2개의 독립적인 실험에서 RNA를 단리하였으며, 각 실험은 생물학적으로 3중으로 수행하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 Taqman 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물로서 사용하였다. CellTiter-GLO® Luminescent Cell Viability Assay(Promega #G9241)를 사용하여 ATP 정량화에 의해 세포 생존능을 평가하였다. 성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(5000개 세포/웰). 그 다음 LNP 제형(0.6 내지 2.5 ug/ml)을 세포에 첨가하여 mRNA 및 sgRNA를 형질감염시켰다. 모든 처리를 생물학적으로 3중으로 수행하였다.
이 데이터는 ZF2-KRAB, ZF3-KRAB 및 ZF4-KRAB가 Hep3B 세포에서 dCas9-KRAB/GD-28859와 동등하거나 더 큰 정도로 MYC를 하향조절하며, 이 때 ZF3-KRAB는 가장 강한 하향조절 효과를 나타내었음을 보였다(도 4b). ZF3-KRAB는 또한 다른 2가지 HCC 모델, 즉 HepG2 및 SKHEP1에서 dCas9-KRAB/GD-28859와 동등하거나 더 큰 정도로 MYC를 하향조절하는 것으로 나타났다(도 4c). ZF3-이펙터 없음(NE)은 또한 조절 부위의 입체적 차단으로 인해, MYC 발현에 대한 하향조절 효과를 나타내는 것으로 결정되었다. Hep3B에서 ZF3-KRAB 및 ZF3-NE는 둘 다 24, 72 및 120시간의 시간 경과에 따라 MYC 발현 및 생존능에 대해 하향조절 효과를 나타내었다(도 4d).
실시예 4: dCas9sgRNA에 융합된 MQ1 이펙터에 의한 MYC1 발현의 하향조절
이 실시예는 dCas9sgRNA에 융합된 MQ1 이펙터를 CTCF 모티프(GD-28616) 또는 CTCF 모티프(GD-28859), GD-28862에 직접 인접한 상류 영역, 또는 MYC 프로모터(GD-28617)에 대해 표적화함으로써 MYC1 발현을 하향조절하는 것을 설명한다.
이 실시예에서, CTCF "앵커" 부위, 또는 MYC 프로모터로 표적화하는 개별 sgRNA(표 11 및 도 1a 내지 b)와 함께 dCas9-MQ1 mRNA를 인간 HCC 세포주(HepG2, Hep3B 및 SKHEP1)로 전달하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 sgRNA를 공동 전달하였다. 대조군의 경우, (1) sgRNA와 조합된 dCas9(이펙터 없음), 및 (2) 비처리 세포를 둘 다 사용하여 변화를 평가하였다. 본질적으로 실시예 2에 기재된 바와 같은 프로토콜을 따라 실험을 수행하였다.
결과는 GD-16, GD-59 및 GD-62에 의해 CTCF로 표적화된 dCas9-MQ1이 세포주 특이적 방식으로 다양한 하향조절 및 상향조절을 야기한다는 것을 나타내었다. GD-17에 의해 프로모터로 표적화된 dCas9-MQ1은 72시간째에 50 내지 90%의 MYC 하향조절을 초래하였고 3가지 HCC 모델 모두에서 168시간까지 지속되었다(도 5). SK-HEP-1 생존능이 MYC 하향조절에 의해 최소로 영향을 받았지만, HepG2 및 Hep3B에서 72 및 168시간에 생존능을 극적으로 감소시켰다. dCas9-sgRNA 대조군은 비처리 대조군과 비교하여 발현 또는 생존능에 대해 영향을 미치지 않았다.
실시예 5: 징크-핑거 도메인에 융합된 MQ1 이펙터에 의한 MYC1 발현의 하향조절
이 실시예는 징크-핑거 도메인에 융합된 MQ1 이펙터를 MYC 프로모터(GD-28617)에 대해 표적화함으로써 MYC1 발현을 하향조절하는 것을 설명한다.
이 실시예에서, GD-28617에 의해 표적화된 DNA 영역에 결합하도록 징크 핑거-지시 MQ1 이펙터(ZF-MQ1 이펙터)를 설계하였다(도 4a 및 도 6a). 실시예 4 스크리닝에서 확인된 영역에 결합하도록 GD-28617 주위에 6가지 작제물(ZF7-MQ1, ZF8-MQ1, ZF9-MQ1, ZF10-MQ1, ZF11-MQ1, 및 ZF12-MQ1)을 설계하고 인간 HCC 모델(HepG2, Hep3B, SKHEP1)에서 스크리닝하였다. 비처리 세포 및 ZF 단백질 단독(ZF-이펙터 없음 또는 ZF-NE)로 형질감염 세포를 실험에 대한 음성 대조군으로 사용하였고 dCas9-KRAB/GD-28859를 양성 대조군으로 사용하였다. 실시예 3에 기재된 바와 같은 프로토콜을 따랐다.
결과는, ZF8-MQ1, ZF9-MQ1 및 ZF11-MQ1은 Hep3B 세포에서 가장 큰 정도로 MYC를 하향 조절하였으며, 이 때 ZF9-MQ1은 가장 강력한 하향조절 효과를 나타내었음을 입증하였다(도 6b). 데이터는 MYC 발현을 성공적으로 감소시킨 ZF-MQ1 분자(ZF8-MQ1, ZF9-MQ1 및 ZF11-MQ1)의 게놈 결합 부위가 MYC 발현을 변경시키지 않은 ZF-MQ1 분자(ZF7-MQ1, ZF10-MQ1 및 ZF12-MQ1)와 매우 근접해 있음을 추가로 입증하였다. 이는 MYC 프로모터의 조절 요소와 관련하여 결합 효율, 결합의 3-D 배향, 영역의 메틸화 확장, 또는 특정 이펙터 위치지정의 결과의 효과일 수 있다. ZF-이펙터 결합 부위의 약간의 이동은 MYC 유전자 조절에 상당한 영향을 미치는 것으로 보인다. ZF9-MQ1은 MYC mRNA를 강력하게 하향조절하고 3가지 HCC 모델 모두에서 생존능을 감소시키는 것으로 밝혀졌으며, ZF9-MQ1 작제물에 의해 보이는 효과는 dCas9-MQ1/GD-28617 시스템에 의해 지시될 수 있는 것보다 훨씬 더 컸음이 밝혀졌다.
실시예 6: ZF9-MQ1은 다른 ZF-MQ1 이펙터와 비교하여 MYC1 발현에 대한 가장 강력한 하향조절 효과를 나타낸다
이 실시예는 테스트한 다른 ZF-MQ1 이펙터와 비교하여 ZF9-MQ1이 징크-핑거 도메인에 융합된 MQ1 이펙터를 MYC 프로모터(GD-28617)에 대해 표적화함으로써 MYC1 발현을 하향조절하는 것에 대해 가장 강력한 효과를 미침을 설명한다.
이 실시예에서, HCC 모델(HepG2, Hep3B 및 SKHEP1) 모두에서 MYC 발현을 하향조절하는 것에 대한 ZF9-MQ1의 효과를 ZF12-MQ1, ZF8-MQ1, 및 dCas9-MQ1/GD-28617의 효과에 대해 각각 비교하였다. 비처리 세포 및 ZF 단백질 단독(ZF-이펙터 없음 또는 ZF-NE)로 형질감염 세포를 실험에 대한 음성 대조군으로 사용하였고 dCas9-KRAB/GD-28859를 양성 대조군으로 사용하였다. 실시예 3에 기재된 바와 같은 프로토콜을 따랐다.
ZF9-MQ1은 ZF12-MQ1과 비교하여 MYC를 강력하게 하향조절하고 검사된 3가지 HCC 모델(Hep3B, HepG2 및 SKHEP1) 모두에서 생존능을 감소시키는 것으로 나타났다(도 7a 내지 c). ZF9-MQ1 조절된 MYC1 발현 하향조절은 ZF8-MQ1의 존재 시 보이는 하향조절보다 비교적 더 크고(도 7d 내지 f), ZF9-MQ1 작제물에 의해 보이는 효과는 dCas9-MQ1/GD-28617 시스템에 의해 지시될 수 있는 것보다 훨씬 더 컸다(도 7g 내지 i). 데이터는, ZF9-MQ1이 24시간만큼 빠르게 MYC 발현을 하향조절하는 반면, 생존능에 대한 영향은 72시간 또는 그 이후까지 관찰되지 않았다는 것을 추가로 나타내었다. 대조적으로, ZF8-MQ1은 MYC mRNA에서 훨씬 덜 중요한 변화를 초래하였고, 세포 생존능을 훨씬 더 즉각적으로 감소시켰다.
실시예 7: dCas9-MQ1은 인간 dCas9-DNMT1 또는 dCas9-DNMT-3A-3L보다 MYC 발현에 대해 훨씬 더 큰 영향을 미친다
이 실시예는 dCas9-MQ1은 인간 dCas9-DNMT1 또는 dCas9-DNMT-3A-3L보다 MYC 발현에 대해 훨씬 더 큰 영향을 미친다는 것을 나타낸다.
이 실시예에서, CRISPR-dCas9 시스템은 KRAB, 인간 DNMT1, 인간 DNMT3A-3L 융합체, 인간 DNMT3Bm 원핵 DNMT, 및 MQ1을 포함하여, 후성유전학적 리프레서의 선택에 테터링함으로써 변형되었다. 이 분자는 억제 복합체(KRAB)를 동원하거나 DNA의 CpG 뉴클레오타이드(DNMT1, DNMT3A-3L, DNMT3B 및 MQ1)를 메틸화함으로써 전사 억제를 조절한다. HepG2, Hep3B 및 SKHEP1을 포함하여 인간 HCC 세포주의 패널을 이용하여 간암 모델에서 이펙터 스크리닝을 수행하였다. GD-28617 sgRNA를 dCas9-DNMT mRNA와 조합하였고 이들 세포주로 LNP 형질감염에 의해 공동 전달하였다. sgRNA/Cas9의 편집 효율을 측정함으로써 LNP 전달의 효능을 평가하는 CRISPR-Cas9 연구는 이 시스템을 사용하여 90 내지 99% 편집 효율을 확인하였다(데이터는 나타내지 않음). 형질감염 후, 세포를 다양한 시점에서, qPCR에 의해 MYC mRNA 발현에 대해, 그리고 CellTiter-GLO®에 의해 생존능에 대해 분석하였다. 중아황산염 서열분석에 의한 표적화 및 전체 메틸화 분석에 대해 Lucigen DNA 추출 키트를 사용하여 게놈 DNA를 단리하였다.
이 연구는 dCas9-MQ1이 검사된 인간 dCas9-DNMT 또는 dCas9-KRAB 중 임의의 것보다 MYC 발현에 대해 훨씬 더 큰 영향을 미친다는 것을 나타낸다(데이터는 나타내지 않음). dCas9-MQ1이 3가지 세포주 전체에 걸쳐 72시간에 mRNA의 50 내지 90% 감소를 초래하였다(도 8a). SK-HEP-1 생존능이 MYC 하향조절에 의해 최소로 영향을 받았지만, HepG2 및 Hep3B에서 72 및 168시간에 생존능을 극적으로 감소시켰다(도 8b). dCas9-sgRNA 대조군은 비처리 대조군과 비교하여 발현 또는 생존능에 대해 영향을 미치지 않았다.
SK-HEP-1 모델이 MYC 하향조절 시 생존능에 대해 최소한의 변화를 나타내었기 때문에, 이 세포주를 이용하여 MYC 발현에 대한 하향조절 효과의 지속성을 평가하였다. 5일째에, MYC mRNA는 dCas9 DBD 단독 및 비처리된 대조군과 비교하여 80%만큼 감소되었다. 7일 및 11일째에, MYC mRNA가 각각 약 70% 및 약 55% 감소되었다. 15일째까지, 전사체에서 약 40% 하향 조절이 유지되었다(도 8c). 단일 염기쌍 분해능에서 5-메틸시토신을 측정하는 정성적 및 정량적 수단인 중아황산염 게놈 서열분석을 사용하여, dCas9-MQ1/GD-28617에 의한 처리가 표적화된 영역으로의 새로운(de novo) 메틸화를 지시하고 이러한 전사 변화가 표적 영역에서 CpG 메틸화의 백분율과 밀접한 상관관계가 있으며 확인된 메틸화가 15일까지 지속된다는 것을 나타냄을 확립하였다(도 8d).
실시예 8: dCas9-MQ1/GD-17을 이용한 처리는 생체내에서 종양 성장을 억제한다
이 실시예는 피하 Hep3B 이종이식편의 dCas9-MQ1/GD-17 처리의 생체내 분석을 설명하며, 이는 대조군 처리(PBS 및/또는 dCas9/GD-SafeHarbor)와 비교하여 종양 성장의 억제를 초래한다.
이 실시예에서, 0.6 mg/ml LNP(MC3) 제형화 이펙터(dCas9-MQ1/GD-17)를 테스트 그룹 동물에서 1일 및 7일째(20 μl/마우스) 종양내 주사에 의해 종양 부위로 전달하였다. 대조군 마우스에 PBS 또는 0.6 mg/ml LNP(MC3) 대조군 이펙터 dCas9/GD-SafeHarbor(20 μl/마우스)를 종양 부위에 주사하였다. 각 대조군 및 테스트 그룹은 SubQ Hep3B 이종이식편(250 mm3)을 갖는 6마리 동물로 구성되었다. 각 그룹에 대한 종양 부피의 변화를 15일 동안 3일마다 측정하였다. 15일 후, 평균 종양 부피의 변화를 대응표본 T-검정(Paired T-test)을 사용하여 측정하였고 이를 플롯팅하였다. dCas9-MQ1/GD-17로 처리된 마우스는 2가지 대조군과 비교하여 종양 부피의 감소를 나타내었다(도 9).
실시예 9: dCas9-MQ1/GD-17은 인간 간세포에서 B형 간염의 맥락에서 MYC를 하향조절한다
이 실시예는 dCas9-MQ1/GD-17이 인간 간세포에서 B형 간염의 맥락에서 MYC를 하향조절함을 나타낸다.
이 실시예에서, 인간 간세포를 HBV로 감염시켰고 비감염 및 감염된 간세포를 둘 다 도말한 다음 8일에 걸쳐 성장시켰다. 9일 후, HBV 감염된 인간 간세포는 비감염 세포와 비교하여 더 높은 MYC 발현을 나타내었다. 비감염 및 HBV 감염 간세포를 둘 다 LNP에 의해 대조군 이펙터 (dCas9 + SafeHarbor sgRNA(GD-SH)), 또는 이펙터 dCas9-MQ1/GD-17로 형질감염시키고 추가 48시간 동안 성장시켰다. 그 다음 MYC 발현을 48시간 후 qPCR에 의해 평가하였다(도 8). 연구를 생물학적으로 3중으로 수행하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, dCas9 + GD-SH 샘플을 보정물로서 사용하였다.
48시간 후 qPCR에 의해 평가되고 비감염 인간 간세포 대조군에 대해 정규화될 때 MYC 발현은 dCas9-MQ1/GD-17(프로모터)은 비감염 세포 및 감염 세포에서 MYC를 하향조절함을 나타내었다(도 10).
실시예 10: MYC ASMC에 대해 표적화된 전사 이펙터 및 징크 핑거 도메인의 조합은 MYC 발현을 하향조절한다
이 실시예는 CTCF 모티프(ZF3-NE 또는 ZF3-KRAB)에 직접 인접한 상류 영역에 대해 징크-핑거 도메인에 융합된 KRAB 이펙터(또는 이펙터 없음 또는 NE)를 표적화 하는 것 및 MYC 프로모터에 대해 징크-핑거 도메인에 융합된 MQ1 이펙터를 표적화하는 것이 MYC mRNA 발현을 하향조절함을 나타낸다. ZF9-MQ1과 ZF3-KRAB의 조합은 개별적으로 또는 조합하여 이 실시예에서 테스트된 다른 이펙터와 비교하여 MYC 발현을 하향조절하는 데 더 효과적이다.
앵커 CTCF를 표적화하는 ZF3-NE 또는 ZF3-KRAB 이펙터를 HCC 세포주인, Hep3B에서 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1과 조합하였다. dCas-KRAB/GD-28859 및 dCas9-MQ1/GD-28617를 2개 영역에 대한 양성 대조군에 사용하였다. 이 실험에 대한 음성 대조군은 비처리 세포 및 ZF5-NE과 녹색-형광 단백질(GFP)로 형질감염 세포를 포함하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA를 공동 전달하였다. 성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(약 5000개 세포/웰). 그 다음 LNP 제형(0.6 ug/ml)을 세포에 첨가하여 mRNA를 형질감염시킨 다음 상이한 시점 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물로서 사용하였다.
이러한 데이터는 ZF3-KRAB와 ZF9-MQ1이 dCas9-KRAB/GD-28859, ZF3-KRAB, ZF3-NE, dCas9-MQ1/GD-28617, ZF9-MQ1 단독 또는 ZF3-NE 또는 ZF5-NE와 ZF9-MQ1 조합보다 더 큰 정도로 MYC를 하향조절함을 나타내었다(도 11). GFP 및 ZF5-NE 단독은 MYC 발현에 대해 미미한 효과를 미쳤다. 데이터는 테스트한 시간 경과(24, 48 및 72시간)에 걸쳐 비슷하였으며, 24시간 후 최대 억제는 적어도 72시간까지 계속되었다.
실시예 11: ZF9-MQ1과 ZF3-KRAB의 조합은 3가지 HCC 모델에서 MYC 발현을 하향조절한다.
이 실시예는 단독으로 또는 조합하여 테스트한 다른 이펙터와 비교하여 ZF9-MQ1과 ZF3-KRAB의 조합이 추가의 HCC 세포주(Hep3B, HepG2 및 SKHEP1)에서 MYC mRNA 발현을 더 많이 하향조절함을 나타낸다.
앵커 CTCF를 표적화하는 ZF3-NE 또는 ZF3-KRAB 이펙터를 3가지 HCC 세포주인, Hep3B, HepG2 및 SKHEP1에서 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1과 조합하였다. 이 실험에 대한 음성 대조군은 ZF5-NE로 형질감염 세포를 포함하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA를 공동 전달하였다. 성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(약 5000개 세포/웰). 그 다음 LNP 제형(0.6 ug/ml)을 세포에 첨가하여 mRNA를 형질감염시킨 다음 상이한 시점 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물로서 사용하였다.
이 데이터는 ZF3-KRAB와 ZF9-MQ1이 ZF9-MQ1 단독 또는 ZF3-NE와 ZF9-MQ1 조합보다 더 큰 정도로 MYC를 하향조절함을 나타낸다(도 12). 데이터는 테스트한 시간 경과(24, 48 및 72시간)에 걸쳐 비슷하였다.
실시예 12: 추가의 HCC 모델에서 ZF9-MQ1에 대한 생존력 및 MYC 발현의 용량 반응 곡선.
이 실시예는 5가지 HCC 세포주에서 용량 반응 곡선을 사용하여 ZF9-MQ1에 의한 Myc 발현 및 세포 생존능의 하향조절을 설명한다.
이 실시예에서, MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1이 5가지 HCC 세포주, 즉 Hep3B, HepG2, SKHEP1, SNU-182 및 SNU-449에서 다수 농도로 투약되었다. 비처리 세포를 음성 대조군으로 사용하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA를 전달하였다. 성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(약 5000개 세포/웰). 그 다음 LNP 제형(5 또는 0.6 ug/ml에서 시작함)을 각각 3개 웰에 첨가한 다음 후속 웰에서 6 내지 10회 용량에 대해 약 1:2로 희석하여 mRNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 상이한 복제물 플레이트를 생존능 및 RNA에 대해 수집하였다. 제조업체의 프로토콜에 따라 Promega의 Celltiter GLO 분석 키트를 사용하여 생존능을 측정하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물로서 사용하였다. 용량 반응 곡선으로부터 EC50 값을 계산하였다.
이 데이터는 ZF9-MQ1이 테스트한 5가지 HCC 세포주 모두에서 MYC 발현을 하향조절하고 생존능을 감소시켰음을 나타내었다. ZF9-MQ1은 0.0057 내지 0.065 ug/ml LNP/mRNA의 EC50 범위로 MYC 발현을 하향조절하였으며, 이들 5가지 HCC 세포주에서 72시간째에 시험관내에서 생존능에 대한 EC50 효과가 0.049 내지 .29 ug/ml 범위이었다. (도 13b 내지 f).
실시예 13: 누드 마우스에서 피하 성장된 Hep 3B 모델에서 ZF9-MQ1의 생체내 효능.
이 실시예는 ZF9-MQ1을 이용한 처리가 암컷 누드 마우스에서 확립된 Hep 3B 종양의 성장을 억제하였음을 입증한다.
Hep 3B 종양 세포를 30마리의 암컷 누드 마우스의 좌측 옆구리에 이식하여 종양을 유도하였다. 종양 부피의 변화를 측정하였고 평균 종양 부피가 대략 100 내지 150 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 처리군 및 대조군으로 마우스를 나누었다. 대조군에 PBS 또는 소분자 비교자인 MYCi975을 주사하였다. 각 그룹의 마우스에 PBS를 종양내로(3회 용량에 대해 5일마다, 그 다음 2회 용량에 대해 IV로 전환함), ZF9-MQ1을 정맥내로(3 mg/kg으로 5일마다) 또는 MYCi975를 복강내로(5일/주에 대해 매일 1회) 주사하였다. 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 각 그룹에 대한 종양 부피의 변화를 주당 3회 측정하였다. 22일의 과정에 걸쳐, 기준선 및 평균 종양 부피로부터 체중의 변화를 대응표본 T-검정(Paired T-test)을 사용하여 측정하였고 이를 플롯팅하였다(도 14a 내지 b).
결과는 ZF9-MQ1이 PBS 대조군 처리 마우스와 비교할 때 (6일째부터 앞으로) 종양 성장을 상당히 감소시킬 수 있었음을 나타낸다. ZF9-MQ1은 소분자 비교자(MYCi975)보다 종양 성장을 더 감소시켰다(도 14a). 추가적으로 마지막 투약 48시간 IHC 염색 후 ZF9-MQ1 폴리펩타이드의 발현, MYC 발현의 감소, 및 Ki67에 의해 측정된 증식의 감소를 나타내었다(데이터는 나타내지 않음). ZF9-MQ1이 전체 동물 체중에 대해 최소한의 영향을 미쳤다(도 14b).
실시예 14: Fox Chase CB17 SCID마우스에서 동소적으로 성장한 Hep 3B 모델에서 ZF9-MQ1 + ZF3-KRAB 의 생체내 효능.
이 마우스는 암컷 Fox Chase CB17 SCID 마우스의 동소 Hep3B-luc 모델에서, 투약 후 이중-시스트론 ZF9-MQ1 + ZF3-KRAB의 장기 항-종양 효능 및 지속성을 입증한다.
Hep-3B-luc 세포를 SCID 마우스의 간의 좌상엽에 주사하였다. 무작위화에서 각 그룹에 대한 평균 복면도 전신 종양-연관 생물발광(tumor-associated bioluminescence; TABL)은 약 2.8x109 p/s이었다. PBS 및 ZF9-MQ1+ZF3-KRAB을 이용한 처리를 위해 각 12마리의 마우스로 구성된 2개 그룹 및 세포 이식 후 7일째 소라페닙을 이용한 처리를 위해 6마리 마우스로 구성된 하나의 그룹으로 마우스를 무작위로 할당하였다. 종양 세포 이식 후 8일째에 처리를 시작하였다(그래프에서 투약 1일로 표시함). 마우스를 PBS를 이용하여 정맥내로(4회 용량에 대해 5일마다, 그 다음 2회 용량에 대해 3일마다), LNP(MC3) ZF9-MQ1 + ZF3-KRAB를 이용하여 정맥내로(2회 용량에 대해 5일마다 1.5 mg/kg, 3회 용량에 대해 5일마다 3 mg/kg, 1회 용량에 대해 3일마다 3 mg/kg), 소라페닙을 이용하여 경구로(메일 50 mg/kg) 처리하였다. 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 매주 2회 생물발광에 의해 종양 크기를 측정하였다.
결과는 ZF9-MQ1 + ZF3-KRAB를 이용한 처리가 PBS 대조군 처리 마우스와 비교할 때 (21일째부터 앞으로) 종양 성장을 상당히 감소시켰음을 나타낸다. 종양 성장을 감소시킨 ZF9-MQ1 + ZF3-KRAB는 소라페닙과 비슷하였다(도 15a). ZF9-MQ1 + ZF3-KRAB를 이용한 처리가 전체 동물 체중에 대해 최소한의 영향을 미쳤다(도 15b).
실시예 15: 누드 마우스에서 피하 성장된 Hep 3B 모델에서 ZF9-MQ1 및 공제형화된 ZF9-MQ1 + ZF3-KRAB의 생체내 효능.
이 실시예는 ZF9-MQ1 및 공제형화된 ZF9-MQ1 + ZF3-KRAB가 암컷 누드 마우스에서 용량-의존적 방식으로 Hep 3B 종양의 성장을 억제할 수 있었음을 입증한다.
Hep 3B 종양 세포를 72마리의 암컷 누드 마우스의 좌측 옆구리에 이식하여 종양을 유도하였다. 종양 부피의 변화를 측정하였고 평균 종양 부피가 대략 200 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 9개의 처리군(각각 8마리 마우스)으로 마우스를 나누었다. 각 그룹의 마우스에 PBS(3회 용량에 대해 5일마다, 그 다음 3회 용량에 대해 3일마다), 1 mg/kg 및 3 mg/kg의 ZF9-MQ1(3회 용량에 대해 5일마다, 그 다음 3회 용량에 대해 3일마다), 1 mg/kg 및 3 mg/kg의 공제형화된 ZF9-MQ1 + ZF3-KRAB(3회 용량에 대해 5일마다, 그 다음 3회 용량에 대해 3일마다), 1 mg/kg 및 3 mg/kg의 음성 대조군 mRNA(3회 용량마다 5일마다, 그 다음 3회 용량에 대해 3일마다)를 이용하여 정맥내로, 100 mg/kg의 MYCi975를 이용하여 복강내로(주당 5일동안 1일 1회) 또는 1 mg/kg의 시스플라틴을 이용하여 복강내로(15일마다 1회) 주사하였다. 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 종양 부피의 변화를 주당 3회 측정하였다.
결과는 1 mg/kg의 ZF9-MQ1 개별 및 ZF9-MQ1과 ZF3-KRAB의 조합물이 음성 대조군 처리 마우스와 비교하여 종양 성장을 감소시킬 수 있었음을 나타낸다(도 16a). 또한, 3 mg/kg의 ZF9-MQ1 개별(13일째부터 앞으로) 및 ZF9-MQ1 + ZF3-KRAB의 공제형의 조합물(6일째부터 앞으로)이 음성 대조군 처리 마우스와 비교할 때 종양 성장을 상당히 감소시킬 수 있었음을 나타낸다(도 16b). 공제형ghk ZF9-MQ1 +/ ZF3-KRAB는 1mg/kg 및 3 mg/kg 투약량 둘 다에서 시스플라틴 또는 소분자 비교자(MYCi975)보다 유사하거나 더 높은 수준으로 종양 성장을 감소시킬 수 있었다. 공제형화 ZF9-MQ1 +/- ZF3-KRAB는 1 mg/kg 및 3 mg/kg 투약량 둘 다에서 시스플라틴 및 MYCi975 둘 다와 비교하여 전체 동물 체중에 대해 최소한의 영향을 미쳤다(도 16c 내지 d).
실시예 16: MYC 절연 게놈 도메인(insulated genomic domain; IGD)으로 표적화된 DNA 메틸트랜스퍼라제와 징크 핑거 도메인의 조합물은 MYC 발현을 하향조절하고 다양한 폐암 세포주에서 세포 생존능을 감소시킨다
이 실시예는 NSCLC 세포주(A549, NCI-H2009, NCI-H358HCC95)에서 징크-핑거 도메인에 융합된 MQ1 이펙터를 MYC 프로모터에 대해 표적화함으로써(ZF9-MQ1) Myc1 mRNA 발현을 하향조절하는 것은 다수의 폐암 세포주에 걸쳐 세포 생존능의 손실을 초래함을 입증한다.
폐암 세포주에서 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1을, 비처리 세포 및 녹색-형광 단백질(GFP)로 형질감염 세포를 포함하는 음성 대조군과 함께 전달하였다. ZF9-MQ1 또는 GFP를 인코딩하는 mRNA를 상기 실시예 12 및 14에 기재된 바와 같이 SSOP LNP 전달을 사용하여 전달하였다. 성장 배지에서 96-웰 플레이트에 폐암 세포를 시딩하였다(약 10000개 세포/웰). 그 다음 LNP 제형(1 ug/ml)을 세포에 첨가하여 mRNA를 형질감염시킨 다음 72시간 및 120시간 동안 각각 인큐베이션하였다. 상이한 복제물 플레이트를 생존능 및 mRNA 발현의 변화를 결정하기 위해 수집하였다.
제조업체의 프로토콜에 따라 Promega의 CellTiter-GLO® 분석 키트를 사용하여 생존능을 측정하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플을 보정물로서 사용하였다.
이 데이터는 ZF9-MQ1이 4개의 폐암 세포주에서 MYC mRNA 수준을 80% 초과로 감소시킬 수 있고 이는 4개의 세포주 전체에 걸쳐 폐암 세포 생존능의 상당한 손실과 일치하였음을 나타내었다(도 17a 내지 h).
실시예 17: ZF9-MQ1은 NSCLC 세포주 NCI-H2009에서 세포 아폽토시스를 유도한다
이 실시예는 폐암 세포의 세포 아폽토시스에 대한 ZF9-MQ1의 효과를 입증한다.
Cell Titer GLO(실시예 16에서 사용됨)와 같은 생존능 분석은 ATP의 수준을 기준으로 웰에 남아 있는 세포의 상대적인 수를 결정함으로써 생존능을 측정한다. 이 분석은 세포 증식 손실과 상이한 유형의 세포 사멸(예를 들어, 괴사 대 아폽토시스)을 구별하지 않는다.
ANNEXIN V 단백질 및 프로피디움 요오다이드(PI) 핵 염색에 대한 형광 태깅된 항체를 ZF9-MQ1로 형질감염시킨 후 아폽토시스 세포를 정량화하는 데 이용하였다. 이펙터 단백질이 없는 ZF9 징크 핑거 도메인(ZF9-NE)을 인코딩하는 mRNA를 비처리 세포에 추가하여 음성 대조군으로 사용하였다. 폐 세포주 line NCI-H2009를 성장 배지에서 12 웰 플레이트에 도말하였다(웰당 50,000개 세포). 그 다음 mRNA가 있는 LNP 제형(1 ug/ml)을 세포에 첨가하여 ZF9-MQ1 또는 ZF9-NE mRNA를 형질감염시킨 다음 96시간 동안 인큐베이션하였다. 세포를 수확하고 BD Annexin V: FITC 아폽토시스 검출 키트(BDB556570)를 사용하여 염색한 다음 유세포 분석에 의해 분석하였다. Annexin V-FITC 및 PI에 대해 양성인 세포를 아폽토시스로 분류하였다.
이 데이터는 음성 대조군(ZF9-NE로 처리된 세포 및 비처리 세포)에서 96시간 후 단지 18%의 세포만 아폽토시스되었음을 나타내었다(도 18a 내지 b, 18d). 대조적으로, 40%의 세포는 ZF9-MQ1로 처리된 NCI-H2009 배양물에서 아폽토시스되었다(도 18c 내지 d). 이는 ZF9-MQ1이 폐암 세포의 세포 아폽토시스를 유도할 수 있음을 나타낸다.
실시예 18: 추가의 NSCLC 세포주에서 ZF9-MQ1에 대한 생존력 및 MYC 발현의 용량 반응 곡선.
이 실시예는 ZF9-MQ1이 용량 반응 방식으로 NSCLC 세포주에서 MYC1 발현 및 세포 생존능을 하향조절함을 입증한다.
MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1이 2가지 NSCLC 세포주, 즉 A549 및 HCC95에서 다수 농도로 투약되었다. 비처리 세포를 음성 대조군으로 사용하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA를 전달하였다. 성장 배지에서 96-웰 플레이트에 폐암 세포를 시딩하였다(약 10000개 세포/웰). 그 다음 LNP 제형(5 ug/ml에서 시작함)을 각각 3개 웰에 첨가한 다음 후속 웰에서 10회 용량에 대해 약 1:2로 희석하여 mRNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 상이한 복제물 플레이트를 생존능 및 mRNA 발현의 변화를 결정하기 위해 수집하였다.
제조업체의 프로토콜에 따라 Promega의 CellTiter-GLO® 분석 키트를 사용하여 생존능을 측정하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물로서 사용하였다.
데이터는 ZF9-MQ1이 0.08 ug/ml LNP/mRNA의 EC50로 MYC를 하향조절하며, A549 및 HCC95 둘 다에서 72시간째에 시험관내 생존능(2 ug/ml)에 대해 약 25배 더 높은 EC50 효과를 갖는다는 것을 나타내었다(도 19a 내지 b).
실시예 19: ZF9-MQ1은 NSCLC 세포주 NCI-H2009에서 MYC 단백질 수준을 80% 초과로 감소시킨다
이 실시예는 면역블롯팅 기법을 통해 ZF9-MQ1 처리에 대한 반응으로 MYC 단백질 수준의 변경을 입증한다.
폐암 세포주에서 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1을, 음성 대조군인 ZF9-NE 및 비처리 세포와 함께 전달하였다. 폐 세포주 NCI-H2009를 성장 배지에서 12 웰 플레이트에 도말하였다(웰당 50,000개 세포). 그 다음 LNP 제형(1 ug/ml)을 세포에 첨가하여 ZF9-MQ1 또는 ZF9-NE mRNA를 형질감염시킨 다음 96시간 동안 인큐베이션하였다. 그 다음 세포를 RIPA 완충액에서 용해시키고 Pierce BCA 단백질 분석(23225)을 사용하여 단백질 수준을 정량화하였다. 동일한 양의 단백질을 각 샘플에 대해 로딩하고, NuPAGETM 미니 겔 시스템(Thermo Fisher)을 사용하여 크기별로 분리하였다. 그 다음 단백질을 iBlot™ 2 겔 전달 장치(Thermo Fisher)를 사용하여 PVDF 막으로 옮겼다. ABCAM 항-MYC 항체(ab32072)를 이용하여 막을 밤새 프로빙하였다. Cell Signaling 항-ACTIN 항체(8H10D10)를 로딩 대조군으로 사용하였다. 그 다음 MYC 및 ACTIN 항체 종에 대한 형광 2차 항체를 사용하는 LI-COR 영상화 시스템을 사용하여 신호를 시각화하고 정량화하였다.
데이터는 ZF9-MQ1 처리가 mRNA 발현 수준의 감소와 비슷하게(실시예 17) 폐암 세포주에서 처리 96시간 후 MYC 단백질 수준을 80% 초과로 감소시킴을 나타내었다(도 20a 내지 b).
실시예 20: 누드 마우스에서 피하 성장된 NCI-H2009 모델에서 ZF9-MQ1의 생체내 효능.
이 실시예는 ZF9-MQ1이 암컷 누드 마우스에서 확립된 NCI-H2009 종양의 성장을 억제함을 입증한다.
암컷 누드 마우스에서 좌측 옆구리에 NCI-H2009 종양 세포를 이식함으로써 질환을 유도하였다. 평균 종양 부피가 대략 100 내지 150 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 처리군으로 마우스를 나누었다. MC3 LNP로 mRNA를 전달하였다. 마우스에 ZF9-MQ1 또는 MC3 LNP의 비-암호화 mRNA를 3 mg/kg으로 또는 PBS를 정맥내로 주사하였다(4회 용량에 대해 5일마다 1회, 그 다음 3회 용량에 대해 3일마다 1회; 마우스에게 총 7회 용량을 제공함). 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 매주 3회 종양 크기를 측정하였다.
결과는 ZF9-MQ1이 PBS 대조군 처리 마우스와 비교할 때 (8일째부터 앞으로) 종양 성장을 상당히 감소시킬 수 있었음을 나타내었다(도 21). ZF9-MQ1이 전체 동물 체중에 대해 최소한의 영향을 미쳤다.
실시예 21: MYC IGD 슈퍼-인핸서에 대해 (dCas9를 통해) 표적화된 전사 리프레서 및 가이드 RNA의 조합물은 SSOP LNP를 사용하여 MYC 발현을 하향조절한다
이 실시예는 MYC mRNA 발현이 A549 세포에서 MYC 발현을 조절하는 폐 특이적 슈퍼-인핸서가 KRAB 이펙터 단백질에 의해 표적화될 때 하향조절됨을 입증한다.
가이드 RNA(표 13)를 폐 슈퍼-인핸서 영역 전체에 걸쳐 설계하였고 효소적으로 사멸된 CAS9에 접합된 KRAB 리프레서 단백질과 조합하여 테스트하였다. 음성 대조군으로서 GFP의 mRNA 전달과 함께 SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 가이드 RNA를 공동 전달하였다. 성장 배지에서 96-웰 플레이트에 NCSLC 세포주 A549를 시딩하였다(약 10000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml)을 세포에 첨가하여 이펙터 mRNA/가이드 RNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플을 보정물로서 사용하였다.
[표 13]
이 데이터는 dCAS9-KRAB 이펙터 mRNA와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 하향조절할 수 있었음을 나타내었으며, 이는 이러한 원위 조절 요소를 사용하여 종양발생 MYC를 삼소시키는 능력을 강조한다(도 22).
실시예 22: MYC IGD 슈퍼-인핸서에 대해 표적화된 전사 리프레서(dCas9) 및 가이드 RNA의 조합물은 MC3 LNP를 사용하여 MYC 발현을 하향조절한다
이 실시예는 대안적인 지질 MC3(대 실시예 21의 SSOP)을 이용하여 MYC 발현을 조절하는 폐 특이적 슈퍼-인핸서에 대해 KRAB 이펙터 단백질을 표적화함으로써 MYC mRNA 발현을 하향조절함을 설명한다.
가이드 RNA(표 13)를 폐 슈퍼-인핸서 영역 전체에 걸쳐 설계하였고 효소적으로 사멸된 CAS9에 접합된 KRAB 리프레서 단백질과 조합하여 테스트하였다. 음성 대조군으로서 GFP의 mRNA 전달과 함께 MC3를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 가이드 RNA를 공동 전달하였다. 성장 배지에서 96-웰 플레이트에 NCSLC 세포주 A549를 시딩하였다(약 10000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml)을 세포에 첨가하여 이펙터 mRNA/가이드 RNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플을 보정물로서 사용하였다.
이 데이터는 dCAS9-KRAB 이펙터 mRNA와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 하향조절할 수 있었음을 나타내었으며, 이는 이러한 원위 조절 요소를 사용하여 종양발생 MYC를 삼소시키는 능력을 강조한다(도 23). 이 효과는 SSOP(실시예 21) 및 MP3 지질 형질감염(실시예 22) 둘 다에 의해 나타났다.
실시예 23: MYC IGD 슈퍼-인핸서에 대해 표적화된 전사 리프레서(dCas9) 및 가이드 RNA의 조합물은 NSCLC에서 MYC 발현을 하향조절한다
이 실시예는 MYC 발현을 조절하는 폐 특이적 슈퍼-인핸서에 대해 다양한 전사 이펙터 단백질(EZH2, EZH2-KRAB, 또는 MQ1)을 표적화함으로써 MYC mRNA 발현을 하향조절함을 설명한다.
MYC 슈퍼-인핸서에 대해 표적화된 가이드 RNA(GD-29833 및 GD-29914)를 히스톤 메틸트랜스퍼라제 EZH2(단독 또는 KRAB와 조합하여) 및 효소적으로 사멸된 CAS9에 접합된 DNA 메틸트랜스퍼라제 MQ1을 포함하여 리프레서 단백질과 조합하여 테스트하였다. 음성 대조군으로서 GFP의 mRNA 전달과 함께 SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 가이드 RNA를 공동 전달하였다. 성장 배지에서 96-웰 플레이트에 NCSLC 세포주 A549 또는 NCI-H2009를 시딩하였다(약 10000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml)을 세포에 첨가하여 이펙터 mRNA/가이드 RNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플을 보정물로서 사용하였다.
이 데이터는 2가지 상이한 NSCLC 세포주(A549 및 NCI-H2009)에서 테스트된 3가지 이펙터 단백질(EZH2, EZH2-KRAB, 및 MQ1) 모두와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타낸다(도 24a 내지 b).
실시예 24: MYC IGD 슈퍼-인핸서에 대해 표적화된 전사 리프레서(dCas9) 및 가이드 RNA의 조합물은 120시간째에 NSCLC에서 MYC 발현을 추가로 하향조절한다
이 실시예는 폐암 세포주(A549 및 NCI-H2009)에서 KRAB 또는 MQ1 이펙터 단백질과 함께 슈퍼-인핸서 표적화된 가이드로 형질감염시킨 후 120시간째에 MYC mRNA 발현의 증가된 감소가 관찰됨을 입증한다.
MYC 슈퍼-인핸서에 대해 표적화된 가이드 RNA를 KRAB 리프레서 단백질 또는 MQ1 DNA 메틸트랜스퍼라제와 조합하여 테스트하였다. 음성 대조군으로서 GFP의 mRNA 전달과 함께 SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 가이드 RNA를 공동 전달하였다. 성장 배지에서 12 웰 플레이트에 NCSLC 세포주 A549 또는 NCI-H2009를 시딩하였다(약 50000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml)을 세포에 첨가하여 이펙터 mRNA/가이드 RNA를 형질감염시킨 다음 120시간 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플을 보정물로서 사용하였다.
이 데이터는 KRAB 또는 MQ1과 함께 전달되는 가이드 RNA GD-29833 및 29914가 120시간째에 2개의 NSCLC 세포주(A549 및 NCI-H2009)에서 MYC mRNA 수준을 상당히 하향조절할 수 있었음을 나타낸다(도 25a 내지 b). 또한, 관찰된 하향조절은 NCI-H2009에서 ZF9-MQ1 처리에 의해 관찰된 하향조절과 비슷하다(도 25b).
실시예 25: dCAS9-MQ1을 MYC 슈퍼-인핸서로 유도하면 슈퍼-인핸서 표적 부위 및 MYC 프로모터 영역에서 DNA 메틸화가 증가한다.
이 실시예는 dCas9-MQ1이 MYC 슈퍼-인핸서로 유도되어 표적 부위 및 MYC 프로모터 영역의 메틸화를 초래함을 입증한다.
CRISPR-dCas9 시스템을 후성유전학적 리프레서: MQ1에 테더링함으로써 CRISPR-dCas9 시스템을 변형시켰다. 이 분자는 DNA의 CpG 뉴클레오타이드를 메틸화함으로써 전사 억제를 조절한다. 음성 대조군으로서 GFP 또는 dCAS9-이펙터 없음 작제물(dCas9-NE)의 mRNA 전달과 함께 SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 슈퍼-인핸서 가이드 RNA(29833 및 29914)를 공동 전달하였다. NCSLC 세포주 line NCI-H2009를 성장 배지에서 6 웰 플레이트에 시딩하였다(약 100000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml)을 세포에 첨가하여 이펙터 mRNA/가이드 RNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. Lucigen QuickExtract™DNA 추출 키트를 사용하여 DNA를 단리하였고 프로모터 및 슈퍼-인핸서 영역의 표적화된 중아황산염 서열분석을 사용하여 메틸화된 영역을 결정하였다.
이 연구는 dCas9-MQ1이 NSCLC에서 표적 부위 메틸화를 60%만큼 증가시키고 또한 원위 프로모터 영역으로 메틸화를 유도하였음(약 50%까지 증가함)을 입증하였다(도 26a 내지 b).
실시예 26: MYC IGD 슈퍼-인핸서에 대해 표적화된 전사 리프레서("사멸" CAS9를 통함) 및 가이드 RNA의 조합물은 NSCLC 세포주 NCI-H2009에서 MYC 단백질 수준을 감소시킨다
이 실시예는 면역블롯팅 기법을 통해 NSCLC 세포에서 MYC 슈퍼-인핸서에 대해 가이드 RNA를 표적화함으로써 MYC 단백질의 수준 변경을 입증한다.
폐암 세포주에서 MYC 슈퍼-인핸서에 결합하고 이를 표적화하도록 설계된 GD-29833을 dCAS9-KRAB 또는 dCAS9-MQ1 이펙터 mRNA와 함께 공동 전달하였다. 폐 세포주 line NCI-H2009를 성장 배지에서 12 웰 플레이트에 도말하였다(웰당 50,000개 세포). 그 다음 LNP 제형(1 ug/ml)을 세포에 첨가하여 가이드 및 이펙터 mRNA를 형질감염시킨 다음 96시간 동안 인큐베이션하였다. dCAS9-이펙터 없음(dCAS9-NE) 작제물을 음성 대조군으로 사용하였다. 그 다음 세포를 RIPA 완충액에서 용해시키고 Pierce BCA 단백질 분석(23225)을 사용하여 단백질 수준을 정량화하였다. 동일한 양의 단백질을 각 샘플에 대해 로딩하고, NuPAGETM 미니 겔 시스템(Thermo Fisher)을 사용하여 크기별로 분리하였다. 그 다음 단백질을 Invitrogen iBlot™2 겔 전달 장치(Thermo Fisher)를 사용하여 PVDF 막으로 옮겼다. ABCAM 항-MYC 항체(ab32072)를 이용하여 막을 밤새 프로빙하였다. Cell Signaling 항-ACTIN 항체(8H10D10)를 로딩 대조군으로 사용하였다. 그 다음 MYC 및 ACTIN 항체 종에 대한 형광 2차 항체를 사용하는 LI-COR 영상화 시스템을 사용하여 신호를 시각화하고 정량화하였다.
이 데이터는 전사 리프레서를 갖는 MYC 폐 슈퍼-인핸서로 가이드를 유도하는 것이 mRNA 발현 수준의 감소와 비슷하게(실시예 16) NCI-H2009 폐암 세포주에서 96시간째에 MYC 단백질 수준을 최대 50%까지 감소시킨다는 것을 나타내었다(도 27a 내지 b).
실시예 27: 전체 세포 용해물에서 ZF9-MQ1 단백질 존재가 Hep3B 세포주에서 MYC 단백질의 하향조절과 상관관계가 있다
이 실시예는 ZF9-MQ1로 처리 후 Hep 3B 세포에서 시간 경과에 따른 ZF9-MQ1 및 MYC 단백질 발현 수준의 변화를 결정하는 것을 설명한다.
ZF9-MQ1 및 MYC 단백질 발현 수준을 ZF9-MQ1 처리 후 6, 16 및 48시간째에 평가하였으며(웨스턴 블롯), 처리 개시 24시간 후에 LNP를 제거하고 배지를 교체하였다. RIPA 완충액을 사용하여 단백질을 추출하고 BCA 분석(Thermo Fisher)을 사용하여 총 단백질을 정량화하였다. 총 단백질을 NuPAGETM Bis-Tris Gels(Thermo Fisher), MOPS 실행 완충액에서 실행하고 iBlot™2 Gel Transfer Device(Thermo Fisher)를 사용하여 옮겼다.
MYC 웨스턴: β-액틴 항체를 594 nm 파장에서 방출하는 형광단으로 태깅된 2차 항체로 염색하였고 MYC 항체(Abcam)를 488 nm의 파장에서 방출하는 형광단으로 태깅된 2차 항체로 염색하였다. 근적외선(NIR) 형광을 사용하는 Odyssey® CLx Imaging System(LI-COR)을 사용하여 LI-COR 소프트웨어를 통해 정량화에 사용된 단백질 이미지를 캡처하였다. 각 MYC 및 ACTIN 밴드에 대한 곡선 하 면적(AUC)을 배경 영역을 차감한 다음, 모두 각 시점에 대해 음성 대조군에 대해 정규화하였다.
ZF9-MQ1(헤마글루티닌 [HA] 에피토프로 태깅된 컨트롤러) 웨스턴: β-액틴 항체를 594 nm 파장에서 방출하는 형광단 태그를 갖는 2차 항체로 염색하였고 HA 항체를 488 nm의 파장에서 방출하는 형광단 태그를 갖는 2차 항체로 염색하였다. NIR 형광을 사용하는 Odyssey® CLx Imaging System(LI-COR)을 사용하여 LI-COR 소프트웨어를 통해 정량화에 사용된 단백질 이미지를 캡처하였다. 각 HA 및 ACTIN 밴드에 대한 AUC를 배경 영역을 차감한 다음, 모두 각 시점에 대해 음성 대조군에 대해 정규화하였다.
데이터는 ZF9-MQ1 단백질 존재 및 MYC 단백질 발현 수준이 둘 다 ZF9-MQ1로 세포를 처리한 후 전체 세포 용해물에서 감소되고(도 28 a 내지 b) 전체 세포 용해물에서 ZF9-MQ1 단백질 존재가 MYC 단백질의 하향조절과 상관관계가 있음(도 28c)을 나타낸다.
실시예 28: MYC 발현 및 메틸화 상태의 감소 기간
본 실험은 ZF9-MQ1으로의 처리 후 MYC 발현의 감소 지속성을 평가한다. 추가적으로, 이 실험은 표적 유전자좌에서 MYC 발현화 DNA 메틸화 증가의 상관관계를 입증하고 평가한다.
생존력에 대한 최소한의 변화를 나타내었지만 40 내지 50% MYC 하향조절(실시예 4)을 나타낸 SKHEP-1 세포주를 이용하여 반응의 지속성을 평가하였다. SK-HEP-1을 LNP / ZF9-MQ1 또는 ZF-이펙터 없음(음성 대조군)으로 형질감염시킨 다음, 처리 24시간 후 새로운 배지로 교체하였다. 지정된 시점에서 mRNA 및 게놈 DNA의 추출을 위해 세포를 수집하였다(Qiagen RNA/DNA 키트). MYC mRNA를 평가하기 위해, 전체 세포 RNA를 처리하여 상보적 DNA(cDNA)(폴리-A 프라이머를 사용함)를 만든 다음, 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. 표적화된 유전자좌에서 메틸화 상태를 평가하기 위해, 표적화된 중아황산염 게놈 서열분석을 사용하여 단일 DNA 염기쌍 분해능에서 5-메틸시토신을 측정하였다.
3일째에, MYC mRNA는 음성 대조군(ZF-이펙터 없음) 및 비처리 세포와 비교하여 89%만큼 감소되었다(나타내지 않음). mRNA 발현의 하향조절은 서서히 증가되었으며, MYC 전사체에서 45% 하향조절이 15일째에 유지되었다(도 29a). 추가적으로, ZF9-MQ1의 발현은 MYC 프로모터 영역으로의 새로운 CpG 메틸화를 지시하였다. MYC 전사 변화는 15일째까지의 메틸화 백분율과 상관관계가 있었다(도 29b).
실시예 29: 1차 간세포에서 이중-시스트론 ZF9-MQ1_ ZF3-KRAB를 이용한 C-MYC 발현 및 세포 생존능
이 실시예는 1차 간세포에서 MYC mRNA 및 생존능에 대한 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 효과를 평가한다.
냉동보존된 1차 인간 간세포(Lonza)를 해동하고 예열된 해동 배지에 첨가한 다음 24시간부터 도말하였다. 세포를 도말 배지에 재현탁시키고 계수하여 명시된 농도(106개 세포/mL)로 제조하였다 그 다음 오십(50) uL의 세포 용액을 96-웰 플레이트(추가 50 uL의 도말 배지 포함)에 100 uL의 총 부피로 첨가하고 밤새 인큐베이션하였다. LNP 제형화 mRNA(GFP, ZF-NE, ZF9-MQ1, ZF3-KRAB, ZF9-MQ1+ ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB)을 0.6μg/ml, 1.25 μg/ml, 및 2.5 μg/ml의 농도로 100 μL의 추가 배지에 있는 세포에 첨가하였다. 세포를 72시간 동안 인큐베이션하고, 유지 배지 교체는 6시간째부터 시작하여 그 후 매일 수행하였다. MYC mRNA 발현 수준(RT-PCR) 및 세포 생존능(CellTiter-GLO®)을 처리 72시간 후에 평가하였다.
ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로 처리된 1차 간세포는 GFP, ZF-NE 또는 ZF3-KRAB와 비교할 때 MYC mRNA 발현의 감소를 나타내었다(도 30a). 전체적으로, 처리는 생존능에 대해 최소한의 영향을 나타내었으며, 이는 HCC 세포주와 비교할 때 MYC 발현의 감소가 정상 세포에 덜 중요하다는 것을 나타낸다(도 30b).
또 다른 실험에서, 냉동보존된 PHH를 예열한 간세포 해동 배지로 해동하였고 실온에서 100 g로 8분 동안 회전하였다. 세포 펠렛을 간세포 도말 배지에서 재현탁시켰다. 그 다음 세포를 계수하고, 기준 생존능을 측정하였다. 세포 희석액을 준비하고, 50,000개 세포를 2중으로 96-웰 플레이트에 도말하였다. 세포를 밤새 인큐베이션하였다. 다음 날 도말 배지를 완전히 제거하고 예열된 간세포 배양 배지를 첨가하였다. 세포를 이중-시스트론 ZF9-MQ1_ZF3-KRAB, ZF9-MQ1, ZF3-KRAB, ZF9-NE 또는 대조군 GFP mRNA로 2.0, 1.0, 또는 0.5 μg/mL에서 3중으로 처리하고 6시간 동안 인큐베이션하였다. 그 다음 처리 배지를 제거하고 200 μL의 신선한 간세포 배양 배지로 교체하였다. 형질감염 후 추가 66시간 동안 세포를 인큐베이션하였다(총 72시간). 처리 후 1개의 플레이트를 CellTiter-GLO® 시약으로 용해시키고, Glo Max Discovery Plate Reader를 사용하여 발광을 정량화하였다. 흡인에 의해 세포의 제2 플레이트로부터 배지를 제거하고 세포를 RLT Plus Lysis 완충액으로 용해시켰다. 제조업체의 지침에 따라 Rneasy® Plus 96 Kit를 사용하여 mRNA 추출을 수행하였다. 추출 후 mRNA를 LunaScript® RT SuperMix Kit(NEB)를 사용하여 cDNA로 전환하였다. MYC(표적) 및 GAPDH(참조) 프로브를 이용하여 ΔΔCT qPCR을 통해 cDNA를 분석하였다.
이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리된 PHH는 대조군과 비교할 때 MYC mRNA의 감소를 나타내었다(도 30c). ZF9-MQ1(모든 용량) 및 ZF3-KRAB(2 μg/mL)는 세포 생존능에 최소한의 영향을 미치면서 MYC mRNA를 하향조절하였다(도 30d). ZF9-NE는 MYC mRNA 또는 생존능에 영향을 미치지 않았다(도 30c 내지 d). 전체적으로, 이중-시스트론 ZF9-MQ1_ZF3-KRAB 처리는 생존능에 대해 최소한의 영향을 나타내었으며, 이는 정상 세포에서 MYC 발현의 감소가 세포 생존능에 영향을 미치지 않았다는 것을 입증한다(도 30a 내지 d).
실시예 30: 누드 마우스에서 피하 성장된 ZF9-MQ1+ZF3-KRAB 모델에서 ZF9-MQ1의 생체내 효능.
이 실시예는 ZF9-MQ1+ZF3-KRAB가 암컷 누드 마우스에서 확립된 NCI-H2009 종양의 성장을 억제함을 입증한다.
암컷 누드 마우스에서 좌측 옆구리에 NCI-H2009 종양 세포를 이식함으로써 질환을 유도하였다. 평균 종양 부피가 대략 100 내지 150 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 처리군으로 마우스를 나누었다. MC3 LNP로 mRNA를 전달하였다. 마우스에 ZF9-MQ1+ZF3-KRAB를 3 mg/kg으로 5일마다, 또는 MC3 LNP의 비-코딩 mRNA를 3 mg/kg으로 5일마다 또는 시스플라틴을 1 mg/kg IP로 15일마다, 또는 PBS를 5일마다 주사하였다.
결과는 ZF9-MQ1+ZF3-KRAB로의 처리가 3회 투여 후 종양 크기의 통계적으로 유의한 감소를 나타내었으며, 대조군과 비교하여 25일째에 종양 부피를 63% 감소를 초래하고(도 31a), 처리된 마우스의 체중에 대해서는 유의한 효과가 없음을 나타내었다(도 31b). 이 연구에서, ZF9-MQ1+ZF3-KRAB 처리는 종양 부피에 대하여 시스플라틴으로의 처리에 대해 동등한 효과와 연관이 있었다(도 31a).
실시예 31: Fox Chase CB17 SCID마우스에서 동소적으로 성장한 Hep 3B 모델에서 ZF9-MQ1 + ZF3-KRAB 공제형의 생체내 효능.
이 마우스는 암컷 Fox Chase CB17 SCID 마우스의 동소 Hep3B-luc 모델에서, 투약 후 ZF9-MQ1 + ZF3-KRAB 공제형의 장기 항-종양 효능 및 지속성을 입증한다.
Hep-3B-luc 세포를 SCID 마우스의 간의 좌상엽에 주사하였다. 무작위화에서 각 그룹에 대한 평균 복면도 전신 종양-연관 생물발광(TABL)은 약 2.8x109 p/s이었다. PBS, ZF9-MQ1+ZF3-KRAB(더 높은 용량, 즉 6 mg/kg), ZF9-MQ1+ZF3-KRAB(중간 용량, 즉 3 mg/kg), ZF9-MQ1+ZF3-KRAB(낮은 량, 즉 3 mg/kg)를 이용한 처리를 위해 각 12마리의 마우스로 구성된 4개 그룹 및 세포 이식 후 7일째 소라페닙을 이용한 처리를 위해 6마리 마우스로 구성된 하나의 그룹으로 마우스를 무작위로 할당하였다. 종양 세포 이식 후 8일째에 처리를 시작하였다(그래프에서 투약 1일로 표시함). 마우스를 PBS(4회 용량에 대해 5일마다, 그 다음 2회 용량에 대해 3일마다), LNP(MC3) ZF9-MQ1 + ZF3-KRAB(5일마다 1.5 mg/kg)를 이용하여 정맥내로, LNP(MC3) ZF9-MQ1 + ZF3-KRAB를 이용하여 정맥내로(5일마다 3 mg/kg), LNP(MC3) ZF9-MQ1 + ZF3-KRAB를 이용하여 정맥내로(5일마다 6 mg/kg), 및 소라페닙을 이용하여 경구로(매일 50 mg/kg) 처리하였다. 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 매주 2회 생물발광에 의해 종양 크기를 측정하였다.
결과는 ZF9-MQ1 + ZF3-KRAB를 이용한 처리가 2회 투여 후 종양 크기의 상당한 억제와 연관이 있음을 나타내었다. 1.5 mg/kg 용량으로의 처리는 음성 대조군과 비교하여 23일째까지 종양 성장의 약 63% 억제를 초래하였고, 3 mg/kg으로의 처리는 음성 대조군과 비교하여 23일째까지 종양 성장의 약 54% 억제를 초래하였다(도 32a). 유사하게, 6 mg/kg의 ZF9-MQ1 + ZF3-KRAB로의 처리는 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되었으며, 음성 대조군과 비교하여 23일째에 종양 부피의 63% 감소를 초래하였다(도 32a). 3 mg/kg의 ZF9-MQ1 + ZF3-KRAB로의 처리는 소라페닙으로의 처리와 동등하였다(도 32a). ZF9-MQ1 + ZF3-KRAB로 처리된 마우스는 체중의 상당한 감소를 경험하지 않았음을 나타낸다(도 32b). 소라페닙으로 처리된 마우스는 처음에 체중 감소를 경험하였고 이후에 종양 덩어리의 증가로 인해 잠재적으로 전체 체중이 증가하였다(도 32b). 이 데이터는 ZF9-MQ1 + ZF3-KRAB로의 처리가 이 연구에서 잘 용인되었음을 제안하였다.
실시예 32: ZF9-MQ1 및 ZF3-KRAB를 인코딩하는 이중-시스트론 mRNA는 MYC 발현 및 세포 생존능을 감소시킨다
이 실시예는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB의 효능을 단일 작제물 ZF3-KRAB와 ZF9-MQ1, 및 ZF3-KRAB와 ZF9-MQ1의 공제형과 비교한다. 이들 작제물을 지질 나노입자(LNP)에 캡슐화된 mRNA를 통해 간세포 암종 세포로 전달한다.
LNP에 각각의 mRNA를 캡슐화함으로써 ZF9-MQ1, ZF3-KRAB, 이중-시스트론 ZF9-MQ1_ZF3-KRAB, 및 공제형화 ZF9-MQ1과 ZF3-KRAB 작제물을 제조하였다. 96웰 플레이트에서 웰당 10,000개 세포를 시딩함으로써 Hep 3B 세포를 형질감염시키고 0.6 μg/mL 및 2 μg/mL mRNA / LNP로 추가로 처리하였다.
MYC mRNA 및 세포 생존능을 형질감염 48시간 후에 분석하였다. 제조업체의 프로토콜에 따라 Promega의 CellTiter-GLO® 분석 키트를 사용하여 생존능을 측정하였다. 제조업체의 프로토콜에 따라 RNeasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 유전자의 발현에 대비하여 MYC 발현을 정량화하였다(TaqManTM 프라이머/프로브를 사용함). 비처리 세포를 사용하여 MYC의 발현을 정규화하였다.
이들 데이터는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 단일 작제물(ZF3-KRAB 또는 ZF9-MQ1) 단독보다 더 큰 정도로 Hep 3B 세포에서 MYC mRNA및 세포 생존능을 하향조절하였음을 나타낸다(도 33a 내지 33b). 이중-시스트론 ZF9-MQ1_ ZF3-KRAB는 0.6 μg/ml 및 2 μg/ml 농도 둘 다에서 48시간째에 총 MYC mRNA 수준을 99%만큼 감소시켰다(도 33a). 이중-시스트론 ZF9-MQ1_ ZF3-KRAB는 2 μg/ml 및 0.6 μg/ml 농도 둘 다에서 Hep3B 세포의 생존능을 각각 약 80% 및 27%만큼 감소시켰다(도 33b). 또한, 이중-시스트론 작제물로의 처리는 ZF3-KRAB와 ZF9-MQ1 작제물의 공제형과 동등하게 효과적이었다.
실시예 33: 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 HCC 하위유형 전체에 걸쳐 용량 의존적 방식으로 MYC mRNA 및 HCC 세포 생존능을 감소시킨다
이 실시예는 HCC 하위유형 S1 및 S2 전체에 걸쳐 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 효능을 평가한다. HCC S1 하위유형 세포주 SKHEP-1, SNU-449와 SNU-182 및 S2 하위유형 세포주 Hep 3B와 Hep G2를 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리하였다. 본 발명자들은 72시간 처리 후 연속적으로 희석된 농도에서 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB 의 MYC mRNA 및 세포 생존능을 평가하였다.
성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(약 10,000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml에서 시작함)을 각각 3개 웰에 첨가한 다음 후속 웰에서 10회 용량 포인트에 대해 약 1:2로 희석하여 mRNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 상이한 복제물 플레이트를 생존능 및 RNA에 대해 수집하였다. 제조업체의 프로토콜에 따라 Promega의 CellTiter-GLO® 분석 키트를 사용하여 생존능을 측정하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 유전자의 발현에 대비하여 MYC 발현을 정량화하였다(TaqManTM 프라이머/프로브를 사용함). 비처리 세포를 사용하여 MYC의 발현을 정규화하였다.
결과는 이중-시스트론 ZF9-MQ1_ZF3-KRAB 처리가 HCC 하위유형 전체에 걸쳐 세포 생존능에 대한 효과를 나타내었음을 지시한다(도 34a 내지 c). MYC mRNA의 억제에 대한 EC50 값은 1 내지 20 ng/mL의 범위이며 S1 및 S2 하위유형 사이에 경향은 없다(도 34d). 유사하게, 50% 세포 생존능의 손실은 MYC mRNA와 비교하여 더 높은 범위의 값(120 내지 200 ng/mL)으로 변환되었다. MYC mRNA 발현 또는 세포 생존능에서 S1과 S2 하위유형 사이에 유의한 차이는 없었다. 3가지 S1 및 2가지 S2 하위유형 HCC 종양 세포주에 대한 EC50 값은, 이중-시스트론 ZF9-MQ1_ZF3-KRAB가 HCC 하위유형 둘 다에 대해 효과적이었음을 입증하였다(도 34d).
실시예 34: 이중-시스트론 ZF9-MQ1_ZF3-KRAB에 의한 HCC 세포의 아폽토시스 유도
이 실시예는 HCC 세포의 세포 아폽토시스에 대한 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 효과를 설명한다. CellTiter-GLO®와 같은 생존능 분석은 세포 증식 손실과 세포 사멸을 구분하지 않고 ATP의 수준을 기준으로 웰에 남아 있는 세포의 상대적인 수만을 평가한다.
이 실시예에서, Annexin V 단백질(Annexin V FITC) 및 프로피디움 요오다이드(PI)에 대한 형광으로 태깅된 항체를 사용하여 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 형질감염시킨 후 3가지 HCC 세포주, 즉 Hep 3B, Hep G2, 및 SK-HEP-1에서 아폽토시스 세포를 정량화하였다. 비-코딩 mRNA를 비처리 세포에 추가하여 음성 대조군으로 사용하였다. 성장 배지에서 12 웰 플레이트에 HCC 세포를 도말하였다(웰당 50,000개 세포). 그 다음 LNP 제형(1 μg/ml)을 세포에 첨가하여 mRNA를 형질감염시키고 48시간 동안 각각 인큐베이션하였다. 세포를 수확하고 BD Annexin V: FITC 아폽토시스 검출 키트(BDB556570)를 사용하여 염색한 다음 유세포 분석에 의해 분석하였다. Annexin V FITC 및 PI에 대해 양성인 세포를 아폽토시스로 분류하였다.
이들 데이터는 이중-시스트론 F9-MQ1_ZF3-KRAB로 처리한 후 48시간째에 75% 초과의 아폽토시스 세포가 Hep 3B 및 Hep G2 세포주에서 검출되었고 15% 아폽토시스 세포가 SK-HEP-1 세포주에서 검출되었음을 나타내었다(도 35). 세포는 비처리 세포(5 내지 20% 배경 아폽토시스)와 비교하여 비-코딩 mRNA 대조군에 의해 영향을 받지 않았으며, 이는 이중-시스트론 ZF9-MQ1_ZF3-KRAB가 배양물에서 HCC 세포주의 세포 아폽토시스를 유도할 수 있었음을 나타낸다.
실시예 35: 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 지속 가능한 방식으로 MYC mRNA 수준을 감소시킨다
이 실시예에서, MYC mRNA 하향조절에 대한 이중 시스트론 ZF9-MQ1_ZF3-KRAB의 지속성을 이중-시스트론 ZF9-MQ1_ZF3-KRAB SSOP LNP의 1회 처리 후에 평가하였다.. 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 메틸화 및 억제 히스톤 마크를 MYC IGD로 유도함으로써 MYC를 억제한다. 이러한 변형이 효과적일 수 있는 기간을 결정하기 위해, SK-HEP-1 세포를 이용하였는데 이는 이들 세포가 이중-시스트론 ZF9-MQ1_ZF3-KRAB를 이용한 처리 후 세포 생존능에 대하여 최소한의 영향을 나타내었기 때문이다. 이 연구의 목적은 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 1회 처리가 MYC mRNA 억제를 약 2주 동안 유지할 수 있는지를 결정하는 것이었다.
2 mL의 성장 배지에서 웰당 200,000개 세포로 6웰 플레이트에 SK-HEP-1 세포를 도말하였다. 그 다음 세포를 0.6 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB 또는 대조군 비-코딩 mRNA LNP로 처리하였다. 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리 후 1일째, 세포를 트립신화하고 3개의 샘플, 즉 RNA 추출을 위한 1개 샘플, 게놈 DNA(gDNA) 추출을 위한 1개 샘플, 향후 시점을 위해 저장된 1개 샘플로 분할하였다. 이 과정을 처리 후 3, 6, 9, 및 12일째에 대해 반복하였다. 15일째에 대해, 남은 세포를 RNA 및 gDNA 추출을 위해 동일하게 분할하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 유전자의 발현에 대비하여 MYC 발현을 정량화하였다(TaqManTM 프라이머/프로브를 사용함). 비처리된 세포를 사용하여 MYC의 발현을 정규화하였다.
이 데이터는 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 지속성이 MYC 유전자 발현 조절을 매개하였음을 입증하였다. SKHEP1 세포에서 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 1회 처리 후, MYC mRNA 수준이 1일째에 감소되었고 처리 후 최대 15일까지 억제된 상태를 유지하였다(도 36).
실시예 36: 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 HCC 세포주에서 MYC mRNA 및 단백질 발현 및 세포 생존능을 감소시킨다
다수 HCC 세포에서 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 약력학을 이해하기 위해 HCC 세포에서 MYC mRNA 및 단백질 수준의 발현, 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 세포 생존능, 및 발현을 이중-시스트론 ZF9-MQ1_ZF3-KRAB로의 처리 96시간 후에 평가하였다.
Hep 3B 또는 SK-HEP-1 세포를 각각의 시점에 대해 배양 배지에서 웰당 10,000개 세포로 2개의 96-웰 플레이트 및 웰당 400,000개 세포로 6-웰 플레이트의 세트에 도말하였다. 96-웰 플레이트를 세포 생존능 및 mRNA 분석에 대해 1 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB 또는 비-코딩 mRNA로 3중으로 처리하였다. 6-웰 플레이트를 단백질 분석에 대해 1 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB 또는 비-코딩 mRNA로 2중으로 처리하였다. 처리 후 6, 24, 48, 72, 또는 96시간 동안 세포를 인큐베이션하고, 각 시점에서 세포의 하위집합을 비처리 음성 대조군으로 남겨 두었다. 각 시점에서, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GLOMAX®를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT LunaScript®를 이용하여 cDNA로 전환하였다. 그 다음 MYC(표적) 및 GAPDH(참조) 프로브를 이용하여 ΔΔCT qPCR을 통해 cDNA를 분석하였다. 6-웰 플레이트로부터의 세포를 각 시점에 단백질 단리를 위해 RIPA 완충액으로 용해하였다. Pierce BCA 단백질 분석(23225)을 사용하여 총 단백질을 정량화하였다. 동일한 양의 단백질을 각 샘플에 대해 로딩하고, NuPAGETM 미니 겔 시스템(Thermo Fisher)을 사용하여 크기별로 분리하였다. 그 다음 단백질을 iBlot™2 겔 전달 장치(Thermo Fisher)를 사용하여 PVDF 막으로 옮겼다. 항-MYC 항체(Abcam ab32072)를 이용하여 막을 밤새 프로빙하였다. 항-β-액틴 항체(Cell Signaling 8H10D10)를 로딩 대조군으로 사용하였다. 그 다음 MYC 및 β-항체 1차 항체에 대한 형광 2차 항체를 사용하는 LI-COR 영상화 시스템을 사용하여 신호를 시각화하고 정량화하였다.
2가지 세포주 모두에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB가 짧은 비-코딩 mRNA 또는 비처리된 세포와 비교할 때 6시간째에 MYC mRNA 및 단백질 발현을 감소시켰으며, 96시간 후에 감소된 상태를 유지하였음을 나타낸다(도 37). 2가지 세포주 둘 다에서, 세포 생존능의 감소가 이중-시스트론 ZF9-MQ1_ZF3-KRAB를 이용한 처리 48시간 후에 관찰되었다(도 37). 짧은 비-코딩 음성 대조군은 세포 생존능에 대해 영향을 미치지 않았다.
실시예 37: 이중-시스트론 ZF9-MQ1_ZF3-KRAB mRNA는 HA 태깅된 단백질에 의해 시각화된 바와 같이 ZF9-MQ1 및 ZF3-KRAB를 둘 다 발현한다
이 실시예에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB mRNA / LNP에 의해 인코딩된 단백질의 발현을 웨스턴 블롯 분석을 통해 확인하였다. 세포 내부에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB는, 이 실험에서 HA로 태깅된 2개의 ZF 단백질(ZF3-KRAB 및 ZF9-MQ1)을 생산하여, HCC 세포의 형질감염 후 단백질 발현의 정량화를 가능하게 한다.
Hep 3B 또는 SK-HEP-1 세포를 각각의 시점에 대해 배양 배지에서 웰당 400,000개 세포로 6-웰 플레이트의 세트에 도말하였다. 6-웰 플레이트를 단백질 분석에 대해 1 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 2중으로 처리하였다. 세포를 6 또는 24시간 동안 인큐베이션하였다. 그 다음 세포를 RIPA 완충액에서 용해시키고 Pierce BCA 단백질 분석(23225)을 사용하여 총 단백질 수준을 정량화하였다. 동일한 양의 단백질을 각 샘플에 대해 로딩하고, NuPAGETM 미니 겔 시스템(Thermo Fisher)을 사용하여 크기별로 분리하였다. 그 다음 단백질을 iBlot™2 겔 전달 장치(Thermo Fisher)를 사용하여 PVDF 막으로 옮겼다. Abcam HA 항체를 이용하여 막을 밤새 프로빙하였다. 항-β-액틴 항체(Cell Signaling 8H10D10)를 로딩 대조군으로 사용하였다. MYC 및 β-액틴 항체에 대한 형광 2차 항체를 사용하는 LI-COR 영상화 시스템을 사용하여 신호를 시각화하고 정량화하였다.
형질감염 후 6 및 24시간째 둘 다에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB mRNA에 의해 인코딩된 ZF3-KRAB 및 ZF9-MQ1 단백질 둘 다를 웨스턴 블롯 상의 HA 태그에 의해 시각화하였음을 나타낸다(도 38). ZF3-KRAB 및 ZF9-MQ1 작제물 둘 다의 축척은 두 시점 모두에서 관찰되었다.
실시예 38: 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 HCC 세포에서 소라페닙 반응을 증가시킨다
이 실시예에서, HCC 세포주에서 소분자 소라페닙(다중-키나제 억제제) 효능에 대한 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 효능을 평가하였다. 소라페닙을 HCC에서 표준 치료(standard of care)로 사용하고 높은 MYC 수준으로 소라페닙 내성을 예측할 수 있다. 이중-시스트론 ZF9-MQ1_ZF3-KRAB가 MYC의 하향조절을 통해 HCC를 소라페닙에 대해 재감작시킬 수 있다는 가설을 세웠다. 용량 반응 분석을 이용하여 이중-시스트론 ZF9-MQ1_ZF3-KRAB 처리가 소라페닙의 IC50을 감소시킬 수 있는지를 평가하하였다.
이중-시스트론 ZF9-MQ1_ZF3-KRAB과 소라페닙 사이의 잠재적인 시너지 효과를 평가하기 위하여, 웰당 10,000개 세포로 96 웰 플레이트에 Hep 3B 또는 SK-HEP-1 세포를 도말하였다. 그 다음 세포를 0.1 내지 25 μM의 용량 범위에서 1:2의 연속 희석으로 소라페닙으로 처리하였다. 그 다음 이중-시스트론 ZF9-MQ1_ZF3-KRAB를 보유하는 지질 혼합물을 0.1 또는 0.6 μg/mL의 용량으로 웰의 하위집합에 첨가하였다. 한 세트의 세포를 소라페닙 단독으로 처리하여 대조군으로 사용하였다. 72시간 처리 후, 세포를 CellTiter-GLO® 시약으로 용해하고 Glo Max를 사용하여 발광을 정량화하였다. 비처리 값을 평균화하고 각 실험의 루시퍼라제 값을 평균으로 나눔으로써 상대적인 세포 생존능을 계산하였다.
Hep3B | SKHEP-1 | ||
이중-시스트론 ZF9-MQ1_ZF3-KRAB 농도 | 소라페닙 IC50 | 이중-시스트론 ZF9-MQ1_ZF3-KRAB 농도 | 소라페닙 IC50 |
0 μg/ml | 4.4 μM | 0 μg/ml | 12.3 μM |
0.1 μg/ml | 4.25 μM | 0.1 μg/ml | 12.3 μM |
0.6 μg/ml | 2.9 μM | 0.6 μg/ml | 10.7 μM |
데이터는 0.6 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 소라페닙을 투여하였을 때 SKHEP1에서 소라페닙의 IC50은 12.3 μM에서 10.7 μM로 감소하였고(도 39a 및 표 19) Hep 3B에서 소라페닙의 IC50은 4.4 μM에서 2.9 μM로 감소되었음(도 39b 및 표 19)을 나타내었다. 소라페닙이 0.1 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 투여될 때 소라페닙의 IC50은 Hep 3B 또는 SK-HEP-1 세포에서 별로 변하지 않았다(도 39a 내지 39b). 소라페닙과 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 조합물은 소라페닙 단독보다 더 효과적이었다(도 39a 내지 39b). 이 데이터는 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 소라페닙 사이의 상승효과 활성을 제안하였다.
실시예 39: 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 HCC 세포에서 JQ1 반응을 증가시킨다
이 실시예는 다수의 HCC 세포주에서 JQ1(BET 억제제)과 조합한 이중-시스트론 ZF9-MQ1_ZF3-KRAB 의 효능을 평가한다. BET 단백질은 MYC 전사에 중요한 것으로 나타났다. 후기 세대 BET 억제제는 현재 임상에서 혈액학적 적응증에 대해 평가되고 있지만; 이들의 독성 프로파일은 사용을 제한하였다. 감소된 용량 수준으로 BET 억제제의 효능을 증가시킬 수 있는 조합 치료는 BET 억제제 내약성을 개선시킬 수 있었다.
이중-시스트론 ZF9-MQ1_ZF3-KRAB과 JQ1 사이의 잠재적인 시너지 효과를 평가하기 위하여, 웰당 10,000개 세포로 96 웰 플레이트에 Hep 3B 또는 SK-HEP-1 세포를 도말하였다. 그 다음 세포를 0.1 내지 25 μM의 용량 범위에서 1:2의 연속 희석으로 JQ1로 처리하였다. 그 다음 이중-시스트론 ZF9-MQ1_ZF3-KRAB를 보유하는 지질 혼합물을 0.1 또는 0.6 μg/mL의 용량으로 웰의 집합에 첨가하였다. 한 세트의 세포를 JQ1 단독으로 처리하여 대조군으로 사용하였다. 72시간 처리 후, 세포를 CellTiter-GLO® 시약으로 용해하고 Glo Max를 사용하여 발광을 정량화하였다. 비처리 값을 평균화하고 각 실험의 루시퍼라제 값을 평균으로 나눔으로써 상대적인 세포 생존능을 계산하였다.
Hep3B | SKHEP-1 | ||
이중-시스트론 ZF9-MQ1_ZF3-KRAB 농도 | JQ1 IC50 | 이중-시스트론 ZF9-MQ1_ZF3-KRAB 농도 | JQ1 IC50 |
0 μg/ml | 6.6 μM | 0 μg/ml | >25 μM |
0.1 μg/ml | 0.6 μM | 0.1 μg/ml | 1.9 μM |
0.6 μg/ml | 0.2 μM | 0.6 μg/ml | 1.1 μM |
0.6 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 JQ1의 조합물이 SK-HEP1에서 JQ1의 IC50을 25 μM에서 1.1 μM로 감소시켰고(도 40a 및 표 20) Hep 3B에서 JQ1의 IC50을 6.6 μM에서 0.2 μM로 감소시켰다(도 40b 및 표 20). 0.1 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 JQ1의 조합물이 SK-HEP1에서 JQ1의 IC50을 25 μM에서 1.9 μM로 감소시켰고(도 40a 및 표 20) Hep 3B에서 JQ1의 IC50을 6.6 μM에서 0.6 μM로 감소시켰다(도 40b 및 표 20). 이 데이터는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB와 JQ1 사이의 상승효과 활성을 제안하였다.
실시예 40: MYC 게놈을 표적화하도록 설계된 마우스 대용 작제물의 스크리닝
이 실시예, 즉 간세포 암종인 Hepa1-6의 마우스 모델을 사용하여 마우스에서 MYC IGD를 표적화하는 작제물을 평가하였다. 이러한 작제물(ZF15-MQ1, ZF16-MQ1 및 ZF17-MQ1)을 마우스 게놈을 표적화하는 이중-시스트론 ZF9-MQ1_ZF3-KRAB에 대한 대용물로 개발하였다. 본 발명자들은 MYC mRNA 발현을 하향조절하고 마우스 HCC 세포 생존능을 감소시키는 이들 작제물의 능력을 평가하였다.
mRNA 추출 또는 세포 생존능 분석을 위해 2중 플레이트에 웰당 10,000개 세포를 시딩함으로써 마우스 대용 작제물(ZF15-MQ1, ZF16-MQ1 및 ZF17-MQ1)의 패널을 생성하고 Hepa1-6 세포에서 스크리닝하였다. 후보 ZF를 이용하여 0.6 또는 1.2 μg/mL로 96-웰 플레이트를 3중으로 처리하였다. 세포를 72시간 동안 인큐베이션하였다. 인큐베이션 기간 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT LunaScript®를 이용하여 cDNA로 전환하였다. 그 다음 MYC(표적) 및 GAPDH(참조) 프로브를 이용하여 ΔΔCT qPCR을 통해 cDNA를 분석하였다.
이 스크린은 ZF17-MQ1이 생존력 감소(도 41b)에 상응하는 마우스 MYC mRNA의 하향조절을 보였음(도 41a)을 나타내었다.
실시예 41: 세포 생존능 및 MYC mRNA 및 단백질 발현 HCC에 대한 마우스 대용 작제물 ZF17-MQ1의 효과
이 실시예에서, 간세포 암종인 Hepa1-6의 마우스 모델을 사용하여 MYC mRNA 및 단백질 발현 및 마우스 HCC 세포 생존능을 하향조절하는 ZF17-MQ1 작제물의 영향을 평가하였다.
MYC mRNA 및 세포 생존능을 ZF17-MQ1 또는 GFP mRNA를 이용한 처리 96시간 후에 분석하였다. mRNA 추출 또는 세포 생존능 분석을 위해 2중 플레이트에 웰당 10,000개 세포로 Hepa1-6 세포를 시딩하였다. ZF17-MQ1를 이용하여 0.6 또는 1.2 μg/mL로 96-웰 플레이트를 3중으로 처리하였다.
인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. RNeasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript를 이용하여 cDNA로 전환하였다. 그 다음 MYC(표적) 및 GAPDH(참조) 프로브를 이용하여 ΔΔCT qPCR을 통해 cDNA를 분석하였다.
12웰 플레이트에서 100,000개 세포를 ZF17-MQ1 또는 대조군 GFP mRNA로 형질감염시킴으로써 처리 24 및 48시간 후 MYC 단백질 수준을 분석하였다. 세포를 RIPA 완충액에서 용해시키고 Pierce BCA 단백질 분석(23225)을 사용하여 총 단백질 수준을 정량화하였다. 동일한 양의 단백질을 각 샘플에 대해 로딩하고, NuPAGETM 미니 겔 시스템(Thermo Fisher)을 사용하여 크기별로 분리하였다. 그 다음 단백질을 iBlot™겔 전달 장치(Thermo Fisher)를 사용하여 PVDF 막으로 옮겼다. 항-MYC 항체(Abcam ab32072)를 이용하여 막을 밤새 프로빙하였다. 항-β-액틴 항체(Cell Signaling 8H10D10)를 로딩 대조군으로 사용하였다. 그 다음 MYC 및 β-액틴 항체에 대한 형광 2차 항체를 사용하는 LI-COR 영상화 시스템을 사용하여 신호를 시각화하고 정량화하였다.
데이터는 ZF17-MQ1이 MYC IGD를 표적화함으로써 이중-시스트론 ZF9-MQ1_ZF3-KRAB에 대한 마우스 대용물로서 기능할 수 있음을 나타내었다. 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 24 및 48시간째에 MYC 단백질의 상당한 하향조절을 나타내었다(도 42a). 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 96시간째에 MYC mRNA의 상당한 하향조절(도 42c) 및 96시간째에 세포 생존능의 감소(도 42d)을 나타내었다.
실시예 42: ZF17-MQ1의 효능을 나타내는 Hepa1-6 피하 동계 모델
이 실시예는 면역-적격 동물에서 ZF17-MQ1 효능을 입증한다. 구체적으로, Hepa1-6을 동계 수용자 C57BL/6 정상 마우스에 이식한다.
암컷 C57BL/6 마우스에서 좌측 옆구리에 Hepa1-6 종양 세포를 이식함으로써 질환을 유도하였다. 평균 종양 부피가 약 150 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 처리군(PBS 또는 ZF17-MQ1의 경우 각각 9마리 마우스, 소라페닙의 경우 6마리 마우스)으로 마우스를 나누었다. 마우스에 PBS 또는 ZF17-MQ1을 3 mg/kg으로 정맥내로 주사하였다. 양성 대조군인 표준 치료 약물 소라페닙을 50 mg/kg으로 경구 위관 영양법을 통해 매일 제공하였다. ZF17-MQ1을 4회 용량에 대해 5일마다 투약한 다음 2주간의 약물 휴지기가 주어졌으며, 치료가 2회 더 재개되었다. 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 매주 3회 캘리퍼스를 통해 종양 크기를 측정하였다.
결과는 ZF17-MQ1이 4회 투약 후 동물 종양 부하를 상당히 감소시켰음을 나타내었다(도 43). 약물 휴지기 후, 마우스를 재처리하여 약 4주 후에 전체 종양 고갈을 초래하였다(도 43). 이러한 데이터는 ZF17-MQ1이 면역-적격 동물에서 수행된 HCC 이종이식에서 종양 부담을 효과적으로 감소시킬 수 있었음을 나타내었다.
실시예 43: HCC에 대한 잠재적인 신규 치료법으로서 MYC 종양유전자의 후성유전학적 조절
이 실시예는 MYC mRNA 및 세포 생존능을 측정함으로써 HCC 세포주(Hep 3B, Hep G2, SK-HEP-1, SNU-182 및 SNU-449)에서 이중-시스트론 ZF9-MQ1-ZF3-KRAB를 특성화하는 것을 설명한다.
MYC mRNA 및 세포 생존능을 측정함으로써 HCC 세포주(Hep 3B, Hep G2, SK-HEP-1, SNU-182 및 SNU-449)에서 이중-시스트론 ZF9-MQ1_ZF3KRAB 작제물을 특성화하였다. 이중-시스트론 ZF9-MQ1_ZF3KRAB를 지속 가능한 후성유전학적(예를 들어, DNA / 염색질 메틸화) 및 전사체(transcriptome)(예를 들어, RNA-seq) 변화에 대해 테스트하였다. 다양한 단백체학 방법을 사용하여 MYC 단백질 수준 및 경로 신호전달의 변화를 측정하였다. 마지막으로, 종양 부피, 종양-연관 생물발광(BLI) 및 면역조직화학(IHC)을 평가함으로써 피하(subQ) 및 동소성 HCC 모델에서 이중-시스트론 ZF9-MQ1_ZF3KRAB의 활성을 생체내에서 분석하였다.
본 발명자들은 MYC IGD의 여러 유전자좌를 표적화하고, 정상 세포를 아끼면서 HCC 세포에서 MYC mRNA, 단백질 및 세포 생존능을 감소시키는 데 효과적인 이중-시스트론 ZF9-MQ1_ZF3-KRAB를 포함하여 작제물을 확인하였다. HCC 세포에서, 이중-시스트론 ZF9-MQ1_ZF3KRAB 억제 EC50 중앙값은 MYC mRNA에 대해 0.001 ng/mL 미만이고 세포 생존능에 대해 120 ng/mL이다. 중요한 것은, 이중-시스트론 ZF9-MQ1_ZF3KRAB의 효과가 2주 초과 동안 지속되어 지속 가능한 MYC mRNA 억제를 제공하였다. 무흉선 누드 마우스의 Hep 3B subQ 모델에서 3 및 6 mg/kg Q5D의 LNP로 이중-시스트론 ZF9-MQ1_ZF3KRAB의 정맥내 전달은 음성 대조군과 비교하여 23일째까지 각각 54% 및 63%의 통계적으로 유의한 종양 성장 억제(TGI)를 나타내었다. 이중-시스트론 ZF9-MQ1_ZF3KRAB로 처리한 마우스는 음성 대조군 또는 소라페닙-처리 마우스와 비교하여 체중(BW)이 별로 감소하지 않았다. 이중-시스트론 ZF9-MQ1_ZF3KRAB 및 대조군 처리 종양의 IHC는 MYC와 증식 마커인 Ki67의 현저한 하향조절, 및 아폽토시스 마커인 카스파제 3의 상향조절을 나타내었다. Hep 3B 동소 모델에서 3 mg/kg 이중-시스트론 ZF9-MQ1_ZF3KRAB Q5D는 BW의 감소 없이 50 mg/kg QD에서 소라페닙에 대한 BLI의 비슷한 감소를 나타내었다.
실시예 44: LL2 세포에서 MYC 발현 및 세포 생존능에 대한 마우스 대용 작제물의 효과
실시예는 LL2 세포에서 MYC 발현 및 세포 생존능에 대한 마우스 대용 작제물(ZF15-MQ1, ZF16-MQ1, 및 ZF17-MQ1)의 효과를 평가하는 것에 관한 것이다.
mRNA 추출 또는 세포 생존능 분석을 위해 2중 플레이트에 웰당 5,000개 세포로 LL2 세포를 시딩하였다. 96-웰 플레이트를 0.625 μg/mL(mRNA 및 생존능 판독용) 및 1.25 μg/ml(mRNA 및 생존능 판독)로 ZF15-MQ1, ZF16-MQ1, 또는 ZF17-MQ1이 로딩된 LNP로 3중으로 처리하고, 인큐베이션하였다. 6 웰 플레이트를 웰당 200,000개 세포로 시딩하고 상기 작제물을 1.25 μg/ml(웨스턴 블롯 판독용)에서 상기 작제물로 형질감염시켰다. GFP 처리 세포를 음성 대조군으로 사용하였다. 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 마우스 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다. 웨스턴 블롯의 경우, β-액틴 항체를 594 nm 파장에서 방출하는 형광단으로 태깅된 2차 항체로 염색하였고 MYC 항체(Abcam)를 488 nm의 파장에서 방출하는 형광단으로 태깅된 2차 항체로 검출하였다. 근적외선(NIR) 형광을 사용하는 Odyssey® CLx Imaging System(LI-COR)을 사용하여 단백질 이미지를 캡처하였다.
데이터는 ZF17-MQ1로 처리된 세포가 비처리된 세포 또는 GFP-처리된 상태의 세포와 비교하여 LL2 세포에서 MYC 단백질 수준 감소를 나타내었음을 보였다(도 44a). 비처리된 세포에서 관찰된 수준과 비교하여, ZF17-MQ1 및 ZF16-MQ1이 LL2 세포에서 MYC mRNA 수준을 각각 99.9% 초과 또는 74%만큼 감소시켰다(도 44b). 또한, 3가지 작제물 모두 LL2 세포에서 비처리된 세포 및 GFP-처리된 세포보다 더 큰 정도로 세포 생존능을 감소시킬 수 있었다(도 44c). 비처리 세포와 비교하여, 작제물 ZF17-MQ1, ZF16-MQ1, 및 ZF15-MQ1은 LL2 세포에서 각각 최대 74%, 65%, 및 30%까지 생존능을 감소시켰다.
실시예 45: MYC 전사체는 ZF17-MQ1 처리 LL2 및 CT26 세포에서 하향조절된다
이 실시예는 CT26 및 LL2 세포에서 MYC mRNA 발현을 하향조절하고 세포 생존능을 감소시킴에 있어서 ZF17-MQ1 작제물의 효능 평가에 관한 것이다.
mRNA 추출 또는 세포 생존능 분석을 위해 2중 플레이트에 웰당 2,500개 세포로 CT26 및 LL2 세포를 시딩하였다. 1.25 μg/mL 및 2.5 μg/ml로 ZF17-MQ1를 이용하여 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 마우스 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 ZF17-MQ1이 LL2 및 CT26 세포에서 비처리된 세포 및 GFP-처리된 세포(음성 대조군)보다 더 큰 정도로 MYC mRNA를 하향조절하였고 세포 생존능을 감소시킴을 나타내었다. 비처리된 세포에서 관찰된 수준과 비교하여, 2.5 μg/mL에서 ZF17-MQ1은 LL2 및 CT26 세포에서 각각 93% 및 85%만큼 MYC mRNA 수준을 감소시켰다(도 45a). 또한, 비처리된 세포와 비교하여, 이러한 조건 하에, ZF17-MQ1은 LL2 및 CT26 세포에서 각각 87% 및 93%만큼 세포 생존능을 감소시켰다(도 45b).
실시예 46: MYC 전사체는 ZF17-MQ1 처리 LL2 및 CMT167 세포에서 하향조절된다
이 실시예는 CMT167 및 LL2 세포에서 MYC mRNA 발현을 하향조절하고 세포 생존능을 감소시킴에 있어서 ZF17-MQ1 작제물의 효능 평가에 관한 것이다.
mRNA 추출 또는 세포 생존능 분석을 위해 2중 플레이트에 웰당 5,000개 세포로 CMT167 및 LL2 세포를 시딩하였다. GFP, 비-코딩 RNA, 또는 ZF17-MQ1를 이용하여 1.0 μg/ml로 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 마우스 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 ZF17-MQ1이 CMT167 및 LL2 세포에서 비처리된 세포 및 GFP-처리된 세포(음성 대조군)보다 더 큰 정도로 MYC mRNA를 하향조절하였고 세포 생존능을 감소시킴을 나타내었다. 비처리된 세포에서 관찰된 수준과 비교하여, ZF17-MQ1은 CMT167 및 LL2 세포에서 각각 62% 및 73%만큼 MYC mRNA 수준을 감소시켰다(도 46). 또한, 비처리된 세포와 비교하여, 이러한 조건 하에, ZF17-MQ1은 CMT167 및 LL2 세포에서 각각 54% 및 57%만큼 세포 생존능을 감소시켰다(도 46).
실시예 47: ZF9-MQ1은 1차 세포 생존능에 거의 영향을 미치지 않음을 나타낸다
이 실시예는 1차 세포 생존능에 대한 ZF9-MQ1 작제물의 효과를 평가한다.
1차 소기도 상피 세포, 1차 엽 상피 세포, 및 1차 폐 섬유아세포를 세포 생존능 분석을 위해 2중 플레이트에 웰당 7,500개(1차 소기도 상피) 또는 5000개(1차 엽 상피 및 1차 폐 섬유아세포) 세포로 시딩하였다. GFP, 또는 ZF9-MQ1을 이용하여 1.0 μg/ml로 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 1차 소기도 상피 세포, 1차 엽 상피 세포, 및 1차 폐 섬유아세포 각각의 무처리 세포와 비교하여 MYC mRNA 수준을 94%, 96%, 96% 수준만큼 하향조절하였음을 나타내었다(도 47). 그러나, 대조군 세포와 비교하여 생존율이 단지 16%, 9%, 및 22%만큼 감소되었으며, 이는 ZF9-MQ1이 H2009 암 세포에서 이전 발견과 달리 정상 폐 상피 또는 섬유아세포의 세포 생존력에 크지 않은 영향만을 미쳤음을 시사한다.
실시예 48: ZF9-MQ1과 JQ1의 공동 처리는 A549 생존능에 대한 부가적 효과보다 더 큰 효과를 나타내었다
이 실시예는다양한 농도의 JQ1 억제제와 함께 사용될 때 A549 cell 세포 생존능에 대한 ZF9-MQ1 작제물의 효과를 평가한다.
세포 생존능 분석을 위해 2중 플레이트에 웰당 4,000개 세포로 A549 세포를 시딩하였다. BET 억제제 JQ1의 농도 증가와 함께(최대 6.25 uM까지의 농도) 0.5 μg/mL 또는 1.0 μg/mL로 GFP 또는 ZF9-MQ1 로딩 LNP를 이용하여 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 72시간 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다.
데이터는 ZF9-MQ1 및 JQ1이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타내었다(도 48a). 조합될 때, ZF9-MQ1(0.5 또는 1 μg/ml) 및 JQ1(최대 6.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었음을 보였으며, 이는 ZF9-MQ1 및 JQ1 조합이 A549 세포에서 생존능을 억제하는 데 상승작용이 있음을 시사한다(도 48b 내지 48c).
실시예 49: ZF9-MQ1과 BET762의 공동 처리는 A549 생존능에 대한 부가적 효과보다 더 큰 효과를 나타내었다
이 실시예는다양한 농도의 BET762 억제제와 함께 사용될 때 A549 cell 세포 생존능에 대한 ZF9-MQ1 작제물의 효과를 평가한다.
세포 생존능 분석을 위해 2중 플레이트에 웰당 4,000개 세포로 A549 세포를 시딩하였다. BET 억제제 BET762의 농도 증가와 함께(최대 1.25 uM까지의 농도) 0.5 μg/mL 또는 1.0 μg/mL로 GFP 또는 ZF9-MQ1 로딩 LNP를 이용하여 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 72시간 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다.
데이터는 ZF9-MQ1 및 BET762이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타내었다(도 49a). 조합될 때, ZF9-MQ1(0.5 μg/ml) 및 BET762(0.5 μg/ml ZF9-MQ1 처리 세포의 경우 최대 1.25 uM까지의 농도, 그리고 1.0 μg/ml ZF9-MQ1 처리 세포의 경우 최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었음을 보인다(도 49b). 조합될 때, ZF9-MQ1(1.0 μg/ml) 및 BET762(최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었다(도 49c). 데이터는 ZF9-MQ1과 BET762 조합이 A549 세포에서 생존능을 억제하는 데 상승작용이 있음을 시사하였다(도 49b 내지 c).
실시예 50: ZF9-MQ1과 비라브레십의 공동 처리는 A549 생존능에 대한 부가적 효과보다 더 큰 효과를 나타내었다
이 실시예는다양한 농도의 BET 억제제인 비라브레십과 함께 사용될 때 A549 cell 세포 생존능에 대한 ZF9-MQ1 작제물의 효과를 평가한다.
세포 생존능 분석을 위해 2중 플레이트에 웰당 4,000개 세포로 A549 세포를 시딩하였다. BET 억제제 비라브레십의 농도 증가와 함께(0.5 μg/ml ZF9-MQ1 처리 세포의 경우 최대 0.6255 uM까지의 농도, 그리고 1.0 μg/ml ZF9-MQ1 처리 세포의 경우 최대 0.313 uM까지의 농도) 0.5 μg/mL 또는 1.0 μg/mL로 GFP 또는 ZF9-MQ1 로딩 LNP를 이용하여 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 72시간 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다.
데이터는 ZF9-MQ1 및 비라브레십이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타내었다(도 50a). 조합될 때, ZF9-MQ1(0.5 μg/ml) 및 비라브레십(최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었다(도 50b). 조합될 때, ZF9-MQ1(1.0 μg/ml) 및 비라브레십(최대 0.313 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었다(도 50c). 데이터는 ZF9-MQ1과 비라브레십 조합이 A549 세포에서 생존능을 억제하는 데 상승작용이 있음을 시사하였다(도 50b 내지 50c).
실시예 51: ZF9-MQ1과 트라메티닙의 공동 처리는 A549 생존능에 대한 부가적 효과보다 더 큰 효과를 나타내었다
이 실시예는 다양한 농도의 MEK 억제제인 트라메티닙과 함께 사용될 때 A549 cell 세포 생존능에 대한 ZF9-MQ1 작제물의 효과를 평가한다.
세포 생존능 분석을 위해 2중 플레이트에 웰당 4,000개 세포로 A549 세포를 시딩하였다. MEK 억제제인 트라메티닙의 농도 증가와 함께(최대 0.05 uM까지의 농도) 0.5 μg/mL 또는 1.0 μg/mL로 GFP 또는 ZF9-MQ1 로딩 LNP를 이용하여 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 72시간 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다.
데이터는 ZF9-MQ1 및 트라메티닙이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타내었다(도 51a). 조합될 때, ZF9-MQ1(0.5 μg/ml) 및 트라메티닙(최대 0.05 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었다(도 51b). 조합될 때, ZF9-MQ1(1.0 μg/ml) 및 트라메티닙(최대 1.0 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었다(도 51c). 데이터는 ZF9-MQ1과 트라메티닙 조합이 A549 세포에서 생존능을 억제하는 데 상승작용이 있음을 시사하였다(도 51b 내지 51c).
실시예 52: 다수 세포주에서 ZF-KRAB 작제물을 표적화하는 슈퍼 인핸서 영역의 패널을 이용한 MYC 하향조절에 대한 연구
이 실시예는 H2009, H460, 및 H226 세포에서 MYC 하향조절에 대한 ZF9-MQ1 및 징크 핑거 작제물 ZF9-MQ1, ZF54-KRAB, ZF61-KRAB, ZF67-KRAB, 및 ZF68-KRAB를 표적화하는 슈퍼-인핸서 영역의 패널의 효과를 평가한다.
mRNA 분석을 위해 2중 플레이트에 웰당 5,000개 세포로 H2009 and H226 세포를 시딩하였다. GFP, ZF9-MQ1, ZF54-KRAB, ZF67-KRAB, 또는 ZF68-KRAB 로딩 LNP를 이용하여 1.0 μg/ml로 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비-코딩 RNA 로딩 LNP를 이용하여 1.0 μg/ml로 H226 세포를 또한 3중으로 처리하고 인큐베이션하였다. mRNA 분석을 위해 2중 플레이트에 웰당 5,000개 세포로 H460 세포를 시딩하였다. GFP, ZF9-MQ1, ZF61-KRAB, ZF67-KRAB, 또는 ZF68-KRAB 로딩 LNP를 이용하여 1.0 μg/ml로 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 72시간 동안 인큐베이션한 후, 세포를 Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 ZF9-MQ1, ZF54-KRAB, ZF67-KRAB, 및 ZF68-KRAB가 비처리된 세포와 비교하여 MYC mRNA 수준을 H2009에서 적어도 42%만큼(도 52a) 및 H226 세포에서 적어도 27%만큼 하향조절하였음을 나타내었다(도 52b 내지 52c). 추가적으로, ZF9-MQ1, ZF61-KRAB, ZF67-KRAB, 및 ZF68-KRAB는 비처리 세포와 비교하여 MYC mRNA 수준을 H460 세포에서 적어도 26%만큼 하향조절하였다(도 52d).
실시예 53: ZF54-KRAB와 ZF9-MQ1의 공동 처리는 ZF9-MQ1 단독과 비교하여 MYC mRNA 수준을 추가로 감소시킨다
이 실시예는 H2009 세포에서 MYC 하향조절에 대한 ZF9-MQ1과 ZF54-KRAB의 조합 처리의 효과를 평가한다.
mRNA 분석을 위해 96 웰 플레이트에 웰당 5,000개 세포로 H2009 세포를 시딩하였다. ZF9-MQ1-로딩 LNP의 농도 증가와 함께 1.0 μg/mL 또는 2.0 μg/mL로 GFP, ZF9-MQ1 로딩 LNP를 이용하여 웰의 플레이트를 3중으로 처리하고 72시간 동안 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 인큐베이션한 후, 세포를 Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 테스트한 가장 높은 농도에서, ZF9-MQ1 및 ZF54-KRAB가 각각 개별적으로 비처리된 대조군 세포에 비해, H2009 세포에서 MYC mRNA를 각각 99% 또는 62%만큼 하향조절하였음을 나타내었다. 0.313 μg/mL 미만의 ZF9-MQ1이 1 또는 2 μg/mL ZF54-KRAB와 조합될 때, MYC mRNA가 단독 처리에 대해 관찰된 것보다 더 큰 정도로 하향조절되고, 이는 각 ZF9-MQ1 및 ZF54-KRAB가 시험관내에서 H2009 세포에서 MYC mRNA 수준의 하향조절에 기여하였음을 나타낸다(도 53).
실시예 54: ZF9-MQ1과 ZF54-KRAB의 1:1 조합은 최대 적어도 6일 동안 모든 시점에 대해 MYC 발현을 억제하였다
이 실시예는 H1299 세포에서 MYC 하향조절에 대한 ZF9-MQ1과 ZF54-KRAB의 조합 처리의 지속성을 평가한다.
mRNA 분석을 위해 96 웰 플레이트에 웰당 10,000개 세포로 H1299 세포를 시딩하였다. GFP, ZF54-KRAB, 또는 ZF9-MQ1+ ZF54-KRAB 로딩 LNP를 이용하여 1.0 μg/ml로 96-웰 플레이트의 웰을 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 형질감염 6시간, 1일, 2일, 3일, 또는 6일 후에 측정을 수행하였다. 인큐베이션 후, Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 하나의 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 ZF9-MQ1이 48시간까지 비처리된 대조군 세포에 비해 H1299 세포에서 MYC mRNA를 95%만큼 하향조절하였고 144시간째에 대조군 수준의 90%로 하향조절을 유지하였음을 나타내었다. ZF9-MQ1과 ZF54-KRAB의 조합은 48시간째에 MYC mRNA 수준을 98%까지 감소시켰고 144시간째에 대조군 수준의 93%로 하향조절을 유지하였다(도 54). 또한, 데이터는 ZF54-KRAB와 조합된 ZF9-MQ1 및 ZF9-MQ1이 H1299 세포에서 적어도 6일 동안 MYC mRNA 수준을 하향조절하였음을 나타내었다(도 54).
실시예 55: 이중-시스트론 ZF9-MQ1_ ZF54-KRAB는 ZF9-MQ1보다 이르게 MYC 수준을 억제한다
이 실시예는 ZF9-MQ1 및 ZF54-KRAB 단독과 비교하여 이중-시스트론 ZF9-MQ1_ZF54-KRAB 및 ZF54-KRAB_ZF9-MQ1의 효능을 평가한다.
mRNA 분석을 위해 96 웰 플레이트에 웰당 5,000개 세포로 H2009 세포를 시딩하였다. GFP, ZF9-MQ1, ZF54-KRAB, ZF9-MQ1_ZF54-KRAB 또는 ZF54-KRAB_ZF9-MQ1 로딩 LNP를 이용하여 0.5 μg/mL 또는 1.0 μg/mL로 96-웰 플레이트의 웰을 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 형질감염 24시간 및 48시간 후에 측정을 수행하였다. 인큐베이션 후, Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 하나의 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 H2009 세포로의 도입 24시간 후, ZF9-MQ1 및 ZF54-KRAB가 비처리된 세포와 비교하여 MYC mRNA 수준을 각각 최개 83% 및 55%까지 하향조절하였음을 나타내었다. MYC mRNA 수준은 처리 48시간 후 비처리된 대조군의 96%에 대해 ZF9-MQ1-처리 세포에서 추가 13%만큼 추가로 감소된 반면, ZF54-KRAB는 MYC 수준을 추가로 하향조절하지 않았다. ZF9-MQ1_ZF54-KRAB 및 ZF54-KRAB_ZF9-MQ1로 처리된 세포에서 MYC mRNA 수준은 처리 후 24시간째에 대조군 세포의 각각 95% 및 96%로 감소되었다. 데이터는 이들 컨트롤러가 ZF9-MQ1보다 더 일찍 MYC mRNA 수준을 감소시켜 H2009 세포에서 24시간째에 ZF9-MQ1 처리된 세포와 비교하여 처리된 세포에서 더 높은 수준의 MYC 하향조절로 이어질 수 있었음을 나타내었다. (도 55).
실시예 56: H460 SQ 종양을 보유하는 마우스에서 종양 성장의 억제에 대한 ZF9-MQ1 처리의 효과
이 실시예는 ZF9-MQ1이 누드 마우스에서 확립된 피하 H460 종양의 성장을 억제함을 입증한다.
누드 마우스에서 좌측 옆구리에 피하 H460 종양 세포를 이식함으로써 질환을 유도하였다. 평균 종양 부피가 대략 100 내지 150 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 처리군으로 마우스를 나누었다. PBS(비히클), 소라페닙(표준 치료), MC3 LNP에 제형화된 비-코딩 RNA, 또는 MC3 LNP에 제형화된 ZF9-MQ1 mRNA로 종양을 처리하였다. PBS, 비-코딩 RNA(서열번호 198) LNP 및 ZF9-MQ1 LNP를 5일마다 투여하여 3 mg/kg으로 투약하였다. 소라페닙을 매일 50 mg/kg으로 투약하였다. 종양의 길이 및 너비를 매주 2회 측정하였다. 종양 부피를 (너비2 x 길이)/2로 계산하였다.
결과는 ZF9-MQ1 처리가 H460 피하 종양 모델에서 종양 성장을 억제함을 나타내었다. 연구 종료 시 평균 종양 부피는 PBS-처리, mRNA 음성 대조군-처리, 및 ZF09-MQ1-처리군에서 각각 1921 mm3, 1829 mm3, 및 702 mm3이었다. 소라페닙-처리 마우스에서 평균 종양 부피(752mm3)는 ZF9-MQ1-LNP 처리 마우스와 구별할 수 없었으며, 이는 ZF9-MQ1이 이 모델에서 표준 치료 작용제인 소라페닙과 유사하거나 더 나은 활성을 보였음을 나타낸다. 이러한 결과는 음성 대조군과 비교하여, ZF9-MQ1-로딩 LNP가 생체내 H460 피하 종양 모델에서 종양 성장을 억제하는 데 효과적임을 입증하였다(도 56).
균등물
본 발명이 이의 상세한 설명과 함께 기재되었지만, 전술한 설명은 예시하고자 하는 것이고, 첨부된 청구범위의 범주에 의해 규정되는 본 발명의 범주를 제한하고자 하는 것이 아님이 이해되어야 한다. 일부 양태, 이점, 및 변형이 하기 청구범위의 범주 내에 있다.
SEQUENCE LISTING
<110> FLAGSHIP PIONEERING INNOVATIONS V, INC.
<120> COMPOSITIONS AND METHODS FOR MODULATING MYC EXPRESSION
<130> O2057-7029WO
<140>
<141>
<150> 63/281,022
<151> 2021-11-18
<150> 63/212,991
<151> 2021-06-21
<150> 63/137,097
<151> 2021-01-13
<150> 63/125,833
<151> 2020-12-15
<160> 210
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> Homo sapiens
<400> 1
atgatctctg ctgccagtag 20
<210> 2
<211> 20
<212> DNA
<213> Homo sapiens
<400> 2
atcgcgcctg gatgtcaacg 20
<210> 3
<211> 20
<212> DNA
<213> Homo sapiens
<400> 3
attgtgcagt gcatcggatt 20
<210> 4
<211> 20
<212> DNA
<213> Homo sapiens
<400> 4
gtcaaacagt actgctacgg 20
<210> 5
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 5
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Ser Asp Lys Leu Thr Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Lys
35 40 45
Asn Ser Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Thr Thr Gly Ala Leu Thr Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg
145 150 155 160
Ala His Leu Glu Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val
180 185 190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 6
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 6
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro
35 40 45
Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Thr Ser His Ser Leu Thr Glu His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn
145 150 155 160
Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr
180 185 190
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 7
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 7
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg
35 40 45
Ala His Leu Glu Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala
145 150 155 160
Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala
180 185 190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 8
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 8
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser His Thr Gly His Leu Leu Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr
35 40 45
Gly Asn Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
145 150 155 160
Asp Lys Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Thr Asp Thr Leu Arg
180 185 190
Asp His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 9
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 9
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser His Thr Gly His Leu Leu Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser
35 40 45
Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Asn Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro
145 150 155 160
Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile
180 185 190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 10
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 10
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Asp Pro Gly Ala Leu Val Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg
35 40 45
Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr
65 70 75 80
Asn His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro
145 150 155 160
Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val
180 185 190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 11
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 11
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys
35 40 45
Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Gln Ser Gly His Leu Thr Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Lys
145 150 155 160
Asn Ser Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr
180 185 190
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 12
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 12
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Ser Asp Lys Leu Thr Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Arg
35 40 45
Asp Glu Leu Asn Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr
65 70 75 80
Asn His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Lys
145 150 155 160
Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile
180 185 190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 13
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 13
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Ser Asp Asp Leu Val Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu
35 40 45
Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr
65 70 75 80
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg
145 150 155 160
Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg
180 185 190
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 14
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 14
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser
35 40 45
Gly His Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg
65 70 75 80
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Arg Asn Asp Thr Leu Thr Glu His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala
145 150 155 160
Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile
180 185 190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 15
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 15
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser His Thr Gly His Leu Leu Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Lys
35 40 45
Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser
145 150 155 160
Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg
180 185 190
Val His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 16
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 16
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
35 40 45
Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg
65 70 75 80
Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Gln Ser Ser Asn Leu Val Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
145 150 155 160
Asp Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg
180 185 190
Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 17
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 17
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 18
<211> 96
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 18
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 30
Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 60
Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln
65 70 75 80
Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
85 90 95
<210> 19
<211> 385
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 19
Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val Phe Glu Ala Phe
1 5 10 15
Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys Val Arg Lys Asp
20 25 30
Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val Pro Ala Ile Val
35 40 45
Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys Leu Glu Tyr Lys
50 55 60
Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu
65 70 75 80
Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys
85 90 95
Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu
100 105 110
Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu
115 120 125
Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser
130 135 140
Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser
145 150 155 160
Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys Asn
165 170 175
Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu Leu His
180 185 190
Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys Leu Glu Ser
195 200 205
Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala Ala Asp Phe Gly
210 215 220
Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser Thr Leu Asn Glu
225 230 235 240
Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys Ser Ile Lys Lys
245 250 255
Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu Asn Asn Leu Leu
260 265 270
Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser Asn Ile Asn Lys
275 280 285
Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr
290 295 300
Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser
305 310 315 320
Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp
325 330 335
Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val
340 345 350
Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly
355 360 365
Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly
370 375 380
Gly
385
<210> 20
<211> 480
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 20
Val Asp Leu Arg Thr Leu Asp Val Phe Ser Gly Cys Gly Gly Leu Ser
1 5 10 15
Glu Gly Phe His Gln Ala Gly Ile Ser Asp Thr Leu Trp Ala Ile Glu
20 25 30
Met Trp Asp Pro Ala Ala Gln Ala Phe Arg Leu Asn Asn Pro Gly Ser
35 40 45
Thr Val Phe Thr Glu Asp Cys Asn Ile Leu Leu Lys Leu Val Met Ala
50 55 60
Gly Glu Thr Thr Asn Ser Arg Gly Gln Arg Leu Pro Gln Lys Gly Asp
65 70 75 80
Val Glu Met Leu Cys Gly Gly Pro Pro Cys Gln Gly Phe Ser Gly Met
85 90 95
Asn Arg Phe Asn Ser Arg Thr Tyr Ser Lys Phe Lys Asn Ser Leu Val
100 105 110
Val Ser Phe Leu Ser Tyr Cys Asp Tyr Tyr Arg Pro Arg Phe Phe Leu
115 120 125
Leu Glu Asn Val Arg Asn Phe Val Ser Phe Lys Arg Ser Met Val Leu
130 135 140
Lys Leu Thr Leu Arg Cys Leu Val Arg Met Gly Tyr Gln Cys Thr Phe
145 150 155 160
Gly Val Leu Gln Ala Gly Gln Tyr Gly Val Ala Gln Thr Arg Arg Arg
165 170 175
Ala Ile Ile Leu Ala Ala Ala Pro Gly Glu Lys Leu Pro Leu Phe Pro
180 185 190
Glu Pro Leu His Val Phe Ala Pro Arg Ala Cys Gln Leu Ser Val Val
195 200 205
Val Asp Asp Lys Lys Phe Val Ser Asn Ile Thr Arg Leu Ser Ser Gly
210 215 220
Pro Phe Arg Thr Ile Thr Val Arg Asp Thr Met Ser Asp Leu Pro Glu
225 230 235 240
Val Arg Asn Gly Ala Ser Ala Leu Glu Ile Ser Tyr Asn Gly Glu Pro
245 250 255
Gln Ser Trp Phe Gln Arg Gln Leu Arg Gly Ala Gln Tyr Gln Pro Ile
260 265 270
Leu Arg Asp His Ile Cys Lys Asp Met Ser Ala Leu Val Ala Ala Arg
275 280 285
Met Arg His Ile Pro Leu Ala Pro Gly Ser Asp Trp Arg Asp Leu Pro
290 295 300
Asn Ile Glu Val Arg Leu Ser Asp Gly Thr Met Ala Arg Lys Leu Arg
305 310 315 320
Tyr Thr His His Asp Arg Lys Asn Gly Arg Ser Ser Ser Gly Ala Leu
325 330 335
Arg Gly Val Cys Ser Cys Val Glu Ala Gly Lys Ala Cys Asp Pro Ala
340 345 350
Ala Arg Gln Phe Asn Thr Leu Ile Pro Trp Cys Leu Pro His Thr Gly
355 360 365
Asn Arg His Asn His Trp Ala Gly Leu Tyr Gly Arg Leu Glu Trp Asp
370 375 380
Gly Phe Phe Ser Thr Thr Val Thr Asn Pro Glu Pro Met Gly Lys Gln
385 390 395 400
Gly Arg Val Leu His Pro Glu Gln His Arg Val Val Ser Val Arg Glu
405 410 415
Cys Ala Arg Ser Gln Gly Phe Pro Asp Thr Tyr Arg Leu Phe Gly Asn
420 425 430
Ile Leu Asp Lys His Arg Gln Val Gly Asn Ala Val Pro Pro Pro Leu
435 440 445
Ala Lys Ala Ile Gly Leu Glu Ile Lys Leu Cys Met Leu Ala Lys Ala
450 455 460
Arg Glu Ser Ala Ser Ala Lys Ile Lys Glu Glu Glu Ala Ala Lys Asp
465 470 475 480
<210> 21
<211> 457
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 21
Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp
1 5 10 15
Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly
20 25 30
Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys
35 40 45
Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala
50 55 60
Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn
65 70 75 80
Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg
85 90 95
Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr
100 105 110
Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg Ile
115 120 125
Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile
130 135 140
Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn Glu Lys Glu
145 150 155 160
Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe Pro Val
165 170 175
His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu
180 185 190
Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro
195 200 205
Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala Asn
210 215 220
Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg
225 230 235 240
Gly Ser His Met Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp
245 250 255
Arg Arg Gln Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys
260 265 270
Glu Leu Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln
275 280 285
Leu Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu
290 295 300
Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu Gly
305 310 315 320
His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe His Arg
325 330 335
Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg Pro Phe Phe
340 345 350
Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu Asp Leu Asp Val
355 360 365
Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr Ile Pro Asp Val His
370 375 380
Gly Gly Ser Leu Gln Asn Ala Val Arg Val Trp Ser Asn Ile Pro Ala
385 390 395 400
Ile Arg Ser Arg His Trp Ala Leu Val Ser Glu Glu Glu Leu Ser Leu
405 410 415
Leu Ala Gln Asn Lys Gln Ser Ser Lys Leu Ala Ala Lys Trp Pro Thr
420 425 430
Lys Leu Val Lys Asn Cys Phe Leu Pro Leu Arg Glu Tyr Phe Lys Tyr
435 440 445
Phe Ser Thr Glu Leu Thr Ser Ser Leu
450 455
<210> 22
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 22
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Ala
115 120 125
Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg Val His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
<210> 23
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 23
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr Glu His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
<210> 24
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 24
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
<210> 25
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 25
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp
115 120 125
Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
<210> 26
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 26
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Thr Ser Gly Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His
115 120 125
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
<210> 27
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 27
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His
115 120 125
Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
<210> 28
<211> 661
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 28
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly His
115 120 125
Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
645 650 655
Val Pro Asp Tyr Ala
660
<210> 29
<211> 661
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 29
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Arg Asp Glu Leu Asn Val His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp
115 120 125
Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
645 650 655
Val Pro Asp Tyr Ala
660
<210> 30
<211> 661
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 30
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn
115 120 125
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
645 650 655
Val Pro Asp Tyr Ala
660
<210> 31
<211> 661
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 31
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Ser Gly His Leu Thr Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly His
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Thr Leu Thr Glu His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
645 650 655
Val Pro Asp Tyr Ala
660
<210> 32
<211> 661
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 32
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His
115 120 125
Leu Leu Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
645 650 655
Val Pro Asp Tyr Ala
660
<210> 33
<211> 661
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 33
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Asn
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
645 650 655
Val Pro Asp Tyr Ala
660
<210> 34
<211> 1528
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 34
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Ser Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr
1400 1405 1410
Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
1415 1420 1425
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val
1430 1435 1440
Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu
1445 1450 1455
Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro
1460 1465 1470
Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser
1475 1480 1485
Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg
1490 1495 1500
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1505 1510 1515
Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1520 1525
<210> 35
<211> 1820
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 35
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu
1400 1405 1410
Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala
1415 1420 1425
Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala
1430 1435 1440
Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn
1445 1450 1455
Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu
1460 1465 1470
Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys
1475 1480 1485
Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu
1490 1495 1500
Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly
1505 1510 1515
Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn
1520 1525 1530
Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln
1535 1540 1545
Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser
1550 1555 1560
Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys
1565 1570 1575
Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu
1580 1585 1590
Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys
1595 1600 1605
Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
1610 1615 1620
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile
1625 1630 1635
Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys
1640 1645 1650
Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys
1655 1660 1665
Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys
1670 1675 1680
Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser
1685 1690 1695
Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly
1700 1705 1710
Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys
1715 1720 1725
Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu
1730 1735 1740
Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile
1745 1750 1755
Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser
1760 1765 1770
Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly
1775 1780 1785
Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1790 1795 1800
Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp
1805 1810 1815
Tyr Ala
1820
<210> 36
<211> 1922
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 36
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Val Asp Leu Arg
1400 1405 1410
Thr Leu Asp Val Phe Ser Gly Cys Gly Gly Leu Ser Glu Gly Phe
1415 1420 1425
His Gln Ala Gly Ile Ser Asp Thr Leu Trp Ala Ile Glu Met Trp
1430 1435 1440
Asp Pro Ala Ala Gln Ala Phe Arg Leu Asn Asn Pro Gly Ser Thr
1445 1450 1455
Val Phe Thr Glu Asp Cys Asn Ile Leu Leu Lys Leu Val Met Ala
1460 1465 1470
Gly Glu Thr Thr Asn Ser Arg Gly Gln Arg Leu Pro Gln Lys Gly
1475 1480 1485
Asp Val Glu Met Leu Cys Gly Gly Pro Pro Cys Gln Gly Phe Ser
1490 1495 1500
Gly Met Asn Arg Phe Asn Ser Arg Thr Tyr Ser Lys Phe Lys Asn
1505 1510 1515
Ser Leu Val Val Ser Phe Leu Ser Tyr Cys Asp Tyr Tyr Arg Pro
1520 1525 1530
Arg Phe Phe Leu Leu Glu Asn Val Arg Asn Phe Val Ser Phe Lys
1535 1540 1545
Arg Ser Met Val Leu Lys Leu Thr Leu Arg Cys Leu Val Arg Met
1550 1555 1560
Gly Tyr Gln Cys Thr Phe Gly Val Leu Gln Ala Gly Gln Tyr Gly
1565 1570 1575
Val Ala Gln Thr Arg Arg Arg Ala Ile Ile Leu Ala Ala Ala Pro
1580 1585 1590
Gly Glu Lys Leu Pro Leu Phe Pro Glu Pro Leu His Val Phe Ala
1595 1600 1605
Pro Arg Ala Cys Gln Leu Ser Val Val Val Asp Asp Lys Lys Phe
1610 1615 1620
Val Ser Asn Ile Thr Arg Leu Ser Ser Gly Pro Phe Arg Thr Ile
1625 1630 1635
Thr Val Arg Asp Thr Met Ser Asp Leu Pro Glu Val Arg Asn Gly
1640 1645 1650
Ala Ser Ala Leu Glu Ile Ser Tyr Asn Gly Glu Pro Gln Ser Trp
1655 1660 1665
Phe Gln Arg Gln Leu Arg Gly Ala Gln Tyr Gln Pro Ile Leu Arg
1670 1675 1680
Asp His Ile Cys Lys Asp Met Ser Ala Leu Val Ala Ala Arg Met
1685 1690 1695
Arg His Ile Pro Leu Ala Pro Gly Ser Asp Trp Arg Asp Leu Pro
1700 1705 1710
Asn Ile Glu Val Arg Leu Ser Asp Gly Thr Met Ala Arg Lys Leu
1715 1720 1725
Arg Tyr Thr His His Asp Arg Lys Asn Gly Arg Ser Ser Ser Gly
1730 1735 1740
Ala Leu Arg Gly Val Cys Ser Cys Val Glu Ala Gly Lys Ala Cys
1745 1750 1755
Asp Pro Ala Ala Arg Gln Phe Asn Thr Leu Ile Pro Trp Cys Leu
1760 1765 1770
Pro His Thr Gly Asn Arg His Asn His Trp Ala Gly Leu Tyr Gly
1775 1780 1785
Arg Leu Glu Trp Asp Gly Phe Phe Ser Thr Thr Val Thr Asn Pro
1790 1795 1800
Glu Pro Met Gly Lys Gln Gly Arg Val Leu His Pro Glu Gln His
1805 1810 1815
Arg Val Val Ser Val Arg Glu Cys Ala Arg Ser Gln Gly Phe Pro
1820 1825 1830
Asp Thr Tyr Arg Leu Phe Gly Asn Ile Leu Asp Lys His Arg Gln
1835 1840 1845
Val Gly Asn Ala Val Pro Pro Pro Leu Ala Lys Ala Ile Gly Leu
1850 1855 1860
Glu Ile Lys Leu Cys Met Leu Ala Lys Ala Arg Glu Ser Ala Ser
1865 1870 1875
Ala Lys Ile Lys Glu Glu Glu Ala Ala Lys Asp Gly Gly Gly Gly
1880 1885 1890
Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1895 1900 1905
Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1910 1915 1920
<210> 37
<211> 1986
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 37
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro
1415 1420 1425
Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe
1430 1435 1440
Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile
1445 1450 1455
Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile
1460 1465 1470
Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly
1475 1480 1485
Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro
1490 1495 1500
Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile
1505 1510 1515
Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu
1520 1525 1530
Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu
1535 1540 1545
Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala
1550 1555 1560
Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser
1565 1570 1575
Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg
1580 1585 1590
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu
1595 1600 1605
Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu
1610 1615 1620
His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
1625 1630 1635
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val
1640 1645 1650
Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu
1655 1660 1665
Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met
1670 1675 1680
Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val
1685 1690 1695
Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala
1700 1705 1710
Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser
1715 1720 1725
Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met
1730 1735 1740
Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp Arg Arg Gln
1745 1750 1755
Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys Glu Leu
1760 1765 1770
Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln Leu
1775 1780 1785
Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu
1790 1795 1800
Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu
1805 1810 1815
Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe
1820 1825 1830
His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg
1835 1840 1845
Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu
1850 1855 1860
Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr
1865 1870 1875
Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val
1880 1885 1890
Trp Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val
1895 1900 1905
Ser Glu Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser
1910 1915 1920
Lys Leu Ala Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe
1925 1930 1935
Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr
1940 1945 1950
Ser Ser Leu Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1955 1960 1965
Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
1970 1975 1980
Asp Tyr Ala
1985
<210> 38
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 38
ctggagcccg gcgagaaacc ctacaagtgc cccgagtgcg gcaaatcctt ctctagaagc 60
gacaaactga ccgaacatca gaggacccac accggcgaga agccttataa gtgtcccgaa 120
tgcggcaaat ccttcagcac caagaactct ctgacagaac accagagaac acataccgga 180
gagaaacctt ataaatgccc cgagtgcggc aagtccttct cccagtccgg cgatctgagg 240
agacaccaaa gaacacatac cggcgaaaag ccttacaagt gccccgagtg tggaaagagc 300
ttctccacca ccggcgctct gaccgagcac cagagaacac acaccggcga gaaaccctat 360
aaatgtcccg agtgtggcaa atccttcagc gacagcggca atctgagagt gcaccaaaga 420
acccataccg gcgaaaaacc ctacaaatgc cccgagtgcg gcaaatcctt cagccagagg 480
gcccatctgg agaggcacca aaggacacac accggagaaa agccctacaa gtgtcccgag 540
tgtggaaaaa gctttagcac aagcggcgag ctggtgaggc atcaaaggac ccacaccggc 600
gaaaagccca ccggcaaaaa gaccagc 627
<210> 39
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 39
ctggagcccg gcgagaagcc ctacaagtgc cccgagtgcg gaaagtcctt cagctccccc 60
gccgatctga caagacatca gagaacccat accggcgaga aaccttacaa atgccccgaa 120
tgtggcaagt cctttagcga tcccggacat ctggtgaggc accagaggac acacaccggc 180
gaaaagccct ataaatgtcc cgagtgtgga aagagctttt ctagaagcga caatctcgtg 240
agacaccaga gaacccacac cggagagaag ccttacaagt gccccgagtg cggcaaatcc 300
ttcagccaga gctcctctct ggtgaggcac caaaggaccc acaccggcga gaaaccttat 360
aagtgtcccg agtgtggcaa aagcttcagc acctcccact ctctgaccga gcatcaaaga 420
acccacaccg gcgaaaaacc ttataaatgc cccgagtgtg gcaaatcctt cagcagaaat 480
gacgctctga cagagcacca aagaacacat accggagaaa agccctacaa atgccccgag 540
tgtggaaaat ccttttctag aaacgatgct ctgaccgaac accaaagaac acacaccggc 600
gaaaagccta ccggaaaaaa gaccagc 627
<210> 40
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 40
ctggagcccg gcgaaaaacc ttacaagtgc cccgagtgcg gaaagagctt cagcagaagc 60
gacaaactgg tgaggcatca aaggacacat accggagaga agccctataa gtgccccgaa 120
tgtggcaaat ccttttccca gagggctcat ctggaaagac accagaggac ccataccggc 180
gaaaaaccct acaaatgtcc cgagtgtgga aagagctttt ccgatcccgg ccatctggtc 240
agacatcaga ggacacatac cggcgaaaag ccttacaagt gtcccgaatg cggaaaatcc 300
ttctccagaa gcgacaagct ggtgaggcac caaagaaccc acaccggcga aaaaccctat 360
aaatgccccg agtgcggcaa gtcctttagc cagctggccc atctgagagc ccaccagaga 420
acacacaccg gagagaagcc ttataagtgt cccgagtgcg gaaagtcctt ctctagagcc 480
gacaatctga ccgaacatca aaggacacac accggcgaga aaccttataa atgccccgag 540
tgcggaaaaa gcttttccga ctgcagagat ctggctagac accagagaac ccacaccggc 600
gagaaaccca ccggcaaaaa gaccagc 627
<210> 41
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 41
ctggagcccg gcgaaaagcc ttataaatgt cccgaatgcg gcaagagctt tagccacacc 60
ggccatctgc tggaacacca aaggacccat accggcgaaa agccctataa gtgccccgag 120
tgtggcaaga gcttcagcac caccggcaat ctgacagtcc atcagaggac ccacaccgga 180
gagaaaccct ataaatgccc cgagtgtgga aagtccttct ccgacaagaa ggatctgaca 240
agacaccaga ggacccatac cggcgagaaa ccctacaaat gccccgagtg cggcaaatcc 300
ttctcccaga gcggcgatct gaggagacat caaagaacac ataccggcga aaaaccctat 360
aagtgccccg aatgcggcaa gtccttcagc cagagggccc atctggaaag gcatcagagg 420
acacacaccg gcgagaagcc ttacaaatgt cccgagtgcg gaaagagctt ctctagaagc 480
gacaagctga ccgagcatca gaggacccac accggagaaa aaccttacaa gtgccccgag 540
tgcggcaaaa gcttcagcag aaccgacaca ctgagagatc accaaaggac acacaccggc 600
gagaaaccca ccggcaaaaa gaccagc 627
<210> 42
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 42
ctggagcccg gcgagaagcc ttataagtgc cccgagtgtg gcaagagctt tagccacacc 60
ggccatctgc tggagcatca aaggacacac accggagaaa agccctataa gtgccccgag 120
tgtggcaaat ccttcagcac ctccggcaat ctcaccgaac accagagaac acacaccgga 180
gaaaaacctt acaaatgtcc cgagtgtgga aagagctttt ccaccagcgg caatctggtg 240
agacatcaaa gaacacatac cggcgaaaaa ccctataaat gccccgagtg tggaaaatcc 300
ttctcccaac tggcccatct gagggcccac cagaggacac ataccggaga aaaaccctac 360
aaatgccccg aatgcggaaa aagcttctcc gagagaagcc atctgagaga gcaccaaagg 420
acccataccg gagaaaagcc ttacaagtgt cccgagtgcg gaaaaagctt tagcgatccc 480
ggacatctgg tgagacatca gagaacccac accggcgaaa agccttataa atgtcccgaa 540
tgtggcaagt cctttagcac ccatctggat ctgattagac accaaagaac ccacaccggc 600
gagaaaccca ccggaaaaaa gaccagc 627
<210> 43
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 43
ctggagcccg gcgaaaagcc ttacaaatgt cccgagtgcg gaaagtcctt cagcgacccc 60
ggcgctctgg tgagacatca aagaacacat accggcgaga aaccttataa atgccccgaa 120
tgtggaaaat ccttcagcga aagaagccat ctgagggaac accagaggac ccacaccggc 180
gaaaaacctt ataagtgccc cgaatgcgga aaaagctttt ctagaagcga tcatctgacc 240
aaccatcaga gaacacacac cggcgaaaag ccctataaat gtcccgagtg tggcaaatcc 300
tttagcgaga ggtcccatct gagagagcac cagaggacac ataccggaga gaagccctac 360
aagtgccccg agtgtggcaa gagctttagc agaagcgacc atctgaccaa tcatcaaagg 420
acccacaccg gagagaagcc ttacaagtgt cccgagtgcg gaaagtcctt ttccgatccc 480
ggccacctcg tgaggcacca aagaacccat accggcgaga aaccctacaa atgccccgag 540
tgtggaaaga gcttctccag aagcgacaag ctggtgaggc atcagaggac acacaccggc 600
gaaaaaccca ccggcaagaa aaccagc 627
<210> 44
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 44
ctggagcccg gagagaagcc ctacaaatgc cccgagtgtg gaaagagctt ctctagaaat 60
gacgctctga cagaacacca gaggacccat accggcgaga aaccttacaa atgccccgag 120
tgcggaaaaa gctttagcga ttgcagagat ctggctagac atcagagaac acacaccggc 180
gagaagccct ataagtgccc cgaatgcggc aagagcttta gcgaccccgg ccatctggtg 240
agacatcaaa ggacacatac cggagaaaaa ccttacaagt gccccgagtg cggaaagtcc 300
ttctcccaga gcggccatct caccgagcat caaaggaccc acaccggcga aaagccttat 360
aaatgtcccg aatgtggcaa gtccttctct agagaggata atctgcacac ccatcagagg 420
acccacaccg gcgaaaagcc ttataaatgc cccgaatgtg gaaagtcctt ttccaccaag 480
aactctctga ccgagcatca gaggacacac accggagaga aaccctataa atgtcccgag 540
tgtggcaaga gcttcagcag agccgacaat ctgacagagc accaaagaac acataccggc 600
gaaaagccca ccggcaaaaa gaccagc 627
<210> 45
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 45
ctggagcccg gcgagaaacc ctacaagtgc cccgagtgtg gcaaatcctt ctctagatcc 60
gacaaactga ccgaacatca gaggacccat accggcgaaa aaccttataa atgtcccgag 120
tgcggaaagt ccttctctag aagggacgag ctgaacgtgc atcagagaac acataccggc 180
gagaagccct ataaatgccc cgaatgcggc aaaagcttct ctagaagcga tcatctgacc 240
aaccaccaga gaacccatac cggagaaaag ccttacaagt gtcccgaatg tggaaaatcc 300
ttcagctccc ccgccgatct gaccagacac caaaggaccc acaccggcga gaagccctat 360
aaatgccccg agtgcggcaa gagcttttcc agatccgacc atctgaccaa tcatcaaaga 420
acccacaccg gcgaaaagcc ttataaatgt cccgagtgcg gcaaatcctt ttccagcaag 480
aaggctctga ccgagcatca aaggacccat accggcgaga agccttacaa atgccccgag 540
tgtggaaagt cctttagcac ccatctggat ctgattagac accagaggac acacaccgga 600
gagaaaccca ccggcaaaaa gaccagc 627
<210> 46
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 46
ctggagcccg gcgagaaacc ttacaaatgc cccgagtgcg gcaagagctt cagcagaagc 60
gacgatctgg tgaggcacca aagaacccac accggcgaaa aaccttacaa gtgtcccgaa 120
tgcggaaagt ccttcagcag agaggacaat ctgcacaccc accagagaac acacaccgga 180
gaaaagcctt acaagtgccc cgaatgcggc aaatcctttt ctagaagcga tcatctgacc 240
acccaccaaa gaacacatac cggcgagaag ccttacaaat gtcccgagtg cggaaagtcc 300
ttctcccaga gagccaatct gagggctcat caaaggaccc ataccggcga aaagccctac 360
aaatgccccg agtgcggaaa atccttcagc cagctggccc atctgagagc ccaccaaagg 420
acacacaccg gagagaaacc ctataagtgc cccgagtgtg gaaaaagctt ttcccagagg 480
gccaatctga gggcccatca gaggacccat accggagaga agccttataa atgtcccgag 540
tgcggaaaaa gcttcagcga gaggagccat ctgagggaac atcaaagaac ccacaccggc 600
gaaaaaccca ccggaaaaaa gaccagc 627
<210> 47
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 47
ctggagcccg gcgagaaacc ctacaagtgc cccgagtgtg gaaaaagctt tagccaaagc 60
ggcgatctga ggagacacca aagaacacac accggcgaga agccctacaa atgtcccgag 120
tgcggaaaga gcttcagcca gagcggccat ctgaccgagc atcagagaac ccataccggc 180
gaaaaacctt ataagtgccc cgagtgtgga aagtccttct ccgagagatc ccatctgaga 240
gaacaccaga ggacacacac cggcgaaaaa ccttataagt gtcccgagtg cggaaagtcc 300
ttcagcgatc ccggccatct ggtgagacat caaaggacac ataccggcga aaaaccttat 360
aagtgtcccg aatgcggcaa gagctttagc agaaacgaca cactcaccga acaccagagg 420
acccacaccg gcgagaaacc ctacaaatgc cccgagtgcg gcaaatcctt ttctagagcc 480
gacaatctga ccgaacacca gaggacccat accggagaaa agccttacaa atgtcccgag 540
tgtggcaaat ccttctccac ccatctggat ctgattagac accaaagaac acataccgga 600
gaaaagccca ccggaaaaaa gaccagc 627
<210> 48
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 48
ctggagcccg gcgaaaaacc ctataagtgc cccgaatgtg gaaagagctt cagccatacc 60
ggccatctgc tggaacacca aaggacacac accggcgaga aaccttacaa gtgtcccgag 120
tgcggaaaaa gcttctcctc caaaaaggct ctcaccgagc accagagaac acataccggc 180
gaaaagcctt ataagtgccc cgagtgtggc aaatcctttt ccgactgtag agatctggcc 240
agacatcaaa gaacccacac cggagagaaa ccttataaat gccccgagtg cggcaagtcc 300
tttagccata ccggccatct gctggagcac cagaggaccc ataccggcga gaagccttac 360
aaatgccccg agtgcggcaa aagcttcagc agaaatgacg ctctgaccga gcatcaaagg 420
acccataccg gcgaaaagcc ctacaagtgt cccgagtgtg gaaagtcctt ctcccagagc 480
ggcgatctga ggagacacca gagaacacac accggcgaga aaccctataa atgtcccgag 540
tgcggaaaga gctttagcga cagcggcaat ctgagggtgc atcaaagaac acacaccggc 600
gaaaaaccca ccggaaaaaa gacaagc 627
<210> 49
<211> 538
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 49
caccggcgaa aagccttata agtgccccga gtgcggcaag tccttctcta gaagcgatca 60
cctcaccaat catcagagga cacataccgg agagaagccc tataagtgcc ccgagtgcgg 120
caagagcttt agccagctgg ctcatctgag agctcaccaa agaacccata ccggcgagaa 180
gccttacaaa tgccccgagt gtggaaaatc cttttcccag tccagcaacc tcgtcagaca 240
tcaaaggacc cataccggcg aaaagcctta caagtgtccc gagtgcggaa agtccttctc 300
tagatccgac aacctcgtga ggcaccagag aacccacacc ggcgagaaac cttacaaatg 360
tcccgagtgt ggcaaaagct tttctagaag cgacgagctg gtgagacatc aaagaaccca 420
taccggcgaa aaaccttata agtgtcccga gtgcggcaaa tcctttagcc agctggccca 480
tctgagggcc caccagagaa cacataccgg cgaaaaaccc accggcaaaa agacaagc 538
<210> 50
<211> 4101
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 50
gacaagaagt acagcatcgg cctggccatc ggcaccaaca gcgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaag ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggcgccctg ctgttcgaca gcggcgagac cgccgaggcc 180
acccggctga agcggaccgc ccggcggcgg tacacccggc ggaagaaccg gatctgctac 240
ctgcaggaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccaccggctg 300
gaggagagct tcctggtgga ggaggacaag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gcggaagaag 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct acctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga gaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgagcgccc ggctgagcaa gagccggcgg 660
ctggagaacc tgatcgccca gctgcccggc gagaagaaga acggcctgtt cggcaacctg 720
atcgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggac 780
gccaagctgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgttcctg gccgccaaga acctgagcga cgccatcctg 900
ctgagcgaca tcctgcgggt gaacaccgag atcaccaagg cccccctgag cgccagcatg 960
atcaagcggt acgacgagca ccaccaggac ctgaccctgc tgaaggccct ggtgcggcag 1020
cagctgcccg agaagtacaa ggagatcttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacatcgacg gcggcgccag ccaggaggag ttctacaagt tcatcaagcc catcctggag 1140
aagatggacg gcaccgagga gctgctggtg aagctgaacc gggaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggcga gctgcacgcc 1260
atcctgcggc ggcaggagga cttctacccc ttcctgaagg acaaccggga gaagatcgag 1320
aagatcctga ccttccggat cccctactac gtgggccccc tggcccgggg caacagccgg 1380
ttcgcctgga tgacccggaa atccgaggag accatcaccc cctggaactt cgaggaggtg 1440
gtggacaagg gcgccagcgc ccagagcttc atcgagcgga tgaccaactt cgacaagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtac 1560
aacgagctga ccaaggtgaa gtacgtgacc gagggcatgc ggaagcccgc cttcctgagc 1620
ggcgagcaga agaaggccat cgtggacctg ctgttcaaga ccaaccggaa ggtgaccgtg 1680
aagcagctga aggaggacta cttcaagaag atcgagtgct tcgacagcgt ggagatcagc 1740
ggcgtggagg accggttcaa cgccagcctg ggcacctacc acgacctgct gaagatcatc 1800
aaggacaagg acttcctgga caacgaggag aacgaggaca tcctggagga catcgtgctg 1860
accctgaccc tgttcgagga ccgggagatg atcgaggagc ggctgaaaac ctacgcccac 1920
ctgttcgacg acaaggtgat gaagcagctg aagcggcggc ggtacaccgg ctggggccgg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcaga gcggcaagac catcctggac 2040
ttcctgaaat ccgacggctt cgccaaccgg aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttca aggaggacat ccagaaggcc caggtgagcg gccagggcga cagcctgcac 2160
gagcacatcg ccaacctggc cggcagcccc gccatcaaga agggcatcct gcagaccgtg 2220
aaggtggtgg acgagctggt gaaggtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gagatggccc gggagaacca gaccacccag aagggccaga agaacagccg ggagcggatg 2340
aagcggatcg aggagggcat caaggagctg ggcagccaga tcctgaagga gcaccccgtg 2400
gagaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa cggccgggac 2460
atgtacgtgg accaggagct ggacatcaac cggctgagcg actacgacgt ggccgccatc 2520
gtgccccaga gcttcctgaa ggacgacagc atcgacaaca aggtgctgac ccggagcgac 2580
aaggcccggg gcaagagcga caacgtgccc agcgaggagg tggtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg atcacccagc ggaagttcga caacctgacc 2700
aaggccgagc ggggcggcct gagcgagctg gacaaggccg gcttcatcaa gcggcagctg 2760
gtggagaccc ggcagatcac caagcacgtg gcccagatcc tggacagccg gatgaacacc 2820
aagtacgacg agaacgacaa gctgatccgg gaggtgaagg tgatcaccct gaaatccaag 2880
ctggtgagcg acttccggaa ggacttccag ttctacaagg tgcgggagat caacaactac 2940
caccacgccc acgacgccta cctgaacgcc gtggtgggca ccgccctgat caagaagtac 3000
cccaagctgg agagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga gatcggcaag gccaccgcca agtacttctt ctacagcaac 3120
atcatgaact tcttcaagac cgagatcacc ctggccaacg gcgagatccg gaagcggccc 3180
ctgatcgaga ccaacggcga gaccggcgag atcgtgtggg acaagggccg ggacttcgcc 3240
accgtgcgga aggtgctgag catgccccag gtgaacatcg tgaagaaaac cgaggtgcag 3300
accggcggct tcagcaagga gagcatcctg cccaagcgga acagcgacaa gctgatcgcc 3360
cggaagaagg actgggaccc caagaagtac ggcggcttcg acagccccac cgtggcctac 3420
agcgtgctgg tggtggccaa ggtggagaag ggcaagagca agaagctgaa atccgtgaag 3480
gagctgctgg gcatcaccat catggagcgg agcagcttcg agaagaaccc catcgacttc 3540
ctggaggcca agggctacaa ggaggtgaag aaggacctga tcatcaagct gcccaagtac 3600
agcctgttcg agctggagaa cggccggaag cggatgctgg ccagcgccgg cgagctgcag 3660
aagggcaacg agctggccct gcccagcaag tacgtgaact tcctgtacct ggccagccac 3720
tacgagaagc tgaagggcag ccccgaggac aacgagcaga agcagctgtt cgtggagcag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttcagcaa gcgggtgatc 3840
ctggccgacg ccaacctgga caaggtgctg agcgcctaca acaagcaccg ggacaagccc 3900
atccgggagc aggccgagaa catcatccac ctgttcaccc tgaccaacct gggcgccccc 3960
gccgccttca agtacttcga caccaccatc gaccggaagc ggtacaccag caccaaggag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac ccggatcgac 4080
ctgagccagc tgggcggcga c 4101
<210> 51
<211> 288
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 51
gacgccaaga gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg 60
gacttcaccc gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac 120
gtgatgctgg agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac 180
gtgatcctgc ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag 240
gagacccacc ccgacagcga gaccgccttc gagatcaaga gcagcgtg 288
<210> 52
<211> 1155
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 52
agcaaggtgg agaacaagac caagaagctg cgggtgttcg aggccttcgc cggcatcggc 60
gcccagcgga aggccctgga gaaggtgcgg aaggacgagt acgagatcgt gggcctggcc 120
gagtggtacg tgcccgccat cgtgatgtac caggccatcc acaacaactt ccacaccaag 180
ctggagtaca agagcgtgag ccgggaggag atgatcgact acctggagaa caagaccctg 240
agctggaaca gcaagaaccc cgtgagcaac ggctactgga agcggaagaa ggacgacgag 300
ctgaagatca tctacaacgc catcaagctg agcgagaagg agggcaacat cttcgacatc 360
cgggacctgt acaagcggac cctgaagaac atcgacctgc tgacctacag cttcccctgc 420
caggacctga gccagcaggg catccagaag ggcatgaagc ggggcagcgg cacccggagc 480
ggcctgctgt gggagatcga gcgggccctg gacagcaccg agaagaacga cctgcccaag 540
tacctgctga tggagaacgt gggcgccctg ctgcacaaga agaacgagga ggagctgaac 600
cagtggaagc agaagctgga gagcctgggc taccagaaca gcatcgaggt gctgaacgcc 660
gccgacttcg gcagcagcca ggcccggcgg cgggtgttca tgatcagcac cctgaacgag 720
ttcgtggagc tgcccaaggg cgacaagaag cccaagagca tcaagaaggt gctgaacaag 780
atcgtgagcg agaaggacat cctgaacaac ctgctgaagt acaacctgac cgagttcaag 840
aaaaccaaga gcaacatcaa caaggccagc ctgatcggct acagcaagtt caacagcgag 900
ggctacgtgt acgaccccga gttcaccggc cccaccctga ccgccagcgg cgccaacagc 960
cggatcaaga tcaaggacgg cagcaacatc cggaagatga acagcgacga gaccttcctg 1020
tacatcggct tcgacagcca ggacggcaag cgggtgaacg agatcgagtt cctgaccgag 1080
aaccagaaga tcttcgtgtg cggcaacagc atcagcgtgg aggtgctgga ggccatcatc 1140
gacaagatcg gcggc 1155
<210> 53
<211> 1440
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 53
gtggatctga ggacactcga cgtgtttagc ggatgcggcg gactctccga aggcttccac 60
caagccggaa tttccgacac actctgggcc attgagatgt gggaccccgc cgctcaagcc 120
ttcagactga ataatcccgg ctccaccgtg ttcaccgagg actgcaacat tctgctgaag 180
ctggtgatgg ctggcgaaac caccaactct agaggccaga ggctgcccca gaagggagat 240
gtggaaatgc tctgtggagg ccctccttgc caaggcttct ccggcatgaa caggttcaac 300
tctagaacat acagcaagtt caagaactct ctggtcgtga gctttctgag ctactgcgac 360
tactatagac ctaggttctt tctgctggag aacgtgagaa atttcgtgtc cttcaagagg 420
agcatggtgc tgaagctgac actgaggtgt ctggtgagga tgggctacca gtgcacattc 480
ggagtgctgc aagctggcca gtacggcgtg gcccagacca gaaggagggc catcattctg 540
gctgctgccc ccggcgagaa actccctctg ttccccgagc ccctccacgt gttcgcccct 600
agagcttgcc agctgagcgt ggtggtcgac gataagaagt tcgtgagcaa catcacaagg 660
ctgtccagcg gacccttcag aaccattacc gtgagggata ccatgtccga cctccccgag 720
gtgaggaatg gcgccagcgc tctggagatt tcctacaacg gcgaacctca gagctggttc 780
caaaggcagc tgagaggcgc tcagtatcag cccattctga gggaccacat ctgcaaagat 840
atgagcgctc tggtggccgc tagaatgaga catattcctc tggcccccgg cagcgactgg 900
agagatctgc ccaatattga ggtgagactc agcgacggaa caatggctag aaaactgagg 960
tacacccatc atgatagaaa gaacggaagg agcagcagcg gcgctctgag aggagtgtgt 1020
agctgcgtgg aagctggcaa ggcttgcgat cccgccgcta ggcagttcaa taccctcatc 1080
ccttggtgtc tgcctcacac cggcaacaga cacaatcatt gggctggact gtatggaagg 1140
ctcgaatggg acggcttttt cagcaccacc gtgaccaatc ccgaacctat gggcaagcaa 1200
ggaagggtgc tccaccccga gcagcataga gtcgtgtccg tgagagaatg cgctagaagc 1260
caaggcttcc ccgacaccta tagactgttc ggcaacattc tggataagca cagacaagtg 1320
ggaaatgctg tccctcctcc tctggccaag gctatcggac tggagatcaa gctgtgtatg 1380
ctcgccaaag ctagggagag cgcttccgcc aagattaagg aggaggaggc cgccaaggac 1440
<210> 54
<211> 1626
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 54
aaccacgacc aggagttcga cccccccaag gtgtaccccc ccgtgcccgc cgagaagcgg 60
aagcccatcc gggtgctgag cctgttcgac ggcatcgcca ccggcctgct ggtgctgaag 120
gacctgggca tccaggtgga ccggtacatc gccagcgagg tgtgcgagga cagcatcacc 180
gtgggcatgg tgcggcacca gggcaagatc atgtacgtgg gcgacgtgcg gagcgtgacc 240
cagaagcaca tccaggagtg gggccccttc gacctggtga tcggcggcag cccctgcaac 300
gacctgagca tcgtgaaccc cgcccggaag ggcctgtacg agggcaccgg ccggctgttc 360
ttcgagttct accggctgct gcacgacgcc cggcccaagg agggcgacga ccggcccttc 420
ttctggctgt tcgagaacgt ggtggccatg ggcgtgagcg acaagcggga catcagccgg 480
ttcctggaga gcaaccccgt gatgatcgac gccaaggagg tgagcgccgc ccaccgggcc 540
cggtacttct ggggcaacct gcccggcatg aaccggcccc tggccagcac cgtgaacgac 600
aagctggagc tgcaggagtg cctggagcac ggccggatcg ccaagttcag caaggtgcgg 660
accatcacca cccggagcaa cagcatcaag cagggcaagg accagcactt ccccgtgttc 720
atgaacgaga aggaggacat cctgtggtgc accgagatgg agcgggtgtt cggcttcccc 780
gtgcactaca ccgacgtgag caacatgagc cggctggccc ggcagcggct gctgggccgg 840
agctggagcg tgcccgtgat ccggcacctg ttcgcccccc tgaaggagta cttcgcctgc 900
gtgagcagcg gcaacagcaa cgccaacagc cggggcccca gcttcagcag cggcctggtg 960
cccctgagcc tgcggggcag ccacatgaat cctctggaga tgttcgagac agtgcccgtg 1020
tggagaaggc aacccgtgag ggtgctgagc ctcttcgagg acattaagaa ggagctgacc 1080
tctctgggct ttctggaatc cggcagcgac cccggccagc tgaaacacgt ggtggacgtg 1140
accgacacag tgaggaagga cgtggaagag tggggcccct ttgacctcgt gtatggagcc 1200
acacctcctc tcggccacac atgcgatagg cctcccagct ggtatctctt ccagttccac 1260
agactgctcc agtacgccag acctaagccc ggcagcccca gacccttctt ctggatgttc 1320
gtggacaatc tggtgctgaa caaggaggat ctggatgtgg ccagcagatt tctggagatg 1380
gaacccgtga caatccccga cgtgcatggc ggctctctgc agaacgccgt gagagtgtgg 1440
tccaacatcc ccgccattag aagcagacac tgggctctgg tgagcgagga ggaactgtct 1500
ctgctggccc agaataagca gtcctccaag ctggccgcca agtggcccac caagctggtg 1560
aagaactgct ttctgcctct gagggagtat ttcaagtatt tcagcaccga actgaccagc 1620
agcctg 1626
<210> 55
<211> 1345
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 55
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgagaa accctacaag tgccccgagt gcggcaaatc cttctctaga agcgacaaac 180
tgaccgaaca tcagaggacc cacaccggcg agaagcctta taagtgtccc gaatgcggca 240
aatccttcag caccaagaac tctctgacag aacaccagag aacacatacc ggagagaaac 300
cttataaatg ccccgagtgc ggcaagtcct tctcccagtc cggcgatctg aggagacacc 360
aaagaacaca taccggcgaa aagccttaca agtgccccga gtgtggaaag agcttctcca 420
ccaccggcgc tctgaccgag caccagagaa cacacaccgg cgagaaaccc tataaatgtc 480
ccgagtgtgg caaatccttc agcgacagcg gcaatctgag agtgcaccaa agaacccata 540
ccggcgaaaa accctacaaa tgccccgagt gcggcaaatc cttcagccag agggcccatc 600
tggagaggca ccaaaggaca cacaccggag aaaagcccta caagtgtccc gagtgtggaa 660
aaagctttag cacaagcggc gagctggtga ggcatcaaag gacccacacc ggcgaaaagc 720
ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780
gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840
gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900
agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960
ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020
ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaa 1345
<210> 56
<211> 1345
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 56
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgagaa gccctacaag tgccccgagt gcggaaagtc cttcagctcc cccgccgatc 180
tgacaagaca tcagagaacc cataccggcg agaaacctta caaatgcccc gaatgtggca 240
agtcctttag cgatcccgga catctggtga ggcaccagag gacacacacc ggcgaaaagc 300
cctataaatg tcccgagtgt ggaaagagct tttctagaag cgacaatctc gtgagacacc 360
agagaaccca caccggagag aagccttaca agtgccccga gtgcggcaaa tccttcagcc 420
agagctcctc tctggtgagg caccaaagga cccacaccgg cgagaaacct tataagtgtc 480
ccgagtgtgg caaaagcttc agcacctccc actctctgac cgagcatcaa agaacccaca 540
ccggcgaaaa accttataaa tgccccgagt gtggcaaatc cttcagcaga aatgacgctc 600
tgacagagca ccaaagaaca cataccggag aaaagcccta caaatgcccc gagtgtggaa 660
aatccttttc tagaaacgat gctctgaccg aacaccaaag aacacacacc ggcgaaaagc 720
ctaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780
gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840
gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900
agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960
ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020
ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaa 1345
<210> 57
<211> 1345
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 57
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa accttacaag tgccccgagt gcggaaagag cttcagcaga agcgacaaac 180
tggtgaggca tcaaaggaca cataccggag agaagcccta taagtgcccc gaatgtggca 240
aatccttttc ccagagggct catctggaaa gacaccagag gacccatacc ggcgaaaaac 300
cctacaaatg tcccgagtgt ggaaagagct tttccgatcc cggccatctg gtcagacatc 360
agaggacaca taccggcgaa aagccttaca agtgtcccga atgcggaaaa tccttctcca 420
gaagcgacaa gctggtgagg caccaaagaa cccacaccgg cgaaaaaccc tataaatgcc 480
ccgagtgcgg caagtccttt agccagctgg cccatctgag agcccaccag agaacacaca 540
ccggagagaa gccttataag tgtcccgagt gcggaaagtc cttctctaga gccgacaatc 600
tgaccgaaca tcaaaggaca cacaccggcg agaaacctta taaatgcccc gagtgcggaa 660
aaagcttttc cgactgcaga gatctggcta gacaccagag aacccacacc ggcgagaaac 720
ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780
gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840
gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900
agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960
ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020
ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaa 1345
<210> 58
<211> 1345
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 58
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa gccttataaa tgtcccgaat gcggcaagag ctttagccac accggccatc 180
tgctggaaca ccaaaggacc cataccggcg aaaagcccta taagtgcccc gagtgtggca 240
agagcttcag caccaccggc aatctgacag tccatcagag gacccacacc ggagagaaac 300
cctataaatg ccccgagtgt ggaaagtcct tctccgacaa gaaggatctg acaagacacc 360
agaggaccca taccggcgag aaaccctaca aatgccccga gtgcggcaaa tccttctccc 420
agagcggcga tctgaggaga catcaaagaa cacataccgg cgaaaaaccc tataagtgcc 480
ccgaatgcgg caagtccttc agccagaggg cccatctgga aaggcatcag aggacacaca 540
ccggcgagaa gccttacaaa tgtcccgagt gcggaaagag cttctctaga agcgacaagc 600
tgaccgagca tcagaggacc cacaccggag aaaaacctta caagtgcccc gagtgcggca 660
aaagcttcag cagaaccgac acactgagag atcaccaaag gacacacacc ggcgagaaac 720
ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780
gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840
gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900
agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960
ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020
ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaa 1345
<210> 59
<211> 1345
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 59
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgagaa gccttataag tgccccgagt gtggcaagag ctttagccac accggccatc 180
tgctggagca tcaaaggaca cacaccggag aaaagcccta taagtgcccc gagtgtggca 240
aatccttcag cacctccggc aatctcaccg aacaccagag aacacacacc ggagaaaaac 300
cttacaaatg tcccgagtgt ggaaagagct tttccaccag cggcaatctg gtgagacatc 360
aaagaacaca taccggcgaa aaaccctata aatgccccga gtgtggaaaa tccttctccc 420
aactggccca tctgagggcc caccagagga cacataccgg agaaaaaccc tacaaatgcc 480
ccgaatgcgg aaaaagcttc tccgagagaa gccatctgag agagcaccaa aggacccata 540
ccggagaaaa gccttacaag tgtcccgagt gcggaaaaag ctttagcgat cccggacatc 600
tggtgagaca tcagagaacc cacaccggcg aaaagcctta taaatgtccc gaatgtggca 660
agtcctttag cacccatctg gatctgatta gacaccaaag aacccacacc ggcgagaaac 720
ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780
gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840
gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900
agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960
ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020
ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaa 1345
<210> 60
<211> 1345
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 60
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa gccttacaaa tgtcccgagt gcggaaagtc cttcagcgac cccggcgctc 180
tggtgagaca tcaaagaaca cataccggcg agaaacctta taaatgcccc gaatgtggaa 240
aatccttcag cgaaagaagc catctgaggg aacaccagag gacccacacc ggcgaaaaac 300
cttataagtg ccccgaatgc ggaaaaagct tttctagaag cgatcatctg accaaccatc 360
agagaacaca caccggcgaa aagccctata aatgtcccga gtgtggcaaa tcctttagcg 420
agaggtccca tctgagagag caccagagga cacataccgg agagaagccc tacaagtgcc 480
ccgagtgtgg caagagcttt agcagaagcg accatctgac caatcatcaa aggacccaca 540
ccggagagaa gccttacaag tgtcccgagt gcggaaagtc cttttccgat cccggccacc 600
tcgtgaggca ccaaagaacc cataccggcg agaaacccta caaatgcccc gagtgtggaa 660
agagcttctc cagaagcgac aagctggtga ggcatcagag gacacacacc ggcgaaaaac 720
ccaccggcaa gaaaaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780
gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840
gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900
agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960
ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020
ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaa 1345
<210> 61
<211> 2227
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 61
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggagagaa gccctacaaa tgccccgagt gtggaaagag cttctctaga aatgacgctc 180
tgacagaaca ccagaggacc cataccggcg agaaacctta caaatgcccc gagtgcggaa 240
aaagctttag cgattgcaga gatctggcta gacatcagag aacacacacc ggcgagaagc 300
cctataagtg ccccgaatgc ggcaagagct ttagcgaccc cggccatctg gtgagacatc 360
aaaggacaca taccggagaa aaaccttaca agtgccccga gtgcggaaag tccttctccc 420
agagcggcca tctcaccgag catcaaagga cccacaccgg cgaaaagcct tataaatgtc 480
ccgaatgtgg caagtccttc tctagagagg ataatctgca cacccatcag aggacccaca 540
ccggcgaaaa gccttataaa tgccccgaat gtggaaagtc cttttccacc aagaactctc 600
tgaccgagca tcagaggaca cacaccggag agaaacccta taaatgtccc gagtgtggca 660
agagcttcag cagagccgac aatctgacag agcaccaaag aacacatacc ggcgaaaagc 720
ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780
gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840
cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900
agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960
tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020
gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080
tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200
aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260
gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320
acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380
agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440
ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500
tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560
tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620
aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680
gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740
ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800
acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860
accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920
acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980
aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040
cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100
cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaa 2227
<210> 62
<211> 2227
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 62
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgagaa accctacaag tgccccgagt gtggcaaatc cttctctaga tccgacaaac 180
tgaccgaaca tcagaggacc cataccggcg aaaaacctta taaatgtccc gagtgcggaa 240
agtccttctc tagaagggac gagctgaacg tgcatcagag aacacatacc ggcgagaagc 300
cctataaatg ccccgaatgc ggcaaaagct tctctagaag cgatcatctg accaaccacc 360
agagaaccca taccggagaa aagccttaca agtgtcccga atgtggaaaa tccttcagct 420
cccccgccga tctgaccaga caccaaagga cccacaccgg cgagaagccc tataaatgcc 480
ccgagtgcgg caagagcttt tccagatccg accatctgac caatcatcaa agaacccaca 540
ccggcgaaaa gccttataaa tgtcccgagt gcggcaaatc cttttccagc aagaaggctc 600
tgaccgagca tcaaaggacc cataccggcg agaagcctta caaatgcccc gagtgtggaa 660
agtcctttag cacccatctg gatctgatta gacaccagag gacacacacc ggagagaaac 720
ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780
gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840
cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900
agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960
tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020
gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080
tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200
aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260
gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320
acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380
agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440
ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500
tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560
tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620
aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680
gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740
ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800
acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860
accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920
acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980
aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040
cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100
cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaa 2227
<210> 63
<211> 2227
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 63
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgagaa accttacaaa tgccccgagt gcggcaagag cttcagcaga agcgacgatc 180
tggtgaggca ccaaagaacc cacaccggcg aaaaacctta caagtgtccc gaatgcggaa 240
agtccttcag cagagaggac aatctgcaca cccaccagag aacacacacc ggagaaaagc 300
cttacaagtg ccccgaatgc ggcaaatcct tttctagaag cgatcatctg accacccacc 360
aaagaacaca taccggcgag aagccttaca aatgtcccga gtgcggaaag tccttctccc 420
agagagccaa tctgagggct catcaaagga cccataccgg cgaaaagccc tacaaatgcc 480
ccgagtgcgg aaaatccttc agccagctgg cccatctgag agcccaccaa aggacacaca 540
ccggagagaa accctataag tgccccgagt gtggaaaaag cttttcccag agggccaatc 600
tgagggccca tcagaggacc cataccggag agaagcctta taaatgtccc gagtgcggaa 660
aaagcttcag cgagaggagc catctgaggg aacatcaaag aacccacacc ggcgaaaaac 720
ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780
gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840
cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900
agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960
tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020
gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080
tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200
aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260
gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320
acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380
agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440
ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500
tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560
tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620
aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680
gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740
ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800
acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860
accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920
acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980
aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040
cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100
cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaa 2227
<210> 64
<211> 2080
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 64
agtgtggaaa aagctttagc caaagcggcg atctgaggag acaccaaaga acacacaccg 60
gcgagaagcc ctacaaatgt cccgagtgcg gaaagagctt cagccagagc ggccatctga 120
ccgagcatca gagaacccat accggcgaaa aaccttataa gtgccccgag tgtggaaagt 180
ccttctccga gagatcccat ctgagagaac accagaggac acacaccggc gaaaaacctt 240
ataagtgtcc cgagtgcgga aagtccttca gcgatcccgg ccatctggtg agacatcaaa 300
ggacacatac cggcgaaaaa ccttataagt gtcccgaatg cggcaagagc tttagcagaa 360
acgacacact caccgaacac cagaggaccc acaccggcga gaaaccctac aaatgccccg 420
agtgcggcaa atccttttct agagccgaca atctgaccga acaccagagg acccataccg 480
gagaaaagcc ttacaaatgt cccgagtgtg gcaaatcctt ctccacccat ctggatctga 540
ttagacacca aagaacacat accggagaaa agcccaccgg aaaaaagacc agcgctagcg 600
gcagcggcgg cggcagcggc ggcgcccggg acagcaaggt ggagaacaag accaagaagc 660
tgcgggtgtt cgaggccttc gccggcatcg gcgcccagcg gaaggccctg gagaaggtgc 720
ggaaggacga gtacgagatc gtgggcctgg ccgagtggta cgtgcccgcc atcgtgatgt 780
accaggccat ccacaacaac ttccacacca agctggagta caagagcgtg agccgggagg 840
agatgatcga ctacctggag aacaagaccc tgagctggaa cagcaagaac cccgtgagca 900
acggctactg gaagcggaag aaggacgacg agctgaagat catctacaac gccatcaagc 960
tgagcgagaa ggagggcaac atcttcgaca tccgggacct gtacaagcgg accctgaaga 1020
acatcgacct gctgacctac agcttcccct gccaggacct gagccagcag ggcatccaga 1080
agggcatgaa gcggggcagc ggcacccgga gcggcctgct gtgggagatc gagcgggccc 1140
tggacagcac cgagaagaac gacctgccca agtacctgct gatggagaac gtgggcgccc 1200
tgctgcacaa gaagaacgag gaggagctga accagtggaa gcagaagctg gagagcctgg 1260
gctaccagaa cagcatcgag gtgctgaacg ccgccgactt cggcagcagc caggcccggc 1320
ggcgggtgtt catgatcagc accctgaacg agttcgtgga gctgcccaag ggcgacaaga 1380
agcccaagag catcaagaag gtgctgaaca agatcgtgag cgagaaggac atcctgaaca 1440
acctgctgaa gtacaacctg accgagttca agaaaaccaa gagcaacatc aacaaggcca 1500
gcctgatcgg ctacagcaag ttcaacagcg agggctacgt gtacgacccc gagttcaccg 1560
gccccaccct gaccgccagc ggcgccaaca gccggatcaa gatcaaggac ggcagcaaca 1620
tccggaagat gaacagcgac gagaccttcc tgtacatcgg cttcgacagc caggacggca 1680
agcgggtgaa cgagatcgag ttcctgaccg agaaccagaa gatcttcgtg tgcggcaaca 1740
gcatcagcgt ggaggtgctg gaggccatca tcgacaagat cggcggcccc agcagcggcg 1800
gcaagcggcc cgccgccacc aagaaggccg gccaggccaa gaagaagaag ggcagctacc 1860
cctacgacgt gcccgactac gcctgagcgg ccgcttaatt aagctgcctt ctgcggggct 1920
tgccttctgg ccatgccctt cttctctccc ttgcacctgt acctcttggt ctttgaataa 1980
agcctgagta ggaagtctag aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2040
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2080
<210> 65
<211> 1929
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 65
gccttataag tgccccgagt gtggcaaatc cttttccgac tgtagagatc tggccagaca 60
tcaaagaacc cacaccggag agaaacctta taaatgcccc gagtgcggca agtcctttag 120
ccataccggc catctgctgg agcaccagag gacccatacc ggcgagaagc cttacaaatg 180
ccccgagtgc ggcaaaagct tcagcagaaa tgacgctctg accgagcatc aaaggaccca 240
taccggcgaa aagccctaca agtgtcccga gtgtggaaag tccttctccc agagcggcga 300
tctgaggaga caccagagaa cacacaccgg cgagaaaccc tataaatgtc ccgagtgcgg 360
aaagagcttt agcgacagcg gcaatctgag ggtgcatcaa agaacacaca ccggcgaaaa 420
acccaccgga aaaaagacaa gcgctagcgg cagcggcggc ggcagcggcg gcgcccggga 480
cagcaaggtg gagaacaaga ccaagaagct gcgggtgttc gaggccttcg ccggcatcgg 540
cgcccagcgg aaggccctgg agaaggtgcg gaaggacgag tacgagatcg tgggcctggc 600
cgagtggtac gtgcccgcca tcgtgatgta ccaggccatc cacaacaact tccacaccaa 660
gctggagtac aagagcgtga gccgggagga gatgatcgac tacctggaga acaagaccct 720
gagctggaac agcaagaacc ccgtgagcaa cggctactgg aagcggaaga aggacgacga 780
gctgaagatc atctacaacg ccatcaagct gagcgagaag gagggcaaca tcttcgacat 840
ccgggacctg tacaagcgga ccctgaagaa catcgacctg ctgacctaca gcttcccctg 900
ccaggacctg agccagcagg gcatccagaa gggcatgaag cggggcagcg gcacccggag 960
cggcctgctg tgggagatcg agcgggccct ggacagcacc gagaagaacg acctgcccaa 1020
gtacctgctg atggagaacg tgggcgccct gctgcacaag aagaacgagg aggagctgaa 1080
ccagtggaag cagaagctgg agagcctggg ctaccagaac agcatcgagg tgctgaacgc 1140
cgccgacttc ggcagcagcc aggcccggcg gcgggtgttc atgatcagca ccctgaacga 1200
gttcgtggag ctgcccaagg gcgacaagaa gcccaagagc atcaagaagg tgctgaacaa 1260
gatcgtgagc gagaaggaca tcctgaacaa cctgctgaag tacaacctga ccgagttcaa 1320
gaaaaccaag agcaacatca acaaggccag cctgatcggc tacagcaagt tcaacagcga 1380
gggctacgtg tacgaccccg agttcaccgg ccccaccctg accgccagcg gcgccaacag 1440
ccggatcaag atcaaggacg gcagcaacat ccggaagatg aacagcgacg agaccttcct 1500
gtacatcggc ttcgacagcc aggacggcaa gcgggtgaac gagatcgagt tcctgaccga 1560
gaaccagaag atcttcgtgt gcggcaacag catcagcgtg gaggtgctgg aggccatcat 1620
cgacaagatc ggcggcccca gcagcggcgg caagcggccc gccgccacca agaaggccgg 1680
ccaggccaag aagaagaagg gcagctaccc ctacgacgtg cccgactacg cctgagcggc 1740
cgcttaatta agctgccttc tgcggggctt gccttctggc catgcccttc ttctctccct 1800
tgcacctgta cctcttggtc tttgaataaa gcctgagtag gaagtctaga aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920
aaaaaaaaa 1929
<210> 66
<211> 1779
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 66
gacccatacc ggcgaaaagc cttacaagtg tcccgagtgc ggaaagtcct tctctagatc 60
cgacaacctc gtgaggcacc agagaaccca caccggcgag aaaccttaca aatgtcccga 120
gtgtggcaaa agcttttcta gaagcgacga gctggtgaga catcaaagaa cccataccgg 180
cgaaaaacct tataagtgtc ccgagtgcgg caaatccttt agccagctgg cccatctgag 240
ggcccaccag agaacacata ccggcgaaaa acccaccggc aaaaagacaa gcgctagcgg 300
cagcggcggc ggcagcggcg gcgcccggga cagcaaggtg gagaacaaga ccaagaagct 360
gcgggtgttc gaggccttcg ccggcatcgg cgcccagcgg aaggccctgg agaaggtgcg 420
gaaggacgag tacgagatcg tgggcctggc cgagtggtac gtgcccgcca tcgtgatgta 480
ccaggccatc cacaacaact tccacaccaa gctggagtac aagagcgtga gccgggagga 540
gatgatcgac tacctggaga acaagaccct gagctggaac agcaagaacc ccgtgagcaa 600
cggctactgg aagcggaaga aggacgacga gctgaagatc atctacaacg ccatcaagct 660
gagcgagaag gagggcaaca tcttcgacat ccgggacctg tacaagcgga ccctgaagaa 720
catcgacctg ctgacctaca gcttcccctg ccaggacctg agccagcagg gcatccagaa 780
gggcatgaag cggggcagcg gcacccggag cggcctgctg tgggagatcg agcgggccct 840
ggacagcacc gagaagaacg acctgcccaa gtacctgctg atggagaacg tgggcgccct 900
gctgcacaag aagaacgagg aggagctgaa ccagtggaag cagaagctgg agagcctggg 960
ctaccagaac agcatcgagg tgctgaacgc cgccgacttc ggcagcagcc aggcccggcg 1020
gcgggtgttc atgatcagca ccctgaacga gttcgtggag ctgcccaagg gcgacaagaa 1080
gcccaagagc atcaagaagg tgctgaacaa gatcgtgagc gagaaggaca tcctgaacaa 1140
cctgctgaag tacaacctga ccgagttcaa gaaaaccaag agcaacatca acaaggccag 1200
cctgatcggc tacagcaagt tcaacagcga gggctacgtg tacgaccccg agttcaccgg 1260
ccccaccctg accgccagcg gcgccaacag ccggatcaag atcaaggacg gcagcaacat 1320
ccggaagatg aacagcgacg agaccttcct gtacatcggc ttcgacagcc aggacggcaa 1380
gcgggtgaac gagatcgagt tcctgaccga gaaccagaag atcttcgtgt gcggcaacag 1440
catcagcgtg gaggtgctgg aggccatcat cgacaagatc ggcggcccca gcagcggcgg 1500
caagcggccc gccgccacca agaaggccgg ccaggccaag aagaagaagg gcagctaccc 1560
ctacgacgtg cccgactacg cctgagcggc cgcttaatta agctgccttc tgcggggctt 1620
gccttctggc catgcccttc ttctctccct tgcacctgta cctcttggtc tttgaataaa 1680
gcctgagtag gaagtctaga aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 1779
<210> 67
<211> 4829
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 67
aaggaaataa gagagaaaag aagagtaaga agaaatataa gagccaccat ggcccccaag 60
aagaagcgga aggtgggcat ccacggcgtg cccgccgccg acaagaagta cagcatcggc 120
ctggccatcg gcaccaacag cgtgggctgg gccgtgatca ccgacgagta caaggtgccc 180
agcaagaagt tcaaggtgct gggcaacacc gaccggcaca gcatcaagaa gaacctgatc 240
ggcgccctgc tgttcgacag cggcgagacc gccgaggcca cccggctgaa gcggaccgcc 300
cggcggcggt acacccggcg gaagaaccgg atctgctacc tgcaggagat cttcagcaac 360
gagatggcca aggtggacga cagcttcttc caccggctgg aggagagctt cctggtggag 420
gaggacaaga agcacgagcg gcaccccatc ttcggcaaca tcgtggacga ggtggcctac 480
cacgagaagt accccaccat ctaccacctg cggaagaagc tggtggacag caccgacaag 540
gccgacctgc ggctgatcta cctggccctg gcccacatga tcaagttccg gggccacttc 600
ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg acaagctgtt catccagctg 660
gtgcagacct acaaccagct gttcgaggag aaccccatca acgccagcgg cgtggacgcc 720
aaggccatcc tgagcgcccg gctgagcaag agccggcggc tggagaacct gatcgcccag 780
ctgcccggcg agaagaagaa cggcctgttc ggcaacctga tcgccctgag cctgggcctg 840
acccccaact tcaagagcaa cttcgacctg gccgaggacg ccaagctgca gctgagcaag 900
gacacctacg acgacgacct ggacaacctg ctggcccaga tcggcgacca gtacgccgac 960
ctgttcctgg ccgccaagaa cctgagcgac gccatcctgc tgagcgacat cctgcgggtg 1020
aacaccgaga tcaccaaggc ccccctgagc gccagcatga tcaagcggta cgacgagcac 1080
caccaggacc tgaccctgct gaaggccctg gtgcggcagc agctgcccga gaagtacaag 1140
gagatcttct tcgaccagag caagaacggc tacgccggct acatcgacgg cggcgccagc 1200
caggaggagt tctacaagtt catcaagccc atcctggaga agatggacgg caccgaggag 1260
ctgctggtga agctgaaccg ggaggacctg ctgcggaagc agcggacctt cgacaacggc 1320
agcatccccc accagatcca cctgggcgag ctgcacgcca tcctgcggcg gcaggaggac 1380
ttctacccct tcctgaagga caaccgggag aagatcgaga agatcctgac cttccggatc 1440
ccctactacg tgggccccct ggcccggggc aacagccggt tcgcctggat gacccggaaa 1500
tccgaggaga ccatcacccc ctggaacttc gaggaggtgg tggacaaggg cgccagcgcc 1560
cagagcttca tcgagcggat gaccaacttc gacaagaacc tgcccaacga gaaggtgctg 1620
cccaagcaca gcctgctgta cgagtacttc accgtgtaca acgagctgac caaggtgaag 1680
tacgtgaccg agggcatgcg gaagcccgcc ttcctgagcg gcgagcagaa gaaggccatc 1740
gtggacctgc tgttcaagac caaccggaag gtgaccgtga agcagctgaa ggaggactac 1800
ttcaagaaga tcgagtgctt cgacagcgtg gagatcagcg gcgtggagga ccggttcaac 1860
gccagcctgg gcacctacca cgacctgctg aagatcatca aggacaagga cttcctggac 1920
aacgaggaga acgaggacat cctggaggac atcgtgctga ccctgaccct gttcgaggac 1980
cgggagatga tcgaggagcg gctgaaaacc tacgcccacc tgttcgacga caaggtgatg 2040
aagcagctga agcggcggcg gtacaccggc tggggccggc tgagccggaa gctgatcaac 2100
ggcatccggg acaagcagag cggcaagacc atcctggact tcctgaaatc cgacggcttc 2160
gccaaccgga acttcatgca gctgatccac gacgacagcc tgaccttcaa ggaggacatc 2220
cagaaggccc aggtgagcgg ccagggcgac agcctgcacg agcacatcgc caacctggcc 2280
ggcagccccg ccatcaagaa gggcatcctg cagaccgtga aggtggtgga cgagctggtg 2340
aaggtgatgg gccggcacaa gcccgagaac atcgtgatcg agatggcccg ggagaaccag 2400
accacccaga agggccagaa gaacagccgg gagcggatga agcggatcga ggagggcatc 2460
aaggagctgg gcagccagat cctgaaggag caccccgtgg agaacaccca gctgcagaac 2520
gagaagctgt acctgtacta cctgcagaac ggccgggaca tgtacgtgga ccaggagctg 2580
gacatcaacc ggctgagcga ctacgacgtg gccgccatcg tgccccagag cttcctgaag 2640
gacgacagca tcgacaacaa ggtgctgacc cggagcgaca aggcccgggg caagagcgac 2700
aacgtgccca gcgaggaggt ggtgaagaag atgaagaact actggcggca gctgctgaac 2760
gccaagctga tcacccagcg gaagttcgac aacctgacca aggccgagcg gggcggcctg 2820
agcgagctgg acaaggccgg cttcatcaag cggcagctgg tggagacccg gcagatcacc 2880
aagcacgtgg cccagatcct ggacagccgg atgaacacca agtacgacga gaacgacaag 2940
ctgatccggg aggtgaaggt gatcaccctg aaatccaagc tggtgagcga cttccggaag 3000
gacttccagt tctacaaggt gcgggagatc aacaactacc accacgccca cgacgcctac 3060
ctgaacgccg tggtgggcac cgccctgatc aagaagtacc ccaagctgga gagcgagttc 3120
gtgtacggcg actacaaggt gtacgacgtg cggaagatga tcgccaagag cgagcaggag 3180
atcggcaagg ccaccgccaa gtacttcttc tacagcaaca tcatgaactt cttcaagacc 3240
gagatcaccc tggccaacgg cgagatccgg aagcggcccc tgatcgagac caacggcgag 3300
accggcgaga tcgtgtggga caagggccgg gacttcgcca ccgtgcggaa ggtgctgagc 3360
atgccccagg tgaacatcgt gaagaaaacc gaggtgcaga ccggcggctt cagcaaggag 3420
agcatcctgc ccaagcggaa cagcgacaag ctgatcgccc ggaagaagga ctgggacccc 3480
aagaagtacg gcggcttcga cagccccacc gtggcctaca gcgtgctggt ggtggccaag 3540
gtggagaagg gcaagagcaa gaagctgaaa tccgtgaagg agctgctggg catcaccatc 3600
atggagcgga gcagcttcga gaagaacccc atcgacttcc tggaggccaa gggctacaag 3660
gaggtgaaga aggacctgat catcaagctg cccaagtaca gcctgttcga gctggagaac 3720
ggccggaagc ggatgctggc cagcgccggc gagctgcaga agggcaacga gctggccctg 3780
cccagcaagt acgtgaactt cctgtacctg gccagccact acgagaagct gaagggcagc 3840
cccgaggaca acgagcagaa gcagctgttc gtggagcagc acaagcacta cctggacgag 3900
atcatcgagc agatcagcga gttcagcaag cgggtgatcc tggccgacgc caacctggac 3960
aaggtgctga gcgcctacaa caagcaccgg gacaagccca tccgggagca ggccgagaac 4020
atcatccacc tgttcaccct gaccaacctg ggcgcccccg ccgccttcaa gtacttcgac 4080
accaccatcg accggaagcg gtacaccagc accaaggagg tgctggacgc caccctgatc 4140
caccagagca tcaccggcct gtacgagacc cggatcgacc tgagccagct gggcggcgac 4200
aagcggcccg ccgccaccaa gaaggccggc caggccaaga agaagaaggc cagcgacgcc 4260
aagagcctga ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc 4320
acccgggagg agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg 4380
ctggagaact acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc 4440
ctgcggctgg agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggagacc 4500
caccccgaca gcgagaccgc cttcgagatc aagagcagcg tgagcggcgg caagcggccc 4560
gccgccacca agaaggccgg ccaggccaag aagaagaagg gcagctaccc ctacgacgtg 4620
cccgactacg cctgagcggc cgcttaatta agctgccttc tgcggggctt gccttctggc 4680
catgcccttc ttctctccct tgcacctgta cctcttggtc tttgaataaa gcctgagtag 4740
gaagtctaga aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4829
<210> 68
<211> 2591
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 68
gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc caagagcgag 60
caggagatcg gcaaggccac cgccaagtac ttcttctaca gcaacatcat gaacttcttc 120
aagaccgaga tcaccctggc caacggcgag atccggaagc ggcccctgat cgagaccaac 180
ggcgagaccg gcgagatcgt gtgggacaag ggccgggact tcgccaccgt gcggaaggtg 240
ctgagcatgc cccaggtgaa catcgtgaag aaaaccgagg tgcagaccgg cggcttcagc 300
aaggagagca tcctgcccaa gcggaacagc gacaagctga tcgcccggaa gaaggactgg 360
gaccccaaga agtacggcgg cttcgacagc cccaccgtgg cctacagcgt gctggtggtg 420
gccaaggtgg agaagggcaa gagcaagaag ctgaaatccg tgaaggagct gctgggcatc 480
accatcatgg agcggagcag cttcgagaag aaccccatcg acttcctgga ggccaagggc 540
tacaaggagg tgaagaagga cctgatcatc aagctgccca agtacagcct gttcgagctg 600
gagaacggcc ggaagcggat gctggccagc gccggcgagc tgcagaaggg caacgagctg 660
gccctgccca gcaagtacgt gaacttcctg tacctggcca gccactacga gaagctgaag 720
ggcagccccg aggacaacga gcagaagcag ctgttcgtgg agcagcacaa gcactacctg 780
gacgagatca tcgagcagat cagcgagttc agcaagcggg tgatcctggc cgacgccaac 840
ctggacaagg tgctgagcgc ctacaacaag caccgggaca agcccatccg ggagcaggcc 900
gagaacatca tccacctgtt caccctgacc aacctgggcg cccccgccgc cttcaagtac 960
ttcgacacca ccatcgaccg gaagcggtac accagcacca aggaggtgct ggacgccacc 1020
ctgatccacc agagcatcac cggcctgtac gagacccgga tcgacctgag ccagctgggc 1080
ggcgacaagc ggcccgccgc caccaagaag gccggccagg ccaagaagaa gaaggcccgg 1140
gacagcaagg tggagaacaa gaccaagaag ctgcgggtgt tcgaggcctt cgccggcatc 1200
ggcgcccagc ggaaggccct ggagaaggtg cggaaggacg agtacgagat cgtgggcctg 1260
gccgagtggt acgtgcccgc catcgtgatg taccaggcca tccacaacaa cttccacacc 1320
aagctggagt acaagagcgt gagccgggag gagatgatcg actacctgga gaacaagacc 1380
ctgagctgga acagcaagaa ccccgtgagc aacggctact ggaagcggaa gaaggacgac 1440
gagctgaaga tcatctacaa cgccatcaag ctgagcgaga aggagggcaa catcttcgac 1500
atccgggacc tgtacaagcg gaccctgaag aacatcgacc tgctgaccta cagcttcccc 1560
tgccaggacc tgagccagca gggcatccag aagggcatga agcggggcag cggcacccgg 1620
agcggcctgc tgtgggagat cgagcgggcc ctggacagca ccgagaagaa cgacctgccc 1680
aagtacctgc tgatggagaa cgtgggcgcc ctgctgcaca agaagaacga ggaggagctg 1740
aaccagtgga agcagaagct ggagagcctg ggctaccaga acagcatcga ggtgctgaac 1800
gccgccgact tcggcagcag ccaggcccgg cggcgggtgt tcatgatcag caccctgaac 1860
gagttcgtgg agctgcccaa gggcgacaag aagcccaaga gcatcaagaa ggtgctgaac 1920
aagatcgtga gcgagaagga catcctgaac aacctgctga agtacaacct gaccgagttc 1980
aagaaaacca agagcaacat caacaaggcc agcctgatcg gctacagcaa gttcaacagc 2040
gagggctacg tgtacgaccc cgagttcacc ggccccaccc tgaccgccag cggcgccaac 2100
agccggatca agatcaagga cggcagcaac atccggaaga tgaacagcga cgagaccttc 2160
ctgtacatcg gcttcgacag ccaggacggc aagcgggtga acgagatcga gttcctgacc 2220
gagaaccaga agatcttcgt gtgcggcaac agcatcagcg tggaggtgct ggaggccatc 2280
atcgacaaga tcggcggccc cagcagcggc ggcaagcggc ccgccgccac caagaaggcc 2340
ggccaggcca agaagaagaa gggcagctac ccctacgacg tgcccgacta cgcctgagcg 2400
gccgcttaat taagctgcct tctgcggggc ttgccttctg gccatgccct tcttctctcc 2460
cttgcacctg tacctcttgg tctttgaata aagcctgagt aggaagtcta gaaaaaaaaa 2520
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2580
aaaaaaaaaa a 2591
<210> 69
<211> 6010
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 69
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagtcgg 4260
gcgggggtgg ctcagtggat ctgaggacac tcgacgtgtt tagcggatgc ggcggactct 4320
ccgaaggctt ccaccaagcc ggaatttccg acacactctg ggccattgag atgtgggacc 4380
ccgccgctca agccttcaga ctgaataatc ccggctccac cgtgttcacc gaggactgca 4440
acattctgct gaagctggtg atggctggcg aaaccaccaa ctctagaggc cagaggctgc 4500
cccagaaggg agatgtggaa atgctctgtg gaggccctcc ttgccaaggc ttctccggca 4560
tgaacaggtt caactctaga acatacagca agttcaagaa ctctctggtc gtgagctttc 4620
tgagctactg cgactactat agacctaggt tctttctgct ggagaacgtg agaaatttcg 4680
tgtccttcaa gaggagcatg gtgctgaagc tgacactgag gtgtctggtg aggatgggct 4740
accagtgcac attcggagtg ctgcaagctg gccagtacgg cgtggcccag accagaagga 4800
gggccatcat tctggctgct gcccccggcg agaaactccc tctgttcccc gagcccctcc 4860
acgtgttcgc ccctagagct tgccagctga gcgtggtggt cgacgataag aagttcgtga 4920
gcaacatcac aaggctgtcc agcggaccct tcagaaccat taccgtgagg gataccatgt 4980
ccgacctccc cgaggtgagg aatggcgcca gcgctctgga gatttcctac aacggcgaac 5040
ctcagagctg gttccaaagg cagctgagag gcgctcagta tcagcccatt ctgagggacc 5100
acatctgcaa agatatgagc gctctggtgg ccgctagaat gagacatatt cctctggccc 5160
ccggcagcga ctggagagat ctgcccaata ttgaggtgag actcagcgac ggaacaatgg 5220
ctagaaaact gaggtacacc catcatgata gaaagaacgg aaggagcagc agcggcgctc 5280
tgagaggagt gtgtagctgc gtggaagctg gcaaggcttg cgatcccgcc gctaggcagt 5340
tcaataccct catcccttgg tgtctgcctc acaccggcaa cagacacaat cattgggctg 5400
gactgtatgg aaggctcgaa tgggacggct ttttcagcac caccgtgacc aatcccgaac 5460
ctatgggcaa gcaaggaagg gtgctccacc ccgagcagca tagagtcgtg tccgtgagag 5520
aatgcgctag aagccaaggc ttccccgaca cctatagact gttcggcaac attctggata 5580
agcacagaca agtgggaaat gctgtccctc ctcctctggc caaggctatc ggactggaga 5640
tcaagctgtg tatgctcgcc aaagctaggg agagcgcttc cgccaagatt aaggaggagg 5700
aggccgccaa ggacggaggt ggcggatcgg gaaagcggcc cgccgccacc aagaaggccg 5760
gtcaggccaa gaagaagaag ggcagctacc cctacgacgt gcccgactac gcctgagcgg 5820
ccgcttaatt aagctgcctt ctgcggggct tgccttctgg ccatgccctt cttctctccc 5880
ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtctag aaaaaaaaaa 5940
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6000
aaaaaaaaaa 6010
<210> 70
<211> 6202
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 70
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
gcgccggcgg cggcggcagc ggcggcggcg gcagcggcgg cggcggcagc ggccccaaga 4260
agaagcggaa ggtggccgcc gccggcagca accacgacca ggagttcgac ccccccaagg 4320
tgtacccccc cgtgcccgcc gagaagcgga agcccatccg ggtgctgagc ctgttcgacg 4380
gcatcgccac cggcctgctg gtgctgaagg acctgggcat ccaggtggac cggtacatcg 4440
ccagcgaggt gtgcgaggac agcatcaccg tgggcatggt gcggcaccag ggcaagatca 4500
tgtacgtggg cgacgtgcgg agcgtgaccc agaagcacat ccaggagtgg ggccccttcg 4560
acctggtgat cggcggcagc ccctgcaacg acctgagcat cgtgaacccc gcccggaagg 4620
gcctgtacga gggcaccggc cggctgttct tcgagttcta ccggctgctg cacgacgccc 4680
ggcccaagga gggcgacgac cggcccttct tctggctgtt cgagaacgtg gtggccatgg 4740
gcgtgagcga caagcgggac atcagccggt tcctggagag caaccccgtg atgatcgacg 4800
ccaaggaggt gagcgccgcc caccgggccc ggtacttctg gggcaacctg cccggcatga 4860
accggcccct ggccagcacc gtgaacgaca agctggagct gcaggagtgc ctggagcacg 4920
gccggatcgc caagttcagc aaggtgcgga ccatcaccac ccggagcaac agcatcaagc 4980
agggcaagga ccagcacttc cccgtgttca tgaacgagaa ggaggacatc ctgtggtgca 5040
ccgagatgga gcgggtgttc ggcttccccg tgcactacac cgacgtgagc aacatgagcc 5100
ggctggcccg gcagcggctg ctgggccgga gctggagcgt gcccgtgatc cggcacctgt 5160
tcgcccccct gaaggagtac ttcgcctgcg tgagcagcgg caacagcaac gccaacagcc 5220
ggggccccag cttcagcagc ggcctggtgc ccctgagcct gcggggcagc cacatgaatc 5280
ctctggagat gttcgagaca gtgcccgtgt ggagaaggca acccgtgagg gtgctgagcc 5340
tcttcgagga cattaagaag gagctgacct ctctgggctt tctggaatcc ggcagcgacc 5400
ccggccagct gaaacacgtg gtggacgtga ccgacacagt gaggaaggac gtggaagagt 5460
ggggcccctt tgacctcgtg tatggagcca cacctcctct cggccacaca tgcgataggc 5520
ctcccagctg gtatctcttc cagttccaca gactgctcca gtacgccaga cctaagcccg 5580
gcagccccag acccttcttc tggatgttcg tggacaatct ggtgctgaac aaggaggatc 5640
tggatgtggc cagcagattt ctggagatgg aacccgtgac aatccccgac gtgcatggcg 5700
gctctctgca gaacgccgtg agagtgtggt ccaacatccc cgccattaga agcagacact 5760
gggctctggt gagcgaggag gaactgtctc tgctggccca gaataagcag tcctccaagc 5820
tggccgccaa gtggcccacc aagctggtga agaactgctt tctgcctctg agggagtatt 5880
tcaagtattt cagcaccgaa ctgaccagca gcctgagcgg cggcaagcgg cccgccgcca 5940
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 6000
acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 6060
ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 6120
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6180
aaaaaaaaaa aaaaaaaaaa aa 6202
<210> 71
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (3)..(3)
<223> a, c, t, g, unknown or other
<400> 71
nbndccdsha grkgghrshv 20
<210> 72
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (18)..(18)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (20)..(20)
<223> a, c, t, g, unknown or other
<400> 72
vhsrhggkrg ahsdccdnbn 20
<210> 73
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (8)..(8)
<223> a, c, t, g, unknown or other
<400> 73
ccgccatntt 10
<210> 74
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (3)..(3)
<223> a, c, t, g, unknown or other
<400> 74
aanatggcgg 10
<210> 75
<211> 21
<212> DNA
<213> Homo sapiens
<400> 75
gctggaaacc ttgcacctcg g 21
<210> 76
<211> 21
<212> DNA
<213> Homo sapiens
<400> 76
ctgctgccag tagagggcac a 21
<210> 77
<211> 21
<212> DNA
<213> Homo sapiens
<400> 77
gcccagagag ggggcggagg g 21
<210> 78
<211> 21
<212> DNA
<213> Homo sapiens
<400> 78
acgcggggag caaccaatcg c 21
<210> 79
<211> 21
<212> DNA
<213> Homo sapiens
<400> 79
actggcagca gagatcatcg c 21
<210> 80
<211> 21
<212> DNA
<213> Homo sapiens
<400> 80
gggggcagga gcaggagcgt c 21
<210> 81
<211> 21
<212> DNA
<213> Homo sapiens
<400> 81
cagccttagc gaggcgccct g 21
<210> 82
<211> 21
<212> DNA
<213> Homo sapiens
<400> 82
actcacagga caaggatgcg g 21
<210> 83
<211> 21
<212> DNA
<213> Homo sapiens
<400> 83
agcaaaagaa aatggtaggc g 21
<210> 84
<211> 21
<212> DNA
<213> Homo sapiens
<400> 84
actcagccgg gcagccgagc a 21
<210> 85
<211> 21
<212> DNA
<213> Homo sapiens
<400> 85
cgtaccaggc tgcagggcgc c 21
<210> 86
<211> 21
<212> DNA
<213> Homo sapiens
<400> 86
agagtggagg aaagaagggt a 21
<210> 87
<211> 386
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 87
Met Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val Phe Glu Ala
1 5 10 15
Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys Val Arg Lys
20 25 30
Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val Pro Ala Ile
35 40 45
Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys Leu Glu Tyr
50 55 60
Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr
65 70 75 80
Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg
85 90 95
Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser
100 105 110
Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr
115 120 125
Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu
130 135 140
Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg
145 150 155 160
Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys
165 170 175
Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu Leu
180 185 190
His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys Leu Glu
195 200 205
Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala Ala Asp Phe
210 215 220
Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser Thr Leu Asn
225 230 235 240
Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys Ser Ile Lys
245 250 255
Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu Asn Asn Leu
260 265 270
Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser Asn Ile Asn
275 280 285
Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu Gly Tyr Val
290 295 300
Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn
305 310 315 320
Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser
325 330 335
Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg
340 345 350
Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys
355 360 365
Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile
370 375 380
Gly Gly
385
<210> 88
<211> 22
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 88
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser
20
<210> 89
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 89
Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1 5 10 15
Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
20 25
<210> 90
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 90
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 91
<211> 1123
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 91
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn
115 120 125
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
645 650 655
Val Pro Asp Tyr Ala Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
660 665 670
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
675 680 685
Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly
690 695 700
Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Glu
705 710 715 720
Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ile
725 730 735
His Gly Val Pro Ala Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu
740 745 750
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp
755 760 765
Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
770 775 780
Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg
785 790 795 800
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys
805 810 815
Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr
820 825 830
His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe
835 840 845
Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu
850 855 860
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala
865 870 875 880
His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
885 890 895
Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu
900 905 910
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys
915 920 925
Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr
930 935 940
His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser
945 950 955 960
Gly Gly Gly Ser Gly Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg
965 970 975
Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
980 985 990
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met
995 1000 1005
Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr
1010 1015 1020
Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp
1025 1030 1035
Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu
1040 1045 1050
Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg Pro
1055 1060 1065
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1070 1075 1080
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Ser Gly Gly Lys Arg
1085 1090 1095
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1100 1105 1110
Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1115 1120
<210> 92
<211> 1123
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 92
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
340 345 350
Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ala Thr Asn Phe Ser
370 375 380
Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser
385 390 395 400
Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
405 410 415
Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Glu Gly Ser Ser Gly Ser
420 425 430
Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
435 440 445
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
450 455 460
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His
465 470 475 480
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
485 490 495
Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His
500 505 510
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
515 520 525
Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys
530 535 540
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn
545 550 555 560
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
565 570 575
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
580 585 590
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
595 600 605
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
610 615 620
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
625 630 635 640
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
645 650 655
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
660 665 670
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
675 680 685
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
690 695 700
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
705 710 715 720
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
725 730 735
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
740 745 750
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
755 760 765
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
770 775 780
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
785 790 795 800
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
805 810 815
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
820 825 830
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
835 840 845
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
850 855 860
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
865 870 875 880
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
885 890 895
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
900 905 910
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
915 920 925
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
930 935 940
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
945 950 955 960
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
965 970 975
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
980 985 990
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
995 1000 1005
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln
1010 1015 1020
Asp Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln
1025 1030 1035
Lys Ile Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu
1040 1045 1050
Ala Ile Ile Asp Lys Ile Gly Gly Pro Ser Gly Gly Lys Arg Pro
1055 1060 1065
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1070 1075 1080
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Ser Gly Gly Lys Arg
1085 1090 1095
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1100 1105 1110
Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1115 1120
<210> 93
<211> 3332
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 93
gcggcaaatc cttttctaga agcgatcatc tgaccaccca ccaaagaaca cataccggcg 60
agaagcctta caaatgtccc gagtgcggaa agtccttctc ccagagagcc aatctgaggg 120
ctcatcaaag gacccatacc ggcgaaaagc cctacaaatg ccccgagtgc ggaaaatcct 180
tcagccagct ggcccatctg agagcccacc aaaggacaca caccggagag aaaccctata 240
agtgccccga gtgtggaaaa agcttttccc agagggccaa tctgagggcc catcagagga 300
cccataccgg agagaagcct tataaatgtc ccgagtgcgg aaaaagcttc agcgagagga 360
gccatctgag ggaacatcaa agaacccaca ccggcgaaaa acccaccgga aaaaagacca 420
gcgctagcgg cagcggcggc ggcagcggcg gcgcccggga cagcaaggtg gagaacaaga 480
ccaagaagct gcgggtgttc gaggccttcg ccggcatcgg cgcccagcgg aaggccctgg 540
agaaggtgcg gaaggacgag tacgagatcg tgggcctggc cgagtggtac gtgcccgcca 600
tcgtgatgta ccaggccatc cacaacaact tccacaccaa gctggagtac aagagcgtga 660
gccgggagga gatgatcgac tacctggaga acaagaccct gagctggaac agcaagaacc 720
ccgtgagcaa cggctactgg aagcggaaga aggacgacga gctgaagatc atctacaacg 780
ccatcaagct gagcgagaag gagggcaaca tcttcgacat ccgggacctg tacaagcgga 840
ccctgaagaa catcgacctg ctgacctaca gcttcccctg ccaggacctg agccagcagg 900
gcatccagaa gggcatgaag cggggcagcg gcacccggag cggcctgctg tgggagatcg 960
agcgggccct ggacagcacc gagaagaacg acctgcccaa gtacctgctg atggagaacg 1020
tgggcgccct gctgcacaag aagaacgagg aggagctgaa ccagtggaag cagaagctgg 1080
agagcctggg ctaccagaac agcatcgagg tgctgaacgc cgccgacttc ggcagcagcc 1140
aggcccggcg gcgggtgttc atgatcagca ccctgaacga gttcgtggag ctgcccaagg 1200
gcgacaagaa gcccaagagc atcaagaagg tgctgaacaa gatcgtgagc gagaaggaca 1260
tcctgaacaa cctgctgaag tacaacctga ccgagttcaa gaaaaccaag agcaacatca 1320
acaaggccag cctgatcggc tacagcaagt tcaacagcga gggctacgtg tacgaccccg 1380
agttcaccgg ccccaccctg accgccagcg gcgccaacag ccggatcaag atcaaggacg 1440
gcagcaacat ccggaagatg aacagcgacg agaccttcct gtacatcggc ttcgacagcc 1500
aggacggcaa gcgggtgaac gagatcgagt tcctgaccga gaaccagaag atcttcgtgt 1560
gcggcaacag catcagcgtg gaggtgctgg aggccatcat cgacaagatc ggcggcccca 1620
gcagcggcgg caagcggccc gccgccacca agaaggccgg ccaggccaag aagaagaagg 1680
gcagctaccc ctacgacgtg cccgactacg ccgggtccta cccgtacgac gtgcccgatt 1740
acgccgccac caacttctcg ctgctgaagc aggccggaga tgtggaagaa aaccctggac 1800
ctaccagtgc cggaaagctc ggtagcggag agggtcgggg aagcctgctt acttgcggcg 1860
acgtggaaga gaaccccggt ccgctggagg gttcgtccgg ctccggatcc cccaagaaga 1920
agcggaaggt gggcatccac ggcgtgcccg ccgccggcag cagcggatcc ctggagcccg 1980
gcgaaaaacc ttacaagtgc cccgagtgcg gaaagagctt cagcagaagc gacaaactgg 2040
tgaggcatca aaggacacat accggagaga agccctataa gtgccccgaa tgtggcaaat 2100
ccttttccca gagggctcat ctggaaagac accagaggac ccataccggc gaaaaaccct 2160
acaaatgtcc cgagtgtgga aagagctttt ccgatcccgg ccatctggtc agacatcaga 2220
ggacacatac cggcgaaaag ccttacaagt gtcccgaatg cggaaaatcc ttctccagaa 2280
gcgacaagct ggtgaggcac caaagaaccc acaccggcga aaaaccctat aaatgccccg 2340
agtgcggcaa gtcctttagc cagctggccc atctgagagc ccaccagaga acacacaccg 2400
gagagaagcc ttataagtgt cccgagtgcg gaaagtcctt ctctagagcc gacaatctga 2460
ccgaacatca aaggacacac accggcgaga aaccttataa atgccccgag tgcggaaaaa 2520
gcttttccga ctgcagagat ctggctagac accagagaac ccacaccggc gagaaaccca 2580
ccggcaaaaa gaccagcgct agcggcagcg gcggcggcag cggcggcgac gccaagagcc 2640
tgaccgcctg gagccggacc ctggtgacct tcaaggacgt gttcgtggac ttcacccggg 2700
aggagtggaa gctgctggac accgcccagc agatcctgta ccggaacgtg atgctggaga 2760
actacaagaa cctggtgagc ctgggctacc agctgaccaa gcccgacgtg atcctgcggc 2820
tggagaaggg cgaggagccc tggctggtgg agcgggagat ccaccaggag acccaccccg 2880
acagcgagac cgccttcgag atcaagagca gcgtgagcgg cggcaagcgg cccgccgcca 2940
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 3000
acgcctgaag cagcggcggc aagcggcccg ccgccaccaa gaaggccggc caggccaaga 3060
agaagaaggg cagctacccc tacgacgtgc ccgactacgc ctgagcggcc gcttaattaa 3120
gctgccttct gcggggcttg ccttctggcc atgcccttct tctctccctt gcacctgtac 3180
ctcttggtct ttgaataaag cctgagtagg aagtctagaa aaaaaaaaaa aaaaaaaaaa 3240
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3300
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 3332
<210> 94
<211> 3012
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 94
tataaatgcc ccgagtgcgg aaaaagcttt tccgactgca gagatctggc tagacaccag 60
agaacccaca ccggcgagaa acccaccggc aaaaagacca gcgctagcgg cagcggcggc 120
ggcagcggcg gcgacgccaa gagcctgacc gcctggagcc ggaccctggt gaccttcaag 180
gacgtgttcg tggacttcac ccgggaggag tggaagctgc tggacaccgc ccagcagatc 240
ctgtaccgga acgtgatgct ggagaactac aagaacctgg tgagcctggg ctaccagctg 300
accaagcccg acgtgatcct gcggctggag aagggcgagg agccctggct ggtggagcgg 360
gagatccacc aggagaccca ccccgacagc gagaccgcct tcgagatcaa gagcagcgtg 420
agcagcggcg gcaagcggcc cgccgccacc aagaaggccg gccaggccaa gaagaagaag 480
ggcagctacc cctacgacgt gcccgactac gccgggtcct acccgtacga cgtgcccgat 540
tacgccgcca ccaacttctc gctgctgaag caggccggag atgtggaaga aaaccctgga 600
cctaccagtg ccggaaagct cggtagcgga gagggtcggg gaagcctgct tacttgcggc 660
gacgtggaag agaaccccgg tccgctggag ggttcgtccg gctccggatc ccccaagaag 720
aagcggaagg tgggcatcca cggcgtgccc gccgccggca gcagcggatc cctggagccc 780
ggcgagaaac cttacaaatg ccccgagtgc ggcaagagct tcagcagaag cgacgatctg 840
gtgaggcacc aaagaaccca caccggcgaa aaaccttaca agtgtcccga atgcggaaag 900
tccttcagca gagaggacaa tctgcacacc caccagagaa cacacaccgg agaaaagcct 960
tacaagtgcc ccgaatgcgg caaatccttt tctagaagcg atcatctgac cacccaccaa 1020
agaacacata ccggcgagaa gccttacaaa tgtcccgagt gcggaaagtc cttctcccag 1080
agagccaatc tgagggctca tcaaaggacc cataccggcg aaaagcccta caaatgcccc 1140
gagtgcggaa aatccttcag ccagctggcc catctgagag cccaccaaag gacacacacc 1200
ggagagaaac cctataagtg ccccgagtgt ggaaaaagct tttcccagag ggccaatctg 1260
agggcccatc agaggaccca taccggagag aagccttata aatgtcccga gtgcggaaaa 1320
agcttcagcg agaggagcca tctgagggaa catcaaagaa cccacaccgg cgaaaaaccc 1380
accggaaaaa agaccagcgc tagcggcagc ggcggcggca gcggcggcgc ccgggacagc 1440
aaggtggaga acaagaccaa gaagctgcgg gtgttcgagg ccttcgccgg catcggcgcc 1500
cagcggaagg ccctggagaa ggtgcggaag gacgagtacg agatcgtggg cctggccgag 1560
tggtacgtgc ccgccatcgt gatgtaccag gccatccaca acaacttcca caccaagctg 1620
gagtacaaga gcgtgagccg ggaggagatg atcgactacc tggagaacaa gaccctgagc 1680
tggaacagca agaaccccgt gagcaacggc tactggaagc ggaagaagga cgacgagctg 1740
aagatcatct acaacgccat caagctgagc gagaaggagg gcaacatctt cgacatccgg 1800
gacctgtaca agcggaccct gaagaacatc gacctgctga cctacagctt cccctgccag 1860
gacctgagcc agcagggcat ccagaagggc atgaagcggg gcagcggcac ccggagcggc 1920
ctgctgtggg agatcgagcg ggccctggac agcaccgaga agaacgacct gcccaagtac 1980
ctgctgatgg agaacgtggg cgccctgctg cacaagaaga acgaggagga gctgaaccag 2040
tggaagcaga agctggagag cctgggctac cagaacagca tcgaggtgct gaacgccgcc 2100
gacttcggca gcagccaggc ccggcggcgg gtgttcatga tcagcaccct gaacgagttc 2160
gtggagctgc ccaagggcga caagaagccc aagagcatca agaaggtgct gaacaagatc 2220
gtgagcgaga aggacatcct gaacaacctg ctgaagtaca acctgaccga gttcaagaaa 2280
accaagagca acatcaacaa ggccagcctg atcggctaca gcaagttcaa cagcgagggc 2340
tacgtgtacg accccgagtt caccggcccc accctgaccg ccagcggcgc caacagccgg 2400
atcaagatca aggacggcag caacatccgg aagatgaaca gcgacgagac cttcctgtac 2460
atcggcttcg acagccagga cggcaagcgg gtgaacgaga tcgagttcct gaccgagaac 2520
cagaagatct tcgtgtgcgg caacagcatc agcgtggagg tgctggaggc catcatcgac 2580
aagatcggcg gccccagcgg cggcaagcgg cccgccgcca ccaagaaggc cggccaggcc 2640
aagaagaaga agggcagcta cccctacgac gtgcccgact acgcctgaag cagcggcggc 2700
aagcggcccg ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc 2760
tacgacgtgc ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg 2820
ccttctggcc atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag 2880
cctgagtagg aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2940
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3000
aaaaaaaaaa aa 3012
<210> 95
<211> 118
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 95
Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1 5 10 15
Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
20 25 30
Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ala Thr Asn Phe Ser
35 40 45
Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser
50 55 60
Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
65 70 75 80
Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Glu Gly Ser Ser Gly Ser
85 90 95
Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
100 105 110
Ala Gly Ser Ser Gly Ser
115
<210> 96
<211> 20
<212> DNA
<213> Homo sapiens
<400> 96
tgccacttcc ccactaaccc 20
<210> 97
<211> 20
<212> DNA
<213> Homo sapiens
<400> 97
ggccacacaa ggaagctgca 20
<210> 98
<211> 20
<212> DNA
<213> Homo sapiens
<400> 98
ccacacaagg aagctgcagg 20
<210> 99
<211> 20
<212> DNA
<213> Homo sapiens
<400> 99
tgattggaat gcaacccgaa 20
<210> 100
<211> 20
<212> DNA
<213> Homo sapiens
<400> 100
ttttgccctt gctaccccaa 20
<210> 101
<211> 20
<212> DNA
<213> Homo sapiens
<400> 101
agctgatggt atccactagg 20
<210> 102
<211> 20
<212> DNA
<213> Homo sapiens
<400> 102
cacatccaag aatgtagtgg 20
<210> 103
<211> 20
<212> DNA
<213> Homo sapiens
<400> 103
gatacagcca caaagctcac 20
<210> 104
<211> 20
<212> DNA
<213> Homo sapiens
<400> 104
attacataac agaatccagg 20
<210> 105
<211> 20
<212> DNA
<213> Homo sapiens
<400> 105
cccttgactg tgctgccacc 20
<210> 106
<211> 20
<212> DNA
<213> Homo sapiens
<400> 106
cagacgagga acctgaaccc 20
<210> 107
<211> 20
<212> DNA
<213> Homo sapiens
<400> 107
agaatccctt ggggtagcaa 20
<210> 108
<211> 20
<212> DNA
<213> Homo sapiens
<400> 108
cagcactctc gctgaccgca 20
<210> 109
<211> 20
<212> DNA
<213> Homo sapiens
<400> 109
gttgagtcat gtgtactctg 20
<210> 110
<211> 20
<212> DNA
<213> Homo sapiens
<400> 110
aggaacagga tgttacaact 20
<210> 111
<211> 20
<212> DNA
<213> Homo sapiens
<400> 111
ggggccacta gggacaggat 20
<210> 112
<211> 3650
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 112
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgagaa accttacaaa tgccccgagt gcggcaagag cttcagcaga agcgacgatc 180
tggtgaggca ccaaagaacc cacaccggcg aaaaacctta caagtgtccc gaatgcggaa 240
agtccttcag cagagaggac aatctgcaca cccaccagag aacacacacc ggagaaaagc 300
cttacaagtg ccccgaatgc ggcaaatcct tttctagaag cgatcatctg accacccacc 360
aaagaacaca taccggcgag aagccttaca aatgtcccga gtgcggaaag tccttctccc 420
agagagccaa tctgagggct catcaaagga cccataccgg cgaaaagccc tacaaatgcc 480
ccgagtgcgg aaaatccttc agccagctgg cccatctgag agcccaccaa aggacacaca 540
ccggagagaa accctataag tgccccgagt gtggaaaaag cttttcccag agggccaatc 600
tgagggccca tcagaggacc cataccggag agaagcctta taaatgtccc gagtgcggaa 660
aaagcttcag cgagaggagc catctgaggg aacatcaaag aacccacacc ggcgaaaaac 720
ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780
gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840
cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900
agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960
tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020
gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080
tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200
aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260
gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320
acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380
agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440
ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500
tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560
tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620
aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680
gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740
ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800
acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860
accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920
acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980
aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc gggtcctacc 2040
cgtacgacgt gcccgattac gccgccacca acttctcgct gctgaagcag gccggagatg 2100
tggaagaaaa ccctggacct accagtgccg gaaagctcgg tagcggagag ggtcggggaa 2160
gcctgcttac ttgcggcgac gtggaagaga accccggtcc gctggagggt tcgtccggct 2220
ccggatcccc caagaagaag cggaaggtgg gcatccacgg cgtgcccgcc gccggcagca 2280
gcggatccct ggagcccggc gaaaaacctt acaagtgccc cgagtgcgga aagagcttca 2340
gcagaagcga caaactggtg aggcatcaaa ggacacatac cggagagaag ccctataagt 2400
gccccgaatg tggcaaatcc ttttcccaga gggctcatct ggaaagacac cagaggaccc 2460
ataccggcga aaaaccctac aaatgtcccg agtgtggaaa gagcttttcc gatcccggcc 2520
atctggtcag acatcagagg acacataccg gcgaaaagcc ttacaagtgt cccgaatgcg 2580
gaaaatcctt ctccagaagc gacaagctgg tgaggcacca aagaacccac accggcgaaa 2640
aaccctataa atgccccgag tgcggcaagt cctttagcca gctggcccat ctgagagccc 2700
accagagaac acacaccgga gagaagcctt ataagtgtcc cgagtgcgga aagtccttct 2760
ctagagccga caatctgacc gaacatcaaa ggacacacac cggcgagaaa ccttataaat 2820
gccccgagtg cggaaaaagc ttttccgact gcagagatct ggctagacac cagagaaccc 2880
acaccggcga gaaacccacc ggcaaaaaga ccagcgctag cggcagcggc ggcggcagcg 2940
gcggcgacgc caagagcctg accgcctgga gccggaccct ggtgaccttc aaggacgtgt 3000
tcgtggactt cacccgggag gagtggaagc tgctggacac cgcccagcag atcctgtacc 3060
ggaacgtgat gctggagaac tacaagaacc tggtgagcct gggctaccag ctgaccaagc 3120
ccgacgtgat cctgcggctg gagaagggcg aggagccctg gctggtggag cgggagatcc 3180
accaggagac ccaccccgac agcgagaccg ccttcgagat caagagcagc gtgagcggcg 3240
gcaagcggcc cgccgccacc aagaaggccg gccaggccaa gaagaagaag ggcagctacc 3300
cctacgacgt gcccgactac gcctgaagca gcggcggcaa gcggcccgcc gccaccaaga 3360
aggccggcca ggccaagaag aagaagggca gctaccccta cgacgtgccc gactacgcct 3420
gagcggccgc ttaattaagc tgccttctgc ggggcttgcc ttctggccat gcccttcttc 3480
tctcccttgc acctgtacct cttggtcttt gaataaagcc tgagtaggaa gtctagaaaa 3540
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3600
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3650
<210> 113
<211> 3650
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 113
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa accttacaag tgccccgagt gcggaaagag cttcagcaga agcgacaaac 180
tggtgaggca tcaaaggaca cataccggag agaagcccta taagtgcccc gaatgtggca 240
aatccttttc ccagagggct catctggaaa gacaccagag gacccatacc ggcgaaaaac 300
cctacaaatg tcccgagtgt ggaaagagct tttccgatcc cggccatctg gtcagacatc 360
agaggacaca taccggcgaa aagccttaca agtgtcccga atgcggaaaa tccttctcca 420
gaagcgacaa gctggtgagg caccaaagaa cccacaccgg cgaaaaaccc tataaatgcc 480
ccgagtgcgg caagtccttt agccagctgg cccatctgag agcccaccag agaacacaca 540
ccggagagaa gccttataag tgtcccgagt gcggaaagtc cttctctaga gccgacaatc 600
tgaccgaaca tcaaaggaca cacaccggcg agaaacctta taaatgcccc gagtgcggaa 660
aaagcttttc cgactgcaga gatctggcta gacaccagag aacccacacc ggcgagaaac 720
ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780
gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840
gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900
agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960
ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020
ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cagcggcggc aagcggcccg 1080
ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 1140
ccgactacgc cgggtcctac ccgtacgacg tgcccgatta cgccgccacc aacttctcgc 1200
tgctgaagca ggccggagat gtggaagaaa accctggacc taccagtgcc ggaaagctcg 1260
gtagcggaga gggtcgggga agcctgctta cttgcggcga cgtggaagag aaccccggtc 1320
cgctggaggg ttcgtccggc tccggatccc ccaagaagaa gcggaaggtg ggcatccacg 1380
gcgtgcccgc cgccggcagc agcggatccc tggagcccgg cgagaaacct tacaaatgcc 1440
ccgagtgcgg caagagcttc agcagaagcg acgatctggt gaggcaccaa agaacccaca 1500
ccggcgaaaa accttacaag tgtcccgaat gcggaaagtc cttcagcaga gaggacaatc 1560
tgcacaccca ccagagaaca cacaccggag aaaagcctta caagtgcccc gaatgcggca 1620
aatccttttc tagaagcgat catctgacca cccaccaaag aacacatacc ggcgagaagc 1680
cttacaaatg tcccgagtgc ggaaagtcct tctcccagag agccaatctg agggctcatc 1740
aaaggaccca taccggcgaa aagccctaca aatgccccga gtgcggaaaa tccttcagcc 1800
agctggccca tctgagagcc caccaaagga cacacaccgg agagaaaccc tataagtgcc 1860
ccgagtgtgg aaaaagcttt tcccagaggg ccaatctgag ggcccatcag aggacccata 1920
ccggagagaa gccttataaa tgtcccgagt gcggaaaaag cttcagcgag aggagccatc 1980
tgagggaaca tcaaagaacc cacaccggcg aaaaacccac cggaaaaaag accagcgcta 2040
gcggcagcgg cggcggcagc ggcggcgccc gggacagcaa ggtggagaac aagaccaaga 2100
agctgcgggt gttcgaggcc ttcgccggca tcggcgccca gcggaaggcc ctggagaagg 2160
tgcggaagga cgagtacgag atcgtgggcc tggccgagtg gtacgtgccc gccatcgtga 2220
tgtaccaggc catccacaac aacttccaca ccaagctgga gtacaagagc gtgagccggg 2280
aggagatgat cgactacctg gagaacaaga ccctgagctg gaacagcaag aaccccgtga 2340
gcaacggcta ctggaagcgg aagaaggacg acgagctgaa gatcatctac aacgccatca 2400
agctgagcga gaaggagggc aacatcttcg acatccggga cctgtacaag cggaccctga 2460
agaacatcga cctgctgacc tacagcttcc cctgccagga cctgagccag cagggcatcc 2520
agaagggcat gaagcggggc agcggcaccc ggagcggcct gctgtgggag atcgagcggg 2580
ccctggacag caccgagaag aacgacctgc ccaagtacct gctgatggag aacgtgggcg 2640
ccctgctgca caagaagaac gaggaggagc tgaaccagtg gaagcagaag ctggagagcc 2700
tgggctacca gaacagcatc gaggtgctga acgccgccga cttcggcagc agccaggccc 2760
ggcggcgggt gttcatgatc agcaccctga acgagttcgt ggagctgccc aagggcgaca 2820
agaagcccaa gagcatcaag aaggtgctga acaagatcgt gagcgagaag gacatcctga 2880
acaacctgct gaagtacaac ctgaccgagt tcaagaaaac caagagcaac atcaacaagg 2940
ccagcctgat cggctacagc aagttcaaca gcgagggcta cgtgtacgac cccgagttca 3000
ccggccccac cctgaccgcc agcggcgcca acagccggat caagatcaag gacggcagca 3060
acatccggaa gatgaacagc gacgagacct tcctgtacat cggcttcgac agccaggacg 3120
gcaagcgggt gaacgagatc gagttcctga ccgagaacca gaagatcttc gtgtgcggca 3180
acagcatcag cgtggaggtg ctggaggcca tcatcgacaa gatcggcggc cccagcggcg 3240
gcaagcggcc cgccgccacc aagaaggccg gccaggccaa gaagaagaag ggcagctacc 3300
cctacgacgt gcccgactac gcctgaagca gcggcggcaa gcggcccgcc gccaccaaga 3360
aggccggcca ggccaagaag aagaagggca gctaccccta cgacgtgccc gactacgcct 3420
gagcggccgc ttaattaagc tgccttctgc ggggcttgcc ttctggccat gcccttcttc 3480
tctcccttgc acctgtacct cttggtcttt gaataaagcc tgagtaggaa gtctagaaaa 3540
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3600
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3650
<210> 114
<211> 542
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 114
Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro
1 5 10 15
Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
20 25 30
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg
35 40 45
Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val
50 55 60
Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr
65 70 75 80
Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly
85 90 95
Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu
100 105 110
Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His
115 120 125
Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe
130 135 140
Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg
145 150 155 160
Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala
165 170 175
Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg
180 185 190
Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu
195 200 205
Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
210 215 220
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe
225 230 235 240
Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val
245 250 255
Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
260 265 270
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg
275 280 285
His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly
290 295 300
Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val
305 310 315 320
Pro Leu Ser Leu Arg Gly Ser His Met Asn Pro Leu Glu Met Phe Glu
325 330 335
Thr Val Pro Val Trp Arg Arg Gln Pro Val Arg Val Leu Ser Leu Phe
340 345 350
Glu Asp Ile Lys Lys Glu Leu Thr Ser Leu Gly Phe Leu Glu Ser Gly
355 360 365
Ser Asp Pro Gly Gln Leu Lys His Val Val Asp Val Thr Asp Thr Val
370 375 380
Arg Lys Asp Val Glu Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala
385 390 395 400
Thr Pro Pro Leu Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu
405 410 415
Phe Gln Phe His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser
420 425 430
Pro Arg Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys
435 440 445
Glu Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr
450 455 460
Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val Trp
465 470 475 480
Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val Ser Glu
485 490 495
Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser Lys Leu Ala
500 505 510
Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe Leu Pro Leu Arg
515 520 525
Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr Ser Ser Leu
530 535 540
<210> 115
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 115
ctggagcccg gcgagaaacc ctataaatgc cccgaatgcg gaaaaagctt cagccagtcc 60
agctctctgg tgagacatca gaggacacac accggcgaaa agccttataa gtgccccgag 120
tgcggcaagt ccttctctag aagcgatcac ctcaccaatc atcagaggac acataccgga 180
gagaagccct ataagtgccc cgagtgcggc aagagcttta gccagctggc tcatctgaga 240
gctcaccaaa gaacccatac cggcgagaag ccttacaaat gccccgagtg tggaaaatcc 300
ttttcccagt ccagcaacct cgtcagacat caaaggaccc ataccggcga aaagccttac 360
aagtgtcccg agtgcggaaa gtccttctct agatccgaca acctcgtgag gcaccagaga 420
acccacaccg gcgagaaacc ttacaaatgt cccgagtgtg gcaaaagctt ttctagaagc 480
gacgagctgg tgagacatca aagaacccat accggcgaaa aaccttataa gtgtcccgag 540
tgcggcaaat cctttagcca gctggcccat ctgagggccc accagagaac acataccggc 600
gaaaaaccca ccggcaaaaa gacaagc 627
<210> 116
<211> 2227
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 116
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgagaa accctacaag tgccccgagt gtggaaaaag ctttagccaa agcggcgatc 180
tgaggagaca ccaaagaaca cacaccggcg agaagcccta caaatgtccc gagtgcggaa 240
agagcttcag ccagagcggc catctgaccg agcatcagag aacccatacc ggcgaaaaac 300
cttataagtg ccccgagtgt ggaaagtcct tctccgagag atcccatctg agagaacacc 360
agaggacaca caccggcgaa aaaccttata agtgtcccga gtgcggaaag tccttcagcg 420
atcccggcca tctggtgaga catcaaagga cacataccgg cgaaaaacct tataagtgtc 480
ccgaatgcgg caagagcttt agcagaaacg acacactcac cgaacaccag aggacccaca 540
ccggcgagaa accctacaaa tgccccgagt gcggcaaatc cttttctaga gccgacaatc 600
tgaccgaaca ccagaggacc cataccggag aaaagcctta caaatgtccc gagtgtggca 660
aatccttctc cacccatctg gatctgatta gacaccaaag aacacatacc ggagaaaagc 720
ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780
gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840
cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900
agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960
tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020
gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080
tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200
aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260
gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320
acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380
agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440
ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500
tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560
tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620
aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680
gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740
ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800
acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860
accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920
acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980
aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040
cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100
cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaa 2227
<210> 117
<211> 2227
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 117
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa accctataag tgccccgaat gtggaaagag cttcagccat accggccatc 180
tgctggaaca ccaaaggaca cacaccggcg agaaacctta caagtgtccc gagtgcggaa 240
aaagcttctc ctccaaaaag gctctcaccg agcaccagag aacacatacc ggcgaaaagc 300
cttataagtg ccccgagtgt ggcaaatcct tttccgactg tagagatctg gccagacatc 360
aaagaaccca caccggagag aaaccttata aatgccccga gtgcggcaag tcctttagcc 420
ataccggcca tctgctggag caccagagga cccataccgg cgagaagcct tacaaatgcc 480
ccgagtgcgg caaaagcttc agcagaaatg acgctctgac cgagcatcaa aggacccata 540
ccggcgaaaa gccctacaag tgtcccgagt gtggaaagtc cttctcccag agcggcgatc 600
tgaggagaca ccagagaaca cacaccggcg agaaacccta taaatgtccc gagtgcggaa 660
agagctttag cgacagcggc aatctgaggg tgcatcaaag aacacacacc ggcgaaaaac 720
ccaccggaaa aaagacaagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780
gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840
cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900
agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960
tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020
gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080
tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200
aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260
gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320
acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380
agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440
ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500
tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560
tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620
aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680
gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740
ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800
acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860
accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920
acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980
aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040
cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100
cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaa 2227
<210> 118
<211> 2227
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 118
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgagaa accctataaa tgccccgaat gcggaaaaag cttcagccag tccagctctc 180
tggtgagaca tcagaggaca cacaccggcg aaaagcctta taagtgcccc gagtgcggca 240
agtccttctc tagaagcgat cacctcacca atcatcagag gacacatacc ggagagaagc 300
cctataagtg ccccgagtgc ggcaagagct ttagccagct ggctcatctg agagctcacc 360
aaagaaccca taccggcgag aagccttaca aatgccccga gtgtggaaaa tccttttccc 420
agtccagcaa cctcgtcaga catcaaagga cccataccgg cgaaaagcct tacaagtgtc 480
ccgagtgcgg aaagtccttc tctagatccg acaacctcgt gaggcaccag agaacccaca 540
ccggcgagaa accttacaaa tgtcccgagt gtggcaaaag cttttctaga agcgacgagc 600
tggtgagaca tcaaagaacc cataccggcg aaaaacctta taagtgtccc gagtgcggca 660
aatcctttag ccagctggcc catctgaggg cccaccagag aacacatacc ggcgaaaaac 720
ccaccggcaa aaagacaagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780
gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840
cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900
agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960
tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020
gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080
tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200
aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260
gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320
acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380
agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440
ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500
tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560
tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620
aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680
gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740
ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800
acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860
accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920
acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980
aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040
cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100
cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaa 2227
<210> 119
<211> 5705
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 119
aaggaaataa gagagaaaag aagagtaaga agaaatataa gagccaccat ggcccccaag 60
aagaagcgga aggtgggcat ccacggcgtg cccgccgccg acaagaagta cagcatcggc 120
ctggccatcg gcaccaacag cgtgggctgg gccgtgatca ccgacgagta caaggtgccc 180
agcaagaagt tcaaggtgct gggcaacacc gaccggcaca gcatcaagaa gaacctgatc 240
ggcgccctgc tgttcgacag cggcgagacc gccgaggcca cccggctgaa gcggaccgcc 300
cggcggcggt acacccggcg gaagaaccgg atctgctacc tgcaggagat cttcagcaac 360
gagatggcca aggtggacga cagcttcttc caccggctgg aggagagctt cctggtggag 420
gaggacaaga agcacgagcg gcaccccatc ttcggcaaca tcgtggacga ggtggcctac 480
cacgagaagt accccaccat ctaccacctg cggaagaagc tggtggacag caccgacaag 540
gccgacctgc ggctgatcta cctggccctg gcccacatga tcaagttccg gggccacttc 600
ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg acaagctgtt catccagctg 660
gtgcagacct acaaccagct gttcgaggag aaccccatca acgccagcgg cgtggacgcc 720
aaggccatcc tgagcgcccg gctgagcaag agccggcggc tggagaacct gatcgcccag 780
ctgcccggcg agaagaagaa cggcctgttc ggcaacctga tcgccctgag cctgggcctg 840
acccccaact tcaagagcaa cttcgacctg gccgaggacg ccaagctgca gctgagcaag 900
gacacctacg acgacgacct ggacaacctg ctggcccaga tcggcgacca gtacgccgac 960
ctgttcctgg ccgccaagaa cctgagcgac gccatcctgc tgagcgacat cctgcgggtg 1020
aacaccgaga tcaccaaggc ccccctgagc gccagcatga tcaagcggta cgacgagcac 1080
caccaggacc tgaccctgct gaaggccctg gtgcggcagc agctgcccga gaagtacaag 1140
gagatcttct tcgaccagag caagaacggc tacgccggct acatcgacgg cggcgccagc 1200
caggaggagt tctacaagtt catcaagccc atcctggaga agatggacgg caccgaggag 1260
ctgctggtga agctgaaccg ggaggacctg ctgcggaagc agcggacctt cgacaacggc 1320
agcatccccc accagatcca cctgggcgag ctgcacgcca tcctgcggcg gcaggaggac 1380
ttctacccct tcctgaagga caaccgggag aagatcgaga agatcctgac cttccggatc 1440
ccctactacg tgggccccct ggcccggggc aacagccggt tcgcctggat gacccggaaa 1500
tccgaggaga ccatcacccc ctggaacttc gaggaggtgg tggacaaggg cgccagcgcc 1560
cagagcttca tcgagcggat gaccaacttc gacaagaacc tgcccaacga gaaggtgctg 1620
cccaagcaca gcctgctgta cgagtacttc accgtgtaca acgagctgac caaggtgaag 1680
tacgtgaccg agggcatgcg gaagcccgcc ttcctgagcg gcgagcagaa gaaggccatc 1740
gtggacctgc tgttcaagac caaccggaag gtgaccgtga agcagctgaa ggaggactac 1800
ttcaagaaga tcgagtgctt cgacagcgtg gagatcagcg gcgtggagga ccggttcaac 1860
gccagcctgg gcacctacca cgacctgctg aagatcatca aggacaagga cttcctggac 1920
aacgaggaga acgaggacat cctggaggac atcgtgctga ccctgaccct gttcgaggac 1980
cgggagatga tcgaggagcg gctgaaaacc tacgcccacc tgttcgacga caaggtgatg 2040
aagcagctga agcggcggcg gtacaccggc tggggccggc tgagccggaa gctgatcaac 2100
ggcatccggg acaagcagag cggcaagacc atcctggact tcctgaaatc cgacggcttc 2160
gccaaccgga acttcatgca gctgatccac gacgacagcc tgaccttcaa ggaggacatc 2220
cagaaggccc aggtgagcgg ccagggcgac agcctgcacg agcacatcgc caacctggcc 2280
ggcagccccg ccatcaagaa gggcatcctg cagaccgtga aggtggtgga cgagctggtg 2340
aaggtgatgg gccggcacaa gcccgagaac atcgtgatcg agatggcccg ggagaaccag 2400
accacccaga agggccagaa gaacagccgg gagcggatga agcggatcga ggagggcatc 2460
aaggagctgg gcagccagat cctgaaggag caccccgtgg agaacaccca gctgcagaac 2520
gagaagctgt acctgtacta cctgcagaac ggccgggaca tgtacgtgga ccaggagctg 2580
gacatcaacc ggctgagcga ctacgacgtg gccgccatcg tgccccagag cttcctgaag 2640
gacgacagca tcgacaacaa ggtgctgacc cggagcgaca aggcccgggg caagagcgac 2700
aacgtgccca gcgaggaggt ggtgaagaag atgaagaact actggcggca gctgctgaac 2760
gccaagctga tcacccagcg gaagttcgac aacctgacca aggccgagcg gggcggcctg 2820
agcgagctgg acaaggccgg cttcatcaag cggcagctgg tggagacccg gcagatcacc 2880
aagcacgtgg cccagatcct ggacagccgg atgaacacca agtacgacga gaacgacaag 2940
ctgatccggg aggtgaaggt gatcaccctg aaatccaagc tggtgagcga cttccggaag 3000
gacttccagt tctacaaggt gcgggagatc aacaactacc accacgccca cgacgcctac 3060
ctgaacgccg tggtgggcac cgccctgatc aagaagtacc ccaagctgga gagcgagttc 3120
gtgtacggcg actacaaggt gtacgacgtg cggaagatga tcgccaagag cgagcaggag 3180
atcggcaagg ccaccgccaa gtacttcttc tacagcaaca tcatgaactt cttcaagacc 3240
gagatcaccc tggccaacgg cgagatccgg aagcggcccc tgatcgagac caacggcgag 3300
accggcgaga tcgtgtggga caagggccgg gacttcgcca ccgtgcggaa ggtgctgagc 3360
atgccccagg tgaacatcgt gaagaaaacc gaggtgcaga ccggcggctt cagcaaggag 3420
agcatcctgc ccaagcggaa cagcgacaag ctgatcgccc ggaagaagga ctgggacccc 3480
aagaagtacg gcggcttcga cagccccacc gtggcctaca gcgtgctggt ggtggccaag 3540
gtggagaagg gcaagagcaa gaagctgaaa tccgtgaagg agctgctggg catcaccatc 3600
atggagcgga gcagcttcga gaagaacccc atcgacttcc tggaggccaa gggctacaag 3660
gaggtgaaga aggacctgat catcaagctg cccaagtaca gcctgttcga gctggagaac 3720
ggccggaagc ggatgctggc cagcgccggc gagctgcaga agggcaacga gctggccctg 3780
cccagcaagt acgtgaactt cctgtacctg gccagccact acgagaagct gaagggcagc 3840
cccgaggaca acgagcagaa gcagctgttc gtggagcagc acaagcacta cctggacgag 3900
atcatcgagc agatcagcga gttcagcaag cgggtgatcc tggccgacgc caacctggac 3960
aaggtgctga gcgcctacaa caagcaccgg gacaagccca tccgggagca ggccgagaac 4020
atcatccacc tgttcaccct gaccaacctg ggcgcccccg ccgccttcaa gtacttcgac 4080
accaccatcg accggaagcg gtacaccagc accaaggagg tgctggacgc caccctgatc 4140
caccagagca tcaccggcct gtacgagacc cggatcgacc tgagccagct gggcggcgac 4200
aagcggcccg ccgccaccaa gaaggccggc caggccaaga agaagaaggc ccgggacagc 4260
aaggtggaga acaagaccaa gaagctgcgg gtgttcgagg ccttcgccgg catcggcgcc 4320
cagcggaagg ccctggagaa ggtgcggaag gacgagtacg agatcgtggg cctggccgag 4380
tggtacgtgc ccgccatcgt gatgtaccag gccatccaca acaacttcca caccaagctg 4440
gagtacaaga gcgtgagccg ggaggagatg atcgactacc tggagaacaa gaccctgagc 4500
tggaacagca agaaccccgt gagcaacggc tactggaagc ggaagaagga cgacgagctg 4560
aagatcatct acaacgccat caagctgagc gagaaggagg gcaacatctt cgacatccgg 4620
gacctgtaca agcggaccct gaagaacatc gacctgctga cctacagctt cccctgccag 4680
gacctgagcc agcagggcat ccagaagggc atgaagcggg gcagcggcac ccggagcggc 4740
ctgctgtggg agatcgagcg ggccctggac agcaccgaga agaacgacct gcccaagtac 4800
ctgctgatgg agaacgtggg cgccctgctg cacaagaaga acgaggagga gctgaaccag 4860
tggaagcaga agctggagag cctgggctac cagaacagca tcgaggtgct gaacgccgcc 4920
gacttcggca gcagccaggc ccggcggcgg gtgttcatga tcagcaccct gaacgagttc 4980
gtggagctgc ccaagggcga caagaagccc aagagcatca agaaggtgct gaacaagatc 5040
gtgagcgaga aggacatcct gaacaacctg ctgaagtaca acctgaccga gttcaagaaa 5100
accaagagca acatcaacaa ggccagcctg atcggctaca gcaagttcaa cagcgagggc 5160
tacgtgtacg accccgagtt caccggcccc accctgaccg ccagcggcgc caacagccgg 5220
atcaagatca aggacggcag caacatccgg aagatgaaca gcgacgagac cttcctgtac 5280
atcggcttcg acagccagga cggcaagcgg gtgaacgaga tcgagttcct gaccgagaac 5340
cagaagatct tcgtgtgcgg caacagcatc agcgtggagg tgctggaggc catcatcgac 5400
aagatcggcg gccccagcag cggcggcaag cggcccgccg ccaccaagaa ggccggccag 5460
gccaagaaga agaagggcag ctacccctac gacgtgcccg actacgcctg agcggccgct 5520
taattaagct gccttctgcg gggcttgcct tctggccatg cccttcttct ctcccttgca 5580
cctgtacctc ttggtctttg aataaagcct gagtaggaag tctagaaaaa aaaaaaaaaa 5640
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5700
aaaaa 5705
<210> 120
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 120
Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro
1 5 10 15
Gly Pro
<210> 121
<211> 1092
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 121
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn
115 120 125
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
645 650 655
Val Pro Asp Tyr Ala Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
660 665 670
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
675 680 685
Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly
690 695 700
Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Glu
705 710 715 720
Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ile
725 730 735
His Gly Val Pro Ala Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu
740 745 750
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp
755 760 765
Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
770 775 780
Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg
785 790 795 800
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys
805 810 815
Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr
820 825 830
His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe
835 840 845
Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu
850 855 860
Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala
865 870 875 880
His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys
885 890 895
Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu
900 905 910
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys
915 920 925
Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr
930 935 940
His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser
945 950 955 960
Gly Gly Gly Ser Gly Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg
965 970 975
Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
980 985 990
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met
995 1000 1005
Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr
1010 1015 1020
Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp
1025 1030 1035
Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu
1040 1045 1050
Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg Pro
1055 1060 1065
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1070 1075 1080
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1085 1090
<210> 122
<211> 1092
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 122
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
340 345 350
Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ala Thr Asn Phe Ser
370 375 380
Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser
385 390 395 400
Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys
405 410 415
Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Glu Gly Ser Ser Gly Ser
420 425 430
Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
435 440 445
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
450 455 460
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His
465 470 475 480
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
485 490 495
Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His
500 505 510
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
515 520 525
Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys
530 535 540
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn
545 550 555 560
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
565 570 575
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
580 585 590
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
595 600 605
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
610 615 620
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
625 630 635 640
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
645 650 655
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
660 665 670
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
675 680 685
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
690 695 700
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
705 710 715 720
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
725 730 735
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
740 745 750
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
755 760 765
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
770 775 780
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
785 790 795 800
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
805 810 815
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
820 825 830
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
835 840 845
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
850 855 860
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
865 870 875 880
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
885 890 895
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
900 905 910
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
915 920 925
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
930 935 940
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
945 950 955 960
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
965 970 975
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
980 985 990
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
995 1000 1005
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln
1010 1015 1020
Asp Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln
1025 1030 1035
Lys Ile Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu
1040 1045 1050
Ala Ile Ile Asp Lys Ile Gly Gly Pro Ser Gly Gly Lys Arg Pro
1055 1060 1065
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1070 1075 1080
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1085 1090
<210> 123
<211> 355
<212> DNA
<213> Homo sapiens
<400> 123
cagagaagga ggaagttaat tcacattctt aattttttct aagggcaaaa aaaaaaaaaa 60
aatgcaccag ctcattttcc atctctgctt gggtcatcag tgtgcattgt gagcctgtac 120
aaaggcctta gacggggaat gctgccgaga gcatcacctt ttatgtcttc ttttatatga 180
aatgtgccac ttccccacta accctggctc tgggctctgc ctctgctctc ctgatggtgt 240
gtttatggtg gattcagcat tctgggccac acaaggaagc tgcagggggt gtccaagttc 300
acatgtcccc gcattccagg cgaatgtttc tgacattgag caatgatatg gctct 355
<210> 124
<211> 46
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 124
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly
20 25 30
Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro
35 40 45
<210> 125
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 125
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly Pro
<210> 126
<211> 18
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 126
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1 5 10 15
Pro Gly
<210> 127
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 127
Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu
1 5 10 15
Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly
20 25
<210> 128
<211> 1
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 128
Pro
1
<210> 129
<211> 652
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 129
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn
115 120 125
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
645 650
<210> 130
<211> 2234
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 130
gggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgagaa accttacaaa tgccccgagt gcggcaagag cttcagcaga agcgacgatc 180
tggtgaggca ccaaagaacc cacaccggcg aaaaacctta caagtgtccc gaatgcggaa 240
agtccttcag cagagaggac aatctgcaca cccaccagag aacacacacc ggagaaaagc 300
cttacaagtg ccccgaatgc ggcaaatcct tttctagaag cgatcatctg accacccacc 360
aaagaacaca taccggcgag aagccttaca aatgtcccga gtgcggaaag tccttctccc 420
agagagccaa tctgagggct catcaaagga cccataccgg cgaaaagccc tacaaatgcc 480
ccgagtgcgg aaaatccttc agccagctgg cccatctgag agcccaccaa aggacacaca 540
ccggagagaa accctataag tgccccgagt gtggaaaaag cttttcccag agggccaatc 600
tgagggccca tcagaggacc cataccggag agaagcctta taaatgtccc gagtgcggaa 660
aaagcttcag cgagaggagc catctgaggg aacatcaaag aacccacacc ggcgaaaaac 720
ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780
gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840
cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900
agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960
tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020
gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080
tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200
aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260
gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320
acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380
agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440
ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500
tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560
tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620
aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680
gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740
ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800
acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860
accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920
acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980
aggccaagaa gaagaagggc agctgagcgg ccgcttaatt aagctgcctt ctgcggggct 2040
tgccttctgg ccatgccctt cttctctccc ttgcacctgt acctcttggt ctttgaataa 2100
agcctgagta ggaagtctag aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaaaaa aaaa 2234
<210> 131
<211> 627
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 131
cuggagcccg gcgagaaacc uuacaaaugc cccgagugcg gcaagagcuu cagcagaagc 60
gacgaucugg ugaggcacca aagaacccac accggcgaaa aaccuuacaa gugucccgaa 120
ugcggaaagu ccuucagcag agaggacaau cugcacaccc accagagaac acacaccgga 180
gaaaagccuu acaagugccc cgaaugcggc aaauccuuuu cuagaagcga ucaucugacc 240
acccaccaaa gaacacauac cggcgagaag ccuuacaaau gucccgagug cggaaagucc 300
uucucccaga gagccaaucu gagggcucau caaaggaccc auaccggcga aaagcccuac 360
aaaugccccg agugcggaaa auccuucagc cagcuggccc aucugagagc ccaccaaagg 420
acacacaccg gagagaaacc cuauaagugc cccgagugug gaaaaagcuu uucccagagg 480
gccaaucuga gggcccauca gaggacccau accggagaga agccuuauaa augucccgag 540
ugcggaaaaa gcuucagcga gaggagccau cugagggaac aucaaagaac ccacaccggc 600
gaaaaaccca ccggaaaaaa gaccagc 627
<210> 132
<211> 1155
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 132
agcaaggugg agaacaagac caagaagcug cggguguucg aggccuucgc cggcaucggc 60
gcccagcgga aggcccugga gaaggugcgg aaggacgagu acgagaucgu gggccuggcc 120
gagugguacg ugcccgccau cgugauguac caggccaucc acaacaacuu ccacaccaag 180
cuggaguaca agagcgugag ccgggaggag augaucgacu accuggagaa caagacccug 240
agcuggaaca gcaagaaccc cgugagcaac ggcuacugga agcggaagaa ggacgacgag 300
cugaagauca ucuacaacgc caucaagcug agcgagaagg agggcaacau cuucgacauc 360
cgggaccugu acaagcggac ccugaagaac aucgaccugc ugaccuacag cuuccccugc 420
caggaccuga gccagcaggg cauccagaag ggcaugaagc ggggcagcgg cacccggagc 480
ggccugcugu gggagaucga gcgggcccug gacagcaccg agaagaacga ccugcccaag 540
uaccugcuga uggagaacgu gggcgcccug cugcacaaga agaacgagga ggagcugaac 600
caguggaagc agaagcugga gagccugggc uaccagaaca gcaucgaggu gcugaacgcc 660
gccgacuucg gcagcagcca ggcccggcgg cggguguuca ugaucagcac ccugaacgag 720
uucguggagc ugcccaaggg cgacaagaag cccaagagca ucaagaaggu gcugaacaag 780
aucgugagcg agaaggacau ccugaacaac cugcugaagu acaaccugac cgaguucaag 840
aaaaccaaga gcaacaucaa caaggccagc cugaucggcu acagcaaguu caacagcgag 900
ggcuacgugu acgaccccga guucaccggc cccacccuga ccgccagcgg cgccaacagc 960
cggaucaaga ucaaggacgg cagcaacauc cggaagauga acagcgacga gaccuuccug 1020
uacaucggcu ucgacagcca ggacggcaag cgggugaacg agaucgaguu ccugaccgag 1080
aaccagaaga ucuucgugug cggcaacagc aucagcgugg aggugcugga ggccaucauc 1140
gacaagaucg gcggc 1155
<210> 133
<211> 690
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 133
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn
115 120 125
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
645 650 655
Val Pro Asp Tyr Ala Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
660 665 670
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
675 680 685
Pro Gly
690
<210> 134
<211> 366
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 134
Pro Leu Glu Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys
1 5 10 15
Val Gly Ile His Gly Val Pro Ala Ala Gly Ser Ser Gly Ser Leu Glu
20 25 30
Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
35 40 45
Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
50 55 60
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His
65 70 75 80
Leu Glu Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
85 90 95
Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His
100 105 110
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
115 120 125
Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His
130 135 140
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
145 150 155 160
Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys
165 170 175
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn
180 185 190
Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
195 200 205
Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His
210 215 220
Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr Ser Ala
225 230 235 240
Ser Gly Ser Gly Gly Gly Ser Gly Gly Asp Ala Lys Ser Leu Thr Ala
245 250 255
Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr
260 265 270
Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg
275 280 285
Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln
290 295 300
Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro
305 310 315 320
Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu
325 330 335
Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg Pro Ala
340 345 350
Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
355 360 365
<210> 135
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 135
Pro Lys Lys Lys Arg Lys
1 5
<210> 136
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 136
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
<210> 137
<211> 13
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 137
Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp
1 5 10
<210> 138
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 138
Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly
1 5 10
<210> 139
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 139
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Ala
115 120 125
Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg Val His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser
355
<210> 140
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 140
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr Glu His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser
355
<210> 141
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 141
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser
355
<210> 142
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 142
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp
115 120 125
Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser
355
<210> 143
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 143
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Thr Ser Gly Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His
115 120 125
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser
355
<210> 144
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 144
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His
115 120 125
Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
245 250 255
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
260 265 270
Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
275 280 285
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
290 295 300
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
305 310 315 320
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
325 330 335
Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser
355
<210> 145
<211> 652
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 145
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly His
115 120 125
Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
645 650
<210> 146
<211> 652
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 146
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Arg Asp Glu Leu Asn Val His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp
115 120 125
Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
645 650
<210> 147
<211> 652
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 147
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Ser Gly His Leu Thr Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly His
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Thr Leu Thr Glu His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
645 650
<210> 148
<211> 652
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 148
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His
115 120 125
Leu Leu Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
645 650
<210> 149
<211> 652
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 149
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Asn
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr
625 630 635 640
Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
645 650
<210> 150
<211> 1519
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 150
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Ser Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr
1400 1405 1410
Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
1415 1420 1425
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val
1430 1435 1440
Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu
1445 1450 1455
Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro
1460 1465 1470
Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser
1475 1480 1485
Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg
1490 1495 1500
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1505 1510 1515
Ser
<210> 151
<211> 1811
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 151
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu
1400 1405 1410
Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala
1415 1420 1425
Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala
1430 1435 1440
Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn
1445 1450 1455
Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu
1460 1465 1470
Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys
1475 1480 1485
Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu
1490 1495 1500
Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly
1505 1510 1515
Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn
1520 1525 1530
Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln
1535 1540 1545
Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser
1550 1555 1560
Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys
1565 1570 1575
Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu
1580 1585 1590
Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys
1595 1600 1605
Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
1610 1615 1620
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile
1625 1630 1635
Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys
1640 1645 1650
Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys
1655 1660 1665
Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys
1670 1675 1680
Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser
1685 1690 1695
Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly
1700 1705 1710
Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys
1715 1720 1725
Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu
1730 1735 1740
Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile
1745 1750 1755
Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser
1760 1765 1770
Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly
1775 1780 1785
Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1790 1795 1800
Gln Ala Lys Lys Lys Lys Gly Ser
1805 1810
<210> 152
<211> 1913
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 152
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Val Asp Leu Arg
1400 1405 1410
Thr Leu Asp Val Phe Ser Gly Cys Gly Gly Leu Ser Glu Gly Phe
1415 1420 1425
His Gln Ala Gly Ile Ser Asp Thr Leu Trp Ala Ile Glu Met Trp
1430 1435 1440
Asp Pro Ala Ala Gln Ala Phe Arg Leu Asn Asn Pro Gly Ser Thr
1445 1450 1455
Val Phe Thr Glu Asp Cys Asn Ile Leu Leu Lys Leu Val Met Ala
1460 1465 1470
Gly Glu Thr Thr Asn Ser Arg Gly Gln Arg Leu Pro Gln Lys Gly
1475 1480 1485
Asp Val Glu Met Leu Cys Gly Gly Pro Pro Cys Gln Gly Phe Ser
1490 1495 1500
Gly Met Asn Arg Phe Asn Ser Arg Thr Tyr Ser Lys Phe Lys Asn
1505 1510 1515
Ser Leu Val Val Ser Phe Leu Ser Tyr Cys Asp Tyr Tyr Arg Pro
1520 1525 1530
Arg Phe Phe Leu Leu Glu Asn Val Arg Asn Phe Val Ser Phe Lys
1535 1540 1545
Arg Ser Met Val Leu Lys Leu Thr Leu Arg Cys Leu Val Arg Met
1550 1555 1560
Gly Tyr Gln Cys Thr Phe Gly Val Leu Gln Ala Gly Gln Tyr Gly
1565 1570 1575
Val Ala Gln Thr Arg Arg Arg Ala Ile Ile Leu Ala Ala Ala Pro
1580 1585 1590
Gly Glu Lys Leu Pro Leu Phe Pro Glu Pro Leu His Val Phe Ala
1595 1600 1605
Pro Arg Ala Cys Gln Leu Ser Val Val Val Asp Asp Lys Lys Phe
1610 1615 1620
Val Ser Asn Ile Thr Arg Leu Ser Ser Gly Pro Phe Arg Thr Ile
1625 1630 1635
Thr Val Arg Asp Thr Met Ser Asp Leu Pro Glu Val Arg Asn Gly
1640 1645 1650
Ala Ser Ala Leu Glu Ile Ser Tyr Asn Gly Glu Pro Gln Ser Trp
1655 1660 1665
Phe Gln Arg Gln Leu Arg Gly Ala Gln Tyr Gln Pro Ile Leu Arg
1670 1675 1680
Asp His Ile Cys Lys Asp Met Ser Ala Leu Val Ala Ala Arg Met
1685 1690 1695
Arg His Ile Pro Leu Ala Pro Gly Ser Asp Trp Arg Asp Leu Pro
1700 1705 1710
Asn Ile Glu Val Arg Leu Ser Asp Gly Thr Met Ala Arg Lys Leu
1715 1720 1725
Arg Tyr Thr His His Asp Arg Lys Asn Gly Arg Ser Ser Ser Gly
1730 1735 1740
Ala Leu Arg Gly Val Cys Ser Cys Val Glu Ala Gly Lys Ala Cys
1745 1750 1755
Asp Pro Ala Ala Arg Gln Phe Asn Thr Leu Ile Pro Trp Cys Leu
1760 1765 1770
Pro His Thr Gly Asn Arg His Asn His Trp Ala Gly Leu Tyr Gly
1775 1780 1785
Arg Leu Glu Trp Asp Gly Phe Phe Ser Thr Thr Val Thr Asn Pro
1790 1795 1800
Glu Pro Met Gly Lys Gln Gly Arg Val Leu His Pro Glu Gln His
1805 1810 1815
Arg Val Val Ser Val Arg Glu Cys Ala Arg Ser Gln Gly Phe Pro
1820 1825 1830
Asp Thr Tyr Arg Leu Phe Gly Asn Ile Leu Asp Lys His Arg Gln
1835 1840 1845
Val Gly Asn Ala Val Pro Pro Pro Leu Ala Lys Ala Ile Gly Leu
1850 1855 1860
Glu Ile Lys Leu Cys Met Leu Ala Lys Ala Arg Glu Ser Ala Ser
1865 1870 1875
Ala Lys Ile Lys Glu Glu Glu Ala Ala Lys Asp Gly Gly Gly Gly
1880 1885 1890
Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1895 1900 1905
Lys Lys Lys Gly Ser
1910
<210> 153
<211> 1977
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 153
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro
1415 1420 1425
Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe
1430 1435 1440
Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile
1445 1450 1455
Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile
1460 1465 1470
Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly
1475 1480 1485
Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro
1490 1495 1500
Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile
1505 1510 1515
Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu
1520 1525 1530
Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu
1535 1540 1545
Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala
1550 1555 1560
Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser
1565 1570 1575
Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg
1580 1585 1590
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu
1595 1600 1605
Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu
1610 1615 1620
His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
1625 1630 1635
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val
1640 1645 1650
Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu
1655 1660 1665
Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met
1670 1675 1680
Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val
1685 1690 1695
Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala
1700 1705 1710
Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser
1715 1720 1725
Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met
1730 1735 1740
Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp Arg Arg Gln
1745 1750 1755
Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys Glu Leu
1760 1765 1770
Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln Leu
1775 1780 1785
Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu
1790 1795 1800
Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu
1805 1810 1815
Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe
1820 1825 1830
His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg
1835 1840 1845
Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu
1850 1855 1860
Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr
1865 1870 1875
Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val
1880 1885 1890
Trp Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val
1895 1900 1905
Ser Glu Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser
1910 1915 1920
Lys Leu Ala Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe
1925 1930 1935
Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr
1940 1945 1950
Ser Ser Leu Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1955 1960 1965
Gly Gln Ala Lys Lys Lys Lys Gly Ser
1970 1975
<210> 154
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 154
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg
35 40 45
Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Thr Leu Thr
65 70 75 80
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Thr Ser Gly Ser Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro
145 150 155 160
Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg
180 185 190
Val His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 155
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 155
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg
35 40 45
Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr
65 70 75 80
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro
145 150 155 160
Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly His Leu Thr
180 185 190
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 156
<211> 209
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 156
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser
35 40 45
Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg
65 70 75 80
Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser His Arg Thr Thr Leu Thr Asn His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Ser
145 150 155 160
Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val
180 185 190
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr
195 200 205
Ser
<210> 157
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 157
cttgagcccg gagaaaagcc atacaaatgt cctgaatgcg gaaagtcatt ttctacgagc 60
ggcgaactcg tgcggcacca aaggactcat accggcgaaa agccttacaa atgcccggag 120
tgcggaaaaa gcttctccga gcgctcgcac ttgcgggaac accagcgaac ccacacaggg 180
gagaaaccgt ataagtgccc agagtgcggc aaatcgttct cccggaacga caccctgacc 240
gaacaccaac gcactcatac tggcgaaaaa ccttacaagt gccctgagtg tggaaagagc 300
ttctcccgcg ccgataacct gaccgagcac cagcggaccc ataccgggga aaagccgtac 360
aagtgtccgg aatgcggcaa aagcttcagc acctcgggtt ccctggtccg gcatcagaga 420
actcacaccg gagagaaacc ctataagtgt cctgagtgcg ggaagtcctt ttcatcgccc 480
gcggacctga ctagacacca gaggacccac accggggaga agccctacaa gtgccccgaa 540
tgtggaaagt ccttctccga ctccggcaac ctccgggtgc accagcgcac ccacactgga 600
gagaagccga ccggaaagaa aacttcc 627
<210> 158
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 158
ctggaacccg gagaaaaacc ttataagtgc cctgaatgcg gaaagtcatt ctcgaggtcg 60
gacaagctcg tgcggcacca gaggacacac accggggaaa agccatacaa gtgtcccgaa 120
tgtggaaagt ccttcagcca acgcgccaac ctgagagctc atcagcggac tcacactggc 180
gaaaaaccgt acaaatgccc cgaatgcggc aaaagcttct cccgcgccga caacttgacc 240
gagcaccagc ggacccatac cggcgaaaag ccgtacaagt gcccggagtg tgggaagtcg 300
ttcagccagt cctcttccct cgtgcgccac caacgcaccc atactgggga gaagccctat 360
aagtgtcctg agtgtggcaa atcattcagc gataagaagg atcttacccg gcaccaacgg 420
actcataccg gagagaagcc ttacaagtgc cccgagtgcg gaaagagctt ctcgtccccg 480
gcggacctga ctagacacca gcgcacccac accggagaaa agccctacaa gtgcccagag 540
tgcgggaagt ccttttccca atccggtcac ctgactgagc accagagaac ccacacggga 600
gagaaaccga ccggaaagaa aacctcc 627
<210> 159
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 159
ttggaacccg gagaaaagcc atacaaatgc cccgaatgcg gaaagtcgtt cagccagtcc 60
ggcgacctca gacggcacca acggactcac accggcgaaa aaccgtacaa gtgcccagag 120
tgcggcaaaa gctttagcca gtcgggcgat ctgcggagac atcagcgcac tcacactggt 180
gaaaagccct acaagtgtcc tgagtgcggg aagtccttca gcgagcgctc ccatcttcgc 240
gagcaccaga gaacccacac tggagaaaaa ccttataagt gccctgagtg tggcaaatcc 300
ttctcaacca ccggcaacct gactgtgcac cagcggaccc acacagggga gaagccttac 360
aagtgcccgg agtgtgggaa gtcattctcc catcggacga ccctgaccaa ccaccagagg 420
acccatactg gcgaaaagcc gtataagtgt ccggagtgcg gaaagagctt ctccgactcc 480
ggaaacctca gggtgcacca acgcacccac accggagaga agccgtacaa atgtcccgaa 540
tgtggaaagt ccttctccca atcctcttcg ctggtccggc accagcgaac tcataccggg 600
gaaaagccca ccggaaagaa aacctcg 627
<210> 160
<211> 659
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 160
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Asn Asp Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn
115 120 125
Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Ser Leu Val Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys
625 630 635 640
Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
645 650 655
Asp Tyr Ala
<210> 161
<211> 659
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 161
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Gln Ser Gly His Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys
625 630 635 640
Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
645 650 655
Asp Tyr Ala
<210> 162
<211> 659
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 162
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn
115 120 125
Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser His Arg Thr Thr Leu Thr Asn His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys
625 630 635 640
Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
645 650 655
Asp Tyr Ala
<210> 163
<211> 650
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 163
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Asn Asp Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn
115 120 125
Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Ser Leu Val Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys
625 630 635 640
Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
645 650
<210> 164
<211> 650
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 164
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Gln Ser Gly His Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys
625 630 635 640
Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
645 650
<210> 165
<211> 650
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 165
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn
115 120 125
Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser His Arg Thr Thr Leu Thr Asn His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys
625 630 635 640
Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
645 650
<210> 166
<211> 2255
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 166
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tcccttgagc 120
ccggagaaaa gccatacaaa tgtcctgaat gcggaaagtc attttctacg agcggcgaac 180
tcgtgcggca ccaaaggact cataccggcg aaaagcctta caaatgcccg gagtgcggaa 240
aaagcttctc cgagcgctcg cacttgcggg aacaccagcg aacccacaca ggggagaaac 300
cgtataagtg cccagagtgc ggcaaatcgt tctcccggaa cgacaccctg accgaacacc 360
aacgcactca tactggcgaa aaaccttaca agtgccctga gtgtggaaag agcttctccc 420
gcgccgataa cctgaccgag caccagcgga cccataccgg ggaaaagccg tacaagtgtc 480
cggaatgcgg caaaagcttc agcacctcgg gttccctggt ccggcatcag agaactcaca 540
ccggagagaa accctataag tgtcctgagt gcgggaagtc cttttcatcg cccgcggacc 600
tgactagaca ccagaggacc cacaccgggg agaagcccta caagtgcccc gaatgtggaa 660
agtccttctc cgactccggc aacctccggg tgcaccagcg cacccacact ggagagaagc 720
cgaccggaaa gaaaacttcc gcctccggtt cgggaggagg ctcaggagga gcgagagatt 780
ccaaggtcga gaacaagacc aagaagctgc gggtgttcga ggcctttgct ggcatcggag 840
cccagaggaa ggccctcgag aaggtccgca aggatgagta cgagatcgtg ggactcgcgg 900
agtggtacgt gcccgccatt gtgatgtacc aggccatcca taacaacttc cacactaagc 960
tggagtacaa gtccgtgtcc cgggaggaaa tgattgacta cctggagaat aagaccctgt 1020
catggaactc taagaacccc gtgtcgaacg gttactggaa gagaaagaag gatgacgaac 1080
tgaagattat ctacaacgcg atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctcta caagcgcacc ttgaagaaca tcgatctgct gacctactcc ttcccgtgcc 1200
aagacctgag ccagcagggc atccagaagg ggatgaaacg gggctccggt actcgcagcg 1260
gcttgctgtg ggaaattgag cgggccctgg atagcaccga gaagaacgac ttgccgaagt 1320
atcttctcat ggaaaacgtc ggggctctcc ttcacaagaa gaacgaggaa gaactgaacc 1380
agtggaagca aaagctggaa tccctcggat accagaactc cattgaggtc ctgaacgccg 1440
ccgacttcgg atcgtcgcaa gccagacgga gggtgttcat gattagcact ctgaacgaat 1500
tcgtggaact gccgaagggc gacaagaagc ctaagtccat caagaaggtg ctgaacaaga 1560
tcgtgtccga gaaggacatt ctcaacaatc tgctgaagta caacctgaca gagttcaaga 1620
aaaccaagtc caacatcaac aaggcctcct tgattggtta ctcaaagttc aacagcgagg 1680
gatacgtgta cgaccccgaa ttcactggac ccactctgac cgcctccgga gcaaactcta 1740
ggattaagat caaggacggc tccaacatcc ggaagatgaa ctccgacgaa acctttctgt 1800
acatcggctt cgactcgcaa gacggaaagc gcgtgaacga gatcgaattt cttaccgaaa 1860
accagaagat cttcgtgtgc ggcaattcaa tctccgtgga agtcctggaa gcgattatcg 1920
acaagatcgg aggcagtggt ggaaagcgcc cagcagccac taagaaggcc ggacaggcca 1980
agaagaagaa gggatcctac ccttacgatg tgccggatta cgcttgagcg gccgcttaat 2040
taagctgcct tctgcggggc ttgccttctg gccatgccct tcttctctcc cttgcacctg 2100
tacctcttgg tctttgaata aagcctgagt aggaagtcta gaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 2255
<210> 167
<211> 2255
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 167
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggaac 120
ccggagaaaa accttataag tgccctgaat gcggaaagtc attctcgagg tcggacaagc 180
tcgtgcggca ccagaggaca cacaccgggg aaaagccata caagtgtccc gaatgtggaa 240
agtccttcag ccaacgcgcc aacctgagag ctcatcagcg gactcacact ggcgaaaaac 300
cgtacaaatg ccccgaatgc ggcaaaagct tctcccgcgc cgacaacttg accgagcacc 360
agcggaccca taccggcgaa aagccgtaca agtgcccgga gtgtgggaag tcgttcagcc 420
agtcctcttc cctcgtgcgc caccaacgca cccatactgg ggagaagccc tataagtgtc 480
ctgagtgtgg caaatcattc agcgataaga aggatcttac ccggcaccaa cggactcata 540
ccggagagaa gccttacaag tgccccgagt gcggaaagag cttctcgtcc ccggcggacc 600
tgactagaca ccagcgcacc cacaccggag aaaagcccta caagtgccca gagtgcggga 660
agtccttttc ccaatccggt cacctgactg agcaccagag aacccacacg ggagagaaac 720
cgaccggaaa gaaaacctcc gcctccggtt cgggaggagg ctcaggagga gcgagagatt 780
ccaaggtcga gaacaagacc aagaagctgc gggtgttcga ggcctttgct ggcatcggag 840
cccagaggaa ggccctcgag aaggtccgca aggatgagta cgagatcgtg ggactcgcgg 900
agtggtacgt gcccgccatt gtgatgtacc aggccatcca taacaacttc cacactaagc 960
tggagtacaa gtccgtgtcc cgggaggaaa tgattgacta cctggagaat aagaccctgt 1020
catggaactc taagaacccc gtgtcgaacg gttactggaa gagaaagaag gatgacgaac 1080
tgaagattat ctacaacgcg atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctcta caagcgcacc ttgaagaaca tcgatctgct gacctactcc ttcccgtgcc 1200
aagacctgag ccagcagggc atccagaagg ggatgaaacg gggctccggt actcgcagcg 1260
gcttgctgtg ggaaattgag cgggccctgg atagcaccga gaagaacgac ttgccgaagt 1320
atcttctcat ggaaaacgtc ggggctctcc ttcacaagaa gaacgaggaa gaactgaacc 1380
agtggaagca aaagctggaa tccctcggat accagaactc cattgaggtc ctgaacgccg 1440
ccgacttcgg atcgtcgcaa gccagacgga gggtgttcat gattagcact ctgaacgaat 1500
tcgtggaact gccgaagggc gacaagaagc ctaagtccat caagaaggtg ctgaacaaga 1560
tcgtgtccga gaaggacatt ctcaacaatc tgctgaagta caacctgaca gagttcaaga 1620
aaaccaagtc caacatcaac aaggcctcct tgattggtta ctcaaagttc aacagcgagg 1680
gatacgtgta cgaccccgaa ttcactggac ccactctgac cgcctccgga gcaaactcta 1740
ggattaagat caaggacggc tccaacatcc ggaagatgaa ctccgacgaa acctttctgt 1800
acatcggctt cgactcgcaa gacggaaagc gcgtgaacga gatcgaattt cttaccgaaa 1860
accagaagat cttcgtgtgc ggcaattcaa tctccgtgga agtcctggaa gcgattatcg 1920
acaagatcgg aggcagtggt ggaaagcgcc cagcagccac taagaaggcc ggacaggcca 1980
agaagaagaa gggatcctac ccttacgatg tgccggatta cgcttgagcg gccgcttaat 2040
taagctgcct tctgcggggc ttgccttctg gccatgccct tcttctctcc cttgcacctg 2100
tacctcttgg tctttgaata aagcctgagt aggaagtcta gaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 2255
<210> 168
<211> 2255
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 168
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccttggaac 120
ccggagaaaa gccatacaaa tgccccgaat gcggaaagtc gttcagccag tccggcgacc 180
tcagacggca ccaacggact cacaccggcg aaaaaccgta caagtgccca gagtgcggca 240
aaagctttag ccagtcgggc gatctgcgga gacatcagcg cactcacact ggtgaaaagc 300
cctacaagtg tcctgagtgc gggaagtcct tcagcgagcg ctcccatctt cgcgagcacc 360
agagaaccca cactggagaa aaaccttata agtgccctga gtgtggcaaa tccttctcaa 420
ccaccggcaa cctgactgtg caccagcgga cccacacagg ggagaagcct tacaagtgcc 480
cggagtgtgg gaagtcattc tcccatcgga cgaccctgac caaccaccag aggacccata 540
ctggcgaaaa gccgtataag tgtccggagt gcggaaagag cttctccgac tccggaaacc 600
tcagggtgca ccaacgcacc cacaccggag agaagccgta caaatgtccc gaatgtggaa 660
agtccttctc ccaatcctct tcgctggtcc ggcaccagcg aactcatacc ggggaaaagc 720
ccaccggaaa gaaaacctcg gcctccggtt cgggaggagg ctcaggagga gcgagagatt 780
ccaaggtcga gaacaagacc aagaagctgc gggtgttcga ggcctttgct ggcatcggag 840
cccagaggaa ggccctcgag aaggtccgca aggatgagta cgagatcgtg ggactcgcgg 900
agtggtacgt gcccgccatt gtgatgtacc aggccatcca taacaacttc cacactaagc 960
tggagtacaa gtccgtgtcc cgggaggaaa tgattgacta cctggagaat aagaccctgt 1020
catggaactc taagaacccc gtgtcgaacg gttactggaa gagaaagaag gatgacgaac 1080
tgaagattat ctacaacgcg atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctcta caagcgcacc ttgaagaaca tcgatctgct gacctactcc ttcccgtgcc 1200
aagacctgag ccagcagggc atccagaagg ggatgaaacg gggctccggt actcgcagcg 1260
gcttgctgtg ggaaattgag cgggccctgg atagcaccga gaagaacgac ttgccgaagt 1320
atcttctcat ggaaaacgtc ggggctctcc ttcacaagaa gaacgaggaa gaactgaacc 1380
agtggaagca aaagctggaa tccctcggat accagaactc cattgaggtc ctgaacgccg 1440
ccgacttcgg atcgtcgcaa gccagacgga gggtgttcat gattagcact ctgaacgaat 1500
tcgtggaact gccgaagggc gacaagaagc ctaagtccat caagaaggtg ctgaacaaga 1560
tcgtgtccga gaaggacatt ctcaacaatc tgctgaagta caacctgaca gagttcaaga 1620
aaaccaagtc caacatcaac aaggcctcct tgattggtta ctcaaagttc aacagcgagg 1680
gatacgtgta cgaccccgaa ttcactggac ccactctgac cgcctccgga gcaaactcta 1740
ggattaagat caaggacggc tccaacatcc ggaagatgaa ctccgacgaa acctttctgt 1800
acatcggctt cgactcgcaa gacggaaagc gcgtgaacga gatcgaattt cttaccgaaa 1860
accagaagat cttcgtgtgc ggcaattcaa tctccgtgga agtcctggaa gcgattatcg 1920
acaagatcgg aggcagtggt ggaaagcgcc cagcagccac taagaaggcc ggacaggcca 1980
agaagaagaa gggatcctac ccttacgatg tgccggatta cgcttgagcg gccgcttaat 2040
taagctgcct tctgcggggc ttgccttctg gccatgccct tcttctctcc cttgcacctg 2100
tacctcttgg tctttgaata aagcctgagt aggaagtcta gaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 2255
<210> 169
<211> 204
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 169
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
35 40 45
Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
145 150 155 160
Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Thr Asp Thr Leu Arg
180 185 190
Asp His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
195 200
<210> 170
<211> 204
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 170
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Gln Lys Ser Ser Leu Ile Ala His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Lys
35 40 45
Asn Ala Leu Gln Asn His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Asn Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ala
145 150 155 160
Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr
180 185 190
Arg His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
195 200
<210> 171
<211> 204
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 171
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys
35 40 45
Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val
65 70 75 80
Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Thr
145 150 155 160
Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
180 185 190
Thr His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
195 200
<210> 172
<211> 204
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 172
Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
1 5 10 15
Phe Ser Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly
20 25 30
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Lys
35 40 45
Ser Ser Leu Ile Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
50 55 60
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Arg Asp Glu Leu Asn
65 70 75 80
Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
85 90 95
Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg
100 105 110
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
115 120 125
Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly
130 135 140
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser
145 150 155 160
Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
165 170 175
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ala Gly His Leu Ala
180 185 190
Ser His Gln Arg Thr His Thr Gly Lys Lys Thr Ser
195 200
<210> 173
<211> 612
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 173
ctggagcctg gagagaaacc ctacaaatgc ccggaatgcg ggaagtcctt ttccgaacgc 60
tcgcacctga gggaacacca gagaactcac accggcgaaa aaccctataa gtgcccagaa 120
tgcggaaaga gcttttcacg gtcggacaac ctcgtgcggc accaacgcac tcataccgga 180
gagaagccgt acaagtgtcc tgagtgcgga aagtcattct ccgactgccg ggatttggcc 240
cgccaccaaa gaacacacac tggcgaaaag ccctacaagt gcccggagtg tggaaagtcc 300
ttcagcactt ccggagagct ggtccggcac cagaggaccc acaccgggga gaagccttac 360
aaatgtccag agtgcggtaa aagcttctcc accaccggca acctcaccgt gcaccagcgg 420
acccacactg gagaaaagcc gtataaatgc cccgaatgcg gcaagagctt ctcgcgatcc 480
gataagcttg tgcggcatca gagaacgcac actggggaaa agccttataa gtgtccggag 540
tgcggcaaat ccttctcccg cactgacacc ctgcgggacc atcagcgcac ccataccggc 600
aaaaagacct ct 612
<210> 174
<211> 612
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 174
cttgaacccg gggagaagcc ctacaagtgc ccggaatgcg gaaagagctt cagccagaag 60
tcctcgctga tcgcgcacca gaggactcac accggcgaaa agccatacaa gtgtcctgag 120
tgtggcaaat ccttctcgca caagaacgca ctgcagaacc accagagaac ccacaccggg 180
gaaaagccgt ataagtgccc cgaatgtgga aagtcgttca gccagtcatc caacctcgtg 240
cgccatcaaa ggactcatac cggagagaaa ccttacaaat gccctgaatg cggcaaatct 300
ttctcccgga atgatgccct gaccgagcac cagcgcactc acacgggaga gaagccgtac 360
aaatgtccgg agtgcggaaa gtccttctcc gacaagaagg acttgaccag acaccagcgg 420
acccatactg gcgaaaaacc ctataagtgt ccagagtgcg ggaagtcctt tagccaagcc 480
ggtcacctcg cttcccacca acggacccac acaggagaaa agccttataa atgccccgag 540
tgcggcaaaa gcttctccga taagaaggac ctgactcggc atcagcgcac ccataccgga 600
aagaaaacct ca 612
<210> 175
<211> 612
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 175
ctggagcctg gcgaaaaacc ctataagtgc ccagaatgcg gaaagagctt ttcacggtcg 60
gacaacctcg tgcggcacca acgcactcat accggagaga agccgtacaa gtgtcctgag 120
tgcggaaagt cattctccga ctgccgggat ttggcccgcc accaaagaac acacactggc 180
gaaaagccct acaagtgccc ggagtgtgga aagtccttca gcacttccgg agagctggtc 240
cggcaccaga ggacccacac cggggagaag ccttacaaat gtccagagtg cggtaaaagc 300
ttctccacca ccggcaacct caccgtgcac cagcggaccc acactggaga aaagccgtat 360
aaatgccccg aatgcggcaa gagcttctcg cgatccgata agcttgtgcg gcatcagaga 420
acgcacactg gggaaaagcc ttataagtgt ccggagtgcg gcaaatcctt ctcccgcact 480
gacaccctgc gggaccacca gagaacccat actggcgaga agccatacaa atgcccggaa 540
tgtggaaaga gtttctcgcg cgaggacaac ctccacaccc atcagcgcac ccataccggc 600
aaaaagacct ct 612
<210> 176
<211> 612
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 176
ctggaacccg gagagaaacc ctacaaatgc ccagagtgcg gcaaatcgtt ctcacggtcc 60
gatcacctca ccacccacca gaggacccat accggggaga agccttacaa gtgtcctgag 120
tgtggaaagt ccttcagcca aaagtcctcg ctgatcgcac accagcgcac gcacactggg 180
gaaaagccat ataaatgccc ggagtgtggc aaatccttct cccgccgcga cgaactgaac 240
gtgcaccaga gaacccacac tggagagaag ccgtataagt gtccggagtg cggaaagagc 300
ttctcgcaat ccggggacct tcggagacat cagaggacac acactggcga aaagccctat 360
aagtgccctg agtgcgggaa gtcctttagc caagccggtc acctggcctc ccaccaacgg 420
actcacaccg gcgaaaaacc gtacaagtgc cccgaatgcg gaaagtcgtt ctctacctcc 480
ggaaacttga ccgaacacca gcggacccac accggagaaa agccgtacaa atgtcctgaa 540
tgcggcaaaa gcttcagcca ggccggtcat ctcgcgagcc atcagcggac tcatactggc 600
aaaaagacct ca 612
<210> 177
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 177
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Lys Lys
210 215 220
Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp
225 230 235 240
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
245 250 255
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
260 265 270
Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
275 280 285
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
290 295 300
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
305 310 315 320
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro
325 330 335
Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
<210> 178
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 178
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Gln Lys Ser Ser Leu Ile Ala His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser His Lys Asn Ala Leu Gln Asn His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Gln Ser Ser Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala
115 120 125
Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Lys Lys
210 215 220
Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp
225 230 235 240
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
245 250 255
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
260 265 270
Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
275 280 285
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
290 295 300
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
305 310 315 320
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro
325 330 335
Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
<210> 179
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 179
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn
115 120 125
Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Lys Lys
210 215 220
Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp
225 230 235 240
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
245 250 255
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
260 265 270
Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
275 280 285
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
290 295 300
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
305 310 315 320
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro
325 330 335
Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
<210> 180
<211> 367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 180
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Thr His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Lys Ser Ser Leu Ile Ala His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Arg Asp Glu Leu Asn Val His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp
115 120 125
Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Ala Gly His Leu Ala Ser His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly Lys Lys
210 215 220
Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp
225 230 235 240
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
245 250 255
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
260 265 270
Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
275 280 285
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
290 295 300
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
305 310 315 320
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro
325 330 335
Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
355 360 365
<210> 181
<211> 1082
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 181
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn
115 120 125
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys
625 630 635 640
Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val
645 650 655
Pro Asp Tyr Ala Gly Ser Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
660 665 670
Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly
675 680 685
Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
690 695 700
Asn Pro Gly Pro Leu Glu Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys
705 710 715 720
Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala Gly Ser Ser Gly
725 730 735
Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
740 745 750
Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr
755 760 765
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
770 775 780
Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro
785 790 795 800
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu
805 810 815
Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
820 825 830
Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln
835 840 845
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
850 855 860
Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His Thr
865 870 875 880
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
885 890 895
Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro
900 905 910
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Thr Asp Thr Leu
915 920 925
Arg Asp His Gln Arg Thr His Thr Gly Lys Lys Thr Ser Ala Ser Gly
930 935 940
Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp Ala Lys Ser Leu Thr
945 950 955 960
Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe
965 970 975
Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr
980 985 990
Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr
995 1000 1005
Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu
1010 1015 1020
Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro
1025 1030 1035
Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro Ser Ser
1040 1045 1050
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1055 1060 1065
Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1070 1075 1080
<210> 182
<211> 1082
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 182
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Lys Lys
210 215 220
Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp
225 230 235 240
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
245 250 255
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
260 265 270
Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
275 280 285
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
290 295 300
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
305 310 315 320
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro
325 330 335
Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly
355 360 365
Ser Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
370 375 380
Asn Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg
385 390 395 400
Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Leu
405 410 415
Glu Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly
420 425 430
Ile His Gly Val Pro Ala Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly
435 440 445
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
450 455 460
Asp Asp Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
465 470 475 480
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
485 490 495
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
500 505 510
Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Thr His Gln Arg
515 520 525
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
530 535 540
Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly
545 550 555 560
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu
565 570 575
Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
580 585 590
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg
595 600 605
Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
610 615 620
Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg
625 630 635 640
Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly
645 650 655
Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Ser Lys Val Glu Asn Lys
660 665 670
Thr Lys Lys Leu Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln
675 680 685
Arg Lys Ala Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly
690 695 700
Leu Ala Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His
705 710 715 720
Asn Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu
725 730 735
Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn
740 745 750
Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys
755 760 765
Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe
770 775 780
Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu
785 790 795 800
Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys
805 810 815
Gly Met Lys Arg Gly Ser Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile
820 825 830
Glu Arg Ala Leu Asp Ser Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu
835 840 845
Leu Met Glu Asn Val Gly Ala Leu Leu His Lys Lys Asn Glu Glu Glu
850 855 860
Leu Asn Gln Trp Lys Gln Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser
865 870 875 880
Ile Glu Val Leu Asn Ala Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg
885 890 895
Arg Val Phe Met Ile Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys
900 905 910
Gly Asp Lys Lys Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val
915 920 925
Ser Glu Lys Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu
930 935 940
Phe Lys Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr
945 950 955 960
Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly
965 970 975
Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp
980 985 990
Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile
995 1000 1005
Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile Glu Phe
1010 1015 1020
Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser Ile Ser
1025 1030 1035
Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly Pro Ser
1040 1045 1050
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1055 1060 1065
Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1070 1075 1080
<210> 183
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 183
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Lys Lys
210 215 220
Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp
225 230 235 240
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
245 250 255
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
260 265 270
Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
275 280 285
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
290 295 300
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
305 310 315 320
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro
325 330 335
Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser
355
<210> 184
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 184
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Gln Lys Ser Ser Leu Ile Ala His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser His Lys Asn Ala Leu Gln Asn His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Gln Ser Ser Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala
115 120 125
Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Lys Lys
210 215 220
Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp
225 230 235 240
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
245 250 255
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
260 265 270
Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
275 280 285
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
290 295 300
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
305 310 315 320
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro
325 330 335
Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser
355
<210> 185
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 185
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn
115 120 125
Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Lys Lys
210 215 220
Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp
225 230 235 240
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
245 250 255
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
260 265 270
Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
275 280 285
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
290 295 300
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
305 310 315 320
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro
325 330 335
Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser
355
<210> 186
<211> 358
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 186
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Thr His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Gln Lys Ser Ser Leu Ile Ala His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Arg Asp Glu Leu Asn Val His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp
115 120 125
Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Ala Gly His Leu Ala Ser His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr Glu His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly Lys Lys
210 215 220
Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp
225 230 235 240
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
245 250 255
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
260 265 270
Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
275 280 285
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
290 295 300
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
305 310 315 320
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro
325 330 335
Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser
355
<210> 187
<211> 1073
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 187
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn
115 120 125
Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys
210 215 220
Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly
225 230 235 240
Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val
245 250 255
Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys
260 265 270
Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val
275 280 285
Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys
290 295 300
Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu
305 310 315 320
Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr
325 330 335
Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile
340 345 350
Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr
355 360 365
Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys
370 375 380
Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser
385 390 395 400
Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser
405 410 415
Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly
420 425 430
Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
435 440 445
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
450 455 460
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser
465 470 475 480
Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys
485 490 495
Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu
500 505 510
Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser
515 520 525
Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu
530 535 540
Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser
545 550 555 560
Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys
565 570 575
Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp
580 585 590
Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile
595 600 605
Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile
610 615 620
Asp Lys Ile Gly Gly Pro Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys
625 630 635 640
Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val
645 650 655
Pro Asp Tyr Ala Gly Ser Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
660 665 670
Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly
675 680 685
Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu
690 695 700
Asn Pro Gly Pro Leu Glu Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys
705 710 715 720
Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala Gly Ser Ser Gly
725 730 735
Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
740 745 750
Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr
755 760 765
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
770 775 780
Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro
785 790 795 800
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu
805 810 815
Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
820 825 830
Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln
835 840 845
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys
850 855 860
Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His Thr
865 870 875 880
Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg
885 890 895
Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro
900 905 910
Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Thr Asp Thr Leu
915 920 925
Arg Asp His Gln Arg Thr His Thr Gly Lys Lys Thr Ser Ala Ser Gly
930 935 940
Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp Ala Lys Ser Leu Thr
945 950 955 960
Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe
965 970 975
Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr
980 985 990
Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr
995 1000 1005
Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu
1010 1015 1020
Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro
1025 1030 1035
Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro Ser Ser
1040 1045 1050
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1055 1060 1065
Lys Lys Lys Gly Ser
1070
<210> 188
<211> 1073
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 188
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys
20 25 30
Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His
35 40 45
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
50 55 60
Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His
65 70 75 80
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
85 90 95
Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu
115 120 125
Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys
130 135 140
Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His
145 150 155 160
Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly
165 170 175
Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His
180 185 190
Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser
195 200 205
Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Lys Lys
210 215 220
Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp
225 230 235 240
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
245 250 255
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
260 265 270
Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
275 280 285
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
290 295 300
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
305 310 315 320
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro
325 330 335
Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
340 345 350
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly
355 360 365
Ser Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
370 375 380
Asn Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg
385 390 395 400
Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Leu
405 410 415
Glu Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly
420 425 430
Ile His Gly Val Pro Ala Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly
435 440 445
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser
450 455 460
Asp Asp Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
465 470 475 480
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His
485 490 495
Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
500 505 510
Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Thr His Gln Arg
515 520 525
Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser
530 535 540
Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly
545 550 555 560
Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu
565 570 575
Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr
580 585 590
Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg
595 600 605
Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu
610 615 620
Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg
625 630 635 640
Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly
645 650 655
Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Ser Lys Val Glu Asn Lys
660 665 670
Thr Lys Lys Leu Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln
675 680 685
Arg Lys Ala Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly
690 695 700
Leu Ala Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His
705 710 715 720
Asn Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu
725 730 735
Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn
740 745 750
Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys
755 760 765
Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe
770 775 780
Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu
785 790 795 800
Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys
805 810 815
Gly Met Lys Arg Gly Ser Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile
820 825 830
Glu Arg Ala Leu Asp Ser Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu
835 840 845
Leu Met Glu Asn Val Gly Ala Leu Leu His Lys Lys Asn Glu Glu Glu
850 855 860
Leu Asn Gln Trp Lys Gln Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser
865 870 875 880
Ile Glu Val Leu Asn Ala Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg
885 890 895
Arg Val Phe Met Ile Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys
900 905 910
Gly Asp Lys Lys Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val
915 920 925
Ser Glu Lys Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu
930 935 940
Phe Lys Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr
945 950 955 960
Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly
965 970 975
Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp
980 985 990
Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile
995 1000 1005
Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile Glu Phe
1010 1015 1020
Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser Ile Ser
1025 1030 1035
Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly Pro Ser
1040 1045 1050
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1055 1060 1065
Lys Lys Lys Gly Ser
1070
<210> 189
<211> 1376
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 189
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ctggagagaa accctacaaa tgcccggaat gcgggaagtc cttttccgaa cgctcgcacc 180
tgagggaaca ccagagaact cacaccggcg aaaaacccta taagtgccca gaatgcggaa 240
agagcttttc acggtcggac aacctcgtgc ggcaccaacg cactcatacc ggagagaagc 300
cgtacaagtg tcctgagtgc ggaaagtcat tctccgactg ccgggatttg gcccgccacc 360
aaagaacaca cactggcgaa aagccctaca agtgcccgga gtgtggaaag tccttcagca 420
cttccggaga gctggtccgg caccagagga cccacaccgg ggagaagcct tacaaatgtc 480
cagagtgcgg taaaagcttc tccaccaccg gcaacctcac cgtgcaccag cggacccaca 540
ctggagaaaa gccgtataaa tgccccgaat gcggcaagag cttctcgcga tccgataagc 600
ttgtgcggca tcagagaacg cacactgggg aaaagcctta taagtgtccg gagtgcggca 660
aatccttctc ccgcactgac accctgcggg accatcagcg cacccatacc ggcaaaaaga 720
cctctgctag cggcagcggc ggcggcagcg gcggcgcccg ggacgacgcc aagagcctga 780
ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc acccgggagg 840
agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg ctggagaact 900
acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc ctgcggctgg 960
agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggaaacc caccccgaca 1020
gcgaaaccgc cttcgagatc aagagcagcg tgcccagcag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1376
<210> 190
<211> 21
<212> DNA
<213> Homo sapiens
<400> 190
aacacagttc agccgagcgc t 21
<210> 191
<211> 21
<212> DNA
<213> Homo sapiens
<400> 191
cgaacaaccg tacagaaagg g 21
<210> 192
<211> 21
<212> DNA
<213> Homo sapiens
<400> 192
gtaaacagta atagcgcagc a 21
<210> 193
<211> 1376
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 193
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tcccttgaac 120
ccggggagaa gccctacaag tgcccggaat gcggaaagag cttcagccag aagtcctcgc 180
tgatcgcgca ccagaggact cacaccggcg aaaagccata caagtgtcct gagtgtggca 240
aatccttctc gcacaagaac gcactgcaga accaccagag aacccacacc ggggaaaagc 300
cgtataagtg ccccgaatgt ggaaagtcgt tcagccagtc atccaacctc gtgcgccatc 360
aaaggactca taccggagag aaaccttaca aatgccctga atgcggcaaa tctttctccc 420
ggaatgatgc cctgaccgag caccagcgca ctcacacggg agagaagccg tacaaatgtc 480
cggagtgcgg aaagtccttc tccgacaaga aggacttgac cagacaccag cggacccata 540
ctggcgaaaa accctataag tgtccagagt gcgggaagtc ctttagccaa gccggtcacc 600
tcgcttccca ccaacggacc cacacaggag aaaagcctta taaatgcccc gagtgcggca 660
aaagcttctc cgataagaag gacctgactc ggcatcagcg cacccatacc ggaaagaaaa 720
cctcagctag cggcagcggc ggcggcagcg gcggcgcccg ggacgacgcc aagagcctga 780
ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc acccgggagg 840
agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg ctggagaact 900
acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc ctgcggctgg 960
agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggaaacc caccccgaca 1020
gcgaaaccgc cttcgagatc aagagcagcg tgcccagcag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1376
<210> 194
<211> 1376
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 194
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ctggcgaaaa accctataag tgcccagaat gcggaaagag cttttcacgg tcggacaacc 180
tcgtgcggca ccaacgcact cataccggag agaagccgta caagtgtcct gagtgcggaa 240
agtcattctc cgactgccgg gatttggccc gccaccaaag aacacacact ggcgaaaagc 300
cctacaagtg cccggagtgt ggaaagtcct tcagcacttc cggagagctg gtccggcacc 360
agaggaccca caccggggag aagccttaca aatgtccaga gtgcggtaaa agcttctcca 420
ccaccggcaa cctcaccgtg caccagcgga cccacactgg agaaaagccg tataaatgcc 480
ccgaatgcgg caagagcttc tcgcgatccg ataagcttgt gcggcatcag agaacgcaca 540
ctggggaaaa gccttataag tgtccggagt gcggcaaatc cttctcccgc actgacaccc 600
tgcgggacca ccagagaacc catactggcg agaagccata caaatgcccg gaatgtggaa 660
agagtttctc gcgcgaggac aacctccaca cccatcagcg cacccatacc ggcaaaaaga 720
cctctgctag cggcagcggc ggcggcagcg gcggcgcccg ggacgacgcc aagagcctga 780
ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc acccgggagg 840
agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg ctggagaact 900
acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc ctgcggctgg 960
agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggaaacc caccccgaca 1020
gcgaaaccgc cttcgagatc aagagcagcg tgcccagcag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1376
<210> 195
<211> 1376
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 195
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggaac 120
ccggagagaa accctacaaa tgcccagagt gcggcaaatc gttctcacgg tccgatcacc 180
tcaccaccca ccagaggacc cataccgggg agaagcctta caagtgtcct gagtgtggaa 240
agtccttcag ccaaaagtcc tcgctgatcg cacaccagcg cacgcacact ggggaaaagc 300
catataaatg cccggagtgt ggcaaatcct tctcccgccg cgacgaactg aacgtgcacc 360
agagaaccca cactggagag aagccgtata agtgtccgga gtgcggaaag agcttctcgc 420
aatccgggga ccttcggaga catcagagga cacacactgg cgaaaagccc tataagtgcc 480
ctgagtgcgg gaagtccttt agccaagccg gtcacctggc ctcccaccaa cggactcaca 540
ccggcgaaaa accgtacaag tgccccgaat gcggaaagtc gttctctacc tccggaaact 600
tgaccgaaca ccagcggacc cacaccggag aaaagccgta caaatgtcct gaatgcggca 660
aaagcttcag ccaggccggt catctcgcga gccatcagcg gactcatact ggcaaaaaga 720
cctcagctag cggcagcggc ggcggcagcg gcggcgcccg ggacgacgcc aagagcctga 780
ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc acccgggagg 840
agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg ctggagaact 900
acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc ctgcggctgg 960
agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggaaacc caccccgaca 1020
gcgaaaccgc cttcgagatc aagagcagcg tgcccagcag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1376
<210> 196
<211> 3521
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 196
gggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gccccaaaga 60
agaagagaaa ggtcggaatt catggcgtgc ccgcagccgg cagcagcggt tccctggagc 120
ccggcgagaa accttacaaa tgccccgagt gcggcaagag cttcagcaga agcgacgatc 180
tggtgaggca ccaaagaacc cacaccggcg aaaaacctta caagtgtccc gaatgcggaa 240
agtccttcag cagagaggac aatctgcaca cccaccagag aacacacacc ggagaaaagc 300
cttacaagtg ccccgaatgc ggcaaatcct tttctagaag cgatcatctg accacccacc 360
aaagaacaca taccggcgag aagccttaca aatgtcccga gtgcggaaag tccttctccc 420
agagagccaa tctgagggct catcaaagga cccataccgg cgaaaagccc tacaaatgcc 480
ccgagtgcgg aaaatccttc agccagctgg cccatctgag agcccaccaa aggacacaca 540
ccggagagaa accctataag tgccccgagt gtggaaaaag cttttcccag agggccaatc 600
tgagggccca tcagaggacc cataccggag agaagcctta taaatgtccc gagtgcggaa 660
aaagcttcag cgagaggagc catctgaggg aacatcaaag aacccacacc ggcgaaaaac 720
ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780
gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840
cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900
agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960
tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020
gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080
tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140
gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200
aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260
gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320
acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380
agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440
ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500
tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560
tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620
aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680
gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740
ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800
acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860
accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920
acaagatcgg cggccccagc ggcggcaagc ggcccgccgc caccaagaag gccggccagg 1980
ccaagaagaa gaagggcagc tacccctacg acgtgcccga ctacgccggg tccgccacca 2040
acttctcgct gctgaagcag gccggagacg tggaagaaaa ccctggacct accagtgccg 2100
gaaagctcgg tagcggagag ggtcggggaa gcctgcttac ttgcggcgac gtggaagaga 2160
accccggtcc gctggagggt tcgtccggct ccggatcccc caagaagaag cggaaggtgg 2220
gcatccacgg cgtgcccgcc gccggcagca gcggatccct ggagcctgga gagaaaccct 2280
acaaatgccc ggaatgcggg aagtcctttt ccgaacgctc gcacctgagg gaacaccaga 2340
gaactcacac cggcgaaaaa ccctataagt gcccagaatg cggaaagagc ttttcacggt 2400
cggacaacct cgtgcggcac caacgcactc ataccggaga gaagccgtac aagtgtcctg 2460
agtgcggaaa gtcattctcc gactgccggg atttggcccg ccaccaaaga acacacactg 2520
gcgaaaagcc ctacaagtgc ccggagtgtg gaaagtcctt cagcacttcc ggagagctgg 2580
tccggcacca gaggacccac accggggaga agccttacaa atgtccagag tgcggtaaaa 2640
gcttctccac caccggcaac ctcaccgtgc accagcggac ccacactgga gaaaagccgt 2700
ataaatgccc cgaatgcggc aagagcttct cgcgatccga taagcttgtg cggcatcaga 2760
gaacgcacac tggggaaaag ccttataagt gtccggagtg cggcaaatcc ttctcccgca 2820
ctgacaccct gcgggaccat cagcgcaccc ataccggcaa aaagacctct gctagcggca 2880
gcggcggcgg cagcggcggc gcccgggacg acgccaagag cctgaccgcc tggagccgga 2940
ccctggtgac cttcaaggac gtgttcgtgg acttcacccg ggaggagtgg aagctgctgg 3000
acaccgccca gcagatcctg taccggaacg tgatgctgga gaactacaag aacctggtga 3060
gcctgggcta ccagctgacc aagcccgacg tgatcctgcg gctggagaag ggcgaggagc 3120
cctggctggt ggagcgggag atccaccagg aaacccaccc cgacagcgaa accgccttcg 3180
agatcaagag cagcgtgccc agcagcggcg gcaagcggcc cgccgccacc aagaaggccg 3240
gccaggccaa gaagaagaag ggcagctacc cctacgacgt gcccgactac gcctgagcgg 3300
ccgcttaatt aagctgcctt ctgcggggct tgccttctgg ccatgccctt cttctctccc 3360
ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtctag aaaaaaaaaa 3420
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3480
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 3521
<210> 197
<211> 3521
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 197
gggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gccccaaaga 60
agaagagaaa ggtcggaatt catggcgtgc ccgcagccgg cagcagcggt tccctggagc 120
ctggagagaa accctacaaa tgcccggaat gcgggaagtc cttttccgaa cgctcgcacc 180
tgagggaaca ccagagaact cacaccggcg aaaaacccta taagtgccca gaatgcggaa 240
agagcttttc acggtcggac aacctcgtgc ggcaccaacg cactcatacc ggagagaagc 300
cgtacaagtg tcctgagtgc ggaaagtcat tctccgactg ccgggatttg gcccgccacc 360
aaagaacaca cactggcgaa aagccctaca agtgcccgga gtgtggaaag tccttcagca 420
cttccggaga gctggtccgg caccagagga cccacaccgg ggagaagcct tacaaatgtc 480
cagagtgcgg taaaagcttc tccaccaccg gcaacctcac cgtgcaccag cggacccaca 540
ctggagaaaa gccgtataaa tgccccgaat gcggcaagag cttctcgcga tccgataagc 600
ttgtgcggca tcagagaacg cacactgggg aaaagcctta taagtgtccg gagtgcggca 660
aatccttctc ccgcactgac accctgcggg accatcagcg cacccatacc ggcaaaaaga 720
cctctgctag cggcagcggc ggcggcagcg gcggcgcccg ggacgacgcc aagagcctga 780
ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc acccgggagg 840
agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg ctggagaact 900
acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc ctgcggctgg 960
agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggaaacc caccccgaca 1020
gcgaaaccgc cttcgagatc aagagcagcg tgcccagcag cggcggcaag cggcccgccg 1080
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140
actacgccgg gtccgccacc aacttctcgc tgctgaagca ggccggagac gtggaagaaa 1200
accctggacc taccagtgcc ggaaagctcg gtagcggaga gggtcgggga agcctgctta 1260
cttgcggcga cgtggaagag aaccccggtc cgctggaggg ttcgtccggc tccggatccc 1320
ccaagaagaa gcggaaggtg ggcatccacg gcgtgcccgc cgccggcagc agcggatccc 1380
tggagcccgg cgagaaacct tacaaatgcc ccgagtgcgg caagagcttc agcagaagcg 1440
acgatctggt gaggcaccaa agaacccaca ccggcgaaaa accttacaag tgtcccgaat 1500
gcggaaagtc cttcagcaga gaggacaatc tgcacaccca ccagagaaca cacaccggag 1560
aaaagcctta caagtgcccc gaatgcggca aatccttttc tagaagcgat catctgacca 1620
cccaccaaag aacacatacc ggcgagaagc cttacaaatg tcccgagtgc ggaaagtcct 1680
tctcccagag agccaatctg agggctcatc aaaggaccca taccggcgaa aagccctaca 1740
aatgccccga gtgcggaaaa tccttcagcc agctggccca tctgagagcc caccaaagga 1800
cacacaccgg agagaaaccc tataagtgcc ccgagtgtgg aaaaagcttt tcccagaggg 1860
ccaatctgag ggcccatcag aggacccata ccggagagaa gccttataaa tgtcccgagt 1920
gcggaaaaag cttcagcgag aggagccatc tgagggaaca tcaaagaacc cacaccggcg 1980
aaaaacccac cggaaaaaag accagcgcta gcggcagcgg cggcggcagc ggcggcgccc 2040
gggacagcaa ggtggagaac aagaccaaga agctgcgggt gttcgaggcc ttcgccggca 2100
tcggcgccca gcggaaggcc ctggagaagg tgcggaagga cgagtacgag atcgtgggcc 2160
tggccgagtg gtacgtgccc gccatcgtga tgtaccaggc catccacaac aacttccaca 2220
ccaagctgga gtacaagagc gtgagccggg aggagatgat cgactacctg gagaacaaga 2280
ccctgagctg gaacagcaag aaccccgtga gcaacggcta ctggaagcgg aagaaggacg 2340
acgagctgaa gatcatctac aacgccatca agctgagcga gaaggagggc aacatcttcg 2400
acatccggga cctgtacaag cggaccctga agaacatcga cctgctgacc tacagcttcc 2460
cctgccagga cctgagccag cagggcatcc agaagggcat gaagcggggc agcggcaccc 2520
ggagcggcct gctgtgggag atcgagcggg ccctggacag caccgagaag aacgacctgc 2580
ccaagtacct gctgatggag aacgtgggcg ccctgctgca caagaagaac gaggaggagc 2640
tgaaccagtg gaagcagaag ctggagagcc tgggctacca gaacagcatc gaggtgctga 2700
acgccgccga cttcggcagc agccaggccc ggcggcgggt gttcatgatc agcaccctga 2760
acgagttcgt ggagctgccc aagggcgaca agaagcccaa gagcatcaag aaggtgctga 2820
acaagatcgt gagcgagaag gacatcctga acaacctgct gaagtacaac ctgaccgagt 2880
tcaagaaaac caagagcaac atcaacaagg ccagcctgat cggctacagc aagttcaaca 2940
gcgagggcta cgtgtacgac cccgagttca ccggccccac cctgaccgcc agcggcgcca 3000
acagccggat caagatcaag gacggcagca acatccggaa gatgaacagc gacgagacct 3060
tcctgtacat cggcttcgac agccaggacg gcaagcgggt gaacgagatc gagttcctga 3120
ccgagaacca gaagatcttc gtgtgcggca acagcatcag cgtggaggtg ctggaggcca 3180
tcatcgacaa gatcggcggc cccagcggcg gcaagcggcc cgccgccacc aagaaggccg 3240
gccaggccaa gaagaagaag ggcagctacc cctacgacgt gcccgactac gcctgagcgg 3300
ccgcttaatt aagctgcctt ctgcggggct tgccttctgg ccatgccctt cttctctccc 3360
ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtctag aaaaaaaaaa 3420
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3480
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 3521
<210> 198
<211> 1385
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 198
gaaataagag agaaaagaag agtaagaaga aatataagac ctaatagtaa tagtaatagc 60
ccaagaagaa gcgcaaggtc gggatccacg gagtcccggc agcaggatcc tcaggctcac 120
tggaaccggg ggaaaaaccc tacaagtgcc cggagtgcgg caagagcttc tcgacctccg 180
ggaacctgac cgagcaccag cgcacccaca ccggagagaa accgtacaag tgccccgagt 240
gcgggaaatc gttctcagac tcgggaaacc tcagggtgca ccagcggacc cacacggggg 300
aaaagccgta caagtgcccg gagtgcggga agtcattctc ccacaagaac gcgctgcaga 360
accaccaaag aacccacacc ggcgaaaaac cgtacaagtg ccccgagtgc ggaaagtcct 420
tctcccgcaa cgacaccctc accgaacacc aacgcaccca caccggagaa aagccctaca 480
agtgcccgga gtgcggaaag agcttcagcc agagggccca cctggaaaga caccagagaa 540
cccacaccgg cgaaaagccg tacaagtgcc cggagtgcgg gaagtccttc agccggtcag 600
acaagctggt ccgccaccaa aggacccaca caggagaaaa gccctacaag tgcccggagt 660
gcggaaaatc gttcagcgac cccggacacc tggtccggca ccagaggacc cacaccgggg 720
agaagccgac cggcaaaaag acctcagcaa gcgggagcgg aggaggaagc ggaggggacg 780
ccaagagcct gaccgcgtgg agcaggaccc tcgtgacctt caaagacgtg ttcgtggact 840
tcacccgcga agagtggaag ctgctggaca ccgcgcagca aatcctgtac cggaacgtga 900
tgctggaaaa ctacaagaac ctcgtcagcc tcggctacca actgaccaag cccgacgtga 960
tcctgcggct ggaaaagggc gaagaaccct ggctcgtgga gcgggagatc caccaggaaa 1020
cccacccgga cagcgaaacc gcgttcgaaa tcaagagcag cgtcagcgga ggaaaaagac 1080
cagccgccac caagaaggcc ggccaagcca agaagaaaaa gggcagctac ccctacgacg 1140
tgccggacta cgcatgagcg gccgcttaat taagctgcct tctgcggggc ttgccttctg 1200
gccatgccct tcttctctcc cttgcacctg tacctcttgg tctttgaata aagcctgagt 1260
aggaagtcta gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1380
aaaaa 1385
<210> 199
<211> 21
<212> DNA
<213> Homo sapiens
<400> 199
acggggaatg ctgccgagag c 21
<210> 200
<211> 21
<212> DNA
<213> Homo sapiens
<400> 200
acctgaaccc tggaaattat a 21
<210> 201
<211> 21
<212> DNA
<213> Homo sapiens
<400> 201
tagacgggga atgctgccga g 21
<210> 202
<211> 21
<212> DNA
<213> Homo sapiens
<400> 202
tgacattgag caatgatatg g 21
<210> 203
<211> 21
<212> DNA
<213> Homo sapiens
<400> 203
agcaaaagaa aatggtaggc g 21
<210> 204
<211> 21
<212> DNA
<213> Homo sapiens
<400> 204
acggggaatg ctgccgagag c 21
<210> 205
<211> 21
<212> DNA
<213> Homo sapiens
<400> 205
acggggaatg ctgccgagag c 21
<210> 206
<211> 21
<212> DNA
<213> Homo sapiens
<400> 206
agcaaaagaa aatggtaggc g 21
<210> 207
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 207
Gly Gly Gly Gly Ser
1 5
<210> 208
<211> 830
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 208
gatgttcatt agcagtggtg ataggttaat tttcaccatc tcttatgcgg ttgaatagtc 60
acctctgaac cactttttcc tccagtaact cctctttctt cggaccttct gcagccaacc 120
tgaaagaata acaaggaggt ggctggaaac ttgttttaag gaaccgcctg tccttccccc 180
gctggaaacc ttgcacctcg gacgctcctg ctcctgcccc cacctgaccc ccgccctcgt 240
tgacatccag gcgcgatgat ctctgctgcc agtagagggc acacttactt tactttcgca 300
aacctgaacg cgggtgctgc ccagagaggg ggcggaggga aagacgcttt gcagcaaaat 360
ccagcatagc gattggttgc tccccgcgtt tgcggcaaag gcctggaggc aggagtaatt 420
tgcaatcctt aaagctgaat tgtgcagtgc atcggatttg gaagctacta tattcactta 480
acacttgaac gctgagctgc aaactcaacg ggtaataacc catcttgaac agcgtacatg 540
ctatacacgc acccctttcc cccgaattgt tttctctttt ggaggtggtg gagggagaga 600
aaagtttact taaaatgcct ttgggtgagg gaccaaggat gagaagaatg ttttttgttt 660
ttcatgccgt ggaataacac aaaataaaaa atcccgaggg aatatacatt atatattaaa 720
tatagatcat ttcagggagc aaacaaatca tgtgtggggc tgggcaacta gctaagtcga 780
agcgtaaata aaatgtgaat acacgtttgc gggttacata cagtgcactt 830
<210> 209
<211> 830
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 209
taggcatcgt tttcctcctt atgcctctat cattcctccc tatctacact aacatcccac 60
gctctgaacg cgcgcccatt aatacccttc tttcctccac tctccctggg actcttgatc 120
aaagcgcggc cctttcccca gccttagcga ggcgccctgc agcctggtac gcgcgtggcg 180
tggcggtggg cgcgcagtgc gttctcggtg tggagggcag ctgttccgcc tgcgatgatt 240
tatactcaca ggacaaggat gcggtttgtc aaacagtact gctacggagg agcagcagag 300
aaagggagag ggtttgagag ggagcaaaag aaaatggtag gcgcgcgtag ttaattcatg 360
cggctctctt actctgttta catcctagag ctagagtgct cggctgcccg gctgagtctc 420
ctccccacct tccccaccct ccccaccctc cccataagcg cccctcccgg gttcccaaag 480
cagagggcgt gggggaaaag aaaaaagatc ctctctcgct aatctccgcc caccggccct 540
ttataatgcg agggtctgga cggctgagga cccccgagct gtgctgctcg cggccgccac 600
cgccgggccc cggccgtccc tggctcccct cctgcctcga gaagggcagg gcttctcaga 660
ggcttggcgg gaaaaagaac ggagggaggg atcgcgctga gtataaaagc cggttttcgg 720
ggctttatct aactcgctgt agtaattcca gcgagaggca gagggagcga gcgggcggcc 780
ggctagggtg gaagagccgg gcgagcagag ctgcgctgcg ggcgtcctgg 830
<210> 210
<211> 7
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 210
tatawaw 7
Claims (57)
- 서열번호 83의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 제1 표적화 모이어티, 및
DNA 메틸트랜스퍼라제를 포함하는 제1 이펙터 모이어티
를 포함하는, 발현 리프레서. - 제1항에 있어서, 상기 제1 표적화 모이어티는 징크 핑거 도메인을 포함하는, 발현 리프레서.
- 제1항 또는 제2항에 있어서, 상기 제1 표적화 모이어티는 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
- 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제1 이펙터 모이어티는 MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는, 발현 리프레서.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 제1 이펙터 모이어티는 서열번호 19 또는 87의 서열, 또는 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
- 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 제1 이펙터 모이어티는 서열번호 30 또는 129의 서열, 또는 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
- 제1항 내지 제6항 중 어느 한 항의 발현 리프레서를 인코딩하는 핵산.
- 제7항에 있어서, 상기 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 46 또는 131에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
- 제7항 또는 제8항 중 어느 한 항에 있어서, 상기 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 52 또는 132에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
- 제7항 내지 제9항 중 어느 한 항에 있어서, 서열번호 63 또는 130에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
- 제1항 내지 제6항 중 어느 한 항에 따른 제1 발현 리프레서, 및
제2 발현 리프레서
를 포함하는, 시스템. - 제11항에 있어서, 상기 제2 발현 리프레서는
게놈 유전자좌에 결합하는 제2 표적화 모이어티, 및
제2 이펙터 모이어티
를 포함하는, 시스템. - 제12항에 있어서, 상기 제2 표적화 모이어티는 서열번호 77, 199 또는 201의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는, 시스템.
- 제12항 또는 제13항에 있어서, 상기 제2 표적화 모이어티는 징크 핑거 도메인을 포함하는, 시스템.
- 제12항 내지 제14항 중 어느 한 항에 있어서, 상기 제2 표적화 모이어티는 서열번호 7, 169, 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템.
- 제12항 내지 제15항 중 어느 한 항에 있어서, 상기 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는, 시스템.
- 제12항 내지 제16항 중 어느 한 항에 있어서, 상기 제2 이펙터는 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템.
- 제12항 내지 제17항 중 어느 한 항에 있어서, 상기 제2 발현 리프레서는 서열번호 24, 177, 183, 179, 또는 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템.
- 제12항 내지 제18항 중 어느 한 항의 시스템의 제1 발현 리프레서 및 제2 리프레서를 인코딩하는 핵산.
- 제19항에 있어서, 서열번호 113, 196, 또는 197에 따른 뉴클레오타이드 서열을 포함하고, 폴리-A 서열은 선택적인, 핵산.
- a) i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는 제1 발현 리프레서; 및
b) i) 서열번호 7에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는 제2 발현 리프레서
를 포함하는, 발현 억제 시스템. - a) i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는 제1 발현 리프레서, 및
b) i) 서열번호 169, 또는 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는 제2 발현 리프레서
를 포함하는, 발현 억제 시스템. - a) i) 서열번호 169, 또는 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는 제1 발현 리프레서, 및
b) i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 13, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는 제2 발현 리프레서
를 포함하는 발현 억제 시스템. - 제1항 내지 제23항 중 어느 한 항에 있어서, 예를 들어 ELISA에 의해 측정 시, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 발현 리프레서 또는 발현 억제 시스템.
- 본 명세서에 기재된 제1 발현 리프레서를 인코딩하는 제1 아미노산 영역 및 본 명세서에 기재된 제2 발현 리프레서를 포함하는 제2 아미노산 영역을 포함하는 융합 단백질.
- 제1항 내지 제25항 중 어느 한 항에 있어서, 상기 MYC 유전자좌에 대한 발현 리프레서의 결합은 발현 리프레서 또는 발현 억제 시스템으로 형질감염 후 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 80, 또는 96시간 후에 MYC의 발현을 상당히 감소시키는, 발현 리프레서, 융합 단백질, 또는 발현 억제 시스템.
- 제1항 내지 제26항 중 어느 한 항에 있어서, 복수의 세포를 발현 리프레서, 발현 리프레서 시스템, 또는 발현 리프레서 또는 제1 발현 리프레서 및 제2 발현 리프레서와 접촉시키는 것은 복수의 세포의 생존능을 감소시키는, 발현 리프레서, 융합 단백질, 또는 발현 억제 시스템.
- 제1항 내지 제27항 중 어느 한 항에 있어서, 상기 발현 리프레서 또는 발현 억제 시스템의 투여는 적어도 5%, 6%, 7%, 8%, 9% 10%, 12%, 15%, 17%, 20%, 25% 30%, 40%, 45%, 50%, 55%, 60%, 65%, 75%의 표적 세포(예를 들어, 암 세포)의 아폽토시스를 초래하는, 발현 리프레서, 융합 단백질, 또는 발현 억제 시스템.
- 제17d항에 있어서, 상기 복수의 세포는 복수의 암 세포 및 복수의 비-암 세포를 포함하는, 발현 리프레서, 융합 단백질, 또는 발현 억제 시스템.
- 제17e에 있어서, 상기 복수의 세포를 시스템 또는 시스템을 인코딩하는 핵산과 접촉시키는 것은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 감소시키며, 선택적으로 복수의 암 세포의 생존능은 복수의 비-암 세포의 생존능보다 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 많이 감소시키는, 발현 리프레서, 융합 단백질, 또는 발현 억제 시스템.
- 제1항 내지 제30항 중 어느 한 항의 발현 리프레서, 융합 단백질, 또는 시스템을 인코딩하는 서열을 포함하는 핵산.
- 발현 억제 시스템을 인코딩하는 핵산으로서, 상기 핵산은
a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서,
i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는, 제1 발현 리프레서, 및
b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서,
i) 서열번호 7에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는, 제2 발현 리프레서
를 포함하는, 핵산. - 발현 억제 시스템을 인코딩하는 핵산으로서,
a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서, 상기 제1 발현 리프레서는 다음을 포함함:
i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티, 및
b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서, 제2 발현 리프레서는 다음을 포함함:
i) 서열번호 169, 또는 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는, 핵산. - 발현 억제 시스템을 인코딩하는 핵산으로서,
a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서,
i) 서열번호 169, 또는 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는, 제1 발현 리프레서, 및
b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서,
i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 13, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는 제2 발현 리프레서
를 포함하는, 핵산. - 제19항, 제21항 또는 제22항 중 어느 한 항에 있어서, 서열번호 93, 94, 112, 113, 196, 197의 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
- 표 12의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티, 및
선택적으로, 이펙터 모이어티
를 포함하는, 발현 리프레서. - 표 4에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 4, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 표적화 모이어티, 및
선택적으로, 이펙터 모이어티
를 포함하는, 발현 리프레서. - 제37항에 있어서, 표 7 또는 표 9에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
- 표 5, 표 6, 표 8, 표 16, 표 10에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 5, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
- 제1항 내지 제39항 중 어느 한 항의 융합 단백질, 시스템, 또는 발현 리프레서를 인코딩하는 핵산을 포함하는 벡터.
- 제1항 내지 제40항 중 어느 한 항의 발현 리프레서, 시스템, 융합 단백질, 핵산, 또는 벡터를 포함하는 반응 혼합물.
- 제1항 내지 제41항 중 어느 한 항의 발현 리프레서, 시스템, 융합 단백질, 핵산, 벡터, 또는 반응 혼합물을 포함하는 약제학적 조성물.
- 필요로 하는 대상체에서 암을 치료하는 방법으로서, 상기 방법은
제1항 내지 제20항 중 어느 한 항의 발현 리프레서, 시스템, 융합 단백질, 또는 발현 리프레서 또는 시스템을 인코딩하는 핵산을 투여하는 단계
를 포함하는, 방법. - 제43항에 있어서, 상기 암은 간세포 암종(HCC), 섬유층판 간세포 암종(FHCC), 담관암종, 혈관육종, 2차 간암, 폐암, 비소세포 폐암(NSCLC), 선암종, 소세포 폐암(SCLC), 대세포 (미분화) 암종, 삼중 음성 유방암, 위 선암종, 자궁내막 암종, 또는 췌 암종인, 방법.
- 필요로 하는 대상체에서 간염을 치료하는 방법으로서, 상기 방법은
제1항 내지 제42항 중 어느 한 항의 발현 리프레서, 융합 단백질, 시스템, 또는 발현 리프레서 또는 시스템을 인코딩하는 핵산을 투여하는 단계
를 포함하는 방법. - 필요로 하는 대상체에서 종양 성장을 감소시키는 방법으로서, 상기 방법은
제1항 내지 제42항 중 어느 한 항의 발현 리프레서, 융합 단백질, 시스템, 핵산, 벡터, 또는 약제학적 조성물을 대상체에게 투여하는 단계
를 포함하며,
이에 의해 대상체에서 종양 성장을 감소시키는, 방법. - 키나제 억제제, 예를 들어 소라페닙에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 제1항 내지 제42항 중 어느 한 항의 발현 리프레서 또는 시스템을 암을 앓는 대상체에게 투여하는 단계를 포함하며, 선택적으로 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석에서 키나제 억제제의 IC50을 10%, 20%, 30%, 또는 40%만큼 낮추는, 방법.
- 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 제1항 내지 제42항 중 어느 한 항의 발현 리프레서, 또는 시스템을 암을 앓는 대상체에게 투여하는 단계를 포함하며, 선택적으로 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석에서 브로모도메인 억제제의 IC50를 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%만큼 낮추는, 방법.
- MEK 억제제, 예를 들어 트라메티닙에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 제1항 내지 제42항 중 어느 한 항의 발현 리프레서, 또는 시스템을 암을 앓는 대상체에게 투여하는 단계를 포함하며, 선택적으로 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석에서 MEK 억제제의 IC50를 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%만큼 낮추는, 방법.
- 제43항 내지 제49항 중 어느 한 항에 있어서, 상기 암은 참조 수준에 비해(예를 들어, 참조 서열의 MYC 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 증가된 MYC 발현을 특징으로 하는 세포, 및 참조 수준에 비해(예를 들어, 참조 세포의 MYC 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 증가된 MYC 발현을 특징으로 하지 않는, 예를 들어 정상적인 MYC 발현을 갖는 세포를 포함하는, 방법.
- 제43항 내지 제50항 중 어느 한 항에 있어서,
a) 첫째, 대상체에게 청구항 중 어느 하나의 발현 리프레서 또는 시스템의 제1 복수의 용량을 투여하되, 선택적으로 제1 복수의 용량의 각각의 후속 용량은 제1 복수의 용량의 이전 용량으로부터 5일 후에 투여되는, 단계;
b) 둘째, 일정 기간(예를 들어, "약물 휴지기") 동안, 예를 들어 약 2주 동안 발현 리프레서 또는 시스템을 중단시키는 단계, 및
c) 셋째, 대상체에게 발현 리프레서 또는 시스템의 제2 복수의 용량을 투여하되, 선택적으로 제2 복수의 용량의 후속 용량은 제2 복수의 용량의 이전 용량으로부터 5일 후에 투여되는, 단계
를 포함하는, 방법. - 제43항 내지 제51항 중 어느 한 항에 있어서, 종양 부피는 발현 리프레서, 융합 단백질, 또는 시스템으로의 치료 중단 후 (예를 들어, 검출 가능하지 않은 수준으로) 감소되는, 방법.
- 제43항 내지 제52항 중 어느 한 항에 있어서, 상기 방법은
a. 세포를 제2 치료제와 접촉시키는 단계, 또는
b. 제2 치료제를 대상체에게 투여하되, 선택적으로 상기 제2 치료제는 청구항 중 어느 한 항의 발현 리프레서, 시스템, 융합 단백질, 핵산, 벡터, 반응 혼합물, 또는 약제학적 조성물이 아닌, 단계
를 추가로 포함하는, 방법. - 제43항 내지 제53항 중 어느 한 항에 있어서, 상기 제2 치료제는 면역요법, 면역 관문 및 항-혈관-내피-성장 인자 요법 중 하나 또는 둘 다, 전신 화학요법, 타이로신 키나제 억제제, 예를 들어 소라페닙, 미토겐-활성화 단백질 키나제 키나제 억제제), 예를 들어 트라메티닙, 또는 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1, 예를 들어 비라브레십인, 방법.
- 제43항 내지 제54항 중 어느 한 항에 있어서, 상기 제1 및 제2 치료제는 동시에 투여되는, 방법
- 제43항 내지 제55항 중 어느 한 항에 있어서, 상기 제1 및 제2 치료제는 순차적으로 투여되는, 방법.
- 제43항 내지 제56항 중 어느 한 항에 있어서, 상기 대상체는 적어도 일부 세포에서 MYC의 과발현을 갖는, 방법.
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063125833P | 2020-12-15 | 2020-12-15 | |
US63/125,833 | 2020-12-15 | ||
US202163137097P | 2021-01-13 | 2021-01-13 | |
US63/137,097 | 2021-01-13 | ||
US202163212991P | 2021-06-21 | 2021-06-21 | |
US63/212,991 | 2021-06-21 | ||
US202163281022P | 2021-11-18 | 2021-11-18 | |
US63/281,022 | 2021-11-18 | ||
PCT/US2021/010059 WO2022132195A2 (en) | 2020-12-15 | 2021-12-15 | Compositions and methods for modulation myc expression |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230120138A true KR20230120138A (ko) | 2023-08-16 |
Family
ID=82060102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237024060A KR20230120138A (ko) | 2020-12-15 | 2021-12-15 | Myc 발현을 조절하기 위한 조성물 및 방법 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP4262849A2 (ko) |
JP (1) | JP2023553490A (ko) |
KR (1) | KR20230120138A (ko) |
AU (1) | AU2021401231A1 (ko) |
CA (1) | CA3205133A1 (ko) |
WO (1) | WO2022132195A2 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115192714A (zh) * | 2022-07-08 | 2022-10-18 | 沈阳药科大学 | Hdac6抑制剂在制备治疗dnmt3a基因缺失癌症的药物中的用途 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201119904D0 (en) * | 2011-11-17 | 2011-12-28 | Univ Vilnius | Analysis of methylation sites |
KR101900278B1 (ko) * | 2016-04-18 | 2018-09-19 | 건국대학교 글로컬산학협력단 | Myc-ap4 축 활성화된 암의 예방 또는 치료용 조성물의 스크리닝 방법 |
WO2018183808A1 (en) * | 2017-03-31 | 2018-10-04 | Agenovir Corporation | Antiviral therapeutic |
US20220380760A1 (en) * | 2018-10-15 | 2022-12-01 | Flagship Pioneering Innovations V, Inc. | Disrupting genomic complex assembly in fusion genes |
WO2020163017A1 (en) * | 2019-02-06 | 2020-08-13 | Klogenix Llc | Dna binding proteins and uses thereof |
-
2021
- 2021-12-15 EP EP21907332.7A patent/EP4262849A2/en active Pending
- 2021-12-15 JP JP2023536049A patent/JP2023553490A/ja active Pending
- 2021-12-15 AU AU2021401231A patent/AU2021401231A1/en active Pending
- 2021-12-15 KR KR1020237024060A patent/KR20230120138A/ko unknown
- 2021-12-15 WO PCT/US2021/010059 patent/WO2022132195A2/en active Application Filing
- 2021-12-15 CA CA3205133A patent/CA3205133A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022132195A8 (en) | 2023-06-22 |
AU2021401231A1 (en) | 2023-06-29 |
JP2023553490A (ja) | 2023-12-21 |
WO2022132195A3 (en) | 2022-07-28 |
WO2022132195A2 (en) | 2022-06-23 |
EP4262849A2 (en) | 2023-10-25 |
CA3205133A1 (en) | 2022-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7008850B2 (ja) | 核酸ターゲティング核酸の組成物および方法 | |
KR102302679B1 (ko) | 가이드 rna 및 엔도뉴클레아제를 유효성분으로 포함하는 암 치료용 약학적 조성물 | |
US20220389519A1 (en) | Biomarkers predictive of anti-immune checkpoint response | |
EP3867368A1 (en) | Disrupting genomic complex assembly in fusion genes | |
JP2011254830A (ja) | 結腸癌に関するポリヌクレオチド | |
KR20230074525A (ko) | 유전자 발현을 억제하기 위한 조성물 및 방법 | |
CN115209923A (zh) | 治疗肝病的组合物和方法 | |
KR20230120138A (ko) | Myc 발현을 조절하기 위한 조성물 및 방법 | |
US20140248254A1 (en) | The use of ache as nuclease | |
Dockendorff et al. | Cloning of karyopherin-α3 from Drosophila through its interaction with the nuclear localization sequence of germ cell-less protein | |
TW202317601A (zh) | 用於調節myc表現之組合物及方法 | |
US20220267756A1 (en) | Compositions and methods for modulating genomic complex integrity index | |
WO2020081588A1 (en) | Swi/snf family chromatin remodeling complexes and uses thereof | |
US20220348893A1 (en) | Methods and compositions for modulating frataxin expression and treating friedrich's ataxia | |
WO2002101076A2 (en) | Methods for targeted expression of therapeutic nucleic acid | |
KR20230079181A (ko) | 다중 유전자의 발현을 억제하는 조성물 및 방법 | |
WO2024040229A2 (en) | Combination therapies comprising myc modulators and checkpoint inhibitors | |
CN116635086A (zh) | 用于抑制多个基因的表达的组合物和方法 | |
CN116829175A (zh) | 用于调节myc表达的组合物和方法 | |
KR20230172456A (ko) | 침입하고 자율적으로 용해하도록 설계된 치료 단백질의 세포내 전달 및 이의 사용 방법 |