KR20230079181A - 다중 유전자의 발현을 억제하는 조성물 및 방법 - Google Patents
다중 유전자의 발현을 억제하는 조성물 및 방법 Download PDFInfo
- Publication number
- KR20230079181A KR20230079181A KR1020237014768A KR20237014768A KR20230079181A KR 20230079181 A KR20230079181 A KR 20230079181A KR 1020237014768 A KR1020237014768 A KR 1020237014768A KR 20237014768 A KR20237014768 A KR 20237014768A KR 20230079181 A KR20230079181 A KR 20230079181A
- Authority
- KR
- South Korea
- Prior art keywords
- site
- specific
- disruptor
- gene
- sequence
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 695
- 238000000034 method Methods 0.000 title claims abstract description 307
- 230000014509 gene expression Effects 0.000 title claims abstract description 167
- 239000000203 mixture Substances 0.000 title claims description 35
- 230000002401 inhibitory effect Effects 0.000 title claims description 7
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 claims abstract description 47
- 102100034221 Growth-regulated alpha protein Human genes 0.000 claims abstract description 44
- 102100039398 C-X-C motif chemokine 2 Human genes 0.000 claims abstract description 30
- 101000889128 Homo sapiens C-X-C motif chemokine 2 Proteins 0.000 claims abstract description 30
- 108090001007 Interleukin-8 Proteins 0.000 claims abstract description 30
- 102000004890 Interleukin-8 Human genes 0.000 claims abstract description 30
- 102100036189 C-X-C motif chemokine 3 Human genes 0.000 claims abstract description 27
- 101000947193 Homo sapiens C-X-C motif chemokine 3 Proteins 0.000 claims abstract description 27
- 101000582950 Homo sapiens Platelet factor 4 Proteins 0.000 claims abstract description 27
- 102100030304 Platelet factor 4 Human genes 0.000 claims abstract description 27
- 230000000770 proinflammatory effect Effects 0.000 claims abstract description 26
- 102100036150 C-X-C motif chemokine 5 Human genes 0.000 claims abstract description 22
- 101000947186 Homo sapiens C-X-C motif chemokine 5 Proteins 0.000 claims abstract description 22
- 101000947178 Homo sapiens Platelet basic protein Proteins 0.000 claims abstract description 22
- 102100036153 C-X-C motif chemokine 6 Human genes 0.000 claims abstract description 20
- 101000947177 Homo sapiens C-X-C motif chemokine 6 Proteins 0.000 claims abstract description 20
- 102100036154 Platelet basic protein Human genes 0.000 claims abstract description 20
- 239000012636 effector Substances 0.000 claims description 435
- 150000007523 nucleic acids Chemical class 0.000 claims description 283
- 230000008685 targeting Effects 0.000 claims description 266
- 102000039446 nucleic acids Human genes 0.000 claims description 197
- 108020004707 nucleic acids Proteins 0.000 claims description 197
- 102000004169 proteins and genes Human genes 0.000 claims description 163
- 210000004027 cell Anatomy 0.000 claims description 162
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 157
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 148
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 138
- 229920001184 polypeptide Polymers 0.000 claims description 134
- 230000027455 binding Effects 0.000 claims description 129
- 239000003795 chemical substances by application Substances 0.000 claims description 95
- 210000005260 human cell Anatomy 0.000 claims description 85
- 150000001413 amino acids Chemical group 0.000 claims description 80
- 108020004414 DNA Proteins 0.000 claims description 73
- 230000000694 effects Effects 0.000 claims description 73
- 239000002773 nucleotide Substances 0.000 claims description 70
- 125000003729 nucleotide group Chemical group 0.000 claims description 67
- 230000001404 mediated effect Effects 0.000 claims description 66
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 claims description 65
- 239000012634 fragment Substances 0.000 claims description 62
- 239000011701 zinc Substances 0.000 claims description 62
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 claims description 59
- 108010014064 CCCTC-Binding Factor Proteins 0.000 claims description 58
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 claims description 58
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 51
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 46
- 108020005004 Guide RNA Proteins 0.000 claims description 46
- 238000006467 substitution reaction Methods 0.000 claims description 44
- 102000003964 Histone deacetylase Human genes 0.000 claims description 42
- 108090000353 Histone deacetylase Proteins 0.000 claims description 42
- 102100035042 Histone-lysine N-methyltransferase EHMT2 Human genes 0.000 claims description 42
- 230000035772 mutation Effects 0.000 claims description 42
- 101000877312 Homo sapiens Histone-lysine N-methyltransferase EHMT2 Proteins 0.000 claims description 41
- 230000002829 reductive effect Effects 0.000 claims description 41
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 31
- 102000004127 Cytokines Human genes 0.000 claims description 28
- 108090000695 Cytokines Proteins 0.000 claims description 28
- 108091034117 Oligonucleotide Proteins 0.000 claims description 27
- 230000000295 complement effect Effects 0.000 claims description 27
- -1 KRAB Proteins 0.000 claims description 25
- 102000011787 Histone Methyltransferases Human genes 0.000 claims description 23
- 108010036115 Histone Methyltransferases Proteins 0.000 claims description 23
- 108060004795 Methyltransferase Proteins 0.000 claims description 23
- 230000009467 reduction Effects 0.000 claims description 23
- 102000016397 Methyltransferase Human genes 0.000 claims description 22
- 208000027866 inflammatory disease Diseases 0.000 claims description 22
- 239000003623 enhancer Substances 0.000 claims description 21
- 201000010099 disease Diseases 0.000 claims description 20
- 230000001973 epigenetic effect Effects 0.000 claims description 19
- 230000004048 modification Effects 0.000 claims description 18
- 238000012986 modification Methods 0.000 claims description 18
- 108091006107 transcriptional repressors Proteins 0.000 claims description 18
- 102100025169 Max-binding protein MNT Human genes 0.000 claims description 17
- 230000004927 fusion Effects 0.000 claims description 17
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 claims description 16
- 102100040247 Tumor necrosis factor Human genes 0.000 claims description 16
- 108010074870 Histone Demethylases Proteins 0.000 claims description 15
- 102000008157 Histone Demethylases Human genes 0.000 claims description 14
- 230000007423 decrease Effects 0.000 claims description 14
- 101000940144 Homo sapiens Transcriptional repressor protein YY1 Proteins 0.000 claims description 13
- 102100031142 Transcriptional repressor protein YY1 Human genes 0.000 claims description 13
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 13
- 239000000126 substance Substances 0.000 claims description 13
- 229910052725 zinc Inorganic materials 0.000 claims description 13
- 108010033040 Histones Proteins 0.000 claims description 12
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 claims description 12
- 241000700605 Viruses Species 0.000 claims description 12
- 208000015181 infectious disease Diseases 0.000 claims description 12
- 238000003780 insertion Methods 0.000 claims description 12
- 230000037431 insertion Effects 0.000 claims description 12
- 230000002103 transcriptional effect Effects 0.000 claims description 12
- 241000894006 Bacteria Species 0.000 claims description 11
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 claims description 11
- 238000012217 deletion Methods 0.000 claims description 11
- 230000037430 deletion Effects 0.000 claims description 11
- 101000909250 Homo sapiens DNA (cytosine-5)-methyltransferase 3-like Proteins 0.000 claims description 10
- 230000001066 destructive effect Effects 0.000 claims description 10
- 102100027770 Histone-lysine N-methyltransferase KMT5B Human genes 0.000 claims description 9
- 101000625376 Homo sapiens Transcription initiation factor TFIID subunit 3 Proteins 0.000 claims description 9
- 101000671637 Homo sapiens Upstream stimulatory factor 1 Proteins 0.000 claims description 9
- 101000759226 Homo sapiens Zinc finger protein 143 Proteins 0.000 claims description 9
- 101710163270 Nuclease Proteins 0.000 claims description 9
- 108091093037 Peptide nucleic acid Proteins 0.000 claims description 9
- 102100025042 Transcription initiation factor TFIID subunit 3 Human genes 0.000 claims description 9
- 102100040105 Upstream stimulatory factor 1 Human genes 0.000 claims description 9
- 102100023389 Zinc finger protein 143 Human genes 0.000 claims description 9
- 230000002708 enhancing effect Effects 0.000 claims description 9
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 claims description 8
- 102100024811 DNA (cytosine-5)-methyltransferase 3-like Human genes 0.000 claims description 8
- 102100038720 Histone deacetylase 9 Human genes 0.000 claims description 8
- 102100035043 Histone-lysine N-methyltransferase EHMT1 Human genes 0.000 claims description 8
- 108060008682 Tumor Necrosis Factor Proteins 0.000 claims description 8
- 210000004962 mammalian cell Anatomy 0.000 claims description 8
- 206010039073 rheumatoid arthritis Diseases 0.000 claims description 8
- 208000025721 COVID-19 Diseases 0.000 claims description 7
- 102000019034 Chemokines Human genes 0.000 claims description 7
- 108010012236 Chemokines Proteins 0.000 claims description 7
- 230000004568 DNA-binding Effects 0.000 claims description 7
- 102100028998 Histone-lysine N-methyltransferase SUV39H1 Human genes 0.000 claims description 7
- 101000696705 Homo sapiens Histone-lysine N-methyltransferase SUV39H1 Proteins 0.000 claims description 7
- 239000003814 drug Substances 0.000 claims description 7
- 101150061166 tetR gene Proteins 0.000 claims description 7
- 108700026220 vif Genes Proteins 0.000 claims description 7
- 241000233866 Fungi Species 0.000 claims description 6
- 102100039996 Histone deacetylase 1 Human genes 0.000 claims description 6
- 102100039999 Histone deacetylase 2 Human genes 0.000 claims description 6
- 102100021455 Histone deacetylase 3 Human genes 0.000 claims description 6
- 101001035024 Homo sapiens Histone deacetylase 1 Proteins 0.000 claims description 6
- 101001035011 Homo sapiens Histone deacetylase 2 Proteins 0.000 claims description 6
- 101000899282 Homo sapiens Histone deacetylase 3 Proteins 0.000 claims description 6
- 101000931374 Homo sapiens Zinc finger protein ZFPM1 Proteins 0.000 claims description 6
- 208000002193 Pain Diseases 0.000 claims description 6
- 102100020993 Zinc finger protein ZFPM1 Human genes 0.000 claims description 6
- 208000006673 asthma Diseases 0.000 claims description 6
- 238000011144 upstream manufacturing Methods 0.000 claims description 6
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 claims description 5
- 102100023696 Histone-lysine N-methyltransferase SETDB1 Human genes 0.000 claims description 5
- 101000684609 Homo sapiens Histone-lysine N-methyltransferase SETDB1 Proteins 0.000 claims description 5
- 101000616738 Homo sapiens NAD-dependent protein deacetylase sirtuin-6 Proteins 0.000 claims description 5
- 101000709248 Homo sapiens NAD-dependent protein deacetylase sirtuin-7 Proteins 0.000 claims description 5
- 101000616727 Homo sapiens NAD-dependent protein deacylase sirtuin-5, mitochondrial Proteins 0.000 claims description 5
- 101000863629 Homo sapiens NAD-dependent protein lipoamidase sirtuin-4, mitochondrial Proteins 0.000 claims description 5
- 108091058560 IL8 Proteins 0.000 claims description 5
- 102100031455 NAD-dependent protein deacetylase sirtuin-1 Human genes 0.000 claims description 5
- 102100022913 NAD-dependent protein deacetylase sirtuin-2 Human genes 0.000 claims description 5
- 102100030710 NAD-dependent protein deacetylase sirtuin-3, mitochondrial Human genes 0.000 claims description 5
- 102100021840 NAD-dependent protein deacetylase sirtuin-6 Human genes 0.000 claims description 5
- 102100034376 NAD-dependent protein deacetylase sirtuin-7 Human genes 0.000 claims description 5
- 102100021839 NAD-dependent protein deacylase sirtuin-5, mitochondrial Human genes 0.000 claims description 5
- 102100030709 NAD-dependent protein lipoamidase sirtuin-4, mitochondrial Human genes 0.000 claims description 5
- 108010041191 Sirtuin 1 Proteins 0.000 claims description 5
- 108010041216 Sirtuin 2 Proteins 0.000 claims description 5
- 230000002757 inflammatory effect Effects 0.000 claims description 5
- 239000003550 marker Substances 0.000 claims description 5
- 244000052769 pathogen Species 0.000 claims description 5
- 208000006820 Arthralgia Diseases 0.000 claims description 4
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 claims description 4
- 201000005569 Gout Diseases 0.000 claims description 4
- 108091005772 HDAC11 Proteins 0.000 claims description 4
- 101710160287 Heterochromatin protein 1 Proteins 0.000 claims description 4
- 102100039385 Histone deacetylase 11 Human genes 0.000 claims description 4
- 102100021454 Histone deacetylase 4 Human genes 0.000 claims description 4
- 102100021453 Histone deacetylase 5 Human genes 0.000 claims description 4
- 102100022537 Histone deacetylase 6 Human genes 0.000 claims description 4
- 108091016366 Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 claims description 4
- 102100027788 Histone-lysine N-methyltransferase KMT5C Human genes 0.000 claims description 4
- 102100023676 Histone-lysine N-methyltransferase SETDB2 Human genes 0.000 claims description 4
- 102100028988 Histone-lysine N-methyltransferase SUV39H2 Human genes 0.000 claims description 4
- 101000899259 Homo sapiens Histone deacetylase 4 Proteins 0.000 claims description 4
- 101000899255 Homo sapiens Histone deacetylase 5 Proteins 0.000 claims description 4
- 101000899330 Homo sapiens Histone deacetylase 6 Proteins 0.000 claims description 4
- 101001032113 Homo sapiens Histone deacetylase 7 Proteins 0.000 claims description 4
- 101001032092 Homo sapiens Histone deacetylase 9 Proteins 0.000 claims description 4
- 101000877314 Homo sapiens Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 claims description 4
- 101001028782 Homo sapiens Histone-lysine N-methyltransferase EZH1 Proteins 0.000 claims description 4
- 101001008821 Homo sapiens Histone-lysine N-methyltransferase KMT5B Proteins 0.000 claims description 4
- 101001008824 Homo sapiens Histone-lysine N-methyltransferase KMT5C Proteins 0.000 claims description 4
- 101000684615 Homo sapiens Histone-lysine N-methyltransferase SETDB2 Proteins 0.000 claims description 4
- 101000696699 Homo sapiens Histone-lysine N-methyltransferase SUV39H2 Proteins 0.000 claims description 4
- 101001008816 Homo sapiens N-lysine methyltransferase KMT5A Proteins 0.000 claims description 4
- 101001035694 Homo sapiens Polyamine deacetylase HDAC10 Proteins 0.000 claims description 4
- 101000584499 Homo sapiens Polycomb protein SUZ12 Proteins 0.000 claims description 4
- 208000022559 Inflammatory bowel disease Diseases 0.000 claims description 4
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 claims description 4
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 claims description 4
- WWGBHDIHIVGYLZ-UHFFFAOYSA-N N-[4-[3-[[[7-(hydroxyamino)-7-oxoheptyl]amino]-oxomethyl]-5-isoxazolyl]phenyl]carbamic acid tert-butyl ester Chemical compound C1=CC(NC(=O)OC(C)(C)C)=CC=C1C1=CC(C(=O)NCCCCCCC(=O)NO)=NO1 WWGBHDIHIVGYLZ-UHFFFAOYSA-N 0.000 claims description 4
- 102100027771 N-lysine methyltransferase KMT5A Human genes 0.000 claims description 4
- 102100029494 Neutrophil defensin 1 Human genes 0.000 claims description 4
- 206010058105 Neutrophilic dermatosis Diseases 0.000 claims description 4
- 102100039388 Polyamine deacetylase HDAC10 Human genes 0.000 claims description 4
- 102100030702 Polycomb protein SUZ12 Human genes 0.000 claims description 4
- 201000004681 Psoriasis Diseases 0.000 claims description 4
- 108010071034 Retinoblastoma-Binding Protein 4 Proteins 0.000 claims description 4
- 102000007508 Retinoblastoma-Binding Protein 4 Human genes 0.000 claims description 4
- 108091005770 SIRT3 Proteins 0.000 claims description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 4
- 230000001154 acute effect Effects 0.000 claims description 4
- 239000003607 modifier Substances 0.000 claims description 4
- 201000008482 osteoarthritis Diseases 0.000 claims description 4
- 230000001717 pathogenic effect Effects 0.000 claims description 4
- 208000023504 respiratory system disease Diseases 0.000 claims description 4
- 230000002441 reversible effect Effects 0.000 claims description 4
- 150000003384 small molecules Chemical class 0.000 claims description 4
- 230000000638 stimulation Effects 0.000 claims description 4
- 208000011580 syndromic disease Diseases 0.000 claims description 4
- 208000023275 Autoimmune disease Diseases 0.000 claims description 3
- 239000004952 Polyamide Substances 0.000 claims description 3
- 241000194017 Streptococcus Species 0.000 claims description 3
- 206010042566 Superinfection Diseases 0.000 claims description 3
- 208000036142 Viral infection Diseases 0.000 claims description 3
- 230000006378 damage Effects 0.000 claims description 3
- 229920002647 polyamide Polymers 0.000 claims description 3
- 239000011541 reaction mixture Substances 0.000 claims description 3
- 238000003753 real-time PCR Methods 0.000 claims description 3
- 230000002195 synergetic effect Effects 0.000 claims description 3
- 230000009385 viral infection Effects 0.000 claims description 3
- 208000024172 Cardiovascular disease Diseases 0.000 claims description 2
- 208000000094 Chronic Pain Diseases 0.000 claims description 2
- 201000004624 Dermatitis Diseases 0.000 claims description 2
- 206010065390 Inflammatory pain Diseases 0.000 claims description 2
- 208000019693 Lung disease Diseases 0.000 claims description 2
- 206010052904 Musculoskeletal stiffness Diseases 0.000 claims description 2
- 102000055027 Protein Methyltransferases Human genes 0.000 claims description 2
- 108700040121 Protein Methyltransferases Proteins 0.000 claims description 2
- 206010042674 Swelling Diseases 0.000 claims description 2
- 238000005299 abrasion Methods 0.000 claims description 2
- 208000005298 acute pain Diseases 0.000 claims description 2
- 239000000654 additive Substances 0.000 claims description 2
- 230000000996 additive effect Effects 0.000 claims description 2
- 206010003246 arthritis Diseases 0.000 claims description 2
- 239000000090 biomarker Substances 0.000 claims description 2
- 206010006451 bronchitis Diseases 0.000 claims description 2
- 238000007385 chemical modification Methods 0.000 claims description 2
- 201000003146 cystitis Diseases 0.000 claims description 2
- 102000027596 immune receptors Human genes 0.000 claims description 2
- 108091008915 immune receptors Proteins 0.000 claims description 2
- 208000014674 injury Diseases 0.000 claims description 2
- 208000017169 kidney disease Diseases 0.000 claims description 2
- 208000019423 liver disease Diseases 0.000 claims description 2
- 230000004770 neurodegeneration Effects 0.000 claims description 2
- 208000015122 neurodegenerative disease Diseases 0.000 claims description 2
- 230000005855 radiation Effects 0.000 claims description 2
- 230000008961 swelling Effects 0.000 claims description 2
- 229940124597 therapeutic agent Drugs 0.000 claims description 2
- 230000008733 trauma Effects 0.000 claims description 2
- 102100038715 Histone deacetylase 8 Human genes 0.000 claims 12
- 101001032118 Homo sapiens Histone deacetylase 8 Proteins 0.000 claims 12
- 102100030323 Epigen Human genes 0.000 claims 8
- 101000938352 Homo sapiens Epigen Proteins 0.000 claims 8
- 101000712977 Homo sapiens Ras association domain-containing protein 6 Proteins 0.000 claims 8
- 102100033216 Ras association domain-containing protein 6 Human genes 0.000 claims 8
- 229920000642 polymer Polymers 0.000 claims 7
- 201000003176 Severe Acute Respiratory Syndrome Diseases 0.000 claims 4
- 206010035664 Pneumonia Diseases 0.000 claims 2
- 208000037847 SARS-CoV-2-infection Diseases 0.000 claims 2
- 238000002203 pretreatment Methods 0.000 claims 2
- 101710113089 DNA methyltransferase A Proteins 0.000 claims 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 claims 1
- 206010030124 Oedema peripheral Diseases 0.000 claims 1
- 206010061418 Zygomycosis Diseases 0.000 claims 1
- 230000005856 abnormality Effects 0.000 claims 1
- 239000003102 growth factor Substances 0.000 claims 1
- 208000030247 mild fever Diseases 0.000 claims 1
- 201000007524 mucormycosis Diseases 0.000 claims 1
- 238000009097 single-agent therapy Methods 0.000 claims 1
- 208000017520 skin disease Diseases 0.000 claims 1
- 210000001082 somatic cell Anatomy 0.000 claims 1
- 230000004936 stimulating effect Effects 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 145
- 235000001014 amino acid Nutrition 0.000 description 78
- 229940024606 amino acid Drugs 0.000 description 70
- 108091033409 CRISPR Proteins 0.000 description 69
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 49
- 125000003275 alpha amino acid group Chemical group 0.000 description 47
- 230000000875 corresponding effect Effects 0.000 description 45
- 101710196274 Histone-lysine N-methyltransferase EZH2 Proteins 0.000 description 43
- 102000011252 Krueppel-associated box Human genes 0.000 description 40
- 108050001491 Krueppel-associated box Proteins 0.000 description 40
- 108020004999 messenger RNA Proteins 0.000 description 40
- 239000002585 base Substances 0.000 description 26
- 238000013518 transcription Methods 0.000 description 25
- 230000035897 transcription Effects 0.000 description 25
- 239000013598 vector Substances 0.000 description 25
- 241000193996 Streptococcus pyogenes Species 0.000 description 20
- 230000001105 regulatory effect Effects 0.000 description 20
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 17
- 108010042407 Endonucleases Proteins 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000011282 treatment Methods 0.000 description 13
- 241000282414 Homo sapiens Species 0.000 description 12
- 230000003993 interaction Effects 0.000 description 12
- 210000004899 c-terminal region Anatomy 0.000 description 11
- 208000035475 disorder Diseases 0.000 description 11
- 210000004072 lung Anatomy 0.000 description 11
- 108700008625 Reporter Genes Proteins 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 10
- 150000003839 salts Chemical class 0.000 description 10
- 102100031780 Endonuclease Human genes 0.000 description 9
- 210000000265 leukocyte Anatomy 0.000 description 9
- 230000001225 therapeutic effect Effects 0.000 description 9
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 8
- 101001055222 Homo sapiens Interleukin-8 Proteins 0.000 description 8
- 102000040945 Transcription factor Human genes 0.000 description 8
- 108091023040 Transcription factor Proteins 0.000 description 8
- 101710185494 Zinc finger protein Proteins 0.000 description 8
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 8
- 108020001507 fusion proteins Proteins 0.000 description 8
- 230000005764 inhibitory process Effects 0.000 description 8
- 230000006911 nucleation Effects 0.000 description 8
- 238000010899 nucleation Methods 0.000 description 8
- 239000008194 pharmaceutical composition Substances 0.000 description 8
- 210000001519 tissue Anatomy 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- 206010061218 Inflammation Diseases 0.000 description 7
- 102100026236 Interleukin-8 Human genes 0.000 description 7
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 7
- 241000699666 Mus <mouse, genus> Species 0.000 description 7
- 108091028113 Trans-activating crRNA Proteins 0.000 description 7
- 230000004075 alteration Effects 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 229940088598 enzyme Drugs 0.000 description 7
- 230000004049 epigenetic modification Effects 0.000 description 7
- 238000009472 formulation Methods 0.000 description 7
- 102000037865 fusion proteins Human genes 0.000 description 7
- 230000004054 inflammatory process Effects 0.000 description 7
- 230000009870 specific binding Effects 0.000 description 7
- 108010077544 Chromatin Proteins 0.000 description 6
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 6
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 6
- 102000004533 Endonucleases Human genes 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 101710096379 Lysine-specific histone demethylase 1 Proteins 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 6
- 210000003483 chromatin Anatomy 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 238000006731 degradation reaction Methods 0.000 description 6
- 238000010494 dissociation reaction Methods 0.000 description 6
- 230000005593 dissociations Effects 0.000 description 6
- 239000013604 expression vector Substances 0.000 description 6
- 238000001727 in vivo Methods 0.000 description 6
- 102000040430 polynucleotide Human genes 0.000 description 6
- 108091033319 polynucleotide Proteins 0.000 description 6
- 239000002157 polynucleotide Substances 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 208000024891 symptom Diseases 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 5
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 5
- 108010016918 Histone-Lysine N-Methyltransferase Proteins 0.000 description 5
- 101100222387 Mus musculus Cxcl15 gene Proteins 0.000 description 5
- 239000002202 Polyethylene glycol Substances 0.000 description 5
- 108091027544 Subgenomic mRNA Proteins 0.000 description 5
- 230000033228 biological regulation Effects 0.000 description 5
- 239000003937 drug carrier Substances 0.000 description 5
- 108091008053 gene clusters Proteins 0.000 description 5
- 238000012239 gene modification Methods 0.000 description 5
- 230000005017 genetic modification Effects 0.000 description 5
- 235000013617 genetically modified food Nutrition 0.000 description 5
- 230000002209 hydrophobic effect Effects 0.000 description 5
- 229920001223 polyethylene glycol Polymers 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 5
- 239000013603 viral vector Substances 0.000 description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- 241000604451 Acidaminococcus Species 0.000 description 4
- 108010067225 Cell Adhesion Molecules Proteins 0.000 description 4
- 102000016289 Cell Adhesion Molecules Human genes 0.000 description 4
- 102220605961 Cytosolic arginine sensor for mTORC1 subunit 2_D11A_mutation Human genes 0.000 description 4
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 230000009918 complex formation Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000030279 gene silencing Effects 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 210000000440 neutrophil Anatomy 0.000 description 4
- 150000004713 phosphodiesters Chemical class 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 235000004252 protein component Nutrition 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 3
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 3
- 102100032366 C-C motif chemokine 7 Human genes 0.000 description 3
- 101150011672 CCL9 gene Proteins 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- 102220605872 Cytosolic arginine sensor for mTORC1 subunit 2_D16A_mutation Human genes 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 238000002965 ELISA Methods 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101000897480 Homo sapiens C-C motif chemokine 2 Proteins 0.000 description 3
- 101000797758 Homo sapiens C-C motif chemokine 7 Proteins 0.000 description 3
- 101000909242 Homo sapiens DNA (cytosine-5)-methyltransferase 3A Proteins 0.000 description 3
- 101000746373 Homo sapiens Granulocyte-macrophage colony-stimulating factor Proteins 0.000 description 3
- 101000599852 Homo sapiens Intercellular adhesion molecule 1 Proteins 0.000 description 3
- 101000599868 Homo sapiens Intercellular adhesion molecule 4 Proteins 0.000 description 3
- 101000960337 Homo sapiens Intercellular adhesion molecule 5 Proteins 0.000 description 3
- 101000852865 Homo sapiens Interferon alpha/beta receptor 2 Proteins 0.000 description 3
- 101000598002 Homo sapiens Interferon regulatory factor 1 Proteins 0.000 description 3
- 101001002634 Homo sapiens Interleukin-1 alpha Proteins 0.000 description 3
- 101001033249 Homo sapiens Interleukin-1 beta Proteins 0.000 description 3
- 101001003149 Homo sapiens Interleukin-10 receptor subunit beta Proteins 0.000 description 3
- 102100037877 Intercellular adhesion molecule 1 Human genes 0.000 description 3
- 102100037874 Intercellular adhesion molecule 4 Human genes 0.000 description 3
- 102100039919 Intercellular adhesion molecule 5 Human genes 0.000 description 3
- 102100036718 Interferon alpha/beta receptor 2 Human genes 0.000 description 3
- 102100036157 Interferon gamma receptor 2 Human genes 0.000 description 3
- 102100036981 Interferon regulatory factor 1 Human genes 0.000 description 3
- 102100020881 Interleukin-1 alpha Human genes 0.000 description 3
- 102100039065 Interleukin-1 beta Human genes 0.000 description 3
- 102100020788 Interleukin-10 receptor subunit beta Human genes 0.000 description 3
- 241000588653 Neisseria Species 0.000 description 3
- 102000002488 Nucleoplasmin Human genes 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 102000051614 SET domains Human genes 0.000 description 3
- 108700039010 SET domains Proteins 0.000 description 3
- 241000194020 Streptococcus thermophilus Species 0.000 description 3
- 108090000190 Thrombin Proteins 0.000 description 3
- 241000589634 Xanthomonas Species 0.000 description 3
- 239000013543 active substance Substances 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000011230 binding agent Substances 0.000 description 3
- 108091008324 binding proteins Proteins 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 238000010804 cDNA synthesis Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- KRKNYBCHXYNGOX-UHFFFAOYSA-N citric acid Chemical compound OC(=O)CC(O)(C(O)=O)CC(O)=O KRKNYBCHXYNGOX-UHFFFAOYSA-N 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 230000008045 co-localization Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- FOCAHLGSDWHSAH-UHFFFAOYSA-N difluoromethanethione Chemical compound FC(F)=S FOCAHLGSDWHSAH-UHFFFAOYSA-N 0.000 description 3
- 230000003828 downregulation Effects 0.000 description 3
- 239000002158 endotoxin Substances 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 230000004077 genetic alteration Effects 0.000 description 3
- 231100000118 genetic alteration Toxicity 0.000 description 3
- 102000055297 human CXCL1 Human genes 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 108010085650 interferon gamma receptor Proteins 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 229920006008 lipopolysaccharide Polymers 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 231100000252 nontoxic Toxicity 0.000 description 3
- 230000003000 nontoxic effect Effects 0.000 description 3
- 108060005597 nucleoplasmin Proteins 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 230000007115 recruitment Effects 0.000 description 3
- 238000010532 solid phase synthesis reaction Methods 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 229960004072 thrombin Drugs 0.000 description 3
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- JBIJLHTVPXGSAM-UHFFFAOYSA-N 2-naphthylamine Chemical compound C1=CC=CC2=CC(N)=CC=C21 JBIJLHTVPXGSAM-UHFFFAOYSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 2
- 102100030088 ATP-dependent RNA helicase A Human genes 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- 101710172824 CRISPR-associated endonuclease Cas9 Proteins 0.000 description 2
- 101150059044 CXCL8 gene Proteins 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 102220605836 Cytosolic arginine sensor for mTORC1 subunit 2_E1369R_mutation Human genes 0.000 description 2
- 102220605919 Cytosolic arginine sensor for mTORC1 subunit 2_E1449H_mutation Human genes 0.000 description 2
- 102220605899 Cytosolic arginine sensor for mTORC1 subunit 2_R1556A_mutation Human genes 0.000 description 2
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 2
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 2
- 230000035131 DNA demethylation Effects 0.000 description 2
- 101100477411 Dictyostelium discoideum set1 gene Proteins 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 2
- 101001050886 Homo sapiens Lysine-specific histone demethylase 1A Proteins 0.000 description 2
- 101000613960 Homo sapiens Lysine-specific histone demethylase 1B Proteins 0.000 description 2
- 101000708645 Homo sapiens N-lysine methyltransferase SMYD2 Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 2
- 206010021143 Hypoxia Diseases 0.000 description 2
- 108010054267 Interferon Receptors Proteins 0.000 description 2
- 102000001617 Interferon Receptors Human genes 0.000 description 2
- 102000004889 Interleukin-6 Human genes 0.000 description 2
- 108090001005 Interleukin-6 Proteins 0.000 description 2
- 102000015696 Interleukins Human genes 0.000 description 2
- 108010063738 Interleukins Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- 150000008575 L-amino acids Chemical class 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- 241000713666 Lentivirus Species 0.000 description 2
- 108050008120 Lysine methyltransferases Proteins 0.000 description 2
- 102000000717 Lysine methyltransferases Human genes 0.000 description 2
- 102100024985 Lysine-specific histone demethylase 1A Human genes 0.000 description 2
- 102100040596 Lysine-specific histone demethylase 1B Human genes 0.000 description 2
- 102100032806 N-lysine methyltransferase SMYD2 Human genes 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 108050007775 Protein-lysine N-methyltransferases Proteins 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 108091084976 TET family Proteins 0.000 description 2
- 102000043123 TET family Human genes 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical group O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 235000010443 alginic acid Nutrition 0.000 description 2
- 229920000615 alginic acid Polymers 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 230000003110 anti-inflammatory effect Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000006041 cell recruitment Effects 0.000 description 2
- 108010045512 cohesins Proteins 0.000 description 2
- 239000006071 cream Substances 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000368 destabilizing effect Effects 0.000 description 2
- MOTZDAYCYVMXPC-UHFFFAOYSA-N dodecyl hydrogen sulfate Chemical compound CCCCCCCCCCCCOS(O)(=O)=O MOTZDAYCYVMXPC-UHFFFAOYSA-N 0.000 description 2
- 229940043264 dodecyl sulfate Drugs 0.000 description 2
- 230000005782 double-strand break Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000002919 epithelial cell Anatomy 0.000 description 2
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 2
- 102000049154 human DNMT3L Human genes 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 230000007954 hypoxia Effects 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 229940047122 interleukins Drugs 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 230000007794 irritation Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 239000002667 nucleating agent Substances 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- VLTRZXGMWDSKGL-UHFFFAOYSA-N perchloric acid Chemical compound OCl(=O)(=O)=O VLTRZXGMWDSKGL-UHFFFAOYSA-N 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 230000002685 pulmonary effect Effects 0.000 description 2
- 238000010188 recombinant method Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000007921 spray Substances 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 125000001273 sulfonato group Chemical group [O-]S(*)(=O)=O 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 239000011885 synergistic combination Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- LSPHULWDVZXLIL-UHFFFAOYSA-N (+/-)-Camphoric acid Chemical class CC1(C)C(C(O)=O)CCC1(C)C(O)=O LSPHULWDVZXLIL-UHFFFAOYSA-N 0.000 description 1
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 description 1
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 1
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 1
- PISWNSOQFZRVJK-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 PISWNSOQFZRVJK-XLPZGREQSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- 101150029062 15 gene Proteins 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- BMYNFMYTOJXKLE-UHFFFAOYSA-N 3-azaniumyl-2-hydroxypropanoate Chemical compound NCC(O)C(O)=O BMYNFMYTOJXKLE-UHFFFAOYSA-N 0.000 description 1
- LMMLLWZHCKCFQA-UGKPPGOTSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-prop-1-ynyloxolan-2-yl]pyrimidin-2-one Chemical compound C1=CC(N)=NC(=O)N1[C@]1(C#CC)O[C@H](CO)[C@@H](O)[C@H]1O LMMLLWZHCKCFQA-UGKPPGOTSA-N 0.000 description 1
- XXSIICQLPUAUDF-TURQNECASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidin-2-one Chemical compound O=C1N=C(N)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XXSIICQLPUAUDF-TURQNECASA-N 0.000 description 1
- 101150096316 5 gene Proteins 0.000 description 1
- 108020005029 5' Flanking Region Proteins 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 1
- WBSCNDJQPKSPII-UHFFFAOYSA-N 6-amino-2-[[6-amino-2-(2,6-diaminohexanoylamino)hexanoyl]amino]hexanoic acid Chemical compound NCCCCC(N)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(O)=O WBSCNDJQPKSPII-UHFFFAOYSA-N 0.000 description 1
- UEHOMUNTZPIBIL-UUOKFMHZSA-N 6-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7h-purin-8-one Chemical compound O=C1NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UEHOMUNTZPIBIL-UUOKFMHZSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- 101150101112 7 gene Proteins 0.000 description 1
- HCAJQHYUCKICQH-VPENINKCSA-N 8-Oxo-7,8-dihydro-2'-deoxyguanosine Chemical compound C1=2NC(N)=NC(=O)C=2NC(=O)N1[C@H]1C[C@H](O)[C@@H](CO)O1 HCAJQHYUCKICQH-VPENINKCSA-N 0.000 description 1
- HDZZVAMISRMYHH-UHFFFAOYSA-N 9beta-Ribofuranosyl-7-deazaadenin Natural products C1=CC=2C(N)=NC=NC=2N1C1OC(CO)C(O)C1O HDZZVAMISRMYHH-UHFFFAOYSA-N 0.000 description 1
- 101710164022 ATP-dependent RNA helicase A Proteins 0.000 description 1
- 241001588186 Acidaminococcus sp. BV3L6 Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 241000416162 Astragalus gummifer Species 0.000 description 1
- 241000714230 Avian leukemia virus Species 0.000 description 1
- 208000034309 Bacterial disease carrier Diseases 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 102100026189 Beta-galactosidase Human genes 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 229920002261 Corn starch Polymers 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 102000004420 Creatine Kinase Human genes 0.000 description 1
- 108010042126 Creatine kinase Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- RGHNJXZEOKUKBD-SQOUGZDYSA-M D-gluconate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C([O-])=O RGHNJXZEOKUKBD-SQOUGZDYSA-M 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical class OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- FEWJPZIEWOKRBE-JCYAYHJZSA-N Dextrotartaric acid Chemical compound OC(=O)[C@H](O)[C@@H](O)C(O)=O FEWJPZIEWOKRBE-JCYAYHJZSA-N 0.000 description 1
- 101000619676 Drosophila melanogaster Lipid storage droplets surface-binding protein 2 Proteins 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 101000889905 Enterobacteria phage RB3 Intron-associated endonuclease 3 Proteins 0.000 description 1
- 101000889904 Enterobacteria phage T4 Defective intron-associated endonuclease 3 Proteins 0.000 description 1
- 101000889899 Enterobacteria phage T4 Intron-associated endonuclease 2 Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 239000001856 Ethyl cellulose Substances 0.000 description 1
- ZZSNKZQZMQGXPY-UHFFFAOYSA-N Ethyl cellulose Chemical compound CCOCC1OC(OC)C(OCC)C(OCC)C1OC1C(O)C(O)C(OC)C(CO)O1 ZZSNKZQZMQGXPY-UHFFFAOYSA-N 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical compound [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- VZCYOOQTPOCHFL-OWOJBTEDSA-N Fumaric acid Chemical compound OC(=O)\C=C\C(O)=O VZCYOOQTPOCHFL-OWOJBTEDSA-N 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 102100033840 General transcription factor IIF subunit 1 Human genes 0.000 description 1
- 102100032863 General transcription factor IIH subunit 3 Human genes 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- 108091016367 Histone-lysine N-methyltransferase EHMT2 Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 101000864670 Homo sapiens ATP-dependent RNA helicase A Proteins 0.000 description 1
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 1
- 101000926140 Homo sapiens Gem-associated protein 2 Proteins 0.000 description 1
- 101000666405 Homo sapiens General transcription factor IIH subunit 1 Proteins 0.000 description 1
- 101000655398 Homo sapiens General transcription factor IIH subunit 2 Proteins 0.000 description 1
- 101000655391 Homo sapiens General transcription factor IIH subunit 3 Proteins 0.000 description 1
- 101000655406 Homo sapiens General transcription factor IIH subunit 4 Proteins 0.000 description 1
- 101000655402 Homo sapiens General transcription factor IIH subunit 5 Proteins 0.000 description 1
- 101000613958 Homo sapiens Lysine-specific demethylase 2A Proteins 0.000 description 1
- 101000614013 Homo sapiens Lysine-specific demethylase 2B Proteins 0.000 description 1
- 101000613629 Homo sapiens Lysine-specific demethylase 4B Proteins 0.000 description 1
- 101001088892 Homo sapiens Lysine-specific demethylase 5A Proteins 0.000 description 1
- 101001088883 Homo sapiens Lysine-specific demethylase 5B Proteins 0.000 description 1
- 101001088887 Homo sapiens Lysine-specific demethylase 5C Proteins 0.000 description 1
- 101001088879 Homo sapiens Lysine-specific demethylase 5D Proteins 0.000 description 1
- 101000602237 Homo sapiens Neuroblastoma suppressor of tumorigenicity 1 Proteins 0.000 description 1
- 101001113490 Homo sapiens Poly(A)-specific ribonuclease PARN Proteins 0.000 description 1
- 101000716750 Homo sapiens Protein SCAF11 Proteins 0.000 description 1
- 101000757216 Homo sapiens Protein arginine N-methyltransferase 1 Proteins 0.000 description 1
- 101000754924 Homo sapiens Ribosomal oxygenase 1 Proteins 0.000 description 1
- 101000753286 Homo sapiens Transcription intermediary factor 1-beta Proteins 0.000 description 1
- 101000723833 Homo sapiens Zinc finger E-box-binding homeobox 2 Proteins 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102000014150 Interferons Human genes 0.000 description 1
- 108010050904 Interferons Proteins 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241001112693 Lachnospiraceae Species 0.000 description 1
- JVTAAEKCZFNVCJ-UHFFFAOYSA-M Lactate Chemical compound CC(O)C([O-])=O JVTAAEKCZFNVCJ-UHFFFAOYSA-M 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 102100040598 Lysine-specific demethylase 2A Human genes 0.000 description 1
- 102100040584 Lysine-specific demethylase 2B Human genes 0.000 description 1
- 102100040860 Lysine-specific demethylase 4B Human genes 0.000 description 1
- 102100033246 Lysine-specific demethylase 5A Human genes 0.000 description 1
- 102100033247 Lysine-specific demethylase 5B Human genes 0.000 description 1
- 102100033249 Lysine-specific demethylase 5C Human genes 0.000 description 1
- 102100033143 Lysine-specific demethylase 5D Human genes 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 241000206589 Marinobacter Species 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 102000003505 Myosin Human genes 0.000 description 1
- 108060008487 Myosin Proteins 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 102100023171 Nuclear receptor subfamily 1 group D member 2 Human genes 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 206010030113 Oedema Diseases 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000010292 Peptide Elongation Factor 1 Human genes 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102100023715 Poly(A)-specific ribonuclease PARN Human genes 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- WDVSHHCDHLJJJR-UHFFFAOYSA-N Proflavine Chemical compound C1=CC(N)=CC2=NC3=CC(N)=CC=C3C=C21 WDVSHHCDHLJJJR-UHFFFAOYSA-N 0.000 description 1
- 229940079156 Proteasome inhibitor Drugs 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102100020876 Protein SCAF11 Human genes 0.000 description 1
- 102100022985 Protein arginine N-methyltransferase 1 Human genes 0.000 description 1
- 229940123573 Protein synthesis inhibitor Drugs 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 102100022091 Ribosomal oxygenase 1 Human genes 0.000 description 1
- 241000714474 Rous sarcoma virus Species 0.000 description 1
- 235000019485 Safflower oil Nutrition 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102000011990 Sirtuin Human genes 0.000 description 1
- 108050002485 Sirtuin Proteins 0.000 description 1
- 108010041218 Sirtuin 3 Proteins 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 241000116873 Spiroplasma monobiae MQ-1 Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 102100040296 TATA-box-binding protein Human genes 0.000 description 1
- FEWJPZIEWOKRBE-UHFFFAOYSA-N Tartaric acid Natural products [H+].[H+].[O-]C(=O)C(O)C(O)C([O-])=O FEWJPZIEWOKRBE-UHFFFAOYSA-N 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 229920001615 Tragacanth Polymers 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 108010083262 Transcription Factor TFIIA Proteins 0.000 description 1
- 102000006289 Transcription Factor TFIIA Human genes 0.000 description 1
- 108010083268 Transcription Factor TFIID Proteins 0.000 description 1
- 108090000941 Transcription factor TFIIB Proteins 0.000 description 1
- 102000004408 Transcription factor TFIIB Human genes 0.000 description 1
- 102100022012 Transcription intermediary factor 1-beta Human genes 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 229940127507 Ubiquitin Ligase Inhibitors Drugs 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241001148134 Veillonella Species 0.000 description 1
- 241000757094 Xanthomonas campestris pv. raphani 756C Species 0.000 description 1
- 241000589652 Xanthomonas oryzae Species 0.000 description 1
- 241000504809 Xanthomonas oryzae pv. oryzicola BLS256 Species 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 102100021112 Zinc finger protein 10 Human genes 0.000 description 1
- 101710160401 Zinc finger protein 10 Proteins 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- WNLRTRBMVRJNCN-UHFFFAOYSA-N adipic acid Chemical class OC(=O)CCCCC(O)=O WNLRTRBMVRJNCN-UHFFFAOYSA-N 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000000443 aerosol Substances 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 239000000783 alginic acid Substances 0.000 description 1
- 229960001126 alginic acid Drugs 0.000 description 1
- 150000004781 alginic acids Chemical class 0.000 description 1
- 208000030961 allergic reaction Diseases 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- AWUCVROLDVIAJX-UHFFFAOYSA-N alpha-glycerophosphate Natural products OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 210000002588 alveolar type II cell Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 229940027991 antiseptic and disinfectant quinoline derivative Drugs 0.000 description 1
- 239000007900 aqueous suspension Substances 0.000 description 1
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical class OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 125000003289 ascorbyl group Chemical class [H]O[C@@]([H])(C([H])([H])O*)[C@@]1([H])OC(=O)C(O*)=C1O* 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical class N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- SRSXLGNVWSONIS-UHFFFAOYSA-N benzenesulfonic acid Chemical class OS(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-N 0.000 description 1
- 150000001558 benzoic acid derivatives Chemical class 0.000 description 1
- 102000015736 beta 2-Microglobulin Human genes 0.000 description 1
- 108010081355 beta 2-Microglobulin Proteins 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 125000002619 bicyclic group Chemical group 0.000 description 1
- 238000010364 biochemical engineering Methods 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 150000001642 boronic acid derivatives Chemical class 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 description 1
- 150000004648 butanoic acid derivatives Chemical class 0.000 description 1
- FATUQANACHZLRT-KMRXSBRUSA-L calcium glucoheptonate Chemical compound [Ca+2].OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)C([O-])=O.OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C(O)C([O-])=O FATUQANACHZLRT-KMRXSBRUSA-L 0.000 description 1
- MIOPJNTWMNEORI-UHFFFAOYSA-N camphorsulfonic acid Chemical class C1CC2(CS(O)(=O)=O)C(=O)CC1C2(C)C MIOPJNTWMNEORI-UHFFFAOYSA-N 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 239000001768 carboxy methyl cellulose Substances 0.000 description 1
- 125000002843 carboxylic acid group Chemical group 0.000 description 1
- 210000003321 cartilage cell Anatomy 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 229920002301 cellulose acetate Polymers 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000002975 chemoattractant Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 229940110456 cocoa butter Drugs 0.000 description 1
- 235000019868 cocoa butter Nutrition 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 235000005687 corn oil Nutrition 0.000 description 1
- 239000002285 corn oil Substances 0.000 description 1
- 239000008120 corn starch Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 235000012343 cottonseed oil Nutrition 0.000 description 1
- 239000002385 cottonseed oil Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- BALGDZWGNCXXES-UHFFFAOYSA-N cyclopentane;propanoic acid Chemical compound CCC(O)=O.C1CCCC1 BALGDZWGNCXXES-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 1
- 229960003957 dexamethasone Drugs 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 239000003534 dna topoisomerase inhibitor Substances 0.000 description 1
- POULHZVOKOAJMA-UHFFFAOYSA-M dodecanoate Chemical compound CCCCCCCCCCCC([O-])=O POULHZVOKOAJMA-UHFFFAOYSA-M 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 229940126534 drug product Drugs 0.000 description 1
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- CCIVGXIOQKPBKL-UHFFFAOYSA-M ethanesulfonate Chemical compound CCS([O-])(=O)=O CCIVGXIOQKPBKL-UHFFFAOYSA-M 0.000 description 1
- 235000019441 ethanol Nutrition 0.000 description 1
- ZMMJGEGLRURXTF-UHFFFAOYSA-N ethidium bromide Chemical compound [Br-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CC)=C1C1=CC=CC=C1 ZMMJGEGLRURXTF-UHFFFAOYSA-N 0.000 description 1
- 229960005542 ethidium bromide Drugs 0.000 description 1
- 235000019325 ethyl cellulose Nutrition 0.000 description 1
- 229920001249 ethyl cellulose Polymers 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000006260 foam Substances 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 208000021302 gastroesophageal reflux disease Diseases 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- 229940050410 gluconate Drugs 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000011187 glycerol Nutrition 0.000 description 1
- 150000002334 glycols Chemical class 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- MNWFXJYAOYHMED-UHFFFAOYSA-N heptanoic acid Chemical compound CCCCCCC(O)=O MNWFXJYAOYHMED-UHFFFAOYSA-N 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 150000002402 hexoses Chemical class 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 125000001183 hydrocarbyl group Chemical group 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 125000002887 hydroxy group Chemical class [H]O* 0.000 description 1
- 230000001965 increasing effect Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000000266 injurious effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 229940079322 interferon Drugs 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- SUMDYPCJJOFFON-UHFFFAOYSA-N isethionic acid Chemical compound OCCS(O)(=O)=O SUMDYPCJJOFFON-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 210000001865 kupffer cell Anatomy 0.000 description 1
- 229940001447 lactate Drugs 0.000 description 1
- 229940099584 lactobionate Drugs 0.000 description 1
- JYTUSYBCFIZPBE-AMTLMPIISA-N lactobionic acid Chemical compound OC(=O)[C@H](O)[C@@H](O)[C@@H]([C@H](O)CO)O[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O JYTUSYBCFIZPBE-AMTLMPIISA-N 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 229940070765 laurate Drugs 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000005073 lymphatic endothelial cell Anatomy 0.000 description 1
- VTHJTEIRLNZDEV-UHFFFAOYSA-L magnesium dihydroxide Chemical compound [OH-].[OH-].[Mg+2] VTHJTEIRLNZDEV-UHFFFAOYSA-L 0.000 description 1
- 239000000347 magnesium hydroxide Substances 0.000 description 1
- 229910001862 magnesium hydroxide Inorganic materials 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 239000011976 maleic acid Substances 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 150000007522 mineralic acids Chemical class 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000000107 myocyte Anatomy 0.000 description 1
- JVXXKQIRGQDWOJ-UHFFFAOYSA-N naphthalene-2-carboxamide Chemical compound C1=CC=CC2=CC(C(=O)N)=CC=C21 JVXXKQIRGQDWOJ-UHFFFAOYSA-N 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000012457 nonaqueous media Substances 0.000 description 1
- 108020004017 nuclear receptors Proteins 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 208000001797 obstructive sleep apnea Diseases 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 235000019198 oils Nutrition 0.000 description 1
- 239000002674 ointment Substances 0.000 description 1
- 239000004006 olive oil Substances 0.000 description 1
- 235000008390 olive oil Nutrition 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000006072 paste Substances 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 238000002823 phage display Methods 0.000 description 1
- 239000000825 pharmaceutical preparation Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000010399 physical interaction Effects 0.000 description 1
- 244000000003 plant pathogen Species 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001592 potato starch Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 229960000286 proflavine Drugs 0.000 description 1
- 229960003387 progesterone Drugs 0.000 description 1
- 239000000186 progesterone Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 239000003207 proteasome inhibitor Substances 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 239000000007 protein synthesis inhibitor Substances 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 125000002943 quinolinyl group Chemical class N1=C(C=CC2=CC=CC=C12)* 0.000 description 1
- 230000009244 rapid viral response Effects 0.000 description 1
- 108091006082 receptor inhibitors Proteins 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000000754 repressing effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 102220063362 rs786204851 Human genes 0.000 description 1
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 1
- 235000005713 safflower oil Nutrition 0.000 description 1
- 239000003813 safflower oil Substances 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 230000003248 secreting effect Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 230000007781 signaling event Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 206010040882 skin lesion Diseases 0.000 description 1
- 231100000444 skin lesion Toxicity 0.000 description 1
- AWUCVROLDVIAJX-GSVOUGTGSA-N sn-glycerol 3-phosphate Chemical compound OC[C@@H](O)COP(O)(O)=O AWUCVROLDVIAJX-GSVOUGTGSA-N 0.000 description 1
- 235000019812 sodium carboxymethyl cellulose Nutrition 0.000 description 1
- 229920001027 sodium carboxymethylcellulose Polymers 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 235000010356 sorbitol Nutrition 0.000 description 1
- 239000003549 soybean oil Substances 0.000 description 1
- 235000012424 soybean oil Nutrition 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 210000001258 synovial membrane Anatomy 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 239000011975 tartaric acid Substances 0.000 description 1
- 235000002906 tartaric acid Nutrition 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 238000011285 therapeutic regimen Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000012876 topography Methods 0.000 description 1
- 229940044693 topoisomerase inhibitor Drugs 0.000 description 1
- UCFGDBYHRUNTLO-QHCPKHFHSA-N topotecan Chemical compound C1=C(O)C(CN(C)C)=C2C=C(CN3C4=CC5=C(C3=O)COC(=O)[C@]5(O)CC)C4=NC2=C1 UCFGDBYHRUNTLO-QHCPKHFHSA-N 0.000 description 1
- 229960000303 topotecan Drugs 0.000 description 1
- 239000000196 tragacanth Substances 0.000 description 1
- 235000010487 tragacanth Nutrition 0.000 description 1
- 229940116362 tragacanth Drugs 0.000 description 1
- 108010014677 transcription factor TFIIE Proteins 0.000 description 1
- 108010014678 transcription factor TFIIF Proteins 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 description 1
- 238000010396 two-hybrid screening Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 210000003556 vascular endothelial cell Anatomy 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/06—Immunosuppressants, e.g. drugs for graft rejection
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
- C07K14/4703—Inhibitors; Suppressors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
- C12N15/1136—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against growth factors, growth regulators, cytokines, lymphokines or hormones
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/78—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
- C12N9/80—Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5) acting on amide bonds in linear amides (3.5.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/01—Methyltransferases (2.1.1)
- C12Y201/01037—DNA (cytosine-5-)-methyltransferase (2.1.1.37)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/01—Methyltransferases (2.1.1)
- C12Y201/01043—Histone-lysine N-methyltransferase (2.1.1.43)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/01—Methyltransferases (2.1.1)
- C12Y201/01072—Site-specific DNA-methyltransferase (adenine-specific) (2.1.1.72)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y305/00—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5)
- C12Y305/01—Hydrolases acting on carbon-nitrogen bonds, other than peptide bonds (3.5) in linear amides (3.5.1)
- C12Y305/01098—Histone deacetylase (3.5.1.98), i.e. sirtuin deacetylase
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K35/00—Medicinal preparations containing materials or reaction products thereof with undetermined constitution
- A61K35/12—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
- A61K2035/122—Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells for inducing tolerance or supression of immune responses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Epidemiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Cell Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Transplantation (AREA)
- Virology (AREA)
- Developmental Biology & Embryology (AREA)
- Mycology (AREA)
- Toxicology (AREA)
- Pain & Pain Management (AREA)
- Rheumatology (AREA)
- Endocrinology (AREA)
Abstract
본 개시내용은 세포 내의 복수의 표적 유전자의 발현을 조절하기 위한, 예를 들어 감소시키기 위한 부위-특이적 파괴제에 관한 것이다. 일부 구현예에서, 복수의 표적 유전자는 전염증성 유전자, 예를 들어 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 및 IL-8을 포함한다. 일부 구현예에서, 방법은 제1 앵커 서열을 표적화하는 제1 부위-특이적 파괴제 및 제2 앵커 서열을 파괴하는 제2 부위-특이적 파괴제를 사용하는 것을 포함한다.
Description
관련 출원에 대한 상호 참조
본 출원은 2020년 9월 29일에 출원된 미국 가출원 63/085,013 및 2021년 6월 29일에 출원된 미국 가출원 63/216,487의 이익을 주장한다. 상기 언급된 출원의 내용은 전체적으로 본 명세서에 참고로 포함된다.
서열 목록
본 출원은 ASCII 서식으로 전자적으로 제출된 서열 목록을 포함하며, 이는 본 명세서에 전체적으로 참고로 포함된다. 2021년 9월 29일에 생성된 상기 ASCII 사본은 파일명이 O2057-7021WO_SL.txt이며, 크기가 666,818 바이트이다.
유전자 발현의 오조절(mis-regulation)은 (예를 들어, 포유동물, 예를 들어 인간에서) 많은 질환의 기저 원인이다. 많은 질환 및 병태는 복수의 관련 유전자와 연관되어 있다. 복수의 연관 유전자의 발현을 변경시키는, 예를 들어 감소시키는 신규 도구, 시스템, 및 방법에 대한 필요성이 있다.
본 개시내용은 특히 복수의 표적 유전자, 예를 들어 제1 앵커 서열 및 제2 앵커 서열을 포함하는 앵커 서열-매개 연접부(ASMC) 내에 있는 제1 유전자 및 제2 유전자의 발현을 조절하는 데, 예를 들어 감소시키는 데 사용될 수 있는 부위-특이적 파괴제 또는 부위-특이적 파괴제를 포함하는 시스템을 제공한다. 일 양태에서, 부위-특이적 파괴제는 ASMC에서 제1 앵커 서열에 또는 제1 앵커 서열의 근접부에 특이적으로 결합하는 표적화 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제의 결합은 복수의 표적 유전자, 예를 들어 제1 유전자 및 제2 유전자의 발현을 조절하는 데, 예를 들어 감소시키는 데 충분한 양으로 발생한다. 일부 구현예에서, 부위-특이적 파괴제는 이펙터 모이어티를 추가로 포함한다. 일반적으로, 부위-특이적 파괴제에 의한 복수의 표적 유전자의 발현의 조절은 제1 앵커 서열에 또는 제1 앵커 서열의 근접부에 대한 부위-특이적 파괴제의 결합을 포함한다. 일부 구현예에서, 제1 앵커 서열에 대한 부위-특이적 파괴제의 결합은 제1 앵커 서열에 대한 핵형성 폴리펩티드, 예를 들어 CTCF의 결합을 파괴할 수 있으며, 예를 들어 이에 의해 ASMC의 형성 및/또는 유지를 방해할 수 있고, 예를 들어 이에 의해 복수의 유전자의 발현을 조절할, 예를 들어 감소시킬 수 있다. 일부 구현예에서, 제1 앵커 서열 또는 제1 앵커 서열의 근접부에 대한 부위-특이적 파괴제의 결합은 제1 앵커 서열 및/또는 ASMC에 대한 이펙터 모이어티의 기능성을 국재화할 수 있고, 예를 들어 이에 의해 ASMC의 형성 및/또는 유지를 방해할 수 있고, 예를 들어 이에 의해 복수의 유전자의 발현을 조절할, 예를 들어 감소시킬 수 있다. 일부 구현예에서, 제1 앵커 서열 또는 제1 앵커 서열의 근접부에 대한 부위-특이적 파괴제의 결합은 제1 앵커 서열 및/또는 ASMC에 대한 이펙터 모이어티의 기능성을 국재화할 수 있고, 예를 들어 이에 의해 복수의 유전자의 발현을 조절할, 예를 들어 감소시킬 수 있다. 이론에 의해 구애되고자 함이 없이, 일부 구현예에서 동일한 ASMC 내에 있는 복수의 유전자를 표적화하는 것은 복수의 유전자의 발현을 더 효과적으로 조절할, 예를 들어 감소시킬 수 있고/있거나 복수의 유전자의 기능성과 관련한 치료 효과를 더 효과적으로 달성할 수 있는 것으로 생각된다. 예를 들어, 일부 구현예에서, 표적화된 복수의 유전자는 모두 전염증성 유전자일 수 있고; 본 명세서에 교시된 바와 같이 발현의 조절, 예를 들어 감소를 위해 복수의 전염증성 유전자를 표적화하는 것은 개별 유전자를 표적화하는 것보다 염증을 더 효과적으로 감소시킬 수 있다. (예를 들어, ASMC 또는 ASMC의 앵커 서열을 표적화함으로써) 동일한 게놈 복합체, 예를 들어 ASMC 내에 포함된 복수의 유전자를 표적화하는 것은 (예를 들어, 발현 조절 또는 조절의 안정성/기간과 관련하여) 복수의 개별 유전자를 표적화하는 효과보다 더 큰 상가적 또는 상승 효과를 가질 수 있다.
일부 양태에서, 본 개시내용은 세포에서 제1 유전자 및 제2 유전자의 발현을 감소시키는 방법을 제공하며, 상기 방법은 세포를, 제1 및 제2 유전자의 발현을 감소시키기에 충분한 양으로 제1 앵커 서열 또는 제1 앵커 서열에 근접한 부위에 특이적으로 결합하는 표적화 모이어티를 포함하는 부위-특이적 파괴제와 접촉시키는 단계를 포함하고, 제1 및 제2 유전자는 제1 앵커 서열 및 제2 앵커 서열을 포함하는 앵커 서열-매개 연접부 내에 있다. 일부 구현예에서, 제1 유전자 및 제2 유전자는 전염증성 유전자이다.
일부 양태에서, 본 개시내용은 부위-특이적 파괴제에 관한 것으로, 상기 부위-특이적 파괴제는 DNA-결합, 예를 들어 세포 내에서 제1 앵커 서열 또는 제1 앵커 서열의 근접부에 특이적으로 결합하는 표적화 모이어티를 포함한다. 일부 구현예에서, 제1 앵커 서열은 제2 앵커 서열, 제1 유전자, 및 제2 유전자를 추가로 포함하는 앵커 서열-매개 연접부의 일부이다. 일부 구현예에서, 제1 유전자 및 제2 유전자는 전염증성 유전자이다.
일부 양태에서, 본 개시내용은 부위-특이적 파괴제에 관한 것으로, 상기 부위-특이적 파괴제는 세포 내에서 제1 앵커 서열 또는 제1 앵커 서열의 근접부에 특이적으로 결합하는 표적화 모이어티를 포함하고, 여기서 제1 앵커 서열은 제2 앵커 서열, 제1 유전자, 및 제2 유전자를 추가로 포함하는 앵커 서열-매개 연접부의 일부이고, 제1 유전자 및 제2 유전자는 전염증성 유전자이다.
또 다른 양태에서, 본 개시내용은 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 부위-특이적 파괴제(여기서, 제1 부위-특이적 파괴제는, 제1 유전자 및 제2 유전자를 포함하는 앵커 서열-매개 연접부(ASMC)의 제1 앵커 서열(또는 제1 앵커 서열의 근접부)에 특이적으로 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 제2 부위-특이적 파괴제(여기서, 제2 부위-특이적 파괴제는 ASMC의 제2 앵커 서열(또는 제2 앵커 서열의 근접부)에 결합함)를 포함하는 시스템을 제공한다.
또 다른 양태에서, 본 개시내용은 세포에서 제1 유전자 및 제2 유전자의 발현을 감소시키는 방법에 관한 것으로, 상기 방법은 세포를, 제1 및 제2 유전자의 발현을 감소시키기에 충분한 양으로 제1 앵커 서열 또는 제1 앵커 서열에 근접한 부위에 특이적으로 결합하는 표적화 모이어티를 포함하는 부위-특이적 파괴제와 접촉시키는 단계를 포함하고, 제1 및 제2 유전자는 제1 앵커 서열 및 제2 앵커 서열을 포함하는 앵커 서열-매개 연접부 내에 있고, 제1 유전자 및 제2 유전자는 전염증성 유전자이며; 이에 의해 제1 및 제2 유전자의 발현을 감소시킨다.
또 다른 양태에서, 본 개시내용은 세포에서 제1 유전자 및 제2 유전자의 발현을 감소시키는 방법에 관한 것으로, 상기 방법은
세포를, 제1 및 제2 유전자의 발현을 감소시키기에 충분한 양으로, 제1 앵커 서열 또는 제1 앵커 서열에 근접한 부위에 특이적으로 결합하는 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 부위-특이적 파괴제, 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 제2 부위-특이적 파괴제(여기서, 제2 부위-특이적 파괴제는 ASMC의 제2 앵커 서열(또는 제2 앵커 서열의 근접부)에 결합함)를 포함하는 시스템과 접촉시키는 단계를 포함하며, 제1 및 제2 유전자는 ASMC 내에 있고, 제1 유전자 및 제2 유전자는 전염증성 유전자이다.
또 다른 양태에서, 본 개시내용은 세포(예를 들어, 인간 세포, 예를 들어 1차 인간 세포) 및 본 명세서에 기재된 바와 같은 부위-특이적 파괴제 또는 시스템을 포함하는 반응 혼합물에 관한 것이다.
또 다른 양태에서, 본 개시내용은 염증성 장애를 갖는 대상체를 치료하는 방법에 관한 것으로, 상기 방법은 염증성 장애를 치료하기에 충분한 양으로 본 명세서에 기재된 바와 같은 부위-특이적 파괴제 또는 시스템을 대상체에게 투여하는 단계를 포함한다.
또 다른 양태에서, 본 개시내용은 감염, 예를 들어 바이러스 감염, 예를 들어 COVID-19를 갖는 대상체에서, 염증, 예를 들어 국부 염증을 치료하는 방법에 관한 것으로, 염증을 치료하기에 충분한 양으로 본 명세서에 기재된 바와 같은 부위-특이적 파괴제 또는 시스템을 대상체에게 투여하는 단계를 포함한다.
또 다른 양태에서, 본 개시내용은 제1 유전자 및 제2 유전자의 발현이 감소된 인간 세포에 관한 것으로, 여기서 제1 유전자 및 제2 유전자는 전염증성 유전자이고, 세포는 제1 및 제2 유전자를 포함하는 파괴된(예를 들어, 완전히 파괴된) 앵커 서열-매개 연접부를 포함한다. 일부 구현예에서, 인간 세포는 이전에 본 명세서에 기재된 부위-특이적 파괴제 또는 시스템과 접촉되었다. 일부 구현예에서, 인간 세포는 더 이상 본 명세서에 기재된 부위-특이적 파괴제 또는 시스템을 포함하지 않는다.
또 다른 양태에서, 본 개시내용은 게놈 좌표 chr4:74595464-74595486, chr4:74595457-74595479, chr4:74595460-74595482, chr4:74595472-74595494, chr4:75000088-75000110, chr4:75000091-75000113, chr4:75000085-75000107, chr4:75000157-75000179, chr4:75000156-75000178, chr4:74595215-74595237, chr4:74595370-74595392, chr4:74595560-74595582, chr4:74595642-74595664, chr4:74595787-74595809, chr4:74528428-74528450, chr4:74528567-74528589, chr4:74528609-74528631, chr4:74789132-74789154, chr4:74789250-74789272, chr4:74789312-74789334, chr4:74964853-74964875, chr4:74964906-74964928, chr4:74965538-74965560, chr4:74965737-74965759, chr4:75000031-75000053, chr4:75000115-75000137, chr4:75000231-75000253, chr4:74975146-74975168, chr4:74975369-74975391, chr4:74976318-74976340, chr4:74570348-74570370, chr4:74570503-74570525, 또는 chr4:74570526-74570548에서, 또는 상기 영역의 5, 10, 15, 20, 30, 40, 또는 50개 뉴클레오티드 내에 돌연변이를 포함하는 인간 세포에 관한 것이다.
당업자는 단지 일상적인 실험을 사용하여, 본 명세서에서 기재된 본 개시내용의 구체적인 구현예에 대한 많은 균등물을 인식하거나 확인할 수 있을 것이다.
본 명세서에서 언급된 모든 간행물, 특허 출원, 특허 및 기타 참고 문헌(예를 들어, 서열 데이터베이스 참조 번호)은 전체적으로 참고로 포함된다. 예를 들어, 본 명세서에 언급된, 예를 들어 본 명세서의 임의의 표에 있는 모든 GenBank, Unigene, 및 Entrez 서열은 참고로 포함된다. 달리 명시되지 않는 한, 본 명세서의 임의의 표에 있는 것을 포함한 본 명세서에 명시된 서열 수탁 번호는 2020년 9월 29일 현재 시점에서 최신의 데이터베이스 등록물을 지칭한다. 하나의 유전자 또는 단백질이 복수의 서열 수탁 번호를 참조할 때, 모든 서열 변이체가 포함된다.
정의
앵커 서열: 본 명세서에 사용되는 바와 같이, 용어 "앵커 서열"은 앵커 서열-매개 연접부, 예를 들어 복합체를 형성하도록 충분히 결합하는 핵형성제(nucleating agent)에 의해 인식되는 핵산 서열을 지칭한다. 일부 구현예에서, 앵커 서열은 하나 이상의 CTCF 결합 모티프를 포함한다. 일부 구현예에서, 앵커 서열은 유전자 코딩 영역 내에 위치되어 있지 않다. 일부 구현예에서, 앵커 서열은 유전자간 영역 내에 위치되어 있다. 일부 구현예에서, 앵커 서열은 인핸서 또는 프로모터 중 어느 것에도 위치되어 있지 않다. 일부 구현예에서, 앵커 서열은 임의의 전사 개시 부위로부터 적어도 400 bp, 적어도 450 bp, 적어도 500 bp, 적어도 550 bp, 적어도 600 bp, 적어도 650 bp, 적어도 700 bp, 적어도 750 bp, 적어도 800 bp, 적어도 850 bp, 적어도 900 bp, 적어도 950 bp, 또는 적어도 1kb 떨어져 위치되어 있다. 일부 구현예에서, 앵커 서열은 게놈 각인, 단일대립유전자 발현, 및/또는 단일대립유전자 후성유전학적 마크와 연관되어 있지 않은 영역 내에 위치되어 있다. 일부 구현예에서, 앵커 서열은 내인성 핵형성 폴리펩티드(예를 들어, CTCF)에 결합하는 기능, 제2 앵커 서열과 상호작용하여 앵커 서열-매개 연접부를 형성하는 기능, 또는 앵커 서열-매개 연접부 외부에 있는 인핸서에 대해 절연하는 기능으로부터 선택되는 하나 이상의 기능을 갖는다. 본 개시내용의 일부 구현예에서, 기타 다른 앵커 서열(예를 들어, 상이한 상황에서 핵형성제(예를 들어, CTCF) 결합 모티프를 함유할 수 있는 서열)을 표적화하지 않고서, 특정 앵커 서열 또는 앵커 서열들을 특이적으로 표적화할 수 있는 기술이 제공되며; 그러한 표적화된 앵커 서열은 "표적 앵커 서열"로 지칭될 수 있다. 일부 구현예에서, 표적 앵커 서열의 서열 및/또는 활성은 조절되는 반면, 표적화된 앵커 서열과 동일한 시스템 내에(예를 들어, 동일한 세포 내에 그리고/또는 일부 구현예에서는 동일한 핵산 분자(예를 들어, 동일한 염색체) 상에) 존재할 수 있는 하나 이상의 다른 앵커 서열의 서열 및/또는 활성은 조절되지 않는다. 일부 구현예에서, 앵커 서열은 핵형성 폴리펩티드 결합 모티프이거나 이를 포함한다. 일부 구현예에서, 앵커 서열은 핵형성 폴리펩티드 결합 모티프에 인접한다.
앵커 서열-매개 연접부: 본 명세서에 사용되는 바와 같이, 용어 "앵커 서열-매개 연접부"는 DNA 내의 적어도 2개의 앵커 서열이, 이들 앵커 서열에 결합하여 앵커 서열들 사이의 공간적 근접 및 기능성 연결을 가능하게 하는 하나 이상의 폴리펩티드, 예컨대 핵형성 폴리펩티드, 또는 하나 이상의 단백질 및/또는 핵산 실체(entity)(예컨대, RNA 또는 DNA)에 의한, 이들 적어도 2개의 앵커 서열의 물리적 상호작용 또는 결합을 통해 일어나고/나거나 유지되는 DNA 구조, 일부 경우에는 복합체를 지칭한다(예를 들어, 도 1 참조).
~와 연관된: 2개의 사건 또는 실체는, 해당 용어가 본 명세서에 사용되는 바와 같이, 하나의 존재, 수준, 형태 및/또는 기능이 나머지 다른 하나의 것과 상관 관계가 있다면, 서로 "연관되어" 있다. 예를 들어, 일부 구현예에서, 특정 실체(예를 들어, 폴리펩티드, 유전자적 시그니처, 대사물, 미생물 등)는 그의 존재, 수준, 형태 및/또는 기능이 (예를 들어, 관련 집단에 걸쳐) 특정 질환, 장애, 또는 병태의 발병률 및/또는 감수성과 상관 관계가 있다면, 그러한 질환, 장애, 또는 병태과 연관되어 있는 것으로 여겨진다. 일부 구현예에서, 2개 이상의 실체는, 그들이 직접적으로 또는 간접적으로 상호작용하여 서로 물리적 근접 상태에 있고/있거나 이 상태를 유지한다면, 서로 물리적으로 "연관되어" 있다. 일부 구현예에서, 서로 물리적으로 연관된 2개 이상의 실체는 서로 공유적으로 연결되어 있으며; 일부 구현예에서, 서로 물리적으로 연관된 2개 이상의 실체는 서로 공유적으로 연결되어 있지 않고, 예를 들어 수소 결합, 반데르발스 상호작용, 소수성 상호작용, 자기력(magnetism), 및 이들의 조합에 의해 비공유적으로 회합되어 있다. 일부 구현예에서, DNA 서열은, 핵산이 적어도 부분적으로 표적 게놈 또는 전사 복합체 내에 있고, DNA 서열 내의 유전자의 발현이 표적 게놈 또는 전사 복합체의 형성 또는 파괴에 의해 영향을 받을 때, 표적 게놈 또는 전사 복합체"와 연관되어" 있다.
부위-특이적 파괴제 : 본 명세서에 사용되는 바와 같이, 용어 "부위-특이적 파괴제"는 게놈 복합체, 예를 들어 ASMC의 하나 이상의 성분을 특이적으로 억제하고/하거나, 분리하고/하거나, 분해하고/하거나, 변형시켜 본 명세서에 기재된 바와 같은 복수의 표적 유전자의 발현을 조절하는, 예를 들어 감소시키는 작용제 또는 실체를 지칭한다. 일부 구현예에서, 부위-특이적 파괴제는 게놈 복합체의 하나 이상의 성분과 상호작용한다. 일부 구현예에서, 부위-특이적 파괴제는 하나 이상의 게놈 복합체 성분에 (예를 들어, 직접적으로, 또는 일부 구현예에서는 간접적으로) 결합한다. 일부 구현예에서, 부위-특이적 파괴제는 복수의 표적 유전자를 포함하는 ASMC의 일부일 수 있는 앵커 서열, 예를 들어 제1 및/또는 제2 앵커 서열에 결합한다. 일부 구현예에서, 부위-특이적 파괴제는 복수의 표적 유전자를 포함하는 ASMC의 일부일 수 있는 앵커 서열, 예를 들어 제1 및/또는 제2 앵커 서열에 근접한 부위에 결합한다. 일부 구현예에서, 부위-특이적 파괴제는 하나 이상의 게놈 복합체 성분을 변형시킨다. 일부 구현예에서, 부위-특이적 파괴제는 올리고뉴클레오티드를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 폴리펩티드를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 항체(예를 들어, 단일특이적 또는 다중특이적 항체 작제물) 또는 항체 단편을 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 본 명세서에 기재된 바와 같이, 특정 게놈 위치 및/또는 표적화 모이어티에 의한 게놈 복합체로 지시된다. 일부 구현예에서, 부위-특이적 파괴제는 게놈 복합체 성분 또는 이의 변이체를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 복수의 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 게놈의 제2 부위보다(예를 들어, 게놈의 임의의 다른 부위에 비해) 더 높은 친화도로 게놈의 제1 부위에 특이적으로 결합한다. 일부 구현예에서, 부위-특이적 파괴제는 제2 게놈 복합체에 비해(예를 들어, 임의의 다른 게놈 복합체에 비해) 제1 게놈 복합체의 하나 이상의 성분을 우선적으로 억제하고/하거나, 분리하고/하거나, 분해하고/하거나, 변형시킨다.
도메인: 본 명세서에 사용되는 바와 같이, 용어 "도메인"은 실체의 섹션 또는 일부분을 지칭한다. 일부 구현예에서, "도메인"은 실체의 특정 구조적 및/또는 기능적 특징과 연관되어 있으며, 따라서 도메인이 그의 모 실체의 나머지로부터 물리적으로 분리되어 있을 때, 도메인은 특정 구조적 및/또는 기능적 특징을 실질적으로 또는 전체적으로 유지한다. 대안적으로 또는 추가적으로, 일부 구현예에서, 도메인은, 그러한 (모) 실체로부터 분리되고 상이한 (수용자) 실체와 연결될 때, 모 실체에서 특징이 되게 한 하나 이상의 구조적 및/또는 기능적 특징을 수용자 실체 상에 실질적으로 유지하고/하거나 부여하는 실체의 일부분일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 도메인은 분자(예를 들어, 소분자, 탄수화물, 지질, 핵산, 폴리펩티드 등)의 섹션 또는 일부분이거나 이를 포함한다. 일부 구현예에서, 도메인은 폴리펩티드의 섹션이거나 이를 포함한다. 일부 그러한 구현예에서, 도메인은 특정 구조 요소(예를 들어, 특정 아미노산 서열 또는 서열 모티프, 알파-나선 특성, 베타-시트 특성, 코일드-코일(coiled-coil) 특성, 랜덤 코일 특성 등)에 의해, 그리고/또는 특정 기능적 특징(예를 들어, 결합 활성, 효소 활성, 접힘 활성, 신호전달 활성 등)에 의해 특성화된다.
이펙터 모이어티: 본 명세서에 사용되는 바와 같이, 용어 "이펙터 모이어티"는 세포의 핵 내에 적절하게 국재화될 때 세포 내의 복수의 표적 유전자의 발현을 조절하는, 예를 들어 감소시키는 하나 이상의 기능성을 갖는 도메인을 지칭한다. 일부 구현예에서, 이펙터 모이어티는 폴리펩티드를 포함한다. 일부 구현예에서, 이펙터 모이어티는 폴리펩티드 및 핵산을 포함한다. 이펙터 모이어티와 연관된 기능성은, 예를 들어 유전자의 발현을 자극할 전사 인자의 동원(recruitment)을 차단하여, 복수의 표적 유전자의 발현에 직접적으로 영향을 줄 수 있다. 이펙터 모이어티와 연관된 기능성은, 예를 들어 복수의 표적 유전자의 발현을 억제하는 염색체 토폴로지의 변화를 유도하는 후성유전학적 변형을 도입하거나, 그러한 후성유전학적 변형을 도입시키는 기타 다른 인자를 동원하여, 복수의 표적 유전자의 발현에 간접적으로 영향을 줄 수 있다.
게놈 복합체 : 본 명세서에 사용되는 바와 같이, 용어 "게놈 복합체"는 복수의 단백질 및/또는 기타 다른 성분(잠재적으로, 게놈 서열 요소를 포함함) 사이의 상호작용을 통해, 하나 이상의 염색체 상의 서로 이격된 2개의 게놈 서열 요소를 합친 복합체이다. 일부 구현예에서, 게놈 서열 요소는 복합체의 하나 이상의 단백질 성분이 결합하는 앵커 서열이다. 일부 구현예에서, 게놈 복합체는 앵커 서열-매개 연접부를 포함할 수 있다. 일부 구현예에서, 게놈 서열 요소는 CTCF 결합 모티프, 프로모터 및/또는 인핸서일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 게놈 서열 요소는 프로모터 및/또는 조절 부위(예를 들어, 인핸서) 중 적어도 하나 또는 둘 모두를 포함한다. 일부 구현예에서, 복합체 형성은 게놈 서열 요소(들)에서 그리고/또는 게놈 서열 요소(들)에 대한 단백질 성분(들) 중 하나 이상의 결합에 의해 핵형성된다. 당업자에 의해 이해되는 바와 같이, 일부 구현예에서 복합체의 형성을 통한 게놈 부위들의 공동국재화(예를 들어, 연접)는 게놈 서열 요소(들)에서 또는 그 부근에서(일부 구현예에서는, 이들 사이를 포함함), DNA 토폴로지를 변경시킨다. 일부 구현예에서, 게놈 복합체는 하나 이상의 루프를 포함하는 앵커 서열-매개 연접부를 포함한다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체는 핵형성 폴리펩티드, 예컨대 CTCF 및/또는 코헤신(Cohesin)에 의해 핵형성된다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체는, 예를 들어 CTCF, 코헤신, 비-코딩 RNA(예를 들어, eRNA), 전사 기구 단백질(예를 들어, RNA 중합효소, 하나 이상의 전사 인자, 예를 들어 TFIIA, TFIIB, TFIID, TFIIE, TFIIF, TFIIH 등으로 구성되는 군으로부터 선택된 것), 전사 조절인자(예를 들어, 메디에이터(Mediator), P300, 인핸서-결합 단백질, 리프레서-결합 단백질, 히스톤 변형제 등) 등 중 하나 이상을 포함할 수 있다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체는 하나 이상의 폴리펩티드 성분 및/또는 하나 이상의 핵산 성분(예를 들어, 하나 이상의 RNA 성분)을 포함하며, 이들은, 일부 구현예에서, 복합체가 형성되지 않을 때 채택하지 않는 토폴로지 형상(예를 들어, 루프) 내로의 게놈 DNA의 신장(stretch)을 구속하도록 서로 그리고/또는 하나 이상의 게놈 서열 요소(예를 들어, 앵커 서열, 프로모터 서열, 조절 서열(예를 들어, 인핸서 서열))와 상호작용할 수 있다.
핵산 : 본 명세서에 사용되는 바와 같이, 용어 "핵산"은, 그의 가장 넓은 의미에서, 올리고뉴클레오티드 사슬 내로 도입되거나 도입될 수 있는 임의의 화합물 및/또는 물질을 지칭한다. 일부 구현예에서, 핵산은 포스포디에스테르 결합을 통해 올리고뉴클레오티드 사슬 내로 도입되거나 도입될 수 있는 화합물 및/또는 물질이다. 맥락으로부터 명백한 바와 같이, 일부 구현예에서 "핵산"은 개별 핵산 잔기(예를 들어, 뉴클레오티드 및/또는 뉴클레오시드)를 지칭하고; 일부 구현예에서, "핵산"은 개별 핵산 잔기들을 포함하는 올리고뉴클레오티드 사슬을 지칭한다. 일부 구현예에서, "핵산"은 RNA이거나 이를 포함하고; 일부 구현예에서, "핵산"은 DNA이거나 이를 포함한다. 일부 구현예에서, 핵산은 하나 이상의 천연 핵산 잔기이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 하나 이상의 핵산 유사체이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산 유사체는 포스포디에스테르 백본을 이용하지 않는다는 점에서 핵산과 상이하다. 예를 들어, 일부 구현예에서, 핵산은 하나 이상의 "펩티드 핵산"이거나, 이를 포함하거나, 이로 구성되는데, 펩티드 핵산은 당업계에 알려져 있고, 백본 내에 포스포디에스테르 결합 대신에 펩티드 결합을 가지며, 본 발명의 범주 내에 있는 것으로 여겨진다. 대안적으로 또는 추가적으로, 일부 구현예에서, 핵산은 포스포디에스테르 결합 대신에 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포르아미다이트 결합을 갖는다. 일부 구현예에서, 핵산은 하나 이상의 천연 뉴클레오시드(예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시 구아노신, 및 데옥시시티딘)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 하나 이상의 뉴클레오시드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, C-5 프로피닐-시티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, 0(6)-메틸구아닌, 2-티오시티딘, 메틸화 염기, 삽입된 염기, 및 이들의 조합)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 천연 핵산 내의 것들과 비교할 때 하나 이상의 변형된 당(예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스)을 포함한다. 일부 구현예에서, 핵산은 기능성 유전자 산물, 예컨대 RNA 또는 단백질을 인코딩하는 뉴클레오티드 서열을 갖는다. 일부 구현예에서, 핵산은 하나 이상의 인트론을 포함한다. 일부 구현예에서, 핵산은 천연 공급원로부터의 단리, 상보적 주형을 기반으로 한 중합에 의한 효소적 합성(생체내 또는 시험관내), 재조합 세포 또는 시스템에서의 재생산, 및 화학적 합성 중 하나 이상에 의해 제조된다. 일부 구현예에서, 핵산은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 20, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000개 또는 그 이상의 잔기 길이이다. 일부 구현예에서, 핵산은 부분적으로 또는 전체적으로 단일 가닥이고; 일부 구현예에서, 핵산은 부분적으로 또는 전체적으로 이중 가닥이다. 일부 구현예에서, 핵산은, 폴리펩티드를 인코딩하는 서열의 상보체이거나 폴리펩티드를 인코딩하는 적어도 하나의 요소를 포함하는 뉴클레오티드 서열을 갖는다. 일부 구현예에서, 핵산은 효소 활성을 갖는다.
작동가능하게 연결된 : 본 명세서에 사용되는 바와 같이, 어구 "작동가능하게 연결된"은 기재된 성분들이 그들의 의도된 방식으로 기능할 수 있게 하는 관계에 있게 하는 병치(juxtaposition)를 지칭한다. 기능성 요소, 예를 들어 유전자에 "작동가능하게 연결된" 전사 제어 요소는 기능성 요소, 예를 들어 유전자의 발현 및/또는 활성이 전사 제어 요소와 양립가능한 조건 하에서 달성되도록 하는 방식으로 연관되어 있다. 일부 구현예에서, "작동가능하게 연결된" 전사 제어 요소는 관심 코딩 요소, 예를 들어 유전자와 연속적이며(예를 들어, 공유적으로 연결되어 있으며); 일부 구현예에서, 작동가능하게 연결된 전사 제어 요소는 관심 기능성 요소, 예를 들어 유전자에 대해 트랜스(trans)로 작용하거나 아니면 이로부터 떨어진 거리에서 작용한다. 일부 구현예에서, '작동가능하게 연결된'은 2개의 핵산 서열이 동일한 핵산 분자 상에 포함되어 있음을 의미한다. 추가의 구현예에서, '작동가능하게 연결된'은 2개의 핵산 서열이 동일한 핵산 분자 상에서, 예를 들어 1000, 500, 100, 50, 또는 10개의 서로의 염기쌍 이내에 서로 근접해 있거나 서로 직접 인접해 있음을 추가로 의미할 수 있다.
펩티드, 폴리펩티드, 단백질 : 본 명세서에 사용되는 바와 같이, 용어 "펩티드", "폴리펩티드", 및 "단백질"은 펩티드 결합에 의해, 또는 펩티드 결합 이외의 수단에 의해 공유적으로 연결된 아미노산 잔기들로 구성된 화합물을 지칭한다. 단백질 또는 펩티드는 적어도 2개의 아미노산을 함유해야 하며, 단백질 또는 펩티드의 서열을 구성할 수 있는 아미노산의 최대수에 대한 제한은 없다. 폴리펩티드는 펩티드 결합에 의해 또는 펩티드 결합 이외의 수단에 의해 서로 연결된 2개 이상의 아미노산을 포함하는 임의의 펩티드 또는 단백질을 포함한다. 본 명세서에 사용되는 바와 같이, 이 용어는 당업계에서, 예를 들어 펩티드, 올리고펩티드 및 올리고머로도 일반적으로 지칭되는 짧은 사슬, 및 당업계에서 단백질(이에는 많은 유형이 있음)로 일반적으로 지칭되는 더 긴 사슬 둘 모두를 지칭한다.
근접 : 본 명세서에 사용되는 바와 같이, 용어 "근접"은 제1 부위에서 부위-특이적 파괴제의 결합 및/또는 부위-특이적 파괴제에 의한 제1 부위의 변형이 다른 한쪽 부위의 결합 및/또는 변형과 동일하거나 실질적으로 동일한 효과를 생성하도록 할 2개의 부위, 예를 들어 핵산 부위의 접근성을 지칭한다. 예를 들어, DNA-표적화 모이어티는 앵커 서열(제2 부위)에 근접한 제1 부위에 결합할 수 있고, 상기 DNA-표적화 모이어티와 연관된 이펙터 모이어티는, 내인성 핵형성 폴리펩티드에 대한 앵커 서열의 결합이 마치 제2 부위(앵커 서열)가 결합되고/되거나 변형된 것처럼 실질적으로 동일하게 변형되도록 제1 부위를 후성유전학적으로 변형시킬 수 있다. 일부 구현예에서, 서로 근접한 부위는 서로 5000, 4000, 3000, 2000, 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 50, 40, 30, 20, 10, 또는 5개 염기쌍 미만이다.
서열 표적화 폴리펩티드 : 본 명세서에 사용되는 바와 같이, 용어 "서열 표적화 폴리펩티드"는 본 명세서에서 사용되는 바와 같이 표적 핵산 서열을 인식하거나 이에 특이적으로 결합하는 단백질, 예컨대 효소, 예를 들어 Cas9 또는 TALEN을 지칭한다. 일부 구현예에서, 서열 표적화 폴리펩티드는 엔도뉴클레아제 활성이 결여된 촉매적으로 비활성인 단백질, 예컨대 dCas9, TAL 이펙터 분자, 또는 Zn 핑거 분자이다.
특이적 결합: 본 명세서에 사용되는 바와 같이, 용어 "특이적 결합"은 결합이 일어나게 될 환경에서, 가능한 결합 파트너들 사이를 구별하는 능력을 지칭한다. 일부 구현예에서, 다른 잠재적인 표적들이 존재할 때 하나의 특정 표적과 상호작용하는 결합제는 그것이 상호작용하는 표적에 "특이적으로 결합한다"라고 지칭한다. 일부 구현예에서, 특이적 결합은 결합제와 이의 파트너 사이의 회합도(degree of association)를 검출하거나 결정함으로써 평가되고; 일부 구현예에서, 특이적 결합은 결합제-파트너 복합체의 해리도(degree of dissociation)를 검출하거나 결정함으로써 평가된다. 일부 구현예에서, 특이적 결합은 이의 파트너와 또 다른 실체 사이의 대체 상호작용과 경쟁할 수 있는 결합제의 능력을 검출하거나 결정함으로써 평가된다. 일부 구현예에서, 특이적 결합은 일정 범위의 농도에 걸쳐 그러한 검출 또는 결정을 수행함으로써 평가된다.
대상체 : 본 명세서에 사용되는 바와 같이, 용어 "대상체" 또는 "시험 대상체"는, 예를 들어 실험, 진단, 예방, 및/또는 치료 목적을 위해, 본 개시내용에 따라 제공되는 화합물 또는 조성물이 투여되는 임의의 유기체를 지칭한다. 통상적인 대상체는 동물(예를 들어, 포유동물, 예컨대 마우스, 래트, 토끼, 비-인간 영장류, 및 인간; 곤충; 벌레 등) 및 식물을 포함한다. 일부 구현예에서, 대상체는 질환, 장애, 및/또는 병태를 앓고 있고/있거나 걸리기 쉬울 수 있다.
실질적으로 : 본 명세서에 사용되는 바와 같이, 용어 "실질적으로"는 관심 특징 또는 특성의 전체적인 또는 거의 전체적인 범위 또는 정도를 나타내는 정성적인 조건을 지칭한다. 당업자는 생물학적 및 화학적 현상이, 설사 가능하다 하더라도, 거의 완료되지 않고/않거나 완료로 진행되지 않거나 절대적인 결과를 달성하거나 피하지 못한다는 것을 이해할 것이다. 따라서, 용어 "실질적으로"는, 본 명세서의 일부 구현예에서, 많은 생물학적 및 화학적 현상에 내재되어 있는 완료의 잠재적인 결여를 포착하는 데 사용될 수 있다.
증상이 감소된다 : 본 명세서에 사용되는 바와 같이, 어구 "증상이 감소된다"는 특정 질환, 장애 또는 병태의 하나 이상의 증상이 크기(예를 들어, 강도, 중증도 등) 및/또는 빈도가 감소될 때 사용될 수 있다. 일부 구현예에서, 특정 증상의 개시의 지연은 해당 증상의 빈도를 감소시키는 한 가지 형태인 것으로 여겨진다.
표적화 : 작용제 또는 실체는, 서로 접촉되게 한 조건 하에서 또 다른 표적화된 작용제 또는 실체에 특이적으로 결합한다면, 본 개시내용에 따라 그러한 또 다른 작용제 또는 실체를 "표적화"하는 것으로 여겨진다. 일부 구현예에서, 예를 들어, 항체(또는 이의 항원-결합 단편)는 그의 동종 에피토프 또는 항원을 표적화한다. 일부 구현예에서, 특정 서열을 갖는 핵산은 실질적으로 상보적인 서열의 핵산을 표적화한다. 일부 구현예에서, 앵커 서열에 특이적으로 결합하는 표적화 모이어티는 앵커 서열, 앵커 서열을 포함하는 ASMC, 및/또는 ASMC 내의 복수의 유전자를 표적화한다.
복수의 표적 유전자: 본 명세서에 사용되는 바와 같이, 용어 "복수의 표적 유전자"는, 예를 들어 발현의 조절을 위해 표적화된 하나 초과의 유전자(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9개, 또는 그 이상의 유전자)의 그룹을 의미한다. 일부 구현예에서, 복수의 표적 유전자는 표적화된 게놈 복합체의 일부이다. 일부 구현예에서, 복수의 표적 유전자의 각각의 유전자는, 예를 들어 본 명세서에 기재된 바와 같은 부위-특이적 파괴제에 의해 게놈 복합체가 표적화된 ASMC 내부에서 적어도 부분적으로, 표적 게놈 복합체의 일부로서 게놈 서열의 적어도 일부(예를 들어, 일부 또는 전부)를 갖는다. 일부 구현예에서, 조절은 복수의 표적 유전자의 발현의 억제를 포함한다. 일부 구현예에서, 복수의 표적 유전자는, 복수의 표적 유전자, 또는 복수의 표적 유전자 중 하나 이상에 작동가능하게 연결된 전사 제어 요소를 본 명세서에 기재된 부위-특이적 파괴제와 접촉시킴으로써 조절된다. 일부 구현예에서, 복수의 표적 유전자 중 하나 이상은 세포, 예를 들어 대상체(예를 들어, 환자) 내의 세포에서 비정상적으로 발현된다(예를 들어, 과발현됨). 일부 구현예에서, 복수의 표적 유전자는 관련된 기능성을 갖는다. 예를 들어, 복수의 표적 유전자 중의 유전자는 전부 발현될 때 전염증 효과를 가질 수 있고; 그러한 복수의 표적 유전자 중의 유전자는 본 명세서에서 전염증성 유전자 또는 표적 전염증성 유전자로 지칭될 수 있다. 일부 구현예에서, 복수의 표적 유전자 중의 유전자는 단백질을 인코딩한다. 일부 구현예에서, 복수의 표적 유전자 중의 유전자는 기능성 RNA를 인코딩한다.
표적화 모이어티 : 본 명세서에 사용되는 바와 같이, 용어 "표적화 모이어티"는 성분 또는 성분들의 세트, 예를 들어 본 명세서에 기재된 바와 같은 게놈 복합체(예를 들어, 앵커 서열-매개 연접부)에 참여하는 성분 또는 성분들과 특이적으로 상호작용하는(예를 들어, 표적화하는) 작용제 또는 실체를 의미한다. 일부 구현예에서, 본 개시내용에 따른 표적화 모이어티는 본 명세서에 기재된 바와 같은 게놈 복합체의 하나 이상의 표적 성분(들)을 표적화한다. 일부 구현예에서, 표적화 모이어티는 게놈 서열 요소(예를 들어, 앵커 서열)를 포함하는 게놈 복합체 성분을 표적화한다. 일부 구현예에서, 표적화 모이어티는 게놈 서열 요소 이외의 게놈 복합체 성분을 표적화한다. 일부 구현예에서, 표적화 모이어티는 게놈 복합체 성분의 복수 또는 조합을 표적화하며, 일부 구현예에서 복수는 게놈 서열 요소를 포함할 수 있다. 일부 양태에서, 본 개시내용의 기여는, 예를 들어 본 명세서에 기재된 바와 같은 표적 유전자(예를 들어, 융합 유전자, 예를 들어 융합 종양유전자) 및/또는 중단점에 근접한 표적 앵커 서열을 포함하는, 하나 이상의 게놈 복합체의 억제, 분리, 분해, 및/또는 변형이 게놈 서열 요소(들)를 포함하여 게놈 복합체 요소(들)를 부위-특이적 파괴제로 표적화함으로써 달성될 수 있다는 통찰을 포함한다. 일부 양태에서, 본 명세서에 기재된 바와 같은 하나 이상의 게놈 복합체의 효과적인 억제, 분리, 분해, 및/또는 변형은 게놈 서열 요소(들)를 포함하는 복합체 성분(들)을 표적화함으로써 달성될 수 있다. 일부 구현예에서, 본 개시내용은 (예를 들어, 주어진 시스템에서 형성되거나 이에 존재할 수 있는 다른 게놈 복합체와 비교하여 특정 게놈 복합체에 대한 특이성 정도, [예를 들어, 집단에서 검출된 복합체의 수에 대한 영향 측면에서] 억제, 분리, 분해, 또는 변형의 유효성과 관련하여) 개선된 억제, 분리, 분해, 또는 변형은 게놈 서열 요소가 아닌 하나 이상의 복합체 성분을 표적화함으로써 달성될 수 있고, 선택적으로, 대안적으로 또는 추가적으로 게놈 서열 요소를 표적화하는 것을 포함할 수 있음을 고려하며, 여기서 개선된 억제, 분리, 분해, 또는 변형은 게놈 서열 요소(들) 단독의 표적화를 통해 통상적으로 달성되는 것에 대해 상대적인 것이다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 부위-특이적 파괴제는 표적 게놈 복합체의 억제, 분리, 분해, 또는 변형을 촉진한다. 예를 들어, 비제한적인 예로서, 일부 구현예에서 본 명세서에 기재된 바와 같은 부위-특이적 파괴제는 주어진 게놈 복합체(예를 들어, 앵커 서열-매개 연접부를 포함함)의 적어도 하나의 성분을 표적화함으로써 앵커 서열-매개 연접부를 억제하고/하거나, 분리하고/하거나, (예를 들어, 이의 성분을) 분해하고/하거나, (예를 들어, 이의 성분을) 변형시킨다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 부위-특이적 파괴제는 특정 게놈 복합체(즉, 표적 게놈 복합체)를 억제하고/하거나, 분리하고/하거나, (예를 들어, 이의 성분을) 분해하고/하거나, (예를 들어, 이의 성분을) 변형시키고, 예를 들어 다른 세포(예를 들어, 비표적 세포)에 존재할 수 있고/있거나 동일한 세포 내(즉, 표적 세포 내) 상이한 부위 부위에 존재할 수 있는 적어도 하나의 다른 특정 게놈 복합체(즉, 비표적 게놈 복합체)를 억제하고/하거나, 분리하고/하거나, (예를 들어, 이의 성분을) 분해하고/하거나, (예를 들어, 이의 성분을) 변형시키지 않는다. 본 명세서에 기재된 바와 같은 부위-특이적 파괴제는 표적화 모이어티를 포함할 수 있다. 일부 구현예에서, 표적화 모이어티는 또한 이펙터 모이어티(예를 들어, 파괴 모이어티)로서 작용하고; 그러한 일부 구현예에서 제공된 부위-특이적 파괴제에는 표적화 모이어티와 분리된(또는 의미있게 구별되는) 임의의 이펙터 모이어티(예를 들어, 파괴, 변형, 또는 기타 다른 이펙터 모이어티)가 결여될 수 있다.
치료적 유효량: 본 명세서에 사용되는 바와 같이, 용어 "치료적 유효량"은 치료 투약계획(therapeutic regimen)의 일부로서 투여될 때 원하는 생물학적 반응을 이끌어내는 물질(예를 들어, 치료제, 조성물, 및/또는 제형)의 양을 의미한다. 일부 구현예에서, 물질의 치료적 유효량은 질환, 장애, 및/또는 병태를 앓거나 이에 취약한 대상체에게 투여될 때 그러한 질환, 장애, 및/또는 병태를 치료하고/하거나, 진단하고/하거나, 예방하고/하거나, 그의 발병을 지연시키기에 충분한 양이다. 당업자에 의해 이해되는 바와 같이, 물질의 유효량은 원하는 생물학적 종점(들), 전달하려는 물질, 표적 세포(들) 또는 조직(들) 등과 같은 인자들에 따라 달라질 수 있다. 예를 들어, 일부 구현예에서, 질환, 장애, 및/또는 병태를 치료하기 위한 제형 내의 화합물의 유효량은 그러한 질환, 장애, 및/또는 병태를 경감시키고/시키거나, 호전시키고/시키거나, 완화하고/하거나, 억제하고/하거나, 예방하고/하거나, 이의 발병을 지연시키고/시키거나, 이의 중증도를 감소시키고/시키거나, 이의 하나 이상의 증상 또는 특징의 발생률을 감소시키는 양이다. 일부 구현예에서, 치료적 유효량은 단회 용량으로 투여되고; 일부 구현예에서는, 치료적 유효량을 전달하기 위해 다회 단위 용량이 요구된다.
전사 제어 서열 : 본 명세서에 사용되는 바와 같이, 용어 "전사 제어 서열"은 유전자의 전사를 증가시키거나 감소시키는 핵산 서열을 지칭한다. "인핸싱 서열"은 유전자 전사의 가능성을 증가시킨다. "침묵 또는 리프레서 서열"은 유전자 전사의 가능성을 감소시킨다. 전사 제어 서열의 예는 프로모터 및 인핸서를 포함한다. 일부 구현예에서, ASMC는 전사 제어 서열을 포함한다. 그러한 전사 제어 서열은 내부 전사 제어 서열로 지칭된다(예를 들어, ASMC 내부에 포함되는 인핸싱 서열은 내부 인핸싱 서열로 지칭됨).
본 개시내용의 구현예에 대한 하기의 상세한 설명은 첨부 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 개시내용을 설명할 목적으로, 도면에 현재 예시된 구현예가 나타나 있다. 그러나, 본 개시내용은 도면에 나타낸 구현예의 정밀한 배열 및 수단으로 한정되지 않음이 이해되어야 한다.
도 1은 앵커 서열에서 gRNA 서열의 예시적인 위치결정을 보여주는 다이어그램을 나타낸다. 도면은 보여지는 순서대로 각각 서열번호 244 내지 245를 개시한다.
도 2는 앵커 서열에서 gRNA 서열의 예시적인 위치결정 및 제한 부위 정보를 보여주는 다이어그램을 나타낸다. 도면은 보여지는 순서대로 각각 서열번호 246 내지 247을 개시한다.
도 3은 CRISPR/Cas 분자 및 제1 예시적인 gRNA를 포함하는 부위-특이적 파괴제로 처리한 TNF-처리 세포 및 상기 부위-특이적 파괴제로 처리하지 않은 TNF-처리 세포에서 다양한 케모카인의 발현(mRNA)의 그래프를 나타낸다.
도 4는 CRISPR/Cas 분자 및 제2 예시적인 gRNA를 포함하는 부위-특이적 파괴제로 처리한 TNF-처리 세포 및 상기 부위-특이적 파괴제로 처리하지 않은 TNF-처리 세포에서 다양한 케모카인의 발현(mRNA)의 그래프를 나타낸다.
도 5는 게놈 복합체, 예를 들어 ASMC의 다양한 유형, 예를 들어 루프, 및 내부에 포함된 유전자의 발현을 변경시키는 방법에 대한 모델을 도시하는 다이어그램을 나타낸다.
도 6은 CRISPR/Cas 분자 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 THP-1 세포에서 CXCL1, CXCL2, CXCL3, 및 IL-8의 RNA 수준에 의해 측정된 사이토카인 발현의 그래프를 나타낸다.
도 7은 CRISPR/Cas 분자 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 상이한 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 THP-1 세포의 사이토카인 분비(CXCL1 및 IL-8)의 그래프를 나타낸다.
도 8은 CRISPR/Cas 분자 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL3)의 그래프(상단), 및 실험에서 세포가 처리되는 방법을 나타내는 순서도(하단)를 나타낸다.
도 9a는 CRISPR/Cas 분자 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리하고 3주 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프(상단), 및 실험에서 세포가 처리되는 방법을 나타내는 순서도(하단)를 나타낸다. 도 9b는 CRISPR/Cas 분자 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리하고 3주 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL3)의 그래프를 나타낸다.
도 10은 촉매적으로 비활성인 CRISPR/Cas 분자와 전사 리프레서(KRAB) 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프를 나타낸다.
도 11은 촉매적으로 비활성인 CRISPR/Cas 분자와 히스톤 메틸트랜스퍼라제(EZH2) 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프를 나타낸다.
도 12는 촉매적으로 비활성인 CRISPR/Cas 분자와 DNA 메틸트랜스퍼라제(MQ1) 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프를 나타낸다.
도 13은 72시간, 3주, 또는 4주 동안 상이한 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프(상단), 및 실험에서 세포가 처리되는 방법을 나타내는 순서도(하단)를 나타낸다.
도 14는 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA 및 상이한 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL3)의 그래프(상단), 및 실험에서 세포가 처리되는 방법을 나타내는 순서도(하단)를 나타낸다.
도 15는 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA 및 상이한 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프(상단)를 나타낸다.
도 16은 인간 CXCL IGD 및 유전자 클러스터 구성을 나타낸다. 도 16a는 CXLC1 내지 CXCL8 유전자 클러스터 내 2개의 루프를 설명하는 개략적인 절연 게놈 도메인(Insulated Genomic Domain; IGD)을 나타낸다. CXCL8, CXCL6, 및 CXCL 1 유전자는 IGD의 좌측 루프에 있다. CXCL2 내지 CXCL5 및 CXCL7 유전자는 IGD의 우측 루프에 있다. 상이한 세포주로부터의 IGD 데이터 조사는 중간 CTCF가 CXCL을 분비하는 세포(예를 들어, 림프구에는 아님)에만 존재함을 시사하였다.
도 16b는 좌측 CTCF-2, 좌측 CTCF, 중간 CTCF, 및 우측 CTCF의 4가지 상이한 CTCF 표적에 대해 가이드가 설계되었음을 나타낸다.
도 17은 dCas9-EZH2 가이드 30183이 TNF-알파로 처리한 인간 A549 폐암 상피 세포에서 CXCL1 내지 CXCL8 클러스터 내에 위치한 중간 CTCF 모티프를 표적화했을 때 CXCL1 내지 CXCL8 유전자가 하향조절되었음을 나타낸다. 대조군으로서 TNF 알파로 자극된 세포를 처리하였다.
도 18은 dCas9-EZH2 가이드 30183이 TNF-알파로 처리한 인간 IMR-90 정상 폐 섬유아세포에서 CXCL1 내지 CXCL8 클러스터 내에 위치한 중간 CTCF 모티프를 표적화했을 때 CXCL1, 2, 3, 8 유전자가 하향조절되었음을 나타낸다. 대조군으로서 TNF 알파로 자극된 세포를 처리하였다.
도 19는 컨트롤러(Controller) A가 TNF-알파로 처리한 인간 단핵구에서 CXCL1 내지 CXCL8 클러스터 내에 위치한 좌측 CTCF 모티프를 표적화했을 때 CXCL1, 2, 3, 8 유전자가 하향조절되었음을 나타낸다. 대조군으로서 TNF 알파로 자극된 세포를 처리하였다.
도 20은 마우스 CXCL IGD 및 유전자 클러스터 구성을 나타낸다. 도 20a는 CXCL 유전자 클러스터 내 2개의 루프를 설명하는 개략적인 절연 게놈 도메인(IGD)을 나타낸다. 도 20b는 CXLC1 내지 5, 7 및 15 유전자 클러스터 내 2개의 루프를 설명한다. CXCL4, CXCL5, 및 CXCL7 유전자는 IGD의 좌측 루프에 있다. CXCL1 내지 3 및 CXCL15 유전자는 좌측(L), 중간 1(M1), 중간 2(M2), 및 우측(R) CTCF의 4가지 상이한 CTCF 표적에 대해 설계된 IGD 가이드의 우측 루프에 있다.
도 21a는 IGD 가이드가 중간 1(M1), 중간 2(M2), 및 우측(R) CTCF의 4가지 상이한 CTCF 표적에 대해 설계되었음을 나타낸다.
도 21b는 dCas9-MQ1을 사용한 Hep 1.6에서 마우스 CXCML IGD의 시험관내 하향조절을 나타낸다. CXCL 유전자 클러스터에서 우측, 또는 2개의 중간 CTCF 모티프 중 하나를 표적화하는 가이드를 사용하여 dCas9-MQ1을 형질감염시켰으며, 이는 TNF 알파 자극 후 7개의 CXCL 유전자 중 어느 것에서도 하향조절하지 않는 것으로 나타났다(주황색). 중간 CTCF와 우측 둘 모두를 표적화하는 조합 가이드를 사용하여 dCas9-MQ1을 형질감염시켰을 때, 전체 유전자 클러스터가 하향조절되었다(파란색).
도 22의 A는 염증이 있는 폐에서 백혈구 여과 감소에 대한 dCas9-MQ1의 효과를 결정하기 위한 개략적인 실험 설계를 나타낸다. -2시간 시점에서 2개의 중간 및 우측 CTCF를 표적화하는 3 mg/kg의 dCas9-MQ1 또는 LNP 단독으로 각각의 마우스를 처리하였다. 0시간에 5 mg/kg LPS에 이어, +8시간 시점에 2개의 중간 및 우측 CTCF를 표적화하는 3 mg/kg의 dCas9-MQ1 또는 LNP 단독의 두 번째 투약으로 마우스를 시뮬레이션하였다. 0, 24, 및 48시간째에 10 mg/kg의 용량으로 덱사메타손을 복강내 투여하였다. 72시간째에 동물을 종료시키고 유동 염색을 위해 세기관지 세척액을 폐로부터 수집하였다.
도 22의 B는 dCas9-MQ1의 전신 투여가 염증이 있는 폐에서 백혈구 침윤을 감소시켰음을 나타낸다. dCas9-MQ1 처리 마우스로부터 수득한 세기관지 세척액에서 mL당 총 백혈구 수는 LPS + 질환 동물과 비교하여 현저한 차이를 나타내었다.
도 23a는 마우스의 염증이 있는 폐로부터 수득한 세기관지 세척액에서 확인된 침윤 세포의 조성을 나타낸다. 침윤 세포의 대부분을 구성하는 백혈구 세포 유형은 호중구이며, B 세포, T 세포, 대식세포 및 다른 유형의 조혈 세포가 그 뒤를 잇는다.
도 23b는 dCas9-MQ1이 +LPS 질환 그룹과 비교하여 현저한 차이로 폐에 침윤하는 호중구의 수를 감소시켰음을 나타낸다.
도 24는 BALF에서 백혈구 세포의 감소가 폐 특이적이며 말초 혈액에서 백혈구의 감소로 인한 것이 아님을 나타낸다. 이 그래프는 dCas9-MQ1로 처리한 BALF에서 백혈구 수의 감소 효과가 폐 특이적이고, 마우스 자체에서 백혈구 집단의 감소가 있기 때문이 아님을 설명하였다. 말초 혈액 중 조혈 세포 집단은 모든 그룹에 걸쳐 유사하였다.
도 25a 내지 25g는 CXCL1-5, CXCL7, 및 CXCL15 유전자 발현이 폐 조직에서 감소되었음을 나타낸다. 동물을 LNP 단독 또는 dCas9-MQ1로 처리한 후, 폐 조직을 처리하여 qPCR 방법에 의해 CXCL 유전자 발현을 확인하였다. 모든 CXCL 유전자는 dCA9-MQ1로 처리될 대 하향조절을 나타낸다. CXCL2 발현이 가장 많이 하향조절되었다.
도 26은 CXCL 발현 및 염증 부위로의 세포 동원의 감소가 다른 사이토카인의 존재를 감소시키는 유익한 하류 효과를 보였음을 나타낸다.
BALF에서 분비된 케모카인 단백질 수준은 CXCL 1 및 2 단백질 수준의 감소를 나타내었다. CXCL 발현 및 염증 부위로의 세포 동원의 감소는 GM-CSF(도 26c) 및 IL6(도 26d)의 존재를 감소시키는 유익한 하류 효과를 보였다.
도 1은 앵커 서열에서 gRNA 서열의 예시적인 위치결정을 보여주는 다이어그램을 나타낸다. 도면은 보여지는 순서대로 각각 서열번호 244 내지 245를 개시한다.
도 2는 앵커 서열에서 gRNA 서열의 예시적인 위치결정 및 제한 부위 정보를 보여주는 다이어그램을 나타낸다. 도면은 보여지는 순서대로 각각 서열번호 246 내지 247을 개시한다.
도 3은 CRISPR/Cas 분자 및 제1 예시적인 gRNA를 포함하는 부위-특이적 파괴제로 처리한 TNF-처리 세포 및 상기 부위-특이적 파괴제로 처리하지 않은 TNF-처리 세포에서 다양한 케모카인의 발현(mRNA)의 그래프를 나타낸다.
도 4는 CRISPR/Cas 분자 및 제2 예시적인 gRNA를 포함하는 부위-특이적 파괴제로 처리한 TNF-처리 세포 및 상기 부위-특이적 파괴제로 처리하지 않은 TNF-처리 세포에서 다양한 케모카인의 발현(mRNA)의 그래프를 나타낸다.
도 5는 게놈 복합체, 예를 들어 ASMC의 다양한 유형, 예를 들어 루프, 및 내부에 포함된 유전자의 발현을 변경시키는 방법에 대한 모델을 도시하는 다이어그램을 나타낸다.
도 6은 CRISPR/Cas 분자 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 THP-1 세포에서 CXCL1, CXCL2, CXCL3, 및 IL-8의 RNA 수준에 의해 측정된 사이토카인 발현의 그래프를 나타낸다.
도 7은 CRISPR/Cas 분자 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 상이한 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 THP-1 세포의 사이토카인 분비(CXCL1 및 IL-8)의 그래프를 나타낸다.
도 8은 CRISPR/Cas 분자 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL3)의 그래프(상단), 및 실험에서 세포가 처리되는 방법을 나타내는 순서도(하단)를 나타낸다.
도 9a는 CRISPR/Cas 분자 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리하고 3주 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프(상단), 및 실험에서 세포가 처리되는 방법을 나타내는 순서도(하단)를 나타낸다. 도 9b는 CRISPR/Cas 분자 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리하고 3주 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL3)의 그래프를 나타낸다.
도 10은 촉매적으로 비활성인 CRISPR/Cas 분자와 전사 리프레서(KRAB) 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프를 나타낸다.
도 11은 촉매적으로 비활성인 CRISPR/Cas 분자와 히스톤 메틸트랜스퍼라제(EZH2) 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프를 나타낸다.
도 12는 촉매적으로 비활성인 CRISPR/Cas 분자와 DNA 메틸트랜스퍼라제(MQ1) 및 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA를 포함하는 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프를 나타낸다.
도 13은 72시간, 3주, 또는 4주 동안 상이한 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프(상단), 및 실험에서 세포가 처리되는 방법을 나타내는 순서도(하단)를 나타낸다.
도 14는 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA 및 상이한 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL3)의 그래프(상단), 및 실험에서 세포가 처리되는 방법을 나타내는 순서도(하단)를 나타낸다.
도 15는 사이토카인-인코딩 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 앵커 서열에 대해 표적화된 sgRNA 및 상이한 부위-특이적 파괴제로 처리한 후 THP-1 세포에서 RNA 수준에 의해 측정된 사이토카인 발현(CXCL1)의 그래프(상단)를 나타낸다.
도 16은 인간 CXCL IGD 및 유전자 클러스터 구성을 나타낸다. 도 16a는 CXLC1 내지 CXCL8 유전자 클러스터 내 2개의 루프를 설명하는 개략적인 절연 게놈 도메인(Insulated Genomic Domain; IGD)을 나타낸다. CXCL8, CXCL6, 및 CXCL 1 유전자는 IGD의 좌측 루프에 있다. CXCL2 내지 CXCL5 및 CXCL7 유전자는 IGD의 우측 루프에 있다. 상이한 세포주로부터의 IGD 데이터 조사는 중간 CTCF가 CXCL을 분비하는 세포(예를 들어, 림프구에는 아님)에만 존재함을 시사하였다.
도 16b는 좌측 CTCF-2, 좌측 CTCF, 중간 CTCF, 및 우측 CTCF의 4가지 상이한 CTCF 표적에 대해 가이드가 설계되었음을 나타낸다.
도 17은 dCas9-EZH2 가이드 30183이 TNF-알파로 처리한 인간 A549 폐암 상피 세포에서 CXCL1 내지 CXCL8 클러스터 내에 위치한 중간 CTCF 모티프를 표적화했을 때 CXCL1 내지 CXCL8 유전자가 하향조절되었음을 나타낸다. 대조군으로서 TNF 알파로 자극된 세포를 처리하였다.
도 18은 dCas9-EZH2 가이드 30183이 TNF-알파로 처리한 인간 IMR-90 정상 폐 섬유아세포에서 CXCL1 내지 CXCL8 클러스터 내에 위치한 중간 CTCF 모티프를 표적화했을 때 CXCL1, 2, 3, 8 유전자가 하향조절되었음을 나타낸다. 대조군으로서 TNF 알파로 자극된 세포를 처리하였다.
도 19는 컨트롤러(Controller) A가 TNF-알파로 처리한 인간 단핵구에서 CXCL1 내지 CXCL8 클러스터 내에 위치한 좌측 CTCF 모티프를 표적화했을 때 CXCL1, 2, 3, 8 유전자가 하향조절되었음을 나타낸다. 대조군으로서 TNF 알파로 자극된 세포를 처리하였다.
도 20은 마우스 CXCL IGD 및 유전자 클러스터 구성을 나타낸다. 도 20a는 CXCL 유전자 클러스터 내 2개의 루프를 설명하는 개략적인 절연 게놈 도메인(IGD)을 나타낸다. 도 20b는 CXLC1 내지 5, 7 및 15 유전자 클러스터 내 2개의 루프를 설명한다. CXCL4, CXCL5, 및 CXCL7 유전자는 IGD의 좌측 루프에 있다. CXCL1 내지 3 및 CXCL15 유전자는 좌측(L), 중간 1(M1), 중간 2(M2), 및 우측(R) CTCF의 4가지 상이한 CTCF 표적에 대해 설계된 IGD 가이드의 우측 루프에 있다.
도 21a는 IGD 가이드가 중간 1(M1), 중간 2(M2), 및 우측(R) CTCF의 4가지 상이한 CTCF 표적에 대해 설계되었음을 나타낸다.
도 21b는 dCas9-MQ1을 사용한 Hep 1.6에서 마우스 CXCML IGD의 시험관내 하향조절을 나타낸다. CXCL 유전자 클러스터에서 우측, 또는 2개의 중간 CTCF 모티프 중 하나를 표적화하는 가이드를 사용하여 dCas9-MQ1을 형질감염시켰으며, 이는 TNF 알파 자극 후 7개의 CXCL 유전자 중 어느 것에서도 하향조절하지 않는 것으로 나타났다(주황색). 중간 CTCF와 우측 둘 모두를 표적화하는 조합 가이드를 사용하여 dCas9-MQ1을 형질감염시켰을 때, 전체 유전자 클러스터가 하향조절되었다(파란색).
도 22의 A는 염증이 있는 폐에서 백혈구 여과 감소에 대한 dCas9-MQ1의 효과를 결정하기 위한 개략적인 실험 설계를 나타낸다. -2시간 시점에서 2개의 중간 및 우측 CTCF를 표적화하는 3 mg/kg의 dCas9-MQ1 또는 LNP 단독으로 각각의 마우스를 처리하였다. 0시간에 5 mg/kg LPS에 이어, +8시간 시점에 2개의 중간 및 우측 CTCF를 표적화하는 3 mg/kg의 dCas9-MQ1 또는 LNP 단독의 두 번째 투약으로 마우스를 시뮬레이션하였다. 0, 24, 및 48시간째에 10 mg/kg의 용량으로 덱사메타손을 복강내 투여하였다. 72시간째에 동물을 종료시키고 유동 염색을 위해 세기관지 세척액을 폐로부터 수집하였다.
도 22의 B는 dCas9-MQ1의 전신 투여가 염증이 있는 폐에서 백혈구 침윤을 감소시켰음을 나타낸다. dCas9-MQ1 처리 마우스로부터 수득한 세기관지 세척액에서 mL당 총 백혈구 수는 LPS + 질환 동물과 비교하여 현저한 차이를 나타내었다.
도 23a는 마우스의 염증이 있는 폐로부터 수득한 세기관지 세척액에서 확인된 침윤 세포의 조성을 나타낸다. 침윤 세포의 대부분을 구성하는 백혈구 세포 유형은 호중구이며, B 세포, T 세포, 대식세포 및 다른 유형의 조혈 세포가 그 뒤를 잇는다.
도 23b는 dCas9-MQ1이 +LPS 질환 그룹과 비교하여 현저한 차이로 폐에 침윤하는 호중구의 수를 감소시켰음을 나타낸다.
도 24는 BALF에서 백혈구 세포의 감소가 폐 특이적이며 말초 혈액에서 백혈구의 감소로 인한 것이 아님을 나타낸다. 이 그래프는 dCas9-MQ1로 처리한 BALF에서 백혈구 수의 감소 효과가 폐 특이적이고, 마우스 자체에서 백혈구 집단의 감소가 있기 때문이 아님을 설명하였다. 말초 혈액 중 조혈 세포 집단은 모든 그룹에 걸쳐 유사하였다.
도 25a 내지 25g는 CXCL1-5, CXCL7, 및 CXCL15 유전자 발현이 폐 조직에서 감소되었음을 나타낸다. 동물을 LNP 단독 또는 dCas9-MQ1로 처리한 후, 폐 조직을 처리하여 qPCR 방법에 의해 CXCL 유전자 발현을 확인하였다. 모든 CXCL 유전자는 dCA9-MQ1로 처리될 대 하향조절을 나타낸다. CXCL2 발현이 가장 많이 하향조절되었다.
도 26은 CXCL 발현 및 염증 부위로의 세포 동원의 감소가 다른 사이토카인의 존재를 감소시키는 유익한 하류 효과를 보였음을 나타낸다.
BALF에서 분비된 케모카인 단백질 수준은 CXCL 1 및 2 단백질 수준의 감소를 나타내었다. CXCL 발현 및 염증 부위로의 세포 동원의 감소는 GM-CSF(도 26c) 및 IL6(도 26d)의 존재를 감소시키는 유익한 하류 효과를 보였다.
본 개시내용은 부위-특이적 파괴제 또는 2가지 이상의 부위-특이적 파괴제를 포함하는 시스템의 사용을 통해 세포, 예를 들어 대상체 또는 환자의 세포 내의 복수의 표적 유전자의 발현을 조절하기 위한, 예를 들어 감소시키기 위한 기술을 제공한다. 일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티 및 이펙터 모이어티를 포함한다. 이론에 의해 구애되고자 함이 없이, 다수의 질환 및 병태는 공통되는 게놈 복합체, 예를 들어 ASMC와 연관된 관련 기능성을 갖는 유전자 그룹과 연관된다. 복수의 표적 유전자를 (전체적으로 또는 부분적으로) 포함하는 게놈 복합체, 예를 들어 ASMC의 조절, 예를 들어 파괴는 개별 표적 유전자의 조절에 비해 (예를 들어, 변경의 개선된 효율, 효능, 및/또는 안정성과 관련하여) 복수의 표적 유전자의 발현을 변경시키는(예를 들어, 감소시키는) 것에 대한 개선된 접근법일 수 있다. 상기 개선은 복수의 표적 유전자와 연관된 질환 및 병태의 치료에서 상응하는 개선으로 해석될 수 있다. 예를 들어, 복수의 유전자는 전염증성 효과와 연관될 수 있고 부위-특이적 파괴제는 복수의 유전자를 (전체적으로 또는 부분적으로) 포함하는 게놈 복합체, 예를 들어 ASMC를 표적화하여 복수의 유전자의 발현을 조절할, 예를 들어 감소시킬 수 있으며, 이에 의해 항염 효과(예를 들어, 복수의 유전자를 개별적으로 표적화하는 것 대비 우수한 항염 효과)를 달성할 수 있다. 부위-특이적 파괴제, 표적화 모이어티, 이펙터 모이어티, 및 복수의 표적 유전자의 예가 본 명세서에서 제공된다.
부위-특이적 파괴제는 하나 이상의 양상에 의해 복수의 표적 유전자의 발현을 조절할, 예를 들어 감소시킬 수 있다. 일부 구현예에서, 부위-특이적 파괴제는 표적 부위, 예를 들어 앵커 서열에 결합하고, 다른 게놈 복합체 성분, 예를 들어 핵형성 폴리펩티드와 결합에 대해 물리적으로 또는 입체적으로 경쟁한다. 이론에 의해 구애되고자 함이 없이, 예를 들어 앵커 서열에 대한 게놈 복합체 성분(예를 들어, 핵형성 폴리펩티드)의 결합이 억제되도록(예를 들어, 방지되도록) 하는 앵커 서열의 물리적 또는 입체적 차단은 부위-특이적 파괴제가 복수의 표적 유전자의 발현을 조절할, 예를 들어 감소시킬 수 있는 하나의 메커니즘이다. 부위-특이적 파괴제는, 예를 들어 게놈 복합체 성분이 앵커 서열에 결합하는 친화도 및/또는 결합력을 변경(예를 들어, 감소)시킴으로써, 게놈 복합체 성분(예를 들어, 핵형성 폴리펩티드)과 앵커 서열의 상호작용을 불안정화시킬 수 있다. 앵커 서열에 대한 게놈 복합체 성분(예를 들어, 핵형성 폴리펩티드)의 결합을 차단 또는 불안정화시키는 것은, 앵커 서열 또는 이에 근접한 서열의 후성유전학적 변형, 앵커 서열 또는 이에 근접한 서열의 유전적 변형, 또는 앵커 서열 또는 이에 근접한 서열에 대한 부위-특이적 파괴제의 결합을 포함하는 하나 이상의 수단에 의해 달성될 수 있다. 앵커 서열에 대한 게놈 복합체 성분(예를 들어, 핵형성 폴리펩티드)의 결합을 억제(예를 들어, 방지)하는 것은 게놈 복합체, 예를 들어 ASMC를 억제(예를 들어, 이의 형성을 파괴 또는 방지)할 수 있다. 복수의 표적 유전자를 전체적으로 또는 부분적으로 포함하는 게놈 복합체, 예를 들어 ASMC의 억제는 복수의 표적 유전자의 유전자 발현을 조절할, 예를 들어 감소시킬 수 있다. 일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티, 제1 이펙터 모이어티, 및 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 제2 이펙터 모이어티의 서열과 상이한 서열을 갖는다. 일부 구현예에서, 제1 이펙터 모이어티는 제2 이펙터 모이어티의 서열과 동일한 서열을 갖는다.
본 개시내용은 부분적으로 2개 이상의 부위-특이적 파괴제를 포함하는 시스템을 추가로 제공하며, 각각의 부위-특이적 파괴제는 표적화 모이어티 및 선택적으로 이펙터 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티는 2개 이상의 상이한 서열을 표적화한다(예를 들어, 각각의 부위-특이적 파괴제는 상이한 서열을 표적화할 수 있음). 일부 구현예에서, 제1 부위-특이적 파괴제는 복수의 표적 유전자, 예를 들어 인간 CXCL1 내지 CXCL8에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS))에 결합하고 제2 부위-특이적 파괴제는 복수의 표적 유전자, 예를 들어 인간 CXCL1 내지 CXCL8을 포함하는 앵커 서열-매개 연접부(ASMC)의 앵커 서열에 결합한다. 일부 구현예에서, 시스템에 의한 복수의 표적 유전자, 예를 들어 인간 CXCL1 내지 CXCL8의 발현 조절은 제1 및 제2 DNA 서열 각각에 대한 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제의 결합을 포함한다. 제1 및 제2 DNA의 결합은 제1 및 제2 이펙터 모이어티의 기능성을 이들 부위로 국재화한다. 이론에 의해 구애되고자 함이 없이, 일부 구현예에서 제1 및 제2 부위-특이적 파괴제 이펙터 모이어티 둘 모두의 기능성을 사용하는 것은 제1 및/또는 제2 DNA 서열과 연관되거나 이를 포함하는 복수의 표적 유전자의 발현을 안정적으로 억제하며, 예를 들어 여기서 제1 및/또는 제2 DNA 서열은 복수의 표적 유전자 또는 하나 이상의 작동가능하게 연결된 전사 제어 요소의 서열이거나 이를 포함한다.
부위-특이적 파괴제
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티는 DNA 서열, 예를 들어 앵커 서열에 특이적으로 결합하며, 이에 의해 상기 DNA 서열을 포함하는 게놈 복합체(예를 들어, ASMC)를 조절, 예를 들어 파괴한다. 일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티 및 이펙터 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티는 DNA 서열에 특이적으로 결합하며, 이에 의해 이펙터 모이어티의 기능성을 DNA 서열로 국재화하고, 이에 의해 상기 DNA 서열을 포함하는 게놈 복합체(예를 들어, ASMC)를 조절, 예를 들어 파괴한다. 일부 구현예에서, 부위-특이적 파괴제는 하나의 표적화 모이어티 및 하나의 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 하나의 표적화 모이어티 및 하나 초과의 이펙터 모이어티, 예를 들어 2, 3, 4, 또는 5개의 이펙터 모이어티를 포함하며, 각 이펙터 모이어티는 하나 초과의 이펙터 모이어티 중 또 다른 것과 동일하거나 상이할 수 있다. 일부 구현예에서, 부위-특이적 파괴제는 2개의 이펙터 모이어티를 포함할 수 있으며, 제1 이펙터 모이어티는 제2 이펙터 모이어티와 상이한 기능성을 포함한다. 예를 들어, 부위-특이적 파괴제는 2개의 이펙터 모이어티를 포함할 수 있으며, 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제 기능성을 포함하고(예를 들어, G9A 또는 EZH2 또는 이의 기능성 단편 또는 변이체를 포함함) 제2 이펙터 모이어티는 전사 리프레서 기능성을 포함한다(예를 들어, KRAB 또는 이의 기능성 단편 또는 변이체를 포함함). 일부 구현예에서, 부위-특이적 파괴제는 복수의 표적 유전자의 발현의 감소에 대해 서로 상보적인 기능성을 갖는 이펙터 모이어티를 포함하며, 이들 기능성은 함께, 발현을 억제하고, 선택적으로, 개별적으로 존재할 때에는 발현을 억제하지 않거나 무시할 만한 정도로 억제한다. 일부 구현예에서, 부위-특이적 파괴제는 복수의 이펙터 모이어티를 포함하며, 각 이펙터 모이어티는 기타 다른 이펙터 모이어티 각각과 상보적이고, 각 이펙터 모이어티는 복수의 표적 유전자의 발현을 감소시킨다.
일부 구현예에서, 부위-특이적 파괴제는 복수의 표적 유전자의 발현의 감소에 대해 서로 상승작용하는 기능성을 갖는 이펙터 모이어티의 조합을 포함한다. 이론에 의해 구애되고자 함이 없이, 일부 구현예에서, 다수의 전사 활성화 후성유전학적 마커(예를 들어, 다수의 상이한 유형의 후성유전학적 마커 및/또는 주어진 유형의 더 광범위한 마킹)가 개별적으로, 단독으로의 개별적인 변형보다 더 효과적으로 발현을 함께 억제한다는 점에서(예를 들어, 발현의 더 큰 감소의 생성 및/또는 발현의 더 오래 지속된 감소), 게놈 유전자좌에 대한 후성유전학적 변형은 누적된다. 일부 구현예에서, 부위-특이적 파괴제는 복수의 이펙터 모이어티를 포함하며, 각 이펙터 모이어티는 기타 다른 이펙터 모이어티 각각과 상승작용하며, 예를 들어 각 이펙터 모이어티는 복수의 표적 유전자의 발현을 감소시킨다. 일부 구현예에서, (서로 상승작용하는 복수의 이펙터 모이어티를 포함하는) 부위-특이적 파괴제가 개별 이펙터 모이어티를 포함하는 부위-특이적 파괴제보다 복수의 표적 유전자의 발현을 억제하는 데 더 효과적이다. 일부 구현예에서, 상기 복수의 이펙터 모이어티를 포함하는 부위-특이적 파괴제는 개별 이펙터 모이어티를 포함하는 부위-특이적 파괴제보다 복수의 표적 유전자의 발현을 감소시키는 데 적어도 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.55×, 1.6×, 1.65×, 1.7×, 1.75×, 1.8×, 1.85×, 1.9×, 1.95×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 30×, 40×, 50×, 60×, 70×, 80×, 90×, 또는 100× 효과적이다.
일부 구현예에서, 부위-특이적 파괴제는 하나 이상의 표적화 모이어티, 예를 들어 Cas 도메인, TAL 이펙터 도메인, 또는 Zn 핑거 도메인을 포함한다. 일 구현예에서, 시스템이 동일한 유형의 2개 이상의 표적화 모이어티, 예를 들어 2개 이상의 Cas 도메인을 포함할 때, 표적화 모이어티는 2개 이상의 상이한 서열에 특이적으로 결합한다. 예를 들어, 2개 이상의 Cas 도메인을 포함하는 부위-특이적 파괴제 시스템에서, 2개 이상의 Cas 도메인은 이들 도메인이 단지 이들의 표적 서열에 상응하는 gRNA에만 두드러지게 결합하도록(예를 들어, 또 다른 Cas9 도메인의 표적에 상응하는 gRNA에는 두드러지게 결합하지 않도록) 선택되거나 변경될 수 있다.
일부 구현예에서, 부위-특이적 파괴제는, 예를 들어 펩티드 결합에 의해, 공유적으로 연결된 표적화 모이어티 및 이펙터 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티 및 이펙터 모이어티는, 예를 들어 하나 이상의 펩티드 결합 및/또는 링커에 의해 연결되어, 동일한 폴리펩티드 사슬 상에 위치한다. 일부 구현예에서, 부위-특이적 파괴제는, 예를 들어 펩티드 결합 및/또는 링커에 의해 연결된 표적화 모이어티와 이펙터 모이어티를 포함하는, 융합 분자를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 동일한 폴리펩티드 사슬 상의 이펙터 모이어티의 N-말단에 배치된 표적화 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 동일한 폴리펩티드 사슬 상의 이펙터 모이어티의 C-말단에 배치된 표적화 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 비-펩티드 결합에 의해 공유적으로 연결된 표적화 모이어티와 이펙터 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티는 비-펩티드 결합에 의해 이펙터 모이어티에 접합된다. 일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티 및 복수의 이펙터 모이어티를 포함하며, 표적화 모이어티와 복수의 이펙터 모이어티는, 예를 들어 펩티드 결합에 의해, 공유적으로 연결된다(예를 들어, 표적화 모이어티와 복수의 이펙터 모이어티는 모두 일련의 공유 결합에 의해 연결되지만, 각 개별 모이어티는 기타 다른 모든 모이어티와 공유 결합을 공유할 수 없음).
다른 구현예에서, 부위-특이적 파괴제는 공유적으로 연결되지 않은, 예를 들어 서로 비공유적으로 회합된 표적화 모이어티와 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 이펙터 모이어티에 비공유적으로 결합하는 표적화 모이어티를 포함하거나 그 반대로도 성립한다. 일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티 및 복수의 이펙터 모이어티를 포함하며, 표적화 모이어티와 적어도 하나의 이펙터 모이어티는 공유적으로 연결되지 않으며, 예를 들어 서로 비공유적으로 회합되고, 표적화 모이어티와 적어도 하나의 기타 다른 이펙터 모이어티는, 예를 들어 펩티드 결합에 의해, 공유적으로 연결된다.
일부 구현예에서, 부위-특이적 파괴제는 G9A를 포함하는 제1 이펙터 모이어티 및 KRAB를 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 G9A를 포함하는 제1 이펙터 모이어티 및 EZH2를 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 EZH2를 포함하는 제1 이펙터 모이어티 및 KRAB를 포함하는 제2 이펙터 모이어티를 포함한다.
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티 및 이펙터 모이어티를 포함하며, 이펙터 모이어티, 예를 들어 EZH2, 또는 G9A, 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 이펙터 모이어티의 C-말단 단부와 표적화 모이어티의 N-말단 단부는 공유적으로 연결된다. 일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티 및 이펙터 모이어티를 포함하며, 이펙터 모이어티, 예를 들어 HDAC8, MQ1, DNMT3a/3L, KRAB, 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 이펙터 모이어티의 N-말단 단부와 표적화 모이어티의 C-말단 단부는 공유적으로 연결된다. 일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티, 제1 이펙터 모이어티 및 제2 이펙터 모이어티를 포함하며, 제1 이펙터 모이어티, 예를 들어 EZH2, G9A, 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 이펙터 모이어티의 C-말단 단부와 표적화 모이어티의 N-말단 단부는 공유적으로 연결되고, 표적화 모이어티의 C-말단 단부와 제2 이펙터 모이어티, 예를 들어 HDAC8, MQ1, DNMT3a/3L, KRAB, 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 이펙터 모이어티의 N-말단 단부는 공유적으로 연결된다. 공유 연결은, 예를 들어 링커 서열을 통한 것일 수 있다.
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티, 제1 이펙터 모이어티 및 제2 이펙터 모이어티를 포함하며, 제1 이펙터 모이어티는 EZH2 또는 이의 기능성 변이체 또는 단편이고, 예를 들어 제1 이펙터 모이어티는 서열번호 17의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하며, 제1 이펙터 모이어티는 표적화 모이어티의 N-말단에 있고; 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이고, 예를 들어 제2 이펙터 모이어티는 서열번호 13의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하며, 제2 이펙터 모이어티는 표적화 모이어티의 C-말단에 있다.
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티, 제1 이펙터 모이어티 및 제2 이펙터 모이어티를 포함하며, 제1 이펙터 모이어티는 EZH2 또는 이의 기능성 변이체 또는 단편이고, 예를 들어 제1 이펙터 모이어티는 서열번호 17의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하며, 제1 이펙터 모이어티는 표적화 모이어티의 N-말단에 있고; 제2 이펙터 모이어티는 HDAC8 또는 이의 기능성 변이체 또는 단편이고, 예를 들어 제2 이펙터 모이어티는 서열번호 19의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하며, 제2 이펙터 모이어티는 표적화 모이어티의 C-말단에 있다.
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티, 제1 이펙터 모이어티 및 제2 이펙터 모이어티를 포함하며, 제1 이펙터 모이어티는 G9A 또는 이의 기능성 변이체 또는 단편이고, 예를 들어 제1 이펙터 모이어티는 서열번호 67의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하며, 제1 이펙터 모이어티는 표적화 모이어티의 N-말단에 있고; 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이고, 예를 들어 제2 이펙터 모이어티는 서열번호 13의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하며, 제2 이펙터 모이어티는 표적화 모이어티의 C-말단에 있다.
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티, 제1 이펙터 모이어티 및 제2 이펙터 모이어티를 포함하며, 제1 이펙터 모이어티는 G9A 또는 이의 기능성 변이체 또는 단편이고, 예를 들어 제1 이펙터 모이어티는 서열번호 67의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하며, 제1 이펙터 모이어티는 표적화 모이어티의 N-말단에 있고; 제2 이펙터 모이어티는 EZH2 또는 이의 기능성 변이체 또는 단편이고, 예를 들어 제2 이펙터 모이어티는 서열번호 17의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하며, 제2 이펙터 모이어티는 표적화 모이어티의 C-말단에 있다.
일부 구현예에서, 제1 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 활성을 포함하고 제2 이펙터 모이어티는 상이한 히스톤 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 활성을 포함하고 제2 이펙터 모이어티는 동일한 히스톤 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 제2 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 제2 이펙터 모이어티는 상이한 히스톤 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 제2 이펙터 모이어티는 동일한 히스톤 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 제2 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 제2 이펙터 모이어티는 상이한 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 제2 이펙터 모이어티는 동일한 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 제2 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 제2 이펙터 모이어티는 상이한 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 제2 이펙터 모이어티는 동일한 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 제2 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 제2 이펙터 모이어티는 상이한 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 제2 이펙터 모이어티는 동일한 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 전사 리프레서 활성을 포함하고 제2 이펙터 모이어티는 상이한 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 전사 리프레서 활성을 포함하고 제2 이펙터 모이어티는 동일한 전사 리프레서 활성을 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 DNMT3a/3l, MQ1, KRAB, G9A, HDAC8, 또는 EZH2를 포함하고 제2 이펙터 모이어티는 DNMT3a/3l, MQ1, KRAB, G9A, HDAC8, 또는 EZH2를 포함한다.
링커
부위-특이적 파괴제는 하나 이상의 링커를 포함할 수 있다. 링커는 표적화 모이어티를 이펙터 모이어티에, 이펙터 모이어티를 또 다른 이펙터 모이어티에, 또는 표적화 모이어티를 또 다른 표적화 모이어티에 연결할 수 있다. 링커는 화학 결합, 예를 들어 하나 이상의 공유 결합 또는 비공유 결합일 수 있다. 일부 구현예에서, 링커는 공유적이다. 일부 구현예에서, 링커는 비공유적이다. 일부 구현예에서, 링커는 펩티드 링커이다. 그러한 링커는 2 내지 30개, 5 내지 30개, 10 내지 30개, 15 내지 30개, 20 내지 30개, 25 내지 30개, 2 내지 25개, 5 내지 25개, 10 내지 25개, 15 내지 25개, 20 내지 25개, 2 내지 20개, 5 내지 20개, 10 내지 20개, 15 내지 20개, 2 내지 15개, 5 내지 15개, 10 내지 15개, 2 내지 10개, 5 내지 10개, 또는 2 내지 5개의 아미노산 길이, 또는 2, 5, 10, 15, 20, 25, 또는 30개 이상의 아미노산 길이(및 선택적으로 최대 50, 40, 30, 25, 20, 15, 10, 또는 5개의 아미노산 길이)일 수 있다. 일부 구현예에서, 링커는 제1 모이어티를 제2 모이어티로부터, 예를 들어 표적화 모이어티를 이펙터 모이어티로부터 이격시키는 데 사용될 수 있다. 일부 구현예에서, 예를 들어, 링커는, 예를 들어 2차 및 3차 구조의 분자 가요성을 제공하기 위하여, 표적화 모이어티와 이펙터 모이어티 사이에 위치될 수 있다. 일부 구현예에서, 부위-특이적 파괴제는 제1 링커를 통해 표적화 모이어티에 연결된 제1 이펙터 모이어티 및 제2 링커를 통해 표적화 모이어티에 연결된 제2 이펙터 모이어티를 포함할 수 있다. 일부 구현예에서, 제1 링커는 제2 링커의 서열과 동일한 서열을 갖는다. 일부 구현예에서, 제1 링커는 제2 링커의 서열과 동일하지 않은 서열을 갖는다. 일부 구현예에서, 제1 이펙터 모이어티는 표적화 모이어티의 N-말단에 있다. 일부 구현예에서, 표적화 모이어티의 C-말단. 일부 구현예에서, 제1 이펙터 모이어티의 C-말단 단부는 제1 링커를 통해 표적화 모이어티의 N-말단 단부에 연결되고, 제2 이펙터 모이어티의 N-말단 단부는 제2 링커를 통해 표적화 모이어티의 C-말단 단부에 연결된다.
링커는 본 명세서에 기재된 가요성, 강성, 및/또는 절단성 링커를 포함할 수 있다. 일부 구현예에서, 링커는 가요성을 제공하기 위하여 적어도 하나의 글리신, 알라닌, 및 세린 아미노산을 포함한다. 일부 구현예에서, 링커는 소수성 링커이며, 이에는, 예를 들어 음으로 하전된 설포네이트 기, 폴리에틸렌 글리콜(PEG) 기, 또는 피로포스페이트 디에스테르 기가 포함된다. 일부 구현예에서, 링커는 조절제로부터 모이어티(예를 들어, 폴리펩티드)를 선택적으로 방출하도록 절단 가능하지만, 조기 절단을 방지하기에 충분히 안정적이어야 한다.
일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제의 하나 이상의 모이어티는 하나 이상의 링커와 연결된다.
당업자에 의해 알려진 바와 같이, 일반적으로 사용되는 가요성 링커는 Gly 및 Ser 잔기의 신장으로 주로 구성되는 서열을 갖는다("GS" 링커). 가요성 링커는 어느 정도의 이동 또는 상호작용을 필요로 하는 도메인/모이어티를 연결하는 데 유용할 수 있으며, 작은, 비극성(예를 들어, Gly) 또는 극성(예를 들어, Ser 또는 Thr) 아미노산을 포함할 수 있다. Ser 또는 Thr의 도입은 또한 물 분자와의 수소 결합을 형성함으로써 수용액 중에서의 링커의 안정성을 유지할 수 있으며, 이에 따라 링커와 모이어티/도메인 사이의 불리한 상호작용을 감소시킬 수 있다.
강성 링커는 도메인들/모이어티들 사이의 고정된 거리를 유지하는 데 그리고 그들의 독립적인 기능을 유지하는 데 유용하다. 강성 링커는 또한, 도메인들의 공간적 분리가 융합체 내의 하나 이상의 성분의 안정성 및 생물활성을 보존하는 데 중요할 때 유용할 수 있다. 강성 링커는 알파 나선-구조 또는 Pro-풍부 서열, (XP)n을 가질 수 있으며, 여기서 X는 임의의 아미노산, 바람직하게는 Ala, Lys, 또는 Glu를 지정한다.
절단성 링커는 생체내에서 유리 기능성 도메인/모이어티를 방출할 수 있다. 일부 구현예에서, 링커는 특정 조건 하에서, 예컨대 환원성 시약 또는 프로테아제의 존재 하에서 절단될 수 있다. 생체내 절단성 링커는 이황화물 결합의 가역적 성질을 이용할 수 있다. 한 예에는 2개의 Cys 잔기 사이의 트롬빈-감수성 서열(예를 들어, PRS)이 포함된다. CPRSC(서열번호 243)의 시험관내 트롬빈 처리는 트롬빈-감수성 서열의 절단을 초래하지만, 가역적 이황화물 결합은 온전하게 남아 있다. 그러한 링커는 알려져 있으며, 예를 들어 문헌[Chen et al. 2013. Fusion Protein Linkers: Property, Design and Functionality. Adv Drug Deliv Rev. 65(10): 1357-1369]에 기재되어 있다. 융합체 내의 링커의 생체내 절단은 또한, 특정 조건 하에 생체내에서, 특정 세포 또는 조직에서 발현되거나 특정 세포 구획 내에 구속된 프로테아제에 의해 수행될 수 있다. 많은 프로테아제의 특이성은 구속된 구획 내에서 링커의 더 느린 절단을 제공한다.
본 명세서에 기재된 링커에 사용하기에 적합한 분자의 예에는 음으로 하전된 설포네이트 기; 지질, 예컨대 폴리 (--CH2--) 탄화수소 사슬, 예컨대 폴리에틸렌 글리콜(PEG) 기, 이의 불포화 변이체, 이의 하이드록실화 변이체, 이의 아미드화 또는 다른 방식으로의 N-함유 변이체; 비탄소 링커; 탄수화물 링커; 포스포디에스테르 링커, 또는 부위-특이적 파괴제의 2개 이상의 성분을 공유적으로 연결할 수 있는 기타 다른 분자가 포함된다. 비공유성 링커가 또한 포함되며, 이에는, 예를 들어 폴리펩티드가, 예를 들어, 류신, 이소류신, 발린, 또는 아마도 또한 알라닌, 페닐알라닌, 또는 심지어 티로신, 메티오닌, 글리신, 또는 기타 다른 소수성 잔기가 풍부한 일련의 잔기와 같은 폴리펩티드의 소수성 영역 또는 폴리펩티드의 소수성 확장을 통해 연결되는 소수성 지질 소구체가 있다. 부위-특이적 파괴제의 성분들은 전하-기반 화학을 사용하여 연결될 수 있으며, 이로써 부위-특이적 파괴제의 양으로 하전된 성분이 또 다른 성분의 음전하에 연결된다.
핵산
일 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 부위-특이적 파괴제, 시스템, 표적화 모이어티 및/또는 이펙터 모이어티를 인코딩하는 핵산 서열을 제공한다. 당업자는 RNA의 핵산 서열은, 통상적으로 티민(T)이 우라실(U)로 대체된 것을 제외하고는, 상응하는 DNA 서열과 동일함을 인식하고 있다. 뉴클레오티드 서열이 DNA 서열(예를 들어, A, T, G, C를 포함함)로 표현될 때, 본 개시내용은 또한 "U"가 "T"를 대체하는 상응하는 RNA 서열(예를 들어, A, U, G, C를 포함함)을 제공함이 이해될 것이다. 폴리뉴클레오티드 서열을 기재하기 위해 본 명세서에서는 통상적인 표기가 사용되며: 단일 가닥 폴리뉴클레오티드 서열의 좌측단은 5'-단부이고, 이중 가닥 폴리뉴클레오티드 서열의 우측 방향은 5'-방향으로 지칭된다.
유전자 코드의 축퇴로 인해, 본 명세서에 기재된 바와 같은 DNA-표적화 모이어티 및/또는 이펙터 모이어티를 포함하는 부위-특이적 파괴제를 인코딩하는 다수의 뉴클레오티드 서열이 생성될 수 있으며, 이들 중 일부는 본 명세서에 개시된 핵산 서열과 유사성, 예를 들어 90%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는다는 것이 당업자에 의해 이해될 것이다. 예를 들어, 코돈 AGA, AGG, CGA, CGC, CGG, 및 CGU 모두는 아미노산 아르기닌을 인코딩한다. 따라서, 아르기닌이 코돈에 의해 지정된 본 개시내용의 핵산 분자 내의 모든 위치에서, 그러한 코돈은 인코딩된 폴리펩티드를 변경시키지 않고서 상기에 기재된 상응하는 코돈 중 임의의 것으로 변경될 수 있다.
일부 구현예에서, 표적화 모이어티 및/또는 하나 이상의 이펙터 모이어티를 포함하는 부위-특이적 파괴제를 인코딩하는 핵산 서열은 포유동물, 예를 들어 인간에서 코돈 사용빈도에 따라 최적화된, 코돈-최적화된 코딩 영역의 일부 또는 전부일 수 있다. 일부 구현예에서, 표적화 모이어티 및/또는 하나 이상의 이펙터 모이어티를 인코딩하는 핵산 서열은 단백질 발현을 증가시키고/시키거나 단백질 발현의 지속시간을 증가시키기 위해 코돈 최적화된다. 일부 구현예에서, 코돈 최적화된 핵산 서열에 의해 생성되는 단백질은 코돈 최적화되지 않은 핵산 서열에 의해 인코딩될 때의 단백질의 수준과 비교하여 적어도 1%, 적어도 2%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 30%, 적어도 40%, 또는 적어도 50% 더 높다.
일부 구현예에서, 본 명세서에 기재된 시스템, 또는 본 명세서에 기재된 방법은 하나 이상(예를 들어, 하나)의 DNA-표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 폴리펩티드의 사용을 포함하며, 예를 들어 이펙터 모이어티는 MQ1, 예를 들어 박테리아 MQ1, 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, MQ1은 스피로플라스마 모노비아이(Spiroplasma monobiae) MQ1, 예를 들어 균주 ATCC 33825로부터 유래되고/되거나 Uniprot ID P15840에 상응하는 MQ1이다. 일부 구현예에서, MQ1 이펙터 모이어티는 서열번호 10의 뉴클레오티드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 뉴클레오티드 서열은 서열번호 10의 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
MQ1
일부 구현예에서, MQ1은 서열번호 11의 아미노산 서열을 포함한다. 일부 구현예에서, MQ1은 서열번호 12의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터 도메인은 서열번호 11 또는 12, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
MQ1
일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제에 사용하기 위한 MQ1은, 예를 들어 야생형 MQ1(예를 들어, 서열번호 11 또는 서열번호 12)과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, MQ1 변이체는 야생형 MQ1과 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, MQ1 변이체는 K297P 치환을 포함한다. 일부 구현예에서, MQ1 변이체는 N299C 치환을 포함한다. 일부 구현예에서, MQ1 변이체는 E301Y 치환을 포함한다. 일부 구현예에서, MQ1 변이체는 Q147L 치환을 포함한다(예를 들어, 그리고 야생형 MQ1과 대비하여 감소된 DNA 메틸트랜스퍼라제 활성을 가짐). 일부 구현예에서, MQ1 변이체는 K297P, N299C, 및 E301Y 치환을 포함한다(예를 들어, 그리고 야생형 MQ1과 대비하여 감소된 DNA 결합 친화도를 가짐). 일부 구현예에서, MQ1 변이체는 Q147L, K297P, N299C, 및 E301Y 치환을 포함한다(예를 들어, 그리고 야생형 MQ1과 대비하여 감소된 DNA 메틸트랜스퍼라제 활성 및 DNA 결합 친화도를 가짐).
일부 구현예에서, 부위-특이적 파괴제는, 예를 들어 모이어티/도메인을 또 다른 모이어티/도메인에 연결시키는, 본 명세서에 기재된 하나 이상의 링커를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는, 예를 들어 CRISPR/Cas 단백질, 예를 들어 dCas9 단백질을 포함하는 CRISPR/Cas 분자이거나 이를 포함하는 표적화 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는, MQ1이거나 이를 포함하는 이펙터 모이어티, 및, 예를 들어 CRISPR/Cas 단백질, 예를 들어 dCas9 단백질; 예를 들어 dCas9m4를 포함하는 CRISPR/Cas 분자이거나 이를 포함하는 DNA-표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 부위-특이적 파괴제는 본 명세서에 기재된 추가적인 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 표적 유전자 또는 복수의 표적 유전자(예를 들어, 본 명세서에 기재된 표적 유전자 또는 복수의 표적 유전자)의 발현을 감소시킨다. 일부 구현예에서, 부위-특이적 파괴제는 본 명세서에 기재된 유전자 발현을 조절하는, 예를 들어 감소시키는 방법, 병태를 치료하는 방법, 또는 표적 유전자 또는 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용될 수 있다. 일부 구현예에서, 시스템은 2개 이상의 부위-특이적 파괴제를 포함한다.
일부 구현예에서, 본 명세서에 기재된 시스템, 또는 본 명세서에 기재된 방법은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 부위-특이적 파괴제 또는 폴리펩티드의 사용을 포함하며, 이펙터 모이어티는 징크 핑거 단백질 10의 크루펠-연관 박스(Krueppel-associated box, KRAB) 도메인, 예를 들어 NP_056209.2에 따른 것, 또는 NM_015394.5에 의해 인코딩된 단백질 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, KRAB는 합성 KRAB 작제물이다. 일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제에 사용하기 위한 KRAB는, 예를 들어 야생형 KRAB(예를 들어, NP_056209.2에 따른 것, 또는 NM_015394.5에 의해 인코딩된 단백질)와 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, KRAB 변이체는 야생형 KRAB와 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, KRAB 변이체는 L37P 치환을 포함한다. 일부 구현예에서, KRAB는 서열번호 13의 아미노산 서열을 포함한다:
KRAB
일부 구현예에서, KRAB 이펙터 모이어티는 서열번호 14의 뉴클레오티드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 뉴클레오티드 서열은 서열번호 14의 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
KRAB
일부 구현예에서, 본 명세서에 기재된 폴리펩티드 또는 부위-특이적 파괴제에 사용하기 위한 KRAB는, 예를 들어 서열번호 13의 KRAB 서열과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, KRAB 변이체는 서열번호 13과 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다.
일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는, KRAB이거나 이를 포함하는 이펙터 모이어티 및 표적화 모이어티, 예를 들어 Crisper/Cas 단백질을 포함하는 융합 단백질이다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 본 명세서에 기재된 추가적인 모이어티를 포함한다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 표적 유전자 또는 복수의 표적 유전자의 발현을 감소시킨다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 본 명세서에 기재된 유전자 발현을 조절하는, 예를 들어 감소시키는 방법, 병태를 치료하는 방법, 또는 표적 유전자 또는 복수의 표적 유전자, 예를 들어 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용될 수 있다.
일부 구현예에서, 본 명세서에 기재된 시스템, 또는 본 명세서에 기재된 방법은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 부위-특이적 파괴제 또는 폴리펩티드의 사용을 포함하며, 이펙터 모이어티는 DNMT3a/3L 복합체, 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, DNMT3a/3L 복합체는 융합 작제물이다. 일부 구현예에서, DNMT3a/3L 복합체는 DNMT3A, 예를 들어 인간 DNMT3A, 예를 들어 NP_072046.2에 따른 것 또는 NM_022552.4에 의해 인코딩된 단백질, 또는 NM_022552.4에 의해 인코딩된 단백질 또는 이의 기능성 변이체 또는 단편, 예를 들어 인간 DNMT3A, 예를 들어 NP_072046.2에 따른 것 또는 NM_022552.4에 의해 인코딩된 단백질의 aa 679 내지 912를 포함한다. 일부 구현예에서, DNMT3a/3L 복합체는 인간 DNMT3L 또는 이의 기능성 단편 또는 변이체(예를 들어, NP_787063.1에 따른 것 또는 NM_175867.3에 의해 인코딩된 단백질 또는 이의 기능성 변이체 또는 단편, 예를 들어 인간 DNMT3L, 예를 들어 NP_787063.1 또는 NM_175867.3에 의해 인코딩된 단백질의 aa 274 내지 386)를 포함한다. 일부 구현예에서, DNMT3a/3L은 서열번호 15의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터 모이어티는 서열번호 15, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
DNMT3A/3l(h)
일부 구현예에서, DNMT3a/3L은 서열번호 16의 뉴클레오티드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 16의 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
DNMT3A/3l(h)
일부 구현예에서, 본 명세서에 기재된 시스템, 또는 본 명세서에 기재된 방법은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 부위-특이적 파괴제 또는 폴리펩티드의 사용을 포함하며, 이펙터 모이어티는 EZH2, 예를 들어 NP-004447.2 또는 NP_001190176.1 2에 따른 것, 또는 NM_004456.5 또는 NM_001203247.2에 의해 인코딩된 단백질 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제에 사용하기 위한 MQ1은, 예를 들어 EZH2, 예를 들어 NP-004447.2 또는 NP_001190176.1 2에 따른 것, 또는 NM_004456.5 또는 NM_001203247.2에 의해 인코딩된 단백질과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, EZH2 변이체는 야생형 EZH2와 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, EZH2는 서열번호 17의 아미노산 서열을 포함한다:
EZH2
일부 구현예에서, EZH2 이펙터 모이어티는 서열번호 18의 뉴클레오티드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 뉴클레오티드 서열은 서열번호 18의 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
EZH2
일부 구현예에서, 본 명세서에 기재된 폴리펩티드 또는 부위-특이적 파괴제에 사용하기 위한 EZH2는, 예를 들어 서열번호 17의 EZH2 서열과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, EZH2 변이체는 서열번호 17과 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다.
일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는, EZH2이거나 이를 포함하는 이펙터 모이어티 및 표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 본 명세서에 기재된 추가적인 모이어티를 포함한다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 표적 유전자 또는 복수의 표적 유전자의 발현을 감소시킨다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 본 명세서에 기재된 유전자 발현을 조절하는, 예를 들어 감소시키는 방법, 병태를 치료하는 방법, 또는 표적 유전자 또는 복수의 표적 유전자, 예를 들어 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용될 수 있다.
일부 구현예에서, 본 명세서에 기재된 시스템, 또는 본 명세서에 기재된 방법은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 부위-특이적 파괴제 또는 폴리펩티드의 사용을 포함하며, 이펙터 모이어티는 HDAC8, 예를 들어 NP_001159890 또는 NP_060956.1에 따른 것, 또는 NM_001166418 또는 NM_018486.3에 의해 인코딩된 단백질 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, HDAC8은 서열번호 19의 아미노산 서열을 포함한다:
HDAC8
일부 구현예에서, HDAC8 이펙터 모이어티는 서열번호 66의 뉴클레오티드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 뉴클레오티드 서열은 서열번호 66의 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
HDAC8
일부 구현예에서, 본 명세서에 기재된 폴리펩티드 또는 부위-특이적 파괴제에 사용하기 위한 HDAC8은, 예를 들어 서열번호 19의 HDAC8 서열과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, HDAC8 변이체는 서열번호 19와 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다.
일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는, HDAC8이거나 이를 포함하는 이펙터 모이어티 및 표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 본 명세서에 기재된 추가적인 모이어티를 포함한다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 표적 유전자 또는 복수의 표적 유전자의 발현을 감소시킨다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 본 명세서에 기재된 유전자 발현을 조절하는, 예를 들어 감소시키는 방법, 병태를 치료하는 방법, 또는 표적 유전자 또는 복수의 표적 유전자, 예를 들어 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용될 수 있다.
일부 구현예에서, 본 명세서에 기재된 시스템, 또는 본 명세서에 기재된 방법은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 부위-특이적 파괴제 또는 폴리펩티드의 사용을 포함하며, 이펙터 모이어티는 G9A, 예를 들어 NP_001350618.1에 따른 것, 또는 NM_001363689.1에 의해 인코딩된 단백질 또는 이의 기능성 변이체 또는 단편, 예를 들어 G9A, 예를 들어 NP_001350618.1에 따른 것 또는 NM_001363689.1에 의해 인코딩된 단백질의 aa967 내지 1250이거나 이를 포함한다. 일부 구현예에서, G9A는 서열번호 67의 아미노산 서열을 포함한다:
G9A
일부 구현예에서, G9A 이펙터 모이어티는 서열번호 68의 뉴클레오티드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 뉴클레오티드 서열은 서열번호 68의 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
G9A
일부 구현예에서, 본 명세서에 기재된 폴리펩티드 또는 부위-특이적 파괴제에 사용하기 위한 G9A는, 예를 들어 서열번호 67의 G9A 서열과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, G9A 변이체는 서열번호 67과 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다.
일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는, G9A이거나 이를 포함하는 이펙터 모이어티 및 표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 본 명세서에 기재된 추가적인 모이어티를 포함한다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 표적 유전자 또는 복수의 표적 유전자의 발현을 감소시킨다. 일부 구현예에서, 폴리펩티드 또는 부위-특이적 파괴제는 본 명세서에 기재된 유전자 발현을 조절하는, 예를 들어 감소시키는 방법, 병태를 치료하는 방법, 또는 표적 유전자 또는 복수의 표적 유전자, 예를 들어 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용될 수 있다.
시스템
본 개시내용의 시스템은 2개 이상의 부위-특이적 파괴제를 포함할 수 있다. 일부 구현예에서, 부위-특이적 파괴제 시스템은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개, 또는 그 이상(그리고 선택적으로 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 또는 2개 이하)의 부위-특이적 파괴제를 포함한다. 일부 구현예에서, 시스템은 2개 이상의 상이한 서열(예를 들어, 1번째 및 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 9번째, 10번째, 11번째, 12번째, 및/또는 그 이상의 DNA 서열, 및 선택적으로 20번째, 19번째, 18번째, 17번째, 16번째, 15번째, 14번째, 13번째, 12번째, 11번째, 10번째, 9번째, 8번째, 6번째, 5번째, 4번째, 3번째, 또는 2번째 이하의 DNA 서열)을 표적화한다. 일부 구현예에서, 시스템은 복수의 부위-특이적 파괴제를 포함하며, 복수의 부위-특이적 파괴제의 각 구성원은 복수의 부위-특이적 파괴제의 또 다른 구성원에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다. 일부 구현예에서, 시스템은 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제를 포함하며, 제1 부위-특이적 파괴제는 제2 부위-특이적 파괴제에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다.
일부 구현예에서, 본 개시내용의 시스템은 2개 이상의 부위-특이적 파괴제를 포함하며, 부위-특이적 파괴제는 조성물, 약제학적 조성물, 또는 혼합물 형태로 함께 존재한다. 일부 구현예에서, 본 개시내용의 시스템은 2개 이상의 부위-특이적 파괴제를 포함하며, 하나 이상의 부위-특이적 파괴제는 적어도 하나의 기타 다른 부위-특이적 파괴제와 혼합되지 않는다. 일부 구현예에서, 시스템은 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제를 포함할 수 있으며, 세포의 핵 내의 제1 부위-특이적 파괴제의 존재는 동일한 세포의 핵 내의 제2 부위-특이적 파괴제의 존재와 중첩되지 않으며, 시스템은 제1 및 제2 부위-특이적 파괴제의 비중첩 존재를 통해 복수의 유전자의 발현 감소를 달성한다. 일부 구현예에서, 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제는 동시에 또는 순차적으로 작용할 수 있다.
일부 구현예에서, 시스템의 부위-특이적 파괴제들은 각각 상이한 표적화 모이어티를 포함한다(예를 들어, 제1, 제2, 제3, 또는 추가의 부위-특이적 파괴제는 각각 서로 상이한 표적화 모이어티를 포함함). 예를 들어, 시스템은 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제를 포함할 수 있으며, 제1 부위-특이적 파괴제는 제1 표적화 모이어티(예를 들어, Cas9 도메인, TAL 이펙터 도메인, 또는 Zn 핑거 도메인)를 포함하고, 제2 부위-특이적 파괴제는 제1 표적화 모이어티와 상이한 제2 표적화 모이어티(예를 들어, Cas9 도메인, TAL 이펙터 도메인, 또는 Zn 핑거 도메인)를 포함한다. 일부 구현예에서, '상이한'이란, 별개의 유형의 표적화 모이어티를 포함한다는 것을 의미할 수 있으며, 예를 들어 제1 표적화 모이어티는 Cas9 도메인을 포함하고, 제2 DNA-표적화 모이어티는 Zn 핑거 도메인을 포함한다. 다른 구현예에서, '상이한'이란, 동일한 유형의 표적화 모이어티의 별개의 변이체를 포함한다는 것을 의미할 수 있으며, 예를 들어 제1 표적화 모이어티는 (예를 들어, 제1 종으로부터의) 제1 Cas9 도메인을 포함하고, 제2 표적화 모이어티는 (예를 들어, 제2 종으로부터의) 제2 Cas9 도메인을 포함한다.
일 구현예에서, 시스템이 동일한 유형의 2개 이상의 표적화 모이어티, 예를 들어 2개 이상의 Cas9 또는 Zn 핑거 도메인을 포함할 때, 표적화 모이어티는 2개 이상의 상이한 서열에 특이적으로 결합한다. 예를 들어, 2개 이상의 Cas9 도메인을 포함하는 시스템에서, 2개 이상의 Cas9 도메인은 이들 도메인이 단지 이들의 표적 서열에 상응하는 gRNA에만 두드러지게 결합하도록(예를 들어, 또 다른 Cas9 도메인의 표적에 상응하는 gRNA에는 두드러지게 결합하지 않도록) 선택되거나 변경될 수 있다. 추가의 예에서, 2개 이상의 이펙터 모이어티를 포함하는 시스템에서, 2개 이상의 이펙터 모이어티는, 이들 모이어티가 단지 이들의 표적 서열에만 두드러지게 결합하도록(예를 들어, 또 다른 이펙터 모이어티의 표적 서열에는 두드러지게 결합하지 않도록) 선택되거나 변경될 수 있다.
일부 구현예에서, 시스템은 3개 이상의 부위-특이적 파괴제를 포함하며, 2개 이상의 부위-특이적 파괴제는 동일한 표적화 모이어티를 포함한다. 예를 들어, 시스템은 3개의 부위-특이적 파괴제를 포함할 수 있으며, 제1 및 제2 부위-특이적 파괴제 둘 모두는 제1 표적화 모이어티를 포함하고, 제3 부위-특이적 파괴제는 상이한 제2 표적화 모이어티를 포함한다. 추가로 예를 들어, 시스템은 4개의 부위-특이적 파괴제를 포함할 수 있으며, 제1 및 제2 부위-특이적 파괴제 둘 모두는 제1 표적화 모이어티를 포함하고, 제3 및 제4 부위-특이적 파괴제는 상이한 제2 표적화 모이어티를 포함한다. 추가로 예를 들어, 시스템은 5개의 부위-특이적 파괴제를 포함할 수 있으며, 제1 및 제2 부위-특이적 파괴제 둘 모두는 제1 표적화 모이어티를 포함하고, 제3 및 제4 부위-특이적 파괴제 둘 모두는 상이한 제2 표적화 모이어티를 포함하고, 제5 부위-특이적 파괴제는 상이한 제3 표적화 모이어티를 포함한다. 상기에 기재된 바와 같이, '상이한'이란, 상이한 유형의 표적화 모이어티를 포함한다는 것, 또는 동일한 유형의 표적화 모이어티의 별개의 변이체를 포함한다는 것을 의미할 수 있다.
일부 구현예에서, 시스템의 부위-특이적 파괴제들은 각각 상이한 DNA 서열에 결합한다(예를 들어, 제1, 제2, 제3, 또는 추가의 부위-특이적 파괴제는 각각 서로 상이한 DNA 서열에 결합함). 예를 들어, 시스템은 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제를 포함할 수 있으며, 제1 부위-특이적 파괴제는 제1 DNA 서열에 결합하고, 제2 부위-특이적 파괴제는 제2 DNA 서열에 결합한다. 상이한 DNA 서열을 포함하는 일부 구현예에서, 하나의 부위-특이적 파괴제에 의해 결합된 DNA 서열과 또 다른 부위-특이적 파괴제에 의해 결합된 DNA 서열 사이에 동일하지 않은 적어도 하나의 위치가 있거나, 하나의 부위-특이적 파괴제에 의해 결합된 DNA 서열 내에 존재하지만 또 다른 부위-특이적 파괴제에 의해 결합된 DNA 서열 내에는 존재하지 않는 적어도 하나의 위치가 있다.
일부 구현예에서, 제1 DNA 서열은 제1 게놈 DNA 가닥 상에 위치할 수 있고, 제2 DNA 서열은 제2 게놈 DNA 가닥 상에 위치할 수 있다. 일부 구현예에서, 제1 DNA 서열은 제2 DNA 서열과 동일한 게놈 DNA 가닥 상에 위치할 수 있다.
일부 구현예에서, 시스템은 3개 이상의 부위-특이적 파괴제를 포함하며, 2개 이상의 부위-특이적 파괴제는 동일한 DNA 서열에 결합한다. 예를 들어, 시스템은 3개의 부위-특이적 파괴제를 포함할 수 있으며, 제1 및 부위-특이적 파괴제 둘 모두는 제1 DNA 서열에 결합하고, 제3 부위-특이적 파괴제는 상이한 제2 DNA 서열에 결합한다. 추가로 예를 들어, 시스템은 4개의 부위-특이적 파괴제를 포함할 수 있으며, 제1 및 제2 부위-특이적 파괴제 둘 모두는 제1 DNA 서열에 결합하고, 제3 및 제4 부위-특이적 파괴제 둘 모두는 제2 DNA 서열에 결합한다. 추가로 예를 들어, 시스템은 5개의 부위-특이적 파괴제를 포함할 수 있으며, 제1 및 제2 부위-특이적 파괴제 둘 모두는 제1 DNA 서열에 결합하고, 제3 및 제4 부위-특이적 파괴제 둘 모두는 제2 DNA 서열에 결합하고, 제5 부위-특이적 파괴제는 제3 DNA 서열에 결합한다. 상기 기재된 바와 같이, '상이한'이란, 하나의 부위-특이적 파괴제에 의해 결합된 DNA 서열과 또 다른 부위-특이적 파괴제에 의해 결합된 DNA 서열 사이에 동일하지 않은 적어도 하나의 위치가 존재한다는 것, 또는 하나의 부위-특이적 파괴제에 의해 결합된 DNA 서열 내에 존재하는 적어도 하나의 위치가 또 다른 부위-특이적 파괴제에 의해 결합된 DNA 서열 내에는 존재하지 않는다는 것을 의미할 수 있다.
일부 구현예에서, 시스템은 2개 이상(예를 들어, 2개)의 부위-특이적 파괴제를 포함하며, 이들 부위-특이적 파괴제 중 복수개(예를 들어, 2개)는 상이한 DNA 서열에 결합하는 표적화 모이어티를 포함한다. 그러한 구현예에서, 제1 표적화 모이어티는 제1 DNA 서열에 결합할 수 있고, 제2 DNA-표적화 모이어티는 제2 DNA 서열에 결합할 수 있으며, 제1 및 제2 DNA 서열은 상이하고 중첩되지 않는다. 일부 그러한 구현예에서, 제1 DNA 서열은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100개의 염기쌍(그리고 선택적으로, 500, 400, 300, 200, 100, 95, 90, 85, 80, 75, 70, 65, 60, 55, 또는 50개 이하의 염기쌍)으로 제2 DNA 서열로부터 분리되어 있다. 일부 그러한 구현예에서, 제1 DNA 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100개 이하의 염기쌍(그리고 선택적으로, 0개의 염기쌍, 예를 들어 제1 서열과 제2 서열이 서로 직접 인접함)으로 제2 DNA 서열로부터 분리되어 있다.
일부 구현예에서, 시스템의 부위-특이적 파괴제들은 각각 상이한 이펙터 모이어티를 포함한다(예를 들어, 제1, 제2, 제3, 또는 추가의 부위-특이적 파괴제는 각각 서로 상이한 이펙터 모이어티를 포함함). 예를 들어, 시스템은 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제를 포함할 수 있으며, 제1 부위-특이적 파괴제는 제1 이펙터 모이어티를 포함하고, 제2 부위-특이적 파괴제는 제1 이펙터 모이어티와 상이한 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 상이한 이펙터 모이어티는 별개의 유형의 이펙터 모이어티를 포함한다. 다른 구현예에서, 상이한 이펙터 모이어티는 동일한 유형의 이펙터 모이어티의 별개의 변이체를 포함한다.
표적화 모이어티
표적화 모이어티는 DNA 서열, 예를 들어 복수의 표적 유전자와 연관된 DNA 서열, 예를 들어 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열에 특이적으로 결합할 수 있다. DNA 서열에 특이적으로 결합하는 임의의 분자 또는 화합물이 표적화 모이어티로서 사용될 수 있다. 일부 구현예에서, 표적화 모이어티는, 예를 들어 앵커 서열, 예를 들어 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열에 상보적인 서열을 포함하는 핵산을 포함한다. 일부 구현예에서, 핵산은 앵커 서열에 대한 게놈 복합체 성분(예를 들어, 핵형성 폴리펩티드, 예를 들어 CTCF)의 결합을 물리적/입체적으로 차단하는 올리고뉴클레오티드이다. 일부 구현예에서, 핵산은, 예를 들어 CRISPR/Cas 분자와 호환가능한 가이드 RNA(gRNA)를 포함한다. 일부 구현예에서, 표적화 모이어티는 CRISPR/Cas 분자, TAL 이펙터 분자, Zn 핑거 분자, tetR 도메인, 메가뉴클레아제, 펩티드 핵산(PNA) 또는 핵산 분자를 포함한다.
일부 구현예에서, 표적화 모이어티는 500, 450, 400, 350, 300, 250, 200, 150, 100, 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1, 0.09, 0.08, 0.07, 0.06, 0.05, 0.04, 0.03, 0.02, 0.01, 0.005, 0.002, 또는 0.001 nM 이하의 KD(그리고 선택적으로, 적어도 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1, 0.09, 0.08, 0.07, 0.06, 0.05, 0.04, 0.03, 0.02, 0.01, 0.005, 0.002, 또는 0.001 nM의 KD)로 그의 표적 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 0.001 nM 내지 500 nM, 예를 들어 0.1 nM 내지 5 nM, 예를 들어 약 0.5 nM의 KD로 그의 표적 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 적어도 500, 600, 700, 800, 900, 1000, 2000, 5000, 10,000, 또는 100,000 nM의 KD로 비표적 서열에 결합한다(그리고 선택적으로, 비표적 서열에는 두드러지게 결합하지 않음). 일부 구현예에서, 표적화 모이어티는 비표적 서열에 결합하지 않는다.
일부 구현예에서, 표적화 모이어티는 표 7로부터 선택되는 서열, 또는 상기 서열과 적어도 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖거나, 상기 서열에 대해 1, 2, 3, 4, 또는 5개 이하의 상이한 위치를 갖는 서열을 포함하는 핵산을 포함한다.
명칭 | 서열 | 서열번호 |
GD-28481 | AGCCCCACCTTGTGGTCAGA | 21 |
GD-28482 | AGTGCTGCCTTCTGACCACA | 22 |
GD-28483 | GCTGCCTTCTGACCACAAGG | 23 |
GD-28484 | CCAGTATAAGCCCCACCTTG | 24 |
GD-28485 | CTGCCTGTCCCATAAGGAGG | 25 |
GD-28486 | GCACTGCCTGTCCCATAAGG | 26 |
GD-28487 | GGTCCTCCTCCTTATGGGAC | 27 |
GD-28488 | GCCTTGTTTTCGGCTCTAGA | 28 |
GD-28489 | GCCATCTAGAGCCGAAAACA | 29 |
GD-29251 | CCAATGAAGATGAAACTGGG | 30 |
GD-29252 | AACGTGCTTGCCTAAGATTC | 31 |
GD-29253 | AGCCCTTAATCATATCTAGT | 32 |
GD-29254 | CAGAGCTTAAGACCTGTACT | 33 |
GD-29255 | GCCCACCTTGACCTTCACAA | 34 |
일부 구현예에서, 표적화 모이어티는 표 6으로부터 선택되는 서열, 또는 상기 서열과 적어도 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖거나, 상기 서열에 대해 1, 2, 3, 4, 또는 5개 이하의 상이한 위치를 갖는 서열을 포함하는 핵산을 포함한다.
가이드 | 서열 | 가닥 | 게놈 좌표 |
GD-30178 | GTTACTGCGTAATTACCAGG (서열번호 35) |
+ | GRCh37: chr4:74528428-74528450 |
GD-30179 | TATTACATCCTACCTATAAG (서열번호 36) |
+ | GRCh37: chr4:74528567-74528589 |
GD-30180 | TGGGCTCTGGACTTAGATCG (서열번호 37) |
+ | GRCh37: chr4:74528609-74528631 |
GD-30181 | TAAGTGGGCTATGTATACAC (서열번호 38) |
+ | GRCh37: chr4:74789132-74789154 |
GD-30182 | TTTCTAAGTCTGTCACAAGG (서열번호 39) |
- | GRCh37: chr4:74789250-74789272 |
GD-30183 | AAAGTAATATGATCTAGGAA (서열번호 40) |
- | GRCh37: chr4:74789312-74789334 |
GD-30184 | GTTCGAGCGGCTGTGCGAGG (서열번호 41) |
+ | GRCh37: chr4:74964853-74964875 |
GD-30185 | GCTCTGTGGCTCTCCGAGAA (서열번호 42) |
+ | GRCh37: chr4:74964906-74964928 |
GD-30186 | GTGTGTGTGTTTCAACGTAG (서열번호 43) |
+ | GRCh37: chr4:74965538-74965560 |
GD-30187 | GGAAGTCACTGGGAGCTGCG (서열번호 44) |
+ | GRCh37: chr4:74965737-74965759 |
GD-30200 | GGCCACGGGTGTGTTCCCAG (서열번호 45) |
- | GRCh37: chr4:75000031-75000053 |
GD-30201 | ATGGCCATTTGCAAAAGTCA (서열번호 46) |
+ | GRCh37: chr4:75000115-75000137 |
GD-30202 | CCAAACTAGACAGATAAAGC (서열번호 47) |
+ | GRCh37: chr4:75000231-75000253 |
GD-30203 | CCAGCATGACTCTAGCATGC (서열번호 48) |
- | GRCh37: chr4:74975146-74975168 |
GD-30204 | TGGCCAAGGTCTGATATGCA (서열번호 49) |
+ | GRCh37: chr4:74975369-74975391 |
GD-30205 | TCATGAGTCCCAGAACATGT (서열번호 50) |
- | GRCh37: chr4:74976318-74976340 |
GD-30206 | GCGAAAGAAGTAGTAGCTAA (서열번호 51) |
- | GRCh37: chr4:74570348-74570370 |
GD-30207 | GACTAAGACTGGCAAATCTG (서열번호 52) |
- | GRCh37: chr4:74570503-74570525 |
GD-30208 | GACTAAGAGGAGCCGACATG (서열번호 53) |
+ | GRCh37: chr4:74570526-74570548 |
GD-30238 | GAAAAACGGGTGTTGTGACG (서열번호 54) |
+ | GRCm38: chr5:90661492-90661514 |
GD-30239 | TTTGTGAACTAAGGATTCTG (서열번호 55) |
- | GRCm38: chr5:90661646-90661668 |
GD-30240 | GTCCGTGTAGAGTTACCATG (서열번호 56) |
+ | GRCm38: chr5:90661744-90661766 |
GD-30241 | GATGTATTCACAAGAGGACT (서열번호 57) |
+ | GRCm38: chr5:90785610-90785632 |
GD-30242 | AATTACTACCTCATAGCTAG (서열번호 58) |
- | GRCm38: chr5:90909047-90909069 |
GD-30592 | GAAGGTAGAAATCCGCCACT (서열번호 59) |
GRCm38: chr5:90785724-90785746 | |
GD-30593 | GAAACGCCGAGGTAACTCAT (서열번호 60) |
GRCm38: chr5:90788137-90788159 | |
GD-30594 | CAACTAAAATTTCTAGCCCT (서열번호 61) |
GRCm38: chr5:90908926-90908948 | |
GD-28044 | GACTCCAGTCTTTCTAGAAGA (서열번호: 62) |
GRCm38: chr6:113076028-113076047 |
일부 구현예에서, 표적화 모이어티는 앵커 서열, 예를 들어 복수의 표적 유전자를 포함하거나, 서열에 대해 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 비상보적인 위치를 갖는 ASMC의 앵커 서열에 상보적인 서열을 포함하는 핵산을 포함한다.
일부 구현예에서, 표적화 모이어티는 게놈 좌표 chr4:74595464-74595486, chr4:74595457-74595479, chr4:74595460-74595482, chr4:74595472-74595494, chr4:75000088-75000110, chr4:75000091-75000113, chr4:75000085-75000107, chr4:75000157-75000179, chr4:75000156-75000178, chr4:74595215-74595237, chr4:74595370-74595392, chr4:74595560-74595582, chr4:74595642-74595664, chr4:74595787-74595809, chr4:74528428-74528450, chr4:74528567-74528589, chr4:74528609-74528631, chr4:74789132-74789154, chr4:74789250-74789272, chr4:74789312-74789334, chr4:74964853-74964875, chr4:74964906-74964928, chr4:74965538-74965560, chr4:74965737-74965759, chr4:75000031-75000053, chr4:75000115-75000137, chr4:75000231-75000253, chr4:74975146-74975168, chr4:74975369-74975391, chr4:74976318-74976340, chr4:74570348-74570370, chr4:74570503-74570525, chr4:74570526-74570548, chr5:90785724-90785746, chr5:90788137-90788159, chr5:90908926-90908948, chr5:90661492-90661514, chr5:90661646-90661668, chr5:90661744-90661766, chr5:90785610-90785632, chr5:90909047-90909069, 또는 chr6:113076028-113076047을 갖는 영역과 적어도 부분적으로 중첩되는 서열, 또는 상기 영역의 5, 10, 15, 20, 30, 40, 또는 50개 뉴클레오티드 내에 있는 서열을 포함하는 핵산을 포함하거나, 상기 게놈 영역의 서열과 적어도 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖거나, 상기 서열에 대해 1, 2, 3, 4, 또는 5개 이하의 상이한 위치를 갖는 서열을 포함한다.
일부 구현예에서, 표적화 모이어티는 게놈 위치 chr4:74595464-74595486, chr4:74595457-74595479, chr4:74595460-74595482, chr4:74595472-74595494, chr4:75000088-75000110, chr4:75000091-75000113, chr4:75000085-75000107, chr4:75000157-75000179, chr4:75000156-75000178, chr4:74595215-74595237, chr4:74595370-74595392, chr4:74595560-74595582, chr4:74595642-74595664, chr4:74595787-74595809, chr4:74528428-74528450, chr4:74528567-74528589, chr4:74528609-74528631, chr4:74789132-74789154, chr4:74789250-74789272, chr4:74789312-74789334, chr4:74964853-74964875, chr4:74964906-74964928, chr4:74965538-74965560, chr4:74965737-74965759, chr4:75000031-75000053, chr4:75000115-75000137, chr4:75000231-75000253, chr4:74975146-74975168, chr4:74975369-74975391, chr4:74976318-74976340, chr4:74570348-74570370, chr4:74570503-74570525, chr4:74570526-74570548, chr5:90661492-90661514, chr5:90661646-90661668, chr5:90661744-90661766, chr5:90785610-90785632, chr5:90909047-90909069, chr5:90785724-90785746, chr5:90788137-90788159, chr5:90908926-90908948, 또는 chr6:113076028-113076047에서 서열에 결합한다.
일부 구현예에서, 표적화 모이어티는 앵커 서열 또는 앵커 서열에 근접한 부위, 예를 들어 복수의 표적 유전자를 전체적으로 또는 부분적으로 포함하는 ASMC의 일부인 앵커 서열에 근접한 부위에 결합한다.
일부 구현예에서, 표적화 모이어티는 CRISPR/Cas 분자를 포함한다. 일부 구현예에서, 이펙터 모이어티는 CRISPR/Cas 분자를 포함한다. CRISPR/Cas 분자는 클러스터화된 규칙적으로 사이 공간을 둔 짧은 회문성 반복(clustered regulatory interspaced short palindromic repeat; CRISPR) 시스템에 관여하는 단백질, 예를 들어 Cas 단백질, 및 선택적으로, 가이드 RNA, 예를 들어 단일 가이드 RNA(sgRNA)를 포함한다.
CRISPR 시스템은 원래 박테리아 및 고세균에서 발견된 적응 방어 시스템이다. CRISPR 시스템은 CRISPR-연관 또는 "Cas" 엔도뉴클레아제(예를 들어, Cas9 또는 Cpf1)로 지칭되는 RNA-유도 뉴클레아제를 사용하여 외래 DNA를 절단한다. 예를 들어, 통상적인 CRISPR/Cas 시스템에서, 엔도뉴클레아제는 단일 가닥 또는 이중 가닥 DNA 서열을 표적화하는 서열-특이적, 비-코딩 "가이드 RNA"에 의해 표적 뉴클레오티드 서열(예를 들어, 서열-편집할 게놈 내의 부위)로 지시된다. CRISPR 시스템의 3가지 클래스(I 내지 III)가 확인되었다. 클래스 II CRISPR 시스템은 (다수의 Cas 단백질이 아닌) 단일 Cas 엔도뉴클레아제를 사용한다. 하나의 클래스 II CRISPR 시스템은 Cas9와 같은 II형 Cas 엔도뉴클레아제, CRISPR RNA("crRNA"), 및 트랜스-활성화 crRNA("tracrRNA")를 포함한다. crRNA는 통상적으로 표적 DNA 서열에 상응하는 약 20개 뉴클레오티드 RNA 서열인 "가이드 RNA"를 포함한다. crRNA는 또한 tracrRNA에 결합하여 RNase III에 의해 절단되는 부분적으로 이중 가닥인 구조를 형성하여 crRNA/tracrRNA 하이브리드를 생성하는 영역을 포함한다. 그 다음 crRNA/tracrRNA 하이브리드는 Cas9 엔도뉴클레아제가 표적 DNA 서열을 인식하고 절단하도록 지시한다. 표적 DNA 서열은 일반적으로 주어진 Cas 엔도뉴클레아제에 특이적인 "프로토스페이서 인접 모티프"(protospacer adjacent motif; "PAM")에 인접하여야 하지만; PAM 서열은 주어진 게놈 전체에 걸쳐 나타난다. 다양한 원핵생물 종으로부터 확인된 CRISPR 엔도뉴클레아제는 고유한 PAM 서열 요건을 가지며; PAM 서열의 예로는 5'-NGG(스트렙토코커스 피오게네스(Streptococcus pyogenes)), 5'-NNAGAA(스트렙토코커스 써모필루스(Streptococcus thermophilus) CRISPR1), 5'-NGGNG(스트렙토코커스 써모필루스 CRISPR3), 및 5'-NNNGATT(네이세리아 메닝지디티스(Neisseria meningiditis))가 포함된다. 일부 엔도뉴클레아제, 예를 들어 Cas9 엔도뉴클레아제는 G-풍부 PAM 부위, 예를 들어 5'-NGG(예를 들어, TGG, 예를 들어 CGG, 예를 들어 AGG)와 회합되며, PAM 부위로부터(이의 5'로부터) 3개 뉴클레오티드 상류의 위치에서 표적 DNA의 평활 말단(blunt-end) 절단을 수행한다. 또 다른 클래스 II CRISPR 시스템은, Cas9보다 작은 V형 엔도뉴클레아제 Cpf1를 포함하며, 예에는 AsCpf1((아시다미노코커스(Acidaminococcus) 종 유래) 및 LbCpf1((라크노스피라세(Lachnospiraceae) 종 유래)이 포함된다. Cpf1-연관 CRISPR 어레이는 tracrRNA의 필요 없이 성숙한 crRNA로 처리되며; 즉, Cpf1 시스템은 표적 DNA 서열을 절단하기 위해 Cpf1 뉴클레아제 및 crRNA만을 필요로 한다. Cpf1 엔도뉴클레아제는 T-풍부 PAM 부위, 예를 들어 5'-TTN과 회합된다. Cpf1은 또한 5'-CTA PAM 모티프를 인식할 수 있다. Cpf1은 4- 또는 5-뉴클레오티드 5' 오버행(overhang)을 갖는 오프셋 또는 엇갈린 이중 가닥 파손을 도입함으로써, 예를 들어 코딩 가닥 상에서 PAM 부위로부터(이의 3'로부터) 18개 뉴클레오티드 하류, 및 상보적 가닥 상에서 PAM 부위로부터 23개 뉴클레오티드 하류에 위치한 5-뉴클레오티드 오프셋 또는 엇갈린 절단물을 갖는 표적 DNA를 절단하며; 그러한 오프셋 절단으로 인한 5-뉴클레오티드 오버행은 평활 말단 절단된 DNA에서의 삽입에 의한 것보다는, 상동성 재조합에 의한 DNA 삽입에 의해 더 정확한 유전체 편집을 가능하게 한다. 예를 들어 문헌[Zetsche et al. (2015) Cell, 163:759 - 771]을 참조한다.
다양한 CRISPR 연관(Cas) 유전자 또는 단백질이 본 개시내용에 의해 제공되는 기술에 사용될 수 있으며, Cas 단백질의 선택은 본 방법의 특정 조건에 따라 달라질 것이다. Cas 단백질의 특정 예는 Cas1, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Cpf1, C2C1, 또는 C2C3을 포함하는 클래스 II 시스템을 포함한다. 일부 구현예에서, Cas 단백질, 예를 들어 Cas9 단백질은 다양한 원핵생물 종들 중 임의의 것으로부터 유래될 수 있다. 일부 구현예에서, 특정 Cas 단백질, 예를 들어 특정 Cas9 단백질은 특정 프로토스페이서-인접 모티프(PAM) 서열을 인식하도록 선택된다. 일부 구현예에서, 표적화 모이어티는 서열 표적화 폴리펩티드, 예컨대 Cas 단백질, 예를 들어 Cas9를 포함한다. 특정 구현예에서, Cas 단백질, 예를 들어 Cas9 단백질은 박테리아 또는 고세균으로부터 수득되거나, 또는 알려진 방법을 사용하여 합성될 수 있다. 특정 구현예에서, Cas 단백질은 그람 양성 박테리아 또는 그람 음성 박테리아에서 유래할 수 있다. 특정 구현예에서, Cas 단백질은 스트렙토코커스(예를 들어, S. 피오게네스, 또는 S. 써모필루스), 프란시셀라(Francisella)(예를 들어, F. 노비시다(novicida)), 스타필로코커스(예를 들어, S. 아우레우스(aureus)), 아시다미노코커스(예를 들어, 아시다미노코커스 종 BV3L6), 네이세리아(예를 들어, N. 메닝지티디스), 크립토코커스, 코리네박테리움, 헤모필루스(Haemophilus), 유박테리움(Eubacterium), 파스퉤렐라(Pasteurella), 프레보텔라(Prevotella), 베일로넬라(Veillonella), 또는 마리노박터(Marinobacter)에서 유래할 수 있다.
일부 구현예에서, Cas 단백질은 Cas 단백질이 결합 및/또는 기능하기 위한 표적 DNA 서열에 존재하거나 이에 인접하기 위해 프로토스페이서 인접 모티프(PAM)를 필요로 한다. 일부 구현예에서, PAM은 5'에서 3'으로 NGG, YG, NNGRRT, NNNRRT, NGA, TYCV, TATV, NTTN, 또는 NNNGATT이거나, 이를 포함하며, 여기서 N은 임의의 뉴클레오티드를 나타내고, Y는 C 또는 T를 나타내고, R은 A 또는 G를 나타내고, V는 A 또는 C 또는 G를 나타낸다. 일부 구현예에서, Cas 단백질은 표 1에 열거된 단백질이다. 일부 구현예에서, Cas 단백질은 그의 PAM을 변경하는 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, Cas 단백질은 E1369R, E1449H, 및 R1556A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 E782K, N968K, 및 R1015H 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 D1135V, R1335Q, 및 T1337R 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 S542R 및 K607R 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 S542R, K548V, 및 N552R 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
명칭 | 효소 | 종 | AA의 수 | PAM | PAM 인식을 변경시키기 위한 돌연변이 | 촉매적으로 사멸되게(catalytically dead) 하기 위한 돌연변이 |
FnCas9 | Cas9 | 프란시셀라 노비시다 | 1629 | 5'-NGG-3' | Wt | D11A/H969A/N995A |
FnCas9 RHA | Cas9 | 프란시셀라 노비시다 | 1629 | 5'-YG-3' | E1369R/E1449H/R1556A | D11A/H969A/N995A |
SaCas9 | Cas9 | 스타필로코커스 아우레우스 | 1053 | 5'-NNGRRT-3' | Wt | D10A/H557A |
SaCas9 KKH | Cas9 | 스타필로코커스 아우레우스 | 1053 | 5'-NNNRRT-3' | E782K/N968K/R1015H | D10A/H557A |
SpCas9 | Cas9 | 스트렙토코커스 피오게네스 | 1368 | 5'-NGG-3' | Wt | D10A/D839A/H840A/N863A |
SpCas9 VQR | Cas9 | 스트렙토코커스 피오게네스 | 1368 | 5'-NGA-3' | D1135V/R1335Q/T1337R | D10A/D839A/H840A/N863A |
AsCpf1 RR | Cpf1 | 아시다미노코커스 종 BV3L6 | 1307 | 5'-TYCV-3' | S542R/K607R | E993A |
AsCpf1 RVR | Cpf1 | 아시다미노코커스 종 BV3L6 | 1307 | 5'-TATV-3' | S542R/K548V/N552R | E993A |
FnCpf1 | Cpf1 | 프란시셀라 노비시다 | 1300 | 5'-NTTN-3' | Wt | D917A/E1006A/D1255A |
NmCas9 | Cas9 | 네이세리아 메닝지디티스 | 1082 | 5'-NNNGATT-3' | Wt | D16A/D587A/H588A/N611A |
일부 구현예에서, Cas 단백질은 촉매적으로 활성적이고, 표적 DNA 부위의 한 가닥 또는 두 가닥 모두를 절단한다. 일부 구현예에서, 표적 DNA 부위를 절단한 후, 예를 들어 세포 복구 기구에 의해 변경, 예를 들어 삽입 또는 결실이 형성된다.
일부 구현예에서, Cas 단백질은 뉴클레아제, 예를 들어 뉴클레아제-결핍 Cas9를 탈활성화하도록 변형된다. 야생형 Cas9는 gRNA에 의해 표적화된 특이적인 DNA 서열에서 이중 가닥 파손(DSB)을 생성하는 반면, 변형된 기능기를 갖는 다수의 CRISPR 엔도뉴클레아제가 이용가능하며, 예를 들어, Cas9의 "닉카제" 형태는 단일 가닥 파손만을 생성하고; 촉매적으로 비활성인 Cas9("dCas9")는 표적 DNA를 절단하지 않는다. 일부 구현예에서, DNA 서열에 결합하는 dCas9는 입체 장애에 의해 해당 부위에서 전사를 방해할 수 있다. 일부 구현예에서, 앵커 서열에 대한 dCas9 결합은 게놈 복합체(예를 들어, ASMC) 형성 및/또는 유지를 방해할 수 있다(예를 들어, 감소시키거나 방지할 수 있음). 일부 구현예에서, 표적화 모이어티는 촉매적으로 비활성인 Cas9, 예를 들어 dCas9, 예를 들어 Cas9m4를 포함한다. 많은 촉매적으로 비활성인 Cas9 단백질이 당업계에 알려져 있다. 일부 구현예에서, dCas9는 Cas 단백질의 각 엔도뉴클레아제 도메인 내의 돌연변이, 예를 들어 D10A 및 H840A 돌연변이를 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D11A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H969A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 N995A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D11A, H969A, 및 N995A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D10A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H557A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D10A 및 H557A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D839A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H840A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 N863A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D10A, D839A, H840A, 및 N863A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 E993A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D917A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 E1006A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D1255A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D917A, E1006A, 및 D1255A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D16A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D587A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H588A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 N611A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D16A, D587A, H588A, 및 N611A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 양태에서, 본 명세서에 기재된 시스템, 또는 본 명세서에 기재된 방법은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티(예를 들어, 1개 또는 2개의 이펙터 모이어티)를 포함하는 부위-특이적 파괴제 또는 폴리펩티드의 사용을 포함하며, 하나 이상의 표적화 모이어티는 Cas 단백질, 예를 들어 촉매적으로 비활성인 Cas9 단백질, 예를 들어 sadCas9, dCas9, 예를 들어 dCas9m4, 또는 이의 기능성 변이체 또는 단편을 포함하는 CRISPR/Cas 분자이거나 이를 포함한다. 일부 구현예에서, dCas9는 서열번호 5, 6, 또는 7의 아미노산 서열을 포함한다:
Cas9
dCas9(Cas9m4)
Sa-dCas9
일부 구현예에서, dCas9는 서열번호 8 또는 9의 핵산 서열에 의해 인코딩된다:
가이드 RNA(gRNA)
일부 구현예에서, 표적화 모이어티는 gRNA를 포함하거나 이에 (예를 들어, 공유적으로) 연결된 Cas 분자를 포함할 수 있다. gRNA는 Cas-단백질 결합에 필요한 "스캐폴드" 서열, 및 게놈 표적을 위한 사용자-정의된 약 20개의 뉴클레오티드 표적화 서열로 구성되는 짧은 합성 RNA이다. 실제로, 가이드 RNA 서열은 17 내지 24개의 뉴클레오티드(예를 들어, 19, 20, 또는 21개의 뉴클레오티드) 길이를 갖고 표적화된 핵산 서열에 상보적이 되도록 일반적으로 설계된다. 일부 구현예에서 gRNA는 3 내지 6개의 측접 포스포로티오에이트(PS) 연결, 예를 들어 각 말단에 3개의 측접 PS 연결을 포함한다. 효과적인 가이드 RNA의 설계에 사용하기 위한 맞춤형 gRNA 생성기 및 알고리즘이 상업적으로 구매 가능하다. 키메라 "단일 가이드 RNA"("sgRNA")를 사용하여 유전자 편집이 또한 달성되었는데, 이는, 자연 발생 crRNA-tracrRNA 복합체를 모방하고, (뉴클레아제에 결합하기 위한) tracrRNA 및 (편집을 위해 뉴클레아제를 표적화된 서열로 가이드하기 위한) 적어도 하나의 crRNA 둘 모두를 함유하는 조작된(합성) 단일 RNA 분자이다. 화학적으로 변형된 sgRNA가 또한 Cas 단백질과 함께 사용하기에 효과적인 것으로 입증되었으며; 예를 들어, 문헌[Hendel et al. (2015) Nature Biotechnol., 985 - 991]을 참조한다.
일부 구현예에서, gRNA는 표적 유전자와 연관된 DNA 서열에 상보적인 핵산 서열을 포함한다. 일부 구현예에서, DNA 서열은 표적 유전자에 작동가능하게 연결된 발현 제어 요소이거나, 이를 포함하거나, 이와 중첩된다. 일부 구현예에서, gRNA는 표적 유전자와 연관된 DNA 서열에 적어도 90, 95, 99, 또는 100% 상보적인 핵산 서열을 포함한다. 일부 구현예에서, Cas 분자를 포함하는 표적화 모이어티와 함께 사용하기 위한 gRNA는 sgRNA이다. 일부 구현예에서, gRNA는 표 4, 표 5, 표 6, 표 7로부터 선택되는 서열, 또는 상기 서열과 적어도 70, 75, 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖거나, 상기 서열에 대해 1, 2, 3, 4, 또는 5개 이하의 상이한 위치를 갖는 서열을 포함하는 핵산 서열에 결합한다.
일부 구현예에서, CRISPR/Cas 분자와 함께 사용하기 위한 gRNA는 β-2-마이크로글로불린 발현과 연관된 표적 서열에 특이적으로 결합한다. 일부 구현예에서, CRISPR/Cas 분자와 함께 사용하기 위한 gRNA는 CXCL1 내지 CXCL8 유전자 발현 중 하나 이상과 연관된 표적 서열에 특이적으로 결합한다. 그러한 gRNA는 서열번호 20 내지 62로부터 선택되는 표적-결합 서열을 포함할 수 있다.
일부 구현예에서, 표적화 모이어티는 TAL 이펙터 분자이거나 이를 포함한다. TAL 이펙터 분자, 예를 들어 DNA 서열에 특이적으로 결합하는 TAL 이펙터 분자는 복수의 TAL 이펙터 도메인 또는 이의 단편들을 포함하며, 선택적으로 자연 발생 TAL 이펙터들의 하나 이상의 추가적인 부분들(예를 들어, 복수의 TAL 이펙터 도메인들의 N- 및/또는 C-말단)을 포함한다. 많은 TAL 이펙터가 당업자에게 알려져 있으며, 예를 들어 Thermo Fisher Scientific으로부터 상업적으로 구매 가능하다.
TALE는 숙주 식물에서의 유전자 발현을 조절하고, 박테리아 콜로니화 및 생존을 용이하게 하는 식물 병원체 잔토모나스(Xanthomonas)를 포함하는 박테리아성 병원체의 다양한 종에 의해 분비되는 천연 이펙터 단백질이다. TAL 이펙터의 특이적 결합은 통상적으로 33 또는 34개의 아미노산의 나란히 정렬된 거의 동일한 반복부들의 중심 반복 도메인(반복부-가변 이(di)-잔기, RVD 도메인)을 기준으로 한다.
TAL 이펙터 패밀리의 구성원들은 그들의 반복부들의 수와 순서에서 주로 상이하다. 반복부들의 수는 1.5 내지 33.5개의 반복부 범위이며, C-말단 반복부는 보통 길이가 더 짧고(예를 들어, 약 20개 아미노산), 일반적으로 "절반-반복부"로서 지칭된다. TAL 이펙터의 각 반복부는 상이한 염기쌍 특이성을 나타내는 상이한 반복부 유형과 하나의 반복부-대-하나의 염기쌍 상관관계를 특징으로 한다(하나의 반복부는 표적 유전자 서열 상에서 하나의 염기쌍을 인식함). 일반적으로, 반복부의 수가 더 적을수록, 단백질-DNA 상호작용은 더 약해진다. 다수의 6.5개 반복부는 리포터 유전자의 전사를 활성화하기에 충분한 것으로 나타났다(Scholze et al., 2010).
반복부 대 반복부 변이는 아미노산 위치 12 및 13에서 주로 발생하며, 따라서 이는 "초가변"으로 지칭되고, 표적 DNA 프로모터 서열과의 상호작용의 특이성을 담당하며, 이는 예시적인 반복부 가변 이-잔기(RVD) 및 이들의 핵산 염기 표적에 대한 상동성을 열거한 표 2에 나타낸 바와 같다.
표적 | 가능한 RVD 아미노산 조합 | ||||||||||||
A | NI | NN | CI | HI | KI | ||||||||
G | NN | GN | SN | VN | LN | DN | QN | EN | HN | RH | NK | AN | FN |
C | HD | RD | KD | ND | AD | ||||||||
T | NG | HG | VG | IG | EG | MG | YG | AA | EP | VA | QG | KG | RG |
따라서, TAL 이펙터의 반복부를 표적 특이적 DAN 서열로 변형하는 것이 가능하다. 추가의 연구는, RVD NK가 G를 표적화할 수 있음을 나타내었다. TAL 이펙터의 표적 부위는 또한 제1 반복부에 의해 표적화되는 5' 염기에 측접하는 T를 포함하는 경향도 있지만, 이러한 인식의 정확한 기작은 알려져 있지 않다. 113개가 넘는 TAL 이펙터 서열이 오늘날까지 알려져 있다. 잔토모나스로부터의 TAL 이펙터의 비제한적 예는 Hax2, Hax3, Hax4, AvrXa7, AvrXa10 및 AvrBs3을 포함한다.
따라서, 본 개시내용의 TAL 이펙터 분자의 TAL 이펙터 도메인은 임의의 박테리아 종(예를 들어, 잔토모나스 종, 예컨대 아프리카 균주인, 잔토모나스 오리제 pv. 오리제(Xanthomonas oryzae pv. Oryzae)(Yu et al. 2011), 잔토모나스 캄페스트리스 pv. 라파니(Xanthomonas campestris pv. raphani) 균주 756C 및 잔토모나스 오리제 pv. 오리지콜라(Xanthomonas oryzae pv. oryzicola) 균주 BLS256(Bogdanove et al. 2011)으로부터의 TAL 이펙터로부터 유래될 수 있다. 본 명세서에 사용되는 바와 같이, 본 개시내용에 따른 TAL 이펙터 도메인은 RVD 도메인뿐만 아니라 자연 발생 TAL 이펙터로부터의 측접 서열(들)(RVD 도메인의 N-말단 및/또는 C-말단 측부 상에서의 서열)도 또한 포함한다. 이는 자연 발생 TAL 이펙터의 RVD보다 더 많거나 더 적은 반복부들을 포함할 수 있다. 본 개시내용의 TAL 이펙터 분자는 상기 코드를 기반으로 한 소정의 DNA 서열 및 당업계에 알려진 다른 것들을 표적화하도록 설계된다. TAL 이펙터 도메인의 수(예를 들어, 반복부(단량체 또는 모듈)) 및 그의 특이적 서열은 원하는 DNA 표적 서열을 기반으로 하여 선택된다. 예를 들어, TAL 이펙터 도메인, 예를 들어 반복부들은 특이적 표적 서열에 맞도록 제거 또는 부가될 수 있다. 일 구현예에서, 본 개시내용의 TAL 이펙터 분자는 6.5 내지 33.5개의 TAL 이펙터 도메인, 예를 들어 반복부를 포함한다. 일 구현예에서, 본 개시내용의 TAL 이펙터 분자는 8 내지 33.5개의 TAL 이펙터 도메인, 예를 들어 반복부, 예를 들어 10 내지 25개의 TAL 이펙터 도메인, 예를 들어 반복부, 예를 들어 10 내지 14개의 TAL 이펙터 도메인, 예를 들어 반복부를 포함한다.
일부 구현예에서, TAL 이펙터 분자는 DNA 표적 서열에 대한 완전한 매치에 상응하는 TAL 이펙터 도메인을 포함한다. 일부 구현예에서, DNA 표적 서열 상에서 반복부와 표적 염기쌍 사이의 미스매치는 TAL 이펙터 분자를 포함하는 부위-특이적 파괴제의 기능을 가능하게 하는 한 허용된다. 일반적으로, TALE 결합은 미스매치의 수와 역의 상관관계를 갖는다. 일부 구현예에서, 본 개시내용의 부위-특이적 파괴제의 TAL 이펙터 분자는 표적 DNA 서열과, 7개의 미스매치, 6개의 미스매치, 5개의 미스매치, 4개의 미스매치, 3개의 미스매치, 2개의 미스매치, 또는 1개의 미스매치 이하를 포함하고, 선택적으로는 미스매치가 없다. 이론에 의해 구애되고자 함이 없이, 일반적으로 TAL 이펙터 분자 내 TAL 이펙터 도메인의 수가 더 적을수록, 더 적은 수의 미스매치가 용인될 것이고, TAL 이펙터 분자를 포함하는 부위-특이적 파괴제의 기능을 여전히 허용할 것이다. 결합 친화도는 매칭되는 반복부-DNA 조합의 합에 따라 달라지는 것으로 생각된다. 예를 들어, 25개 이상의 TAL 이펙터 도메인을 갖는 TAL 이펙터 분자는 최대 7개의 미스매치를 용인할 수 있다.
TAL 이펙터 도메인에 추가적으로, 본 개시내용의 TAL 이펙터 분자는 자연 발생 TAL 이펙터로부터 유래된 추가적인 서열들을 포함할 수 있다. TAL 이펙터 분자의 TAL 이펙터 도메인 부분의 각각의 측면에 포함된 C-말단 및/또는 N-말단 서열(들)의 길이는 다양할 수 있으며, 예를 들어 문헌[Zhang et al. (2011)]의 연구를 기반으로 하여 당업자에 의해 선택될 수 있다. 상기 문헌[Zhang et al.]은 Hax3 유래된 TAL-이펙터를 기반으로 한 단백질에서 많은 C-말단 및 N-말단 절단 돌연변이체를 특성화하였으며, 표적 서열에 대한 최적 결합 및 이에 따라 전사 활성화에 기여하는 주요 요소를 확인하였다. 일반적으로, 전사 활성은 N-말단의 길이와 역의 상관관계에 있는 것으로 밝혀졌다. C-말단에 대하여, Hax 3 서열의 최초 68개 아미노산 내 DNA 결합 잔기에 중요한 요소가 확인되었다. 이에 따라 일부 구현예에서, 자연 발생 TAL 이펙터의 TAL 이펙터 도메인의 C-말단부 상에서 최초 68개 아미노산은 본 개시내용의 부위-특이적 파괴제의 TAL 이펙터 분자 내에 포함된다. 따라서, 일 구현예에서 본 개시내용의 TAL 이펙터 분자는 1) 자연 발생 TAL 이펙터로부터 유래된 하나 이상의 TAL 이펙터 도메인; 2) TAL 이펙터 도메인의 N-말단부에 대한 자연 발생 TAL 이펙터로부터 적어도 70, 80, 90, 100, 110, 120, 130, 140, 150, 170, 180, 190, 200, 220, 230, 240, 250, 260, 270, 280개 또는 그 이상의 아미노산; 및/또는 3) TAL 이펙터 도메인의 C-말단부 상에서 자연 발생 TAL 이펙터로부터의 적어도 68, 80, 90, 100, 110, 120, 130, 140, 150, 170, 180, 190, 200, 220, 230, 240, 250, 260개 또는 그 이상의 아미노산을 포함한다.
일부 구현예에서, 표적화 모이어티는 Zn 핑거 분자이거나 이를 포함한다. Zn 핑거 분자는 Zn 핑거 단백질, 예를 들어, 자연 발생 Zn 핑거 단백질 또는 조작된 Zn 핑거 단백질, 또는 이의 단편을 포함한다. 많은 Zn 핑거 단백질이 당업자에게 알려져 있으며, 예를 들어 Sigma-Aldrich로부터 상업적으로 구매 가능하다.
일부 구현예에서, Zn 핑거 분자는, 선택된 표적 DNA 서열에 결합하도록 조작된, 비자연 발생 Zn 핑거 단백질을 포함한다. 예를 들어, 그 전체가 본 명세서에 참고로 포함된, 문헌[Beerli, et al. (2002) Nature Biotechnol. 20:135-141]; 문헌[Pabo, et al. (2001) Ann. Rev. Biochem. 70:313-340]; 문헌[Isalan, et al. (2001) Nature Biotechnol. 19:656-660]; 문헌[Segal, et al. (2001) Curr. Opin. Biotechnol. 12:632-637]; 문헌[Choo, et al. (2000) Curr. Opin. Struct. Biol. 10:411-416]; 미국 특허 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273; 및 미국 특허 공개 2005/0064474; 2007/0218528; 2005/0267061을 참조한다.
조작된 Zn 핑거 단백질은, 자연 발생 Zn 핑거 단백질과 비교하여, 새로운 결합 특이성을 가질 수 있다. 조작 방법은 합리적 설계(rational design) 및 다양한 유형의 선택을 포함하지만 이로 한정되지 않는다. 합리적 설계는, 예를 들어 삼중자(또는 사중자) 뉴클레오티드 서열 및 개별적인 Zn 핑거 아미노산 서열을 포함하는 데이터베이스의 사용을 포함하며, 여기서 각각의 삼중자 또는 사중자 뉴클레오티드 서열은, 특정 삼중자 또는 사중자 서열에 결합하는 징크 핑거의 아미노산 서열 하나 이상과 회합된다. 예를 들어, 그 전체가 본 명세서에 참고로 포함된, 미국 특허 6,453,242 및 6,534,261을 참조한다.
파지 디스플레이 및 2-하이브리드 시스템을 포함하여 예시적인 선택 방법이 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 및 국제 특허 공개 WO 98/37186; WO 98/53057; WO 00/27878; 및 WO 01/88197 및 GB 2,338,237에 개시되어 있다. 추가적으로, 징크 핑거 단백질에 대한 결합 특이성의 향상은, 예를 들어 국제 특허 공개 WO 02/077227에 기재되어 있다.
추가적으로, 이들 및 기타 참고 문헌에 개시된 바와 같이, 징크 핑거 도메인 및/또는 다중-핑거의 징크 핑거 단백질은 임의의 적합한 링커 서열을 함께 사용하여 연결될 수 있으며, 이는 예를 들어 길이가 5개 이상의 아미노산인 링커를 포함한다. 또한, 길이가 6개 이상의 아미노산인 예시적인 링커 서열에 대해, 미국 특허 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본 명세서에 기재된 단백질은 단백질의 개별적인 징크 핑거들 간에 적합한 링커의 임의의 조합을 포함할 수 있다. 추가적으로, 징크 핑거 결합 도메인에 대한 결합 특이성의 향상은, 예를 들어 공동 소유된 국제 특허 공개 WO 02/077227에 기재되어 있다.
Zn 핑거 단백질 및 융합 단백질의 설계 및 구축 방법(및 이를 인코딩하는 폴리뉴클레오티드)는 당업자에게 알려져 있으며, 미국 특허 6,140,0815; 789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 및 6,200,759; 국제 특허 공개 WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536; 및 WO 03/016496에 상세하게 기재되어 있다.
추가적으로, 이들 및 기타 참고 문헌에 개시된 바와 같이, Zn 핑거 단백질 및/또는 다중-핑거 Zn 핑거 단백질은, 예를 들어 길이가 5개 이상의 아미노산인 링커를 포함하는, 임의의 적합한 링커 서열을 사용하여, 예를 들어 융합 단백질로서, 함께 연결될 수 있다. 또한, 길이가 6개 이상의 아미노산인 예시적인 링커 서열에 대해 미국 특허 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본 명세서에 기재된 Zn 핑거 분자는, 개별적인 징크 핑거 단백질 및/또는 Zn 핑거 분자의 다중-핑거 Zn 핑거 단백질 간에 적합한 링커의 임의의 조합을 포함할 수 있다.
특정 구현예에서, 표적화 모이어티는 표적 DNA 서열에 (서열-특이적 방식으로) 결합하는 조작된 징크 핑거 단백질을 포함하는 Zn 핑거 분자를 포함한다. 일부 구현예에서, Zn 핑거 분자는 하나의 Zn 핑거 단백질 또는 이의 단편을 포함한다. 다른 구현예에서, Zn 핑거 분자는 복수의 Zn 핑거 단백질(또는 이의 단편), 예를 들어, 2, 3, 4, 5, 6개 이상의 Zn 핑거 단백질(및 선택적으로 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 또는 2개 이하의 Zn 핑거 단백질)을 포함한다. 일부 구현예에서, Zn 핑거 분자는 적어도 3개의 Zn 핑거 단백질을 포함한다. 일부 구현예에서, Zn 핑거 분자는 4, 5, 또는 6개의 핑거를 포함한다. 일부 구현예에서, Zn 핑거 분자는 8, 9, 10, 11 또는 12개의 핑거를 포함한다. 일부 구현예에서, 3개의 Zn 핑거 단백질을 포함하는 Zn 핑거 분자는 9 또는 10개의 뉴클레오티드를 포함하는 표적 DNA 서열을 인식한다. 일부 구현예에서, 4개의 Zn 핑거 단백질을 포함하는 Zn 핑거 분자는 12 내지 14개의 뉴클레오티드를 포함하는 표적 DNA 서열을 인식한다. 일부 구현예에서, 6개의 Zn 핑거 단백질을 포함하는 Zn 핑거 분자는 18 내지 21개의 뉴클레오티드를 포함하는 표적 DNA 서열을 인식한다.
일부 구현예에서, Zn 핑거 분자는 양손(two-handed) Zn 핑거 단백질을 포함한다. 양손 징크 핑거 단백질은, 징크 핑거 단백질의 2개의 클러스터가 개재하는 아미노산들에 의해 분리되어, 2개의 징크 핑거 도메인이 2개의 불연속적인 표적 DNA 서열에 결합되도록 하는 단백질들이다. 징크 핑거 결합 단백질의 양손 유형의 예는 SIP1이며, 여기서 4개의 징크 핑거 단백질의 클러스터는 단백질의 아미노 말단에 위치되고, 3개의 징크 핑거 단백질의 클러스터는 카르복실 말단에 위치한다(문헌[Remade, et al. (1999) EMBO Journal 18(18):5073-5084] 참조). 이들 단백질의 징크 핑거의 각 클러스터는 독특한 표적 서열에 결합할 수 있고, 2개의 표적 서열 사이의 간격은 많은 뉴클레오티드를 포함할 수 있다.
일부 구현예에서, 표적화 모이어티는 뉴클레아제로부터의 DNA-결합 도메인이거나 이를 포함한다. 예를 들어, I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII과 같은 호밍 엔도뉴클레아제 및 메가뉴클레아제의 인식 서열이 알려져 있다. 또한, 미국 특허 5,420,032; 6,833,252; 문헌[Belfort, et al. (1997) Nucleic Acids Res. 25:3379-3388]; 문헌[Dujon, et al. (1989) Gene 82:115-118]; 문헌[Perler, et al. (1994) Nucleic Acids Res. 22:1125-1127]; 문헌[Jasin (1996) Trends Genet. 12:224-228]; 문헌[Gimble, et al. (1996) J. Mol. Biol. 263:163-180]; 문헌[Argast, et al. (1998) J. Mol. Biol. 280:345-353] 및 New England Biolabs 카탈로그를 참조한다. 추가적으로, 호밍 엔도뉴클레아제 및 메가뉴클레아제의 DNA-결합 특이성이 비천연 표적 부위에 결합하도록 조작될 수 있다. 예를 들어, 문헌[Chevalier, et al. (2002) Molec. Cell 10:895-905]; 문헌[Epinat, et al. (2003) Nucleic Acids Res. 31:2952-2962]; 문헌[Ashworth, et al. (2006) Nature 441:656-659]; 문헌[Paques, et al. (2007) Current Gene Therapy 7:49-66]; 미국 특허 공개 2007/0117128을 참조한다.
일부 구현예에서, 표적화 모이어티는 핵산을 포함한다. 일부 구현예에서, 표적화 모이어티 내에 포함될 수 있는 핵산은 DNA, RNA, 및/또는 인공 또는 합성 핵산 또는 핵산 유사체 또는 모방체이거나 이를 포함할 수 있다. 예를 들어, 일부 구현예에서, 핵산은 게놈 DNA(gDNA), 상보적 DNA(cDNA), 펩티드 핵산(PNA), 펩티드- 올리고뉴클레오티드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체-형성 올리고뉴클레오티드, 안티센스 올리고뉴클레오티드, tRNA, mRNA, rRNA, miRNA, gRNA, siRNA 또는 기타 다른 RNAi 분자(예를 들어, 본 명세서에 기재된 바와 같은 비코딩 RNA를 표적화하고/하거나 본 명세서에 기재된 바와 같은 표적화된 게놈 복합체와 연관된 특정 유전자의 발현 산물을 표적화하는 것들) 등 중 하나 이상이거나 이를 포함할 수 있다. 일부 구현예에서, 핵산은 자연 발생 DNA 또는 RNA 잔기가 아닌 하나 이상의 잔기를 포함할 수 있고/있거나, 포스포디에스테르 결합이 아닌(예를 들어, 이를 테면 포스포로티오에이트 결합 등일 수 있는) 하나 이상의 결합을 포함할 수 있고/있거나, 예를 들어 2'O 변형, 예컨대 2'-OMeP와 같은 하나 이상의 변형을 포함할 수 있다. 합성 핵산을 제조하는 데 유용한 다양한 핵산 구조가 당업계에 알려져 있으며(예를 들어, WO2017/062862l 및 WO2014/012081 참조), 당업자는 이들이 본 개시내용에 따라 이용될 수 있음을 이해할 것이다.
부위-특이적 파괴제에, 예를 들어 표적화 모이어티에 사용하기에 적합한 핵산은 DNA, RNA, 변형된 올리고뉴클레오티드(예를 들어, 화학적 변형, 예컨대 백본 연결, 당 분자, 및/또는 핵산 염기를 변경시키는 변형), 및 인공 핵산을 포함할 수 있지만 이로 한정되지 않는다. 일부 구현예에서, 핵산은 게놈 DNA, cDNA, 펩티드 핵산(PNA) 또는 펩티드 올리고뉴클레오티드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체 형성 올리고뉴클레오티드, 변형된 DNA, 안티센스 DNA 올리고뉴클레오티드, tRNA, mRNA, rRNA, 변형된 RNA, miRNA, gRNA, 및 siRNA 또는 기타 다른 RNA 또는 DNA 분자를 포함하지만 이로 한정되지 않는다.
일부 구현예에서, 표적화 모이어티는 약 15 내지 200개, 20 내지 200개, 30 내지 200개, 40 내지 200개, 50 내지 200개, 60 내지 200개, 70 내지 200개, 80 내지 200개, 90 내지 200개, 100 내지 200개, 110 내지 200개, 120 내지 200개, 130 내지 200개, 140 내지 200개, 150 내지 200개, 160 내지 200개, 170 내지 200개, 180 내지 200개, 190 내지 200개, 215 내지 190개, 20 내지 190개, 30 내지 190개, 40 내지 190개, 50 내지 190개, 60 내지 190개, 70 내지 190개, 80 내지 190개, 90 내지 190개, 100 내지 190개, 110 내지 190개, 120 내지 190개, 130 내지 190개, 140 내지 190개, 150 내지 190개, 160 내지 190개, 170 내지 190개, 180 내지 190개, 15 내지 180개, 20 내지 180개, 30 내지 180개, 40 내지 180개, 50 내지 180개, 60 내지 180개, 70 내지 180개, 80 내지 180개, 90 내지 180개, 100 내지 180개, 110 내지 180개, 120 내지 180개, 130 내지 180개, 140 내지 180개, 150 내지 180개, 160 내지 180개, 170 내지 180개, 15 내지 170개, 20 내지 170개, 30 내지 170개, 40 내지 170개, 50 내지 170개, 60 내지 170개, 70 내지 170개, 80 내지 170개, 90 내지 170개, 100 내지 170개, 110 내지 170개, 120 내지 170개, 130 내지 170개, 140 내지 170개, 150 내지 170개, 160 내지 170개, 15 내지 160개, 20 내지 160개, 30 내지 160개, 40 내지 160개, 50 내지 160개, 60 내지 160개, 70 내지 160개, 80 내지 160개, 90 내지 160개, 100 내지 160개, 110 내지 160개, 120 내지 160개, 130 내지 160개, 140 내지 160개, 150 내지 160개, 215 내지 150개, 20 내지 150개, 30 내지 150개, 40 내지 150개, 50 내지 150개, 60 내지 150개, 70 내지 150개, 80 내지 150개, 90 내지 150개, 100 내지 150개, 110 내지 150개, 120 내지 150개, 130 내지 150개, 140 내지 150개, 15 내지 140개, 20 내지 140개, 30 내지 140개, 40 내지 140개, 50 내지 140개, 60 내지 140개, 70 내지 140개, 80 내지 140개, 90 내지 140개, 100 내지 140개, 110 내지 140개, 120 내지 140개, 130 내지 140개, 15 내지 130개, 20 내지 130개, 30 내지 130개, 40 내지 130개, 50 내지 130개, 60 내지 130개, 70 내지 130개, 80 내지 130개, 90 내지 130개, 100 내지 130개, 110 내지 130개, 120 내지 130개, 215 내지 120개, 20 내지 120개, 30 내지 120개, 40 내지 120개, 50 내지 120개, 60 내지 120개, 70 내지 120개, 80 내지 120개, 90 내지 120개, 100 내지 120개, 110 내지 120개, 15 내지 110개, 20 내지 110개, 30 내지 110개, 40 내지 110개, 50 내지 110개, 60 내지 110개, 70 내지 110개, 80 내지 110개, 90 내지 110개, 100 내지 110개, 15 내지 100개, 20 내지 100개, 30 내지 100개, 40 내지 100개, 50 내지 100개, 60 내지 100개, 70 내지 100개, 80 내지 100개, 90 내지 100개, 15 내지 90개, 20 내지 90개, 30 내지 90개, 40 내지 90개, 50 내지 90개, 60 내지 90개, 70 내지 90개, 80 내지 90개, 15 내지 80개, 20 내지 80개, 30 내지 80개, 40 내지 80개, 50 내지 80개, 60 내지 80개, 70 내지 80개, 15 내지 70개, 20 내지 70개, 30 내지 70개, 40 내지 70개, 50 내지 70개, 60 내지 70개, 15 내지 60개, 20 내지 60개, 30 내지 60개, 40 내지 60개, 50 내지 60개, 15 내지 50개, 20 내지 50개, 30 내지 50개, 40 내지 50개, 15 내지 40개, 20 내지 40개, 30 내지 40개, 15 내지 30개, 20 내지 30개, 또는 15 내지 20개의 뉴클레오티드 길이, 또는 이들 사이의 임의의 범위의 뉴클레오티드 길이를 갖는 핵산을 포함한다.
이펙터 모이어티
본 개시내용의 부위-특이적 파괴제는 하나 이상의 이펙터 모이어티를 포함할 수 있다. 이펙터 모이어티는 본 명세서에 기재된 부위-특이적 파괴제의 일부로서 사용될 때 세포에서 복수의 표적 유전자의 발현을 조절하는, 예를 들어 감소시키는 하나 이상의 기능성을 갖는다. 일부 구현예에서, 이펙터 모이어티는, 예를 들어 앵커 서열에 대한 게놈 복합체 성분(예를 들어, 핵형성 폴리펩티드)의 결합이 억제되도록(예를 들어, 방지되도록) 앵커 서열을 물리적 또는 입체적으로 차단한다. 일부 구현예에서, 이펙터 모이어티는, 예를 들어 게놈 복합체 성분이 앵커 서열에 결합하는 친화도 및/또는 결합력을 변경(예를 들어, 감소)시킴으로써, 게놈 복합체 성분(예를 들어, 핵형성 폴리펩티드)과 앵커 서열의 상호작용을 불안정화시킨다. 예를 들어, 이펙터 모이어티는 게놈 복합체, 예를 들어 ASMC의 형성을 억제하거나 불안정화시키는 인자를 동원할 수 있거나, 게놈 복합체(예를 들어, ASMC)의 형성 또는 유지에 필요한 인자(예를 들어, 게놈 복합체 성분 또는 전사 인자)의 동원을 억제할 수 있다. 일부 구현예에서, 이펙터 모이어티는, 예를 들어 DNA 또는 이와 연관된 히스톤에 대한 하나 이상의 후성유전학적 변형의 적용 또는 제거를 촉진(예를 들어, 촉매화)함으로써, 앵커 서열 또는 앵커 서열에 근접한 서열의 후성유전학적 지형을 조절하여, 복수의 표적 유전자의 발현을 감소시킨다는 점에서 후성유전학적 변형 기능성을 갖는다. 일부 구현예에서, 이펙터 모이어티는 유전적 변형 기능성을 가지며, 예를 들어 이펙터 모이어티는 앵커 서열 또는 이에 근접한 서열에 변경(예를 들어, 삽입, 결실, 또는 치환)을 도입한다.
일부 구현예에서, 이펙터 모이어티는 CRISPR/Cas 분자, TAL 이펙터 분자, Zn 핑거 분자, tetR 도메인, 또는 메가뉴클레아제를 포함한다. 일부 구현예에서, 이펙터 모이어티는 유전적 변형 기능성, 예를 들어 본 명세서에 기재된 방법에서 유전적 변형을 할 수 있는 엔도뉴클레아제 활성을 갖는 CRISPR/Cas 분자, TAL 이펙터 분자, Zn 핑거 분자를 갖는다.
일부 구현예에서, 이펙터 모이어티는 히스톤 변형 기능성, 예를 들어 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 또는 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 히스톤 메틸트랜스퍼라제 기능성은 H3K9 표적화 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 히스톤 메틸트랜스퍼라제 기능성은 H3K56 표적화 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 히스톤 메틸트랜스퍼라제 기능성은 H3K27 표적화 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 히스톤 메틸트랜스퍼라제 또는 데메틸라제 기능성은 1개, 2개, 또는 3개의 메틸 기를 전달한다. 일부 구현예에서, 히스톤 데메틸라제 기능성은 H3K4 표적화 데메틸라제 활성을 포함한다. 일부 구현예에서, 이펙터 모이어티는 SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편, 예를 들어 이들 중 임의의 것의 SET 도메인으로부터 선택되는 단백질을 포함한다. 일부 구현예에서, 이펙터 모이어티는 KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함한다. 일부 구현예에서, 이펙터 모이어티는 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함한다. 일부 구현예에서, 이펙터 모이어티는 DNA 변형 기능성, 예를 들어 DNA 메틸트랜스퍼라제를 포함한다. 일부 구현예에서, 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함한다.
일부 구현예에서, 이펙터 모이어티는 전사 리프레서를 포함한다. 일부 구현예에서, 전사 리프레서는 전사, 예를 들어 표적 유전자의 전사를 자극하거나 촉진하는 인자의 동원을 차단한다. 일부 구현예에서, 전사 리프레서는 전사, 예를 들어 표적 유전자의 전사를 억제하는 인자를 동원한다. 일부 구현예에서, 이펙터 모이어티, 예를 들어 전사 리프레서는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질이거나 이를 포함한다.
일부 구현예에서, 이펙터 모이어티는 본 명세서에 기재된 기능성을 갖는 단백질을 포함한다. 일부 구현예에서, 이펙터 모이어티는 하기로부터 선택되는 단백질을 포함한다:
KRAB(예를 들어, NP_056209.2에 따른 것 또는 NM_015394.5에 의해 인코딩된 단백질);
SET 도메인(예를 들어, 하기의 SET 도메인:
SETDB1(예를 들어, NP_001353347.1에 따른 것 또는 NM_001366418.1에 의해 인코딩된 단백질);
EZH2(예를 들어, NP-004447.2 또는 NP_001190176.1에 따른 것 또는 NM_004456.5 또는 NM_001203247.2에 의해 인코딩된 단백질);
G9A(예를 들어, NP_001350618.1에 따른 것 또는 NM_001363689.1에 의해 인코딩된 단백질); 또는
SUV39H1(예를 들어, NP_003164.1에 따른 것 또는 NM_003173.4에 의해 인코딩된 단백질));
히스톤 데메틸라제 LSD1(예를 들어, NP_055828.2에 따른 것 또는 NM_015013.4에 의해 인코딩된 단백질);
FOG1(예를 들어, FOG1의 N-말단 잔기)(예를 들어, NP_722520.2에 따른 것 또는 NM_153813.3에 의해 인코딩된 단백질); 또는
KAP1(예를 들어, NP_005753.1에 따른 것 또는 NM_005762.3에 의해 인코딩된 단백질);
이들 중 임의의 것의 기능성 단편 또는 변이체, 또는
상기 언급된 임의의 서열과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 서열을 갖는 폴리펩티드. 일부 구현예에서, 이펙터 모이어티는 하기로부터 선택되는 단백질을 포함한다:
DNMT3A(예를 들어, 인간 DNMT3A)(예를 들어, NP_072046.2에 따른 것
또는 NM_022552.4에 의해 인코딩된 단백질);
DNMT3B(예를 들어, NP_008823.1에 따른 것
또는 NM_006892.4에 의해 인코딩된 단백질);
DNMT3L(예를 들어, NP_787063.1에 따른 것
또는 NM_175867.3에 의해 인코딩된 단백질);
DNMT3A/3L 복합체,
박테리아 MQ1(예를 들어, 균주 ATCC 33825로부터 얻은 CAA35058.1 또는 Uniprot ID P15840.3에 따른 것);
이들 중 임의의 것의 기능성 단편, 또는
상기 언급된 임의의 서열과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 서열을 갖는 폴리펩티드. 일부 구현예에서, 이펙터 모이어티는 성숙한 박테리아 MQ1(예를 들어, 균주 ATCC 33825로부터 얻은 CAA35058.1 또는 Uniprot ID P15840.3에 따른 것)을 포함한다.
예시적인 이펙터 모이어티는 하기를 포함할 수 있지만 이로 한정되지 않는다: 유비퀴틴, 유비퀴틴 리가제 억제제로서의 바이사이클릭 펩티드, 전사 인자, DNA 및 단백질 변형 효소, 예컨대 토포이소머라제, 토포이소머라제 억제제, 예컨대 토포테칸, DNA 메틸트랜스퍼라제, 예컨대 DNMT 패밀리(예를 들어, DNMT3A, DNMT3B, DNMT3L), 단백질 메틸트랜스퍼라제(예를 들어, 바이러스 라이신 메틸트랜스퍼라제(vSET), 단백질-라이신 N-메틸트랜스퍼라제(SMYD2), 데아미나제(예를 들어, APOBEC, UG1), 히스톤 메틸트랜스퍼라제, 예컨대 제스트 인핸서 상동체 2(enhancer of zeste homolog 2, EZH2), PRMT1, 히스톤-라이신-N-메틸트랜스퍼라제(Setdb1), 히스톤 메틸트랜스퍼라제(SET2), 진정 염색질(euchromatic) 히스톤-라이신 N-메틸트랜스퍼라제 2(G9a), 히스톤-라이신 N-메틸트랜스퍼라제(SUV39H1), 및 G9a), 히스톤 데아세틸라제(예를 들어, HDAC1, HDAC2, HDAC3), DNA 탈메틸화에서 역할을 갖는 효소(예를 들어, TET 패밀리 효소는 5-메틸시토신의 5-하이드록시메틸시토신 및 더 고차의 산화적 유도체로의 산화를 촉매함), 단백질 데메틸라제, 예컨대 KDM1A 및 라이신-특이적 히스톤 데메틸라제 1(LSD1), 헬리카제, 예컨대 DHX9, 데아세틸라제(예를 들어, 시르투인(sirtuin) 1, 2, 3, 4, 5, 6, 또는 7), 키나제, 포스파타제, DNA 삽입제, 예컨대 에티듐 브로마이드, SYBR 그린, 및 프로플라빈, 유출 펌프(efflux pump) 억제제, 예컨대 페닐알라닌 아르기닐 β-나프틸아미드 또는 퀴놀린 유도체와 같은 펩티드모방체, 핵 수용체 활성화제 및 억제제, 프로테아좀 억제제, 리소좀 저장 질환에 관여하는 것들과 같은 효소에 대한 경쟁적 억제제, 단백질 합성 억제제, 뉴클레아제(예를 들어, Cpf1, Cas9, 징크 핑거 뉴클레아제), 이들 중 하나 이상의 융합체(예를 들어, dCas9-DNMT, dCas9-APOBEC, dCas9-UG1), 및 단백질 유래 특정 도메인, 예컨대 KRAB 도메인.
일부 구현예에서, 당업자에게 알려진 방법에 의해 이펙터 모이어티로서 사용하기에 적합한 것으로 후보 도메인이 결정될 수 있다. 예를 들어, 후보 이펙터 모이어티가 세포의 핵 내에 존재하고, (예를 들어, 표적 유전자 또는 상기 표적 유전자에 작동가능하게 연결된 전사 제어 요소에, 예를 들어 표적화 모이어티를 통해) 적절하게 국재화될 때, 후보 이펙터 모이어티가 세포 내의 표적 유전자의 발현을 감소시키는지, 예를 들어 표적 유전자에 의해 인코딩된 RNA 전사체의 수준을 감소시키는지(예를 들어, RNASeq 또는 노던 블롯(Northern blot)에 의해 측정되는 바와 같음), 또는 표적 유전자에 의해 인코딩된 단백질의 수준을 감소시키는지(예를 들어, ELISA에 의해 측정되는 바와 같음)의 여부를 검정함으로써 후보 이펙터 모이어티가 시험될 수 있다.
일부 구현예에서, 부위-특이적 파괴제는 이펙터 모이어티의 또 다른 카피에 결합하지 않는(예를 들어, 검출가능하게 결합하지 않는) 이펙터 모이어티를 포함하고, 예를 들어, 이펙터 모이어티는 단량체성이며 다량체로 회합하지 않는다. 일부 구현예에서, 부위-특이적 파괴제는 이펙터 모이어티의 추가 카피와 다량체, 예를 들어 이량체, 삼량체, 사량체 또는 그 이상으로 회합하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 복수의 이펙터 모이어티를 포함하며, 여기서 각 이펙터 모이어티는 또 다른 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 본 명세서에 기재된 조성물 및 방법에 사용하기 위한 이펙터 모이어티는 단량체성 상태, 예를 들어 비이량체성 상태에서 기능성이다.
일부 구현예에서, 이펙터 모이어티는 후성유전학적 변형 모이어티, 예를 들어 염색질의 2차원 구조를 조절하는(즉, 염색질의 2차원 표현을 변경시키는 방식으로 염색질의 구조를 조절하는) 후성유전학적 변형 모이어티를 포함한다.
본 개시내용의 방법 및 조성물에 유용한 후성유전학적 변형 모이어티는 후성유전학적 마커, 예를 들어 DNA 메틸화, 히스톤 메틸화, 히스톤 아세틸화, 히스톤 수모일화(sumoylation), 히스톤 인산화, 및 RNA-연관 침묵에 영향을 주는 작용제를 포함한다. 본 명세서에 기재된 바와 같은 게놈 서열 요소에 표적화될 수 있는 예시적인 후성유전학적 효소는 DNA 메틸라제(예를 들어, DNMT3a, DNMT3b, DNMTL, MQ1), DNA 탈메틸화(예를 들어, TET 패밀리), 히스톤 메틸트랜스퍼라제, 히스톤 데아세틸라제(예를 들어, HDAC1, HDAC2, HDAC3), 시르투인 1, 2, 3, 4, 5, 6, 또는 7, 라이신-특이적 히스톤 데메틸라제 1(LSD1), 히스톤-라이신-N-메틸트랜스퍼라제(Setdb1), 진정 염색질 히스톤-라이신 N-메틸트랜스퍼라제 2(G9a), 히스톤-라이신 N-메틸트랜스퍼라제(SUV39H1), 제스트 인핸서 상동체 2(EZH2), 바이러스 라이신 메틸트랜스퍼라제(vSET), 히스톤 메틸트랜스퍼라제(SET2), 및 단백질-라이신 N-메틸트랜스퍼라제(SMYD2)를 포함한다. 그러한 후성유전학적 변형제의 예는, 예를 들어 문헌[de Groote et al. Nuc. Acids Res. (2012):1-18]에 기재되어 있다.
일부 구현예에서, 부위-특이적 파괴제, 예를 들어 본 발명에 유용한 후성유전학적 변형 모이어티를 포함하는 부위-특이적 파괴제는, 본 명세서에 참고로 포함되는 문헌[Koferle et al. Genome Medicine 7.59 (2015):1-3]에 기재된 작제물이거나 이를 포함한다. 예를 들어, 일부 구현예에서, 부위-특이적 파괴제는 문헌[Koferle et al.]의 표 1에서 확인되는 작제물, 예를 들어 표 1에 기재된 히스톤 데아세틸라제, 히스톤 메틸트랜스퍼라제, DNA 탈메틸화, 또는 H3K4 및/또는 H3K9 히스톤 데메틸라제(예를 들어, dCas9-p300, TALE-TET1, ZF-DNMT3A, 또는 TALE-LSD1)이거나 이를 포함한다.
추가적인 모이어티
부위-특이적 파괴제는 (예를 들어, 하나 이상의 표적화 모이어티 및 하나 이상의 이펙터 모이어티에 추가하여) 하나 이상의 추가적인 모이어티를 추가로 포함할 수 있다. 일부 구현예에서, 추가적인 모이어티는 태깅 또는 모니터링 모이어티, 절단성 모이어티(예를 들어, 표적화 모이어티와 이펙터 모이어티 사이에 위치하거나, 폴리펩티드의 N- 또는 C-말단 단부에 위치한 절단성 모이어티), 소분자, 막 전좌 폴리펩티드, 또는 약제 모이어티로부터 선택된다.
예시적인 부위-특이적 파괴제
하기의 예시적인 부위-특이적 파괴제는 단지 예시 목적으로 제시되며, 제한적인 것으로 의도되지 않는다.
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티(예를 들어, dCas9, 예를 들어 S. 아우레우스 dCas9를 포함함), 및 MQ1, 예를 들어 박테리아 MQ1을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 201의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 플라스미드), 및/또는 서열번호 202의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 핵산(예를 들어, mRNA)), 부위-특이적 파괴제를 인코딩하는 핵산)에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 201 또는 202의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다. 일부 구현예에서, 표적화 모이어티는 서열번호 9의 핵산 서열에 의해 인코딩되고/되거나, 이펙터 모이어티는 서열번호 10의 핵산 서열에 의해 인코딩된다.
Sa-dCas9-MQ1(PL-27695) 플라스미드 DNA 서열:
Sa-dCas9-MQ1(MR-28126) 발현된 mRNA 서열:
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티(예를 들어, dCas9, 예를 들어 S. 피오게네스 dCas9 또는 이의 기능성 변이체 또는 돌연변이체; 예를 들어 Cas9m4를 포함함), 및 MQ1, 예를 들어 박테리아 MQ1을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 207의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 핵산(예를 들어, mRNA))에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 207의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다. 일부 구현예에서, 표적화 모이어티는 서열번호 8의 핵산 서열에 의해 인코딩되고/되거나, 이펙터 모이어티는 서열번호 10의 핵산 서열에 의해 인코딩된다.
dCas9-MQ1 mRNA 서열(MR28125)
일부 구현예에서, 부위-특이적 파괴제는 서열번호 203, 208, 73 또는 74의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제는 서열번호 203, 208, 73 또는 74의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
Sa-dCas9-MQ1 단백질 서열:
dCas9-MQ1 단백질 서열(MR-28125에 상응함):
HA 태그를 갖지 않는 Sa-dCas9-MQ1
HA 태그를 갖지 않는 dCas9-MQ1
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티(예를 들어, dCas9, 예를 들어 S. 피오게네스 dCas9를 포함함), 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 204의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 플라스미드), 및/또는 서열번호 205의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 핵산(예를 들어, mRNA))에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 204 또는 205의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다. 일부 구현예에서, 표적화 모이어티는 서열번호 8의 핵산 서열에 의해 인코딩되고, 이펙터 모이어티는 서열번호 14의 핵산 서열에 의해 인코딩된다.
Sp-dCas9-KRAB(PL-27687) 플라스미드 DNA 서열:
Sp-dCas9-KRAB(MR-28122) 발현된 mRNA 서열:
일부 구현예에서, 부위-특이적 파괴제는 서열번호 206 또는 75의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 206 또는 75의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
Sp-dCas9-KRAB 단백질 서열:
HA 태그를 갖지 않는 Sp-dCas9-KRAB 단백질 서열:
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티(예를 들어, dCas9, 예를 들어 S. 아우레우스 dCas9를 포함함), 및 EZH2를 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 dCas9, 예를 들어 S. 피오게네스 dCas9, 예를 들어 돌연변이체 S. 피오게네스 Cas9, 예를 들어 Cas9m4를 포함하는 표적화 모이어티 및 EZH2를 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 209의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 mRNA)에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 209의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다. 일부 구현예에서, 표적화 모이어티는 서열번호 8의 핵산 서열에 의해 인코딩되고/되거나, 이펙터 모이어티는 서열번호 18의 핵산 서열에 의해 인코딩된다.
EZH2-dCas9 mRNA(MR28938)
일부 구현예에서, 부위-특이적 파괴제는 서열번호 210 또는 76의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 210 또는 76의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
EZH2-dCas9 단백질 서열(MR-28938에 상응함)
HA 태그를 갖지 않는 EZH2-dCas9
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티(예를 들어, dCas9, 예를 들어 S. 아우레우스 dCas9를 포함함), 및 DNMT3(예를 들어, DNMT3a/3L)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 dCas9, 예를 들어 S. 피오게네스 dCas9, 예를 들어 돌연변이체 S. 피오게네스 Cas9, 예를 들어 Cas9m4를 포함하는 표적화 모이어티 및 DNMT3(예를 들어, DNMT3a/3L)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 211의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 mRNA)에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 211의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
dCas9-DNMT3a/3L mRNA(MR-29414)
일부 구현예에서, 부위-특이적 파괴제는 서열번호 211 또는 77의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 작제물은 서열번호 211 또는 77의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
dCas9-DNMT3a/3L 단백질 서열(MR-29414에 상응함)
HA 태그를 갖지 않는 dCas-DNMT3a/3L(h)
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티(예를 들어, dCas9, 예를 들어 S. 아우레우스 dCas9를 포함함), 및 HDAC8, 예를 들어 HDAC8 도메인을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 dCas9, 예를 들어 S. 피오게네스 dCas9, 예를 들어 돌연변이체 S. 피오게네스 Cas9, 예를 들어 Cas9m4를 포함하는 표적화 모이어티, 및 HDAC8, 예를 들어 HDAC8 도메인을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 213의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 mRNA)에 의해 인코딩된다.
일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 213의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
dCas9-HDAC8 mRNA(MR-29439)
일부 구현예에서, 부위-특이적 파괴제는 서열번호 214 또는 78의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제는 서열번호 214 또는 78의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
dCas9-HDAC8 단백질 서열(MR 29439에 상응함)
HA 태그를 갖지 않는 dCas9-HDAC8
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티(예를 들어, dCas9, 예를 들어 S. 아우레우스 dCas9를 포함함), EZH2; 예를 들어 EZH2 도메인을 포함하는 제1 이펙터 모이어티, 및 HDAC8, 예를 들어 HDAC8 도메인을 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 dCas9, 예를 들어 S. 피오게네스 dCas9, 예를 들어 돌연변이체 S. 피오게네스 Cas9, 예를 들어 Cas9m4를 포함하는 표적화 모이어티; EZH2, 예를 들어 EZH2 도메인을 포함하는 제1 이펙터 모이어티; 및 HDAC8, 예를 들어 HDAC8 도메인을 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 215의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 mRNA)에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 215의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
EZH2-dCas9-HDAC8 mRNA(MR-29447)
일부 구현예에서, 부위-특이적 파괴제는 서열번호 216 또는 79의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제는 서열번호 216 또는 79의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
EZH2-dCas9-HDAC8 단백질 서열(MR-29447에 상응함)
EZH2-dCas9-HDAC8 단백질 서열(MR-29447에 상응함)
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티(예를 들어, dCas9, 예를 들어 S. 아우레우스 dCas9를 포함함), G9A; 예를 들어 G9A 도메인을 포함하는 제1 이펙터 모이어티, 및 EZH2, 예를 들어 EZH2 도메인을 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 dCas9, 예를 들어 S. 피오게네스 dCas9, 예를 들어 돌연변이체 S. 피오게네스 Cas9, 예를 들어 Cas9m4를 포함하는 표적화 모이어티; G9A, 예를 들어 G9A 도메인을 포함하는 제1 이펙터 모이어티; 및 EZH2, 예를 들어 EZH2 도메인을 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 69의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 mRNA)에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 69의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
G9A-dCas9-EZH2(MR-29441) mRNA 서열
일부 구현예에서, 부위-특이적 파괴제는 서열번호 70 또는 80의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제는 서열번호 70 또는 80의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
G9A-dCas9-EZH2 단백질
HA 태그를 갖지 않는 G9A-dCas9-EZH2 단백질
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티(예를 들어, dCas9, 예를 들어 S. 아우레우스 dCas9를 포함함), G9A; 예를 들어 G9A 도메인을 포함하는 제1 이펙터 모이어티, 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 dCas9, 예를 들어 S. 피오게네스 dCas9, 예를 들어 돌연변이체 S. 피오게네스 Cas9, 예를 들어 Cas9m4를 포함하는 표적화 모이어티; G9A, 예를 들어 G9A 도메인을 포함하는 제1 이펙터 모이어티; 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 71의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 mRNA)에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 71의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
G9A-dCas9-KRAB(MR-29942) mRNA 서열
일부 구현예에서, 부위-특이적 파괴제는 서열번호 72 또는 81의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제는 서열번호 72 또는 81의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
G9A-dCas9-KRAB 단백질
HA 태그를 갖지 않는 G9A-dCas9-KRAB 단백질
일부 구현예에서, 부위-특이적 파괴제는 표적화 모이어티(예를 들어, dCas9, 예를 들어 S. 아우레우스 dCas9를 포함함), EZH2; 예를 들어 EZH2 도메인을 포함하는 제1 이펙터 모이어티, 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 dCas9, 예를 들어 S. 피오게네스 dCas9, 예를 들어 돌연변이체 S. 피오게네스 Cas9, 예를 들어 Cas9m4를 포함하는 표적화 모이어티; EZH2, 예를 들어 EZH2 도메인을 포함하는 제1 이펙터 모이어티; 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 85의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 mRNA)에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 85의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
EZH2-dCas9-KRAB(MR-29948) mRNA 서열
일부 구현예에서, 부위-특이적 파괴제는 서열번호 86 또는 82의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제는 서열번호 86 또는 82의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
EZH2-dCas9-KRAB 단백질
HA 태그를 갖지 않는 EZH2 -dCas9-KRAB 단백질
일부 구현예에서, 부위-특이적 파괴제는 Cas9를 포함하는 CRISPR/Cas 분자를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 217의 핵산 서열(예를 들어, 부위-특이적 파괴제를 인코딩하는 mRNA)에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 217의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
Cas9 mRNA(MR-28127)
일부 구현예에서, 부위-특이적 파괴제는 서열번호 218 또는 84의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제는 서열번호 218 또는 84의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함한다.
Cas9 단백질 서열(MR-28127에 상응함)
HA 태그를 갖지 않는 Cas9 단백질 서열(MR-28127에 상응함)
일부 구현예에서, 부위-특이적 파괴제는 핵 국재화 서열(nuclear localization sequence; NLS)을 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 NLS, 예를 들어 N-말단에 있는 SV40 NLS를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 NLS, 예를 들어 C-말단에 있는 SV40 NLS를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 NLS, 예를 들어 C-말단에 있는 뉴클레오플라스민 NLS를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 N-말단에 있는 제1 NLS 및 C-말단에 있는 제2 NLS를 포함한다. 일부 구현예에서, 제1 NLS와 제2 NLS는 동일한 서열을 갖는다. 일부 구현예에서, 제1 NLS와 제2 NLS는 상이한 서열을 갖는다. 일부 구현예에서, 부위-특이적 파괴제는 N-말단에 있는 제1 NLS, C-말단에 있는 제2 NLS 및 제3 NLS를 포함한다. 일부 구현예에서, 적어도 2개의 NLS는 동일한 서열을 갖는다. 일부 구현예에서, 제1 NLS와 제2 NLS는 동일한 서열을 갖고, 제3 NLS는 제1 NLS 및 제2 NLS와 상이한 서열을 갖는다. 일부 구현예에서, 부위-특이적 파괴제는 SV40 NLS를 포함하며, 예를 들어 부위-특이적 파괴제는 PKKKRK(서열번호 63)에 따른 서열을 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 뉴클레오플라스민 NLS을 포함하며, 예를 들어 부위-특이적 파괴제는 KRPAATKKAGQAKKK(서열번호 64)의 서열을 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 뉴클레오플라스민 핵 국재화 서열 및 HA-태그 중 하나 이상, 예를 들어 이들 중 어느 하나 또는 둘 모두를 포함하는 C-말단 서열을 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 에피토프 태그, 예를 들어 HA 태그: YPYDVPDYA(서열번호 65)를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 에피토프 태그의 2개의 카피를 포함할 수 있다.
에피토프 태그가 많은 연구 상황에서 유용하지만, 치료적 상황에서는 에피토프 태그를 생략하는 것이 때때로 바람직하다. 따라서, 일부 구현예에서, 부위-특이적 파괴제는 에피토프 태그가 결여되어 있다. 일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제는 본 명세서에 제공된 서열(또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열)을 포함하지만, 서열번호 65의 HA 태그가 결여되어 있다. 일부 구현예에서, 본 명세서에 기재된 핵산은 본 명세서에 제공된 서열(또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열)을 포함하지만, 서열번호 65의 HA 태그를 인코딩하는 영역이 결여되어 있다. 일부 구현예에서, 부위-특이적 파괴제는 NLS를 포함하지 않는다. 일부 구현예에서, 부위-특이적 파괴제는 에피토프 태그를 포함하지 않는다. 일부 구현예에서, 부위-특이적 파괴제는 HA 태그를 포함하지 않는다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 65에 따른 HA 태그를 포함하지 않는다.
일부 구현예에서, 부위-특이적 파괴제는 Zn 핑거 분자를 포함하는 표적화 모이어티 및 EZH2 또는 이의 기능성 단편 또는 변이체를 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 219, 220, 222, 223, 233, 또는 234의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열에 의해 인코딩된다.
일부 구현예에서, 부위-특이적 파괴제는 Zn 핑거 분자를 포함하는 표적화 모이어티 및 DNMT3(예를 들어, DNMT3a 또는 DNMT3L) 또는 이의 기능성 단편 또는 변이체를 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 221, 231, 또는 236 내지 239의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열에 의해 인코딩된다.
일부 구현예에서, 부위-특이적 파괴제는 Zn 핑거 분자를 포함하는 표적화 모이어티 및 G9A 또는 이의 기능성 단편 또는 변이체를 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 224, 225, 또는 227 내지 230의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열에 의해 인코딩된다.
일부 구현예에서, 부위-특이적 파괴제는 Zn 핑거 분자를 포함하는 표적화 모이어티 및 HDAC8 또는 이의 기능성 단편 또는 변이체를 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 부위-특이적 파괴제는 서열번호 226, 232, 235, 또는 240 내지 242의 핵산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열에 의해 인코딩된다.
일부 구현예에서, 본 명세서에 기재된 방법 또는 조성물에 사용하기 위한 핵산(예를 들어, 부위-특이적 파괴제를 인코딩하는 핵산)은 서열번호 69, 71, 85, 201, 202, 204, 205, 207, 209, 211, 213, 215, 217, 또는 219 내지 242 중 어느 하나의 핵산 서열, 또는 이들 중 임의의 것의 상보적 또는 역상보적 서열을 포함하거나, 이들 중 임의의 것과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 방법 또는 조성물에 사용하기 위한 부위-특이적 파괴제는 서열번호 70, 72 내지 82, 84, 86, 203, 206, 208, 210, 212, 214, 216, 또는 218 중 어느 하나의 핵산 서열을 포함하거나, 이들 중 임의의 것과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 방법 또는 조성물에 사용하기 위한 부위-특이적 파괴제는 서열번호 69, 71, 85, 201, 202, 204, 205, 207, 209, 211, 213, 215, 217, 또는 219 내지 242 중 임의의 것에 의해 인코딩되는 아미노산 서열, 또는 이들 중 임의의 것과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 아미노산 서열을 포함한다.
기능적 특성
본 개시내용의 부위-특이적 파괴제 또는 시스템은 세포 내의 복수의 표적 유전자의 발현을 조절하는 데, 예를 들어 감소시키는 데 사용될 수 있다. 일부 구현예에서, 발현의 조절은 복수의 표적 유전자의 각각에 의해 인코딩되는 RNA, 예를 들어 mRNA의 수준의 감소를 포함한다. 일부 구현예에서, 발현의 조절은 복수의 표적 유전자의 각각에 의해 인코딩되는 단백질의 수준의 감소를 포함한다. 일부 구현예에서, 발현의 조절은 복수의 표적 유전자의 각각에 의해 인코딩되는 mRNA 및 단백질의 수준 둘 모두의 감소를 포함한다. 일부 구현예에서, 부위-특이적 파괴제에 의해 접촉되거나 이를 포함하는 세포 내의 복수의 표적 유전자 중 유전자의 발현은 부위-특이적 파괴제 또는 시스템에 의해 접촉되지 않거나 이를 포함하지 않는 세포 내의 유전자의 발현 수준보다 적어도 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.55×, 1.6×, 1.65×, 1.7×, 1.75×, 1.8×, 1.85×, 1.9×, 1.95×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 30×, 40×, 50×, 60×, 70×, 80×, 90×, 또는 100× 더 낮다. 일부 구현예에서, 부위-특이적 파괴제 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 복수의 표적 유전자의 각 유전자의 발현은 부위-특이적 파괴제 또는 시스템에 의해 접촉되지 않거나 이를 포함하지 않는 세포 내의 유전자의 발현 수준보다 적어도 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.55×, 1.6×, 1.65×, 1.7×, 1.75×, 1.8×, 1.85×, 1.9×, 1.95×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 30×, 40×, 50×, 60×, 70×, 80×, 90×, 또는 100× 더 낮다. 유전자의 발현은 RT-PCR, ELISA, 웨스턴 블롯을 포함한 당업자에게 알려진 방법, 및 실시예 2 또는 4 내지 19의 방법에 의해 검정될 수 있다.
본 개시내용의 부위-특이적 파괴제 또는 시스템은 앵커 서열에 대한 핵형성 폴리펩티드, 예를 들어 CTCF의 결합을 감소시키는 데 사용될 수 있다. 일부 구현예에서, 세포를 부위-특이적 파괴제 또는 시스템과 접촉시키는 것 또는 부위-특이적 파괴제 또는 시스템을 투여하는 것은 앵커 서열(예를 들어, 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열)에 대한 핵형성 폴리펩티드, 예를 들어 CTCF의 결합의 감소를 초래한다. 일부 구현예에서, 세포를 부위-특이적 파괴제 또는 시스템과 접촉시키는 것 또는 부위-특이적 파괴제 또는 시스템을 투여하는 것은, 예를 들어 ChIP 및/또는 정량적 PCR에 의해 측정될 때, 부위-특이적 파괴제 또는 시스템으로 처리하기 전 또는 부위-특이적 파괴제 또는 시스템의 부재 하의 앵커 서열에 대한 핵형성 폴리펩티드(예를 들어, CTCF)의 결합과 대비하여 결합의 완전한 손실 또는 적어도 50, 60, 70, 80, 90, 95, 또는 99%의 감소를 초래한다.
본 개시내용의 부위-특이적 파괴제 또는 시스템은 복수의 표적 세포를 포함하는 게놈 복합체(예를 들어, ASMC)를 파괴하는 데 사용될 수 있다. 일부 구현예에서, 세포를 부위-특이적 파괴제 또는 시스템과 접촉시키는 것 또는 부위-특이적 파괴제 또는 시스템을 투여하는 것은 부위-특이적 파괴제 또는 시스템으로 처리하기 전 또는 부위-특이적 파괴제 또는 시스템의 부재 하의 복합체의 수준과 대비하여 복수의 표적 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 수준의 감소를 초래한다. 일부 구현예에서, 세포를 부위-특이적 파괴제 또는 시스템과 접촉시키는 것 또는 부위-특이적 파괴제 또는 시스템을 투여하는 것은, 예를 들어 ChIA-PET, ELISA(예를 들어, 유전자 발현 변화를 평가하기 위함), CUT&RUN, ATAC-SEQ, ChIP 및/또는 정량적 PCR에 의해 측정될 때, 부위-특이적 파괴제 또는 시스템으로 처리하기 전 또는 부위-특이적 파괴제 또는 시스템의 부재 하의 복합체의 수준과 대비하여 게놈 복합체, 예를 들어 ASMC의 완전한 손실, 또는 적어도 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 95, 또는 99%의 감소를 초래한다.
본 개시내용의 부위-특이적 파괴제 또는 시스템은 일정 기간 동안 세포 내의 복수의 표적 유전자의 발현을 조절하는 데, 예를 들어 감소시키는 데 사용될 수 있다. 일부 구현예에서, 부위-특이적 파괴제 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 복수의 표적 유전자 중 유전자의 발현은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 상당히 감소된다. 일부 구현예에서, 부위-특이적 파괴제 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 복수의 표적 유전자의 각 유전자의 발현은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 상당히 감소된다. 선택적으로, 부위-특이적 파괴제 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 복수의 표적 유전자 중 유전자의 발현은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하 동안 상당히 감소된다. 선택적으로, 부위-특이적 파괴제 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 복수의 표적 유전자의 각 유전자의 발현은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하 동안 상당히 감소된다.
부위-특이적 파괴제 또는 시스템은 복수의 이펙터 모이어티를 포함할 수 있으며, 각 이펙터 모이어티는 서로 다른 이펙터 모이어티와 상이한 기능성을 갖는다. 예를 들어, 부위-특이적 파괴제 또는 시스템은 히스톤 데아세틸라제 기능성을 포함하는 제1 이펙터 모이어티 및 DNA 메틸트랜스퍼라제 기능성을 포함하는 제2 이펙터 모이어티를 포함할 수 있다. 일부 구현예에서, 부위-특이적 파괴제는 복수의 표적 유전자의 발현의 조절, 예를 들어 감소에 대해 서로 상보적인 기능성을 갖는 이펙터 모이어티의 조합을 포함하며, 예를 들어 이들 기능성은 함께 발현을 감소시키고, 선택적으로, 개별적으로 존재할 때에는 발현을 감소시키지 않거나 무시할 만한 정도로 감소시킨다.
일부 구현예에서, 부위-특이적 파괴제 또는 시스템은 복수의 표적 유전자의 발현의 조절, 예를 들어 감소에 대해 서로 상승작용하는 기능성을 갖는 이펙터 모이어티의 조합을 포함한다. 이론에 의해 구애되고자 함이 없이, 다수의 억제 후성유전학적 마커(예를 들어, 다수의 상이한 유형의 후성유전학적 마커 및/또는 주어진 유형의 더 광범위한 마킹)가 단독으로의 개별적인 변형보다 더 효과적으로 발현을 함께 감소시킨다는 점에서(예를 들어, 발현의 더 큰 감소의 생성 및/또는 발현의 더 오래 지속된 감소), 게놈 유전자좌에 대한 후성유전학적 변형은 누적되는 것으로 생각된다. 일부 구현예에서, 부위-특이적 파괴제 또는 시스템은 서로 상승작용하는 복수의 이펙터 모이어티를 포함하며, 예를 들어 각 이펙터 모이어티는 표적 유전자의 발현을 감소시킨다. 일부 구현예에서, 서로 상승작용하는 복수의 상이한 이펙터 모이어티를 포함하는 부위-특이적 파괴제는 복수의 상이한 이펙터 모이어티 중 단지 하나만 또는 이펙터 모이어티의 비-상승적 조합을 포함하는 부위-특이적 파괴제보다 복수의 표적 유전자의 발현을 조절하는 데, 예를 들어 감소시키는 데 더 효과적이다. 일부 구현예에서, 그러한 부위-특이적 파괴제는 복수의 상이한 이펙터 모이어티 중 단지 하나만 또는 이펙터 모이어티의 비-상승적 조합을 포함하는 부위-특이적 파괴제 또는 시스템보다 복수의 표적 유전자의 발현을 조절하는, 예를 들어 감소시키는 데 적어도 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.55×, 1.6×, 1.65×, 1.7×, 1.75×, 1.8×, 1.85×, 1.9×, 1.95×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 30×, 40×, 50×, 60×, 70×, 80×, 90×, 또는 100× 효과적이다.
표적 부위
본 명세서에 개시된 부위-특이적 파괴제 또는 시스템은 세포, 예를 들어 대상체 또는 환자의 세포 내의 복수의 표적 유전자의 발현을 조절하는 데, 예를 들어 감소시키는 데 유용하다. 복수의 표적 유전자는 당업자에게 알려진 임의의 유전자를 포함할 수 있다. 복수의 표적 유전자는 적어도 2개의 유전자를 포함한다. 일부 구현예에서, 표적화된 복수의 유전자는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 유전자(및 선택적으로 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 30개 이하의 유전자), 예를 들어 제1 유전자 및 제2 유전자, 그리고 선택적으로 제3 유전자, 제4 유전자, 제5 유전자, 제6 유전자, 제7 유전자, 제8 유전자, 제9 유전자, 제10 유전자, 제11 유전자, 제12 유전자, 제13 유전자, 제14 유전자, 제15 유전자, 제16 유전자, 제17 유전자, 제18 유전자, 제19 유전자, 및/또는 제20 유전자를 포함한다. 일부 구현예에서, 표적화된 복수의 유전자는 2 내지 20개, 2 내지 18개, 2 내지 16개, 2 내지 14개, 2 내지 12개, 2 내지 10개, 2 내지 9개, 2 내지 8개, 2 내지 7개, 2 내지 6개, 2 내지 5개, 2 내지 4개, 2 내지 3개, 3 내지 20개, 3 내지 18개, 3 내지 16개, 3 내지 14개, 3 내지 12개, 3 내지 10개, 3 내지 9개, 3 내지 8개, 3 내지 7개, 3 내지 6개, 3 내지 5개, 3 내지 4개, 4 내지 20개, 4 내지 18개, 4 내지 16개, 4 내지 14개, 4 내지 12개, 4 내지 10개, 4 내지 9개, 4 내지 8개, 4 내지 7개, 4 내지 6개, 4 내지 5개, 5 내지 20개, 5 내지 18개, 5 내지 16개, 5 내지 14개, 5 내지 12개, 5 내지 10개, 5 내지 9개, 5 내지 8개, 5 내지 7개, 5 내지 6개, 6 내지 20개, 6 내지 18개, 6 내지 16개, 6 내지 14개, 6 내지 12개, 6 내지 10개, 6 내지 9개, 6 내지 8개, 6 내지 7개, 7 내지 20개, 7 내지 18개, 7 내지 16개, 7 내지 14개, 7 내지 12개, 7 내지 10개, 7 내지 9개, 7 내지 8개, 8 내지 20개, 8 내지 18개, 8 내지 16개, 8 내지 14개, 8 내지 12개, 8 내지 10개, 8 내지 9개, 9 내지 20개, 9 내지 18개, 9 내지 16개, 9 내지 14개, 9 내지 12개, 9 내지 10개, 10 내지 20개, 10 내지 18개, 10 내지 16개, 10 내지 14개, 10 내지 12개, 12 내지 20개, 12 내지 18개, 12 내지 16개, 12 내지 14개, 14 내지 20개, 14 내지 18개, 14 내지 16개, 16 내지 20개, 16 내지 18개, 또는 18 내지 20개의 유전자를 포함한다.
일부 구현예에서, 복수의 표적 유전자 중 2개 이상(예를 들어, 모두)의 유전자는 대상체, 예를 들어 포유동물, 예를 들어 인간, 소, 말, 양, 닭, 래트, 마우스, 고양이, 또는 개에서 질환 또는 병태와 연관된다. 일부 구현예에서, 질환 또는 병태는 염증성 질환, 예를 들어 면역 매개 염증성 질환이다. 일부 구현예에서, 질환 또는 병태는 류마티스 관절염, 염증성 관절염, 통풍, 천식, 호중구 천식, 호중구 피부병, 발 부종, 급성 호흡기 질환 증후군(ARDS), COVID-19, 건선, 염증성 장 질환, 감염(예를 들어, 병원균, 예를 들어 박테리아, 바이러스, 또는 진균에 의한 감염), 외상(예를 들어, 찰과상 또는 이물질), 방사선 또는 화학적 손상의 영향, 골관절염, 골관절염 관절 통증, 관절 통증, 염증성 통증, 급성 통증, 만성 통증, 방광염, 기관지염, 피부염, 심혈관계 질환, 신경퇴행성 질환, 간 질환, 폐 질환, 신장 질환, 통증, 종창, 경직, 압통, 발적, 미열, 또는 질환 상태와 관련된 바이오마커(예를 들어, 사이토카인, 면역 수용체, 또는 염증성 마커)의 상승 중 하나 이상이다. 일부 구현예에서, 염증성 장애는, 예를 들어 바이러스, 예를 들어 Sars-Cov-2 바이러스에 의한 감염과 연관된다. 일부 구현예에서, 염증성 장애는 자가면역 장애이다. 일부 구현예에서, 염증성 장애는 저산소증과 연관된다. 일부 구현예에서, 염증성 장애는 ARDS, 저산소증, 및/또는 패혈증과 연관된다. 일부 구현예에서, 감염은, 예를 들어 하나 초과의 병원균, 예를 들어 제1 바이러스 또는 박테리아, 또는 진균, 및 제2 바이러스, 또는 박테리아, 또는 진균에 의해 유발되는 중복 감염이다. 일부 구현예에서, 염증성 장애는 폐 세포 조성, 예를 들어 감소된 AT2 세포 및/또는 증가된 수지상 세포, 대식세포, 호중구 세포, NK 세포, 섬유아세포, 백혈구, 림프 내피 세포 및/또는 혈관 내피 세포를 변화시킬 수 있다. 일부 구현예에서, 장애는 하나 이상의 동반이환, 예를 들어 호흡기 감염, 비만, 위식도 역류 질환, 피부 병변, 및/또는 페쇄성 수면 무호흡증과 연관된다.
일부 구현예에서, 복수의 표적 유전자 중 2개 이상(예를 들어, 모두)의 유전자는 세포, 예를 들어 대상체, 예를 들어 인간 대상체 내의 세포에서 비정상적으로 발현되며, 예를 들어 과발현된다.
일부 구현예에서, 복수의 표적 유전자 중 2개 이상(예를 들어, 모두)의 유전자는 관련된 기능성을 갖는다. 이론에 의해 구애되고자 함이 없이, 관련된 기능성을 갖는 유전자는 종종 게놈에서 서로 근접하게 위치되며 또한 종종 (전체적으로 또는 부분적으로) 공통되는 게놈 복합체, 예를 들어 ASMC 내에서 발견되는 것으로 생각된다. 복수의 유전자 중 2개 이상(예를 들어, 모두)이 관련된 기능성을 갖는 복수의 표적 유전자의 발현을 조절하는, 예를 들어 감소시키는 것은 상기 상호관련된 유전자를 포함하는 게놈 복합체, 예를 들어 ASMC를 표적화함으로써 효율적으로 및 효과적으로 달성될 수 있다.
일부 구현예에서, 복수의 표적 유전자 중 1, 2, 3개, 또는 그 이상(예를 들어, 모두)은 사이토카인, 예를 들어 케모카인, 인터류킨, 전사 인자(예를 들어, 인터페론 조절 전사 인자), 세포간 접착 분자(ICAM), 또는 인터페론 수용체이다. 일부 구현예에서, 복수의 표적 유전자 중 2개 이상(예를 들어, 모두)은 사이토카인, 인터류킨, 전사 인자(예를 들어, 인터페론 조절 전사 인자), 세포간 접착 분자(ICAM), 또는 인터페론 수용체이다. 일부 구현예에서, 복수의 표적 유전자는 포유동물 유전자, 예를 들어 마우스 유전자, 인간 유전자이다.
일부 구현예에서, 복수의 표적 유전자 중 2개 이상(예를 들어, 모두)의 유전자는 전염증성 기능성을 갖는다. 일부 구현예에서, 복수의 표적 유전자 중 2개 이상(예를 들어, 모두)의 유전자는 면역 세포, 예를 들어 호중구에 대한 화학유인물질로서 작용할 수 있다. 예를 들어, 전염증성 기능성을 갖는 유전자(또한 본 명세서에서 전염증성 유전자로 지칭됨)는 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, IL8, CXCL15, CCL2, CCL7, CCL9, IL1A, IL1B, CSF2, IRF1, ICAM1, ICAM4, ICAM5, IFNAR2, IL10RB, 또는 IFNGR2를 포함한다. 일부 구현예에서, 복수의 표적 유전자는 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, IL8, CXCL15, CCL2, CCL7, CCL9, IL1A, IL1B, CSF2, IRF1, ICAM1, ICAM4, ICAM5, IFNAR2, IL10RB, 또는 IFNGR2 중 2개 이상을 포함한다. 일부 구현예에서, 복수의 유전자는 하나 이상의 유전자 이상의 인간 CXCL 패밀리를 포함한다. 일부 구현예에서, 복수의 표적 유전자는 CXCL1(예를 들어, NM_002089에 따른 RNA를 인코딩하는 핵산 서열 또는 P09341에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL2(예를 들어, NM_001511에 따른 RNA를 인코딩하는 핵산 서열 또는 P19875에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL3(예를 들어, NM_002090에 따른 RNA를 인코딩하는 핵산 서열 또는 P19876에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL4(예를 들어, NM_002619 또는 NM_001363352에 따른 RNA를 인코딩하는 핵산 서열 또는 P02776에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL5(예를 들어, NM_002994에 따른 RNA를 인코딩하는 핵산 서열 또는 P42830에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL6(예를 들어, NM_002993에 따른 RNA를 인코딩하는 핵산 서열 또는 P80162에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL7(예를 들어, NM_002704에 따른 RNA를 인코딩하는 핵산 서열 또는 P02775에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), 및 IL8(예를 들어, NM_000584 또는 NM_001354840에 따른 RNA를 인코딩하는 핵산 서열, 또는 P10145에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체)을 포함한다. 일부 구현예에서, 복수의 유전자는 하나 이상의 유전자 이상의 마우스 CXCL 패밀리를 포함한다. 일부 구현예에서, 복수의 표적 유전자는 CXCL1(예를 들어, NM_008176.3에 따른 RNA를 인코딩하는 핵산 서열 또는 P12850에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL2(예를 들어, NM_009140.2에 따른 RNA를 인코딩하는 핵산 서열 또는 P10889에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL3(예를 들어, NM_203320.3에 따른 RNA를 인코딩하는 핵산 서열 또는 Q6W5C0에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL4(예를 들어, NM_019932에 따른 RNA를 인코딩하는 핵산 서열 또는 Q9Z126에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL5(예를 들어, NM_009141.3에 따른 RNA를 인코딩하는 핵산 서열 또는 P50228에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), CXCL7(예를 들어, NM_023785.3에 따른 RNA를 인코딩하는 핵산 서열 또는 Q9EQI5에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체), 및 CXCL15(예를 들어, NM_011339에 따른 RNA를 인코딩하는 핵산 서열 또는 Q9WVL7에 따른 폴리펩티드를 인코딩하는 핵산, 또는 이의 돌연변이체)를 포함한다. 일부 구현예에서, 복수의 표적 유전자는 CCL2, CCL7, CCL9, IL1A, 및 IL1B를 포함한다. 일부 구현예에서, 복수의 표적 유전자는 CSF2, IRF1, ICAM1, ICAM4, 및 ICAM5를 포함한다. 일부 구현예에서, 복수의 표적 유전자는 IFNAR2, IL10RB, 및 IFNGR2를 포함한다.
일부 구현예에서, 복수의 표적 유전자 중 2개 이상(예를 들어, 모두) 유전자의 발현 억제는 단백질, 예를 들어 사이토카인을 인코딩하는 다른 유전자의 발현을 조절할 수 있으며, 예를 들어 CXCL 발현 및 염증 부위로의 CXCL의 세포 동원을 감소시키는 것은 염증 부위에서 GM-CSF, 및/또는 IL-6의 존재를 감소시킨다.
일부 구현예에서, 복수의 표적 유전자는 게놈 복합체, 예를 들어 ASMC의 일부이다. 본 명세서에 사용되는 바와 같이, '복수의 표적 유전자는 게놈 복합체, 예를 들어 ASMC의 일부이다'라고 지칭하는 것은, 복수의 유전자의 각각이 게놈 복합체, 예를 들어 ASMC 내에 적어도 부분적으로 포함된다는 것을 의미한다. '게놈 복합체, 예를 들어 ASMC의 일부인 복수의 표적 유전자'라고 지칭하는 것은 복수의 표적 유전자를 포함하는 게놈 복합체, 예를 들어 ASMC와 관련하여 호환 가능하게 사용된다. 예를 들어, 복수의 표적 유전자는 게놈에서 서로 인접하여 위치한 2개의 유전자로 구성될 수 있으며, 여기서 제1 앵커 서열은 제1 유전자 내에 배치되고 제2 앵커 서열은 제1 유전자에 대해 원위인 제2 유전자의 외부에 배치된다. 상기 제1 및 제2 앵커 서열의 회합에 의해 형성된 ASMC는 제2 유전자를 전체적으로 포함하고 제1 유전자를 부분적으로 포함할 것이며; 이들 2개의 유전자로 구성된 복수의 유전자는 이러한 ASMC의 일부가 될 것이다. 일부 구현예에서, 복수의 표적 유전자 중 각 유전자는 전체적으로 게놈 복합체, 예를 들어 ASMC 내에 있다(예를 들어, 유전자 서열을 인코딩하는 전사체의 어떤 부분도 게놈 복합체, 예를 들어 ASMC의 외부에 없음). 일부 구현예에서, 복수의 표적 유전자 중 각 유전자는 부분적으로 게놈 복합체, 예를 들어 ASMC 내에 있다(예를 들어, 유전자 서열을 인코딩하는 전사체의 일부 부분은 게놈 복합체, 예를 들어 ASMC의 외부에 있음). 일부 구현예에서, 복수의 표적 유전자 중 적어도 하나의 유전자는 전체적으로 게놈 복합체, 예를 들어 ASMC 내에 있고(예를 들어, 유전자 서열을 인코딩하는 전사체의 어떤 부분도 게놈 복합체, 예를 들어 ASMC의 외부에 없음), 복수의 표적 유전자 중 적어도 하나의 유전자는 부분적으로 게놈 복합체, 예를 들어 ASMC 내에 있다(예를 들어, 유전자 서열을 인코딩하는 전사체의 일부 부분은 게놈 복합체, 예를 들어 ASMC의 외부에 있음).
복수의 표적 유전자 중의 유전자는 코딩 서열, 예를 들어 엑손, 및/또는 비-코딩 서열, 예를 들어 인트론, 3'UTR, 또는 5'UTR을 포함할 수 있다. 일부 구현예에서, 복수의 표적 유전자의 유전자는 전사 제어 요소에 작동가능하게 연결된다. 일부 구현예에서, 복수의 표적 유전자 중 유전자의 전사 제어 요소는 또한 게놈 복합체, 예를 들어 ASMC(유전자가 이의 일부임)의 일부이다. '게놈 복합체, 예를 들어 ASMC의 일부인 유전자에 작동가능하게 연결된 전사 제어 요소'를 지칭하는 것은 복수의 표적 유전자에 관하여 상기 기재된 바와 동일한 의미로 이해될 수 있다. 일부 구현예에서, 복수의 표적 유전자 중 유전자에 작동가능하게 연결된 각 전사 제어 요소는 전체적으로 게놈 복합체, 예를 들어 ASMC 내에 있다(예를 들어, 전사 제어 요소 서열의 어떤 부분도 게놈 복합체, 예를 들어 ASMC의 외부에 없음). 일부 구현예에서, 복수의 표적 유전자 중 각 전사 제어 요소는 부분적으로 게놈 복합체, 예를 들어 ASMC 내에 있다(예를 들어, 전사 제어 요소 서열의 일부 부분은 게놈 복합체, 예를 들어 ASMC의 외부에 있음). 일부 구현예에서, 복수의 표적 유전자 중 각 전사 제어 요소는 완전히 게놈 복합체, 예를 들어 ASMC의 외부에 있다(예를 들어, 각 전사 제어 요소 서열은 게놈 복합체, 예를 들어 ASMC의 외부에 있음). 일부 구현예에서, 복수의 표적 유전자 중 유전자에 작동가능하게 연결된 적어도 하나의 전사 제어 요소는 전체적으로 게놈 복합체, 예를 들어 ASMC 내에 있다(예를 들어, 전사 제어 요소 서열의 어떤 부분도 게놈 복합체, 예를 들어 ASMC의 외부에 없음). 일부 구현예에서, 복수의 표적 유전자 중 또 다른 유전자에 작동가능하게 연결된 적어도 하나의 전사 제어 요소는 부분적으로 게놈 복합체, 예를 들어 ASMC 내에 있다(예를 들어, 유전자 서열을 인코딩하는 전사체의 일부 부분은 게놈 복합체, 예를 들어 ASMC의 외부에 있음). 일부 구현예에서, 복수의 표적 유전자 중의 유전자에 작동가능하게 연결된 적어도 하나의 전사 제어 요소는 완전히 게놈 복합체, 예를 들어 ASMC의 외부에 있다.
일부 구현예에서, 부위-특이적 파괴제 또는 시스템은 앵커 서열, 예를 들어 복수의 표적 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 일부인 앵커 서열에 대한 결합에 의해 복수의 표적 유전자를 표적화한다. 일부 구현예에서, 표적화 모이어티는 앵커 서열에 결합한다. 일부 구현예에서, 앵커 서열에 대한 게놈 복합체 성분, 예를 들어 핵형성 폴리펩티드의 결합은 복합체 형성, 예를 들어 앵커 서열-매개 연접부 형성을 핵형성한다. 각 앵커 서열-매개 연접부는 하나 이상의 앵커 서열, 예를 들어 복수의 앵커 서열을 포함한다. 일부 구현예에서, 앵커 서열-매개 연접부는 복수의 표적 유전자의 발현을 변경시키도록, 예를 들어 억제하도록 파괴될 수 있다. 그러한 파괴는, 예를 들어 DNA의 토폴로지 구조를 변경시킴으로써, 예를 들어 전사 제어 요소(예를 들어, 인핸싱 및 침묵/억제 서열)와 상호작용할 수 있는 복수의 유전자의 능력을 조절함으로써, 유전자 발현을 조절할 수 있다.
부위-특이적 파괴제 또는 시스템에 사용하기에 적합한 표적화 모이어티는 앵커 서열, 예를 들어 복수의 표적 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 일부인 앵커 서열에 근접한 부위에 결합할, 예를 들어 특이적으로 결합할 수 있다. 본 명세서에 사용되는 바와 같이, '근접'은 제1 부위에서 부위-특이적 파괴제 또는 시스템의 결합 및/또는 부위-특이적 파괴제에 의한 제1 부위의 변형이 다른 부위의 결합 및/또는 변형과 동일하거나 실질적으로 동일한 효과를 생성하도록 할 2개의 부위, 예를 들어 핵산 부위의 접근성을 지칭한다. 예를 들어, 표적화 모이어티는 복수의 표적 유전자(제2 부위)를 포함하는 게놈 복합체(예를 들어, ASMC)의 일부인 앵커 서열에 근접한 제1 부위에 결합할 수 있고, 상기 표적화 모이어티와 연관된 이펙터 모이어티는, 앵커 서열을 포함하는 게놈 복합체(예를 들어, ASMC)가 마치 제2 부위가 결합되고/되거나 변형된 것처럼 실질적으로 동일하게 변형되도록 제1 부위를 후성유전학적으로 변형시킬 수 있다. 일부 구현예에서, 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위)에 근접한 부위, 표적 유전자에 작동가능하게 연결된 전사 제어 요소에 근접한 부위, 또는 앵커 서열에 근접한 부위는 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위), 전사 제어 요소, 또는 앵커 서열로부터 5000, 4000, 3000, 2000, 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 50, 40, 30, 25, 20, 15, 10, 또는 5개의 염기쌍(그리고 선택적으로, 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위), 전사 제어 요소, 또는 앵커 서열)로부터 적어도 적어도 5, 10, 20, 25, 50, 100, 200, 또는 300개의 염기쌍) 내에 있다. 일부 구현예에서, 앵커 서열에 근접한 부위는 앵커 서열로부터 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 50, 40, 30, 20, 10, 또는 5개 염기쌍 미만(그리고 선택적으로, 적어도 5, 10, 20, 25, 50, 100, 200, 또는 300개 염기쌍) 내에 있는 부위이다. 일부 구현예에서, 앵커 서열에 근접한 부위는 앵커 서열로부터 800, 700, 600, 500, 400, 500, 400, 또는 300개 염기쌍 미만(그리고 선택적으로, 적어도 5, 10, 20, 25, 50, 100, 200, 또는 300개 염기쌍) 내에 있는 부위이다.
본 명세서에 기재된 부위-특이적 파괴제 또는 시스템에 사용하기에 적합한 표적화 모이어티는 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개의 뉴클레오티드 또는 염기쌍(그리고 선택적으로, 50, 49, 48, 47, 46, 45, 44, 43, 42, 41, 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 또는 10개 이하의 뉴클레오티드 또는 염기쌍)을 포함하는 부위에 결합할, 예를 들어 특이적으로 결합할 수 있다. 일부 구현예에서, 표적화 모이어티는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개의 뉴클레오티드 또는 염기쌍을 포함하는 부위에 결합한다.
게놈 복합체
본 개시내용과 관련된 게놈 복합체는 복수의 폴리펩티드 및/또는 핵산(특히, 리보핵산) 성분을 포함하고 2개 이상의 게놈 서열 요소(예를 들어, 앵커 서열, 프로모터 및/또는 인핸서 요소)를 공동국재화하는 안정적인 구조를 포함한다. 일부 구현예에서, 관련 게놈 복합체는 앵커-서열-매개 연접부(예를 들어, 게놈 루프)를 포함한다. 일부 구현예에서, 게놈 복합체 내(즉, 3차원 공간 내)에 있는 게놈 서열 요소는 전사 프로모터 및/또는 조절(예를 들어, 인핸서 또는 리프레서) 서열을 포함한다. 대안적으로, 또는 추가적으로, 일부 구현예에서, 게놈 복합체 내에 있는 게놈 서열 요소는 CTCF, YY1 등 중 하나 이상에 대한 결합 부위를 포함한다. 일부 구현예에서, 게놈 복합체는 복수의 표적 유전자를 포함한다. 일부 구현예에서, 복수의 표적 유전자 중 2개 이상(예를 들어, 모두)의 유전자는 ASMC의 단일 루프 내에 위치한다. 일부 구현예에서, 복수의 표적 유전자 중 2개 이상(예를 들어, 모두)의 유전자는 ASMC의 상이한 루프 내에 위치한다.
일부 구현예에서, 본 개시내용에 따라 발생률이 감소한 게놈 복합체는 게놈 서열 요소(예를 들어, 일부 구현예에서 핵형성 성분에 의해 인식될 수 있는 앵커 서열, 예를 들어 CTCF 결합 모티프, YY1 결합 모티프 등), 하나 이상의 폴리펩티드 성분(예를 들어, 하나 이상의 핵형성 폴리펩티드, 하나 이상의 전사 기구 단백질, 및/또는 하나 이상의 전사 조절 단백질), 및/또는 하나 이상의 비-게놈 핵산 성분(예를 들어, 비-코딩 RNA 및/또는 mRNA, 예를 들어 게놈 복합체와 연관된 게놈으로부터 전사된 것) 중 하나 이상의 성분을 포함하거나, 이로 구성된다.
일부 구현예에서, 게놈 복합체 성분은 게놈 복합체의 일부이며, 여기서 게놈 복합체는, 예를 들어 복수의 단백질 및/또는 다른 성분 사이의 상호작용을 통해, 염색체 상의 서로 이격된 2개의 게놈 서열 요소를 합친 것이다.
일부 구현예에서, 게놈 서열 요소는 복합체의 하나 이상의 단백질 성분이 결합하는 앵커 서열이며; 따라서, 일부 구현예에서 게놈 복합체는 앵커-서열-매개 연접부를 포함한다. 일부 구현예에서, 게놈 서열 요소는 CTCF 결합 모티프, 프로모터 및/또는 인핸서를 포함한다. 일부 구현예에서, 게놈 서열 요소는 프로모터 및/또는 조절 부위(예를 들어, 인핸서) 중 적어도 하나 또는 둘 모두를 포함한다. 일부 구현예에서, 복합체 형성은 게놈 서열 요소(들)에서 그리고/또는 게놈 서열 요소(들)에 대한 단백질 성분(들) 중 하나 이상의 결합에 의해 핵형성된다.
본 명세서에 기재된 바와 같은 게놈 복합체에 관련된 게놈 서열 요소는 서로 인접하지 않을 수 있다. 비인접 게놈 서열 요소(예를 들어, 앵커 서열, 프로모터, 및/또는 전사 조절 서열)를 갖는 일부 구현예에서, 제1 게놈 서열 요소(예를 들어, 앵커 서열, 프로모터, 또는 전사 조절 서열)는 제2 게놈 서열 요소(예를 들어, 앵커 서열, 프로모터, 또는 전사 조절 서열)로부터 약 500 bp 내지 약 500 Mb, 약 750 bp 내지 약 200 Mb, 약 1 kb 내지 약 100 Mb, 약 25 kb 내지 약 50 Mb, 약 50 kb 내지 약 1 Mb, 약 100 kb 내지 약 750 kb, 약 150 kb 내지 약 500 kb, 또는 약 175 kb 내지 약 500 kb 떨어져 있을 수 있다. 일부 구현예에서, 제1 게놈 서열 요소(예를 들어, 앵커 서열, 프로모터, 또는 전사 조절 서열)는 제2 게놈 서열 요소(예를 들어, 앵커 서열, 프로모터, 또는 전사 조절 서열)로부터 약 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1 kb, 5 kb, 10 kb, 15 kb, 20 kb, 25 kb, 30 kb, 35 kb, 40 kb, 45 kb, 50 kb, 55 kb, 60 kb, 65 kb, 70 kb, 75 kb, 80 kb, 85 kb, 90 kb, 95 kb, 100 kb, 125 kb, 150 kb, 175 kb, 200 kb, 225 kb, 250 kb, 275 kb, 300 kb, 350 kb, 400 kb, 500 kb, 600 kb, 700 kb, 800 kb, 900 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb, 10 Mb, 15 Mb, 20 Mb, 25 Mb, 50 Mb, 75 Mb, 100 Mb, 200 Mb, 300 Mb, 400 Mb, 500 Mb, 또는 이 사이의 임의의 크기만큼 떨어져 있다.
앵커 서열-매개 연접부
일부 구현예에서, 본 개시내용과 관련된 게놈 복합체는 앵커 서열-매개 연접부(ASMC)이거나 이를 포함한다. 일부 구현예에서, 핵형성 폴리펩티드(들)가 게놈 내의 앵커 서열에 결합하고 이들 단백질, 및 선택적으로 하나 이상의 다른 성분 사이의 상호작용이 앵커 서열이 물리적으로 공동국재화된 연접부를 형성할 때 앵커-서열-매개 연접부가 형성된다. 본 명세서에 기재된 많은 구현예에서, 하나 이상의 유전자는 앵커-서열-매개 연접부와 연관되고; 그러한 구현예에서, 앵커 서열-매개 연접부는 통상적으로 하나 이상의 앵커 서열, 하나 이상의 유전자, 및 하나 이상의 전사 제어 서열, 예컨대 인핸싱 또는 침묵 서열을 포함한다. 일부 구현예에서, 전사 제어 서열은 앵커 서열-매개 연접부 내부에, 부분적으로 내부에, 또는 외부에 있다. 일부 구현예에서, ASMC는 내부 인핸싱 서열, 예를 들어 인핸서를 포함한다. 일부 구현예에서, ASMC는 복수의 표적 유전자를 포함한다.
일부 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체(예를 들어, 앵커 서열-매개 연접부)는 게놈 루프, 예컨대 염색체내 루프이거나 이를 포함한다. 특정 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체(예를 들어, 앵커 서열-매개 연접부)는 복수의 게놈 루프를 포함한다. 하나 이상의 게놈 루프는 제1 앵커 서열, 핵산 서열, 전사 제어 서열, 및 제2 앵커 서열을 포함할 수 있다. 일부 구현예에서, 적어도 하나의 게놈 루프는 제1 앵커 서열, 전사 제어 서열, 및 제2 앵커 서열; 또는 제1 앵커 서열, 핵산 서열, 및 제2 앵커 서열을 순서대로 포함한다. 또 다른 일부 구현예에서, 핵산 서열 및 전사 제어 서열 중 하나 또는 둘 모두는 게놈 루프 내부에 위치한다. 또 다른 일부 구현예에서, 핵산 서열 및 전사 제어 서열 중 하나 또는 둘 모두는 게놈 루프 외부에 위치한다. 일부 구현예에서, 하나 이상의 게놈 루프는 전사 제어 서열을 포함한다. 일부 구현예에서, 게놈 복합체(예를 들어, 앵커 서열-매개 연접부)는 TATA 박스, CAAT 박스, GC 박스, 또는 CAP 부위를 포함한다.
일부 구현예에서, 앵커 서열-매개 연접부는 복수의 게놈 루프를 포함하고; 일부 그러한 구현예에서, 앵커 서열-매개 연접부는 하나 이상의 게놈 루프에 앵커 서열, 핵산 서열, 및 전사 제어 서열 중 적어도 하나를 포함한다.
루프 유형
일부 구현예에서, 게놈 루프는 하나 이상, 예를 들어 2, 3, 4, 5개, 또는 그 이상의 유전자, 예를 들어 복수의 표적 유전자를 포함한다. 일부 구현예에서, 복수의 표적 유전자 중 2개 이상, 예를 들어 2, 3, 4, 5개, 또는 그 이상의 유전자는 동일한 방향으로 전사된다. 일부 구현예에서, 복수의 표적 유전자 중 모든 유전자는 동일한 방향으로 전사된다.
일부 구현예에서, 본 개시내용은 루프 내 복수의 표적 유전자의 발현을 조절하는(예를 들어, 감소시키는) 방법을 제공하며, 상기 방법은 (i) (예를 들어, 복수의 표적 유전자 중) 발현이 조절되는 유전자; 및/또는 (ii) 발현이 조절되는 유전자의 전사에 영향을 미치는 하나 이상의 연관된 전사 제어 서열의 외부에 있거나, 이의 일부가 아니거나, 이의 내부에 포함되는 게놈 서열의 공동국재화를 달성하는 게놈 복합체를 억제하고/하거나, 분리하고/하거나, 분해하고/하거나, 변형시키는 것을 포함한다.
일부 구현예에서, 본 개시내용은 복수의 표적 유전자의 전사를 조절하는(예를 들어, 감소시키는) 방법을 제공하며, 상기 방법은 (i) (예를 들어, 복수의 표적 유전자 중) 발현이 조절되는 유전자; 및/또는 (ii) 발현이 조절되는 유전자의 전사에 영향을 미치는 연관된 전사 제어 서열과 인접하지 않은 게놈 서열의 공동국재화를 달성하는 복합체의 형성을 억제하고/하거나 복합체를 불안정화시키는 것을 포함한다.
일부 구현예에서, 앵커 서열-매개 연접부는 하나 이상, 예를 들어 2, 3, 4, 5개, 또는 그 이상의 전사 제어 서열과 회합된다. 일부 구현예에서, 복수의 표적 유전자 중의 유전자(예를 들어, 복수의 표적 유전자 중 1, 2개, 또는 그 이상, 예를 들어 모두)는 하나 이상의 전사 제어 서열과 인접하지 않는다. 유전자가 전사 제어 서열(들)과 인접하지 않는 일부 구현예에서, 유전자는 하나 이상의 전사 제어 서열로부터 약 100 bp 내지 약 500 Mb, 약 500 bp 내지 약 200 Mb, 약 1 kb 내지 약 100 Mb, 약 25 kb 내지 약 50 Mb, 약 50 kb 내지 약 1 Mb, 약 100 kb 내지 약 750 kb, 약 150 kb 내지 약 500 kb, 또는 약 175 kb 내지 약 500 kb 떨어져 있을 수 있다. 일부 구현예에서, 유전자는 전사 제어 서열로부터 약 100 bp, 300 bp, 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1 kb, 5 kb, 10 kb, 15 kb, 20 kb, 25 kb, 30 kb, 35 kb, 40 kb, 45 kb, 50 kb, 55 kb, 60 kb, 65 kb, 70 kb, 75 kb, 80 kb, 85 kb, 90 kb, 95 kb, 100 kb, 125 kb, 150 kb, 175 kb, 200 kb, 225 kb, 250 kb, 275 kb, 300 kb, 350 kb, 400 kb, 500 kb, 600 kb, 700 kb, 800 kb, 900 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb, 10 Mb, 15 Mb, 20 Mb, 25 Mb, 50 Mb, 75 Mb, 100 Mb, 200 Mb, 300 Mb, 400 Mb, 500 Mb, 또는 이 사이의 임의의 크기만큼 떨어져 있다.
앵커 서열
일반적으로, 앵커 서열은 게놈 복합체 성분, 예를 들어 핵형성 폴리펩티드가 특이적으로 결합하는 게놈 서열 요소이다. 일부 구현예에서, 앵커 서열에 대한 게놈 복합체 성분의 결합은 복합체 형성을 핵형성한다.
각각의 앵커 서열-매개 연접부는 하나 이상, 예를 들어 복수의 앵커 서열을 포함한다. 일부 구현예에서, 앵커 서열은 자연 발생 루프를 형성 및/또는 안정화시키기 위해, 하나 이상의 새로운 루프를 형성하기 위해(예를 들어, 외인성 루프를 형성하기 위해 또는 외인성 또는 변경된 앵커 서열을 갖는 비자연 발행 루프를 형성하기 위해), 또는 자연 발생 또는 외인성 루프의 형성을 억제하거나 불안정화시키기 위해 조작되거나 변경될 수 있다. 그러한 변경은, 예를 들어 DNA의 토폴로지 구조를 변경시킴으로써, 예를 들어 이에 의해 유전자 조절 및 제어 요소(예를 들어, 인핸싱 및 침묵/억제 서열)와 상호작용할 수 있는 표적 유전자의 능력을 조절함으로써, 유전자 발현을 조절할 수 있다.
일부 구현예에서, 염색질 구조는 앵커 서열-매개 연접부 내에서 하나 이상의 뉴클레오티드를 치환하거나, 추가하거나 결실시킴으로써 변형된다. 일부 구현예에서, 염색질 구조는 앵커 서열-매개 연접부의 앵커 서열 내에서 하나 이상의 뉴클레오티드를 치환하거나, 추가하거나 결실시킴으로써 변형된다.
일부 구현예에서, 앵커 서열은 공통 뉴클레오티드 서열, 예를 들어 다음과 같은 CTCF-결합 모티프를 포함한다: N(T/C/G)N(G/A/T)CC(A/T/G)(C/G)(C/T/A)AG(G/A)(G/T)GG(C/A/T)(G/A)(C/G)(C/T/A)(G/A/C)(서열번호 1)(여기서, N은 임의의 뉴클레오티드임).
A CTCF-결합 모티프는 또한 반대 배향일 수 있으며, 예를 들어 (G/A/C)(C/T/A)(C/G)(G/A)(C/A/T)GG(G/T)(G/A)GA(C/T/A)(C/G)(A/T/G)CC(G/A/T)N(T/C/G)N(서열번호 2)이다. 일부 구현예에서, 앵커 서열은 서열번호 1 또는 서열번호 2를 포함하거나, 서열번호 1 또는 서열번호 2 중 어느 하나와 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일한 서열을 포함한다.
일부 구현예에서, 앵커 서열은 CTCF 결합 모티프, USF1 결합 모티프, YY1 결합 모티프, TAF3 결합 모티프, 또는 ZNF143 결합 모티프를 포함한다. 일부 구현예에서, 앵커 서열은 핵형성 폴리펩티드 결합 모티프, 예를 들어 YY1-결합 모티프를 포함한다: CCGCCATNTT(서열번호 3)(여기서, N은 임의의 뉴클레오티드임). YY1-결합 모티프는 또한 반대 배향일 수 있으며, 예를 들어 AANATGGCGG(서열번호 4)(여기서, N은 임의의 뉴클레오티드임)이다. 일부 구현예에서, 앵커 서열은 서열번호 3 또는 서열번호 4를 포함하거나, 서열번호 3 또는 서열번호 4 중 어느 하나와 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일한 서열을 포함한다.
일부 구현예에서, 앵커 서열-매개 연접부는 제1 앵커 서열 및 제2 앵커 서열을 포함한다. 예를 들어, 일부 구현예에서, 제1 앵커 서열 및 제2 앵커 서열은 각각 공통 뉴클레오티드 서열을 포함할 수 있으며, 예를 들어 각각은 CTCF 결합 모티프를 포함한다. 일부 구현예에서, 제1 앵커 서열 및 제2 앵커 서열은 각각 USF1 결합 모티프를 포함할 수 있다. 일부 구현예에서, 제1 앵커 서열 및 제2 앵커 서열은 각각 YY1 결합 모티프를 포함할 수 있다. 일부 구현예에서, 제1 앵커 서열 및 제2 앵커 서열은 각각 TAF3 결합 모티프를 포함할 수 있다. 일부 구현예에서, 제1 앵커 서열 및 제2 앵커 서열은 각각 ZNF143 결합 모티프를 포함할 수 있다.
일부 구현예에서, 제1 앵커 서열 및 제2 앵커 서열은 상이한 서열을 포함하며, 예를 들어 제1 앵커 서열은 CTCF 결합 모티프를 포함하고, 제2 앵커 서열은 CTCF 결합 모티프 이외의 앵커 서열을 포함한다. 일부 구현예에서, 제1 앵커 서열은 CTCF 결합 모티프, USF1 결합 모티프, YY1 결합 모티프, TAF3 결합 모티프, 또는 ZNF143 결합 모티프를 포함하고, 제2 앵커 서열은 CTCF 결합 모티프, USF1 결합 모티프, YY1 결합 모티프, TAF3 결합 모티프, 또는 ZNF143 결합 모티프를 포함하며, 여기서 제1 및 제2 앵커 서열은 둘 모두 CTCF 결합 모티프, USF1 결합 모티프, YY1 결합 모티프, TAF3 결합 모티프, 또는 ZNF143 결합 모티프를 포함하지 않는다. 일부 구현예에서, 각 앵커 서열은 공통 뉴클레오티드 서열(예를 들어, CTCF 결합 모티프, USF1 결합 모티프, YY1 결합 모티프, TAF3 결합 모티프, 또는 ZNF143 결합 모티프)을 포함하고 공통 뉴클레오티드 서열의 한쪽 또는 양쪽에 하나 이상의 측접 뉴클레오티드를 포함한다.
연접부를 형성할 수 있는 2개의 앵커 서열(예를 들어, 각각은 CTCF 결합 모티프, USF1 결합 모티프, YY1 결합 모티프, TAF3 결합 모티프, 또는 ZNF143 결합 모티프를 포함함)은 임의의 배향으로, 예를 들어 5'-3'(좌측 탠덤) 또는 3'-5'(우측 탠덤) 중 어느 하나의 동일한 배향(탠덤)으로, 또는 하나의 앵커 서열은 5'-3'으로 배향되고 다른 하나는 3'-5'으로 배향되는 수렴 배향으로 게놈에 존재할 수 있다.
연접부를 형성할 수 있는 2개의 CTCF-결합 모티프(예를 들어, 연속 또는 비연속 CTCF 결합 모티프)는 임의의 배향으로, 예를 들어 5'-3'(좌측 탠덤, 예를 들어 서열번호 1을 포함하는 2개의 CTCF-결합 모티프) 또는 3'-5'(우측 탠덤, 예를 들어 서열번호 2를 포함하는 2개의 CTCF-결합 모티프) 중 어느 하나의 동일한 배향(탠덤)으로, 또는 하나의 CTCF-결합 모티프는 서열번호 1을 포함하고 또 다른 하나는 서열번호 2를 포함하는 수렴 배향으로 게놈에 존재할 수 있다. CTCFBSDB 2.0: Database For CTCF binding motifs And Genome Organization(월드와이드웹 insulatordb.uthsc.edu/)은 표적 유전자와 연관된 CTCF 결합 모티프를 확인하는 데 사용될 수 있다.
일부 구현예에서, 앵커 서열은 복수의 표적 유전자와 연관된 CTCF 결합 모티프를 포함하며, 여기서 복수의 표적 유전자는 질환, 장애 및/또는 병태와 연관된다. 일부 구현예에서, 앵커 서열은 복수의 표적 유전자와 연관된 CTCF 결합 모티프를 포함하며, 여기서 복수의 표적 유전자 중의 유전자는 관련된 기능성을 갖는다. 일부 구현예에서, 앵커 서열은 복수의 표적 유전자와 연관된 CTCF 결합 모티프를 포함하며, 여기서 복수의 표적 유전자(예를 들어, 복수 유전자 중 2개 이상, 예를 들어 모두)는 대상체의 세포에서 비정상적으로 발현된다.
일부 구현예에서, 염색질 구조는 적어도 하나의 앵커 서열, 예를 들어 핵형성 폴리펩티드 결합 모티프 내에서 하나 이상의 뉴클레오티드를 치환하거나, 추가하거나 결실시킴으로써 변형될 수 있다. 하나 이상의 뉴클레오티드는 앵커 서열, 예를 들어 핵형성 폴리펩티드 결합 모티프 내에서 치환, 추가 또는 결실을 위해 특이적으로 표적화될 수 있으며, 예를 들어 표적화된 변경일 수 있다.
일부 구현예에서, 앵커 서열-매개 연접부는 적어도 하나의 공통 뉴클레오티드 서열, 예를 들어 핵형성 폴리펩티드 결합 모티프의 배향을 변화시킴으로써 변경될 수 있다. 일부 구현예에서, 앵커 서열은 핵형성 폴리펩티드 결합 모티프, 예를 들어 CTCF 결합 모티프를 포함하고, 표적화 모이어티는 적어도 하나의 핵형성 폴리펩티드 결합 모티프에 변경을 도입하여, 예를 들어 핵형성 폴리펩티드에 대한 결합 친화도를 변경시킨다.
일부 구현예에서, 앵커 서열-매개 연접부는 외인성 앵커 서열을 도입함으로써 변경될 수 있다. 일부 구현예에서, 예를 들어 비자연 발생 루프를 형성하도록 유도함으로써, 자연 발생 앵커 서열-매개 연접부의 형성을 불안정화시키거나 억제하기 위한 비자연 발생 또는 외인성 앵커 서열의 첨가는 핵산 서열의 전사를 변경시킨다(예를 들어, 감소시킴).
기타 구성
핵산 및 벡터
추가로 본 개시내용은, 부분적으로, 본 명세서에 기재된 부위-특이적 파괴제 또는 시스템을 인코딩하는 핵산에 관한 것이다. 일부 구현예에서, 부위-특이적 파괴제는 부위-특이적 파괴제, 예를 들어 부위-특이적 파괴제의 표적화 모이어티 및/또는 이펙터 모이어티를 인코딩하는 핵산을 포함하는 조성물을 통해 제공될 수 있으며, 핵산은 관심 시스템 내에서(예를 들어, 특정 세포, 조직, 유기체 등 내에서) 부위-특이적 파괴제의 발현을 달성하기에 충분한 기타 다른 서열과 연관되어 있다. 일부 구현예에서, 시스템은 제1 부위-특이적 파괴제, 예를 들어 제1 부위-특이적 파괴제의 제1 표적화 모이어티 및/또는 제1 이펙터 모이어티를 인코딩하는 제1 핵산, 및 제2 부위 특이적 파괴제, 예를 들어 제2 부위-특이적 파괴제의 제2 표적화 모이어티 및/또는 제2 이펙터 모이어티를 인코딩하는 제2 핵산을 포함하는 조성물을 통해 제공될 수 있으며, 제1 및/또는 제2 핵산은 관심 시스템 내에서(예를 들어, 특정 세포, 조직, 유기체 등 내에서) 부위-특이적 파괴제의 발현을 달성하기에 충분한 기타 다른 서열과 연관되어 있다.
일부 특정 구현예에서, 본 개시내용은 부위-특이적 파괴제를 인코딩하는 핵산 또는 이의 폴리펩티드 또는 핵산 부분(예를 들어, 폴리펩티드 및/또는 핵산을 포함하는 표적화 모이어티 및/또는 이펙터 모이어티)을 인코딩하는 핵산의 조성물을 제공한다. 일부 특정 구현예에서, 본 개시내용은 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제를 인코딩하는 핵산, 또는 이의 폴리펩티드 또는 핵산 부분(예를 들어, 폴리펩티드 및/또는 핵산을 포함하는 표적화 모이어티 및/또는 이펙터 모이어티)의 조성물을 제공한다. 일부 그러한 구현예에서, 제공된 핵산은 DNA, RNA, 또는 본 명세서에 기재된 바와 같은 임의의 다른 핵산 모이어티 또는 실체를 포함할 수 있으며, 본 명세서에 기재된 임의의 기술 또는 당업계에서 달리 이용가능한 기술(예를 들어, 합성, 클로닝, 증폭, 시험관내 또는 생체내 전사 등)에 의해 제조될 수 있다. 일부 구현예에서, 하나 이상의 부위-특이적 파괴제를 인코딩하는 제공된 핵산, 또는 이의 폴리펩티드 또는 핵산 부분은 관심 시스템에서(예를 들어, 특정 세포, 조직, 유기체 등에서) 제공된 핵산의 통합, 복제, 및/또는 발현을 달성하기에 적절한 및/또는 충분한 하나 이상의 복제, 통합, 및/또는 발현 신호와 작동적으로 연관될 수 있다.
일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제 또는 시스템을 전달하기 위한 조성물은 부위-특이적 파괴제를 인코딩하는 하나 이상의 핵산 또는 이의 폴리펩티드 또는 핵산 부분을 포함하는 벡터, 예를 들어 바이러스 벡터를 포함한다. 일부 구현예에서, 제1 벡터는 제1 부위-특이적 파괴제를 인코딩하는 제1 핵산을 포함하고, 제2 벡터는 제2 부위-특이적 파괴제를 인코딩하는 제2 핵산을 포함한다. 일부 구현예에서, 단일 벡터는 제1 부위-특이적 파괴제를 인코딩하는 제1 핵산, 및 제2 부위-특이적 파괴제를 인코딩하는 제2 핵산을 포함한다.
일부 구현예에서, 본 명세서에 기재된 부위-특이적 파괴제 또는 시스템을 전달하기 위한 조성물은 부위-특이적 파괴제의 하나 이상의 성분을 인코딩하는 하나 이상의 핵산 또는 이의 폴리펩티드 또는 핵산 부분을 포함하는 RNA, 예를 들어 mRNA이거나 이를 포함한다.
본 명세서에 기재된 바와 같은 핵산 또는 본 명세서에 기재된 단백질을 인코딩하는 핵산이 벡터 내로 도입될 수 있다. 레트로바이러스, 예컨대 렌티바이러스로부터 유래된 것들을 포함한 벡터가 장기간 유전자 전달을 달성하기에 적합한 도구인데, 그 이유는, 이들 벡터가 이식유전자의 장기간의 안정적인 통합 및 딸 세포에서의 그의 증식을 가능하게 하기 때문이다. 벡터의 예에는 발현 벡터, 복제 벡터, 프로브 생성 벡터 및 시퀀싱 벡터가 포함된다. 발현 벡터는 바이러스 벡터의 형태로 세포에 제공될 수 있다. 바이러스 벡터 기술은 당업계에 잘 알려져 있으며, 다양한 바이러스학 및 분자 생물학 매뉴얼에 기재되어 있다. 벡터로서 유용한 바이러스는 레트로바이러스, 아데노바이러스, 아데노-연관 바이러스, 헤르페스 바이러스, 및 렌티바이러스를 포함하지만 이로 한정되지 않는다. 일반적으로, 적합한 벡터는 적어도 하나의 유기체에서 기능성인 복제 기점, 프로모터 서열, 편리한 제한 엔도뉴클레아제 부위, 및 하나 이상의 선택가능한 마커를 포함한다.
천연 또는 합성 핵산의 발현은 통상적으로 관심 유전자를 인코딩하는 핵산을 프로모터에 작동가능하게 연결하고 작제물을 발현 벡터 내로 도입함으로써 달성된다. 벡터는 진핵세포에서 복제 및 통합에 적합할 수 있다. 통상적인 클로닝 벡터는 전사 및 번역 종결자, 개시 서열, 및 원하는 핵산 서열의 발현에 유용한 프로모터를 포함한다.
추가적인 프로모터 요소, 예를 들어 인핸싱 서열은 전사 개시의 빈도를 조절할 수 있다. 통상적으로, 이들 서열은 전사 개시 부위의 30 내지 110 bp 상류 영역 내에 위치되지만, 다수의 프로모터가 마찬가지로 전사 개시 부위의 하류에 기능성 요소를 포함하는 것으로 최근에 밝혀졌다. 프로모터 요소간의 간격은 빈번하게 가요성이어서, 요소들이 서로에 대해 역전되거나 이동될 때 프로모터 기능이 보존된다. 티미딘 키나제(tk) 프로모터에서는, 활성의 감소가 시작되기 전에 프로모터 요소간의 간격이 증가되어 50 bp로 떨어질 수 있다. 프로모터에 따라, 개별 요소들이 전사를 활성화하도록 협동적으로 또는 독립적으로 기능할 수 있는 것으로 나타난다.
적합한 프로모터의 한 예는 전초기 사이토메갈로바이러스(CMV) 프로모터 서열이다. 이러한 프로모터 서열은 강력한 구성적 프로모터 서열로서, 이것에 작동가능하게 연결된 임의의 폴리뉴클레오티드 서열의 고수준의 발현을 유도할 수 있다. 일부 구현예에서, 적합한 프로모터는 연장 성장 인자-1α(EF-1α)이다. 그러나, 다른 구성적 프로모터 서열이 또한 사용될 수 있으며, 이에는 유인원 바이러스 40(SV40) 초기 프로모터, 마우스 유선 종양 바이러스(MMTV), 인간 면역결핍 바이러스(HIV) 긴 말단 반복부(LTR) 프로모터, MoMuLV 프로모터, 조류 백혈병 바이러스 프로모터, 엡스타인-바(Epstein-Barr) 바이러스 전초기 프로모터, 라우스 육종 바이러스 프로모터뿐만 아니라, 인간 유전자 프로모터, 예컨대 제한 없이, 액틴 프로모터, 미오신 프로모터, 헤모글로빈 프로모터, 및 크레아틴 키나제 프로모터가 포함되지만 이로 한정되지 않는다.
본 개시내용은 임의의 특정 프로모터 또는 프로모터 카테고리(예를 들어, 구성적 프로모터)의 사용으로 제한되는 것으로 해석되어서는 안 된다. 예를 들어, 일부 구현예에서, 유도성 프로모터가 본 개시내용의 일부로서 고려된다. 일부 구현예에서, 유도성 프로모터의 사용은, 그것에 작동가능하게 연결된 폴리뉴클레오티드 서열의 발현이 요구될 때, 그러한 발현을 켤 수 있는 분자 스위치를 제공한다. 일부 구현예에서, 유도성 프로모터의 사용은, 발현이 요구되지 않을 때 발현을 끌 수 있는 분자 스위치를 제공한다. 유도성 프로모터의 예에는 메탈로티오닌(metallothionine) 프로모터, 글루코코르티코이드 프로모터, 프로게스테론 프로모터, 및 테트라사이클린 프로모터가 포함되지만 이로 한정되지 않는다.
일부 구현예에서, 도입하려는 발현 벡터는 또한 선택가능한 마커 유전자 또는 리포터 유전자 중 어느 하나 또는 둘 모두를 함유하여, 바이러스 벡터를 통해 형질감염시키거나 감염시키고자 하는 세포 집단으로부터의 발현 세포의 확인 및 선택을 용이하게 할 수 있다. 일부 양태에서, 선택가능한 마커는 별개의 DNA 조각 상에서 운반되어 공동형질감염 절차에 사용될 수 있다. 선택가능한 마커 및 리포터 유전자 둘 모두에는 숙주 세포에서의 발현을 가능하게 하기에 적절한 전사 제어 서열이 측접될 수 있다. 유용한 선택가능한 마커는, 예를 들어 항생제-저항성 유전자, 예컨대 neo 등을 포함할 수 있다.
일부 구현예에서, 리포터 유전자는 잠재적으로 형질감염된 세포를 확인하는 데 그리고/또는 전사 제어 서열의 기능성을 평가하는 데 사용될 수 있다. 일반적으로, 리포터 유전자는, (리포터 유전자의) 수용자 공급원에 존재하지 않거나 그에 의해 발현되지 않고, 어떠한 용이하게 검출가능한 특성, 예를 들어 효소 활성 또는 시각화 가능한 형광에 의해 발현이 나타나는 폴리펩티드를 인코딩하는 유전자이다. 리포터 유전자의 발현은 DNA가 수용자 세포 내로 도입된 후 적합한 시간에 검정된다. 적합한 리포터 유전자는 루시퍼라제, 베타-갈락토시다제, 클로람페니콜 아세틸 트랜스퍼라제, 분비 알칼리성 포스파타제, 또는 녹색 형광 단백질 유전자를 인코딩하는 유전자를 포함할 수 있다(예를 들어, 문헌[Ui-Tei et al., 2000 FEBS Letters 479: 79-82]). 적합한 발현 시스템은 잘 알려져 있으며, 알려진 기법을 사용하여 제조되거나 상업적으로 입수될 수 있다. 일반적으로, 최고 수준의 리포터 유전자 발현을 나타내는 최소 5' 측접 영역을 갖는 작제물이 프로모터로서 확인된다. 그러한 프로모터 영역은 리포터 유전자에 연결되어, 프로모터-구동 전사를 조절하는 능력에 대하여 작용제를 평가하는 데 사용될 수 있다.
세포
추가로 본 개시내용은, 부분적으로, 본 명세서에 기재된 부위-특이적 파괴제 또는 시스템을 포함하는 세포에 관한 것이다. 당업자에게 알려진 임의의 세포, 예를 들어 세포주, 예를 들어 재조합 폴리펩티드의 발현에 적합한 세포주가 본 명세서에 기재된 부위-특이적 파괴제를 포함하기에 적합하다. 일부 구현예에서, 세포, 예를 들어 세포주가 부위-특이적 파괴제, 하나 이상의 부위-특이적 작용제, 또는 이의 핵산 또는 폴리펩티드 부분을 포함하는 시스템을 발현하는 데 사용될 수 있다. 일부 구현예에서, 세포, 예를 들어 세포주가 부위-특이적 파괴제를 인코딩하는 핵산, 예를 들어 벡터를 발현하거나 증폭시키는 데 사용될 수 있다. 일부 구현예에서, 세포, 예를 들어 세포주가 제1 부위-특이적 파괴제를 인코딩하는 핵산, 예를 들어 벡터 및 제2 부위-특이적 파괴제를 인코딩하는 벡터를 발현하거나 증폭시키는 데 사용될 수 있다. 일부 구현예에서, 세포는 본 명세서에 기재된 부위-특이적 파괴제를 인코딩하는 핵산을 포함한다. 일부 구현예에서, 세포는 본 명세서에 기재된 제1 부위-특이적 파괴제를 인코딩하는 제1 핵산, 및 제2 부위-특이적 파괴제를 인코딩하는 제2 핵산을 포함한다.
일부 구현예에서, 세포는 부위-특이적 파괴제를 인코딩하는 핵산 또는 이의 핵산 또는 폴리펩티드 부분을 포함하고, 핵산은 세포의 게놈 DNA 내로 통합된다. 일부 구현예에서, 세포는 부위-특이적 파괴제를 인코딩하는 핵산 또는 이의 핵산 또는 폴리펩티드 부분을 포함하고, 핵산은 벡터 상에 배치된다. 일부 구현예에서, 세포는 제1 부위-특이적 파괴제를 인코딩하는 제1 핵산 및 제2 부위-특이적 파괴제를 인코딩하는 제2 핵산 또는 이의 핵산 또는 폴리펩티드 부분을 포함하고, 제1 및 제2 핵산은 세포의 게놈 DNA 내로 통합된다. 일부 구현예에서, 세포는 제1 부위-특이적 파괴제를 인코딩하는 제1 핵산 및 제2 부위-특이적 파괴제를 인코딩하는 제2 핵산 또는 이의 핵산 또는 폴리펩티드 부분을 포함하고, 제1 및 제2 핵산은 벡터 상에 배치된다.
본 명세서의 부위-특이적 파괴제 또는 시스템을 포함하고/하거나 발현할 수 있는 세포의 예에는 간세포, 성상 세포, 쿠퍼 세포, 뉴런 세포, 내피 세포, 폐포 세포, 상피 세포, 근세포, 윤활층, 연골세포, 면역 세포, 및 림프구가 포함되지만 이로 한정되지 않는다.
추가로 본 개시내용은, 부분적으로, 본 명세서에 기재된 방법 또는 공정에 의해 제조된 세포에 관한 것이다. 일부 구현예에서, 본 개시내용은 본 명세서에 기재된 부위-특이적 파괴제를 제공하는 단계, 세포를 제공하는 단계, 및 세포를 부위-특이적 파괴제(또는 부위-특이적 파괴제를 인코딩하는 핵산, 또는 상기 부위-특이적 파괴제 또는 핵산을 포함하는 조성물)과 접촉시키는 단계를 수행함으로써 생성되는 세포를 제공한다. 일부 구현예에서, 본 개시내용은 본 명세서에 기재된 시스템을 제공하는 단계, 세포를 제공하는 단계, 및 세포를 시스템(또는 제1 부위-특이적 파괴제를 인코딩하는 제1 핵산 및 제2 부위-특이적 파괴제를 인코딩하는 제2 핵산, 또는 상기 시스템 또는 핵산을 포함하는 조성물)과 접촉시키는 단계를 수행함으로써 생성되는 세포를 제공한다. 이론에 의해 구애되고자 함이 없이, 본 명세서에 기재된 부위-특이적 파괴제 또는 시스템과 접촉된 세포는 부위-특이적 파괴제에 의해 접촉되지 않은 유사한 세포와 비교하여, 복수의 표적 유전자의 발현의 감소; 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 또는 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열과 연관된 후성유전학적 마커의 변형; 복수의 표적 유전자 중 유전자, 복수의 표적 유전자에 작동 가능하게 연결된 전사 제어 요소, 또는 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열의 유전적 변형; 및/또는 복수의 표적 유전자를 포함하는 게놈 복합체, 예를 들어 ASMC의 수준의 감소(예를 들어, 이의 부재)를 나타낼 수 있다. 일부 구현예에서, 상기 복수의 표적 유전자의 발현의 감소, 후성유전학적 마커의 변형, 및/또는 유전적 변형을 나타내는 세포는 부위-특이적 파괴제를 포함하지 않는다. 표적 유전자의 발현의 감소, 후성유전학적 마커의 변형, 및/또는 유전적 변형은, 예를 들어 부위-특이적 파괴제와의 접촉 후에 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 지속될 수 있다. 일부 구현예에서, 부위-특이적 파괴제에 의해 사전에 접촉된 세포는 부위-특이적 파괴제가 세포 내에 더 이상 존재하지 않게 된 후에 복수의 표적 유전자의 발현의 감소, 후성유전학적 마커의 변형, 및/또는 유전적 변형을 보유하며, 예를 들어 부위-특이적 파괴제가 세포 내에 더 이상 존재하지 않게 된 후에 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 보유한다. 일부 구현예에서, 세포는 포유동물 세포, 예를 들어 인간 세포이다. 일부 구현예에서, 세포는 체세포 및/또는 1차 세포이다.
키트
추가로 본 개시내용은, 부분적으로, 본 명세서에 기재된 부위-특이적 파괴제, 시스템, 부위-특이적 파괴제를 인코딩하는 핵산, 또는 제1 부위-특이적 파괴제를 인코딩하는 제1 핵산 및 제2 부위-특이적 파괴제를 인코딩하는 제2 핵산을 포함하는 키트에 관한 것이다. 일부 구현예에서, 키트는 부위-특이적 파괴제, 시스템, 또는 이를 인코딩하는 핵산, 및 상기 부위-특이적 파괴제 또는 시스템의 사용에 대한 설명서를 포함한다. 일부 구현예에서, 키트는 부위-특이적 파괴제 또는 이의 성분(예를 들어, 부위-특이적 파괴제의 폴리펩티드 또는 핵산 부분)을 인코딩하는 핵산, 및 상기 핵산 및/또는 부위-특이적 파괴제의 사용에 대한 설명서를 포함한다. 일부 구현예에서, 키트는 부위-특이적 파괴제 또는 이의 성분(예를 들어, 부위-특이적 파괴제의 폴리펩티드 또는 핵산 부분)을 인코딩하는 핵산을 포함하는 세포, 및 상기 세포, 핵산, 및/또는 상기 부위-특이적 파괴제의 사용에 대한 설명서를 포함한다. 일부 구현예에서, 키트는 제1 부위-특이적 파괴제를 인코딩하는 제1 핵산 및 제2 부위-특이적 파괴제를 인코딩하는 제2 핵산 또는 이의 성분(예를 들어, 제1 및 제2 부위-특이적 파괴제의 폴리펩티드 또는 핵산 부분), 및 상기 핵산 및/또는 상기 시스템의 사용에 대한 설명서를 포함한다. 일부 구현예에서, 키트는 제1 부위-특이적 파괴제를 인코딩하는 핵산 또는 이를 인코딩하는 제1 핵산 및 제2 부위-특이적 파괴제를 인코딩하는 제2 핵산 또는 이의 성분(예를 들어, 제1 및 제2 부위-특이적 파괴제의 폴리펩티드 또는 핵산 부분)을 포함하는 세포, 및 상기 세포, 핵산 및/또는 상기 시스템의 사용에 대한 설명서를 포함한다.
일부 구현예에서, 키트는 본 명세서에 기재된 부위-특이적 파괴제의 단위 투약량, 또는 부위-특이적 파괴제를 인코딩하는 핵산, 예를 들어 벡터의 단위 투약량을 포함한다. 일부 구현예에서, 키트는 본 명세서에 기재된 시스템의 단위 투약량, 또는 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제를 인코딩하는 제1 및 제2 핵산, 예를 들어 벡터의 단위 투약량을 포함한다.
부위-특이적 파괴제를 제조하는 방법
일부 구현예에서, 부위-특이적 파괴제 또는 시스템은 하나 이상의 단백질을 포함하며, 따라서 단백질을 제조하는 방법에 의해 생성될 수 있다. 당업자에 의해 이해되는 바와 같이, (본 명세서에 기재된 바와 같은 조절제 내에 포함될 수 있는) 단백질 또는 폴리펩티드의 제조 방법은 당업계에서 일상적이다. 일반적으로, 문헌[Smales & James (Eds.), Therapeutic Proteins: Methods and Protocols (Methods in Molecular Biology), Humana Press (2005)]; 및 [Crommelin, Sindelar & Meibohm (Eds.), Pharmaceutical Biotechnology: Fundamentals and Applications, Springer (2013)]을 참조한다.
본 개시내용의 조성물의 단백질 또는 폴리펩티드는 표준 고상(solid phase) 기법을 사용함으로써 생화학적으로 합성될 수 있다. 그러한 방법은 전체 고상 합성 방법, 부분 고상 합성 방법, 단편 축합, 고전적 용액 합성을 포함한다. 이들 방법은 펩티드가 비교적 짧을 때(예를 들어, 10 kDa) 그리고/또는 그것이 재조합 기법에 의해 생성될 수 없을 때(즉, 핵산 서열에 의해 인코딩되지 않을 때) 사용될 수 있으며, 이에 따라 상이한 화학을 수반한다.
고상 합성 절차는 당업계에 잘 알려져 있으며, 문헌[John Morrow Stewart and Janis Dillaha Young, Solid Phase Peptide Syntheses, 2nd Ed., Pierce Chemical Company, 1984]; 및 문헌[Coin, I., et al., Nature Protocols, 2:3247-3256, 2007]에 의해 추가로 기재되어 있다.
더 긴 펩티드의 경우, 재조합 방법이 사용될 수 있다. 재조합 치료용 폴리펩티드의 제조 방법은 당업계에서 일상적이다. 일반적으로, 문헌[Smales & James (Eds.), Therapeutic Proteins: Methods and Protocols (Methods in Molecular Biology), Humana Press (2005)]; 및 문헌[Crommelin, Sindelar & Meibohm (Eds.), Pharmaceutical Biotechnology: Fundamentals and Applications, Springer (2013)]을 참조한다.
재조합 단백질은 또한 곤충 세포, 효모, 박테리아 또는 기타 세포를 사용하여 적절한 프로모터 제어 하에 생산될 수도 있지만, 치료적 약학 단백질 또는 폴리펩티드를 생산하기 위한 예시적인 방법은 포유동물 세포에서의 발현을 포함한다. 포유동물 발현 벡터는 복제 기점, 적합한 프로모터, 및 기타 5' 또는 3' 측접하는 비-전사 서열과 같은 비-전사 요소들, 및 필요한 리보솜 결합 부위, 폴리아데닐화 부위, 스플라이스 공여체 및 수용체 부위, 및 종료 서열과 같은 5' 또는 3' 비번역 서열을 포함할 수 있다. SV40 바이러스 게놈, 예를 들어 SV40 기원으로부터 유래된 DNA 서열, 초기 프로모터, 스플라이스 및 폴리아데닐화 부위는 이종 DNA 서열의 발현에 필요한 기타 유전자 요소를 제공하는 데 사용될 수 있다. 박테리아, 진균, 효모, 및 포유동물 세포 숙주와의 사용을 위한 적절한 클로닝과 발현 벡터가 문헌[Green & Sambrook, Molecular Cloning: A Laboratory Manual (Fourth Edition), Cold Spring Harbor Laboratory Press (2012)]에 기재되어 있다.
대량의 단백질 또는 폴리펩티드가 요구되는 경우, 그것은 문헌[Brian Bray, Nature Reviews Drug Discovery, 2:587-593, 2003]; 및 문헌[Weissbach & Weissbach, 1988, Methods for Plant Molecular Biology, Academic Press, NY, Section VIII, pp 421-463]에 기재된 바와 같은 기법을 사용하여 생성될 수 있다.
다양한 포유동물 세포 배양 시스템이 재조합 단백질을 발현하고 제조하는 데 사용될 수 있다. 포유동물 발현 시스템의 예에는 CHO 세포, COS 세포, HeLA 및 BHK 세포주가 포함된다. 단백질 치료제의 생산을 위한 숙주 세포 배양의 과정은 문헌[Zhou and Kantardjieff (Eds.), Mammalian Cell Cultures for Biologics Manufacturing (Advances in Biochemical Engineering/Biotechnology), Springer (2014)]에 기재되어 있다. 본 명세서에 기재된 조성물은 재조합 단백질을 인코딩하는, 벡터, 예컨대 바이러스 벡터, 예를 들어 렌티바이러스 벡터를 포함할 수 있다. 일부 구현예에서, 벡터, 예를 들어 바이러스 벡터는 재조합 단백질을 인코딩하는 핵산을 포함할 수 있다.
단백질 치료제의 정제는 문헌[Franks, Protein Biotechnology: Isolation, Characterization, and Stabilization, Humana Press (2013)]; 및 문헌[Cutler, Protein Purification Protocols (Methods in Molecular Biology), Humana Press (2010)]에 기재되어 있다. 단백질 치료제의 제형은 문헌[Meyer (Ed.), Therapeutic Protein Drug Products: Practical Approaches to formulation in the Laboratory, Manufacturing, and the Clinic, Woodhead Publishing Series (2012)]에 기재되어 있다. 단백질은 하나 이상의 아미노산을 포함한다. 아미노산은, 예를 들어 하나 이상의 펩티드 결합의 형성을 통해 폴리펩티드 사슬 내로 도입될 수 있는 임의의 화합물 및/또는 물질을 포함한다. 일부 구현예에서, 아미노산은 일반 구조 H2N-C(H)(R)-COOH를 갖는다. 일부 구현예에서, 아미노산은 자연 발생 아미노산이다. 일부 구현예에서, 아미노산은 비천연 아미노산이고; 일부 구현예에서, 아미노산은 D-아미노산이며; 일부 구현예에서, 아미노산은 L-아미노산이다. "표준 아미노산"은 자연 발생 펩티드에서 일반적으로 발견되는 20개의 표준 L-아미노산 중 임의의 것을 지칭한다. "비표준 아미노산"은 그것이 합성에 의해 제조되는지 또는 천연 공급원으로부터 수득되는지의 여부에 관계 없이 표준 아미노산 이외의 임의의 아미노산을 지칭한다. 일부 구현예에서, 폴리펩티드 내의 카르복시- 및/또는 아미노-말단 아미노산을 포함한 아미노산은 상기 일반적인 구조와 비교하여 구조적 변형을 포함할 수 있다. 예를 들어, 일부 구현예에서, 아미노산은 일반적인 구조와 비교하여 메틸화, 아미드화, 아세틸화, PEG화, 글리코실화, 인산화, 및/또는 치환(예를 들어, 아미노 기, 카르복실산 기, 하나 이상의 양성자, 및/또는 하이드록실 기의 치환)에 의해 변형될 수 있다. 일부 구현예에서, 그러한 변형은, 예를 들어 달리 동일한 비변형된 아미노산을 함유하는 것과 비교하여, 변형된 아미노산을 함유하는 폴리펩티드의 순환 반감기를 변경시킬 수 있다. 일부 구현예에서, 그러한 변형은, 달리 동일한 비변형된 아미노산을 함유하는 것과 비교하여, 변형된 아미노산을 함유하는 폴리펩티드의 관련 활성을 유의하게 변경시키지 않는다. 맥락으로부터 명백한 바와 같이, 일부 구현예에서, 용어 "아미노산"은 유리 아미노산을 지칭하는 데 사용될 수 있으며; 일부 구현예에서 그것은 폴리펩티드의 아미노산 잔기를 지칭하는 데 사용될 수 있다.
약제학적 조성물, 제형, 전달, 및 투여
추가로 본 개시내용은, 부분적으로, 본 명세서에 기재된 부위-특이적 파괴제를 포함하는 약제학적 조성물, 및 본 명세서에 기재된 부위-특이적 파괴제 또는 시스템을 인코딩하는 핵산을 포함하는 약제학적 조성물에 관한 것이다.
본 명세서에 사용되는 바와 같이, 용어 "약제학적 조성물"은 하나 이상의 약제학적으로 허용되는 담체(예를 들어, 당업자에게 알려진 약제학적으로 허용되는 담체)와 함께 제형화된 활성제(예를 들어, 부위-특이적 파괴제, 시스템, 또는 이를 인코딩하는 핵산)를 지칭한다. 일부 구현예에서, 활성제는 관련 집단에 투여될 때 사전결정된 치료적 효과를 달성할 통계학적으로 유의한 확률을 나타내는 치료 투약계획에서 투여하기에 적절한 단위 용량으로 존재한다. 일부 구현예에서, 약제학적 조성물은 본 개시내용의 부위-특이적 파괴제 또는 시스템을 포함한다.
일부 구현예에서, 약제학적 조성물은 고체 또는 액체 형태로의 투여를 위해 특수하게 제형화될 수 있으며, 이에는 하기에 맞게 구성된 것들이 포함된다: 경구 투여, 예를 들어 드렌치(drench)(수성 또는 비수성 용액 또는 현탁액), 정제, 예를 들어 협측, 설하, 및 전신 흡수를 목표로 한 것들, 볼루스, 분말, 과립, 혀에 적용하기 위한 페이스트; 비경구 투여, 예를 들어 피하, 근육내, 정맥내 또는 경막외 주사에 의한 투여, 예를 들어 멸균 용액 또는 현탁액, 또는 지속-방출 제형으로서의 주사; 국소 적용, 예를 들어 피부, 폐, 또는 구강에 적용되는 크림, 연고, 또는 제어-방출 패치 또는 스프레이로서의 적용; 질내 또는 직장내 투여, 예를 들어 페서리(pessary), 크림, 또는 폼(foam)으로서의 투여; 설하 투여; 안내 투여(ocularly); 경피 투여; 또는 비강, 폐, 및/또는 기타 다른 점막 표면 투여, 예를 들어 에어로졸, 수용액, 또는 현탁액. 일부 구현예에서, 조성물은 동결건조되거나 분무건조될 수 있다. 일부 구현예에서, 조성물은 폐 투여 및/또는 정맥내 투여를 위해 제형화될 수 있다.
본 명세서에 사용되는 바와 같이, 용어 "약제학적으로 허용되는"은, 적절한 의학적 판단의 범주 내에서, 과도한 독성, 자극, 알러지 반응, 또는 다른 문제 또는 합병증 없이 인간 및 동물의 조직과 접촉하여 사용하기에 적합하고, 합리적인 이익/위험 비에 부합하는 화합물, 물질, 조성물, 및/또는 투약 형태를 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "약제학적으로 허용되는 담체"는 대상 화합물을 하나의 기관, 또는 신체의 일부분을 또 다른 기관, 또는 신체의 일부분으로 운반 또는 수송하는 데 관여하는 약제학적으로 허용되는 물질, 조성물, 또는 비히클, 예컨대 액체 또는 고체 충전제, 희석제, 부형제, 또는 용매 캡슐화 물질을 의미한다. 각 담체는, 제형의 나머지 다른 성분들과 상용성이고 환자에게 해롭지 않다는 의미에서 "허용되어야" 한다. 일부 구현예에서, 예를 들어, 약제학적으로 허용되는 담체로서의 역할을 할 수 있는 물질은 하기를 포함한다: 당, 예컨대 락토스, 글루코스 및 수크로스; 전분, 예컨대 옥수수 전분 및 감자 전분; 셀룰로스, 및 이의 유도체, 예컨대 나트륨 카르복시메틸 셀룰로스, 에틸 셀룰로스 및 셀룰로스 아세테이트; 분말형 트래거캔스; 맥아; 젤라틴; 활석; 부형제, 예컨대 코코아 버터 및 좌제 왁스; 오일, 예컨대 땅콩유, 면실유, 홍화유, 참깨유, 올리브유, 옥수수유 및 대두유; 글리콜, 예컨대 프로필렌 글리콜; 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜; 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; 한천; 완충제, 예컨대 수산화마그네슘 및 수산화알루미늄; 알긴산; 무발열성 물(pyrogen-free water); 등장 식염수; 링거 용액; 에틸 알코올; pH 완충 용액; 폴리에스테르, 폴리카르보네이트 및/또는 폴리무수물; 및 약제학적 제형에 사용되는 기타 다른 무독성 상용성 물질.
본 명세서에 사용되는 바와 같이, "약제학적으로 허용되는 염"은 약제학적 맥락에서 사용하기에 적절한 그러한 화합물의 염, 즉, 적절한 의학적 판단의 범주 내에서, 과도한 독성, 자극, 알러지 반응 등 없이 인간 및 하등 동물의 조직과 접촉하여 사용하기에 적합하고, 합리적인 이익/위험 비에 부합하는 염을 지칭한다. 약제학적으로 허용되는 염은 당업계에 잘 알려져 있다. 예를 들어, S. M. Berge 외 다수는 문헌[J. Pharmaceutical Sciences, 66: 1-19 (1977)]에서 약제학적으로 허용되는 염을 상세히 기재한다. 일부 구현예에서, 약제학적으로 허용되는 염은 비독성 산 부가 염을 포함하지만 이로 한정되지 않으며, 이때 비독성 산 부가 염은 무기 산, 예컨대 염산, 브롬화수소산, 인산, 황산 및 과염소산과 함께 또는 유기 산, 예컨대 아세트산, 말레산, 타르타르산, 시트르산, 석신산, 또는 말론산과 함께 형성되는 아미노 기의 염이거나, 당업계에서 사용되는 다른 방법, 예컨대 이온 교환을 사용함으로써 형성된 것이다. 일부 구현예에서, 약제학적으로 허용되는 염은 아디페이트, 알기네이트, 아스코르베이트, 아스파르테이트, 벤젠설포네이트, 벤조에이트, 바이셀페이트, 보레이트, 부티레이트, 캄퍼레이트, 캄퍼설포네이트, 시트레이트, 사이클로펜탄프로피오네이트, 디글루코네이트, 도데실설페이트, 에탄설포네이트, 포르메이트, 푸마레이트, 글루코헵토네이트, 글리세로포스페이트, 글루코네이트, 헤미설페이트, 헵타노에이트, 헥사노에이트, 하이드로요오다이드, 2-하이드록시-에탄설포네이트, 락토바이오네이트, 락테이트, 라우레이트, 라우릴 설페이트, 말레이트, 말레에이트, 말로네이트, 메탄설포네이트, 2-나프탈렌설포네이트, 니코티네이트, 니트레이트, 올레에이트, 옥살레이트, 팔미테이트, 파모에이트, 펙티네이트, 퍼설페이트, 3-페닐프로피오네이트, 포스페이트, 피크레이트, 피발레이트, 프로피오네이트, 스테아레이트, 석시네이트, 설페이트, 타르트레이트, 티오시아네이트, p-톨루엔설포네이트, 운데카노에이트, 발레레이트 염 등을 포함하지만 이로 한정되지 않는다. 대표적인 알칼리 금속 또는 알칼리 토금속 염은 나트륨, 리튬, 칼륨, 칼슘, 마그네슘 등을 포함한다. 일부 구현예에서, 약제학적으로 허용되는 염은 적절한 경우, 비독성 암모늄, 4차 암모늄, 및 할라이드, 하이드록사이드, 카르복실레이트, 설페이트, 포스페이트, 니트레이트, 1 내지 6개의 탄소 원자를 갖는 알킬, 설포네이트, 및 아릴 설포네이트와 같은 반대이온을 사용하여 형성된 아민 양이온을 포함한다.
다양한 구현예에서, 본 개시내용은 약제학적으로 허용되는 부형제와 함께 본 명세서에 기재된 약제학적 조성물을 제공한다. 약제학적으로 허용되는 부형제는, 일반적으로 안전하고, 비독성이고, 바람직한 약제학적 조성물을 제조하는 데 유용한 부형제를 포함하고, 인간의 약제학적 용도뿐만 아니라 수의용 용도에 허용되는 부형제를 포함한다. 그러한 부형제는 고체, 액체, 반고체이거나, 에어로졸 조성물의 경우에는 가스상일 수 있다.
약제학적 제제는, 정제 형태에 대해서는 필요에 따라 밀링, 혼합, 과립화, 및 압축을; 또는 경질 젤라틴 캡슐 형태에 대해서는 밀링, 혼합, 및 충전을 수반하는 통상적인 조제 기법에 따라 제조될 수 있다. 액체 담체가 사용될 때, 제제는 시럽, 엘릭서, 에멀젼 또는 수성 또는 비수성 용액 또는 현탁액의 형태일 수 있다. 그러한 액체 제형은 직접 os(경구) 투여될 수 있다.
일부 구현예에서, 약제학적 조성물은 임의의 투여 경로를 통한 세포 및/또는 대상체에 대한 전달을 위해 제형화될 수 있다. 대상체에 대한 투여 방식은 주사, 주입, 흡입, 비강내, 안내(intraocular), 국소 전달, 캐뉼러간(inter-cannular) 전달, 또는 섭취를 포함할 수 있다. 주사는, 제한 없이, 정맥내, 근육내, 동맥내, 수강내, 뇌실내, 관절낭내, 안와내, 심장내, 피내, 복막내, 경기관(transtracheal), 피하, 표피하, 관절내, 기관지, 피막하, 지주막하, 척수내, 뇌척수내, 및 흉골내 주사 및 주입을 포함한다. 일부 구현예에서, 투여는 에어로졸 흡입, 예를 들어 네뷸라이제이션에 의한 에어로졸 흡입을 포함한다. 일부 구현예에서, 투여는 전신(예를 들어, 경구, 직장, 비강, 설하, 협측, 또는 비경구), 장내(예를 들어, 전신에 미치는 효과를 갖지만, 위장관을 통해 전달됨), 또는 국부(예를 들어, 피부 상에의 국부 적용, 유리체강내 주사) 투여이다. 일부 구현예에서, 하나 이상의 조성물이 전신 투여된다. 일부 구현예에서, 투여는 비경구외(non-parenteral) 투여이고, 치료제는 비경구 치료제이다. 일부 구현예에서, 투여는 기관지(예를 들어, 기관지 점적주입에 의함), 협측, 진피(이는, 예를 들어 진피, 피내, 피간, 경피 등에 대한 국소 투여 중 하나 이상일 수 있거나 이를 포함할 수 있음), 장내, 동맥내, 피내, 위내, 수내, 근육내, 비강내, 복막내, 수강내, 정맥내, 뇌실내, 특정 기관 내(예를 들어, 간내), 점막, 비강, 경구, 직장, 피하, 설하, 국소, 기관(tracheal)(예를 들어, 기관내 점적주입에 의함), 질내, 유리체 투여 등일 수 있다. 일부 구현예에서, 투여는 단회 용량일 수 있다. 일부 구현예에서, 투여는 간헐적(예를 들어, 복수의 용량이 시간적으로 분리됨) 및/또는 주기적(예를 들어, 개별 용량이 공통된 기간에 의해 분리됨) 투약을 수반할 수 있다. 일부 구현예에서, 투여는 적어도 선택된 기간 동안 연속 투약(예를 들어, 관류)을 수반할 수 있다. 일부 구현예에서, 6, 8, 10, 12, 15 또는 20회, 또는 그 이상의 투여가 1회 치료 동안 또는 치료 투약계획으로서 일정 기간에 걸쳐 대상체에게 제공될 수 있다. 일부 구현예에서, 예를 들어 질환, 장애 또는 병태와 연관된 증상이 지속되는 한, 필요에 따라 투여가 제공될 수 있다. 일부 구현예에서, 반복 투여는 대상체의 남은 생애 동안 필요할 수 있다. 치료 기간은 다양할 수 있으며, 예를 들어 1일, 2일, 3일, 1주, 2주, 1개월, 2개월, 3개월, 6개월, 1년, 또는 그 이상일 수 있다.
일부 구현예에서, 투여는 호흡 전달 장치, 예를 들어 네뷸라이저, 예를 들어 정량 흡입기, 예를 들어 건조 분말 흡입기를 사용하여 제공된다. 상업적으로 구매 가능한 건조 분말 흡입기 중 일부는 Spinhaler(Fisons Pharmaceuticals, 미국 뉴욕주 로체스터 소재) 및 Rotahaler(GSK, 미국 노스캐롤라이나주 RTP 소재)를 포함한다. 일부 구현예에서, 네뷸라이저는 제트 네뷸라이저, 초음파 네뷸라이저, 및/또는 진동 메쉬 네뷸라이저를 포함할 수 있다.
투약
본 개시내용에 따른 약제학적 조성물은 치료적 유효량으로 전달될 수 있다. 정확한 치료적 유효량은 주어진 대상체에서 치료 효능의 관점에서 가장 효과적인 결과를 가져오게 될 조성물의 양이다. 이 양은 치료적 화합물의 특성(활성, 약동학적 특성, 약력학적 특성, 및 생체이용률을 포함함), 대상체의 생리학적 조건(연령, 성별, 질환 유형 및 병기, 전반적인 신체적 상태, 주어진 투약량에 대한 반응, 및 약제의 유형을 포함함), 제형에서의 약제학적으로 허용되는 담체 또는 담체들의 성질, 및/또는 투여 경로를 포함하지만 이로 한정되지 않는 다양한 인자에 따라 달라질 것이다.
일부 양태에서, 본 개시내용은 치료제를 전달하는 방법을 제공하며, 상기 방법은 본 명세서에 기재된 바와 같은 조성물을 대상체에게 투여하는 단계를 포함하며, 여기서 게놈 복합체 조절제는 치료제이고/이거나 치료제의 전달은 치료제의 부재 하에서의 유전자 발현과 대비하여 유전자 발현의 변화를 야기한다.
본 명세서의 다양한 구현예에 제공된 바와 같은 방법이 본 명세서에 기재된 임의의 일부 양태에서 이용될 수 있다. 일부 구현예에서, 하나 이상의 조성물은 특정 세포, 또는 하나 이상의 특정 조직에 표적화된다.
예를 들어, 일부 구현예에서 하나 이상의 조성물은 상피, 결합, 근육, 및/또는 신경 조직 또는 세포에 표적화된다. 일부 구현예에서, 조성물은, 예를 들어 다음과 같은 특정 기관계의 세포 또는 조직에 표적화된다: 호흡계(인두, 후두, 기관, 기관지, 폐, 횡격막); 심혈관계(심장, 혈관계); 소화계(식도, 위, 간, 담낭, 췌장, 장, 결장, 직장 및 항문); 내분비계(시상하부, 뇌하수체, 송과체 또는 송과선, 갑상선, 부갑상선, 부신); 배설계(신장, 요관, 방광); 림프계(림프, 림프절, 림프관, 편도선, 인두편도, 흉선, 비장); 외피계(피부, 모발, 손발톱); 근육계(예를 들어, 골격근); 신경계(뇌, 척수, 신경); 생식기계(난소, 자궁, 유선, 고환, 수정관, 정낭, 전립선); 골격계(뼈, 연골); 및/또는 이들의 조합. 일부 구현예에서, 조성물은 세포, 예를 들어 내피 세포, 폐포 세포, 상피 세포, 간세포, 성상 세포, 쿠퍼 세포, 윤활층, 연골세포, 섬유아세포, 관상피 세포, 상피 장세포, 배상세포, 기저 세포, 및/또는 면역 세포로 표적화된다. 일부 구현예에서, 조성물은 기관의 세포, 예를 들어 비강 세포, 폐 세포, 회장 세포, 심장 세포, 시각 세포, 간 세포, 방광 세포, 췌장 세포, 신장 세포, 뉴런 세포, 전립선 세포, 고환 세포로 표적화된다.
일부 구현예에서, 본 개시내용의 조성물은 혈액-뇌 장벽, 태반막, 또는 혈액-고환 장벽을 횡단한다. 일부 구현예에서, 조성물은 ACE-2 수용체를 발현하는 세포로 표적화된다.
일부 구현예에서, 본 명세서에 제공된 바와 같은 약제학적 조성물은 전신 투여된다.
일부 구현예에서, 투여는 비경구외 투여이고, 치료제는 비경구 치료제이다.
일부 구현예에서, 본 개시내용의 약제학적 조성물은 활성제 단독과 비교하여 개선된 PK/PD, 예를 들어 증가된 약동학적 특성 또는 약력학적 특성, 예컨대 개선된 표적화, 흡수, 또는 수송(예를 들어, 적어도 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 75%, 80%, 90% 개선되거나 그 이상임)을 갖는다. 일부 구현예에서, 약제학적 조성물은 치료제 단독과 비교하여 바람직하지 않은 효과의 감소, 예컨대 비표적 위치로의 확산, 탈표적(off-target) 활성, 또는 독성 대사의 감소를 갖는다(예를 들어, 활성제 단독과 대비하여 적어도 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 75%, 80%, 90% 또는 그 이상이 감소됨). 일부 구현예에서, 조성물은 활성제 단독과 비교하여 (예를 들어, 적어도 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 75%, 80%, 90% 또는 그 이상) 치료제의 효능을 증가시키고/시키거나 독성을 감소시킨다.
본 명세서에 기재된 약제학적 조성물은, 예를 들어 담체, 예컨대 약제학적 담체 및/또는 중합체 담체, 예를 들어 리포좀 또는 소포를 포함하는 것으로 제형화되고, 알려진 방법에 의해 이를 필요로 하는 대상체(예를 들어, 인간 또는 비인간 농업용 동물 또는 가축 동물, 예를 들어 소, 개, 고양이, 말, 가금류)에게 전달될 수 있다. 그러한 방법은 형질감염(예를 들어, 지질-매개, 양이온성 중합체, 인산칼슘); 전기천공 또는 막 파괴(예를 들어, 뉴클레오펙션(nucleofection)) 및 바이러스 전달(예를 들어, 렌티바이러스, 레트로바이러스, 아데노바이러스, AAV)의 기타 다른 방법을 포함한다. 전달 방법은 또한, 예를 들어 문헌[Gori et al., Delivery and Specificity of CRISPR/Cas9 Genome Editing Technologies for Human Gene Therapy. Human Gene Therapy. July 2015, 26(7): 443-451. doi:10.1089/hum.2015.074]; 및 문헌[Zuris et al. Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo. Nat Biotechnol. 2014 Oct 30;33(1):73-80]에 기재되어 있다.
지질 나노입자
본 명세서에 기재된 바와 같은 부위-특이적 파괴제는 입자를 포함한 임의의 생물학적 전달 시스템/제형, 예를 들어 나노입자 전달 시스템을 사용하여 전달될 수 있다. 나노입자는 치수(예를 들어, 직경)가 약 1 내지 약 1000 나노미터, 약 1 내지 약 500 나노미터 크기, 약 1 내지 약 100 nm, 약 30 nm 내지 약 200 nm, 약 50 nm 내지 약 300 nm, 약 75 nm 내지 약 200 nm, 약 100 nm 내지 약 200 nm, 및 이들 사이의 임의의 범위인 입자를 포함한다. 나노입자는 나노규모 치수들의 복합 구조를 갖는다. 일부 구현예에서, 나노입자는 통상적으로 구형이지만, 나노입자 조성에 따라 상이한 모폴로지가 가능하다. 나노입자의 외부 환경과 접촉해 있는 나노입자의 일부분은 일반적으로 나노입자의 표면으로서 확인된다. 일부 구현예에서, 나노입자는 최대 치수가 25 nm 내지 200 nm의 범위이다. 본 명세서에 기재된 바와 같은 나노입자는 고체, 반고체, 에멀젼, 또는 콜로이드성 나노입자를 포함하지만 이로 한정되지 않는 임의의 형태로 제공될 수 있는 전달 시스템을 포함한다. 나노입자 전달 시스템은 지질-기반 시스템, 리포좀, 미셀, 마이크로소포, 엑소솜, 또는 유전자 총(gene gun)을 포함할 수 있지만 이로 한정되지 않는다. 일 구현예에서, 나노입자는 지질 나노입자(LNP)이다. 일부 구현예에서, LNP는 분자간력에 의해 서로 물리적으로 회합된 복수의 지질 분자를 포함하는 입자이다. 일부 구현예에서, LNP는 다수의 성분, 예를 들어 3개 또는 4개의 성분을 포함할 수 있다. 일 구현예에서, 부위-특이적 파괴제 또는 상기 부위-특이적 파괴제를 포함하는 약제학적 조성물(또는 상기 부위-특이적 파괴제를 인코딩하는 핵산, 또는 상기 부위-특이적 파괴제를 인코딩하는 핵산을 포함하는 약제학적 조성물)이 LNP 내에 캡슐화된다. 일 구현예에서, 시스템, 또는 상기 시스템을 포함하는 약제학적 조성물(또는 상기 시스템을 인코딩하는 핵산, 또는 상기 시스템을 인코딩하는 핵산을 포함하는 약제학적 조성물)이 LNP 내에 캡슐화된다. 일부 구현예에서, 제1 부위-특이적 파괴제를 인코딩하는 핵산과 제2 부위-특이적 파괴제를 인코딩하는 핵산은 동일한 LNP 내에 존재한다. 일부 구현예에서, 제1 부위-특이적 파괴제를 인코딩하는 핵산과 제2 부위-특이적 파괴제를 인코딩하는 핵산은 상이한 LNP 내에 존재한다. LNP의 제조 및 조절제 캡슐화가 사용될 수 있고/있거나 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, December 2011]으로부터 변형될 수 있다. 일부 구현예에서, 본 명세서에 개시된 지질 나노입자 조성물은 mRNA에 의해 인코딩된 단백질의 발현에 유용하다. 일부 구현예에서, 핵산은, 지질 나노입자 내에 존재할 때, 수용액 중에서 뉴클레아제에 의한 분해에 저항한다.
일부 구현예에서, LNP 제형은 CCD 지질, 중성 지질, 및/또는 헬퍼 지질을 포함할 수 있다. 일부 구현예에서, LNP 제형은 이온화 가능한 지질을 포함한다. 일부 구현예에서, 이온화 가능한 지질은 양이온성 지질, 이온화 가능한 양이온성 지질, 또는 용이하게 양성자화될 수 있는 아민-함유 지질일 수 있다. 일부 구현예에서, 지질은 pH에 따라 양으로 하전된 형태 또는 중성 형태로 존재할 수 있는 양이온성 지질이다. 일부 구현예에서, 양이온성 지질은, 예를 들어 생리학적 조건 하에서 양으로 하전될 수 있는 지질이다. 일부 구현예에서, 지질 입자는 중성 지질, 이온화 가능한 아민-함유 지질, 생분해성 알킨 지질, 스테로이드, 인지질(다가불포화 지질을 포함함), 구조 지질(예를 들어, 스테롤), PEG, 콜레스테롤, 및 중합체 접합된 지질 중 하나 이상과 함께 제형 내에 양이온성 지질을 포함한다.
일부 구현예에서, LNP 제형(예를 들어, MC3 및/또는 SSOP)은 콜레스테롤, PEG, 및/또는 헬퍼 지질을 포함한다. LNP는, 예를 들어 미소구체, 예컨대 단층 및 다층 소포, 라멜라 상 지질 이중층일 수 있으며, 이는 일부 구현예에서 실질적으로 구형이다.
일부 구현예에서, LNP는 수성 코어, 예를 들어 본 명세서에 개시된 바와 같은 부위-특이적 파괴제 또는 시스템을 인코딩하는 핵산을 포함하는 수성 코어를 포함할 수 있다. 본 개시내용의 일부 구현예에서, LNP 제형을 위한 카고는 적어도 하나의 가이드 RNA를 포함한다. 일부 구현예에서, 카고, 예를 들어 본 명세서에 개시된 바와 같은 부위-특이적 파괴제, 또는 시스템을 인코딩하는 핵산은 LNP, 예를 들어 양이온성 지질을 포함하는 LNP의 표면에 흡착될 수 있다. 일부 구현예에서, 카고, 예를 들어 본 명세서에 개시된 바와 같은 부위-특이적 파괴제, 또는 시스템을 인코딩하는 핵산은 LNP와 회합될 수 있다. 일부 구현예에서, 카고, 예를 들어 본 명세서에 개시된 바와 같은 부위-특이적 파괴제, 또는 시스템을 인코딩하는 핵산은 LNP 내에 캡슐화되며, 예를 들어 완전 캡슐화 및/또는 부분 캡슐화될 수 있다.
일부 구현예에서, 카고를 포함하는 LNP는 전신 전달, 예를 들어 유기체 내에서 활성제의 폭넓은 노출을 초래할 수 있는 카고의 치료적 유효 용량의 전달을 위해 투여될 수 있다. 지질 나노입자의 전신 전달은, 예를 들어 정맥내, 폐, 기관지, 동맥내, 피하, 및 복막내 전달일 수 있다. 일부 구현예에서, 지질 나노입자의 전신 전달은 정맥내 전달에 의해 수행된다. 일부 구현예에서, 카고를 포함하는 LNP는 국부 전달, 예를 들어 유기체 내의 표적 부위로의 활성제의 직접 전달을 위해 투여될 수 있다. 일부 구현예에서, LNP는 질환 부위, 예를 들어 종양, 기타 다른 표적 부위, 예를 들어 염증 부위, 또는 표적 기관, 예를 들어 간, 폐, 위, 결장, 췌장, 자궁, 유방, 림프절 등으로 국부 전달될 수 있다. 일부 구현예에서, 본 명세서에 개시된 바와 같은 LNP는 특정 세포, 예를 들어 간세포, 성상 세포, 쿠퍼 세포, 내피 세포, 폐포 세포, 및/또는 상피 세포로 국부 전달될 수 있다. 일부 구현예에서, 본 명세서에 개시된 바와 같은 LNP는 특정 종양 부위, 예를 들어 피하, 동소(orthotopic) 부위로 국부 전달될 수 있다.
LNP는 에멀젼 중에 분산상으로서, 미셀로서, 또는 현탁액 중에 내부상으로서 제형화될 수 있다. 일부 구현예에서, LNP는 생분해성이다. 일부 구현예에서, LNP는 치료적 유효 용량에서 세포독성 수준으로 축적되지 않거나 생체내에서 독성을 야기하지 않는다. 일부 구현예에서, LNP는 치료적 유효 용량으로 반복 투여 후에 세포독성 수준으로 축적되지 않거나 생체내에서 독성을 야기하지 않는다. 일부 구현예에서, LNP는 치료적 유효 용량에서 실질적으로 유해한 효과로 이어지는 선천성 면역 반응을 야기하지 않는다.
일부 구현예에서, 사용되는 LNP는 화학식 (6Z,9Z,28Z,31Z)-헵타트리아콘트-6,9,28,31-테트라엔-19-일 4-(디메틸아미노) 부타노네이트 또는 ssPalmO-페닐-P4C2(ssPalmOPhe, SS-OP)를 포함한다. 일부 구현예에서, LNP 제형은 화학식 (6Z,9Z,28Z,31Z)-헵타트리아콘트-6,9,28,31-테트라엔-19-일 4-(디메틸아미노)부타노네이트(MC3), 1,2-디올레오일-sn-글리세로-3-포스포콜린(DOPC), 콜레스테롤, 1,2-디미리스토일-rac-글리세로-3-메톡시폴리에틸렌 글리콜-2000(PEG2k-DMG), 예를 들어 MC3 LNP 또는 ssPalmO-페닐-P4C2(ssPalmOPhe, SS-OP), 1,2-디올레오일-sn-글리세로-3-포스포콜린(DOPC), 콜레스테롤, 1,2-디미리스토일-rac-글리세로-3-메톡시폴리에틸렌 글리콜-2000(PEG2k-DMG), 예를 들어 SSOP-LNP를 포함한다.
리포좀은 내부 수성 구획을 둘러싸는 단층 또는 다층 지질 이중층 및 상대적으로 불투과성인 외측 친유성 인지질 이중층으로 구성된 구형의 소포 구조이다. 리포좀은 음이온성, 중성, 또는 양이온성일 수 있다. 리포좀은 생체적합성이고, 비독성이며, 친수성 및 친유성 약물 분자 둘 모두를 전달하고, 혈장 효소에 의한 분해로부터 그들의 카고(cargo)를 보호하고, 생물학적 막 및 혈액-뇌 장벽(BBB)을 가로질러 그들의 로드를 수송할 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조).
소포는 몇몇 상이한 유형의 지질로부터 제조될 수 있지만, 약물 담체로서 리포좀을 생성하는 데 인지질이 가장 일반적으로 사용된다. 소포는, 제한 없이, DOTMA, DOTAP, DOTIM, DDAB를 단독으로 또는 콜레스테롤과 함께 포함하여 DOTMA와 콜레스테롤, DOTAP와 콜레스테롤, DOTIM과 콜레스테롤, 및 DDAB와 콜레스테롤을 생성할 수 있다. 다층 소포 지질의 제조 방법은 당업계에 알려져 있다(예를 들어, 미국 특허 6,693,086을 참조하며, 다층 소포 지질 제조에 관한 이의 교시내용은 본 명세서에 참고로 포함됨). 지질 필름이 수용액과 혼합될 때 소포 형성이 자발적일 수 있지만, 그것은 또한 균질기, 초음파처리기, 또는 압출 장치를 사용함으로써 전단 형태로 힘을 인가함으로써 촉진될 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. doi:10.1155/2011/469679] 참조). 문헌[Templeton et al., Nature Biotech, 15:647-652, 1997]에 기재된 바와 같이, 크기 감소 필터를 통해 압출함으로써 압출된 지질이 제조될 수 있으며, 압출된 지질 제조에 관한 이의 교시내용은 본 명세서에 참고로 포함된다.
본 명세서에 제공된 방법 및 조성물은 질환, 장애, 및/또는 병태의 증상을 경감시키는 충분한 투약계획에 의해 투여되는 약제학적 조성물을 포함할 수 있다. 일부 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물을 투여함으로써 치료제를 전달하는 방법을 제공한다.
용도
본 개시내용은 추가로 본 명세서에 개시된 부위-특이적 파괴제 또는 시스템의 용도에 관한 것이다. 특히, 일부 구현예에서 그러한 제공된 기술은 복수의 표적 유전자 발현의 조절, 예를 들어 억제를 달성하는 데, 그리고 예를 들어, 이를 테면 세포 내에서의 복수의 표적 유전자 중 하나 이상 생성물의 활성, 전달, 및 침투의 제어를 가능하게 하는 데 사용될 수 있다. 일부 구현예에서, 세포는 포유동물 세포, 예를 들어 인간 세포이다. 일부 구현예에서, 세포는 체세포이다. 일부 구현예에서, 세포는 1차 세포이다. 예를 들어, 일부 구현예에서, 세포는 포유동물 체세포이다. 일부 구현예에서, 포유동물 체세포는 1차 세포이다. 일부 구현예에서, 포유동물 체세포는 비배아 세포이다.
유전자 발현의 조절
추가로 본 개시내용은, 부분적으로, 복수의 표적 전자의 발현을 조절하는, 예를 들어 감소시키는 방법에 관한 것으로, 상기 방법은 본 명세서에 기재된 부위-특이적 파괴제 또는 시스템(또는 이를 인코딩하는 핵산, 또는 상기 부위-특이적 파괴제 또는 핵산을 포함하는 약제학적 조성물)을 제공하는 단계, 및 복수의 표적 유전자, 복수의 표적 유전자와 연관된 앵커 서열, 및/또는 복수의 표적 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)를 부위-특이적 파괴제 또는 시스템과 접촉시키는 단계를 포함한다. 일부 구현예에서, 복수의 표적 유전자의 발현을 조절하는, 예를 들어 감소시키는 것은 참조값, 예를 들어 부위-특이적 파괴제 또는 시스템의 부재 하에서의 유전자의 전사와 비교하여 복수의 표적 유전자 중 유전자의 전사의 조절을 포함한다. 일부 구현예에서, 복수의 표적 유전자의 발현을 조절하는, 예를 들어 감소시키는 방법은 생체외에서, 예를 들어 대상체, 예를 들어 포유동물 대상체, 예를 들어 인간 대상체 유래의 세포 상에서 사용된다. 일부 구현예에서, 세포는 포유동물 세포, 예를 들어 인간 세포이다. 일부 구현예에서, 세포는 체세포이다. 일부 구현예에서, 세포는 1차 세포이다. 일부 구현예에서, 복수의 표적 유전자의 발현을 조절하는, 예를 들어 감소시키는 방법은 생체내에서, 예를 들어 포유동물 대상체, 예를 들어 인간 대상체에서 사용된다. 일부 구현예에서, 복수의 표적 유전자의 발현을 조절하는, 예를 들어 감소시키는 방법은 시험관내에서, 예를 들어 본 명세서에 기재된 세포 또는 세포주에서 사용된다.
이론에 의해 구애되고자 함이 없이, 일부 구현예에서 부위-특이적 파괴제 또는 시스템은 복수의 표적 유전자를 포함하는 게놈 복합체, 예를 들어 ASMC의 앵커 서열에 결합하고, 다음 효과 중 1, 2개, 또는 모두를 가짐으로써 복수의 표적 유전자의 발현을 조절할 수 있는 것으로 생각된다: 앵커 서열에 대한 게놈 복합체 성분(예를 들어, 핵형성 폴리펩티드)의 결합을 물리적 또는 입체적으로 차단함(예를 들어, 경쟁적으로 억제함); 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 또는 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열을 후성유전학적으로 변형시킴(예를 들어, 이에 의해 앵커 서열에 대한 게놈 복합체 성분, 예를 들어 핵형성 폴리펩티드의 결합을 감소시키고/시키거나 제거함); 또는 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 또는 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열을 유전적으로 변형시킴(예를 들어, 이에 의해 앵커 서열에 대한 게놈 복합체 성분, 예를 들어 핵형성 폴리펩티드의 결합을 감소시키고/시키거나 제거함).
일부 구현예에서, 본 명세서에 기재된 방법은 복수의 표적 유전자 중 2개 이상 유전자의 발현을 조절하며, 예를 들어 감소시킨다. 일부 구현예에서, 본 명세서에 기재된 방법은 복수의 표적 유전자 중 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개(및 선택적으로 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 30개 이하)의 유전자의 발현을 조절하며, 예를 들어 감소시킨다. 일부 구현예에서, 본 명세서에 기재된 방법은 복수의 표적 유전자 중 2 내지 20개, 2 내지 18개, 2 내지 16개, 2 내지 14개, 2 내지 12개, 2 내지 10개, 2 내지 9개, 2 내지 8개, 2 내지 7개, 2 내지 6개, 2 내지 5개, 2 내지 4개, 2 내지 3개, 3 내지 20개, 3 내지 18개, 3 내지 16개, 3 내지 14개, 3 내지 12개, 3 내지 10개, 3 내지 9개, 3 내지 8개, 3 내지 7개, 3 내지 6개, 3 내지 5개, 3 내지 4개, 4 내지 20개, 4 내지 18개, 4 내지 16개, 4 내지 14개, 4 내지 12개, 4 내지 10개, 4 내지 9개, 4 내지 8개, 4 내지 7개, 4 내지 6개, 4 내지 5개, 5 내지 20개, 5 내지 18개, 5 내지 16개, 5 내지 14개, 5 내지 12개, 5 내지 10개, 5 내지 9개, 5 내지 8개, 5 내지 7개, 5 내지 6개, 6 내지 20개, 6 내지 18개, 6 내지 16개, 6 내지 14개, 6 내지 12개, 6 내지 10개, 6 내지 9개, 6 내지 8개, 6 내지 7개, 7 내지 20개, 7 내지 18개, 7 내지 16개, 7 내지 14개, 7 내지 12개, 7 내지 10개, 7 내지 9개, 7 내지 8개, 8 내지 20개, 8 내지 18개, 8 내지 16개, 8 내지 14개, 8 내지 12개, 8 내지 10개, 8 내지 9개, 9 내지 20개, 9 내지 18개, 9 내지 16개, 9 내지 14개, 9 내지 12개, 9 내지 10개, 10 내지 20개, 10 내지 18개, 10 내지 16개, 10 내지 14개, 10 내지 12개, 12 내지 20개, 12 내지 18개, 12 내지 16개, 12 내지 14개, 14 내지 20개, 14 내지 18개, 14 내지 16개, 16 내지 20개, 16 내지 18개, 또는 18 내지 20개 유전자의 발현을 조절하며, 예를 들어 감소시킨다. 일부 구현예에서, 본 명세서에 기재된 방법은 복수의 표적 유전자 중 각각의 유전자(예를 들어, 모든 유전자)의 발현을 조절하며, 예를 들어 감소시킨다.
일부 구현예에서, 본 명세서에 기재된 방법은 복수의 표적 유전자 중 유전자의 발현을 조절하며, 예를 들어 감소시키고, 유전자 중 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상, 예를 들어 모두)은 사이토카인, 인터류킨, 전사 인자(예를 들어, 인터페론 조절 전사 인자), 세포간 접착 분자(ICAM), 또는 인터페론 수용체이다. 일부 구현예에서, 본 명세서에 기재된 방법은 복수의 표적 유전자 중 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상, 예를 들어 모두)의 유전자로부터 생성된 RNA, 예를 들어 mRNA의 수준을 조절하며, 예를 들어 감소시킨다. 일부 구현예에서, 발현을 조절하는 것은 복수의 표적 유전자 중 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상, 예를 들어 모두)의 유전자로부터 생성된 단백질의 수준을 감소시키는 것을 포함한다. 일부 구현예에서, 발현을 조절하는 것은 복수의 표적 유전자 중 하나 이상(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 이상, 예를 들어 모두)의 유전자로부터 생성된 mRNA 및 단백질의 수준을 둘 모두 감소시키는 것을 포함한다. 일부 구현예에서, 감소는 처리 전 수준 또는 부위-특이적 파괴제의 부재 하의 수준과 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90%의 감소이다.
일부 구현예에서, 본 명세서에 기재된 방법은, 예를 들어 실시예 2 또는 4 내지 11 중 임의의 것의 검정법을 사용하여, 예를 들어 세포를 TNF-알파로 자극 시, 인간 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 및 IL8 중 하나 이상(예를 들어, 이들 중 1, 2, 3개, 또는 모두)의 발현을 조절하며, 예를 들어 감소시킨다. 일부 구현예에서, 본 명세서에 기재된 방법은, 예를 들어 실시예 14의 검정법을 사용하여, 예를 들어 세포를 TNF-알파로 자극 시, 마우스 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL7, 및 CXCL15 중 하나 이상(예를 들어, 이들 중 1, 2, 3개, 또는 모두)의 발현을 조절하며, 예를 들어 감소시킨다.
일부 구현예에서, 본 명세서에 기재된 방법은 앵커 서열에 대한 핵형성 폴리펩티드, 예를 들어 CTCF의 결합을 감소시킨다. 일부 구현예에서, 세포를 부위-특이적 파괴제와 접촉시키는 것 또는 부위-특이적 파괴제를 투여하는 것은 앵커 서열(예를 들어, 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열)에 대한 핵형성 폴리펩티드, 예를 들어 CTCF의 결합의 감소를 초래한다. 일부 구현예에서, 세포를 부위-특이적 파괴제와 접촉시키는 것 또는 부위-특이적 파괴제를 투여하는 것은, 예를 들어 ChIP 및/또는 정량적 PCR에 의해 측정될 때, 부위-특이적 파괴제 또는 시스템으로 처리하기 전 또는 부위-특이적 파괴제 또는 시스템의 부재 하의 앵커 서열에 대한 핵형성 폴리펩티드(예를 들어, CTCF)의 결합과 대비하여 결합의 완전한 손실 또는 적어도 50, 60, 70, 80, 90, 95, 또는 99%의 감소를 초래한다.
추가로 본 개시내용은, 부분적으로, 대상체에서 복수의 표적 유전자의 과발현과 연관된 병태를 치료하는 방법에 관한 것으로, 상기 방법은 본 명세서에 기재된 부위-특이적 파괴제, 시스템, 핵산, 벡터, 세포, 또는 약제학적 조성물을 대상체에게 투여하는 단계를 포함한다. 특정 유전자의 과발현과 연관된 병태는 당업자에게 알려져 있다. 그러한 병태는 대사 장애, 신경근육 장애, 암(예를 들어, 고형 종양), 섬유증, 당뇨병, 우레아 장애, 면역 장애, 염증, 및 관절염을 포함하지만 이로 한정되지 않는다. 일부 구현예에서, 장애는 자가면역 장애이다. 일부 구현예에서, 장애는 감염, 예를 들어 바이러스 감염, 예를 들어 SARS-Cov2 바이러스 감염과 연관되거나 이에 의해 유발된다.
추가로 본 개시내용은, 부분적으로, 대상체, 예를 들어 인간 대상체의 세포에서 복수의 표적 유전자의 발현을 조절하는, 예를 들어 감소시키는 방법에 관한 것이다. 일부 구현예에서, 대상체는 질환 또는 병태를 갖는다. 일부 구현예에서, 질환은 염증성 질환, 예를 들어 면역 매개 염증성 질환이다. 일부 구현예에서, 질환 또는 병태는 류마티스 관절염, 통풍, 천식, 호중구 천식, 호중구 피부병, 발 부종, 급성 호흡기 질환 증후군(ARDS), COVID-19, 건선, 염증성 장 질환, 감염(예를 들어, 병원균, 예를 들어 박테리아, 바이러스, 또는 진균에 의한 감염), 외상(예를 들어, 찰과상 또는 이물질), 방사선 또는 화학적 손상의 영향, 골관절염, 골관절염 관절 통증, 관절 통증, 염증성 통증, 급성 통증, 만성 통증, 방광염, 기관지염, 피부염, 심혈관계 질환, 신경퇴행성 질환, 간 질환, 폐 질환, 신장 질환, 통증, 종창, 경직, 압통, 발적, 미열, 또는 질환 상태와 관련된 바이오마커(예를 들어, 사이토카인, 면역 수용체, 또는 염증성 마커)의 상승 중 하나 이상이다. 일부 구현예에서, 염증성 장애는, 예를 들어 바이러스, 예를 들어 Sars-Cov-2 바이러스에 의한 감염과 연관된다. 일부 구현예에서, 염증성 장애는 자가면역 장애이다.
본 명세서에 제공된 바와 같은 방법 및 조성물은 복수의 표적 유전자의 전사를 안정하게 또는 일시적으로 변경시킴으로써(예를 들어, 감소시킴으로써) 복수의 표적 유전자의 과발현과 연관된 병태를 치료할 수 있다. 일부 구현예에서, 그러한 조절은 적어도 약 1시간 내지 약 30일, 또는 적어도 약 2시간, 6시간, 12시간, 18시간, 24시간, 2일, 3일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 16일, 17일, 18일, 19일, 20일, 21일, 22일, 23일, 24일, 25일, 26일, 27일, 28일, 29일, 30일, 또는 더 긴 시간 동안 또는 이들 사이의 임의의 시간 동안 지속된다. 일부 구현예에서, 그러한 조절은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 또는 7일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 지속된다. 선택적으로, 그러한 조절은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하의 기간 동안 지속된다.
일부 구현예에서, 본 명세서에 제공된 방법 또는 조성물은 상기 조성물에 의해 접촉되지 않거나 상기 방법으로 처리되지 않은 세포 내의 복수의 표적 유전자 중 유전자의 발현 대비 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%(그리고 선택적으로, 최대 100%)만큼 세포 내의 복수의 표적 유전자 중 유전자의 발현을 감소시킬 수 있다. 일부 구현예에서, 본 명세서에 제공된 방법 또는 조성물은 상기 조성물에 의해 접촉되지 않거나 상기 방법으로 처리되지 않은 세포 내의 복수의 표적 유전자 중 각 유전자의 발현 대비 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%(그리고 선택적으로, 최대 100%)만큼 세포 내의 복수의 표적 유전자 중 각 유전자의 발현을 감소시킬 수 있다.
일부 구현예에서, 본 명세서에 제공된 방법은 상기 복수의 표적 유전자를 포함하는 게놈 복합체, 예를 들어 앵커 서열-매개 연접부를 파괴함으로써 복수의 표적 유전자의 발현을 조절할, 예를 들어 감소시킬 수 있다. 일부 구현예에서, 본 명세서에 기재된 방법은 게놈 복합체(예를 들어, ASMC)를 파괴한다. 일부 구현예에서, 세포를 부위-특이적 파괴제와 접촉시키는 것 또는 부위-특이적 파괴제를 투여하는 것은 부위-특이적 파괴제 또는 시스템으로 처리하기 전 또는 부위-특이적 파괴제 또는 시스템의 부재 하의 복합체의 수준과 대비하여 복수의 표적 유전자를 포함하는 게놈 복합체(예를 들어, ASMC)의 수준의 감소를 초래한다. 일부 구현예에서, 세포를 부위-특이적 파괴제와 접촉시키는 것 또는 부위-특이적 파괴제를 투여하는 것은, 예를 들어 ChIA-PET, ELISA(예를 들어, 유전자 발현 변화를 평가하기 위함), CUT&RUN, ATAC-SEQ, ChIP 및/또는 정량적 PCR에 의해 측정될 때, 부위-특이적 파괴제 또는 시스템으로 처리하기 전 또는 부위-특이적 파괴제 또는 시스템의 부재 하의 복합체의 수준과 대비하여 게놈 복합체, 예를 들어 ASMC의 완전한 손실, 또는 적어도 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 95, 또는 99%의 감소를 초래한다.
일부 구현예에서, 본 명세서에 제공된 바와 같은 방법 및 조성물은 염증 부위에서 사이토카인의 동원을 감소시킴으로써 염증 캐스케이드 또는 사이토카인 폭풍과 연관된 병태를 치료할 수 있다. 일부 구현예에서, 염증 캐스케이드 및/또는 사이토카인 폭풍은 염증성 장애, 예를 들어 바이러스 매개 염증성 장애, 예를 들어 COVID-19 감염과 연관된다. 일부 구현예에서, 염증성 장애는, 예를 들어 바이러스, 예를 들어 Sars-Cov-2 바이러스에 의한 감염과 연관된다. 일부 구현예에서, 염증성 장애는 자가면역 장애이다. 일부 구현예에서, 염증성 장애는 저산소증과 연관된다. 일부 구현예에서, 염증성 장애는 ARDS, 저산소증, 및/또는 패혈증과 연관된다. 일부 구현예에서, 감염은, 예를 들어 하나 초과의 병원균, 예를 들어 제1 바이러스 또는 박테리아, 또는 진균, 및 제2 바이러스, 또는 제2 박테리아, 또는 제2 진균에 의해 유발되는 중복 감염이다.
후성유전학적 변형
추가로 본 개시내용은, 부분적으로, 복수의 표적 유전자 중 하나 이상(예를 들어, 모두)의 유전자; 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소; 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열; 또는 상기 앵커 서열에 근접한 부위를 후성유전학적으로 변형시키는 방법에 관한 것으로, 상기 방법은 부위-특이적 파괴제, 시스템, 부위-특이적 파괴제를 인코딩하는 핵산, 시스템의 성분을 인코딩하는 핵산, 또는 상기 부위-특이적 파괴제, 시스템 또는 핵산을 포함하는 약제학적 조성물을 제공하는 단계; 및 복수의 표적 유전자 중 하나 이상(예를 들어, 모두)의 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위를 부위-특이적 파괴제 또는 시스템과 접촉시키는 단계를 포함하며, 이에 의해 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위를 후성유전학적으로 변형시킨다.
일부 구현예에서, 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위를 후성유전학적으로 변형시키는 방법은 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위의 DNA 메틸화를 증가시키거나 감소시키는 단계를 포함한다. 일부 구현예에서, 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위를 후성유전학적으로 변형시키는 방법은 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위와 연관된 히스톤의 히스톤 메틸화를 증가시키거나 감소시키는 단계를 포함한다. 일부 구현예에서, 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위를 후성유전학적으로 변형시키는 방법은 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위와 연관된 히스톤의 히스톤 아세틸화를 감소시키는 단계를 포함한다. 일부 구현예에서, 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위를 후성유전학적으로 변형시키는 방법은 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위와 연관된 히스톤의 히스톤 수모일화를 증가시키거나 감소시키는 단계를 포함한다. 일부 구현예에서, 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위를 후성유전학적으로 변형시키는 방법은 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위와 연관된 히스톤의 히스톤 인산화를 증가시키거나 감소시키는 단계를 포함한다.
일부 구현예에서, 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위를 후성유전학적으로 변형시키는 방법은 상기 조성물에 의해 접촉되지 않거나 상기 방법으로 처리되지 않은 세포 내의 그러한 부위에서의 후성유전학적 변형의 수준 대비 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%(그리고 선택적으로, 최대 100%)만큼 후성유전학적 변형의 수준을 감소시킬 수 있다. 일부 구현예에서, 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위를 후성유전학적으로 변형시키는 방법은 상기 조성물에 의해 접촉되지 않거나 상기 방법으로 처리되지 않은 세포 내의 그러한 부위에서의 후성유전학적 변형의 수준 대비 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1000%(그리고 선택적으로, 최대 200, 300, 400, 500, 600, 700, 800, 900, 1000, 또는 2000%)만큼 후성유전학적 변형의 수준을 증가시킬 수 있다. 일부 구현예에서, 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위의 후성유전학적 변형은, 예를 들어 본 명세서에 기재된 바와 같은, 복수의 표적 유전자의 발현 수준을 변형시킬 수 있다.
일부 구현예에서, 본 명세서에 기재된 방법에 의해 생성된 후성유전학적 변형은 적어도 약 1시간 내지 약 30일, 또는 적어도 약 2시간, 6시간, 12시간, 18시간, 24시간, 2일, 3일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 16일, 17일, 18일, 19일, 20일, 21일, 22일, 23일, 24일, 25일, 26일, 27일, 28일, 29일, 30일, 또는 더 긴 시간 동안 또는 이들 사이의 임의의 시간 동안 지속된다. 일부 구현예에서, 그러한 조절은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 또는 7일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 지속된다. 선택적으로, 그러한 조절은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하의 기간 동안 지속된다.
일부 구현예에서, 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위를 후성유전학적으로 변형시키는 방법에서 사용하기 위한 부위-특이적 파괴제 또는 시스템은 후성유전학적 변형 모이어티를 포함하는 이펙터 모이어티를 포함한다. 예를 들어, 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 갖는 후성유전학적 변형 모이어티를 포함할 수 있으며, 내인성 또는 자연 발생 표적 서열(예를 들어, 복수의 표적 유전자 중의 유전자, 복수의 표적 유전자에 작동 가능하게 연결된 전사 제어 요소, 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열, 또는 상기 앵커 서열에 근접한 부위)이 그의 메틸화를 증가시키도록(예를 들어, 전사 인자와 복수의 표적 유전자 중의 유전자 또는 전사 제어 요소의 일부분과의 상호작용을 감소시키도록, 앵커 서열에 대한 핵형성 단백질의 결합을 감소시키도록, 그리고/또는 앵커 서열-매개 연접부를 파괴하거나 방해하도록) 변경될 수 있거나, 그의 메틸화를 감소시키도록(예를 들어, 전사 인자와 복수의 표적 유전자 중의 유전자 또는 전사 제어 요소의 일부분의 상호작용을 증가시키도록, 앵커 서열에 대한 핵형성 단백질의 결합을 증가시키도록, 그리고/또는 앵커 서열-매개 연접부의 강도를 촉진하거나 증가시키도록) 변경될 수 있다.
유전적 변형
추가로 본 개시내용은, 부분적으로, 복수의 표적 유전자 중 하나 이상(예를 들어, 1, 2, 3개, 또는 모두)의 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 또는 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열을 유전적으로 변형시키는 방법에 관한 것으로, 상기 방법은 부위-특이적 파괴제 또는 시스템 또는 이를 인코딩하는 핵산, 또는 상기 부위-특이적 파괴제, 시스템 또는 핵산을 포함하는 약제학적 조성물을 제공하는 단계; 및 복수의 표적 유전자 중 하나 이상(예를 들어, 1, 2, 3개, 또는 모두)의 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 또는 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열을 부위-특이적 파괴제와 접촉시키는 단계를 포함하며, 이에 의해 복수의 표적 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 또는 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열을 유전적으로 변형시킨다.
유전적 변형은 삽입, 결실, 또는 치환 중 하나 이상을 복수의 표적 유전자 중의 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 또는 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열에 도입하는 것을 포함할 수 있다. 일부 구현예에서, 삽입은 적어도 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1000, 1200, 1400, 1600, 1800, 또는 2000개의 뉴클레오티드(및 선택적으로 3000, 2500, 2000, 1500, 1000, 900, 800, 700, 600, 500, 400, 300, 또는 200개 이하의 뉴클레오티드)의 추가를 포함한다. 일부 구현예에서, 삽입은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드(및 선택적으로 200, 150, 100, 90, 80, 70, 60, 50, 40, 35, 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 뉴클레오티드)의 추가를 포함한다. 일부 구현예에서, 삽입은 1 내지 10개, 1 내지 9개, 1 내지 8개, 1 내지 7개, 1 내지 6개, 1 내지 5개, 1 내지 4개, 1 내지 3개, 또는 1 내지 2개 뉴클레오티드의 추가를 포함한다. 일부 구현예에서, 결실은 적어도 150, 200, 250, 300, 400, 500, 600, 700, 800, 900, 1000, 1200, 1400, 1600, 1800, 또는 2000개의 뉴클레오티드(및 선택적으로 3000, 2500, 2000, 1500, 1000, 900, 800, 700, 600, 500, 400, 300, 또는 200개 이하의 뉴클레오티드)의 제거를 포함한다. 일부 구현예에서, 결실은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드(및 선택적으로 200, 150, 100, 90, 80, 70, 60, 50, 40, 35, 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 뉴클레오티드)의 제거를 포함한다. 일부 구현예에서, 결실은 1 내지 10개, 1 내지 9개, 1 내지 8개, 1 내지 7개, 1 내지 6개, 1 내지 5개, 1 내지 4개, 1 내지 3개, 또는 1 내지 2개 뉴클레오티드의 제거를 포함한다. 일부 구현예에서, 치환은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 또는 100개의 뉴클레오티드(및 선택적으로 200, 150, 100, 90, 80, 70, 60, 50, 40, 35, 30, 25, 20, 15, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 뉴클레오티드)의 변경을 포함한다. 일부 구현예에서, 치환은 1 내지 10개, 1 내지 9개, 1 내지 8개, 1 내지 7개, 1 내지 6개, 1 내지 5개, 1 내지 4개, 1 내지 3개, 또는 1 내지 2개 뉴클레오티드의 변경을 포함한다.
일부 구현예에서, 유전적 변형은, 예를 들어 복수의 표적 유전자를 포함하는 ASMC와 연관된 앵커 서열에 대한 삽입, 결실, 또는 치환을 포함한다. 일부 구현예에서, 유전적 변형은 앵커 서열에 대한 게놈 복합체 성분, 예를 들어 핵형성 폴리펩티드의 결합을 변경시킨다(예를 들어, 감소시키거나 증가시킴). 일부 구현예에서, 유전적 변형은 전체적으로 또는 부분적으로 앵커 서열을 (예를 들어, 삽입, 결실, 또는 치환을 통해) 무효화시키며, 이에 의해 예를 들어 앵커 서열에 대한 핵형성 폴리펩티드의 결합을 감소시키거나 제거하고, 예를 들어 상기 앵커 서열을 포함하는 ASMC의 존재를 감소시키거나 상기 ASMC를 제거한다. 이론에 의해 구애되고자 함이 없이, 본 개시내용은 삽입, 결실, 또는 치환을 앵커 서열에 도입하여 복수의 표적 유전자를 포함하는 게놈 복합체, 예를 들어 ASMC에서 앵커 서열의 참여를 감소시키거나 제거하기 위한 유전적 변형 기능성을 갖는 부위-특이적 파괴제의 사용을 고려한다. 본 명세서의 다른 곳에 기재된 바와 같이, 그러한 변경은 게놈 복합체, 예를 들어 ASMC를 파괴하는 것으로 예상되며, 복수의 표적 유전자의 발현을 감소시킬 수 있다.
일부 구현예에서, 유전적 변형은 앵커 서열을 포함하는 서열의 삽입을 포함한다. 이론에 의해 구애되고자 함이 없이, 본 개시내용은 외인성 앵커 서열을 복수의 표적 유전자 중의 유전자, 복수의 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 또는 복수의 표적 유전자에 근접하거나 복수의 표적 유전자를 포함하는 앵커 서열-매개 연접부와 연관된 앵커 서열에 도입하기 위한 유전적 변형 기능성을 갖는 부위-특이적 파괴제 또는 시스템의 사용을 고려한다. 새로운 앵커 서열의 존재는 복수의 표적 유전자를 포함하는 게놈 복합체, 예를 들어 ASMC의 형성 및/또는 유지를 파괴하며, 이에 의해 복수의 표적 유전자의 발현을 조절할, 예를 들어 감소시킬 수 있다고 생각된다.
하기 실시예는 본 개시내용의 일부 구현예를 추가로 설명하기 위해 제공되지만, 본 개시내용의 범주를 제한하고자 하지 않으며; 그들의 예시적인 성질로 인해 당업자에게 알려진 기타 다른 절차, 방법, 또는 기법이 대안적으로 사용될 수 있음이 이해될 것이다.
실시예
실시예 1: 예시적인 복수의 유전자의 발현 감소
이 실시예는 부분적으로, CRISPR/Cas 분자 및 주어진 가이드 서열을 포함하는 가이드 RNA를 포함하는 부위-특이적 파괴제를 사용하여 CXCL1, CXCL2, CXCL3, 및 IL8을 포함하는 복수의 표적 유전자의 발현 감소를 입증하는 실험을 기재한다.
CRISPR/Cas 분자(Cas9)를 인코딩하는 mRNA 및 sgRNA Cas9/가이드 RNP 복합체를 포함하는 부위-특이적 파괴제를 포함하는 RNP의 형질감염을 THP-1 세포로의 전기천공에 의해 수행하였다. RPMI + 10% FBS에서 세포를 배양하였다. 또한 비교를 위해 부모 계통(parental line)도 분석하였다.
각 편집된 세포주 및 부모 대조군에 대해 4중으로 24웰 플레이트에 350k개 세포를 도말하였다. 1시간 후 각 세포주에 대해 2개 웰에 10 ng/ml의 TNF 알파(Sigma Cat# 654205)를 첨가하였다. 나머지 2개 웰은 대조군으로서 비처리되었다.
편집된 세포와 부모 세포를 TNF 알파와 함께 24시간 동안 인큐베이션하였다. 그 후, 제조업체의 프로토콜에 따라 AllPrep DNA/RNA Kit(Qiagen)를 사용하여 DNA와 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 CXCL1, CXCL2, CXCL3 및 IL8 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다.
ΔΔCt 방법을 사용하여 인간 GAPDH 참조 유전자에 대비하여 CXCL1 내지 CXCL3 및 IL7 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다.
절연 게놈 도메인(IGD)의 양쪽 경계에 있는 CTCF 앵커를 ChIP-seq 데이터를 사용하여 위치를 파악하고, CTCF 앵커 서열을 알려진 CTCF 위치 가중치 매트릭스(JASPAR)를 사용하여 컴퓨터로 확인하였다. CTCF 앵커 서열을 표적화하도록 CRISPR(Sp Cas9) 가이드를 선택하였다.
가이드 서열은 하기 표에 열거되어 있다.
실시예 2: 72시간째 THP-1 세포에서의 사이토카인 발현 감소
이 실시예는 부분적으로, CRISPR/Cas 분자 및 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열로 표적화된 가이드 RNA를 포함하는 부위-특이적 파괴제를 사용하여 CXCL1, CXCL2, CXCL3, 및 IL8을 포함하는 복수의 표적 유전자의 발현 감소를 입증하는 실험을 기재한다.
sgRNA 및 Cas9 RNP를 인코딩하는 mRNA를 THP-1 세포로 전기천공하였다. CXCL1, CXCL2, CXCL3, 및 IL8을 포함하는 ASMC의 CTCF 부위 중 하나를 표적화하도록 sgRNA 서열(실시예 1의 것)을 선택하였다. 형질감염된 세포를 10 ng/ml의 TNF 알파와 함께 24시간 동안 인큐베이션하였다. 그 후, 제조업체의 프로토콜에 따라 AllPrep DNA/RNA Kit(Qiagen)를 사용하여 DNA와 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 CXCL1, CXCL2, CXCL3 및 IL8 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다.
ΔΔCt 방법을 사용하여 인간 GAPDH 참조 유전자에 대비하여 CXCL1 내지 3 및 IL8 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다. 도 6의 결과는 CRISPR/Cas 분자와 sgRNA를 포함하는 부위-특이적 파괴제가 THP-1 세포에서 CXCL1, CXCL2, CXCL3, 및 IL8 발현을 감소시키는 데 사용될 수 있으며 처리 72시간 후에 발현이 감소됨을 나타낸다. 결과는 또한 상기 부위-특이적 파괴제의 LNP 전달이 유효량의 작용제를 표적 세포에 전달하는 데 사용될 수 있음을 나타낸다.
CXCL1, CXCL2, CXCL3, 및 IL8을 포함하는 ASMC의 다른 CTCF 부위를 표적화하는 sgRNA를 사용하여 실험을 반복했을 때 유사한 결과가 관찰되었다(데이터는 나타내지 않음).
실시예 3: 부위-특이적 조절제에 의해 감소된 THP-1 세포의 사이토카인 단백질 분비
이 실시예는 부분적으로, CRISPR/Cas 분자 및 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열로 표적화된 가이드 RNA를 포함하는 부위-특이적 파괴제를 사용하여 세포를 처리함으로써, 복수의 표적 유전자 중 2개의 유전자인 CXCL1과 IL-8의 분비 감소를 입증하는 실험을 기재한다.
이전 실시예에서와 같이 예시적인 CRISPR/Cas 분자(Cas9)를 포함하는 부위-특이적 파괴제를 인코딩하는 mRNA 및 sgRNA를 포함하는 RNP로 THP-1 세포를 전기천공하였다. CXCL1 및 IL-8을 포함하는 ASMC의 CTCF 부위 중 하나로 sgRNA(실시예 1의 것)를 표적화하였다. 세포를 10 ng/ml의 TNF 알파로 24시간 동안 자극하였다. 그 후, 세포 상청액을 수집하고 -80℃에서 동결시켰다. CRISPR/Cas 분자를 인코딩하는 mRNA에 추가적으로, 4가지 상이한 sgRNA와 접촉한 세포로부터의 상청액, 및 형질감염되지 않은 양성 대조군을 Myriad Genetics Inc.의 사이토카인 패널에서 CXCL1 및 IL-8 단백질 수준에 대해 스크리닝하였다. 도 7은 sgRNA 및 CRISPR/Cas 분자 RNP로 처리한 세포로부터 수득한 각 상청액에 대해 CXCL1 및 IL-8의 수준 감소가 관찰되었음을 나타내며, 이는 (예를 들어, 앵커 서열의 파괴 및 폴리펩티드 상호작용의 핵형성, 예를 들어 CTCF 결합의 파괴에 의해) ASMC 파괴에 대한 표현형 반응을 입증한다. 이 데이터는 실시예 2의 qPCR에 의해 관찰된 mRNA 발현 감소와 일치한다.
CXCL1 및 IL8을 포함하는 ASMC의 다른 CTCF 부위를 표적화하는 sgRNA를 사용하여 실험을 반복했을 때 유사한 결과가 관찰되었다(데이터는 나타내지 않음).
실시예 4: qPCR에 의해 측정된 CXCL3 발현 감소
이 실시예는 부분적으로, CRISPR/Cas 분자 및 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열로 표적화된 다양한 가이드 RNA를 포함하는 부위-특이적 파괴제를 사용하여 THP-1 세포를 처리함으로써 CXCL3의 발현 감소를 입증하는 실험을 기재한다.
RPMI + 10% FBS에서 THP-1 세포를 성장시켰다. CRISPR/Cas 분자(Cas9)를 인코딩하는 mRNA 및 복수의 표적 유전자를 포함하는 ASMC의 CTCF 부위 중 어느 하나로 표적화된 sgRNA로 LNP를 사용하여 세포를 형질감염시켰다. 도 9a에 표시된 바와 같이 사용된 sgRNA(실시예 1의 것)은 좌측 또는 우측 CTCF 부위를 표적으로 한다. Precision NanoSystems Inc.의 NanoAssemblr® SparkTM를 사용함으로써 SSOP 지질 혼합물을 사용한 지질 나노입자(LNP) 제형화를 수행하였다. 실험 조건의 경우, 각 형질감염된 조건 및 부모 대조군에 대해 LNP 형질감염 72시간 후 24웰 플레이트에 웰당 350k개 세포를 도말하였다(도 8의 순서도 참조). 1시간 후 각 웰에 대해 10 ng/ml의 TNF 알파(Sigma Cat# 654205)를 첨가하였다. 비처리 부모 세포를 10 ng/ml의 TNF 알파와 함께 또는 이것 없이 도말하였다.
형질감염된 세포를 TNF 알파와 함께 24시간 동안 인큐베이션하였다. 그 후, 제조업체의 프로토콜에 따라 AllPrep DNA/RNA Kit(Qiagen)를 사용하여 DNA와 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 CXCL3 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다.
ΔΔCt 방법을 사용하여 인간 GAPDH 참조 유전자에 대비하여 CXCL3 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다. 결과는 CRISPR/Cas 분자 및 여러 가지 상이한 sgRNA를 포함하는 부위-특이적 파괴제가 THP-1 세포에서 CXCL3 발현을 감소시키는 데 사용될 수 있음을 나타낸다(도 8 그래프). 결과는 또한 상기 부위-특이적 파괴제의 LNP 전달이 유효량의 작용제를 표적 세포에 전달하는 데 사용될 수 있음을 나타낸다. 결과는 또한 복수의 표적 유전자를 포함하는 ASMC의 어느 한 쪽에 있는 앵커 서열을 표적화하는 것이 복수의 표적 유전자의 발현을 감소시킬 수 있음을 입증한다.
CXCL1, CXCL2, CXCL3, 및 IL8을 포함하는 ASMC의 다른 CTCF 부위를 표적화하는 sgRNA를 사용하여 실험을 반복했을 때 유사한 결과가 관찰되었다(데이터는 나타내지 않음).
실시예 5: CXCL1 및 CXCL3 발현은 형질감염 3주 후 감소된다
이 실시예는 부분적으로, CRISPR/Cas 분자 및 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열로 표적화된 다양한 가이드 RNA를 포함하는 부위-특이적 파괴제를 사용하여 형질감염 3주 후 THP-1 세포에서 CXCL1 및 CXCL3의 안정적인 발현 감소를 입증하는 실험을 기재한다.
TNF 알파 자극 전에 형질감염된 세포를 3주 동안 인큐베이션한 것을 제외하고는, 실시예 4에서와 같이 세포와 LNP를 준비하고, 샘플을 분석하였다(도 9a 순서도 참조).
결과는 CRISPR/Cas 분자 및 여러 가지 상이한 sgRNA를 포함하는 부위-특이적 파괴제가 작용제(들)를 포함하는 LNP로 처리하고 최대 3주(3주를 포함함) 후 THP-1 세포에서 CXCL1 및 CXCL3 발현을 안정적으로 감소시키는 데 사용될 수 있음을 나타낸다(도 9a 및 9b). 결과는 또한 복수의 표적 유전자를 포함하는 ASMC의 어느 한 쪽에 있는 앵커 서열을 표적화하는 것이 복수의 표적 유전자의 발현을 안정적으로 감소시킬 수 있음을 입증한다.
실시예 6: KRAB 이펙터 모이어티를 포함하는 작용제는 CXCL1 발현을 감소시킨다
이 실시예는 부분적으로, 전사 리프레서에 융합된 CRISPR/Cas 분자 및 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열로 표적화된 다양한 가이드 RNA를 포함하는 부위-특이적 파괴제를 사용하여 형질감염 후 THP-1 세포에서 CXCL1의 발현 감소를 입증하는 실험을 기재한다.
RPMI + 10% FBS에서 THP-1 세포를 성장시켰다. 전사 리프레서에 융합된 CRISPR/Cas 분자인 dCas9-KRAB를 인코딩하는 mRNA 및 복수의 표적 유전자를 포함하는 ASMC의 CTCF 부위 중 어느 하나로 표적화된 sgRNA(실시예 1의 것)로 LNP를 사용하여 세포를 형질감염시켰다. Precision NanoSystems Inc.의 NanoAssemblr® SparkTM를 사용함으로써 SSOP 지질 혼합물을 사용한 지질 나노입자(LNP) 제형화를 수행하였다. 실험 조건의 경우, 각 형질감염된 조건 및 부모 대조군에 대해 LNP 형질감염 72시간 후 24웰 플레이트에 웰당 350k개 세포를 도말하였다. 1시간 후 각 웰에 대해 10 ng/ml의 TNF 알파(Sigma Cat# 654205)를 첨가하였다. 비처리 부모 세포를 10 ng/ml의 TNF 알파와 함께 또는 이것 없이 도말하였다. CRISPR/Cas 분자(Cas9)를 인코딩하는 mRNA 및 sgRNA를 사용한 형질감염(실시예 2, 4 및 5에 따름)을 양성 대조군으로 수행하였다.
형질감염된 세포를 TNF 알파와 함께 24시간 동안 인큐베이션하였다. 그 후, 제조업체의 프로토콜에 따라 AllPrep DNA/RNA Kit(Qiagen)를 사용하여 DNA와 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 CXCL1 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다.
ΔΔCt 방법을 사용하여 인간 GAPDH 참조 유전자에 대비하여 CXCL1 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다. 결과는 전사 리프레서인 KRAB에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자를 포함하고, 다양한 sgRNA에 의해 CTCF 부위로 표적화된 부위-특이적 파괴제가 THP-1 세포에서 CXCL1 발현을 감소시키는 데 사용될 수 있음을 나타낸다(도 10). 형질감염 72시간 후에 발현 감소가 관찰되었다.
실시예 7: EZH2 이펙터 모이어티를 포함하는 작용제는 CXCL1 발현을 감소시킨다
이 실시예는 부분적으로, 히스톤 메틸트랜스퍼라제(EZH2)에 융합된 CRISPR/Cas 분자 및 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열로 표적화된 다양한 가이드 RNA를 포함하는 부위-특이적 파괴제를 사용하여 형질감염 후 THP-1 세포에서 CXCL1의 발현 감소를 입증하는 실험을 기재한다.
RPMI + 10% FBS에서 THP-1 세포를 성장시켰다. 히스톤 데아세틸라제에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자(dCas9)인 dCas9-EZH2를 인코딩하는 mRNA, 및 복수의 표적 유전자를 포함하는 ASMC의 CTCF 부위 중 어느 하나로 표적화된 sgRNA(실시예 1의 것)로 LNP를 사용하여 세포를 형질감염시켰다. Precision NanoSystems Inc.의 NanoAssemblr® SparkTM를 사용함으로써 SSOP 지질 혼합물을 사용한 지질 나노입자(LNP) 제형화를 수행하였다. 실험 조건의 경우, 각 형질감염된 조건 및 부모 대조군에 대해 LNP 형질감염 72시간 후 24웰 플레이트에 웰당 350k개 세포를 도말하였다. 1시간 후 각 웰에 대해 10 ng/ml의 TNF 알파(Sigma Cat# 654205)를 첨가하였다. 비처리 부모 세포를 10 ng/ml의 TNF 알파와 함께 또는 이것 없이 도말하였다.
형질감염된 세포를 TNF 알파와 함께 24시간 동안 인큐베이션하였다. 그 후, 제조업체의 프로토콜에 따라 AllPrep DNA/RNA Kit(Qiagen)를 사용하여 DNA와 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 CXCL1 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다.
ΔΔCt 방법을 사용하여 인간 GAPDH 참조 유전자에 대비하여 CXCL1 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다. 결과는 히스톤 메틸트랜스퍼라제(EZH2)에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자를 포함하고, 다양한 sgRNA에 의해 CTCF 부위로 표적화된 부위-특이적 파괴제가 THP-1 세포에서 CXCL1 발현을 감소시키는 데 사용될 수 있음을 나타낸다(도 11). 형질감염 72시간 후에 발현 감소가 관찰되었다.
실시예 8: MQ1이펙터 모이어티를 포함하는 작용제는 CXCL1 발현을 감소시킨다
이 실시예는 부분적으로, DNA 메틸트랜스퍼라제(MQ1)에 융합된 CRISPR/Cas 분자 및 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열로 표적화된 다양한 가이드 RNA를 포함하는 부위-특이적 파괴제를 사용하여 형질감염 후 THP-1 세포에서 CXCL1의 발현 감소를 입증하는 실험을 기재한다.
RPMI + 10% FBS에서 THP-1 세포를 성장시켰다. MQ1에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자(dCas9)인 dCas9-MQ1을 인코딩하는 mRNA, 및 복수의 표적 유전자를 포함하는 ASMC의 CTCF 부위 중 어느 하나로 표적화된 sgRNA(실시예 1의 것)로 LNP를 사용하여 세포를 형질감염시켰다. Precision NanoSystems Inc.의 NanoAssemblr® SparkTM를 사용함으로써 SSOP 지질 혼합물을 사용한 지질 나노입자(LNP) 제형화를 수행하였다. 실험 조건의 경우, 각 형질감염된 조건 및 부모 대조군에 대해 LNP 형질감염 72시간 후 24웰 플레이트에 웰당 350k개 세포를 도말하였다. 1시간 후 각 웰에 대해 10 ng/ml의 TNF 알파(Sigma Cat# 654205)를 첨가하였다. 비처리 부모 세포를 10 ng/ml의 TNF 알파와 함께 또는 이것 없이 도말하였다.
형질감염된 세포를 TNF 알파와 함께 24시간 동안 인큐베이션하였다. 그 후, 제조업체의 프로토콜에 따라 AllPrep DNA/RNA Kit(Qiagen)를 사용하여 DNA와 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 CXCL1 및 CXCL3 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다.
ΔΔCt 방법을 사용하여 인간 GAPDH 참조 유전자에 대비하여 CXCL1 및 3 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다. 결과는 DNA 메틸트랜스퍼라제(MQ1)에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자를 포함하고, 다양한 sgRNA에 의해 CTCF 부위로 표적화된 부위-특이적 파괴제가 THP-1 세포에서 CXCL1 발현을 감소시키는 데 사용될 수 있음을 나타낸다(도 12). 형질감염 72시간 후에 발현 감소가 관찰되었다. CXCL3 발현을 측정하여 유사한 결과가 관찰되었다(데이터는 나타내지 않음).
실시예 9: Cas9 또는 dCas9-EZH2 처리 후 지속적인 CXCL1 발현 감소
이 실시예는 부분적으로, CRISPR/Cas 분자 또는 히스톤 데아세틸라제(EZH2)에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자 중 어느 하나 및 CXCL1을 포함하는 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열로 표적화된 sgRNA를 포함하는 부위-특이적 파괴제를 사용하여 형질감염 후 최대 4주까지 THP-1 세포에서 CXCL1의 안정적인 발현 감소를 입증하는 실험을 기재한다.
ATxTM Scalable Transfection System(MaxCyte)을 사용하여, 어느 하나의 부위-특이적 파괴제(Cas9 또는 dCas9-EZH2)를 인코딩하는 mRNA 및 sgRNA(실시예 1의 것)를 사용하여 어셈플리 처리에 있어서 조건당 5백만개의 세포로 RPMI + 10% FBS에서 성장시킨 THP-1 세포를 전기천공하였다. 형질감염된 세포의 샘플을 수확하고 TNF 알파와 함께 24시간 동안 인큐베이션하였다. 이를 매주 반복하여 4주까지 수행하였다. 그 후, 제조업체의 프로토콜에 따라 AllPrep DNA/RNA Kit(Qiagen)를 사용하여 DNA와 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 CXCL1, CXCL2, CXCL3 및 IL8 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다.
ΔΔCt 방법을 사용하여 인간 GAPDH 참조 유전자에 대비하여 CXCL1 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다. 결과는 CRISPR/Cas 분자, 또는 히스톤 메틸트랜스퍼라제(EZH2)에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자를 포함하고, sgRNA에 의해 CTCF 부위로 표적화된 부위-특이적 파괴제가 THP-1 세포에서 CXCL 발현을 감소시키는 데 사용될 수 있음을 나타낸다(도 13). 발현 감소는 적어도 4주까지 지속되며, 또한 형질감염 후 72시간 및 3주째에도 관찰된다.
실시예 10: EZH2-dCas9-KRAB 및 sgRNA로 처리 시의 CXCL3 발현 감소
이 실시예는 부분적으로, 히스톤 메틸트랜스퍼라제(EZH2) 및 전사 리프레서(KRAB)에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자, 및 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열로 표적화된 다양한 가이드 RNA를 포함하는 부위-특이적 파괴제를 사용하여 형질감염 후 THP-1 세포에서 CXCL3의 발현 감소를 입증하는 실험을 기재한다.
RPMI + 10% FBS에서 THP-1 세포를 성장시켰다. 여러 가지 상이한 부위-특이적 파괴제를 다음과 같이 시험하였다: G9A-dCas9-EZH2(G9A가 dCas9에 융합되고 이것이 EZH2에 융합됨), G9A-dCas9-KRAB, 및 EZH2-dCas9-KRAB. 부위-특이적 파괴제를 인코딩하는 mRNA, 및 복수의 표적 유전자를 포함하는 ASMC의 CTCF 부위로 표적화된 sgRNA로 LNP를 사용하여 세포를 형질감염시켰다. 좌측 CTCF에 근접하지만 좌측 CTCF 부위로부터 약간의 거리가 있는(예를 들어, CTCF 부위로부터 80, 160, 235, 또는 300개 뉴클레오티드) 게놈 DNA 부위를 표적화하도록 sgRNA를 선택하였다. 좌측 CTCF에 근접하지만 좌측 CTCF 부위로부터 약간의 거리가 있는 게놈 DNA 부위를 표적화하는 예시적인 가이드 서열이 표 5에 제공되어 있다.
가이드 | 가이드 서열 | 게놈 좌표 | 서열번호 |
GD-29251 | CCAATGAAGATGAAACTGGG | chr4:74595215-74595237 | 30 |
GD-29252 | AACGTGCTTGCCTAAGATTC | chr4:74595370-74595392 | 31 |
GD-29253 | AGCCCTTAATCATATCTAGT | chr4:74595560-74595582 | 32 |
GD-29254 | CAGAGCTTAAGACCTGTACT | chr4:74595642-74595664 | 33 |
GD-29255 | GCCCACCTTGACCTTCACAA | chr4:74595787-74595809 | 34 |
Precision NanoSystems Inc.의 NanoAssemblr® SparkTM를 사용함으로써 SSOP 지질 혼합물을 사용한 지질 나노입자(LNP) 제형화를 수행하였다. 실험 조건의 경우, 각 형질감염된 조건 및 부모 대조군에 대해 LNP 형질감염 72시간 후 24웰 플레이트에 웰당 350k개 세포를 도말하였다. 1시간 후 각 웰에 대해 10 ng/ml의 TNF 알파(Sigma Cat# 654205)를 첨가하였다. 비처리 부모 세포를 10 ng/ml의 TNF 알파와 함께 또는 이것 없이 도말하였다.
형질감염된 세포를 TNF 알파와 함께 24시간 동안 인큐베이션하였다. 그 후, 제조업체의 프로토콜에 따라 AllPrep DNA/RNA Kit(Qiagen)를 사용하여 DNA와 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 CXCL1 및 CXCL3 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다.
ΔΔCt 방법을 사용하여 인간 GAPDH 참조 유전자에 대비하여 CXCL1 및 3 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다. 결과는 히스톤 메틸트랜스퍼라제(EZH2) 및 전사 리프레서(KRAB)에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자를 포함하고, sgRNA에 의해 CTCF에 근접한 부위로 표적화된 부위-특이적 파괴제가 THP-1 세포에서 CXCL3 발현을 감소시키는 데 사용될 수 있음을 나타낸다(도 14). CXCL1 발현을 측정하여 유사한 결과가 관찰되었다(데이터는 나타내지 않음).
실시예 11: 부위-특이적 파괴제 및 sgRNA로 처리 시의 CXCL1 발현 감소
이 실시예는 부분적으로, DNA 메틸트랜스퍼라제(DNMT33a/3l)에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자; 히스톤 데아세틸라제(HDAC8)에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자; 또는 히스톤 데아세틸라제(HDAC8) 및 히스톤 메틸트랜스퍼라제(EZH2)에 융합된 촉매적으로 비활성인 CRISPR/Cas 분자, 및 복수의 표적 유전자를 포함하는 ASMC의 앵커 서열로 표적화된 다양한 가이드 RNA를 포함하는 다양한 예시적인 부위-특이적 파괴제를 사용하여 형질감염 후 THP-1 세포에서 CXCL1의 발현 감소를 입증하는 실험을 기재한다.
RPMI + 10% FBS에서 THP-1 세포를 성장시켰다. 여러 가지 상이한 부위-특이적 파괴제를 다음과 같이 시험하였다: dCas9-DNMT3a/3l(dCas9에 융합된 DNMT3a/3l), dCas9-HDAC8, 및 EZH2-dCas9-HDAC8. 부위-특이적 파괴제를 인코딩하는 mRNA, 및 복수의 표적 유전자를 포함하는 ASMC의 어느 하나의 CTCF 부위로 표적화된 sgRNA(실시예 1의 것)로 LNP를 사용하여 세포를 형질감염시켰다. Precision NanoSystems Inc.의 NanoAssemblr® SparkTM를 사용함으로써 SSOP 지질 혼합물을 사용한 지질 나노입자(LNP) 제형화를 수행하였다. 실험 조건의 경우, 각 형질감염된 조건 및 부모 대조군에 대해 LNP 형질감염 72시간 후 24웰 플레이트에 웰당 350k개 세포를 도말하였다. 1시간 후 각 웰에 대해 10 ng/ml의 TNF 알파(Sigma Cat# 654205)를 첨가하였다. 비처리 부모 세포를 10 ng/ml의 TNF 알파와 함께 또는 이것 없이 도말하였다.
형질감염된 세포를 TNF 알파와 함께 24시간 동안 인큐베이션하였다. 그 후, 제조업체의 프로토콜에 따라 AllPrep DNA/RNA Kit(Qiagen)를 사용하여 DNA와 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 CXCL1 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다.
ΔΔCt 방법을 사용하여 인간 GAPDH 참조 유전자에 대비하여 CXCL1 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다. 결과는 dCas9-DNMT3a/3l, dCas9-HDAC8, 또는 EZH2-dCas9-HDAC8을 포함한 부위-특이적 파괴제가 THP-1 세포에서 CXCL1 발현을 감소시키는 데 사용될 수 있고 이들 작용제가 여러 가지 상이한 sgRNA에 의해 CTCF 부위로 표적화될 때 사이토카인 발현을 감소시키는 데 효과적이었음을 나타낸다(도 15).
실시예 12: 인간 A549 폐암 상피 세포 및 IMR-90 세포에서 dCas9-EZH2 및 가이드 30183으로 처리 시의 CXCL 유전자 클러스터 발현 감소
이 실시예는 dCas9-EZH2 및 가이드 30183(컨트롤러 1)으로 처리 시의 인간 A549 폐암 상피 세포 및 IMR-90 세포에서의 CXCL 유전자 클러스터 발현 감소를 입증한다.
인간 A549 세포(ATCC® CCL-185) 및 IMR-90 세포(ATCC®-CCL-186)를 100 μl의 배지에서 평평한 바닥 세포 배양 처리 플레이트에 웰당 15,000개 세포로 도말하였다. A549 세포에는 F12/K ATCC®-30-2004 배지를 제공하고 IMR-90 세포에는 EMEM ATCC®-30-2003 배지를 제공하였다. 완전 배지는 둘 다 10% FBS(VWR cat# 97068-085)를 포함하여 제조되었다. 플레이트에 부착하고 24시간 후, 가이드 30183 및 EZH2-dCas9 컨트롤러를 함유한 LNP를 2 μg/ml SSOP 지질 믹스의 최종 농도로 배지에 첨가하였다. 6시간 후, 배지를 100 μl의 적절한 배지로 교체하고 세포를 72시간 동안 인큐베이션하였다. 72시간 인큐베이션의 완료 후, TNF 알파(Sigma Cat# 654205)를 10 ng/ml의 최종 농도로 지정된 웰에 첨가하고 24시간 동안 인큐베이션하였다. 24시간 후, 제조업체의 프로토콜에 따라 NucleoSpin® 96 RNA Core Kit(Macherey-Nagel Inc, cat# 740466.4)를 사용하여 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다. ΔΔCt 방법을 사용하여 인간 ABL1 참조 유전자에 대비하여 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다.
데이터는 dCas9-EZH2로 처리될 때 인간 A549 폐암 상피 세포에서 CXCL 유전자 클러스터의 유전자(구체적으로, CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 및 IL-8) 발현 수준이 40 내지 70%로 감소했음을 나타내었다(도 17). 중간 CTCF가 dCas9-EZH2 및 GD-30183로 표적화될 때 IMR-90 세포에서 CXCL 유전자 클러스터의 유전자(구체적으로, CXCL1, CXCL2, CXCL3, 및 IL-8)의 유전자 발현이 약 50% 감소하였다(도 18).
실시예 13: 인간 단핵구에서 dCas9-EZH2 및 가이드 GD-28481로 처리 시의 CXCL 유전자 클러스터 발현 감소
이 실시예는 dCas 기반 이펙터(컨트롤러 A)로 처리 시의 인간 단핵구 세포에서의 CXCL 유전자 클러스터 발현 감소를 입증한다.
Synthego에 의해 THP-1 세포(ATCC-TIB-202)로 전기천공함으로써 Cas9/가이드 RNP 복합체의 형질감염을 수행하였다.
편집된 세포주를 받은 후, 바이알을 해동하고, 세포를 RPMI + 10% FBS(VWR cat# 97068-085)에서 1주일 동안 배양하여 세포가 동결 및 해동으로부터 회복되도록 하였다. 또한 비교를 위해 부모 비편집 THP1 세포주도 분석하였다.
편집된 세포주 및 부모 대조군에 대해 4중으로 24웰 플레이트에 350,000개 세포를 도말하였다. 1시간 후 10 ng/ml의 TNF 알파(Sigma Cat# 654205)를 첨가하였다. 또한 비처리 대조군 웰을 사용하여 케모카인 발현의 증가 배수를 비교하였다.
편집된 세포와 부모 세포를 TNF 알파와 함께 24시간 동안 인큐베이션하였다. 그 후, 제조업체의 프로토콜에 따라 DNA/RNA All Prep Kit(Qiagen)를 사용하여 DNA와 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 CXCL1, CXCL2, CXCL3 및 IL8 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다.
ΔΔCt 방법을 사용하여 인간 GAPDH 참조 유전자에 대비하여 CXCL1 내지 3 및 IL8 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다.
데이터는 투약 후 24시간째에 CXCL1, CXCL2, CXCL3, 및 IL-8의 유전자 발현이 비처리 단핵구에서 CXCL1, CXCL2, CXCL3, 및 IL-8 유전자 발현과 비교하여 컨트롤러 A로 처리한 단핵구에서 각각 65%, 55%, 88%, 및 52% 감소하였음을 나타내었다(도 19).
실시예 14: Hep 1.6 세포에서 3개의 앵커 서열을 표적화하는 sgRNA 및 dCas9-MQ1로 처리 시의 마우스 CXCL 유전자 클러스터 발현 감소
이 실시예는 Hep 1.6 세포에서 3개의 앵커 서열을 표적화하는 sgRNA 및 dCas9-MQ1로 처리할 때 마우스 CXCL 유전자 클러스터 발현이 하향조절됨을 입증한다.
마우스 세포 HEPA 1.6(ATCC® CRL-1830)을 100 μl의 배지(DMEM Gibco Cat# 11995-065, 10% FBS VWR cat# 97068-085)에서 평평한 바닥 세포 배양 처리 플레이트에 웰당 10k개 세포로 도말하였다. 플레이트에 부착시키고 24시간 후, 배양액을 4개의 처리군과 3개의 대조군으로 나누었다. (i) 우측 CTCF를 표적화하는 가이드 GD-30594 및 dCas9-MQ1 컨트롤러, (ii) 중간 CTCF 1을 표적화하는 dCas9-MQ1 이펙터가 있는 가이드 GD-30592, (iii) 중간 CTCF를 표적화하는 dCas9-MQ1 이펙터가 있는 가이드 GD-30593 및 (iv) 중간 및 우측 CTCF를 둘 다 표적화하는 dCas9-MQ1과 GD-30594, GD-30592 및 GD-30593의 조합을 함유하는 LNP를 2 μg/mL SSOP 지질 믹스의 최종 농도로 처리군에 따른 세포 배양액에 첨가하였다. 비처리 세포, LNP로 처리한 세포, 및 형질감염 대조군 가이드를 함유한 LNP 및 TNF로 처리한 세포를 대조군으로 사용하였다. 6시간 후, 배지를 100 μl의 DMEM로 교체하고 세포를 72시간 동안 인큐베이션하였다. 72시간 인큐베이션의 완료 후, TNF 알파(Sigma Cat# 654245)를 10 ng/ml의 최종 농도로 지정된 웰에 첨가하고 24시간 동안 인큐베이션한다. 24시간 후, 제조업체의 프로토콜에 따라 NucleoSpin® 96 RNA Core Kit(Macherey-Nagel, cat# 740466.4)를 사용하여 RNA를 분리하였다. LunaScript® RT SuperMix Kit(New England Biolabs)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqMan® Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 개별 특이적 TaqMan 프라이머/프로브 세트를 사용하여 정량적 PCR에 의해 분석하였다. ΔΔCt 방법을 사용하여 마우스 HPRT 참조 유전자에 대비하여 유전자 발현을 정량화하였다. 직접적으로 TNF 알파를 처리한 후 유전자 발현의 배수 증가를 측정함으로써 비처리 세포에서의 유전자 발현 수준과 비교하여 유전자 발현 변화를 추가로 정량화하였다.
데이터는 CXCL 유전자 클러스터에서 우측, 또는 2개의 중간 CTCF 모티프 중 하나를 표적화하는 가이드를 사용하여 형질감염된 dCas9-MQ1로 처리한 세포가 TNF 알파 자극 후 7개의 CXCL 유전자 모두에서 약간의 하향조절을 보임을 입증하였다(도 21b). 그러나, 중간과 우측 CTCF를 둘 모두 표적화하는 가이드의 조합을 사용하여 형질감염된 dCas9-MQ1로 세포를 처리했을 때 전체 CXCL 유전자 클러스터는 현저하게 더 하향조절되었다.
실시예 15: dCas9-MQ1의 전신 투여는 염증이 있는 폐에서 백혈구 침윤의 현저한 감소를 입증한다
이 실시예는 dCas9-MQ1의 전신 투여가 마우스 폐에서 생체내 백혈구 침윤을 감소시킴을 입증한다.
뮤린 지질다당류(LPS) 폐 염증 모델을 사용하여 폐에서의 급성 염증을 연구하였다. DOTAP 1% PEG 짧은 ncRNA를 포함하는 LNP를 대조군으로 사용하였다. 각 마우스는 정맥내 투여 지점을 통해 -2시간째에 3 mg/kg 용량의 LNP-DOTAP 또는 dCas9-MQ1을 받았다. 마우스를 0시간째에 경구 흡입을 통해 5 mg/kg의 LPS로 자극하였다. 3 mg/kg으로 LNP-DOTAP 또는 dCas9-MQ1의 제2 용량을 +8시간 시점에 투여하였다. 0, 24, 및 48시간째에 10 mg/kg의 용량으로 덱사메타손을 복강내 투여하였다. 72시간째에 동물을 종료시키고 유동 염색을 위해 세기관지 세척액을 폐로부터 수집하였다. BALF에서의 호중구 침윤 감소를 염증성 반응의 중증도를 이해하기 위한 척도로 사용하였다.
dCas9-MQ1 처리 동물의 폐로부터 수집한 세기관지 세척액은 약 5.0 × 105개 백혈구 수/mL를 나타내었다. 허위 그룹, 즉 처리를 받지 않은 건강한 마우스에는 세기관지 세척액에서(BALF) 백혈구가 유의하게 존재하지 않았다. LPS 처리 마우스, 덱사메타손 처리 마우스, 및 LNP-DOTAP 처리 마우스는 세기관지 세척액에서 각각 약 8.0 × 105개 백혈구 수/mL, 약 7.2 × 105개 백혈구 수/mL, 및 약 6.0 × 105개 백혈구 수/mL를 나타내었다(도 22의 B). 또한 질환 대조군과 비교하여 dCas9-MQ1 처리 72시간 후 마우스에서 기관지-폐포 세척액(BALF)에서 호중구 침윤의 56% 감소가 관찰되었다.
실시예 16: dCas9-MQ1의 전신 투여는 BALF에서 호중구 침윤의 현저한 감소를 입증한다
이 실시예는 세포 집단을 평가하기 위해 실시예 15에서 얻은 BALF를 분석한다.
하기 염색 패널을 사용한 유세포 측정 분석을 사용하여 실시예 15에서 얻은 BALF의 세포 집단을 평가하고 종결 시점에 BALF에 존재하는 세포의 백분율을 기록하였다(도 23a). 또한 BALF 중 호중구 수를 하기 항체 염색 패널을 사용하여 그래프로 표시하였다.
폐포 대식세포: CD45+, Siglec F+, CD11b-, CD11c+
호중구: CD45+, Siglec F-, CD11b+, CD11c-, Ly-6G+
T 세포: CD45+, Siglec F-, CD11c-, CD3+
B 세포: CD45+, Siglec F--, CD11c-, B220+(도 23b)
분석은, 침윤 세포의 대부분을 구성하는 백혈구 세포 유형은 호중구이며, B 세포, T 세포, 대식세포 및 다른 유형의 조혈 세포가 그 뒤를 잇는다는 것을 나타내었다(도 23a). 컨트롤러는 +LPS 질환 그룹과 비교하여 현저한 차이로 폐에 침윤하는 호중구의 수를 감소시켰다(도 23b).
실시예 17: BALF에서 백혈구 세포의 감소는 폐 특이적이다
이 실시예는 BALF에서 백혈구 세포의 감소가 폐 특이적임을 입증하며, 이러한 감소가 dCas9-MQ1 처리로 인한 것임을 시사한다.
뮤린 지질다당류(LPS) 폐 염증 모델을 사용하여 폐에서의 급성 염증을 연구하였다. DOTAP 1% PEG 짧은 ncRNA를 포함하는 LNP를 대조군으로 사용하였다. 각 마우스는 정맥내 투여 지점을 통해 -2시간째에 3 mg/kg 용량의 LNP-DOTAP 또는 dCas9-MQ1을 받았다. 마우스를 0시간째에 경구 흡입을 통해 5 mg/kg의 LPS로 자극하였다. 3 mg/kg으로 LNP-DOTAP 또는 dCas9-MQ1의 제2 용량을 +8시간 시점에 투여하였다. 0, 24, 및 48시간째에 10 mg/kg의 용량으로 덱사메타손을 복강내 투여하였다. 72시간째에 동물을 종료시키고 유동 염색을 위해 세기관지 세척액을 폐로부터 수집하였다. 말초 혈액을 72시간 종료 시점에 수집하였다. CD45+ 항체 염색을 사용한 유세포 측정을 사용하여 각 그룹의 말초 혈액에서 백혈구 집단을 결정하였다. 각 군에 대해 얻은 백혈구 수를 그래프에 플롯팅하였다.
그래프는 컨트롤러로 처리한 BALF에서 백혈구 수의 감소 효과가 폐 특이적인 것을 나타내었는데, 이는 백혈구 수의 감소가 마우스 자체에서, 말초 혈액에서도 더 낮은 백혈구 수를 보였을 것인 백혈구 집단의 감소가 있기 때문이 아니라 dCas9-MQ1 처리에 기인한 것임을 시사한다. 말초 혈액 중 조혈 세포 집단은 모든 그룹에 걸쳐 유사한 것으로 밝혀졌다(도 24).
실시예 18: dCas9-MQ1의 전신 투여는 CXCL 유전자 발현이 폐 조직에서 감소됨을 입증한다
이 실시예는 CXCL 유전자 클러스터 발현이 dCas9-MQ1의 전신 투여 시 폐 조직에서 하향조절됨을 입증한다.
BALF를 실시예 15에 기재된 방법을 사용하여 수집하였다. BALF 수집 후, 좌측 폐엽의 절반을 취해 동결하여 qPCR 분석을 위해 보관하였다. 폐 조직을 균질화하고, qPCR 분석을 위해 RNA를 추출하여 구체적으로 CXCL1 내지 7 및 CXCL15에 대해 정량화하였다. ΔΔCt 방법을 사용하여 마우스 GAPDH 참조 유전자에 대비하여 유전자 발현을 정량화하였다.
데이터는 CXCL 유전자 클러스터 발현이 dCas9-MQ1로 처리되지 않은 마우스에서 얻은 폐 조직 샘플에서의 CXCL 유전자 클러스터 발현과 비교하여 dCas9-MQ1로 처리된 마우스로부터 얻은 폐 조직 샘플에서 다양한 정도로 하향조절되었음을 나타내었다(도 25).
실시예 19: CXCL 발현 감소는 염증 부위에 대한 다른 사이토카인의 존재 및 세포 동원 감소의 유익한 하류 효과를 나타낸다
CXCL 유전자 클러스터의 과발현은 호중구를 유인하는 케모카인을 생성한다. 염증성 세포를 폐로 동원하는 케모카인은 국부 염증을 촉진하여, 심각한 병의 발생을 야기한다. 이 실시예는 CXCL 발현의 하향조절이 세포 동원을 감소시키는 유익한 하류 효과를 나타내어 염증 부위에서 다른 사이토카인의 존재의 감소를 야기함을 입증하며, 이는 CXCL 발현의 하향 조절이 염증 발병의 중증도를 감소시키는 유망한 방법임을 시사한다.
BALF를 실시예 15에 기재된 방법을 사용하여 수집하였다. BALF 수집 후, 좌측 폐엽의 절반을 취해 동결하여 qPCR 분석을 위해 보관하였다. 폐 조직을 균질화하고, qPCR 분석을 위해 RNA를 추출하여 멀티플렉싱 Luminex® 기기를 사용하여 구체적으로 BALF 중 CXCL1, CXCL2, GM-CSF, 및 IL-6 단백질의 총 수에 대해 정량화하였다.
데이터는 dCas9-MQ1로 처리한 마우스로부터 얻은 폐 조직이 dCas9-MQ1로 처리하지 않은 마우스로부터 얻은 폐 조직에서 확인된 CXCL1, CXCL2, GM-CSF, 및 IL-6 발현과 비교하여 CXCL1, CXCL2, GM-CSF, 및 IL-6의 더 낮은 발현을 보임을 입증하였다.
균등물
본 발명이 이의 상세한 설명과 함께 기재되었지만, 전술한 설명은 예시하고자 하는 것이고, 첨부된 청구범위의 범주에 의해 규정되는 본 발명의 범주를 제한하고자 하는 것이 아님이 이해되어야 한다. 일부 양태, 이점, 및 변형이 하기 청구범위의 범주 내에 있다.
SEQUENCE LISTING
<110> FLAGSHIP PIONEERING INNOVATIONS V, INC.
<120> COMPOSITIONS AND METHODS FOR INHIBITING THE EXPRESSION OF
MULTIPLE GENES
<130> O2057-7021WO
<140>
<141>
<150> 63/216,487
<151> 2021-06-29
<150> 63/085,013
<151> 2020-09-29
<160> 247
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (3)..(3)
<223> a, c, t, g, unknown or other
<400> 1
nbndccdsha grkgghrshv 20
<210> 2
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (18)..(18)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (20)..(20)
<223> a, c, t, g, unknown or other
<400> 2
vhsrhggkrg ahsdccdnbn 20
<210> 3
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (8)..(8)
<223> a, c, t, g, unknown or other
<400> 3
ccgccatntt 10
<210> 4
<211> 10
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (3)..(3)
<223> a, c, t, g, unknown or other
<400> 4
aanatggcgg 10
<210> 5
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 5
Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 6
<211> 1367
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 6
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 7
<211> 1053
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 7
Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 8
<211> 4101
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 8
gacaagaagt acagcatcgg cctggccatc ggcaccaaca gcgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaag ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggcgccctg ctgttcgaca gcggcgagac cgccgaggcc 180
acccggctga agcggaccgc ccggcggcgg tacacccggc ggaagaaccg gatctgctac 240
ctgcaggaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccaccggctg 300
gaggagagct tcctggtgga ggaggacaag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gcggaagaag 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct acctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga gaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgagcgccc ggctgagcaa gagccggcgg 660
ctggagaacc tgatcgccca gctgcccggc gagaagaaga acggcctgtt cggcaacctg 720
atcgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggac 780
gccaagctgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgttcctg gccgccaaga acctgagcga cgccatcctg 900
ctgagcgaca tcctgcgggt gaacaccgag atcaccaagg cccccctgag cgccagcatg 960
atcaagcggt acgacgagca ccaccaggac ctgaccctgc tgaaggccct ggtgcggcag 1020
cagctgcccg agaagtacaa ggagatcttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacatcgacg gcggcgccag ccaggaggag ttctacaagt tcatcaagcc catcctggag 1140
aagatggacg gcaccgagga gctgctggtg aagctgaacc gggaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggcga gctgcacgcc 1260
atcctgcggc ggcaggagga cttctacccc ttcctgaagg acaaccggga gaagatcgag 1320
aagatcctga ccttccggat cccctactac gtgggccccc tggcccgggg caacagccgg 1380
ttcgcctgga tgacccggaa atccgaggag accatcaccc cctggaactt cgaggaggtg 1440
gtggacaagg gcgccagcgc ccagagcttc atcgagcgga tgaccaactt cgacaagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtac 1560
aacgagctga ccaaggtgaa gtacgtgacc gagggcatgc ggaagcccgc cttcctgagc 1620
ggcgagcaga agaaggccat cgtggacctg ctgttcaaga ccaaccggaa ggtgaccgtg 1680
aagcagctga aggaggacta cttcaagaag atcgagtgct tcgacagcgt ggagatcagc 1740
ggcgtggagg accggttcaa cgccagcctg ggcacctacc acgacctgct gaagatcatc 1800
aaggacaagg acttcctgga caacgaggag aacgaggaca tcctggagga catcgtgctg 1860
accctgaccc tgttcgagga ccgggagatg atcgaggagc ggctgaaaac ctacgcccac 1920
ctgttcgacg acaaggtgat gaagcagctg aagcggcggc ggtacaccgg ctggggccgg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcaga gcggcaagac catcctggac 2040
ttcctgaaat ccgacggctt cgccaaccgg aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttca aggaggacat ccagaaggcc caggtgagcg gccagggcga cagcctgcac 2160
gagcacatcg ccaacctggc cggcagcccc gccatcaaga agggcatcct gcagaccgtg 2220
aaggtggtgg acgagctggt gaaggtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gagatggccc gggagaacca gaccacccag aagggccaga agaacagccg ggagcggatg 2340
aagcggatcg aggagggcat caaggagctg ggcagccaga tcctgaagga gcaccccgtg 2400
gagaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa cggccgggac 2460
atgtacgtgg accaggagct ggacatcaac cggctgagcg actacgacgt ggccgccatc 2520
gtgccccaga gcttcctgaa ggacgacagc atcgacaaca aggtgctgac ccggagcgac 2580
aaggcccggg gcaagagcga caacgtgccc agcgaggagg tggtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg atcacccagc ggaagttcga caacctgacc 2700
aaggccgagc ggggcggcct gagcgagctg gacaaggccg gcttcatcaa gcggcagctg 2760
gtggagaccc ggcagatcac caagcacgtg gcccagatcc tggacagccg gatgaacacc 2820
aagtacgacg agaacgacaa gctgatccgg gaggtgaagg tgatcaccct gaaatccaag 2880
ctggtgagcg acttccggaa ggacttccag ttctacaagg tgcgggagat caacaactac 2940
caccacgccc acgacgccta cctgaacgcc gtggtgggca ccgccctgat caagaagtac 3000
cccaagctgg agagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga gatcggcaag gccaccgcca agtacttctt ctacagcaac 3120
atcatgaact tcttcaagac cgagatcacc ctggccaacg gcgagatccg gaagcggccc 3180
ctgatcgaga ccaacggcga gaccggcgag atcgtgtggg acaagggccg ggacttcgcc 3240
accgtgcgga aggtgctgag catgccccag gtgaacatcg tgaagaaaac cgaggtgcag 3300
accggcggct tcagcaagga gagcatcctg cccaagcgga acagcgacaa gctgatcgcc 3360
cggaagaagg actgggaccc caagaagtac ggcggcttcg acagccccac cgtggcctac 3420
agcgtgctgg tggtggccaa ggtggagaag ggcaagagca agaagctgaa atccgtgaag 3480
gagctgctgg gcatcaccat catggagcgg agcagcttcg agaagaaccc catcgacttc 3540
ctggaggcca agggctacaa ggaggtgaag aaggacctga tcatcaagct gcccaagtac 3600
agcctgttcg agctggagaa cggccggaag cggatgctgg ccagcgccgg cgagctgcag 3660
aagggcaacg agctggccct gcccagcaag tacgtgaact tcctgtacct ggccagccac 3720
tacgagaagc tgaagggcag ccccgaggac aacgagcaga agcagctgtt cgtggagcag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttcagcaa gcgggtgatc 3840
ctggccgacg ccaacctgga caaggtgctg agcgcctaca acaagcaccg ggacaagccc 3900
atccgggagc aggccgagaa catcatccac ctgttcaccc tgaccaacct gggcgccccc 3960
gccgccttca agtacttcga caccaccatc gaccggaagc ggtacaccag caccaaggag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac ccggatcgac 4080
ctgagccagc tgggcggcga c 4101
<210> 9
<211> 3159
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 9
gccaagcgga actacatcct gggcctggcc atcggcatca ccagcgtggg ctacggcatc 60
atcgactacg agacccggga cgtgatcgac gccggcgtgc ggctgttcaa ggaggccaac 120
gtggagaaca acgagggccg gcggagcaag cggggcgccc ggcggctgaa gcggcggcgg 180
cggcaccgga tccagcgggt gaagaagctg ctgttcgact acaacctgct gaccgaccac 240
agcgagctga gcggcatcaa cccctacgag gcccgggtga agggcctgag ccagaagctg 300
agcgaggagg agttcagcgc cgccctgctg cacctggcca agcggcgggg cgtgcacaac 360
gtgaacgagg tggaggagga caccggcaac gagctgagca ccaaggagca gatcagccgg 420
aacagcaagg ccctggagga gaagtacgtg gccgagctgc agctggagcg gctgaagaag 480
gacggcgagg tgcggggcag catcaaccgg ttcaagacca gcgactacgt gaaggaggcc 540
aagcagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt catcgacacc 600
tacatcgacc tgctggagac ccggcggacc tactacgagg gccccggcga gggcagcccc 660
ttcggctgga aggacatcaa ggagtggtac gagatgctga tgggccactg cacctacttc 720
cccgaggagc tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa cgccctgaac 780
gacctgaaca acctggtgat cacccgggac gagaacgaga agctggagta ctacgagaag 840
ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa gcagatcgcc 900
aaggagatcc tggtgaacga ggaggacatc aagggctacc gggtgaccag caccggcaag 960
cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acatcaccgc ccggaaggag 1020
atcatcgaga acgccgagct gctggaccag atcgccaaga tcctgaccat ctaccagagc 1080
agcgaggaca tccaggagga gctgaccaac ctgaacagcg agctgaccca ggaggagatc 1140
gagcagatca gcaacctgaa gggctacacc ggcacccaca acctgagcct gaaggccatc 1200
aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgccat cttcaaccgg 1260
ctgaagctgg tgcccaagaa ggtggacctg agccagcaga aggagatccc caccaccctg 1320
gtggacgact tcatcctgag ccccgtggtg aagcggagct tcatccagag catcaaggtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcatcatcga gctggcccgg 1440
gagaagaaca gcaaggacgc ccagaagatg atcaacgaga tgcagaagcg gaaccggcag 1500
accaacgagc ggatcgagga gatcatccgg accaccggca aggagaacgc caagtacctg 1560
atcgagaaga tcaagctgca cgacatgcag gagggcaagt gcctgtacag cctggaggcc 1620
atccccctgg aggacctgct gaacaacccc ttcaactacg aggtggacgc catcatcccc 1680
cggagcgtga gcttcgacaa cagcttcaac aacaaggtgc tggtgaagca ggaggagaac 1740
agcaagaagg gcaaccggac ccccttccag tacctgagca gcagcgacag caagatcagc 1800
tacgagacct tcaagaagca catcctgaac ctggccaagg gcaagggccg gatcagcaag 1860
accaagaagg agtacctgct ggaggagcgg gacatcaacc ggttcagcgt gcagaaggac 1920
ttcatcaacc ggaacctggt ggacacccgg tacgccaccc ggggcctgat gaacctgctg 1980
cggagctact tccgggtgaa caacctggac gtgaaggtga aatccatcaa cggcggcttc 2040
accagcttcc tgcggcggaa gtggaagttc aagaaggagc ggaacaaggg ctacaagcac 2100
cacgccgagg acgccctgat catcgccaac gccgacttca tcttcaagga gtggaagaag 2160
ctggacaagg ccaagaaggt gatggagaac cagatgttcg aggagaagca ggccgagagc 2220
atgcccgaga tcgagaccga gcaggagtac aaggagatct tcatcacccc ccaccagatc 2280
aagcacatca aggacttcaa ggactacaag tacagccacc gggtggacaa gaagcccaac 2340
cggaagctga tcaacgacac cctgtacagc acccggaagg acgacaaggg caacaccctg 2400
atcgtgaaca acctgaacgg cctgtacgac aaggacaacg acaagctgaa gaagctgatc 2460
aacaagagcc ccgagaagct gctgatgtac caccacgacc cccagaccta ccagaagctg 2520
aagctgatca tggagcagta cggcgacgag aagaaccccc tgtacaagta ctacgaggag 2580
accggcaact acctgaccaa gtacagcaag aaggacaacg gccccgtgat caagaagatc 2640
aagtactacg gcaacaagct gaacgcccac ctggacatca ccgacgacta ccccaacagc 2700
cggaacaagg tggtgaagct gagcctgaag ccctaccggt tcgacgtgta cctggacaac 2760
ggcgtgtaca agttcgtgac cgtgaagaac ctggacgtga tcaagaagga gaactactac 2820
gaggtgaaca gcaagtgcta cgaggaggcc aagaagctga agaagatcag caaccaggcc 2880
gagttcatcg ccagcttcta caagaacgac ctgatcaaga tcaacggcga gctgtaccgg 2940
gtgatcggcg tgaacaacga cctgctgaac cggatcgagg tgaacatgat cgacatcacc 3000
taccgggagt acctggagaa catgaacgac aagcggcccc cccacatcat caagaccatc 3060
gccagcaaga cccagagcat caagaagtac agcaccgaca tcctgggcaa cctgtacgag 3120
gtgaaatcca agaagcaccc ccagatcatc aagaagggc 3159
<210> 10
<211> 1155
<212> DNA
<213> Spiroplasma monobiae
<400> 10
agcaaggtgg agaacaagac caagaagctg cgggtgttcg aggccttcgc cggcatcggc 60
gcccagcgga aggccctgga gaaggtgcgg aaggacgagt acgagatcgt gggcctggcc 120
gagtggtacg tgcccgccat cgtgatgtac caggccatcc acaacaactt ccacaccaag 180
ctggagtaca agagcgtgag ccgggaggag atgatcgact acctggagaa caagaccctg 240
agctggaaca gcaagaaccc cgtgagcaac ggctactgga agcggaagaa ggacgacgag 300
ctgaagatca tctacaacgc catcaagctg agcgagaagg agggcaacat cttcgacatc 360
cgggacctgt acaagcggac cctgaagaac atcgacctgc tgacctacag cttcccctgc 420
caggacctga gccagcaggg catccagaag ggcatgaagc ggggcagcgg cacccggagc 480
ggcctgctgt gggagatcga gcgggccctg gacagcaccg agaagaacga cctgcccaag 540
tacctgctga tggagaacgt gggcgccctg ctgcacaaga agaacgagga ggagctgaac 600
cagtggaagc agaagctgga gagcctgggc taccagaaca gcatcgaggt gctgaacgcc 660
gccgacttcg gcagcagcca ggcccggcgg cgggtgttca tgatcagcac cctgaacgag 720
ttcgtggagc tgcccaaggg cgacaagaag cccaagagca tcaagaaggt gctgaacaag 780
atcgtgagcg agaaggacat cctgaacaac ctgctgaagt acaacctgac cgagttcaag 840
aaaaccaaga gcaacatcaa caaggccagc ctgatcggct acagcaagtt caacagcgag 900
ggctacgtgt acgaccccga gttcaccggc cccaccctga ccgccagcgg cgccaacagc 960
cggatcaaga tcaaggacgg cagcaacatc cggaagatga acagcgacga gaccttcctg 1020
tacatcggct tcgacagcca ggacggcaag cgggtgaacg agatcgagtt cctgaccgag 1080
aaccagaaga tcttcgtgtg cggcaacagc atcagcgtgg aggtgctgga ggccatcatc 1140
gacaagatcg gcggc 1155
<210> 11
<211> 386
<212> PRT
<213> Spiroplasma monobiae
<400> 11
Met Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val Phe Glu Ala
1 5 10 15
Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys Val Arg Lys
20 25 30
Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val Pro Ala Ile
35 40 45
Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys Leu Glu Tyr
50 55 60
Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr
65 70 75 80
Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg
85 90 95
Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser
100 105 110
Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr
115 120 125
Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu
130 135 140
Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg
145 150 155 160
Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys
165 170 175
Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu Leu
180 185 190
His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys Leu Glu
195 200 205
Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala Ala Asp Phe
210 215 220
Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser Thr Leu Asn
225 230 235 240
Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys Ser Ile Lys
245 250 255
Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu Asn Asn Leu
260 265 270
Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser Asn Ile Asn
275 280 285
Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu Gly Tyr Val
290 295 300
Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn
305 310 315 320
Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser
325 330 335
Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg
340 345 350
Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys
355 360 365
Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile
370 375 380
Gly Gly
385
<210> 12
<211> 385
<212> PRT
<213> Spiroplasma monobiae
<400> 12
Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val Phe Glu Ala Phe
1 5 10 15
Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys Val Arg Lys Asp
20 25 30
Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val Pro Ala Ile Val
35 40 45
Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys Leu Glu Tyr Lys
50 55 60
Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu
65 70 75 80
Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys
85 90 95
Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu
100 105 110
Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu
115 120 125
Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser
130 135 140
Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser
145 150 155 160
Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys Asn
165 170 175
Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu Leu His
180 185 190
Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys Leu Glu Ser
195 200 205
Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala Ala Asp Phe Gly
210 215 220
Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser Thr Leu Asn Glu
225 230 235 240
Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys Ser Ile Lys Lys
245 250 255
Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu Asn Asn Leu Leu
260 265 270
Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser Asn Ile Asn Lys
275 280 285
Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr
290 295 300
Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser
305 310 315 320
Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp
325 330 335
Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val
340 345 350
Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly
355 360 365
Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly
370 375 380
Gly
385
<210> 13
<211> 96
<212> PRT
<213> Homo sapiens
<400> 13
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 30
Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 60
Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln
65 70 75 80
Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
85 90 95
<210> 14
<211> 288
<212> DNA
<213> Homo sapiens
<400> 14
gacgccaaga gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg 60
gacttcaccc gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac 120
gtgatgctgg agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac 180
gtgatcctgc ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag 240
gagacccacc ccgacagcga gaccgccttc gagatcaaga gcagcgtg 288
<210> 15
<211> 475
<212> PRT
<213> Homo sapiens
<400> 15
Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His
1 5 10 15
Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro Cys
20 25 30
Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly
35 40 45
Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg
50 55 60
Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val
65 70 75 80
Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu
85 90 95
Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg
100 105 110
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala
115 120 125
Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly
130 135 140
Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn
145 150 155 160
Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn Glu
165 170 175
Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe
180 185 190
Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg Gln
195 200 205
Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg His Leu Phe
210 215 220
Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn
225 230 235 240
Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser
245 250 255
Leu Arg Gly Ser His Met Asn Pro Leu Glu Met Phe Glu Thr Val Pro
260 265 270
Val Trp Arg Arg Gln Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile
275 280 285
Lys Lys Glu Leu Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro
290 295 300
Gly Gln Leu Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp
305 310 315 320
Val Glu Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro
325 330 335
Leu Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe
340 345 350
His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg Pro
355 360 365
Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu Asp Leu
370 375 380
Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr Ile Pro Asp
385 390 395 400
Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val Trp Ser Asn Ile
405 410 415
Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val Ser Glu Glu Glu Leu
420 425 430
Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser Lys Leu Ala Ala Lys Trp
435 440 445
Pro Thr Lys Leu Val Lys Asn Cys Phe Leu Pro Leu Arg Glu Tyr Phe
450 455 460
Lys Tyr Phe Ser Thr Glu Leu Thr Ser Ser Leu
465 470 475
<210> 16
<211> 1626
<212> DNA
<213> Homo sapiens
<400> 16
aaccacgacc aggagttcga cccccccaag gtgtaccccc ccgtgcccgc cgagaagcgg 60
aagcccatcc gggtgctgag cctgttcgac ggcatcgcca ccggcctgct ggtgctgaag 120
gacctgggca tccaggtgga ccggtacatc gccagcgagg tgtgcgagga cagcatcacc 180
gtgggcatgg tgcggcacca gggcaagatc atgtacgtgg gcgacgtgcg gagcgtgacc 240
cagaagcaca tccaggagtg gggccccttc gacctggtga tcggcggcag cccctgcaac 300
gacctgagca tcgtgaaccc cgcccggaag ggcctgtacg agggcaccgg ccggctgttc 360
ttcgagttct accggctgct gcacgacgcc cggcccaagg agggcgacga ccggcccttc 420
ttctggctgt tcgagaacgt ggtggccatg ggcgtgagcg acaagcggga catcagccgg 480
ttcctggaga gcaaccccgt gatgatcgac gccaaggagg tgagcgccgc ccaccgggcc 540
cggtacttct ggggcaacct gcccggcatg aaccggcccc tggccagcac cgtgaacgac 600
aagctggagc tgcaggagtg cctggagcac ggccggatcg ccaagttcag caaggtgcgg 660
accatcacca cccggagcaa cagcatcaag cagggcaagg accagcactt ccccgtgttc 720
atgaacgaga aggaggacat cctgtggtgc accgagatgg agcgggtgtt cggcttcccc 780
gtgcactaca ccgacgtgag caacatgagc cggctggccc ggcagcggct gctgggccgg 840
agctggagcg tgcccgtgat ccggcacctg ttcgcccccc tgaaggagta cttcgcctgc 900
gtgagcagcg gcaacagcaa cgccaacagc cggggcccca gcttcagcag cggcctggtg 960
cccctgagcc tgcggggcag ccacatgaat cctctggaga tgttcgagac agtgcccgtg 1020
tggagaaggc aacccgtgag ggtgctgagc ctcttcgagg acattaagaa ggagctgacc 1080
tctctgggct ttctggaatc cggcagcgac cccggccagc tgaaacacgt ggtggacgtg 1140
accgacacag tgaggaagga cgtggaagag tggggcccct ttgacctcgt gtatggagcc 1200
acacctcctc tcggccacac atgcgatagg cctcccagct ggtatctctt ccagttccac 1260
agactgctcc agtacgccag acctaagccc ggcagcccca gacccttctt ctggatgttc 1320
gtggacaatc tggtgctgaa caaggaggat ctggatgtgg ccagcagatt tctggagatg 1380
gaacccgtga caatccccga cgtgcatggc ggctctctgc agaacgccgt gagagtgtgg 1440
tccaacatcc ccgccattag aagcagacac tgggctctgg tgagcgagga ggaactgtct 1500
ctgctggccc agaataagca gtcctccaag ctggccgcca agtggcccac caagctggtg 1560
aagaactgct ttctgcctct gagggagtat ttcaagtatt tcagcaccga actgaccagc 1620
agcctg 1626
<210> 17
<211> 745
<212> PRT
<213> Homo sapiens
<400> 17
Gly Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys
1 5 10 15
Arg Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg
20 25 30
Arg Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile
35 40 45
Leu Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile
50 55 60
Gln Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg
65 70 75 80
Glu Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro
85 90 95
Leu Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp
100 105 110
Ser Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His
115 120 125
Asn Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe
130 135 140
Ile Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg
145 150 155 160
Glu Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala
165 170 175
Leu Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro
180 185 190
Glu Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp
195 200 205
Lys Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu
210 215 220
Ala Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys
225 230 235 240
Glu Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro
245 250 255
Pro Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln
260 265 270
Arg Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys
275 280 285
Phe Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr
290 295 300
Tyr Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly
305 310 315 320
Pro Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala
325 330 335
Leu Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg
340 345 350
Arg Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr
355 360 365
Ile Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly
370 375 380
Thr Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys
385 390 395 400
Asp Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro
405 410 415
Ile Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser
420 425 430
Gly Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp
435 440 445
Asn Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln
450 455 460
Val Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro
465 470 475 480
Ala Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg
485 490 495
Leu Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser
500 505 510
Ser Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro
515 520 525
Cys Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys
530 535 540
Phe Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg
545 550 555 560
Cys Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val
565 570 575
Arg Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His
580 585 590
Trp Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly
595 600 605
Ser Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly
610 615 620
Ile Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr
625 630 635 640
Cys Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val
645 650 655
Tyr Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe
660 665 670
Val Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His
675 680 685
Ser Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp
690 695 700
His Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu
705 710 715 720
Leu Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val
725 730 735
Gly Ile Glu Arg Glu Met Glu Ile Pro
740 745
<210> 18
<211> 2235
<212> DNA
<213> Homo sapiens
<400> 18
ggccagaccg gcaagaagag cgagaagggc cccgtgtgct ggcggaagcg ggtgaagagc 60
gagtacatgc ggctgcggca gctgaagcgg ttccggcggg ccgacgaggt gaagagcatg 120
ttcagcagca accggcagaa gatcctggag cggaccgaga tcctgaacca ggagtggaag 180
cagcggcgaa tccagcccgt gcacatcctg accagcgtga gcagcctgcg gggcacccgg 240
gagtgcagcg tgaccagcga cctggacttc cccacccagg tgatccccct aaagaccctg 300
aacgccgtgg ccagcgtgcc catcatgtac agctggagcc ccctgcagca gaacttcatg 360
gtggaggacg agaccgtgct gcacaacatc ccctacatgg gcgacgaggt gctggaccag 420
gacggcacct tcatcgagga gctgatcaag aactacgacg gcaaggtgca cggcgaccgg 480
gagtgcggct tcatcaacga cgagatcttc gtggagctgg tgaacgccct gggccagtac 540
aacgacgacg acgacgacga cgacggcgac gaccccgagg agcgggagga gaagcagaag 600
gacctggagg accaccggga cgacaaggag agccggcccc cccggaagtt ccccagcgac 660
aagatcttcg aggccatcag cagcatgttc cccgacaagg gcaccgccga ggagctgaag 720
gagaagtaca aggagctgac cgagcagcag ctgcccggcg ccctgccccc cgagtgcacc 780
cccaacatcg acggccccaa cgccaagagc gtgcagcggg agcagagcct gcacagcttc 840
cacaccctgt tctgccggcg gtgcttcaag tacgactgct tcctgcaccc cttccacgcc 900
acccccaaca cctacaagcg gaagaacacc gagaccgccc tggacaacaa gccctgcggc 960
ccccagtgct accagcacct ggagggcgcc aaggagttcg ccgccgccct gaccgccgag 1020
cggatcaaga ccccccccaa gcggcccggc ggccggcggc ggggccggct gcccaacaac 1080
agcagccggc ccagcacccc caccatcaac gtgctggaga gcaaggacac cgacagcgac 1140
cgggaggccg gcaccgagac cggcggcgag aacaacgaca aggaggagga ggagaagaag 1200
gacgagacca gcagcagcag cgaggccaac agccggtgcc agacccccat caagatgaag 1260
cccaacatcg agccccccga gaacgtggag tggagcggcg ccgaggccag catgttccgg 1320
gtgctgatcg gcacctacta cgacaacttc tgcgccatcg cccggctgat cggcaccaag 1380
acctgccggc aggtgtacga gttccgggtg aaggagagca gcatcatcgc ccccgccccc 1440
gccgaggacg tggacacccc cccccggaag aagaagcgga agcaccggct gtgggccgcc 1500
cactgccgga agatccagct gaagaaggac ggcagcagca accacgtgta caactaccag 1560
ccctgcgacc acccccggca gccctgcgac agcagctgcc cctgcgtgat cgcccagaac 1620
ttctgcgaga agttctgcca gtgcagcagc gagtgccaga accggttccc cggctgccgg 1680
tgcaaggccc agtgcaacac caagcagtgc ccctgctacc tggccgtgcg ggagtgcgac 1740
cccgacctgt gcctgacctg cggcgccgcc gaccactggg acagcaagaa cgtgagctgc 1800
aagaactgca gcatccagcg gggcagcaag aagcacctgc tgctggcccc cagcgacgtg 1860
gccggctggg gcatcttcat caaggacccc gtgcagaaga acgagttcat cagcgagtac 1920
tgcggcgaga tcatcagcca ggacgaggcc gaccggcggg gcaaggtgta cgacaagtac 1980
atgtgcagct tcctgttcaa cctgaacaac gacttcgtgg tggacgccac ccggaagggc 2040
aacaagatcc ggttcgccaa ccacagcgtg aaccccaact gctacgccaa ggtgatgatg 2100
gtgaacggcg accaccggat cggcatcttc gccaagcggg ccatccagac cggcgaggag 2160
ctgttcttcg actaccggta cagccaggcc gacgccctga agtacgtggg catcgagcgg 2220
gagatggaga tcccc 2235
<210> 19
<211> 376
<212> PRT
<213> Homo sapiens
<400> 19
Glu Glu Pro Glu Glu Pro Ala Asp Ser Gly Gln Ser Leu Val Pro Val
1 5 10 15
Tyr Ile Tyr Ser Pro Glu Tyr Val Ser Met Cys Asp Ser Leu Ala Lys
20 25 30
Ile Pro Lys Arg Ala Ser Met Val His Ser Leu Ile Glu Ala Tyr Ala
35 40 45
Leu His Lys Gln Met Arg Ile Val Lys Pro Lys Val Ala Ser Met Glu
50 55 60
Glu Met Ala Thr Phe His Thr Asp Ala Tyr Leu Gln His Leu Gln Lys
65 70 75 80
Val Ser Gln Glu Gly Asp Asp Asp His Pro Asp Ser Ile Glu Tyr Gly
85 90 95
Leu Gly Tyr Asp Cys Pro Ala Thr Glu Gly Ile Phe Asp Tyr Ala Ala
100 105 110
Ala Ile Gly Gly Ala Thr Ile Thr Ala Ala Gln Cys Leu Ile Asp Gly
115 120 125
Met Cys Lys Val Ala Ile Asn Trp Ser Gly Gly Trp His His Ala Lys
130 135 140
Lys Asp Glu Ala Ser Gly Phe Cys Tyr Leu Asn Asp Ala Val Leu Gly
145 150 155 160
Ile Leu Arg Leu Arg Arg Lys Phe Glu Arg Ile Leu Tyr Val Asp Leu
165 170 175
Asp Leu His His Gly Asp Gly Val Glu Asp Ala Phe Ser Phe Thr Ser
180 185 190
Lys Val Met Thr Val Ser Leu His Lys Phe Ser Pro Gly Phe Phe Pro
195 200 205
Gly Thr Gly Asp Val Ser Asp Val Gly Leu Gly Lys Gly Arg Tyr Tyr
210 215 220
Ser Val Asn Val Pro Ile Gln Asp Gly Ile Gln Asp Glu Lys Tyr Tyr
225 230 235 240
Gln Ile Cys Glu Ser Val Leu Lys Glu Val Tyr Gln Ala Phe Asn Pro
245 250 255
Lys Ala Val Val Leu Gln Leu Gly Ala Asp Thr Ile Ala Gly Asp Pro
260 265 270
Met Cys Ser Phe Asn Met Thr Pro Val Gly Ile Gly Lys Cys Leu Lys
275 280 285
Tyr Ile Leu Gln Trp Gln Leu Ala Thr Leu Ile Leu Gly Gly Gly Gly
290 295 300
Tyr Asn Leu Ala Asn Thr Ala Arg Cys Trp Thr Tyr Leu Thr Gly Val
305 310 315 320
Ile Leu Gly Lys Thr Leu Ser Ser Glu Ile Pro Asp His Glu Phe Phe
325 330 335
Thr Ala Tyr Gly Pro Asp Tyr Val Leu Glu Ile Thr Pro Ser Cys Arg
340 345 350
Pro Asp Arg Asn Glu Pro His Arg Ile Gln Gln Ile Leu Asn Tyr Ile
355 360 365
Lys Gly Asn Leu Lys His Val Val
370 375
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 20
ggggccacta gggacaggat 20
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 21
agccccacct tgtggtcaga 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 22
agtgctgcct tctgaccaca 20
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 23
gctgccttct gaccacaagg 20
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 24
ccagtataag ccccaccttg 20
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 25
ctgcctgtcc cataaggagg 20
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 26
gcactgcctg tcccataagg 20
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 27
ggtcctcctc cttatgggac 20
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 28
gccttgtttt cggctctaga 20
<210> 29
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 29
gccatctaga gccgaaaaca 20
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 30
ccaatgaaga tgaaactggg 20
<210> 31
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 31
aacgtgcttg cctaagattc 20
<210> 32
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 32
agcccttaat catatctagt 20
<210> 33
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 33
cagagcttaa gacctgtact 20
<210> 34
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 34
gcccaccttg accttcacaa 20
<210> 35
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 35
gttactgcgt aattaccagg 20
<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 36
tattacatcc tacctataag 20
<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 37
tgggctctgg acttagatcg 20
<210> 38
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 38
taagtgggct atgtatacac 20
<210> 39
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 39
tttctaagtc tgtcacaagg 20
<210> 40
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 40
aaagtaatat gatctaggaa 20
<210> 41
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 41
gttcgagcgg ctgtgcgagg 20
<210> 42
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 42
gctctgtggc tctccgagaa 20
<210> 43
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 43
gtgtgtgtgt ttcaacgtag 20
<210> 44
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 44
ggaagtcact gggagctgcg 20
<210> 45
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 45
ggccacgggt gtgttcccag 20
<210> 46
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 46
atggccattt gcaaaagtca 20
<210> 47
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 47
ccaaactaga cagataaagc 20
<210> 48
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 48
ccagcatgac tctagcatgc 20
<210> 49
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 49
tggccaaggt ctgatatgca 20
<210> 50
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 50
tcatgagtcc cagaacatgt 20
<210> 51
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 51
gcgaaagaag tagtagctaa 20
<210> 52
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 52
gactaagact ggcaaatctg 20
<210> 53
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 53
gactaagagg agccgacatg 20
<210> 54
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 54
gaaaaacggg tgttgtgacg 20
<210> 55
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 55
tttgtgaact aaggattctg 20
<210> 56
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 56
gtccgtgtag agttaccatg 20
<210> 57
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 57
gatgtattca caagaggact 20
<210> 58
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 58
aattactacc tcatagctag 20
<210> 59
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 59
gaaggtagaa atccgccact 20
<210> 60
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 60
gaaacgccga ggtaactcat 20
<210> 61
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 61
caactaaaat ttctagccct 20
<210> 62
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 62
gactccagtc tttctagaag a 21
<210> 63
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 63
Pro Lys Lys Lys Arg Lys
1 5
<210> 64
<211> 15
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 64
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
<210> 65
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 65
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 66
<211> 1128
<212> DNA
<213> Homo sapiens
<400> 66
gaggagcccg aggagcccgc cgatagcgga caatctctgg tgcccgtcta catctacagc 60
cccgaatatg tgagcatgtg tgattccctc gccaagatcc ctaagagagc cagcatggtg 120
cattctctga tcgaggccta cgctctgcat aagcaaatga ggatcgtgaa gcccaaggtc 180
gccagcatgg aagagatggc cacctttcac accgatgcct acctccaaca tctccagaag 240
gtgtcccaag agggcgacga cgaccacccc gactccattg agtacggact gggctatgat 300
tgccccgcca ccgagggcat ctttgactat gccgccgcta tcggcggagc taccatcaca 360
gccgcccagt gtctgattga tggcatgtgc aaggtcgcca tcaactggtc cggaggctgg 420
catcatgcca agaaggatga ggcctccggc ttctgttatc tgaatgacgc cgtgctgggc 480
attctgagac tgaggaggaa attcgagagg attctgtacg tggatctgga tctgcatcac 540
ggagatggag tcgaagatgc cttcagcttc accagcaagg tgatgacagt ctctctgcac 600
aagttctccc ccggcttctt tcccggaacc ggcgacgtgt ccgacgtggg actgggcaag 660
ggaaggtact acagcgtgaa cgtgcccatt caagacggca tccaagacga gaagtactac 720
cagatctgcg agtccgtgct caaggaggtc taccaagcct tcaatcctaa ggctgtcgtg 780
ctccaactgg gagctgatac cattgctggc gatcccatgt gcagcttcaa tatgacaccc 840
gtcggaatcg gcaagtgcct caagtacatc ctccagtggc agctcgccac cctcattctc 900
ggaggaggcg gatacaatct ggctaatacc gccagatgct ggacctatct gaccggcgtg 960
attctgggca aaacactgag cagcgaaatc cccgaccacg agtttttcac cgcttacggc 1020
cccgactacg tgctggagat cacccccagc tgcagacccg atagaaacga accccataga 1080
atccagcaaa ttctgaacta tatcaagggc aacctcaagc acgtcgtg 1128
<210> 67
<211> 282
<212> PRT
<213> Homo sapiens
<400> 67
Gly Asn Arg Ala Ile Arg Thr Glu Lys Ile Ile Cys Arg Asp Val Ala
1 5 10 15
Arg Gly Tyr Glu Asn Val Pro Ile Pro Cys Val Asn Gly Val Asp Gly
20 25 30
Glu Pro Cys Pro Glu Asp Tyr Lys Tyr Ile Ser Glu Asn Cys Glu Thr
35 40 45
Ser Thr Met Asn Ile Asp Arg Asn Ile Thr His Leu Gln His Cys Thr
50 55 60
Cys Val Asp Asp Cys Ser Ser Ser Asn Cys Leu Cys Gly Gln Leu Ser
65 70 75 80
Ile Arg Cys Trp Tyr Asp Lys Asp Gly Arg Leu Leu Gln Glu Phe Asn
85 90 95
Lys Ile Glu Pro Pro Leu Ile Phe Glu Cys Asn Gln Ala Cys Ser Cys
100 105 110
Trp Arg Asn Cys Lys Asn Arg Val Val Gln Ser Gly Ile Lys Val Arg
115 120 125
Leu Gln Leu Tyr Arg Thr Ala Lys Met Gly Trp Gly Val Arg Ala Leu
130 135 140
Gln Thr Ile Pro Gln Gly Thr Phe Ile Cys Glu Tyr Val Gly Glu Leu
145 150 155 160
Ile Ser Asp Ala Glu Ala Asp Val Arg Glu Asp Asp Ser Tyr Leu Phe
165 170 175
Asp Leu Asp Asn Lys Asp Gly Glu Val Tyr Cys Ile Asp Ala Arg Tyr
180 185 190
Tyr Gly Asn Ile Ser Arg Phe Ile Asn His Leu Cys Asp Pro Asn Ile
195 200 205
Ile Pro Val Arg Val Phe Met Leu His Gln Asp Leu Arg Phe Pro Arg
210 215 220
Ile Ala Phe Phe Ser Ser Arg Asp Ile Arg Thr Gly Glu Glu Leu Gly
225 230 235 240
Phe Asp Tyr Gly Asp Arg Phe Trp Asp Ile Lys Ser Lys Tyr Phe Thr
245 250 255
Cys Gln Cys Gly Ser Glu Lys Cys Lys His Ser Ala Glu Ala Ile Ala
260 265 270
Leu Glu Gln Ser Arg Leu Ala Arg Leu Asp
275 280
<210> 68
<211> 846
<212> DNA
<213> Homo sapiens
<400> 68
ggaaataggg ctatcagaac cgagaagatc atctgtaggg acgtggctag aggctacgag 60
aacgtgccca ttccttgcgt gaatggcgtg gatggcgaac cttgccccga ggactacaaa 120
tacatctccg agaactgcga aaccagcaca atgaacatcg acagaaacat cacccacctc 180
cagcactgca catgtgtgga tgactgctcc tccagcaact gtctgtgcgg ccagctctcc 240
atcagatgct ggtacgacaa ggacggcaga ctgctgcaag agttcaacaa gatcgaaccc 300
cctctcatct tcgagtgtaa ccaagcttgc agctgctgga gaaactgcaa gaatagagtg 360
gtccagagcg gcatcaaggt gagactgcaa ctgtacagaa ccgccaagat gggatgggga 420
gtgagggctc tgcaaaccat tccccaaggc accttcatct gcgaatacgt gggcgaactg 480
atctccgacg ccgaagctga cgtgagagag gacgacagct atctcttcga tctggacaat 540
aaggacggcg aggtgtactg catcgacgct agatattacg gcaacatctc tagattcatc 600
aaccacctct gcgatcccaa catcattccc gtgagggtgt tcatgctgca ccaagatctg 660
aggttcccta gaatcgcctt cttcagctct agagacatca gaaccggcga ggagctgggc 720
ttcgattacg gcgatagatt ctgggacatc aagtccaagt acttcacatg ccagtgcggc 780
agcgagaagt gtaagcacag cgctgaggcc attgctctgg agcagtctag actggccaga 840
ctggat 846
<210> 69
<211> 7987
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 69
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaggaa 120
gcgccgctat cgccgaagtg ctgctgaatg ccagatgcga tctgcatgcc gtgaactacc 180
acggcgacac ccctctgcat atcgccgcta gagagagcta ccatgactgt gtgctgctgt 240
ttctgagcag aggcgccaat cccgagctca gaaacaaaga gggcgacacc gcttgggatc 300
tgacacccga gagatccgac gtgtggttcg ctctgcaact gaatagaaaa ctgagactgg 360
gcgtcggcaa tagggccatt agaaccgaga agatcatctg tagggacgtg gctaggggct 420
acgagaacgt gcccatccct tgtgtgaacg gagtggatgg agagccttgc cccgaggatt 480
acaaatacat cagcgagaac tgcgaaacct ccaccatgaa tatcgataga aacattacac 540
acctccagca ctgtacatgc gtggacgatt gcagcagcag caactgtctg tgcggccaac 600
tgagcatcag atgctggtac gacaaggatg gcagactgct gcaagagttc aacaagatcg 660
aaccccctct gatcttcgag tgtaaccaag cttgcagctg ttggaggaac tgcaagaata 720
gggtcgtgca gtccggaatc aaggtgagac tgcagctgta tagaacagct aagatgggat 780
ggggagtcag agctctgcag accatccccc aaggcacatt catctgtgag tacgtcggcg 840
aactcatcag cgacgctgag gccgatgtga gggaggacga cagctatctc ttcgacctcg 900
acaacaagga cggcgaggtg tactgcatcg acgctagata ttacggcaac atcagcagat 960
tcatcaacca cctctgcgac cccaatatca tccccgtgag agtgttcatg ctccatcaag 1020
atctgagatt ccctaggatc gccttcttca gctctagaga cattagaacc ggcgaggagc 1080
tgggattcga ctacggcgac aggttctggg acatcaagag caagtacttc acatgccaat 1140
gcggcagcga gaaatgcaag catagcgccg aggccattgc tctggagcag tctagactgg 1200
ctaggctgga ccctcacccc gagctgctgc ccgaactggg atctctgcct cccgtgaata 1260
ccggaggtgg cggatcggga gacaagaagt acagcatcgg cctggccatc ggcaccaaca 1320
gcgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaag ttcaaggtgc 1380
tgggcaacac cgaccggcac agcatcaaga agaacctgat cggcgccctg ctgttcgaca 1440
gcggcgagac cgccgaggcc acccggctga agcggaccgc ccggcggcgg tacacccggc 1500
ggaagaaccg gatctgctac ctgcaggaga tcttcagcaa cgagatggcc aaggtggacg 1560
acagcttctt ccaccggctg gaggagagct tcctggtgga ggaggacaag aagcacgagc 1620
ggcaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag taccccacca 1680
tctaccacct gcggaagaag ctggtggaca gcaccgacaa ggccgacctg cggctgatct 1740
acctggccct ggcccacatg atcaagttcc ggggccactt cctgatcgag ggcgacctga 1800
accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc tacaaccagc 1860
tgttcgagga gaaccccatc aacgccagcg gcgtggacgc caaggccatc ctgagcgccc 1920
ggctgagcaa gagccggcgg ctggagaacc tgatcgccca gctgcccggc gagaagaaga 1980
acggcctgtt cggcaacctg atcgccctga gcctgggcct gacccccaac ttcaagagca 2040
acttcgacct ggccgaggac gccaagctgc agctgagcaa ggacacctac gacgacgacc 2100
tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg gccgccaaga 2160
acctgagcga cgccatcctg ctgagcgaca tcctgcgggt gaacaccgag atcaccaagg 2220
cccccctgag cgccagcatg atcaagcggt acgacgagca ccaccaggac ctgaccctgc 2280
tgaaggccct ggtgcggcag cagctgcccg agaagtacaa ggagatcttc ttcgaccaga 2340
gcaagaacgg ctacgccggc tacatcgacg gcggcgccag ccaggaggag ttctacaagt 2400
tcatcaagcc catcctggag aagatggacg gcaccgagga gctgctggtg aagctgaacc 2460
gggaggacct gctgcggaag cagcggacct tcgacaacgg cagcatcccc caccagatcc 2520
acctgggcga gctgcacgcc atcctgcggc ggcaggagga cttctacccc ttcctgaagg 2580
acaaccggga gaagatcgag aagatcctga ccttccggat cccctactac gtgggccccc 2640
tggcccgggg caacagccgg ttcgcctgga tgacccggaa atccgaggag accatcaccc 2700
cctggaactt cgaggaggtg gtggacaagg gcgccagcgc ccagagcttc atcgagcgga 2760
tgaccaactt cgacaagaac ctgcccaacg agaaggtgct gcccaagcac agcctgctgt 2820
acgagtactt caccgtgtac aacgagctga ccaaggtgaa gtacgtgacc gagggcatgc 2880
ggaagcccgc cttcctgagc ggcgagcaga agaaggccat cgtggacctg ctgttcaaga 2940
ccaaccggaa ggtgaccgtg aagcagctga aggaggacta cttcaagaag atcgagtgct 3000
tcgacagcgt ggagatcagc ggcgtggagg accggttcaa cgccagcctg ggcacctacc 3060
acgacctgct gaagatcatc aaggacaagg acttcctgga caacgaggag aacgaggaca 3120
tcctggagga catcgtgctg accctgaccc tgttcgagga ccgggagatg atcgaggagc 3180
ggctgaaaac ctacgcccac ctgttcgacg acaaggtgat gaagcagctg aagcggcggc 3240
ggtacaccgg ctggggccgg ctgagccgga agctgatcaa cggcatccgg gacaagcaga 3300
gcggcaagac catcctggac ttcctgaaat ccgacggctt cgccaaccgg aacttcatgc 3360
agctgatcca cgacgacagc ctgaccttca aggaggacat ccagaaggcc caggtgagcg 3420
gccagggcga cagcctgcac gagcacatcg ccaacctggc cggcagcccc gccatcaaga 3480
agggcatcct gcagaccgtg aaggtggtgg acgagctggt gaaggtgatg ggccggcaca 3540
agcccgagaa catcgtgatc gagatggccc gggagaacca gaccacccag aagggccaga 3600
agaacagccg ggagcggatg aagcggatcg aggagggcat caaggagctg ggcagccaga 3660
tcctgaagga gcaccccgtg gagaacaccc agctgcagaa cgagaagctg tacctgtact 3720
acctgcagaa cggccgggac atgtacgtgg accaggagct ggacatcaac cggctgagcg 3780
actacgacgt ggccgccatc gtgccccaga gcttcctgaa ggacgacagc atcgacaaca 3840
aggtgctgac ccggagcgac aaggcccggg gcaagagcga caacgtgccc agcgaggagg 3900
tggtgaagaa gatgaagaac tactggcggc agctgctgaa cgccaagctg atcacccagc 3960
ggaagttcga caacctgacc aaggccgagc ggggcggcct gagcgagctg gacaaggccg 4020
gcttcatcaa gcggcagctg gtggagaccc ggcagatcac caagcacgtg gcccagatcc 4080
tggacagccg gatgaacacc aagtacgacg agaacgacaa gctgatccgg gaggtgaagg 4140
tgatcaccct gaaatccaag ctggtgagcg acttccggaa ggacttccag ttctacaagg 4200
tgcgggagat caacaactac caccacgccc acgacgccta cctgaacgcc gtggtgggca 4260
ccgccctgat caagaagtac cccaagctgg agagcgagtt cgtgtacggc gactacaagg 4320
tgtacgacgt gcggaagatg atcgccaaga gcgagcagga gatcggcaag gccaccgcca 4380
agtacttctt ctacagcaac atcatgaact tcttcaagac cgagatcacc ctggccaacg 4440
gcgagatccg gaagcggccc ctgatcgaga ccaacggcga gaccggcgag atcgtgtggg 4500
acaagggccg ggacttcgcc accgtgcgga aggtgctgag catgccccag gtgaacatcg 4560
tgaagaaaac cgaggtgcag accggcggct tcagcaagga gagcatcctg cccaagcgga 4620
acagcgacaa gctgatcgcc cggaagaagg actgggaccc caagaagtac ggcggcttcg 4680
acagccccac cgtggcctac agcgtgctgg tggtggccaa ggtggagaag ggcaagagca 4740
agaagctgaa atccgtgaag gagctgctgg gcatcaccat catggagcgg agcagcttcg 4800
agaagaaccc catcgacttc ctggaggcca agggctacaa ggaggtgaag aaggacctga 4860
tcatcaagct gcccaagtac agcctgttcg agctggagaa cggccggaag cggatgctgg 4920
ccagcgccgg cgagctgcag aagggcaacg agctggccct gcccagcaag tacgtgaact 4980
tcctgtacct ggccagccac tacgagaagc tgaagggcag ccccgaggac aacgagcaga 5040
agcagctgtt cgtggagcag cacaagcact acctggacga gatcatcgag cagatcagcg 5100
agttcagcaa gcgggtgatc ctggccgacg ccaacctgga caaggtgctg agcgcctaca 5160
acaagcaccg ggacaagccc atccgggagc aggccgagaa catcatccac ctgttcaccc 5220
tgaccaacct gggcgccccc gccgccttca agtacttcga caccaccatc gaccggaagc 5280
ggtacaccag caccaaggag gtgctggacg ccaccctgat ccaccagagc atcaccggcc 5340
tgtacgagac ccggatcgac ctgagccagc tgggcggcga cagcggcggc aagcggcccg 5400
ccgccaccaa gaaggccggc caggccaaga agaagaagtc gggcgggggt ggctcaggac 5460
agaccggcaa aaagtccgaa aagggccccg tgtgctggag gaagagggtc aagagcgagt 5520
acatgaggct gagacagctc aagagattta ggagagccga tgaggtgaag tccatgttct 5580
ccagcaacag acaaaagatt ctggagagga ccgagatcct caaccaagag tggaagcaga 5640
gaagaatcca gcccgtgcac attctgacct ccgtgagctc tctgaggggc acaagagaat 5700
gctccgtcac cagcgatctg gacttcccca cacaagtgat ccccctcaag acactgaacg 5760
ctgtggccag cgtgcccatc atgtatagct ggtcccctct gcaacagaac ttcatggtgg 5820
aggacgagac agtgctgcac aatatcccct acatgggaga tgaggtgctg gaccaagacg 5880
gcacctttat tgaggagctg attaaaaact acgatggcaa ggtgcacggc gatagggagt 5940
gtggcttcat caacgacgag atcttcgtcg agctggtgaa tgctctgggc cagtataatg 6000
acgatgatga cgacgatgac ggcgacgacc ccgaagagag agaggagaag caaaaggatc 6060
tggaggacca tagggacgac aaagagtcta gacctcctag aaagttcccc tccgacaaga 6120
tcttcgaagc catctcctcc atgttccccg acaagggcac agccgaggaa ctgaaggaga 6180
agtataagga actcacagag caacagctgc ccggagctct gcctcccgag tgcaccccta 6240
acatcgacgg ccccaacgcc aagagcgtgc agagggagca atccctccac agcttccata 6300
ccctcttctg cagaagatgc tttaaatacg attgctttct ccatcctttc cacgccacac 6360
ccaacaccta caagaggaag aacaccgaaa ccgctctgga caataaacct tgcggacccc 6420
agtgctacca gcatctggaa ggagccaagg aatttgccgc tgctctgaca gccgagagaa 6480
ttaaaacccc tcccaaaaga cccggcggca gaaggagggg cagactgcct aataacagca 6540
gcagacccag cacccctacc attaacgtgc tggaatccaa ggacaccgac agcgatagag 6600
aggccggcac agaaaccggc ggagagaaca acgacaagga ggaggaggag aagaaagacg 6660
agacatcctc cagcagcgag gctaatagca gatgccagac ccctatcaag atgaaaccta 6720
atatcgagcc ccccgagaat gtggagtgga gcggcgctga ggcctccatg tttagagtgc 6780
tgatcggaac ctactacgac aacttctgcg ctatcgctag actgattggc accaagacat 6840
gcagacaagt gtacgagttc agagtcaagg agagctccat tatcgccccc gcccccgccg 6900
aagatgtgga cacccccccc agaaagaaga aaaggaagca tagactgtgg gccgcccact 6960
gtagaaagat ccagctcaaa aaggacggca gcagcaacca cgtgtacaac tatcagcctt 7020
gtgaccaccc cagacaacct tgtgattcca gctgcccttg cgtgatcgcc cagaacttct 7080
gcgagaagtt ctgtcagtgc agcagcgagt gccaaaatag atttcccgga tgtaggtgca 7140
aagcccagtg caataccaag cagtgccctt gctatctggc cgtgagagag tgcgatcccg 7200
atctgtgtct gacatgtgga gctgccgacc attgggacag caagaatgtg agctgcaaga 7260
actgcagcat ccaaagggga agcaaaaaac atctgctgct cgccccttcc gatgtggccg 7320
gatggggaat ctttatcaag gaccccgtcc agaaaaacga gttcatttcc gagtattgcg 7380
gcgagatcat cagccaagac gaagctgata gaagaggcaa agtgtatgac aaatacatgt 7440
gctccttcct cttcaacctc aataatgatt tcgtggtgga cgccacaagg aagggcaaca 7500
agattagatt cgccaaccac agcgtcaatc ctaactgcta tgccaaggtc atgatggtca 7560
acggcgacca cagaattggc atcttcgcta agagggccat ccagaccggc gaggaactgt 7620
tcttcgacta tagatactcc caagccgacg ctctgaagta cgtgggcatc gagagagaga 7680
tggaaatccc cggaggtggc ggatcgggaa agcggcccgc cgccaccaag aaggccggtc 7740
aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 7800
cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 7860
cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 7920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7980
aaaaaaa 7987
<210> 70
<211> 2581
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 70
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Gly Gly Gly Gly Ser Gly Ser Ala Ala Ile Ala Glu Val Leu
20 25 30
Leu Asn Ala Arg Cys Asp Leu His Ala Val Asn Tyr His Gly Asp Thr
35 40 45
Pro Leu His Ile Ala Ala Arg Glu Ser Tyr His Asp Cys Val Leu Leu
50 55 60
Phe Leu Ser Arg Gly Ala Asn Pro Glu Leu Arg Asn Lys Glu Gly Asp
65 70 75 80
Thr Ala Trp Asp Leu Thr Pro Glu Arg Ser Asp Val Trp Phe Ala Leu
85 90 95
Gln Leu Asn Arg Lys Leu Arg Leu Gly Val Gly Asn Arg Ala Ile Arg
100 105 110
Thr Glu Lys Ile Ile Cys Arg Asp Val Ala Arg Gly Tyr Glu Asn Val
115 120 125
Pro Ile Pro Cys Val Asn Gly Val Asp Gly Glu Pro Cys Pro Glu Asp
130 135 140
Tyr Lys Tyr Ile Ser Glu Asn Cys Glu Thr Ser Thr Met Asn Ile Asp
145 150 155 160
Arg Asn Ile Thr His Leu Gln His Cys Thr Cys Val Asp Asp Cys Ser
165 170 175
Ser Ser Asn Cys Leu Cys Gly Gln Leu Ser Ile Arg Cys Trp Tyr Asp
180 185 190
Lys Asp Gly Arg Leu Leu Gln Glu Phe Asn Lys Ile Glu Pro Pro Leu
195 200 205
Ile Phe Glu Cys Asn Gln Ala Cys Ser Cys Trp Arg Asn Cys Lys Asn
210 215 220
Arg Val Val Gln Ser Gly Ile Lys Val Arg Leu Gln Leu Tyr Arg Thr
225 230 235 240
Ala Lys Met Gly Trp Gly Val Arg Ala Leu Gln Thr Ile Pro Gln Gly
245 250 255
Thr Phe Ile Cys Glu Tyr Val Gly Glu Leu Ile Ser Asp Ala Glu Ala
260 265 270
Asp Val Arg Glu Asp Asp Ser Tyr Leu Phe Asp Leu Asp Asn Lys Asp
275 280 285
Gly Glu Val Tyr Cys Ile Asp Ala Arg Tyr Tyr Gly Asn Ile Ser Arg
290 295 300
Phe Ile Asn His Leu Cys Asp Pro Asn Ile Ile Pro Val Arg Val Phe
305 310 315 320
Met Leu His Gln Asp Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Ser
325 330 335
Arg Asp Ile Arg Thr Gly Glu Glu Leu Gly Phe Asp Tyr Gly Asp Arg
340 345 350
Phe Trp Asp Ile Lys Ser Lys Tyr Phe Thr Cys Gln Cys Gly Ser Glu
355 360 365
Lys Cys Lys His Ser Ala Glu Ala Ile Ala Leu Glu Gln Ser Arg Leu
370 375 380
Ala Arg Leu Asp Pro His Pro Glu Leu Leu Pro Glu Leu Gly Ser Leu
385 390 395 400
Pro Pro Val Asn Thr Gly Gly Gly Gly Ser Gly Asp Lys Lys Tyr Ser
405 410 415
Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr
420 425 430
Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr
435 440 445
Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp
450 455 460
Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg
465 470 475 480
Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe
485 490 495
Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu
500 505 510
Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile
515 520 525
Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr
530 535 540
Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp
545 550 555 560
Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly
565 570 575
His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp
580 585 590
Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu
595 600 605
Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala
610 615 620
Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro
625 630 635 640
Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu
645 650 655
Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala
660 665 670
Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
675 680 685
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys
690 695 700
Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr
705 710 715 720
Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp
725 730 735
Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln
740 745 750
Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly
755 760 765
Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys
770 775 780
Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu
785 790 795 800
Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp
805 810 815
Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile
820 825 830
Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu
835 840 845
Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
850 855 860
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu
865 870 875 880
Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala
885 890 895
Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu
900 905 910
Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
915 920 925
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met
930 935 940
Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
945 950 955 960
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu
965 970 975
Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly
980 985 990
Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu
995 1000 1005
Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
1010 1015 1020
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp
1025 1030 1035
Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
1040 1045 1050
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
1055 1060 1065
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
1070 1075 1080
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
1085 1090 1095
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
1100 1105 1110
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
1115 1120 1125
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
1130 1135 1140
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
1145 1150 1155
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1160 1165 1170
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1175 1180 1185
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1190 1195 1200
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1205 1210 1215
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1220 1225 1230
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1235 1240 1245
Ala Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1250 1255 1260
Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg Gly Lys Ser Asp
1265 1270 1275
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1280 1285 1290
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1295 1300 1305
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1310 1315 1320
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1325 1330 1335
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1340 1345 1350
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1355 1360 1365
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1370 1375 1380
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1385 1390 1395
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1400 1405 1410
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1415 1420 1425
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1430 1435 1440
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1445 1450 1455
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1460 1465 1470
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1475 1480 1485
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1490 1495 1500
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1505 1510 1515
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1520 1525 1530
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1535 1540 1545
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1550 1555 1560
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1565 1570 1575
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1580 1585 1590
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1595 1600 1605
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1610 1615 1620
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1625 1630 1635
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1640 1645 1650
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1655 1660 1665
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1670 1675 1680
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1685 1690 1695
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1700 1705 1710
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1715 1720 1725
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1730 1735 1740
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1745 1750 1755
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1760 1765 1770
Gln Leu Gly Gly Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys
1775 1780 1785
Lys Ala Gly Gln Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser
1790 1795 1800
Gly Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg
1805 1810 1815
Lys Arg Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg
1820 1825 1830
Phe Arg Arg Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg
1835 1840 1845
Gln Lys Ile Leu Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys
1850 1855 1860
Gln Arg Arg Ile Gln Pro Val His Ile Leu Thr Ser Val Ser Ser
1865 1870 1875
Leu Arg Gly Thr Arg Glu Cys Ser Val Thr Ser Asp Leu Asp Phe
1880 1885 1890
Pro Thr Gln Val Ile Pro Leu Lys Thr Leu Asn Ala Val Ala Ser
1895 1900 1905
Val Pro Ile Met Tyr Ser Trp Ser Pro Leu Gln Gln Asn Phe Met
1910 1915 1920
Val Glu Asp Glu Thr Val Leu His Asn Ile Pro Tyr Met Gly Asp
1925 1930 1935
Glu Val Leu Asp Gln Asp Gly Thr Phe Ile Glu Glu Leu Ile Lys
1940 1945 1950
Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu Cys Gly Phe Ile
1955 1960 1965
Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu Gly Gln Tyr
1970 1975 1980
Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu Glu Arg
1985 1990 1995
Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys Glu
2000 2005 2010
Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
2015 2020 2025
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys
2030 2035 2040
Glu Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu
2045 2050 2055
Pro Pro Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser
2060 2065 2070
Val Gln Arg Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys
2075 2080 2085
Arg Arg Cys Phe Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala
2090 2095 2100
Thr Pro Asn Thr Tyr Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp
2105 2110 2115
Asn Lys Pro Cys Gly Pro Gln Cys Tyr Gln His Leu Glu Gly Ala
2120 2125 2130
Lys Glu Phe Ala Ala Ala Leu Thr Ala Glu Arg Ile Lys Thr Pro
2135 2140 2145
Pro Lys Arg Pro Gly Gly Arg Arg Arg Gly Arg Leu Pro Asn Asn
2150 2155 2160
Ser Ser Arg Pro Ser Thr Pro Thr Ile Asn Val Leu Glu Ser Lys
2165 2170 2175
Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr Glu Thr Gly Gly Glu
2180 2185 2190
Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp Glu Thr Ser Ser
2195 2200 2205
Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile Lys Met Lys
2210 2215 2220
Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly Ala Glu
2225 2230 2235
Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn Phe
2240 2245 2250
Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
2255 2260 2265
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro
2270 2275 2280
Ala Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His
2285 2290 2295
Arg Leu Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp
2300 2305 2310
Gly Ser Ser Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro
2315 2320 2325
Arg Gln Pro Cys Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn
2330 2335 2340
Phe Cys Glu Lys Phe Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg
2345 2350 2355
Phe Pro Gly Cys Arg Cys Lys Ala Gln Cys Asn Thr Lys Gln Cys
2360 2365 2370
Pro Cys Tyr Leu Ala Val Arg Glu Cys Asp Pro Asp Leu Cys Leu
2375 2380 2385
Thr Cys Gly Ala Ala Asp His Trp Asp Ser Lys Asn Val Ser Cys
2390 2395 2400
Lys Asn Cys Ser Ile Gln Arg Gly Ser Lys Lys His Leu Leu Leu
2405 2410 2415
Ala Pro Ser Asp Val Ala Gly Trp Gly Ile Phe Ile Lys Asp Pro
2420 2425 2430
Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys Gly Glu Ile Ile
2435 2440 2445
Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr Asp Lys Tyr
2450 2455 2460
Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val Val Asp
2465 2470 2475
Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser Val
2480 2485 2490
Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
2495 2500 2505
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu
2510 2515 2520
Leu Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr
2525 2530 2535
Val Gly Ile Glu Arg Glu Met Glu Ile Pro Gly Gly Gly Gly Ser
2540 2545 2550
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
2555 2560 2565
Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
2570 2575 2580
<210> 71
<211> 6040
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 71
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaggaa 120
gcgccgctat cgccgaagtg ctgctgaatg ccagatgcga tctgcatgcc gtgaactacc 180
acggcgacac ccctctgcat atcgccgcta gagagagcta ccatgactgt gtgctgctgt 240
ttctgagcag aggcgccaat cccgagctca gaaacaaaga gggcgacacc gcttgggatc 300
tgacacccga gagatccgac gtgtggttcg ctctgcaact gaatagaaaa ctgagactgg 360
gcgtcggcaa tagggccatt agaaccgaga agatcatctg tagggacgtg gctaggggct 420
acgagaacgt gcccatccct tgtgtgaacg gagtggatgg agagccttgc cccgaggatt 480
acaaatacat cagcgagaac tgcgaaacct ccaccatgaa tatcgataga aacattacac 540
acctccagca ctgtacatgc gtggacgatt gcagcagcag caactgtctg tgcggccaac 600
tgagcatcag atgctggtac gacaaggatg gcagactgct gcaagagttc aacaagatcg 660
aaccccctct gatcttcgag tgtaaccaag cttgcagctg ttggaggaac tgcaagaata 720
gggtcgtgca gtccggaatc aaggtgagac tgcagctgta tagaacagct aagatgggat 780
ggggagtcag agctctgcag accatccccc aaggcacatt catctgtgag tacgtcggcg 840
aactcatcag cgacgctgag gccgatgtga gggaggacga cagctatctc ttcgacctcg 900
acaacaagga cggcgaggtg tactgcatcg acgctagata ttacggcaac atcagcagat 960
tcatcaacca cctctgcgac cccaatatca tccccgtgag agtgttcatg ctccatcaag 1020
atctgagatt ccctaggatc gccttcttca gctctagaga cattagaacc ggcgaggagc 1080
tgggattcga ctacggcgac aggttctggg acatcaagag caagtacttc acatgccaat 1140
gcggcagcga gaaatgcaag catagcgccg aggccattgc tctggagcag tctagactgg 1200
ctaggctgga ccctcacccc gagctgctgc ccgaactggg atctctgcct cccgtgaata 1260
ccggaggtgg cggatcggga gacaagaagt acagcatcgg cctggccatc ggcaccaaca 1320
gcgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaag ttcaaggtgc 1380
tgggcaacac cgaccggcac agcatcaaga agaacctgat cggcgccctg ctgttcgaca 1440
gcggcgagac cgccgaggcc acccggctga agcggaccgc ccggcggcgg tacacccggc 1500
ggaagaaccg gatctgctac ctgcaggaga tcttcagcaa cgagatggcc aaggtggacg 1560
acagcttctt ccaccggctg gaggagagct tcctggtgga ggaggacaag aagcacgagc 1620
ggcaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag taccccacca 1680
tctaccacct gcggaagaag ctggtggaca gcaccgacaa ggccgacctg cggctgatct 1740
acctggccct ggcccacatg atcaagttcc ggggccactt cctgatcgag ggcgacctga 1800
accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc tacaaccagc 1860
tgttcgagga gaaccccatc aacgccagcg gcgtggacgc caaggccatc ctgagcgccc 1920
ggctgagcaa gagccggcgg ctggagaacc tgatcgccca gctgcccggc gagaagaaga 1980
acggcctgtt cggcaacctg atcgccctga gcctgggcct gacccccaac ttcaagagca 2040
acttcgacct ggccgaggac gccaagctgc agctgagcaa ggacacctac gacgacgacc 2100
tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg gccgccaaga 2160
acctgagcga cgccatcctg ctgagcgaca tcctgcgggt gaacaccgag atcaccaagg 2220
cccccctgag cgccagcatg atcaagcggt acgacgagca ccaccaggac ctgaccctgc 2280
tgaaggccct ggtgcggcag cagctgcccg agaagtacaa ggagatcttc ttcgaccaga 2340
gcaagaacgg ctacgccggc tacatcgacg gcggcgccag ccaggaggag ttctacaagt 2400
tcatcaagcc catcctggag aagatggacg gcaccgagga gctgctggtg aagctgaacc 2460
gggaggacct gctgcggaag cagcggacct tcgacaacgg cagcatcccc caccagatcc 2520
acctgggcga gctgcacgcc atcctgcggc ggcaggagga cttctacccc ttcctgaagg 2580
acaaccggga gaagatcgag aagatcctga ccttccggat cccctactac gtgggccccc 2640
tggcccgggg caacagccgg ttcgcctgga tgacccggaa atccgaggag accatcaccc 2700
cctggaactt cgaggaggtg gtggacaagg gcgccagcgc ccagagcttc atcgagcgga 2760
tgaccaactt cgacaagaac ctgcccaacg agaaggtgct gcccaagcac agcctgctgt 2820
acgagtactt caccgtgtac aacgagctga ccaaggtgaa gtacgtgacc gagggcatgc 2880
ggaagcccgc cttcctgagc ggcgagcaga agaaggccat cgtggacctg ctgttcaaga 2940
ccaaccggaa ggtgaccgtg aagcagctga aggaggacta cttcaagaag atcgagtgct 3000
tcgacagcgt ggagatcagc ggcgtggagg accggttcaa cgccagcctg ggcacctacc 3060
acgacctgct gaagatcatc aaggacaagg acttcctgga caacgaggag aacgaggaca 3120
tcctggagga catcgtgctg accctgaccc tgttcgagga ccgggagatg atcgaggagc 3180
ggctgaaaac ctacgcccac ctgttcgacg acaaggtgat gaagcagctg aagcggcggc 3240
ggtacaccgg ctggggccgg ctgagccgga agctgatcaa cggcatccgg gacaagcaga 3300
gcggcaagac catcctggac ttcctgaaat ccgacggctt cgccaaccgg aacttcatgc 3360
agctgatcca cgacgacagc ctgaccttca aggaggacat ccagaaggcc caggtgagcg 3420
gccagggcga cagcctgcac gagcacatcg ccaacctggc cggcagcccc gccatcaaga 3480
agggcatcct gcagaccgtg aaggtggtgg acgagctggt gaaggtgatg ggccggcaca 3540
agcccgagaa catcgtgatc gagatggccc gggagaacca gaccacccag aagggccaga 3600
agaacagccg ggagcggatg aagcggatcg aggagggcat caaggagctg ggcagccaga 3660
tcctgaagga gcaccccgtg gagaacaccc agctgcagaa cgagaagctg tacctgtact 3720
acctgcagaa cggccgggac atgtacgtgg accaggagct ggacatcaac cggctgagcg 3780
actacgacgt ggccgccatc gtgccccaga gcttcctgaa ggacgacagc atcgacaaca 3840
aggtgctgac ccggagcgac aaggcccggg gcaagagcga caacgtgccc agcgaggagg 3900
tggtgaagaa gatgaagaac tactggcggc agctgctgaa cgccaagctg atcacccagc 3960
ggaagttcga caacctgacc aaggccgagc ggggcggcct gagcgagctg gacaaggccg 4020
gcttcatcaa gcggcagctg gtggagaccc ggcagatcac caagcacgtg gcccagatcc 4080
tggacagccg gatgaacacc aagtacgacg agaacgacaa gctgatccgg gaggtgaagg 4140
tgatcaccct gaaatccaag ctggtgagcg acttccggaa ggacttccag ttctacaagg 4200
tgcgggagat caacaactac caccacgccc acgacgccta cctgaacgcc gtggtgggca 4260
ccgccctgat caagaagtac cccaagctgg agagcgagtt cgtgtacggc gactacaagg 4320
tgtacgacgt gcggaagatg atcgccaaga gcgagcagga gatcggcaag gccaccgcca 4380
agtacttctt ctacagcaac atcatgaact tcttcaagac cgagatcacc ctggccaacg 4440
gcgagatccg gaagcggccc ctgatcgaga ccaacggcga gaccggcgag atcgtgtggg 4500
acaagggccg ggacttcgcc accgtgcgga aggtgctgag catgccccag gtgaacatcg 4560
tgaagaaaac cgaggtgcag accggcggct tcagcaagga gagcatcctg cccaagcgga 4620
acagcgacaa gctgatcgcc cggaagaagg actgggaccc caagaagtac ggcggcttcg 4680
acagccccac cgtggcctac agcgtgctgg tggtggccaa ggtggagaag ggcaagagca 4740
agaagctgaa atccgtgaag gagctgctgg gcatcaccat catggagcgg agcagcttcg 4800
agaagaaccc catcgacttc ctggaggcca agggctacaa ggaggtgaag aaggacctga 4860
tcatcaagct gcccaagtac agcctgttcg agctggagaa cggccggaag cggatgctgg 4920
ccagcgccgg cgagctgcag aagggcaacg agctggccct gcccagcaag tacgtgaact 4980
tcctgtacct ggccagccac tacgagaagc tgaagggcag ccccgaggac aacgagcaga 5040
agcagctgtt cgtggagcag cacaagcact acctggacga gatcatcgag cagatcagcg 5100
agttcagcaa gcgggtgatc ctggccgacg ccaacctgga caaggtgctg agcgcctaca 5160
acaagcaccg ggacaagccc atccgggagc aggccgagaa catcatccac ctgttcaccc 5220
tgaccaacct gggcgccccc gccgccttca agtacttcga caccaccatc gaccggaagc 5280
ggtacaccag caccaaggag gtgctggacg ccaccctgat ccaccagagc atcaccggcc 5340
tgtacgagac ccggatcgac ctgagccagc tgggcggcga cagcggcggc aagcggcccg 5400
ccgccaccaa gaaggccggc caggccaaga agaagaagtc gggcgggggt ggctcagacg 5460
ctaagtctct gaccgcttgg agcagaacac tggtcacctt caaggacgtg ttcgtcgact 5520
tcacaagaga ggagtggaaa ctgctggaca ccgcccagca gatcctctat agaaacgtca 5580
tgctggagaa ctacaagaat ctggtgtctc tgggctacca gctgaccaag cccgacgtga 5640
ttctgaggct ggagaagggc gaggagcctt ggctggtgga gagagagatc caccaagaaa 5700
cccaccccga cagcgaaacc gccttcgaga tcaagagcag cgtgggaggt ggcggatcgg 5760
gaaagcggcc cgccgccacc aagaaggccg gtcaggccaa gaagaagaag ggcagctacc 5820
cctacgacgt gcccgactac gcctgagcgg ccgcttaatt aagctgcctt ctgcggggct 5880
tgccttctgg ccatgccctt cttctctccc ttgcacctgt acctcttggt ctttgaataa 5940
agcctgagta ggaagtctag aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6000
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6040
<210> 72
<211> 1932
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 72
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Gly Gly Gly Gly Ser Gly Ser Ala Ala Ile Ala Glu Val Leu
20 25 30
Leu Asn Ala Arg Cys Asp Leu His Ala Val Asn Tyr His Gly Asp Thr
35 40 45
Pro Leu His Ile Ala Ala Arg Glu Ser Tyr His Asp Cys Val Leu Leu
50 55 60
Phe Leu Ser Arg Gly Ala Asn Pro Glu Leu Arg Asn Lys Glu Gly Asp
65 70 75 80
Thr Ala Trp Asp Leu Thr Pro Glu Arg Ser Asp Val Trp Phe Ala Leu
85 90 95
Gln Leu Asn Arg Lys Leu Arg Leu Gly Val Gly Asn Arg Ala Ile Arg
100 105 110
Thr Glu Lys Ile Ile Cys Arg Asp Val Ala Arg Gly Tyr Glu Asn Val
115 120 125
Pro Ile Pro Cys Val Asn Gly Val Asp Gly Glu Pro Cys Pro Glu Asp
130 135 140
Tyr Lys Tyr Ile Ser Glu Asn Cys Glu Thr Ser Thr Met Asn Ile Asp
145 150 155 160
Arg Asn Ile Thr His Leu Gln His Cys Thr Cys Val Asp Asp Cys Ser
165 170 175
Ser Ser Asn Cys Leu Cys Gly Gln Leu Ser Ile Arg Cys Trp Tyr Asp
180 185 190
Lys Asp Gly Arg Leu Leu Gln Glu Phe Asn Lys Ile Glu Pro Pro Leu
195 200 205
Ile Phe Glu Cys Asn Gln Ala Cys Ser Cys Trp Arg Asn Cys Lys Asn
210 215 220
Arg Val Val Gln Ser Gly Ile Lys Val Arg Leu Gln Leu Tyr Arg Thr
225 230 235 240
Ala Lys Met Gly Trp Gly Val Arg Ala Leu Gln Thr Ile Pro Gln Gly
245 250 255
Thr Phe Ile Cys Glu Tyr Val Gly Glu Leu Ile Ser Asp Ala Glu Ala
260 265 270
Asp Val Arg Glu Asp Asp Ser Tyr Leu Phe Asp Leu Asp Asn Lys Asp
275 280 285
Gly Glu Val Tyr Cys Ile Asp Ala Arg Tyr Tyr Gly Asn Ile Ser Arg
290 295 300
Phe Ile Asn His Leu Cys Asp Pro Asn Ile Ile Pro Val Arg Val Phe
305 310 315 320
Met Leu His Gln Asp Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Ser
325 330 335
Arg Asp Ile Arg Thr Gly Glu Glu Leu Gly Phe Asp Tyr Gly Asp Arg
340 345 350
Phe Trp Asp Ile Lys Ser Lys Tyr Phe Thr Cys Gln Cys Gly Ser Glu
355 360 365
Lys Cys Lys His Ser Ala Glu Ala Ile Ala Leu Glu Gln Ser Arg Leu
370 375 380
Ala Arg Leu Asp Pro His Pro Glu Leu Leu Pro Glu Leu Gly Ser Leu
385 390 395 400
Pro Pro Val Asn Thr Gly Gly Gly Gly Ser Gly Asp Lys Lys Tyr Ser
405 410 415
Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr
420 425 430
Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr
435 440 445
Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp
450 455 460
Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg
465 470 475 480
Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe
485 490 495
Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu
500 505 510
Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile
515 520 525
Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr
530 535 540
Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp
545 550 555 560
Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly
565 570 575
His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp
580 585 590
Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu
595 600 605
Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala
610 615 620
Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro
625 630 635 640
Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu
645 650 655
Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala
660 665 670
Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
675 680 685
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys
690 695 700
Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr
705 710 715 720
Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp
725 730 735
Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln
740 745 750
Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly
755 760 765
Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys
770 775 780
Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu
785 790 795 800
Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp
805 810 815
Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile
820 825 830
Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu
835 840 845
Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
850 855 860
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu
865 870 875 880
Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala
885 890 895
Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu
900 905 910
Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
915 920 925
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met
930 935 940
Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
945 950 955 960
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu
965 970 975
Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly
980 985 990
Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu
995 1000 1005
Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
1010 1015 1020
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp
1025 1030 1035
Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
1040 1045 1050
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
1055 1060 1065
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
1070 1075 1080
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
1085 1090 1095
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
1100 1105 1110
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
1115 1120 1125
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
1130 1135 1140
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
1145 1150 1155
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1160 1165 1170
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1175 1180 1185
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1190 1195 1200
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1205 1210 1215
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1220 1225 1230
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1235 1240 1245
Ala Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1250 1255 1260
Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg Gly Lys Ser Asp
1265 1270 1275
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1280 1285 1290
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1295 1300 1305
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1310 1315 1320
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1325 1330 1335
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1340 1345 1350
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1355 1360 1365
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1370 1375 1380
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1385 1390 1395
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1400 1405 1410
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1415 1420 1425
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1430 1435 1440
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1445 1450 1455
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1460 1465 1470
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1475 1480 1485
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1490 1495 1500
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1505 1510 1515
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1520 1525 1530
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1535 1540 1545
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1550 1555 1560
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1565 1570 1575
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1580 1585 1590
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1595 1600 1605
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1610 1615 1620
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1625 1630 1635
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1640 1645 1650
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1655 1660 1665
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1670 1675 1680
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1685 1690 1695
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1700 1705 1710
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1715 1720 1725
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1730 1735 1740
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1745 1750 1755
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1760 1765 1770
Gln Leu Gly Gly Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys
1775 1780 1785
Lys Ala Gly Gln Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser
1790 1795 1800
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
1805 1810 1815
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu
1820 1825 1830
Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn
1835 1840 1845
Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp
1850 1855 1860
Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu
1865 1870 1875
Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe
1880 1885 1890
Glu Ile Lys Ser Ser Val Gly Gly Gly Gly Ser Gly Lys Arg Pro
1895 1900 1905
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1910 1915 1920
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1925 1930
<210> 73
<211> 1497
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 73
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser
20 25 30
Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala
35 40 45
Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg
50 55 60
Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg
65 70 75 80
Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp
85 90 95
His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly
100 105 110
Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His
115 120 125
Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp
130 135 140
Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys
145 150 155 160
Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys
165 170 175
Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp
180 185 190
Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His
195 200 205
Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr
210 215 220
Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp
225 230 235 240
Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr
245 250 255
Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu
260 265 270
Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu
275 280 285
Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val
290 295 300
Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile
305 310 315 320
Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly
325 330 335
Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile
340 345 350
Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile
355 360 365
Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu
370 375 380
Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile
385 390 395 400
Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala
405 410 415
Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile
420 425 430
Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser
435 440 445
Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser
450 455 460
Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala
465 470 475 480
Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala
485 490 495
Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln
500 505 510
Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr
515 520 525
Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His
530 535 540
Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu
545 550 555 560
Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile
565 570 575
Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val
580 585 590
Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr
595 600 605
Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His
610 615 620
Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys
625 630 635 640
Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys
645 650 655
Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly
660 665 670
Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val
675 680 685
Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys
690 695 700
Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu
705 710 715 720
Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys
725 730 735
Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu
740 745 750
Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys
755 760 765
Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys
770 775 780
Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu
785 790 795 800
Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr
805 810 815
Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys
820 825 830
Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His
835 840 845
His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr
850 855 860
Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn
865 870 875 880
Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys
885 890 895
Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp
900 905 910
Asp Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro
915 920 925
Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr
930 935 940
Val Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn
945 950 955 960
Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln
965 970 975
Ala Glu Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn
980 985 990
Gly Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg
995 1000 1005
Ile Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu
1010 1015 1020
Asn Met Asn Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala
1025 1030 1035
Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly
1040 1045 1050
Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys
1055 1060 1065
Lys Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1070 1075 1080
Lys Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys
1085 1090 1095
Leu Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys
1100 1105 1110
Ala Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu
1115 1120 1125
Ala Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His
1130 1135 1140
Asn Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu
1145 1150 1155
Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser
1160 1165 1170
Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp
1175 1180 1185
Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu
1190 1195 1200
Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys
1205 1210 1215
Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser
1220 1225 1230
Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg
1235 1240 1245
Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu
1250 1255 1260
Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala
1265 1270 1275
Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
1280 1285 1290
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn
1295 1300 1305
Ala Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met
1310 1315 1320
Ile Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys
1325 1330 1335
Lys Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu
1340 1345 1350
Lys Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe
1355 1360 1365
Lys Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr
1370 1375 1380
Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr
1385 1390 1395
Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile
1400 1405 1410
Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe
1415 1420 1425
Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu
1430 1435 1440
Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn
1445 1450 1455
Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly
1460 1465 1470
Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1475 1480 1485
Gly Gln Ala Lys Lys Lys Lys Gly Ser
1490 1495
<210> 74
<211> 1811
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 74
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu
1400 1405 1410
Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala
1415 1420 1425
Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala
1430 1435 1440
Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn
1445 1450 1455
Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu
1460 1465 1470
Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys
1475 1480 1485
Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu
1490 1495 1500
Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly
1505 1510 1515
Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn
1520 1525 1530
Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln
1535 1540 1545
Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser
1550 1555 1560
Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys
1565 1570 1575
Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu
1580 1585 1590
Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys
1595 1600 1605
Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
1610 1615 1620
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile
1625 1630 1635
Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys
1640 1645 1650
Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys
1655 1660 1665
Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys
1670 1675 1680
Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser
1685 1690 1695
Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly
1700 1705 1710
Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys
1715 1720 1725
Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu
1730 1735 1740
Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile
1745 1750 1755
Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser
1760 1765 1770
Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly
1775 1780 1785
Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1790 1795 1800
Gln Ala Lys Lys Lys Lys Gly Ser
1805 1810
<210> 75
<211> 1519
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 75
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Ser Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr
1400 1405 1410
Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
1415 1420 1425
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val
1430 1435 1440
Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu
1445 1450 1455
Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro
1460 1465 1470
Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser
1475 1480 1485
Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg
1490 1495 1500
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1505 1510 1515
Ser
<210> 76
<211> 2168
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 76
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys Arg
20 25 30
Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg Arg
35 40 45
Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile Leu
50 55 60
Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile Gln
65 70 75 80
Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg Glu
85 90 95
Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro Leu
100 105 110
Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp Ser
115 120 125
Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His Asn
130 135 140
Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe Ile
145 150 155 160
Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu
165 170 175
Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu
180 185 190
Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu
195 200 205
Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys
210 215 220
Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
225 230 235 240
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys Glu
245 250 255
Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro Pro
260 265 270
Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln Arg
275 280 285
Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys Phe
290 295 300
Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr Tyr
305 310 315 320
Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly Pro
325 330 335
Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala Leu
340 345 350
Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg Arg
355 360 365
Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr Ile
370 375 380
Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr
385 390 395 400
Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp
405 410 415
Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile
420 425 430
Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly
435 440 445
Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn
450 455 460
Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
465 470 475 480
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro Ala
485 490 495
Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg Leu
500 505 510
Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser Ser
515 520 525
Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro Cys
530 535 540
Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys Phe
545 550 555 560
Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg Cys
565 570 575
Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val Arg
580 585 590
Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His Trp
595 600 605
Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly Ser
610 615 620
Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly Ile
625 630 635 640
Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys
645 650 655
Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr
660 665 670
Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val
675 680 685
Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser
690 695 700
Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
705 710 715 720
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu Leu
725 730 735
Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val Gly
740 745 750
Ile Glu Arg Glu Met Glu Ile Pro Ser Thr Gly Gly Ser Gly Gly Ser
755 760 765
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Arg Pro Asp Lys Lys Tyr
770 775 780
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
785 790 795 800
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
805 810 815
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
820 825 830
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
835 840 845
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
850 855 860
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
865 870 875 880
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
885 890 895
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
900 905 910
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
915 920 925
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
930 935 940
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
945 950 955 960
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
965 970 975
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
980 985 990
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
995 1000 1005
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
1010 1015 1020
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
1025 1030 1035
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
1040 1045 1050
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
1055 1060 1065
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
1070 1075 1080
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
1085 1090 1095
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
1100 1105 1110
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
1115 1120 1125
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
1130 1135 1140
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
1145 1150 1155
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
1160 1165 1170
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
1175 1180 1185
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
1190 1195 1200
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
1205 1210 1215
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
1220 1225 1230
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
1235 1240 1245
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
1250 1255 1260
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
1265 1270 1275
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
1280 1285 1290
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
1295 1300 1305
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
1310 1315 1320
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
1325 1330 1335
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
1340 1345 1350
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
1355 1360 1365
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
1370 1375 1380
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
1385 1390 1395
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1400 1405 1410
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
1415 1420 1425
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
1430 1435 1440
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
1445 1450 1455
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
1460 1465 1470
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1475 1480 1485
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1490 1495 1500
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1505 1510 1515
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
1520 1525 1530
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
1535 1540 1545
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
1550 1555 1560
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
1565 1570 1575
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1580 1585 1590
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1595 1600 1605
Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln
1610 1615 1620
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1625 1630 1635
Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1640 1645 1650
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1655 1660 1665
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1670 1675 1680
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1685 1690 1695
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1700 1705 1710
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1715 1720 1725
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1730 1735 1740
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1745 1750 1755
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1760 1765 1770
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1775 1780 1785
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1790 1795 1800
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1805 1810 1815
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1820 1825 1830
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1835 1840 1845
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1850 1855 1860
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1865 1870 1875
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1880 1885 1890
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1895 1900 1905
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1910 1915 1920
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1925 1930 1935
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1940 1945 1950
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1955 1960 1965
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1970 1975 1980
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1985 1990 1995
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
2000 2005 2010
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
2015 2020 2025
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
2030 2035 2040
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
2045 2050 2055
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
2060 2065 2070
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
2075 2080 2085
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
2090 2095 2100
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
2105 2110 2115
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
2120 2125 2130
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser
2135 2140 2145
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
2150 2155 2160
Lys Lys Lys Gly Ser
2165
<210> 77
<211> 1977
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 77
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro
1415 1420 1425
Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe
1430 1435 1440
Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile
1445 1450 1455
Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile
1460 1465 1470
Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly
1475 1480 1485
Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro
1490 1495 1500
Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile
1505 1510 1515
Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu
1520 1525 1530
Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu
1535 1540 1545
Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala
1550 1555 1560
Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser
1565 1570 1575
Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg
1580 1585 1590
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu
1595 1600 1605
Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu
1610 1615 1620
His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
1625 1630 1635
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val
1640 1645 1650
Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu
1655 1660 1665
Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met
1670 1675 1680
Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val
1685 1690 1695
Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala
1700 1705 1710
Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser
1715 1720 1725
Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met
1730 1735 1740
Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp Arg Arg Gln
1745 1750 1755
Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys Glu Leu
1760 1765 1770
Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln Leu
1775 1780 1785
Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu
1790 1795 1800
Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu
1805 1810 1815
Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe
1820 1825 1830
His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg
1835 1840 1845
Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu
1850 1855 1860
Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr
1865 1870 1875
Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val
1880 1885 1890
Trp Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val
1895 1900 1905
Ser Glu Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser
1910 1915 1920
Lys Leu Ala Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe
1925 1930 1935
Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr
1940 1945 1950
Ser Ser Leu Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1955 1960 1965
Gly Gln Ala Lys Lys Lys Lys Gly Ser
1970 1975
<210> 78
<211> 1809
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 78
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Glu Glu Pro Glu
1400 1405 1410
Glu Pro Ala Asp Ser Gly Gln Ser Leu Val Pro Val Tyr Ile Tyr
1415 1420 1425
Ser Pro Glu Tyr Val Ser Met Cys Asp Ser Leu Ala Lys Ile Pro
1430 1435 1440
Lys Arg Ala Ser Met Val His Ser Leu Ile Glu Ala Tyr Ala Leu
1445 1450 1455
His Lys Gln Met Arg Ile Val Lys Pro Lys Val Ala Ser Met Glu
1460 1465 1470
Glu Met Ala Thr Phe His Thr Asp Ala Tyr Leu Gln His Leu Gln
1475 1480 1485
Lys Val Ser Gln Glu Gly Asp Asp Asp His Pro Asp Ser Ile Glu
1490 1495 1500
Tyr Gly Leu Gly Tyr Asp Cys Pro Ala Thr Glu Gly Ile Phe Asp
1505 1510 1515
Tyr Ala Ala Ala Ile Gly Gly Ala Thr Ile Thr Ala Ala Gln Cys
1520 1525 1530
Leu Ile Asp Gly Met Cys Lys Val Ala Ile Asn Trp Ser Gly Gly
1535 1540 1545
Trp His His Ala Lys Lys Asp Glu Ala Ser Gly Phe Cys Tyr Leu
1550 1555 1560
Asn Asp Ala Val Leu Gly Ile Leu Arg Leu Arg Arg Lys Phe Glu
1565 1570 1575
Arg Ile Leu Tyr Val Asp Leu Asp Leu His His Gly Asp Gly Val
1580 1585 1590
Glu Asp Ala Phe Ser Phe Thr Ser Lys Val Met Thr Val Ser Leu
1595 1600 1605
His Lys Phe Ser Pro Gly Phe Phe Pro Gly Thr Gly Asp Val Ser
1610 1615 1620
Asp Val Gly Leu Gly Lys Gly Arg Tyr Tyr Ser Val Asn Val Pro
1625 1630 1635
Ile Gln Asp Gly Ile Gln Asp Glu Lys Tyr Tyr Gln Ile Cys Glu
1640 1645 1650
Ser Val Leu Lys Glu Val Tyr Gln Ala Phe Asn Pro Lys Ala Val
1655 1660 1665
Val Leu Gln Leu Gly Ala Asp Thr Ile Ala Gly Asp Pro Met Cys
1670 1675 1680
Ser Phe Asn Met Thr Pro Val Gly Ile Gly Lys Cys Leu Lys Tyr
1685 1690 1695
Ile Leu Gln Trp Gln Leu Ala Thr Leu Ile Leu Gly Gly Gly Gly
1700 1705 1710
Tyr Asn Leu Ala Asn Thr Ala Arg Cys Trp Thr Tyr Leu Thr Gly
1715 1720 1725
Val Ile Leu Gly Lys Thr Leu Ser Ser Glu Ile Pro Asp His Glu
1730 1735 1740
Phe Phe Thr Ala Tyr Gly Pro Asp Tyr Val Leu Glu Ile Thr Pro
1745 1750 1755
Ser Cys Arg Pro Asp Arg Asn Glu Pro His Arg Ile Gln Gln Ile
1760 1765 1770
Leu Asn Tyr Ile Lys Gly Asn Leu Lys His Val Val Gly Gly Gly
1775 1780 1785
Gly Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
1790 1795 1800
Lys Lys Lys Lys Gly Ser
1805
<210> 79
<211> 2572
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 79
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys Arg
20 25 30
Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg Arg
35 40 45
Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile Leu
50 55 60
Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile Gln
65 70 75 80
Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg Glu
85 90 95
Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro Leu
100 105 110
Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp Ser
115 120 125
Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His Asn
130 135 140
Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe Ile
145 150 155 160
Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu
165 170 175
Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu
180 185 190
Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu
195 200 205
Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys
210 215 220
Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
225 230 235 240
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys Glu
245 250 255
Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro Pro
260 265 270
Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln Arg
275 280 285
Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys Phe
290 295 300
Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr Tyr
305 310 315 320
Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly Pro
325 330 335
Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala Leu
340 345 350
Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg Arg
355 360 365
Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr Ile
370 375 380
Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr
385 390 395 400
Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp
405 410 415
Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile
420 425 430
Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly
435 440 445
Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn
450 455 460
Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
465 470 475 480
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro Ala
485 490 495
Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg Leu
500 505 510
Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser Ser
515 520 525
Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro Cys
530 535 540
Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys Phe
545 550 555 560
Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg Cys
565 570 575
Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val Arg
580 585 590
Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His Trp
595 600 605
Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly Ser
610 615 620
Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly Ile
625 630 635 640
Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys
645 650 655
Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr
660 665 670
Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val
675 680 685
Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser
690 695 700
Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
705 710 715 720
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu Leu
725 730 735
Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val Gly
740 745 750
Ile Glu Arg Glu Met Glu Ile Pro Ser Thr Gly Gly Ser Gly Gly Ser
755 760 765
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Arg Pro Asp Lys Lys Tyr
770 775 780
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
785 790 795 800
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
805 810 815
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
820 825 830
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
835 840 845
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
850 855 860
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
865 870 875 880
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
885 890 895
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
900 905 910
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
915 920 925
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
930 935 940
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
945 950 955 960
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
965 970 975
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
980 985 990
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
995 1000 1005
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
1010 1015 1020
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
1025 1030 1035
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
1040 1045 1050
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
1055 1060 1065
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
1070 1075 1080
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
1085 1090 1095
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
1100 1105 1110
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
1115 1120 1125
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
1130 1135 1140
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
1145 1150 1155
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
1160 1165 1170
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
1175 1180 1185
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
1190 1195 1200
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
1205 1210 1215
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
1220 1225 1230
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
1235 1240 1245
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
1250 1255 1260
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
1265 1270 1275
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
1280 1285 1290
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
1295 1300 1305
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
1310 1315 1320
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
1325 1330 1335
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
1340 1345 1350
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
1355 1360 1365
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
1370 1375 1380
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
1385 1390 1395
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1400 1405 1410
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
1415 1420 1425
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
1430 1435 1440
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
1445 1450 1455
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
1460 1465 1470
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1475 1480 1485
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1490 1495 1500
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1505 1510 1515
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
1520 1525 1530
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
1535 1540 1545
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
1550 1555 1560
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
1565 1570 1575
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1580 1585 1590
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1595 1600 1605
Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln
1610 1615 1620
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1625 1630 1635
Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1640 1645 1650
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1655 1660 1665
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1670 1675 1680
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1685 1690 1695
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1700 1705 1710
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1715 1720 1725
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1730 1735 1740
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1745 1750 1755
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1760 1765 1770
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1775 1780 1785
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1790 1795 1800
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1805 1810 1815
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1820 1825 1830
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1835 1840 1845
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1850 1855 1860
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1865 1870 1875
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1880 1885 1890
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1895 1900 1905
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1910 1915 1920
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1925 1930 1935
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1940 1945 1950
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1955 1960 1965
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1970 1975 1980
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1985 1990 1995
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
2000 2005 2010
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
2015 2020 2025
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
2030 2035 2040
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
2045 2050 2055
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
2060 2065 2070
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
2075 2080 2085
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
2090 2095 2100
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
2105 2110 2115
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
2120 2125 2130
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser
2135 2140 2145
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
2150 2155 2160
Lys Lys Lys Ser Gly Gly Gly Gly Ser Glu Glu Pro Glu Glu Pro
2165 2170 2175
Ala Asp Ser Gly Gln Ser Leu Val Pro Val Tyr Ile Tyr Ser Pro
2180 2185 2190
Glu Tyr Val Ser Met Cys Asp Ser Leu Ala Lys Ile Pro Lys Arg
2195 2200 2205
Ala Ser Met Val His Ser Leu Ile Glu Ala Tyr Ala Leu His Lys
2210 2215 2220
Gln Met Arg Ile Val Lys Pro Lys Val Ala Ser Met Glu Glu Met
2225 2230 2235
Ala Thr Phe His Thr Asp Ala Tyr Leu Gln His Leu Gln Lys Val
2240 2245 2250
Ser Gln Glu Gly Asp Asp Asp His Pro Asp Ser Ile Glu Tyr Gly
2255 2260 2265
Leu Gly Tyr Asp Cys Pro Ala Thr Glu Gly Ile Phe Asp Tyr Ala
2270 2275 2280
Ala Ala Ile Gly Gly Ala Thr Ile Thr Ala Ala Gln Cys Leu Ile
2285 2290 2295
Asp Gly Met Cys Lys Val Ala Ile Asn Trp Ser Gly Gly Trp His
2300 2305 2310
His Ala Lys Lys Asp Glu Ala Ser Gly Phe Cys Tyr Leu Asn Asp
2315 2320 2325
Ala Val Leu Gly Ile Leu Arg Leu Arg Arg Lys Phe Glu Arg Ile
2330 2335 2340
Leu Tyr Val Asp Leu Asp Leu His His Gly Asp Gly Val Glu Asp
2345 2350 2355
Ala Phe Ser Phe Thr Ser Lys Val Met Thr Val Ser Leu His Lys
2360 2365 2370
Phe Ser Pro Gly Phe Phe Pro Gly Thr Gly Asp Val Ser Asp Val
2375 2380 2385
Gly Leu Gly Lys Gly Arg Tyr Tyr Ser Val Asn Val Pro Ile Gln
2390 2395 2400
Asp Gly Ile Gln Asp Glu Lys Tyr Tyr Gln Ile Cys Glu Ser Val
2405 2410 2415
Leu Lys Glu Val Tyr Gln Ala Phe Asn Pro Lys Ala Val Val Leu
2420 2425 2430
Gln Leu Gly Ala Asp Thr Ile Ala Gly Asp Pro Met Cys Ser Phe
2435 2440 2445
Asn Met Thr Pro Val Gly Ile Gly Lys Cys Leu Lys Tyr Ile Leu
2450 2455 2460
Gln Trp Gln Leu Ala Thr Leu Ile Leu Gly Gly Gly Gly Tyr Asn
2465 2470 2475
Leu Ala Asn Thr Ala Arg Cys Trp Thr Tyr Leu Thr Gly Val Ile
2480 2485 2490
Leu Gly Lys Thr Leu Ser Ser Glu Ile Pro Asp His Glu Phe Phe
2495 2500 2505
Thr Ala Tyr Gly Pro Asp Tyr Val Leu Glu Ile Thr Pro Ser Cys
2510 2515 2520
Arg Pro Asp Arg Asn Glu Pro His Arg Ile Gln Gln Ile Leu Asn
2525 2530 2535
Tyr Ile Lys Gly Asn Leu Lys His Val Val Gly Gly Gly Gly Ser
2540 2545 2550
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
2555 2560 2565
Lys Lys Gly Ser
2570
<210> 80
<211> 2572
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 80
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Gly Gly Gly Gly Ser Gly Ser Ala Ala Ile Ala Glu Val Leu
20 25 30
Leu Asn Ala Arg Cys Asp Leu His Ala Val Asn Tyr His Gly Asp Thr
35 40 45
Pro Leu His Ile Ala Ala Arg Glu Ser Tyr His Asp Cys Val Leu Leu
50 55 60
Phe Leu Ser Arg Gly Ala Asn Pro Glu Leu Arg Asn Lys Glu Gly Asp
65 70 75 80
Thr Ala Trp Asp Leu Thr Pro Glu Arg Ser Asp Val Trp Phe Ala Leu
85 90 95
Gln Leu Asn Arg Lys Leu Arg Leu Gly Val Gly Asn Arg Ala Ile Arg
100 105 110
Thr Glu Lys Ile Ile Cys Arg Asp Val Ala Arg Gly Tyr Glu Asn Val
115 120 125
Pro Ile Pro Cys Val Asn Gly Val Asp Gly Glu Pro Cys Pro Glu Asp
130 135 140
Tyr Lys Tyr Ile Ser Glu Asn Cys Glu Thr Ser Thr Met Asn Ile Asp
145 150 155 160
Arg Asn Ile Thr His Leu Gln His Cys Thr Cys Val Asp Asp Cys Ser
165 170 175
Ser Ser Asn Cys Leu Cys Gly Gln Leu Ser Ile Arg Cys Trp Tyr Asp
180 185 190
Lys Asp Gly Arg Leu Leu Gln Glu Phe Asn Lys Ile Glu Pro Pro Leu
195 200 205
Ile Phe Glu Cys Asn Gln Ala Cys Ser Cys Trp Arg Asn Cys Lys Asn
210 215 220
Arg Val Val Gln Ser Gly Ile Lys Val Arg Leu Gln Leu Tyr Arg Thr
225 230 235 240
Ala Lys Met Gly Trp Gly Val Arg Ala Leu Gln Thr Ile Pro Gln Gly
245 250 255
Thr Phe Ile Cys Glu Tyr Val Gly Glu Leu Ile Ser Asp Ala Glu Ala
260 265 270
Asp Val Arg Glu Asp Asp Ser Tyr Leu Phe Asp Leu Asp Asn Lys Asp
275 280 285
Gly Glu Val Tyr Cys Ile Asp Ala Arg Tyr Tyr Gly Asn Ile Ser Arg
290 295 300
Phe Ile Asn His Leu Cys Asp Pro Asn Ile Ile Pro Val Arg Val Phe
305 310 315 320
Met Leu His Gln Asp Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Ser
325 330 335
Arg Asp Ile Arg Thr Gly Glu Glu Leu Gly Phe Asp Tyr Gly Asp Arg
340 345 350
Phe Trp Asp Ile Lys Ser Lys Tyr Phe Thr Cys Gln Cys Gly Ser Glu
355 360 365
Lys Cys Lys His Ser Ala Glu Ala Ile Ala Leu Glu Gln Ser Arg Leu
370 375 380
Ala Arg Leu Asp Pro His Pro Glu Leu Leu Pro Glu Leu Gly Ser Leu
385 390 395 400
Pro Pro Val Asn Thr Gly Gly Gly Gly Ser Gly Asp Lys Lys Tyr Ser
405 410 415
Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr
420 425 430
Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr
435 440 445
Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp
450 455 460
Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg
465 470 475 480
Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe
485 490 495
Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu
500 505 510
Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile
515 520 525
Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr
530 535 540
Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp
545 550 555 560
Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly
565 570 575
His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp
580 585 590
Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu
595 600 605
Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala
610 615 620
Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro
625 630 635 640
Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu
645 650 655
Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala
660 665 670
Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
675 680 685
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys
690 695 700
Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr
705 710 715 720
Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp
725 730 735
Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln
740 745 750
Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly
755 760 765
Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys
770 775 780
Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu
785 790 795 800
Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp
805 810 815
Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile
820 825 830
Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu
835 840 845
Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
850 855 860
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu
865 870 875 880
Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala
885 890 895
Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu
900 905 910
Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
915 920 925
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met
930 935 940
Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
945 950 955 960
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu
965 970 975
Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly
980 985 990
Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu
995 1000 1005
Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
1010 1015 1020
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp
1025 1030 1035
Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
1040 1045 1050
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
1055 1060 1065
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
1070 1075 1080
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
1085 1090 1095
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
1100 1105 1110
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
1115 1120 1125
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
1130 1135 1140
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
1145 1150 1155
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1160 1165 1170
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1175 1180 1185
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1190 1195 1200
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1205 1210 1215
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1220 1225 1230
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1235 1240 1245
Ala Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1250 1255 1260
Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg Gly Lys Ser Asp
1265 1270 1275
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1280 1285 1290
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1295 1300 1305
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1310 1315 1320
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1325 1330 1335
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1340 1345 1350
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1355 1360 1365
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1370 1375 1380
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1385 1390 1395
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1400 1405 1410
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1415 1420 1425
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1430 1435 1440
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1445 1450 1455
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1460 1465 1470
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1475 1480 1485
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1490 1495 1500
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1505 1510 1515
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1520 1525 1530
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1535 1540 1545
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1550 1555 1560
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1565 1570 1575
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1580 1585 1590
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1595 1600 1605
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1610 1615 1620
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1625 1630 1635
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1640 1645 1650
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1655 1660 1665
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1670 1675 1680
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1685 1690 1695
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1700 1705 1710
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1715 1720 1725
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1730 1735 1740
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1745 1750 1755
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1760 1765 1770
Gln Leu Gly Gly Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys
1775 1780 1785
Lys Ala Gly Gln Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser
1790 1795 1800
Gly Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg
1805 1810 1815
Lys Arg Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg
1820 1825 1830
Phe Arg Arg Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg
1835 1840 1845
Gln Lys Ile Leu Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys
1850 1855 1860
Gln Arg Arg Ile Gln Pro Val His Ile Leu Thr Ser Val Ser Ser
1865 1870 1875
Leu Arg Gly Thr Arg Glu Cys Ser Val Thr Ser Asp Leu Asp Phe
1880 1885 1890
Pro Thr Gln Val Ile Pro Leu Lys Thr Leu Asn Ala Val Ala Ser
1895 1900 1905
Val Pro Ile Met Tyr Ser Trp Ser Pro Leu Gln Gln Asn Phe Met
1910 1915 1920
Val Glu Asp Glu Thr Val Leu His Asn Ile Pro Tyr Met Gly Asp
1925 1930 1935
Glu Val Leu Asp Gln Asp Gly Thr Phe Ile Glu Glu Leu Ile Lys
1940 1945 1950
Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu Cys Gly Phe Ile
1955 1960 1965
Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu Gly Gln Tyr
1970 1975 1980
Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu Glu Arg
1985 1990 1995
Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys Glu
2000 2005 2010
Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
2015 2020 2025
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys
2030 2035 2040
Glu Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu
2045 2050 2055
Pro Pro Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser
2060 2065 2070
Val Gln Arg Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys
2075 2080 2085
Arg Arg Cys Phe Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala
2090 2095 2100
Thr Pro Asn Thr Tyr Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp
2105 2110 2115
Asn Lys Pro Cys Gly Pro Gln Cys Tyr Gln His Leu Glu Gly Ala
2120 2125 2130
Lys Glu Phe Ala Ala Ala Leu Thr Ala Glu Arg Ile Lys Thr Pro
2135 2140 2145
Pro Lys Arg Pro Gly Gly Arg Arg Arg Gly Arg Leu Pro Asn Asn
2150 2155 2160
Ser Ser Arg Pro Ser Thr Pro Thr Ile Asn Val Leu Glu Ser Lys
2165 2170 2175
Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr Glu Thr Gly Gly Glu
2180 2185 2190
Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp Glu Thr Ser Ser
2195 2200 2205
Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile Lys Met Lys
2210 2215 2220
Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly Ala Glu
2225 2230 2235
Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn Phe
2240 2245 2250
Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
2255 2260 2265
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro
2270 2275 2280
Ala Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His
2285 2290 2295
Arg Leu Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp
2300 2305 2310
Gly Ser Ser Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro
2315 2320 2325
Arg Gln Pro Cys Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn
2330 2335 2340
Phe Cys Glu Lys Phe Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg
2345 2350 2355
Phe Pro Gly Cys Arg Cys Lys Ala Gln Cys Asn Thr Lys Gln Cys
2360 2365 2370
Pro Cys Tyr Leu Ala Val Arg Glu Cys Asp Pro Asp Leu Cys Leu
2375 2380 2385
Thr Cys Gly Ala Ala Asp His Trp Asp Ser Lys Asn Val Ser Cys
2390 2395 2400
Lys Asn Cys Ser Ile Gln Arg Gly Ser Lys Lys His Leu Leu Leu
2405 2410 2415
Ala Pro Ser Asp Val Ala Gly Trp Gly Ile Phe Ile Lys Asp Pro
2420 2425 2430
Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys Gly Glu Ile Ile
2435 2440 2445
Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr Asp Lys Tyr
2450 2455 2460
Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val Val Asp
2465 2470 2475
Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser Val
2480 2485 2490
Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
2495 2500 2505
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu
2510 2515 2520
Leu Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr
2525 2530 2535
Val Gly Ile Glu Arg Glu Met Glu Ile Pro Gly Gly Gly Gly Ser
2540 2545 2550
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
2555 2560 2565
Lys Lys Gly Ser
2570
<210> 81
<211> 1923
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 81
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Gly Gly Gly Gly Ser Gly Ser Ala Ala Ile Ala Glu Val Leu
20 25 30
Leu Asn Ala Arg Cys Asp Leu His Ala Val Asn Tyr His Gly Asp Thr
35 40 45
Pro Leu His Ile Ala Ala Arg Glu Ser Tyr His Asp Cys Val Leu Leu
50 55 60
Phe Leu Ser Arg Gly Ala Asn Pro Glu Leu Arg Asn Lys Glu Gly Asp
65 70 75 80
Thr Ala Trp Asp Leu Thr Pro Glu Arg Ser Asp Val Trp Phe Ala Leu
85 90 95
Gln Leu Asn Arg Lys Leu Arg Leu Gly Val Gly Asn Arg Ala Ile Arg
100 105 110
Thr Glu Lys Ile Ile Cys Arg Asp Val Ala Arg Gly Tyr Glu Asn Val
115 120 125
Pro Ile Pro Cys Val Asn Gly Val Asp Gly Glu Pro Cys Pro Glu Asp
130 135 140
Tyr Lys Tyr Ile Ser Glu Asn Cys Glu Thr Ser Thr Met Asn Ile Asp
145 150 155 160
Arg Asn Ile Thr His Leu Gln His Cys Thr Cys Val Asp Asp Cys Ser
165 170 175
Ser Ser Asn Cys Leu Cys Gly Gln Leu Ser Ile Arg Cys Trp Tyr Asp
180 185 190
Lys Asp Gly Arg Leu Leu Gln Glu Phe Asn Lys Ile Glu Pro Pro Leu
195 200 205
Ile Phe Glu Cys Asn Gln Ala Cys Ser Cys Trp Arg Asn Cys Lys Asn
210 215 220
Arg Val Val Gln Ser Gly Ile Lys Val Arg Leu Gln Leu Tyr Arg Thr
225 230 235 240
Ala Lys Met Gly Trp Gly Val Arg Ala Leu Gln Thr Ile Pro Gln Gly
245 250 255
Thr Phe Ile Cys Glu Tyr Val Gly Glu Leu Ile Ser Asp Ala Glu Ala
260 265 270
Asp Val Arg Glu Asp Asp Ser Tyr Leu Phe Asp Leu Asp Asn Lys Asp
275 280 285
Gly Glu Val Tyr Cys Ile Asp Ala Arg Tyr Tyr Gly Asn Ile Ser Arg
290 295 300
Phe Ile Asn His Leu Cys Asp Pro Asn Ile Ile Pro Val Arg Val Phe
305 310 315 320
Met Leu His Gln Asp Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Ser
325 330 335
Arg Asp Ile Arg Thr Gly Glu Glu Leu Gly Phe Asp Tyr Gly Asp Arg
340 345 350
Phe Trp Asp Ile Lys Ser Lys Tyr Phe Thr Cys Gln Cys Gly Ser Glu
355 360 365
Lys Cys Lys His Ser Ala Glu Ala Ile Ala Leu Glu Gln Ser Arg Leu
370 375 380
Ala Arg Leu Asp Pro His Pro Glu Leu Leu Pro Glu Leu Gly Ser Leu
385 390 395 400
Pro Pro Val Asn Thr Gly Gly Gly Gly Ser Gly Asp Lys Lys Tyr Ser
405 410 415
Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr
420 425 430
Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr
435 440 445
Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp
450 455 460
Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg
465 470 475 480
Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe
485 490 495
Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu
500 505 510
Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile
515 520 525
Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr
530 535 540
Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp
545 550 555 560
Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly
565 570 575
His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp
580 585 590
Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu
595 600 605
Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala
610 615 620
Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro
625 630 635 640
Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu
645 650 655
Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala
660 665 670
Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
675 680 685
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys
690 695 700
Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr
705 710 715 720
Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp
725 730 735
Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln
740 745 750
Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly
755 760 765
Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys
770 775 780
Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu
785 790 795 800
Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp
805 810 815
Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile
820 825 830
Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu
835 840 845
Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
850 855 860
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu
865 870 875 880
Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala
885 890 895
Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu
900 905 910
Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
915 920 925
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met
930 935 940
Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
945 950 955 960
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu
965 970 975
Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly
980 985 990
Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu
995 1000 1005
Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
1010 1015 1020
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp
1025 1030 1035
Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
1040 1045 1050
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
1055 1060 1065
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
1070 1075 1080
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
1085 1090 1095
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
1100 1105 1110
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
1115 1120 1125
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
1130 1135 1140
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
1145 1150 1155
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1160 1165 1170
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1175 1180 1185
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1190 1195 1200
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1205 1210 1215
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1220 1225 1230
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1235 1240 1245
Ala Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1250 1255 1260
Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg Gly Lys Ser Asp
1265 1270 1275
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1280 1285 1290
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1295 1300 1305
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1310 1315 1320
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1325 1330 1335
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1340 1345 1350
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1355 1360 1365
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1370 1375 1380
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1385 1390 1395
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1400 1405 1410
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1415 1420 1425
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1430 1435 1440
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1445 1450 1455
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1460 1465 1470
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1475 1480 1485
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1490 1495 1500
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1505 1510 1515
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1520 1525 1530
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1535 1540 1545
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1550 1555 1560
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1565 1570 1575
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1580 1585 1590
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1595 1600 1605
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1610 1615 1620
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1625 1630 1635
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1640 1645 1650
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1655 1660 1665
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1670 1675 1680
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1685 1690 1695
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1700 1705 1710
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1715 1720 1725
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1730 1735 1740
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1745 1750 1755
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1760 1765 1770
Gln Leu Gly Gly Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys
1775 1780 1785
Lys Ala Gly Gln Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser
1790 1795 1800
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
1805 1810 1815
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu
1820 1825 1830
Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn
1835 1840 1845
Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp
1850 1855 1860
Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu
1865 1870 1875
Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe
1880 1885 1890
Glu Ile Lys Ser Ser Val Gly Gly Gly Gly Ser Gly Lys Arg Pro
1895 1900 1905
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1910 1915 1920
<210> 82
<211> 2292
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 82
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys Arg
20 25 30
Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg Arg
35 40 45
Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile Leu
50 55 60
Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile Gln
65 70 75 80
Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg Glu
85 90 95
Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro Leu
100 105 110
Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp Ser
115 120 125
Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His Asn
130 135 140
Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe Ile
145 150 155 160
Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu
165 170 175
Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu
180 185 190
Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu
195 200 205
Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys
210 215 220
Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
225 230 235 240
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys Glu
245 250 255
Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro Pro
260 265 270
Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln Arg
275 280 285
Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys Phe
290 295 300
Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr Tyr
305 310 315 320
Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly Pro
325 330 335
Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala Leu
340 345 350
Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg Arg
355 360 365
Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr Ile
370 375 380
Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr
385 390 395 400
Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp
405 410 415
Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile
420 425 430
Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly
435 440 445
Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn
450 455 460
Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
465 470 475 480
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro Ala
485 490 495
Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg Leu
500 505 510
Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser Ser
515 520 525
Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro Cys
530 535 540
Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys Phe
545 550 555 560
Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg Cys
565 570 575
Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val Arg
580 585 590
Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His Trp
595 600 605
Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly Ser
610 615 620
Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly Ile
625 630 635 640
Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys
645 650 655
Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr
660 665 670
Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val
675 680 685
Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser
690 695 700
Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
705 710 715 720
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu Leu
725 730 735
Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val Gly
740 745 750
Ile Glu Arg Glu Met Glu Ile Pro Ser Thr Gly Gly Ser Gly Gly Ser
755 760 765
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Arg Pro Asp Lys Lys Tyr
770 775 780
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
785 790 795 800
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
805 810 815
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
820 825 830
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
835 840 845
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
850 855 860
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
865 870 875 880
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
885 890 895
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
900 905 910
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
915 920 925
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
930 935 940
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
945 950 955 960
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
965 970 975
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
980 985 990
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
995 1000 1005
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
1010 1015 1020
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
1025 1030 1035
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
1040 1045 1050
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
1055 1060 1065
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
1070 1075 1080
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
1085 1090 1095
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
1100 1105 1110
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
1115 1120 1125
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
1130 1135 1140
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
1145 1150 1155
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
1160 1165 1170
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
1175 1180 1185
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
1190 1195 1200
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
1205 1210 1215
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
1220 1225 1230
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
1235 1240 1245
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
1250 1255 1260
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
1265 1270 1275
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
1280 1285 1290
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
1295 1300 1305
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
1310 1315 1320
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
1325 1330 1335
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
1340 1345 1350
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
1355 1360 1365
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
1370 1375 1380
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
1385 1390 1395
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1400 1405 1410
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
1415 1420 1425
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
1430 1435 1440
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
1445 1450 1455
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
1460 1465 1470
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1475 1480 1485
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1490 1495 1500
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1505 1510 1515
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
1520 1525 1530
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
1535 1540 1545
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
1550 1555 1560
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
1565 1570 1575
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1580 1585 1590
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1595 1600 1605
Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln
1610 1615 1620
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1625 1630 1635
Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1640 1645 1650
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1655 1660 1665
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1670 1675 1680
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1685 1690 1695
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1700 1705 1710
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1715 1720 1725
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1730 1735 1740
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1745 1750 1755
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1760 1765 1770
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1775 1780 1785
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1790 1795 1800
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1805 1810 1815
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1820 1825 1830
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1835 1840 1845
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1850 1855 1860
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1865 1870 1875
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1880 1885 1890
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1895 1900 1905
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1910 1915 1920
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1925 1930 1935
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1940 1945 1950
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1955 1960 1965
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1970 1975 1980
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1985 1990 1995
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
2000 2005 2010
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
2015 2020 2025
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
2030 2035 2040
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
2045 2050 2055
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
2060 2065 2070
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
2075 2080 2085
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
2090 2095 2100
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
2105 2110 2115
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
2120 2125 2130
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser
2135 2140 2145
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
2150 2155 2160
Lys Lys Lys Ser Gly Gly Gly Gly Ser Asp Ala Lys Ser Leu Thr
2165 2170 2175
Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp
2180 2185 2190
Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile
2195 2200 2205
Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser
2210 2215 2220
Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu
2225 2230 2235
Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
2240 2245 2250
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
2255 2260 2265
Gly Gly Gly Gly Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
2270 2275 2280
Gly Gln Ala Lys Lys Lys Lys Gly Ser
2285 2290
<210> 83
<400> 83
000
<210> 84
<211> 1405
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 84
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Gly Ser
1400 1405
<210> 85
<211> 7147
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 85
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgtgtg ctggcggaag cgggtgaaga gcgagtacat gcggctgcgg cagctgaagc 180
ggttccggcg ggccgacgag gtgaagagca tgttcagcag caaccggcag aagatcctgg 240
agcggaccga gatcctgaac caggagtgga agcagcggcg aatccagccc gtgcacatcc 300
tgaccagcgt gagcagcctg cggggcaccc gggagtgcag cgtgaccagc gacctggact 360
tccccaccca ggtgatcccc ctaaagaccc tgaacgccgt ggccagcgtg cccatcatgt 420
acagctggag ccccctgcag cagaacttca tggtggagga cgagaccgtg ctgcacaaca 480
tcccctacat gggcgacgag gtgctggacc aggacggcac cttcatcgag gagctgatca 540
agaactacga cggcaaggtg cacggcgacc gggagtgcgg cttcatcaac gacgagatct 600
tcgtggagct ggtgaacgcc ctgggccagt acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggacctgga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag ttccccagcg acaagatctt cgaggccatc agcagcatgt 780
tccccgacaa gggcaccgcc gaggagctga aggagaagta caaggagctg accgagcagc 840
agctgcccgg cgccctgccc cccgagtgca cccccaacat cgacggcccc aacgccaaga 900
gcgtgcagcg ggagcagagc ctgcacagct tccacaccct gttctgccgg cggtgcttca 960
agtacgactg cttcctgcac cccttccacg ccacccccaa cacctacaag cggaagaaca 1020
ccgagaccgc cctggacaac aagccctgcg gcccccagtg ctaccagcac ctggagggcg 1080
ccaaggagtt cgccgccgcc ctgaccgccg agcggatcaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg ctgcccaaca acagcagccg gcccagcacc cccaccatca 1200
acgtgctgga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggtg ccagaccccc atcaagatga agcccaacat cgagcccccc gagaacgtgg 1380
agtggagcgg cgccgaggcc agcatgttcc gggtgctgat cggcacctac tacgacaact 1440
tctgcgccat cgcccggctg atcggcacca agacctgccg gcaggtgtac gagttccggg 1500
tgaaggagag cagcatcatc gcccccgccc ccgccgagga cgtggacacc cccccccgga 1560
agaagaagcg gaagcaccgg ctgtgggccg cccactgccg gaagatccag ctgaagaagg 1620
acggcagcag caaccacgtg tacaactacc agccctgcga ccacccccgg cagccctgcg 1680
acagcagctg cccctgcgtg atcgcccaga acttctgcga gaagttctgc cagtgcagca 1740
gcgagtgcca gaaccggttc cccggctgcc ggtgcaaggc ccagtgcaac accaagcagt 1800
gcccctgcta cctggccgtg cgggagtgcg accccgacct gtgcctgacc tgcggcgccg 1860
ccgaccactg ggacagcaag aacgtgagct gcaagaactg cagcatccag cggggcagca 1920
agaagcacct gctgctggcc cccagcgacg tggccggctg gggcatcttc atcaaggacc 1980
ccgtgcagaa gaacgagttc atcagcgagt actgcggcga gatcatcagc caggacgagg 2040
ccgaccggcg gggcaaggtg tacgacaagt acatgtgcag cttcctgttc aacctgaaca 2100
acgacttcgt ggtggacgcc acccggaagg gcaacaagat ccggttcgcc aaccacagcg 2160
tgaaccccaa ctgctacgcc aaggtgatga tggtgaacgg cgaccaccgg atcggcatct 2220
tcgccaagcg ggccatccag accggcgagg agctgttctt cgactaccgg tacagccagg 2280
ccgacgccct gaagtacgtg ggcatcgagc gggagatgga gatccccagc accggcggca 2340
gcggcggcag cggcggcagc ggcggcagcg gcggcagcgg ccgacccgac aagaagtaca 2400
gcatcggcct ggccatcggc accaacagcg tgggctgggc cgtgatcacc gacgagtaca 2460
aggtgcccag caagaagttc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga 2520
acctgatcgg cgccctgctg ttcgacagcg gcgagaccgc cgaggccacc cggctgaagc 2580
ggaccgcccg gcggcggtac acccggcgga agaaccggat ctgctacctg caggagatct 2640
tcagcaacga gatggccaag gtggacgaca gcttcttcca ccggctggag gagagcttcc 2700
tggtggagga ggacaagaag cacgagcggc accccatctt cggcaacatc gtggacgagg 2760
tggcctacca cgagaagtac cccaccatct accacctgcg gaagaagctg gtggacagca 2820
ccgacaaggc cgacctgcgg ctgatctacc tggccctggc ccacatgatc aagttccggg 2880
gccacttcct gatcgagggc gacctgaacc ccgacaacag cgacgtggac aagctgttca 2940
tccagctggt gcagacctac aaccagctgt tcgaggagaa ccccatcaac gccagcggcg 3000
tggacgccaa ggccatcctg agcgcccggc tgagcaagag ccggcggctg gagaacctga 3060
tcgcccagct gcccggcgag aagaagaacg gcctgttcgg caacctgatc gccctgagcc 3120
tgggcctgac ccccaacttc aagagcaact tcgacctggc cgaggacgcc aagctgcagc 3180
tgagcaagga cacctacgac gacgacctgg acaacctgct ggcccagatc ggcgaccagt 3240
acgccgacct gttcctggcc gccaagaacc tgagcgacgc catcctgctg agcgacatcc 3300
tgcgggtgaa caccgagatc accaaggccc ccctgagcgc cagcatgatc aagcggtacg 3360
acgagcacca ccaggacctg accctgctga aggccctggt gcggcagcag ctgcccgaga 3420
agtacaagga gatcttcttc gaccagagca agaacggcta cgccggctac atcgacggcg 3480
gcgccagcca ggaggagttc tacaagttca tcaagcccat cctggagaag atggacggca 3540
ccgaggagct gctggtgaag ctgaaccggg aggacctgct gcggaagcag cggaccttcg 3600
acaacggcag catcccccac cagatccacc tgggcgagct gcacgccatc ctgcggcggc 3660
aggaggactt ctaccccttc ctgaaggaca accgggagaa gatcgagaag atcctgacct 3720
tccggatccc ctactacgtg ggccccctgg cccggggcaa cagccggttc gcctggatga 3780
cccggaaatc cgaggagacc atcaccccct ggaacttcga ggaggtggtg gacaagggcg 3840
ccagcgccca gagcttcatc gagcggatga ccaacttcga caagaacctg cccaacgaga 3900
aggtgctgcc caagcacagc ctgctgtacg agtacttcac cgtgtacaac gagctgacca 3960
aggtgaagta cgtgaccgag ggcatgcgga agcccgcctt cctgagcggc gagcagaaga 4020
aggccatcgt ggacctgctg ttcaagacca accggaaggt gaccgtgaag cagctgaagg 4080
aggactactt caagaagatc gagtgcttcg acagcgtgga gatcagcggc gtggaggacc 4140
ggttcaacgc cagcctgggc acctaccacg acctgctgaa gatcatcaag gacaaggact 4200
tcctggacaa cgaggagaac gaggacatcc tggaggacat cgtgctgacc ctgaccctgt 4260
tcgaggaccg ggagatgatc gaggagcggc tgaaaaccta cgcccacctg ttcgacgaca 4320
aggtgatgaa gcagctgaag cggcggcggt acaccggctg gggccggctg agccggaagc 4380
tgatcaacgg catccgggac aagcagagcg gcaagaccat cctggacttc ctgaaatccg 4440
acggcttcgc caaccggaac ttcatgcagc tgatccacga cgacagcctg accttcaagg 4500
aggacatcca gaaggcccag gtgagcggcc agggcgacag cctgcacgag cacatcgcca 4560
acctggccgg cagccccgcc atcaagaagg gcatcctgca gaccgtgaag gtggtggacg 4620
agctggtgaa ggtgatgggc cggcacaagc ccgagaacat cgtgatcgag atggcccggg 4680
agaaccagac cacccagaag ggccagaaga acagccggga gcggatgaag cggatcgagg 4740
agggcatcaa ggagctgggc agccagatcc tgaaggagca ccccgtggag aacacccagc 4800
tgcagaacga gaagctgtac ctgtactacc tgcagaacgg ccgggacatg tacgtggacc 4860
aggagctgga catcaaccgg ctgagcgact acgacgtggc cgccatcgtg ccccagagct 4920
tcctgaagga cgacagcatc gacaacaagg tgctgacccg gagcgacaag gcccggggca 4980
agagcgacaa cgtgcccagc gaggaggtgg tgaagaagat gaagaactac tggcggcagc 5040
tgctgaacgc caagctgatc acccagcgga agttcgacaa cctgaccaag gccgagcggg 5100
gcggcctgag cgagctggac aaggccggct tcatcaagcg gcagctggtg gagacccggc 5160
agatcaccaa gcacgtggcc cagatcctgg acagccggat gaacaccaag tacgacgaga 5220
acgacaagct gatccgggag gtgaaggtga tcaccctgaa atccaagctg gtgagcgact 5280
tccggaagga cttccagttc tacaaggtgc gggagatcaa caactaccac cacgcccacg 5340
acgcctacct gaacgccgtg gtgggcaccg ccctgatcaa gaagtacccc aagctggaga 5400
gcgagttcgt gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc gccaagagcg 5460
agcaggagat cggcaaggcc accgccaagt acttcttcta cagcaacatc atgaacttct 5520
tcaagaccga gatcaccctg gccaacggcg agatccggaa gcggcccctg atcgagacca 5580
acggcgagac cggcgagatc gtgtgggaca agggccggga cttcgccacc gtgcggaagg 5640
tgctgagcat gccccaggtg aacatcgtga agaaaaccga ggtgcagacc ggcggcttca 5700
gcaaggagag catcctgccc aagcggaaca gcgacaagct gatcgcccgg aagaaggact 5760
gggaccccaa gaagtacggc ggcttcgaca gccccaccgt ggcctacagc gtgctggtgg 5820
tggccaaggt ggagaagggc aagagcaaga agctgaaatc cgtgaaggag ctgctgggca 5880
tcaccatcat ggagcggagc agcttcgaga agaaccccat cgacttcctg gaggccaagg 5940
gctacaagga ggtgaagaag gacctgatca tcaagctgcc caagtacagc ctgttcgagc 6000
tggagaacgg ccggaagcgg atgctggcca gcgccggcga gctgcagaag ggcaacgagc 6060
tggccctgcc cagcaagtac gtgaacttcc tgtacctggc cagccactac gagaagctga 6120
agggcagccc cgaggacaac gagcagaagc agctgttcgt ggagcagcac aagcactacc 6180
tggacgagat catcgagcag atcagcgagt tcagcaagcg ggtgatcctg gccgacgcca 6240
acctggacaa ggtgctgagc gcctacaaca agcaccggga caagcccatc cgggagcagg 6300
ccgagaacat catccacctg ttcaccctga ccaacctggg cgcccccgcc gccttcaagt 6360
acttcgacac caccatcgac cggaagcggt acaccagcac caaggaggtg ctggacgcca 6420
ccctgatcca ccagagcatc accggcctgt acgagacccg gatcgacctg agccagctgg 6480
gcggcgacag cggcggcaag cggcccgccg ccaccaagaa ggccggccag gccaagaaga 6540
agaagtcggg cgggggtggc tcagacgcta agtctctgac cgcttggagc agaacactgg 6600
tcaccttcaa ggacgtgttc gtcgacttca caagagagga gtggaaactg ctggacaccg 6660
cccagcagat cctctataga aacgtcatgc tggagaacta caagaatctg gtgtctctgg 6720
gctaccagct gaccaagccc gacgtgattc tgaggctgga gaagggcgag gagccttggc 6780
tggtggagag agagatccac caagaaaccc accccgacag cgaaaccgcc ttcgagatca 6840
agagcagcgt gggaggtggc ggatcgggaa agcggcccgc cgccaccaag aaggccggtc 6900
aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 6960
cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 7020
cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 7080
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7140
aaaaaaa 7147
<210> 86
<211> 2301
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 86
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys Arg
20 25 30
Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg Arg
35 40 45
Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile Leu
50 55 60
Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile Gln
65 70 75 80
Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg Glu
85 90 95
Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro Leu
100 105 110
Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp Ser
115 120 125
Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His Asn
130 135 140
Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe Ile
145 150 155 160
Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu
165 170 175
Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu
180 185 190
Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu
195 200 205
Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys
210 215 220
Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
225 230 235 240
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys Glu
245 250 255
Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro Pro
260 265 270
Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln Arg
275 280 285
Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys Phe
290 295 300
Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr Tyr
305 310 315 320
Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly Pro
325 330 335
Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala Leu
340 345 350
Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg Arg
355 360 365
Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr Ile
370 375 380
Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr
385 390 395 400
Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp
405 410 415
Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile
420 425 430
Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly
435 440 445
Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn
450 455 460
Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
465 470 475 480
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro Ala
485 490 495
Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg Leu
500 505 510
Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser Ser
515 520 525
Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro Cys
530 535 540
Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys Phe
545 550 555 560
Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg Cys
565 570 575
Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val Arg
580 585 590
Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His Trp
595 600 605
Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly Ser
610 615 620
Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly Ile
625 630 635 640
Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys
645 650 655
Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr
660 665 670
Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val
675 680 685
Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser
690 695 700
Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
705 710 715 720
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu Leu
725 730 735
Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val Gly
740 745 750
Ile Glu Arg Glu Met Glu Ile Pro Ser Thr Gly Gly Ser Gly Gly Ser
755 760 765
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Arg Pro Asp Lys Lys Tyr
770 775 780
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
785 790 795 800
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
805 810 815
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
820 825 830
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
835 840 845
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
850 855 860
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
865 870 875 880
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
885 890 895
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
900 905 910
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
915 920 925
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
930 935 940
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
945 950 955 960
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
965 970 975
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
980 985 990
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
995 1000 1005
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
1010 1015 1020
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
1025 1030 1035
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
1040 1045 1050
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
1055 1060 1065
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
1070 1075 1080
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
1085 1090 1095
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
1100 1105 1110
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
1115 1120 1125
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
1130 1135 1140
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
1145 1150 1155
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
1160 1165 1170
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
1175 1180 1185
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
1190 1195 1200
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
1205 1210 1215
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
1220 1225 1230
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
1235 1240 1245
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
1250 1255 1260
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
1265 1270 1275
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
1280 1285 1290
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
1295 1300 1305
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
1310 1315 1320
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
1325 1330 1335
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
1340 1345 1350
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
1355 1360 1365
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
1370 1375 1380
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
1385 1390 1395
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1400 1405 1410
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
1415 1420 1425
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
1430 1435 1440
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
1445 1450 1455
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
1460 1465 1470
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1475 1480 1485
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1490 1495 1500
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1505 1510 1515
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
1520 1525 1530
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
1535 1540 1545
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
1550 1555 1560
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
1565 1570 1575
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1580 1585 1590
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1595 1600 1605
Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln
1610 1615 1620
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1625 1630 1635
Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1640 1645 1650
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1655 1660 1665
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1670 1675 1680
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1685 1690 1695
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1700 1705 1710
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1715 1720 1725
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1730 1735 1740
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1745 1750 1755
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1760 1765 1770
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1775 1780 1785
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1790 1795 1800
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1805 1810 1815
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1820 1825 1830
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1835 1840 1845
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1850 1855 1860
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1865 1870 1875
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1880 1885 1890
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1895 1900 1905
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1910 1915 1920
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1925 1930 1935
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1940 1945 1950
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1955 1960 1965
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1970 1975 1980
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1985 1990 1995
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
2000 2005 2010
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
2015 2020 2025
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
2030 2035 2040
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
2045 2050 2055
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
2060 2065 2070
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
2075 2080 2085
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
2090 2095 2100
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
2105 2110 2115
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
2120 2125 2130
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser
2135 2140 2145
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
2150 2155 2160
Lys Lys Lys Ser Gly Gly Gly Gly Ser Asp Ala Lys Ser Leu Thr
2165 2170 2175
Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp
2180 2185 2190
Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile
2195 2200 2205
Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser
2210 2215 2220
Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu
2225 2230 2235
Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
2240 2245 2250
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
2255 2260 2265
Gly Gly Gly Gly Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
2270 2275 2280
Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
2285 2290 2295
Asp Tyr Ala
2300
<210> 87
<400> 87
000
<210> 88
<400> 88
000
<210> 89
<400> 89
000
<210> 90
<400> 90
000
<210> 91
<400> 91
000
<210> 92
<400> 92
000
<210> 93
<400> 93
000
<210> 94
<400> 94
000
<210> 95
<400> 95
000
<210> 96
<400> 96
000
<210> 97
<400> 97
000
<210> 98
<400> 98
000
<210> 99
<400> 99
000
<210> 100
<400> 100
000
<210> 101
<400> 101
000
<210> 102
<400> 102
000
<210> 103
<400> 103
000
<210> 104
<400> 104
000
<210> 105
<400> 105
000
<210> 106
<400> 106
000
<210> 107
<400> 107
000
<210> 108
<400> 108
000
<210> 109
<400> 109
000
<210> 110
<400> 110
000
<210> 111
<400> 111
000
<210> 112
<400> 112
000
<210> 113
<400> 113
000
<210> 114
<400> 114
000
<210> 115
<400> 115
000
<210> 116
<400> 116
000
<210> 117
<400> 117
000
<210> 118
<400> 118
000
<210> 119
<400> 119
000
<210> 120
<400> 120
000
<210> 121
<400> 121
000
<210> 122
<400> 122
000
<210> 123
<400> 123
000
<210> 124
<400> 124
000
<210> 125
<400> 125
000
<210> 126
<400> 126
000
<210> 127
<400> 127
000
<210> 128
<400> 128
000
<210> 129
<400> 129
000
<210> 130
<400> 130
000
<210> 131
<400> 131
000
<210> 132
<400> 132
000
<210> 133
<400> 133
000
<210> 134
<400> 134
000
<210> 135
<400> 135
000
<210> 136
<400> 136
000
<210> 137
<400> 137
000
<210> 138
<400> 138
000
<210> 139
<400> 139
000
<210> 140
<400> 140
000
<210> 141
<400> 141
000
<210> 142
<400> 142
000
<210> 143
<400> 143
000
<210> 144
<400> 144
000
<210> 145
<400> 145
000
<210> 146
<400> 146
000
<210> 147
<400> 147
000
<210> 148
<400> 148
000
<210> 149
<400> 149
000
<210> 150
<400> 150
000
<210> 151
<400> 151
000
<210> 152
<400> 152
000
<210> 153
<400> 153
000
<210> 154
<400> 154
000
<210> 155
<400> 155
000
<210> 156
<400> 156
000
<210> 157
<400> 157
000
<210> 158
<400> 158
000
<210> 159
<400> 159
000
<210> 160
<400> 160
000
<210> 161
<400> 161
000
<210> 162
<400> 162
000
<210> 163
<400> 163
000
<210> 164
<400> 164
000
<210> 165
<400> 165
000
<210> 166
<400> 166
000
<210> 167
<400> 167
000
<210> 168
<400> 168
000
<210> 169
<400> 169
000
<210> 170
<400> 170
000
<210> 171
<400> 171
000
<210> 172
<400> 172
000
<210> 173
<400> 173
000
<210> 174
<400> 174
000
<210> 175
<400> 175
000
<210> 176
<400> 176
000
<210> 177
<400> 177
000
<210> 178
<400> 178
000
<210> 179
<400> 179
000
<210> 180
<400> 180
000
<210> 181
<400> 181
000
<210> 182
<400> 182
000
<210> 183
<400> 183
000
<210> 184
<400> 184
000
<210> 185
<400> 185
000
<210> 186
<400> 186
000
<210> 187
<400> 187
000
<210> 188
<400> 188
000
<210> 189
<400> 189
000
<210> 190
<400> 190
000
<210> 191
<400> 191
000
<210> 192
<400> 192
000
<210> 193
<400> 193
000
<210> 194
<400> 194
000
<210> 195
<400> 195
000
<210> 196
<400> 196
000
<210> 197
<400> 197
000
<210> 198
<400> 198
000
<210> 199
<400> 199
000
<210> 200
<400> 200
000
<210> 201
<211> 7433
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 201
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggtac 420
ctaatacgac tcactataag gaaataagag agaaaagaag agtaagaaga aatataagag 480
ccaccatggc ccccaagaag aagcggaagg tgggcatcca cggcgtgccc gccgccgcca 540
agcggaacta catcctgggc ctggccatcg gcatcaccag cgtgggctac ggcatcatcg 600
actacgagac ccgggacgtg atcgacgccg gcgtgcggct gttcaaggag gccaacgtgg 660
agaacaacga gggccggcgg agcaagcggg gcgcccggcg gctgaagcgg cggcggcggc 720
accggatcca gcgggtgaag aagctgctgt tcgactacaa cctgctgacc gaccacagcg 780
agctgagcgg catcaacccc tacgaggccc gggtgaaggg cctgagccag aagctgagcg 840
aggaggagtt cagcgccgcc ctgctgcacc tggccaagcg gcggggcgtg cacaacgtga 900
acgaggtgga ggaggacacc ggcaacgagc tgagcaccaa ggagcagatc agccggaaca 960
gcaaggccct ggaggagaag tacgtggccg agctgcagct ggagcggctg aagaaggacg 1020
gcgaggtgcg gggcagcatc aaccggttca agaccagcga ctacgtgaag gaggccaagc 1080
agctgctgaa ggtgcagaag gcctaccacc agctggacca gagcttcatc gacacctaca 1140
tcgacctgct ggagacccgg cggacctact acgagggccc cggcgagggc agccccttcg 1200
gctggaagga catcaaggag tggtacgaga tgctgatggg ccactgcacc tacttccccg 1260
aggagctgcg gagcgtgaag tacgcctaca acgccgacct gtacaacgcc ctgaacgacc 1320
tgaacaacct ggtgatcacc cgggacgaga acgagaagct ggagtactac gagaagttcc 1380
agatcatcga gaacgtgttc aagcagaaga agaagcccac cctgaagcag atcgccaagg 1440
agatcctggt gaacgaggag gacatcaagg gctaccgggt gaccagcacc ggcaagcccg 1500
agttcaccaa cctgaaggtg taccacgaca tcaaggacat caccgcccgg aaggagatca 1560
tcgagaacgc cgagctgctg gaccagatcg ccaagatcct gaccatctac cagagcagcg 1620
aggacatcca ggaggagctg accaacctga acagcgagct gacccaggag gagatcgagc 1680
agatcagcaa cctgaagggc tacaccggca cccacaacct gagcctgaag gccatcaacc 1740
tgatcctgga cgagctgtgg cacaccaacg acaaccagat cgccatcttc aaccggctga 1800
agctggtgcc caagaaggtg gacctgagcc agcagaagga gatccccacc accctggtgg 1860
acgacttcat cctgagcccc gtggtgaagc ggagcttcat ccagagcatc aaggtgatca 1920
acgccatcat caagaagtac ggcctgccca acgacatcat catcgagctg gcccgggaga 1980
agaacagcaa ggacgcccag aagatgatca acgagatgca gaagcggaac cggcagacca 2040
acgagcggat cgaggagatc atccggacca ccggcaagga gaacgccaag tacctgatcg 2100
agaagatcaa gctgcacgac atgcaggagg gcaagtgcct gtacagcctg gaggccatcc 2160
ccctggagga cctgctgaac aaccccttca actacgaggt ggacgccatc atcccccgga 2220
gcgtgagctt cgacaacagc ttcaacaaca aggtgctggt gaagcaggag gagaacagca 2280
agaagggcaa ccggaccccc ttccagtacc tgagcagcag cgacagcaag atcagctacg 2340
agaccttcaa gaagcacatc ctgaacctgg ccaagggcaa gggccggatc agcaagacca 2400
agaaggagta cctgctggag gagcgggaca tcaaccggtt cagcgtgcag aaggacttca 2460
tcaaccggaa cctggtggac acccggtacg ccacccgggg cctgatgaac ctgctgcgga 2520
gctacttccg ggtgaacaac ctggacgtga aggtgaaatc catcaacggc ggcttcacca 2580
gcttcctgcg gcggaagtgg aagttcaaga aggagcggaa caagggctac aagcaccacg 2640
ccgaggacgc cctgatcatc gccaacgccg acttcatctt caaggagtgg aagaagctgg 2700
acaaggccaa gaaggtgatg gagaaccaga tgttcgagga gaagcaggcc gagagcatgc 2760
ccgagatcga gaccgagcag gagtacaagg agatcttcat caccccccac cagatcaagc 2820
acatcaagga cttcaaggac tacaagtaca gccaccgggt ggacaagaag cccaaccgga 2880
agctgatcaa cgacaccctg tacagcaccc ggaaggacga caagggcaac accctgatcg 2940
tgaacaacct gaacggcctg tacgacaagg acaacgacaa gctgaagaag ctgatcaaca 3000
agagccccga gaagctgctg atgtaccacc acgaccccca gacctaccag aagctgaagc 3060
tgatcatgga gcagtacggc gacgagaaga accccctgta caagtactac gaggagaccg 3120
gcaactacct gaccaagtac agcaagaagg acaacggccc cgtgatcaag aagatcaagt 3180
actacggcaa caagctgaac gcccacctgg acatcaccga cgactacccc aacagccgga 3240
acaaggtggt gaagctgagc ctgaagccct accggttcga cgtgtacctg gacaacggcg 3300
tgtacaagtt cgtgaccgtg aagaacctgg acgtgatcaa gaaggagaac tactacgagg 3360
tgaacagcaa gtgctacgag gaggccaaga agctgaagaa gatcagcaac caggccgagt 3420
tcatcgccag cttctacaag aacgacctga tcaagatcaa cggcgagctg taccgggtga 3480
tcggcgtgaa caacgacctg ctgaaccgga tcgaggtgaa catgatcgac atcacctacc 3540
gggagtacct ggagaacatg aacgacaagc ggccccccca catcatcaag accatcgcca 3600
gcaagaccca gagcatcaag aagtacagca ccgacatcct gggcaacctg tacgaggtga 3660
aatccaagaa gcacccccag atcatcaaga agggcaagcg gcccgccgcc accaagaagg 3720
ccggccaggc caagaagaag aaggcccggg acagcaaggt ggagaacaag accaagaagc 3780
tgcgggtgtt cgaggccttc gccggcatcg gcgcccagcg gaaggccctg gagaaggtgc 3840
ggaaggacga gtacgagatc gtgggcctgg ccgagtggta cgtgcccgcc atcgtgatgt 3900
accaggccat ccacaacaac ttccacacca agctggagta caagagcgtg agccgggagg 3960
agatgatcga ctacctggag aacaagaccc tgagctggaa cagcaagaac cccgtgagca 4020
acggctactg gaagcggaag aaggacgacg agctgaagat catctacaac gccatcaagc 4080
tgagcgagaa ggagggcaac atcttcgaca tccgggacct gtacaagcgg accctgaaga 4140
acatcgacct gctgacctac agcttcccct gccaggacct gagccagcag ggcatccaga 4200
agggcatgaa gcggggcagc ggcacccgga gcggcctgct gtgggagatc gagcgggccc 4260
tggacagcac cgagaagaac gacctgccca agtacctgct gatggagaac gtgggcgccc 4320
tgctgcacaa gaagaacgag gaggagctga accagtggaa gcagaagctg gagagcctgg 4380
gctaccagaa cagcatcgag gtgctgaacg ccgccgactt cggcagcagc caggcccggc 4440
ggcgggtgtt catgatcagc accctgaacg agttcgtgga gctgcccaag ggcgacaaga 4500
agcccaagag catcaagaag gtgctgaaca agatcgtgag cgagaaggac atcctgaaca 4560
acctgctgaa gtacaacctg accgagttca agaaaaccaa gagcaacatc aacaaggcca 4620
gcctgatcgg ctacagcaag ttcaacagcg agggctacgt gtacgacccc gagttcaccg 4680
gccccaccct gaccgccagc ggcgccaaca gccggatcaa gatcaaggac ggcagcaaca 4740
tccggaagat gaacagcgac gagaccttcc tgtacatcgg cttcgacagc caggacggca 4800
agcgggtgaa cgagatcgag ttcctgaccg agaaccagaa gatcttcgtg tgcggcaaca 4860
gcatcagcgt ggaggtgctg gaggccatca tcgacaagat cggcggcccc agcagcggcg 4920
gcaagcggcc cgccgccacc aagaaggccg gccaggccaa gaagaagaag ggcagctacc 4980
cctacgacgt gcccgactac gcctgagcgg ccgcttaatt aagctgcctt ctgcggggct 5040
tgccttctgg ccatgccctt cttctctccc ttgcacctgt acctcttggt ctttgaataa 5100
agcctgagta ggaagtctag aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ttgtcttctt catcgcctgc 5220
agatcccaat ggcgcgccga gcttggctcg agcatggtca tagctgtttc ctgtgtgaaa 5280
ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 5340
gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 5400
gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 5460
tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 5520
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 5580
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 5640
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 5700
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 5760
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 5820
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 5880
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 5940
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 6000
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 6060
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 6120
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 6180
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 6240
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 6300
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 6360
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 6420
gaaaaactca tcgagcatca aatgaaactg caatttattc atatcaggat tatcaatacc 6480
atatttttga aaaagccgtt tctgtaatga aggagaaaac tcaccgaggc agttccatag 6540
gatggcaaga tcctggtatc ggtctgcgat tccgactcgt ccaacatcaa tacaacctat 6600
taatttcccc tcgtcaaaaa taaggttatc aagtgagaaa tcaccatgag tgacgactga 6660
atccggtgag aatggcaaaa gtttatgcat ttctttccag acttgttcaa caggccagcc 6720
attacgctcg tcatcaaaat cactcgcatc aaccaaaccg ttattcattc gtgattgcgc 6780
ctgagcgaga cgaaatacgc gatcgctgtt aaaaggacaa ttacaaacag gaatcgaatg 6840
caaccggcgc aggaacactg ccagcgcatc aacaatattt tcacctgaat caggatattc 6900
ttctaatacc tggaatgctg ttttcccagg gatcgcagtg gtgagtaacc atgcatcatc 6960
aggagtacgg ataaaatgct tgatggtcgg aagaggcata aattccgtca gccagtttag 7020
tctgaccatc tcatctgtaa catcattggc aacgctacct ttgccatgtt tcagaaacaa 7080
ctctggcgca tcgggcttcc catacaatcg atagattgtc gcacctgatt gcccgacatt 7140
atcgcgagcc catttatacc catataaatc agcatccatg ttggaattta atcgcggcct 7200
agagcaagac gtttcccgtt gaatatggct catactcttc ctttttcaat attattgaag 7260
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 7320
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 7380
tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtc 7433
<210> 202
<211> 4762
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 202
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgc caagcggaac tacatcctgg 120
gcctggccat cggcatcacc agcgtgggct acggcatcat cgactacgag acccgggacg 180
tgatcgacgc cggcgtgcgg ctgttcaagg aggccaacgt ggagaacaac gagggccggc 240
ggagcaagcg gggcgcccgg cggctgaagc ggcggcggcg gcaccggatc cagcgggtga 300
agaagctgct gttcgactac aacctgctga ccgaccacag cgagctgagc ggcatcaacc 360
cctacgaggc ccgggtgaag ggcctgagcc agaagctgag cgaggaggag ttcagcgccg 420
ccctgctgca cctggccaag cggcggggcg tgcacaacgt gaacgaggtg gaggaggaca 480
ccggcaacga gctgagcacc aaggagcaga tcagccggaa cagcaaggcc ctggaggaga 540
agtacgtggc cgagctgcag ctggagcggc tgaagaagga cggcgaggtg cggggcagca 600
tcaaccggtt caagaccagc gactacgtga aggaggccaa gcagctgctg aaggtgcaga 660
aggcctacca ccagctggac cagagcttca tcgacaccta catcgacctg ctggagaccc 720
ggcggaccta ctacgagggc cccggcgagg gcagcccctt cggctggaag gacatcaagg 780
agtggtacga gatgctgatg ggccactgca cctacttccc cgaggagctg cggagcgtga 840
agtacgccta caacgccgac ctgtacaacg ccctgaacga cctgaacaac ctggtgatca 900
cccgggacga gaacgagaag ctggagtact acgagaagtt ccagatcatc gagaacgtgt 960
tcaagcagaa gaagaagccc accctgaagc agatcgccaa ggagatcctg gtgaacgagg 1020
aggacatcaa gggctaccgg gtgaccagca ccggcaagcc cgagttcacc aacctgaagg 1080
tgtaccacga catcaaggac atcaccgccc ggaaggagat catcgagaac gccgagctgc 1140
tggaccagat cgccaagatc ctgaccatct accagagcag cgaggacatc caggaggagc 1200
tgaccaacct gaacagcgag ctgacccagg aggagatcga gcagatcagc aacctgaagg 1260
gctacaccgg cacccacaac ctgagcctga aggccatcaa cctgatcctg gacgagctgt 1320
ggcacaccaa cgacaaccag atcgccatct tcaaccggct gaagctggtg cccaagaagg 1380
tggacctgag ccagcagaag gagatcccca ccaccctggt ggacgacttc atcctgagcc 1440
ccgtggtgaa gcggagcttc atccagagca tcaaggtgat caacgccatc atcaagaagt 1500
acggcctgcc caacgacatc atcatcgagc tggcccggga gaagaacagc aaggacgccc 1560
agaagatgat caacgagatg cagaagcgga accggcagac caacgagcgg atcgaggaga 1620
tcatccggac caccggcaag gagaacgcca agtacctgat cgagaagatc aagctgcacg 1680
acatgcagga gggcaagtgc ctgtacagcc tggaggccat ccccctggag gacctgctga 1740
acaacccctt caactacgag gtggacgcca tcatcccccg gagcgtgagc ttcgacaaca 1800
gcttcaacaa caaggtgctg gtgaagcagg aggagaacag caagaagggc aaccggaccc 1860
ccttccagta cctgagcagc agcgacagca agatcagcta cgagaccttc aagaagcaca 1920
tcctgaacct ggccaagggc aagggccgga tcagcaagac caagaaggag tacctgctgg 1980
aggagcggga catcaaccgg ttcagcgtgc agaaggactt catcaaccgg aacctggtgg 2040
acacccggta cgccacccgg ggcctgatga acctgctgcg gagctacttc cgggtgaaca 2100
acctggacgt gaaggtgaaa tccatcaacg gcggcttcac cagcttcctg cggcggaagt 2160
ggaagttcaa gaaggagcgg aacaagggct acaagcacca cgccgaggac gccctgatca 2220
tcgccaacgc cgacttcatc ttcaaggagt ggaagaagct ggacaaggcc aagaaggtga 2280
tggagaacca gatgttcgag gagaagcagg ccgagagcat gcccgagatc gagaccgagc 2340
aggagtacaa ggagatcttc atcacccccc accagatcaa gcacatcaag gacttcaagg 2400
actacaagta cagccaccgg gtggacaaga agcccaaccg gaagctgatc aacgacaccc 2460
tgtacagcac ccggaaggac gacaagggca acaccctgat cgtgaacaac ctgaacggcc 2520
tgtacgacaa ggacaacgac aagctgaaga agctgatcaa caagagcccc gagaagctgc 2580
tgatgtacca ccacgacccc cagacctacc agaagctgaa gctgatcatg gagcagtacg 2640
gcgacgagaa gaaccccctg tacaagtact acgaggagac cggcaactac ctgaccaagt 2700
acagcaagaa ggacaacggc cccgtgatca agaagatcaa gtactacggc aacaagctga 2760
acgcccacct ggacatcacc gacgactacc ccaacagccg gaacaaggtg gtgaagctga 2820
gcctgaagcc ctaccggttc gacgtgtacc tggacaacgg cgtgtacaag ttcgtgaccg 2880
tgaagaacct ggacgtgatc aagaaggaga actactacga ggtgaacagc aagtgctacg 2940
aggaggccaa gaagctgaag aagatcagca accaggccga gttcatcgcc agcttctaca 3000
agaacgacct gatcaagatc aacggcgagc tgtaccgggt gatcggcgtg aacaacgacc 3060
tgctgaaccg gatcgaggtg aacatgatcg acatcaccta ccgggagtac ctggagaaca 3120
tgaacgacaa gcggcccccc cacatcatca agaccatcgc cagcaagacc cagagcatca 3180
agaagtacag caccgacatc ctgggcaacc tgtacgaggt gaaatccaag aagcaccccc 3240
agatcatcaa gaagggcaag cggcccgccg ccaccaagaa ggccggccag gccaagaaga 3300
agaaggcccg ggacagcaag gtggagaaca agaccaagaa gctgcgggtg ttcgaggcct 3360
tcgccggcat cggcgcccag cggaaggccc tggagaaggt gcggaaggac gagtacgaga 3420
tcgtgggcct ggccgagtgg tacgtgcccg ccatcgtgat gtaccaggcc atccacaaca 3480
acttccacac caagctggag tacaagagcg tgagccggga ggagatgatc gactacctgg 3540
agaacaagac cctgagctgg aacagcaaga accccgtgag caacggctac tggaagcgga 3600
agaaggacga cgagctgaag atcatctaca acgccatcaa gctgagcgag aaggagggca 3660
acatcttcga catccgggac ctgtacaagc ggaccctgaa gaacatcgac ctgctgacct 3720
acagcttccc ctgccaggac ctgagccagc agggcatcca gaagggcatg aagcggggca 3780
gcggcacccg gagcggcctg ctgtgggaga tcgagcgggc cctggacagc accgagaaga 3840
acgacctgcc caagtacctg ctgatggaga acgtgggcgc cctgctgcac aagaagaacg 3900
aggaggagct gaaccagtgg aagcagaagc tggagagcct gggctaccag aacagcatcg 3960
aggtgctgaa cgccgccgac ttcggcagca gccaggcccg gcggcgggtg ttcatgatca 4020
gcaccctgaa cgagttcgtg gagctgccca agggcgacaa gaagcccaag agcatcaaga 4080
aggtgctgaa caagatcgtg agcgagaagg acatcctgaa caacctgctg aagtacaacc 4140
tgaccgagtt caagaaaacc aagagcaaca tcaacaaggc cagcctgatc ggctacagca 4200
agttcaacag cgagggctac gtgtacgacc ccgagttcac cggccccacc ctgaccgcca 4260
gcggcgccaa cagccggatc aagatcaagg acggcagcaa catccggaag atgaacagcg 4320
acgagacctt cctgtacatc ggcttcgaca gccaggacgg caagcgggtg aacgagatcg 4380
agttcctgac cgagaaccag aagatcttcg tgtgcggcaa cagcatcagc gtggaggtgc 4440
tggaggccat catcgacaag atcggcggcc ccagcagcgg cggcaagcgg cccgccgcca 4500
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 4560
acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 4620
ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 4680
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4740
aaaaaaaaaa aaaaaaaaaa aa 4762
<210> 203
<211> 1506
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 203
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser
20 25 30
Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala
35 40 45
Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg
50 55 60
Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg
65 70 75 80
Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp
85 90 95
His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly
100 105 110
Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His
115 120 125
Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp
130 135 140
Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys
145 150 155 160
Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys
165 170 175
Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp
180 185 190
Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His
195 200 205
Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr
210 215 220
Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp
225 230 235 240
Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr
245 250 255
Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu
260 265 270
Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu
275 280 285
Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val
290 295 300
Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile
305 310 315 320
Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly
325 330 335
Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile
340 345 350
Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile
355 360 365
Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu
370 375 380
Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile
385 390 395 400
Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala
405 410 415
Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile
420 425 430
Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser
435 440 445
Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser
450 455 460
Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala
465 470 475 480
Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala
485 490 495
Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln
500 505 510
Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr
515 520 525
Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His
530 535 540
Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu
545 550 555 560
Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile
565 570 575
Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val
580 585 590
Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr
595 600 605
Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His
610 615 620
Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys
625 630 635 640
Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys
645 650 655
Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly
660 665 670
Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val
675 680 685
Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys
690 695 700
Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu
705 710 715 720
Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys
725 730 735
Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu
740 745 750
Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys
755 760 765
Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys
770 775 780
Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu
785 790 795 800
Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr
805 810 815
Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys
820 825 830
Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His
835 840 845
His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr
850 855 860
Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn
865 870 875 880
Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys
885 890 895
Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp
900 905 910
Asp Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro
915 920 925
Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr
930 935 940
Val Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn
945 950 955 960
Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln
965 970 975
Ala Glu Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn
980 985 990
Gly Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg
995 1000 1005
Ile Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu
1010 1015 1020
Asn Met Asn Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala
1025 1030 1035
Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly
1040 1045 1050
Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys
1055 1060 1065
Lys Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1070 1075 1080
Lys Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys
1085 1090 1095
Leu Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys
1100 1105 1110
Ala Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu
1115 1120 1125
Ala Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His
1130 1135 1140
Asn Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu
1145 1150 1155
Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser
1160 1165 1170
Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp
1175 1180 1185
Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu
1190 1195 1200
Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys
1205 1210 1215
Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser
1220 1225 1230
Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg
1235 1240 1245
Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu
1250 1255 1260
Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala
1265 1270 1275
Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
1280 1285 1290
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn
1295 1300 1305
Ala Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met
1310 1315 1320
Ile Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys
1325 1330 1335
Lys Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu
1340 1345 1350
Lys Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe
1355 1360 1365
Lys Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr
1370 1375 1380
Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr
1385 1390 1395
Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile
1400 1405 1410
Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe
1415 1420 1425
Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu
1430 1435 1440
Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn
1445 1450 1455
Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly
1460 1465 1470
Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1475 1480 1485
Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
1490 1495 1500
Asp Tyr Ala
1505
<210> 204
<211> 7499
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 204
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggtac 420
ctaatacgac tcactataag gaaataagag agaaaagaag agtaagaaga aatataagag 480
ccaccatggc ccccaagaag aagcggaagg tgggcatcca cggcgtgccc gccgccgaca 540
agaagtacag catcggcctg gccatcggca ccaacagcgt gggctgggcc gtgatcaccg 600
acgagtacaa ggtgcccagc aagaagttca aggtgctggg caacaccgac cggcacagca 660
tcaagaagaa cctgatcggc gccctgctgt tcgacagcgg cgagaccgcc gaggccaccc 720
ggctgaagcg gaccgcccgg cggcggtaca cccggcggaa gaaccggatc tgctacctgc 780
aggagatctt cagcaacgag atggccaagg tggacgacag cttcttccac cggctggagg 840
agagcttcct ggtggaggag gacaagaagc acgagcggca ccccatcttc ggcaacatcg 900
tggacgaggt ggcctaccac gagaagtacc ccaccatcta ccacctgcgg aagaagctgg 960
tggacagcac cgacaaggcc gacctgcggc tgatctacct ggccctggcc cacatgatca 1020
agttccgggg ccacttcctg atcgagggcg acctgaaccc cgacaacagc gacgtggaca 1080
agctgttcat ccagctggtg cagacctaca accagctgtt cgaggagaac cccatcaacg 1140
ccagcggcgt ggacgccaag gccatcctga gcgcccggct gagcaagagc cggcggctgg 1200
agaacctgat cgcccagctg cccggcgaga agaagaacgg cctgttcggc aacctgatcg 1260
ccctgagcct gggcctgacc cccaacttca agagcaactt cgacctggcc gaggacgcca 1320
agctgcagct gagcaaggac acctacgacg acgacctgga caacctgctg gcccagatcg 1380
gcgaccagta cgccgacctg ttcctggccg ccaagaacct gagcgacgcc atcctgctga 1440
gcgacatcct gcgggtgaac accgagatca ccaaggcccc cctgagcgcc agcatgatca 1500
agcggtacga cgagcaccac caggacctga ccctgctgaa ggccctggtg cggcagcagc 1560
tgcccgagaa gtacaaggag atcttcttcg accagagcaa gaacggctac gccggctaca 1620
tcgacggcgg cgccagccag gaggagttct acaagttcat caagcccatc ctggagaaga 1680
tggacggcac cgaggagctg ctggtgaagc tgaaccggga ggacctgctg cggaagcagc 1740
ggaccttcga caacggcagc atcccccacc agatccacct gggcgagctg cacgccatcc 1800
tgcggcggca ggaggacttc taccccttcc tgaaggacaa ccgggagaag atcgagaaga 1860
tcctgacctt ccggatcccc tactacgtgg gccccctggc ccggggcaac agccggttcg 1920
cctggatgac ccggaaatcc gaggagacca tcaccccctg gaacttcgag gaggtggtgg 1980
acaagggcgc cagcgcccag agcttcatcg agcggatgac caacttcgac aagaacctgc 2040
ccaacgagaa ggtgctgccc aagcacagcc tgctgtacga gtacttcacc gtgtacaacg 2100
agctgaccaa ggtgaagtac gtgaccgagg gcatgcggaa gcccgccttc ctgagcggcg 2160
agcagaagaa ggccatcgtg gacctgctgt tcaagaccaa ccggaaggtg accgtgaagc 2220
agctgaagga ggactacttc aagaagatcg agtgcttcga cagcgtggag atcagcggcg 2280
tggaggaccg gttcaacgcc agcctgggca cctaccacga cctgctgaag atcatcaagg 2340
acaaggactt cctggacaac gaggagaacg aggacatcct ggaggacatc gtgctgaccc 2400
tgaccctgtt cgaggaccgg gagatgatcg aggagcggct gaaaacctac gcccacctgt 2460
tcgacgacaa ggtgatgaag cagctgaagc ggcggcggta caccggctgg ggccggctga 2520
gccggaagct gatcaacggc atccgggaca agcagagcgg caagaccatc ctggacttcc 2580
tgaaatccga cggcttcgcc aaccggaact tcatgcagct gatccacgac gacagcctga 2640
ccttcaagga ggacatccag aaggcccagg tgagcggcca gggcgacagc ctgcacgagc 2700
acatcgccaa cctggccggc agccccgcca tcaagaaggg catcctgcag accgtgaagg 2760
tggtggacga gctggtgaag gtgatgggcc ggcacaagcc cgagaacatc gtgatcgaga 2820
tggcccggga gaaccagacc acccagaagg gccagaagaa cagccgggag cggatgaagc 2880
ggatcgagga gggcatcaag gagctgggca gccagatcct gaaggagcac cccgtggaga 2940
acacccagct gcagaacgag aagctgtacc tgtactacct gcagaacggc cgggacatgt 3000
acgtggacca ggagctggac atcaaccggc tgagcgacta cgacgtggcc gccatcgtgc 3060
cccagagctt cctgaaggac gacagcatcg acaacaaggt gctgacccgg agcgacaagg 3120
cccggggcaa gagcgacaac gtgcccagcg aggaggtggt gaagaagatg aagaactact 3180
ggcggcagct gctgaacgcc aagctgatca cccagcggaa gttcgacaac ctgaccaagg 3240
ccgagcgggg cggcctgagc gagctggaca aggccggctt catcaagcgg cagctggtgg 3300
agacccggca gatcaccaag cacgtggccc agatcctgga cagccggatg aacaccaagt 3360
acgacgagaa cgacaagctg atccgggagg tgaaggtgat caccctgaaa tccaagctgg 3420
tgagcgactt ccggaaggac ttccagttct acaaggtgcg ggagatcaac aactaccacc 3480
acgcccacga cgcctacctg aacgccgtgg tgggcaccgc cctgatcaag aagtacccca 3540
agctggagag cgagttcgtg tacggcgact acaaggtgta cgacgtgcgg aagatgatcg 3600
ccaagagcga gcaggagatc ggcaaggcca ccgccaagta cttcttctac agcaacatca 3660
tgaacttctt caagaccgag atcaccctgg ccaacggcga gatccggaag cggcccctga 3720
tcgagaccaa cggcgagacc ggcgagatcg tgtgggacaa gggccgggac ttcgccaccg 3780
tgcggaaggt gctgagcatg ccccaggtga acatcgtgaa gaaaaccgag gtgcagaccg 3840
gcggcttcag caaggagagc atcctgccca agcggaacag cgacaagctg atcgcccgga 3900
agaaggactg ggaccccaag aagtacggcg gcttcgacag ccccaccgtg gcctacagcg 3960
tgctggtggt ggccaaggtg gagaagggca agagcaagaa gctgaaatcc gtgaaggagc 4020
tgctgggcat caccatcatg gagcggagca gcttcgagaa gaaccccatc gacttcctgg 4080
aggccaaggg ctacaaggag gtgaagaagg acctgatcat caagctgccc aagtacagcc 4140
tgttcgagct ggagaacggc cggaagcgga tgctggccag cgccggcgag ctgcagaagg 4200
gcaacgagct ggccctgccc agcaagtacg tgaacttcct gtacctggcc agccactacg 4260
agaagctgaa gggcagcccc gaggacaacg agcagaagca gctgttcgtg gagcagcaca 4320
agcactacct ggacgagatc atcgagcaga tcagcgagtt cagcaagcgg gtgatcctgg 4380
ccgacgccaa cctggacaag gtgctgagcg cctacaacaa gcaccgggac aagcccatcc 4440
gggagcaggc cgagaacatc atccacctgt tcaccctgac caacctgggc gcccccgccg 4500
ccttcaagta cttcgacacc accatcgacc ggaagcggta caccagcacc aaggaggtgc 4560
tggacgccac cctgatccac cagagcatca ccggcctgta cgagacccgg atcgacctga 4620
gccagctggg cggcgacaag cggcccgccg ccaccaagaa ggccggccag gccaagaaga 4680
agaaggccag cgacgccaag agcctgaccg cctggagccg gaccctggtg accttcaagg 4740
acgtgttcgt ggacttcacc cgggaggagt ggaagctgct ggacaccgcc cagcagatcc 4800
tgtaccggaa cgtgatgctg gagaactaca agaacctggt gagcctgggc taccagctga 4860
ccaagcccga cgtgatcctg cggctggaga agggcgagga gccctggctg gtggagcggg 4920
agatccacca ggagacccac cccgacagcg agaccgcctt cgagatcaag agcagcgtga 4980
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagggca 5040
gctaccccta cgacgtgccc gactacgcct gagcggccgc ttaattaagc tgccttctgc 5100
ggggcttgcc ttctggccat gcccttcttc tctcccttgc acctgtacct cttggtcttt 5160
gaataaagcc tgagtaggaa gtctagaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5220
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaattgt cttcttcatc 5280
gcctgcagat cccaatggcg cgccgagctt ggctcgagca tggtcatagc tgtttcctgt 5340
gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 5400
agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 5460
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 5520
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 5580
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 5640
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 5700
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 5760
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 5820
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 5880
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 5940
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 6000
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 6060
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 6120
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 6180
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 6240
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 6300
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 6360
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 6420
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 6480
cagttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 6540
aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 6600
ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 6660
acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 6720
gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg 6780
ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 6840
ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 6900
cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 6960
atattcttct aatacctgga atgctgtttt cccagggatc gcagtggtga gtaaccatgc 7020
atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca 7080
gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 7140
aaacaactct ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc 7200
gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 7260
cggcctagag caagacgttt cccgttgaat atggctcata ctcttccttt ttcaatatta 7320
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 7380
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 7440
aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtc 7499
<210> 205
<211> 4828
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 205
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
agcggcccgc cgccaccaag aaggccggcc aggccaagaa gaagaaggcc agcgacgcca 4260
agagcctgac cgcctggagc cggaccctgg tgaccttcaa ggacgtgttc gtggacttca 4320
cccgggagga gtggaagctg ctggacaccg cccagcagat cctgtaccgg aacgtgatgc 4380
tggagaacta caagaacctg gtgagcctgg gctaccagct gaccaagccc gacgtgatcc 4440
tgcggctgga gaagggcgag gagccctggc tggtggagcg ggagatccac caggagaccc 4500
accccgacag cgagaccgcc ttcgagatca agagcagcgt gagcggcggc aagcggcccg 4560
ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 4620
ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg ccttctggcc 4680
atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag cctgagtagg 4740
aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4800
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 4828
<210> 206
<211> 1528
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 206
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Ser Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr
1400 1405 1410
Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
1415 1420 1425
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val
1430 1435 1440
Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu
1445 1450 1455
Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro
1460 1465 1470
Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser
1475 1480 1485
Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg
1490 1495 1500
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1505 1510 1515
Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1520 1525
<210> 207
<211> 5705
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 207
aaggaaauaa gagagaaaag aagaguaaga agaaauauaa gagccaccau ggcccccaag 60
aagaagcgga aggugggcau ccacggcgug cccgccgccg acaagaagua cagcaucggc 120
cuggccaucg gcaccaacag cgugggcugg gccgugauca ccgacgagua caaggugccc 180
agcaagaagu ucaaggugcu gggcaacacc gaccggcaca gcaucaagaa gaaccugauc 240
ggcgcccugc uguucgacag cggcgagacc gccgaggcca cccggcugaa gcggaccgcc 300
cggcggcggu acacccggcg gaagaaccgg aucugcuacc ugcaggagau cuucagcaac 360
gagauggcca agguggacga cagcuucuuc caccggcugg aggagagcuu ccugguggag 420
gaggacaaga agcacgagcg gcaccccauc uucggcaaca ucguggacga gguggccuac 480
cacgagaagu accccaccau cuaccaccug cggaagaagc ugguggacag caccgacaag 540
gccgaccugc ggcugaucua ccuggcccug gcccacauga ucaaguuccg gggccacuuc 600
cugaucgagg gcgaccugaa ccccgacaac agcgacgugg acaagcuguu cauccagcug 660
gugcagaccu acaaccagcu guucgaggag aaccccauca acgccagcgg cguggacgcc 720
aaggccaucc ugagcgcccg gcugagcaag agccggcggc uggagaaccu gaucgcccag 780
cugcccggcg agaagaagaa cggccuguuc ggcaaccuga ucgcccugag ccugggccug 840
acccccaacu ucaagagcaa cuucgaccug gccgaggacg ccaagcugca gcugagcaag 900
gacaccuacg acgacgaccu ggacaaccug cuggcccaga ucggcgacca guacgccgac 960
cuguuccugg ccgccaagaa ccugagcgac gccauccugc ugagcgacau ccugcgggug 1020
aacaccgaga ucaccaaggc cccccugagc gccagcauga ucaagcggua cgacgagcac 1080
caccaggacc ugacccugcu gaaggcccug gugcggcagc agcugcccga gaaguacaag 1140
gagaucuucu ucgaccagag caagaacggc uacgccggcu acaucgacgg cggcgccagc 1200
caggaggagu ucuacaaguu caucaagccc auccuggaga agauggacgg caccgaggag 1260
cugcugguga agcugaaccg ggaggaccug cugcggaagc agcggaccuu cgacaacggc 1320
agcauccccc accagaucca ccugggcgag cugcacgcca uccugcggcg gcaggaggac 1380
uucuaccccu uccugaagga caaccgggag aagaucgaga agauccugac cuuccggauc 1440
cccuacuacg ugggcccccu ggcccggggc aacagccggu ucgccuggau gacccggaaa 1500
uccgaggaga ccaucacccc cuggaacuuc gaggaggugg uggacaaggg cgccagcgcc 1560
cagagcuuca ucgagcggau gaccaacuuc gacaagaacc ugcccaacga gaaggugcug 1620
cccaagcaca gccugcugua cgaguacuuc accguguaca acgagcugac caaggugaag 1680
uacgugaccg agggcaugcg gaagcccgcc uuccugagcg gcgagcagaa gaaggccauc 1740
guggaccugc uguucaagac caaccggaag gugaccguga agcagcugaa ggaggacuac 1800
uucaagaaga ucgagugcuu cgacagcgug gagaucagcg gcguggagga ccgguucaac 1860
gccagccugg gcaccuacca cgaccugcug aagaucauca aggacaagga cuuccuggac 1920
aacgaggaga acgaggacau ccuggaggac aucgugcuga cccugacccu guucgaggac 1980
cgggagauga ucgaggagcg gcugaaaacc uacgcccacc uguucgacga caaggugaug 2040
aagcagcuga agcggcggcg guacaccggc uggggccggc ugagccggaa gcugaucaac 2100
ggcauccggg acaagcagag cggcaagacc auccuggacu uccugaaauc cgacggcuuc 2160
gccaaccgga acuucaugca gcugauccac gacgacagcc ugaccuucaa ggaggacauc 2220
cagaaggccc aggugagcgg ccagggcgac agccugcacg agcacaucgc caaccuggcc 2280
ggcagccccg ccaucaagaa gggcauccug cagaccguga agguggugga cgagcuggug 2340
aaggugaugg gccggcacaa gcccgagaac aucgugaucg agauggcccg ggagaaccag 2400
accacccaga agggccagaa gaacagccgg gagcggauga agcggaucga ggagggcauc 2460
aaggagcugg gcagccagau ccugaaggag caccccgugg agaacaccca gcugcagaac 2520
gagaagcugu accuguacua ccugcagaac ggccgggaca uguacgugga ccaggagcug 2580
gacaucaacc ggcugagcga cuacgacgug gccgccaucg ugccccagag cuuccugaag 2640
gacgacagca ucgacaacaa ggugcugacc cggagcgaca aggcccgggg caagagcgac 2700
aacgugccca gcgaggaggu ggugaagaag augaagaacu acuggcggca gcugcugaac 2760
gccaagcuga ucacccagcg gaaguucgac aaccugacca aggccgagcg gggcggccug 2820
agcgagcugg acaaggccgg cuucaucaag cggcagcugg uggagacccg gcagaucacc 2880
aagcacgugg cccagauccu ggacagccgg augaacacca aguacgacga gaacgacaag 2940
cugauccggg aggugaaggu gaucacccug aaauccaagc uggugagcga cuuccggaag 3000
gacuuccagu ucuacaaggu gcgggagauc aacaacuacc accacgccca cgacgccuac 3060
cugaacgccg uggugggcac cgcccugauc aagaaguacc ccaagcugga gagcgaguuc 3120
guguacggcg acuacaaggu guacgacgug cggaagauga ucgccaagag cgagcaggag 3180
aucggcaagg ccaccgccaa guacuucuuc uacagcaaca ucaugaacuu cuucaagacc 3240
gagaucaccc uggccaacgg cgagauccgg aagcggcccc ugaucgagac caacggcgag 3300
accggcgaga ucguguggga caagggccgg gacuucgcca ccgugcggaa ggugcugagc 3360
augccccagg ugaacaucgu gaagaaaacc gaggugcaga ccggcggcuu cagcaaggag 3420
agcauccugc ccaagcggaa cagcgacaag cugaucgccc ggaagaagga cugggacccc 3480
aagaaguacg gcggcuucga cagccccacc guggccuaca gcgugcuggu gguggccaag 3540
guggagaagg gcaagagcaa gaagcugaaa uccgugaagg agcugcuggg caucaccauc 3600
auggagcgga gcagcuucga gaagaacccc aucgacuucc uggaggccaa gggcuacaag 3660
gaggugaaga aggaccugau caucaagcug cccaaguaca gccuguucga gcuggagaac 3720
ggccggaagc ggaugcuggc cagcgccggc gagcugcaga agggcaacga gcuggcccug 3780
cccagcaagu acgugaacuu ccuguaccug gccagccacu acgagaagcu gaagggcagc 3840
cccgaggaca acgagcagaa gcagcuguuc guggagcagc acaagcacua ccuggacgag 3900
aucaucgagc agaucagcga guucagcaag cgggugaucc uggccgacgc caaccuggac 3960
aaggugcuga gcgccuacaa caagcaccgg gacaagccca uccgggagca ggccgagaac 4020
aucauccacc uguucacccu gaccaaccug ggcgcccccg ccgccuucaa guacuucgac 4080
accaccaucg accggaagcg guacaccagc accaaggagg ugcuggacgc cacccugauc 4140
caccagagca ucaccggccu guacgagacc cggaucgacc ugagccagcu gggcggcgac 4200
aagcggcccg ccgccaccaa gaaggccggc caggccaaga agaagaaggc ccgggacagc 4260
aagguggaga acaagaccaa gaagcugcgg guguucgagg ccuucgccgg caucggcgcc 4320
cagcggaagg cccuggagaa ggugcggaag gacgaguacg agaucguggg ccuggccgag 4380
ugguacgugc ccgccaucgu gauguaccag gccauccaca acaacuucca caccaagcug 4440
gaguacaaga gcgugagccg ggaggagaug aucgacuacc uggagaacaa gacccugagc 4500
uggaacagca agaaccccgu gagcaacggc uacuggaagc ggaagaagga cgacgagcug 4560
aagaucaucu acaacgccau caagcugagc gagaaggagg gcaacaucuu cgacauccgg 4620
gaccuguaca agcggacccu gaagaacauc gaccugcuga ccuacagcuu ccccugccag 4680
gaccugagcc agcagggcau ccagaagggc augaagcggg gcagcggcac ccggagcggc 4740
cugcuguggg agaucgagcg ggcccuggac agcaccgaga agaacgaccu gcccaaguac 4800
cugcugaugg agaacguggg cgcccugcug cacaagaaga acgaggagga gcugaaccag 4860
uggaagcaga agcuggagag ccugggcuac cagaacagca ucgaggugcu gaacgccgcc 4920
gacuucggca gcagccaggc ccggcggcgg guguucauga ucagcacccu gaacgaguuc 4980
guggagcugc ccaagggcga caagaagccc aagagcauca agaaggugcu gaacaagauc 5040
gugagcgaga aggacauccu gaacaaccug cugaaguaca accugaccga guucaagaaa 5100
accaagagca acaucaacaa ggccagccug aucggcuaca gcaaguucaa cagcgagggc 5160
uacguguacg accccgaguu caccggcccc acccugaccg ccagcggcgc caacagccgg 5220
aucaagauca aggacggcag caacauccgg aagaugaaca gcgacgagac cuuccuguac 5280
aucggcuucg acagccagga cggcaagcgg gugaacgaga ucgaguuccu gaccgagaac 5340
cagaagaucu ucgugugcgg caacagcauc agcguggagg ugcuggaggc caucaucgac 5400
aagaucggcg gccccagcag cggcggcaag cggcccgccg ccaccaagaa ggccggccag 5460
gccaagaaga agaagggcag cuaccccuac gacgugcccg acuacgccug agcggccgcu 5520
uaauuaagcu gccuucugcg gggcuugccu ucuggccaug cccuucuucu cucccuugca 5580
ccuguaccuc uuggucuuug aauaaagccu gaguaggaag ucuagaaaaa aaaaaaaaaa 5640
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5700
aaaaa 5705
<210> 208
<211> 1820
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 208
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu
1400 1405 1410
Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala
1415 1420 1425
Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala
1430 1435 1440
Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn
1445 1450 1455
Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu
1460 1465 1470
Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys
1475 1480 1485
Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu
1490 1495 1500
Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly
1505 1510 1515
Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn
1520 1525 1530
Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln
1535 1540 1545
Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser
1550 1555 1560
Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys
1565 1570 1575
Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu
1580 1585 1590
Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys
1595 1600 1605
Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
1610 1615 1620
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile
1625 1630 1635
Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys
1640 1645 1650
Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys
1655 1660 1665
Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys
1670 1675 1680
Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser
1685 1690 1695
Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly
1700 1705 1710
Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys
1715 1720 1725
Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu
1730 1735 1740
Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile
1745 1750 1755
Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser
1760 1765 1770
Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly
1775 1780 1785
Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1790 1795 1800
Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp
1805 1810 1815
Tyr Ala
1820
<210> 209
<211> 6775
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 209
aggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gcccccaaga 60
agaagcggaa ggugggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgugug cuggcggaag cgggugaaga gcgaguacau gcggcugcgg cagcugaagc 180
gguuccggcg ggccgacgag gugaagagca uguucagcag caaccggcag aagauccugg 240
agcggaccga gauccugaac caggagugga agcagcggcg aauccagccc gugcacaucc 300
ugaccagcgu gagcagccug cggggcaccc gggagugcag cgugaccagc gaccuggacu 360
uccccaccca ggugaucccc cuaaagaccc ugaacgccgu ggccagcgug cccaucaugu 420
acagcuggag cccccugcag cagaacuuca ugguggagga cgagaccgug cugcacaaca 480
uccccuacau gggcgacgag gugcuggacc aggacggcac cuucaucgag gagcugauca 540
agaacuacga cggcaaggug cacggcgacc gggagugcgg cuucaucaac gacgagaucu 600
ucguggagcu ggugaacgcc cugggccagu acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggaccugga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag uuccccagcg acaagaucuu cgaggccauc agcagcaugu 780
uccccgacaa gggcaccgcc gaggagcuga aggagaagua caaggagcug accgagcagc 840
agcugcccgg cgcccugccc cccgagugca cccccaacau cgacggcccc aacgccaaga 900
gcgugcagcg ggagcagagc cugcacagcu uccacacccu guucugccgg cggugcuuca 960
aguacgacug cuuccugcac cccuuccacg ccacccccaa caccuacaag cggaagaaca 1020
ccgagaccgc ccuggacaac aagcccugcg gcccccagug cuaccagcac cuggagggcg 1080
ccaaggaguu cgccgccgcc cugaccgccg agcggaucaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg cugcccaaca acagcagccg gcccagcacc cccaccauca 1200
acgugcugga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggug ccagaccccc aucaagauga agcccaacau cgagcccccc gagaacgugg 1380
aguggagcgg cgccgaggcc agcauguucc gggugcugau cggcaccuac uacgacaacu 1440
ucugcgccau cgcccggcug aucggcacca agaccugccg gcagguguac gaguuccggg 1500
ugaaggagag cagcaucauc gcccccgccc ccgccgagga cguggacacc cccccccgga 1560
agaagaagcg gaagcaccgg cugugggccg cccacugccg gaagauccag cugaagaagg 1620
acggcagcag caaccacgug uacaacuacc agcccugcga ccacccccgg cagcccugcg 1680
acagcagcug ccccugcgug aucgcccaga acuucugcga gaaguucugc cagugcagca 1740
gcgagugcca gaaccgguuc cccggcugcc ggugcaaggc ccagugcaac accaagcagu 1800
gccccugcua ccuggccgug cgggagugcg accccgaccu gugccugacc ugcggcgccg 1860
ccgaccacug ggacagcaag aacgugagcu gcaagaacug cagcauccag cggggcagca 1920
agaagcaccu gcugcuggcc cccagcgacg uggccggcug gggcaucuuc aucaaggacc 1980
ccgugcagaa gaacgaguuc aucagcgagu acugcggcga gaucaucagc caggacgagg 2040
ccgaccggcg gggcaaggug uacgacaagu acaugugcag cuuccuguuc aaccugaaca 2100
acgacuucgu gguggacgcc acccggaagg gcaacaagau ccgguucgcc aaccacagcg 2160
ugaaccccaa cugcuacgcc aaggugauga uggugaacgg cgaccaccgg aucggcaucu 2220
ucgccaagcg ggccauccag accggcgagg agcuguucuu cgacuaccgg uacagccagg 2280
ccgacgcccu gaaguacgug ggcaucgagc gggagaugga gauccccagc accggcggca 2340
gcggcggcag cggcggcagc ggcggcagcg gcggcagcgg ccgacccgac aagaaguaca 2400
gcaucggccu ggccaucggc accaacagcg ugggcugggc cgugaucacc gacgaguaca 2460
aggugcccag caagaaguuc aaggugcugg gcaacaccga ccggcacagc aucaagaaga 2520
accugaucgg cgcccugcug uucgacagcg gcgagaccgc cgaggccacc cggcugaagc 2580
ggaccgcccg gcggcgguac acccggcgga agaaccggau cugcuaccug caggagaucu 2640
ucagcaacga gauggccaag guggacgaca gcuucuucca ccggcuggag gagagcuucc 2700
ugguggagga ggacaagaag cacgagcggc accccaucuu cggcaacauc guggacgagg 2760
uggccuacca cgagaaguac cccaccaucu accaccugcg gaagaagcug guggacagca 2820
ccgacaaggc cgaccugcgg cugaucuacc uggcccuggc ccacaugauc aaguuccggg 2880
gccacuuccu gaucgagggc gaccugaacc ccgacaacag cgacguggac aagcuguuca 2940
uccagcuggu gcagaccuac aaccagcugu ucgaggagaa ccccaucaac gccagcggcg 3000
uggacgccaa ggccauccug agcgcccggc ugagcaagag ccggcggcug gagaaccuga 3060
ucgcccagcu gcccggcgag aagaagaacg gccuguucgg caaccugauc gcccugagcc 3120
ugggccugac ccccaacuuc aagagcaacu ucgaccuggc cgaggacgcc aagcugcagc 3180
ugagcaagga caccuacgac gacgaccugg acaaccugcu ggcccagauc ggcgaccagu 3240
acgccgaccu guuccuggcc gccaagaacc ugagcgacgc cauccugcug agcgacaucc 3300
ugcgggugaa caccgagauc accaaggccc cccugagcgc cagcaugauc aagcgguacg 3360
acgagcacca ccaggaccug acccugcuga aggcccuggu gcggcagcag cugcccgaga 3420
aguacaagga gaucuucuuc gaccagagca agaacggcua cgccggcuac aucgacggcg 3480
gcgccagcca ggaggaguuc uacaaguuca ucaagcccau ccuggagaag auggacggca 3540
ccgaggagcu gcuggugaag cugaaccggg aggaccugcu gcggaagcag cggaccuucg 3600
acaacggcag caucccccac cagauccacc ugggcgagcu gcacgccauc cugcggcggc 3660
aggaggacuu cuaccccuuc cugaaggaca accgggagaa gaucgagaag auccugaccu 3720
uccggauccc cuacuacgug ggcccccugg cccggggcaa cagccgguuc gccuggauga 3780
cccggaaauc cgaggagacc aucacccccu ggaacuucga ggagguggug gacaagggcg 3840
ccagcgccca gagcuucauc gagcggauga ccaacuucga caagaaccug cccaacgaga 3900
aggugcugcc caagcacagc cugcuguacg aguacuucac cguguacaac gagcugacca 3960
aggugaagua cgugaccgag ggcaugcgga agcccgccuu ccugagcggc gagcagaaga 4020
aggccaucgu ggaccugcug uucaagacca accggaaggu gaccgugaag cagcugaagg 4080
aggacuacuu caagaagauc gagugcuucg acagcgugga gaucagcggc guggaggacc 4140
gguucaacgc cagccugggc accuaccacg accugcugaa gaucaucaag gacaaggacu 4200
uccuggacaa cgaggagaac gaggacaucc uggaggacau cgugcugacc cugacccugu 4260
ucgaggaccg ggagaugauc gaggagcggc ugaaaaccua cgcccaccug uucgacgaca 4320
aggugaugaa gcagcugaag cggcggcggu acaccggcug gggccggcug agccggaagc 4380
ugaucaacgg cauccgggac aagcagagcg gcaagaccau ccuggacuuc cugaaauccg 4440
acggcuucgc caaccggaac uucaugcagc ugauccacga cgacagccug accuucaagg 4500
aggacaucca gaaggcccag gugagcggcc agggcgacag ccugcacgag cacaucgcca 4560
accuggccgg cagccccgcc aucaagaagg gcauccugca gaccgugaag gugguggacg 4620
agcuggugaa ggugaugggc cggcacaagc ccgagaacau cgugaucgag auggcccggg 4680
agaaccagac cacccagaag ggccagaaga acagccggga gcggaugaag cggaucgagg 4740
agggcaucaa ggagcugggc agccagaucc ugaaggagca ccccguggag aacacccagc 4800
ugcagaacga gaagcuguac cuguacuacc ugcagaacgg ccgggacaug uacguggacc 4860
aggagcugga caucaaccgg cugagcgacu acgacguggc cgccaucgug ccccagagcu 4920
uccugaagga cgacagcauc gacaacaagg ugcugacccg gagcgacaag gcccggggca 4980
agagcgacaa cgugcccagc gaggaggugg ugaagaagau gaagaacuac uggcggcagc 5040
ugcugaacgc caagcugauc acccagcgga aguucgacaa ccugaccaag gccgagcggg 5100
gcggccugag cgagcuggac aaggccggcu ucaucaagcg gcagcuggug gagacccggc 5160
agaucaccaa gcacguggcc cagauccugg acagccggau gaacaccaag uacgacgaga 5220
acgacaagcu gauccgggag gugaagguga ucacccugaa auccaagcug gugagcgacu 5280
uccggaagga cuuccaguuc uacaaggugc gggagaucaa caacuaccac cacgcccacg 5340
acgccuaccu gaacgccgug gugggcaccg cccugaucaa gaaguacccc aagcuggaga 5400
gcgaguucgu guacggcgac uacaaggugu acgacgugcg gaagaugauc gccaagagcg 5460
agcaggagau cggcaaggcc accgccaagu acuucuucua cagcaacauc augaacuucu 5520
ucaagaccga gaucacccug gccaacggcg agauccggaa gcggccccug aucgagacca 5580
acggcgagac cggcgagauc gugugggaca agggccggga cuucgccacc gugcggaagg 5640
ugcugagcau gccccaggug aacaucguga agaaaaccga ggugcagacc ggcggcuuca 5700
gcaaggagag cauccugccc aagcggaaca gcgacaagcu gaucgcccgg aagaaggacu 5760
gggaccccaa gaaguacggc ggcuucgaca gccccaccgu ggccuacagc gugcuggugg 5820
uggccaaggu ggagaagggc aagagcaaga agcugaaauc cgugaaggag cugcugggca 5880
ucaccaucau ggagcggagc agcuucgaga agaaccccau cgacuuccug gaggccaagg 5940
gcuacaagga ggugaagaag gaccugauca ucaagcugcc caaguacagc cuguucgagc 6000
uggagaacgg ccggaagcgg augcuggcca gcgccggcga gcugcagaag ggcaacgagc 6060
uggcccugcc cagcaaguac gugaacuucc uguaccuggc cagccacuac gagaagcuga 6120
agggcagccc cgaggacaac gagcagaagc agcuguucgu ggagcagcac aagcacuacc 6180
uggacgagau caucgagcag aucagcgagu ucagcaagcg ggugauccug gccgacgcca 6240
accuggacaa ggugcugagc gccuacaaca agcaccggga caagcccauc cgggagcagg 6300
ccgagaacau cauccaccug uucacccuga ccaaccuggg cgcccccgcc gccuucaagu 6360
acuucgacac caccaucgac cggaagcggu acaccagcac caaggaggug cuggacgcca 6420
cccugaucca ccagagcauc accggccugu acgagacccg gaucgaccug agccagcugg 6480
gcggcgacag cggcggcaag cggcccgccg ccaccaagaa ggccggccag gccaagaaga 6540
agaagggcag cuaccccuac gacgugcccg acuacgccug agcggccgcu uaauuaagcu 6600
gccuucugcg gggcuugccu ucuggccaug cccuucuucu cucccuugca ccuguaccuc 6660
uuggucuuug aauaaagccu gaguaggaag ucuagaaaaa aaaaaaaaaa aaaaaaaaaa 6720
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 6775
<210> 210
<211> 2177
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 210
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys Arg
20 25 30
Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg Arg
35 40 45
Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile Leu
50 55 60
Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile Gln
65 70 75 80
Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg Glu
85 90 95
Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro Leu
100 105 110
Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp Ser
115 120 125
Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His Asn
130 135 140
Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe Ile
145 150 155 160
Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu
165 170 175
Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu
180 185 190
Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu
195 200 205
Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys
210 215 220
Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
225 230 235 240
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys Glu
245 250 255
Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro Pro
260 265 270
Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln Arg
275 280 285
Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys Phe
290 295 300
Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr Tyr
305 310 315 320
Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly Pro
325 330 335
Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala Leu
340 345 350
Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg Arg
355 360 365
Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr Ile
370 375 380
Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr
385 390 395 400
Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp
405 410 415
Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile
420 425 430
Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly
435 440 445
Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn
450 455 460
Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
465 470 475 480
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro Ala
485 490 495
Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg Leu
500 505 510
Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser Ser
515 520 525
Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro Cys
530 535 540
Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys Phe
545 550 555 560
Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg Cys
565 570 575
Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val Arg
580 585 590
Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His Trp
595 600 605
Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly Ser
610 615 620
Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly Ile
625 630 635 640
Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys
645 650 655
Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr
660 665 670
Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val
675 680 685
Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser
690 695 700
Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
705 710 715 720
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu Leu
725 730 735
Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val Gly
740 745 750
Ile Glu Arg Glu Met Glu Ile Pro Ser Thr Gly Gly Ser Gly Gly Ser
755 760 765
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Arg Pro Asp Lys Lys Tyr
770 775 780
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
785 790 795 800
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
805 810 815
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
820 825 830
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
835 840 845
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
850 855 860
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
865 870 875 880
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
885 890 895
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
900 905 910
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
915 920 925
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
930 935 940
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
945 950 955 960
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
965 970 975
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
980 985 990
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
995 1000 1005
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
1010 1015 1020
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
1025 1030 1035
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
1040 1045 1050
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
1055 1060 1065
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
1070 1075 1080
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
1085 1090 1095
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
1100 1105 1110
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
1115 1120 1125
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
1130 1135 1140
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
1145 1150 1155
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
1160 1165 1170
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
1175 1180 1185
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
1190 1195 1200
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
1205 1210 1215
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
1220 1225 1230
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
1235 1240 1245
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
1250 1255 1260
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
1265 1270 1275
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
1280 1285 1290
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
1295 1300 1305
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
1310 1315 1320
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
1325 1330 1335
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
1340 1345 1350
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
1355 1360 1365
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
1370 1375 1380
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
1385 1390 1395
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1400 1405 1410
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
1415 1420 1425
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
1430 1435 1440
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
1445 1450 1455
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
1460 1465 1470
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1475 1480 1485
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1490 1495 1500
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1505 1510 1515
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
1520 1525 1530
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
1535 1540 1545
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
1550 1555 1560
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
1565 1570 1575
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1580 1585 1590
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1595 1600 1605
Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln
1610 1615 1620
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1625 1630 1635
Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1640 1645 1650
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1655 1660 1665
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1670 1675 1680
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1685 1690 1695
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1700 1705 1710
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1715 1720 1725
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1730 1735 1740
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1745 1750 1755
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1760 1765 1770
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1775 1780 1785
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1790 1795 1800
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1805 1810 1815
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1820 1825 1830
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1835 1840 1845
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1850 1855 1860
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1865 1870 1875
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1880 1885 1890
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1895 1900 1905
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1910 1915 1920
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1925 1930 1935
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1940 1945 1950
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1955 1960 1965
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1970 1975 1980
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1985 1990 1995
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
2000 2005 2010
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
2015 2020 2025
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
2030 2035 2040
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
2045 2050 2055
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
2060 2065 2070
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
2075 2080 2085
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
2090 2095 2100
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
2105 2110 2115
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
2120 2125 2130
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser
2135 2140 2145
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
2150 2155 2160
Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
2165 2170 2175
<210> 211
<211> 6202
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 211
aggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gcccccaaga 60
agaagcggaa ggugggcauc cacggcgugc ccgccgccga caagaaguac agcaucggcc 120
uggccaucgg caccaacagc gugggcuggg ccgugaucac cgacgaguac aaggugccca 180
gcaagaaguu caaggugcug ggcaacaccg accggcacag caucaagaag aaccugaucg 240
gcgcccugcu guucgacagc ggcgagaccg ccgaggccac ccggcugaag cggaccgccc 300
ggcggcggua cacccggcgg aagaaccgga ucugcuaccu gcaggagauc uucagcaacg 360
agauggccaa gguggacgac agcuucuucc accggcugga ggagagcuuc cugguggagg 420
aggacaagaa gcacgagcgg caccccaucu ucggcaacau cguggacgag guggccuacc 480
acgagaagua ccccaccauc uaccaccugc ggaagaagcu gguggacagc accgacaagg 540
ccgaccugcg gcugaucuac cuggcccugg cccacaugau caaguuccgg ggccacuucc 600
ugaucgaggg cgaccugaac cccgacaaca gcgacgugga caagcuguuc auccagcugg 660
ugcagaccua caaccagcug uucgaggaga accccaucaa cgccagcggc guggacgcca 720
aggccauccu gagcgcccgg cugagcaaga gccggcggcu ggagaaccug aucgcccagc 780
ugcccggcga gaagaagaac ggccuguucg gcaaccugau cgcccugagc cugggccuga 840
cccccaacuu caagagcaac uucgaccugg ccgaggacgc caagcugcag cugagcaagg 900
acaccuacga cgacgaccug gacaaccugc uggcccagau cggcgaccag uacgccgacc 960
uguuccuggc cgccaagaac cugagcgacg ccauccugcu gagcgacauc cugcggguga 1020
acaccgagau caccaaggcc ccccugagcg ccagcaugau caagcgguac gacgagcacc 1080
accaggaccu gacccugcug aaggcccugg ugcggcagca gcugcccgag aaguacaagg 1140
agaucuucuu cgaccagagc aagaacggcu acgccggcua caucgacggc ggcgccagcc 1200
aggaggaguu cuacaaguuc aucaagccca uccuggagaa gauggacggc accgaggagc 1260
ugcuggugaa gcugaaccgg gaggaccugc ugcggaagca gcggaccuuc gacaacggca 1320
gcauccccca ccagauccac cugggcgagc ugcacgccau ccugcggcgg caggaggacu 1380
ucuaccccuu ccugaaggac aaccgggaga agaucgagaa gauccugacc uuccggaucc 1440
ccuacuacgu gggcccccug gcccggggca acagccgguu cgccuggaug acccggaaau 1500
ccgaggagac caucaccccc uggaacuucg aggagguggu ggacaagggc gccagcgccc 1560
agagcuucau cgagcggaug accaacuucg acaagaaccu gcccaacgag aaggugcugc 1620
ccaagcacag ccugcuguac gaguacuuca ccguguacaa cgagcugacc aaggugaagu 1680
acgugaccga gggcaugcgg aagcccgccu uccugagcgg cgagcagaag aaggccaucg 1740
uggaccugcu guucaagacc aaccggaagg ugaccgugaa gcagcugaag gaggacuacu 1800
ucaagaagau cgagugcuuc gacagcgugg agaucagcgg cguggaggac cgguucaacg 1860
ccagccuggg caccuaccac gaccugcuga agaucaucaa ggacaaggac uuccuggaca 1920
acgaggagaa cgaggacauc cuggaggaca ucgugcugac ccugacccug uucgaggacc 1980
gggagaugau cgaggagcgg cugaaaaccu acgcccaccu guucgacgac aaggugauga 2040
agcagcugaa gcggcggcgg uacaccggcu ggggccggcu gagccggaag cugaucaacg 2100
gcauccggga caagcagagc ggcaagacca uccuggacuu ccugaaaucc gacggcuucg 2160
ccaaccggaa cuucaugcag cugauccacg acgacagccu gaccuucaag gaggacaucc 2220
agaaggccca ggugagcggc cagggcgaca gccugcacga gcacaucgcc aaccuggccg 2280
gcagccccgc caucaagaag ggcauccugc agaccgugaa ggugguggac gagcugguga 2340
aggugauggg ccggcacaag cccgagaaca ucgugaucga gauggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggaugaa gcggaucgag gagggcauca 2460
aggagcuggg cagccagauc cugaaggagc accccgugga gaacacccag cugcagaacg 2520
agaagcugua ccuguacuac cugcagaacg gccgggacau guacguggac caggagcugg 2580
acaucaaccg gcugagcgac uacgacgugg ccgccaucgu gccccagagc uuccugaagg 2640
acgacagcau cgacaacaag gugcugaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgugcccag cgaggaggug gugaagaaga ugaagaacua cuggcggcag cugcugaacg 2760
ccaagcugau cacccagcgg aaguucgaca accugaccaa ggccgagcgg ggcggccuga 2820
gcgagcugga caaggccggc uucaucaagc ggcagcuggu ggagacccgg cagaucacca 2880
agcacguggc ccagauccug gacagccgga ugaacaccaa guacgacgag aacgacaagc 2940
ugauccggga ggugaaggug aucacccuga aauccaagcu ggugagcgac uuccggaagg 3000
acuuccaguu cuacaaggug cgggagauca acaacuacca ccacgcccac gacgccuacc 3060
ugaacgccgu ggugggcacc gcccugauca agaaguaccc caagcuggag agcgaguucg 3120
uguacggcga cuacaaggug uacgacgugc ggaagaugau cgccaagagc gagcaggaga 3180
ucggcaaggc caccgccaag uacuucuucu acagcaacau caugaacuuc uucaagaccg 3240
agaucacccu ggccaacggc gagauccgga agcggccccu gaucgagacc aacggcgaga 3300
ccggcgagau cgugugggac aagggccggg acuucgccac cgugcggaag gugcugagca 3360
ugccccaggu gaacaucgug aagaaaaccg aggugcagac cggcggcuuc agcaaggaga 3420
gcauccugcc caagcggaac agcgacaagc ugaucgcccg gaagaaggac ugggacccca 3480
agaaguacgg cggcuucgac agccccaccg uggccuacag cgugcuggug guggccaagg 3540
uggagaaggg caagagcaag aagcugaaau ccgugaagga gcugcugggc aucaccauca 3600
uggagcggag cagcuucgag aagaacccca ucgacuuccu ggaggccaag ggcuacaagg 3660
aggugaagaa ggaccugauc aucaagcugc ccaaguacag ccuguucgag cuggagaacg 3720
gccggaagcg gaugcuggcc agcgccggcg agcugcagaa gggcaacgag cuggcccugc 3780
ccagcaagua cgugaacuuc cuguaccugg ccagccacua cgagaagcug aagggcagcc 3840
ccgaggacaa cgagcagaag cagcuguucg uggagcagca caagcacuac cuggacgaga 3900
ucaucgagca gaucagcgag uucagcaagc gggugauccu ggccgacgcc aaccuggaca 3960
aggugcugag cgccuacaac aagcaccggg acaagcccau ccgggagcag gccgagaaca 4020
ucauccaccu guucacccug accaaccugg gcgcccccgc cgccuucaag uacuucgaca 4080
ccaccaucga ccggaagcgg uacaccagca ccaaggaggu gcuggacgcc acccugaucc 4140
accagagcau caccggccug uacgagaccc ggaucgaccu gagccagcug ggcggcgaca 4200
gcgccggcgg cggcggcagc ggcggcggcg gcagcggcgg cggcggcagc ggccccaaga 4260
agaagcggaa gguggccgcc gccggcagca accacgacca ggaguucgac ccccccaagg 4320
uguacccccc cgugcccgcc gagaagcgga agcccauccg ggugcugagc cuguucgacg 4380
gcaucgccac cggccugcug gugcugaagg accugggcau ccagguggac cgguacaucg 4440
ccagcgaggu gugcgaggac agcaucaccg ugggcauggu gcggcaccag ggcaagauca 4500
uguacguggg cgacgugcgg agcgugaccc agaagcacau ccaggagugg ggccccuucg 4560
accuggugau cggcggcagc cccugcaacg accugagcau cgugaacccc gcccggaagg 4620
gccuguacga gggcaccggc cggcuguucu ucgaguucua ccggcugcug cacgacgccc 4680
ggcccaagga gggcgacgac cggcccuucu ucuggcuguu cgagaacgug guggccaugg 4740
gcgugagcga caagcgggac aucagccggu uccuggagag caaccccgug augaucgacg 4800
ccaaggaggu gagcgccgcc caccgggccc gguacuucug gggcaaccug cccggcauga 4860
accggccccu ggccagcacc gugaacgaca agcuggagcu gcaggagugc cuggagcacg 4920
gccggaucgc caaguucagc aaggugcgga ccaucaccac ccggagcaac agcaucaagc 4980
agggcaagga ccagcacuuc cccguguuca ugaacgagaa ggaggacauc cuguggugca 5040
ccgagaugga gcggguguuc ggcuuccccg ugcacuacac cgacgugagc aacaugagcc 5100
ggcuggcccg gcagcggcug cugggccgga gcuggagcgu gcccgugauc cggcaccugu 5160
ucgccccccu gaaggaguac uucgccugcg ugagcagcgg caacagcaac gccaacagcc 5220
ggggccccag cuucagcagc ggccuggugc cccugagccu gcggggcagc cacaugaauc 5280
cucuggagau guucgagaca gugcccgugu ggagaaggca acccgugagg gugcugagcc 5340
ucuucgagga cauuaagaag gagcugaccu cucugggcuu ucuggaaucc ggcagcgacc 5400
ccggccagcu gaaacacgug guggacguga ccgacacagu gaggaaggac guggaagagu 5460
ggggccccuu ugaccucgug uauggagcca caccuccucu cggccacaca ugcgauaggc 5520
cucccagcug guaucucuuc caguuccaca gacugcucca guacgccaga ccuaagcccg 5580
gcagccccag acccuucuuc uggauguucg uggacaaucu ggugcugaac aaggaggauc 5640
uggauguggc cagcagauuu cuggagaugg aacccgugac aauccccgac gugcauggcg 5700
gcucucugca gaacgccgug agaguguggu ccaacauccc cgccauuaga agcagacacu 5760
gggcucuggu gagcgaggag gaacugucuc ugcuggccca gaauaagcag uccuccaagc 5820
uggccgccaa guggcccacc aagcugguga agaacugcuu ucugccucug agggaguauu 5880
ucaaguauuu cagcaccgaa cugaccagca gccugagcgg cggcaagcgg cccgccgcca 5940
ccaagaaggc cggccaggcc aagaagaaga agggcagcua ccccuacgac gugcccgacu 6000
acgccugagc ggccgcuuaa uuaagcugcc uucugcgggg cuugccuucu ggccaugccc 6060
uucuucucuc ccuugcaccu guaccucuug gucuuugaau aaagccugag uaggaagucu 6120
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6180
aaaaaaaaaa aaaaaaaaaa aa 6202
<210> 212
<211> 1986
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 212
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro
1415 1420 1425
Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe
1430 1435 1440
Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile
1445 1450 1455
Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile
1460 1465 1470
Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly
1475 1480 1485
Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro
1490 1495 1500
Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile
1505 1510 1515
Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu
1520 1525 1530
Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu
1535 1540 1545
Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala
1550 1555 1560
Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser
1565 1570 1575
Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg
1580 1585 1590
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu
1595 1600 1605
Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu
1610 1615 1620
His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
1625 1630 1635
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val
1640 1645 1650
Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu
1655 1660 1665
Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met
1670 1675 1680
Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val
1685 1690 1695
Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala
1700 1705 1710
Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser
1715 1720 1725
Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met
1730 1735 1740
Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp Arg Arg Gln
1745 1750 1755
Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys Glu Leu
1760 1765 1770
Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln Leu
1775 1780 1785
Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu
1790 1795 1800
Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu
1805 1810 1815
Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe
1820 1825 1830
His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg
1835 1840 1845
Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu
1850 1855 1860
Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr
1865 1870 1875
Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val
1880 1885 1890
Trp Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val
1895 1900 1905
Ser Glu Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser
1910 1915 1920
Lys Leu Ala Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe
1925 1930 1935
Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr
1940 1945 1950
Ser Ser Leu Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1955 1960 1965
Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
1970 1975 1980
Asp Tyr Ala
1985
<210> 213
<211> 5698
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 213
aggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gcccccaaga 60
agaagcggaa ggugggcauc cacggcgugc ccgccgccga caagaaguac agcaucggcc 120
uggccaucgg caccaacagc gugggcuggg ccgugaucac cgacgaguac aaggugccca 180
gcaagaaguu caaggugcug ggcaacaccg accggcacag caucaagaag aaccugaucg 240
gcgcccugcu guucgacagc ggcgagaccg ccgaggccac ccggcugaag cggaccgccc 300
ggcggcggua cacccggcgg aagaaccgga ucugcuaccu gcaggagauc uucagcaacg 360
agauggccaa gguggacgac agcuucuucc accggcugga ggagagcuuc cugguggagg 420
aggacaagaa gcacgagcgg caccccaucu ucggcaacau cguggacgag guggccuacc 480
acgagaagua ccccaccauc uaccaccugc ggaagaagcu gguggacagc accgacaagg 540
ccgaccugcg gcugaucuac cuggcccugg cccacaugau caaguuccgg ggccacuucc 600
ugaucgaggg cgaccugaac cccgacaaca gcgacgugga caagcuguuc auccagcugg 660
ugcagaccua caaccagcug uucgaggaga accccaucaa cgccagcggc guggacgcca 720
aggccauccu gagcgcccgg cugagcaaga gccggcggcu ggagaaccug aucgcccagc 780
ugcccggcga gaagaagaac ggccuguucg gcaaccugau cgcccugagc cugggccuga 840
cccccaacuu caagagcaac uucgaccugg ccgaggacgc caagcugcag cugagcaagg 900
acaccuacga cgacgaccug gacaaccugc uggcccagau cggcgaccag uacgccgacc 960
uguuccuggc cgccaagaac cugagcgacg ccauccugcu gagcgacauc cugcggguga 1020
acaccgagau caccaaggcc ccccugagcg ccagcaugau caagcgguac gacgagcacc 1080
accaggaccu gacccugcug aaggcccugg ugcggcagca gcugcccgag aaguacaagg 1140
agaucuucuu cgaccagagc aagaacggcu acgccggcua caucgacggc ggcgccagcc 1200
aggaggaguu cuacaaguuc aucaagccca uccuggagaa gauggacggc accgaggagc 1260
ugcuggugaa gcugaaccgg gaggaccugc ugcggaagca gcggaccuuc gacaacggca 1320
gcauccccca ccagauccac cugggcgagc ugcacgccau ccugcggcgg caggaggacu 1380
ucuaccccuu ccugaaggac aaccgggaga agaucgagaa gauccugacc uuccggaucc 1440
ccuacuacgu gggcccccug gcccggggca acagccgguu cgccuggaug acccggaaau 1500
ccgaggagac caucaccccc uggaacuucg aggagguggu ggacaagggc gccagcgccc 1560
agagcuucau cgagcggaug accaacuucg acaagaaccu gcccaacgag aaggugcugc 1620
ccaagcacag ccugcuguac gaguacuuca ccguguacaa cgagcugacc aaggugaagu 1680
acgugaccga gggcaugcgg aagcccgccu uccugagcgg cgagcagaag aaggccaucg 1740
uggaccugcu guucaagacc aaccggaagg ugaccgugaa gcagcugaag gaggacuacu 1800
ucaagaagau cgagugcuuc gacagcgugg agaucagcgg cguggaggac cgguucaacg 1860
ccagccuggg caccuaccac gaccugcuga agaucaucaa ggacaaggac uuccuggaca 1920
acgaggagaa cgaggacauc cuggaggaca ucgugcugac ccugacccug uucgaggacc 1980
gggagaugau cgaggagcgg cugaaaaccu acgcccaccu guucgacgac aaggugauga 2040
agcagcugaa gcggcggcgg uacaccggcu ggggccggcu gagccggaag cugaucaacg 2100
gcauccggga caagcagagc ggcaagacca uccuggacuu ccugaaaucc gacggcuucg 2160
ccaaccggaa cuucaugcag cugauccacg acgacagccu gaccuucaag gaggacaucc 2220
agaaggccca ggugagcggc cagggcgaca gccugcacga gcacaucgcc aaccuggccg 2280
gcagccccgc caucaagaag ggcauccugc agaccgugaa ggugguggac gagcugguga 2340
aggugauggg ccggcacaag cccgagaaca ucgugaucga gauggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggaugaa gcggaucgag gagggcauca 2460
aggagcuggg cagccagauc cugaaggagc accccgugga gaacacccag cugcagaacg 2520
agaagcugua ccuguacuac cugcagaacg gccgggacau guacguggac caggagcugg 2580
acaucaaccg gcugagcgac uacgacgugg ccgccaucgu gccccagagc uuccugaagg 2640
acgacagcau cgacaacaag gugcugaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgugcccag cgaggaggug gugaagaaga ugaagaacua cuggcggcag cugcugaacg 2760
ccaagcugau cacccagcgg aaguucgaca accugaccaa ggccgagcgg ggcggccuga 2820
gcgagcugga caaggccggc uucaucaagc ggcagcuggu ggagacccgg cagaucacca 2880
agcacguggc ccagauccug gacagccgga ugaacaccaa guacgacgag aacgacaagc 2940
ugauccggga ggugaaggug aucacccuga aauccaagcu ggugagcgac uuccggaagg 3000
acuuccaguu cuacaaggug cgggagauca acaacuacca ccacgcccac gacgccuacc 3060
ugaacgccgu ggugggcacc gcccugauca agaaguaccc caagcuggag agcgaguucg 3120
uguacggcga cuacaaggug uacgacgugc ggaagaugau cgccaagagc gagcaggaga 3180
ucggcaaggc caccgccaag uacuucuucu acagcaacau caugaacuuc uucaagaccg 3240
agaucacccu ggccaacggc gagauccgga agcggccccu gaucgagacc aacggcgaga 3300
ccggcgagau cgugugggac aagggccggg acuucgccac cgugcggaag gugcugagca 3360
ugccccaggu gaacaucgug aagaaaaccg aggugcagac cggcggcuuc agcaaggaga 3420
gcauccugcc caagcggaac agcgacaagc ugaucgcccg gaagaaggac ugggacccca 3480
agaaguacgg cggcuucgac agccccaccg uggccuacag cgugcuggug guggccaagg 3540
uggagaaggg caagagcaag aagcugaaau ccgugaagga gcugcugggc aucaccauca 3600
uggagcggag cagcuucgag aagaacccca ucgacuuccu ggaggccaag ggcuacaagg 3660
aggugaagaa ggaccugauc aucaagcugc ccaaguacag ccuguucgag cuggagaacg 3720
gccggaagcg gaugcuggcc agcgccggcg agcugcagaa gggcaacgag cuggcccugc 3780
ccagcaagua cgugaacuuc cuguaccugg ccagccacua cgagaagcug aagggcagcc 3840
ccgaggacaa cgagcagaag cagcuguucg uggagcagca caagcacuac cuggacgaga 3900
ucaucgagca gaucagcgag uucagcaagc gggugauccu ggccgacgcc aaccuggaca 3960
aggugcugag cgccuacaac aagcaccggg acaagcccau ccgggagcag gccgagaaca 4020
ucauccaccu guucacccug accaaccugg gcgcccccgc cgccuucaag uacuucgaca 4080
ccaccaucga ccggaagcgg uacaccagca ccaaggaggu gcuggacgcc acccugaucc 4140
accagagcau caccggccug uacgagaccc ggaucgaccu gagccagcug ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagucgg 4260
gcgggggugg cucagaggag cccgaggagc ccgccgauag cggacaaucu cuggugcccg 4320
ucuacaucua cagccccgaa uaugugagca ugugugauuc ccucgccaag aucccuaaga 4380
gagccagcau ggugcauucu cugaucgagg ccuacgcucu gcauaagcaa augaggaucg 4440
ugaagcccaa ggucgccagc auggaagaga uggccaccuu ucacaccgau gccuaccucc 4500
aacaucucca gaaggugucc caagagggcg acgacgacca ccccgacucc auugaguacg 4560
gacugggcua ugauugcccc gccaccgagg gcaucuuuga cuaugccgcc gcuaucggcg 4620
gagcuaccau cacagccgcc cagugucuga uugauggcau gugcaagguc gccaucaacu 4680
gguccggagg cuggcaucau gccaagaagg augaggccuc cggcuucugu uaucugaaug 4740
acgccgugcu gggcauucug agacugagga ggaaauucga gaggauucug uacguggauc 4800
uggaucugca ucacggagau ggagucgaag augccuucag cuucaccagc aaggugauga 4860
cagucucucu gcacaaguuc ucccccggcu ucuuucccgg aaccggcgac guguccgacg 4920
ugggacuggg caagggaagg uacuacagcg ugaacgugcc cauucaagac ggcauccaag 4980
acgagaagua cuaccagauc ugcgaguccg ugcucaagga ggucuaccaa gccuucaauc 5040
cuaaggcugu cgugcuccaa cugggagcug auaccauugc uggcgauccc augugcagcu 5100
ucaauaugac acccgucgga aucggcaagu gccucaagua cauccuccag uggcagcucg 5160
ccacccucau ucucggagga ggcggauaca aucuggcuaa uaccgccaga ugcuggaccu 5220
aucugaccgg cgugauucug ggcaaaacac ugagcagcga aauccccgac cacgaguuuu 5280
ucaccgcuua cggccccgac uacgugcugg agaucacccc cagcugcaga cccgauagaa 5340
acgaacccca uagaauccag caaauucuga acuauaucaa gggcaaccuc aagcacgucg 5400
ugggaggugg cggaucggga aagcggcccg ccgccaccaa gaaggccggu caggccaaga 5460
agaagaaggg cagcuacccc uacgacgugc ccgacuacgc cugagcggcc gcuuaauuaa 5520
gcugccuucu gcggggcuug ccuucuggcc augcccuucu ucucucccuu gcaccuguac 5580
cucuuggucu uugaauaaag ccugaguagg aagucuagaa aaaaaaaaaa aaaaaaaaaa 5640
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 5698
<210> 214
<211> 1818
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 214
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Glu Glu Pro Glu
1400 1405 1410
Glu Pro Ala Asp Ser Gly Gln Ser Leu Val Pro Val Tyr Ile Tyr
1415 1420 1425
Ser Pro Glu Tyr Val Ser Met Cys Asp Ser Leu Ala Lys Ile Pro
1430 1435 1440
Lys Arg Ala Ser Met Val His Ser Leu Ile Glu Ala Tyr Ala Leu
1445 1450 1455
His Lys Gln Met Arg Ile Val Lys Pro Lys Val Ala Ser Met Glu
1460 1465 1470
Glu Met Ala Thr Phe His Thr Asp Ala Tyr Leu Gln His Leu Gln
1475 1480 1485
Lys Val Ser Gln Glu Gly Asp Asp Asp His Pro Asp Ser Ile Glu
1490 1495 1500
Tyr Gly Leu Gly Tyr Asp Cys Pro Ala Thr Glu Gly Ile Phe Asp
1505 1510 1515
Tyr Ala Ala Ala Ile Gly Gly Ala Thr Ile Thr Ala Ala Gln Cys
1520 1525 1530
Leu Ile Asp Gly Met Cys Lys Val Ala Ile Asn Trp Ser Gly Gly
1535 1540 1545
Trp His His Ala Lys Lys Asp Glu Ala Ser Gly Phe Cys Tyr Leu
1550 1555 1560
Asn Asp Ala Val Leu Gly Ile Leu Arg Leu Arg Arg Lys Phe Glu
1565 1570 1575
Arg Ile Leu Tyr Val Asp Leu Asp Leu His His Gly Asp Gly Val
1580 1585 1590
Glu Asp Ala Phe Ser Phe Thr Ser Lys Val Met Thr Val Ser Leu
1595 1600 1605
His Lys Phe Ser Pro Gly Phe Phe Pro Gly Thr Gly Asp Val Ser
1610 1615 1620
Asp Val Gly Leu Gly Lys Gly Arg Tyr Tyr Ser Val Asn Val Pro
1625 1630 1635
Ile Gln Asp Gly Ile Gln Asp Glu Lys Tyr Tyr Gln Ile Cys Glu
1640 1645 1650
Ser Val Leu Lys Glu Val Tyr Gln Ala Phe Asn Pro Lys Ala Val
1655 1660 1665
Val Leu Gln Leu Gly Ala Asp Thr Ile Ala Gly Asp Pro Met Cys
1670 1675 1680
Ser Phe Asn Met Thr Pro Val Gly Ile Gly Lys Cys Leu Lys Tyr
1685 1690 1695
Ile Leu Gln Trp Gln Leu Ala Thr Leu Ile Leu Gly Gly Gly Gly
1700 1705 1710
Tyr Asn Leu Ala Asn Thr Ala Arg Cys Trp Thr Tyr Leu Thr Gly
1715 1720 1725
Val Ile Leu Gly Lys Thr Leu Ser Ser Glu Ile Pro Asp His Glu
1730 1735 1740
Phe Phe Thr Ala Tyr Gly Pro Asp Tyr Val Leu Glu Ile Thr Pro
1745 1750 1755
Ser Cys Arg Pro Asp Arg Asn Glu Pro His Arg Ile Gln Gln Ile
1760 1765 1770
Leu Asn Tyr Ile Lys Gly Asn Leu Lys His Val Val Gly Gly Gly
1775 1780 1785
Gly Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
1790 1795 1800
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1805 1810 1815
<210> 215
<211> 7987
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 215
aggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gcccccaaga 60
agaagcggaa ggugggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgugug cuggcggaag cgggugaaga gcgaguacau gcggcugcgg cagcugaagc 180
gguuccggcg ggccgacgag gugaagagca uguucagcag caaccggcag aagauccugg 240
agcggaccga gauccugaac caggagugga agcagcggcg aauccagccc gugcacaucc 300
ugaccagcgu gagcagccug cggggcaccc gggagugcag cgugaccagc gaccuggacu 360
uccccaccca ggugaucccc cuaaagaccc ugaacgccgu ggccagcgug cccaucaugu 420
acagcuggag cccccugcag cagaacuuca ugguggagga cgagaccgug cugcacaaca 480
uccccuacau gggcgacgag gugcuggacc aggacggcac cuucaucgag gagcugauca 540
agaacuacga cggcaaggug cacggcgacc gggagugcgg cuucaucaac gacgagaucu 600
ucguggagcu ggugaacgcc cugggccagu acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggaccugga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag uuccccagcg acaagaucuu cgaggccauc agcagcaugu 780
uccccgacaa gggcaccgcc gaggagcuga aggagaagua caaggagcug accgagcagc 840
agcugcccgg cgcccugccc cccgagugca cccccaacau cgacggcccc aacgccaaga 900
gcgugcagcg ggagcagagc cugcacagcu uccacacccu guucugccgg cggugcuuca 960
aguacgacug cuuccugcac cccuuccacg ccacccccaa caccuacaag cggaagaaca 1020
ccgagaccgc ccuggacaac aagcccugcg gcccccagug cuaccagcac cuggagggcg 1080
ccaaggaguu cgccgccgcc cugaccgccg agcggaucaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg cugcccaaca acagcagccg gcccagcacc cccaccauca 1200
acgugcugga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggug ccagaccccc aucaagauga agcccaacau cgagcccccc gagaacgugg 1380
aguggagcgg cgccgaggcc agcauguucc gggugcugau cggcaccuac uacgacaacu 1440
ucugcgccau cgcccggcug aucggcacca agaccugccg gcagguguac gaguuccggg 1500
ugaaggagag cagcaucauc gcccccgccc ccgccgagga cguggacacc cccccccgga 1560
agaagaagcg gaagcaccgg cugugggccg cccacugccg gaagauccag cugaagaagg 1620
acggcagcag caaccacgug uacaacuacc agcccugcga ccacccccgg cagcccugcg 1680
acagcagcug ccccugcgug aucgcccaga acuucugcga gaaguucugc cagugcagca 1740
gcgagugcca gaaccgguuc cccggcugcc ggugcaaggc ccagugcaac accaagcagu 1800
gccccugcua ccuggccgug cgggagugcg accccgaccu gugccugacc ugcggcgccg 1860
ccgaccacug ggacagcaag aacgugagcu gcaagaacug cagcauccag cggggcagca 1920
agaagcaccu gcugcuggcc cccagcgacg uggccggcug gggcaucuuc aucaaggacc 1980
ccgugcagaa gaacgaguuc aucagcgagu acugcggcga gaucaucagc caggacgagg 2040
ccgaccggcg gggcaaggug uacgacaagu acaugugcag cuuccuguuc aaccugaaca 2100
acgacuucgu gguggacgcc acccggaagg gcaacaagau ccgguucgcc aaccacagcg 2160
ugaaccccaa cugcuacgcc aaggugauga uggugaacgg cgaccaccgg aucggcaucu 2220
ucgccaagcg ggccauccag accggcgagg agcuguucuu cgacuaccgg uacagccagg 2280
ccgacgcccu gaaguacgug ggcaucgagc gggagaugga gauccccagc accggcggca 2340
gcggcggcag cggcggcagc ggcggcagcg gcggcagcgg ccgacccgac aagaaguaca 2400
gcaucggccu ggccaucggc accaacagcg ugggcugggc cgugaucacc gacgaguaca 2460
aggugcccag caagaaguuc aaggugcugg gcaacaccga ccggcacagc aucaagaaga 2520
accugaucgg cgcccugcug uucgacagcg gcgagaccgc cgaggccacc cggcugaagc 2580
ggaccgcccg gcggcgguac acccggcgga agaaccggau cugcuaccug caggagaucu 2640
ucagcaacga gauggccaag guggacgaca gcuucuucca ccggcuggag gagagcuucc 2700
ugguggagga ggacaagaag cacgagcggc accccaucuu cggcaacauc guggacgagg 2760
uggccuacca cgagaaguac cccaccaucu accaccugcg gaagaagcug guggacagca 2820
ccgacaaggc cgaccugcgg cugaucuacc uggcccuggc ccacaugauc aaguuccggg 2880
gccacuuccu gaucgagggc gaccugaacc ccgacaacag cgacguggac aagcuguuca 2940
uccagcuggu gcagaccuac aaccagcugu ucgaggagaa ccccaucaac gccagcggcg 3000
uggacgccaa ggccauccug agcgcccggc ugagcaagag ccggcggcug gagaaccuga 3060
ucgcccagcu gcccggcgag aagaagaacg gccuguucgg caaccugauc gcccugagcc 3120
ugggccugac ccccaacuuc aagagcaacu ucgaccuggc cgaggacgcc aagcugcagc 3180
ugagcaagga caccuacgac gacgaccugg acaaccugcu ggcccagauc ggcgaccagu 3240
acgccgaccu guuccuggcc gccaagaacc ugagcgacgc cauccugcug agcgacaucc 3300
ugcgggugaa caccgagauc accaaggccc cccugagcgc cagcaugauc aagcgguacg 3360
acgagcacca ccaggaccug acccugcuga aggcccuggu gcggcagcag cugcccgaga 3420
aguacaagga gaucuucuuc gaccagagca agaacggcua cgccggcuac aucgacggcg 3480
gcgccagcca ggaggaguuc uacaaguuca ucaagcccau ccuggagaag auggacggca 3540
ccgaggagcu gcuggugaag cugaaccggg aggaccugcu gcggaagcag cggaccuucg 3600
acaacggcag caucccccac cagauccacc ugggcgagcu gcacgccauc cugcggcggc 3660
aggaggacuu cuaccccuuc cugaaggaca accgggagaa gaucgagaag auccugaccu 3720
uccggauccc cuacuacgug ggcccccugg cccggggcaa cagccgguuc gccuggauga 3780
cccggaaauc cgaggagacc aucacccccu ggaacuucga ggagguggug gacaagggcg 3840
ccagcgccca gagcuucauc gagcggauga ccaacuucga caagaaccug cccaacgaga 3900
aggugcugcc caagcacagc cugcuguacg aguacuucac cguguacaac gagcugacca 3960
aggugaagua cgugaccgag ggcaugcgga agcccgccuu ccugagcggc gagcagaaga 4020
aggccaucgu ggaccugcug uucaagacca accggaaggu gaccgugaag cagcugaagg 4080
aggacuacuu caagaagauc gagugcuucg acagcgugga gaucagcggc guggaggacc 4140
gguucaacgc cagccugggc accuaccacg accugcugaa gaucaucaag gacaaggacu 4200
uccuggacaa cgaggagaac gaggacaucc uggaggacau cgugcugacc cugacccugu 4260
ucgaggaccg ggagaugauc gaggagcggc ugaaaaccua cgcccaccug uucgacgaca 4320
aggugaugaa gcagcugaag cggcggcggu acaccggcug gggccggcug agccggaagc 4380
ugaucaacgg cauccgggac aagcagagcg gcaagaccau ccuggacuuc cugaaauccg 4440
acggcuucgc caaccggaac uucaugcagc ugauccacga cgacagccug accuucaagg 4500
aggacaucca gaaggcccag gugagcggcc agggcgacag ccugcacgag cacaucgcca 4560
accuggccgg cagccccgcc aucaagaagg gcauccugca gaccgugaag gugguggacg 4620
agcuggugaa ggugaugggc cggcacaagc ccgagaacau cgugaucgag auggcccggg 4680
agaaccagac cacccagaag ggccagaaga acagccggga gcggaugaag cggaucgagg 4740
agggcaucaa ggagcugggc agccagaucc ugaaggagca ccccguggag aacacccagc 4800
ugcagaacga gaagcuguac cuguacuacc ugcagaacgg ccgggacaug uacguggacc 4860
aggagcugga caucaaccgg cugagcgacu acgacguggc cgccaucgug ccccagagcu 4920
uccugaagga cgacagcauc gacaacaagg ugcugacccg gagcgacaag gcccggggca 4980
agagcgacaa cgugcccagc gaggaggugg ugaagaagau gaagaacuac uggcggcagc 5040
ugcugaacgc caagcugauc acccagcgga aguucgacaa ccugaccaag gccgagcggg 5100
gcggccugag cgagcuggac aaggccggcu ucaucaagcg gcagcuggug gagacccggc 5160
agaucaccaa gcacguggcc cagauccugg acagccggau gaacaccaag uacgacgaga 5220
acgacaagcu gauccgggag gugaagguga ucacccugaa auccaagcug gugagcgacu 5280
uccggaagga cuuccaguuc uacaaggugc gggagaucaa caacuaccac cacgcccacg 5340
acgccuaccu gaacgccgug gugggcaccg cccugaucaa gaaguacccc aagcuggaga 5400
gcgaguucgu guacggcgac uacaaggugu acgacgugcg gaagaugauc gccaagagcg 5460
agcaggagau cggcaaggcc accgccaagu acuucuucua cagcaacauc augaacuucu 5520
ucaagaccga gaucacccug gccaacggcg agauccggaa gcggccccug aucgagacca 5580
acggcgagac cggcgagauc gugugggaca agggccggga cuucgccacc gugcggaagg 5640
ugcugagcau gccccaggug aacaucguga agaaaaccga ggugcagacc ggcggcuuca 5700
gcaaggagag cauccugccc aagcggaaca gcgacaagcu gaucgcccgg aagaaggacu 5760
gggaccccaa gaaguacggc ggcuucgaca gccccaccgu ggccuacagc gugcuggugg 5820
uggccaaggu ggagaagggc aagagcaaga agcugaaauc cgugaaggag cugcugggca 5880
ucaccaucau ggagcggagc agcuucgaga agaaccccau cgacuuccug gaggccaagg 5940
gcuacaagga ggugaagaag gaccugauca ucaagcugcc caaguacagc cuguucgagc 6000
uggagaacgg ccggaagcgg augcuggcca gcgccggcga gcugcagaag ggcaacgagc 6060
uggcccugcc cagcaaguac gugaacuucc uguaccuggc cagccacuac gagaagcuga 6120
agggcagccc cgaggacaac gagcagaagc agcuguucgu ggagcagcac aagcacuacc 6180
uggacgagau caucgagcag aucagcgagu ucagcaagcg ggugauccug gccgacgcca 6240
accuggacaa ggugcugagc gccuacaaca agcaccggga caagcccauc cgggagcagg 6300
ccgagaacau cauccaccug uucacccuga ccaaccuggg cgcccccgcc gccuucaagu 6360
acuucgacac caccaucgac cggaagcggu acaccagcac caaggaggug cuggacgcca 6420
cccugaucca ccagagcauc accggccugu acgagacccg gaucgaccug agccagcugg 6480
gcggcgacag cggcggcaag cggcccgccg ccaccaagaa ggccggccag gccaagaaga 6540
agaagucggg cggggguggc ucagaggagc ccgaggagcc cgccgauagc ggacaaucuc 6600
uggugcccgu cuacaucuac agccccgaau augugagcau gugugauucc cucgccaaga 6660
ucccuaagag agccagcaug gugcauucuc ugaucgaggc cuacgcucug cauaagcaaa 6720
ugaggaucgu gaagcccaag gucgccagca uggaagagau ggccaccuuu cacaccgaug 6780
ccuaccucca acaucuccag aagguguccc aagagggcga cgacgaccac cccgacucca 6840
uugaguacgg acugggcuau gauugccccg ccaccgaggg caucuuugac uaugccgccg 6900
cuaucggcgg agcuaccauc acagccgccc agugucugau ugauggcaug ugcaaggucg 6960
ccaucaacug guccggaggc uggcaucaug ccaagaagga ugaggccucc ggcuucuguu 7020
aucugaauga cgccgugcug ggcauucuga gacugaggag gaaauucgag aggauucugu 7080
acguggaucu ggaucugcau cacggagaug gagucgaaga ugccuucagc uucaccagca 7140
aggugaugac agucucucug cacaaguucu cccccggcuu cuuucccgga accggcgacg 7200
uguccgacgu gggacugggc aagggaaggu acuacagcgu gaacgugccc auucaagacg 7260
gcauccaaga cgagaaguac uaccagaucu gcgaguccgu gcucaaggag gucuaccaag 7320
ccuucaaucc uaaggcuguc gugcuccaac ugggagcuga uaccauugcu ggcgauccca 7380
ugugcagcuu caauaugaca cccgucggaa ucggcaagug ccucaaguac auccuccagu 7440
ggcagcucgc cacccucauu cucggaggag gcggauacaa ucuggcuaau accgccagau 7500
gcuggaccua ucugaccggc gugauucugg gcaaaacacu gagcagcgaa auccccgacc 7560
acgaguuuuu caccgcuuac ggccccgacu acgugcugga gaucaccccc agcugcagac 7620
ccgauagaaa cgaaccccau agaauccagc aaauucugaa cuauaucaag ggcaaccuca 7680
agcacgucgu gggagguggc ggaucgggaa agcggcccgc cgccaccaag aaggccgguc 7740
aggccaagaa gaagaagggc agcuaccccu acgacgugcc cgacuacgcc ugagcggccg 7800
cuuaauuaag cugccuucug cggggcuugc cuucuggcca ugcccuucuu cucucccuug 7860
caccuguacc ucuuggucuu ugaauaaagc cugaguagga agucuagaaa aaaaaaaaaa 7920
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7980
aaaaaaa 7987
<210> 216
<211> 2581
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 216
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys Arg
20 25 30
Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg Arg
35 40 45
Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile Leu
50 55 60
Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile Gln
65 70 75 80
Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg Glu
85 90 95
Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro Leu
100 105 110
Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp Ser
115 120 125
Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His Asn
130 135 140
Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe Ile
145 150 155 160
Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu
165 170 175
Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu
180 185 190
Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu
195 200 205
Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys
210 215 220
Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
225 230 235 240
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys Glu
245 250 255
Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro Pro
260 265 270
Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln Arg
275 280 285
Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys Phe
290 295 300
Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr Tyr
305 310 315 320
Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly Pro
325 330 335
Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala Leu
340 345 350
Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg Arg
355 360 365
Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr Ile
370 375 380
Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr
385 390 395 400
Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp
405 410 415
Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile
420 425 430
Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly
435 440 445
Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn
450 455 460
Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
465 470 475 480
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro Ala
485 490 495
Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg Leu
500 505 510
Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser Ser
515 520 525
Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro Cys
530 535 540
Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys Phe
545 550 555 560
Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg Cys
565 570 575
Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val Arg
580 585 590
Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His Trp
595 600 605
Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly Ser
610 615 620
Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly Ile
625 630 635 640
Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys
645 650 655
Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr
660 665 670
Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val
675 680 685
Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser
690 695 700
Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
705 710 715 720
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu Leu
725 730 735
Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val Gly
740 745 750
Ile Glu Arg Glu Met Glu Ile Pro Ser Thr Gly Gly Ser Gly Gly Ser
755 760 765
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Arg Pro Asp Lys Lys Tyr
770 775 780
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
785 790 795 800
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
805 810 815
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
820 825 830
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
835 840 845
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
850 855 860
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
865 870 875 880
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
885 890 895
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
900 905 910
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
915 920 925
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
930 935 940
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
945 950 955 960
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
965 970 975
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
980 985 990
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
995 1000 1005
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
1010 1015 1020
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
1025 1030 1035
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
1040 1045 1050
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
1055 1060 1065
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
1070 1075 1080
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
1085 1090 1095
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
1100 1105 1110
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
1115 1120 1125
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
1130 1135 1140
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
1145 1150 1155
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
1160 1165 1170
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
1175 1180 1185
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
1190 1195 1200
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
1205 1210 1215
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
1220 1225 1230
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
1235 1240 1245
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
1250 1255 1260
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
1265 1270 1275
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
1280 1285 1290
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
1295 1300 1305
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
1310 1315 1320
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
1325 1330 1335
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
1340 1345 1350
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
1355 1360 1365
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
1370 1375 1380
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
1385 1390 1395
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1400 1405 1410
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
1415 1420 1425
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
1430 1435 1440
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
1445 1450 1455
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
1460 1465 1470
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1475 1480 1485
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1490 1495 1500
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1505 1510 1515
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
1520 1525 1530
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
1535 1540 1545
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
1550 1555 1560
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
1565 1570 1575
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1580 1585 1590
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1595 1600 1605
Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln
1610 1615 1620
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1625 1630 1635
Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1640 1645 1650
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1655 1660 1665
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1670 1675 1680
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1685 1690 1695
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1700 1705 1710
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1715 1720 1725
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1730 1735 1740
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1745 1750 1755
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1760 1765 1770
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1775 1780 1785
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1790 1795 1800
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1805 1810 1815
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1820 1825 1830
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1835 1840 1845
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1850 1855 1860
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1865 1870 1875
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1880 1885 1890
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1895 1900 1905
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1910 1915 1920
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1925 1930 1935
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1940 1945 1950
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1955 1960 1965
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1970 1975 1980
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1985 1990 1995
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
2000 2005 2010
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
2015 2020 2025
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
2030 2035 2040
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
2045 2050 2055
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
2060 2065 2070
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
2075 2080 2085
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
2090 2095 2100
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
2105 2110 2115
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
2120 2125 2130
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser
2135 2140 2145
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
2150 2155 2160
Lys Lys Lys Ser Gly Gly Gly Gly Ser Glu Glu Pro Glu Glu Pro
2165 2170 2175
Ala Asp Ser Gly Gln Ser Leu Val Pro Val Tyr Ile Tyr Ser Pro
2180 2185 2190
Glu Tyr Val Ser Met Cys Asp Ser Leu Ala Lys Ile Pro Lys Arg
2195 2200 2205
Ala Ser Met Val His Ser Leu Ile Glu Ala Tyr Ala Leu His Lys
2210 2215 2220
Gln Met Arg Ile Val Lys Pro Lys Val Ala Ser Met Glu Glu Met
2225 2230 2235
Ala Thr Phe His Thr Asp Ala Tyr Leu Gln His Leu Gln Lys Val
2240 2245 2250
Ser Gln Glu Gly Asp Asp Asp His Pro Asp Ser Ile Glu Tyr Gly
2255 2260 2265
Leu Gly Tyr Asp Cys Pro Ala Thr Glu Gly Ile Phe Asp Tyr Ala
2270 2275 2280
Ala Ala Ile Gly Gly Ala Thr Ile Thr Ala Ala Gln Cys Leu Ile
2285 2290 2295
Asp Gly Met Cys Lys Val Ala Ile Asn Trp Ser Gly Gly Trp His
2300 2305 2310
His Ala Lys Lys Asp Glu Ala Ser Gly Phe Cys Tyr Leu Asn Asp
2315 2320 2325
Ala Val Leu Gly Ile Leu Arg Leu Arg Arg Lys Phe Glu Arg Ile
2330 2335 2340
Leu Tyr Val Asp Leu Asp Leu His His Gly Asp Gly Val Glu Asp
2345 2350 2355
Ala Phe Ser Phe Thr Ser Lys Val Met Thr Val Ser Leu His Lys
2360 2365 2370
Phe Ser Pro Gly Phe Phe Pro Gly Thr Gly Asp Val Ser Asp Val
2375 2380 2385
Gly Leu Gly Lys Gly Arg Tyr Tyr Ser Val Asn Val Pro Ile Gln
2390 2395 2400
Asp Gly Ile Gln Asp Glu Lys Tyr Tyr Gln Ile Cys Glu Ser Val
2405 2410 2415
Leu Lys Glu Val Tyr Gln Ala Phe Asn Pro Lys Ala Val Val Leu
2420 2425 2430
Gln Leu Gly Ala Asp Thr Ile Ala Gly Asp Pro Met Cys Ser Phe
2435 2440 2445
Asn Met Thr Pro Val Gly Ile Gly Lys Cys Leu Lys Tyr Ile Leu
2450 2455 2460
Gln Trp Gln Leu Ala Thr Leu Ile Leu Gly Gly Gly Gly Tyr Asn
2465 2470 2475
Leu Ala Asn Thr Ala Arg Cys Trp Thr Tyr Leu Thr Gly Val Ile
2480 2485 2490
Leu Gly Lys Thr Leu Ser Ser Glu Ile Pro Asp His Glu Phe Phe
2495 2500 2505
Thr Ala Tyr Gly Pro Asp Tyr Val Leu Glu Ile Thr Pro Ser Cys
2510 2515 2520
Arg Pro Asp Arg Asn Glu Pro His Arg Ile Gln Gln Ile Leu Asn
2525 2530 2535
Tyr Ile Lys Gly Asn Leu Lys His Val Val Gly Gly Gly Gly Ser
2540 2545 2550
Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
2555 2560 2565
Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
2570 2575 2580
<210> 217
<211> 4486
<212> RNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 217
aggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gcccccaaga 60
agaagcggaa ggugggcauc cacggcgugc ccgccgccga caagaaguac agcaucggcc 120
uggacaucgg caccaacagc gugggcuggg ccgugaucac cgacgaguac aaggugccca 180
gcaagaaguu caaggugcug ggcaacaccg accggcacag caucaagaag aaccugaucg 240
gcgcccugcu guucgacagc ggcgagaccg ccgaggccac ccggcugaag cggaccgccc 300
ggcggcggua cacccggcgg aagaaccgga ucugcuaccu gcaggagauc uucagcaacg 360
agauggccaa gguggacgac agcuucuucc accggcugga ggagagcuuc cugguggagg 420
aggacaagaa gcacgagcgg caccccaucu ucggcaacau cguggacgag guggccuacc 480
acgagaagua ccccaccauc uaccaccugc ggaagaagcu gguggacagc accgacaagg 540
ccgaccugcg gcugaucuac cuggcccugg cccacaugau caaguuccgg ggccacuucc 600
ugaucgaggg cgaccugaac cccgacaaca gcgacgugga caagcuguuc auccagcugg 660
ugcagaccua caaccagcug uucgaggaga accccaucaa cgccagcggc guggacgcca 720
aggccauccu gagcgcccgg cugagcaaga gccggcggcu ggagaaccug aucgcccagc 780
ugcccggcga gaagaagaac ggccuguucg gcaaccugau cgcccugagc cugggccuga 840
cccccaacuu caagagcaac uucgaccugg ccgaggacgc caagcugcag cugagcaagg 900
acaccuacga cgacgaccug gacaaccugc uggcccagau cggcgaccag uacgccgacc 960
uguuccuggc cgccaagaac cugagcgacg ccauccugcu gagcgacauc cugcggguga 1020
acaccgagau caccaaggcc ccccugagcg ccagcaugau caagcgguac gacgagcacc 1080
accaggaccu gacccugcug aaggcccugg ugcggcagca gcugcccgag aaguacaagg 1140
agaucuucuu cgaccagagc aagaacggcu acgccggcua caucgacggc ggcgccagcc 1200
aggaggaguu cuacaaguuc aucaagccca uccuggagaa gauggacggc accgaggagc 1260
ugcuggugaa gcugaaccgg gaggaccugc ugcggaagca gcggaccuuc gacaacggca 1320
gcauccccca ccagauccac cugggcgagc ugcacgccau ccugcggcgg caggaggacu 1380
ucuaccccuu ccugaaggac aaccgggaga agaucgagaa gauccugacc uuccggaucc 1440
ccuacuacgu gggcccccug gcccggggca acagccgguu cgccuggaug acccggaaau 1500
ccgaggagac caucaccccc uggaacuucg aggagguggu ggacaagggc gccagcgccc 1560
agagcuucau cgagcggaug accaacuucg acaagaaccu gcccaacgag aaggugcugc 1620
ccaagcacag ccugcuguac gaguacuuca ccguguacaa cgagcugacc aaggugaagu 1680
acgugaccga gggcaugcgg aagcccgccu uccugagcgg cgagcagaag aaggccaucg 1740
uggaccugcu guucaagacc aaccggaagg ugaccgugaa gcagcugaag gaggacuacu 1800
ucaagaagau cgagugcuuc gacagcgugg agaucagcgg cguggaggac cgguucaacg 1860
ccagccuggg caccuaccac gaccugcuga agaucaucaa ggacaaggac uuccuggaca 1920
acgaggagaa cgaggacauc cuggaggaca ucgugcugac ccugacccug uucgaggacc 1980
gggagaugau cgaggagcgg cugaaaaccu acgcccaccu guucgacgac aaggugauga 2040
agcagcugaa gcggcggcgg uacaccggcu ggggccggcu gagccggaag cugaucaacg 2100
gcauccggga caagcagagc ggcaagacca uccuggacuu ccugaaaucc gacggcuucg 2160
ccaaccggaa cuucaugcag cugauccacg acgacagccu gaccuucaag gaggacaucc 2220
agaaggccca ggugagcggc cagggcgaca gccugcacga gcacaucgcc aaccuggccg 2280
gcagccccgc caucaagaag ggcauccugc agaccgugaa ggugguggac gagcugguga 2340
aggugauggg ccggcacaag cccgagaaca ucgugaucga gauggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggaugaa gcggaucgag gagggcauca 2460
aggagcuggg cagccagauc cugaaggagc accccgugga gaacacccag cugcagaacg 2520
agaagcugua ccuguacuac cugcagaacg gccgggacau guacguggac caggagcugg 2580
acaucaaccg gcugagcgac uacgacgugg accacaucgu gccccagagc uuccugaagg 2640
acgacagcau cgacaacaag gugcugaccc ggagcgacaa gaaccggggc aagagcgaca 2700
acgugcccag cgaggaggug gugaagaaga ugaagaacua cuggcggcag cugcugaacg 2760
ccaagcugau cacccagcgg aaguucgaca accugaccaa ggccgagcgg ggcggccuga 2820
gcgagcugga caaggccggc uucaucaagc ggcagcuggu ggagacccgg cagaucacca 2880
agcacguggc ccagauccug gacagccgga ugaacaccaa guacgacgag aacgacaagc 2940
ugauccggga ggugaaggug aucacccuga aauccaagcu ggugagcgac uuccggaagg 3000
acuuccaguu cuacaaggug cgggagauca acaacuacca ccacgcccac gacgccuacc 3060
ugaacgccgu ggugggcacc gcccugauca agaaguaccc caagcuggag agcgaguucg 3120
uguacggcga cuacaaggug uacgacgugc ggaagaugau cgccaagagc gagcaggaga 3180
ucggcaaggc caccgccaag uacuucuucu acagcaacau caugaacuuc uucaagaccg 3240
agaucacccu ggccaacggc gagauccgga agcggccccu gaucgagacc aacggcgaga 3300
ccggcgagau cgugugggac aagggccggg acuucgccac cgugcggaag gugcugagca 3360
ugccccaggu gaacaucgug aagaaaaccg aggugcagac cggcggcuuc agcaaggaga 3420
gcauccugcc caagcggaac agcgacaagc ugaucgcccg gaagaaggac ugggacccca 3480
agaaguacgg cggcuucgac agccccaccg uggccuacag cgugcuggug guggccaagg 3540
uggagaaggg caagagcaag aagcugaaau ccgugaagga gcugcugggc aucaccauca 3600
uggagcggag cagcuucgag aagaacccca ucgacuuccu ggaggccaag ggcuacaagg 3660
aggugaagaa ggaccugauc aucaagcugc ccaaguacag ccuguucgag cuggagaacg 3720
gccggaagcg gaugcuggcc agcgccggcg agcugcagaa gggcaacgag cuggcccugc 3780
ccagcaagua cgugaacuuc cuguaccugg ccagccacua cgagaagcug aagggcagcc 3840
ccgaggacaa cgagcagaag cagcuguucg uggagcagca caagcacuac cuggacgaga 3900
ucaucgagca gaucagcgag uucagcaagc gggugauccu ggccgacgcc aaccuggaca 3960
aggugcugag cgccuacaac aagcaccggg acaagcccau ccgggagcag gccgagaaca 4020
ucauccaccu guucacccug accaaccugg gcgcccccgc cgccuucaag uacuucgaca 4080
ccaccaucga ccggaagcgg uacaccagca ccaaggaggu gcuggacgcc acccugaucc 4140
accagagcau caccggccug uacgagaccc ggaucgaccu gagccagcug ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagggca 4260
gcuaccccua cgacgugccc gacuacgccu gagcggccgc uuaauuaagc ugccuucugc 4320
ggggcuugcc uucuggccau gcccuucuuc ucucccuugc accuguaccu cuuggucuuu 4380
gaauaaagcc ugaguaggaa gucuagaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4440
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 4486
<210> 218
<211> 1414
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 218
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr
1400 1405 1410
Ala
<210> 219
<211> 3262
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 219
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgtgtg ctggcggaag cgggtgaaga gcgagtacat gcggctgcgg cagctgaagc 180
ggttccggcg ggccgacgag gtgaagagca tgttcagcag caaccggcag aagatcctgg 240
agcggaccga gatcctgaac caggagtgga agcagcggcg aatccagccc gtgcacatcc 300
tgaccagcgt gagcagcctg cggggcaccc gggagtgcag cgtgaccagc gacctggact 360
tccccaccca ggtgatcccc ctaaagaccc tgaacgccgt ggccagcgtg cccatcatgt 420
acagctggag ccccctgcag cagaacttca tggtggagga cgagaccgtg ctgcacaaca 480
tcccctacat gggcgacgag gtgctggacc aggacggcac cttcatcgag gagctgatca 540
agaactacga cggcaaggtg cacggcgacc gggagtgcgg cttcatcaac gacgagatct 600
tcgtggagct ggtgaacgcc ctgggccagt acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggacctgga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag ttccccagcg acaagatctt cgaggccatc agcagcatgt 780
tccccgacaa gggcaccgcc gaggagctga aggagaagta caaggagctg accgagcagc 840
agctgcccgg cgccctgccc cccgagtgca cccccaacat cgacggcccc aacgccaaga 900
gcgtgcagcg ggagcagagc ctgcacagct tccacaccct gttctgccgg cggtgcttca 960
agtacgactg cttcctgcac cccttccacg ccacccccaa cacctacaag cggaagaaca 1020
ccgagaccgc cctggacaac aagccctgcg gcccccagtg ctaccagcac ctggagggcg 1080
ccaaggagtt cgccgccgcc ctgaccgccg agcggatcaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg ctgcccaaca acagcagccg gcccagcacc cccaccatca 1200
acgtgctgga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggtg ccagaccccc atcaagatga agcccaacat cgagcccccc gagaacgtgg 1380
agtggagcgg cgccgaggcc agcatgttcc gggtgctgat cggcacctac tacgacaact 1440
tctgcgccat cgcccggctg atcggcacca agacctgccg gcaggtgtac gagttccggg 1500
tgaaggagag cagcatcatc gcccccgccc ccgccgagga cgtggacacc cccccccgga 1560
agaagaagcg gaagcaccgg ctgtgggccg cccactgccg gaagatccag ctgaagaagg 1620
acggcagcag caaccacgtg tacaactacc agccctgcga ccacccccgg cagccctgcg 1680
acagcagctg cccctgcgtg atcgcccaga acttctgcga gaagttctgc cagtgcagca 1740
gcgagtgcca gaaccggttc cccggctgcc ggtgcaaggc ccagtgcaac accaagcagt 1800
gcccctgcta cctggccgtg cgggagtgcg accccgacct gtgcctgacc tgcggcgccg 1860
ccgaccactg ggacagcaag aacgtgagct gcaagaactg cagcatccag cggggcagca 1920
agaagcacct gctgctggcc cccagcgacg tggccggctg gggcatcttc atcaaggacc 1980
ccgtgcagaa gaacgagttc atcagcgagt actgcggcga gatcatcagc caggacgagg 2040
ccgaccggcg gggcaaggtg tacgacaagt acatgtgcag cttcctgttc aacctgaaca 2100
acgacttcgt ggtggacgcc acccggaagg gcaacaagat ccggttcgcc aaccacagcg 2160
tgaaccccaa ctgctacgcc aaggtgatga tggtgaacgg cgaccaccgg atcggcatct 2220
tcgccaagcg ggccatccag accggcgagg agctgttctt cgactaccgg tacagccagg 2280
ccgacgccct gaagtacgtg ggcatcgagc gggagatgga gatccccggc agcagcggat 2340
ccctggagcc cggcgaaaag ccttacaagt gtcccgagtg cggaaagagc ttcagcagag 2400
ccgataatct gaccgagcac caaaggaccc acaccggaga gaagccttat aagtgtcccg 2460
aatgcggcaa aagcttttct agaagcgatc atctgaccaa ccaccagagg acacacaccg 2520
gagaaaaacc ttacaaatgc cccgagtgcg gcaaaagctt ctcccagagc agcaatctgg 2580
tgagacacca aaggacccac accggcgaaa aaccctataa atgccccgaa tgtggcaaga 2640
gctttagcac atccggcgag ctggtgaggc atcaaagaac acataccggc gagaagccct 2700
acaagtgccc cgagtgtgga aaaagcttca gcacccacct cgatctgatc agacaccaga 2760
ggacccatac cggagagaaa ccctacaaat gtcccgagtg cggaaagtcc tttagccagc 2820
tggcccatct gagagctcat caaaggacac acaccggcga gaagccttac aagtgtcccg 2880
agtgcggaaa atccttctcc caactggccc atctgagggc ccaccagaga acccacaccg 2940
gcaaaaagac ctccgctagc ggcagcggcg gcggcagcgg cggcaagcgg cccgccgcca 3000
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 3060
acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 3120
ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 3180
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3240
aaaaaaaaaa aaaaaaaaaa aa 3262
<210> 220
<211> 3262
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 220
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgtgtg ctggcggaag cgggtgaaga gcgagtacat gcggctgcgg cagctgaagc 180
ggttccggcg ggccgacgag gtgaagagca tgttcagcag caaccggcag aagatcctgg 240
agcggaccga gatcctgaac caggagtgga agcagcggcg aatccagccc gtgcacatcc 300
tgaccagcgt gagcagcctg cggggcaccc gggagtgcag cgtgaccagc gacctggact 360
tccccaccca ggtgatcccc ctaaagaccc tgaacgccgt ggccagcgtg cccatcatgt 420
acagctggag ccccctgcag cagaacttca tggtggagga cgagaccgtg ctgcacaaca 480
tcccctacat gggcgacgag gtgctggacc aggacggcac cttcatcgag gagctgatca 540
agaactacga cggcaaggtg cacggcgacc gggagtgcgg cttcatcaac gacgagatct 600
tcgtggagct ggtgaacgcc ctgggccagt acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggacctgga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag ttccccagcg acaagatctt cgaggccatc agcagcatgt 780
tccccgacaa gggcaccgcc gaggagctga aggagaagta caaggagctg accgagcagc 840
agctgcccgg cgccctgccc cccgagtgca cccccaacat cgacggcccc aacgccaaga 900
gcgtgcagcg ggagcagagc ctgcacagct tccacaccct gttctgccgg cggtgcttca 960
agtacgactg cttcctgcac cccttccacg ccacccccaa cacctacaag cggaagaaca 1020
ccgagaccgc cctggacaac aagccctgcg gcccccagtg ctaccagcac ctggagggcg 1080
ccaaggagtt cgccgccgcc ctgaccgccg agcggatcaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg ctgcccaaca acagcagccg gcccagcacc cccaccatca 1200
acgtgctgga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggtg ccagaccccc atcaagatga agcccaacat cgagcccccc gagaacgtgg 1380
agtggagcgg cgccgaggcc agcatgttcc gggtgctgat cggcacctac tacgacaact 1440
tctgcgccat cgcccggctg atcggcacca agacctgccg gcaggtgtac gagttccggg 1500
tgaaggagag cagcatcatc gcccccgccc ccgccgagga cgtggacacc cccccccgga 1560
agaagaagcg gaagcaccgg ctgtgggccg cccactgccg gaagatccag ctgaagaagg 1620
acggcagcag caaccacgtg tacaactacc agccctgcga ccacccccgg cagccctgcg 1680
acagcagctg cccctgcgtg atcgcccaga acttctgcga gaagttctgc cagtgcagca 1740
gcgagtgcca gaaccggttc cccggctgcc ggtgcaaggc ccagtgcaac accaagcagt 1800
gcccctgcta cctggccgtg cgggagtgcg accccgacct gtgcctgacc tgcggcgccg 1860
ccgaccactg ggacagcaag aacgtgagct gcaagaactg cagcatccag cggggcagca 1920
agaagcacct gctgctggcc cccagcgacg tggccggctg gggcatcttc atcaaggacc 1980
ccgtgcagaa gaacgagttc atcagcgagt actgcggcga gatcatcagc caggacgagg 2040
ccgaccggcg gggcaaggtg tacgacaagt acatgtgcag cttcctgttc aacctgaaca 2100
acgacttcgt ggtggacgcc acccggaagg gcaacaagat ccggttcgcc aaccacagcg 2160
tgaaccccaa ctgctacgcc aaggtgatga tggtgaacgg cgaccaccgg atcggcatct 2220
tcgccaagcg ggccatccag accggcgagg agctgttctt cgactaccgg tacagccagg 2280
ccgacgccct gaagtacgtg ggcatcgagc gggagatgga gatccccggc agcagcggat 2340
ccctggagcc cggcgaaaag ccttacaaat gtcccgaatg cggaaagagc ttcagcagag 2400
ccgacaatct gaccgaacat cagagaaccc ataccggaga aaaaccttac aaatgtcccg 2460
agtgcggcaa aagcttctcc caagccggac atctggccag ccaccaaagg acacataccg 2520
gcgagaaacc ctacaagtgc cccgagtgcg gcaagtcctt ctctagatcc gatgagctgg 2580
tcagacatca gagaacccat accggcgaga agccttataa gtgccccgaa tgtggcaagt 2640
ccttcagcca gagagctcat ctggagaggc atcaaagaac acacaccgga gagaaacctt 2700
acaagtgtcc cgagtgtgga aagagcttct ccagaaggga cgagctgaac gtccaccaaa 2760
gaacccatac cggcgaaaag ccctataaat gccccgagtg tggaaaatcc ttttctagat 2820
ccgaccatct gacaacccac cagaggaccc ataccggaga gaagccctac aaatgccccg 2880
agtgtggaaa aagcttctct agaaacgatg ctctgacaga gcaccaaagg acccacaccg 2940
gcaaaaagac cagcgctagc ggcagcggcg gcggcagcgg cggcaagcgg cccgccgcca 3000
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 3060
acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 3120
ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 3180
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3240
aaaaaaaaaa aaaaaaaaaa aa 3262
<210> 221
<211> 2668
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 221
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa gccttacaag tgccccgagt gtggcaaatc ctttagcacc accggaaatc 180
tgaccgtcca ccagagaaca cataccggcg agaaacccta caagtgtccc gagtgcggca 240
aatccttcag ccagctggcc catctgagag cccatcaaag gacccatacc ggcgagaaac 300
cttacaagtg tcccgaatgt ggaaagtcct ttagcagccc cgccgatctg acaagacatc 360
aaagaaccca caccggcgag aagccctata aatgtcccga gtgtggaaag tccttcagcc 420
agagcggcaa tctgaccgag catcaaagaa cccataccgg cgaaaagccc tataagtgcc 480
ccgaatgcgg aaaaagcttc tccacaagcg gcgagctggt gagacaccaa aggacacata 540
ccggcgaaaa gccttataaa tgccccgagt gcggcaagag cttctctaga aaggacaatc 600
tgaagaacca ccaaagaaca cacaccggcg agaagcccta caaatgcccc gagtgcggca 660
agagctttag ccagtccagc aacctcgtga gacatcagag gacacatacc ggaaaaaaga 720
ccagcgctag cggcagcggc ggcggcagcg gcggcaacca cgaccaggag ttcgaccccc 780
ccaaggtgta cccccccgtg cccgccgaga agcggaagcc catccgggtg ctgagcctgt 840
tcgacggcat cgccaccggc ctgctggtgc tgaaggacct gggcatccag gtggaccggt 900
acatcgccag cgaggtgtgc gaggacagca tcaccgtggg catggtgcgg caccagggca 960
agatcatgta cgtgggcgac gtgcggagcg tgacccagaa gcacatccag gagtggggcc 1020
ccttcgacct ggtgatcggc ggcagcccct gcaacgacct gagcatcgtg aaccccgccc 1080
ggaagggcct gtacgagggc accggccggc tgttcttcga gttctaccgg ctgctgcacg 1140
acgcccggcc caaggagggc gacgaccggc ccttcttctg gctgttcgag aacgtggtgg 1200
ccatgggcgt gagcgacaag cgggacatca gccggttcct ggagagcaac cccgtgatga 1260
tcgacgccaa ggaggtgagc gccgcccacc gggcccggta cttctggggc aacctgcccg 1320
gcatgaaccg gcccctggcc agcaccgtga acgacaagct ggagctgcag gagtgcctgg 1380
agcacggccg gatcgccaag ttcagcaagg tgcggaccat caccacccgg agcaacagca 1440
tcaagcaggg caaggaccag cacttccccg tgttcatgaa cgagaaggag gacatcctgt 1500
ggtgcaccga gatggagcgg gtgttcggct tccccgtgca ctacaccgac gtgagcaaca 1560
tgagccggct ggcccggcag cggctgctgg gccggagctg gagcgtgccc gtgatccggc 1620
acctgttcgc ccccctgaag gagtacttcg cctgcgtgag cagcggcaac agcaacgcca 1680
acagccgggg ccccagcttc agcagcggcc tggtgcccct gagcctgcgg ggcagccaca 1740
tgaatcctct ggagatgttc gagacagtgc ccgtgtggag aaggcaaccc gtgagggtgc 1800
tgagcctctt cgaggacatt aagaaggagc tgacctctct gggctttctg gaatccggca 1860
gcgaccccgg ccagctgaaa cacgtggtgg acgtgaccga cacagtgagg aaggacgtgg 1920
aagagtgggg cccctttgac ctcgtgtatg gagccacacc tcctctcggc cacacatgcg 1980
ataggcctcc cagctggtat ctcttccagt tccacagact gctccagtac gccagaccta 2040
agcccggcag ccccagaccc ttcttctgga tgttcgtgga caatctggtg ctgaacaagg 2100
aggatctgga tgtggccagc agatttctgg agatggaacc cgtgacaatc cccgacgtgc 2160
atggcggctc tctgcagaac gccgtgagag tgtggtccaa catccccgcc attagaagca 2220
gacactgggc tctggtgagc gaggaggaac tgtctctgct ggcccagaat aagcagtcct 2280
ccaagctggc cgccaagtgg cccaccaagc tggtgaagaa ctgctttctg cctctgaggg 2340
agtatttcaa gtatttcagc accgaactga ccagcagcct gagcggcggc aagcggcccg 2400
ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 2460
ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg ccttctggcc 2520
atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag cctgagtagg 2580
aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2640
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 2668
<210> 222
<211> 3262
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 222
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgtgtg ctggcggaag cgggtgaaga gcgagtacat gcggctgcgg cagctgaagc 180
ggttccggcg ggccgacgag gtgaagagca tgttcagcag caaccggcag aagatcctgg 240
agcggaccga gatcctgaac caggagtgga agcagcggcg aatccagccc gtgcacatcc 300
tgaccagcgt gagcagcctg cggggcaccc gggagtgcag cgtgaccagc gacctggact 360
tccccaccca ggtgatcccc ctaaagaccc tgaacgccgt ggccagcgtg cccatcatgt 420
acagctggag ccccctgcag cagaacttca tggtggagga cgagaccgtg ctgcacaaca 480
tcccctacat gggcgacgag gtgctggacc aggacggcac cttcatcgag gagctgatca 540
agaactacga cggcaaggtg cacggcgacc gggagtgcgg cttcatcaac gacgagatct 600
tcgtggagct ggtgaacgcc ctgggccagt acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggacctgga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag ttccccagcg acaagatctt cgaggccatc agcagcatgt 780
tccccgacaa gggcaccgcc gaggagctga aggagaagta caaggagctg accgagcagc 840
agctgcccgg cgccctgccc cccgagtgca cccccaacat cgacggcccc aacgccaaga 900
gcgtgcagcg ggagcagagc ctgcacagct tccacaccct gttctgccgg cggtgcttca 960
agtacgactg cttcctgcac cccttccacg ccacccccaa cacctacaag cggaagaaca 1020
ccgagaccgc cctggacaac aagccctgcg gcccccagtg ctaccagcac ctggagggcg 1080
ccaaggagtt cgccgccgcc ctgaccgccg agcggatcaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg ctgcccaaca acagcagccg gcccagcacc cccaccatca 1200
acgtgctgga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggtg ccagaccccc atcaagatga agcccaacat cgagcccccc gagaacgtgg 1380
agtggagcgg cgccgaggcc agcatgttcc gggtgctgat cggcacctac tacgacaact 1440
tctgcgccat cgcccggctg atcggcacca agacctgccg gcaggtgtac gagttccggg 1500
tgaaggagag cagcatcatc gcccccgccc ccgccgagga cgtggacacc cccccccgga 1560
agaagaagcg gaagcaccgg ctgtgggccg cccactgccg gaagatccag ctgaagaagg 1620
acggcagcag caaccacgtg tacaactacc agccctgcga ccacccccgg cagccctgcg 1680
acagcagctg cccctgcgtg atcgcccaga acttctgcga gaagttctgc cagtgcagca 1740
gcgagtgcca gaaccggttc cccggctgcc ggtgcaaggc ccagtgcaac accaagcagt 1800
gcccctgcta cctggccgtg cgggagtgcg accccgacct gtgcctgacc tgcggcgccg 1860
ccgaccactg ggacagcaag aacgtgagct gcaagaactg cagcatccag cggggcagca 1920
agaagcacct gctgctggcc cccagcgacg tggccggctg gggcatcttc atcaaggacc 1980
ccgtgcagaa gaacgagttc atcagcgagt actgcggcga gatcatcagc caggacgagg 2040
ccgaccggcg gggcaaggtg tacgacaagt acatgtgcag cttcctgttc aacctgaaca 2100
acgacttcgt ggtggacgcc acccggaagg gcaacaagat ccggttcgcc aaccacagcg 2160
tgaaccccaa ctgctacgcc aaggtgatga tggtgaacgg cgaccaccgg atcggcatct 2220
tcgccaagcg ggccatccag accggcgagg agctgttctt cgactaccgg tacagccagg 2280
ccgacgccct gaagtacgtg ggcatcgagc gggagatgga gatccccggc agcagcggat 2340
ccctggagcc cggcgaaaag ccttacaagt gccccgagtg tggcaaatcc tttagcacca 2400
ccggaaatct gaccgtccac cagagaacac ataccggcga gaaaccctac aagtgtcccg 2460
agtgcggcaa atccttcagc cagctggccc atctgagagc ccatcaaagg acccataccg 2520
gcgagaaacc ttacaagtgt cccgaatgtg gaaagtcctt tagcagcccc gccgatctga 2580
caagacatca aagaacccac accggcgaga agccctataa atgtcccgag tgtggaaagt 2640
ccttcagcca gagcggcaat ctgaccgagc atcaaagaac ccataccggc gaaaagccct 2700
ataagtgccc cgaatgcgga aaaagcttct ccacaagcgg cgagctggtg agacaccaaa 2760
ggacacatac cggcgaaaag ccttataaat gccccgagtg cggcaagagc ttctctagaa 2820
aggacaatct gaagaaccac caaagaacac acaccggcga gaagccctac aaatgccccg 2880
agtgcggcaa gagctttagc cagtccagca acctcgtgag acatcagagg acacataccg 2940
gaaaaaagac cagcgctagc ggcagcggcg gcggcagcgg cggcaagcgg cccgccgcca 3000
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 3060
acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 3120
ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 3180
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3240
aaaaaaaaaa aaaaaaaaaa aa 3262
<210> 223
<211> 3262
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 223
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgtgtg ctggcggaag cgggtgaaga gcgagtacat gcggctgcgg cagctgaagc 180
ggttccggcg ggccgacgag gtgaagagca tgttcagcag caaccggcag aagatcctgg 240
agcggaccga gatcctgaac caggagtgga agcagcggcg aatccagccc gtgcacatcc 300
tgaccagcgt gagcagcctg cggggcaccc gggagtgcag cgtgaccagc gacctggact 360
tccccaccca ggtgatcccc ctaaagaccc tgaacgccgt ggccagcgtg cccatcatgt 420
acagctggag ccccctgcag cagaacttca tggtggagga cgagaccgtg ctgcacaaca 480
tcccctacat gggcgacgag gtgctggacc aggacggcac cttcatcgag gagctgatca 540
agaactacga cggcaaggtg cacggcgacc gggagtgcgg cttcatcaac gacgagatct 600
tcgtggagct ggtgaacgcc ctgggccagt acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggacctgga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag ttccccagcg acaagatctt cgaggccatc agcagcatgt 780
tccccgacaa gggcaccgcc gaggagctga aggagaagta caaggagctg accgagcagc 840
agctgcccgg cgccctgccc cccgagtgca cccccaacat cgacggcccc aacgccaaga 900
gcgtgcagcg ggagcagagc ctgcacagct tccacaccct gttctgccgg cggtgcttca 960
agtacgactg cttcctgcac cccttccacg ccacccccaa cacctacaag cggaagaaca 1020
ccgagaccgc cctggacaac aagccctgcg gcccccagtg ctaccagcac ctggagggcg 1080
ccaaggagtt cgccgccgcc ctgaccgccg agcggatcaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg ctgcccaaca acagcagccg gcccagcacc cccaccatca 1200
acgtgctgga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggtg ccagaccccc atcaagatga agcccaacat cgagcccccc gagaacgtgg 1380
agtggagcgg cgccgaggcc agcatgttcc gggtgctgat cggcacctac tacgacaact 1440
tctgcgccat cgcccggctg atcggcacca agacctgccg gcaggtgtac gagttccggg 1500
tgaaggagag cagcatcatc gcccccgccc ccgccgagga cgtggacacc cccccccgga 1560
agaagaagcg gaagcaccgg ctgtgggccg cccactgccg gaagatccag ctgaagaagg 1620
acggcagcag caaccacgtg tacaactacc agccctgcga ccacccccgg cagccctgcg 1680
acagcagctg cccctgcgtg atcgcccaga acttctgcga gaagttctgc cagtgcagca 1740
gcgagtgcca gaaccggttc cccggctgcc ggtgcaaggc ccagtgcaac accaagcagt 1800
gcccctgcta cctggccgtg cgggagtgcg accccgacct gtgcctgacc tgcggcgccg 1860
ccgaccactg ggacagcaag aacgtgagct gcaagaactg cagcatccag cggggcagca 1920
agaagcacct gctgctggcc cccagcgacg tggccggctg gggcatcttc atcaaggacc 1980
ccgtgcagaa gaacgagttc atcagcgagt actgcggcga gatcatcagc caggacgagg 2040
ccgaccggcg gggcaaggtg tacgacaagt acatgtgcag cttcctgttc aacctgaaca 2100
acgacttcgt ggtggacgcc acccggaagg gcaacaagat ccggttcgcc aaccacagcg 2160
tgaaccccaa ctgctacgcc aaggtgatga tggtgaacgg cgaccaccgg atcggcatct 2220
tcgccaagcg ggccatccag accggcgagg agctgttctt cgactaccgg tacagccagg 2280
ccgacgccct gaagtacgtg ggcatcgagc gggagatgga gatccccggc agcagcggat 2340
ccctggagcc cggcgaaaaa ccctataagt gccccgagtg cggcaagagc tttagcgatc 2400
ccggccatct ggtgaggcat cagaggaccc acaccggcga aaagccttac aaatgccccg 2460
agtgtggaaa aagcttcagc agaagcgatc atctgaccac ccatcagagg acacataccg 2520
gcgagaagcc ttataaatgc cccgaatgtg gaaagagctt ctccagaagc gaccatctga 2580
ccaaccacca gaggacccat accggagaaa aaccttacaa atgccccgag tgtggaaagt 2640
ccttcagctc ccccgccgat ctgacaagac atcagagaac ccacaccggc gaaaaacctt 2700
ataaatgtcc cgagtgtggc aaaagcttct ccgacaagaa ggatctgaca agacaccaaa 2760
ggacccacac cggcgagaaa ccttataaat gtcccgaatg cggaaaaagc tttagcagaa 2820
acgacgctct gaccgaacac cagagaacac ataccggaga gaaaccctat aaatgtcccg 2880
agtgcggaaa atccttcagc accaccggcg ctctgacaga gcatcagagg acacacaccg 2940
gcaaaaagac ctccgctagc ggcagcggcg gcggcagcgg cggcaagcgg cccgccgcca 3000
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 3060
acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 3120
ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 3180
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3240
aaaaaaaaaa aaaaaaaaaa aa 3262
<210> 224
<211> 1897
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 224
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaggaa 120
atagggctat cagaaccgag aagatcatct gtagggacgt ggctagaggc tacgagaacg 180
tgcccattcc ttgcgtgaat ggcgtggatg gcgaaccttg ccccgaggac tacaaataca 240
tctccgagaa ctgcgaaacc agcacaatga acatcgacag aaacatcacc cacctccagc 300
actgcacatg tgtggatgac tgctcctcca gcaactgtct gtgcggccag ctctccatca 360
gatgctggta cgacaaggac ggcagactgc tgcaagagtt caacaagatc gaaccccctc 420
tcatcttcga gtgtaaccaa gcttgcagct gctggagaaa ctgcaagaat agagtggtcc 480
agagcggcat caaggtgaga ctgcaactgt acagaaccgc caagatggga tggggagtga 540
gggctctgca aaccattccc caaggcacct tcatctgcga atacgtgggc gaactgatct 600
ccgacgccga agctgacgtg agagaggacg acagctatct cttcgatctg gacaataagg 660
acggcgaggt gtactgcatc gacgctagat attacggcaa catctctaga ttcatcaacc 720
acctctgcga tcccaacatc attcccgtga gggtgttcat gctgcaccaa gatctgaggt 780
tccctagaat cgccttcttc agctctagag acatcagaac cggcgaggag ctgggcttcg 840
attacggcga tagattctgg gacatcaagt ccaagtactt cacatgccag tgcggcagcg 900
agaagtgtaa gcacagcgct gaggccattg ctctggagca gtctagactg gccagactgg 960
atggcagcag cggatccctg gagcccggag aaaagcctta caaatgcccc gagtgcggca 1020
agtccttcag ccagctggct catctgagag ctcatcaaag gacccacacc ggcgagaagc 1080
cctataagtg ccccgagtgc ggaaaatcct tctcccagag cagcaatctc gtcagacacc 1140
agaggaccca caccggcgag aaaccttaca agtgtcccga atgtggaaag tccttctccc 1200
aaaagagctc tctgatcgcc catcagagaa cacataccgg cgaaaaaccc tacaagtgcc 1260
ccgagtgtgg caaaagcttt tccaccaccg gcaatctgac cgtgcatcaa agaacccaca 1320
ccggcgaaaa accctacaaa tgccccgagt gtggcaaatc cttctccgac cccggccatc 1380
tggtgaggca ccagaggaca cacaccggcg agaaacctta taaatgtccc gaatgcggca 1440
agtcctttag caccagcggc tctctggtga gacatcagag gacacatacc ggcgaaaagc 1500
cttacaagtg tcccgagtgt ggcaaaagct tcagccagaa cagcacactg acagagcatc 1560
agagaaccca taccggcaaa aagaccagcg ctagcggcag cggcggcggc agcggcggca 1620
agcggcccgc cgccaccaag aaggccggcc aggccaagaa gaagaagggc agctacccct 1680
acgacgtgcc cgactacgcc tgagcggccg cttaattaag ctgccttctg cggggcttgc 1740
cttctggcca tgcccttctt ctctcccttg cacctgtacc tcttggtctt tgaataaagc 1800
ctgagtagga agtctagaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 1897
<210> 225
<211> 1897
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 225
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaggaa 120
atagggctat cagaaccgag aagatcatct gtagggacgt ggctagaggc tacgagaacg 180
tgcccattcc ttgcgtgaat ggcgtggatg gcgaaccttg ccccgaggac tacaaataca 240
tctccgagaa ctgcgaaacc agcacaatga acatcgacag aaacatcacc cacctccagc 300
actgcacatg tgtggatgac tgctcctcca gcaactgtct gtgcggccag ctctccatca 360
gatgctggta cgacaaggac ggcagactgc tgcaagagtt caacaagatc gaaccccctc 420
tcatcttcga gtgtaaccaa gcttgcagct gctggagaaa ctgcaagaat agagtggtcc 480
agagcggcat caaggtgaga ctgcaactgt acagaaccgc caagatggga tggggagtga 540
gggctctgca aaccattccc caaggcacct tcatctgcga atacgtgggc gaactgatct 600
ccgacgccga agctgacgtg agagaggacg acagctatct cttcgatctg gacaataagg 660
acggcgaggt gtactgcatc gacgctagat attacggcaa catctctaga ttcatcaacc 720
acctctgcga tcccaacatc attcccgtga gggtgttcat gctgcaccaa gatctgaggt 780
tccctagaat cgccttcttc agctctagag acatcagaac cggcgaggag ctgggcttcg 840
attacggcga tagattctgg gacatcaagt ccaagtactt cacatgccag tgcggcagcg 900
agaagtgtaa gcacagcgct gaggccattg ctctggagca gtctagactg gccagactgg 960
atggcagcag cggatccctg gagcccggcg aaaagcctta caagtgcccc gagtgtggca 1020
aatcctttag caccaccgga aatctgaccg tccaccagag aacacatacc ggcgagaaac 1080
cctacaagtg tcccgagtgc ggcaaatcct tcagccagct ggcccatctg agagcccatc 1140
aaaggaccca taccggcgag aaaccttaca agtgtcccga atgtggaaag tcctttagca 1200
gccccgccga tctgacaaga catcaaagaa cccacaccgg cgagaagccc tataaatgtc 1260
ccgagtgtgg aaagtccttc agccagagcg gcaatctgac cgagcatcaa agaacccata 1320
ccggcgaaaa gccctataag tgccccgaat gcggaaaaag cttctccaca agcggcgagc 1380
tggtgagaca ccaaaggaca cataccggcg aaaagcctta taaatgcccc gagtgcggca 1440
agagcttctc tagaaaggac aatctgaaga accaccaaag aacacacacc ggcgagaagc 1500
cctacaaatg ccccgagtgc ggcaagagct ttagccagtc cagcaacctc gtgagacatc 1560
agaggacaca taccggaaaa aagaccagcg ctagcggcag cggcggcggc agcggcggca 1620
agcggcccgc cgccaccaag aaggccggcc aggccaagaa gaagaagggc agctacccct 1680
acgacgtgcc cgactacgcc tgagcggccg cttaattaag ctgccttctg cggggcttgc 1740
cttctggcca tgcccttctt ctctcccttg cacctgtacc tcttggtctt tgaataaagc 1800
ctgagtagga agtctagaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 1897
<210> 226
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 226
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggagaaaa gccttacaaa tgccccgagt gcggcaagtc cttcagccag ctggctcatc 180
tgagagctca tcaaaggacc cacaccggcg agaagcccta taagtgcccc gagtgcggaa 240
aatccttctc ccagagcagc aatctcgtca gacaccagag gacccacacc ggcgagaaac 300
cttacaagtg tcccgaatgt ggaaagtcct tctcccaaaa gagctctctg atcgcccatc 360
agagaacaca taccggcgaa aaaccctaca agtgccccga gtgtggcaaa agcttttcca 420
ccaccggcaa tctgaccgtg catcaaagaa cccacaccgg cgaaaaaccc tacaaatgcc 480
ccgagtgtgg caaatccttc tccgaccccg gccatctggt gaggcaccag aggacacaca 540
ccggcgagaa accttataaa tgtcccgaat gcggcaagtc ctttagcacc agcggctctc 600
tggtgagaca tcagaggaca cataccggcg aaaagcctta caagtgtccc gagtgtggca 660
aaagcttcag ccagaacagc acactgacag agcatcagag aacccatacc ggcaaaaaga 720
ccagcgctag cggcagcggc ggcggcagcg gcggcgagga gcccgaggag cccgccgata 780
gcggacaatc tctggtgccc gtctacatct acagccccga atatgtgagc atgtgtgatt 840
ccctcgccaa gatccctaag agagccagca tggtgcattc tctgatcgag gcctacgctc 900
tgcataagca aatgaggatc gtgaagccca aggtcgccag catggaagag atggccacct 960
ttcacaccga tgcctacctc caacatctcc agaaggtgtc ccaagagggc gacgacgacc 1020
accccgactc cattgagtac ggactgggct atgattgccc cgccaccgag ggcatctttg 1080
actatgccgc cgctatcggc ggagctacca tcacagccgc ccagtgtctg attgatggca 1140
tgtgcaaggt cgccatcaac tggtccggag gctggcatca tgccaagaag gatgaggcct 1200
ccggcttctg ttatctgaat gacgccgtgc tgggcattct gagactgagg aggaaattcg 1260
agaggattct gtacgtggat ctggatctgc atcacggaga tggagtcgaa gatgccttca 1320
gcttcaccag caaggtgatg acagtctctc tgcacaagtt ctcccccggc ttctttcccg 1380
gaaccggcga cgtgtccgac gtgggactgg gcaagggaag gtactacagc gtgaacgtgc 1440
ccattcaaga cggcatccaa gacgagaagt actaccagat ctgcgagtcc gtgctcaagg 1500
aggtctacca agccttcaat cctaaggctg tcgtgctcca actgggagct gataccattg 1560
ctggcgatcc catgtgcagc ttcaatatga cacccgtcgg aatcggcaag tgcctcaagt 1620
acatcctcca gtggcagctc gccaccctca ttctcggagg aggcggatac aatctggcta 1680
ataccgccag atgctggacc tatctgaccg gcgtgattct gggcaaaaca ctgagcagcg 1740
aaatccccga ccacgagttt ttcaccgctt acggccccga ctacgtgctg gagatcaccc 1800
ccagctgcag acccgataga aacgaacccc atagaatcca gcaaattctg aactatatca 1860
agggcaacct caagcacgtc gtgggaggtg gcggatcggg aaagcggccc gccgccacca 1920
agaaggccgg tcaggccaag aagaagaagg gcagctaccc ctacgacgtg cccgactacg 1980
cctgagcggc cgcttaatta agctgccttc tgcggggctt gccttctggc catgcccttc 2040
ttctctccct tgcacctgta cctcttggtc tttgaataaa gcctgagtag gaagtctaga 2100
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaa 2179
<210> 227
<211> 1897
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 227
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaggaa 120
atagggctat cagaaccgag aagatcatct gtagggacgt ggctagaggc tacgagaacg 180
tgcccattcc ttgcgtgaat ggcgtggatg gcgaaccttg ccccgaggac tacaaataca 240
tctccgagaa ctgcgaaacc agcacaatga acatcgacag aaacatcacc cacctccagc 300
actgcacatg tgtggatgac tgctcctcca gcaactgtct gtgcggccag ctctccatca 360
gatgctggta cgacaaggac ggcagactgc tgcaagagtt caacaagatc gaaccccctc 420
tcatcttcga gtgtaaccaa gcttgcagct gctggagaaa ctgcaagaat agagtggtcc 480
agagcggcat caaggtgaga ctgcaactgt acagaaccgc caagatggga tggggagtga 540
gggctctgca aaccattccc caaggcacct tcatctgcga atacgtgggc gaactgatct 600
ccgacgccga agctgacgtg agagaggacg acagctatct cttcgatctg gacaataagg 660
acggcgaggt gtactgcatc gacgctagat attacggcaa catctctaga ttcatcaacc 720
acctctgcga tcccaacatc attcccgtga gggtgttcat gctgcaccaa gatctgaggt 780
tccctagaat cgccttcttc agctctagag acatcagaac cggcgaggag ctgggcttcg 840
attacggcga tagattctgg gacatcaagt ccaagtactt cacatgccag tgcggcagcg 900
agaagtgtaa gcacagcgct gaggccattg ctctggagca gtctagactg gccagactgg 960
atggcagcag cggatccctg gagcccggcg aaaagcctta caagtgtccc gagtgcggaa 1020
agagcttcag cagagccgat aatctgaccg agcaccaaag gacccacacc ggagagaagc 1080
cttataagtg tcccgaatgc ggcaaaagct tttctagaag cgatcatctg accaaccacc 1140
agaggacaca caccggagaa aaaccttaca aatgccccga gtgcggcaaa agcttctccc 1200
agagcagcaa tctggtgaga caccaaagga cccacaccgg cgaaaaaccc tataaatgcc 1260
ccgaatgtgg caagagcttt agcacatccg gcgagctggt gaggcatcaa agaacacata 1320
ccggcgagaa gccctacaag tgccccgagt gtggaaaaag cttcagcacc cacctcgatc 1380
tgatcagaca ccagaggacc cataccggag agaaacccta caaatgtccc gagtgcggaa 1440
agtcctttag ccagctggcc catctgagag ctcatcaaag gacacacacc ggcgagaagc 1500
cttacaagtg tcccgagtgc ggaaaatcct tctcccaact ggcccatctg agggcccacc 1560
agagaaccca caccggcaaa aagacctccg ctagcggcag cggcggcggc agcggcggca 1620
agcggcccgc cgccaccaag aaggccggcc aggccaagaa gaagaagggc agctacccct 1680
acgacgtgcc cgactacgcc tgagcggccg cttaattaag ctgccttctg cggggcttgc 1740
cttctggcca tgcccttctt ctctcccttg cacctgtacc tcttggtctt tgaataaagc 1800
ctgagtagga agtctagaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 1897
<210> 228
<211> 1897
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 228
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaggaa 120
atagggctat cagaaccgag aagatcatct gtagggacgt ggctagaggc tacgagaacg 180
tgcccattcc ttgcgtgaat ggcgtggatg gcgaaccttg ccccgaggac tacaaataca 240
tctccgagaa ctgcgaaacc agcacaatga acatcgacag aaacatcacc cacctccagc 300
actgcacatg tgtggatgac tgctcctcca gcaactgtct gtgcggccag ctctccatca 360
gatgctggta cgacaaggac ggcagactgc tgcaagagtt caacaagatc gaaccccctc 420
tcatcttcga gtgtaaccaa gcttgcagct gctggagaaa ctgcaagaat agagtggtcc 480
agagcggcat caaggtgaga ctgcaactgt acagaaccgc caagatggga tggggagtga 540
gggctctgca aaccattccc caaggcacct tcatctgcga atacgtgggc gaactgatct 600
ccgacgccga agctgacgtg agagaggacg acagctatct cttcgatctg gacaataagg 660
acggcgaggt gtactgcatc gacgctagat attacggcaa catctctaga ttcatcaacc 720
acctctgcga tcccaacatc attcccgtga gggtgttcat gctgcaccaa gatctgaggt 780
tccctagaat cgccttcttc agctctagag acatcagaac cggcgaggag ctgggcttcg 840
attacggcga tagattctgg gacatcaagt ccaagtactt cacatgccag tgcggcagcg 900
agaagtgtaa gcacagcgct gaggccattg ctctggagca gtctagactg gccagactgg 960
atggcagcag cggatccctg gagcccggcg aaaaacccta taaatgcccc gagtgtggca 1020
agagcttttc cgaccccgga cacctcgtga ggcatcagag aacacatacc ggcgagaaac 1080
cctacaagtg ccccgaatgc ggcaaatcct tctctagaaa ggacaatctg aaaaaccatc 1140
aaagaaccca taccggcgag aagccctata aatgtcccga gtgtggaaag agcttcagcc 1200
acaagaacgc tctgcagaac catcagagga cccataccgg cgaaaagcct tataagtgcc 1260
ccgagtgcgg aaaatccttt tctagaaggg acgagctgaa tgtgcaccaa aggacacata 1320
ccggagagaa accctacaaa tgccccgagt gcggcaagtc cttcagcacc tccggcaatc 1380
tggtgaggca ccaaaggaca cacaccggcg aaaaacctta caagtgtccc gagtgcggaa 1440
aaagcttttc ccagaacagc acactgaccg aacaccaaag gacccacacc ggagagaaac 1500
cttataaatg tcccgagtgt ggaaagtcct ttagccagtc cggcaatctg acagagcatc 1560
aaagaaccca caccggcaaa aagacctccg ctagcggcag cggcggcggc agcggcggca 1620
agcggcccgc cgccaccaag aaggccggcc aggccaagaa gaagaagggc agctacccct 1680
acgacgtgcc cgactacgcc tgagcggccg cttaattaag ctgccttctg cggggcttgc 1740
cttctggcca tgcccttctt ctctcccttg cacctgtacc tcttggtctt tgaataaagc 1800
ctgagtagga agtctagaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 1897
<210> 229
<211> 1897
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 229
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaggaa 120
atagggctat cagaaccgag aagatcatct gtagggacgt ggctagaggc tacgagaacg 180
tgcccattcc ttgcgtgaat ggcgtggatg gcgaaccttg ccccgaggac tacaaataca 240
tctccgagaa ctgcgaaacc agcacaatga acatcgacag aaacatcacc cacctccagc 300
actgcacatg tgtggatgac tgctcctcca gcaactgtct gtgcggccag ctctccatca 360
gatgctggta cgacaaggac ggcagactgc tgcaagagtt caacaagatc gaaccccctc 420
tcatcttcga gtgtaaccaa gcttgcagct gctggagaaa ctgcaagaat agagtggtcc 480
agagcggcat caaggtgaga ctgcaactgt acagaaccgc caagatggga tggggagtga 540
gggctctgca aaccattccc caaggcacct tcatctgcga atacgtgggc gaactgatct 600
ccgacgccga agctgacgtg agagaggacg acagctatct cttcgatctg gacaataagg 660
acggcgaggt gtactgcatc gacgctagat attacggcaa catctctaga ttcatcaacc 720
acctctgcga tcccaacatc attcccgtga gggtgttcat gctgcaccaa gatctgaggt 780
tccctagaat cgccttcttc agctctagag acatcagaac cggcgaggag ctgggcttcg 840
attacggcga tagattctgg gacatcaagt ccaagtactt cacatgccag tgcggcagcg 900
agaagtgtaa gcacagcgct gaggccattg ctctggagca gtctagactg gccagactgg 960
atggcagcag cggatccctg gagcccggcg aaaaacccta taagtgcccc gagtgcggca 1020
agagctttag cgatcccggc catctggtga ggcatcagag gacccacacc ggcgaaaagc 1080
cttacaaatg ccccgagtgt ggaaaaagct tcagcagaag cgatcatctg accacccatc 1140
agaggacaca taccggcgag aagccttata aatgccccga atgtggaaag agcttctcca 1200
gaagcgacca tctgaccaac caccagagga cccataccgg agaaaaacct tacaaatgcc 1260
ccgagtgtgg aaagtccttc agctcccccg ccgatctgac aagacatcag agaacccaca 1320
ccggcgaaaa accttataaa tgtcccgagt gtggcaaaag cttctccgac aagaaggatc 1380
tgacaagaca ccaaaggacc cacaccggcg agaaacctta taaatgtccc gaatgcggaa 1440
aaagctttag cagaaacgac gctctgaccg aacaccagag aacacatacc ggagagaaac 1500
cctataaatg tcccgagtgc ggaaaatcct tcagcaccac cggcgctctg acagagcatc 1560
agaggacaca caccggcaaa aagacctccg ctagcggcag cggcggcggc agcggcggca 1620
agcggcccgc cgccaccaag aaggccggcc aggccaagaa gaagaagggc agctacccct 1680
acgacgtgcc cgactacgcc tgagcggccg cttaattaag ctgccttctg cggggcttgc 1740
cttctggcca tgcccttctt ctctcccttg cacctgtacc tcttggtctt tgaataaagc 1800
ctgagtagga agtctagaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 1897
<210> 230
<211> 1897
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 230
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaggaa 120
atagggctat cagaaccgag aagatcatct gtagggacgt ggctagaggc tacgagaacg 180
tgcccattcc ttgcgtgaat ggcgtggatg gcgaaccttg ccccgaggac tacaaataca 240
tctccgagaa ctgcgaaacc agcacaatga acatcgacag aaacatcacc cacctccagc 300
actgcacatg tgtggatgac tgctcctcca gcaactgtct gtgcggccag ctctccatca 360
gatgctggta cgacaaggac ggcagactgc tgcaagagtt caacaagatc gaaccccctc 420
tcatcttcga gtgtaaccaa gcttgcagct gctggagaaa ctgcaagaat agagtggtcc 480
agagcggcat caaggtgaga ctgcaactgt acagaaccgc caagatggga tggggagtga 540
gggctctgca aaccattccc caaggcacct tcatctgcga atacgtgggc gaactgatct 600
ccgacgccga agctgacgtg agagaggacg acagctatct cttcgatctg gacaataagg 660
acggcgaggt gtactgcatc gacgctagat attacggcaa catctctaga ttcatcaacc 720
acctctgcga tcccaacatc attcccgtga gggtgttcat gctgcaccaa gatctgaggt 780
tccctagaat cgccttcttc agctctagag acatcagaac cggcgaggag ctgggcttcg 840
attacggcga tagattctgg gacatcaagt ccaagtactt cacatgccag tgcggcagcg 900
agaagtgtaa gcacagcgct gaggccattg ctctggagca gtctagactg gccagactgg 960
atggcagcag cggatccctg gagcccggcg aaaagcctta caaatgtccc gaatgcggaa 1020
agagcttcag cagagccgac aatctgaccg aacatcagag aacccatacc ggagaaaaac 1080
cttacaaatg tcccgagtgc ggcaaaagct tctcccaagc cggacatctg gccagccacc 1140
aaaggacaca taccggcgag aaaccctaca agtgccccga gtgcggcaag tccttctcta 1200
gatccgatga gctggtcaga catcagagaa cccataccgg cgagaagcct tataagtgcc 1260
ccgaatgtgg caagtccttc agccagagag ctcatctgga gaggcatcaa agaacacaca 1320
ccggagagaa accttacaag tgtcccgagt gtggaaagag cttctccaga agggacgagc 1380
tgaacgtcca ccaaagaacc cataccggcg aaaagcccta taaatgcccc gagtgtggaa 1440
aatccttttc tagatccgac catctgacaa cccaccagag gacccatacc ggagagaagc 1500
cctacaaatg ccccgagtgt ggaaaaagct tctctagaaa cgatgctctg acagagcacc 1560
aaaggaccca caccggcaaa aagaccagcg ctagcggcag cggcggcggc agcggcggca 1620
agcggcccgc cgccaccaag aaggccggcc aggccaagaa gaagaagggc agctacccct 1680
acgacgtgcc cgactacgcc tgagcggccg cttaattaag ctgccttctg cggggcttgc 1740
cttctggcca tgcccttctt ctctcccttg cacctgtacc tcttggtctt tgaataaagc 1800
ctgagtagga agtctagaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1860
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 1897
<210> 231
<211> 2668
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 231
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa accctataag tgccccgagt gcggcaagag ctttagcgat cccggccatc 180
tggtgaggca tcagaggacc cacaccggcg aaaagcctta caaatgcccc gagtgtggaa 240
aaagcttcag cagaagcgat catctgacca cccatcagag gacacatacc ggcgagaagc 300
cttataaatg ccccgaatgt ggaaagagct tctccagaag cgaccatctg accaaccacc 360
agaggaccca taccggagaa aaaccttaca aatgccccga gtgtggaaag tccttcagct 420
cccccgccga tctgacaaga catcagagaa cccacaccgg cgaaaaacct tataaatgtc 480
ccgagtgtgg caaaagcttc tccgacaaga aggatctgac aagacaccaa aggacccaca 540
ccggcgagaa accttataaa tgtcccgaat gcggaaaaag ctttagcaga aacgacgctc 600
tgaccgaaca ccagagaaca cataccggag agaaacccta taaatgtccc gagtgcggaa 660
aatccttcag caccaccggc gctctgacag agcatcagag gacacacacc ggcaaaaaga 720
cctccgctag cggcagcggc ggcggcagcg gcggcaacca cgaccaggag ttcgaccccc 780
ccaaggtgta cccccccgtg cccgccgaga agcggaagcc catccgggtg ctgagcctgt 840
tcgacggcat cgccaccggc ctgctggtgc tgaaggacct gggcatccag gtggaccggt 900
acatcgccag cgaggtgtgc gaggacagca tcaccgtggg catggtgcgg caccagggca 960
agatcatgta cgtgggcgac gtgcggagcg tgacccagaa gcacatccag gagtggggcc 1020
ccttcgacct ggtgatcggc ggcagcccct gcaacgacct gagcatcgtg aaccccgccc 1080
ggaagggcct gtacgagggc accggccggc tgttcttcga gttctaccgg ctgctgcacg 1140
acgcccggcc caaggagggc gacgaccggc ccttcttctg gctgttcgag aacgtggtgg 1200
ccatgggcgt gagcgacaag cgggacatca gccggttcct ggagagcaac cccgtgatga 1260
tcgacgccaa ggaggtgagc gccgcccacc gggcccggta cttctggggc aacctgcccg 1320
gcatgaaccg gcccctggcc agcaccgtga acgacaagct ggagctgcag gagtgcctgg 1380
agcacggccg gatcgccaag ttcagcaagg tgcggaccat caccacccgg agcaacagca 1440
tcaagcaggg caaggaccag cacttccccg tgttcatgaa cgagaaggag gacatcctgt 1500
ggtgcaccga gatggagcgg gtgttcggct tccccgtgca ctacaccgac gtgagcaaca 1560
tgagccggct ggcccggcag cggctgctgg gccggagctg gagcgtgccc gtgatccggc 1620
acctgttcgc ccccctgaag gagtacttcg cctgcgtgag cagcggcaac agcaacgcca 1680
acagccgggg ccccagcttc agcagcggcc tggtgcccct gagcctgcgg ggcagccaca 1740
tgaatcctct ggagatgttc gagacagtgc ccgtgtggag aaggcaaccc gtgagggtgc 1800
tgagcctctt cgaggacatt aagaaggagc tgacctctct gggctttctg gaatccggca 1860
gcgaccccgg ccagctgaaa cacgtggtgg acgtgaccga cacagtgagg aaggacgtgg 1920
aagagtgggg cccctttgac ctcgtgtatg gagccacacc tcctctcggc cacacatgcg 1980
ataggcctcc cagctggtat ctcttccagt tccacagact gctccagtac gccagaccta 2040
agcccggcag ccccagaccc ttcttctgga tgttcgtgga caatctggtg ctgaacaagg 2100
aggatctgga tgtggccagc agatttctgg agatggaacc cgtgacaatc cccgacgtgc 2160
atggcggctc tctgcagaac gccgtgagag tgtggtccaa catccccgcc attagaagca 2220
gacactgggc tctggtgagc gaggaggaac tgtctctgct ggcccagaat aagcagtcct 2280
ccaagctggc cgccaagtgg cccaccaagc tggtgaagaa ctgctttctg cctctgaggg 2340
agtatttcaa gtatttcagc accgaactga ccagcagcct gagcggcggc aagcggcccg 2400
ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 2460
ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg ccttctggcc 2520
atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag cctgagtagg 2580
aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2640
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 2668
<210> 232
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 232
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa gccttacaag tgtcccgagt gcggaaagag cttcagcaga gccgataatc 180
tgaccgagca ccaaaggacc cacaccggag agaagcctta taagtgtccc gaatgcggca 240
aaagcttttc tagaagcgat catctgacca accaccagag gacacacacc ggagaaaaac 300
cttacaaatg ccccgagtgc ggcaaaagct tctcccagag cagcaatctg gtgagacacc 360
aaaggaccca caccggcgaa aaaccctata aatgccccga atgtggcaag agctttagca 420
catccggcga gctggtgagg catcaaagaa cacataccgg cgagaagccc tacaagtgcc 480
ccgagtgtgg aaaaagcttc agcacccacc tcgatctgat cagacaccag aggacccata 540
ccggagagaa accctacaaa tgtcccgagt gcggaaagtc ctttagccag ctggcccatc 600
tgagagctca tcaaaggaca cacaccggcg agaagcctta caagtgtccc gagtgcggaa 660
aatccttctc ccaactggcc catctgaggg cccaccagag aacccacacc ggcaaaaaga 720
cctccgctag cggcagcggc ggcggcagcg gcggcgagga gcccgaggag cccgccgata 780
gcggacaatc tctggtgccc gtctacatct acagccccga atatgtgagc atgtgtgatt 840
ccctcgccaa gatccctaag agagccagca tggtgcattc tctgatcgag gcctacgctc 900
tgcataagca aatgaggatc gtgaagccca aggtcgccag catggaagag atggccacct 960
ttcacaccga tgcctacctc caacatctcc agaaggtgtc ccaagagggc gacgacgacc 1020
accccgactc cattgagtac ggactgggct atgattgccc cgccaccgag ggcatctttg 1080
actatgccgc cgctatcggc ggagctacca tcacagccgc ccagtgtctg attgatggca 1140
tgtgcaaggt cgccatcaac tggtccggag gctggcatca tgccaagaag gatgaggcct 1200
ccggcttctg ttatctgaat gacgccgtgc tgggcattct gagactgagg aggaaattcg 1260
agaggattct gtacgtggat ctggatctgc atcacggaga tggagtcgaa gatgccttca 1320
gcttcaccag caaggtgatg acagtctctc tgcacaagtt ctcccccggc ttctttcccg 1380
gaaccggcga cgtgtccgac gtgggactgg gcaagggaag gtactacagc gtgaacgtgc 1440
ccattcaaga cggcatccaa gacgagaagt actaccagat ctgcgagtcc gtgctcaagg 1500
aggtctacca agccttcaat cctaaggctg tcgtgctcca actgggagct gataccattg 1560
ctggcgatcc catgtgcagc ttcaatatga cacccgtcgg aatcggcaag tgcctcaagt 1620
acatcctcca gtggcagctc gccaccctca ttctcggagg aggcggatac aatctggcta 1680
ataccgccag atgctggacc tatctgaccg gcgtgattct gggcaaaaca ctgagcagcg 1740
aaatccccga ccacgagttt ttcaccgctt acggccccga ctacgtgctg gagatcaccc 1800
ccagctgcag acccgataga aacgaacccc atagaatcca gcaaattctg aactatatca 1860
agggcaacct caagcacgtc gtgggaggtg gcggatcggg aaagcggccc gccgccacca 1920
agaaggccgg tcaggccaag aagaagaagg gcagctaccc ctacgacgtg cccgactacg 1980
cctgagcggc cgcttaatta agctgccttc tgcggggctt gccttctggc catgcccttc 2040
ttctctccct tgcacctgta cctcttggtc tttgaataaa gcctgagtag gaagtctaga 2100
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaa 2179
<210> 233
<211> 3262
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 233
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgtgtg ctggcggaag cgggtgaaga gcgagtacat gcggctgcgg cagctgaagc 180
ggttccggcg ggccgacgag gtgaagagca tgttcagcag caaccggcag aagatcctgg 240
agcggaccga gatcctgaac caggagtgga agcagcggcg aatccagccc gtgcacatcc 300
tgaccagcgt gagcagcctg cggggcaccc gggagtgcag cgtgaccagc gacctggact 360
tccccaccca ggtgatcccc ctaaagaccc tgaacgccgt ggccagcgtg cccatcatgt 420
acagctggag ccccctgcag cagaacttca tggtggagga cgagaccgtg ctgcacaaca 480
tcccctacat gggcgacgag gtgctggacc aggacggcac cttcatcgag gagctgatca 540
agaactacga cggcaaggtg cacggcgacc gggagtgcgg cttcatcaac gacgagatct 600
tcgtggagct ggtgaacgcc ctgggccagt acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggacctgga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag ttccccagcg acaagatctt cgaggccatc agcagcatgt 780
tccccgacaa gggcaccgcc gaggagctga aggagaagta caaggagctg accgagcagc 840
agctgcccgg cgccctgccc cccgagtgca cccccaacat cgacggcccc aacgccaaga 900
gcgtgcagcg ggagcagagc ctgcacagct tccacaccct gttctgccgg cggtgcttca 960
agtacgactg cttcctgcac cccttccacg ccacccccaa cacctacaag cggaagaaca 1020
ccgagaccgc cctggacaac aagccctgcg gcccccagtg ctaccagcac ctggagggcg 1080
ccaaggagtt cgccgccgcc ctgaccgccg agcggatcaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg ctgcccaaca acagcagccg gcccagcacc cccaccatca 1200
acgtgctgga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggtg ccagaccccc atcaagatga agcccaacat cgagcccccc gagaacgtgg 1380
agtggagcgg cgccgaggcc agcatgttcc gggtgctgat cggcacctac tacgacaact 1440
tctgcgccat cgcccggctg atcggcacca agacctgccg gcaggtgtac gagttccggg 1500
tgaaggagag cagcatcatc gcccccgccc ccgccgagga cgtggacacc cccccccgga 1560
agaagaagcg gaagcaccgg ctgtgggccg cccactgccg gaagatccag ctgaagaagg 1620
acggcagcag caaccacgtg tacaactacc agccctgcga ccacccccgg cagccctgcg 1680
acagcagctg cccctgcgtg atcgcccaga acttctgcga gaagttctgc cagtgcagca 1740
gcgagtgcca gaaccggttc cccggctgcc ggtgcaaggc ccagtgcaac accaagcagt 1800
gcccctgcta cctggccgtg cgggagtgcg accccgacct gtgcctgacc tgcggcgccg 1860
ccgaccactg ggacagcaag aacgtgagct gcaagaactg cagcatccag cggggcagca 1920
agaagcacct gctgctggcc cccagcgacg tggccggctg gggcatcttc atcaaggacc 1980
ccgtgcagaa gaacgagttc atcagcgagt actgcggcga gatcatcagc caggacgagg 2040
ccgaccggcg gggcaaggtg tacgacaagt acatgtgcag cttcctgttc aacctgaaca 2100
acgacttcgt ggtggacgcc acccggaagg gcaacaagat ccggttcgcc aaccacagcg 2160
tgaaccccaa ctgctacgcc aaggtgatga tggtgaacgg cgaccaccgg atcggcatct 2220
tcgccaagcg ggccatccag accggcgagg agctgttctt cgactaccgg tacagccagg 2280
ccgacgccct gaagtacgtg ggcatcgagc gggagatgga gatccccggc agcagcggat 2340
ccctggagcc cggagaaaag ccttacaaat gccccgagtg cggcaagtcc ttcagccagc 2400
tggctcatct gagagctcat caaaggaccc acaccggcga gaagccctat aagtgccccg 2460
agtgcggaaa atccttctcc cagagcagca atctcgtcag acaccagagg acccacaccg 2520
gcgagaaacc ttacaagtgt cccgaatgtg gaaagtcctt ctcccaaaag agctctctga 2580
tcgcccatca gagaacacat accggcgaaa aaccctacaa gtgccccgag tgtggcaaaa 2640
gcttttccac caccggcaat ctgaccgtgc atcaaagaac ccacaccggc gaaaaaccct 2700
acaaatgccc cgagtgtggc aaatccttct ccgaccccgg ccatctggtg aggcaccaga 2760
ggacacacac cggcgagaaa ccttataaat gtcccgaatg cggcaagtcc tttagcacca 2820
gcggctctct ggtgagacat cagaggacac ataccggcga aaagccttac aagtgtcccg 2880
agtgtggcaa aagcttcagc cagaacagca cactgacaga gcatcagaga acccataccg 2940
gcaaaaagac cagcgctagc ggcagcggcg gcggcagcgg cggcaagcgg cccgccgcca 3000
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 3060
acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 3120
ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 3180
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3240
aaaaaaaaaa aaaaaaaaaa aa 3262
<210> 234
<211> 3262
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 234
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgtgtg ctggcggaag cgggtgaaga gcgagtacat gcggctgcgg cagctgaagc 180
ggttccggcg ggccgacgag gtgaagagca tgttcagcag caaccggcag aagatcctgg 240
agcggaccga gatcctgaac caggagtgga agcagcggcg aatccagccc gtgcacatcc 300
tgaccagcgt gagcagcctg cggggcaccc gggagtgcag cgtgaccagc gacctggact 360
tccccaccca ggtgatcccc ctaaagaccc tgaacgccgt ggccagcgtg cccatcatgt 420
acagctggag ccccctgcag cagaacttca tggtggagga cgagaccgtg ctgcacaaca 480
tcccctacat gggcgacgag gtgctggacc aggacggcac cttcatcgag gagctgatca 540
agaactacga cggcaaggtg cacggcgacc gggagtgcgg cttcatcaac gacgagatct 600
tcgtggagct ggtgaacgcc ctgggccagt acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggacctgga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag ttccccagcg acaagatctt cgaggccatc agcagcatgt 780
tccccgacaa gggcaccgcc gaggagctga aggagaagta caaggagctg accgagcagc 840
agctgcccgg cgccctgccc cccgagtgca cccccaacat cgacggcccc aacgccaaga 900
gcgtgcagcg ggagcagagc ctgcacagct tccacaccct gttctgccgg cggtgcttca 960
agtacgactg cttcctgcac cccttccacg ccacccccaa cacctacaag cggaagaaca 1020
ccgagaccgc cctggacaac aagccctgcg gcccccagtg ctaccagcac ctggagggcg 1080
ccaaggagtt cgccgccgcc ctgaccgccg agcggatcaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg ctgcccaaca acagcagccg gcccagcacc cccaccatca 1200
acgtgctgga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggtg ccagaccccc atcaagatga agcccaacat cgagcccccc gagaacgtgg 1380
agtggagcgg cgccgaggcc agcatgttcc gggtgctgat cggcacctac tacgacaact 1440
tctgcgccat cgcccggctg atcggcacca agacctgccg gcaggtgtac gagttccggg 1500
tgaaggagag cagcatcatc gcccccgccc ccgccgagga cgtggacacc cccccccgga 1560
agaagaagcg gaagcaccgg ctgtgggccg cccactgccg gaagatccag ctgaagaagg 1620
acggcagcag caaccacgtg tacaactacc agccctgcga ccacccccgg cagccctgcg 1680
acagcagctg cccctgcgtg atcgcccaga acttctgcga gaagttctgc cagtgcagca 1740
gcgagtgcca gaaccggttc cccggctgcc ggtgcaaggc ccagtgcaac accaagcagt 1800
gcccctgcta cctggccgtg cgggagtgcg accccgacct gtgcctgacc tgcggcgccg 1860
ccgaccactg ggacagcaag aacgtgagct gcaagaactg cagcatccag cggggcagca 1920
agaagcacct gctgctggcc cccagcgacg tggccggctg gggcatcttc atcaaggacc 1980
ccgtgcagaa gaacgagttc atcagcgagt actgcggcga gatcatcagc caggacgagg 2040
ccgaccggcg gggcaaggtg tacgacaagt acatgtgcag cttcctgttc aacctgaaca 2100
acgacttcgt ggtggacgcc acccggaagg gcaacaagat ccggttcgcc aaccacagcg 2160
tgaaccccaa ctgctacgcc aaggtgatga tggtgaacgg cgaccaccgg atcggcatct 2220
tcgccaagcg ggccatccag accggcgagg agctgttctt cgactaccgg tacagccagg 2280
ccgacgccct gaagtacgtg ggcatcgagc gggagatgga gatccccggc agcagcggat 2340
ccctggagcc cggcgaaaaa ccctataaat gccccgagtg tggcaagagc ttttccgacc 2400
ccggacatct cgtgaggcat cagagaacac ataccggcga gaaaccctac aagtgccccg 2460
aatgcggcaa atccttctct agaaaggaca atctgaaaaa ccatcaaaga acccataccg 2520
gcgagaagcc ctataaatgt cccgagtgtg gaaagagctt cagccacaag aacgctctgc 2580
agaaccatca gaggacccat accggcgaaa agccttataa gtgccccgag tgcggaaaat 2640
ccttttctag aagggacgag ctgaatgtgc accaaaggac acataccgga gagaaaccct 2700
acaaatgccc cgagtgcggc aagtccttca gcacctccgg caatctggtg aggcaccaaa 2760
ggacacacac cggcgaaaaa ccttacaagt gtcccgagtg cggaaaaagc ttttcccaga 2820
acagcacact gaccgaacac caaaggaccc acaccggaga gaaaccttat aaatgtcccg 2880
agtgtggaaa gtcctttagc cagtccggca atctgacaga gcatcaaaga acccacaccg 2940
gcaaaaagac ctccgctagc ggcagcggcg gcggcagcgg cggcaagcgg cccgccgcca 3000
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 3060
acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 3120
ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 3180
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3240
aaaaaaaaaa aaaaaaaaaa aa 3262
<210> 235
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 235
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa accctataaa tgccccgagt gtggcaagag cttttccgac cccggacacc 180
tcgtgaggca tcagagaaca cataccggcg agaaacccta caagtgcccc gaatgcggca 240
aatccttctc tagaaaggac aatctgaaaa accatcaaag aacccatacc ggcgagaagc 300
cctataaatg tcccgagtgt ggaaagagct tcagccacaa gaacgctctg cagaaccatc 360
agaggaccca taccggcgaa aagccttata agtgccccga gtgcggaaaa tccttttcta 420
gaagggacga gctgaatgtg caccaaagga cacataccgg agagaaaccc tacaaatgcc 480
ccgagtgcgg caagtccttc agcacctccg gcaatctggt gaggcaccaa aggacacaca 540
ccggcgaaaa accttacaag tgtcccgagt gcggaaaaag cttttcccag aacagcacac 600
tgaccgaaca ccaaaggacc cacaccggag agaaacctta taaatgtccc gagtgtggaa 660
agtcctttag ccagtccggc aatctgacag agcatcaaag aacccacacc ggcaaaaaga 720
cctccgctag cggcagcggc ggcggcagcg gcggcgagga gcccgaggag cccgccgata 780
gcggacaatc tctggtgccc gtctacatct acagccccga atatgtgagc atgtgtgatt 840
ccctcgccaa gatccctaag agagccagca tggtgcattc tctgatcgag gcctacgctc 900
tgcataagca aatgaggatc gtgaagccca aggtcgccag catggaagag atggccacct 960
ttcacaccga tgcctacctc caacatctcc agaaggtgtc ccaagagggc gacgacgacc 1020
accccgactc cattgagtac ggactgggct atgattgccc cgccaccgag ggcatctttg 1080
actatgccgc cgctatcggc ggagctacca tcacagccgc ccagtgtctg attgatggca 1140
tgtgcaaggt cgccatcaac tggtccggag gctggcatca tgccaagaag gatgaggcct 1200
ccggcttctg ttatctgaat gacgccgtgc tgggcattct gagactgagg aggaaattcg 1260
agaggattct gtacgtggat ctggatctgc atcacggaga tggagtcgaa gatgccttca 1320
gcttcaccag caaggtgatg acagtctctc tgcacaagtt ctcccccggc ttctttcccg 1380
gaaccggcga cgtgtccgac gtgggactgg gcaagggaag gtactacagc gtgaacgtgc 1440
ccattcaaga cggcatccaa gacgagaagt actaccagat ctgcgagtcc gtgctcaagg 1500
aggtctacca agccttcaat cctaaggctg tcgtgctcca actgggagct gataccattg 1560
ctggcgatcc catgtgcagc ttcaatatga cacccgtcgg aatcggcaag tgcctcaagt 1620
acatcctcca gtggcagctc gccaccctca ttctcggagg aggcggatac aatctggcta 1680
ataccgccag atgctggacc tatctgaccg gcgtgattct gggcaaaaca ctgagcagcg 1740
aaatccccga ccacgagttt ttcaccgctt acggccccga ctacgtgctg gagatcaccc 1800
ccagctgcag acccgataga aacgaacccc atagaatcca gcaaattctg aactatatca 1860
agggcaacct caagcacgtc gtgggaggtg gcggatcggg aaagcggccc gccgccacca 1920
agaaggccgg tcaggccaag aagaagaagg gcagctaccc ctacgacgtg cccgactacg 1980
cctgagcggc cgcttaatta agctgccttc tgcggggctt gccttctggc catgcccttc 2040
ttctctccct tgcacctgta cctcttggtc tttgaataaa gcctgagtag gaagtctaga 2100
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaa 2179
<210> 236
<211> 2668
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 236
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa gccttacaag tgtcccgagt gcggaaagag cttcagcaga gccgataatc 180
tgaccgagca ccaaaggacc cacaccggag agaagcctta taagtgtccc gaatgcggca 240
aaagcttttc tagaagcgat catctgacca accaccagag gacacacacc ggagaaaaac 300
cttacaaatg ccccgagtgc ggcaaaagct tctcccagag cagcaatctg gtgagacacc 360
aaaggaccca caccggcgaa aaaccctata aatgccccga atgtggcaag agctttagca 420
catccggcga gctggtgagg catcaaagaa cacataccgg cgagaagccc tacaagtgcc 480
ccgagtgtgg aaaaagcttc agcacccacc tcgatctgat cagacaccag aggacccata 540
ccggagagaa accctacaaa tgtcccgagt gcggaaagtc ctttagccag ctggcccatc 600
tgagagctca tcaaaggaca cacaccggcg agaagcctta caagtgtccc gagtgcggaa 660
aatccttctc ccaactggcc catctgaggg cccaccagag aacccacacc ggcaaaaaga 720
cctccgctag cggcagcggc ggcggcagcg gcggcaacca cgaccaggag ttcgaccccc 780
ccaaggtgta cccccccgtg cccgccgaga agcggaagcc catccgggtg ctgagcctgt 840
tcgacggcat cgccaccggc ctgctggtgc tgaaggacct gggcatccag gtggaccggt 900
acatcgccag cgaggtgtgc gaggacagca tcaccgtggg catggtgcgg caccagggca 960
agatcatgta cgtgggcgac gtgcggagcg tgacccagaa gcacatccag gagtggggcc 1020
ccttcgacct ggtgatcggc ggcagcccct gcaacgacct gagcatcgtg aaccccgccc 1080
ggaagggcct gtacgagggc accggccggc tgttcttcga gttctaccgg ctgctgcacg 1140
acgcccggcc caaggagggc gacgaccggc ccttcttctg gctgttcgag aacgtggtgg 1200
ccatgggcgt gagcgacaag cgggacatca gccggttcct ggagagcaac cccgtgatga 1260
tcgacgccaa ggaggtgagc gccgcccacc gggcccggta cttctggggc aacctgcccg 1320
gcatgaaccg gcccctggcc agcaccgtga acgacaagct ggagctgcag gagtgcctgg 1380
agcacggccg gatcgccaag ttcagcaagg tgcggaccat caccacccgg agcaacagca 1440
tcaagcaggg caaggaccag cacttccccg tgttcatgaa cgagaaggag gacatcctgt 1500
ggtgcaccga gatggagcgg gtgttcggct tccccgtgca ctacaccgac gtgagcaaca 1560
tgagccggct ggcccggcag cggctgctgg gccggagctg gagcgtgccc gtgatccggc 1620
acctgttcgc ccccctgaag gagtacttcg cctgcgtgag cagcggcaac agcaacgcca 1680
acagccgggg ccccagcttc agcagcggcc tggtgcccct gagcctgcgg ggcagccaca 1740
tgaatcctct ggagatgttc gagacagtgc ccgtgtggag aaggcaaccc gtgagggtgc 1800
tgagcctctt cgaggacatt aagaaggagc tgacctctct gggctttctg gaatccggca 1860
gcgaccccgg ccagctgaaa cacgtggtgg acgtgaccga cacagtgagg aaggacgtgg 1920
aagagtgggg cccctttgac ctcgtgtatg gagccacacc tcctctcggc cacacatgcg 1980
ataggcctcc cagctggtat ctcttccagt tccacagact gctccagtac gccagaccta 2040
agcccggcag ccccagaccc ttcttctgga tgttcgtgga caatctggtg ctgaacaagg 2100
aggatctgga tgtggccagc agatttctgg agatggaacc cgtgacaatc cccgacgtgc 2160
atggcggctc tctgcagaac gccgtgagag tgtggtccaa catccccgcc attagaagca 2220
gacactgggc tctggtgagc gaggaggaac tgtctctgct ggcccagaat aagcagtcct 2280
ccaagctggc cgccaagtgg cccaccaagc tggtgaagaa ctgctttctg cctctgaggg 2340
agtatttcaa gtatttcagc accgaactga ccagcagcct gagcggcggc aagcggcccg 2400
ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 2460
ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg ccttctggcc 2520
atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag cctgagtagg 2580
aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2640
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 2668
<210> 237
<211> 2668
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 237
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggagaaaa gccttacaaa tgccccgagt gcggcaagtc cttcagccag ctggctcatc 180
tgagagctca tcaaaggacc cacaccggcg agaagcccta taagtgcccc gagtgcggaa 240
aatccttctc ccagagcagc aatctcgtca gacaccagag gacccacacc ggcgagaaac 300
cttacaagtg tcccgaatgt ggaaagtcct tctcccaaaa gagctctctg atcgcccatc 360
agagaacaca taccggcgaa aaaccctaca agtgccccga gtgtggcaaa agcttttcca 420
ccaccggcaa tctgaccgtg catcaaagaa cccacaccgg cgaaaaaccc tacaaatgcc 480
ccgagtgtgg caaatccttc tccgaccccg gccatctggt gaggcaccag aggacacaca 540
ccggcgagaa accttataaa tgtcccgaat gcggcaagtc ctttagcacc agcggctctc 600
tggtgagaca tcagaggaca cataccggcg aaaagcctta caagtgtccc gagtgtggca 660
aaagcttcag ccagaacagc acactgacag agcatcagag aacccatacc ggcaaaaaga 720
ccagcgctag cggcagcggc ggcggcagcg gcggcaacca cgaccaggag ttcgaccccc 780
ccaaggtgta cccccccgtg cccgccgaga agcggaagcc catccgggtg ctgagcctgt 840
tcgacggcat cgccaccggc ctgctggtgc tgaaggacct gggcatccag gtggaccggt 900
acatcgccag cgaggtgtgc gaggacagca tcaccgtggg catggtgcgg caccagggca 960
agatcatgta cgtgggcgac gtgcggagcg tgacccagaa gcacatccag gagtggggcc 1020
ccttcgacct ggtgatcggc ggcagcccct gcaacgacct gagcatcgtg aaccccgccc 1080
ggaagggcct gtacgagggc accggccggc tgttcttcga gttctaccgg ctgctgcacg 1140
acgcccggcc caaggagggc gacgaccggc ccttcttctg gctgttcgag aacgtggtgg 1200
ccatgggcgt gagcgacaag cgggacatca gccggttcct ggagagcaac cccgtgatga 1260
tcgacgccaa ggaggtgagc gccgcccacc gggcccggta cttctggggc aacctgcccg 1320
gcatgaaccg gcccctggcc agcaccgtga acgacaagct ggagctgcag gagtgcctgg 1380
agcacggccg gatcgccaag ttcagcaagg tgcggaccat caccacccgg agcaacagca 1440
tcaagcaggg caaggaccag cacttccccg tgttcatgaa cgagaaggag gacatcctgt 1500
ggtgcaccga gatggagcgg gtgttcggct tccccgtgca ctacaccgac gtgagcaaca 1560
tgagccggct ggcccggcag cggctgctgg gccggagctg gagcgtgccc gtgatccggc 1620
acctgttcgc ccccctgaag gagtacttcg cctgcgtgag cagcggcaac agcaacgcca 1680
acagccgggg ccccagcttc agcagcggcc tggtgcccct gagcctgcgg ggcagccaca 1740
tgaatcctct ggagatgttc gagacagtgc ccgtgtggag aaggcaaccc gtgagggtgc 1800
tgagcctctt cgaggacatt aagaaggagc tgacctctct gggctttctg gaatccggca 1860
gcgaccccgg ccagctgaaa cacgtggtgg acgtgaccga cacagtgagg aaggacgtgg 1920
aagagtgggg cccctttgac ctcgtgtatg gagccacacc tcctctcggc cacacatgcg 1980
ataggcctcc cagctggtat ctcttccagt tccacagact gctccagtac gccagaccta 2040
agcccggcag ccccagaccc ttcttctgga tgttcgtgga caatctggtg ctgaacaagg 2100
aggatctgga tgtggccagc agatttctgg agatggaacc cgtgacaatc cccgacgtgc 2160
atggcggctc tctgcagaac gccgtgagag tgtggtccaa catccccgcc attagaagca 2220
gacactgggc tctggtgagc gaggaggaac tgtctctgct ggcccagaat aagcagtcct 2280
ccaagctggc cgccaagtgg cccaccaagc tggtgaagaa ctgctttctg cctctgaggg 2340
agtatttcaa gtatttcagc accgaactga ccagcagcct gagcggcggc aagcggcccg 2400
ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 2460
ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg ccttctggcc 2520
atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag cctgagtagg 2580
aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2640
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 2668
<210> 238
<211> 2668
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 238
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa accctataaa tgccccgagt gtggcaagag cttttccgac cccggacacc 180
tcgtgaggca tcagagaaca cataccggcg agaaacccta caagtgcccc gaatgcggca 240
aatccttctc tagaaaggac aatctgaaaa accatcaaag aacccatacc ggcgagaagc 300
cctataaatg tcccgagtgt ggaaagagct tcagccacaa gaacgctctg cagaaccatc 360
agaggaccca taccggcgaa aagccttata agtgccccga gtgcggaaaa tccttttcta 420
gaagggacga gctgaatgtg caccaaagga cacataccgg agagaaaccc tacaaatgcc 480
ccgagtgcgg caagtccttc agcacctccg gcaatctggt gaggcaccaa aggacacaca 540
ccggcgaaaa accttacaag tgtcccgagt gcggaaaaag cttttcccag aacagcacac 600
tgaccgaaca ccaaaggacc cacaccggag agaaacctta taaatgtccc gagtgtggaa 660
agtcctttag ccagtccggc aatctgacag agcatcaaag aacccacacc ggcaaaaaga 720
cctccgctag cggcagcggc ggcggcagcg gcggcaacca cgaccaggag ttcgaccccc 780
ccaaggtgta cccccccgtg cccgccgaga agcggaagcc catccgggtg ctgagcctgt 840
tcgacggcat cgccaccggc ctgctggtgc tgaaggacct gggcatccag gtggaccggt 900
acatcgccag cgaggtgtgc gaggacagca tcaccgtggg catggtgcgg caccagggca 960
agatcatgta cgtgggcgac gtgcggagcg tgacccagaa gcacatccag gagtggggcc 1020
ccttcgacct ggtgatcggc ggcagcccct gcaacgacct gagcatcgtg aaccccgccc 1080
ggaagggcct gtacgagggc accggccggc tgttcttcga gttctaccgg ctgctgcacg 1140
acgcccggcc caaggagggc gacgaccggc ccttcttctg gctgttcgag aacgtggtgg 1200
ccatgggcgt gagcgacaag cgggacatca gccggttcct ggagagcaac cccgtgatga 1260
tcgacgccaa ggaggtgagc gccgcccacc gggcccggta cttctggggc aacctgcccg 1320
gcatgaaccg gcccctggcc agcaccgtga acgacaagct ggagctgcag gagtgcctgg 1380
agcacggccg gatcgccaag ttcagcaagg tgcggaccat caccacccgg agcaacagca 1440
tcaagcaggg caaggaccag cacttccccg tgttcatgaa cgagaaggag gacatcctgt 1500
ggtgcaccga gatggagcgg gtgttcggct tccccgtgca ctacaccgac gtgagcaaca 1560
tgagccggct ggcccggcag cggctgctgg gccggagctg gagcgtgccc gtgatccggc 1620
acctgttcgc ccccctgaag gagtacttcg cctgcgtgag cagcggcaac agcaacgcca 1680
acagccgggg ccccagcttc agcagcggcc tggtgcccct gagcctgcgg ggcagccaca 1740
tgaatcctct ggagatgttc gagacagtgc ccgtgtggag aaggcaaccc gtgagggtgc 1800
tgagcctctt cgaggacatt aagaaggagc tgacctctct gggctttctg gaatccggca 1860
gcgaccccgg ccagctgaaa cacgtggtgg acgtgaccga cacagtgagg aaggacgtgg 1920
aagagtgggg cccctttgac ctcgtgtatg gagccacacc tcctctcggc cacacatgcg 1980
ataggcctcc cagctggtat ctcttccagt tccacagact gctccagtac gccagaccta 2040
agcccggcag ccccagaccc ttcttctgga tgttcgtgga caatctggtg ctgaacaagg 2100
aggatctgga tgtggccagc agatttctgg agatggaacc cgtgacaatc cccgacgtgc 2160
atggcggctc tctgcagaac gccgtgagag tgtggtccaa catccccgcc attagaagca 2220
gacactgggc tctggtgagc gaggaggaac tgtctctgct ggcccagaat aagcagtcct 2280
ccaagctggc cgccaagtgg cccaccaagc tggtgaagaa ctgctttctg cctctgaggg 2340
agtatttcaa gtatttcagc accgaactga ccagcagcct gagcggcggc aagcggcccg 2400
ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 2460
ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg ccttctggcc 2520
atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag cctgagtagg 2580
aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2640
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 2668
<210> 239
<211> 2668
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 239
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa gccttacaaa tgtcccgaat gcggaaagag cttcagcaga gccgacaatc 180
tgaccgaaca tcagagaacc cataccggag aaaaacctta caaatgtccc gagtgcggca 240
aaagcttctc ccaagccgga catctggcca gccaccaaag gacacatacc ggcgagaaac 300
cctacaagtg ccccgagtgc ggcaagtcct tctctagatc cgatgagctg gtcagacatc 360
agagaaccca taccggcgag aagccttata agtgccccga atgtggcaag tccttcagcc 420
agagagctca tctggagagg catcaaagaa cacacaccgg agagaaacct tacaagtgtc 480
ccgagtgtgg aaagagcttc tccagaaggg acgagctgaa cgtccaccaa agaacccata 540
ccggcgaaaa gccctataaa tgccccgagt gtggaaaatc cttttctaga tccgaccatc 600
tgacaaccca ccagaggacc cataccggag agaagcccta caaatgcccc gagtgtggaa 660
aaagcttctc tagaaacgat gctctgacag agcaccaaag gacccacacc ggcaaaaaga 720
ccagcgctag cggcagcggc ggcggcagcg gcggcaacca cgaccaggag ttcgaccccc 780
ccaaggtgta cccccccgtg cccgccgaga agcggaagcc catccgggtg ctgagcctgt 840
tcgacggcat cgccaccggc ctgctggtgc tgaaggacct gggcatccag gtggaccggt 900
acatcgccag cgaggtgtgc gaggacagca tcaccgtggg catggtgcgg caccagggca 960
agatcatgta cgtgggcgac gtgcggagcg tgacccagaa gcacatccag gagtggggcc 1020
ccttcgacct ggtgatcggc ggcagcccct gcaacgacct gagcatcgtg aaccccgccc 1080
ggaagggcct gtacgagggc accggccggc tgttcttcga gttctaccgg ctgctgcacg 1140
acgcccggcc caaggagggc gacgaccggc ccttcttctg gctgttcgag aacgtggtgg 1200
ccatgggcgt gagcgacaag cgggacatca gccggttcct ggagagcaac cccgtgatga 1260
tcgacgccaa ggaggtgagc gccgcccacc gggcccggta cttctggggc aacctgcccg 1320
gcatgaaccg gcccctggcc agcaccgtga acgacaagct ggagctgcag gagtgcctgg 1380
agcacggccg gatcgccaag ttcagcaagg tgcggaccat caccacccgg agcaacagca 1440
tcaagcaggg caaggaccag cacttccccg tgttcatgaa cgagaaggag gacatcctgt 1500
ggtgcaccga gatggagcgg gtgttcggct tccccgtgca ctacaccgac gtgagcaaca 1560
tgagccggct ggcccggcag cggctgctgg gccggagctg gagcgtgccc gtgatccggc 1620
acctgttcgc ccccctgaag gagtacttcg cctgcgtgag cagcggcaac agcaacgcca 1680
acagccgggg ccccagcttc agcagcggcc tggtgcccct gagcctgcgg ggcagccaca 1740
tgaatcctct ggagatgttc gagacagtgc ccgtgtggag aaggcaaccc gtgagggtgc 1800
tgagcctctt cgaggacatt aagaaggagc tgacctctct gggctttctg gaatccggca 1860
gcgaccccgg ccagctgaaa cacgtggtgg acgtgaccga cacagtgagg aaggacgtgg 1920
aagagtgggg cccctttgac ctcgtgtatg gagccacacc tcctctcggc cacacatgcg 1980
ataggcctcc cagctggtat ctcttccagt tccacagact gctccagtac gccagaccta 2040
agcccggcag ccccagaccc ttcttctgga tgttcgtgga caatctggtg ctgaacaagg 2100
aggatctgga tgtggccagc agatttctgg agatggaacc cgtgacaatc cccgacgtgc 2160
atggcggctc tctgcagaac gccgtgagag tgtggtccaa catccccgcc attagaagca 2220
gacactgggc tctggtgagc gaggaggaac tgtctctgct ggcccagaat aagcagtcct 2280
ccaagctggc cgccaagtgg cccaccaagc tggtgaagaa ctgctttctg cctctgaggg 2340
agtatttcaa gtatttcagc accgaactga ccagcagcct gagcggcggc aagcggcccg 2400
ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 2460
ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg ccttctggcc 2520
atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag cctgagtagg 2580
aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2640
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 2668
<210> 240
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 240
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa gccttacaag tgccccgagt gtggcaaatc ctttagcacc accggaaatc 180
tgaccgtcca ccagagaaca cataccggcg agaaacccta caagtgtccc gagtgcggca 240
aatccttcag ccagctggcc catctgagag cccatcaaag gacccatacc ggcgagaaac 300
cttacaagtg tcccgaatgt ggaaagtcct ttagcagccc cgccgatctg acaagacatc 360
aaagaaccca caccggcgag aagccctata aatgtcccga gtgtggaaag tccttcagcc 420
agagcggcaa tctgaccgag catcaaagaa cccataccgg cgaaaagccc tataagtgcc 480
ccgaatgcgg aaaaagcttc tccacaagcg gcgagctggt gagacaccaa aggacacata 540
ccggcgaaaa gccttataaa tgccccgagt gcggcaagag cttctctaga aaggacaatc 600
tgaagaacca ccaaagaaca cacaccggcg agaagcccta caaatgcccc gagtgcggca 660
agagctttag ccagtccagc aacctcgtga gacatcagag gacacatacc ggaaaaaaga 720
ccagcgctag cggcagcggc ggcggcagcg gcggcgagga gcccgaggag cccgccgata 780
gcggacaatc tctggtgccc gtctacatct acagccccga atatgtgagc atgtgtgatt 840
ccctcgccaa gatccctaag agagccagca tggtgcattc tctgatcgag gcctacgctc 900
tgcataagca aatgaggatc gtgaagccca aggtcgccag catggaagag atggccacct 960
ttcacaccga tgcctacctc caacatctcc agaaggtgtc ccaagagggc gacgacgacc 1020
accccgactc cattgagtac ggactgggct atgattgccc cgccaccgag ggcatctttg 1080
actatgccgc cgctatcggc ggagctacca tcacagccgc ccagtgtctg attgatggca 1140
tgtgcaaggt cgccatcaac tggtccggag gctggcatca tgccaagaag gatgaggcct 1200
ccggcttctg ttatctgaat gacgccgtgc tgggcattct gagactgagg aggaaattcg 1260
agaggattct gtacgtggat ctggatctgc atcacggaga tggagtcgaa gatgccttca 1320
gcttcaccag caaggtgatg acagtctctc tgcacaagtt ctcccccggc ttctttcccg 1380
gaaccggcga cgtgtccgac gtgggactgg gcaagggaag gtactacagc gtgaacgtgc 1440
ccattcaaga cggcatccaa gacgagaagt actaccagat ctgcgagtcc gtgctcaagg 1500
aggtctacca agccttcaat cctaaggctg tcgtgctcca actgggagct gataccattg 1560
ctggcgatcc catgtgcagc ttcaatatga cacccgtcgg aatcggcaag tgcctcaagt 1620
acatcctcca gtggcagctc gccaccctca ttctcggagg aggcggatac aatctggcta 1680
ataccgccag atgctggacc tatctgaccg gcgtgattct gggcaaaaca ctgagcagcg 1740
aaatccccga ccacgagttt ttcaccgctt acggccccga ctacgtgctg gagatcaccc 1800
ccagctgcag acccgataga aacgaacccc atagaatcca gcaaattctg aactatatca 1860
agggcaacct caagcacgtc gtgggaggtg gcggatcggg aaagcggccc gccgccacca 1920
agaaggccgg tcaggccaag aagaagaagg gcagctaccc ctacgacgtg cccgactacg 1980
cctgagcggc cgcttaatta agctgccttc tgcggggctt gccttctggc catgcccttc 2040
ttctctccct tgcacctgta cctcttggtc tttgaataaa gcctgagtag gaagtctaga 2100
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaa 2179
<210> 241
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 241
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa accctataag tgccccgagt gcggcaagag ctttagcgat cccggccatc 180
tggtgaggca tcagaggacc cacaccggcg aaaagcctta caaatgcccc gagtgtggaa 240
aaagcttcag cagaagcgat catctgacca cccatcagag gacacatacc ggcgagaagc 300
cttataaatg ccccgaatgt ggaaagagct tctccagaag cgaccatctg accaaccacc 360
agaggaccca taccggagaa aaaccttaca aatgccccga gtgtggaaag tccttcagct 420
cccccgccga tctgacaaga catcagagaa cccacaccgg cgaaaaacct tataaatgtc 480
ccgagtgtgg caaaagcttc tccgacaaga aggatctgac aagacaccaa aggacccaca 540
ccggcgagaa accttataaa tgtcccgaat gcggaaaaag ctttagcaga aacgacgctc 600
tgaccgaaca ccagagaaca cataccggag agaaacccta taaatgtccc gagtgcggaa 660
aatccttcag caccaccggc gctctgacag agcatcagag gacacacacc ggcaaaaaga 720
cctccgctag cggcagcggc ggcggcagcg gcggcgagga gcccgaggag cccgccgata 780
gcggacaatc tctggtgccc gtctacatct acagccccga atatgtgagc atgtgtgatt 840
ccctcgccaa gatccctaag agagccagca tggtgcattc tctgatcgag gcctacgctc 900
tgcataagca aatgaggatc gtgaagccca aggtcgccag catggaagag atggccacct 960
ttcacaccga tgcctacctc caacatctcc agaaggtgtc ccaagagggc gacgacgacc 1020
accccgactc cattgagtac ggactgggct atgattgccc cgccaccgag ggcatctttg 1080
actatgccgc cgctatcggc ggagctacca tcacagccgc ccagtgtctg attgatggca 1140
tgtgcaaggt cgccatcaac tggtccggag gctggcatca tgccaagaag gatgaggcct 1200
ccggcttctg ttatctgaat gacgccgtgc tgggcattct gagactgagg aggaaattcg 1260
agaggattct gtacgtggat ctggatctgc atcacggaga tggagtcgaa gatgccttca 1320
gcttcaccag caaggtgatg acagtctctc tgcacaagtt ctcccccggc ttctttcccg 1380
gaaccggcga cgtgtccgac gtgggactgg gcaagggaag gtactacagc gtgaacgtgc 1440
ccattcaaga cggcatccaa gacgagaagt actaccagat ctgcgagtcc gtgctcaagg 1500
aggtctacca agccttcaat cctaaggctg tcgtgctcca actgggagct gataccattg 1560
ctggcgatcc catgtgcagc ttcaatatga cacccgtcgg aatcggcaag tgcctcaagt 1620
acatcctcca gtggcagctc gccaccctca ttctcggagg aggcggatac aatctggcta 1680
ataccgccag atgctggacc tatctgaccg gcgtgattct gggcaaaaca ctgagcagcg 1740
aaatccccga ccacgagttt ttcaccgctt acggccccga ctacgtgctg gagatcaccc 1800
ccagctgcag acccgataga aacgaacccc atagaatcca gcaaattctg aactatatca 1860
agggcaacct caagcacgtc gtgggaggtg gcggatcggg aaagcggccc gccgccacca 1920
agaaggccgg tcaggccaag aagaagaagg gcagctaccc ctacgacgtg cccgactacg 1980
cctgagcggc cgcttaatta agctgccttc tgcggggctt gccttctggc catgcccttc 2040
ttctctccct tgcacctgta cctcttggtc tttgaataaa gcctgagtag gaagtctaga 2100
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaa 2179
<210> 242
<211> 2179
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 242
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120
ccggcgaaaa gccttacaaa tgtcccgaat gcggaaagag cttcagcaga gccgacaatc 180
tgaccgaaca tcagagaacc cataccggag aaaaacctta caaatgtccc gagtgcggca 240
aaagcttctc ccaagccgga catctggcca gccaccaaag gacacatacc ggcgagaaac 300
cctacaagtg ccccgagtgc ggcaagtcct tctctagatc cgatgagctg gtcagacatc 360
agagaaccca taccggcgag aagccttata agtgccccga atgtggcaag tccttcagcc 420
agagagctca tctggagagg catcaaagaa cacacaccgg agagaaacct tacaagtgtc 480
ccgagtgtgg aaagagcttc tccagaaggg acgagctgaa cgtccaccaa agaacccata 540
ccggcgaaaa gccctataaa tgccccgagt gtggaaaatc cttttctaga tccgaccatc 600
tgacaaccca ccagaggacc cataccggag agaagcccta caaatgcccc gagtgtggaa 660
aaagcttctc tagaaacgat gctctgacag agcaccaaag gacccacacc ggcaaaaaga 720
ccagcgctag cggcagcggc ggcggcagcg gcggcgagga gcccgaggag cccgccgata 780
gcggacaatc tctggtgccc gtctacatct acagccccga atatgtgagc atgtgtgatt 840
ccctcgccaa gatccctaag agagccagca tggtgcattc tctgatcgag gcctacgctc 900
tgcataagca aatgaggatc gtgaagccca aggtcgccag catggaagag atggccacct 960
ttcacaccga tgcctacctc caacatctcc agaaggtgtc ccaagagggc gacgacgacc 1020
accccgactc cattgagtac ggactgggct atgattgccc cgccaccgag ggcatctttg 1080
actatgccgc cgctatcggc ggagctacca tcacagccgc ccagtgtctg attgatggca 1140
tgtgcaaggt cgccatcaac tggtccggag gctggcatca tgccaagaag gatgaggcct 1200
ccggcttctg ttatctgaat gacgccgtgc tgggcattct gagactgagg aggaaattcg 1260
agaggattct gtacgtggat ctggatctgc atcacggaga tggagtcgaa gatgccttca 1320
gcttcaccag caaggtgatg acagtctctc tgcacaagtt ctcccccggc ttctttcccg 1380
gaaccggcga cgtgtccgac gtgggactgg gcaagggaag gtactacagc gtgaacgtgc 1440
ccattcaaga cggcatccaa gacgagaagt actaccagat ctgcgagtcc gtgctcaagg 1500
aggtctacca agccttcaat cctaaggctg tcgtgctcca actgggagct gataccattg 1560
ctggcgatcc catgtgcagc ttcaatatga cacccgtcgg aatcggcaag tgcctcaagt 1620
acatcctcca gtggcagctc gccaccctca ttctcggagg aggcggatac aatctggcta 1680
ataccgccag atgctggacc tatctgaccg gcgtgattct gggcaaaaca ctgagcagcg 1740
aaatccccga ccacgagttt ttcaccgctt acggccccga ctacgtgctg gagatcaccc 1800
ccagctgcag acccgataga aacgaacccc atagaatcca gcaaattctg aactatatca 1860
agggcaacct caagcacgtc gtgggaggtg gcggatcggg aaagcggccc gccgccacca 1920
agaaggccgg tcaggccaag aagaagaagg gcagctaccc ctacgacgtg cccgactacg 1980
cctgagcggc cgcttaatta agctgccttc tgcggggctt gccttctggc catgcccttc 2040
ttctctccct tgcacctgta cctcttggtc tttgaataaa gcctgagtag gaagtctaga 2100
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaa 2179
<210> 243
<211> 5
<212> PRT
<213> Unknown
<220>
<223> Description of Unknown:
Thrombin-sensitive sequence
<400> 243
Cys Pro Arg Ser Cys
1 5
<210> 244
<211> 51
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Anchor sequence
<400> 244
tggatgggag tgtgacagtg ctgccttctg accacaaggt ggggcttata c 51
<210> 245
<211> 51
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Anchor sequence
<400> 245
gtataagccc caccttgtgg tcagaaggca gcactgtcac actcccatcc a 51
<210> 246
<211> 102
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Anchor sequence
<400> 246
ttgttttcgg ctctagatgg cgccataagc ctatgtttac cttgactttt gcaaatggcc 60
atggcactgc ctgtcccata aggaggagga ccaaagggat ta 102
<210> 247
<211> 51
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown:
Anchor sequence
<400> 247
caaaagtcaa ggtaaacata ggcttatggc gccatctaga gccgaaaaca a 51
Claims (232)
- 세포에서 제1 유전자 및 제2 유전자의 발현을 감소시키는 방법으로서,
세포를, 제1 유전자 및 제2 유전자의 발현을 감소시키기에 충분한 양으로 제1 앵커 서열 또는 제1 앵커 서열에 근접한 부위에 특이적으로 결합하는 표적화 모이어티를 포함하는 부위-특이적 파괴제와 접촉시키는 단계
를 포함하며,
제1 및 제2 유전자는 제1 앵커 서열 및 제2 앵커 서열을 포함하는 앵커 서열-매개 연접부 내에 있고,
선택적으로 제1 유전자 및 제2 유전자는 전염증성 유전자이며,
이에 의해 제1 유전자 및 제2 유전자의 발현을 감소시키는, 방법. - 부위-특이적 파괴제로서,
DNA-결합, 예를 들어 세포 내에서 제1 앵커 서열 또는 제1 앵커 서열의 근접부에 특이적으로 결합하는 표적화 모이어티
를 포함하며,
제1 앵커 서열은 제2 앵커 서열, 제1 유전자, 및 제2 유전자를 추가로 포함하는 앵커 서열-매개 연접부의 일부이고,
선택적으로 제1 유전자 및 제2 유전자는 전염증성 유전자인, 부위-특이적 파괴제. - 제2항에 있어서, 상기 제1 또는 제2 앵커 서열은 IL-8과 RASSF6 사이; IL-8 인핸서와 RASSF6 사이; CXCL1과 CXCL4 사이; CXCL2와 EPGN 사이; 또는 E2 인핸서와 EPGN 사이에 위치하는, 부위-특이적 파괴제.
- 제2항 또는 제3항에 있어서, 상기 부위-특이적 파괴제는 이펙터 모이어티를 추가로 포함하는, 부위-특이적 파괴제.
- 제2항 내지 제4항 중 어느 한 항에 있어서, 상기 표적화 모이어티는 TAL 이펙터 분자, CRISPR/Cas 분자(예를 들어, 촉매적으로 비활성인 CRISPR/Cas 단백질), 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제, 또는 올리고뉴클레오티드를 포함하는, 부위-특이적 파괴제.
- 제2항 내지 제5항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 본 명세서에 기재된 이펙터, 예를 들어 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, EZH2, HDAC8, KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2 또는 DNMT3, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 부위-특이적 파괴제.
- 제2항 내지 제6항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 링커를 통해 표적화 모이어티에 연결된, 부위-특이적 파괴제.
- 제2항 내지 제7항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 표적화 모이어티의 C-말단에 있는, 부위-특이적 파괴제.
- 제2항 내지 제7항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 표적화 모이어티의 N-말단에 있는, 부위-특이적 파괴제.
- 제2항 내지 제9항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 서열번호 10, 14, 16, 18, 66, 68 중 어느 하나로부터 선택되는 뉴클레오티드 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열에 의해 인코딩되는, 부위-특이적 파괴제.
- 제2항 내지 제10항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 서열번호 11, 12, 13, 15, 17, 19, 67 중 어느 하나에 따른 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하는, 부위-특이적 파괴제.
- 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 MQ1 또는 이의 기능성 변이체 또는 단편이며, 예를 들어 이펙터 모이어티는 서열번호 11 또는 12의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하고, 선택적으로 이펙터 모이어티는 표적화 모이어티의 C-말단에 있는, 부위-특이적 파괴제.
- 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이며, 예를 들어 이펙터 모이어티는 서열번호 13의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하고, 선택적으로 이펙터 모이어티는 표적화 모이어티의 C-말단에 있는, 부위-특이적 파괴제.
- 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 DNMT3a/3L 또는 이의 기능성 변이체 또는 단편이며, 예를 들어 이펙터 모이어티는 서열번호 15의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하고, 선택적으로 이펙터 모이어티는 표적화 모이어티의 C-말단에 있는, 부위-특이적 파괴제.
- 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 EZH2 또는 이의 기능성 변이체 또는 단편이며, 예를 들어 이펙터 모이어티는 서열번호 17의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하는, 부위-특이적 파괴제.
- 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 HDAC8 또는 이의 기능성 변이체 또는 단편이며, 예를 들어 이펙터 모이어티는 서열번호 19의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하고, 선택적으로 이펙터 모이어티는 표적화 모이어티의 C-말단에 있는, 부위-특이적 파괴제.
- 제2항 내지 제11항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 G9A 또는 이의 기능성 변이체 또는 단편이며, 예를 들어 이펙터 모이어티는 서열번호 67의 아미노산 서열, 또는 상기 서열과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 상기 서열에 대해 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 상이한 위치를 갖는 서열을 포함하고, 선택적으로 이펙터 모이어티는 표적화 모이어티의 N-말단에 있는, 부위-특이적 파괴제.
- 제2항 내지 제17항 중 어느 한 항에 있어서, 제2 이펙터 모이어티를 추가로 포함하는, 부위-특이적 파괴제.
- 제18항에 있어서, 상기 표적화 모이어티는 제1 이펙터 모이어티와 제2 이펙터 모이어티 사이에 위치하는, 부위-특이적 파괴제.
- 제2항 내지 제19항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 중합체, 예를 들어 올리고뉴클레오티드; 예를 들어 gRNA를 포함하는, 부위-특이적 파괴제.
- 제20항에 있어서, 상기 올리고뉴클레오티드는 앵커 서열의 보체 또는 앵커 서열에 근접한 서열에 대한 보체를 포함하는 서열을 갖는, 부위-특이적 파괴제.
- 제2항 내지 제21항 중 어느 한 항에 있어서, 상기 표적화 모이어티는 gRNA, 예를 들어 서열번호 20 내지 62 중 임의의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드를 포함하는 게놈 유전자좌에 결합하는 gRNA를 추가로 포함하며, gRNA는 서열번호 20 내지 62 중 임의의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드를 포함하는 서열을 포함하는, 부위-특이적 파괴제.
- 제2항 내지 제22항 중 어느 한 항에 있어서, 상기 표적화 도메인은 CRISPR/Cas 분자, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질, 및 gRNA, 예를 들어 서열번호 20 내지 62 중 임의의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드를 포함하는 게놈 유전자좌에 결합하는 gRNA를 포함하며, 예를 들어 gRNA는 서열번호 20 내지 62 중 임의의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드를 포함하는 서열을 포함하고, 이펙터 모이어티는 DNMT3a/3l, MQ1, KRAB, G9A, HDAC8, 또는 EZH2로부터 선택되는 이펙터를 포함하는, 부위-특이적 파괴제.
- 제23항에 있어서, 상기 표적화 도메인은 CRISPR/Cas 분자, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질, 및 gRNA, 예를 들어 서열번호 20 내지 62 중 임의의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드를 포함하는 게놈 유전자좌에 결합하는 gRNA를 포함하며, 예를 들어 gRNA는 서열번호 20 내지 62 중 임의의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드를 포함하는 서열을 포함하고, 제1 이펙터 모이어티는 DNMT3a/3l, MQ1, KRAB, G9A, HDAC8, 또는 EZH2로부터 선택되는 이펙터를 포함하고, 제2 이펙터 모이어티는 DNMT3a/3l, MQ1, KRAB, G9A, HDAC8, 또는 EZH2로부터 선택되는 이펙터를 포함하는, 부위-특이적 파괴제.
- 제2항 내지 제24항 중 어느 한 항에 있어서, 상기 표적화 도메인은 서열번호 20 내지 62 중 임의의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오티드를 포함하는 게놈 유전자좌에 결합하는, 부위-특이적 파괴제.
- 제2항 내지 제25항 중 어느 한 항에 있어서, 상기 표적화 도메인은 서열번호 20 내지 62 중 임의의 서열의 (예를 들어, 상류 또는 하류의) 50개 뉴클레오티드 내에 있는 게놈 유전자좌에 결합하는, 부위-특이적 파괴제.
- 제2항 내지 제26항 중 어느 한 항에 있어서, 상기 표적화 도메인은 서열번호 20 내지 62 중 임의의 서열의 (예를 들어, 상류 또는 하류의) 100개 뉴클레오티드 내에 있는 게놈 유전자좌에 결합하는, 부위-특이적 파괴제.
- 제2항 내지 제27항 중 어느 한 항에 있어서, 상기 표적화 도메인은 서열번호 20 내지 62 중 임의의 서열의 (예를 들어, 상류 또는 하류의) 200개 뉴클레오티드 내에 있는 게놈 유전자좌에 결합하는, 부위-특이적 파괴제.
- 제2항 내지 제28항 중 어느 한 항에 있어서, 상기 표적화 도메인은 서열번호 20 내지 62 중 임의의 서열의 (예를 들어, 상류 또는 하류의) 300개 뉴클레오티드 내에 있는 게놈 유전자좌에 결합하는, 부위-특이적 파괴제.
- 제2항 내지 제29항 중 어느 한 항에 있어서, (i) 하나 이상의 핵 국재화 신호 서열(NLS)을 포함하거나, (ii) NLS를 포함하지 않고, 선택적으로 NLS는 서열번호 63 및/또는 64의 아미노산 서열을 포함하는, 부위-특이적 파괴제.
- 제18항 내지 제30항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제, 히스톤 메틸트랜스퍼라제, 히스톤 데아세틸라제, 히스톤 데메틸라제, 또는 히스톤 변형 복합체의 동원인자(recruiter)를 포함하는, 부위-특이적 파괴제.
- 제2항 내지 제31항 중 어느 한 항에 있어서, 상기 ASMC는 2개의 루프를 포함하는, 부위-특이적 파괴제.
- 제2항 내지 제32항 중 어느 한 항의 부위-특이적 파괴제 또는 제1항의 방법에 있어서, 상기 제1 유전자는 ASMC의 제1 루프에 위치하고, 제2 유전자는 ASMC의 제2 루프에 위치하는, 부위-특이적 파괴제 또는 방법.
- 제33항에 있어서, 상기 제1 앵커 서열은 제1 루프와 제2 루프 사이에 위치하는, 부위-특이적 파괴제 또는 방법.
- 제2항 내지 제34항 중 어느 한 항의 부위-특이적 파괴제를 인코딩하는 핵산.
- 제1항의 방법 또는 제2항 내지 제36항 중 어느 한 항의 부위-특이적 파괴제에 있어서, 상기 앵커 서열-매개 연접부는 제3 유전자를 추가로 포함하고, 선택적으로 상기 방법은 제3 유전자의 발현 감소를 초래하는, 방법 또는 부위-특이적 파괴제.
- 제36항에 있어서, 상기 앵커 서열-매개 연접부는 제4 유전자를 추가로 포함하고, 선택적으로 상기 방법은 제4 유전자의 발현 감소를 초래하는, 방법 또는 부위-특이적 파괴제.
- 제37항에 있어서, 상기 앵커 서열-매개 연접부는 제5 유전자를 추가로 포함하고, 선택적으로 상기 방법은 제5 유전자의 발현 감소를 초래하는, 방법 또는 부위-특이적 파괴제.
- 제38항에 있어서, 상기 앵커 서열-매개 연접부는 제6 유전자를 추가로 포함하고, 선택적으로 상기 방법은 제6 유전자의 발현 감소를 초래하는, 방법 또는 부위-특이적 파괴제.
- 제39항에 있어서, 상기 앵커 서열-매개 연접부는 제7 유전자를 추가로 포함하고, 선택적으로 상기 방법은 제7 유전자의 발현 감소를 초래하는, 방법 또는 부위-특이적 파괴제.
- 제40항에 있어서, 상기 앵커 서열-매개 연접부는 제8 유전자를 추가로 포함하고, 선택적으로 상기 방법은 제8 유전자의 발현 감소를 초래하는, 방법 또는 부위-특이적 파괴제.
- 제1 유전자 및 제2 유전자의 발현이 감소된 인간 세포로서,
제1 유전자 및 제2 유전자는 전염증성 유전자이고,
세포는 제1 유전자 및 제2 유전자를 포함하는 파괴된(예를 들어, 완전히 파괴된) 앵커 서열-매개 연접부를 포함하는, 인간 세포. - 제42항에 있어서, 앵커 서열-매개 연접부에 포함되어 있는 앵커 서열에 대한 CTCF 결합이 감소된, 예를 들어 적어도 20, 30, 40, 50, 60, 70, 80, 90, 또는 100% 감소된, 인간 세포.
- 제42항 또는 제43항에 있어서, 제3 전염증성 유전자의 발현이 감소된, 인간 세포.
- 제44항에 있어서, 제4 전염증성 유전자의 발현이 감소된, 인간 세포.
- 제45항에 있어서, 제5 전염증성 유전자의 발현이 감소된, 인간 세포.
- 제46항에 있어서, 제6 전염증성 유전자의 발현이 감소된, 인간 세포.
- 제47항에 있어서, 제7 전염증성 유전자의 발현이 감소된, 인간 세포.
- 제48항에 있어서, 제8 전염증성 유전자의 발현이 감소된, 인간 세포.
- 제42항 내지 제49항 중 어느 한 항에 있어서, chr4:74595464-74595486, chr4:74595457-74595479, chr4:74595460-74595482, chr4:74595472-74595494, chr4:75000088-75000110, chr4:75000091-75000113, chr4:75000085-75000107, chr4:75000157-75000179, chr4:75000156-75000178, chr4:74595215-74595237, chr4:74595370-74595392, chr4:74595560-74595582, chr4:74595642-74595664, chr4:74595787-74595809, chr4:74528428-74528450, chr4:74528567-74528589, chr4:74528609-74528631, chr4:74789132-74789154, chr4:74789250-74789272, chr4:74789312-74789334, chr4:74964853-74964875, chr4:74964906-74964928, chr4:74965538-74965560, chr4:74965737-74965759, chr4:75000031-75000053, chr4:75000115-75000137, chr4:75000231-75000253, chr4:74975146-74975168, chr4:74975369-74975391, chr4:74976318-74976340, chr4:74570348-74570370, chr4:74570503-74570525, 또는 chr4:74570526-74570548에, 또는 상기 영역의 5, 10, 15, 20, 30, 40, 또는 50개 뉴클레오티드 내에 돌연변이를 포함하는, 인간 세포.
- 인간 세포로서, chr4:74595464-74595486, chr4:74595457-74595479, chr4:74595460-74595482, chr4:74595472-74595494, chr4:75000088-75000110, chr4:75000091-75000113, chr4:75000085-75000107, chr4:75000157-75000179, chr4:75000156-75000178, chr4:74595215-74595237, chr4:74595370-74595392, chr4:74595560-74595582, chr4:74595642-74595664, chr4:74595787-74595809, chr4:74528428-74528450, chr4:74528567-74528589, chr4:74528609-74528631, chr4:74789132-74789154, chr4:74789250-74789272, chr4:74789312-74789334, chr4:74964853-74964875, chr4:74964906-74964928, chr4:74965538-74965560, chr4:74965737-74965759, chr4:75000031-75000053, chr4:75000115-75000137, chr4:75000231-75000253, chr4:74975146-74975168, chr4:74975369-74975391, chr4:74976318-74976340, chr4:74570348-74570370, chr4:74570503-74570525, 또는 chr4:74570526-74570548에, 또는 상기 영역의 5, 10, 15, 20, 30, 40, 또는 50개 뉴클레오티드 내에 돌연변이를 포함하는 인간 세포.
- 제27항 또는 제28항에 있어서, 상기 돌연변이는 (예를 들어, 1 내지 10개, 1 내지 9개, 1 내지 8개, 1 내지 7개, 1 내지 6개, 1 내지 5개, 1 내지 4개, 1 내지 3개, 또는 1 내지 2개의 뉴클레오티드의) 결실, 치환, 또는 삽입을 포함하는, 인간 세포.
- 제50항 내지 제52항 중 어느 한 항에 있어서, 돌연변이에 대한 CTCF 결합이 감소된, 예를 들어 파괴되지 않은 ASMC를 갖는 인간 세포와 비교하여 적어도 20, 30, 40, 50, 60, 70, 80, 90, 또는 100% 감소된, 인간 세포.
- 제42항 내지 제53항 중 어느 한 항에 있어서, 상기 제1 유전자 및 제2 유전자의 발현은 파괴되지 않은 ASMC를 갖는 인간 세포와 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90% 감소된, 인간 세포.
- 시스템으로서,
제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하며, 앵커 서열-매개 연접부(ASMC)의 제1 앵커 서열에 특이적으로 결합하고, ASMC는 제1 유전자 및 제2 유전자를 포함하는, 제1 부위-특이적 파괴제, 및
제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하며, ASMC의 제2 앵커 서열에 결합하는, 제2 부위-특이적 파괴제;
를 포함하는 시스템. - 제55항에 있어서, 상기 제1 앵커 서열은 IL-8과 RASSF6 사이; IL-8 인핸서와 RASSF6 사이; CXCL1과 CXCL4 사이; CXCL2와 EPGN 사이; 또는 E2 인핸서와 EPGN 사이에 있는, 시스템.
- 제55항 또는 제56항에 있어서, 상기 제2 앵커 서열은 IL-8과 RASSF6 사이; IL-8 인핸서와 RASSF6 사이; CXCL1과 CXCL4 사이; CXCL2와 EPGN 사이; 또는 E2 인핸서와 EPGN 사이에 있는, 시스템.
- 제55항 내지 제57항 중 어느 한 항에 있어서, 상기 제1 앵커 서열은 IL-8 인핸서와 RASSF6 사이에 있고 제2 앵커 서열은 CXCL1과 CXCL4 사이에 있는, 시스템.
- 제55항 내지 제58항 중 어느 한 항에 있어서, 상기 제1 앵커 서열은 IL-8 인핸서와 RASSF6 사이에 있고 제2 앵커 서열은 E2 인핸서와 EPGN 사이에 있는, 시스템.
- 제55항 내지 제59항 중 어느 한 항에 있어서, 상기 제1 앵커 서열은 CXCL1과 CXCL4 사이에 있고 제2 앵커 서열은 E2 인핸서와 EPGN 사이에 있는, 시스템.
- 제55항 내지 제60항 중 어느 한 항에 있어서, 상기 제1 부위-특이적 파괴제는 본 명세서에 기재된 부위-특이적 파괴제, 예를 들어 제2항 내지 제9항 중 어느 한 항의 부위-특이적 파괴제인, 시스템.
- 제55항 내지 제61항 중 어느 한 항에 있어서, 상기 제2 부위-특이적 파괴제는 본 명세서에 기재된 부위-특이적 파괴제, 예를 들어 제2항 내지 제9항 중 어느 한 항의 부위-특이적 파괴제인, 시스템.
- 제55항 내지 제62항 중 어느 한 항에 있어서, 상기 제1 표적화 모이어티 및 제2 표적화 모이어티는 각각 독립적으로 TAL 이펙터 분자, CRISPR/Cas 분자, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제, 또는 올리고뉴클레오티드를 포함하는, 시스템.
- 제55항 내지 제63항 중 어느 한 항에 있어서, 상기 제1 이펙터 및 제2 이펙터는 각각 독립적으로 본 명세서에 기재된 이펙터, 예를 들어 MQ1, EZH2, HDAC8, KRAB, G9A, 또는 DNMT3a/3l, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 시스템.
- 제55항 내지 제62항 중 어느 한 항에 있어서, 상기 제1 이펙터 및 제2 이펙터는 각각 독립적으로 SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템.
- 제55항 내지 제65항 중 어느 한 항에 있어서, 상기 제1 이펙터 및 제2 이펙터는 각각 독립적으로 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템.
- 제55항 내지 제43항 중 어느 한 항에 있어서, 상기 제1 이펙터 및 제2 이펙터는 각각 독립적으로 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, DNMT3a/3l, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템.
- 제55항 내지 제67항 중 어느 한 항에 있어서, 상기 제1 이펙터 및 제2 이펙터는 각각 독립적으로 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템.
- 제55항 내지 제68항 중 어느 한 항에 있어서, 상기 제1 이펙터 및 제2 이펙터는 각각 독립적으로 중합체, 예를 들어 올리고뉴클레오티드를 포함하는, 시스템.
- 제55항 내지 제69항 중 어느 한 항에 있어서, 제1 올리고뉴클레오티드 및 제2 올리고뉴클레오티드는 동일한, 시스템.
- 제55항 내지 제70항 중 어느 한 항에 있어서, 제1 올리고뉴클레오티드 및 제2 올리고뉴클레오티드는 상이한, 시스템.
- 제55항 내지 제71항 중 어느 한 항에 있어서, 상기 제1 올리고뉴클레오티드는 제1 앵커 서열의 보체 또는 제1 앵커 서열에 근접한 서열에 대한 보체를 포함하는 서열을 갖고, 제2 올리고뉴클레오티드는 제2 앵커 서열의 보체 또는 제2 앵커 서열에 근접한 서열에 대한 보체를 포함하는 서열을 갖는, 시스템.
- 제55항 내지 제72항 중 어느 한 항에 있어서, 상기 앵커 서열-매개 연접부는 제3 유전자를 추가로 포함하는, 시스템.
- 제55항 내지 제73항 중 어느 한 항에 있어서, 상기 앵커 서열-매개 연접부는 제4 유전자를 추가로 포함하는, 시스템.
- 제55항 내지 제74항 중 어느 한 항에 있어서, 상기 앵커 서열-매개 연접부는 제5 유전자를 추가로 포함하는, 시스템.
- 제55항 내지 제75항 중 어느 한 항에 있어서, 상기 앵커 서열-매개 연접부는 제6 유전자를 추가로 포함하는, 시스템.
- 제55항 내지 제76항 중 어느 한 항에 있어서, 상기 앵커 서열-매개 연접부는 제7 유전자를 추가로 포함하는, 시스템.
- 제55항 내지 제77항 중 어느 한 항에 있어서, 상기 앵커 서열-매개 연접부는 제8 유전자를 추가로 포함하는, 시스템.
- 제55항 내지 제78항 중 어느 한 항에 있어서, 상기 ASMC는 2개의 루프를 포함하는, 시스템.
- 제55항 내지 제79항 중 어느 한 항의 시스템을 인코딩하는 핵산 조성물.
- 제80항에 있어서, 단일 핵산이 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제를 둘 모두 인코딩하는, 핵산.
- 제81항에 있어서, 제1 핵산은 제1 부위-특이적 파괴제를 인코딩하고 제2 핵산은 제2 부위-특이적 파괴제를 인코딩하는, 핵산.
- 세포에서 제1 유전자 및 제2 유전자의 발현을 감소시키는 방법으로서, 세포를, 제80항 내지 제82항 중 어느 한 항에 따른 핵산 조성물의 제55항 내지 제79항 중 어느 한 항에 따른 시스템과 접촉시키는 단계를 포함하는, 방법.
- 제83항에 있어서, 상기 세포는 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제와 동시에 접촉되는, 방법.
- 제83항에 있어서, 상기 세포는 제1 부위-특이적 파괴제 및 제2 부위-특이적 파괴제와 순차적으로 접촉되는, 방법.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL1이고 제2 유전자는 CXCL2인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL1이고 제2 유전자는 CXCL3인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL1이고 제2 유전자는 IL-8인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL1이고 제2 유전자는 CXCL4인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL1이고 제2 유전자는 CXCL5인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL1이고 제2 유전자는 CXCL6인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL1이고 제2 유전자는 CXCL7인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL2이고 제2 유전자는 CXCL3인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL2이고 제2 유전자는 IL-8인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL2이고 제2 유전자는 CXCL4인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL2이고 제2 유전자는 CXCL4인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL2이고 제2 유전자는 CXCL5인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL2이고 제2 유전자는 CXCL6인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL2이고 제2 유전자는 CXCL7인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL3이고 제2 유전자는 IL-8인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL3이고 제2 유전자는 CXCL4인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL3이고 제2 유전자는 CXCL5인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL3이고 제2 유전자는 CXCL6인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL3이고 제2 유전자는 CXCL7인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL4이고 제2 유전자는 CXCL5인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL4이고 제2 유전자는 CXCL6인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL4이고 제2 유전자는 CXCL7인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL4이고 제2 유전자는 IL-8인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL5이고 제2 유전자는 CXCL6인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL5이고 제2 유전자는 CXCL7인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL5이고 제2 유전자는 IL-8인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL6이고 제2 유전자는 CXCL7인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL6이고 제2 유전자는 IL-8인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL7이고 제2 유전자는 IL-8인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제36항 내지 제85항 중 어느 한 항에 있어서, 상기 제1 유전자는 CXCL1이고, 제2 유전자는 CXCL2이며, 제3 유전자는 CXCL3인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제36항 내지 제85항 중 어느 한 항에 있어서, 상기 제1, 제2, 및 제3 유전자는 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 또는 IL-8로부터 선택되는, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제36항 내지 제85항 중 어느 한 항에 있어서, 상기 제1, 제2, 제3, 및 제4 유전자는 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 또는 IL-8로부터 선택되는, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제36항 내지 제85항 중 어느 한 항에 있어서, 상기 제1, 제2, 제3, 제4, 및 제5 유전자는 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 또는 IL-8로부터 선택되는, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제36항 내지 제85항 중 어느 한 항에 있어서, 상기 제1, 제2, 제3, 제4, 제5, 및 제6 유전자는 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 또는 IL-8로부터 선택되는, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제36항 내지 제85항 중 어느 한 항에 있어서, 상기 제1, 제2, 제3, 제4, 제5, 제6, 및 제7 유전자는 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 또는 IL-8로부터 선택되는, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제36항 내지 제85항 중 어느 한 항에 있어서, 상기 제1, 제2, 제3, 제4, 제5, 제6, 제7, 및 제8 유전자는 CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 또는 IL-8인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제121항 중 어느 한 항에 있어서, 상기 제1 유전자는 사이토카인인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제122항 중 어느 한 항에 있어서, 상기 제2 유전자는 사이토카인인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제123항 중 어느 한 항에 있어서, 상기 제3 유전자는 사이토카인인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제124항 중 어느 한 항에 있어서, 상기 제4 유전자는 사이토카인인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제125항 중 어느 한 항에 있어서, 상기 제5 유전자는 사이토카인인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제126항 중 어느 한 항에 있어서, 상기 제6 유전자는 사이토카인인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제127항 중 어느 한 항에 있어서, 상기 제7 유전자는 사이토카인인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제128항 중 어느 한 항에 있어서, 상기 제8 유전자는 사이토카인인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제129항 중 어느 한 항에 있어서, 상기 앵커 서열-매개 연접부는 3, 4, 또는 5개의 전염증성 유전자를 포함하는, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제130항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 서열번호 20 내지 62로부터 선택되는 뉴클레오티드 서열, 또는 상기 서열과 적어도 90%, 95%, 98%, 또는 99% 동일성을 갖거나, 상기 서열에 대해 1, 2, 3, 4, 또는 5개 이하의 상이한 위치를 갖는 서열을 포함하는 핵산(예를 들어, DNA 또는 RNA)을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제131항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 서열번호 21, 22, 24, 40으로부터 선택되는 뉴클레오티드 서열, 또는 상기 서열과 적어도 90%, 95%, 98%, 또는 99% 동일성을 갖거나, 상기 서열에 대해 1, 2, 3, 4, 또는 5개 이하의 상이한 위치를 갖는 서열을 포함하는 핵산(예를 들어, DNA 또는 RNA)을 포함하는, 방법, 부위-특이적 파괴제.
- 제1항 내지 제132항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 표 4, 5, 6, 7로부터 선택되는 게놈 좌표를 갖는 영역과 적어도 부분적으로 중첩되는 서열, 또는 상기 영역의 5, 10, 15, 20, 30, 40, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1000개 뉴클레오티드 내에 있는 서열에 결합하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제133항 중 어느 한 항에 있어서, 예를 들어 실시예 2 내지 11에 기재된 바와 같이 측정될 때, 예를 들어 세포를 TNF-알파로 자극 시, 사이토카인, 예를 들어 케모카인의 수준의 감소를 초래하는, 방법.
- 제1항 내지 제134항 중 어느 한 항에 있어서, 예를 들어 실시예 2 내지 11에 기재된 바와 같이 측정될 때, 예를 들어 세포를 TNF-알파로 자극 시, 사이토카인(예를 들어, 케모카인)의 수준이 감소되는, 방법 또는 인간 세포.
- 제1항 내지 제135항 중 어느 한 항에 있어서, 예를 들어 실시예 2 또는 4 내지 11에 기재된 바와 같이 측정될 때, 예를 들어 세포를 TNF-알파로 자극 시, CXCL1, CXCL2, CXCL3, 및 IL8 중 하나 이상(예를 들어, 이들 중 2, 3개, 또는 모두)의 전사체 수준이 감소되는, 방법 또는 인간 세포.
- 제1항 내지 제136항 중 어느 한 항에 있어서, 예를 들어 세포를 TNF-알파로 자극 시, CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 및 IL8 중 하나 이상(예를 들어, 이들 중 2, 3개, 또는 모두)의 전사체 수준이 감소되는, 방법 또는 인간 세포.
- 제132항 내지 제137항 중 어느 한 항에 있어서, 상기 감소는 처리 전 수준 또는 파괴되지 않은 ASMC를 갖는 인간 세포와 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90%의 감소인, 방법 또는 인간 세포.
- 제1항 내지 제138항 중 어느 한 항에 있어서, 예를 들어 실시예 3에 기재된 바와 같이 측정될 때, 예를 들어 세포를 TNF-알파로 자극 시, CXCL1, CXCL2, CXCL3, 및 IL8 중 하나 이상(예를 들어, 이들 중 2, 3개, 또는 모두)의 단백질 수준(예를 들어, 분비된 단백질 수준)이 감소되는, 방법 또는 인간 세포.
- 제1항 내지 제139항 중 어느 한 항에 있어서, 예를 들어 세포를 TNF-알파로 자극 시, CXCL1, CXCL2, CXCL3, CXCL4, CXCL5, CXCL6, CXCL7, 및 IL8 중 하나 이상(예를 들어, 이들 중 2, 3개, 또는 모두)의 단백질 수준(예를 들어, 분비된 단백질 수준)이 감소되는, 방법 또는 인간 세포.
- 제140항에 있어서, 상기 감소는 처리 전 수준 또는 파괴되지 않은 ASMC를 갖는 인간 세포와 비교하여 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 90%의 감소인, 방법 또는 인간 세포.
- 제1항 내지 제141항 중 어느 한 항에 있어서, 제1 앵커 서열에 대한 CTCF의 결합의 감소, 예를 들어 ChIP 및 정량적 PCR에 의해 측정될 때, 파괴되지 않은 ASMC를 갖는 인간 세포와 비교하여 결합의 완전한 손실 또는 적어도 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%의 손실을 초래하는, 방법.
- 제1항 내지 제142항 중 어느 한 항에 있어서, 앵커 서열-매개 연접부의 파괴를 초래하는, 방법.
- 제1항 내지 제143항 중 어느 한 항에 있어서, 상기 세포의 집단은 부위-특이적 파괴제와 접촉되고, 제1 앵커 서열은 집단에서 세포의 적어도 50%, 60%, 70%, 80%, 90%, 또는 95%에서 편집되는, 방법.
- 제1항 내지 제144항 중 어느 한 항에 있어서, 상기 효과(예를 들어, 사이토카인 수준의 감소)는 제1 유전자 또는 제2 유전자를 개별적으로 억제하는 효과와 비교하여 상가적 또는 상승적인, 방법.
- 제1항 내지 제145항 중 어느 한 항에 있어서, 발현은 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주 동안 감소되는, 방법.
- 제1항 내지 제146항 중 어느 한 항에 있어서, 상기 세포는 염증성 질환, 예를 들어 면역 매개 염증성 질환을 갖는 대상체의 세포인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제147항 중 어느 한 항에 있어서, 상기 염증성 질환은 자가면역 장애, 예를 들어 류마티스 관절염인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제148항 중 어느 한 항에 있어서, 상기 염증성 질환은 병원성 감염, 예를 들어 바이러스 감염, 예를 들어 SARS-CoV2 감염과 연관되는, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제149항 중 어느 한 항에 있어서, 상기 염증성 질환은 중복 감염, 예를 들어 2개 이상의 병원체에 의해, 예를 들어 바이러스 및 박테리아에 의해(예를 들어, SARS-CoV2 및 연쇄상구균폐렴에 의해), 예를 들어 바이러스 및 진균에 의해(예를 들어, SARS-CoV2 및 털곰팡이(mucormycosis)에 의해) 유발되는 감염과 연관된, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제150항 중 어느 한 항에 있어서, 상기 세포는 류마티스 관절염, 염증성 관절염, 통풍, 천식, 호중구 천식, 호중구 피부병, 발 부종, 급성 호흡기 질환 증후군(ARDS), COVID-19, 건선, 염증성 장 질환, 감염(예를 들어, 병원균, 예를 들어 박테리아, 바이러스, 또는 진균에 의한 감염), 외상(예를 들어, 찰과상 또는 이물질), 방사선 또는 화학적 손상의 영향, 골관절염, 골관절염 관절 통증, 관절 통증, 염증성 통증, 급성 통증, 만성 통증, 방광염, 기관지염, 피부염, 피부병, 심혈관계 질환, 신경퇴행성 질환, 간 질환, 폐 질환, 신장 질환, 통증, 종창, 경직, 압통, 발적, 미열, 또는 질환 상태와 관련된 바이오마커(예를 들어, 사이토카인, 케모카인, 성장 인자, 면역 수용체, 감염 마커, 또는 염증성 마커)의 상승을 갖는 대상체의 세포인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제151항 중 어느 한 항에 있어서, 상기 세포는 류마티스 관절염, 건선, 또는 염증성 장 질환을 갖는 대상체의 세포인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제152항 중 어느 한 항에 있어서, 상기 세포는 류마티스 관절염, 통풍, 호중구 천식, 호중구 피부병, 급성 호흡기 질환 증후군(ARDS), 또는 COVID-19를 갖는 대상체의 세포인, 방법, 인간 세포, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제153항 중 어느 한 항에 있어서, 상기 앵커 서열-매개 연접부는 내부 인핸싱 서열을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제154항 중 어느 한 항에 있어서, 제2 유전자(및 선택적으로 제3, 제4, 제5, 제6, 제7, 또는 제8 유전자)는 제1 유전자와 동일한 방향으로 전사되는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제155항 중 어느 한 항에 있어서, 상기 제1 앵커 서열은 CTCF 결합 모티프, USF1 결합 모티프, YY1 결합 모티프, TAF3 결합 모티프, 또는 ZNF143 결합 모티프로부터 선택되는 결합 모티프를 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제156항 중 어느 한 항에 있어서, 상기 제1 앵커 서열은 CTCF 결합 모티프를 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제157항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 세포 내에서 내인성 핵형성 폴리펩티드(예를 들어, CTCF, USF1, YY1, TAF3, 또는 ZNF143)의 결합과 경쟁하기에 충분한 친화도로 제1 앵커 서열 또는 이의 근접부에 특이적으로 결합하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제158항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 제1 앵커 서열 내의 또는 이에 근접한 하나 이상의 뉴클레오티드를 추가하거나, 결실시키거나, 치환하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제159항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 제1 CRISPR/Cas 단백질 및 제1 가이드 RNA를 포함하는 제1 CRISPR/Cas 분자를 포함하는 표적화 모이어티 또는 이펙터 모이어티를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제160항 중 어느 한 항에 있어서, 제1 부위-특이적 파괴제는 제1 CRISPR/Cas 단백질 및 제1 가이드 RNA를 포함하는 제1 CRISPR/Cas 분자를 포함하는 제1 표적화 모이어티 또는 제1 이펙터 모이어티를 포함하고, 제2 부위-특이적 파괴제는 제2 CRISPR/Cas 단백질 및 제2 가이드 RNA를 포함하는 제2 CRISPR/Cas 분자를 포함하는 제2 표적화 모이어티 또는 제2 이펙터 모이어티를 포함하는, 방법 또는 시스템.
- 제1항 내지 제161항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 TAL 이펙터 분자, CRISPR/Cas 분자, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제, 또는 올리고뉴클레오티드를 포함하는 표적화 모이어티 또는 이펙터 모이어티를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제162항 중 어느 한 항에 있어서, 상기 제1 부위-특이적 파괴제는 TAL 이펙터 분자, CRISPR/Cas 분자, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제, 또는 올리고뉴클레오티드를 포함하는 제1 표적화 모이어티 또는 제1 이펙터 모이어티를 포함하고, 제2 부위-특이적 파괴제는 TAL 이펙터 분자, CRISPR/Cas 분자, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제, 또는 올리고뉴클레오티드를 포함하는 제2 표적화 모이어티 또는 제2 이펙터 모이어티를 포함하는, 방법 또는 시스템.
- 제1항 내지 제163항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 히스톤 변형 기능성, 예를 들어 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 또는 히스톤 데아세틸라제 활성을 포함하는 이펙터 모이어티를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제164항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 부위-특이적 파괴제는 히스톤 변형 기능성, 예를 들어 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 또는 히스톤 데아세틸라제 활성을 포함하는 이펙터 모이어티를 포함하는, 방법 또는 시스템.
- 제164항 또는 제165항에 있어서, 상기 이펙터 모이어티는 SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제164항 또는 제165항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제164항 또는 제165항에 있어서, 상기 이펙터 모이어티는 EZH2 또는 이 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제164항 또는 제165항에 있어서, 상기 이펙터 모이어티는 HDAC8 또는 이 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제169항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 DNA 변형 기능성, 예를 들어 DNA 메틸트랜스퍼라제를 포함하는 이펙터 모이어티를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제170항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 부위-특이적 파괴제는 DNA 변형 기능성, 예를 들어 DNA 메틸트랜스퍼라제를 포함하는 이펙터 모이어티를 포함하는, 방법 또는 시스템.
- 제170항 또는 제171항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, DNMT3a/3l, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제170항 또는 제171항에 있어서, 상기 이펙터 모이어티는 MQ1 또는 이 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제170항 또는 제171항에 있어서, 상기 이펙터 모이어티는 DNMT3(예를 들어, DNMT3a, DNMT3L, DNMT3a/3l, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, 또는 DNMT3B6) 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제174항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제175항 중 어느 한 항에 있어서, 제1 및/또는 제2 부위-특이적 파괴제는 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제175항 또는 제176항 중 어느 한 항에 있어서, 상기 이펙터 모이어티는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제177항에 있어서, 상기 이펙터 모이어티는 KRAB 또는 이 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제178항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 중합체를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제179항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 부위-특이적 파괴제는 중합체를 포함하는, 방법 또는 시스템.
- 제179항 또는 제180항에 있어서, 상기 중합체는 폴리아미드를 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제179항 또는 제180항에 있어서, 상기 중합체는 올리고뉴클레오티드인, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제182항에 있어서, 상기 올리고뉴클레오티드는 제1 앵커 서열의 보체 또는 제1 앵커 서열에 근접한 서열에 대한 보체를 포함하는 서열을 갖는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제182항에 있어서, 상기 올리고뉴클레오티드는 제2 앵커 서열의 보체 또는 제2 앵커 서열에 근접한 서열에 대한 보체를 포함하는 서열을 갖는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제182항 내지 제184항 중 어느 한 항에 있어서, 상기 올리고뉴클레오티드는 화학적 변형을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제179항 또는 제180항에 있어서, 상기 중합체는 펩티드 핵산인, 방법 또는 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제186항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 펩티드-핵산 믹스머(mixmer)를 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제187항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제(예를 들어, 부위-특이적 파괴제의 표적화 모이어티 또는 이펙터 모이어티)는 펩티드 또는 폴리펩티드를 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제188항에 있어서, 상기 폴리펩티드는 징크 핑거 폴리펩티드인, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제188항에 있어서, 상기 폴리펩티드는 전사 활성화제-유사 이펙터 뉴클레아제(TALEN) 폴리펩티드이거나 이를 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제190항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 소분자를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제191항 중 어느 한 항에 있어서, 제1 및/또는 제2 부위-특이적 파괴제는 소분자를 포함하는, 방법 또는 시스템.
- 제1항 내지 제192항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 이펙터 모이어티, 예를 들어 후성유전학적 변형제, 예를 들어 DNA 메틸트랜스퍼라제, 히스톤 데아세틸라제, 또는 히스톤 메틸트랜스퍼라제를 추가로 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제193항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 부위-특이적 파괴제는 이펙터 모이어티, 예를 들어 후성유전학적 변형제, 예를 들어 DNA 메틸트랜스퍼라제, 히스톤 데아세틸라제, 또는 히스톤 메틸트랜스퍼라제를 추가로 포함하는, 방법 또는 시스템.
- 제1항 내지 제194항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 융합 분자를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제195항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 부위-특이적 파괴제는 융합 분자를 포함하는, 방법 또는 시스템.
- 제1항 내지 제196항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는, 예를 들어 융합 분자로서, CRISPR/Cas 분자를 포함하는 표적화 모이어티, 및 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제197항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 부위-특이적 파괴제는, 예를 들어 융합 분자로서, CRISPR/Cas 분자를 포함하는 표적화 모이어티, 및 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 방법 또는 시스템.
- 제198항에 있어서, 상기 표적화 모이어티는 dCas9를 포함하고 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 부분을 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제199항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 표적화 모이어티는 dCas9를 포함하고 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 부분을 포함하는, 방법 또는 시스템.
- 제1항 내지 제177항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는, 예를 들어 융합 분자로서, CRISPR/Cas 분자를 포함하는 표적화 모이어티, 및 히스톤 메틸트랜스퍼라제를 포함하는 이펙터 모이어티를 포함하는, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제201항 중 어느 한 항에 있어서, 상기 제1 및/또는 제2 부위-특이적 파괴제는, 예를 들어 융합 분자로서, CRISPR/Cas 분자를 포함하는 표적화 모이어티, 및 히스톤 메틸트랜스퍼라제를 포함하는 이펙터 모이어티를 포함하는, 방법 또는 시스템.
- 제201항에 있어서, 상기 표적화 모이어티는 dCas9를 포함하고 이펙터 모이어티는 EZH2 또는 이의 기능성 변이체 또는 부분을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제196항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는, 예를 들어 융합 분자로서, CRISPR/Cas 분자를 포함하는 표적화 모이어티, 및 DNA 메틸트랜스퍼라제를 포함하는 이펙터 모이어티를 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제204항에 있어서, 상기 표적화 모이어티는 dCas9를 포함하고 이펙터 모이어티는 MQ1 또는 이의 기능성 변이체 또는 부분을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제203항에 있어서, 상기 표적화 모이어티는 dCas9를 포함하고 이펙터 모이어티는 DNMT3, 예를 들어 DNMT3a/3l 또는 이의 기능성 변이체 또는 부분을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제206항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는, 예를 들어 융합 분자로서, CRISPR/Cas 분자를 포함하는 표적화 모이어티, 히스톤 메틸트랜스퍼라제를 포함하는 제1 이펙터 모이어티, 및 전사 리프레서를 포함하는 제2 이펙터 모이어티를 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제207항에 있어서, 상기 표적화 모이어티는 dCas9를 포함하고, 제1 이펙터 모이어티는 EZH2 또는 이의 기능성 변이체 또는 부분을 포함하며, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 부분을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제208항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는, 예를 들어 융합 분자로서, CRISPR/Cas 분자를 포함하는 표적화 모이어티, 및 히스톤 데아세틸라제를 포함하는 이펙터 모이어티를 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제209항에 있어서, 상기 표적화 모이어티는 dCas9를 포함하고 이펙터 모이어티는 HDAC8 또는 이의 기능성 변이체 또는 부분을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제210항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는, 예를 들어 융합 분자로서, CRISPR/Cas 분자를 포함하는 표적화 모이어티, 히스톤 메틸트랜스퍼라제를 포함하는 제1 이펙터 모이어티, 및 히스톤 데아세틸라제를 포함하는 제2 이펙터 모이어티를 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제211항에 있어서, 상기 표적화 모이어티는 dCas9를 포함하고, 제1 이펙터 모이어티는 EZH2 또는 이의 기능성 변이체 또는 부분을 포함하며, 제2 이펙터 모이어티는 HDAC8 또는 이의 기능성 변이체 또는 부분을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제195항 내지 제212항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 서열번호 69, 71, 85, 201, 202, 204, 205, 207, 209, 211, 213, 215, 217, 또는 219 내지 242로부터 선택되는 핵산 서열, 이들 중 임의의 것의 상보적 또는 역상보적 서열에 의해 인코딩되는 아미노산 서열을 포함하거나, 이들 중 임의의 것과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 서열을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제195항 내지 제213항 중 어느 한 항에 있어서, 상기 부위-특이적 파괴제는 서열번호 70, 72, 82, 84, 86, 203, 206, 208, 210, 212, 214, 216, 또는 218 중 어느 하나로부터 선택되거나, 서열번호 219 내지 242 중 어느 하나로부터 선택되는 서열에 의해 인코딩되는 아미노산 서열을 포함하거나, 이들 중 임의의 것과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 서열을 포함하는, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제214항 중 어느 한 항에 있어서, 상기 세포는 대상체 내에 위치한, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제215항 중 어느 한 항에 있어서, 상기 세포는 생체외에 있는, 방법, 부위-특이적 파괴제.
- 제1항 내지 제216항 중 어느 한 항에 있어서, 상기 세포는 포유동물 세포, 예를 들어 인간 세포인, 방법 또는 부위-특이적 파괴제.
- 제1항 내지 제217항 중 어느 한 항에 있어서, 상기 세포는 체세포인, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제218항 중 어느 한 항에 있어서, 상기 세포는 1차 세포인, 방법, 부위-특이적 파괴제, 또는 시스템.
- 제1항 내지 제219항 중 어느 한 항에 있어서, 상기 접촉시키는 단계는 생체외에서 수행되는, 방법.
- 제220항에 있어서, 상기 접촉시키는 단계 전에, 대상체로부터 세포(예를 들어, 포유동물 세포)를 제거하는 단계를 추가로 포함하는, 방법.
- 제220항 또는 제221항에 있어서, 상기 접촉시키는 단계 후에, (b) 세포(예를 들어, 포유동물 세포)를 대상체에게 투여하는 단계를 추가로 포함하는, 방법.
- 제1항 내지 제222항 중 어느 한 항에 있어서, 상기 접촉시키는 단계는 부위-특이적 파괴제를 포함하는 조성물을 대상체에게 투여하는 것을 포함하는, 방법.
- 제223항에 있어서, 상기 부위-특이적 파괴제는 단일요법으로 투여되는, 방법.
- 제223항에 있어서, 상기 부위-특이적 파괴제는 제2 치료제와 조합하여 투여되는, 방법.
- 제1항 내지 제225항 중 어느 한 항의 세포(예를 들어, 인간 세포, 예를 들어 1차 인간 세포), 및 부위-특이적 파괴제, 또는 시스템을 포함하는 반응 혼합물.
- 염증성 장애를 갖는 대상체를 치료하는 방법으로서,
염증성 장애를 치료하기에 충분한 양으로 제1항 내지 제226항 중 어느 한 항의 부위-특이적 파괴제, 시스템 또는 반응 혼합물을 대상체에게 투여하는 단계
를 포함하며,
이에 의해 염증성 장애를 치료하는, 방법. - 제227항에 있어서, 상기 염증성 장애는 류마티스 관절염, 건선, 또는 염증성 장 질환인, 방법.
- 제227항 또는 제228항에 있어서, 상기 염증성 장애는 류마티스 관절염, 통풍, 호중구 천식, 호중구 피부병, 급성 호흡기 질환 증후군(ARDS), 또는 COVID-19인, 방법.
- 제227항 내지 제229항 중 어느 한 항에 있어서, 상기 염증성 장애는 자가면역 장애, 예를 들어 류마티스 관절염인, 방법.
- 제227항 내지 제229항 중 어느 한 항에 있어서, 상기 염증성 질환은 병원성 감염, 예를 들어 바이러스 감염, 예를 들어 SARS-CoV2 감염과 연관되는, 방법.
- 제227항 내지 제229항 중 어느 한 항에 있어서, 상기 염증성 질환은 중복 감염, 예를 들어 2개 이상의 병원체에 의해, 예를 들어 바이러스 및 박테리아에 의해(예를 들어, SARS-CoV2 및 연쇄상구균폐렴에 의해), 예를 들어 바이러스 및 진균에 의해(예를 들어, SARS-CoV2 및 털곰팡이에 의해) 유발되는 감염과 연관된, 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063085013P | 2020-09-29 | 2020-09-29 | |
US63/085,013 | 2020-09-29 | ||
US202163216487P | 2021-06-29 | 2021-06-29 | |
US63/216,487 | 2021-06-29 | ||
PCT/US2021/052720 WO2022072546A2 (en) | 2020-09-29 | 2021-09-29 | Compositions and methods for inhibiting the expression of multiple genes |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230079181A true KR20230079181A (ko) | 2023-06-05 |
Family
ID=80951794
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237014768A KR20230079181A (ko) | 2020-09-29 | 2021-09-29 | 다중 유전자의 발현을 억제하는 조성물 및 방법 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20230374549A1 (ko) |
EP (1) | EP4222259A2 (ko) |
JP (1) | JP2023543056A (ko) |
KR (1) | KR20230079181A (ko) |
AU (1) | AU2021354159A1 (ko) |
CA (1) | CA3193868A1 (ko) |
WO (1) | WO2022072546A2 (ko) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3867368A4 (en) * | 2018-10-15 | 2022-08-10 | Flagship Pioneering Innovations V, Inc. | DESTROYING THE ASSEMBLY OF A GENOMIC COMPLEX IN FUSION GENES |
-
2021
- 2021-09-29 JP JP2023519466A patent/JP2023543056A/ja active Pending
- 2021-09-29 CA CA3193868A patent/CA3193868A1/en active Pending
- 2021-09-29 WO PCT/US2021/052720 patent/WO2022072546A2/en active Application Filing
- 2021-09-29 EP EP21876425.6A patent/EP4222259A2/en active Pending
- 2021-09-29 KR KR1020237014768A patent/KR20230079181A/ko unknown
- 2021-09-29 US US18/028,975 patent/US20230374549A1/en active Pending
- 2021-09-29 AU AU2021354159A patent/AU2021354159A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2021354159A9 (en) | 2023-07-13 |
JP2023543056A (ja) | 2023-10-12 |
AU2021354159A1 (en) | 2023-05-04 |
WO2022072546A3 (en) | 2022-05-12 |
US20230374549A1 (en) | 2023-11-23 |
CA3193868A1 (en) | 2022-04-07 |
EP4222259A2 (en) | 2023-08-09 |
WO2022072546A2 (en) | 2022-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7306696B2 (ja) | Rna誘導型核酸修飾酵素及びその使用方法 | |
US20240167052A1 (en) | Rna-guided nucleic acid modifying enzymes and methods of use thereof | |
KR20210023833A (ko) | 프로그래밍가능한 염기 편집기 시스템을 이용하여 단일염기다형성을 편집하는 방법 | |
KR20210116526A (ko) | 증진된 항-신생물 활성 및 면역억제 내성을 갖는 변형된 면역 세포 | |
KR20210139265A (ko) | 표적 서열에서 핵염기를 변형하기 위한 아데노신 데아미나제 염기 편집기 및 이의 사용 방법 | |
KR20230074525A (ko) | 유전자 발현을 억제하기 위한 조성물 및 방법 | |
KR20210041008A (ko) | 핵산 표적 서열을 변형시키기 위한 다중-이펙터 핵염기 편집기 및 이를 이용하는 방법 | |
JP2023071855A (ja) | CRISPR-Casエフェクターポリペプチド及びその使用方法 | |
CN111801417A (zh) | 新的rna-可编程的内切核酸酶系统及其在基因组编辑和其他应用中的用途 | |
KR20220090512A (ko) | 액체암의 치료를 위한 조성물 및 방법 | |
WO2019089808A1 (en) | Class 2 crispr/cas compositions and methods of use | |
EP3704239A1 (en) | Casz compositions and methods of use | |
KR20210127206A (ko) | 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용하여 질환-관련 유전자를 편집하는 방법 | |
KR20210124280A (ko) | 표적-이탈 탈아미노화가 감소된 핵염기 편집기 및 이를 이용하여 핵염기 표적 서열을 변형시키는 방법 | |
KR20210077732A (ko) | Nme2cas9-데아미나아제 융합 단백질에 의한 프로그램 가능한 dna 염기 편집 | |
KR20180034402A (ko) | 신규한 crispr 효소 및 시스템 | |
KR20210125560A (ko) | 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용한 질환-관련 유전자의 스플라이스 수용체 부위 파괴 | |
WO2020023529A1 (en) | Rna-guided nucleic acid modifying enzymes and methods of use thereof | |
KR20220010540A (ko) | 프로그래밍가능한 염기 편집기 시스템을 이용하여 단일염기다형성을 편집하는 방법 | |
KR20220019685A (ko) | B형 간염 치료를 위한 조성물 및 방법 | |
KR20220066289A (ko) | 전사 또는 발현을 가능하게 하는 돌연변이를 편집하기 위한 조성물 및 방법 | |
KR20230003511A (ko) | 안면견갑상완 근이영양증에 대한 crispr-억제 | |
CA3237482A1 (en) | Precise genome editing using retrons | |
TW202421205A (zh) | 基因編輯組分、系統及使用方法 | |
KR20230079181A (ko) | 다중 유전자의 발현을 억제하는 조성물 및 방법 |