CN116615539A - 抑制基因表达的组合物和方法 - Google Patents
抑制基因表达的组合物和方法 Download PDFInfo
- Publication number
- CN116615539A CN116615539A CN202180077372.2A CN202180077372A CN116615539A CN 116615539 A CN116615539 A CN 116615539A CN 202180077372 A CN202180077372 A CN 202180077372A CN 116615539 A CN116615539 A CN 116615539A
- Authority
- CN
- China
- Prior art keywords
- expression
- repressor
- dna
- sequence
- targeting moiety
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000014509 gene expression Effects 0.000 title claims abstract description 940
- 238000000034 method Methods 0.000 title claims description 83
- 239000000203 mixture Substances 0.000 title description 17
- 230000002401 inhibitory effect Effects 0.000 title description 5
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 357
- 108020004414 DNA Proteins 0.000 claims description 383
- 230000008685 targeting Effects 0.000 claims description 320
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 205
- 150000007523 nucleic acids Chemical class 0.000 claims description 177
- 230000000694 effects Effects 0.000 claims description 175
- 102000004169 proteins and genes Human genes 0.000 claims description 165
- 102000039446 nucleic acids Human genes 0.000 claims description 153
- 108020004707 nucleic acids Proteins 0.000 claims description 153
- 239000012634 fragment Substances 0.000 claims description 141
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 118
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 112
- 229920001184 polypeptide Polymers 0.000 claims description 110
- 102100038970 Histone-lysine N-methyltransferase EZH2 Human genes 0.000 claims description 101
- 101000882127 Homo sapiens Histone-lysine N-methyltransferase EZH2 Proteins 0.000 claims description 101
- 238000010453 CRISPR/Cas method Methods 0.000 claims description 93
- 230000027455 binding Effects 0.000 claims description 78
- -1 e.g. Proteins 0.000 claims description 76
- 102100035043 Histone-lysine N-methyltransferase EHMT1 Human genes 0.000 claims description 70
- 102100038720 Histone deacetylase 9 Human genes 0.000 claims description 68
- 101001050886 Homo sapiens Lysine-specific histone demethylase 1A Proteins 0.000 claims description 62
- 102100024985 Lysine-specific histone demethylase 1A Human genes 0.000 claims description 61
- 102100038715 Histone deacetylase 8 Human genes 0.000 claims description 56
- 101001032118 Homo sapiens Histone deacetylase 8 Proteins 0.000 claims description 56
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 55
- 101001088887 Homo sapiens Lysine-specific demethylase 5C Proteins 0.000 claims description 45
- 102100033249 Lysine-specific demethylase 5C Human genes 0.000 claims description 45
- 239000013598 vector Substances 0.000 claims description 39
- 102100035042 Histone-lysine N-methyltransferase EHMT2 Human genes 0.000 claims description 38
- 102100023696 Histone-lysine N-methyltransferase SETDB1 Human genes 0.000 claims description 38
- 101000877312 Homo sapiens Histone-lysine N-methyltransferase EHMT2 Proteins 0.000 claims description 38
- 101000684609 Homo sapiens Histone-lysine N-methyltransferase SETDB1 Proteins 0.000 claims description 38
- 102100028998 Histone-lysine N-methyltransferase SUV39H1 Human genes 0.000 claims description 37
- 101001028782 Homo sapiens Histone-lysine N-methyltransferase EZH1 Proteins 0.000 claims description 37
- 101000696705 Homo sapiens Histone-lysine N-methyltransferase SUV39H1 Proteins 0.000 claims description 37
- 101000931374 Homo sapiens Zinc finger protein ZFPM1 Proteins 0.000 claims description 36
- 102100020993 Zinc finger protein ZFPM1 Human genes 0.000 claims description 36
- 101100455526 Drosophila melanogaster Lsd-2 gene Proteins 0.000 claims description 35
- 108091016366 Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 claims description 35
- 102100027770 Histone-lysine N-methyltransferase KMT5B Human genes 0.000 claims description 35
- 102100027788 Histone-lysine N-methyltransferase KMT5C Human genes 0.000 claims description 35
- 102100023676 Histone-lysine N-methyltransferase SETDB2 Human genes 0.000 claims description 35
- 102100028988 Histone-lysine N-methyltransferase SUV39H2 Human genes 0.000 claims description 35
- 101000877314 Homo sapiens Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 claims description 35
- 101001008821 Homo sapiens Histone-lysine N-methyltransferase KMT5B Proteins 0.000 claims description 35
- 101001008824 Homo sapiens Histone-lysine N-methyltransferase KMT5C Proteins 0.000 claims description 35
- 101000684615 Homo sapiens Histone-lysine N-methyltransferase SETDB2 Proteins 0.000 claims description 35
- 101000696699 Homo sapiens Histone-lysine N-methyltransferase SUV39H2 Proteins 0.000 claims description 35
- 101000613958 Homo sapiens Lysine-specific demethylase 2A Proteins 0.000 claims description 35
- 101000614013 Homo sapiens Lysine-specific demethylase 2B Proteins 0.000 claims description 35
- 101000613960 Homo sapiens Lysine-specific histone demethylase 1B Proteins 0.000 claims description 35
- 101001008816 Homo sapiens N-lysine methyltransferase KMT5A Proteins 0.000 claims description 35
- 102100040598 Lysine-specific demethylase 2A Human genes 0.000 claims description 35
- 102100040584 Lysine-specific demethylase 2B Human genes 0.000 claims description 35
- 102100040596 Lysine-specific histone demethylase 1B Human genes 0.000 claims description 35
- 102100027771 N-lysine methyltransferase KMT5A Human genes 0.000 claims description 35
- 108091005772 HDAC11 Proteins 0.000 claims description 34
- 102000003964 Histone deacetylase Human genes 0.000 claims description 34
- 108090000353 Histone deacetylase Proteins 0.000 claims description 34
- 102100039996 Histone deacetylase 1 Human genes 0.000 claims description 34
- 102100039385 Histone deacetylase 11 Human genes 0.000 claims description 34
- 102100039999 Histone deacetylase 2 Human genes 0.000 claims description 34
- 102100021455 Histone deacetylase 3 Human genes 0.000 claims description 34
- 102100021454 Histone deacetylase 4 Human genes 0.000 claims description 34
- 102100021453 Histone deacetylase 5 Human genes 0.000 claims description 34
- 102100022537 Histone deacetylase 6 Human genes 0.000 claims description 34
- 101001035024 Homo sapiens Histone deacetylase 1 Proteins 0.000 claims description 34
- 101001035011 Homo sapiens Histone deacetylase 2 Proteins 0.000 claims description 34
- 101000899282 Homo sapiens Histone deacetylase 3 Proteins 0.000 claims description 34
- 101000899259 Homo sapiens Histone deacetylase 4 Proteins 0.000 claims description 34
- 101000899255 Homo sapiens Histone deacetylase 5 Proteins 0.000 claims description 34
- 101000899330 Homo sapiens Histone deacetylase 6 Proteins 0.000 claims description 34
- 101001032113 Homo sapiens Histone deacetylase 7 Proteins 0.000 claims description 34
- 101001032092 Homo sapiens Histone deacetylase 9 Proteins 0.000 claims description 34
- 101000616738 Homo sapiens NAD-dependent protein deacetylase sirtuin-6 Proteins 0.000 claims description 34
- 101000709248 Homo sapiens NAD-dependent protein deacetylase sirtuin-7 Proteins 0.000 claims description 34
- 101000616727 Homo sapiens NAD-dependent protein deacylase sirtuin-5, mitochondrial Proteins 0.000 claims description 34
- 101000863629 Homo sapiens NAD-dependent protein lipoamidase sirtuin-4, mitochondrial Proteins 0.000 claims description 34
- 101001035694 Homo sapiens Polyamine deacetylase HDAC10 Proteins 0.000 claims description 34
- WWGBHDIHIVGYLZ-UHFFFAOYSA-N N-[4-[3-[[[7-(hydroxyamino)-7-oxoheptyl]amino]-oxomethyl]-5-isoxazolyl]phenyl]carbamic acid tert-butyl ester Chemical compound C1=CC(NC(=O)OC(C)(C)C)=CC=C1C1=CC(C(=O)NCCCCCCC(=O)NO)=NO1 WWGBHDIHIVGYLZ-UHFFFAOYSA-N 0.000 claims description 34
- 102100031455 NAD-dependent protein deacetylase sirtuin-1 Human genes 0.000 claims description 34
- 102100022913 NAD-dependent protein deacetylase sirtuin-2 Human genes 0.000 claims description 34
- 102100030710 NAD-dependent protein deacetylase sirtuin-3, mitochondrial Human genes 0.000 claims description 34
- 102100021840 NAD-dependent protein deacetylase sirtuin-6 Human genes 0.000 claims description 34
- 102100034376 NAD-dependent protein deacetylase sirtuin-7 Human genes 0.000 claims description 34
- 102100021839 NAD-dependent protein deacylase sirtuin-5, mitochondrial Human genes 0.000 claims description 34
- 102100030709 NAD-dependent protein lipoamidase sirtuin-4, mitochondrial Human genes 0.000 claims description 34
- 102100039388 Polyamine deacetylase HDAC10 Human genes 0.000 claims description 34
- 108091005770 SIRT3 Proteins 0.000 claims description 34
- 108010041191 Sirtuin 1 Proteins 0.000 claims description 34
- 108010041216 Sirtuin 2 Proteins 0.000 claims description 34
- 108700009124 Transcription Initiation Site Proteins 0.000 claims description 34
- 239000012636 effector Substances 0.000 claims description 32
- 102000011787 Histone Methyltransferases Human genes 0.000 claims description 31
- 108010036115 Histone Methyltransferases Proteins 0.000 claims description 31
- 108060004795 Methyltransferase Proteins 0.000 claims description 31
- 102000016397 Methyltransferase Human genes 0.000 claims description 31
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 claims description 30
- 108020005004 Guide RNA Proteins 0.000 claims description 30
- 101001088879 Homo sapiens Lysine-specific demethylase 5D Proteins 0.000 claims description 30
- 102100033143 Lysine-specific demethylase 5D Human genes 0.000 claims description 30
- 108010074870 Histone Demethylases Proteins 0.000 claims description 29
- 102000008157 Histone Demethylases Human genes 0.000 claims description 29
- 102100025169 Max-binding protein MNT Human genes 0.000 claims description 28
- 108091006107 transcriptional repressors Proteins 0.000 claims description 28
- 101001088883 Homo sapiens Lysine-specific demethylase 5B Proteins 0.000 claims description 27
- 102100033247 Lysine-specific demethylase 5B Human genes 0.000 claims description 27
- 150000002632 lipids Chemical class 0.000 claims description 27
- 239000008194 pharmaceutical composition Substances 0.000 claims description 25
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 claims description 24
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 claims description 24
- 101000613629 Homo sapiens Lysine-specific demethylase 4B Proteins 0.000 claims description 23
- 102100040860 Lysine-specific demethylase 4B Human genes 0.000 claims description 23
- 239000002105 nanoparticle Substances 0.000 claims description 19
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 claims description 18
- 101001088892 Homo sapiens Lysine-specific demethylase 5A Proteins 0.000 claims description 17
- 101000754924 Homo sapiens Ribosomal oxygenase 1 Proteins 0.000 claims description 17
- 102100033246 Lysine-specific demethylase 5A Human genes 0.000 claims description 17
- 102100022091 Ribosomal oxygenase 1 Human genes 0.000 claims description 17
- 230000007423 decrease Effects 0.000 claims description 17
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 claims description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 15
- 238000002965 ELISA Methods 0.000 claims description 15
- 108020004999 messenger RNA Proteins 0.000 claims description 15
- 230000002829 reductive effect Effects 0.000 claims description 15
- 230000004049 epigenetic modification Effects 0.000 claims description 13
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 claims description 12
- 108091034117 Oligonucleotide Proteins 0.000 claims description 11
- 230000032823 cell division Effects 0.000 claims description 11
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 10
- 230000001580 bacterial effect Effects 0.000 claims description 10
- 230000001404 mediated effect Effects 0.000 claims description 10
- 101000909250 Homo sapiens DNA (cytosine-5)-methyltransferase 3-like Proteins 0.000 claims description 9
- 241000191967 Staphylococcus aureus Species 0.000 claims description 9
- 102000015736 beta 2-Microglobulin Human genes 0.000 claims description 9
- 108010081355 beta 2-Microglobulin Proteins 0.000 claims description 9
- 102100024811 DNA (cytosine-5)-methyltransferase 3-like Human genes 0.000 claims description 8
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 claims description 8
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 claims description 8
- 108700028146 Genetic Enhancer Elements Proteins 0.000 claims description 7
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 claims description 7
- 102100038895 Myc proto-oncogene protein Human genes 0.000 claims description 7
- 102100031690 Erythroid transcription factor Human genes 0.000 claims description 6
- 102100040407 Heat shock 70 kDa protein 1B Human genes 0.000 claims description 6
- 101001066268 Homo sapiens Erythroid transcription factor Proteins 0.000 claims description 6
- 101001037968 Homo sapiens Heat shock 70 kDa protein 1B Proteins 0.000 claims description 6
- 101000584499 Homo sapiens Polycomb protein SUZ12 Proteins 0.000 claims description 6
- 102100030702 Polycomb protein SUZ12 Human genes 0.000 claims description 6
- 108010071034 Retinoblastoma-Binding Protein 4 Proteins 0.000 claims description 6
- 102000051614 SET domains Human genes 0.000 claims description 6
- 108700039010 SET domains Proteins 0.000 claims description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 6
- 230000001973 epigenetic effect Effects 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 108091092195 Intron Proteins 0.000 claims description 5
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 5
- 230000003831 deregulation Effects 0.000 claims description 5
- 230000002018 overexpression Effects 0.000 claims description 5
- 239000011701 zinc Substances 0.000 claims description 5
- 229910052725 zinc Inorganic materials 0.000 claims description 5
- 101100170936 Homo sapiens DNMT1 gene Proteins 0.000 claims description 4
- 101150061166 tetR gene Proteins 0.000 claims description 4
- 102100040202 Apolipoprotein B-100 Human genes 0.000 claims description 2
- 102100039398 C-X-C motif chemokine 2 Human genes 0.000 claims description 2
- 102100036189 C-X-C motif chemokine 3 Human genes 0.000 claims description 2
- 102100036150 C-X-C motif chemokine 5 Human genes 0.000 claims description 2
- 102100036153 C-X-C motif chemokine 6 Human genes 0.000 claims description 2
- 108700024394 Exon Proteins 0.000 claims description 2
- 102100027581 Forkhead box protein P3 Human genes 0.000 claims description 2
- 102100034221 Growth-regulated alpha protein Human genes 0.000 claims description 2
- 101000889953 Homo sapiens Apolipoprotein B-100 Proteins 0.000 claims description 2
- 101000889128 Homo sapiens C-X-C motif chemokine 2 Proteins 0.000 claims description 2
- 101000947193 Homo sapiens C-X-C motif chemokine 3 Proteins 0.000 claims description 2
- 101000947186 Homo sapiens C-X-C motif chemokine 5 Proteins 0.000 claims description 2
- 101000947177 Homo sapiens C-X-C motif chemokine 6 Proteins 0.000 claims description 2
- 101000861452 Homo sapiens Forkhead box protein P3 Proteins 0.000 claims description 2
- 101001069921 Homo sapiens Growth-regulated alpha protein Proteins 0.000 claims description 2
- 101001055222 Homo sapiens Interleukin-8 Proteins 0.000 claims description 2
- 101000947178 Homo sapiens Platelet basic protein Proteins 0.000 claims description 2
- 101000582950 Homo sapiens Platelet factor 4 Proteins 0.000 claims description 2
- 102100026236 Interleukin-8 Human genes 0.000 claims description 2
- 102100036154 Platelet basic protein Human genes 0.000 claims description 2
- 102100030304 Platelet factor 4 Human genes 0.000 claims description 2
- 108020005038 Terminator Codon Proteins 0.000 claims description 2
- 239000003937 drug carrier Substances 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 2
- 230000001629 suppression Effects 0.000 claims 2
- 102100025190 Histone-binding protein RBBP4 Human genes 0.000 claims 1
- 230000001105 regulatory effect Effects 0.000 abstract description 4
- 235000018102 proteins Nutrition 0.000 description 133
- 210000004027 cell Anatomy 0.000 description 82
- 235000001014 amino acid Nutrition 0.000 description 39
- 239000002773 nucleotide Substances 0.000 description 39
- 125000003729 nucleotide group Chemical group 0.000 description 39
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 33
- 229940024606 amino acid Drugs 0.000 description 30
- 230000035772 mutation Effects 0.000 description 29
- 108091033409 CRISPR Proteins 0.000 description 28
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 27
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 27
- 238000006467 substitution reaction Methods 0.000 description 27
- 150000001413 amino acids Chemical class 0.000 description 24
- 210000004899 c-terminal region Anatomy 0.000 description 23
- 208000035475 disorder Diseases 0.000 description 22
- 230000000875 corresponding effect Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 239000003623 enhancer Substances 0.000 description 17
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 16
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 16
- 239000002585 base Substances 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 12
- 108020001507 fusion proteins Proteins 0.000 description 12
- 239000011541 reaction mixture Substances 0.000 description 12
- 238000011144 upstream manufacturing Methods 0.000 description 12
- 201000010099 disease Diseases 0.000 description 11
- 102000037865 fusion proteins Human genes 0.000 description 11
- 238000003780 insertion Methods 0.000 description 11
- 230000037431 insertion Effects 0.000 description 11
- 239000002777 nucleoside Substances 0.000 description 11
- 239000000126 substance Substances 0.000 description 11
- 108010042407 Endonucleases Proteins 0.000 description 10
- 108091093037 Peptide nucleic acid Proteins 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 8
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 8
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 8
- 239000003814 drug Substances 0.000 description 8
- 230000002255 enzymatic effect Effects 0.000 description 8
- 150000003833 nucleoside derivatives Chemical class 0.000 description 8
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 7
- 102000004533 Endonucleases Human genes 0.000 description 7
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 7
- 101150038500 cas9 gene Proteins 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 238000001727 in vivo Methods 0.000 description 7
- 208000024891 symptom Diseases 0.000 description 7
- 229940124597 therapeutic agent Drugs 0.000 description 7
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 101100194362 Schizosaccharomyces pombe (strain 972 / ATCC 24843) res1 gene Proteins 0.000 description 6
- 108091028113 Trans-activating crRNA Proteins 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 150000004713 phosphodiesters Chemical class 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 230000009870 specific binding Effects 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 238000011282 treatment Methods 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 5
- 239000002202 Polyethylene glycol Substances 0.000 description 5
- 102000007508 Retinoblastoma-Binding Protein 4 Human genes 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 230000002209 hydrophobic effect Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 229920001223 polyethylene glycol Polymers 0.000 description 5
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 4
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- 229930010555 Inosine Natural products 0.000 description 4
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 4
- 101710163270 Nuclease Proteins 0.000 description 4
- 102000055027 Protein Methyltransferases Human genes 0.000 description 4
- 108700040121 Protein Methyltransferases Proteins 0.000 description 4
- 241000194020 Streptococcus thermophilus Species 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- 229930182470 glycoside Natural products 0.000 description 4
- 150000002338 glycosides Chemical class 0.000 description 4
- 229960003786 inosine Drugs 0.000 description 4
- 230000006911 nucleation Effects 0.000 description 4
- 238000010899 nucleation Methods 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- HLYBTPMYFWWNJN-UHFFFAOYSA-N 2-(2,4-dioxo-1h-pyrimidin-5-yl)-2-hydroxyacetic acid Chemical compound OC(=O)C(O)C1=CNC(=O)NC1=O HLYBTPMYFWWNJN-UHFFFAOYSA-N 0.000 description 3
- 241001478240 Coccus Species 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 102100031780 Endonuclease Human genes 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 108090000190 Thrombin Proteins 0.000 description 3
- 239000011230 binding agent Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000010804 cDNA synthesis Methods 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 230000005782 double-strand break Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 230000011987 methylation Effects 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 102000040430 polynucleotide Human genes 0.000 description 3
- 108091033319 polynucleotide Proteins 0.000 description 3
- 239000002157 polynucleotide Substances 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- 229960004072 thrombin Drugs 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- RIFDKYBNWNPCQK-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-(6-imino-3-methylpurin-9-yl)oxolane-3,4-diol Chemical compound C1=2N(C)C=NC(=N)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RIFDKYBNWNPCQK-IOSLPCCCSA-N 0.000 description 2
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 2
- QLOCVMVCRJOTTM-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 QLOCVMVCRJOTTM-TURQNECASA-N 0.000 description 2
- PISWNSOQFZRVJK-XLPZGREQSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 PISWNSOQFZRVJK-XLPZGREQSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 2
- RFLVMTUMFYRZCB-UHFFFAOYSA-N 1-methylguanine Chemical compound O=C1N(C)C(N)=NC2=C1N=CN2 RFLVMTUMFYRZCB-UHFFFAOYSA-N 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 2
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 2
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- RHFUOMFWUGWKKO-XVFCMESISA-N 2-thiocytidine Chemical compound S=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RHFUOMFWUGWKKO-XVFCMESISA-N 0.000 description 2
- LMMLLWZHCKCFQA-UGKPPGOTSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-prop-1-ynyloxolan-2-yl]pyrimidin-2-one Chemical compound C1=CC(N)=NC(=O)N1[C@]1(C#CC)O[C@H](CO)[C@@H](O)[C@H]1O LMMLLWZHCKCFQA-UGKPPGOTSA-N 0.000 description 2
- XXSIICQLPUAUDF-TURQNECASA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-ynylpyrimidin-2-one Chemical compound O=C1N=C(N)C(C#CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XXSIICQLPUAUDF-TURQNECASA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 2
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 2
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 2
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 2
- KDOPAZIWBAHVJB-UHFFFAOYSA-N 5h-pyrrolo[3,2-d]pyrimidine Chemical compound C1=NC=C2NC=CC2=N1 KDOPAZIWBAHVJB-UHFFFAOYSA-N 0.000 description 2
- UEHOMUNTZPIBIL-UUOKFMHZSA-N 6-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-7h-purin-8-one Chemical compound O=C1NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UEHOMUNTZPIBIL-UUOKFMHZSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 101100193720 Caenorhabditis elegans rbg-1 gene Proteins 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 2
- 102220605961 Cytosolic arginine sensor for mTORC1 subunit 2_D11A_mutation Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical class OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 101000753286 Homo sapiens Transcription intermediary factor 1-beta Proteins 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- HYVABZIGRDEKCD-UHFFFAOYSA-N N(6)-dimethylallyladenine Chemical compound CC(C)=CCNC1=NC=NC2=C1N=CN2 HYVABZIGRDEKCD-UHFFFAOYSA-N 0.000 description 2
- 241000588653 Neisseria Species 0.000 description 2
- 241000588650 Neisseria meningitidis Species 0.000 description 2
- 102000002488 Nucleoplasmin Human genes 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 239000004952 Polyamide Substances 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 102100022012 Transcription intermediary factor 1-beta Human genes 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical class OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 2
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 108010045512 cohesins Proteins 0.000 description 2
- 230000009918 complex formation Effects 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 238000009472 formulation Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 150000002402 hexoses Chemical class 0.000 description 2
- 102000057967 human DNMT1 Human genes 0.000 description 2
- 239000001257 hydrogen Substances 0.000 description 2
- 229910052739 hydrogen Inorganic materials 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- AWJUIBRHMBBTKR-UHFFFAOYSA-N isoquinoline Chemical compound C1=NC=CC2=CC=CC=C21 AWJUIBRHMBBTKR-UHFFFAOYSA-N 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 210000004379 membrane Anatomy 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 239000002667 nucleating agent Substances 0.000 description 2
- 108060005597 nucleoplasmin Proteins 0.000 description 2
- GJVFBWCTGUSGDD-UHFFFAOYSA-L pentamethonium bromide Chemical compound [Br-].[Br-].C[N+](C)(C)CCCCC[N+](C)(C)C GJVFBWCTGUSGDD-UHFFFAOYSA-L 0.000 description 2
- 229920002647 polyamide Polymers 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 235000004252 protein component Nutrition 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- RHFUOMFWUGWKKO-UHFFFAOYSA-N s2C Natural products S=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 RHFUOMFWUGWKKO-UHFFFAOYSA-N 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 125000001273 sulfonato group Chemical group [O-]S(*)(=O)=O 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- MPXDAIBTYWGBSL-UHFFFAOYSA-N 2,4-difluoro-1-methylbenzene Chemical compound CC1=CC=C(F)C=C1F MPXDAIBTYWGBSL-UHFFFAOYSA-N 0.000 description 1
- SGAKLDIYNFXTCK-UHFFFAOYSA-N 2-[(2,4-dioxo-1h-pyrimidin-5-yl)methylamino]acetic acid Chemical compound OC(=O)CNCC1=CNC(=O)NC1=O SGAKLDIYNFXTCK-UHFFFAOYSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- XMSMHKMPBNTBOD-UHFFFAOYSA-N 2-dimethylamino-6-hydroxypurine Chemical compound N1C(N(C)C)=NC(=O)C2=C1N=CN2 XMSMHKMPBNTBOD-UHFFFAOYSA-N 0.000 description 1
- SMADWRYCYBUIKH-UHFFFAOYSA-N 2-methyl-7h-purin-6-amine Chemical compound CC1=NC(N)=C2NC=NC2=N1 SMADWRYCYBUIKH-UHFFFAOYSA-N 0.000 description 1
- KOLPWZCZXAMXKS-UHFFFAOYSA-N 3-methylcytosine Chemical compound CN1C(N)=CC=NC1=O KOLPWZCZXAMXKS-UHFFFAOYSA-N 0.000 description 1
- LOJNBPNACKZWAI-UHFFFAOYSA-N 3-nitro-1h-pyrrole Chemical compound [O-][N+](=O)C=1C=CNC=1 LOJNBPNACKZWAI-UHFFFAOYSA-N 0.000 description 1
- GJAKJCICANKRFD-UHFFFAOYSA-N 4-acetyl-4-amino-1,3-dihydropyrimidin-2-one Chemical compound CC(=O)C1(N)NC(=O)NC=C1 GJAKJCICANKRFD-UHFFFAOYSA-N 0.000 description 1
- QCXGJTGMGJOYDP-UHFFFAOYSA-N 4-methyl-1h-benzimidazole Chemical compound CC1=CC=CC2=C1N=CN2 QCXGJTGMGJOYDP-UHFFFAOYSA-N 0.000 description 1
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 1
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 1
- MQJSSLBGAQJNER-UHFFFAOYSA-N 5-(methylaminomethyl)-1h-pyrimidine-2,4-dione Chemical compound CNCC1=CNC(=O)NC1=O MQJSSLBGAQJNER-UHFFFAOYSA-N 0.000 description 1
- WPYRHVXCOQLYLY-UHFFFAOYSA-N 5-[(methoxyamino)methyl]-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CONCC1=CNC(=S)NC1=O WPYRHVXCOQLYLY-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- VKLFQTYNHLDMDP-PNHWDRBUSA-N 5-carboxymethylaminomethyl-2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C(CNCC(O)=O)=C1 VKLFQTYNHLDMDP-PNHWDRBUSA-N 0.000 description 1
- ZFTBZKVVGZNMJR-UHFFFAOYSA-N 5-chlorouracil Chemical compound ClC1=CNC(=O)NC1=O ZFTBZKVVGZNMJR-UHFFFAOYSA-N 0.000 description 1
- KSNXJLQDQOIRIP-UHFFFAOYSA-N 5-iodouracil Chemical compound IC1=CNC(=O)NC1=O KSNXJLQDQOIRIP-UHFFFAOYSA-N 0.000 description 1
- KELXHQACBIUYSE-UHFFFAOYSA-N 5-methoxy-1h-pyrimidine-2,4-dione Chemical compound COC1=CNC(=O)NC1=O KELXHQACBIUYSE-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- VKKXEIQIGGPMHT-UHFFFAOYSA-N 7h-purine-2,8-diamine Chemical compound NC1=NC=C2NC(N)=NC2=N1 VKKXEIQIGGPMHT-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- 108091029430 CpG site Proteins 0.000 description 1
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 1
- 102220605836 Cytosolic arginine sensor for mTORC1 subunit 2_E1369R_mutation Human genes 0.000 description 1
- 102220605919 Cytosolic arginine sensor for mTORC1 subunit 2_E1449H_mutation Human genes 0.000 description 1
- 102220605899 Cytosolic arginine sensor for mTORC1 subunit 2_R1556A_mutation Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 101100219622 Escherichia coli (strain K12) casC gene Proteins 0.000 description 1
- 101100382541 Escherichia coli (strain K12) casD gene Proteins 0.000 description 1
- 101100326871 Escherichia coli (strain K12) ygbF gene Proteins 0.000 description 1
- 101100005249 Escherichia coli (strain K12) ygcB gene Proteins 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 102100033840 General transcription factor IIF subunit 1 Human genes 0.000 description 1
- 102100032863 General transcription factor IIH subunit 3 Human genes 0.000 description 1
- 241000606790 Haemophilus Species 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 102000008949 Histocompatibility Antigens Class I Human genes 0.000 description 1
- 108010088652 Histocompatibility Antigens Class I Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000909242 Homo sapiens DNA (cytosine-5)-methyltransferase 3A Proteins 0.000 description 1
- 101000666405 Homo sapiens General transcription factor IIH subunit 1 Proteins 0.000 description 1
- 101000655398 Homo sapiens General transcription factor IIH subunit 2 Proteins 0.000 description 1
- 101000655391 Homo sapiens General transcription factor IIH subunit 3 Proteins 0.000 description 1
- 101000655406 Homo sapiens General transcription factor IIH subunit 4 Proteins 0.000 description 1
- 101000655402 Homo sapiens General transcription factor IIH subunit 5 Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241001112693 Lachnospiraceae Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241001082241 Lythrum hyssopifolia Species 0.000 description 1
- 101150039798 MYC gene Proteins 0.000 description 1
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 1
- 101000909241 Mus musculus DNA (cytosine-5)-methyltransferase 3A Proteins 0.000 description 1
- 101100332083 Mus musculus Dnmt3l gene Proteins 0.000 description 1
- 101100387128 Myxococcus xanthus (strain DK1622) devR gene Proteins 0.000 description 1
- 101100387131 Myxococcus xanthus (strain DK1622) devS gene Proteins 0.000 description 1
- SGSSKEDGVONRGC-UHFFFAOYSA-N N(2)-methylguanine Chemical compound O=C1NC(NC)=NC2=C1N=CN2 SGSSKEDGVONRGC-UHFFFAOYSA-N 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000606860 Pasteurella Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241000202917 Spiroplasma Species 0.000 description 1
- 241000202909 Spiroplasma monobiae Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 229930182558 Sterol Natural products 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 102100040296 TATA-box-binding protein Human genes 0.000 description 1
- 101100059152 Thermococcus onnurineus (strain NA1) csm1 gene Proteins 0.000 description 1
- 101100273269 Thermus thermophilus (strain ATCC 27634 / DSM 579 / HB8) cse3 gene Proteins 0.000 description 1
- 108010083262 Transcription Factor TFIIA Proteins 0.000 description 1
- 102000006289 Transcription Factor TFIIA Human genes 0.000 description 1
- 108010083268 Transcription Factor TFIID Proteins 0.000 description 1
- 108090000941 Transcription factor TFIIB Proteins 0.000 description 1
- 102000004408 Transcription factor TFIIB Human genes 0.000 description 1
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 1
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241001148134 Veillonella Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000012382 advanced drug delivery Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 101150090505 cas10 gene Proteins 0.000 description 1
- 101150059443 cas12a gene Proteins 0.000 description 1
- 101150117416 cas2 gene Proteins 0.000 description 1
- 101150055191 cas3 gene Proteins 0.000 description 1
- 101150111685 cas4 gene Proteins 0.000 description 1
- 101150049463 cas5 gene Proteins 0.000 description 1
- 101150106467 cas6 gene Proteins 0.000 description 1
- 101150044165 cas7 gene Proteins 0.000 description 1
- 101150055766 cat gene Proteins 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000008045 co-localization Effects 0.000 description 1
- 238000012761 co-transfection Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 102000049154 human DNMT3L Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 125000001183 hydrocarbyl group Chemical group 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000009063 long-term regulation Effects 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- WIWYTVIDXZPFDU-UHFFFAOYSA-N methyl 2-(2,4-dioxo-1h-pyrimidin-5-yl)-2-hydroxyacetate Chemical compound COC(=O)C(O)C1=CNC(=O)NC1=O WIWYTVIDXZPFDU-UHFFFAOYSA-N 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- XJVXMWNLQRTRGH-UHFFFAOYSA-N n-(3-methylbut-3-enyl)-2-methylsulfanyl-7h-purin-6-amine Chemical compound CSC1=NC(NCCC(C)=C)=C2NC=NC2=N1 XJVXMWNLQRTRGH-UHFFFAOYSA-N 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 230000010399 physical interaction Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- YAAWASYJIRZXSZ-UHFFFAOYSA-N pyrimidine-2,4-diamine Chemical compound NC1=CC=NC(N)=N1 YAAWASYJIRZXSZ-UHFFFAOYSA-N 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- QQXQGKSPIMGUIZ-AEZJAUAXSA-N queuosine Chemical compound C1=2C(=O)NC(N)=NC=2N([C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=C1CN[C@H]1C=C[C@H](O)[C@@H]1O QQXQGKSPIMGUIZ-AEZJAUAXSA-N 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 230000009834 selective interaction Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000009064 short-term regulation Effects 0.000 description 1
- 230000007781 signaling event Effects 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 150000003432 sterols Chemical class 0.000 description 1
- 235000003702 sterols Nutrition 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000011285 therapeutic regimen Methods 0.000 description 1
- 108010014677 transcription factor TFIIE Proteins 0.000 description 1
- 108010014678 transcription factor TFIIF Proteins 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- WCNMEQDMUYVWMJ-JPZHCBQBSA-N wybutoxosine Chemical compound C1=NC=2C(=O)N3C(CC([C@H](NC(=O)OC)C(=O)OC)OO)=C(C)N=C3N(C)C=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WCNMEQDMUYVWMJ-JPZHCBQBSA-N 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Landscapes
- Peptides Or Proteins (AREA)
Abstract
本披露涉及用于调节细胞中靶基因的表达的表达阻遏物和表达阻遏系统。
Description
相关申请的交叉引用
本申请要求2020年9月24日提交的美国临时申请63/082,555和2021年9月10日提交的63/242,957的权益。上述申请的内容特此通过引用以其全文并入。
序列表
本申请包含序列表,该序列表已以ASCII格式电子提交,并通过援引以其全文并入本文。于2021年9月17日创建的所述ASCII副本命名为O2057-7017WO_SL.txt且大小为694,831字节。
背景技术
基因表达的错误调控是许多疾病的根本原因(例如,在哺乳动物中,例如人类)。虽然存在短时间调节基因表达的技术,但许多疾病的治疗需要稳定、长期的基因表达调节。需要新的工具、系统和方法来稳定地改变(例如,减少)疾病相关基因的表达。
发明内容
本披露尤其提供可用于调节(例如,降低)靶基因表达的表达阻遏物和表达阻遏系统。
在一些方面,表达阻遏物包含DNA靶向部分和能够调节(例如,降低)靶基因表达的阻遏物结构域。在一些实施例中,表达阻遏物包含DNA靶向部分、第一阻遏物结构域和第二阻遏物结构域。在一些实施例中,第一阻遏物结构域不同于第二阻遏物结构域。在一些实施例中,第一阻遏物结构域与第二阻遏物结构域相同。
在一些方面,本披露的特征在于表达阻遏系统,其包含含有第一DNA靶向部分和第一阻遏物结构域的第一表达阻遏物,以及含有第二DNA靶向部分和第二阻遏物结构域的第二表达阻遏物。在一些实施例中,第一DNA靶向部分特异性结合第一DNA序列,并且第二DNA靶向部分特异性结合不同于第一DNA序列的第二DNA序列。在一些实施例中,第一阻遏物结构域不同于第二阻遏物结构域。在一些实施例中,表达阻遏系统包括:(i)包含第一DNA靶向部分、第一阻遏物结构域和第二阻遏物结构域的第一表达阻遏物,和(ii)包含第二DNA靶向部分和第一阻遏物结构域的第二表达阻遏物。在一些实施例中,所有三个阻遏物结构域都不同。在一些实施例中,至少两个阻遏物结构域是相同的。在一些实施例中,表达阻遏系统包括:(i)包含第一DNA靶向部分、第一阻遏物结构域和第二阻遏物结构域的第一表达阻遏物,和(ii)包含第二DNA靶向部分、第一阻遏物结构域和第二阻遏物结构域的第二表达阻遏物。在一些实施例中,所有四个阻遏物结构域都不同。在一些实施例中,至少两个阻遏物结构域是相同的。
通常,表达阻遏系统对靶基因表达的调节涉及第一表达阻遏物和第二表达阻遏物分别与第一和第二DNA序列的结合。第一和第二DNA序列的结合将第一和第二阻遏物结构域的功能定位于那些位点。不希望受理论的束缚,在一些实施例中,认为使用第一和第二阻遏物结构域的功能稳定地阻遏与第一和/或第二DNA序列相关或包含第一和/或第二DNA序列的靶基因的表达,例如,其中第一和/或第二DNA序列是或包含靶基因或一个或多个可操作地连接的转录控制元件的序列。
在一些方面,本披露提供了表达阻遏物或表达阻遏系统,其包含:结合包含SEQ IDNO:1-21序列的至少14、15、16、17、18、19或20个核苷酸的基因组基因座的靶向部分,其中表达阻遏物或表达阻遏系统能够降低靶基因的表达。
在一些方面,本披露提供了表达阻遏物,其包含:DNA靶向部分(其中任选地,DNA靶向部分包含CRISPR/Cas分子,例如无催化活性的CRISPR/Cas蛋白),其结合可操作地连接至靶基因的转录调控元件(例如启动子或转录起始位点(TSS))),或所述转录调控元件近侧的序列;和阻遏物结构域。在一些实施例中,表达阻遏物包含DNA靶向部分(其中任选地,DNA靶向部分包含CRISPR/Cas分子,例如无催化活性的CRISPR/Cas蛋白),其结合可操作地连接至靶基因的转录调控元件(例如启动子或转录起始位点(TSS)))或所述转录调控元件近侧的序列;第一阻遏物结构域与第二阻遏物结构域。在一些实施例中,第一阻遏物结构域与第二阻遏物结构域相同。在一些实施例中,第一阻遏物结构域与第二阻遏物结构域不同。
在一些方面,本披露提供了表达阻遏系统,其包含:(i)第一表达阻遏物,该第一表达阻遏物包含第一DNA靶向部分(其中任选地,DNA靶向部分包含CRISPR/Cas分子,例如无催化活性的CRISPR/Cas蛋白),其结合可操作地连接至靶基因的转录调控元件(例如启动子或转录起始位点(TSS))),或所述转录调控元件近侧的序列;和第一阻遏物结构域,以及第二表达阻遏物,该第二表达阻遏物包含第二DNA靶向部分(其中任选地,DNA靶向部分包含CRISPR/Cas分子,例如无催化活性的CRISPR/Cas蛋白),其结合可操作地连接至靶基因的转录调控元件(例如启动子或转录起始位点(TSS))),或所述转录调控元件近侧的序列;和第一阻遏物结构域。在一些实施例中,第一表达阻遏物和第二表达阻遏物的第一阻遏物结构域相同。在一些实施例中,第一和第二表达阻遏物的第一阻遏物结构域不同。在一些实施例中,第一DNA靶向部分和第二DNA靶向部分相同。在一些实施例中,第一DNA靶向部分和第二DNA靶向部分不同。在一些实施例中,表达阻遏系统包含第一表达阻遏物和第二表达阻遏物,该第一表达阻遏物包含第一DNA靶向部分(其中任选地,DNA靶向部分包含CRISPR/Cas分子,例如无催化活性的CRISPR/Cas蛋白),其结合可操作地连接至靶基因的转录调控元件(例如启动子或转录起始位点(TSS)))或所述转录调控元件近侧的序列;第一阻遏物结构域与第二阻遏物结构域;该第二表达阻遏物包含第二DNA靶向部分(其中任选地,DNA靶向部分包含CRISPR/Cas分子,例如无催化活性的CRISPR/Cas蛋白),其结合可操作地连接至靶基因的转录调控元件(例如启动子或转录起始位点(TSS))),或所述转录调控元件近侧的序列;第一阻遏物结构域和第二阻遏物结构域。在一些实施例中,第一表达阻遏物和第二表达阻遏物的第一阻遏物结构域相同。在一些实施例中,第一和第二表达阻遏物的第一阻遏物结构域不同。在一些实施例中,第一表达阻遏物和第二表达阻遏物的第二阻遏物结构域相同。在一些实施例中,第一和第二表达阻遏物的第二阻遏物结构域不同。
在一些方面,本披露的特征在于编码表达阻遏物或其组分(例如,gRNA)的核酸。在一些方面,本披露涉及编码第一表达阻遏物、第二表达阻遏物、两者或其组分(例如,gRNA)的核酸。在一些方面,本披露涉及包含本文描述的核酸的载体。在一些方面,本披露涉及包含本文所述的表达阻遏物、表达阻遏系统、核酸或载体的细胞。在一些方面,本披露涉及包含本文所述的载体、核酸、表达阻遏系统或表达阻遏物的脂质纳米颗粒。在一些方面,本披露涉及包含本文所述的表达阻遏物、表达阻遏系统、核酸、载体或脂质纳米颗粒的反应混合物。在一些方面,本披露涉及包含本文所述的表达阻遏系统、核酸或载体的药物组合物。
在一些方面,本披露涉及降低靶基因的表达的方法,该方法包括提供本文所述的表达阻遏物或表达阻遏系统,并使该靶基因和/或一个或多个可操作地连接的转录控制元件与该表达阻遏物或该表达阻遏系统接触,从而降低该靶基因的表达。
在一些方面,本披露涉及治疗与受试者中靶基因的过度表达相关的病症的方法,该方法包括向该受试者施用本文所述的表达阻遏物或表达阻遏系统、核酸或载体,从而治疗该病症。
在一些方面,本披露涉及治疗与受试者中靶基因的错误调控相关的病症的方法,该方法包括向该受试者施用本文所述的表达阻遏物或表达阻遏系统、核酸或载体,从而治疗该病症。
任何前述方法或组合物的附加特征包括以下列举的实施例中的一个或多个。
本领域技术人员将认知到、或不使用过度常规实验就能够确定本文所述发明的特定实施例的许多等效实施例。这样的等同形式意在由以下列举的实施例所涵盖。
本文提及的所有出版物、专利申请、专利和其他参考(例如,序列数据库参考号)通过引用以其全文而结合。例如,本文提及的所有GenBank、Unigene和Entrez序列(例如,在本文的任一表中)均通过引用而结合。除非另外指明,否则本文指定的序列登录号(包括在本文任一表中)是指截至2019年9月23日的当前数据库条目。当一个基因或蛋白质参考多个序列登录号时,涵盖所有的序列变体。
列举的实施例
1.一种表达阻遏物,其包含:
DNA靶向部分和
阻遏物结构域,
其中该表达阻遏物能够降低靶基因的表达。
2.如实施例1所述的表达阻遏物,其中该DNA靶向部分结合转录调控元件(例如,启动子、增强子、超级增强子或转录起始位点(TSS)),该转录调控元件可操作地连接至该靶基因或结合所述转录调控元件近侧的序列。
3.如实施例1或2所述的表达阻遏物,其中该阻遏物结构域共价连接至该DNA靶向部分。
4.如实施例1或2所述的表达阻遏物,其中该阻遏物结构域通过接头连接至该DNA靶向部分。
5.如实施例1-4中任一项所述的表达阻遏物,其中该阻遏物结构域在该DNA靶向部分的C末端。
6.如实施例1-4中任一项所述的表达阻遏物,其中该阻遏物结构域在该DNA靶向部分的N末端。
7.如实施例1-6中任一项所述的表达阻遏物,其中该阻遏物结构域由选自SEQ IDNO:47-56中任一个的核苷酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列编码。
8.如实施例1-7中任一项所述的表达阻遏物,其中该阻遏物结构域包含根据SEQID NO:57-66、90中任一个的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
9.如前述实施例中任一项所述的表达阻遏物,其中该阻遏物结构域是MQ1或其功能变体或片段,例如,其中该阻遏物结构域包含SEQ ID NO:57或90的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,其中任选地该阻遏物结构域在该DNA靶向部分的C末端。
10.如前述实施例中任一项所述的表达阻遏物,其中该阻遏物结构域是DNMT1或其功能变体或片段,例如,其中该阻遏物结构域包含SEQ ID NO:58的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,其中任选地该阻遏物结构域在该DNA靶向部分的C末端。
11.如前述实施例中任一项所述的表达阻遏物,其中该阻遏物结构域是DNMT3a/3L或其功能变体或片段,例如,其中该阻遏物结构域包含SEQ ID NO:59或60的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,其中任选地该阻遏物结构域在该DNA靶向部分的C末端。
12.如前述实施例中任一项所述的表达阻遏物,其中该阻遏物结构域是KRAB或其功能变体或片段,例如,其中该阻遏物结构域包含SEQ ID NO:61的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,其中任选地该阻遏物结构域在该DNA靶向部分的C末端。
13.如前述实施例中任一项所述的表达阻遏物,其中该阻遏物结构域是G9A或其功能变体或片段,例如,其中该阻遏物结构域包含SEQ ID NO:62的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,其中任选地该阻遏物结构域在该DNA靶向部分的N末端。
14.如前述实施例中任一项所述的表达阻遏物,其中该阻遏物结构域是HDAC8或其功能变体或片段,例如,其中该阻遏物结构域包含SEQ ID NO:63的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,其中任选地该阻遏物结构域在该DNA靶向部分的C末端。
15.如前述实施例中任一项所述的表达阻遏物,其中该阻遏物结构域是LSD1或其功能变体或片段,例如,其中该阻遏物结构域包含SEQ ID NO:64的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,其中任选地该阻遏物结构域在该DNA靶向部分的C末端。
16.如前述实施例中任一项所述的表达阻遏物,其中该阻遏物结构域是EZH2或其功能变体或片段,例如,其中该阻遏物结构域包含SEQ ID NO:64的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,其中任选地该阻遏物结构域在该DNA靶向部分的N末端。
17.如前述实施例中任一项所述的表达阻遏物,其中该阻遏物结构域是FOG1或其功能变体或片段,例如,其中该阻遏物结构域包含SEQ ID NO:66的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
18.如前述实施例中任一项所述的表达阻遏物,其进一步包含第二阻遏物结构域。
19.如实施例18所述的表达阻遏物,其中该DNA靶向部分位于该阻遏物结构域和该第二阻遏物结构域之间。
20.一种表达阻遏物,其包含:
DNA靶向部分,
第一阻遏物结构域和
第二阻遏物结构域,
其中该表达阻遏物能够降低靶基因的表达。
21.如任一前述实施例所述的表达阻遏物,其中该DNA靶向部分结合转录调控元件(例如,启动子、增强子、超级增强子或转录起始位点(TSS)),该转录调控元件可操作地连接至该靶基因或结合所述转录调控元件近侧的序列。
22.如实施例18-21中任一项所述的表达阻遏物,其中该第一阻遏物结构域与该第二阻遏物结构域相同。
23.如实施例18-21中任一项所述的表达阻遏物,其中该第一阻遏物结构域与该第二阻遏物结构域不同。
24.如实施例18-23中任一项所述的表达阻遏物,其中该第一阻遏物结构域和该第二阻遏物结构域共价连接至该DNA靶向部分。
25.如实施例18-24中任一项所述的表达阻遏物,其中该第一阻遏物结构域通过第一接头连接至该DNA靶向部分并且该第二阻遏物结构域通过第二接头连接至该DNA靶向部分。
26.如实施例25的表达阻遏物,其中该第一接头与该第二接头相同。
27.如实施例25的表达阻遏物,其中该第一接头与该第二接头不同。
28.如实施例18-27中任一项所述的表达阻遏物,其中该第一阻遏物结构域在该DNA靶向部分的N末端。
29.如实施例18-28中任一项所述的表达阻遏物,其中该第二阻遏物结构域在该DNA靶向部分的C末端。
30.如实施例25-29中任一项所述的表达阻遏物,其中该第一阻遏物结构域的C末端通过该第一接头连接至该DNA靶向部分的N末端,并且该第二阻遏物结构域的N末端通过该第二接头连接至该DNA靶向部分的C末端。
31.如实施例18-30中任一项所述的表达阻遏物,其中:
该第一阻遏物结构域是EZH2或其功能变体或片段,例如,其中该第一阻遏物结构域包含SEQ ID NO:64的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,并且该第一阻遏物结构域在该DNA靶向部分的N末端;以及
该第二阻遏物结构域是KRAB或其功能变体或片段,例如,其中该第二阻遏物结构域包含SEQ ID NO:61的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,并且该第二阻遏物结构域在该DNA靶向部分的C末端。
32.如实施例18-30中任一项所述的表达阻遏物,其中:
该第一阻遏物结构域是G9A或其功能变体或片段,例如,其中该第一阻遏物结构域包含SEQ ID NO:62的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,并且该第一阻遏物结构域在该DNA靶向部分的N末端;以及
该第二阻遏物结构域是KRAB或其功能变体或片段,例如,其中该第二阻遏物结构域包含SEQ ID NO:61的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,并且该第二阻遏物结构域在该DNA靶向部分的C末端。
33.如实施例18-30中任一项所述的表达阻遏物,其中:
该第一阻遏物结构域是FOG1或其功能变体或片段,例如,其中该第一阻遏物结构域包含SEQ ID NO:66的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,并且该第一阻遏物结构域在该DNA靶向部分的N末端;以及
该第二阻遏物结构域是FOG1或其功能变体或片段,例如,其中该第二阻遏物结构域包含SEQ ID NO:66的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,并且该第二阻遏物结构域在该DNA靶向部分的C末端。
34.如实施例1-33中任一项所述的表达阻遏物,其中该DNA靶向部分结合包含SEQID NO:1-21中任一个的序列的至少14、15、16、17、18、19或20个核苷酸的基因组基因座。
35.如实施例1-34中任一项所述的表达阻遏物,其中该DNA靶向部分包含CRISPR/Cas分子(例如,无催化活性的CRISPR/Cas蛋白)、锌指结构域或TAL效应子分子。
36.如实施例35所述的表达阻遏物,其中该CRISPR/Cas分子包含一个或多个选自D10A、D839A、H840A和N863A的突变。
37.如实施例1-36中任一项所述的表达阻遏物,其中该DNA靶向部分结合靶基因的启动子区域、增强子区域(例如超增强子区域)或锚序列。
38.如实施例1-37中任一项所述的表达阻遏物,其中该阻遏物结构域包含DNMT1、DNMT3a/3L、MQ1、KRAB、G9A、HDAC8、LSD1、EZH2或FOG1,
39.如实施例18-38中任一项所述的表达阻遏物,其中该第一阻遏物结构域包含DNMT1、DNMT3a/3l、MQ1、KRAB、G9A、HDAC8、LSD1、EZH2或FOG1,并且该第二阻遏物结构域包含DNMT1、DNMT3a/3l、MQ1、KRAB、G9A、HDAC8、LSD1、EZH2或FOG1,
40.如实施例1-39中任一项所述的表达阻遏物,其中该表达阻遏物由选自SEQ IDNO:22-32、92、95中任一个的核苷酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列编码。
41.如实施例1-40中任一项所述的表达阻遏物,其中该表达阻遏物包含选自SEQID NO:33-36、38-44、67-69、93、96中任一个的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
42.如实施例1-41中任一项所述的表达阻遏物,其中该DNA靶向部分由选自SEQ IDNO:45或89中任一个的核苷酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列编码。
43.如实施例1-42中任一项所述的表达阻遏物,其中该DNA靶向部分包含根据SEQID NO:46或88中任一个的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
44.如实施例18-43中任一项所述的表达阻遏物,其中,
(i)该第一阻遏物结构域由选自SEQ ID NO:47-56、90中任一个或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的核苷酸序列编码,以及
(ii)该第二阻遏物结构域由选自SEQ ID NO:47-56、90中任一个或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的核苷酸序列编码。
45.如实施例18-43中任一项所述的表达阻遏物,其中,
(i)该第一阻遏物结构域包含根据SEQ ID NO:57-66中任一个的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列,以及
(ii)该第二阻遏物结构域包含根据SEQ ID NO:57-66中任一个的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
46.如任一前述实施例所述的表达阻遏物,其中该DNA靶向部分包含TAL效应子分子、CRISPR/Cas分子、锌指结构域、tetR结构域、大范围核酸酶结构域或寡核苷酸。
47.如任一前述实施例的表达阻遏物,其中该DNA靶向部分进一步包含gRNA,例如,结合包含SEQ ID NO:1-21中任一个的序列的至少14、15、16、17、18、19或20个核苷酸的基因组基因座的gRNA,例如,其中该gRNA包含的序列包含SEQ ID NO:1-21中任一个的序列的至少14、15、16、17、18、19或20个核苷酸。
48.如实施例35-47中任一项所述的表达阻遏物,其中该DNA靶向结构域包含CRISPR/Cas分子,例如,无催化活性的CRISPR/Cas蛋白,和gRNA,例如,结合包含SEQ ID NO:1-21中任一个的序列的至少14、15、16、17、18、19或20个核苷酸的基因组基因座的gRNA,例如,其中该gRNA包含的序列包含SEQ ID NO:1-21中任一个的序列的至少14、15、16、17、18、19或20个核苷酸并且该阻遏物结构域包含选自DNMT1、DNMt3a/3l、MQ1、KRAB、G9A、HDAC8、LSD1、EZH2或FOG1的部分。
49.如实施例35-47所述的表达阻遏物,其中该DNA靶向结构域包含CRISPR/Cas分子,例如,无催化活性的CRISPR/Cas蛋白,和gRNA,例如,结合包含SEQ ID NO:1-21中任一个的序列的至少14、15、16、17、18、19或20个核苷酸的基因组基因座的gRNA,例如,其中该gRNA包含的序列包含SEQ ID NO:1-21中任一个的序列的至少14、15、16、17、18、19或20个核苷酸,该第一阻遏物结构域包含选自DNMT1、DNM T3a/3L、MQ1、KRAB、G9A、HDAC8、LSD1、EZH2或FOG1的部分,并且该第二结构域包含选自DNMT1、DNMt3a/3L、MQ1、KRAB、G9A、HDAC8、LSD1、EZH2或FOG1的部分。
50.如实施例35-49中任一项所述的表达阻遏物,其中该CRISPR/Cas分子包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体)。
51.如实施例35-50中任一项所述的表达阻遏物,其中该CRISPR/Cas分子包含无催化活性的CRISPR/Cas蛋白,例如dCas9。
52.如前述实施例中任一项所述的表达阻遏物,其:(i)包含一个或多个核定位信号序列(NLS),或(ii)不包含NLS。
53.如前述实施例中任一项所述的表达阻遏物,其在N末端包含第一NLS,例如,其中该第一NLS具有SEQ ID NO:86的序列。
54.如前述实施例中任一项所述的表达阻遏物,其在C末端包含NLS,例如第二NLS,例如具有SEQ ID NO:87的序列。
55.如前述实施例中任一项所述的表达阻遏物,其中该第一和该第二NLS具有相同序列。
56.如实施例52-55中任一项所述的表达阻遏物,其中该第一和该第二NLS具有不同序列。
57.如前述实施例中任一项所述的表达阻遏物,其包含表位标签。
58.如实施例57的表达阻遏物,其中该表位标签是HA标签,例如,包含SEQ ID NO:80的氨基酸序列的HA标签。
59.如实施例37-58中任一项所述的表达阻遏物,其中该锚序列包含SEQ ID NO:81或82的序列,或相对其具有不超过8、7、6、5、4、3、2或1个改变的序列。
60.如实施例37-58中任一项所述的表达阻遏物,其中该锚序列包含根据SEQ IDNO:83或84的序列,或相对其具有不超过8、7、6、5、4、3、2或1个改变的序列。
61.如实施例37-60中任一项所述的表达阻遏物,其中该锚序列与该基因位于同一染色体上。
62.如实施例37-61中任一项所述的表达阻遏物,其中该锚序列在该靶基因的上游(例如,TSS上游或启动子上游)。
63.如实施例37-61中任一项所述的表达阻遏物,其中该锚序列在该靶基因的下游(例如,TSS下游或启动子上游)。
64.如前述实施例中任一项所述的表达阻遏物,其中该表达阻遏物与该靶基因基因座的结合使细胞中该靶基因的表达与不存在该表达阻遏物时该靶基因的表达相比降低10、20、30、40、50、60、70、80、90或100%。
65.如前述实施例中任一项所述的表达阻遏物,其中该表达阻遏物与该靶基因基因座的结合使该靶基因的表达明显降低持续至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22天的时间段。
66.如实施例18-65中任一项所述的表达阻遏物,其中该第一和/或第二阻遏物结构域包含DNA甲基转移酶、组蛋白甲基转移酶、组蛋白脱乙酰酶、组蛋白去甲基化酶或组蛋白修饰复合物的募集子。
67.一种表达阻遏系统,其包含:
包含第一DNA靶向部分和第一阻遏物结构域的第一表达阻遏物,和
包含第二DNA靶向部分和第二阻遏物结构域的第二表达阻遏物,
其中该第一DNA靶向部分特异性结合第一DNA序列,并且该第二DNA靶向部分特异性结合不同于该第一DNA序列的第二DNA序列,并且
其中该第一阻遏物结构域不同于该第二阻遏物结构域。
68.一种表达阻遏系统,其包含:
包含第一DNA靶向部分和第一阻遏物结构域的第一表达阻遏物,和
包含第二DNA靶向部分和第二阻遏物结构域的第二表达阻遏物,
其中该第一或第二阻遏物结构域包含MQ1结构域或其功能变体或片段,
其中该第一阻遏物结构域不同于该第二阻遏物结构域。
69.如实施例67或68所述的表达阻遏系统,其中该第一表达阻遏物进一步包含第三阻遏物结构域。
70.如实施例67-69中任一项所述的表达阻遏系统,其中该第二表达阻遏物进一步包含第四阻遏物结构域。
71.如实施例67-70中任一项所述的表达阻遏系统,其中该第一DNA靶向部分特异性结合第一DNA序列,并且该第二DNA靶向部分特异性结合不同于该第一DNA序列的第二DNA序列。
72.如实施例67-70中任一项所述的表达阻遏系统,其中该第一DNA靶向部分和该第二DNA靶向部分特异性结合相同的DNA序列。
73.如实施例67-72中任一项所述的表达阻遏系统,
其中该第一DNA靶向部分包含第一CRISPR/Cas分子,该第一CRISPR/Cas分子包含第一CRISPR/Cas蛋白和第一指导RNA,并且该第二DNA靶向部分包含第二CRISPR/Cas分子,该第二CRISPR/Cas分子包含第二CRISPR/Cas蛋白和第二指导RNA。
74.如实施例73所述的表达阻遏系统,
其中该第一CRISPR/Cas蛋白不结合该第二指导RNA,例如,以至少10、20、50、100、1000或10,000nM的KD结合,并且该第二CRISPR/Cas蛋白不结合该第一指导RNA,例如,以至少10、20、50、100、1000或10,000nM的KD结合。
75.如实施例73或74中任一项所述的表达阻遏系统:
其中该第一CRISPR/Cas蛋白包含与该第二CRISPR/Cas蛋白不同的氨基酸序列。
76.如实施例67-75中任一项所述的表达阻遏系统,其中该第一或第二DNA靶向部分包含CRISPR/Cas分子,该CRISPR/Cas分子包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体)。
77.如实施例67-76中任一项所述的表达阻遏系统,其中该第一DNA靶向部分包含第一CRISPR/Cas分子,该第一CRISPR/Cas分子包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体),并且该第二DNA靶向部分包含第二CRISPR/Cas分子,该第二CRISPR/Cas分子包含选自表1的不同Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体)。
78.如实施例70-77中任一项所述的表达阻遏系统,其中该第一、第二、第三或第四阻遏物结构域包含组蛋白甲基转移酶活性。
79.如实施例70-78所述的表达阻遏系统,其中该第一、第二、第三或第四阻遏物结构域包含选自SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2的蛋白质或其任一项的功能变体或片段,例如其任一项的SET结构域。
80.如实施例70-79中任一项所述的表达阻遏系统,其中该第一、第二、第三或第四阻遏物结构域包含组蛋白去甲基化酶活性(例如,赖氨酸去甲基化酶活性)。
81.如实施例70-80中任一项所述的表达阻遏系统,其中该第一、第二、第三或第四阻遏物结构域包含选自KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66的蛋白质或其任一项的功能变体或片段。
82.如实施例70-81中任一项所述的表达阻遏系统,其中该第一、第二、第三或第四阻遏物结构域包含组蛋白脱乙酰酶活性。
83.如实施例70-82所述的表达阻遏系统,其中该第一、第二、第三或第四阻遏物结构域包含选自HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9的蛋白质,或其任一项的功能变体或片段。
84.如实施例70-83中任一项所述的表达阻遏系统,其中该第一、第二、第二、第三或第四阻遏物结构域包含DNA甲基转移酶活性。
85.如实施例70-84所述的表达阻遏系统,其中该第一、第二、第三或第四阻遏物结构域包含选自MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L的蛋白质,或其任一项的功能变体或片段。
86.如实施例70-85中任一项所述的表达阻遏系统,其中该第一、第二、第三或第四阻遏物结构域包含转录阻遏物活性。
87.如实施例70-86所述的表达阻遏系统,其中该第一、第二、第三或第四阻遏物结构域包含选自KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12的蛋白质或其任一项的功能变体或片段。
88.如实施例67-87中任一项所述的表达阻遏系统,其中:
第一阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段,并且
第二阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段。
89.如实施例69-88中任一项所述的表达阻遏系统,其中:
(i)第一阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段,并且
(ii)第三阻遏物结构域包含选自以下的蛋白质(例如,不同的蛋白质):SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段。
90.如实施例69-89中任一项所述的表达阻遏系统,其中:
(i)第一阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段,
(ii)第二阻遏物结构域包含选自以下的蛋白质(例如,不同的蛋白质):SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段,并且
(iii)第三阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段。
91.如实施例70-90中任一项所述的表达阻遏系统,其中:
(i)第一阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段,
(ii)第二阻遏物结构域包含选自以下的蛋白质(例如,不同的蛋白质):SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段,
(iii)第三阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段并且
(iv)第四阻遏物结构域包含选自以下的蛋白质(例如,不同的蛋白质):SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段。
92.如实施例70-91中任一项所述的表达阻遏系统,其中:
(i)第二阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段,并且
(ii)第四阻遏物结构域包含选自以下的蛋白质(例如,不同的蛋白质):SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段。
93.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白甲基转移酶活性并且该第二阻遏物结构域包含组蛋白去甲基化酶活性。
94.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白甲基转移酶活性并且该第二阻遏物结构域包含组蛋白脱乙酰酶活性。
95.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白甲基转移酶活性并且该第二阻遏物结构域包含DNA甲基转移酶活性。
96.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白甲基转移酶活性并且该第二阻遏物结构域包含DNA去甲基化酶活性。
97.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白甲基转移酶活性并且该第二阻遏物结构域包含转录阻遏物活性。
98.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白甲基转移酶活性并且该第二阻遏物结构域包含组蛋白甲基转移酶活性(例如,其中这些组蛋白甲基转移酶活性彼此相同或不同)。
99.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白去甲基化酶活性并且该第二阻遏物结构域包含组蛋白脱乙酰酶活性。
100.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白去甲基化酶活性并且该第二阻遏物结构域包含DNA甲基转移酶活性。
101.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白去甲基化酶活性并且该第二阻遏物结构域包含DNA去甲基化酶活性。
102.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白去甲基化酶活性并且该第二阻遏物结构域包含转录阻遏物活性。
103.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白去甲基化酶活性并且该第二阻遏物结构域包含组蛋白去甲基化酶活性(例如,其中这些组蛋白去甲基化酶活性彼此相同或不同)。
104.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白脱乙酰酶活性并且该第二阻遏物结构域包含DNA甲基转移酶活性。
105.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白脱乙酰酶活性并且该第二阻遏物结构域包含DNA去甲基化酶活性。
106.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白脱乙酰酶活性并且该第二阻遏物结构域包含转录阻遏物活性。
107.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含组蛋白脱乙酰酶活性并且该第二阻遏物结构域包含组蛋白脱乙酰酶活性(例如,其中这些组蛋白脱乙酰酶活性彼此相同或不同)。
108.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含DNA甲基转移酶活性并且该第二阻遏物结构域包含DNA去甲基化酶活性。
109.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含DNA甲基转移酶活性并且该第二阻遏物结构域包含转录阻遏物活性。
110.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含DNA甲基转移酶活性并且该第二阻遏物结构域包含DNA甲基转移酶活性(例如,其中这些DNA甲基转移酶活性彼此相同或不同)。
111.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含DNA去甲基化酶活性并且该第二阻遏物结构域包含转录阻遏物活性。
112.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含DNA去甲基化酶活性并且该第二阻遏物结构域包含DNA去甲基化酶活性(例如,其中这些DNA去甲基化酶活性彼此相同或不同)。
113.如实施例67-92中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含转录阻遏物活性并且该第二阻遏物结构域包含转录阻遏物活性(例如,其中这些转录阻遏物活性彼此相同或不同)。
114.如实施例67-113中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含选自以下的蛋白质:KRAB、SET结构域(例如,SETDB1、EZH2、G9A或SUV39H1的SET结构域)、组蛋白去甲基化酶LSD1、FOG1(例如,FOG1的N末端残基)、KAP1或其任一项的功能变体或片段;以及
该第二阻遏物结构域包含选自以下的蛋白质:DNMT3A(例如,人DNMT3A)、DNMT3B、DNMT3L、DNMT3A/3L复合物、细菌MQ1或其任一项的功能变体或片段。
115.如实施例67-114中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含选自以下的蛋白质:EZH2、G9A、SUV39H1、FOG1或其任一项的功能变体或片段;以及
该第二阻遏物结构域包含选自以下的蛋白质:DNMT3A(例如,人DNMT3A)、DNMT3B、DNMT3L、DNMT3A/3L、DNMT1、LSD1、FOG1、KRAB、HDAC8、细菌MQ1或其任一项的功能变体或片段。
116.如实施例67-115中任一项所述的表达阻遏系统,其中:
(i)该第一阻遏物结构域包含选自以下的蛋白质:KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KAP1、HDAC8、MQ1、DNMT1、DNMT3A、DNMT3a/3l,或其任一项的功能变体或片段;以及
(ii)该第二阻遏物结构域包含选自以下的蛋白质:KRAB、FOG1、G9A、LSD1、HDAC8、EZH2、DNMT3a/3l、MQ1、DNMT1、DBMT3A、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L或其任一项的功能变体或片段。
117.如实施例67-116中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含KRAB,并且该第二阻遏物结构域包含DNMT3A(例如,人DNMT3A)。
118.如实施例67-115中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含G9A或其功能变体或片段,并且该第二阻遏物结构域包含KRAB或其功能变体或片段。
119.如实施例67-118中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含LSD1或其功能变体或片段,并且该第二阻遏物结构域包含KRAB或其功能变体或片段。
120.如实施例67-119中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含KRAB或其功能变体或片段并且该第二阻遏物结构域包含细菌MQ1或其功能变体或片段。
121.如实施例67-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含G9A或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的N末端;并且
该第二阻遏物结构域包含EZH2或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的N末端。
122.如实施例67-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含LSD1或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的C末端;并且
该第二阻遏物结构域包含G9A或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的N末端。
123.如实施例67-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含MQ1或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的C末端;并且
该第二阻遏物结构域包含HDAC8或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的C末端。
124.如实施例67-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含LSD1或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的C末端;并且
该第二阻遏物结构域包含HDAC8或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的C末端。
125.如实施例67-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含LSD1或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的C末端;并且
该第二阻遏物结构域包含EZH2或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的N末端。
126.如实施例67-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含EZH2或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的N末端;并且
该第二阻遏物结构域包含HDAC8或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的C末端。
127.如实施例67-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含G9A或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的N末端;并且
该第二阻遏物结构域包含HDAC8或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的C末端。
128.如实施例69-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含EZH2或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的N末端,
该第三阻遏物结构域包含KRAB或其功能变体或片段,其中任选地该第三阻遏物结构域在该第一DNA靶向部分的C末端;并且
该第二阻遏物结构域包含MQ1或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的C末端。
129.如实施例69-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含G9A或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的N末端,
该第三阻遏物结构域包含KRAB或其功能变体或片段,其中任选地该第三阻遏物结构域在该第一DNA靶向部分的C末端,并且
该第二阻遏物结构域包含MQ1或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的C末端。
130.如实施例69-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含EZH2或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的N末端,
该第三阻遏物结构域包含KRAB或其功能变体或片段,其中任选地该第三阻遏物结构域在该第一DNA靶向部分的C末端,并且
该第二阻遏物结构域包含HDAC8或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的C末端。
131.如实施例69-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含FOG1或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的N末端,
该第三阻遏物结构域包含FOG1或其功能变体或片段,其中任选地该第三阻遏物结构域在该第一DNA靶向部分的C末端,并且
该第二阻遏物结构域包含KRAB或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的C末端。
132.如实施例69-120中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含EZH2或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的N末端,
该第三阻遏物结构域包含KRAB或其功能变体或片段,其中任选地该第三阻遏物结构域在该第一DNA靶向部分的C末端,并且
该第二阻遏物结构域包含LSD1或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的C末端。
133.如实施例69-130中任一项所述的表达阻遏系统,其中:
该第一阻遏物结构域包含G9A或其功能变体或片段,其中任选地该第一阻遏物结构域在该第一DNA靶向部分的N末端,
该第三阻遏物结构域包含KRAB或其功能变体或片段,其中任选地该第三阻遏物结构域在该第一DNA靶向部分的C末端,并且
该第二阻遏物结构域包含LSD1或其功能变体或片段,其中任选地该第二阻遏物结构域在该第二DNA靶向部分的C末端。
134.如实施例67-133中任一项所述的表达阻遏系统,其中该第一DNA靶向部分选自TAL效应子分子、CRISPR/Cas分子、锌指结构域、tetR结构域、大范围核酸酶或寡核苷酸。
135.如实施例67-134中任一项所述的表达阻遏系统,其中该第二DNA靶向部分选自TAL效应子分子、CRISPR/Cas分子、锌指结构域、tetR结构域、大范围核酸酶或寡核苷酸。
136.如实施例67-135中任一项所述的表达阻遏系统,其中该第一DNA靶向部分是或包含CRISPR/Cas分子,该CRISPR/Cas分子包含CRISPR/Cas蛋白(例如,其是或包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体))和指导RNA。
137.如实施例67-136中任一项所述的表达阻遏系统,其中该第二DNA靶向部分是或包含CRISPR/Cas分子,该CRISPR/Cas分子包含CRISPR/Cas蛋白(例如,其是或包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体))和指导RNA。
138.如实施例67-137中任一项所述的表达阻遏系统,其中:
该第一DNA靶向部分是或包含CRISPR/Cas分子,该CRISPR/Cas分子包含CRISPR/Cas蛋白,该CRISPR/Cas蛋白是或包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体)并且
该第二DNA靶向部分是或包含CRISPR/Cas分子,该CRISPR/Cas分子包含不同CRISPR/Cas蛋白,该不同CRISPR/Cas蛋白是或包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体)。
139.如实施例135-138中任一项所述的表达阻遏系统,其中:
该第一DNA靶向部分是或包含由SEQ ID NO:45或89的核酸序列编码的CRISPR/Cas分子,并且
该第二DNA靶向部分是或包含由SEQ ID NO:45或89的核酸序列编码的CRISPR/Cas分子。
140.如实施例135-138中任一项所述的表达阻遏系统,其中:
该第一DNA靶向部分是或包含含有SEQ ID NO:46或88的氨基酸序列的CRISPR/Cas分子,并且
该第二DNA靶向部分是或包含含有SEQ ID NO:46或88的氨基酸序列的CRISPR/Cas分子。
141.如实施例67-140中任一项所述的表达阻遏系统,其中该第一或该第二DNA靶向部分特异性结合启动子序列或启动子序列的近侧DNA,例如,可操作地连接至靶基因的启动子序列。
142.如实施例67-141中任一项所述的表达阻遏系统,其中该第一或该第二DNA靶向部分特异性结合增强子序列或增强子序列近侧的DNA,例如影响靶基因表达和/或与靶基因可操作地连接的增强子序列。
143.如实施例67-142中任一项所述的表达阻遏系统,其中该第一或该第二DNA靶向部分特异性结合靶基因,例如靶基因的转录起始位点和终止密码子之间包含的序列。
144.如实施例67-143中任一项所述的表达阻遏系统,其中该第一或该第二DNA靶向部分特异性结合靶基因的转录起始位点。
145.如实施例67-144中任一项所述的表达阻遏系统,其中该第一或该第二DNA靶向部分特异性结合靶基因的内含子,例如与内含子相关的剪接位点。
146.如实施例67-145中任一项所述的表达阻遏系统,其中该第一或该第二DNA靶向部分特异性结合靶基因的外显子。
147.如实施例67-146中任一项所述的表达阻遏系统,其中该第一或第二DNA靶向部分特异性结合锚序列。
148.如实施例147的表达阻遏系统,其中该锚序列包含SEQ ID NO:81或82的序列,或相对其具有不超过8、7、6、5、4、3、2或1个改变的序列。
149.如实施例147的表达阻遏系统,其中该锚序列包含SEQ ID NO:83或84的序列,或相对其具有不超过8、7、6、5、4、3、2或1个改变的序列。
150.如实施例147-149中任一项所述的表达阻遏系统,其中该锚序列与该基因位于同一染色体上。
151.如实施例147-149中任一项所述的表达阻遏系统,其中该锚序列与该基因位于不同染色体上。
152.如实施例147-151中任一项所述的表达阻遏系统,其中该锚序列在该靶基因的上游(例如,TSS上游或启动子上游)。
153.如实施例148-151中任一项所述的表达阻遏系统,其中该锚序列在该靶基因的下游(例如,TSS下游或启动子上游)。
154.如实施例67-141中任一项所述的表达阻遏系统,其中该第一DNA序列是可操作地连接至靶基因的启动子内或近侧的第一位点,并且该第二DNA序列是可操作地连接至靶基因的启动子内或近侧的第二位点。
155.如实施例67-142中任一项所述的表达阻遏系统,其中该第一DNA序列在可操作地连接至靶基因的启动子内或近侧,并且该第二DNA序列在影响该靶基因表达并且可操作地连接至该靶基因的增强子内或近侧。
156.如实施例67-142中任一项的表达阻遏系统,其中该第一DNA序列影响靶基因表达并且可操作地连接至该靶基因的增强子内或近侧,并且该第二DNA序列在可操作地连接至该靶基因的启动子内或近侧。
157.如实施例67-141或143中任一项所述的表达阻遏系统,其中该第一DNA序列包含靶基因的转录起始位点并且该第二DNA序列在可操作地连接至该靶基因的启动子内或近侧。
158.如实施例67-140、142或143中任一项所述的表达阻遏系统,其中该第一DNA序列包含靶基因的转录起始位点并且该第二DNA序列在影响该靶基因表达并且可操作地连接至该靶基因的增强子内或近侧。
159.如实施例67-141或143中任一项所述的表达阻遏系统,其中启动子内或近侧的该第一DNA序列可操作地连接至靶基因并且该第二DNA序列是该靶基因的转录起始位点。
160.如实施例67-140、142或143中任一项所述的表达阻遏系统,其中该第一DNA序列在影响靶基因表达并且可操作地连接至该靶基因的增强子内或近侧,并且该第二DNA序列是该靶基因的转录起始位点。
161.如实施例67-160中任一项所述的表达阻遏系统,其中该第一DNA序列和该第二DNA序列之间的距离是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、550、600、650、700、750、800、850、900、950或1000个碱基对或其间的任何大小,例如20-500个碱基对。
162.如实施例67-161中任一项所述的表达阻遏系统,其中该第一DNA序列和该第二DNA序列之间的距离不超过100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、550、600、650、700、750、800、850、900、950或1000个碱基对或其间的任何大小,例如20-500个碱基对。
163.如实施例67-162中任一项所述的表达阻遏系统,其中该第一DNA序列和该第二DNA序列位于不同的核酸上,例如不同的染色体上。
164.如实施例67-163中任一项所述的表达阻遏系统,其中该靶基因是β-2-微球蛋白、MYC、HSPA1B、GATA1、APOB、FOXP3、CXCL1、CXCL2、CXCL3、CXCL4、CXCL5、CXCL6、CXCL6、CXCL7、和/或CXCL8。
165.如实施例73-164中任一项所述的表达阻遏系统,其中该第一指导RNA包含对该第一DNA序列特异(例如互补)的序列并且该第二指导RNA包含对该第二DNA序列特异(例如互补)的序列。
166.如实施例67-165中任一项所述的表达阻遏系统,其中该第一DNA靶向部分不明显结合该第二DNA序列并且该第二DNA靶向部分不明显结合该第一DNA序列。
167.如实施例67-166中任一项所述的表达阻遏系统,其中该第一DNA靶向部分以至少500、600、700、800、900、1000、2000、5000、10,000或100,000nM的KD结合该第二DNA序列,并且该第二DNA靶向部分以至少500、600、700、800、900、1000、2000、5000、10,000或100,000nM的KD结合该第一DNA序列。
168.如实施例67-167中任一项所述的表达阻遏系统,其中该第一表达阻遏物与该第一DNA序列的结合降低细胞中靶基因的表达,例如,与该第一DNA序列可操作地连接的靶基因。
169.如实施例168的表达阻遏系统,其中与不存在该第一表达阻遏物的情况下的表达相比,表达降低10%、20%、30%、40%、50%、60%、70%、80%、90%或100%,例如,如通过ELISA测量或如实例2-4中所述。
170.如实施例67-169中任一项所述的表达阻遏系统,其中该第一表达阻遏物与该第一DNA序列的结合使靶基因,例如与该第一DNA序列可操作地连接的靶基因的表达明显降低持续以下时间段:至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25天,或至少1、2、3、4、5、6、7、8、9或10次细胞分裂,例如,如通过ELISA测量或如实例2-4中所述。
171.如实施例67-170中任一项所述的表达阻遏系统,其中该第二表达阻遏物与该第二DNA序列的结合降低细胞中靶基因的表达,例如,与该第二DNA序列可操作地连接的靶基因。
172.如实施例171的表达阻遏系统,其中与不存在该第二表达阻遏物的情况下的表达相比,表达降低10%、20%、30%、40%、50%、60%、70%、80%、90%或100%,例如,如通过ELISA测量或如实例2-4中所述。
173.如实施例67-172中任一项所述的表达阻遏系统,其中该第二表达阻遏物与该第二DNA序列的结合使靶基因,例如与该第二DNA序列可操作地连接的靶基因的表达明显降低持续以下时间段:至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25天,或至少1、2、3、4、5、6、7、8、9或10次细胞分裂,例如,如通过ELISA测量或如实例2-4中所述。
174.如实施例67-173中任一项所述的表达阻遏系统,其中该第一表达阻遏物与该第一DNA序列的结合以及该第二表达阻遏物与该第二DNA序列的结合降低细胞中靶基因的表达,例如,可操作地连接至该第一DNA序列和/或该第二DNA序列的靶基因。
175.如实施例174的表达阻遏系统,其中与不存在该第一和第二表达阻遏物的情况下的表达相比,表达降低10%、20%、30%、40%、50%、60%、70%、80%、90%或100%,例如,如通过ELISA测量或如实例2-4中所述。
176.如实施例1-175中任一项所述的表达阻遏系统,其中该第一表达阻遏物与该第一DNA序列的结合和该第二表达阻遏物与该第二DNA序列的结合使靶基因,例如与该第一DNA序列可操作地连接的靶基因的表达明显降低持续以下时间段:至少1、2、3、4、5、6、7、8、9、10、11或12小时,或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25天,或至少1、2、3、4、5、6、7、8、9或10次细胞分裂,例如,如通过ELISA测量或如实例2-4中所述。
177.如实施例174-176中任一项所述的表达阻遏系统,其中由该第一表达阻遏物与该第一DNA序列的结合以及该第二表达阻遏物与该第二DNA序列的结合导致的表达降低大于由该第一表达阻遏物与该第一DNA序列结合或该第二表达阻遏物与该第二DNA序列结合各自导致的表达降低。
178.如实施例177所述的表达阻遏系统,其中该第一表达阻遏物与该第一DNA序列的结合以及该第二表达阻遏物与该第二DNA序列的结合对表达的降低比该第一表达阻遏物与该第一DNA序列结合或该第二表达阻遏物与该第二DNA序列结合各自对表达的降低高1.05x(即1.05倍)、1.1x、1.15x、1.2x、1.25x、1.3x、1.35x、1.4x、1.45x、1.5x、1.6x、1.7x、1.8x、1.9x、2x、3x、4x、5x、6x、7x、8x、9x、10x、20x、50x或100x,例如,如通过ELISA测量或如实施例2-4中所述。
179.如实施例174-178所述的表达阻遏系统,其中由该第一表达阻遏物与该第一DNA序列的结合以及该第二表达阻遏物与该第二DNA序列的结合导致的表达降低比由该第一表达阻遏物与该第一DNA序列结合或该第二表达阻遏物与该第二DNA序列结合各自导致的表达降低持续更长的时间(例如,更多的小时、天或细胞分裂)。
180.如实施例179所述的表达阻遏系统,其中该第一表达阻遏物与该第一DNA序列的结合以及该第二表达阻遏物与该第二DNA序列的结合对表达的降低比该第一表达阻遏物与该第一DNA序列结合或该第二表达阻遏物与该第二DNA序列结合各自对表达的降低长(例如,以小时、天或细胞分裂来测量)1.05x(即1.05倍)、1.1x、1.15x、1.2x、1.25x、1.3x、1.35x、1.4x、1.45x、1.5x、1.6x、1.7x、1.8x、1.9x、2x、3x、4x、5x、6x、7x、8x、9x、10x、20x、50x或100x,例如,如通过ELISA测量或如实施例2-4中所述。
181.如实施例174-180中任一项所述的表达阻遏系统,其中该细胞以每24、36、48、60或72小时不超过一次的速率分裂(并且任选地,至少每24、36、48、60或72小时一次)。
182.如实施例174-181中任一项所述的表达阻遏系统,其中该细胞以每24、36、48、60或72小时至少一次的速率分裂(并且任选地,每24、36、48、60或72小时不超过一次)。
183.如实施例174-182中任一项所述的表达阻遏系统,其中表达明显地无限定地降低(例如,持续比可通过实验测量的时间更长的时间段)。
184.如实施例67-183中任一项所述的表达阻遏系统,其中
该第一DNA靶向部分包含选自表1的化脓性链球菌CRISPR/Cas蛋白或其变体(例如,突变体),例如化脓性链球菌dCas9,例如,包含SEQ ID NO:46的氨基酸序列的dCas9;或选自表1的金黄色葡萄球菌CRISPR/Cas蛋白或其变体(例如,突变体),例如,金黄色葡萄球菌dCas9,例如,包含SEQ ID NO:88的氨基酸序列的dCas9并且
该第二DNA靶向部分包含选自表1的化脓性链球菌CRISPR/Cas蛋白或其变体(例如,突变体),例如化脓性链球菌dCas9,例如,包含SEQ ID NO:46的氨基酸序列的dCas9;或含有选自表1的金黄色葡萄球菌CRISPR/Cas蛋白或其变体(例如,突变体)的CRISPR/Cas分子,例如,金黄色葡萄球菌dCas9,例如,包含SEQ ID NO:88的氨基酸序列的dCas9。
185.如实施例67-184中任一项所述的表达阻遏系统,其中
该第一DNA靶向部分包含含有CRISPR/Cas蛋白的CRISPR/Cas分子,例如无催化活性的dCas9,例如dCas9,例如包含选自D10A、D839A、H840A和N863A突变的一个或多个突变的dCas9;并且
该第二DNA靶向部分包含含有CRISPR/Cas蛋白的CRISPR/Cas分子,例如无催化活性的dCas9,例如dCas9,例如包含选自D10A、D839A、H840A和N863A突变的一个或多个突变的dCas9。
186.如实施例67-185中任一项所述的表达阻遏系统,其中
该第一表达阻遏物包含含有CRISPR/Cas分子的第一DNA靶向部分以及含有KRAB或其功能变体或片段的第一阻遏物结构域,该CRISPR/Cas分子包含选自表1的化脓性链球菌CRISPR/Cas蛋白或其变体(例如,突变体),例如化脓性链球菌dCas9;并且
该第二表达阻遏物包含含有CRISPR/Cas分子的第二DNA靶向部分以及含有细菌MQ1或其功能变体或片段的第二阻遏物结构域,该CRISPR/Cas分子包含选自表1的金黄色葡萄球菌CRISPR/Cas蛋白或其变体(例如,突变体),例如金黄色葡萄球菌dCas9。
187.一种多肽,其包含:
DNA靶向部分;以及
包含细菌MQ1或其功能变体或片段的阻遏物结构域。
188.一种多肽,其包含:
DNA靶向部分;
第一阻遏物结构域,其包含MQ1、DNMT1、DNMT3a/3l、KRAB、G9A、HDAC8、LSD1、EZH2、FOG1或其功能变体或片段,和
第二阻遏物结构域,其包含MQ1、DNMT1、DNMT3a/3l、KRAB、G9A、HDAC8、LSD1、EZH2、FOG1或其功能变体或片段。
189.如实施例88a所述的多肽,其中该DNA靶向部分位于该第一阻遏物结构域和该第二阻遏物结构域之间。
190.一种核酸,其编码如实施例67-189中任一项所述的表达阻遏系统的第一表达阻遏物。
191.一种核酸,其编码如实施例67-189中任一项所述的表达阻遏系统的第二表达阻遏物。
192.一种核酸,其编码如实施例67-189中任一项所述的表达阻遏系统,例如第一表达阻遏物和第二表达阻遏物。
193.如实施例190-192中任一项所述的核酸,其是RNA,例如mRNA。
194.一种表达阻遏系统,其包含:
第一核酸,其包含编码如实施例67-189中任一项所述的表达阻遏系统的第一表达阻遏物的序列;以及
第二核酸,其包含编码如实施例67-189中任一项所述的表达阻遏系统的第二表达阻遏物的序列。
195.一种核酸,其编码如实施例187-189中任一项所述的多肽。
196.如实施例190-193或195中任一项所述的核酸,其中该核酸包含mRNA。
197.一种载体,其包含编码如任何前述实施例所述的表达阻遏物或表达阻遏系统的核酸。
198.一种脂质纳米颗粒,其包含如任何前述实施例所述的表达阻遏物、表达阻遏系统、核酸、mRNA或载体。
199.如实施例198所述的脂质纳米颗粒,其包含可电离脂质,例如阳离子脂质,例如MC3、SSOP。
200.如实施例198或199所述的脂质纳米颗粒,其进一步包含一种或多种中性脂质、可电离的含胺脂质、可生物降解的炔烃脂质、类固醇、磷脂、多不饱和脂质、结构脂质(例如甾醇)、PEG、胆固醇或聚合物缀合脂质。
201.一种反应混合物,其包含如任何前述实施例所述的表达阻遏物、表达阻遏系统、核酸、载体或脂质纳米颗粒。
202.如实施例201所述的反应混合物,其进一步包含细胞。
203.一种细胞,其包含如实施例1-202中任一项所述的表达阻遏物、表达阻遏系统、核酸、mRNA、载体或纳米颗粒。
204.如实施例203所述的细胞,其中该细胞选自肝细胞、神经元细胞、内皮细胞、肌细胞和淋巴细胞。
205.一种细胞,其由包括以下的方法产生:
提供i)细胞和ii)如实施例1-202中任一项所述的表达阻遏物、表达阻遏系统、多肽、核酸、载体、脂质纳米颗粒或反应混合物;以及
使该细胞与该表达阻遏物、表达阻遏系统、多肽、核酸、载体、脂质纳米颗粒或反应混合物接触。
206.一种药物组合物,其包含如实施例1-202中任一项所述的表达阻遏物、表达阻遏系统、核酸、多肽、载体、脂质纳米颗粒或反应混合物,以及至少一种药学上可接受的赋形剂或载剂。
207.如实施例1-202中任一项所述的表达阻遏系统,其中该第一表达阻遏物进一步包含选自以下的另外部分:标记部分或监测部分、可切割部分(例如,位于DNA靶向部分和阻遏物结构域之间或位于多肽的N或C末端的可切割部分)、小分子、膜易位多肽、或药剂部分。
208.如实施例1-202中任一项所述的表达阻遏系统,其中该第二表达阻遏物进一步包含选自以下的另外部分:标记部分或监测部分、可切割部分(例如,位于DNA靶向部分和阻遏物结构域之间或位于多肽的N或C末端的可切割部分)、小分子、膜易位多肽、或药剂部分。
209.一种降低细胞中靶基因组序列的表达的方法,该方法包括:
提供如实施例1-204或206中任一项所述的表达阻遏物、表达阻遏系统、核酸、多肽、载体、脂质纳米颗粒、反应混合物、细胞或药物组合物;以及
使该细胞与该表达阻遏物、表达阻遏系统、核酸、多肽、载体、脂质纳米颗粒、反应混合物、细胞或药物组合物接触
从而降低该靶基因组序列的表达。
210.一种在细胞中表观遗传修饰靶基因组序列的方法,该方法包括:
提供如实施例1-204或206中任一项所述的表达阻遏物、表达阻遏系统、核酸、载体、多肽、脂质纳米颗粒、反应混合物、细胞或药物组合物;以及
使该细胞与该表达阻遏物、表达阻遏系统、核酸、载体、多肽、脂质纳米颗粒、反应混合物、细胞或药物组合物接触,
从而表观遗传修饰该靶基因组序列。
211.如实施例209或210所述的方法,其中该靶基因组序列是:
靶基因(例如,靶基因内的位点,例如外显子、内含子或剪接位点),例如编码β-2-微球蛋白(β2M)的基因、编码MYC的基因、编码HSPA1B的基因,或编码GATA1的基因,
可操作地连接至靶基因的转录控制元件,或
靶基因近侧的锚序列或与可操作地连接至该靶基因的锚序列介导的连接相关联的锚序列。
212.如实施例211所述的方法,其中该表观遗传修饰导致该靶基因表达的降低。
213.如实施例174-212中任一项所述的表达阻遏物、表达阻遏系统、细胞、药物组合物、核酸、载体或方法,其中该细胞是哺乳动物细胞,例如人细胞。
214.如实施例213所述的方法,其中该方法离体(例如,在来自受试者的样品中)或体内(例如,通过向受试者施用该表达阻遏系统)进行。
215.如实施例209-214中任一项所述的方法,其中与除了不存在该表达阻遏系统之外在其他方面相似的细胞中的表达相比,表达降低10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。
216.如实施例209-214中任一项所述的方法,其中与除了未接触该表达阻遏系统之外在其他方面相似的细胞中的表达相比,表达降低10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。
217.如实施例209-216中任一项所述的方法,其中表达降低持续以下时间段:至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25天,或至少1、2、3、4、5、6、7、8、9或10次细胞分裂,例如,如通过ELISA测量或如实例2-4中所述。
218.如实施例215-217中任一项所述的方法,其中表达的降低包括该靶基因编码的RNA例如mRNA水平的降低。
219.如实施例215-218中任一项所述的方法,其中表达的降低包括该靶基因编码的蛋白质水平的降低。
220.如实施例209-219中任一项所述的方法,其中提供包括使该细胞与编码针对包含该靶基因的细胞的表达阻遏系统的核酸,例如载体接触。
221.如实施例209-220中任一项所述的方法,其中编码该第一表达阻遏物的核酸布置在第一核酸分子上并且编码该第二表达阻遏物的核酸布置在第二核酸分子上。
222.如实施例209-221中任一项所述的方法,其中编码该第一表达阻遏物的核酸与编码该第二表达阻遏物的核酸布置在相同的核酸分子上。
223.如实施例209-222中任一项所述的方法,其中施用包括使该细胞与该第一核酸分子和该第二核酸分子一起接触,例如同时接触。
224.如实施例209-223中任一项所述的方法,其中施用包括使该细胞与该第一核酸分子和该第二核酸分子分开接触,例如,顺序接触。
225.如实施例209-224中任一项所述的方法,其中提供包括使该细胞与包含该表达阻遏系统或编码该表达阻遏系统的核酸(例如载体)的囊泡接触。
226.如实施例209-225中任一项所述的方法,其中提供包括使该细胞与包含该表达阻遏系统或编码该表达阻遏系统的核酸(例如载体)的脂质纳米颗粒(LNP)接触。
227.如实施例209-226中任一项所述的方法,其中该表达阻遏系统包含第一表达阻遏物和第二表达阻遏物,并且提供包括施用该第一表达阻遏物和分开地施用该第二表达阻遏物。
228.如实施例209-227中任一项所述的方法,其中该表达阻遏系统包含第一表达阻遏物和第二表达阻遏物并且提供包括一起施用该第一表达阻遏物和该第二表达阻遏物,例如同时施用。
229.一种治疗与受试者中靶基因的过度表达相关的病症的方法,该方法包括:
向该受试者施用如实施例1-204或206-208中任一项所述的表达阻遏物、表达阻遏系统、核酸、载体、多肽、脂质纳米颗粒、反应混合物、细胞或药物组合物,
从而治疗与受试者中靶基因的过度表达相关的病症。
230.一种治疗与受试者中靶基因的错误调控相关的病症的方法,该方法包括:
向该受试者施用如实施例1-204或206-208中任一项所述的表达阻遏物、表达阻遏系统、核酸、载体、多肽、脂质纳米颗粒、反应混合物、细胞或药物组合物,
从而治疗与受试者中靶基因的错误调控相关的病症。
231.一种制备包含表达阻遏系统的细胞的方法,该方法包括:
提供如实施例1-201或206-208中任一项所述的表达阻遏物、表达阻遏系统、核酸、载体、多肽或药物组合物;并且
使该细胞与该表达阻遏物、表达阻遏系统、核酸、载体或药物组合物接触,
从而制备包含表达阻遏系统的细胞。
232.一种制备编码表达阻遏系统的核酸的方法,该方法包括:
提供编码如实施例67-186、207或208中任一项所述的表达阻遏系统的第一表达阻遏物的第一核酸;
提供编码如实施例67-186、9207或208中任一项所述的表达阻遏系统的第二表达阻遏物的第二核酸;
将该第一核酸和该第二核酸组合(例如,连接或重组)成单个核酸分子,
从而制备编码表达阻遏系统的核酸。
233.一种细胞,其通过如实施例209-228或230中任一项所述的方法处理或产生。
234.如实施例233所述的细胞,其中该细胞不包含该表达阻遏系统,例如,该表达阻遏系统的至少一种组分(例如,所有组分)。
235.如实施例233或234中任一项所述的细胞,其中相对于未通过如实施例209-228或230中任一项所述的方法接触、处理或产生的细胞,该靶基因的表达降低。
236.一种试剂盒,其包含容器,该容器包含组合物,该组合物包含如实施例1-208中任一项所述的表达阻遏物、表达阻遏系统、编码所述表达阻遏物或表达阻遏系统的一种或多种核酸、载体、脂质纳米颗粒或药物组合物以及包含至少一种用所述组合物调节例如降低细胞内基因表达的方法的一套说明书。
定义
锚序列:如本文所用的术语“锚序列”是指被成核剂识别的核酸序列,其充分结合以形成锚序列介导的连接,例如复合物。在一些实施例中,锚序列包含一个或多个CTCF结合基序。在一些实施例中,锚序列不位于基因编码区内。在一些实施例中,锚序列位于基因间区域内。在一些实施例中,锚序列不位于增强子或启动子内。在一些实施例中,锚序列位于距离任何转录起始位点至少400bp、至少450bp、至少500bp、至少550bp、至少600bp、至少650bp、至少700bp、至少750bp、至少800bp、至少850bp、至少900bp、至少950bp、或至少1kb处。在一些实施例中,锚序列位于与基因组印记、单等位基因表达和/或单等位基因表观遗传标记物无关的区域内。在一些实施例中,锚序列具有一种或多种选自以下的功能:结合内源性成核多肽(例如,CTCF)、与第二种锚序列相互作用以形成锚序列介导的连接,或与锚序列介导的连接之外的增强子隔离。在本披露的一些实施例中,提供了可以特异性靶向一个或多个特定锚序列,而不靶向其他锚序列(例如,在不同上下文中可能含有成核剂(例如,CTCF)结合基序的序列)的技术;此类靶向的锚序列可以被称为“靶锚序列”。在一些实施例中,靶锚序列的序列和/或活性受到调节,而可能存在于与靶向的锚序列相同的系统中(例如,在相同的细胞中和/或在一些实施例中在相同的核酸分子(例如,相同的染色体)上)的一个或多个其他锚序列的序列和/或活性不受调节。在一些实施例中,锚序列包含或者是成核多肽结合基序。在一些实施例中,锚序列邻近成核多肽结合基序。
锚序列介导的连接:如本文所用的术语“锚序列介导的连接”是指一种DNA结构,在一些情况下是一种复合物,其经由通过一种或多种多肽(如成核多肽)或者一种或多种蛋白质和/或核酸实体(如RNA或DNA)(其结合锚序列以实现锚序列之间的空间接近和功能性连接)与DNA中至少两个锚序列的物理相互作用或结合而产生和/或维持(参见,例如图1)。
相关联:如果一个事件或实体的存在、水平、形式和/或功能与另一个事件或实体相关联,则两个事件或实体彼此“相关”,如该术语在本文中所使用的。例如,在一些实施例中,如果特定实体(例如,多肽、遗传特征、代谢物、微生物等)的存在、水平、形式和/或功能与疾病、障碍或病症的发病率和/或易感性相关(例如,在相关群体中),则其被认为与特定疾病、障碍或病症相关联。在一些实施例中,如果两个或更多个实体直接或间接地相互作用,使得它们在物理上彼此接近和/或保持在物理上彼此接近,则它们在物理上彼此“相关联”。在一些实施例中,在物理上彼此相关联的两个或更多个实体彼此共价连接;在一些实施例中,在物理上彼此相关联的两个或更多个实体不是彼此共价连接,而是非共价结合,例如通过氢键、范德华相互作用、疏水相互作用、磁性、及其组合。在一些实施例中,当核酸至少部分位于靶基因组或转录复合物内,并且DNA序列中基因的表达受到靶基因组或转录复合物的形成或破坏的影响时,DNA序列与靶基因组或转录复合物“相关联”。
结构域:如本文所用,术语“结构域”是指实体的区段或部分。在一些实施例中,“结构域”与实体的特定结构和/或功能特征相关联,使得当该结构域与其父实体的其余部分物理分离时,它基本上或完全保留该特定结构和/或功能特征。可替代地或另外地,在一些实施例中,结构域可以是或包括实体的一部分,该实体在与该(父)实体分离并与不同的(接收)实体连接时,基本上保留和/或赋予接收实体一个或多个在父实体中表征它的结构和/或功能特征。在一些实施例中,结构域是或包含分子(例如,小分子、碳水化合物、脂质、核酸、多肽等)的区段或部分。在一些实施例中,结构域是或包含多肽的区段。在一些此类实施例中,结构域的特征在于特定的结构元件(例如,特定的氨基酸序列或序列基序、α-螺旋特征、β-折叠特征、螺旋卷曲特征、随机卷曲特征等),和/或特定的功能特征(例如,结合活性、酶活性、折叠活性、信号活性等)。
表达阻遏物:如本文所用,术语“表达阻遏物”是指具有一种或多种功能性的药剂或实体,其降低细胞中靶基因的表达并特异性结合DNA序列(例如,与靶基因相关的DNA序列,或可操作地连接至靶基因的转录控制元件)。表达阻遏物包含至少一个DNA靶向部分和至少一个阻遏物结构域。
表达阻遏系统:如本文所用,术语“表达阻遏系统”指降低细胞中靶基因表达的多个表达阻遏物。在一些实施例中,表达阻遏系统包含第一表达阻遏物和第二表达阻遏物,其中第一表达阻遏物和第二表达阻遏物(或编码第一表达阻遏物和第二表达阻遏物的核酸)一起存在于单一组合物中,混合物或药物组合物中。在一些实施例中,表达阻遏系统包含第一表达阻遏物和第二表达阻遏物,其中第一表达阻遏物和第二表达阻遏物(或编码第一表达阻遏物和第二表达阻遏物的核酸)存在于分开的组合物或药物组合物中。在一些实施例中,第一表达阻遏物和第二表达阻遏物同时存在于同一细胞中。在一些实施例中,第一表达阻遏物和第二表达阻遏物不同时存在于同一细胞中,例如,它们顺序地存在。例如,第一表达阻遏物可以在细胞中存在第一时间段,然后第二表达阻遏物可以在细胞中存在第二时间段,其中第一和第二时间段可以重叠或不重叠。
基因组复合物:如本文所用,术语“基因组复合物”是经由多个蛋白质和/或其他组分(可能包括基因组序列元件)之间和其中的相互作用,将在一条或多条染色体上彼此隔开的两个基因组序列元件聚集在一起的复合物。在一些实施例中,基因组序列元件是锚序列,复合物的一种或多种蛋白质组分与之结合。在一些实施例中,基因组复合物可以包含锚序列介导的连接。在一些实施例中,基因组序列元件可以是或包含CTCF结合基序、启动子和/或增强子。在一些实施例中,基因组序列元件包括启动子和/或调控位点(例如,增强子)中的至少一者或二者。在一些实施例中,复合物形成在一个或多个基因组序列元件处成核和/或通过一种或多种蛋白质组分与一个或多个基因组序列元件的结合而成核。如本领域技术人员将理解的,在一些实施例中,经由形成复合物进行的基因组位点的共定位(例如,结合)改变了一个或多个基因组序列元件处或附近(在一些实施例中,包括它们之间)的DNA拓扑结构。在一些实施例中,基因组复合物包含锚序列介导的连接,其包含一个或多个环。在一些实施例中,如本文所述的基因组复合物由成核多肽(例如像CTCF和/或黏连蛋白)成核。在一些实施例中,如本文所述的基因组复合物可以包含例如CTCF、黏连蛋白(Cohesin)、非编码RNA(例如,eRNA)、转录机器蛋白(例如,RNA聚合酶、一个或多个转录因子,例如选自由TFIIA、TFIIB、TFIID、TFIIE、TFIIF、TFIIH等组成的组)、转录调节因子(例如,中介体(Mediator)、P300、增强子结合蛋白、阻遏物结合蛋白、组蛋白修饰剂等)等。在一些实施例中,如本文所述的基因组复合物包含一个或多个多肽组分和/或一个或多个核酸组分(例如,一个或多个RNA组分),在一些实施例中,它们可以彼此相互作用和/或与一个或多个基因组序列元件(例如,锚序列、启动子序列、调节序列(例如,增强子序列))相互作用,以便将一段基因组DNA限制到拓扑结构(例如,环)中,当复合物没有形成时,不会采用这种拓扑结构。
核酸:如本文所用,在其最广义上,术语“核酸”是指被并入或可并入寡核苷酸链中的任何化合物和/或物质。在一些实施例中,核酸是经由磷酸二酯键被掺入或可以被掺入寡核苷酸链的化合物和/或物质。从上下文可以清楚地看出,在一些实施例中,“核酸”是指单个核酸残基(例如,核苷酸和/或核苷);在一些实施例中,“核酸”是指包含单个核酸残基的寡核苷酸链。在一些实施例中,“核酸”是或包含RNA;在一些实施例中,“核酸”是或包含DNA。在一些实施例中,核酸是、包含一个或多个天然核酸残基或由其组成。在一些实施例中,核酸是、包含一种或多种核酸类似物或由其组成。在一些实施例中,核酸类似物与核酸的不同之处在于它不利用磷酸二酯主链。例如,在一些实施例中,核酸是、包含一种或多种“肽核酸”或由其组成,这些肽核酸是本领域已知的,并且在主链中具有肽键而不是磷酸二酯键,被认为在本披露的范围内。可替代地或另外地,在一些实施例中,核酸具有一个或多个硫代磷酸酯和/或5'-N-亚磷酰胺键,而不是磷酸二酯键。在一些实施例中,核酸是、包含一种或多种天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)或由其组成。在一些实施例中,核酸是、包含一种或多种核苷类似物(例如,2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-去氮腺苷、7-去氮鸟苷、8-氧腺苷、8-氧鸟苷、0(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、插入碱基、及其组合)或由其组成。在一些实施例中,与天然核酸中的相比,核酸包含一种或多种修饰的糖(例如,2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖)。在一些实施例中,核酸具有编码功能基因产物(如RNA或蛋白质)的核苷酸序列。在一些实施例中,核酸包含一个或多个内含子。在一些实施例中,通过从天然来源分离、通过基于互补模板的聚合的酶促合成(体内或体外)、在重组细胞或系统中复制以及化学合成中的一种或多种来制备核酸。在一些实施例中,核酸长度是至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000或更多个残基。在一些实施例中,核酸部分或全部是单链的;在一些实施例中,核酸部分或全部是双链的。在一些实施例中,核酸具有包含至少一个编码多肽的元件或者是编码多肽的序列的互补序列的核苷酸序列。在一个实施例中,核酸具有酶活性。
可操作地连接:如本文所用,短语“可操作地连接”是指一种并列关系,其中所述组分处于允许它们以其预期方式发挥功能的关系中。与功能元件(例如,基因)“可操作地连接”的转录控制元件以这样的方式关联:在与转录控制元件相容的条件下实现功能元件(例如,基因)的表达和/或活性。在一些实施例中,“可操作地连接的”转录控制元件与感兴趣的编码元件(例如,基因)是连续的(例如,共价连接);在一些实施例中,可操作地连接的转录控制元件反式作用于感兴趣的功能元件(例如,基因)或以其他方式在距其一定距离处起作用。在一些实施例中,可操作地连接意味着两个核酸序列包含在同一核酸分子上。在另一个实施例中,可操作地连接可以进一步意指两个核酸序列在同一核酸分子上彼此接近,例如,彼此在1000、500、100、50或10个碱基对内或彼此直接邻近。
肽、多肽、蛋白质:如本文所用,术语“肽”、“多肽”和“蛋白质”是指由通过肽键或通过除了肽键之外的方式共价连接的氨基酸残基组成的化合物。蛋白质或肽必须含有至少两个氨基酸,并且对可以包含蛋白质或肽的序列的氨基酸的最大数量没有限制。多肽包括包含两个或更多个通过肽键或通过除了肽键之外的方式相互连接的氨基酸的任何肽或蛋白质。如本文所用,该术语是指短链和长链二者,该短链在本领域中通常也称为例如肽、寡肽和寡聚体,并且该长链在本领域中通常称为蛋白质,这些蛋白质具有许多类型。
阻遏物结构域:如本文所用,术语“阻遏物结构域”是指具有一种或多种功能的结构域,当适当地定位在细胞核中时,该结构域降低细胞中靶基因的表达。在一些实施例中,阻遏物结构域是或包括多肽。在一些实施例中,阻遏物结构域是或包含多肽和核酸。与阻遏物结构域相关联的功能可能直接影响靶基因的表达,例如,阻断会刺激该基因的表达的转录因子的募集。与阻遏物结构域相关的功能可能会间接影响靶基因的表达,例如,引入表观遗传修饰或募集其他引入表观遗传修饰的因子,从而诱导染色体拓扑结构的变化,从而抑制靶基因的表达。
特异性结合:如本文所用,术语“特异性结合”是指在结合发生的环境中区分可能的结合配偶体的能力。在一些实施例中,当其他潜在靶标存在时与一个特定靶标相互作用的结合剂被称为“特异性结合”至与其相互作用的靶标。在一些实施例中,特异性结合通过检测或确定结合剂与其配偶体之间的结合程度来评估;在一些实施例中,特异性结合通过检测或确定结合剂-配偶体复合物的解离程度来评估。在一些实施例中,特异性结合通过检测或确定结合剂与其配偶体和另一实体之间的选择性相互作用竞争的能力来评估。在一些实施例中,特异性结合是通过在一定浓度范围内进行此类检测或确定来评估的。
基本上:如本文所用,术语“基本上”是指表现出感兴趣的特征或特性的全部或接近全部范围或程度的定性条件。本领域普通技术人员将理解,生物和化学现象很少(如果有的话)完成和/或进行到完全或实现或避免绝对结果。因此,术语“基本上”可以用于本文的一些实施例中,以捕捉许多生物和化学现象中固有的潜在不完整性。
症状减轻:如本文所用,当特定疾病、障碍或病症的一种或多种症状的程度(例如,强度、严重性等)和/或频率降低时,可以使用短语“症状减轻”。在一些实施例中,延迟特定症状的发作被认为是降低该症状频率的一种形式。
靶标:根据本披露,如果一种试剂或实体在它们彼此接触的条件下与靶向的试剂或实体特异性结合,则认为该试剂或实体“靶向”另一种试剂或实体。例如,在一些实施例中,抗体(或其抗原结合片段)靶向其同源表位或抗原。在一些实施例中,具有特定序列的核酸靶向基本上互补序列的核酸。
靶基因:如本文所用,术语“靶基因”意指被靶向用于调节例如表达的基因。在一些实施例中,靶基因是靶向的基因组复合物的一部分(例如,其基因组序列的至少一部分作为靶基因组复合物的一部分的基因,例如在锚序列介导的连接内),该基因组复合物被一种或多种如本文所述的调节剂靶向。在一些实施例中,调节包括抑制靶基因的表达。在一些实施例中,通过将靶基因或可操作地连接至靶基因上的转录控制元件与本文所述的表达阻遏系统(例如表达阻遏物)接触来调节靶基因。在一些实施例中,靶基因在细胞(例如,受试者(例如,患者)中的细胞)中异常表达(例如,过表达)。
DNA靶向部分:如本文所用,在表达阻遏物的上下文中,术语“DNA靶向部分”意指与DNA序列(例如,与靶基因相关联的DNA序列,或可操作地连接至靶基因的转录控制元件)特异性结合的结构域。
治疗剂:如本文所用,短语“治疗剂”是指当施用至受试者时,具有治疗效果和/或引起所期望的生物学和/或药理学效果的试剂。在一些实施例中,治疗剂是可用于减轻、改善、缓解、抑制、预防疾病、障碍和/或病症的一种或多种症状或特征、延迟其发作、降低其严重性和/或降低其发生率的任何物质。在一些实施例中,治疗剂包含本文所述的表达阻遏系统,例如表达阻遏物。在一些实施例中,治疗剂包含编码本文所述的表达阻遏系统例如表达阻遏物的核酸。在一些实施例中,治疗剂包含本文所述的药物组合物。
治疗有效量:如本文所用,术语“治疗有效量”意指当作为治疗方案的一部分施用时,引起所期望生物应答的物质(例如,治疗剂、组合物和/或配制品)的量。在一些实施例中,物质的治疗有效量是当施用至患有或易患疾病、障碍和/或病症的受试者时,足以治疗、诊断、预防疾病、障碍和/或病症和/或延迟其发作的量。如本领域的普通技术人员将理解,物质的有效量可取决于以下这类因素变化:如一个或多个所希望的生物学终点、待递送的物质、一个或多个靶细胞或一个或多个组织等。例如,在一些实施例中,用于治疗疾病、障碍和/或病症的配制品中化合物的有效量是缓解、改善、减轻、抑制、预防、延迟疾病、障碍和/或病症的一种或多种症状或特征的发作,降低疾病、障碍和/或病症的一种或多种症状或特征的严重程度,和/或降低疾病、障碍和/或病症的一种或多种症状或特征的发病率的量。在一些实施例中,治疗有效量以单个剂量施用;在一些实施例中,需要多个单位剂量来递送治疗有效量。
附图说明
当结合附图阅读时,将会更好地理解以下对本发明实施例的详细描述。出于图解说明本发明的目的,在附图中显示了目前示例的实施例。然而,应该理解的是,本发明不限于附图中所示实施例的精确布置及手段。
图1显示了基因组浏览器视图,其显示了β2M转录起始位点附近区域的关键特征。RNAseq(顶层)显示来自β2M基因的mRNA表达。先前描述的阳性对照(Cas9靶向,GD-21547)显示为绿色。蓝色指导物(GD-28228和GD-28229)用于靶向Sp-dCas9-KRAB,橙色指导物(GD-28171、GD-28172和GD-28173)用于使Sa-dCas9-MQ1靶向至β2M启动子区中的CpG岛(从顶数第二层)。根据启动子区域的低甲基化(在CpG甲基化轨迹中描绘,底层)选择指导物,其中甲基化从0到1(0到100%),红色条表示更高的甲基化。每个条代表CpG位点。
图2显示了用多种表达阻遏物或对照处理的HepG2细胞中β-2-微球蛋白表达(mRNA)的百分比变化图。显示的β2M mRNA水平是相对于未处理的对照(灰色)而言的。点显示生物学重复。条显示平均值,误差条表示标准偏差。指导物ID号显示在x轴上。用dCas9处理的样品以洋红色显示;dCas9-KRAB为绿色;sa-dCas9-MQ1为浅蓝色;dCas9-KRAB和sa-dCas9-MQ1的组合为深蓝色。带有Cas9的β2M敲除阳性对照以橙色显示。
图3显示了72小时后用多种表达阻遏物或对照处理情况下β-2-微球蛋白mRNA的百分比变化图(左),以及72小时后用各种表达阻遏物或对照处理情况下β-2-微球蛋白蛋白水平的流式细胞术数据图(右)。(左)用dCas9-KRAB(绿色)和Sa-dCas9-MQ1(浅蓝色)效应子单独和一起(深蓝色)处理导致相对于未处理的细胞(灰色)和用dCas9处理的细胞(洋红色)而言β2M mRNA减少。(右)流式细胞术显示,相对于未处理的细胞和用dCas9处理的细胞,用dCas9-KRAB和Sa-dCas9-MQ1处理的细胞中β2M免疫荧光降低的群体。
图4显示了用多种表达阻遏物或对照处理情况下经22天β-2-微球蛋白mRNA的倍数变化图。经22天,未转染的(蓝色线)和dCas9转染的(红色线)细胞不会改变β2M表达,而dCas9-KRAB(绿色线)转染的细胞在转染后的最初几天阻遏了β2M,第2天效果最大,但第5天后阻遏消失。SadCas9-MQ1(紫色线)转染的细胞显示出显著的阻遏(到第4天时高达85%),并且阻遏得以保留,然后慢慢消失,如图中保持在虚线正下的线所示。dCas9-KRAB+SadCas9-MQ1联合转染(橙色线)没有比单独使用SadCas9(紫色线)观察到更多阻遏。
图5显示了用多种表达阻遏物或对照处理情况下经18天β-2-微球蛋白mRNA的倍数变化图。经18天,未处理的细胞不改变β2M表达,而转染dCas9-MQ1、dCas9-DNMT3a/3L(m)、dCas9-DNMT3a/3L(hs)、dCas9-DNMT1和dCas9-DNMT3B的细胞表现出显著的转染后β2M阻遏。
图6显示了当用靶向位于MYC基因上游的CTCF位点的不同表达阻遏物或表达阻遏系统处理时,K-562细胞中MYC表达的倍数变化图。数据显示,至少,用dCas9-DNMT3a/3L(h)、dCas9-KRAB,FOG1-dCas9-FOG1、G9A-dCas9+EZH2-dCas9、dCas9-MQ1+EZH2-dCas9-KRAB、dCas9-LSD1+G9A-dCas9、dCas9-MQ1+dCas9-HDAC8和dCas9-MQ1+G9A-dCas9-KRAB处理的细胞在48小时和/或72小时时间点显示MYC表达的阻遏。
图7显示了当用靶向β2M启动子上游区域的不同表达阻遏物或表达阻遏系统处理时,K-562细胞中β2M表达的倍数变化图。数据显示,至少,用dCas9-HDAC8、dCas9-LSD1、dCas9-MQ1、FOG1-dCas9-FOG1、G9A-dCas9-KRAB、dCas9-DNMT3a/3L(h)、G9A-dCas9、EZH2-dCas9-KRAB、dCas9-KRAB、EZH2-dCas9-KRAB+dCas9-HDAC8、dCas9-LSD1+EZH2-dCas9-KRAB、dCas9-LSD1+dCas9-HDAC8、dCas9-KRAB+FOG1-dCas9-FOG1、dCas9-MQ1+G9A-dCas9-KRAB、G9A-dCas9+EZH2-dCas9、dCas9-MQ1+EZH2-dCas9-KRAB和dCas9-MQ1+dCas9-HDAC8处理的细胞在48小时、72小时和/或144小时时间点显示β2M表达的阻遏。
图8显示了当用靶向HSPA1B启动子下游区域的不同表达阻遏物或表达阻遏系统处理时,K-562细胞中HSPA1B表达的倍数变化图。数据显示,至少,用dCas9-HDAC8、EZH2-dCas9、dCas9-MQ1、dCas9-DNMT1、dCas9-DNMT3a/3L(h)、dCas9-DNMT3a/3L(m)、G9A-dCas9-KRAB、FOG1-dCas9-FOG1、G9A-dCas9、dCas9-KRAB、G9A-dCas9+dCas9-HDAC8、dCas9-LSD1+G9A-dCas9-KRAB、dCas9-LSD1+EZH2-dCas9、G9A-dCas9+EZH2-dCas9、dCas9-LSD1+EZH2-dCas9-KRAB、EZH2-dCas9+dCas9-HDAC8、dCas9-LSD1+dCas9-HDAC8、dCas9-MQ1+EZH2-dCas9-KRAB、dCas9-MQ1+dCas9-HDAC8、G9A-dCas9-KRAB+EZH2-dCas9-KRAB、dCas9-LSD1+G9A-dCas9和dCas9-MQ1+G9A-dCas9-KRAB处理的细胞在48小时、72小时和/或144小时时间点显示HSPA1B表达的阻遏。
图9显示了当用不同表达阻遏物或表达阻遏系统处理时,K-562细胞中GATA1表达的倍数变化图。数据显示,至少,用dCas9-HDAC8,dCas9-LSD1+dCas9-HDAC8,dCas9-MQ1+dCas9-HDAC8和G9A-dCas9+dCas9-HDAC8处理的细胞在48小时、72小时和/或144小时时间点时显示出GATA1表达的阻遏。
具体实施方式
本披露提供了通过使用表达阻遏物或表达阻遏系统来调节(例如,降低)靶基因在细胞中(例如,在受试者或患者中)的表达的技术。在一些实施例中,表达阻遏物包含DNA结合部分和至少一个阻遏物结构域。在一些实施例中,表达阻遏物包含两个阻遏物结构域。在一些实施例中,表达阻遏物包含两个相同的阻遏物结构域。在一些实施例中,表达阻遏物包含两个不同的阻遏物结构域。
在一些实施例中,表达阻遏系统包含两个或更多个表达阻遏物,每个表达阻遏物包含DNA靶向部分和至少一个阻遏物结构域。在一些实施例中,DNA靶向部分靶向两个或更多个不同的DNA序列(例如,每个表达阻遏物可靶向不同的DNA序列)。在不希望受理论束缚的情况下,使用包括靶向两个或更多个不同DNA序列的表达阻遏物的表达阻遏系统可能优于靶向单个DNA序列的类似系统,因为各个表达阻遏物不会彼此竞争或较少地彼此竞争结合至它们的靶DNA序列,从而实现阻遏物结构域的各种功能的优越定位。在一些实施例中,可能是有利的是,使用两个不同的DNA靶向部分将两个不同的阻遏物精确地靶向两个不同的确定位置,例如,将第一表达阻遏物靶向转录起始位点上游的第一位置,并且将第二表达阻遏物靶向包括转录起始位点的第二位置。在一些实施例中,表达阻遏物包含两个或更多个不同的阻遏物结构域(例如,每个表达阻遏物包含与每个其他表达阻遏物不同的阻遏物结构域)。在不希望受理论束缚的情况下,使用包括包含两个或更多个阻遏物结构域的表达阻遏物的表达阻遏系统可能优于包括单个阻遏物结构域的类似系统,这是由于与两个或更多个阻遏物结构域的协调作用相关联的对靶基因表达的协同效应。
表达阻遏物
本披露的表达阻遏物可包含DNA靶向部分和至少一个阻遏物结构域。在一些实施例中,表达阻遏物可包含1、2、3、4、5、6或更多个阻遏物结构域。在一些实施例中,表达阻遏物靶向两个或更多个不同的DNA序列(例如第1和第2、第3、第4、第5、第6、第7、第8、第9、第10、第11、第12和/或其他DNA序列,并且任选地不超过第20、第19、第18、第17、第16、第15、第14、第13、第12、第11、第10、第9、第8、第6、第5、第4、第3或第2个DNA序列)。在一些实施例中,表达阻遏物包括DNA靶向部分和多个阻遏物结构域(例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或更多个阻遏物结构域(并且任选地,少于20个、19个、18个、17个、16个、15个、14个、13个、12个、11个、10个、9个、8个、7个、6个、5个、4个、3个或2个阻遏物结构域)),其中每一个可与多于一个阻遏物结构域中的另一个相同或不同。
在一些实施例中,表达阻遏物包含第一阻遏物结构域和第二阻遏物结构域,其中第一阻遏物结构域与第二阻遏物结构域不同。在一些实施例中,表达阻遏物包含第一阻遏物结构域和第二阻遏物结构域,其中第一阻遏物结构域与第二阻遏物结构域相同。在一些实施例中,DNA靶向部分位于第一阻遏物结构域和第二阻遏物结构域之间。
表达阻遏物可包含多个阻遏物结构域,其中每个阻遏物结构域包含与其他阻遏物结构域不同的功能。例如,表达阻遏物可包含两个阻遏物结构域,其中第一阻遏物结构域包含DNA甲基化酶功能,第二阻遏物结构域包含转录阻遏物功能。在一些实施例中,表达阻遏物包含阻遏物结构域,所述阻遏物结构域的功能在降低靶基因的表达方面彼此互补,其中所述功能一起使得能够抑制表达,且任选地当单独存在时不抑制或可忽略地抑制表达。在一些实施例中,表达阻遏物包含多个阻遏物结构域,其中每个阻遏物结构域与其他阻遏物结构域互补,每个阻遏物结构域降低靶基因的表达。
在一些实施例中,表达阻遏物包含阻遏物结构域的组合,所述阻遏物结构域的功能在降低靶基因表达方面彼此协同。不希望被理论所束缚,在一些实施例中,据认为对基因组基因座的表观遗传修饰是累积的,因为多个转录激活表观遗传标记物(例如,多种不同类型的表观遗传标记物和/或给定类型的更广泛标记)单独地一起比单独的单个修饰更有效地抑制表达(例如,产生更大的表达降低和/或更持久的表达降低)。在一些实施例中,表达阻遏物包含多个阻遏物结构域,其中每个阻遏物结构域与其他阻遏物结构域协同作用,例如每个阻遏物结构域降低靶基因的表达。在一些实施例中,表达阻遏物(包含多个相互协同的阻遏物结构域)在抑制靶基因表达方面比包含单个阻遏物结构域的表达阻遏物更有效。在一些实施例中,包含所述多个阻遏物结构域的表达阻遏物在降低靶基因表达方面比包含单个阻遏物结构域的表达阻遏物更有效至少1.05x(即1.05倍)、1.1x、1.15x、1.2x、1.25x、1.3x、1.35x、1.4x、1.45x、1.5x、1.55x、1.6x、1.65x、1.7x、1.75x、1.8x、1.85x、1.9x、1.95x、2x、3x、4x、5x、6x、7x、8x、9x、10x、20x、30x、40x、50x、60x、70x、80x、90x或100x。
在一些实施例中,表达阻遏物包含例如通过肽键共价连接的DNA靶向部分和阻遏物结构域。在一些实施例中,DNA靶向部分和阻遏物结构域位于同一多肽链上,例如,通过一个或多个肽键和/或接头连接。在一些实施例中,表达阻遏物是或包含融合分子,例如,该融合分子包含通过肽键和/或接头连接的DNA靶向部分和阻遏物结构域。在一些实施例中,表达阻遏物包含靶向部分和多个效应子部分,其中靶向部分和多个效应子部分共价连接,例如,通过肽键(例如,靶向部分和多个效应子部分都是通过一系列共价键连接,尽管每个单独的部分可能不会与每个其他效应子部分共享共价键)。在一些实施例中,表达阻遏物包含连接至同一多肽链上的阻遏物结构域的N末端的DNA靶向部分。在一些实施例中,表达阻遏物包含连接至同一多肽链上的阻遏物结构域的C末端的DNA靶向部分。在一些实施例中,表达阻遏物包含DNA靶向部分,其连接至第一阻遏物结构域的C末端并连接至同一多肽链上的第二阻遏物结构域的N末端。在一些实施例中,表达阻遏物包含布置在同一多肽链上的阻遏物结构域的N末端的DNA靶向部分。在一些实施例中,表达阻遏物包含布置在同一多肽链上的阻遏物结构域的C末端的DNA靶向部分。在一些实施例中,表达阻遏物包含通过非肽键共价连接的DNA靶向部分和阻遏物结构域。在一些实施例中,DNA靶向部分通过非肽键缀合至阻遏物结构域。在一些实施例中,表达阻遏物包含DNA靶向部分和多个阻遏物结构域,其中DNA靶向部分和多个阻遏物结构域共价连接,例如,通过肽键(例如,DNA靶向部分和多个阻遏物结构域都是通过一系列共价键连接,尽管每个单独的结构域或部分可能不会与每个其他结构域或部分共享共价键)。
在其他实施例中,表达阻遏物包含未共价连接的DNA靶向部分和阻遏物结构域,例如,它们彼此非共价地相关联。在一些实施例中,表达阻遏物包含非共价结合至阻遏物结构域的DNA靶向部分或反之亦然。在一些实施例中,表达阻遏物包含DNA靶向部分和多个阻遏物结构域,其中DNA靶向部分和至少一个阻遏物结构域不共价连接,例如彼此非共价地相关联,并且其中DNA靶向部分和至少一个其他阻遏物结构域共价连接,例如通过肽键。
通常,本文所述的表达阻遏物结合(例如,通过DNA靶向部分)靶基因近侧的和/或可操作连接至靶基因的基因组序列元件。在一些实施例中,表达阻遏物与基因组序列元件的结合调节(例如降低)靶基因的表达。例如,包含募集转录机器组分或抑制其募集的阻遏物结构域的表达阻遏物与基因组序列元件的结合可以调节(例如降低)靶基因的表达。作为进一步的实例,包含具有酶活性的阻遏物结构域(例如表观遗传修饰部分)的表达阻遏物的结合可以通过阻遏物结构域的局部酶活性来调节(例如降低)靶基因的表达。作为进一步的实例,表达阻遏物与基因组序列元件的结合和表达阻遏物的局部酶活性都有助于最终调节(例如降低)靶基因的表达。
在一些实施例中,表达阻遏物包含阻遏物结构域,其中阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段,并且第二阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段。
在一些实施例中,表达阻遏物包含第一阻遏物结构域,其中阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段,并且第二阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段,以及第二阻遏物结构域,其中阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段,并且第二阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或其片段。
在一些实施例中,表达阻遏物包含DNA靶向部分和阻遏物结构域,其中阻遏物结构域(例如选自EZH1、EZH2、G9A、SUV39H1、FOG1、SETDB1或SETDB2的阻遏物结构域)的C末端和DNA靶向部分的N末端共价连接。在一些实施例中,表达阻遏物包含DNA靶向部分和阻遏物结构域,其中阻遏物结构域(例如选自LSD1、HDAC8、MQ1、DNMT1、DNMT3a/3L、FOG1或KRAB的阻遏物结构域)的N末端和DNA靶向部分的C末端共价连接。在一些实施例中,表达阻遏物包含DNA靶向部分、第一阻遏物结构域和第二阻遏物结构域,其中,第一阻遏物结构域(例如选自EZH1、EZH2、G9A、SUV39H1、FOG1、SETDB1或SETDB2的阻遏物结构域)的C末端和DNA靶向部分的N末端共价连接并且DNA靶向部分的C末端和第二阻遏物结构域(例如选自LSD1、HDAC8、MQ1、DNMT1、DNMT3a/3L、FOG1或KRAB的阻遏物结构域)的N末端共价连接。
在一些实施例中,如本文披露的表达阻遏物存在于组合物、药物组合物或混合物中。
虽然本文的几个实施例描述了包括多个表达阻遏物的系统,但应理解,本申请还提供单独的表达阻遏物,例如,用作单一药剂,或与无需在此说明的通用第二疗法组合使用。
在一些实施例中,本文所述的表达阻遏物是例如如下所述的表达阻遏系统的一部分。
表达阻遏系统
本披露的表达阻遏系统可包含两个或更多个表达阻遏物。在一些实施例中,表达阻遏系统包含2、3、4、5、6、7、8、9、10、11、12或更多个表达阻遏物(并且任选地不超过15、14、13、12、11、10、9、8、7、6、5、4、3或2个)。在一些实施例中,表达阻遏系统靶向两个或更多个不同的DNA序列(例如第1和第2、第3、第4、第5、第6、第7、第8、第9、第10、第11、第12和/或其他DNA序列,并且任选地不超过第20、第19、第18、第17、第16、第15、第14、第13、第12、第11、第10、第9、第8、第6、第5、第4、第3或第2个DNA序列)。在一些实施例中,表达阻遏系统包含多个表达阻遏物,其中多个表达阻遏物的每个成员不会可检测地结合,例如,不结合多个表达阻遏物的另一个成员。在一些实施例中,表达阻遏系统包含第一表达阻遏物和第二表达阻遏物,其中第一表达阻遏物不会可检测地结合,例如,不结合第二表达阻遏物。
在一些实施例中,本披露的表达阻遏系统包含两个或更多个表达阻遏物,其中表达阻遏物一起存在于组合物、药物组合物或混合物中。在一些实施例中,本披露的表达阻遏系统包含两个或更多个表达阻遏物,其中一个或多个表达阻遏物不与至少一个其他表达阻遏物混合。例如,表达阻遏系统可包含第一表达阻遏物和第二表达阻遏物,其中第一表达阻遏物在细胞核中的存在与第二表达阻遏物在相同细胞的细胞核中的存在不重叠,其中表达阻遏系统通过第一和第二表达阻遏物的非重叠存在实现靶基因表达的降低。
在一些实施例中,表达阻遏系统的表达阻遏物各自包含不同的DNA靶向部分(例如,第一、第二、第三或另外的表达阻遏物各自包含彼此不同的DNA靶向部分)。例如,表达阻遏系统可包含第一表达阻遏物和第二表达阻遏物,其中第一表达阻遏物包含第一DNA靶向部分(例如Cas9分子、TAL效应子分子或Zn指结构域),并且第二表达阻遏物包含不同于第一DNA靶向部分的第二DNA靶向部分(例如,Cas9分子、TAL效应子分子或Zn指结构域)。在一些实施例中,不同可指包含不同类型的DNA靶向部分,例如,第一DNA靶向部分包含Cas9分子,且第二DNA靶向部分包含TAL效应子分子。在其他实施例中,不同可以指包括同一类型的DNA靶向部分的不同变体,例如,第一DNA靶向部分包括第一Cas9分子(例如,来自第一物种)并且第二DNA靶向部分包括第二Cas9分子(例如,来自第二物种)。在一个实施例中,当表达阻遏系统包含两个或更多个相同类型的DNA靶向部分,例如两个或更多个Cas9分子时,DNA靶向部分特异性结合两个或更多个不同的DNA序列。例如,在包括两个或更多个Cas9分子的表达阻遏系统中,可以选择或改变所述两个或更多个Cas9分子,使得它们仅明显地结合对应于它们的靶DNA序列的gRNA(例如,而不会明显地结合对应于另一个Cas9分子的靶标的gRNA)。在另一个实例中,在包括两个或更多个TAL效应子分子的表达阻遏系统中,可以选择或改变所述两个或更多个TAL效应子分子,使得它们仅明显地与它们的靶DNA序列结合(例如,而不会明显地结合另一个TAL效应子分子的靶DNA序列)。
在一些实施例中,表达阻遏系统包含三个或更多个表达阻遏物并且两个或更多个表达阻遏物包含相同的DNA靶向部分。例如,表达阻遏系统可包含三个表达阻遏物,其中第一和第二表达阻遏物均包含第一DNA靶向部分并且第三表达阻遏物包含第二不同的DNA靶向部分。又如,表达阻遏系统可包含四个表达阻遏物,其中第一和第二表达阻遏物均包含第一DNA靶向部分,而第三和第四表达阻遏物包含第二不同的DNA靶向部分。又如,表达阻遏系统可包含五个表达阻遏物,其中第一和第二表达阻遏物均包含第一DNA靶向部分,第三和第四表达阻遏物均包含第二不同的DNA靶向部分,并且第五个表达阻遏物包含第三不同的DNA靶向部分。如上所述,不同可以指包含不同类型的DNA靶向部分或包含相同类型的DNA靶向部分的不同变体。
在一些实施例中,表达阻遏系统的表达阻遏物各自结合不同的DNA序列(例如,第一、第二、第三或另外的表达阻遏物各自结合彼此不同的DNA序列)。例如,表达阻遏系统可包含第一表达阻遏物和第二表达阻遏物,其中第一表达阻遏物结合第一DNA序列,第二表达阻遏物结合第二DNA序列。在一些实施例中,不同可以指:在一个表达阻遏物所结合的DNA序列和另一个表达阻遏物所结合的DNA序列之间至少有一个位置不相同,或者在一个表达阻遏物所结合的DNA序列中存在至少一个位置,该位置不存在于另一个表达阻遏物所结合的DNA序列中。例如,第一表达阻遏物可以结合第一示例性DNA序列5’-ATGATTGGATTTA-3’(SEQID NO:97),并且第二表达阻遏物可以结合第二示例性DNA序列5’-TGATTGGATTTAG-3’(SEQID NO:98);在所述示例中,第一和第二示例性DNA序列不同。对于进一步的实例,第一表达阻遏物可以结合第一示例性DNA序列5’-ATGATTgGATTTA-3’(SEQ ID NO:99),并且第二表达阻遏物可以结合第二示例性DNA序列5’-ATGATTcGATTTA-3’(SEQ ID NO:100);在所述示例中,第一和第二示例性DNA序列不同。在一些实施例中,第一DNA序列可位于第一基因组DNA链上且第二DNA序列可位于第二基因组DNA链上。在一些实施例中,第一DNA序列可位于与第二DNA序列相同的基因组DNA链上。
在一些实施例中,表达阻遏系统包含三个或更多个表达阻遏物并且两个或更多个表达阻遏物结合相同的DNA序列。例如,表达阻遏系统可包含三个表达阻遏物,其中第一和第二表达阻遏物均结合第一DNA序列,并且第三表达阻遏物结合第二不同DNA序列。又如,表达阻遏系统可包含四个表达阻遏物,其中第一和第二表达阻遏物均结合第一DNA序列,而第三和第四表达阻遏物均结合第二DNA序列。又如,表达阻遏系统可包含五个表达阻遏物,其中第一和第二表达阻遏物均结合第一DNA序列,第三和第四表达阻遏物均结合第二DNA序列,第五表达阻遏物结合第三DNA序列DNA序列。如上所述,不同可以指在一个表达阻遏物所结合的DNA序列和另一个表达阻遏物所结合的DNA序列之间至少有一个位置不相同,或者在一个表达阻遏物所结合的DNA序列中存在至少一个位置,该位置不存在于另一个表达阻遏物所结合的DNA序列中。
在一些实施例中,表达阻遏系统包含两个或更多个(例如两个)表达阻遏物并且多个(例如两个)表达阻遏物包含结合不同DNA序列的DNA靶向部分。在这样的实施例中,第一DNA靶向部分可以结合第一DNA序列并且第二DNA靶向部分可以结合第二DNA序列,其中第一和第二DNA序列不同并且不重叠。在一些此类实施例中,第一DNA序列与第二DNA序列相隔至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个碱基对(任选地,不超过500、400、300、200、100、95、90、85、80、75、70、65、60、55或50个碱基对)。在一些此类实施例中,第一DNA序列与第二DNA序列的间隔不超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个碱基对(任选地,没有碱基对,例如,第一和第二序列彼此直接相邻)。
在一些实施例中,表达阻遏系统的表达阻遏物各自包含不同的阻遏物结构域(例如,第一、第二、第三或另外的表达阻遏物各自包含彼此不同的阻遏物结构域)。例如,表达阻遏系统可包含第一表达阻遏物和第二表达阻遏物,其中第一表达阻遏物包含第一阻遏物结构域(例如,包含组蛋白甲基转移酶或其功能片段),并且第二表达阻遏物包含与第一阻遏物结构域不同的第二阻遏物结构域(例如,包含DNA甲基转移酶或其功能片段)。在一些实施例中,不同可以指包括不同类型的阻遏物结构域,例如,第一阻遏物结构域包括组蛋白甲基转移酶并且第二阻遏物结构域包括DNA甲基转移酶,或者第一阻遏物结构域包括组蛋白甲基转移酶并且第二阻遏物结构域包括酶的小分子抑制剂。在其他实施例中,不同可以指包括同一类型的阻遏物结构域的不同变体,例如,第一阻遏物结构域包括第一组蛋白甲基转移酶(例如,具有第一位点特异性或氨基酸序列)并且第二阻遏物结构域包括第二组蛋白甲基转移酶(例如,具有第二位点特异性或氨基酸序列)。
在一些实施例中,表达阻遏系统包含含有第一阻遏物结构域的第一表达阻遏物和含有第二阻遏物结构域的第二表达阻遏物,其中第一阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段,并且第二阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段。
在一些实施例中,表达阻遏系统包含含有第一阻遏物结构域的第一表达阻遏物和含有第二阻遏物结构域的第二表达阻遏物,其中第一阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段,第二阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段,并且第三阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段。
在一些实施例中,表达阻遏系统包括:(i)包含第一阻遏物结构域和第三阻遏物结构域的第一表达阻遏物,和(ii)包含第二阻遏物结构域和任选的第四阻遏物结构域的第二表达阻遏物,其中第一阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段,第二阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段,第三阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或片段,并且第四阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其功能变体或其片段。
在一些实施例中,第一阻遏物结构域包含组蛋白甲基转移酶活性(例如,SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2或其任一项的功能变体或片段,例如其任一项的SET结构域),并且第二阻遏物结构域包含组蛋白去甲基化酶活性(例如,KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66或其任一项的功能变体或片段)。在一些实施例中,第一阻遏物结构域包含组蛋白甲基转移酶活性并且第二阻遏物结构域包含组蛋白脱乙酰酶活性(例如,HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9或其任一项的功能变体或片段)。在一些实施例中,第一阻遏物结构域包含组蛋白甲基转移酶活性,第二阻遏物结构域包含DNA甲基转移酶活性(例如,MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L或其任一项的功能变体或片段)。在一些实施例中,第一阻遏物结构域包含组蛋白甲基转移酶活性并且第二阻遏物结构域包含DNA去甲基化酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白甲基转移酶活性并且第二阻遏物结构域包含转录阻遏物活性(例如,KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其任一项的功能变体或片段)。在一些实施例中,第一阻遏物结构域包含组蛋白甲基转移酶活性并且第二阻遏物结构域包含不同的组蛋白甲基转移酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白甲基转移酶活性并且第二阻遏物结构域包含相同的组蛋白甲基转移酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白去甲基化酶活性并且第二阻遏物结构域包含组蛋白脱乙酰酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白去甲基化酶活性并且第二阻遏物结构域包含DNA甲基转移酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白去甲基化酶活性并且第二阻遏物结构域包含DNA去甲基化酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白去甲基化酶活性并且第二阻遏物结构域包含转录阻遏物活性。在一些实施例中,第一阻遏物结构域包含组蛋白去甲基化酶活性并且第二阻遏物结构域包含不同的组蛋白去甲基化酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白去甲基化酶活性并且第二阻遏物结构域包含相同的组蛋白去甲基化酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白脱乙酰酶活性并且第二阻遏物结构域包含DNA甲基转移酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白脱乙酰酶活性并且第二阻遏物结构域包含DNA去甲基化酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白脱乙酰酶活性并且第二阻遏物结构域包含转录阻遏物活性。在一些实施例中,第一阻遏物结构域包含组蛋白脱乙酰酶活性并且第二阻遏物结构域包含不同的组蛋白脱乙酰酶活性。在一些实施例中,第一阻遏物结构域包含组蛋白脱乙酰酶活性并且第二阻遏物结构域包含相同的组蛋白脱乙酰酶活性。在一些实施例中,第一阻遏物结构域包含DNA甲基转移酶活性并且第二阻遏物结构域包含DNA去甲基化酶活性。在一些实施例中,第一阻遏物结构域包含DNA甲基转移酶活性并且第二阻遏物结构域包含转录阻遏物活性。在一些实施例中,第一阻遏物结构域包含DNA甲基转移酶活性并且第二阻遏物结构域包含不同的DNA甲基转移酶活性。在一些实施例中,第一阻遏物结构域包含DNA甲基转移酶活性并且第二阻遏物结构域包含相同的DNA甲基转移酶活性。在一些实施例中,第一阻遏物结构域包含DNA去甲基化酶活性并且第二阻遏物结构域包含转录阻遏物活性。在一些实施例中,第一阻遏物结构域包含DNA去甲基化酶活性并且第二阻遏物结构域包含不同的DNA去甲基化酶活性。在一些实施例中,第一阻遏物结构域包含DNA去甲基化酶活性并且第二阻遏物结构域包含相同的DNA去甲基化酶活性。在一些实施例中,第一阻遏物结构域包含转录阻遏物活性并且第二阻遏物结构域包含不同的转录阻遏物活性。在一些实施例中,第一阻遏物结构域包含转录阻遏物活性并且第二阻遏物结构域包含相同的转录阻遏物活性。
在一些实施例中,表达阻遏系统包含三个或更多个表达阻遏物并且两个或更多个表达阻遏物包含相同的DNA靶向部分。例如,表达阻遏系统可包含三个表达阻遏物,其中第一和第二表达阻遏物均包含第一阻遏物结构域并且第三表达阻遏物包含第二不同的阻遏物结构域。又如,表达阻遏系统可包含四个表达阻遏物,其中第一和第二表达阻遏物均包含第一阻遏物结构域并且第三和第四表达阻遏物包含第二不同的阻遏物结构域。又如,表达阻遏系统可包含五个表达阻遏物,其中第一和第二表达阻遏物均包含第一阻遏物结构域,第三和第四表达阻遏物均包含第二不同的阻遏物结构域,并且第五表达阻遏物包含第三不同的阻遏物结构域。如上所述,不同可以指包含不同类型的阻遏物结构域或包含相同类型阻遏物结构域的不同变体。
在一些实施例中,两个阻遏物结构域包含组蛋白甲基转移酶活性(例如,SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2或其任一项的功能变体或片段,例如其任一项的SET结构域),并且另一个阻遏物结构域包含组蛋白去甲基化酶活性(例如,KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66或其任一项的功能变体或片段)。在一些实施例中,两个阻遏物结构域包含组蛋白甲基转移酶活性并且另一个阻遏物结构域包含组蛋白脱乙酰酶活性(例如,HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9或其任一项的功能变体或片段)。在一些实施例中,两个阻遏物结构域包含组蛋白甲基转移酶活性并且另一个阻遏物结构域包含DNA甲基转移酶活性(例如,MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L或其任一项的功能变体或片段)。在一些实施例中,两个阻遏物结构域包含组蛋白甲基转移酶活性并且另一个阻遏物结构域包含DNA去甲基化酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白甲基转移酶活性并且另一个阻遏物结构域包含转录阻遏物活性(例如,KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12,或其任一项的功能变体或片段)。在一些实施例中,两个阻遏物结构域包含组蛋白甲基转移酶活性并且另一个阻遏物结构域包含不同的组蛋白甲基转移酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白甲基转移酶活性并且另一个阻遏物结构域包含相同的组蛋白甲基转移酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白去甲基化酶活性并且另一个阻遏物结构域包含组蛋白脱乙酰酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白去甲基化酶活性并且另一个阻遏物结构域包含DNA甲基转移酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白去甲基化酶活性并且另一个阻遏物结构域包含DNA去甲基化酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白去甲基化酶活性并且另一个阻遏物结构域包含转录阻遏物活性。在一些实施例中,两个阻遏物结构域包含组蛋白去甲基化酶活性并且另一个阻遏物结构域包含不同的组蛋白去甲基化酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白去甲基化酶活性并且另一个阻遏物结构域包含相同的组蛋白去甲基化酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白脱乙酰酶活性并且另一个阻遏物结构域包含DNA甲基转移酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白脱乙酰酶活性并且另一个阻遏物结构域包含DNA去甲基化酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白脱乙酰酶活性并且另一个阻遏物结构域包含转录阻遏物活性。在一些实施例中,两个阻遏物结构域包含组蛋白脱乙酰酶活性并且另一个阻遏物结构域包含不同的组蛋白脱乙酰酶活性。在一些实施例中,两个阻遏物结构域包含组蛋白脱乙酰酶活性并且另一个阻遏物结构域包含相同的组蛋白脱乙酰酶活性。在一些实施例中,两个阻遏物结构域包含DNA甲基转移酶活性并且另一个阻遏物结构域包含DNA去甲基化酶活性。在一些实施例中,两个阻遏物结构域包含DNA甲基转移酶活性并且另一个阻遏物结构域包含转录阻遏物活性。在一些实施例中,两个阻遏物结构域包含DNA甲基转移酶活性并且另一个阻遏物结构域包含不同的DNA甲基转移酶活性。在一些实施例中,两个阻遏物结构域包含DNA甲基转移酶活性并且另一个阻遏物结构域包含相同的DNA甲基转移酶活性。在一些实施例中,两个阻遏物结构域包含DNA去甲基化酶活性并且另一个阻遏物结构域包含转录阻遏物活性。在一些实施例中,两个阻遏物结构域包含DNA去甲基化酶活性并且另一个阻遏物结构域包含不同的DNA去甲基化酶活性。在一些实施例中,两个阻遏物结构域包含DNA去甲基化酶活性并且另一个阻遏物结构域包含相同的DNA去甲基化酶活性。在一些实施例中,两个阻遏物结构域包含转录阻遏物活性并且另一个阻遏物结构域包含不同的转录阻遏物活性。在一些实施例中,两个阻遏物结构域包含转录阻遏物活性并且另一个阻遏物结构域包含相同的转录阻遏物活性。
在一些实施例中,表达阻遏系统的两个或更多个(例如,所有)表达阻遏物彼此不共价地相关联,例如,每个表达阻遏物不与任何其他表达阻遏物共价地相关联。在另一个实施例中,表达阻遏系统的两个或更多个表达阻遏物彼此共价地相关联。在一个实施例中,表达阻遏系统包含布置在同一多肽上的第一表达阻遏物和第二表达阻遏物,例如作为融合分子,例如通过肽键和任选的接头连接。在一个实施例中,表达阻遏系统包含通过非肽键连接,例如彼此缀合的第一表达阻遏物和第二表达阻遏物。
接头
如本文所披露的表达阻遏物或表达阻遏系统可包含一个或多个接头。接头可以将DNA靶向部分连接至阻遏物结构域,将阻遏物结构域连接至另一个阻遏物结构域,或将DNA靶向部分连接至另一个DNA靶向部分。接头可以是化学键,例如一个或多个共价键或非共价键。在一些实施例中,接头是共价的。在一些实施例中,接头是非共价的。在一些实施例中,接头是肽接头。这种接头的长度可以在2-30、5-30、10-30、15-30、20-30、25-30、2-25、5-25、10-25、15-25、20-25、2-20、5-20、10-20、15-20、2-15、5-15、10-15、2-10、5-10、或2-5个氨基酸之间,或者长度大于或等于2、5、10、15、20、25或30个氨基酸(并且任选地,长度高达50、40、30、25、20、15、10或5个氨基酸)。在一些实施例中,接头可用于将第一结构域或部分与第二结构域或部分隔开,例如将DNA靶向部分与阻遏物结构域隔开。在一些实施例中,例如,接头可以位于DNA靶向部分和阻遏物结构域之间,例如,以提供二级和三级结构的分子柔性。接头可以包括本文所述的柔性的、刚性的和/或可切割的接头。在一些实施例中,接头包括至少一个甘氨酸、丙氨酸、和丝氨酸氨基酸以提供柔性。在一些实施例中,接头是疏水接头,例如包括带负电荷的磺酸盐基团、聚乙二醇(PEG)基团或焦磷酸二酯基团。在一些实施例中,接头是可切割的以选择性地从调节剂释放部分(例如多肽),但足够稳定以防止过早切割。
在一些实施例中,本文所述的表达阻遏物的一个或多个部分和/或结构域与一个或多个接头连接。在一些实施例中,表达阻遏可以包含位于DNA靶向部分和阻遏物结构域之间的接头。在一些实施例中,表达阻遏物可包含位于DNA靶向部分和第一阻遏物结构域之间的第一接头,以及位于DNA靶向部分和第二阻遏物结构域之间的第二接头。在一些实施例中,第一和第二接头可以相同。在一些实施例中,第一和第二接头可以不同。
如本领域技术人员所知,最常用的柔性接头具有的序列主要由Gly和Ser残基(“GS”接头)段组成。柔性接头可以有用于连接需要一定程度的移动或相互作用的结构域/部分,并且可以包括小的、非极性的(例如Gly)或极性的(例如Ser或Thr)氨基酸。Ser或Thr的掺入还可通过与水分子形成氢键来维持接头在水溶液中的稳定性,且因此减少了接头与部分/结构域之间的不利相互作用。
刚性接头有用于保持结构域/部分之间的固定距离并维持它们的独立功能。当结构域的空间分离对于保持融合中一种或多种组分的稳定性或生物活性至关重要时,刚性接头也可以是有用的。刚性接头可以具有α螺旋结构或富含脯氨酸的序列(Pro-richsequence)、(XP)n,其中X表示任何氨基酸,优选Ala、Lys或Glu。
可切割接头可以在体内释放游离的功能结构域。在一些实施例中,接头可以在特异性条件下(例如在还原剂或蛋白酶的存在下)切割。体内可切割接头可利用二硫键的可逆性质。一个实例包括两个Cys残基之间的凝血酶敏感性序列(例如,PRS)。CPRSC的体外凝血酶处理导致凝血酶敏感性序列的切割,而可逆的二硫键保持完整。此类接头是已知的并且描述于,例如,Chen等人,2013.Fusion Protein Linkers:Property,Design andFunctionality[融合蛋白接头:性质、设计和功能]Adv Drug Deliv.Rev.[先进药物输送评论]65(10):1357-1369。融合蛋白中接头的体内切割也可以通过蛋白酶进行,该蛋白酶在某些条件下在体内、在特定细胞或组织中、或在受限的某些细胞区室内表达。许多蛋白酶的特异性在受限的区室中提供了对接头的缓慢裂切割。
适用于本文所述接头的分子的实例包括带负电荷的磺酸盐基团;脂质,如聚(--CH2--)烃链,如聚乙二醇(PEG)基团,其不饱和变体,其羟基化变体,其酰胺化或其他含N的变体;非碳接头;碳水化合物接头;磷酸二酯接头,或能够共价连接表达阻遏物的两个或更多个组分的其他分子。也可包含非共价接头(例如多肽与之连接的疏水性脂质小球),例如通过多肽的疏水区或多肽的疏水延伸,例如富含亮氨酸、异亮氨酸、缬氨酸或者也可能是丙氨酸、苯丙氨酸或甚至酪氨酸、甲硫氨酸、甘氨酸的一系列残基或其他疏水残基。表达阻遏物的组分可以使用基于电荷的化学被连接,使得表达阻遏物的正电荷组分与另一组分的负电荷连接。
核酸
一方面,本披露提供了编码本文所述的表达阻遏物、表达阻遏系统、DNA靶向部分和/或阻遏物结构域的核酸序列。技术人员知道RNA的核酸序列与相应的DNA序列相同,除了胸腺嘧啶(T)通常被尿嘧啶(U)替代。应当理解,当核苷酸序列由DNA序列(例如,包括A、T、G、C)表示时,本披露还提供对应的RNA序列(例如,包括A、U、G、C),其中“U”代替“T”。本文使用常规符号来描述多核苷酸序列:单链多核苷酸序列的左手端是5'端;双链多核苷酸序列的左手方向称为5'方向。
本领域技术人员将理解,由于遗传密码的简并性,可以产生编码包括如本文所述的DNA靶向部分和/或阻遏物结构域的表达阻遏物的大量核苷酸序列,其中一些与本文披露的核酸序列具有相似性,例如,90%、95%、96%、97%、98%或99%的同一性。例如,密码子AGA、AGG、CGA、CGC、CGG和CGU都编码氨基酸精氨酸。因此,在本披露的核酸分子中精氨酸由密码子指定的每个位置,密码子可以改变为上述任何相应的密码子而不改变编码的多肽。
在一些实施例中,编码包含DNA靶向部分和/或一个或多个阻遏物结构域的表达阻遏物的核酸序列可以是密码子优化编码区的一部分或全部,根据哺乳动物例如人的密码子使用进行优化。在一些实施例中,编码DNA靶向部分和/或一个或多个阻遏物结构域的核酸序列是密码子优化的以增加蛋白质表达和/或增加蛋白质表达的持续时间。在一些实施例中,由密码子优化的核酸序列产生的蛋白质与由非密码子优化的核酸序列编码时的蛋白质水平相比高至少1%、至少2%、至少5%、至少10%、至少15%、至少20%、至少30%、至少40%或至少50%。
一方面,本披露涉及多肽,其包含一个或多个(例如,一个)DNA靶向部分和一个或多个阻遏物结构域,例如,其中阻遏物结构域是或包含MQ1,例如细菌MQ1,或其功能变体或片段。在一些实施例中,MQ1是单比亚螺原体(Spiroplasma monobiae)MQ1,例如,来自菌株ATCC 33825和/或对应于Uniprot ID P15840的MQ1。在一些实施例中,MQ1阻遏物结构域由SEQ ID NO:47的核苷酸序列编码。在一些实施例中,本文所述的核苷酸序列包含SEQ IDNO:47的序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,MQ1包含SEQ ID NO:90的氨基酸序列。在一些实施例中,MQ1包含SEQ ID NO:57的氨基酸序列。在一些实施例中,本文所述的效应子结构域包含SEQ ID NO:90或57或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,用于本文所述多肽的MQ1是变体,例如,相对于野生型MQ1(例如,SEQ ID NO:90或SEQ ID NO:57),包含一个或多个突变。在一些实施例中,MQ1变体包含相对于野生型MQ1的一个或多个氨基酸取代、缺失或插入。在一些实施例中,MQ1变体包含K297P取代。在一些实施例中,MQ1变体包含N299C取代。在一些实施例中,MQ1变体包含E301Y取代。在一些实施例中,MQ1变体包含Q147L取代(例如,并且相对于野生型MQ1具有降低的DNA甲基转移酶活性)。在一些实施例中,MQ1变体包含K297P、N299C和E301Y取代(例如,并且相对于野生型MQ1具有降低的DNA结合亲和力)。在一些实施例中,MQ1变体包含Q147L、K297P、N299C和E301Y取代(例如,并且相对于野生型MQ1具有降低的DNA甲基转移酶活性和DNA结合亲和力)。在一些实施例中,多肽包含一个或多个本文所述的接头,例如,将部分/结构域连接至另一个部分/结构域。在一些实施例中,多肽包含DNA靶向部分,该DNA靶向部分是或包含CRISPR/Cas分子,例如包含CRISPR/Cas蛋白,例如dCas9蛋白。在一些实施例中,多肽是融合蛋白,该融合蛋白包含阻遏物结构域和DNA靶向部分,该阻遏物结构域是或包含MQ1并且该DNA靶向部分是或包含CRISPR/Cas分子,例如包含CRISPR/Cas蛋白,例如dCas9蛋白。在一些实施例中,多肽包含本文所述的另外部分。在一些实施例中,多肽降低靶基因(例如,本文所述的靶基因)的表达。在一些实施例中,多肽可用于调节(例如,降低)基因表达的方法、治疗病症的方法或对本文所述的靶基因或转录控制元件进行表观遗传修饰(例如,代替表达阻遏系统)的方法。在一些实施例中,表达阻遏系统包含两个或更多个(例如,两个、三个或四个)表达阻遏物,其中第一表达阻遏物包含阻遏物结构域,该阻遏物结构域包含MQ1,例如细菌MQ1,或其功能变体或片段。
在另一方面,本披露涉及包含一个或多个(例如,一个)靶向部分和一个或多个效应子部分的表达阻遏物或多肽,其中效应子部分是或包含Krueppel相关盒(KRAB),例如,如根据NP_056209.2,或NM_015394.5编码的蛋白质或其功能变体或片段。在一些实施例中,KRAB是合成的KRAB构建体。在一些实施例中,KRAB包含SEQ ID NO:61的氨基酸序列:
在一些实施例中,KRAB阻遏物结构域由SEQ ID NO:51的核苷酸序列编码。在一些实施例中,本文所述的核苷酸序列包含SEQ ID NO:51的序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,用于本文所述的多肽或表达阻遏物的KRAB是变体,例如,相对于SEQ ID NO:61的KRAB序列包含一个或多个突变。在一些实施例中,KRAB变体包含相对于SEQID NO:61的一个或多个氨基酸取代、缺失或插入。
在一些实施例中,多肽或表达阻遏物是包含作为或含有KRAB的阻遏物结构域和DNA靶向部分的融合蛋白。在一些实施例中,多肽或表达阻遏物包含本文所述的另外部分。在一些实施例中,多肽或表达阻遏物降低靶基因的表达。在一些实施例中,多肽或表达阻遏物可用于调节(例如,降低)基因表达的方法、治疗病症的方法或对本文所述的靶基因例如转录控制元件进行表观遗传修饰(例如,代替表达阻遏系统)的方法。在一些实施例中,表达阻遏系统包含两个或更多个(例如,两个、三个或四个)表达阻遏物,其中第一表达阻遏物包含阻遏物结构域,该阻遏物结构域包含SEQ ID NO:61的KRAB序列,或其功能变体或片段。
在另一方面,本披露涉及表达阻遏物或多肽,其包含一个或多个(例如,一个)DNA靶向部分和一个或多个阻遏物结构域,其中阻遏物结构域是或包含DNMT1,例如人DNMT1,或其功能变体或片段。在一些实施例中,DNMT1是人DNMT1,例如对应于基因ID 1786,例如对应于UniPort ID P26358.2。在一些实施例中,DNMT1包含SEQ ID NO:58的氨基酸序列。在一些实施例中,本文所述的阻遏物结构域包含根据SEQ ID NO:58的序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列:
在一些实施例中,DNMT1由SEQ ID NO:48的核苷酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:48的序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列:
在一些实施例中,用于本文所述的多肽或表达阻遏物的DNMT1是变体,例如,相对于SEQ ID NO:58的DNMT序列包含一个或多个突变。在一些实施例中,效应子结构域包含相对于野生型DNMT1的一个或多个氨基酸取代、缺失或插入。在一些实施例中,多肽是包含作为或含有DNMT1的阻遏物结构域和靶向部分的融合蛋白。在一些实施例中,表达阻遏系统包含两个或更多个(例如,两个、三个或四个)表达阻遏物,其中第一表达阻遏物包含阻遏物结构域,该阻遏物结构域包含DNMT1,或其功能变体或片段。
在另一方面,本披露涉及表达阻遏物或多肽,其包含一个或多个(例如,一个)DNA靶向部分和一个或多个阻遏物结构域,其中阻遏物结构域是或包含DNMT3a/3L复合物,或其功能变体或片段。在一些实施例中,DNMT3a/3L复合物是融合构建体。在一些实施例中,DNMT3a/3L复合物包含DNMT3A,例如人DNMT3A,例如根据NP_072046.2或由NM_022552.4编码的蛋白质)。在一些实施例中,DNMT3a/3L复合物包含小鼠DNMT3A,例如根据NP_031898或由NM_007872编码的蛋白质。在一些实施例中,DNMT3a/3L复合物包含人DNMT3L(例如根据NP_787063.1或由NM_175867.3编码的蛋白质)。在一些实施例中,DNMT3a/3L复合物包含小鼠DNMT3L(例如根据NP_001075164或由NM_001081695编码的蛋白质)。在一些实施例中,DNMT3a/3L包含SEQ ID NO:59或60的氨基酸序列。在一些实施例中,本文所述的阻遏物结构域包含SEQ ID NO:59或SEQ ID NO:60或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,DNMT3a/3L由SEQ ID NO:49或SEQ ID NO:50的核苷酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:49或50的序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,用于本文所述的多肽或表达阻遏物的DNMT3a/3L是变体,例如,相对于SEQ ID NO:59或SEQ ID NO:60的DNMT3a/3L包含一个或多个突变。在一些实施例中,DNMT3a/3L变体包含相对于SEQ ID NO:59或SEQ ID NO:60的一个或多个氨基酸取代、缺失或插入。在一些实施例中,多肽或表达阻遏物是包含作为或含有DNMT3a/3L的阻遏物结构域和DNA靶向部分的融合蛋白。在一些实施例中,表达阻遏系统包含两个或更多个(例如,两个、三个或四个)表达阻遏物,其中第一表达阻遏物包含阻遏物结构域,该阻遏物结构域包含DNMT3a/3L,或其功能变体或片段。
在另一方面,本披露涉及表达阻遏物或多肽,其包含一个或多个(例如,一个)DNA靶向部分和一个或多个阻遏物结构域,其中阻遏物结构域是或包含DNMT3b,例如人DNMT3b,或其功能变体或片段。在一些实施例中,DNMT3b是人DNMT3b,例如,根据NP_008823.1或
AOX21819.1,或由NM_006892.4或KX447429编码的蛋白质。)在一些实施例中,DNMT3b包含SEQ ID NO:85的氨基酸序列。在一些实施例中,本文所述的阻遏物结构域包含SEQ ID NO:85或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在另一方面,本披露涉及包含一个或多个(例如,一个)靶向部分和一个或多个效应子部分的表达阻遏物或多肽,其中效应子部分是或包含G9A,例如,如根据NP_001350618.1,或NM_001363689.1编码的蛋白质或其功能变体或片段。在一些实施例中,G9A包含SEQ ID NO:62的氨基酸序列:
在一些实施例中,G9A阻遏物结构域由SEQ ID NO:52的核苷酸序列编码。在一些实施例中,本文所述的核苷酸序列包含SEQ ID NO:52的序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,用于本文所述的多肽或表达阻遏物的G9A是变体,例如,相对于SEQ ID NO:62的G9A序列包含一个或多个突变。在一些实施例中,G9A变体包含相对于SEQID NO:62的一个或多个氨基酸取代、缺失或插入。
在一些实施例中,多肽或表达阻遏物是包含作为或包含G9A的阻遏物结构域和DNA靶向部分的融合蛋白。在一些实施例中,多肽或表达阻遏物包含本文所述的另外部分。在一些实施例中,多肽或表达阻遏物降低靶基因的表达。在一些实施例中,多肽或表达阻遏物可用于调节(例如,降低)基因表达的方法、治疗病症的方法或对本文所述的靶基因例如转录控制元件进行表观遗传修饰(例如,代替表达阻遏系统)的方法。在一些实施例中,表达阻遏系统包含两个或更多个(例如,两个、三个或四个)表达阻遏物,其中第一表达阻遏物包含阻遏物结构域,该阻遏物结构域包含SEQ ID NO:62的G9A序列,或其功能变体或片段。
在另一方面,本披露涉及包含一个或多个(例如,一个)靶向部分和一个或多个效应子部分的表达阻遏物或多肽,其中效应子部分是或包含HDAC8,例如,如根据NP_001159890,或NM_001166418编码的蛋白质或其功能变体或片段。在一些实施例中,HDAC8包含SEQ ID NO:63的氨基酸序列:
在一些实施例中,HDAC8阻遏物结构域由SEQ ID NO:53的核苷酸序列编码。在一些实施例中,本文所述的核苷酸序列包含SEQ ID NO:53的序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,用于本文所述的多肽或表达阻遏物的HDAC8是变体,例如,相对于SEQ ID NO:63的HDAC8序列包含一个或多个突变。在一些实施例中,HDAC8变体包含相对于SEQ ID NO:63的一个或多个氨基酸取代、缺失或插入。
在一些实施例中,多肽或表达阻遏物是包含作为或包含HDAC8的阻遏物结构域和DNA靶向部分的融合蛋白。在一些实施例中,多肽或表达阻遏物包含本文所述的另外部分。在一些实施例中,多肽或表达阻遏物降低靶基因的表达。在一些实施例中,多肽或表达阻遏物可用于调节(例如,降低)基因表达的方法、治疗病症的方法或对本文所述的靶基因例如转录控制元件进行表观遗传修饰(例如,代替表达阻遏系统)的方法。在一些实施例中,表达阻遏系统包含两个或更多个(例如,两个、三个或四个)表达阻遏物,其中第一表达阻遏物包含阻遏物结构域,该阻遏物结构域包含SEQ ID NO:63的HDAC8序列,或其功能变体或片段。
在另一方面,本披露涉及包含一个或多个(例如,一个)靶向部分和一个或多个效应子部分的表达阻遏物或多肽,其中效应子部分是或包含LSD1,例如,如根据NP_055828.2,或NM_015013.4编码的蛋白质或其功能变体或片段。在一些实施例中,KRAB包含SEQ ID NO:64的氨基酸序列:
在一些实施例中,LSD1阻遏物结构域由SEQ ID NO:54的核苷酸序列编码。在一些实施例中,本文所述的核苷酸序列包含SEQ ID NO:54的序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,用于本文所述的多肽或表达阻遏物的LSD1是变体,例如,相对于SEQ ID NO:64的LSD1序列包含一个或多个突变。在一些实施例中,LSD1变体包含相对于SEQID NO:64的一个或多个氨基酸取代、缺失或插入。
在一些实施例中,多肽或表达阻遏物是包含作为或包含LSD1的阻遏物结构域和DNA靶向部分的融合蛋白。在一些实施例中,多肽或表达阻遏物包含本文所述的另外部分。在一些实施例中,多肽或表达阻遏物降低靶基因的表达。在一些实施例中,多肽或表达阻遏物可用于调节(例如,降低)基因表达的方法、治疗病症的方法或对本文所述的靶基因例如转录控制元件进行表观遗传修饰(例如,代替表达阻遏系统)的方法。在一些实施例中,表达阻遏系统包含两个或更多个(例如,两个、三个或四个)表达阻遏物,其中第一表达阻遏物包含阻遏物结构域,该阻遏物结构域包含SEQ ID NO:64的LSD1序列,或其功能变体或片段。
在另一方面,本披露涉及包含一个或多个(例如,一个)靶向部分和一个或多个效应子部分的表达阻遏物或多肽,其中效应子部分是或包含EZH2,例如,如根据NP-004447.2,或NM_004456.5编码的蛋白质或其功能变体或片段。在一些实施例中,EZH2包含SEQ ID NO:65的氨基酸序列:
在一些实施例中,EZH2阻遏物结构域由SEQ ID NO:55的核苷酸序列编码。在一些实施例中,本文所述的核苷酸序列包含SEQ ID NO:55的序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,用于本文所述的多肽或表达阻遏物的EZH2是变体,例如,相对于SEQ ID NO:65的EZH2序列包含一个或多个突变。在一些实施例中,EZH2变体包含相对于SEQID NO:65的一个或多个氨基酸取代、缺失或插入。
在一些实施例中,多肽或表达阻遏物是包含作为或包含EZH2的阻遏物结构域和DNA靶向部分的融合蛋白。在一些实施例中,多肽或表达阻遏物包含本文所述的另外部分。在一些实施例中,多肽或表达阻遏物降低靶基因的表达。在一些实施例中,多肽或表达阻遏物可用于调节(例如,降低)基因表达的方法、治疗病症的方法或对本文所述的靶基因例如转录控制元件进行表观遗传修饰(例如,代替表达阻遏系统)的方法。在一些实施例中,表达阻遏系统包含两个或更多个(例如,两个、三个或四个)表达阻遏物,其中第一表达阻遏物包含阻遏物结构域,该阻遏物结构域包含SEQ ID NO:65的EZH2序列,或其功能变体或片段。
在另一方面,本披露涉及包含一个或多个(例如,一个)靶向部分和一个或多个效应子部分的表达阻遏物或多肽,其中效应子部分是或包含FOG1,例如,如根据NP_722520.2,或NM_153813.3编码的蛋白质或其功能变体或片段。在一些实施例中,FOG1包含SEQ ID NO:66的氨基酸序列:SRRKQSNPRQIKRSLGDMEAREEVQLVGASHMEQKATAPEAPSP(SEQ ID NO:66)
在一些实施例中,FOG1阻遏物结构域由SEQ ID NO:56的核苷酸序列编码。在一些实施例中,本文所述的核苷酸序列包含SEQ ID NO:56的序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,用于本文所述的多肽或表达阻遏物的FOG1是变体,例如,相对于SEQ ID NO:66的FOG 1序列包含一个或多个突变。在一些实施例中,FOG1变体包含相对于SEQ ID NO:66的一个或多个氨基酸取代、缺失或插入。
在一些实施例中,多肽或表达阻遏物是包含作为或包含FOG1的阻遏物结构域和DNA靶向部分的融合蛋白。在一些实施例中,多肽或表达阻遏物包含本文所述的另外部分。在一些实施例中,多肽或表达阻遏物降低靶基因的表达。在一些实施例中,多肽或表达阻遏物可用于调节(例如,降低)基因表达的方法、治疗病症的方法或对本文所述的靶基因例如转录控制元件进行表观遗传修饰(例如,代替表达阻遏系统)的方法。在一些实施例中,表达阻遏系统包含两个或更多个(例如,两个、三个或四个)表达阻遏物,其中第一表达阻遏物包含阻遏物结构域,该阻遏物结构域包含SEQ ID NO:66的FOG1序列,或其功能变体或片段。
在一些实施例中,所提供的技术被描述为包含特异性靶向靶基因的gRNA。在一些实施例中,靶基因是癌基因、肿瘤抑制基因或MYC错配障碍相关基因。在一些实施例中,靶基因是MYC。在一些实施例中,靶基因是MHC I类分子,例如β2M。在一些实施例中,靶基因编码热休克蛋白,例如,HSPA1B。在一些实施例中,靶基因是转录因子,例如,GATA1。
在一些实施例中,本文提供的技术包括通过将本文所述的一个或多个表达阻遏物或表达阻遏系统连接至DNA靶向部分作为融合分子的一部分,将这样的部分递送至受试者(例如,递送至受试者的细胞核或组织)的方法。
在一些实施例中,表达阻遏物包含核定位序列(NLS)。在一些实施例中,表达阻遏物包含NLS,例如,在N末端的SV40 NLS。在一些实施例中,表达阻遏物包含NLS,例如C末端的核质蛋白NLS。在一些实施例中,表达阻遏物包含在N末端的第一NLS和在C末端的第二NLS。在一些实施例中,第一和第二NLS具有相同的序列。在一些实施例中,第一和第二NLS具有不同的序列。在一些实施例中,表达阻遏阻遏物包含SV40 NLS,例如,表达阻遏物包含根据PKKKRK(SEQ ID NO:86)的序列。在一些实施例中,表达阻遏物包含表位标签,例如HA标签:YPYDVPDYA(SEQ ID NO:80)。例如,表达阻遏物可包含表位标签的两个拷贝。
虽然表位标签在许多研究环境中很有用,但有时希望在治疗环境中省略表位标签。因此,在一些实施例中,表达阻遏物缺少表位标签。在一些实施例中,本文所述的表达阻遏物包含本文提供的序列(或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列),但缺少SEQ ID NO:80的HA标签。在一些实施例中,本文所述的核酸包含本文提供的序列(或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列),但缺少编码SEQ IDNO:80的HA标签的区域。在一些实施例中,表达阻遏物包含核质蛋白NLS,例如,表达阻遏物包含序列KRPAATKKAGQAKKK(SEQ ID NO:87)。在一些实施例中,表达阻遏物不包含NLS。在一些实施例中,表达阻遏物不包含表位标签。在一些实施例中,表达阻遏物不包含HA标签。在一些实施例中,表达阻遏物不包含根据SEQ ID NO:80的HA标签序列。
DNA靶向部分
DNA靶向部分可以特异性结合DNA序列,例如,与靶基因相关联的DNA序列,例如,结合靶基因中的、靶基因近侧的和/或可操作地连接至靶基因的基因组序列元件(例如,启动子、TSS或锚序列)。特异性结合DNA序列的任何分子或化合物均可用作DNA靶向部分。
在一些实施例中,DNA靶向部分靶向(例如,结合)基因组复合物(例如,ASMC)的组分。在一些实施例中,DNA靶向部分靶向(例如,结合)与靶基因可操作地连接的表达控制序列(例如,启动子或增强子)。在一些实施例中,DNA靶向部分靶向(例如,结合)靶基因或靶基因的一部分。DNA靶向部分的靶标可以被称为其靶向的组分。靶向的组分可以是与靶基因可操作地连接的任何基因组序列元件或靶基因本身,包括但不限于启动子、增强子、锚序列、外显子、内含子、UTR编码序列、剪接位点或转录起始位点。在一些实施例中,DNA靶向部分特异性结合一个或多个靶锚序列(例如,在细胞内)并且不结合非靶向的锚序列(例如,在同一细胞内)。
在一些实施例中,DNA靶向部分可以是或包含CRISPR/Cas分子、TAL效应子分子、Zn指结构域、肽核酸(PNA)或核酸分子。在一些实施例中,表达阻遏物包含一个DNA靶向部分。在一些实施例中,表达阻遏系统包含多个表达阻遏物,其中多个表达阻遏物的每个成员包含DNA靶向部分,其中每个DNA靶向部分不会可检测地结合,例如不结合另一个DNA靶向部分。在一些实施例中,表达阻遏系统包含含有第一DNA靶向部分的第一表达阻遏物和含有第二DNA靶向部分的第二表达阻遏物,其中第一DNA靶向部分不会可检测地结合,例如,不结合第二DNA靶向部分。在一些实施例中,表达阻遏系统包含含有第一DNA靶向部分的第一表达阻遏物和含有第二DNA靶向部分的第二表达阻遏物,其中第一DNA靶向部分不会可检测地结合,例如,不结合另一个第一DNA靶向部分,并且第二DNA靶向部分不会可检测地结合,例如不结合另一个第二DNA靶向部分。在一些实施例中,用于本文所述的组合物和方法的DNA靶向部分在单体状态(例如非二聚体状态)下是有功能的(例如,结合DNA序列)。
在一些实施例中,靶向部分与靶向的组分的结合降低了靶向的组分对另一种转录因子、基因组复合物组分或基因组序列元件的结合亲和力。在一些实施例中,DNA靶向部分以小于或等于500、450、400、350、300、250、200、150、100、50、40、30、20、10、9、8、7、6、5、4、3、2、1、0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2、0.1、0.09、0.08、0.07、0.06、0.05、0.04、0.03、0.02、0.01、0.005、0.002或0.001nM的KD(并且任选地,至少50、40、30、20、10、9、8、7、6、5、4、3、2、1、0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2、0.1、0.09、0.08、0.07、0.06、0.05、0.04、0.03、0.02、0.01、0.005、0.002或0.001nM的KD)与其靶序列结合。在一些实施例中,DNA靶向部分以0.001nM至500nM,例如0.1nM至5nM,例如约0.5nM的KD与其靶序列结合。在一些实施例中,DNA靶向部分以至少500、600、700、800、900、1000、2000、5000、10,000或100,000nM的KD结合非靶序列(并且任选地,不会明显地结合非靶序列)。在一些实施例中,DNA靶向部分不结合非靶序列。
在一些实施例中,DNA靶向部分包括与靶向的组分(例如靶基因的启动子)互补的核酸序列。在一些实施例中,靶向部分包含与靶向的组分至少10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%互补的核酸序列。
在一些实施例中,表达阻遏物的DNA靶向部分包含不超过100、90、80、70、60、50、40、30或20个核苷酸(并且任选至少10、20、30、40、50、60、70、80或90个核苷酸)。在一些实施例中,融合分子的表达阻遏物或阻遏物结构域包含不超过2000、1900、1800、1700、1600、1500、1400、1300、1200、1100、1000、900、800、700、600、500、400、300、200、或100个氨基酸(并且任选至少50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、或1900个氨基酸)。在一些实施例中,融合分子的表达阻遏物或效应子部分包含100-2000、100-1900、100-1800、100-1700、100-1600、100-1500、100-1400、100-1300、100-1200、100-1100、100-1000、100-900、100-800、100-700、100-600、100-500、100-400、100-300、100-200、200-2000、200-1900、200-1800、200-1700、200-1600、200-1500、200-1400、200-1300、200-1200、200-1100、200-1000、200-900、200-800、200-700、200-600、200-500、200-400、200-300、300-2000、300-1900、300-1800、300-1700、300-1600、300-1500、300-1400、300-1300、300-1200、300-1100、300-1000、300-900、300-800、300-700、300-600、300-500、300-400、400-2000、400-1900、400-1800、400-1700、400-1600、400-1500、400-1400、400-1300、400-1200、400-1100、400-1000、400-900、400-800、400-700、400-600、400-500、500-2000、500-1900、500-1800、500-1700、500-1600、500-1500、500-1400、500-1300、500-1200、500-1100、500-1000、500-900、500-800、500-700、500-600、600-2000、600-1900、600-1800、600-1700、600-1600、600-1500、600-1400、600-1300、600-1200、600-1100、600-1000、600-900、600-800、600-700、700-2000、700-1900、700-1800、700-1700、700-1600、700-1500、700-1400、700-1300、700-1200、700-1100、700-1000、700-900、700-800、800-2000、800-1900、800-1800、800-1700、800-1600、800-1500、800-1400、800-1300、800-1200、800-1100、800-1000、800-900、900-2000、900-1900、900-1800、900-1700、900-1600、900-1500、900-1400、900-1300、900-1200、900-1100、900-1000、1000-2000、1000-1900、1000-1800、1000-1700、1000-1600、1000-1500、1000-1400、1000-1300、1000-1200、1000-1100、1100-2000、1100-1900、1100-1800、1100-1700、1100-1600、1100-1500、1100-1400、1100-1300、1100-1200、1200-2000、1200-1900、1200-1800、1200-1700、1200-1600、1200-1500、1200-1400、1200-1300、1300-2000、1300-1900、1300-1800、1300-1700、1300-1600、1300-1500、1300-1400、1400-2000、1400-1900、1400-1800、1400-1700、1400-1600、1400-1500、1500-2000、1500-1900、1500-1800、1500-1700、1500-1600、1600-2000、1600-1900、1600-1800、1600-1700、1700-2000、1700-1900、1700-1800、1800-2000、1800-1900、或1900-2000个氨基酸。
如本文所披露的表达阻遏物或表达阻遏系统可包含核酸,例如一个或多个核酸。在一些实施例中,“核酸”是或包含RNA;在一些实施例中,“核酸”是或包含DNA。在一些实施例中,核酸是或包含多于50%的核糖核苷酸。在一些实施例中,核酸是、包含一个或多个天然核酸残基或由其组成。在一些实施例中,核酸是、包含一种或多种核酸类似物或由其组成。在一些实施例中,核酸类似物与核酸的不同之处在于它不利用磷酸二酯主链。例如,在一些实施例中,核酸是一个或多个肽核酸、包含一个或多个肽核酸或由一个或多个肽核酸组成。可替代地或另外地,在一些实施例中,核酸具有一个或多个硫代磷酸酯和/或5'-N-亚磷酰胺键,而不是磷酸二酯键。在一些实施例中,核酸是、包含一种或多种天然核苷(例如,腺苷、胸苷、鸟苷、胞苷、尿苷、脱氧腺苷、脱氧胸苷、脱氧鸟苷和脱氧胞苷)或由其组成。在一些实施例中,核酸是、包含一种或多种核苷类似物(例如,2-氨基腺苷、2-硫代胸苷、肌苷、吡咯并嘧啶、3-甲基腺苷、5-甲基胞苷、C-5丙炔基-胞苷、C-5丙炔基-尿苷、2-氨基腺苷、C5-溴尿苷、C5-氟尿苷、C5-碘尿苷、C5-丙炔基-尿苷、C5-丙炔基-胞苷、C5-甲基胞苷、2-氨基腺苷、7-去氮腺苷、7-去氮鸟苷、8-氧腺苷、8-氧鸟苷、0(6)-甲基鸟嘌呤、2-硫代胞苷、甲基化碱基、插入碱基、及其组合)或由其组成。在一些实施例中,与天然核酸中的相比,核酸包含一种或多种修饰的糖(例如,2'-氟核糖、核糖、2'-脱氧核糖、阿拉伯糖和己糖)。在一些实施例中,核酸具有编码功能基因产物(如RNA或蛋白质)的核苷酸序列。在一些实施例中,核酸包含一个或多个内含子。在一些实施例中,通过从天然来源分离、通过基于互补模板的聚合的酶促合成(体内或体外)、在重组细胞或系统中复制以及化学合成中的一种或多种来制备核酸。在一些实施例中,核酸长度是至少3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、20、225、250、275、300、325、350、375、400、425、450、475、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000或更多个残基。在一些实施例中,核酸的长度可以是约2nt至约5000nt、约10nt至约100nt、约50nt至约150nt、约100nt至约200nt、约150nt至约250nt、约200nt至约300nt、约250nt至约350nt、约300nt至约500nt、约10nt至约1000nt、约50nt至约1000nt、约100nt至约1000nt、约1000nt至约2000nt、约2000nt至约3000nt、约3000nt至约4000nt、约4000nt至约5000nt、或其间的任何范围。在一些实施例中,核酸部分或全部是单链的;在一些实施例中,核酸部分或全部是双链的。在一些实施例中,核酸具有包含至少一个编码多肽的元件或者是编码多肽的序列的互补序列的核苷酸序列。在一个实施例中,核酸具有酶活性。
在一些实施例中,DNA靶向部分包含或者是核酸。
在一些实施例中,可以包含在部分中的核酸可以是或包含DNA、RNA和/或人工或合成的核酸或核酸类似物或模拟物。例如,在一些实施例中,核酸可以是或包含以下中的一个或多个:基因组DNA(gDNA)、互补DNA(cDNA)、肽核酸(PNA)、肽-核酸混合体、肽-寡核苷酸缀合物、锁核酸(LNA)、桥接核酸(BNA)、聚酰胺、形成三链体的寡核苷酸、反义寡核苷酸、tRNA、mRNA、rRNA、miRNA、gRNA、siRNA或其他RNAi分子(例如,靶向本文所述的非编码RNA和/或靶向与本文所述的靶基因组复合物相关联的特定基因的表达产物)等。核酸序列可以包括经修饰的寡核苷酸(例如,化学修饰,如改变主链连接、糖分子和/或核酸碱基的修饰)和/或人工核酸。在一些实施例中,核酸序列包括但不限于基因组DNA、cDNA、肽核酸(PNA)或肽寡核苷酸缀合物、锁核酸(LNA)、桥接核酸(BNA)、聚酰胺、形成三链体的寡核苷酸、修饰的DNA、反义DNA寡核苷酸、tRNA、mRNA、rRNA、修饰的RNA、miRNA、gRNA和siRNA或其他RNA或DNA分子。在一些实施例中,核酸可以包括一个或多个不是天然存在的DNA或RNA残基的残基,可以包括一个或多个不是磷酸二酯键的连接(例如,可以是例如硫代磷酸酯键等),和/或可以包括一个或多个修饰,例如像2'O修饰,如2'-OMeP。可用于制备合成核酸的多种核酸结构是本领域已知的(参见例如,WO 2017/062862l和WO 2014/012081),本领域技术人员将理解,可以根据本披露利用这些核酸结构。
在一些实施例中,本文所述的核酸包含一个或多个核苷类似物。在一些实施例中,除了一种或多种天然核苷(例如,嘌呤或嘧啶,例如腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶和尿嘧啶)之外或作为其替代物,核酸序列可以包括一种或多种核苷类似物。在一些实施例中,核酸序列包括一种或多种核苷类似物。核苷类似物可以包括但不限于,核苷类似物,如5-氟尿嘧啶;5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰基胞嘧啶、4-甲基苯并咪唑、5-(羧基羟基甲基)尿嘧啶、5-羧基甲基氨基甲基-2-硫尿核苷、5-羧基甲基氨基甲基尿嘧啶、二氢尿嘧啶、二氢尿苷、β-D-半乳糖基辫苷(beta-D-galactosylqueosine)、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-D-甘露糖基辫苷(beta-D-mannosylqueosine)、5'-甲氧基羧基甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-异戊烯基腺嘌呤、尿嘧啶-5-羟乙酸(v)、怀丁氧苷(wybutoxosine)、假尿嘧啶、辫苷(queosine)、2-巯基胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-羟乙酸甲基酯、尿嘧啶-5-羟乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧基丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤、3-硝基吡咯、肌苷、硫尿核苷、辫苷(queuosine)、怀俄苷、二氨基嘌呤、异鸟嘌呤、异胞嘧啶、二氨基嘧啶、2,4-二氟甲苯、异喹啉、吡咯并[2,3-β]吡啶、以及可以与嘌呤或嘧啶侧链碱基配对的任何其他物质。
CRISPR/Cas结构域
在一些实施例中,DNA靶向部分是或包含CRISPR/Cas分子。CRISPR/Cas分子包含参与成簇的调控间隔短回文重复序列(CRISPR)系统的蛋白质,例如Cas蛋白,以及任选的指导RNA,例如单指导RNA(sgRNA)。在一些实施例中,CRISPR/Cas分子包含的gRNA与CRISPR/Cas蛋白非共价结合。
CRISPR系统是最初在细菌和古细菌中发现的自适应防御系统。CRISPR系统使用称为CRISPR相关或“Cas”核酸内切酶的RNA引导性核酸酶(例如,Cas9或Cpf1)来切割外来DNA。例如,在典型的CRISPR/Cas系统中,核酸内切酶通过靶向单链或双链DNA序列的序列特异性的非编码“指导RNA”定向到靶核苷酸序列(例如,基因组中待序列编辑的位点)。已经鉴定了三类(I-III)CRISPR系统。II类CRISPR系统使用单个Cas核酸内切酶(而不是多个Cas蛋白)。一种II类CRISPR系统包括II型Cas核酸内切酶,例如Cas9、CRISPR RNA(“crRNA”)和反式激活crRNA(“tracrRNA”)。crRNA含有“引导RNA”,即通常对应于靶DNA序列的约20个核苷酸的RNA序列。crRNA还包含与tracrRNA结合的区域,以形成被RNA酶III切割的部分双链结构,产生crRNA/tracrRNA杂交体。然后,crRNA/tracrRNA杂交体指导Cas9核酸内切酶识别并切割靶DNA序列。靶DNA序列必须总体上邻近针对给定Cas核酸内切酶来说是特异性的“原间隔子邻近基序”(“PAM”);然而,PAM序列似乎遍布整个给定基因组。从不同原核物种鉴定的CRISPR核酸内切酶具有独特的PAM序列要求;PAM序列的实例包括5’-NGG(化脓性链球菌)、5’-NNAGAA(嗜热链球菌(Streptococcus thermophilus)CRISPR1)、5’-NGGNG(嗜热链球菌CRISPR3)、和5’-NNNGATT(奈瑟氏脑膜炎双球菌(Neisseria meningiditis))。一些核酸内切酶(例如Cas9核酸内切酶)与富含G的PAM位点(例如5'-NGG)相关联,并在距PAM位点上游(5')3个核苷酸处对靶DNA进行钝端切割。另一个II类CRISPR系统包括V型核酸内切酶Cpf1,它比Cas9小;实例包括AsCpf1(来自氨基酸球菌属物种(Acidaminococcus sp.))和LbCpf1(来自毛螺旋菌属物种(Lachnospiraceae sp.))。Cpf1相关CRISPR阵列被处理成成熟crRNA,而不需要tracrRNA;换言之,Cpf1系统仅需要Cpf1核酸酶和crRNA来切割靶DNA序列。Cpf1核酸内切酶与富含T的PAM位点例如5'-TTN相关。Cpf1也可以识别5'-CTA PAM基序。Cpf1通过引入具有4或5个核苷酸的5'突出端的错位或交错的双链断裂来切割靶DNA,例如切割如下靶DNA,该靶DNA中的5个核苷酸的错位或交错的切割位于距离编码链上的PAM位点下游(3')18个核苷酸的位置处和距离互补链上的PAM位点下游23个核苷酸的位置处;由这样的错位切割产生的5个核苷酸突出端使得通过同源重组的DNA插入比在平末端切割的DNA的插入更精确地进行基因组编辑。参见例如,Zetsche等人(2015)Cell[细胞],163:759-771。
多种CRISPR相关(Cas)基因或蛋白可以用于本披露提供的技术中,并且Cas蛋白的选择将取决于该方法的具体条件。Cas蛋白的具体实例包括II类系统,包括Cas1、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cpf1、C2C1或C2C3。在一些实施例中,Cas蛋白(例如,Cas9蛋白)可以来自多种原核物种中的任一种。在一些实施例中,特定Cas蛋白(例如,特定Cas9蛋白)被选择以识别特定的原间隔子邻近基序(PAM)序列。在一些实施例中,DNA靶向部分包括序列靶向多肽,如Cas蛋白,例如Cas9。在某些实施例中,Cas蛋白(例如,Cas9蛋白)可以从细菌或古细菌中获得或使用已知方法合成。在某些实施例中,Cas蛋白可以来自革兰氏阳性细菌或革兰氏阴性细菌。在某些实施例中,Cas蛋白可以来自链球菌(例如,化脓性链球菌或嗜热链球菌)、弗朗西斯菌(例如,新凶手弗朗西斯菌)、葡萄球菌(例如,金黄色葡萄球菌)、氨基酸球菌(例如,氨基酸球菌属物种BV3L6)、奈瑟氏球菌(例如,脑膜炎奈瑟氏球菌)、隐球菌、棒状杆菌、嗜血杆菌、真细菌、巴斯德氏菌、普氏菌、韦荣球菌或海洋杆菌。
在一些实施例中,Cas蛋白需要原间隔子邻近基序(PAM)存在于靶DNA序列中或邻近靶DNA序列,以便Cas蛋白结合和/或发挥功能。在一些实施例中,PAM是或包含从5'至3'的NGG、YG、NNGRRT、NNNRRT、NGA、TYCV、TATV、NTTN或NNNGATT,其中N代表任何核苷酸,Y代表C或T,R代表A或G,并且V代表A或C或G。在一些实施例中,Cas蛋白是表1中列出的蛋白。在一些实施例中,Cas蛋白包含一个或多个改变其PAM的突变。在一些实施例中,Cas蛋白包含E1369R、E1449H和R1556A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,Cas蛋白包含E782K、N968K和R1015H突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,Cas蛋白包含D1135V、R1335Q和T1337R突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,Cas蛋白包含S542R和K607R突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,Cas蛋白包含S542R、K548V和N552R突变或对应于所述位置的氨基酸的类似取代。
表1
在一些实施例中,Cas蛋白被修饰以使核酸酶失活,例如核酸酶缺陷型Cas9。而在由gRNA靶向的特异性DNA序列上,野生型Cas9产生双链断裂(DSB),具有修饰的功能性的许多CRISPR核酸内切酶是可得的,例如:Cas9的“切口酶”版本仅产生单链断裂;无催化活性的Cas9(“dCas9”)不会切割靶DNA。在一些实施例中,dCas9与DNA序列的结合可以通过空间位阻干扰该位点处的转录。在一些实施例中,DNA靶向部分是或包含无催化活性的Cas9,例如dCas9。在一些实施例中,DNA靶向部分是或包含无催化活性的突变Cas9,例如Cas9m4。许多无催化活性的Cas9蛋白是本领域已知的。在一些实施例中,dCas9包含Cas蛋白的每个核酸内切酶结构域中的突变,例如D10A和H840A突变。
在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D11A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含H969A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含N995A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D11A、H969A和N995A突变或对应于所述位置的氨基酸的类似取代。
在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D10A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含H557A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D10A和H557A突变或对应于所述位置的氨基酸的类似取代。
在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D839A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含H840A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含N863A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D10A和D839A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D10A、D839A和H840A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D10A、D839A、H840A和N863A突变或对应于所述位置的氨基酸的类似取代。
在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含E993A突变或对应于所述位置的氨基酸的类似取代。
在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D917A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含E1006A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D1255A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D917A、E1006A和D1255A突变或对应于所述位置的氨基酸的类似取代。
在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D16A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D587A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含H588A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含N611A突变或对应于所述位置的氨基酸的类似取代。在一些实施例中,无催化活性的Cas9蛋白例如dCas9包含D16A、D587A、H588A和N611A突变或对应于所述位置的氨基酸的类似取代。
在另一方面,本披露涉及包含一个或多个(例如,一个)DNA靶向部分和一个或多个阻遏物结构域的表达阻遏物或多肽,其中该一个或多个DNA靶向部分是或包含CRISPR/Cas分子,该分子包含Cas蛋白,例如无催化活性的Cas9蛋白,例如dCas9,例如dCas9m4,或其功能变体或片段。在一些实施例中,dCas9包含SEQ ID NO:46或88的氨基酸序列:
在一些实施例中,dCas9由SEQ ID NO:45或89的核酸序列编码:
指导RNA(gRNA)
在一些实施例中,DNA靶向部分可以包含含有或连接(例如,共价连接)gRNA的Cas分子。gRNA是一种短的合成RNA,由Cas蛋白结合所必需的“支架”序列和用于基因组靶标的用户定义的约20个核苷酸靶向序列组成。在实践中,通常将引导RNA序列设计为具有17-24个核苷酸(例如,19、20或21个核苷酸)的长度,并且与靶核酸序列互补。定制gRNA生成器和算法可通过商业途径获得,用于设计有效的引导RNA。使用嵌合性“单引导RNA”(“sgRNA”)也可以实现基因编辑,这是一种工程化(合成)的单一RNA分子,模拟天然存在的crRNA-tracrRNA复合物,并同时含有tracrRNA(用于结合核酸酶)和至少一个crRNA(以将核酸酶引导至被靶向序列进行编辑)。化学修饰的sgRNA也已经被证明有效地与Cas蛋白一起使用;参见,例如,Hendel等人(2015)Nature Biotechnol.[自然-生物技术],985-991。
在一些实施例中,gRNA包含与靶基因相关联的DNA序列互补的核酸序列。在一些实施例中,DNA序列是、包含或重叠与靶基因可操作地连接的表达控制元件。在一些实施例中,gRNA包括与靶基因相关联的DNA序列至少90%、95%、99%或100%互补的核酸序列。在一些实施例中,与包含Cas分子的DNA靶向部分一起使用的gRNA是sgRNA。
在一些实施例中,与CRISPR/Cas分子一起使用的gRNA特异性结合与β-2-微球蛋白表达相关联的靶序列。这样的gRNA可以包含选自以下的靶结合序列:
GD-28228:TCTCCTTGGTGGCCCGCCGT(SEQ ID NO:1),
GD-28229:GTCCCAAAGGCGCGGCGCTG(SEQ ID NO:2),
GD-28171:CCCTGCTCCCCGCCGAAAGGG(SEQ ID NO:3),
GD-28172:CTCTGGCTCCCCCAGCGCAGC(SEQ ID NO:4),或
GD-28173:GTGAACGCGTGGAGGGGCGCT(SEQ ID NO:5)。
在一些实施例中,与CRISPR/Cas结构域一起使用的gRNA特异性结合与CTCF相关联的靶序列。在一些实施例中,与CRISPR/Cas结构域一起使用的gRNA特异性结合与启动子相关联的靶序列。在一些实施例中,gRNA结合表3中列出的靶序列。
表3:示例性gRNA序列
在一些实施例中,表达阻遏物系统包含含有第一DNA靶向部分的第一表达阻遏物和含有第二DNA靶向部分的第二表达阻遏物,其中第一DNA靶向部分包含或者是第一CRISPR/Cas分子,并且第二DNA靶向部分包含或者是第二CRISPR/Cas分子。在一些实施例中,第一CRISPR/Cas分子包含第一CRISPR/Cas蛋白和第一指导RNA,并且第二CRISPR/Cas分子包含第二CRISPR/Cas蛋白和第二指导RNA。在一些实施例中,第一CRISPR/Cas蛋白不明显结合(例如,不结合)第二指导RNA,例如,以至少10、20、50、100、1000或10,000nM的KD结合,并且第二CRISPR/Cas蛋白不明显结合(例如,不结合)第一指导RNA,例如,以至少10、20、50、100、1000或10,000nM的KD结合。
TAL效应子结构域
在一些实施例中,DNA靶向部分是或包含TAL效应子分子。TAL效应子分子,例如特异性结合DNA序列的TAL效应子分子,包含多个TAL效应子结构域或其片段,以及任选地天然存在的TAL效应子的一个或多个附加部分(例如,多个TAL效应子结构域的N和/或C末端)。许多TAL效应子是本领域技术人员已知的并且是可商购的,例如从赛默飞世尔科技公司(Thermo Fisher Scientific)商购。
TALE是由多种细菌病原体(包括植物病原体黄单胞菌(Xanthomonas))分泌的天然效应蛋白,其调节宿主植物中的基因表达并促进细菌定植和存活。TAL效应子的特异性结合基于串联排列的几乎相同的典型33或34个氨基酸重复序列的中心重复结构域(重复可变二残基,RVD结构域)。
TAL效应子家族的成员主要在其重复序列的数量和顺序上不同。重复序列的数量范围为1.5至33.5个重复,并且C末端重复通常长度较短(例如,约20个氨基酸),并且通常被称为“半重复”。TAL效应子的每个重复具有一个重复对一个碱基对的相关性,其中不同的重复类型表现出不同的碱基对特异性(一个重复识别靶基因序列上的一个碱基对)。通常,重复序列数量越少,蛋白质-DNA相互作用越弱。已证明6.5个重复序列的数量足以激活报告基因的转录(Scholze等人,2010)。
重复至重复的变异主要发生在氨基酸位置12和13处,因此它们被称为“高变的”,并负责与靶DNA启动子序列相互作用的特异性,如表2所示,其列出了示例性重复可变双残基(RVD)及其与核酸碱基靶标的对应关系。
表2-RVD和核酸碱基特异性
因此,有可能修饰TAL效应子的重复序列以靶向特定的DNA序列。进一步的研究表明,RVD NK可以靶向G。TAL效应子的靶位点也倾向于包括在被第一重复序列靶向的5'碱基侧翼的T,但这种识别的确切机制尚不清楚。迄今已知超过113种TAL效应子序列。来自黄单胞菌的TAL效应子的非限制性实例包括Hax2、Hax3、Hax4、AvrXa7、AvrXa10和AvrBs3。
相应地,本发明的TAL效应子分子的TAL效应子结构域可以源自来自任何细菌物种(例如黄单胞菌属(Xanthomonas)物种,例如米糠黄单胞菌(Xanthomonasoryzaepv.Oryzae)的非洲菌株(Yu等人2011)、野油菜黄单胞菌萝卜致病变种(Xanthomonascampestrispv.raphani)菌株756C和水稻细菌性条斑病菌(Xanthomonasoryzaepv.oryzicola)菌株BLS256(Bogdanove等人2011))的TAL效应子。如本文所用,根据本发明的TAL效应子结构域包含RVD结构域,以及也来自天然存在的TAL效应子的一个或多个侧翼序列(RVD结构域的N末端和/或C末端侧上的序列)。它可以包含比天然存在的TAL效应子的RVD更多或更少的重复序列。本发明的TAL效应子分子被设计成基于上述编码和本领域已知的其他编码来靶向给定的DNA序列。TAL效应子结构域(例如,重复序列(单体或模块))的数量及其特定序列是基于所期望的DNA靶序列来选择的。例如,为了适应特定的靶序列,可以去除或添加TAL效应子结构域,例如重复序列。在一个实施例中,本发明的TAL效应子分子包含6.5至33.5个TAL效应子结构域,例如重复序列。在一个实施例中,本发明的TAL效应子分子包含8至33.5个TAL效应子结构域,例如重复序列,例如10至25个TAL效应子结构域,例如重复序列,例如10至14个TAL效应子结构域,例如重复序列。
在一些实施例中,TAL效应子分子包含对应于与DNA靶序列完全匹配的TAL效应子结构域。在一些实施例中,DNA靶序列上重复和靶碱基对之间的错配是允许的,只要它允许表达阻遏系统(例如,包含TAL效应子分子的表达阻遏子)的功能。通常,TALE结合与错配数量呈负相关。在一些实施例中,本发明的表达阻遏子的TAL效应子分子与靶DNA序列包含不超过7个错配、6个错配、5个错配、4个错配、3个错配、2个错配或1个错配,并且任选地没有错配。不希望被理论所束缚,一般来说,TAL效应子分子中TAL效应子结构域的数量越少,将被容许的错配数量就越少,并且仍然允许表达阻遏系统(例如,包含TAL效应子分子的表达阻遏子)的功能。结合亲和力被认为取决于匹配的重复-DNA组合的总和。例如,具有25个或更多个TAL效应子结构域的TAL效应子分子可能能够耐受多达7个错配。
除了TAL效应子结构域之外,本发明的TAL效应子分子还可以包含来源于天然存在的TAL效应子的另外序列。包含在TAL效应子分子的TAL效应子结构域部分每一侧上的一个或多个C末端和/或N末端序列的长度可以变化,并且由本领域技术人员选择,例如基于Zhang等人(2011)的研究。Zhang等人已经表征了Hax3来源的基于TAL效应子的蛋白质中的许多C末端和N末端截短突变体,并且已经鉴定了有助于与靶序列最佳结合并因此激活转录的关键元件。通常,发现转录活性与N末端的长度呈负相关。关于C末端,鉴定了Hax 3序列前68个氨基酸内DNA结合残基的重要元件。因此,在一些实施例中,天然存在的TAL效应子的TAL效应子结构域的C末端侧上的前68个氨基酸包含在本发明表达阻遏子的TAL效应子分子中。因此,在一个实施例中,本发明的TAL效应子分子包含1)一个或多个来源于天然存在的TAL效应子的TAL效应子结构域;2)至少70、80、90、100、110、120、130、140、150、170、180、190、200、220、230、240、250、260、270、280个或更多个来自TAL效应子结构域N末端侧上的天然存在的TAL效应子的氨基酸;和/或3)至少68、80、90、100、110、120、130、140、150、170、180、190、200、220、230、240、250、260个或更多个来自TAL效应子C末端侧上的天然存在的TAL效应子的氨基酸。
Zn指结构域
在一些实施例中,DNA靶向部分是或包含Zn指结构域。Zn指结构域包含Zn指蛋白,例如天然存在的Zn指蛋白或工程化的Zn指蛋白、或其片段。许多锌指蛋白是本领域技术人员已知的并且是可商购的,例如从西格玛奥德里奇公司(Sigma-Aldrich)商购。
在一些实施例中,Zn指结构域包含非天然存在的Zn指蛋白,其被工程化以与选择的靶DNA序列结合。例如,参见Beerli等人(2002)Nature Biotechnol.[自然生物技术]20:135-141;Pabo等人(2001)Ann.Rev.Biochem.[生物化学年度综述]70:313-340;Isalan等人(2001)Nature Biotechnol.[自然生物技术]19:656-660;Segal等人(2001)Curr.Opin.Biotechnol.[生物技术当前观点]12:632-637;Choo,等人.(2000)Curr.Opin.Struct.Biol[结构生物学当前观点].10:411-416;美国专利号6,453,242;6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262,054;7,070,934;7,361,635;7,253,273;以及美国专利公开号2005/0064474;2007/0218528;2005/0267061,均通过引用以其整体并入本文。
与天然存在的Zn指蛋白相比,工程化的Zn指蛋白可能具有新的结合特异性。工程化方法包括但不限于合理设计和各种类型的选择。合理设计包括,例如,使用包含三联体(或四联体)核苷酸序列和单个Zn指氨基酸序列的数据库,其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的Zn指的一个或多个氨基酸序列相关联。参见例如,美国专利号6,453,242和6,534,261,通过引用以其整体并入本文。
示例性选择方法(包括噬菌体展示和双杂交系统)披露于以下中:美国专利号5,789,538、5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;以及国际专利公开号WO 98/37186;WO 98/53057;WO 00/27878;以及WO 01/88197和GB2,338,237。另外,增强锌指蛋白的结合特异性已经例如,在国际专利公开号WO 02/077227中描述。
另外,如这些和其他参考文献中所披露的,锌指结构域和/或多指锌指蛋白可以使用任何合适的接头序列(包括例如,长度为5个或更多个氨基酸的接头)连接在一起。另参见美国专利号6,479,626;6,903,185;和7,153,949的示例性接头序列长度为6个或更多个氨基酸。本文所述的蛋白质可以包括蛋白质的单个锌指之间的合适接头的任何组合。另外,增强锌指结合结构域的结合特异性已经例如,在共同拥有的国际专利公开号WO 02/077227中描述。
Zn指蛋白和用于设计和构建融合蛋白(和编码其的多核苷酸)的方法是本领域技术人员已知的,并在以下中详细描述:美国专利号6,140,0815;789,538;6,453,242;6,534,261;5,925,523;6,007,988;6,013,453;和6,200,759;国际专利公开号WO 95/19431;WO96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197;WO 02/099084;WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536;和WO 03/016496。
另外,如这些和其他参考文献中所披露的,Zn指蛋白和/或多指Zn指蛋白可以使用任何合适的接头序列(包括例如,长度为5个或更多个氨基酸的接头)连接在一起,例如作为融合蛋白。另参见美国专利号6,479,626;6,903,185;和7,153,949的示例性接头序列长度为6个或更多个氨基酸。本文所述的Zn指结构域可以包括Zn指结构域的单个锌指蛋白和/或多指Zn指蛋白之间的合适接头的任何组合。
在某些实施例中,DNA靶向部分包含Zn指结构域,其包含与靶DNA序列结合(以序列特异性方式)的工程化锌指蛋白。在一些实施例中,Zn指结构域包含一个Zn指蛋白或其片段。在其他实施例中,Zn指结构域包含多个Zn指蛋白(或其片段),例如2、3、4、5、6或更多个Zn指蛋白(并且任选地,不超过12、11、10、9、8、7、6、5、4、3或2个Zn指蛋白)。在一些实施例中,Zn指结构域包含至少三个Zn指蛋白。在一些实施例中,Zn指结构域包含四个、五个或六个指。在一些实施例中,Zn指结构域包含8、9、10、11或12个指。在一些实施例中,包含三个Zn指蛋白的Zn指结构域识别包含9或10个核苷酸的靶DNA序列。在一些实施例中,包含四个Zn指蛋白的Zn指结构域识别包含12至14个核苷酸的靶DNA序列。在一些实施例中,包含六个Zn指蛋白的Zn指结构域识别包含18至21个核苷酸的靶DNA序列。
在一些实施例中,Zn指结构域包含双手Zn指蛋白。双手锌指蛋白是这样的蛋白质,其中两簇锌指蛋白被插入的氨基酸分开,使得两个锌指结构域与两个不连续的靶DNA序列结合。双手型锌指结合蛋白的实例是SIP1,其中四个锌指蛋白的簇位于蛋白质的氨基末端处,并且三个Zn指蛋白的簇位于羧基末端处(参见Remade等人(1999)EMBO Journal[欧洲分子生物学杂志]18(18):5073-5084)。这些蛋白质中的每一簇锌指均能够与独特的靶序列结合,并且这两个靶序列之间的间隔可以包含许多核苷酸。
核酸分子:
在一些实施例中,DNA靶向部分是或包含来自核酸酶的DNA结合结构域。例如,归巢核酸内切酶和大范围核酸酶的识别序列(如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII)是已知的。还参见美国专利号5,420,032;6,833,252;Belfort等人(1997)Nucleic Acids Res[核酸研究].25:3379-3388;Dujon等人(1989)Gene[基因]82:115-118;Perler等人(1994)NucleicAcids Res[核酸研究].22:1125-1127;Jasin(1996)Trends Genet[遗传学趋势].12:224-228;Gimble等人(1996)J.Mol.Biol[分子生物学杂志].263:163-180;Argast等人(1998)J.Mol.Biol[分子生物学杂志].280:345-353和新英格兰生物实验室目录。另外,归巢核酸内切酶和大范围核酸酶的DNA结合特异性可以被工程化以结合非天然靶位点。参见例如,Chevalier等人(2002)Molec.Cell[分子细胞]10:895-905;Epinat等人(2003)NucleicAcids Res[核酸研究].31:2952-2962;Ashworth等人(2006)Nature[自然]441:656-659;Paques等人(2007)Current Gene Therapy[目前的基因疗法]7:49-66;美国专利公开号2007/0117128。
在一些实施例中,DNA靶向部分包含或者是核酸。在一些实施例中,可以包含在DNA靶向部分中的核酸可以是或包含DNA、RNA和/或人工或合成的核酸或核酸类似物或模拟物。例如,在一些实施例中,核酸可以是或包含以下中的一个或多个:基因组DNA(gDNA)、互补DNA(cDNA)、肽核酸(PNA)、肽-寡核苷酸缀合物、锁核酸(LNA)、桥接核酸(BNA)、聚酰胺、形成三链体的寡核苷酸、反义寡核苷酸、tRNA、mRNA、rRNA、miRNA、gRNA、siRNA或其他RNAi分子(例如,靶向本文所述的非编码RNA和/或靶向与本文所述的靶基因组复合物相关联的特定基因的表达产物)等。在一些实施例中,核酸可以包含一个或多个作为并非天然存在的DNA或RNA残基的残基、可以包含一个或多个是/不是磷酸二酯键的连接(例如,可以是例如硫代磷酸酯键等)和/或可以包含一个或多个修饰,诸如,例如2'O修饰,诸如2'-OMeP。可用于制备合成核酸的多种核酸结构是本领域已知的(参见例如,WO 2017/062862l和WO 2014/012081),本领域技术人员将理解,可以根据本披露利用这些核酸结构。
适用于表达阻遏物中,例如DNA靶向部分中的核酸可以包括但不限于DNA、RNA、经修饰的寡核苷酸(例如,化学修饰,如改变主链连接、糖分子和/或核酸碱基的修饰)和人工核酸。在一些实施例中,核酸包括但不限于基因组DNA、cDNA、肽核酸(PNA)或肽寡核苷酸缀合物、锁核酸(LNA)、桥接核酸(BNA)、聚酰胺、形成三链体的寡核苷酸、修饰的DNA、反义DNA寡核苷酸、tRNA、mRNA、rRNA、修饰的RNA、miRNA、gRNA和siRNA或其他RNA或DNA分子。
在一些实施例中,DNA靶向部分包含的核酸的长度是约15-200、20-200、30-200、40-200、50-200、60-200、70-200、80-200、90-200、100-200、110-200、120-200、130-200、140-200、150-200、160-200、170-200、180-200、190-200、215-190、20-190、30-190、40-190、50-190、60-190、70-190、80-190、90-190、100-190、110-190、120-190、130-190、140-190、150-190、160-190、170-190、180-190、15-180、20-180、30-180、40-180、50-180、60-180、70-180、80-180、90-180、100-180、110-180、120-180、130-180、140-180、150-180、160-180、170-180、15-170、20-170、30-170、40-170、50-170、60-170、70-170、80-170、90-170、100-170、110-170、120-170、130-170、140-170、150-170、160-170、15-160、20-160、30-160、40-160、50-160、60-160、70-160、80-160、90-160、100-160、110-160、120-160、130-160、140-160、150-160、215-150、20-150、30-150、40-150、50-150、60-150、70-150、80-150、90-150、100-150、110-150、120-150、130-150、140-150、15-140、20-140、30-140、40-140、50-140、60-140、70-140、80-140、90-140、100-140、110-140、120-140、130-140、15-130、20-130、30-130、40-130、50-130、60-130、70-130、80-130、90-130、100-130、110-130、120-130、215-120、20-120、30-120、40-120、50-120、60-120、70-120、80-120、90-120、100-120、110-120、15-110、20-110、30-110、40-110、50-110、60-110、70-110、80-110、90-110、100-110、15-100、20-100、30-100、40-100、50-100、60-100、70-100、80-100、90-100、15-90、20-90、30-90、40-90、50-90、60-90、70-90、80-90、15-80、20-80、30-80、40-80、50-80、60-80、70-80、15-70、20-70、30-70、40-70、50-70、60-70、15-60、20-60、30-60、40-60、50-60、15-50、20-50、30-50、40-50、15-40、20-40、30-40、15-30、20-30、或15-20个核苷酸、或其间的任何范围。
阻遏物结构域
本披露的表达阻遏物包含一个或多个阻遏物结构域。阻遏物结构域当用作本文所述的表达阻遏物或表达阻遏系统的一部分时具有一种或多种功能,可降低细胞中靶基因的表达。
在一些实施例中,阻遏物结构域包含组蛋白修饰功能,例如组蛋白甲基转移酶、组蛋白去甲基化酶或组蛋白去乙酰化酶活性。在一些实施例中,组蛋白甲基转移酶功能包括靶向H3K9的甲基转移酶活性。在一些实施例中,组蛋白甲基转移酶功能包括靶向H3K56的甲基转移酶活性。在一些实施例中,组蛋白甲基转移酶功能包括靶向H3K27的甲基转移酶活性。在一些实施例中,组蛋白甲基转移酶或去甲基化酶功能转移一个、两个或三个甲基基团。在一些实施例中,组蛋白去甲基化酶功能包括靶向H3K4的去甲基化酶活性。在一些实施例中,阻遏物结构域是或包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2或其任一项的功能变体或片段,例如其任一项的SET结构域。在一些实施例中,阻遏物结构域是或包含选自以下的蛋白质:KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66或其任一项的功能变体或片段。在一些实施例中,阻遏物结构域是或包含选自以下的蛋白质:HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9或其任一项的功能变体或片段。
在一些实施例中,阻遏物结构域包含表观遗传修饰部分。在一些实施例中,阻遏物结构域包含DNA修饰功能,例如DNA甲基转移酶。在一些实施例中,阻遏物结构域是或包含选自以下的蛋白质:MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、DNMT3a/3L或其任一项的功能变体或片段。
在一些实施例中,阻遏物结构域包含转录阻遏物。在一些实施例中,转录阻遏物阻断刺激或促进转录(例如靶基因的转录)的因子的募集。在一些实施例中,转录阻遏物募集抑制例如转录(例如靶基因的转录)的因子。在一些实施例中,阻遏物结构域,例如转录阻遏物,是或包含选自以下的蛋白质:KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其任一项的功能变体或片段。
在一些实施例中,阻遏物结构域例如直接或间接地促进表观遗传修饰。例如,阻遏物结构域可以通过募集表观遗传修饰染色质的内源性蛋白质来间接促进表观遗传修饰。在一些实施例中,阻遏物结构域可以通过催化表观遗传修饰直接促进表观遗传修饰,其中阻遏物结构域具有酶活性并直接在染色质上放置表观遗传标志物。
在一些实施例中,阻遏物结构域包含具有本文所述功能的蛋白质。在一些实施例中,阻遏物结构域是或包含选自以下的蛋白质:
KRAB(例如,根据NP_056209.2或由NM_015394.5编码的蛋白质,例如,根据SEQ IDNO:61);
SET结构域(例如,以下的SET结构域:
SETDB1(例如,根据NP_001353347.1或NM_001366418.1编码的蛋白质);
EZH2(例如,根据NP-004447.2或由NM_004456.5编码的蛋白质,例如,根据SEQ IDNO:65);
G9A(例如,根据NP_001350618.1或NM_001363689.1编码的蛋白质;例如,根据SEQID NO:62);或者
SUV39H1(例如,根据NP_003164.1或NM_003173.4编码的蛋白质);
组蛋白去甲基化酶LSD1(例如,根据NP_055828.2或由NM_015013.4编码的蛋白质,例如,根据SEQ ID NO:64);
FOG1(例如,FOG1的N末端残基)(例如,根据NP_722520.2或由NM_153813.3编码的蛋白质,例如,根据SEQ ID NO:66);
KAP1(例如,根据NP_005753.1或NM_005762.3编码的蛋白质);或者
HDAC8(例如,根据NP_001159890或由NM_001166418编码的蛋白质,例如,根据SEQID NO:63);
其任一项的功能片段或变体,或
具有与任何上述序列具有至少80、85、90、91、92、93、94、95、96、97、98或99%同一性的序列的多肽。在一些实施例中,阻遏物结构域是或包含选自以下的蛋白质:
DNMT3A(例如,人DNMT3A)(例如,根据NP_072046.2
或由NM_022552.4编码的蛋白质,例如根据SEQ ID NO:58);
DNMT3B(例如,根据AOX21819.1
或由NM_006892.4或KX447429编码的蛋白质);
DNMT3L(例如,根据NP_787063.1
或由NM_175867.3编码的蛋白质);
DNMT3A/3L复合物(例如,根据SEQ ID NO:59或60),
细菌MQ1(例如,根据CAA35058.1或P15840.3,例如,根据SEQ ID NO:57或90);
其任一项的功能片段,或
具有与任何上述序列具有至少80、85、90、91、92、93、94、95、96、97、98或99%同一性的序列的多肽。
在一些实施例中,阻遏物结构域是或包含多肽。在一些实施例中,阻遏物结构域具有酶活性。
在一些实施例中,DNA结合结构域包含螺旋-发夹-螺旋(HhH)基序。具有HhH结构基序的DNA结合蛋白可能参与非序列特异性DNA结合,这种结合经由蛋白主链氮和DNA磷酸基团之间的氢键形成而发生。
在一些实施例中,DNA结合结构域包含螺旋-环-螺旋(HLH)基序。具有HLH结构基序的DNA结合蛋白是转录调控蛋白,并且主要与多种发育过程相关。就残基而言,HLH结构基序比HTH或HhH基序更长。许多这些蛋白质相互作用,以形成同源和异源二聚体。一个结构基序由两个长螺旋区域构成,其中N末端螺旋与DNA结合,而复合物区域允许蛋白质二聚化。
在一些实施例中,DNA结合结构域包含亮氨酸拉链基序。在一些转录因子中,具有DNA的二聚体结合位点形成亮氨酸拉链。该基序包括两个两亲性螺旋,每个亚基一个,相互作用产生左旋螺旋卷曲超级二级结构。亮氨酸拉链是一个螺旋中规则间隔的亮氨酸残基与来自相邻螺旋的亮氨酸的交错接合。大多数情况下,亮氨酸拉链中涉及的螺旋表现出七残基序列(abcdefg),其中残基a和d是疏水的,其他残基是亲水的。亮氨酸拉链基序可以介导同源或异源二聚体的形成。
在一些实施例中,DNA结合结构域包含Zn指结构域,其中Zn++离子由2个Cys和2个His残基配位。这种转录因子包括化学计量为ββ'α的三聚体。Zn++配位的一个明显效果是稳定小的复合物结构,而不是疏水的核心残基。每个锌指以构象相同的方式与双螺旋大沟中连续的三碱基对片段相互作用。蛋白质-DNA相互作用由两个因素决定:(i)α-螺旋和DNA片段之间的H键相互作用,主要在Arg残基和鸟嘌呤碱基之间。(ii)与DNA磷酸主链的H键相互作用,主要是与Arg和His的相互作用。可替代的锌指基序使Zn++与6个Cys螯合。
示例性阻遏物结构域可以包括但不限于:泛素、作为泛素连接酶抑制剂的双环肽、转录因子、DNA和蛋白质修饰酶如拓扑异构酶、拓扑异构酶抑制剂如拓扑替康、DNA甲基转移酶如DNMT家族(例如,DNMT3A、DNMT3B、DNMT3L)、蛋白质甲基转移酶(例如,病毒赖氨酸甲基转移酶(vSET)、蛋白质-赖氨酸N-甲基转移酶(SMYD2)、脱氨酶(例如,APOBEC、UG1)、组蛋白甲基转移酶如zeste增强子同源物2(EZH2)、PRMT1、组蛋白-赖氨酸-N-甲基转移酶(Setdb1)、组蛋白甲基转移酶(SET2)、常染色质组蛋白-赖氨酸N-甲基转移酶2(G9A)、组蛋白-赖氨酸N-甲基转移酶(SUV39H1)和G9a)、组蛋白脱乙酰酶(例如,HDAC1、HDAC2、HDAC3、HDAC8)、在DNA去甲基化中起作用的酶(例如,TET家族酶催化5-甲基胞嘧啶氧化为5-羟甲基胞嘧啶和更高级的氧化衍生物)、蛋白质去甲基化酶如KDM1A和赖氨酸特异性组蛋白去甲基化酶1(LSD1)、转录阻遏物(例如,KRAB,FOG1)、解旋酶如DHX9、乙酰转移酶、脱乙酰酶(例如,瑟土因1、2、3、4、5、6或7)、激酶、磷酸酶、DNA嵌入剂如溴化乙锭、SYBR green和原黄素、外排泵抑制剂如肽模拟物如苯丙氨酸精氨酸基β-萘酰胺或喹啉衍生物、核受体激活剂和抑制剂、蛋白酶体抑制剂、酶的竞争性抑制剂如参与溶酶体贮积病的那些、蛋白质合成抑制剂、核酸酶(例如,Cpf1、Cas9、锌指核酸酶)、其一种或多种的融合物(例如,dCas9-DNMT、dCas9-APOBEC、dCas9-UG1),以及来自蛋白质的特定结构域,如KRAB结构域。
在一些实施例中,可以通过本领域技术人员已知的方法确定候选结构域适合用作阻遏物结构域。例如,候选阻遏物结构域可以通过以下方式进行测试:测定当候选阻遏物结构域存在于细胞核中并适当定位(例如,定位至靶基因或与所述靶基因可操作地连接的转录控制元件,例如,通过DNA靶向部分)时,候选阻遏物结构域是否降低细胞中靶基因的表达,例如,降低靶基因编码的RNA转录物的水平(例如,通过RNASeq或RNA印迹测量)或降低靶基因编码的蛋白质的水平(例如,通过ELISA测量)。
在一些实施例中,表达阻遏系统包含多个表达阻遏物,其中多个表达阻遏物的每个成员包含阻遏物结构域,其中每个阻遏物结构域不会可检测地结合,例如,不结合另一个阻遏物结构域。在一些实施例中,表达阻遏系统包含含有第一阻遏物结构域的第一表达阻遏物和含有第二阻遏物结构域的第二表达阻遏物,其中第一阻遏物结构域不会可检测地结合,例如不结合第二阻遏物结构域。在一些实施例中,表达阻遏系统包含含有第一阻遏物结构域的第一表达阻遏物和含有第二阻遏物结构域的第二表达阻遏物,其中第一阻遏物结构域不会可检测地结合,例如不结合另一个第一阻遏物结构域,并且第二阻遏物结构域不会可检测地结合,例如,不结合到另一个第二阻遏物结构域。在一些实施例中,用于本文所述的组合物和方法中的阻遏物结构域以单体(例如,非二聚体)状态起作用。
在一些实施例中,阻遏物结构域是或包含例如调节染色质的二维结构的表观遗传修饰部分(即,以改变其二维表达的方式调节染色质的结构)。
可用于本披露的方法和组合物中的表观遗传修饰部分包括影响表观遗传标记物的药剂,例如,DNA甲基化、组蛋白甲基化、组蛋白乙酰化、组蛋白糖基化、组蛋白磷酸化和RNA相关沉默。可以靶向如本文所述基因组序列元件的示例性表观遗传酶包括DNA甲基化酶(例如,DNMT3a、DNMT3b、DNMTL)、DNA去甲基化(例如,TET家族)、组蛋白甲基转移酶、组蛋白脱乙酰酶(例如,HDAC1、HDAC2、HDAC3)、瑟土因1、2、3、4、5、6或7、赖氨酸特异性组蛋白去甲基化酶1(LSD1)、组蛋白-赖氨酸-N-甲基转移酶(Setdb1)、常染色质组蛋白-赖氨酸N-甲基转移酶2(G9a)、组蛋白-赖氨酸N-甲基转移酶(SUV39H1)、zeste增强子同源物2(EZH2)、病毒赖氨酸甲基转移酶(vSET)、组蛋白甲基转移酶(SET2)和蛋白质-赖氨酸N-甲基转移酶(SMYD2)。此类表观遗传修饰剂的实例例如,在de Groote等人Nuc.Acids Res.[核酸研究](2012):1-18中描述。
在一些实施例中,在本文中有用的表达阻遏物(例如,包括表观遗传修饰部分)包括或是以下文献中描述的构建体:Koferle等人Genome Medicine[基因组医学]7.59(2015):1-3,该文献通过引用并入本文。例如,在一些实施例中,表达阻遏子包含或是Koferle等人的表1中发现的构建体,例如,表1中描述的组蛋白脱乙酰酶、组蛋白甲基转移酶、DNA去甲基化、或H3K4和/或H3K9组蛋白去甲基化酶(例如dCas9-p300、TALE-TET1、ZF-DNMT3A或TALE-LSD1)。
另外的部分
表达阻遏物可进一步包含一个或多个另外的部分(例如,除了一个或多个DNA靶向部分和一个或多个阻遏物结构域之外)。在一些实施例中,另外的部分选自标记部分或监测部分、可切割部分(例如,位于DNA靶向部分和阻遏物结构域之间或位于多肽的N或C末端的可切割部分)、小分子、膜易位多肽、或药剂部分。
示例性表达阻遏物
以下示例性表达阻遏物仅出于说明目的而呈现,并不旨在进行限制。
在一些实施例中,表达阻遏物包含含有dCas9(例如金黄色葡萄球菌dCas9)的DNA靶向部分,和含有MQ1(例如细菌MQ1)的阻遏物结构域。在一些实施例中,表达阻遏物由SEQID NO:91(例如,编码表达阻遏物的质粒)、SEQ ID NO:22(例如,编码表达阻遏物的核酸(例如,cDNA))和/或SEQ ID NO:92(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:22、91或92的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。在一些实施例中,DNA靶向部分由SEQ IDNO:45或89的核酸序列编码和/或阻遏物结构域由SEQ ID NO:47的核酸序列编码。
dCas9-MQ1(MR-28125)mRNA序列:
Sa-dCas9-MQ1(PL-27695)质粒DNA序列:
Sa-dCas9-MQ1(MR-28126)表达的mRNA序列:
在一些实施例中,表达阻遏物包含SEQ ID NO:93、33、67或68的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:93、33、67、68的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
Sa-dCas9-MQ1蛋白序列:
dCas9-MQ1氨基酸序列
无HA标签的Sa-dCas9-MQ1
无HA标签的dCas9-MQ1
在一些实施例中,表达阻遏物包含含有dCas9(例如化脓性链球菌dCas9)的DNA靶向部分,和含有KRAB(例如KRAB结构域)的阻遏物结构域。在一些实施例中,表达阻遏物由SEQ ID NO:94(例如,编码表达阻遏物的质粒)和/或95(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:94或95的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
Sp-dCas9-KRAB(PL-27687)质粒DNA序列:
Sp-dCas9-KRAB(MR-28122)表达的mRNA序列:
在一些实施例中,表达阻遏物包含SEQ ID NO:96或72的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:72或96的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
Sp-dCas9-KRAB蛋白序列:
在一些实施例中,表达阻遏物包含含有dCas9(例如化脓性链球菌dCas9)的DNA靶向部分,和含有DNMT1(例如DNMT1结构域)的阻遏物结构域。在一些实施例中,表达阻遏物由SEQ ID NO:23(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:23的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,表达阻遏物包含SEQ ID NO:34或69的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:34或69的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
无HA标签的dCas9-DNMT
在一些实施例中,表达阻遏物包含含有dCas9(例如化脓性链球菌dCas9)的DNA靶向部分,和含有DNMT3a/3L的阻遏物结构域。在一些实施例中,表达阻遏物由SEQ ID NO:24(例如,编码完全人表达阻遏物的核酸(例如,cDNA))和/或25(例如,编码嵌合表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:24或25的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,表达阻遏物包含SEQ ID NO:35、36、70或71的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:35、36、70或71的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
无HA标签的dCas-DNMT3a/3L(h)
无HA标签的dCas9-DNMT3a/3L(m)
在一些实施例中,表达阻遏物包含含有dCas9(例如化脓性链球菌dCas9)的DNA靶向部分,和含有G9A(例如G9A结构域)的阻遏物结构域。在一些实施例中,表达阻遏物由SEQID NO:26(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:26的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,表达阻遏物包含SEQ ID NO:38或73的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:38或73的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
无HA标签的G9A-dCas9
在一些实施例中,表达阻遏物包含含有dCas9(例如化脓性链球菌dCas9)的DNA靶向部分,和含有HDAC8(例如HDAC8结构域)的阻遏物结构域。在一些实施例中,表达阻遏物由SEQ ID NO:27(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:27的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,表达阻遏物包含SEQ ID NO:39或74的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:39或74的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
无HA标签的dCas9-HDAC8
在一些实施例中,表达阻遏物包含含有dCas9(例如化脓性链球菌dCas9)的DNA靶向部分,和含有LSD1(例如LSD1结构域)的阻遏物结构域。在一些实施例中,表达阻遏物由SEQ ID NO:28(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:28的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,表达阻遏物包含SEQ ID NO:40或75的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:40或75的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
无HA标签的dCas9-LSD1
在一些实施例中,表达阻遏物包含含有dCas9(例如化脓性链球菌dCas9)的DNA靶向部分,和含有EZH2(例如EZH2结构域)的阻遏物结构域。在一些实施例中,表达阻遏物由SEQ ID NO:29(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:29的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,表达阻遏物包含SEQ ID NO:41或76的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:41或76的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
无HA标签的EZH2-dCas9
在一些实施例中,表达阻遏物包括:包含dCas9(例如,化脓性链球菌dCas9)的DNA靶向部分;和包含EZH2(例如,EZH2结构域)的第一阻遏物结构域;和包含KRAB(例如,KRAB结构域)的第二阻遏物结构域。在一些实施例中,表达阻遏物由SEQ ID NO:30(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQID NO:30的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,表达阻遏物包含SEQ ID NO:42或77的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:42或77的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
无HA标签的EZH2-dCas9-KRAB
在一些实施例中,表达阻遏物包括:包含dCas9(例如,化脓性链球菌dCas9)的DNA靶向部分;和包含G9A(例如,G9A结构域)的第一阻遏物结构域;和包含KRAB(例如,KRAB结构域)的第二阻遏物结构域。在一些实施例中,表达阻遏物由SEQ ID NO:31(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQ IDNO:31的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,表达阻遏物包含SEQ ID NO:43或78的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:42或77的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
无HA标签的G9A-dCas9-KRAB
在一些实施例中,表达阻遏物包括:包含dCas9(例如,化脓性链球菌dCas9)的DNA靶向部分;和包含FOG1(例如,FOG1结构域)的第一阻遏物结构域;和包含FOG1(例如,FOG1结构域)的第二阻遏物结构域。在一些实施例中,表达阻遏物由SEQ ID NO:32(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQID NO:32的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,表达阻遏物包含SEQ ID NO:44或79的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:44或79的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
无HA标签的FOG1-dCas9-FOG1
在一些实施例中,表达阻遏物包含含有dCas9(例如化脓性链球菌dCas9)的DNA靶向部分,和含有DNMT(例如DNMT3b结构域)的阻遏物结构域。在一些实施例中,表达阻遏物由SEQ ID NO:15(例如,编码表达阻遏物的核酸(例如,cDNA))的核酸序列编码。在一些实施例中,本文所述的核酸包含SEQ ID NO:15的核酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
在一些实施例中,表达阻遏物包含SEQ ID NO:16或37的氨基酸序列。在一些实施例中,本文所述的表达阻遏物包含SEQ ID NO:16或37的氨基酸序列或与其具有至少80%、85%、90%、95%、99%或100%同一性,或与其差异不超过20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个位置的序列。
无HA标签的dCas9-DNMT3b
功能特征
本披露的表达阻遏系统可用于降低细胞中靶基因的表达。在一些实施例中,降低表达包括降低由靶基因编码的RNA例如mRNA的水平。在一些实施例中,降低表达包括降低靶基因编码的蛋白的水平。在一些实施例中,降低表达包括降低由靶基因编码的mRNA和蛋白质二者的水平。在一些实施例中,靶基因在与表达阻遏系统接触或包含表达阻遏系统的细胞中的表达比靶基因在未与表达阻遏系统接触或包含表达阻遏系统的细胞中的表达水平低至少1.05x(即1.05倍)、1.1x、1.15x、1.2x、1.25x、1.3x、1.35x、1.4x、1.45x、1.5x、1.55x、1.6x、1.65x、1.7x、1.75x、1.8x、1.85x、1.9x、1.95x、2x、3x、4x、5x、6x、7x、8x、9x、10x、20x、30x、40x、50x、60x、70x、80x、90x或100x。靶基因的表达可以通过本领域技术人员已知的方法测定,包括RT-PCR、ELISA、蛋白质印迹和实例2-4的方法。
本披露的表达阻遏系统可用于在一段时间内降低细胞中靶基因的表达。在一些实施例中,靶基因在与表达阻遏系统接触或包含表达阻遏系统的细胞中的表达明显降低持续至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24小时,或至少1、2、3、4、5、6、7、10或14天,或至少1、2、3、4或5周,或至少1、2、3、4、5、6、7、8、9、10、11或12个月,或至少1、2、3、4或5年(例如,无限期地)。任选地,靶基因在与表达阻遏系统接触或包含表达阻遏系统的细胞中的表达明显降低持续不超过10、9、8、7、6、5、4、3、2或1年。
在一些实施例中,靶标在与表达阻遏物或系统接触或包含表达阻遏物或系统的细胞中的表达明显降低持续至少1、2、3、4、5、6、7、8、9或10次细胞分裂。本披露的表达阻遏物或系统可用于甲基化靶区域中的CpG核苷酸。在一些实施例中,甲基化在用本文披露的表达阻遏物或表达阻遏系统处理后持续至少1天、至少2天、至少5天、至少7天、至少10天、至少15天或至少22天。
表达阻遏系统可包含多个表达阻遏物,其中每个表达阻遏物包含与另一个表达阻遏物的阻遏物结构域具有不同功能的阻遏物结构域。例如,表达阻遏系统可以包括两个表达阻遏物,其中第一表达阻遏物包括包含组蛋白去乙酰化酶功能的第一阻遏物结构域并且第二表达阻遏物包括包含DNA甲基转移酶功能的第二阻遏物结构域。在一些实施例中,表达阻遏系统包括表达阻遏物,所述表达阻遏物包括阻遏物结构域的组合,这些阻遏物结构域的功能在抑制靶基因表达方面彼此互补,例如,其中这些功能一起能够抑制表达,并且任选地,当单独存在时不抑制或可忽略地抑制表达。在一些实施例中,表达阻遏系统包含多个表达阻遏物,其中每个表达阻遏物包含与每个其他表达阻遏物的阻遏物结构域互补的阻遏物结构域,例如,每个阻遏物结构域降低靶基因的表达。
在一些实施例中,表达阻遏系统包含表达阻遏物,所述表达阻遏物包含阻遏物结构域的组合,所述阻遏物结构域的功能在抑制靶基因表达方面相互协同。不希望被理论所束缚,据认为对基因组基因座的表观遗传修饰是累积的,因为多个阻遏表观遗传标记物(例如,多种不同类型的表观遗传标记物和/或给定类型的更广泛标记)单独地一起比单独的单个修饰更有效地降低表达(例如,产生更大的表达减少和/或更持久的表达减少)。在一些实施例中,表达阻遏系统包含多个表达阻遏物,其中每个表达阻遏物包含与每个其他表达阻遏物的阻遏物结构域协同作用的阻遏物结构域,例如,每个阻遏物结构域降低靶基因的表达。在一些实施例中,表达阻遏系统(包括多个表达阻遏物,所述多个表达阻遏物包括多个彼此协同的不同阻遏物结构域)在抑制靶基因的表达方面比单个表达阻遏物(例如,及其单一阻遏物结构域)更有效。在一些实施例中,表达阻遏系统在阻遏靶基因表达方面的有效性是单个表达阻遏物的至少1.05x(即,1.05倍)、1.1x、1.15x、1.2x、1.25x、1.3x、1.35x、1.4x、1.45x、1.5x、1.55x、1.6x、1.65x、1.7x、1.75x、1.8x、1.85x、1.9x、1.95x、2x、3x、4x、5x、6x、7x、8x、9x、10x、20x、30x、40x、50x、60x、70x、80x、90x或100x。表观遗传标记物的水平可以通过本领域技术人员已知的方法来测定,包括全基因组亚硫酸氢盐测序、简并代表性亚硫酸氢盐测序、亚硫酸氢盐扩增子测序、甲基化阵列、焦磷酸测序、ChIP-seq或ChIP-qPCR。
阻遏物的组合
在一些实施例中,表达阻遏系统包含含有第一阻遏物结构域的第一表达阻遏物和含有第二阻遏物结构域的第二表达阻遏物,其中第一阻遏物结构域和第二阻遏物结构域彼此不同。在一些实施例中,第一阻遏物结构域是或包括第一表观遗传修饰部分(例如,其增加或减少第一表观遗传标记物)或其功能片段,并且第二阻遏物结构域是或包括第二表观遗传修饰部分(例如,其增加或减少第二表观遗传标记物)或其功能片段。在一些实施例中,第一阻遏物结构域是或包含组蛋白甲基转移酶或其功能片段,并且第二阻遏物结构域是或包含DNA甲基转移酶或其功能片段。在一些实施例中,第一阻遏物结构域是或包含组蛋白脱乙酰酶或其功能片段,并且第二阻遏物结构域是或包含DNA甲基转移酶或其功能片段。在一些实施例中,第一阻遏物结构域是或包含组蛋白脱乙酰酶或其功能片段,并且第二阻遏物结构域是或包含组蛋白甲基转移酶或其功能片段。
在一些实施例中,第一阻遏物结构域是或包括KRAB(例如,KRAB结构域)、SET结构域(例如,SETDB1 EZH2、G9A或SUV39H1的SET结构域)、组蛋白去甲基化酶LSD1、FOG1(例如,FOG1的N末端残基)、HDAC8、MQ1、DNMT1、DNMT3a/3l或KAP1或其任一项的功能片段,并且第二阻遏物结构域是或包括KRAB(例如,KRAB结构域)、SET结构域(例如,SETDB1 EZH2、G9A或SUV39H1的SET结构域)、组蛋白去甲基化酶LSD1、FOG1(例如,FOG1的N末端残基)、DNMT3A(例如,人DNMT3A)、DNMT3B、DNMT3L、DNMT3A/3L复合物或细菌MQ1或其任一项的功能片段。
在一些实施例中,第一阻遏物结构域是或包含KRAB或其功能变体或片段,并且第二阻遏物结构域是或包含细菌MQ1或其功能变体或片段。
在一些实施例中,第一阻遏物结构域是或包含KRAB或其功能变体或片段,并且第二阻遏物结构域是或包含DNMT3A或其功能变体或片段。
在一些实施例中,第一阻遏物结构域是或包含KRAB或其功能变体或片段,并且第二阻遏物结构域是或包含DNMT3B或其功能变体或片段。
在一些实施例中,第一阻遏物结构域是或包含KRAB或其功能变体或片段,并且第二阻遏物结构域是或包含DNMT3L或其功能变体或片段。
在一些实施例中,第一阻遏物结构域是或包含KRAB或其功能变体或片段,并且第二阻遏物结构域是或包含DNMT3A/3L复合物或其功能变体或片段。
在一些实施例中,第一阻遏物结构域是或包含SET结构域或其功能变体或片段,并且第二阻遏物结构域是或包含细菌MQ1或其功能变体或片段。
在一些实施例中,第一阻遏物结构域是或包含LSD1或其功能变体或片段,并且第二阻遏物结构域是或包含细菌MQ1或其功能变体或片段。
在一些实施例中,第一阻遏物结构域是或包含FOG1或其功能变体或片段,并且第二阻遏物结构域是或包含细菌MQ1或其功能变体或片段。
在一些实施例中,第一阻遏物结构域是或包含KAP1或其功能变体或片段,并且第二阻遏物结构域是或包含细菌MQ1或其功能变体或片段。
在一些实施例中,表达阻遏系统包含第一表达阻遏物和第二表达阻遏物,其中第一表达阻遏物是选自以下的表达阻遏物:dCas9-MQ1、dCas9-DNMT1、dCas9-DNMT3a/3l、G9A-dCas9、dCas9-HDAC8、dCas9-LSD1、EZH2-dCas9、EZH2-dCas9-KRAB、G9a-dCas9-KRAB和Fog1-dCas9-Fog1,其中第二表达阻遏物是选自以下的表达阻遏物:dCas9-MQ1、dCas9-DNMT1、dCas9-DNMT3a/3l、G9A-dCas9、dCas9-HDAC8、dCas9-LSD1、EZH2-dCas9、EZH2-dCas9-KRAB、G9a-dCas9-KRAB和Fog1-dCas9-Fog1。
在一些实施例中,表达阻遏系统由以下编码:编码第一表达阻遏物的第一核酸,其中表达由第一启动子或IRES驱动,和编码第二表达阻遏物的第二核酸,其中表达由第二启动子或IRES驱动。
靶位点
本文披露的表达阻遏系统可用于调节(例如,降低)靶基因在细胞(例如,受试者或患者)中的表达。靶基因可以是本领域技术人员已知的任何基因。在一些实施例中,靶基因与受试者(例如哺乳动物,例如人、牛、马、羊、鸡、大鼠、小鼠、猫或狗)的疾病或病症相关。靶基因可包括编码序列,例如外显子,和/或非编码序列,例如内含子、3’UTR或5’UTR。在一些实施例中,靶基因可操作地连接至转录控制元件。
适用于本文所述的表达阻遏系统的表达阻遏物的DNA靶向部分可以结合(例如,特异性结合)靶基因内的任何位点、可操作地连接至靶基因的转录控制元件、或锚序列(例如,靶基因近侧的锚序列或与可操作地连接至靶基因的锚序列介导的连接相关联的锚序列(例如,如果连接的中断改变了靶基因的表达,则锚序列介导的连接可操作地连接至靶基因))。
在一些实施例中,DNA靶向部分结合靶基因。在一些实施例中,DNA靶向部分结合靶基因外显子内的位点。在一些实施例中,DNA靶向部分结合靶基因内含子内的位点。在一些实施例中,DNA靶向部分结合靶基因的外显子和内含子边界处的位点,例如剪接位点。在一些实施例中,DNA靶向部分结合靶基因的5'UTR内的位点。在一些实施例中,DNA靶向部分结合靶基因的3'UTR内的位点。靶基因包含但不限于编码β-2微球蛋白的基因、编码MYC的基因、编码HSPA1B的基因、编码GATA1的基因、编码APOB的基因、编码FOXP3的基因、编码CXCL1的基因、编码CXCL2的基因、编码CXCL3的基因、编码CXCL4的基因、编码CXCL5的基因、编码CXCL6的基因、编码CXCL7的基因和编码CXCL8的基因。
在一些实施例中,DNA靶向部分结合可操作地连接至靶基因的转录控制元件,例如启动子或增强子。在一些实施例中,DNA靶向部分结合可操作地连接至靶基因的启动子的一部分或可操作地连接至靶基因的启动子内的位点。在一些实施例中,DNA靶向部分结合靶基因的转录起始位点。在一些实施例中,DNA靶向部分结合可操作地连接至靶基因的增强子的一部分或可操作地连接至靶基因的增强子内的位点。启动子通常是启动相关基因转录的序列元件。启动子典型地位于基因的5'端附近,离其转录起始位点不远。如本领域普通技术人员所知,真核细胞中蛋白质编码基因的转录典型地通过以下来启动:将一般转录因子(例如,TFIID、TFIIE、TFIIH等)和介体与核心启动子序列结合,作为将RNA聚合酶II引导至转录起始位点的起始前复合物,并且在许多情况下,甚至在RNA聚合酶逃逸和初级转录物延伸启动之后仍保持与核心启动子序列的结合。在一些实施例中,启动子包括如TATA、Inr、DPE或BRE的序列元件,但本领域技术人员很清楚此类序列不是定义启动子所必需的。本领域技术人员熟悉各种与基因相关联的正(例如增强子)或负(例如阻遏子或沉默子)转录控制元件。在一些实施例中,转录控制元件是转录因子结合位点。典型地,当同源调节蛋白与这种转录控制元件结合时,从一个或多个相关基因的转录被改变(例如,增加或减少)。
在一些实施例中,DNA靶向部分结合锚序列,例如,靶基因近侧的锚序列或与可操作地连接至靶基因的锚序列介导的连接相关联的锚序列(例如,如果连接的中断改变了靶基因的表达,则锚序列介导的连接可操作地连接至靶基因)。在一些实施例中,DNA靶向部分结合或邻近包含多个靶基因例如人CXCL1-8的锚序列介导的连接(ASMC)的锚序列。通常,锚序列是基因组复合物组分特异性结合的基因组序列元件。在一些实施例中,基因组复合物组分与锚序列的结合使复合物形成成核,例如,锚序列介导的连接形成。每个锚序列介导的连接包含一个或多个锚序列,例如多个。在一些实施例中,可以破坏锚序列介导的连接以改变,例如,抑制靶基因的表达。这种破坏可以通过例如改变DNA的拓扑结构来调节基因表达,例如通过调节靶基因与转录控制元件相互作用的能力(例如,增强和沉默/阻遏序列)。
适用于本文所述的表达阻遏系统的表达阻遏物的DNA靶向部分可以结合(例如,特异性结合)靶基因近侧的位点(例如,靶基因内的外显子、内含子或剪接位点)、可操作地连接至靶基因的转录控制元件近侧的位点或锚序列(例如,靶基因近侧的锚序列或与可操作地连接至靶基因的锚序列介导的连接相关联的锚序列(例如,如果连接的中断改变了靶基因的表达,则锚序列介导的连接可操作地连接至靶基因))近侧的位点。如本文所用,“近侧”是指两个位点(例如,核酸位点)的接近,使得表达阻遏子在第一位点处的结合和/或表达阻遏子对第一位点的修饰将产生与另一个位点的结合和/或修饰相同或基本上相同的效果。例如,DNA靶向部分可以与增强子(第二位点)近侧的第一位点结合,并且与所述DNA靶向部分相关联的阻遏子结构域可以表观遗传修饰第一位点,使得增强子对靶基因表达的影响被修饰,基本上与第二位点(增强子序列)被结合和/或修饰的情况相同。在一些实施例中,靶基因(例如,靶基因内的外显子、内含子或剪接位点)近侧、与靶基因可操作地连接的转录控制元件近侧、或锚序列近侧的位点距靶基因(例如,靶基因内的外显子、内含子或剪接位点)、转录控制元件、或锚序列少于5000、4000、3000、2000、1000、900、800、700、600、500、400、300、200、100、50或25个碱基对(并且任选地,距靶基因(例如,靶基因内的外显子、内含子或剪接位点)、转录控制元件、或锚序列至少20、25、50、100、200或300个碱基对)。
适用于本文所述表达阻遏系统的表达阻遏物中的DNA靶向部分可结合,例如特异性结合包含至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸或碱基对(并且任选地不超过50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11或10个核苷酸或碱基对)的位点。在一些实施例中,DNA靶向部分结合包含10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸或碱基对的位点。
本披露的表达阻遏系统可包含两个或更多个表达阻遏物。在一些实施例中,表达阻遏系统的表达阻遏物各自包含不同的DNA靶向部分。
在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括结合靶基因(例如,外显子、内含子或外显子内含子边界(例如,剪接位点))的DNA靶向部分;和第二表达阻遏物,其包括结合靶基因(例如,外显子、内含子或外显子内含子边界(例如,剪接位点))的DNA靶向部分。在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括结合靶基因(例如,外显子、内含子或外显子内含子边界(例如,剪接位点))的DNA靶向部分;和第二表达阻遏物,其包括与可操作地连接至靶基因的转录控制元件(例如,启动子或增强子)结合的DNA靶向部分。在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括与可操作地连接至靶基因的转录控制元件(例如,启动子或增强子)结合的DNA靶向部分;和第二表达阻遏物,其包括与可操作地连接至靶基因的转录控制元件(例如,启动子或增强子)结合的DNA靶向部分。在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括与靶基因近侧的锚序列或可操作地连接至靶基因的锚序列介导的连接相关联的锚序列结合的DNA靶向部分;和第二表达阻遏物,其包括与可操作地连接至靶基因的转录控制元件(例如,启动子或增强子)结合的DNA靶向部分。在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括与靶基因近侧的锚序列或可操作地连接至靶基因的锚序列介导的连接相关联的锚序列结合的DNA靶向部分;和第二表达阻遏物,其包括与靶基因,例如外显子、内含子或外显子内含子边界(例如剪接位点)结合的DNA靶向部分。在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括与靶基因近侧的锚序列或可操作地连接至靶基因的锚序列介导的连接相关联的锚序列结合的DNA靶向部分;和第二表达阻遏物,其包括与靶基因近侧的锚序列或可操作地连接至靶基因的锚序列介导的连接相关联的锚序列结合的DNA靶向部分。
在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括结合至例如可操作地连接至靶基因的启动子中的第一位点的DNA靶向部分;和第二表达阻遏物,其包括结合至例如可操作地连接至靶基因的启动子中的第二位点的DNA靶向部分。第一位点和第二位点可以是不同的且不重叠的位点,例如,第一位点和第二位点不共享任何共同的序列。第一位点和第二位点可以是不同但重叠的位点,例如,第一位点和第二位点包含不同的序列但共享一些共同的序列。
在一些实施例中,DNA靶向部分结合选自SEQ ID NO:1-21的序列或相对其具有不超过10、9、8、7、6、5、4、3、2或1个改变的序列。
ACGGCGGGCCACCAAGGAGA(SEQ ID NO:6)
CAGCGCCGCGCCTTTGGGAC(SEQ ID NO:7)
CCCTTTCGGCGGGGAGCAGGG(SEQ ID NO:8)
GCTGCGCTGGGGGAGCCAGAG(SEQ ID NO:9)
AGCGCCCCTCCACGCGTTCAC(SEQ ID NO:10)
在一些实施例中,第一DNA靶向部分结合包含SEQ ID NO:1-21中任一个的序列,并且第二DNA靶向部分结合包含SEQ ID NO:1-21中任一个的序列,其中第一和第二DNA靶向部分结合相同的序列。在一些实施例中,第一DNA靶向部分结合包含SEQ ID NO:1-21中任一个的序列,并且第二DNA靶向部分结合包含SEQ ID NO:1-21中任一个的序列,其中第一第二靶向部分结合不同的序列。
在一些实施例中,表达阻遏物结合具有本文所列序列的基因组基因座,例如,SEQID NO:1-21中的任一个。应当理解,在许多情况下,被结合的基因组基因座包含双链DNA,并且可以通过给出其有义链或反义链的序列来描述该基因座。因此,具有给定间隔子序列的gRNA可能导致表达阻遏物与特定基因组基因座结合,其中基因组基因座的一条链具有与间隔子序列相似或相同的序列,并且基因组基因座的另一条链具有互补序列。通常,gRNA与基因组基因座的结合将涉及基因组基因座的一些解旋以及gRNA间隔子和跟间隔子互补的链的配对。
在一些实施例中,锚序列包含成核多肽结合基序,例如CTCF结合基序:N(T/C/G)N(G/A/T)CC(A/T/G)(C/G)(C/T/A)AG(G/A)(G/T)GG(C/A/T)(G/A)(C/G)(C/T/A)(G/A/C)(SEQID NO:81),其中N是任何核苷酸。
CTCF结合基序也可以是相反的方向,例如(G/A/C)(C/T/A)(C/G)(G/A)(C/A/T)GG(G/T)(G/A)GA(C/T/A)(C/G)(A/T/G)CC(G/A/T)N(T/C/G)N(SEQ ID NO:82)。其中N是任何核苷酸。
在一些实施例中,锚序列包含SEQ ID NO:81或SEQ ID NO:82或者与SEQ ID NO:81或SEQ ID NO:82至少75%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%相同的序列。
在一些实施例中,锚序列包含成核多肽结合基序,例如YY1结合基序:CCGCCATNTT(SEQ ID NO:83),其中N是任何核苷酸。
YY1结合基序也可以处于相反方向,例如AANATGGCGG(SEQ ID NO:84),其中N是任何核苷酸。
适用于本文所述表达阻遏系统的表达阻遏物中的靶向部分可结合,例如特异性结合包含至少10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸或碱基对(并且任选地不超过50、49、48、47、46、45、44、43、42、41、40、39、38、37、36、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11或10个核苷酸或碱基对)的位点。在一些实施例中,DNA靶向部分结合包含10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸或碱基对的位点。
本披露的表达阻遏系统可包含两个或更多个表达阻遏物。在一些实施例中,表达阻遏系统的表达阻遏物各自包含不同的靶向部分。
在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括结合靶基因(例如,外显子、内含子或外显子内含子边界(例如,剪接位点))的DNA靶向部分;和第二表达阻遏物,其包括结合靶基因(例如,外显子、内含子或外显子内含子边界(例如,剪接位点))的DNA靶向部分。在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括结合靶基因(例如,外显子、内含子或外显子内含子边界(例如,剪接位点))的DNA靶向部分;和第二表达阻遏物,其包括与可操作地连接至靶基因的转录控制元件(例如,启动子或增强子)结合的DNA靶向部分。在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括与可操作地连接至靶基因的转录控制元件(例如,启动子或增强子)结合的DNA靶向部分;和第二表达阻遏物,其包括与可操作地连接至靶基因的转录控制元件(例如,启动子或增强子)结合的DNA靶向部分。在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括与靶基因近侧的锚序列或可操作地连接至靶基因的锚序列介导的连接相关联的锚序列结合的DNA靶向部分;和第二表达阻遏物,其包括与可操作地连接至靶基因的转录控制元件(例如,启动子或增强子)结合的DNA靶向部分。在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括与靶基因近侧的锚序列或可操作地连接至靶基因的锚序列介导的连接相关联的锚序列结合的DNA靶向部分;和第二表达阻遏物,其包括与靶基因,例如外显子、内含子或外显子内含子边界(例如剪接位点)结合的DNA靶向部分。在一些实施例中,表达阻遏系统包括:第一表达阻遏物,其包括与靶基因近侧的锚序列或可操作地连接至靶基因的锚序列介导的连接相关联的锚序列结合的DNA靶向部分;和第二表达阻遏物,其包括与靶基因近侧的锚序列或可操作地连接至靶基因的锚序列介导的连接相关联的锚序列结合的DNA靶向部分。
其他组合物
核酸和载体
本披露进一步部分地涉及编码本文所述的表达阻遏物或表达阻遏系统的核酸。在一些实施例中,可以通过包含编码表达阻遏系统(例如表达阻遏系统的一个或多个表达阻遏物)的核酸的组合物提供表达阻遏系统,其中核酸与足够的其他序列相关联以实现在目的系统中(例如,在特定细胞、组织、生物体等中)表达所述表达阻遏系统(例如表达阻遏系统的一个或多个表达阻遏物)。
在一些特定的实施例中,本披露提供了编码表达阻遏系统、一个或多个表达阻遏物或其多肽部分的核酸组合物。在一些此类实施例中,所提供的核酸可以是或包括DNA、RNA或如本文所述的任何其他核酸部分或实体,并且可以通过本文所述的任何技术或本领域中可获得的其他技术来制备(例如,合成、克隆、扩增、体外或体内转录等)。在一些实施例中,提供了编码表达阻遏系统、一个或多个表达阻遏物或其多肽部分的核酸可以与一种或多种复制、整合和/或表达信号可操作地相关联,该一种或多种复制、整合和/或表达信号适于和/或足以实现所提供核酸在感兴趣的系统(例如,在特定细胞、组织、生物体等)中的整合、复制和/或表达。在一些实施例中,用于递送本文所述的表达阻遏系统的组合物是或包括载体,例如,病毒载体,其包括编码表达阻遏系统的一个或多个组分(例如,如本文所述的表达阻遏系统的一个或多个表达阻遏物)的一个或多个核酸。
在一些实施例中,用于递送本文所述的表达阻遏物或表达阻遏系统的组合物是或包括RNA,例如,mRNA,其包括编码表达阻遏物或表达阻遏系统的一个或多个组分(例如,如本文所述的表达阻遏系统的一个或多个表达阻遏物)的一个或多个核酸。
可以将本文所述的核酸或编码本文所述的蛋白质的核酸掺入载体中。包括来源于逆转录病毒如慢病毒的那些载体是实现长期基因转移的合适工具,因为它们允许转基因的长期稳定整合及其在子细胞中的繁殖。载体的实例包括表达载体、复制载体、探针产生载体、和测序载体。可以按病毒载体的形式,将表达载体提供给细胞。病毒载体技术是本领域众所周知的,并且描述于多种病理学和分子生物学手册。可用作载体的病毒包括但不限于逆转录病毒、腺病毒、腺相关病毒、疱疹病毒和慢病毒。通常,合适的载体含有在至少一种生物体中有复制功能的起点、启动子序列、方便的限制性内切酶位点、和一种或多种选择性标记物。
天然的或合成的核酸的表达典型地通过以下实现:将编码感兴趣基因的核酸可操作地连接至启动子,并且将构建体并入表达载体。载体可以适用于在真核生物中复制和整合。典型的克隆载体含有转录和翻译终止子、起始序列、和启动子,可用于所期望核酸序列的表达。
另外的启动子元件,例如增强序列,可以调节转录起始的频率。典型地,这些序列位于转录起始位点上游30-110bp的区域中,尽管最近已显示多种启动子也含有转录起始位点下游的功能元件。启动子元件之间的间隔通常是灵活的,使得当反转元件或使元件相对彼此移动时能够保留启动子功能。在胸苷激酶(tk)启动子中,在活性开始下降之前,启动子元件之间的间隔可以增加至50bp。取决于启动子,似乎单个元件可以共同地或独立地发挥功能,以激活转录。
合适的启动子的一个实例是即时早期巨细胞病毒(CMV)启动子序列。这一启动子序列是能够驱动与其可操作地连接的任何多核苷酸序列的高水平表达的强组成型启动子序列。合适的启动子的一些实施例是延伸生长因子-1α(EF-1α)。然而,还可以使用其他组成型启动子序列,包括但不限于猿猴病毒40(SV40)早期启动子、小鼠乳腺瘤病毒(MMTV)、人类免疫缺陷病毒(HIV)、长末端重复序列(LTR)启动子、MoMuLV启动子、禽白血病病毒启动子、EB病毒即时早期启动子、劳斯肉瘤病毒启动子、连同人类基因启动子(如但不限于肌动蛋白启动子、肌球蛋白启动子、血红蛋白启动子、以及肌酸激酶启动子)。
本披露不应解释为限于使用任何特定启动子或启动子种类(例如组成型启动子)。例如,在一些实施例中,诱导型启动子被认为是本披露的一部分。在一些实施例中,诱导型启动子的使用提供了能够开启与其可操作地连接的多核苷酸序列的表达的分子开关(当期望这样的表达时)。在一些实施例中,诱导型启动子的使用提供了能够关闭表达的分子开关(当不期望表达时)。诱导型启动子的实例包括但不限于金属硫蛋白启动子、糖皮质激素启动子、孕酮启动子、和四环素启动子。
在一些实施例中,待引入的表达载体还可以含有选择性标记基因或报告基因或二者,从而便于从寻求通过病毒载体转染或感染的细胞的群体中,鉴定和选择表达性细胞。在一些方面,选择性标记物可以在一段单独的DNA上进行,并且用于共转染程序。选择性标记物和报告基因的侧翼均可以是适当的转录控制序列,以使得能够在宿主细胞中表达。有用的选择性标记物可以包括例如抗生素抗性基因,例如neo等。
在一些实施例中,可以将报告基因用于鉴定潜在转染的细胞和/或用于评估转录控制序列的功能。通常,报告基因是不存在于(报告基因的)受者来源中或不由受者来源表达,并且编码其表达由一些易于检测特性(例如酶活性或可视荧光)所证明的多肽的基因。在将DNA引入受体细胞后,在适当的时间测定报告基因的表达。合适的报告基因可包括编码萤光素酶、β-半乳糖苷酶、氯霉素乙酰转移酶、分泌型碱性磷酸酶的基因或绿色荧光蛋白基因(例如,Ui-Tei等人,2000 FEBS Letters[欧洲生化学会联合会快报]479:79-82)。合适的表达系统是熟知的,可以使用已知技术制备或商业获得。通常,具有显示报告基因最高表达水平的最小5'侧翼区的构建体被鉴定为启动子。此类启动子区可以连接至报告基因,并且用于评估药剂调节启动子驱动的转录的能力。
细胞
本披露进一步部分地涉及包含本文所述的表达阻遏物或表达阻遏系统的细胞。本领域技术人员已知的任何细胞,例如细胞系,例如适合表达重组多肽的细胞系,都适合包含本文所述的表达阻遏物或表达阻遏系统。在一些实施例中,细胞,例如细胞系,可用于表达本文所述的表达阻遏物或表达阻遏系统,例如一个或多个表达阻遏物。在一些实施例中,细胞例如细胞系可用于表达或扩增编码本文所述的表达阻遏物或表达阻遏系统(例如一个或多个表达阻遏物)的核酸,例如载体。在一些实施例中,细胞包含编码本文所述的表达阻遏物或表达阻遏系统(例如一个或多个表达阻遏物)的核酸。
在一些实施例中,细胞包含编码表达阻遏物或表达阻遏系统的第一组分(例如第一表达阻遏物)的第一核酸,和编码表达阻遏系统的第二组分(例如第二表达阻遏物)的第二核酸。在一些实施例中,其中细胞包含编码包含两个或更多个表达阻遏物的表达阻遏系统的核酸,编码每个表达阻遏物的序列布置在不同的核酸分子上,例如不同的载体上,例如编码第一表达阻遏物的第一载体和编码第二表达阻遏物的第二载体。在一些实施例中,编码每个表达阻遏物的序列布置在相同的核酸分子上,例如,相同的载体上。在一些实施例中,编码表达阻遏系统的一些或所有核酸被整合到细胞的基因组DNA中。在一些实施例中,编码表达阻遏系统的第一表达阻遏物的核酸被整合到细胞的基因组DNA中,并且编码表达阻遏系统的第二表达阻遏物的核酸不被整合到细胞的基因组DNA中(例如,位于载体上)。在一些实施例中,编码表达阻遏系统的第一和第二表达阻遏物的一个或多个核酸被整合到细胞的基因组DNA中,例如,在基因组DNA中的相同(例如,相邻或共定位)或不同位点。
可包含和/或表达本文所述的表达阻遏系统或表达阻遏物的细胞的实例包括但不限于肝细胞、神经元细胞、内皮细胞、肌细胞和淋巴细胞。
本披露进一步部分地涉及通过本文所述的方法或工艺制造的细胞。在一些实施例中,本披露提供了通过以下产生的细胞:提供本文所述的表达阻遏系统,提供细胞,并使细胞与表达阻遏系统(或编码表达阻遏系统的核酸,或包含所述表达阻遏系统或核酸的组合物)接触。不希望受理论的束缚,与本文所述的表达阻遏系统接触的细胞可以表现出:与未与表达阻遏系统接触过的相似细胞相比,靶基因表达的减少和/或与靶基因相关联的表观遗传标记物的修饰、可操作地连接至靶基因的转录控制元件的修饰、或靶基因近侧的锚序列或与可操作地连接至靶基因的锚序列介导的连接相关联的锚序列的修饰。在一些实施例中,表现出所述靶基因表达降低和/或表观遗传标记物修饰的细胞不包含表达阻遏系统。在与表达阻遏系统接触后,表达降低和/或表观遗传标记物修饰可持续例如至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24小时,或至少1、2、3、4、5、6、7、10或14天,或至少1、2、3、4或5周,或至少1、2、3、4、5、6、7、8、9、10、11或12个月,或至少1、2、3、4或5年(例如,无限期地)。在一些实施例中,先前被表达阻遏系统接触过的细胞在表达阻遏系统不再存在于该细胞中后保持表达的减少和/或表观遗传标记物的修饰,例如,在表达阻遏系统不再存在于该细胞中后持续至少1小时、2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时或24小时,或至少1天、2天、3天、4天、5天、6天、7天、10天或14天,或至少1周、2周、3周、4周或5周,或至少1个月、2个月、3个月、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月或12个月,或至少1年、2年、3年、4年或5年(例如,无限期地)。
制造表达阻遏系统和/或表达阻遏物的方法
在一些实施例中,表达阻遏物包含蛋白质或者是蛋白质,因此可以通过制备蛋白质的方法产生。在一些实施例中,表达阻遏系统,例如表达阻遏系统的一个或多个表达阻遏物,包含一个或多个蛋白质并且因此可以通过制备蛋白质的方法来产生。如技术人员将理解的,制备蛋白质或多肽(其可以包含在如本文所述的调节剂中)的方法是本领域的常规方法。通常,参见Smales和James(编辑),Therapeutic Proteins:Methods and Protocols[治疗性蛋白:方法和方案](Methods in Molecular Biology[分子生物学方法]),HumanaPress[胡玛纳出版社](2005);以及Crommelin,Sindelar和Meibohm(编辑),Pharmaceutical Biotechnology:Fundamentals and Applications[药物生物技术:基础与应用],Springer[斯普林格出版社](2013)。
本披露组合物的蛋白质或多肽可以通过采用标准固相技术来生化合成。这类方法包括排阻固相合成、部分固相合成方法、片段缩合、经典溶液合成。这些方法可以当肽相对较短(例如,10kDa)和/或当它不能通过重组技术来产生(即,未由核酸序列来编码)并且因此涉及不同化学时使用。
固相合成程序是本领域众所周知的,并且进一步由以下描述:John MorrowStewart和Janis Dillaha Young,Solid Phase Peptide Syntheses[固相肽合成],第2版,Pierce Chemical Company[皮尔斯化学公司],1984;和Coin,I.等人,Nature Protocols[自然实验手册],2:3247-3256,2007。
对于较长肽,可以使用重组的方法。制备重组治疗性多肽的方法在本领域是常规的。通常,参见Smales和James(编辑),Therapeutic Proteins:Methods and Protocols[治疗性蛋白:方法和方案](Methods in Molecular Biology[分子生物学方法]),HumanaPress[胡玛纳出版社](2005);以及Crommelin,Sindelar和Meibohm(编辑),Pharmaceutical Biotechnology:Fundamentals and Applications[药物生物技术:基础与应用],Springer[斯普林格出版社](2013)。
产生治疗性药物蛋白质或多肽的示例性方法涉及在哺乳动物细胞中表达,尽管也可以使用昆虫细胞、酵母、细菌、或其他细胞,在适当的启动子控制下,产生重组蛋白。哺乳动物表达载体可以包含非转录元件,如复制起点、合适的启动子、以及其他5'或3’侧翼非转录序列;以及5'或3'非翻译序列,如必要的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、以及终止序列。源自SV40病毒基因组的DNA序列,例如SV40起点、早期启动子、剪接和聚腺苷酸化位点可以用于提供异源DNA序列表达所需的其他遗传元件。在以下文献中描述了用于与细菌、真菌、酵母、和哺乳动物细胞宿主一起使用的适当的克隆和表达载体:Green&Sambrook,Molecular Cloning:A Laboratory Manual[分子克隆-实验室手册](第四版),Cold Spring Harbor Laboratory Press[冷泉港实验室出版社](2012)。
在期望大量蛋白质或多肽的情况下,其可以使用例如由以下文献描述的技术来产生:Brian Bray,Nature Reviews Drug Discovery[自然综述:药物发现],2:587-593,2003;以及Weissbach&Weissbach,1988,Methods for Plant Molecular Biology[植物分子生物学方法],Academic Press[学术出版社],纽约,第VIII节,第421-463页。
各种哺乳动物细胞培养系统可以用于表达和制造重组蛋白。哺乳动物表达系统的实例包括但不限于CHO细胞、COS细胞、HeLA和BHK细胞系。在以下文献中描述了用于生产蛋白治疗剂的宿主细胞培养的过程:Zhou和Kantardjieff(编辑),Mammalian Cell Culturesfor Biologics Manufacturing[用于生物制品制造的哺乳动物细胞培养](Advances inBiochemical Engineering/Biotechnology[生物化学工程/生物科技的进展]),Springer[斯普林格出版社](2014)。本文所述的组合物可包括载体,例如编码重组蛋白的病毒载体,例如慢病毒载体。在一些实施例中,载体,例如病毒载体,可以包含编码重组蛋白的核酸。本文所述的组合物可包括包封编码重组蛋白的载体(例如病毒载体,例如慢病毒载体)的脂质纳米颗粒。在一些实施例中,包封载体(例如病毒载体)的脂质纳米颗粒可包含编码重组蛋白的核酸。
蛋白质包含一种或多种氨基酸。氨基酸包括可以例如通过形成一个或多个肽键掺入多肽链的任何化合物和/或物质。在一些实施例中,氨基酸具有通式结构H2N–C(H)(R)–COOH。在一些实施例中,氨基酸是天然存在的氨基酸。在一些实施例中,氨基酸是非天然氨基酸;在一些实施例中,氨基酸是D-氨基酸;在一些实施例中,氨基酸是L-氨基酸。“标准氨基酸”是指通常在天然存在的肽中发现的二十种标准L-氨基酸中的任一种。“非标准氨基酸”是指除了标准氨基酸之外的任何氨基酸,无论它是合成制备的还是从天然来源获得的。在一些实施例中,与上述一般结构相比,多肽中的氨基酸,包括羧基和/或氨基末端氨基酸,可以包含结构修饰。例如,在一些实施例中,与一般结构相比,氨基酸可以通过甲基化、酰胺化、乙酰化、聚乙二醇化、糖基化、磷酸化和/或取代(例如氨基、羧酸基、一个或多个质子、和/或羟基)来修饰。在一些实施例中,与含有其他方面相同的未修饰氨基酸的多肽相比,这种修饰可以例如,改变含有修饰的氨基酸的多肽的循环半衰期。在一些实施例中,与含有其他方面相同的未修饰氨基酸的多肽相比,这种修饰不会显著改变含有修饰的氨基酸的多肽的相关活性。从上下文可以清楚地看出,在一些实施例中,术语“氨基酸”可以用来指游离氨基酸;在一些实施例中,它可以用来指多肽的氨基酸残基。
在以下文献中描述了蛋白治疗剂的纯化:Franks,Protein Biotechnology:Isolation,Characterization,and Stabilization[蛋白生物技术:分离、表征、和稳定化],Humana Press[胡玛纳出版社](2013);以及Cutler,Protein PurificationProtocols[蛋白纯化方案](Methods in Molecular Biology[分子生物学方法]),HumanaPress[胡玛纳出版社](2010)。以下文献中描述了蛋白治疗剂的配制品:Meyer(编辑),Therapeutic Protein Drug Products:Practical Approaches to formulation in theLaboratory,Manufacturing,and the Clinic[治疗性蛋白药物产品:实验室、制造和临床中配制品的实践方法],Woodhead Publishing Series[伍德海德出版系列](2012)。
药物组合物、配制品、递送和施用
本披露进一步部分地涉及包括本文所述的表达阻遏物或表达阻遏系统(例如,一个或多个表达阻遏物)的药物组合物、涉及包括编码本文所述的表达阻遏物或表达阻遏系统(例如,一个或多个表达阻遏物)的核酸的药物组合物和/或涉及将本文所述的表达阻遏物或表达阻遏系统(例如,一个或多个表达阻遏物)递送至细胞、组织、器官和/或受试者的组合物。
如本文所用,术语“药物组合物”是指与一种或多种药学上可接受的载剂(例如,本领域技术人员已知的药学上可接受的载剂)一起配制的活性剂(例如,表达阻遏物或表达受体的核酸,例如,表达阻遏系统,例如,表达阻遏系统的一个或多个表达阻遏物,或编码其的核酸)。在一些实施例中,活性剂以适合于在治疗方案中施用的单位剂量存在,当施用至相关群体时,该治疗方案显示出实现预定治疗效果的统计学显著概率。在一些实施例中,包含本披露的表达阻遏物的药物组合物包含表达阻遏物或一个或多个编码其的核酸。在一些实施例中,包括本披露的表达阻遏系统的药物组合物包括表达阻遏系统的表达阻遏物中的每一个或编码所述表达阻遏物的一个或多个核酸(例如,如果表达阻遏系统包括第一表达阻遏物和第二表达阻遏物,则药物组合物包括第一和第二表达阻遏物)。在一些实施例中,药物组合物包含少于包含多个表达阻遏物的表达阻遏系统的所有表达阻遏物。例如,表达阻遏系统可以包括第一表达阻遏物和第二表达阻遏物,并且第一药物组合物可以包括第一表达阻遏物或编码所述第一表达阻遏物的核酸,并且第二药物组合物可以包括第二表达阻遏物或编码所述第二表达阻遏物的核酸。
在一些实施例中,药物组合物可以特别配制成以固体或液体形式施用,包括适用于以下情况的那些:口服施用,例如,灌服剂(水性或非水性溶液或悬浮液)、片剂,例如用于口腔、舌下和全身吸收的那些片剂、丸剂、粉剂、颗粒剂、用于舌头的糊剂;胃肠外施用,例如通过皮下、肌内、静脉内或硬膜外注射,作为例如无菌溶液或悬浮液,或持续释放配制品;局部施用,例如,作为乳膏、软膏或控释贴剂或喷雾剂应用于皮肤、肺或口腔;阴道内或直肠内,例如,作为阴道栓、乳膏或泡沫;舌下含服;眼部;经皮;或鼻、肺和/或至其他粘膜表面。
如本文所用,术语“药学上可接受的”是指在合理的医学判断范围内的那些化合物、材料、组合物、和/或剂型,其适用于与人类和动物的组织接触而没有过度毒性、刺激、过敏应答、或其他问题或并发症,与适当的益处/风险比相称。
如本文所用,术语“药学上可接受的载剂”意指药学上可接受的材料、组合物或媒介物,如液体或固体填充剂、稀释剂、赋形剂或溶剂包封材料,其参与将主题化合物从身体的一个器官或部分运送或转运至身体的另一个器官或部分。每种载剂在与配制品的其他成分相容的意义上必须是“可接受的”,并且对患者无害。
例如,在一些实施例中,可以用作药学上可接受的载剂的材料包括:糖类,如乳糖、葡萄糖和蔗糖;淀粉,如玉米淀粉和马铃薯淀粉;纤维素及其衍生物,如羧甲基纤维素钠、乙基纤维素和醋酸纤维素;粉状黄蓍胶;麦芽;明胶;滑石;赋形剂,如可可脂和栓剂蜡;油类,如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油;二元醇,如丙二醇;多元醇,如甘油、山梨醇、甘露醇和聚乙二醇;酯类,如油酸乙酯和月桂酸乙酯;琼脂;缓冲剂,如氢氧化镁和氢氧化铝;海藻酸;无热原的水;等渗盐水;林格氏溶液;乙醇;pH缓冲溶液;聚酯、聚碳酸酯和/或聚酸酐;以及在药物配制品中采用的其他无毒相容物质。
如本文所用,术语“药学上可接受的盐”是指适合用于药物环境的此类化合物的盐,即在合理的医学判断范围内适用于与人和低等动物的组织接触而没有不适当的毒性、刺激、过敏应答等,并且与适当的益处/风险比相称的盐。药学上可接受的盐是本领域熟知的。例如,S.M.Berge等人在J.Pharmaceutical Sciences[药物科学杂志],66:1-19(1977)中详细描述了药学上可接受的盐。在一些实施例中,药学上可接受的盐包括但不限于无毒的酸加成盐,其是使用无机酸诸如盐酸、氢溴酸、磷酸、硫酸和高氯酸或使用有机酸诸如乙酸、马来酸、酒石酸、柠檬酸、琥珀酸或丙二酸或通过使用本领域中所使用的其他方法诸如离子交换形成的具有氨基的盐。在一些实施例中,药学上可接受的盐包括但不限于己二酸盐、藻酸盐、抗坏血酸盐、天冬氨酸盐、苯磺酸盐、苯酸盐、硫酸氢盐、硼酸盐、丁酸盐、樟脑酸盐、樟脑磺酸盐、柠檬酸盐、环戊烷丙酸盐、二葡糖酸盐、十二烷基硫酸盐、乙磺酸盐、甲酸盐、富马酸盐、葡庚糖酸盐、甘油磷酸盐、葡糖酸盐、半硫酸盐、庚酸盐、己酸盐、氢碘酸盐、2-羟基-乙磺酸盐、乳糖醛酸盐、乳酸盐、月桂酸盐、十二烷基硫酸盐、苹果酸盐、马来酸盐、丙二酸盐、甲磺酸盐、2-萘磺酸盐、烟酸盐、硝酸盐、油酸盐、草酸盐、棕榈酸盐、双羟萘酸盐、果胶酸盐、过硫酸盐、3-苯基丙酸盐、磷酸盐、苦味酸盐、新戊酸盐、丙酸盐、硬脂酸盐、琥珀酸盐、硫酸盐、酒石酸盐、硫氰酸盐、对-甲苯磺酸盐、十一酸盐、戊酸盐等。代表性的碱金属或碱土金属盐包括钠、锂、钾、钙、镁等。在一些实施例中,药学上可接受的盐适当地包括使用平衡离子(诸如卤离子、氢氧根、羧酸根、硫酸根、磷酸根、硝酸根、具有从1至6个碳原子的烷基、磺酸根以及芳基磺酸根)形成的无毒铵、季铵以及胺阳离子。
在各种实施例中,本披露提供了本文所述的药物组合物,其具有药学上可接受的赋形剂。药学上可接受的赋形剂包括可用于制备通常安全,无毒和所期望的药物组合物的赋形剂,并且包括兽医用途以及人类药物用途可接受的赋形剂。此类赋形剂可以是固体、液体、半固体,或者在气雾剂组合物的情况下是气体。
药物制剂可以按照常规制药技术来制备,包括研磨、混合、制粒,必要时压制成片剂;或者针对硬明胶胶囊形式进行研磨、混合和填充。当使用液体载剂时,制剂可以是糖浆、酏剂、乳剂或水性或非水性溶液或悬浮液的形式。这种液体配制品可以直接口服施用。
在一些实施例中,药物组合物可以配制成经由任何施用途径递送至细胞和/或受试者。对受试者的施用方式可以包括注射、输注、吸入、鼻内、眼内、局部递送、环间递送或摄入。注射包括但不限于静脉内、肌肉内、动脉内、鞘内、心室内、囊内、眶内、心内、皮内、腹膜内、经气管、皮下、表皮下、关节内、囊下、蛛网膜下、椎管内、脊髓内和胸骨内注射和输注。在一些实施例中,施用包括气雾剂吸入,例如使用雾化。在一些实施例中,施用是全身性的(例如,口服、直肠、鼻内、舌下、口腔或胃肠外)、经肠的(例如,系统范围的作用,但通过胃肠道递送),或局部的(例如,皮肤上的局部应用、玻璃体内注射)。在一些实施例中,全身性施用一种或多种组合物。在一些实施例中,施用是非胃肠外施用,并且治疗剂是胃肠外治疗剂。在一些实施例中,施用可以是支气管(例如,通过支气管滴注)、口腔、皮肤(其可以是或包括例如真皮局部、皮内、皮肤内、经皮等中的一种或多种)、肠内、动脉内、皮内、胃内、髓内、肌内、鼻内、腹膜内、鞘内、静脉内、心室内、特定器官内(例如肝内)、粘膜、鼻、口服、直肠、皮下、舌下、局部、气管(例如,通过气管内滴注)、阴道、玻璃体等施用。在一些实施例中,施用可以是单剂量。在一些实施例中,施用可以包括间歇给药(例如,在时间上分开的多个剂量)和/或周期性(例如,由公共时间段分开的单个剂量)给药。在一些实施例中,施用可以包括持续给药(例如,灌注)至少一段选定的时间。
根据本披露的药物组合物可以按治疗有效量递送。精确的治疗有效量是将在治疗功效方面在给定受试者中产生最有效结果的组合物的量。该量将根据多种因素而变化,包括但不限于治疗性化合物的特征(包括活性、药代动力学、药效学和生物利用度)、受试者的生理状况(包括年龄、性别、疾病类型和阶段、一般身体条件、对给定剂量的应答性和药物类型)、配制品中一种或多种药学上可接受的载剂的性质、和/或施用途径。
在一些方面,本披露提供了递送治疗剂的方法,其包括向受试者施用如本文所述的组合物,其中基因组复合物调节剂是治疗剂和/或其中治疗剂的递送相对于不存在治疗剂时的基因表达引起基因表达的变化。
如在本文各种实施例中所提供的方法可用于本文描述的任何一些方面。在一些实施例中,一种或多种组合物靶向特定细胞或一种或多种特定组织。
例如,在一些实施例中,一种或多种组合物靶向上皮、结缔、肌肉和/或神经组织或细胞。在一些实施例中,组合物靶向特定器官系统的细胞或组织,例如心血管系统(心脏、脉管系统);消化系统(食道、胃、肝、胆、胰、肠、结肠、直肠和肛门);内分泌系统(下丘脑、垂体、松果体或松果腺、甲状腺、甲状旁腺、肾上腺);排泄系统(肾脏、输尿管、膀胱);淋巴系统(淋巴、淋巴结、淋巴管、扁桃体、腺样体、胸腺、脾脏);皮肤系统(皮肤、毛发、指甲);肌肉系统(例如,骨骼肌);神经系统(大脑、脊髓、神经);生殖系统(卵巢、子宫、乳腺、睾丸、输精管、精囊、前列腺);呼吸系统(咽、喉、气管、支气管、肺、膈肌);骨骼系统(骨骼、软骨);和/或其组合。
在一些实施例中,本披露的组合物穿过血脑屏障、胎盘膜或血睾屏障。
在一些实施例中,全身性施用如本文所提供的药物组合物。
在一些实施例中,施用是非胃肠外施用,并且治疗剂是胃肠外治疗剂。
在一些实施例中,与单独的活性剂相比,本披露的药物组合物具有改善的PK/PD,例如增加的药代动力学或药效学,如改善的靶向、吸收或转运(例如,至少5%、10%、15%、20%、30%、40%、50%、60%、75%、80%、90%的改善或更多)。在一些实施例中,与单独的治疗剂相比,药物组合物具有减少的不良效应,如减少的向非靶位置的扩散、脱靶活性或毒性代谢(例如,与单独的活性剂相比,减少至少5%、10%、15%、20%、30%、40%、50%、60%、75%、80%、90%或更多)。在一些实施例中,与单独的活性剂相比,组合物增加了治疗剂的功效和/或降低了治疗剂的毒性(例如,至少5%、10%、15%、20%、30%、40%、50%、60%、75%、80%、90%或更多)。
本文所述的药物组合物可以被配制例如包含载剂(如药物载剂和/或聚合物载剂,例如脂质体或媒介物),并通过已知方法递送至有需要的受试者(例如,人或非人农业动物或家畜,例如牛、狗、猫、马、家禽)。此类方法包括转染(例如,脂质介导的阳离子聚合物,磷酸钙);电穿孔或其他破坏膜的方法(例如,核转染)和病毒递送(例如,慢病毒、逆转录病毒、腺病毒、AAV)。递送方法也描述于例如Gori等人,Delivery and Specificity of CRISPR/Cas9 Genome Editing Technologies for Human Gene Therapy[人类基因治疗用CRISPR/Cas9基因组编辑技术的传递和特异性].Human Gene Therapy[人类基因治疗].2015年7月,26(7):443-451.doi:10.1089/hum.2015.074;和Zuris等人,Cationic lipid-mediateddelivery of proteins enables efficient protein-based genome editing in vitroand in vivo[阳离子脂质介导的蛋白质递送能够在体外和体内实现高效的基于蛋白质的基因组编辑].Nat Biotechnol[自然生物技术].2014年10月30日;33(1):73-80。
脂质体是球形囊泡结构,这些球形囊泡结构由围绕内部水性隔室的单层或多层的脂质双层和相对不可渗透的外部亲脂性磷脂双层构成。脂质体可以是阴离子的、中性的或阳离子的。脂质体具有生物相容性,无毒,可以递送亲水性和亲脂性药物分子,保护其货物免受血浆酶的降解,并将其负载运输穿过生物膜和血脑屏障(BBB)(有关综述,参见,例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章ID 469679,第12页,2011.doi:10.1155/2011/469679)。
囊泡可由几种不同类型的脂质制成;然而,最常使用磷脂生成作为药物载剂的脂质体。囊泡可包括但不限于DOTMA、DOTAP、DOTIM、DDAB,单独使用或与胆固醇一起产生DOTMA和胆固醇、DOTAP和胆固醇、DOTIM和胆固醇以及DDAB和胆固醇。制备多层囊泡脂质的方法是本领域已知的(参见例如美国专利号6,693,086,其关于多层囊泡脂质制备的传授内容通过援引并入文中)。尽管当脂质膜与水溶液混合时,囊泡形成可以是自发的,但也可以通过经由使用均质器、超声波仪或挤压设备以振荡的形式施加力来加快囊泡形成(关于综述,参见例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章ID469679,第12页,2011.doi:10.1155/2011/469679)。可通过挤出通过具有减小尺寸的过滤器来制备挤出的脂质,如Templeton等人,Nature Biotech[自然生物技术],15:647-652,1997中所述,其关于挤出脂质制备的传授内容通过援引并入文中。
本文提供的方法和组合物可以包括通过足以减轻疾病、障碍和/或病症的症状的方案施用的药物组合物。在一些方面,本披露提供了通过施用如本文所述的组合物来递送治疗剂的方法。
用途
本披露进一步涉及本文披露的表达阻遏系统的用途。除其他事项外,在一些实施例中,此类提供的技术可用于实现靶基因表达的调节,例如阻遏,并且例如能够控制例如细胞中的靶基因的活性、递送和外显率。在一些实施例中,细胞是哺乳动物细胞,例如人细胞。在一些实施例中,细胞是体细胞。在一些实施例中,细胞是原代细胞。例如,在一些实施例中,细胞是哺乳动物体细胞。在一些实施例中,哺乳动物体细胞是原代细胞。在一些实施例中,哺乳动物体细胞是非胚胎细胞。
剂量
施用的药剂或组合物的剂量可以根据例如所治疗的病症、疾病的严重程度、受试者的个体参数(包含年龄、生理状况、体型和体重)、治疗的持续时间、待进行的治疗的类型(如果有的话)、特定的施用途径和类似因素而变化。因此,本文所述药剂的施用剂量可取决于此类各种参数。施用的组合物的剂量也可根据其他因素如受试者的性别、一般医学状况和待治疗障碍的严重程度而变化。可能需要根据情况要求向受试者提供一定剂量的表达阻遏物或表达阻遏系统或本文披露的表达阻遏物的组合。在一些实施例中,根据情况指示要求向受试者提供一定剂量的表达阻遏物、或表达阻遏系统或本文披露的表达阻遏物的组合。
根据本披露的药物组合物可以按治疗有效量递送。精确的治疗有效量是将在治疗功效方面在给定受试者中产生最有效结果的组合物的量。该量将根据多种因素而变化,包括但不限于治疗性化合物的特征(包括活性、药代动力学、药效学和生物利用度)、受试者的生理状况(包括年龄、性别、疾病类型和阶段、一般身体条件、对给定剂量的应答性和药物类型)、配制品中一种或多种药学上可接受的载剂的性质、和/或施用途径。
脂质纳米颗粒
如本文所述的表达阻遏物或表达阻遏系统可以使用任何生物递送系统/配制品递送,包括颗粒,例如纳米颗粒递送系统。纳米颗粒包括尺寸(例如直径)为约1至约1000纳米、约1至约500纳米、约1至约100nm、约30nm至约200nm、约50nm至约300nm、约75nm至约200nm、约100nm至约200nm以及其间任何范围的颗粒。纳米颗粒具有纳米级尺寸的复合结构。在一些实施例中,纳米颗粒通常是球形的,尽管根据纳米颗粒的组成可能有不同的形态。纳米颗粒与纳米颗粒外部环境接触的部分通常被确定为纳米颗粒的表面。在一些实施例中,纳米颗粒具有范围在25nm和200nm之间的最大尺寸。本文所述的纳米颗粒包含可以任何形式提供的递送系统,包括但不限于固体、半固体、乳液或胶体纳米颗粒。纳米颗粒递送系统可包括但不限于基于脂质的系统、脂质体、胶束、微囊泡、外来体或基因枪。在一个实施例中,纳米颗粒是脂质纳米颗粒(LNP)。在一些实施例中,LNP是包含多个通过分子间力彼此物理关联的脂质分子的颗粒。
在一些实施例中,LNP可包含多个组分,例如3-4个组分。在一个实施例中,表达阻遏物或包含所述表达阻遏物的药物组合物(或编码其的核酸,或包含所述表达阻遏物核酸的药物组合物)被封装在LNP中。在一个实施例中,表达阻遏系统或包含所述表达阻遏系统的药物组合物(或编码其的核酸,或包含所述表达阻遏系统核酸的药物组合物)被封装在LNP中。在一些实施例中,编码第一表达阻遏物的核酸和编码第二表达阻遏物的核酸存在于同一LNP中。在一些实施例中,编码第一表达阻遏物的核酸和编码第二表达阻遏物的核酸存在于不同的LNP中。可以使用LNP的制备和调节剂封装/和/或改编自Rosin等人,MolecularTherapy[分子疗法],第19卷,第12期,第1286-2200页,2011年12月。在一些实施例中,本文披露的脂质纳米颗粒组合物可用于表达由mRNA编码的蛋白质。在一些实施例中,当核酸存在于脂质纳米颗粒中时,核酸在水溶液中抵抗核酸酶的降解。
在一些实施例中,LNP配制品可包括CCD脂质、中性脂质和/或辅助脂质。在一些实施例中,LNP配制品包含可电离脂质。在一些实施例中,可电离脂质可以是阳离子脂质、可电离阳离子脂质或可容易质子化的含胺脂质。在一些实施例中,脂质是阳离子脂质,其可以根据pH以带正电或中性形式存在。在一些实施例中,阳离子脂质是例如在生理条件下能够带正电的脂质。在一些实施例中,脂质颗粒包括与中性脂质、可电离含胺脂质、可生物降解的炔脂质、类固醇、包括多不饱和脂质的磷脂、结构脂质(例如固醇)、PEG、胆固醇和聚合物缀合脂质中的一种或多种配制的阳离子脂质。
在一些实施例中,LNP配制品(例如,MC3和/或SSOP)包括胆固醇、PEG和/或辅助脂质。LNP可以是例如微球体(包括单层和多层囊泡、层状相脂质双层,其在一些实施例中基本上是球形的。
在一些实施例中,LNP可包含水性核心,例如,包含编码本文披露的表达阻遏物或系统的核酸。在本披露的一些实施例中,LNP配制品的货物包括至少一个指导RNA。在一些实施例中,货物,例如编码表达阻遏物的核酸,或如本文所披露的系统,可以吸附到LNP的表面,例如包含阳离子脂质的LNP。在一些实施例中,货物,例如编码表达阻遏物的核酸,或如本文披露的系统可与LNP相关联。在一些实施例中,货物,例如编码表达阻遏物的核酸,或本文披露的系统,可以被封装,例如完全封装和/或部分封装在LNP中。
在一些实施例中,包含货物的LNP可被施用用于全身递送,例如,递送治疗有效剂量的货物,其可导致活性剂在生物体内的广泛暴露。脂质纳米颗粒的全身递送可以通过本领域已知的任何方式进行,包括例如静脉内、动脉内、皮下和腹膜内递送。在一些实施例中,脂质纳米颗粒的全身递送是通过静脉内递送。在一些实施例中,可以施用包含货物的LNP用于局部递送,例如,将活性剂直接递送至生物体内的靶位点。
LNP可以配制成乳液中的分散相、胶束或悬浮液中的内相。在一些实施例中,LNP是可生物降解的。在一些实施例中,LNP在治疗有效剂量下不会累积到细胞毒性水平或在体内引起毒性。在一些实施例中,LNP在以治疗有效剂量重复施用后不会累积到细胞毒性水平或在体内引起毒性。在一些实施例中,LNP在治疗有效剂量下不引起导致显著不利影响的先天免疫反应。
在一些实施例中,使用的LNP包含式(6Z,9Z,28Z,31Z)-七碳六烯酸-6,9,28,31-四烯-19-基4-(二甲氨基)丁酸酯或ssPalmO-苯基-P4C2(ssPalmO-Phe,SS-OP)。在一些实施例中,LNP配制品包括以下式:(6Z,9Z,28Z,31Z)-七碳六烯酸-6,9,28,31-四烯-19-基4-(二甲氨基)丁酸酯(MC3)、1,2-二油酰基-sn-甘油-3-磷酸胆碱(DOPC)、胆固醇、1,2-二肉豆蔻酰基-rac-甘油-3-甲氧基聚乙二醇-2000(PEG2k-DMG),例如,MC3 LNP或ssPalmO-苯基-P4C2(ssPalmO-Phe,SS-OP)、1,2-二油酰基-sn-甘油-3-磷酸胆碱(DOPC)、胆固醇、1,2-二肉豆蔻酰基-rac-甘油-3-甲氧基聚乙二醇-2000(PEG2k-DMG),例如,SSOP-LNP。
脂质体是球形囊泡结构,这些球形囊泡结构由围绕内部水性隔室的单层或多层的脂质双层和相对不可渗透的外部亲脂性磷脂双层构成。脂质体可以是阴离子的、中性的或阳离子的。脂质体具有生物相容性,无毒,可以递送亲水性和亲脂性药物分子,保护其货物免受血浆酶的降解,并将其负载运输穿过生物膜和血脑屏障(BBB)(有关综述,参见,例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章ID 469679,第12页,2011.doi:10.1155/2011/469679)。
囊泡可由几种不同类型的脂质制成;然而,最常使用磷脂生成作为药物载剂的脂质体。囊泡可包括但不限于DOTMA、DOTAP、DOTIM、DDAB,单独使用或与胆固醇一起产生DOTMA和胆固醇、DOTAP和胆固醇、DOTIM和胆固醇以及DDAB和胆固醇。制备多层囊泡脂质的方法是本领域已知的(参见例如美国专利号6,693,086,其关于多层囊泡脂质制备的传授内容通过援引并入文中)。尽管当脂质膜与水溶液混合时,囊泡形成可以是自发的,但也可以通过经由使用均质器、超声波仪或挤压设备以振荡的形式施加力来加快囊泡形成(关于综述,参见例如,Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文章ID469679,第12页,2011.doi:10.1155/2011/469679)。可通过挤出通过具有减小尺寸的过滤器来制备挤出的脂质,如Templeton等人,Nature Biotech[自然生物技术],15:647-652,1997中所述,其关于挤出脂质制备的传授内容通过援引并入文中。
本文提供的方法和组合物可以包括通过足以减轻疾病、障碍和/或病症的症状的方案施用的药物组合物。在一些方面,本披露提供了通过施用如本文所述的组合物来递送治疗剂的方法。
调节基因表达
本披露进一步部分地涉及一种调节(例如,降低)靶基因表达的方法,所述方法包括提供表达阻遏物(或编码所述表达阻遏物的核酸,或包括所述表达阻遏物核酸的药物组合物)或本文所述的表达阻遏系统(或编码所述表达阻遏系统的核酸,或包括所述表达阻遏系统或核酸的药物组合物),以及使靶基因和/或可操作地连接的一个或多个转录控制元件与表达阻遏物或表达阻遏系统接触。在一些实施例中,调节,例如降低靶基因的表达,包括与在不存在表达阻遏物或表达阻遏系统的情况下的参考值,例如靶基因的转录相比,调节靶基因的转录。在一些实施例中,调节(例如,降低)靶基因表达的方法是离体使用的,例如在来自受试者(例如哺乳动物受试者,例如人受试者)的细胞上。在一些实施例中,调节(例如,降低)靶基因表达的方法是在体内使用的,例如在哺乳动物受试者(例如,人受试者)体内。在一些实施例中,调节(例如,降低)靶基因表达的方法是体外使用的,例如在本文所述的细胞或细胞系上。
本披露进一步部分地涉及治疗与受试者中靶基因过度表达相关的病症的方法,该方法包括对受试者施用本文所述的表达阻遏系统(或编码该系统的核酸,或包含所述表达阻遏系统或核酸的药物组合物)。与特定基因表达的过度表达相关的病症是本领域技术人员已知的。此类病症包括但不限于代谢障碍、神经肌肉障碍、癌症(例如,实体瘤)、纤维化、糖尿病、尿素障碍、免疫障碍、炎症和关节炎。
本披露进一步部分地涉及治疗与受试者中靶基因表达错误调控相关的病症的方法,该方法包括对受试者施用本文所述的表达阻遏系统(或编码该系统的核酸,或包含所述表达阻遏系统或核酸的药物组合物)。不希望受理论的束缚,认为表达阻遏系统可用于靶向调节靶基因表达的基因(例如,降低其表达),从而通过改变调节基因的表达来改变靶基因的表达。与特定基因表达的错误调控相关的病症是本领域技术人员已知的。此类病症包括但不限于代谢障碍、神经肌肉障碍、癌症(例如,实体瘤)、纤维化、糖尿病、尿素障碍、免疫障碍、炎症和关节炎。
本文提供的方法和组合物可以通过稳定或瞬时改变(例如,减少)靶基因的转录来治疗与靶基因的过度表达或错误调控相关的病症。在一些实施例中,这种调节持续至少约1小时至约30天,或至少约2小时、6小时、12小时、18小时、24小时、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、16天、17天、18天、19天、20天、21天、22天、23天、24天、25天、26天、27天、28天、29天、30天或更长时间或其间的任何时间。在一些实施例中,这种调节持续至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24小时,或至少1、2、3、4、5、6或7天,或至少1、2、3、4或5周,或至少1、2、3、4、5、6、7、8、9、10、11或12个月,或至少1、2、3、4或5年(例如,无限期地)。任选地,这种调节持续不超过10、9、8、7、6、5、4、3、2或1年。
在一些实施例中,本文提供的方法或组合物可使细胞中靶基因的表达相对于靶基因在未接触组合物或未用方法处理的细胞中的表达降低至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%(并且任选地高达100%)。
在一些实施例中,本文提供的方法可以通过破坏与靶基因相关联的基因组复合物(例如,锚序列介导的连接)来调节(例如,降低)所述靶基因的表达。与锚序列介导的连接相关联的基因可以至少部分地在连接内(即,在序列上位于第一和第二锚序列之间),或者它可以在连接的外部,因为它在序列上不位于第一和第二锚序列之间,而是位于同一染色体上,并且与至少第一或第二锚序列足够接近,使得它的表达可以通过控制锚序列介导的连接的拓扑结构来调节。本领域普通技术人员将理解,在一些实施例中,两个元件之间(例如,基因和锚序列介导的连接之间)的三维空间距离可能比碱基对方面的距离更相关。在一些实施例中,外部但相关联的基因位于第一或第二锚序列的2Mb内、1.9Mb内、1.8Mb内、1.7Mb内、1.6Mb内、1.5Mb内、1.4Mb内、1.3Mb内、1.3Mb内、1.2Mb内、1.1Mb内、1Mb内、900kb内、800kb内、700kb内、500kb内、400kb内、300kb内、200kb内、100kb内、50kb内、20kb内、10kb内或5kb内。
在一些实施例中,调节基因的表达包括改变转录控制序列对基因的可及性。转录控制序列,无论是锚序列介导的连接的内部还是外部,都可以是增强序列或沉默(或抑制)序列。
表观遗传修饰
本披露进一步部分地涉及一种对靶基因、可操作地连接至靶基因的转录控制元件或锚序列(例如,靶基因近侧的锚序列或与可操作地连接至靶基因的锚序列介导的连接相关联的锚序列)进行表观遗传修饰的方法,所述方法包括提供表达阻遏系统(例如,一个或多个表达阻遏物)或编码所述表达阻遏系统的核酸或包括所述表达阻遏系统或核酸的药物组合物;以及使靶基因或可操作地连接至靶基因的转录控制元件与表达阻遏系统接触,从而对靶基因或可操作地连接至靶基因的转录控制元件进行表观遗传修饰。
在一些实施例中,表观遗传学修饰靶基因或与靶基因可操作地连接的转录控制元件的方法包括增加或减少靶基因或与靶基因可操作地连接的转录控制元件的DNA甲基化。在一些实施例中,表观遗传学修饰靶基因或与靶基因可操作地连接的转录控制元件的方法包括增加或减少与靶基因或与靶基因可操作地连接的转录控制元件相关联的组蛋白的组蛋白甲基化。在一些实施例中,表观遗传学修饰靶基因或与靶基因可操作地连接的转录控制元件的方法包括减少与靶基因或与靶基因可操作地连接的转录控制元件相关联的组蛋白的组蛋白乙酰化。在一些实施例中,表观遗传学修饰靶基因或与靶基因可操作地连接的转录控制元件的方法包括增加或减少与靶基因或与靶基因可操作地连接的转录控制元件相关联的组蛋白的组蛋白苏素化。在一些实施例中,表观遗传学修饰靶基因或与靶基因可操作地连接的转录控制元件的方法包括增加或减少与靶基因或与靶基因可操作地连接的转录控制元件相关联的组蛋白的组蛋白磷酰化。
在一些实施例中,表观遗传学修饰靶基因或与靶基因可操作地连接的转录控制元件的方法可以相对于未被组合物接触或用该方法处理的细胞中该位点处的表观遗传修饰的水平,将表观遗传修饰的水平降低至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%(并且任选地,高达100%)。在一些实施例中,表观遗传学修饰靶基因或与靶基因可操作地连接的转录控制元件的方法可以相对于未被组合物接触或用该方法处理的细胞中该位点处的表观遗传修饰的水平,将表观遗传修饰的水平增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、120%、140%、160%、180%、200%、300%、400%、500%、600%、700%、800%、900%或1000%(并且任选地,高达200%、300%、400%、500%、600%、700%、800%、900%、1000%或2000%)。在一些实施例中,靶基因或与靶基因可操作地连接的转录控制元件的表观遗传修饰可以修饰靶基因的表达水平,例如,如本文所述。
在一些实施例中,通过本文所述方法产生的表观遗传修饰持续至少约1小时至约30天,或至少约2小时、6小时、12小时、18小时、24小时、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、15天、16天、17天、18天、19天、20天、21天、22天、23天、24天、25天、26天、27天、28天、29天、30天或更长时间或其间的任何时间。在一些实施例中,这种调节持续至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或24小时,或至少1、2、3、4、5、6或7天,或至少1、2、3、4或5周,或至少1、2、3、4、5、6、7、8、9、10、11或12个月,或至少1、2、3、4或5年(例如,无限期地)。任选地,这种调节持续不超过10、9、8、7、6、5、4、3、2或1年。
在一些实施例中,用于对靶基因或可操作地连接至靶基因的转录控制元件进行表观遗传修饰的方法中的表达阻遏系统包括表达阻遏物,所述表达阻遏物包括阻遏物结构域,所述阻遏物结构域是或包括表观遗传修饰部分。
例如,阻遏物结构域可以是或包括具有DNA甲基转移酶活性的表观遗传修饰部分,并且内源性或天然存在的靶序列(例如靶基因或转录控制元件)可以被改变成增加其甲基化(例如,减少转录因子与靶基因或转录控制元件的一部分的相互作用,减少成核蛋白与锚序列的结合,和/或中断或阻止锚序列介导的连接),或者被改变成降低其甲基化(例如,增加转录因子与靶基因或转录控制元件的一部分的相互作用,增加成核蛋白与锚序列的结合,和/或促进或增加锚序列介导的连接)。
试剂盒
本披露进一步部分地涉及包含本文所述的表达阻遏物或表达阻遏系统例如一个或多个表达阻遏物的试剂盒。在一些实施例中,试剂盒包含表达阻遏物或表达阻遏系统(例如,表达阻遏系统的一个或多个表达阻遏物)和使用所述表达阻遏物或表达阻遏系统的说明书。在一些实施例中,试剂盒包括编码表达阻遏物或表达阻遏系统或其组分(例如,表达阻遏系统的一个或多个表达阻遏物)的核酸和使用所述核酸和/或所述表达阻遏物或表达阻遏系统的说明书。在一些实施例中,试剂盒包含含有编码表达阻遏物或表达阻遏系统或其组分(例如,表达阻遏系统的一个或多个表达阻遏物)的核酸的细胞和使用所述细胞、核酸和/或所述表达阻遏系统的说明书。
在一些实施例中,试剂盒包括单位剂量的本文所述的表达阻遏物或表达阻遏系统(例如,一个或多个表达阻遏物),或单位剂量的编码本文所述的表达阻遏物或表达阻遏系统(例如,一个或多个表达阻遏物)的核酸,例如,载体。
在一些实施例中,该试剂盒进一步包括b)一套说明书,其包括至少一种用所述组合物治疗疾病或调节(例如,降低)靶基因在细胞内的表达的方法。在一些实施例中,试剂盒可以任选地包括用于所述组合物的递送媒剂(例如,脂质纳米颗粒)。试剂可以悬浮在赋形剂和/或递送媒剂中提供,或者可以作为单独的组分提供,该单独的组分随后可以与赋形剂和/或递送媒剂组合。在一些实施例中,试剂盒可以任选地包含另外的治疗剂以与组合物共同施用以影响期望的靶基因表达。虽然说明材料通常包括书面或印刷材料,但它们不限于此。任何能够存储此类说明并将它们传送给最终用户的介质都在考虑之列。此类介质包括但不限于电子存储介质(例如,磁盘、磁带、盒式磁带、芯片)、光学介质(例如,CD ROM)等。此类介质可能包括提供此类说明材料的互联网站点的地址。
在一些实施例中,试剂盒包括单位剂量的本文所述的表达阻遏物或表达阻遏系统(例如,一个或多个表达阻遏物),或单位剂量的编码本文所述的表达阻遏系统(例如,一个或多个表达阻遏物)的核酸,例如,载体。
提供以下实例以进一步说明本披露的一些实施例,但并非旨在限制本披露的范围;通过它们的示例性性质将理解,可以替换地使用本领域技术人员已知的其他程序、方法或技术。
实例
实例1:靶标选择和指导物设计
使用本披露的表达阻遏系统靶向β-2-微球蛋白(β2M)基因进行下调。使用了包含化脓性链球菌dCas9和KRAB结构域(Sp-dCas9-KRAB,对应于SEQ ID NO:91-93)的第一表达阻遏物和包含金黄色葡萄球菌dCas9和MQ1(Sa-dCas9-MQ1,对应于SEQ ID No:94-96)的第二表达阻遏物。指导RNA(包含对应于SEQ ID NO:1-5的靶结合序列)将每个表达阻遏物靶向β2M基因启动子区域的CpG低甲基化区域(图1),其中甲基化从0到1(0到100%),其中较高的甲基化由红色条表示。每个条代表CpG位点。蓝色指导物(GD-28228和GD-28229)用于靶向Sp-dCas9-KRAB,橙色指导物(GD-28171、GD-28172和GD-28173)用于使Sa-dCas9-MQ1靶向至β2M启动子区中的CpG岛。
实例2:使用一个或两个表达阻遏物的β2M表达阻遏
实例1的指导RNA用于将Sp-dCas9-KRAB表达阻遏物、Sa-dCas9-MQ1表达阻遏物或两者靶向β2M的启动子区域,并通过qPCR监测对β2M表达的影响。编码一个或多个表达阻遏物和一个或多个指导RNA的mRNA在脂质纳米颗粒(LNP)中被递送至细胞。
HepG2细胞以30,000个细胞/孔的密度接种在96孔板中的100μL RPMI(+10% FBS,+Penn/Strep)中。在使用0.125ug RNA(1:1mRNA:sgRNA,按重量计)/指导物进行处理之前,让细胞附着24小时。RNA由用COATSOME SS-OP可电离脂质(NOF美国公司(NOF America))配制的LNP递送。LNP由一种mRNA和一种指导物配制而成,但标有“共同配制”的样品除外,它们是用两种指导物制备的,保持相同的mRNA:指导物重量比。细胞与LNP一起孵育72小时,随后收获细胞用于通过qPCR进行β2M mRNA分析(图2),相对于未处理的对照细胞给出β2M mRNA水平。
靶向β2M启动子的dCas9单独不会降低β2M mRNA水平。数据显示,单独使用Sp-dCas9-KRAB或Sa-dCas9-MQ1会降低β2M mRNA水平,其中根据所使用的指导RNA,降低幅度因使用的指导RNA而有所不同。Sp-dCas9-KRAB和Sa-dCas9-MQ1一起在平均上比单独使用任一表达阻遏物更能降低β2M mRNA水平,降低幅度也因使用的一个或多个指导RNA而有所不同。使用包含一个或两个表达阻遏物的表达阻遏系统降低了靶基因的表达。包含两个表达阻遏物的表达阻遏系统似乎比单个表达阻遏物更能降低靶基因的表达。
实例3:跨剂量的和使用流式细胞术时的β2M表达阻遏
使用实例1的指导RNA(用于Sp-dCas9和Sp-dCas9-KRAB的GD-28228;用于Sa-dCas9-MQ1的GD-28172;或用于Sp-dCas9-KRAB和Sa-dCas9-MQ1的GD-28228和GD-28172)将Sp-dCas9-KRAB表达阻遏物、Sa-dCas9-MQ1表达阻遏物或两者靶向β2M的启动子区域,并通过qPCR以及还通过流式细胞仪监测对β2M表达的影响(使用荧光β2M来监测β2M蛋白水平)。编码一个或多个表达阻遏物和一个或多个指导RNA的mRNA以不同的剂量和配制品在LNP中被递送至细胞。
HepG2细胞以330,000个细胞/孔的密度接种在12孔板中的1.5mL RPMI(+10%FBS,+Penn/Strep)中。在1mL介质中使用1.25ug或2.5ug RNA(1:1mRNA:sgRNA,按重量计)/指导物进行处理之前,让细胞附着24小时。RNA由用COATSOME SS-OP可电离脂质(NOF美国公司(NOF America))配制的LNP递送。LNP由一种mRNA和一种指导物配制而成,但标有“共同配制”的样品除外,它们是用两种指导物制备的,保持相同的mRNA:指导物重量比。将细胞与LNP一起孵育72小时,然后收获细胞用于通过qPCR进行的FACS和mRNA分析。
如实施例2所示,靶向β2M启动子的dCas9单独不会降低β2M mRNA水平。单独的Sp-dCas9-KRAB或Sa-dCas9-MQ1,以及Sp-dCas9-KRAB和Sa-dCas9-MQ1一起降低了β2M mRNA水平(图3)。1.25ug/ml和2.5ug/ml剂量的表达阻遏物(单独或一起)都降低β2M mRNA水平,其中较高剂量的Sp-dCas9-KRAB似乎比较低剂量产生更大的降低。FACS对β2M蛋白水平的监测表明,经Sp-dCas9-KRAB或Sa-dCas9-MQ1处理的细胞显示出具有未处理水平的β2M蛋白的细胞群的减少,并且出现了具有降低的β2M蛋白水平的新细胞群。这些数据与实例2的数据一致,这表明:使用包括一个或两个表达阻遏物的表达阻遏系统可降低靶基因的表达,并且单独的表达阻遏物也降低靶基因编码的蛋白质的水平。
实例4:随时间的β2M表达阻遏
使用实例1的指导RNA(用于Sp-dCas9和Sp-dCas9-KRAB的GD-28228;用于Sa-dCas9-MQ1的GD-28172;或用于Sp-dCas9-KRAB和Sa-dCas9-MQ1的GD-28228和GD-28172)将Sp-dCas9-KRAB表达阻遏物、Sa-dCas9-MQ1表达阻遏物或两者靶向β2M的启动子区域,并通过qPCR监测对β2M表达的影响。在转染后的不同天数收集细胞以提取总RNA并探测表达变化。
将K562细胞接种在24孔板中,并用包含以下的基于MC3的LNP配制品进行转染:dCas9 mRNA与β2M靶向性指导RNA,Sp-dCas9-KRAB mRNA与β2M靶向性指导RNA,Sa-dCas9-MQ1 mRNA与β2M靶向性指导RNA,或Sp-dCas9-KRAB和Sa-dCas9-MQ1 mRNA与β2M靶向性指导RNA的混合物。在转染后的不同天数收集细胞以提取总RNA并探测β2M mRNA的表达变化(图4)。虚线表示随时间的平均未处理β2M mRNA水平(顶部)和转染后24小时的平均敲低β2MmRNA水平(底部)。
经22天,未转染的(蓝色线)和dCas9转染的(红色线)细胞不会改变β2M表达,而Sp-dCas9-KRAB(绿色线)转染的细胞在转染后的最初几天具有较低的β2M mRNA水平,第2天效果最大,但第5天后阻遏消失。Sa-dCas9-MQ1(紫色线)转染的细胞显示出对β2M mRNA水平的显著阻遏(到第4天时高达85%),并且阻遏得以保留,然后阻遏逐渐减弱,如图中测试期结束时保持在虚线正下的线所示。Sp-dCas9-KRAB和Sa-dCas9-MQ1联合转染(橙色线)没有比单独Sa-dCas9-MQ1(紫色线)观察到更多阻遏。
这些数据显示使用包含一个或两个表达阻遏物的表达阻遏系统降低靶基因的表达。单独的表达阻遏物(诸如包括MQ1的表达阻遏物)可以在延长的持续时间内阻遏靶基因的表达,并且包括多于一个表达阻遏物(例如,其中之一是包括MQ1的表达阻遏物)的表达阻遏系统也可以在延长的持续时间内阻遏靶基因的表达。
实例5:DNA甲基转移酶对启动子甲基化后B2M表达的持久阻遏
本实例证明了通过用含有各种DNMT的LNP和含有将dCas9融合物靶向B2M启动子区的指导物的LNP处理,B2M启动子区的甲基化导致B2M表达的持久阻遏。
K-562细胞以200,000个细胞/孔的密度接种在24孔板中的750μL生长培养基(RPMI+10% FBS+pen/strep)中。使用Precision NanoSystems NanoAssemblr Spark仪器在MC3脂质中配制编码效应子,dCas9-MQ1(SEQ ID NO:33)、dCas9-DNMT3a/3L(m)(“m”表示3a区域具有人序列但3L区域具有小鼠序列)(SEQ ID NO:36)、dCas9-DNMT3a/3L(h(“h”表示3a区域和3L区域都有人序列)(SEQ ID NO:35)、dCas9-DNMT1(SEQ ID NO:35)和dCas9-DNMT3B的mRNA。SEQ ID NO:21的单指导RNA(sgRNA)在同一仪器中以相同的脂质配制在不同的配制品中。母液LNP浓度为100μg/mL。用封装mRNA的LNP和封装sgRNA的LNP以1:1的比例(最终脂质浓度为1.25μg/mL)处理细胞,然后孵育。每个效应子和指导物组合一式四份转染。在转染后的不同时间点,取出200μL细胞并处理以提取总RNA并探测表达变化,并将200μL细胞移入550μL新鲜培养基中。该过程持续到初次转染后18天。使用RNeasy 96Plus试剂盒(凯杰)提取RNA,使用LunaScript RT SuperMix(新英格兰生物实验室)将其转化为cDNA,并使用带有TaqManTM Fast Advanced Master Mix的B2M特异性TaqMan引物/探针组测定(赛默飞世尔科技公司)进行RT-qPCR。数据显示为与使用ddCT方法的未转染对照相比的倍数变化。
结果显示,相对于未处理的样品,处理后4天,本实例中描述的所有构建体能够阻遏B2M表达,范围从约35%到60%(图5)。相对于未处理的样品,所有构建体在8天结束时都能阻遏B2M表达,范围从约15%到30%。在13天结束时,所有效应子都能阻遏B2M表达约45-55%,在18天结束时,相对于未处理的样品,所有效应子都能阻遏B2M表达约30-40%(图5)。
实例6:通过靶向K-562细胞中位于MYC基因上游的CTCF位点来下调MYC表达的持久
阻遏物或阻遏物系统的鉴定
本实例展示了通过靶向位于MYC基因上游的CTCF位点来下调MYC表达的单个表达阻遏物或表达阻遏系统的鉴定。
K-562细胞以1x 106个细胞/mL的密度在96孔板中的100μL生长培养基(RPMI+10%FBS+pen/strep)中生长。通过以1:1的比例混合GD-29639(SEQ ID NO:11)和GD-29640(SEQID NO:12)来制备sgRNA池。通过在每个孔中添加5μl表4中编码效应子或效应子组合的mRNA来准备阻遏母板。添加后,每个孔中存在17.5ng的每种mRNA或mRNA组合。铺板后,将母板冷冻保存直至转染的时间。
表4:测试的表达阻遏物或表达阻遏系统的列表
在转染之前,在每个孔中添加5μl sgRNA池,以便每个孔中存在8.75ng的每个sgRNA。效应子mRNA-sgRNA混合物用Opti-MEM培养基(赛默飞世尔公司(Thermo Fisher))稀释至每个孔中的总体积为40μl。LipofectamineTM MessengarMAXTM(赛默飞世尔公司)和Opti-MEM的转染母混合物使用0.3μL LipofectamineTM MessengarMAXTM/100ng总RNA的比率制备,如表5中所述。在即将转染之前,将35μL转染母混合物添加到每个含有RNA的孔中,使最终体积达到75μl,并在室温下孵育5分钟,用于转染K-562细胞。转染后,将细胞在37℃和5% CO2的标准培养箱中孵育。
表5
转染后24小时,每孔加入100μL新鲜培养基。样品采集在转染后48小时开始并持续到6天。在48小时、72小时和144小时时间点收集细胞悬浮液样品。每次取出样品进行分析时,加入等量的新鲜培养基并继续孵育。使用Plus 96试剂盒(凯杰公司)提取RNA,使用RT SuperMix(新英格兰生物实验室)将其转化为cDNA,并使用带有TaqmanTM Fast Advanced Master Mix的MYC特异性Taqman引物/探针组测定(赛默飞世尔科技公司)进行RT-qPCR。数据表示为与使用ddCT方法的dCas9处理的对照相比的倍数变化。未处理的和dCas9样品用作校准物。
实验显示,至少,用dCas9-DNMT3a/3L(h)、dCas9-KRAB,FOG1-dCas9-FOG1、G9A-dCas9+EZH2-dCas9、dCas9-MQ1+EZH2-dCas9-KRAB、dCas9-LSD1+G9A-dCas9、dCas9-MQ1+dCas9-HDAC8和dCas9-MQ1+G9A-dCas9-KRAB处理的细胞在48小时和/或72小时时间点显示MYC表达的阻遏(图6)。
实例7:通过靶向K-562细胞中β2M转录起始位点上游的区域来下调β2M表达的持久
阻遏物或阻遏系统的鉴定
本实例展示了通过靶向β2M启动子的上游区域来下调B2M表达的单个表达阻遏物或表达阻遏系统的鉴定。
K-562细胞以1x 106个细胞/mL的密度在96孔板中的100μL生长培养基(RPMI+10%FBS+pen/strep)中生长。通过以1:1的比例混合GD-27634(SEQ ID NO:13)和GD-29500(SEQID NO:14)来制备sgRNA池。按照实例6中描述的方案,使用表X中描述的效应子和sgRNA池混合物来转染细胞。在48小时、72小时、144小时、192小时和240小时时间点收集细胞悬浮液样品,并使用实例6中描述的方案进行处理。数据表示为与使用ddCT方法的dCas9处理的对照相比的倍数变化。未处理的和dCas9样品用作校准物。
数据显示,至少,用dCas9-HDAC8、dCas9-LSD1、dCas9-MQ1、FOG1-dCas9-FOG1、G9A-dCas9-KRAB、dCas9-DNMT3a/3L(h)、G9A-dCas9、EZH2-dCas9-KRAB、dCas9-KRAB、EZH2-dCas9-KRAB+dCas9-HDAC8、dCas9-LSD1+EZH2-dCas9-KRAB、dCas9-LSD1+dCas9-HDAC8、dCas9-KRAB+FOG1-dCas9-FOG1、dCas9-MQ1+G9A-dCas9-KRAB、G9A-dCas9+EZH2-dCas9、dCas9-MQ1+EZH2-dCas9-KRAB和dCas9-MQ1+dCas9-HDAC8处理的细胞在48小时、72小时和/或144小时时间点显示β2M表达的阻遏(图7)。
实例8:通过靶向K-562细胞中HSPA1B转录起始位点下游的区域来下调HSPA1B表达
的持久阻遏物或阻遏系统的鉴定
本实例展示了通过靶向HSPA1B启动子的下游区域来下调HSPA1B表达的单个表达阻遏物或表达阻遏系统的鉴定。
K-562细胞以1x106个细胞/mL的密度在96孔板中的100μL生长培养基(RPMI+10%FBS+pen/strep)中生长。通过以1:1的比例混合GD-29542(SEQ ID NO:17)和GD-29544(SEQID NO:18)来制备sgRNA池。按照实例6中描述的方案,使用表4中描述的效应子和sgRNA池混合物来转染细胞。在48小时、72小时和144小时时间点收集细胞悬浮液样品,并使用实例6中描述的方案进行处理。数据表示为与使用ddCT方法的dCas9处理的对照相比的倍数变化。未处理的和dCas9样品用作校准物。
数据显示,至少,用dCas9-HDAC8、EZH2-dCas9、dCas9-MQ1、dCas9-DNMT1、dCas9-DNMT3a/3L(h)、dCas9-DNMT3a/3L(m)、G9A-dCas9-KRAB、FOG1-dCas9-FOG1、G9A-dCas9、dCas9-KRAB、G9A-dCas9+dCas9-HDAC8、dCas9-LSD1+G9A-dCas9-KRAB、dCas9-LSD1+EZH2-dCas9、G9A-dCas9+EZH2-dCas9、dCas9-LSD1+EZH2-dCas9-KRAB、EZH2-dCas9+dCas9-HDAC8、dCas9-LSD1+dCas9-HDAC8、dCas9-MQ1+EZH2-dCas9-KRAB、dCas9-MQ1+dCas9-HDAC8、G9A-dCas9-KRAB+EZH2-dCas9-KRAB、dCas9-LSD1+G9A-dCas9和dCas9-MQ1+G9A-dCas9-KRAB处理的细胞在48小时、72小时和/或144小时时间点显示HSPA1B表达的阻遏(图8)。
实例9:下调K-562细胞中GATA1表达的持久阻遏物或阻遏系统的鉴定
本实例展示了下调K-562细胞中GATA1表达的单个表达阻遏物或表达阻遏系统的鉴定。
K-562细胞以1x106个细胞/mL的密度在96孔板中的100μL生长培养基(RPMI+10%FBS+pen/strep)中生长。通过以1:1的比例混合GD-29536(SEQ ID NO:19)和GD-29693(SEQID NO:20)来制备sgRNA池。按照实例6中描述的方案,使用表4中描述的效应子和sgRNA池混合物来转染细胞。在48小时、72小时和144小时时间点收集细胞悬浮液样品,并使用实例6中描述的方案进行处理。数据表示为与使用ddCT方法的dCas9处理的对照相比的倍数变化。未处理的和dCas9样品用作校准物。
数据显示,至少,用dCas9-HDAC8,dCas9-LSD1+dCas9-HDAC8,dCas9-MQ1+dCas9-HDAC8和G9A-dCas9+dCas9-HDAC8处理的细胞在48小时、72小时和/或144小时时间点时显示出GATA1表达的阻遏(图9)。
等同形式
应当理解,虽然已经结合其具体实施方式描述了本发明,但前述描述旨在说明而不是限制本发明的范围,本发明的范围由所附权利要求的范围来限定。一些方面、优点和修改在以下权利要求的范围内。
序列表
<110> 旗舰先锋创新V股份有限公司
<120> 抑制基因表达的组合物和方法
<130> O2057-7017WO
<140>
<141>
<150> 63/242,957
<151> 2021-09-10
<150> 63/082,555
<151> 2020-09-24
<160> 100
<170> PatentIn 3.5版
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 1
tctccttggt ggcccgccgt 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 2
gtcccaaagg cgcggcgctg 20
<210> 3
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 3
ccctgctccc cgccgaaagg g 21
<210> 4
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 4
ctctggctcc cccagcgcag c 21
<210> 5
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 5
gtgaacgcgt ggaggggcgc t 21
<210> 6
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 6
acggcgggcc accaaggaga 20
<210> 7
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 7
cagcgccgcg cctttgggac 20
<210> 8
<211> 21
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 8
ccctttcggc ggggagcagg g 21
<210> 9
<211> 21
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 9
gctgcgctgg gggagccaga g 21
<210> 10
<211> 21
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 10
agcgcccctc cacgcgttca c 21
<210> 11
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 11
agggtgatgt tcattagcag 20
<210> 12
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 12
tgcagaaggt ccgaagaaag 20
<210> 13
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 13
gagacaggtg acggtccctg 20
<210> 14
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 14
gagtctcgtg atgtttaaga 20
<210> 15
<211> 5533
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 15
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagtcgg 4260
gcgggggtgg ctcagtggac gtgctgagga gaaggaagga ctggaacgtg agactgcaag 4320
ccttcttcac cagcgacacc ggactggaat acgaggcccc taagctgtac cccgccattc 4380
ccgccgctag acgcagaccc attagagtgc tctctctgtt tgacggaatc gccaccggct 4440
atctggtgct gaaagagctg ggcatcaagg tgggcaaata cgtggccagc gaggtgtgcg 4500
aggagtctat cgccgtcgga accgtgaaac acgagggaaa catcaaatac gtgaacgacg 4560
tgaggaacat caccaagaaa aacatcgagg agtggggccc cttcgatctc gtgatcggcg 4620
gcagcccttg caacgatctc tccaatgtga accccgccag aaagggactg tacgagggca 4680
ccggcagact gttcttcgag ttctaccatc tgctgaacta cagcagaccc aaggagggcg 4740
acgacagacc cttcttctgg atgttcgaaa acgtggtcgc catgaaggtg ggcgataaga 4800
gggacatcag cagatttctg gagtgtaacc ccgtcatgat cgatgccatt aaggtcagcg 4860
ccgcccacag agctaggtac ttctggggaa atctgcccgg catgaataga cccgtgatcg 4920
cttccaagaa cgacaagctg gagctgcaag actgtctgga gtacaataga atcgctaagc 4980
tcaagaaggt ccagaccatc accacaaaat ccaacagcat caagcaaggc aagaaccagc 5040
tgttccccgt ggtcatgaac ggcaaggagg atgtgctctg gtgcaccgag ctggagagga 5100
tctttggctt ccccgtgcac tataccgatg tgtccaacat gggaagaggc gctagacaga 5160
aactgctggg aagaagctgg agcgtgcccg tgattagaca cctcttcgcc cctctgaagg 5220
attacttcgc ttgcgaggga ggtggcggat cgggaaagcg gcccgccgcc accaagaagg 5280
ccggtcaggc caagaagaag aagggcagct acccctacga cgtgcccgac tacgcctgag 5340
cggccgctta attaagctgc cttctgcggg gcttgccttc tggccatgcc cttcttctct 5400
cccttgcacc tgtacctctt ggtctttgaa taaagcctga gtaggaagtc tagaaaaaaa 5460
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5520
aaaaaaaaaa aaa 5533
<210> 16
<211> 1763
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 16
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Val Asp Val Leu
1400 1405 1410
Arg Arg Arg Lys Asp Trp Asn Val Arg Leu Gln Ala Phe Phe Thr
1415 1420 1425
Ser Asp Thr Gly Leu Glu Tyr Glu Ala Pro Lys Leu Tyr Pro Ala
1430 1435 1440
Ile Pro Ala Ala Arg Arg Arg Pro Ile Arg Val Leu Ser Leu Phe
1445 1450 1455
Asp Gly Ile Ala Thr Gly Tyr Leu Val Leu Lys Glu Leu Gly Ile
1460 1465 1470
Lys Val Gly Lys Tyr Val Ala Ser Glu Val Cys Glu Glu Ser Ile
1475 1480 1485
Ala Val Gly Thr Val Lys His Glu Gly Asn Ile Lys Tyr Val Asn
1490 1495 1500
Asp Val Arg Asn Ile Thr Lys Lys Asn Ile Glu Glu Trp Gly Pro
1505 1510 1515
Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Asn
1520 1525 1530
Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu
1535 1540 1545
Phe Phe Glu Phe Tyr His Leu Leu Asn Tyr Ser Arg Pro Lys Glu
1550 1555 1560
Gly Asp Asp Arg Pro Phe Phe Trp Met Phe Glu Asn Val Val Ala
1565 1570 1575
Met Lys Val Gly Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Cys
1580 1585 1590
Asn Pro Val Met Ile Asp Ala Ile Lys Val Ser Ala Ala His Arg
1595 1600 1605
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Val
1610 1615 1620
Ile Ala Ser Lys Asn Asp Lys Leu Glu Leu Gln Asp Cys Leu Glu
1625 1630 1635
Tyr Asn Arg Ile Ala Lys Leu Lys Lys Val Gln Thr Ile Thr Thr
1640 1645 1650
Lys Ser Asn Ser Ile Lys Gln Gly Lys Asn Gln Leu Phe Pro Val
1655 1660 1665
Val Met Asn Gly Lys Glu Asp Val Leu Trp Cys Thr Glu Leu Glu
1670 1675 1680
Arg Ile Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met
1685 1690 1695
Gly Arg Gly Ala Arg Gln Lys Leu Leu Gly Arg Ser Trp Ser Val
1700 1705 1710
Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Asp Tyr Phe Ala
1715 1720 1725
Cys Glu Gly Gly Gly Gly Ser Gly Lys Arg Pro Ala Ala Thr Lys
1730 1735 1740
Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp
1745 1750 1755
Val Pro Asp Tyr Ala
1760
<210> 17
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 17
cctgccctct gattggtcca 20
<210> 18
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 18
gcctcatcga gcttggtgat 20
<210> 19
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 19
ctgtggtgtc aaaagcacca 20
<210> 20
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 20
gaaccccaga agatgccagg 20
<210> 21
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
靶序列
<400> 21
ggcgcgcacc ccagatcgga 20
<210> 22
<211> 5704
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 22
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
agcggcccgc cgccaccaag aaggccggcc aggccaagaa gaagaaggcc cgggacagca 4260
aggtggagaa caagaccaag aagctgcggg tgttcgaggc cttcgccggc atcggcgccc 4320
agcggaaggc cctggagaag gtgcggaagg acgagtacga gatcgtgggc ctggccgagt 4380
ggtacgtgcc cgccatcgtg atgtaccagg ccatccacaa caacttccac accaagctgg 4440
agtacaagag cgtgagccgg gaggagatga tcgactacct ggagaacaag accctgagct 4500
ggaacagcaa gaaccccgtg agcaacggct actggaagcg gaagaaggac gacgagctga 4560
agatcatcta caacgccatc aagctgagcg agaaggaggg caacatcttc gacatccggg 4620
acctgtacaa gcggaccctg aagaacatcg acctgctgac ctacagcttc ccctgccagg 4680
acctgagcca gcagggcatc cagaagggca tgaagcgggg cagcggcacc cggagcggcc 4740
tgctgtggga gatcgagcgg gccctggaca gcaccgagaa gaacgacctg cccaagtacc 4800
tgctgatgga gaacgtgggc gccctgctgc acaagaagaa cgaggaggag ctgaaccagt 4860
ggaagcagaa gctggagagc ctgggctacc agaacagcat cgaggtgctg aacgccgccg 4920
acttcggcag cagccaggcc cggcggcggg tgttcatgat cagcaccctg aacgagttcg 4980
tggagctgcc caagggcgac aagaagccca agagcatcaa gaaggtgctg aacaagatcg 5040
tgagcgagaa ggacatcctg aacaacctgc tgaagtacaa cctgaccgag ttcaagaaaa 5100
ccaagagcaa catcaacaag gccagcctga tcggctacag caagttcaac agcgagggct 5160
acgtgtacga ccccgagttc accggcccca ccctgaccgc cagcggcgcc aacagccgga 5220
tcaagatcaa ggacggcagc aacatccgga agatgaacag cgacgagacc ttcctgtaca 5280
tcggcttcga cagccaggac ggcaagcggg tgaacgagat cgagttcctg accgagaacc 5340
agaagatctt cgtgtgcggc aacagcatca gcgtggaggt gctggaggcc atcatcgaca 5400
agatcggcgg ccccagcagc ggcggcaagc ggcccgccgc caccaagaag gccggccagg 5460
ccaagaagaa gaagggcagc tacccctacg acgtgcccga ctacgcctga gcggccgctt 5520
aattaagctg ccttctgcgg ggcttgcctt ctggccatgc ccttcttctc tcccttgcac 5580
ctgtacctct tggtctttga ataaagcctg agtaggaagt ctagaaaaaa aaaaaaaaaa 5640
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5700
aaaa 5704
<210> 23
<211> 6010
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 23
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagtcgg 4260
gcgggggtgg ctcagtggat ctgaggacac tcgacgtgtt tagcggatgc ggcggactct 4320
ccgaaggctt ccaccaagcc ggaatttccg acacactctg ggccattgag atgtgggacc 4380
ccgccgctca agccttcaga ctgaataatc ccggctccac cgtgttcacc gaggactgca 4440
acattctgct gaagctggtg atggctggcg aaaccaccaa ctctagaggc cagaggctgc 4500
cccagaaggg agatgtggaa atgctctgtg gaggccctcc ttgccaaggc ttctccggca 4560
tgaacaggtt caactctaga acatacagca agttcaagaa ctctctggtc gtgagctttc 4620
tgagctactg cgactactat agacctaggt tctttctgct ggagaacgtg agaaatttcg 4680
tgtccttcaa gaggagcatg gtgctgaagc tgacactgag gtgtctggtg aggatgggct 4740
accagtgcac attcggagtg ctgcaagctg gccagtacgg cgtggcccag accagaagga 4800
gggccatcat tctggctgct gcccccggcg agaaactccc tctgttcccc gagcccctcc 4860
acgtgttcgc ccctagagct tgccagctga gcgtggtggt cgacgataag aagttcgtga 4920
gcaacatcac aaggctgtcc agcggaccct tcagaaccat taccgtgagg gataccatgt 4980
ccgacctccc cgaggtgagg aatggcgcca gcgctctgga gatttcctac aacggcgaac 5040
ctcagagctg gttccaaagg cagctgagag gcgctcagta tcagcccatt ctgagggacc 5100
acatctgcaa agatatgagc gctctggtgg ccgctagaat gagacatatt cctctggccc 5160
ccggcagcga ctggagagat ctgcccaata ttgaggtgag actcagcgac ggaacaatgg 5220
ctagaaaact gaggtacacc catcatgata gaaagaacgg aaggagcagc agcggcgctc 5280
tgagaggagt gtgtagctgc gtggaagctg gcaaggcttg cgatcccgcc gctaggcagt 5340
tcaataccct catcccttgg tgtctgcctc acaccggcaa cagacacaat cattgggctg 5400
gactgtatgg aaggctcgaa tgggacggct ttttcagcac caccgtgacc aatcccgaac 5460
ctatgggcaa gcaaggaagg gtgctccacc ccgagcagca tagagtcgtg tccgtgagag 5520
aatgcgctag aagccaaggc ttccccgaca cctatagact gttcggcaac attctggata 5580
agcacagaca agtgggaaat gctgtccctc ctcctctggc caaggctatc ggactggaga 5640
tcaagctgtg tatgctcgcc aaagctaggg agagcgcttc cgccaagatt aaggaggagg 5700
aggccgccaa ggacggaggt ggcggatcgg gaaagcggcc cgccgccacc aagaaggccg 5760
gtcaggccaa gaagaagaag ggcagctacc cctacgacgt gcccgactac gcctgagcgg 5820
ccgcttaatt aagctgcctt ctgcggggct tgccttctgg ccatgccctt cttctctccc 5880
ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtctag aaaaaaaaaa 5940
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6000
aaaaaaaaaa 6010
<210> 24
<211> 6202
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 24
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
gcgccggcgg cggcggcagc ggcggcggcg gcagcggcgg cggcggcagc ggccccaaga 4260
agaagcggaa ggtggccgcc gccggcagca accacgacca ggagttcgac ccccccaagg 4320
tgtacccccc cgtgcccgcc gagaagcgga agcccatccg ggtgctgagc ctgttcgacg 4380
gcatcgccac cggcctgctg gtgctgaagg acctgggcat ccaggtggac cggtacatcg 4440
ccagcgaggt gtgcgaggac agcatcaccg tgggcatggt gcggcaccag ggcaagatca 4500
tgtacgtggg cgacgtgcgg agcgtgaccc agaagcacat ccaggagtgg ggccccttcg 4560
acctggtgat cggcggcagc ccctgcaacg acctgagcat cgtgaacccc gcccggaagg 4620
gcctgtacga gggcaccggc cggctgttct tcgagttcta ccggctgctg cacgacgccc 4680
ggcccaagga gggcgacgac cggcccttct tctggctgtt cgagaacgtg gtggccatgg 4740
gcgtgagcga caagcgggac atcagccggt tcctggagag caaccccgtg atgatcgacg 4800
ccaaggaggt gagcgccgcc caccgggccc ggtacttctg gggcaacctg cccggcatga 4860
accggcccct ggccagcacc gtgaacgaca agctggagct gcaggagtgc ctggagcacg 4920
gccggatcgc caagttcagc aaggtgcgga ccatcaccac ccggagcaac agcatcaagc 4980
agggcaagga ccagcacttc cccgtgttca tgaacgagaa ggaggacatc ctgtggtgca 5040
ccgagatgga gcgggtgttc ggcttccccg tgcactacac cgacgtgagc aacatgagcc 5100
ggctggcccg gcagcggctg ctgggccgga gctggagcgt gcccgtgatc cggcacctgt 5160
tcgcccccct gaaggagtac ttcgcctgcg tgagcagcgg caacagcaac gccaacagcc 5220
ggggccccag cttcagcagc ggcctggtgc ccctgagcct gcggggcagc cacatgaatc 5280
ctctggagat gttcgagaca gtgcccgtgt ggagaaggca acccgtgagg gtgctgagcc 5340
tcttcgagga cattaagaag gagctgacct ctctgggctt tctggaatcc ggcagcgacc 5400
ccggccagct gaaacacgtg gtggacgtga ccgacacagt gaggaaggac gtggaagagt 5460
ggggcccctt tgacctcgtg tatggagcca cacctcctct cggccacaca tgcgataggc 5520
ctcccagctg gtatctcttc cagttccaca gactgctcca gtacgccaga cctaagcccg 5580
gcagccccag acccttcttc tggatgttcg tggacaatct ggtgctgaac aaggaggatc 5640
tggatgtggc cagcagattt ctggagatgg aacccgtgac aatccccgac gtgcatggcg 5700
gctctctgca gaacgccgtg agagtgtggt ccaacatccc cgccattaga agcagacact 5760
gggctctggt gagcgaggag gaactgtctc tgctggccca gaataagcag tcctccaagc 5820
tggccgccaa gtggcccacc aagctggtga agaactgctt tctgcctctg agggagtatt 5880
tcaagtattt cagcaccgaa ctgaccagca gcctgagcgg cggcaagcgg cccgccgcca 5940
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 6000
acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 6060
ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 6120
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6180
aaaaaaaaaa aaaaaaaaaa aa 6202
<210> 25
<211> 6205
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 25
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
gcgccggcgg cggcggcagc ggcggcggcg gcagcggcgg cggcggcagc ggccccaaga 4260
agaagcggaa ggtggccgcc gccggcagca accacgacca ggagttcgac ccccccaagg 4320
tgtacccccc cgtgcccgcc gagaagcgga agcccatccg ggtgctgagc ctgttcgacg 4380
gcatcgccac cggcctgctg gtgctgaagg acctgggcat ccaggtggac cggtacatcg 4440
ccagcgaggt gtgcgaggac agcatcaccg tgggcatggt gcggcaccag ggcaagatca 4500
tgtacgtggg cgacgtgcgg agcgtgaccc agaagcacat ccaggagtgg ggccccttcg 4560
acctggtgat cggcggcagc ccctgcaacg acctgagcat cgtgaacccc gcccggaagg 4620
gcctgtacga gggcaccggc cggctgttct tcgagttcta ccggctgctg cacgacgccc 4680
ggcccaagga gggcgacgac cggcccttct tctggctgtt cgagaacgtg gtggccatgg 4740
gcgtgagcga caagcgggac atcagccggt tcctggagag caaccccgtg atgatcgacg 4800
ccaaggaggt gagcgccgcc caccgggccc ggtacttctg gggcaacctg cccggcatga 4860
accggcccct ggccagcacc gtgaacgaca agctggagct gcaggagtgc ctggagcacg 4920
gccggatcgc caagttcagc aaggtgcgga ccatcaccac ccggagcaac agcatcaagc 4980
agggcaagga ccagcacttc cccgtgttca tgaacgagaa ggaggacatc ctgtggtgca 5040
ccgagatgga gcgggtgttc ggcttccccg tgcactacac cgacgtgagc aacatgagcc 5100
ggctggcccg gcagcggctg ctgggccgga gctggagcgt gcccgtgatc cggcacctgt 5160
tcgcccccct gaaggagtac ttcgcctgcg tgagcagcgg caacagcaac gccaacagcc 5220
ggggccccag cttcagcagc ggcctggtgc ccctgagcct gcggggcagc cacatgggcc 5280
ccatggagat ctacaagacc gtgagcgcct ggaagcggca gcccgtgcgg gtgctgagcc 5340
tgttccggaa catcgacaag gtgctgaaat ccctgggctt cctggagagc ggcagcggca 5400
gcggcggcgg caccctgaag tacgtggagg acgtgaccaa cgtggtgcgg cgggacgtgg 5460
agaagtgggg ccccttcgac ctggtgtacg gcagcaccca gcccctgggc agcagctgcg 5520
accggtgccc cggctggtac atgttccagt tccaccggat cctgcagtac gccctgcccc 5580
ggcaggagag ccagcggccc ttcttctgga tcttcatgga caacctgctg ctgaccgagg 5640
acgaccagga gaccaccacc cggttcctgc agaccgaggc cgtgaccctg caggacgtgc 5700
ggggccggga ctaccagaac gccatgcggg tgtggagcaa catccccggc ctgaaatcca 5760
agcacgcccc cctgaccccc aaggaggagg agtacctgca ggcccaggtg cggagccgga 5820
gcaagctgga cgcccccaag gtggacctgc tggtgaagaa ctgcctgctg cccctgcggg 5880
agtacttcaa gtacttcagc cagaacagcc tgcccctgag cggcggcaag cggcccgccg 5940
ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 6000
actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 6060
cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 6120
tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6180
aaaaaaaaaa aaaaaaaaaa aaaaa 6205
<210> 26
<211> 5368
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 26
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaggaa 120
atagggctat cagaaccgag aagatcatct gtagggacgt ggctagaggc tacgagaacg 180
tgcccattcc ttgcgtgaat ggcgtggatg gcgaaccttg ccccgaggac tacaaataca 240
tctccgagaa ctgcgaaacc agcacaatga acatcgacag aaacatcacc cacctccagc 300
actgcacatg tgtggatgac tgctcctcca gcaactgtct gtgcggccag ctctccatca 360
gatgctggta cgacaaggac ggcagactgc tgcaagagtt caacaagatc gaaccccctc 420
tcatcttcga gtgtaaccaa gcttgcagct gctggagaaa ctgcaagaat agagtggtcc 480
agagcggcat caaggtgaga ctgcaactgt acagaaccgc caagatggga tggggagtga 540
gggctctgca aaccattccc caaggcacct tcatctgcga atacgtgggc gaactgatct 600
ccgacgccga agctgacgtg agagaggacg acagctatct cttcgatctg gacaataagg 660
acggcgaggt gtactgcatc gacgctagat attacggcaa catctctaga ttcatcaacc 720
acctctgcga tcccaacatc attcccgtga gggtgttcat gctgcaccaa gatctgaggt 780
tccctagaat cgccttcttc agctctagag acatcagaac cggcgaggag ctgggcttcg 840
attacggcga tagattctgg gacatcaagt ccaagtactt cacatgccag tgcggcagcg 900
agaagtgtaa gcacagcgct gaggccattg ctctggagca gtctagactg gccagactgg 960
atggaggtgg cggatcggga gacaagaagt acagcatcgg cctggccatc ggcaccaaca 1020
gcgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaag ttcaaggtgc 1080
tgggcaacac cgaccggcac agcatcaaga agaacctgat cggcgccctg ctgttcgaca 1140
gcggcgagac cgccgaggcc acccggctga agcggaccgc ccggcggcgg tacacccggc 1200
ggaagaaccg gatctgctac ctgcaggaga tcttcagcaa cgagatggcc aaggtggacg 1260
acagcttctt ccaccggctg gaggagagct tcctggtgga ggaggacaag aagcacgagc 1320
ggcaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag taccccacca 1380
tctaccacct gcggaagaag ctggtggaca gcaccgacaa ggccgacctg cggctgatct 1440
acctggccct ggcccacatg atcaagttcc ggggccactt cctgatcgag ggcgacctga 1500
accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc tacaaccagc 1560
tgttcgagga gaaccccatc aacgccagcg gcgtggacgc caaggccatc ctgagcgccc 1620
ggctgagcaa gagccggcgg ctggagaacc tgatcgccca gctgcccggc gagaagaaga 1680
acggcctgtt cggcaacctg atcgccctga gcctgggcct gacccccaac ttcaagagca 1740
acttcgacct ggccgaggac gccaagctgc agctgagcaa ggacacctac gacgacgacc 1800
tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg gccgccaaga 1860
acctgagcga cgccatcctg ctgagcgaca tcctgcgggt gaacaccgag atcaccaagg 1920
cccccctgag cgccagcatg atcaagcggt acgacgagca ccaccaggac ctgaccctgc 1980
tgaaggccct ggtgcggcag cagctgcccg agaagtacaa ggagatcttc ttcgaccaga 2040
gcaagaacgg ctacgccggc tacatcgacg gcggcgccag ccaggaggag ttctacaagt 2100
tcatcaagcc catcctggag aagatggacg gcaccgagga gctgctggtg aagctgaacc 2160
gggaggacct gctgcggaag cagcggacct tcgacaacgg cagcatcccc caccagatcc 2220
acctgggcga gctgcacgcc atcctgcggc ggcaggagga cttctacccc ttcctgaagg 2280
acaaccggga gaagatcgag aagatcctga ccttccggat cccctactac gtgggccccc 2340
tggcccgggg caacagccgg ttcgcctgga tgacccggaa atccgaggag accatcaccc 2400
cctggaactt cgaggaggtg gtggacaagg gcgccagcgc ccagagcttc atcgagcgga 2460
tgaccaactt cgacaagaac ctgcccaacg agaaggtgct gcccaagcac agcctgctgt 2520
acgagtactt caccgtgtac aacgagctga ccaaggtgaa gtacgtgacc gagggcatgc 2580
ggaagcccgc cttcctgagc ggcgagcaga agaaggccat cgtggacctg ctgttcaaga 2640
ccaaccggaa ggtgaccgtg aagcagctga aggaggacta cttcaagaag atcgagtgct 2700
tcgacagcgt ggagatcagc ggcgtggagg accggttcaa cgccagcctg ggcacctacc 2760
acgacctgct gaagatcatc aaggacaagg acttcctgga caacgaggag aacgaggaca 2820
tcctggagga catcgtgctg accctgaccc tgttcgagga ccgggagatg atcgaggagc 2880
ggctgaaaac ctacgcccac ctgttcgacg acaaggtgat gaagcagctg aagcggcggc 2940
ggtacaccgg ctggggccgg ctgagccgga agctgatcaa cggcatccgg gacaagcaga 3000
gcggcaagac catcctggac ttcctgaaat ccgacggctt cgccaaccgg aacttcatgc 3060
agctgatcca cgacgacagc ctgaccttca aggaggacat ccagaaggcc caggtgagcg 3120
gccagggcga cagcctgcac gagcacatcg ccaacctggc cggcagcccc gccatcaaga 3180
agggcatcct gcagaccgtg aaggtggtgg acgagctggt gaaggtgatg ggccggcaca 3240
agcccgagaa catcgtgatc gagatggccc gggagaacca gaccacccag aagggccaga 3300
agaacagccg ggagcggatg aagcggatcg aggagggcat caaggagctg ggcagccaga 3360
tcctgaagga gcaccccgtg gagaacaccc agctgcagaa cgagaagctg tacctgtact 3420
acctgcagaa cggccgggac atgtacgtgg accaggagct ggacatcaac cggctgagcg 3480
actacgacgt ggccgccatc gtgccccaga gcttcctgaa ggacgacagc atcgacaaca 3540
aggtgctgac ccggagcgac aaggcccggg gcaagagcga caacgtgccc agcgaggagg 3600
tggtgaagaa gatgaagaac tactggcggc agctgctgaa cgccaagctg atcacccagc 3660
ggaagttcga caacctgacc aaggccgagc ggggcggcct gagcgagctg gacaaggccg 3720
gcttcatcaa gcggcagctg gtggagaccc ggcagatcac caagcacgtg gcccagatcc 3780
tggacagccg gatgaacacc aagtacgacg agaacgacaa gctgatccgg gaggtgaagg 3840
tgatcaccct gaaatccaag ctggtgagcg acttccggaa ggacttccag ttctacaagg 3900
tgcgggagat caacaactac caccacgccc acgacgccta cctgaacgcc gtggtgggca 3960
ccgccctgat caagaagtac cccaagctgg agagcgagtt cgtgtacggc gactacaagg 4020
tgtacgacgt gcggaagatg atcgccaaga gcgagcagga gatcggcaag gccaccgcca 4080
agtacttctt ctacagcaac atcatgaact tcttcaagac cgagatcacc ctggccaacg 4140
gcgagatccg gaagcggccc ctgatcgaga ccaacggcga gaccggcgag atcgtgtggg 4200
acaagggccg ggacttcgcc accgtgcgga aggtgctgag catgccccag gtgaacatcg 4260
tgaagaaaac cgaggtgcag accggcggct tcagcaagga gagcatcctg cccaagcgga 4320
acagcgacaa gctgatcgcc cggaagaagg actgggaccc caagaagtac ggcggcttcg 4380
acagccccac cgtggcctac agcgtgctgg tggtggccaa ggtggagaag ggcaagagca 4440
agaagctgaa atccgtgaag gagctgctgg gcatcaccat catggagcgg agcagcttcg 4500
agaagaaccc catcgacttc ctggaggcca agggctacaa ggaggtgaag aaggacctga 4560
tcatcaagct gcccaagtac agcctgttcg agctggagaa cggccggaag cggatgctgg 4620
ccagcgccgg cgagctgcag aagggcaacg agctggccct gcccagcaag tacgtgaact 4680
tcctgtacct ggccagccac tacgagaagc tgaagggcag ccccgaggac aacgagcaga 4740
agcagctgtt cgtggagcag cacaagcact acctggacga gatcatcgag cagatcagcg 4800
agttcagcaa gcgggtgatc ctggccgacg ccaacctgga caaggtgctg agcgcctaca 4860
acaagcaccg ggacaagccc atccgggagc aggccgagaa catcatccac ctgttcaccc 4920
tgaccaacct gggcgccccc gccgccttca agtacttcga caccaccatc gaccggaagc 4980
ggtacaccag caccaaggag gtgctggacg ccaccctgat ccaccagagc atcaccggcc 5040
tgtacgagac ccggatcgac ctgagccagc tgggcggcga cagcggcggc aagcggcccg 5100
ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 5160
ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg ccttctggcc 5220
atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag cctgagtagg 5280
aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5340
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 5368
<210> 27
<211> 5698
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 27
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagtcgg 4260
gcgggggtgg ctcagaggag cccgaggagc ccgccgatag cggacaatct ctggtgcccg 4320
tctacatcta cagccccgaa tatgtgagca tgtgtgattc cctcgccaag atccctaaga 4380
gagccagcat ggtgcattct ctgatcgagg cctacgctct gcataagcaa atgaggatcg 4440
tgaagcccaa ggtcgccagc atggaagaga tggccacctt tcacaccgat gcctacctcc 4500
aacatctcca gaaggtgtcc caagagggcg acgacgacca ccccgactcc attgagtacg 4560
gactgggcta tgattgcccc gccaccgagg gcatctttga ctatgccgcc gctatcggcg 4620
gagctaccat cacagccgcc cagtgtctga ttgatggcat gtgcaaggtc gccatcaact 4680
ggtccggagg ctggcatcat gccaagaagg atgaggcctc cggcttctgt tatctgaatg 4740
acgccgtgct gggcattctg agactgagga ggaaattcga gaggattctg tacgtggatc 4800
tggatctgca tcacggagat ggagtcgaag atgccttcag cttcaccagc aaggtgatga 4860
cagtctctct gcacaagttc tcccccggct tctttcccgg aaccggcgac gtgtccgacg 4920
tgggactggg caagggaagg tactacagcg tgaacgtgcc cattcaagac ggcatccaag 4980
acgagaagta ctaccagatc tgcgagtccg tgctcaagga ggtctaccaa gccttcaatc 5040
ctaaggctgt cgtgctccaa ctgggagctg ataccattgc tggcgatccc atgtgcagct 5100
tcaatatgac acccgtcgga atcggcaagt gcctcaagta catcctccag tggcagctcg 5160
ccaccctcat tctcggagga ggcggataca atctggctaa taccgccaga tgctggacct 5220
atctgaccgg cgtgattctg ggcaaaacac tgagcagcga aatccccgac cacgagtttt 5280
tcaccgctta cggccccgac tacgtgctgg agatcacccc cagctgcaga cccgatagaa 5340
acgaacccca tagaatccag caaattctga actatatcaa gggcaacctc aagcacgtcg 5400
tgggaggtgg cggatcggga aagcggcccg ccgccaccaa gaaggccggt caggccaaga 5460
agaagaaggg cagctacccc tacgacgtgc ccgactacgc ctgagcggcc gcttaattaa 5520
gctgccttct gcggggcttg ccttctggcc atgcccttct tctctccctt gcacctgtac 5580
ctcttggtct ttgaataaag cctgagtagg aagtctagaa aaaaaaaaaa aaaaaaaaaa 5640
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 5698
<210> 28
<211> 7114
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 28
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaaggaga 4260
gcggcggcgg cagcctctcc ggaaagaaag ccgccgctgc cgctgccgcc gctgctgctg 4320
ccgctaccgg cacagaagct ggccccggaa cagctggcgg aagcgaaaac ggaagcgaag 4380
tggctgccca gcccgccgga ctgtccggac ccgccgaggt gggacccggc gctgtcggcg 4440
aaaggacccc cagaaaaaag gagcctccta gagccagccc tcccggcgga ctcgccgaac 4500
ctcccggcag cgctggacct caagccggac ctacagtggt gcccggcagc gctacaccta 4560
tggagaccgg catcgctgag acccccgagg gaaggagaac cagcagaagg aagagagcca 4620
aggtggagta cagagagatg gatgagtctc tggctaacct cagcgaggac gagtactact 4680
ccgaggagga aaggaatgcc aaggccgaga aggagaagaa gctgccccct cctccccctc 4740
aagccccccc cgaggaggag aacgagtccg agcccgagga acccagcgga gtggaaggag 4800
ccgcctttca gtccagactg ccccacgaca gaatgacatc ccaagaggcc gcttgctttc 4860
ccgacattat ttccggccct cagcagaccc agaaggtgtt tctgttcatt agaaatagaa 4920
cactccagct gtggctcgac aaccccaaga tccagctgac cttcgaggct accctccaac 4980
agctggaggc cccctacaat agcgataccg tgctggtgca cagagtgcac agctatctgg 5040
agaggcacgg cctcattaac ttcggcattt acaagcggat caagcccctg cccaccaaga 5100
aaacaggcaa ggtgatcatc atcggcagcg gcgtgagcgg cctggccgcc gcccggcagc 5160
tgcagagctt cggcatggac gtgaccctgc tggaggcccg ggaccgggtg ggcggccggg 5220
tggccacctt ccggaagggc aactacgtgg ccgacctggg cgccatggtg gtgaccggcc 5280
tgggcggcaa ccccatggcc gtggtgagca agcaggtgaa catggagctg gccaagatca 5340
agcagaagtg ccccctgtac gaggccaacg gccaggccgt gcccaaggag aaggacgaga 5400
tggtggagca ggagttcaac cggctgctgg aggccaccag ctacctgagc caccagctgg 5460
acttcaacgt gctgaacaac aagcacgtga gcctgggcca ggccctggag gtggtgatcc 5520
agctgcagga gaagcacgtg aaggacgagc agatcgagca ctggaagaag atcgtgaaaa 5580
cacaggagga gctgaaggag ctgctgaaca agatggtgaa cctgaaggag aagatcaagg 5640
agctgcacca gcagtacaag gaggccagcg aggtgaagcc cccccgggac atcaccgccg 5700
agttcctggt caaaagcaag caccgggacc tgaccgccct gtgcaaggag tacgacgagc 5760
tggccgagac ccagggcaag ctggaggaga agctgcagga gctggaggcc aaccccccca 5820
gcgacgtgta cctgagcagc cgggaccggc agatcctgga ctggcacttc gccaacctgg 5880
agttcgccaa cgccaccccc ctgagcaccc tgagcctgaa gcactgggac caggacgacg 5940
acttcgagtt caccggcagc cacctgaccg tgcggaacgg ctacagctgc gtgcccgtgg 6000
ccctggccga gggcctggac atcaagctga acaccgccgt gcggcaggtg cggtacaccg 6060
ccagcggctg cgaggtgatc gccgtgaaca cccggagcac cagccagacc ttcatctaca 6120
agtgcgacgc cgtgctgtgc accctgcccc tgggcgtgct gaagcagcag ccccccgccg 6180
tgcagttcgt gccccccctg cccgagtgga aaacaagcgc cgtgcagcgg atgggcttcg 6240
gcaacctgaa caaggtggtg ctgtgcttcg accgggtgtt ctgggacccc agcgtgaacc 6300
tgttcggcca cgtgggcagc accaccgcca gccggggcga gctgttcctg ttctggaacc 6360
tgtacaaggc ccccatcctg ctggccctgg tggccggcga ggccgccggc atcatggaga 6420
acatcagcga cgacgtgatc gtgggccggt gcctggccat cctgaagggc atcttcggca 6480
gcagcgccgt gccccagccc aaggagaccg tggtgagccg gtggcgggcc gacccctggg 6540
cccggggcag ctacagctac gtggccgccg gcagcagcgg caacgactac gacctgatgg 6600
cccagcccat cacccccggc cccagcatcc ccggcgcccc ccagcccatc ccccggctgt 6660
tcttcgccgg cgagcacacc atccggaact accccgccac cgtgcacggc gccctgctga 6720
gcggcctgcg ggaggcagga cggatcgccg accagttcct gggcgccatg tacaccctgc 6780
cccggcaggc cacccccggc gtgcccgccc agcagagccc cagcatgagc ggcggcaagc 6840
ggcccgccgc caccaagaag gccggccagg ccaagaagaa gaagggcagc tacccctacg 6900
acgtgcccga ctacgcctga gcggccgctt aattaagctg ccttctgcgg ggcttgcctt 6960
ctggccatgc ccttcttctc tcccttgcac ctgtacctct tggtctttga ataaagcctg 7020
agtaggaagt ctagaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7080
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 7114
<210> 29
<211> 6775
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 29
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgtgtg ctggcggaag cgggtgaaga gcgagtacat gcggctgcgg cagctgaagc 180
ggttccggcg ggccgacgag gtgaagagca tgttcagcag caaccggcag aagatcctgg 240
agcggaccga gatcctgaac caggagtgga agcagcggcg aatccagccc gtgcacatcc 300
tgaccagcgt gagcagcctg cggggcaccc gggagtgcag cgtgaccagc gacctggact 360
tccccaccca ggtgatcccc ctaaagaccc tgaacgccgt ggccagcgtg cccatcatgt 420
acagctggag ccccctgcag cagaacttca tggtggagga cgagaccgtg ctgcacaaca 480
tcccctacat gggcgacgag gtgctggacc aggacggcac cttcatcgag gagctgatca 540
agaactacga cggcaaggtg cacggcgacc gggagtgcgg cttcatcaac gacgagatct 600
tcgtggagct ggtgaacgcc ctgggccagt acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggacctgga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag ttccccagcg acaagatctt cgaggccatc agcagcatgt 780
tccccgacaa gggcaccgcc gaggagctga aggagaagta caaggagctg accgagcagc 840
agctgcccgg cgccctgccc cccgagtgca cccccaacat cgacggcccc aacgccaaga 900
gcgtgcagcg ggagcagagc ctgcacagct tccacaccct gttctgccgg cggtgcttca 960
agtacgactg cttcctgcac cccttccacg ccacccccaa cacctacaag cggaagaaca 1020
ccgagaccgc cctggacaac aagccctgcg gcccccagtg ctaccagcac ctggagggcg 1080
ccaaggagtt cgccgccgcc ctgaccgccg agcggatcaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg ctgcccaaca acagcagccg gcccagcacc cccaccatca 1200
acgtgctgga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggtg ccagaccccc atcaagatga agcccaacat cgagcccccc gagaacgtgg 1380
agtggagcgg cgccgaggcc agcatgttcc gggtgctgat cggcacctac tacgacaact 1440
tctgcgccat cgcccggctg atcggcacca agacctgccg gcaggtgtac gagttccggg 1500
tgaaggagag cagcatcatc gcccccgccc ccgccgagga cgtggacacc cccccccgga 1560
agaagaagcg gaagcaccgg ctgtgggccg cccactgccg gaagatccag ctgaagaagg 1620
acggcagcag caaccacgtg tacaactacc agccctgcga ccacccccgg cagccctgcg 1680
acagcagctg cccctgcgtg atcgcccaga acttctgcga gaagttctgc cagtgcagca 1740
gcgagtgcca gaaccggttc cccggctgcc ggtgcaaggc ccagtgcaac accaagcagt 1800
gcccctgcta cctggccgtg cgggagtgcg accccgacct gtgcctgacc tgcggcgccg 1860
ccgaccactg ggacagcaag aacgtgagct gcaagaactg cagcatccag cggggcagca 1920
agaagcacct gctgctggcc cccagcgacg tggccggctg gggcatcttc atcaaggacc 1980
ccgtgcagaa gaacgagttc atcagcgagt actgcggcga gatcatcagc caggacgagg 2040
ccgaccggcg gggcaaggtg tacgacaagt acatgtgcag cttcctgttc aacctgaaca 2100
acgacttcgt ggtggacgcc acccggaagg gcaacaagat ccggttcgcc aaccacagcg 2160
tgaaccccaa ctgctacgcc aaggtgatga tggtgaacgg cgaccaccgg atcggcatct 2220
tcgccaagcg ggccatccag accggcgagg agctgttctt cgactaccgg tacagccagg 2280
ccgacgccct gaagtacgtg ggcatcgagc gggagatgga gatccccagc accggcggca 2340
gcggcggcag cggcggcagc ggcggcagcg gcggcagcgg ccgacccgac aagaagtaca 2400
gcatcggcct ggccatcggc accaacagcg tgggctgggc cgtgatcacc gacgagtaca 2460
aggtgcccag caagaagttc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga 2520
acctgatcgg cgccctgctg ttcgacagcg gcgagaccgc cgaggccacc cggctgaagc 2580
ggaccgcccg gcggcggtac acccggcgga agaaccggat ctgctacctg caggagatct 2640
tcagcaacga gatggccaag gtggacgaca gcttcttcca ccggctggag gagagcttcc 2700
tggtggagga ggacaagaag cacgagcggc accccatctt cggcaacatc gtggacgagg 2760
tggcctacca cgagaagtac cccaccatct accacctgcg gaagaagctg gtggacagca 2820
ccgacaaggc cgacctgcgg ctgatctacc tggccctggc ccacatgatc aagttccggg 2880
gccacttcct gatcgagggc gacctgaacc ccgacaacag cgacgtggac aagctgttca 2940
tccagctggt gcagacctac aaccagctgt tcgaggagaa ccccatcaac gccagcggcg 3000
tggacgccaa ggccatcctg agcgcccggc tgagcaagag ccggcggctg gagaacctga 3060
tcgcccagct gcccggcgag aagaagaacg gcctgttcgg caacctgatc gccctgagcc 3120
tgggcctgac ccccaacttc aagagcaact tcgacctggc cgaggacgcc aagctgcagc 3180
tgagcaagga cacctacgac gacgacctgg acaacctgct ggcccagatc ggcgaccagt 3240
acgccgacct gttcctggcc gccaagaacc tgagcgacgc catcctgctg agcgacatcc 3300
tgcgggtgaa caccgagatc accaaggccc ccctgagcgc cagcatgatc aagcggtacg 3360
acgagcacca ccaggacctg accctgctga aggccctggt gcggcagcag ctgcccgaga 3420
agtacaagga gatcttcttc gaccagagca agaacggcta cgccggctac atcgacggcg 3480
gcgccagcca ggaggagttc tacaagttca tcaagcccat cctggagaag atggacggca 3540
ccgaggagct gctggtgaag ctgaaccggg aggacctgct gcggaagcag cggaccttcg 3600
acaacggcag catcccccac cagatccacc tgggcgagct gcacgccatc ctgcggcggc 3660
aggaggactt ctaccccttc ctgaaggaca accgggagaa gatcgagaag atcctgacct 3720
tccggatccc ctactacgtg ggccccctgg cccggggcaa cagccggttc gcctggatga 3780
cccggaaatc cgaggagacc atcaccccct ggaacttcga ggaggtggtg gacaagggcg 3840
ccagcgccca gagcttcatc gagcggatga ccaacttcga caagaacctg cccaacgaga 3900
aggtgctgcc caagcacagc ctgctgtacg agtacttcac cgtgtacaac gagctgacca 3960
aggtgaagta cgtgaccgag ggcatgcgga agcccgcctt cctgagcggc gagcagaaga 4020
aggccatcgt ggacctgctg ttcaagacca accggaaggt gaccgtgaag cagctgaagg 4080
aggactactt caagaagatc gagtgcttcg acagcgtgga gatcagcggc gtggaggacc 4140
ggttcaacgc cagcctgggc acctaccacg acctgctgaa gatcatcaag gacaaggact 4200
tcctggacaa cgaggagaac gaggacatcc tggaggacat cgtgctgacc ctgaccctgt 4260
tcgaggaccg ggagatgatc gaggagcggc tgaaaaccta cgcccacctg ttcgacgaca 4320
aggtgatgaa gcagctgaag cggcggcggt acaccggctg gggccggctg agccggaagc 4380
tgatcaacgg catccgggac aagcagagcg gcaagaccat cctggacttc ctgaaatccg 4440
acggcttcgc caaccggaac ttcatgcagc tgatccacga cgacagcctg accttcaagg 4500
aggacatcca gaaggcccag gtgagcggcc agggcgacag cctgcacgag cacatcgcca 4560
acctggccgg cagccccgcc atcaagaagg gcatcctgca gaccgtgaag gtggtggacg 4620
agctggtgaa ggtgatgggc cggcacaagc ccgagaacat cgtgatcgag atggcccggg 4680
agaaccagac cacccagaag ggccagaaga acagccggga gcggatgaag cggatcgagg 4740
agggcatcaa ggagctgggc agccagatcc tgaaggagca ccccgtggag aacacccagc 4800
tgcagaacga gaagctgtac ctgtactacc tgcagaacgg ccgggacatg tacgtggacc 4860
aggagctgga catcaaccgg ctgagcgact acgacgtggc cgccatcgtg ccccagagct 4920
tcctgaagga cgacagcatc gacaacaagg tgctgacccg gagcgacaag gcccggggca 4980
agagcgacaa cgtgcccagc gaggaggtgg tgaagaagat gaagaactac tggcggcagc 5040
tgctgaacgc caagctgatc acccagcgga agttcgacaa cctgaccaag gccgagcggg 5100
gcggcctgag cgagctggac aaggccggct tcatcaagcg gcagctggtg gagacccggc 5160
agatcaccaa gcacgtggcc cagatcctgg acagccggat gaacaccaag tacgacgaga 5220
acgacaagct gatccgggag gtgaaggtga tcaccctgaa atccaagctg gtgagcgact 5280
tccggaagga cttccagttc tacaaggtgc gggagatcaa caactaccac cacgcccacg 5340
acgcctacct gaacgccgtg gtgggcaccg ccctgatcaa gaagtacccc aagctggaga 5400
gcgagttcgt gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc gccaagagcg 5460
agcaggagat cggcaaggcc accgccaagt acttcttcta cagcaacatc atgaacttct 5520
tcaagaccga gatcaccctg gccaacggcg agatccggaa gcggcccctg atcgagacca 5580
acggcgagac cggcgagatc gtgtgggaca agggccggga cttcgccacc gtgcggaagg 5640
tgctgagcat gccccaggtg aacatcgtga agaaaaccga ggtgcagacc ggcggcttca 5700
gcaaggagag catcctgccc aagcggaaca gcgacaagct gatcgcccgg aagaaggact 5760
gggaccccaa gaagtacggc ggcttcgaca gccccaccgt ggcctacagc gtgctggtgg 5820
tggccaaggt ggagaagggc aagagcaaga agctgaaatc cgtgaaggag ctgctgggca 5880
tcaccatcat ggagcggagc agcttcgaga agaaccccat cgacttcctg gaggccaagg 5940
gctacaagga ggtgaagaag gacctgatca tcaagctgcc caagtacagc ctgttcgagc 6000
tggagaacgg ccggaagcgg atgctggcca gcgccggcga gctgcagaag ggcaacgagc 6060
tggccctgcc cagcaagtac gtgaacttcc tgtacctggc cagccactac gagaagctga 6120
agggcagccc cgaggacaac gagcagaagc agctgttcgt ggagcagcac aagcactacc 6180
tggacgagat catcgagcag atcagcgagt tcagcaagcg ggtgatcctg gccgacgcca 6240
acctggacaa ggtgctgagc gcctacaaca agcaccggga caagcccatc cgggagcagg 6300
ccgagaacat catccacctg ttcaccctga ccaacctggg cgcccccgcc gccttcaagt 6360
acttcgacac caccatcgac cggaagcggt acaccagcac caaggaggtg ctggacgcca 6420
ccctgatcca ccagagcatc accggcctgt acgagacccg gatcgacctg agccagctgg 6480
gcggcgacag cggcggcaag cggcccgccg ccaccaagaa ggccggccag gccaagaaga 6540
agaagggcag ctacccctac gacgtgcccg actacgcctg agcggccgct taattaagct 6600
gccttctgcg gggcttgcct tctggccatg cccttcttct ctcccttgca cctgtacctc 6660
ttggtctttg aataaagcct gagtaggaag tctagaaaaa aaaaaaaaaa aaaaaaaaaa 6720
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 6775
<210> 30
<211> 7147
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 30
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcggc agcggcggca gcggccagac cggcaagaag agcgagaagg 120
gccccgtgtg ctggcggaag cgggtgaaga gcgagtacat gcggctgcgg cagctgaagc 180
ggttccggcg ggccgacgag gtgaagagca tgttcagcag caaccggcag aagatcctgg 240
agcggaccga gatcctgaac caggagtgga agcagcggcg aatccagccc gtgcacatcc 300
tgaccagcgt gagcagcctg cggggcaccc gggagtgcag cgtgaccagc gacctggact 360
tccccaccca ggtgatcccc ctaaagaccc tgaacgccgt ggccagcgtg cccatcatgt 420
acagctggag ccccctgcag cagaacttca tggtggagga cgagaccgtg ctgcacaaca 480
tcccctacat gggcgacgag gtgctggacc aggacggcac cttcatcgag gagctgatca 540
agaactacga cggcaaggtg cacggcgacc gggagtgcgg cttcatcaac gacgagatct 600
tcgtggagct ggtgaacgcc ctgggccagt acaacgacga cgacgacgac gacgacggcg 660
acgaccccga ggagcgggag gagaagcaga aggacctgga ggaccaccgg gacgacaagg 720
agagccggcc cccccggaag ttccccagcg acaagatctt cgaggccatc agcagcatgt 780
tccccgacaa gggcaccgcc gaggagctga aggagaagta caaggagctg accgagcagc 840
agctgcccgg cgccctgccc cccgagtgca cccccaacat cgacggcccc aacgccaaga 900
gcgtgcagcg ggagcagagc ctgcacagct tccacaccct gttctgccgg cggtgcttca 960
agtacgactg cttcctgcac cccttccacg ccacccccaa cacctacaag cggaagaaca 1020
ccgagaccgc cctggacaac aagccctgcg gcccccagtg ctaccagcac ctggagggcg 1080
ccaaggagtt cgccgccgcc ctgaccgccg agcggatcaa gacccccccc aagcggcccg 1140
gcggccggcg gcggggccgg ctgcccaaca acagcagccg gcccagcacc cccaccatca 1200
acgtgctgga gagcaaggac accgacagcg accgggaggc cggcaccgag accggcggcg 1260
agaacaacga caaggaggag gaggagaaga aggacgagac cagcagcagc agcgaggcca 1320
acagccggtg ccagaccccc atcaagatga agcccaacat cgagcccccc gagaacgtgg 1380
agtggagcgg cgccgaggcc agcatgttcc gggtgctgat cggcacctac tacgacaact 1440
tctgcgccat cgcccggctg atcggcacca agacctgccg gcaggtgtac gagttccggg 1500
tgaaggagag cagcatcatc gcccccgccc ccgccgagga cgtggacacc cccccccgga 1560
agaagaagcg gaagcaccgg ctgtgggccg cccactgccg gaagatccag ctgaagaagg 1620
acggcagcag caaccacgtg tacaactacc agccctgcga ccacccccgg cagccctgcg 1680
acagcagctg cccctgcgtg atcgcccaga acttctgcga gaagttctgc cagtgcagca 1740
gcgagtgcca gaaccggttc cccggctgcc ggtgcaaggc ccagtgcaac accaagcagt 1800
gcccctgcta cctggccgtg cgggagtgcg accccgacct gtgcctgacc tgcggcgccg 1860
ccgaccactg ggacagcaag aacgtgagct gcaagaactg cagcatccag cggggcagca 1920
agaagcacct gctgctggcc cccagcgacg tggccggctg gggcatcttc atcaaggacc 1980
ccgtgcagaa gaacgagttc atcagcgagt actgcggcga gatcatcagc caggacgagg 2040
ccgaccggcg gggcaaggtg tacgacaagt acatgtgcag cttcctgttc aacctgaaca 2100
acgacttcgt ggtggacgcc acccggaagg gcaacaagat ccggttcgcc aaccacagcg 2160
tgaaccccaa ctgctacgcc aaggtgatga tggtgaacgg cgaccaccgg atcggcatct 2220
tcgccaagcg ggccatccag accggcgagg agctgttctt cgactaccgg tacagccagg 2280
ccgacgccct gaagtacgtg ggcatcgagc gggagatgga gatccccagc accggcggca 2340
gcggcggcag cggcggcagc ggcggcagcg gcggcagcgg ccgacccgac aagaagtaca 2400
gcatcggcct ggccatcggc accaacagcg tgggctgggc cgtgatcacc gacgagtaca 2460
aggtgcccag caagaagttc aaggtgctgg gcaacaccga ccggcacagc atcaagaaga 2520
acctgatcgg cgccctgctg ttcgacagcg gcgagaccgc cgaggccacc cggctgaagc 2580
ggaccgcccg gcggcggtac acccggcgga agaaccggat ctgctacctg caggagatct 2640
tcagcaacga gatggccaag gtggacgaca gcttcttcca ccggctggag gagagcttcc 2700
tggtggagga ggacaagaag cacgagcggc accccatctt cggcaacatc gtggacgagg 2760
tggcctacca cgagaagtac cccaccatct accacctgcg gaagaagctg gtggacagca 2820
ccgacaaggc cgacctgcgg ctgatctacc tggccctggc ccacatgatc aagttccggg 2880
gccacttcct gatcgagggc gacctgaacc ccgacaacag cgacgtggac aagctgttca 2940
tccagctggt gcagacctac aaccagctgt tcgaggagaa ccccatcaac gccagcggcg 3000
tggacgccaa ggccatcctg agcgcccggc tgagcaagag ccggcggctg gagaacctga 3060
tcgcccagct gcccggcgag aagaagaacg gcctgttcgg caacctgatc gccctgagcc 3120
tgggcctgac ccccaacttc aagagcaact tcgacctggc cgaggacgcc aagctgcagc 3180
tgagcaagga cacctacgac gacgacctgg acaacctgct ggcccagatc ggcgaccagt 3240
acgccgacct gttcctggcc gccaagaacc tgagcgacgc catcctgctg agcgacatcc 3300
tgcgggtgaa caccgagatc accaaggccc ccctgagcgc cagcatgatc aagcggtacg 3360
acgagcacca ccaggacctg accctgctga aggccctggt gcggcagcag ctgcccgaga 3420
agtacaagga gatcttcttc gaccagagca agaacggcta cgccggctac atcgacggcg 3480
gcgccagcca ggaggagttc tacaagttca tcaagcccat cctggagaag atggacggca 3540
ccgaggagct gctggtgaag ctgaaccggg aggacctgct gcggaagcag cggaccttcg 3600
acaacggcag catcccccac cagatccacc tgggcgagct gcacgccatc ctgcggcggc 3660
aggaggactt ctaccccttc ctgaaggaca accgggagaa gatcgagaag atcctgacct 3720
tccggatccc ctactacgtg ggccccctgg cccggggcaa cagccggttc gcctggatga 3780
cccggaaatc cgaggagacc atcaccccct ggaacttcga ggaggtggtg gacaagggcg 3840
ccagcgccca gagcttcatc gagcggatga ccaacttcga caagaacctg cccaacgaga 3900
aggtgctgcc caagcacagc ctgctgtacg agtacttcac cgtgtacaac gagctgacca 3960
aggtgaagta cgtgaccgag ggcatgcgga agcccgcctt cctgagcggc gagcagaaga 4020
aggccatcgt ggacctgctg ttcaagacca accggaaggt gaccgtgaag cagctgaagg 4080
aggactactt caagaagatc gagtgcttcg acagcgtgga gatcagcggc gtggaggacc 4140
ggttcaacgc cagcctgggc acctaccacg acctgctgaa gatcatcaag gacaaggact 4200
tcctggacaa cgaggagaac gaggacatcc tggaggacat cgtgctgacc ctgaccctgt 4260
tcgaggaccg ggagatgatc gaggagcggc tgaaaaccta cgcccacctg ttcgacgaca 4320
aggtgatgaa gcagctgaag cggcggcggt acaccggctg gggccggctg agccggaagc 4380
tgatcaacgg catccgggac aagcagagcg gcaagaccat cctggacttc ctgaaatccg 4440
acggcttcgc caaccggaac ttcatgcagc tgatccacga cgacagcctg accttcaagg 4500
aggacatcca gaaggcccag gtgagcggcc agggcgacag cctgcacgag cacatcgcca 4560
acctggccgg cagccccgcc atcaagaagg gcatcctgca gaccgtgaag gtggtggacg 4620
agctggtgaa ggtgatgggc cggcacaagc ccgagaacat cgtgatcgag atggcccggg 4680
agaaccagac cacccagaag ggccagaaga acagccggga gcggatgaag cggatcgagg 4740
agggcatcaa ggagctgggc agccagatcc tgaaggagca ccccgtggag aacacccagc 4800
tgcagaacga gaagctgtac ctgtactacc tgcagaacgg ccgggacatg tacgtggacc 4860
aggagctgga catcaaccgg ctgagcgact acgacgtggc cgccatcgtg ccccagagct 4920
tcctgaagga cgacagcatc gacaacaagg tgctgacccg gagcgacaag gcccggggca 4980
agagcgacaa cgtgcccagc gaggaggtgg tgaagaagat gaagaactac tggcggcagc 5040
tgctgaacgc caagctgatc acccagcgga agttcgacaa cctgaccaag gccgagcggg 5100
gcggcctgag cgagctggac aaggccggct tcatcaagcg gcagctggtg gagacccggc 5160
agatcaccaa gcacgtggcc cagatcctgg acagccggat gaacaccaag tacgacgaga 5220
acgacaagct gatccgggag gtgaaggtga tcaccctgaa atccaagctg gtgagcgact 5280
tccggaagga cttccagttc tacaaggtgc gggagatcaa caactaccac cacgcccacg 5340
acgcctacct gaacgccgtg gtgggcaccg ccctgatcaa gaagtacccc aagctggaga 5400
gcgagttcgt gtacggcgac tacaaggtgt acgacgtgcg gaagatgatc gccaagagcg 5460
agcaggagat cggcaaggcc accgccaagt acttcttcta cagcaacatc atgaacttct 5520
tcaagaccga gatcaccctg gccaacggcg agatccggaa gcggcccctg atcgagacca 5580
acggcgagac cggcgagatc gtgtgggaca agggccggga cttcgccacc gtgcggaagg 5640
tgctgagcat gccccaggtg aacatcgtga agaaaaccga ggtgcagacc ggcggcttca 5700
gcaaggagag catcctgccc aagcggaaca gcgacaagct gatcgcccgg aagaaggact 5760
gggaccccaa gaagtacggc ggcttcgaca gccccaccgt ggcctacagc gtgctggtgg 5820
tggccaaggt ggagaagggc aagagcaaga agctgaaatc cgtgaaggag ctgctgggca 5880
tcaccatcat ggagcggagc agcttcgaga agaaccccat cgacttcctg gaggccaagg 5940
gctacaagga ggtgaagaag gacctgatca tcaagctgcc caagtacagc ctgttcgagc 6000
tggagaacgg ccggaagcgg atgctggcca gcgccggcga gctgcagaag ggcaacgagc 6060
tggccctgcc cagcaagtac gtgaacttcc tgtacctggc cagccactac gagaagctga 6120
agggcagccc cgaggacaac gagcagaagc agctgttcgt ggagcagcac aagcactacc 6180
tggacgagat catcgagcag atcagcgagt tcagcaagcg ggtgatcctg gccgacgcca 6240
acctggacaa ggtgctgagc gcctacaaca agcaccggga caagcccatc cgggagcagg 6300
ccgagaacat catccacctg ttcaccctga ccaacctggg cgcccccgcc gccttcaagt 6360
acttcgacac caccatcgac cggaagcggt acaccagcac caaggaggtg ctggacgcca 6420
ccctgatcca ccagagcatc accggcctgt acgagacccg gatcgacctg agccagctgg 6480
gcggcgacag cggcggcaag cggcccgccg ccaccaagaa ggccggccag gccaagaaga 6540
agaagtcggg cgggggtggc tcagacgcta agtctctgac cgcttggagc agaacactgg 6600
tcaccttcaa ggacgtgttc gtcgacttca caagagagga gtggaaactg ctggacaccg 6660
cccagcagat cctctataga aacgtcatgc tggagaacta caagaatctg gtgtctctgg 6720
gctaccagct gaccaagccc gacgtgattc tgaggctgga gaagggcgag gagccttggc 6780
tggtggagag agagatccac caagaaaccc accccgacag cgaaaccgcc ttcgagatca 6840
agagcagcgt gggaggtggc ggatcgggaa agcggcccgc cgccaccaag aaggccggtc 6900
aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 6960
cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 7020
cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 7080
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7140
aaaaaaa 7147
<210> 31
<211> 6040
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 31
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaggaa 120
gcgccgctat cgccgaagtg ctgctgaatg ccagatgcga tctgcatgcc gtgaactacc 180
acggcgacac ccctctgcat atcgccgcta gagagagcta ccatgactgt gtgctgctgt 240
ttctgagcag aggcgccaat cccgagctca gaaacaaaga gggcgacacc gcttgggatc 300
tgacacccga gagatccgac gtgtggttcg ctctgcaact gaatagaaaa ctgagactgg 360
gcgtcggcaa tagggccatt agaaccgaga agatcatctg tagggacgtg gctaggggct 420
acgagaacgt gcccatccct tgtgtgaacg gagtggatgg agagccttgc cccgaggatt 480
acaaatacat cagcgagaac tgcgaaacct ccaccatgaa tatcgataga aacattacac 540
acctccagca ctgtacatgc gtggacgatt gcagcagcag caactgtctg tgcggccaac 600
tgagcatcag atgctggtac gacaaggatg gcagactgct gcaagagttc aacaagatcg 660
aaccccctct gatcttcgag tgtaaccaag cttgcagctg ttggaggaac tgcaagaata 720
gggtcgtgca gtccggaatc aaggtgagac tgcagctgta tagaacagct aagatgggat 780
ggggagtcag agctctgcag accatccccc aaggcacatt catctgtgag tacgtcggcg 840
aactcatcag cgacgctgag gccgatgtga gggaggacga cagctatctc ttcgacctcg 900
acaacaagga cggcgaggtg tactgcatcg acgctagata ttacggcaac atcagcagat 960
tcatcaacca cctctgcgac cccaatatca tccccgtgag agtgttcatg ctccatcaag 1020
atctgagatt ccctaggatc gccttcttca gctctagaga cattagaacc ggcgaggagc 1080
tgggattcga ctacggcgac aggttctggg acatcaagag caagtacttc acatgccaat 1140
gcggcagcga gaaatgcaag catagcgccg aggccattgc tctggagcag tctagactgg 1200
ctaggctgga ccctcacccc gagctgctgc ccgaactggg atctctgcct cccgtgaata 1260
ccggaggtgg cggatcggga gacaagaagt acagcatcgg cctggccatc ggcaccaaca 1320
gcgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaag ttcaaggtgc 1380
tgggcaacac cgaccggcac agcatcaaga agaacctgat cggcgccctg ctgttcgaca 1440
gcggcgagac cgccgaggcc acccggctga agcggaccgc ccggcggcgg tacacccggc 1500
ggaagaaccg gatctgctac ctgcaggaga tcttcagcaa cgagatggcc aaggtggacg 1560
acagcttctt ccaccggctg gaggagagct tcctggtgga ggaggacaag aagcacgagc 1620
ggcaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag taccccacca 1680
tctaccacct gcggaagaag ctggtggaca gcaccgacaa ggccgacctg cggctgatct 1740
acctggccct ggcccacatg atcaagttcc ggggccactt cctgatcgag ggcgacctga 1800
accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc tacaaccagc 1860
tgttcgagga gaaccccatc aacgccagcg gcgtggacgc caaggccatc ctgagcgccc 1920
ggctgagcaa gagccggcgg ctggagaacc tgatcgccca gctgcccggc gagaagaaga 1980
acggcctgtt cggcaacctg atcgccctga gcctgggcct gacccccaac ttcaagagca 2040
acttcgacct ggccgaggac gccaagctgc agctgagcaa ggacacctac gacgacgacc 2100
tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg gccgccaaga 2160
acctgagcga cgccatcctg ctgagcgaca tcctgcgggt gaacaccgag atcaccaagg 2220
cccccctgag cgccagcatg atcaagcggt acgacgagca ccaccaggac ctgaccctgc 2280
tgaaggccct ggtgcggcag cagctgcccg agaagtacaa ggagatcttc ttcgaccaga 2340
gcaagaacgg ctacgccggc tacatcgacg gcggcgccag ccaggaggag ttctacaagt 2400
tcatcaagcc catcctggag aagatggacg gcaccgagga gctgctggtg aagctgaacc 2460
gggaggacct gctgcggaag cagcggacct tcgacaacgg cagcatcccc caccagatcc 2520
acctgggcga gctgcacgcc atcctgcggc ggcaggagga cttctacccc ttcctgaagg 2580
acaaccggga gaagatcgag aagatcctga ccttccggat cccctactac gtgggccccc 2640
tggcccgggg caacagccgg ttcgcctgga tgacccggaa atccgaggag accatcaccc 2700
cctggaactt cgaggaggtg gtggacaagg gcgccagcgc ccagagcttc atcgagcgga 2760
tgaccaactt cgacaagaac ctgcccaacg agaaggtgct gcccaagcac agcctgctgt 2820
acgagtactt caccgtgtac aacgagctga ccaaggtgaa gtacgtgacc gagggcatgc 2880
ggaagcccgc cttcctgagc ggcgagcaga agaaggccat cgtggacctg ctgttcaaga 2940
ccaaccggaa ggtgaccgtg aagcagctga aggaggacta cttcaagaag atcgagtgct 3000
tcgacagcgt ggagatcagc ggcgtggagg accggttcaa cgccagcctg ggcacctacc 3060
acgacctgct gaagatcatc aaggacaagg acttcctgga caacgaggag aacgaggaca 3120
tcctggagga catcgtgctg accctgaccc tgttcgagga ccgggagatg atcgaggagc 3180
ggctgaaaac ctacgcccac ctgttcgacg acaaggtgat gaagcagctg aagcggcggc 3240
ggtacaccgg ctggggccgg ctgagccgga agctgatcaa cggcatccgg gacaagcaga 3300
gcggcaagac catcctggac ttcctgaaat ccgacggctt cgccaaccgg aacttcatgc 3360
agctgatcca cgacgacagc ctgaccttca aggaggacat ccagaaggcc caggtgagcg 3420
gccagggcga cagcctgcac gagcacatcg ccaacctggc cggcagcccc gccatcaaga 3480
agggcatcct gcagaccgtg aaggtggtgg acgagctggt gaaggtgatg ggccggcaca 3540
agcccgagaa catcgtgatc gagatggccc gggagaacca gaccacccag aagggccaga 3600
agaacagccg ggagcggatg aagcggatcg aggagggcat caaggagctg ggcagccaga 3660
tcctgaagga gcaccccgtg gagaacaccc agctgcagaa cgagaagctg tacctgtact 3720
acctgcagaa cggccgggac atgtacgtgg accaggagct ggacatcaac cggctgagcg 3780
actacgacgt ggccgccatc gtgccccaga gcttcctgaa ggacgacagc atcgacaaca 3840
aggtgctgac ccggagcgac aaggcccggg gcaagagcga caacgtgccc agcgaggagg 3900
tggtgaagaa gatgaagaac tactggcggc agctgctgaa cgccaagctg atcacccagc 3960
ggaagttcga caacctgacc aaggccgagc ggggcggcct gagcgagctg gacaaggccg 4020
gcttcatcaa gcggcagctg gtggagaccc ggcagatcac caagcacgtg gcccagatcc 4080
tggacagccg gatgaacacc aagtacgacg agaacgacaa gctgatccgg gaggtgaagg 4140
tgatcaccct gaaatccaag ctggtgagcg acttccggaa ggacttccag ttctacaagg 4200
tgcgggagat caacaactac caccacgccc acgacgccta cctgaacgcc gtggtgggca 4260
ccgccctgat caagaagtac cccaagctgg agagcgagtt cgtgtacggc gactacaagg 4320
tgtacgacgt gcggaagatg atcgccaaga gcgagcagga gatcggcaag gccaccgcca 4380
agtacttctt ctacagcaac atcatgaact tcttcaagac cgagatcacc ctggccaacg 4440
gcgagatccg gaagcggccc ctgatcgaga ccaacggcga gaccggcgag atcgtgtggg 4500
acaagggccg ggacttcgcc accgtgcgga aggtgctgag catgccccag gtgaacatcg 4560
tgaagaaaac cgaggtgcag accggcggct tcagcaagga gagcatcctg cccaagcgga 4620
acagcgacaa gctgatcgcc cggaagaagg actgggaccc caagaagtac ggcggcttcg 4680
acagccccac cgtggcctac agcgtgctgg tggtggccaa ggtggagaag ggcaagagca 4740
agaagctgaa atccgtgaag gagctgctgg gcatcaccat catggagcgg agcagcttcg 4800
agaagaaccc catcgacttc ctggaggcca agggctacaa ggaggtgaag aaggacctga 4860
tcatcaagct gcccaagtac agcctgttcg agctggagaa cggccggaag cggatgctgg 4920
ccagcgccgg cgagctgcag aagggcaacg agctggccct gcccagcaag tacgtgaact 4980
tcctgtacct ggccagccac tacgagaagc tgaagggcag ccccgaggac aacgagcaga 5040
agcagctgtt cgtggagcag cacaagcact acctggacga gatcatcgag cagatcagcg 5100
agttcagcaa gcgggtgatc ctggccgacg ccaacctgga caaggtgctg agcgcctaca 5160
acaagcaccg ggacaagccc atccgggagc aggccgagaa catcatccac ctgttcaccc 5220
tgaccaacct gggcgccccc gccgccttca agtacttcga caccaccatc gaccggaagc 5280
ggtacaccag caccaaggag gtgctggacg ccaccctgat ccaccagagc atcaccggcc 5340
tgtacgagac ccggatcgac ctgagccagc tgggcggcga cagcggcggc aagcggcccg 5400
ccgccaccaa gaaggccggc caggccaaga agaagaagtc gggcgggggt ggctcagacg 5460
ctaagtctct gaccgcttgg agcagaacac tggtcacctt caaggacgtg ttcgtcgact 5520
tcacaagaga ggagtggaaa ctgctggaca ccgcccagca gatcctctat agaaacgtca 5580
tgctggagaa ctacaagaat ctggtgtctc tgggctacca gctgaccaag cccgacgtga 5640
ttctgaggct ggagaagggc gaggagcctt ggctggtgga gagagagatc caccaagaaa 5700
cccaccccga cagcgaaacc gccttcgaga tcaagagcag cgtgggaggt ggcggatcgg 5760
gaaagcggcc cgccgccacc aagaaggccg gtcaggccaa gaagaagaag ggcagctacc 5820
cctacgacgt gcccgactac gcctgagcgg ccgcttaatt aagctgcctt ctgcggggct 5880
tgccttctgg ccatgccctt cttctctccc ttgcacctgt acctcttggt ctttgaataa 5940
agcctgagta ggaagtctag aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6000
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6040
<210> 32
<211> 4870
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 32
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgcctc gggcgggggt ggctcaagca 120
gaaggaagca gagcaacccc agacaaatca agagatctct gggcgacatg gaggccagag 180
aggaagtgca gctggtgggc gccagccaca tggagcagaa ggctacagcc cccgaggccc 240
ccagccccgg aggtggcgga tcgggagaca agaagtacag catcggcctg gccatcggca 300
ccaacagcgt gggctgggcc gtgatcaccg acgagtacaa ggtgcccagc aagaagttca 360
aggtgctggg caacaccgac cggcacagca tcaagaagaa cctgatcggc gccctgctgt 420
tcgacagcgg cgagaccgcc gaggccaccc ggctgaagcg gaccgcccgg cggcggtaca 480
cccggcggaa gaaccggatc tgctacctgc aggagatctt cagcaacgag atggccaagg 540
tggacgacag cttcttccac cggctggagg agagcttcct ggtggaggag gacaagaagc 600
acgagcggca ccccatcttc ggcaacatcg tggacgaggt ggcctaccac gagaagtacc 660
ccaccatcta ccacctgcgg aagaagctgg tggacagcac cgacaaggcc gacctgcggc 720
tgatctacct ggccctggcc cacatgatca agttccgggg ccacttcctg atcgagggcg 780
acctgaaccc cgacaacagc gacgtggaca agctgttcat ccagctggtg cagacctaca 840
accagctgtt cgaggagaac cccatcaacg ccagcggcgt ggacgccaag gccatcctga 900
gcgcccggct gagcaagagc cggcggctgg agaacctgat cgcccagctg cccggcgaga 960
agaagaacgg cctgttcggc aacctgatcg ccctgagcct gggcctgacc cccaacttca 1020
agagcaactt cgacctggcc gaggacgcca agctgcagct gagcaaggac acctacgacg 1080
acgacctgga caacctgctg gcccagatcg gcgaccagta cgccgacctg ttcctggccg 1140
ccaagaacct gagcgacgcc atcctgctga gcgacatcct gcgggtgaac accgagatca 1200
ccaaggcccc cctgagcgcc agcatgatca agcggtacga cgagcaccac caggacctga 1260
ccctgctgaa ggccctggtg cggcagcagc tgcccgagaa gtacaaggag atcttcttcg 1320
accagagcaa gaacggctac gccggctaca tcgacggcgg cgccagccag gaggagttct 1380
acaagttcat caagcccatc ctggagaaga tggacggcac cgaggagctg ctggtgaagc 1440
tgaaccggga ggacctgctg cggaagcagc ggaccttcga caacggcagc atcccccacc 1500
agatccacct gggcgagctg cacgccatcc tgcggcggca ggaggacttc taccccttcc 1560
tgaaggacaa ccgggagaag atcgagaaga tcctgacctt ccggatcccc tactacgtgg 1620
gccccctggc ccggggcaac agccggttcg cctggatgac ccggaaatcc gaggagacca 1680
tcaccccctg gaacttcgag gaggtggtgg acaagggcgc cagcgcccag agcttcatcg 1740
agcggatgac caacttcgac aagaacctgc ccaacgagaa ggtgctgccc aagcacagcc 1800
tgctgtacga gtacttcacc gtgtacaacg agctgaccaa ggtgaagtac gtgaccgagg 1860
gcatgcggaa gcccgccttc ctgagcggcg agcagaagaa ggccatcgtg gacctgctgt 1920
tcaagaccaa ccggaaggtg accgtgaagc agctgaagga ggactacttc aagaagatcg 1980
agtgcttcga cagcgtggag atcagcggcg tggaggaccg gttcaacgcc agcctgggca 2040
cctaccacga cctgctgaag atcatcaagg acaaggactt cctggacaac gaggagaacg 2100
aggacatcct ggaggacatc gtgctgaccc tgaccctgtt cgaggaccgg gagatgatcg 2160
aggagcggct gaaaacctac gcccacctgt tcgacgacaa ggtgatgaag cagctgaagc 2220
ggcggcggta caccggctgg ggccggctga gccggaagct gatcaacggc atccgggaca 2280
agcagagcgg caagaccatc ctggacttcc tgaaatccga cggcttcgcc aaccggaact 2340
tcatgcagct gatccacgac gacagcctga ccttcaagga ggacatccag aaggcccagg 2400
tgagcggcca gggcgacagc ctgcacgagc acatcgccaa cctggccggc agccccgcca 2460
tcaagaaggg catcctgcag accgtgaagg tggtggacga gctggtgaag gtgatgggcc 2520
ggcacaagcc cgagaacatc gtgatcgaga tggcccggga gaaccagacc acccagaagg 2580
gccagaagaa cagccgggag cggatgaagc ggatcgagga gggcatcaag gagctgggca 2640
gccagatcct gaaggagcac cccgtggaga acacccagct gcagaacgag aagctgtacc 2700
tgtactacct gcagaacggc cgggacatgt acgtggacca ggagctggac atcaaccggc 2760
tgagcgacta cgacgtggcc gccatcgtgc cccagagctt cctgaaggac gacagcatcg 2820
acaacaaggt gctgacccgg agcgacaagg cccggggcaa gagcgacaac gtgcccagcg 2880
aggaggtggt gaagaagatg aagaactact ggcggcagct gctgaacgcc aagctgatca 2940
cccagcggaa gttcgacaac ctgaccaagg ccgagcgggg cggcctgagc gagctggaca 3000
aggccggctt catcaagcgg cagctggtgg agacccggca gatcaccaag cacgtggccc 3060
agatcctgga cagccggatg aacaccaagt acgacgagaa cgacaagctg atccgggagg 3120
tgaaggtgat caccctgaaa tccaagctgg tgagcgactt ccggaaggac ttccagttct 3180
acaaggtgcg ggagatcaac aactaccacc acgcccacga cgcctacctg aacgccgtgg 3240
tgggcaccgc cctgatcaag aagtacccca agctggagag cgagttcgtg tacggcgact 3300
acaaggtgta cgacgtgcgg aagatgatcg ccaagagcga gcaggagatc ggcaaggcca 3360
ccgccaagta cttcttctac agcaacatca tgaacttctt caagaccgag atcaccctgg 3420
ccaacggcga gatccggaag cggcccctga tcgagaccaa cggcgagacc ggcgagatcg 3480
tgtgggacaa gggccgggac ttcgccaccg tgcggaaggt gctgagcatg ccccaggtga 3540
acatcgtgaa gaaaaccgag gtgcagaccg gcggcttcag caaggagagc atcctgccca 3600
agcggaacag cgacaagctg atcgcccgga agaaggactg ggaccccaag aagtacggcg 3660
gcttcgacag ccccaccgtg gcctacagcg tgctggtggt ggccaaggtg gagaagggca 3720
agagcaagaa gctgaaatcc gtgaaggagc tgctgggcat caccatcatg gagcggagca 3780
gcttcgagaa gaaccccatc gacttcctgg aggccaaggg ctacaaggag gtgaagaagg 3840
acctgatcat caagctgccc aagtacagcc tgttcgagct ggagaacggc cggaagcgga 3900
tgctggccag cgccggcgag ctgcagaagg gcaacgagct ggccctgccc agcaagtacg 3960
tgaacttcct gtacctggcc agccactacg agaagctgaa gggcagcccc gaggacaacg 4020
agcagaagca gctgttcgtg gagcagcaca agcactacct ggacgagatc atcgagcaga 4080
tcagcgagtt cagcaagcgg gtgatcctgg ccgacgccaa cctggacaag gtgctgagcg 4140
cctacaacaa gcaccgggac aagcccatcc gggagcaggc cgagaacatc atccacctgt 4200
tcaccctgac caacctgggc gcccccgccg ccttcaagta cttcgacacc accatcgacc 4260
ggaagcggta caccagcacc aaggaggtgc tggacgccac cctgatccac cagagcatca 4320
ccggcctgta cgagacccgg atcgacctga gccagctggg cggcgacagc ggcggcaagc 4380
ggcccgccgc caccaagaag gccggccagg ccaagaagaa gaagtcgggc gggggtggct 4440
caagcagaag gaagcagagc aaccccagac aaatcaagag atctctgggc gacatggagg 4500
ccagagagga agtgcagctg gtgggcgcca gccacatgga gcagaaggct acagcccccg 4560
aggcccccag ccccggaggt ggcggatcgg gaaagcggcc cgccgccacc aagaaggccg 4620
gtcaggccaa gaagaagaag ggcagctacc cctacgacgt gcccgactac gcctgagcgg 4680
ccgcttaatt aagctgcctt ctgcggggct tgccttctgg ccatgccctt cttctctccc 4740
ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtctag aaaaaaaaaa 4800
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4860
aaaaaaaaaa 4870
<210> 33
<211> 1820
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 33
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu
1400 1405 1410
Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala
1415 1420 1425
Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala
1430 1435 1440
Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn
1445 1450 1455
Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu
1460 1465 1470
Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys
1475 1480 1485
Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu
1490 1495 1500
Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly
1505 1510 1515
Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn
1520 1525 1530
Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln
1535 1540 1545
Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser
1550 1555 1560
Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys
1565 1570 1575
Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu
1580 1585 1590
Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys
1595 1600 1605
Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
1610 1615 1620
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile
1625 1630 1635
Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys
1640 1645 1650
Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys
1655 1660 1665
Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys
1670 1675 1680
Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser
1685 1690 1695
Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly
1700 1705 1710
Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys
1715 1720 1725
Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu
1730 1735 1740
Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile
1745 1750 1755
Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser
1760 1765 1770
Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly
1775 1780 1785
Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1790 1795 1800
Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp
1805 1810 1815
Tyr Ala
1820
<210> 34
<211> 1922
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 34
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Val Asp Leu Arg
1400 1405 1410
Thr Leu Asp Val Phe Ser Gly Cys Gly Gly Leu Ser Glu Gly Phe
1415 1420 1425
His Gln Ala Gly Ile Ser Asp Thr Leu Trp Ala Ile Glu Met Trp
1430 1435 1440
Asp Pro Ala Ala Gln Ala Phe Arg Leu Asn Asn Pro Gly Ser Thr
1445 1450 1455
Val Phe Thr Glu Asp Cys Asn Ile Leu Leu Lys Leu Val Met Ala
1460 1465 1470
Gly Glu Thr Thr Asn Ser Arg Gly Gln Arg Leu Pro Gln Lys Gly
1475 1480 1485
Asp Val Glu Met Leu Cys Gly Gly Pro Pro Cys Gln Gly Phe Ser
1490 1495 1500
Gly Met Asn Arg Phe Asn Ser Arg Thr Tyr Ser Lys Phe Lys Asn
1505 1510 1515
Ser Leu Val Val Ser Phe Leu Ser Tyr Cys Asp Tyr Tyr Arg Pro
1520 1525 1530
Arg Phe Phe Leu Leu Glu Asn Val Arg Asn Phe Val Ser Phe Lys
1535 1540 1545
Arg Ser Met Val Leu Lys Leu Thr Leu Arg Cys Leu Val Arg Met
1550 1555 1560
Gly Tyr Gln Cys Thr Phe Gly Val Leu Gln Ala Gly Gln Tyr Gly
1565 1570 1575
Val Ala Gln Thr Arg Arg Arg Ala Ile Ile Leu Ala Ala Ala Pro
1580 1585 1590
Gly Glu Lys Leu Pro Leu Phe Pro Glu Pro Leu His Val Phe Ala
1595 1600 1605
Pro Arg Ala Cys Gln Leu Ser Val Val Val Asp Asp Lys Lys Phe
1610 1615 1620
Val Ser Asn Ile Thr Arg Leu Ser Ser Gly Pro Phe Arg Thr Ile
1625 1630 1635
Thr Val Arg Asp Thr Met Ser Asp Leu Pro Glu Val Arg Asn Gly
1640 1645 1650
Ala Ser Ala Leu Glu Ile Ser Tyr Asn Gly Glu Pro Gln Ser Trp
1655 1660 1665
Phe Gln Arg Gln Leu Arg Gly Ala Gln Tyr Gln Pro Ile Leu Arg
1670 1675 1680
Asp His Ile Cys Lys Asp Met Ser Ala Leu Val Ala Ala Arg Met
1685 1690 1695
Arg His Ile Pro Leu Ala Pro Gly Ser Asp Trp Arg Asp Leu Pro
1700 1705 1710
Asn Ile Glu Val Arg Leu Ser Asp Gly Thr Met Ala Arg Lys Leu
1715 1720 1725
Arg Tyr Thr His His Asp Arg Lys Asn Gly Arg Ser Ser Ser Gly
1730 1735 1740
Ala Leu Arg Gly Val Cys Ser Cys Val Glu Ala Gly Lys Ala Cys
1745 1750 1755
Asp Pro Ala Ala Arg Gln Phe Asn Thr Leu Ile Pro Trp Cys Leu
1760 1765 1770
Pro His Thr Gly Asn Arg His Asn His Trp Ala Gly Leu Tyr Gly
1775 1780 1785
Arg Leu Glu Trp Asp Gly Phe Phe Ser Thr Thr Val Thr Asn Pro
1790 1795 1800
Glu Pro Met Gly Lys Gln Gly Arg Val Leu His Pro Glu Gln His
1805 1810 1815
Arg Val Val Ser Val Arg Glu Cys Ala Arg Ser Gln Gly Phe Pro
1820 1825 1830
Asp Thr Tyr Arg Leu Phe Gly Asn Ile Leu Asp Lys His Arg Gln
1835 1840 1845
Val Gly Asn Ala Val Pro Pro Pro Leu Ala Lys Ala Ile Gly Leu
1850 1855 1860
Glu Ile Lys Leu Cys Met Leu Ala Lys Ala Arg Glu Ser Ala Ser
1865 1870 1875
Ala Lys Ile Lys Glu Glu Glu Ala Ala Lys Asp Gly Gly Gly Gly
1880 1885 1890
Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1895 1900 1905
Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1910 1915 1920
<210> 35
<211> 1986
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 35
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro
1415 1420 1425
Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe
1430 1435 1440
Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile
1445 1450 1455
Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile
1460 1465 1470
Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly
1475 1480 1485
Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro
1490 1495 1500
Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile
1505 1510 1515
Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu
1520 1525 1530
Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu
1535 1540 1545
Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala
1550 1555 1560
Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser
1565 1570 1575
Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg
1580 1585 1590
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu
1595 1600 1605
Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu
1610 1615 1620
His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
1625 1630 1635
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val
1640 1645 1650
Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu
1655 1660 1665
Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met
1670 1675 1680
Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val
1685 1690 1695
Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala
1700 1705 1710
Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser
1715 1720 1725
Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met
1730 1735 1740
Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp Arg Arg Gln
1745 1750 1755
Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys Glu Leu
1760 1765 1770
Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln Leu
1775 1780 1785
Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu
1790 1795 1800
Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu
1805 1810 1815
Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe
1820 1825 1830
His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg
1835 1840 1845
Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu
1850 1855 1860
Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr
1865 1870 1875
Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val
1880 1885 1890
Trp Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val
1895 1900 1905
Ser Glu Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser
1910 1915 1920
Lys Leu Ala Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe
1925 1930 1935
Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr
1940 1945 1950
Ser Ser Leu Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1955 1960 1965
Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
1970 1975 1980
Asp Tyr Ala
1985
<210> 36
<211> 1986
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 36
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro
1415 1420 1425
Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe
1430 1435 1440
Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile
1445 1450 1455
Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile
1460 1465 1470
Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly
1475 1480 1485
Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro
1490 1495 1500
Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile
1505 1510 1515
Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu
1520 1525 1530
Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu
1535 1540 1545
Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala
1550 1555 1560
Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser
1565 1570 1575
Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg
1580 1585 1590
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu
1595 1600 1605
Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu
1610 1615 1620
His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
1625 1630 1635
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val
1640 1645 1650
Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu
1655 1660 1665
Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met
1670 1675 1680
Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val
1685 1690 1695
Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala
1700 1705 1710
Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser
1715 1720 1725
Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met
1730 1735 1740
Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp Arg Arg Gln
1745 1750 1755
Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys Glu Leu
1760 1765 1770
Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln Leu
1775 1780 1785
Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu
1790 1795 1800
Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu
1805 1810 1815
Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe
1820 1825 1830
His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg
1835 1840 1845
Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu
1850 1855 1860
Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr
1865 1870 1875
Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val
1880 1885 1890
Trp Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val
1895 1900 1905
Ser Glu Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser
1910 1915 1920
Lys Leu Ala Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe
1925 1930 1935
Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr
1940 1945 1950
Ser Ser Leu Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1955 1960 1965
Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
1970 1975 1980
Asp Tyr Ala
1985
<210> 37
<211> 1754
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 37
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Val Asp Val Leu
1400 1405 1410
Arg Arg Arg Lys Asp Trp Asn Val Arg Leu Gln Ala Phe Phe Thr
1415 1420 1425
Ser Asp Thr Gly Leu Glu Tyr Glu Ala Pro Lys Leu Tyr Pro Ala
1430 1435 1440
Ile Pro Ala Ala Arg Arg Arg Pro Ile Arg Val Leu Ser Leu Phe
1445 1450 1455
Asp Gly Ile Ala Thr Gly Tyr Leu Val Leu Lys Glu Leu Gly Ile
1460 1465 1470
Lys Val Gly Lys Tyr Val Ala Ser Glu Val Cys Glu Glu Ser Ile
1475 1480 1485
Ala Val Gly Thr Val Lys His Glu Gly Asn Ile Lys Tyr Val Asn
1490 1495 1500
Asp Val Arg Asn Ile Thr Lys Lys Asn Ile Glu Glu Trp Gly Pro
1505 1510 1515
Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Asn
1520 1525 1530
Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu
1535 1540 1545
Phe Phe Glu Phe Tyr His Leu Leu Asn Tyr Ser Arg Pro Lys Glu
1550 1555 1560
Gly Asp Asp Arg Pro Phe Phe Trp Met Phe Glu Asn Val Val Ala
1565 1570 1575
Met Lys Val Gly Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Cys
1580 1585 1590
Asn Pro Val Met Ile Asp Ala Ile Lys Val Ser Ala Ala His Arg
1595 1600 1605
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Val
1610 1615 1620
Ile Ala Ser Lys Asn Asp Lys Leu Glu Leu Gln Asp Cys Leu Glu
1625 1630 1635
Tyr Asn Arg Ile Ala Lys Leu Lys Lys Val Gln Thr Ile Thr Thr
1640 1645 1650
Lys Ser Asn Ser Ile Lys Gln Gly Lys Asn Gln Leu Phe Pro Val
1655 1660 1665
Val Met Asn Gly Lys Glu Asp Val Leu Trp Cys Thr Glu Leu Glu
1670 1675 1680
Arg Ile Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met
1685 1690 1695
Gly Arg Gly Ala Arg Gln Lys Leu Leu Gly Arg Ser Trp Ser Val
1700 1705 1710
Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Asp Tyr Phe Ala
1715 1720 1725
Cys Glu Gly Gly Gly Gly Ser Gly Lys Arg Pro Ala Ala Thr Lys
1730 1735 1740
Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1745 1750
<210> 38
<211> 1708
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 38
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Gly Gly Gly Gly Ser Gly Asn Arg Ala Ile Arg Thr Glu Lys
20 25 30
Ile Ile Cys Arg Asp Val Ala Arg Gly Tyr Glu Asn Val Pro Ile Pro
35 40 45
Cys Val Asn Gly Val Asp Gly Glu Pro Cys Pro Glu Asp Tyr Lys Tyr
50 55 60
Ile Ser Glu Asn Cys Glu Thr Ser Thr Met Asn Ile Asp Arg Asn Ile
65 70 75 80
Thr His Leu Gln His Cys Thr Cys Val Asp Asp Cys Ser Ser Ser Asn
85 90 95
Cys Leu Cys Gly Gln Leu Ser Ile Arg Cys Trp Tyr Asp Lys Asp Gly
100 105 110
Arg Leu Leu Gln Glu Phe Asn Lys Ile Glu Pro Pro Leu Ile Phe Glu
115 120 125
Cys Asn Gln Ala Cys Ser Cys Trp Arg Asn Cys Lys Asn Arg Val Val
130 135 140
Gln Ser Gly Ile Lys Val Arg Leu Gln Leu Tyr Arg Thr Ala Lys Met
145 150 155 160
Gly Trp Gly Val Arg Ala Leu Gln Thr Ile Pro Gln Gly Thr Phe Ile
165 170 175
Cys Glu Tyr Val Gly Glu Leu Ile Ser Asp Ala Glu Ala Asp Val Arg
180 185 190
Glu Asp Asp Ser Tyr Leu Phe Asp Leu Asp Asn Lys Asp Gly Glu Val
195 200 205
Tyr Cys Ile Asp Ala Arg Tyr Tyr Gly Asn Ile Ser Arg Phe Ile Asn
210 215 220
His Leu Cys Asp Pro Asn Ile Ile Pro Val Arg Val Phe Met Leu His
225 230 235 240
Gln Asp Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Ser Arg Asp Ile
245 250 255
Arg Thr Gly Glu Glu Leu Gly Phe Asp Tyr Gly Asp Arg Phe Trp Asp
260 265 270
Ile Lys Ser Lys Tyr Phe Thr Cys Gln Cys Gly Ser Glu Lys Cys Lys
275 280 285
His Ser Ala Glu Ala Ile Ala Leu Glu Gln Ser Arg Leu Ala Arg Leu
290 295 300
Asp Gly Gly Gly Gly Ser Gly Asp Lys Lys Tyr Ser Ile Gly Leu Ala
305 310 315 320
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
325 330 335
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
340 345 350
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
355 360 365
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
370 375 380
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
385 390 395 400
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
405 410 415
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
420 425 430
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
435 440 445
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
450 455 460
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
465 470 475 480
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
485 490 495
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
500 505 510
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
515 520 525
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
530 535 540
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
545 550 555 560
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
565 570 575
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
580 585 590
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
595 600 605
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
610 615 620
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
625 630 635 640
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
645 650 655
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
660 665 670
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
675 680 685
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
690 695 700
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
705 710 715 720
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
725 730 735
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
740 745 750
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
755 760 765
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
770 775 780
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
785 790 795 800
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
805 810 815
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
820 825 830
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
835 840 845
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
850 855 860
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
865 870 875 880
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
885 890 895
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
900 905 910
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
915 920 925
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
930 935 940
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
945 950 955 960
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
965 970 975
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
980 985 990
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
995 1000 1005
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
1010 1015 1020
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
1025 1030 1035
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val
1040 1045 1050
Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn
1055 1060 1065
Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly
1070 1075 1080
Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile
1085 1090 1095
Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
1100 1105 1110
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
1115 1120 1125
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
1130 1135 1140
Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
1145 1150 1155
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala
1160 1165 1170
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
1175 1180 1185
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
1190 1195 1200
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
1205 1210 1215
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu
1220 1225 1230
Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
1235 1240 1245
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
1250 1255 1260
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys
1265 1270 1275
Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His
1280 1285 1290
Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile
1295 1300 1305
Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr
1310 1315 1320
Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1325 1330 1335
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met
1340 1345 1350
Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg
1355 1360 1365
Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1370 1375 1380
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1385 1390 1395
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly
1400 1405 1410
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys
1415 1420 1425
Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly
1430 1435 1440
Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1445 1450 1455
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu
1460 1465 1470
Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1475 1480 1485
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
1490 1495 1500
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn
1505 1510 1515
Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly
1520 1525 1530
Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu
1535 1540 1545
Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu
1550 1555 1560
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
1565 1570 1575
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
1580 1585 1590
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg
1595 1600 1605
Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1610 1615 1620
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1625 1630 1635
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
1640 1645 1650
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
1655 1660 1665
Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Lys Arg
1670 1675 1680
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1685 1690 1695
Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1700 1705
<210> 39
<211> 1818
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 39
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Glu Glu Pro Glu
1400 1405 1410
Glu Pro Ala Asp Ser Gly Gln Ser Leu Val Pro Val Tyr Ile Tyr
1415 1420 1425
Ser Pro Glu Tyr Val Ser Met Cys Asp Ser Leu Ala Lys Ile Pro
1430 1435 1440
Lys Arg Ala Ser Met Val His Ser Leu Ile Glu Ala Tyr Ala Leu
1445 1450 1455
His Lys Gln Met Arg Ile Val Lys Pro Lys Val Ala Ser Met Glu
1460 1465 1470
Glu Met Ala Thr Phe His Thr Asp Ala Tyr Leu Gln His Leu Gln
1475 1480 1485
Lys Val Ser Gln Glu Gly Asp Asp Asp His Pro Asp Ser Ile Glu
1490 1495 1500
Tyr Gly Leu Gly Tyr Asp Cys Pro Ala Thr Glu Gly Ile Phe Asp
1505 1510 1515
Tyr Ala Ala Ala Ile Gly Gly Ala Thr Ile Thr Ala Ala Gln Cys
1520 1525 1530
Leu Ile Asp Gly Met Cys Lys Val Ala Ile Asn Trp Ser Gly Gly
1535 1540 1545
Trp His His Ala Lys Lys Asp Glu Ala Ser Gly Phe Cys Tyr Leu
1550 1555 1560
Asn Asp Ala Val Leu Gly Ile Leu Arg Leu Arg Arg Lys Phe Glu
1565 1570 1575
Arg Ile Leu Tyr Val Asp Leu Asp Leu His His Gly Asp Gly Val
1580 1585 1590
Glu Asp Ala Phe Ser Phe Thr Ser Lys Val Met Thr Val Ser Leu
1595 1600 1605
His Lys Phe Ser Pro Gly Phe Phe Pro Gly Thr Gly Asp Val Ser
1610 1615 1620
Asp Val Gly Leu Gly Lys Gly Arg Tyr Tyr Ser Val Asn Val Pro
1625 1630 1635
Ile Gln Asp Gly Ile Gln Asp Glu Lys Tyr Tyr Gln Ile Cys Glu
1640 1645 1650
Ser Val Leu Lys Glu Val Tyr Gln Ala Phe Asn Pro Lys Ala Val
1655 1660 1665
Val Leu Gln Leu Gly Ala Asp Thr Ile Ala Gly Asp Pro Met Cys
1670 1675 1680
Ser Phe Asn Met Thr Pro Val Gly Ile Gly Lys Cys Leu Lys Tyr
1685 1690 1695
Ile Leu Gln Trp Gln Leu Ala Thr Leu Ile Leu Gly Gly Gly Gly
1700 1705 1710
Tyr Asn Leu Ala Asn Thr Ala Arg Cys Trp Thr Tyr Leu Thr Gly
1715 1720 1725
Val Ile Leu Gly Lys Thr Leu Ser Ser Glu Ile Pro Asp His Glu
1730 1735 1740
Phe Phe Thr Ala Tyr Gly Pro Asp Tyr Val Leu Glu Ile Thr Pro
1745 1750 1755
Ser Cys Arg Pro Asp Arg Asn Glu Pro His Arg Ile Gln Gln Ile
1760 1765 1770
Leu Asn Tyr Ile Lys Gly Asn Leu Lys His Val Val Gly Gly Gly
1775 1780 1785
Gly Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
1790 1795 1800
Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1805 1810 1815
<210> 40
<211> 2290
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 40
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Glu Ser Gly Gly Gly Ser Leu Ser Gly Lys
1400 1405 1410
Lys Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Thr Gly
1415 1420 1425
Thr Glu Ala Gly Pro Gly Thr Ala Gly Gly Ser Glu Asn Gly Ser
1430 1435 1440
Glu Val Ala Ala Gln Pro Ala Gly Leu Ser Gly Pro Ala Glu Val
1445 1450 1455
Gly Pro Gly Ala Val Gly Glu Arg Thr Pro Arg Lys Lys Glu Pro
1460 1465 1470
Pro Arg Ala Ser Pro Pro Gly Gly Leu Ala Glu Pro Pro Gly Ser
1475 1480 1485
Ala Gly Pro Gln Ala Gly Pro Thr Val Val Pro Gly Ser Ala Thr
1490 1495 1500
Pro Met Glu Thr Gly Ile Ala Glu Thr Pro Glu Gly Arg Arg Thr
1505 1510 1515
Ser Arg Arg Lys Arg Ala Lys Val Glu Tyr Arg Glu Met Asp Glu
1520 1525 1530
Ser Leu Ala Asn Leu Ser Glu Asp Glu Tyr Tyr Ser Glu Glu Glu
1535 1540 1545
Arg Asn Ala Lys Ala Glu Lys Glu Lys Lys Leu Pro Pro Pro Pro
1550 1555 1560
Pro Gln Ala Pro Pro Glu Glu Glu Asn Glu Ser Glu Pro Glu Glu
1565 1570 1575
Pro Ser Gly Val Glu Gly Ala Ala Phe Gln Ser Arg Leu Pro His
1580 1585 1590
Asp Arg Met Thr Ser Gln Glu Ala Ala Cys Phe Pro Asp Ile Ile
1595 1600 1605
Ser Gly Pro Gln Gln Thr Gln Lys Val Phe Leu Phe Ile Arg Asn
1610 1615 1620
Arg Thr Leu Gln Leu Trp Leu Asp Asn Pro Lys Ile Gln Leu Thr
1625 1630 1635
Phe Glu Ala Thr Leu Gln Gln Leu Glu Ala Pro Tyr Asn Ser Asp
1640 1645 1650
Thr Val Leu Val His Arg Val His Ser Tyr Leu Glu Arg His Gly
1655 1660 1665
Leu Ile Asn Phe Gly Ile Tyr Lys Arg Ile Lys Pro Leu Pro Thr
1670 1675 1680
Lys Lys Thr Gly Lys Val Ile Ile Ile Gly Ser Gly Val Ser Gly
1685 1690 1695
Leu Ala Ala Ala Arg Gln Leu Gln Ser Phe Gly Met Asp Val Thr
1700 1705 1710
Leu Leu Glu Ala Arg Asp Arg Val Gly Gly Arg Val Ala Thr Phe
1715 1720 1725
Arg Lys Gly Asn Tyr Val Ala Asp Leu Gly Ala Met Val Val Thr
1730 1735 1740
Gly Leu Gly Gly Asn Pro Met Ala Val Val Ser Lys Gln Val Asn
1745 1750 1755
Met Glu Leu Ala Lys Ile Lys Gln Lys Cys Pro Leu Tyr Glu Ala
1760 1765 1770
Asn Gly Gln Ala Val Pro Lys Glu Lys Asp Glu Met Val Glu Gln
1775 1780 1785
Glu Phe Asn Arg Leu Leu Glu Ala Thr Ser Tyr Leu Ser His Gln
1790 1795 1800
Leu Asp Phe Asn Val Leu Asn Asn Lys His Val Ser Leu Gly Gln
1805 1810 1815
Ala Leu Glu Val Val Ile Gln Leu Gln Glu Lys His Val Lys Asp
1820 1825 1830
Glu Gln Ile Glu His Trp Lys Lys Ile Val Lys Thr Gln Glu Glu
1835 1840 1845
Leu Lys Glu Leu Leu Asn Lys Met Val Asn Leu Lys Glu Lys Ile
1850 1855 1860
Lys Glu Leu His Gln Gln Tyr Lys Glu Ala Ser Glu Val Lys Pro
1865 1870 1875
Pro Arg Asp Ile Thr Ala Glu Phe Leu Val Lys Ser Lys His Arg
1880 1885 1890
Asp Leu Thr Ala Leu Cys Lys Glu Tyr Asp Glu Leu Ala Glu Thr
1895 1900 1905
Gln Gly Lys Leu Glu Glu Lys Leu Gln Glu Leu Glu Ala Asn Pro
1910 1915 1920
Pro Ser Asp Val Tyr Leu Ser Ser Arg Asp Arg Gln Ile Leu Asp
1925 1930 1935
Trp His Phe Ala Asn Leu Glu Phe Ala Asn Ala Thr Pro Leu Ser
1940 1945 1950
Thr Leu Ser Leu Lys His Trp Asp Gln Asp Asp Asp Phe Glu Phe
1955 1960 1965
Thr Gly Ser His Leu Thr Val Arg Asn Gly Tyr Ser Cys Val Pro
1970 1975 1980
Val Ala Leu Ala Glu Gly Leu Asp Ile Lys Leu Asn Thr Ala Val
1985 1990 1995
Arg Gln Val Arg Tyr Thr Ala Ser Gly Cys Glu Val Ile Ala Val
2000 2005 2010
Asn Thr Arg Ser Thr Ser Gln Thr Phe Ile Tyr Lys Cys Asp Ala
2015 2020 2025
Val Leu Cys Thr Leu Pro Leu Gly Val Leu Lys Gln Gln Pro Pro
2030 2035 2040
Ala Val Gln Phe Val Pro Pro Leu Pro Glu Trp Lys Thr Ser Ala
2045 2050 2055
Val Gln Arg Met Gly Phe Gly Asn Leu Asn Lys Val Val Leu Cys
2060 2065 2070
Phe Asp Arg Val Phe Trp Asp Pro Ser Val Asn Leu Phe Gly His
2075 2080 2085
Val Gly Ser Thr Thr Ala Ser Arg Gly Glu Leu Phe Leu Phe Trp
2090 2095 2100
Asn Leu Tyr Lys Ala Pro Ile Leu Leu Ala Leu Val Ala Gly Glu
2105 2110 2115
Ala Ala Gly Ile Met Glu Asn Ile Ser Asp Asp Val Ile Val Gly
2120 2125 2130
Arg Cys Leu Ala Ile Leu Lys Gly Ile Phe Gly Ser Ser Ala Val
2135 2140 2145
Pro Gln Pro Lys Glu Thr Val Val Ser Arg Trp Arg Ala Asp Pro
2150 2155 2160
Trp Ala Arg Gly Ser Tyr Ser Tyr Val Ala Ala Gly Ser Ser Gly
2165 2170 2175
Asn Asp Tyr Asp Leu Met Ala Gln Pro Ile Thr Pro Gly Pro Ser
2180 2185 2190
Ile Pro Gly Ala Pro Gln Pro Ile Pro Arg Leu Phe Phe Ala Gly
2195 2200 2205
Glu His Thr Ile Arg Asn Tyr Pro Ala Thr Val His Gly Ala Leu
2210 2215 2220
Leu Ser Gly Leu Arg Glu Ala Gly Arg Ile Ala Asp Gln Phe Leu
2225 2230 2235
Gly Ala Met Tyr Thr Leu Pro Arg Gln Ala Thr Pro Gly Val Pro
2240 2245 2250
Ala Gln Gln Ser Pro Ser Met Ser Gly Gly Lys Arg Pro Ala Ala
2255 2260 2265
Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro
2270 2275 2280
Tyr Asp Val Pro Asp Tyr Ala
2285 2290
<210> 41
<211> 2177
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 41
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys Arg
20 25 30
Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg Arg
35 40 45
Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile Leu
50 55 60
Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile Gln
65 70 75 80
Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg Glu
85 90 95
Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro Leu
100 105 110
Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp Ser
115 120 125
Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His Asn
130 135 140
Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe Ile
145 150 155 160
Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu
165 170 175
Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu
180 185 190
Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu
195 200 205
Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys
210 215 220
Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
225 230 235 240
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys Glu
245 250 255
Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro Pro
260 265 270
Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln Arg
275 280 285
Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys Phe
290 295 300
Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr Tyr
305 310 315 320
Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly Pro
325 330 335
Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala Leu
340 345 350
Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg Arg
355 360 365
Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr Ile
370 375 380
Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr
385 390 395 400
Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp
405 410 415
Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile
420 425 430
Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly
435 440 445
Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn
450 455 460
Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
465 470 475 480
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro Ala
485 490 495
Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg Leu
500 505 510
Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser Ser
515 520 525
Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro Cys
530 535 540
Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys Phe
545 550 555 560
Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg Cys
565 570 575
Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val Arg
580 585 590
Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His Trp
595 600 605
Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly Ser
610 615 620
Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly Ile
625 630 635 640
Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys
645 650 655
Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr
660 665 670
Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val
675 680 685
Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser
690 695 700
Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
705 710 715 720
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu Leu
725 730 735
Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val Gly
740 745 750
Ile Glu Arg Glu Met Glu Ile Pro Ser Thr Gly Gly Ser Gly Gly Ser
755 760 765
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Arg Pro Asp Lys Lys Tyr
770 775 780
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
785 790 795 800
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
805 810 815
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
820 825 830
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
835 840 845
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
850 855 860
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
865 870 875 880
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
885 890 895
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
900 905 910
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
915 920 925
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
930 935 940
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
945 950 955 960
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
965 970 975
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
980 985 990
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
995 1000 1005
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
1010 1015 1020
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
1025 1030 1035
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
1040 1045 1050
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
1055 1060 1065
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
1070 1075 1080
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
1085 1090 1095
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
1100 1105 1110
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
1115 1120 1125
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
1130 1135 1140
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
1145 1150 1155
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
1160 1165 1170
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
1175 1180 1185
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
1190 1195 1200
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
1205 1210 1215
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
1220 1225 1230
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
1235 1240 1245
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
1250 1255 1260
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
1265 1270 1275
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
1280 1285 1290
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
1295 1300 1305
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
1310 1315 1320
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
1325 1330 1335
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
1340 1345 1350
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
1355 1360 1365
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
1370 1375 1380
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
1385 1390 1395
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1400 1405 1410
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
1415 1420 1425
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
1430 1435 1440
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
1445 1450 1455
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
1460 1465 1470
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1475 1480 1485
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1490 1495 1500
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1505 1510 1515
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
1520 1525 1530
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
1535 1540 1545
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
1550 1555 1560
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
1565 1570 1575
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1580 1585 1590
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1595 1600 1605
Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln
1610 1615 1620
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1625 1630 1635
Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1640 1645 1650
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1655 1660 1665
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1670 1675 1680
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1685 1690 1695
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1700 1705 1710
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1715 1720 1725
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1730 1735 1740
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1745 1750 1755
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1760 1765 1770
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1775 1780 1785
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1790 1795 1800
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1805 1810 1815
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1820 1825 1830
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1835 1840 1845
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1850 1855 1860
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1865 1870 1875
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1880 1885 1890
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1895 1900 1905
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1910 1915 1920
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1925 1930 1935
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1940 1945 1950
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1955 1960 1965
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1970 1975 1980
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1985 1990 1995
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
2000 2005 2010
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
2015 2020 2025
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
2030 2035 2040
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
2045 2050 2055
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
2060 2065 2070
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
2075 2080 2085
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
2090 2095 2100
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
2105 2110 2115
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
2120 2125 2130
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser
2135 2140 2145
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
2150 2155 2160
Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
2165 2170 2175
<210> 42
<211> 2301
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 42
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys Arg
20 25 30
Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg Arg
35 40 45
Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile Leu
50 55 60
Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile Gln
65 70 75 80
Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg Glu
85 90 95
Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro Leu
100 105 110
Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp Ser
115 120 125
Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His Asn
130 135 140
Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe Ile
145 150 155 160
Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu
165 170 175
Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu
180 185 190
Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu
195 200 205
Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys
210 215 220
Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
225 230 235 240
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys Glu
245 250 255
Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro Pro
260 265 270
Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln Arg
275 280 285
Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys Phe
290 295 300
Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr Tyr
305 310 315 320
Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly Pro
325 330 335
Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala Leu
340 345 350
Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg Arg
355 360 365
Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr Ile
370 375 380
Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr
385 390 395 400
Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp
405 410 415
Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile
420 425 430
Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly
435 440 445
Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn
450 455 460
Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
465 470 475 480
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro Ala
485 490 495
Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg Leu
500 505 510
Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser Ser
515 520 525
Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro Cys
530 535 540
Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys Phe
545 550 555 560
Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg Cys
565 570 575
Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val Arg
580 585 590
Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His Trp
595 600 605
Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly Ser
610 615 620
Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly Ile
625 630 635 640
Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys
645 650 655
Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr
660 665 670
Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val
675 680 685
Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser
690 695 700
Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
705 710 715 720
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu Leu
725 730 735
Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val Gly
740 745 750
Ile Glu Arg Glu Met Glu Ile Pro Ser Thr Gly Gly Ser Gly Gly Ser
755 760 765
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Arg Pro Asp Lys Lys Tyr
770 775 780
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
785 790 795 800
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
805 810 815
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
820 825 830
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
835 840 845
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
850 855 860
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
865 870 875 880
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
885 890 895
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
900 905 910
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
915 920 925
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
930 935 940
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
945 950 955 960
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
965 970 975
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
980 985 990
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
995 1000 1005
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
1010 1015 1020
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
1025 1030 1035
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
1040 1045 1050
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
1055 1060 1065
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
1070 1075 1080
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
1085 1090 1095
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
1100 1105 1110
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
1115 1120 1125
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
1130 1135 1140
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
1145 1150 1155
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
1160 1165 1170
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
1175 1180 1185
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
1190 1195 1200
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
1205 1210 1215
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
1220 1225 1230
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
1235 1240 1245
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
1250 1255 1260
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
1265 1270 1275
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
1280 1285 1290
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
1295 1300 1305
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
1310 1315 1320
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
1325 1330 1335
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
1340 1345 1350
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
1355 1360 1365
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
1370 1375 1380
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
1385 1390 1395
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1400 1405 1410
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
1415 1420 1425
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
1430 1435 1440
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
1445 1450 1455
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
1460 1465 1470
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1475 1480 1485
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1490 1495 1500
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1505 1510 1515
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
1520 1525 1530
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
1535 1540 1545
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
1550 1555 1560
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
1565 1570 1575
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1580 1585 1590
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1595 1600 1605
Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln
1610 1615 1620
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1625 1630 1635
Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1640 1645 1650
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1655 1660 1665
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1670 1675 1680
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1685 1690 1695
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1700 1705 1710
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1715 1720 1725
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1730 1735 1740
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1745 1750 1755
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1760 1765 1770
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1775 1780 1785
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1790 1795 1800
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1805 1810 1815
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1820 1825 1830
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1835 1840 1845
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1850 1855 1860
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1865 1870 1875
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1880 1885 1890
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1895 1900 1905
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1910 1915 1920
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1925 1930 1935
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1940 1945 1950
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1955 1960 1965
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1970 1975 1980
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1985 1990 1995
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
2000 2005 2010
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
2015 2020 2025
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
2030 2035 2040
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
2045 2050 2055
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
2060 2065 2070
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
2075 2080 2085
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
2090 2095 2100
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
2105 2110 2115
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
2120 2125 2130
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser
2135 2140 2145
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
2150 2155 2160
Lys Lys Lys Ser Gly Gly Gly Gly Ser Asp Ala Lys Ser Leu Thr
2165 2170 2175
Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp
2180 2185 2190
Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile
2195 2200 2205
Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser
2210 2215 2220
Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu
2225 2230 2235
Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
2240 2245 2250
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
2255 2260 2265
Gly Gly Gly Gly Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
2270 2275 2280
Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
2285 2290 2295
Asp Tyr Ala
2300
<210> 43
<211> 1932
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 43
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Gly Gly Gly Gly Ser Gly Ser Ala Ala Ile Ala Glu Val Leu
20 25 30
Leu Asn Ala Arg Cys Asp Leu His Ala Val Asn Tyr His Gly Asp Thr
35 40 45
Pro Leu His Ile Ala Ala Arg Glu Ser Tyr His Asp Cys Val Leu Leu
50 55 60
Phe Leu Ser Arg Gly Ala Asn Pro Glu Leu Arg Asn Lys Glu Gly Asp
65 70 75 80
Thr Ala Trp Asp Leu Thr Pro Glu Arg Ser Asp Val Trp Phe Ala Leu
85 90 95
Gln Leu Asn Arg Lys Leu Arg Leu Gly Val Gly Asn Arg Ala Ile Arg
100 105 110
Thr Glu Lys Ile Ile Cys Arg Asp Val Ala Arg Gly Tyr Glu Asn Val
115 120 125
Pro Ile Pro Cys Val Asn Gly Val Asp Gly Glu Pro Cys Pro Glu Asp
130 135 140
Tyr Lys Tyr Ile Ser Glu Asn Cys Glu Thr Ser Thr Met Asn Ile Asp
145 150 155 160
Arg Asn Ile Thr His Leu Gln His Cys Thr Cys Val Asp Asp Cys Ser
165 170 175
Ser Ser Asn Cys Leu Cys Gly Gln Leu Ser Ile Arg Cys Trp Tyr Asp
180 185 190
Lys Asp Gly Arg Leu Leu Gln Glu Phe Asn Lys Ile Glu Pro Pro Leu
195 200 205
Ile Phe Glu Cys Asn Gln Ala Cys Ser Cys Trp Arg Asn Cys Lys Asn
210 215 220
Arg Val Val Gln Ser Gly Ile Lys Val Arg Leu Gln Leu Tyr Arg Thr
225 230 235 240
Ala Lys Met Gly Trp Gly Val Arg Ala Leu Gln Thr Ile Pro Gln Gly
245 250 255
Thr Phe Ile Cys Glu Tyr Val Gly Glu Leu Ile Ser Asp Ala Glu Ala
260 265 270
Asp Val Arg Glu Asp Asp Ser Tyr Leu Phe Asp Leu Asp Asn Lys Asp
275 280 285
Gly Glu Val Tyr Cys Ile Asp Ala Arg Tyr Tyr Gly Asn Ile Ser Arg
290 295 300
Phe Ile Asn His Leu Cys Asp Pro Asn Ile Ile Pro Val Arg Val Phe
305 310 315 320
Met Leu His Gln Asp Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Ser
325 330 335
Arg Asp Ile Arg Thr Gly Glu Glu Leu Gly Phe Asp Tyr Gly Asp Arg
340 345 350
Phe Trp Asp Ile Lys Ser Lys Tyr Phe Thr Cys Gln Cys Gly Ser Glu
355 360 365
Lys Cys Lys His Ser Ala Glu Ala Ile Ala Leu Glu Gln Ser Arg Leu
370 375 380
Ala Arg Leu Asp Pro His Pro Glu Leu Leu Pro Glu Leu Gly Ser Leu
385 390 395 400
Pro Pro Val Asn Thr Gly Gly Gly Gly Ser Gly Asp Lys Lys Tyr Ser
405 410 415
Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr
420 425 430
Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr
435 440 445
Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp
450 455 460
Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg
465 470 475 480
Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe
485 490 495
Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu
500 505 510
Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile
515 520 525
Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr
530 535 540
Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp
545 550 555 560
Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly
565 570 575
His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp
580 585 590
Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu
595 600 605
Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala
610 615 620
Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro
625 630 635 640
Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu
645 650 655
Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala
660 665 670
Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
675 680 685
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys
690 695 700
Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr
705 710 715 720
Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp
725 730 735
Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln
740 745 750
Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly
755 760 765
Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys
770 775 780
Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu
785 790 795 800
Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp
805 810 815
Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile
820 825 830
Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu
835 840 845
Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
850 855 860
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu
865 870 875 880
Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala
885 890 895
Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu
900 905 910
Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
915 920 925
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met
930 935 940
Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
945 950 955 960
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu
965 970 975
Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly
980 985 990
Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu
995 1000 1005
Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
1010 1015 1020
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp
1025 1030 1035
Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
1040 1045 1050
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
1055 1060 1065
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
1070 1075 1080
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
1085 1090 1095
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
1100 1105 1110
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
1115 1120 1125
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
1130 1135 1140
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
1145 1150 1155
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1160 1165 1170
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1175 1180 1185
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1190 1195 1200
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1205 1210 1215
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1220 1225 1230
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1235 1240 1245
Ala Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1250 1255 1260
Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg Gly Lys Ser Asp
1265 1270 1275
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1280 1285 1290
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1295 1300 1305
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1310 1315 1320
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1325 1330 1335
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1340 1345 1350
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1355 1360 1365
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1370 1375 1380
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1385 1390 1395
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1400 1405 1410
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1415 1420 1425
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1430 1435 1440
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1445 1450 1455
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1460 1465 1470
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1475 1480 1485
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1490 1495 1500
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1505 1510 1515
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1520 1525 1530
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1535 1540 1545
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1550 1555 1560
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1565 1570 1575
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1580 1585 1590
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1595 1600 1605
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1610 1615 1620
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1625 1630 1635
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1640 1645 1650
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1655 1660 1665
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1670 1675 1680
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1685 1690 1695
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1700 1705 1710
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1715 1720 1725
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1730 1735 1740
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1745 1750 1755
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1760 1765 1770
Gln Leu Gly Gly Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys
1775 1780 1785
Lys Ala Gly Gln Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser
1790 1795 1800
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
1805 1810 1815
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu
1820 1825 1830
Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn
1835 1840 1845
Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp
1850 1855 1860
Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu
1865 1870 1875
Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe
1880 1885 1890
Glu Ile Lys Ser Ser Val Gly Gly Gly Gly Ser Gly Lys Arg Pro
1895 1900 1905
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1910 1915 1920
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1925 1930
<210> 44
<211> 1542
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 44
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Gly Gly Gly Gly Ser Ser Arg Arg Lys Gln Ser Asn Pro Arg
20 25 30
Gln Ile Lys Arg Ser Leu Gly Asp Met Glu Ala Arg Glu Glu Val Gln
35 40 45
Leu Val Gly Ala Ser His Met Glu Gln Lys Ala Thr Ala Pro Glu Ala
50 55 60
Pro Ser Pro Gly Gly Gly Gly Ser Gly Asp Lys Lys Tyr Ser Ile Gly
65 70 75 80
Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu
85 90 95
Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg
100 105 110
His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly
115 120 125
Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr
130 135 140
Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn
145 150 155 160
Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser
165 170 175
Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly
180 185 190
Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr
195 200 205
His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg
210 215 220
Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe
225 230 235 240
Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu
245 250 255
Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro
260 265 270
Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu
275 280 285
Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu
290 295 300
Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu
305 310 315 320
Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu
325 330 335
Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala
340 345 350
Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu
355 360 365
Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile
370 375 380
Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His
385 390 395 400
His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro
405 410 415
Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala
420 425 430
Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile
435 440 445
Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys
450 455 460
Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly
465 470 475 480
Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
485 490 495
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile
500 505 510
Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala
515 520 525
Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr
530 535 540
Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala
545 550 555 560
Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn
565 570 575
Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val
580 585 590
Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys
595 600 605
Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu
610 615 620
Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr
625 630 635 640
Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu
645 650 655
Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile
660 665 670
Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu
675 680 685
Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile
690 695 700
Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met
705 710 715 720
Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
725 730 735
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu
740 745 750
Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu
755 760 765
Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln
770 775 780
Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
785 790 795 800
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val
805 810 815
Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val
820 825 830
Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn
835 840 845
Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
850 855 860
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
865 870 875 880
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
885 890 895
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala
900 905 910
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val
915 920 925
Leu Thr Arg Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser
930 935 940
Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn
945 950 955 960
Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
965 970 975
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
980 985 990
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp
995 1000 1005
Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg
1010 1015 1020
Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe
1025 1030 1035
Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr
1040 1045 1050
His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala
1055 1060 1065
Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly
1070 1075 1080
Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu
1085 1090 1095
Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1100 1105 1110
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1115 1120 1125
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu
1130 1135 1140
Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val
1145 1150 1155
Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln
1160 1165 1170
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1175 1180 1185
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr
1190 1195 1200
Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1205 1210 1215
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1220 1225 1230
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys
1235 1240 1245
Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys
1250 1255 1260
Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
1265 1270 1275
Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln
1280 1285 1290
Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
1295 1300 1305
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp
1310 1315 1320
Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu
1325 1330 1335
Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1340 1345 1350
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1355 1360 1365
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His
1370 1375 1380
Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr
1385 1390 1395
Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu
1400 1405 1410
Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1415 1420 1425
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly
1430 1435 1440
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1445 1450 1455
Lys Ser Gly Gly Gly Gly Ser Ser Arg Arg Lys Gln Ser Asn Pro
1460 1465 1470
Arg Gln Ile Lys Arg Ser Leu Gly Asp Met Glu Ala Arg Glu Glu
1475 1480 1485
Val Gln Leu Val Gly Ala Ser His Met Glu Gln Lys Ala Thr Ala
1490 1495 1500
Pro Glu Ala Pro Ser Pro Gly Gly Gly Gly Ser Gly Lys Arg Pro
1505 1510 1515
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1520 1525 1530
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1535 1540
<210> 45
<211> 4101
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 45
gacaagaagt acagcatcgg cctggccatc ggcaccaaca gcgtgggctg ggccgtgatc 60
accgacgagt acaaggtgcc cagcaagaag ttcaaggtgc tgggcaacac cgaccggcac 120
agcatcaaga agaacctgat cggcgccctg ctgttcgaca gcggcgagac cgccgaggcc 180
acccggctga agcggaccgc ccggcggcgg tacacccggc ggaagaaccg gatctgctac 240
ctgcaggaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccaccggctg 300
gaggagagct tcctggtgga ggaggacaag aagcacgagc ggcaccccat cttcggcaac 360
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gcggaagaag 420
ctggtggaca gcaccgacaa ggccgacctg cggctgatct acctggccct ggcccacatg 480
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga gaaccccatc 600
aacgccagcg gcgtggacgc caaggccatc ctgagcgccc ggctgagcaa gagccggcgg 660
ctggagaacc tgatcgccca gctgcccggc gagaagaaga acggcctgtt cggcaacctg 720
atcgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggac 780
gccaagctgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840
atcggcgacc agtacgccga cctgttcctg gccgccaaga acctgagcga cgccatcctg 900
ctgagcgaca tcctgcgggt gaacaccgag atcaccaagg cccccctgag cgccagcatg 960
atcaagcggt acgacgagca ccaccaggac ctgaccctgc tgaaggccct ggtgcggcag 1020
cagctgcccg agaagtacaa ggagatcttc ttcgaccaga gcaagaacgg ctacgccggc 1080
tacatcgacg gcggcgccag ccaggaggag ttctacaagt tcatcaagcc catcctggag 1140
aagatggacg gcaccgagga gctgctggtg aagctgaacc gggaggacct gctgcggaag 1200
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggcga gctgcacgcc 1260
atcctgcggc ggcaggagga cttctacccc ttcctgaagg acaaccggga gaagatcgag 1320
aagatcctga ccttccggat cccctactac gtgggccccc tggcccgggg caacagccgg 1380
ttcgcctgga tgacccggaa atccgaggag accatcaccc cctggaactt cgaggaggtg 1440
gtggacaagg gcgccagcgc ccagagcttc atcgagcgga tgaccaactt cgacaagaac 1500
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtac 1560
aacgagctga ccaaggtgaa gtacgtgacc gagggcatgc ggaagcccgc cttcctgagc 1620
ggcgagcaga agaaggccat cgtggacctg ctgttcaaga ccaaccggaa ggtgaccgtg 1680
aagcagctga aggaggacta cttcaagaag atcgagtgct tcgacagcgt ggagatcagc 1740
ggcgtggagg accggttcaa cgccagcctg ggcacctacc acgacctgct gaagatcatc 1800
aaggacaagg acttcctgga caacgaggag aacgaggaca tcctggagga catcgtgctg 1860
accctgaccc tgttcgagga ccgggagatg atcgaggagc ggctgaaaac ctacgcccac 1920
ctgttcgacg acaaggtgat gaagcagctg aagcggcggc ggtacaccgg ctggggccgg 1980
ctgagccgga agctgatcaa cggcatccgg gacaagcaga gcggcaagac catcctggac 2040
ttcctgaaat ccgacggctt cgccaaccgg aacttcatgc agctgatcca cgacgacagc 2100
ctgaccttca aggaggacat ccagaaggcc caggtgagcg gccagggcga cagcctgcac 2160
gagcacatcg ccaacctggc cggcagcccc gccatcaaga agggcatcct gcagaccgtg 2220
aaggtggtgg acgagctggt gaaggtgatg ggccggcaca agcccgagaa catcgtgatc 2280
gagatggccc gggagaacca gaccacccag aagggccaga agaacagccg ggagcggatg 2340
aagcggatcg aggagggcat caaggagctg ggcagccaga tcctgaagga gcaccccgtg 2400
gagaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa cggccgggac 2460
atgtacgtgg accaggagct ggacatcaac cggctgagcg actacgacgt ggccgccatc 2520
gtgccccaga gcttcctgaa ggacgacagc atcgacaaca aggtgctgac ccggagcgac 2580
aaggcccggg gcaagagcga caacgtgccc agcgaggagg tggtgaagaa gatgaagaac 2640
tactggcggc agctgctgaa cgccaagctg atcacccagc ggaagttcga caacctgacc 2700
aaggccgagc ggggcggcct gagcgagctg gacaaggccg gcttcatcaa gcggcagctg 2760
gtggagaccc ggcagatcac caagcacgtg gcccagatcc tggacagccg gatgaacacc 2820
aagtacgacg agaacgacaa gctgatccgg gaggtgaagg tgatcaccct gaaatccaag 2880
ctggtgagcg acttccggaa ggacttccag ttctacaagg tgcgggagat caacaactac 2940
caccacgccc acgacgccta cctgaacgcc gtggtgggca ccgccctgat caagaagtac 3000
cccaagctgg agagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga gatcggcaag gccaccgcca agtacttctt ctacagcaac 3120
atcatgaact tcttcaagac cgagatcacc ctggccaacg gcgagatccg gaagcggccc 3180
ctgatcgaga ccaacggcga gaccggcgag atcgtgtggg acaagggccg ggacttcgcc 3240
accgtgcgga aggtgctgag catgccccag gtgaacatcg tgaagaaaac cgaggtgcag 3300
accggcggct tcagcaagga gagcatcctg cccaagcgga acagcgacaa gctgatcgcc 3360
cggaagaagg actgggaccc caagaagtac ggcggcttcg acagccccac cgtggcctac 3420
agcgtgctgg tggtggccaa ggtggagaag ggcaagagca agaagctgaa atccgtgaag 3480
gagctgctgg gcatcaccat catggagcgg agcagcttcg agaagaaccc catcgacttc 3540
ctggaggcca agggctacaa ggaggtgaag aaggacctga tcatcaagct gcccaagtac 3600
agcctgttcg agctggagaa cggccggaag cggatgctgg ccagcgccgg cgagctgcag 3660
aagggcaacg agctggccct gcccagcaag tacgtgaact tcctgtacct ggccagccac 3720
tacgagaagc tgaagggcag ccccgaggac aacgagcaga agcagctgtt cgtggagcag 3780
cacaagcact acctggacga gatcatcgag cagatcagcg agttcagcaa gcgggtgatc 3840
ctggccgacg ccaacctgga caaggtgctg agcgcctaca acaagcaccg ggacaagccc 3900
atccgggagc aggccgagaa catcatccac ctgttcaccc tgaccaacct gggcgccccc 3960
gccgccttca agtacttcga caccaccatc gaccggaagc ggtacaccag caccaaggag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac ccggatcgac 4080
ctgagccagc tgggcggcga c 4101
<210> 46
<211> 1367
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 46
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 47
<211> 1155
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
MQ1阻遏物结构域序列
<400> 47
agcaaggtgg agaacaagac caagaagctg cgggtgttcg aggccttcgc cggcatcggc 60
gcccagcgga aggccctgga gaaggtgcgg aaggacgagt acgagatcgt gggcctggcc 120
gagtggtacg tgcccgccat cgtgatgtac caggccatcc acaacaactt ccacaccaag 180
ctggagtaca agagcgtgag ccgggaggag atgatcgact acctggagaa caagaccctg 240
agctggaaca gcaagaaccc cgtgagcaac ggctactgga agcggaagaa ggacgacgag 300
ctgaagatca tctacaacgc catcaagctg agcgagaagg agggcaacat cttcgacatc 360
cgggacctgt acaagcggac cctgaagaac atcgacctgc tgacctacag cttcccctgc 420
caggacctga gccagcaggg catccagaag ggcatgaagc ggggcagcgg cacccggagc 480
ggcctgctgt gggagatcga gcgggccctg gacagcaccg agaagaacga cctgcccaag 540
tacctgctga tggagaacgt gggcgccctg ctgcacaaga agaacgagga ggagctgaac 600
cagtggaagc agaagctgga gagcctgggc taccagaaca gcatcgaggt gctgaacgcc 660
gccgacttcg gcagcagcca ggcccggcgg cgggtgttca tgatcagcac cctgaacgag 720
ttcgtggagc tgcccaaggg cgacaagaag cccaagagca tcaagaaggt gctgaacaag 780
atcgtgagcg agaaggacat cctgaacaac ctgctgaagt acaacctgac cgagttcaag 840
aaaaccaaga gcaacatcaa caaggccagc ctgatcggct acagcaagtt caacagcgag 900
ggctacgtgt acgaccccga gttcaccggc cccaccctga ccgccagcgg cgccaacagc 960
cggatcaaga tcaaggacgg cagcaacatc cggaagatga acagcgacga gaccttcctg 1020
tacatcggct tcgacagcca ggacggcaag cgggtgaacg agatcgagtt cctgaccgag 1080
aaccagaaga tcttcgtgtg cggcaacagc atcagcgtgg aggtgctgga ggccatcatc 1140
gacaagatcg gcggc 1155
<210> 48
<211> 1440
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
DNMT1序列
<400> 48
gtggatctga ggacactcga cgtgtttagc ggatgcggcg gactctccga aggcttccac 60
caagccggaa tttccgacac actctgggcc attgagatgt gggaccccgc cgctcaagcc 120
ttcagactga ataatcccgg ctccaccgtg ttcaccgagg actgcaacat tctgctgaag 180
ctggtgatgg ctggcgaaac caccaactct agaggccaga ggctgcccca gaagggagat 240
gtggaaatgc tctgtggagg ccctccttgc caaggcttct ccggcatgaa caggttcaac 300
tctagaacat acagcaagtt caagaactct ctggtcgtga gctttctgag ctactgcgac 360
tactatagac ctaggttctt tctgctggag aacgtgagaa atttcgtgtc cttcaagagg 420
agcatggtgc tgaagctgac actgaggtgt ctggtgagga tgggctacca gtgcacattc 480
ggagtgctgc aagctggcca gtacggcgtg gcccagacca gaaggagggc catcattctg 540
gctgctgccc ccggcgagaa actccctctg ttccccgagc ccctccacgt gttcgcccct 600
agagcttgcc agctgagcgt ggtggtcgac gataagaagt tcgtgagcaa catcacaagg 660
ctgtccagcg gacccttcag aaccattacc gtgagggata ccatgtccga cctccccgag 720
gtgaggaatg gcgccagcgc tctggagatt tcctacaacg gcgaacctca gagctggttc 780
caaaggcagc tgagaggcgc tcagtatcag cccattctga gggaccacat ctgcaaagat 840
atgagcgctc tggtggccgc tagaatgaga catattcctc tggcccccgg cagcgactgg 900
agagatctgc ccaatattga ggtgagactc agcgacggaa caatggctag aaaactgagg 960
tacacccatc atgatagaaa gaacggaagg agcagcagcg gcgctctgag aggagtgtgt 1020
agctgcgtgg aagctggcaa ggcttgcgat cccgccgcta ggcagttcaa taccctcatc 1080
ccttggtgtc tgcctcacac cggcaacaga cacaatcatt gggctggact gtatggaagg 1140
ctcgaatggg acggcttttt cagcaccacc gtgaccaatc ccgaacctat gggcaagcaa 1200
ggaagggtgc tccaccccga gcagcataga gtcgtgtccg tgagagaatg cgctagaagc 1260
caaggcttcc ccgacaccta tagactgttc ggcaacattc tggataagca cagacaagtg 1320
ggaaatgctg tccctcctcc tctggccaag gctatcggac tggagatcaa gctgtgtatg 1380
ctcgccaaag ctagggagag cgcttccgcc aagattaagg aggaggaggc cgccaaggac 1440
<210> 49
<211> 1626
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
DNMT3a/3L序列
<400> 49
aaccacgacc aggagttcga cccccccaag gtgtaccccc ccgtgcccgc cgagaagcgg 60
aagcccatcc gggtgctgag cctgttcgac ggcatcgcca ccggcctgct ggtgctgaag 120
gacctgggca tccaggtgga ccggtacatc gccagcgagg tgtgcgagga cagcatcacc 180
gtgggcatgg tgcggcacca gggcaagatc atgtacgtgg gcgacgtgcg gagcgtgacc 240
cagaagcaca tccaggagtg gggccccttc gacctggtga tcggcggcag cccctgcaac 300
gacctgagca tcgtgaaccc cgcccggaag ggcctgtacg agggcaccgg ccggctgttc 360
ttcgagttct accggctgct gcacgacgcc cggcccaagg agggcgacga ccggcccttc 420
ttctggctgt tcgagaacgt ggtggccatg ggcgtgagcg acaagcggga catcagccgg 480
ttcctggaga gcaaccccgt gatgatcgac gccaaggagg tgagcgccgc ccaccgggcc 540
cggtacttct ggggcaacct gcccggcatg aaccggcccc tggccagcac cgtgaacgac 600
aagctggagc tgcaggagtg cctggagcac ggccggatcg ccaagttcag caaggtgcgg 660
accatcacca cccggagcaa cagcatcaag cagggcaagg accagcactt ccccgtgttc 720
atgaacgaga aggaggacat cctgtggtgc accgagatgg agcgggtgtt cggcttcccc 780
gtgcactaca ccgacgtgag caacatgagc cggctggccc ggcagcggct gctgggccgg 840
agctggagcg tgcccgtgat ccggcacctg ttcgcccccc tgaaggagta cttcgcctgc 900
gtgagcagcg gcaacagcaa cgccaacagc cggggcccca gcttcagcag cggcctggtg 960
cccctgagcc tgcggggcag ccacatgaat cctctggaga tgttcgagac agtgcccgtg 1020
tggagaaggc aacccgtgag ggtgctgagc ctcttcgagg acattaagaa ggagctgacc 1080
tctctgggct ttctggaatc cggcagcgac cccggccagc tgaaacacgt ggtggacgtg 1140
accgacacag tgaggaagga cgtggaagag tggggcccct ttgacctcgt gtatggagcc 1200
acacctcctc tcggccacac atgcgatagg cctcccagct ggtatctctt ccagttccac 1260
agactgctcc agtacgccag acctaagccc ggcagcccca gacccttctt ctggatgttc 1320
gtggacaatc tggtgctgaa caaggaggat ctggatgtgg ccagcagatt tctggagatg 1380
gaacccgtga caatccccga cgtgcatggc ggctctctgc agaacgccgt gagagtgtgg 1440
tccaacatcc ccgccattag aagcagacac tgggctctgg tgagcgagga ggaactgtct 1500
ctgctggccc agaataagca gtcctccaag ctggccgcca agtggcccac caagctggtg 1560
aagaactgct ttctgcctct gagggagtat ttcaagtatt tcagcaccga actgaccagc 1620
agcctg 1626
<210> 50
<211> 1629
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
DNMT3a/3L序列
<400> 50
aaccacgacc aggagttcga cccccccaag gtgtaccccc ccgtgcccgc cgagaagcgg 60
aagcccatcc gggtgctgag cctgttcgac ggcatcgcca ccggcctgct ggtgctgaag 120
gacctgggca tccaggtgga ccggtacatc gccagcgagg tgtgcgagga cagcatcacc 180
gtgggcatgg tgcggcacca gggcaagatc atgtacgtgg gcgacgtgcg gagcgtgacc 240
cagaagcaca tccaggagtg gggccccttc gacctggtga tcggcggcag cccctgcaac 300
gacctgagca tcgtgaaccc cgcccggaag ggcctgtacg agggcaccgg ccggctgttc 360
ttcgagttct accggctgct gcacgacgcc cggcccaagg agggcgacga ccggcccttc 420
ttctggctgt tcgagaacgt ggtggccatg ggcgtgagcg acaagcggga catcagccgg 480
ttcctggaga gcaaccccgt gatgatcgac gccaaggagg tgagcgccgc ccaccgggcc 540
cggtacttct ggggcaacct gcccggcatg aaccggcccc tggccagcac cgtgaacgac 600
aagctggagc tgcaggagtg cctggagcac ggccggatcg ccaagttcag caaggtgcgg 660
accatcacca cccggagcaa cagcatcaag cagggcaagg accagcactt ccccgtgttc 720
atgaacgaga aggaggacat cctgtggtgc accgagatgg agcgggtgtt cggcttcccc 780
gtgcactaca ccgacgtgag caacatgagc cggctggccc ggcagcggct gctgggccgg 840
agctggagcg tgcccgtgat ccggcacctg ttcgcccccc tgaaggagta cttcgcctgc 900
gtgagcagcg gcaacagcaa cgccaacagc cggggcccca gcttcagcag cggcctggtg 960
cccctgagcc tgcggggcag ccacatgggc cccatggaga tctacaagac cgtgagcgcc 1020
tggaagcggc agcccgtgcg ggtgctgagc ctgttccgga acatcgacaa ggtgctgaaa 1080
tccctgggct tcctggagag cggcagcggc agcggcggcg gcaccctgaa gtacgtggag 1140
gacgtgacca acgtggtgcg gcgggacgtg gagaagtggg gccccttcga cctggtgtac 1200
ggcagcaccc agcccctggg cagcagctgc gaccggtgcc ccggctggta catgttccag 1260
ttccaccgga tcctgcagta cgccctgccc cggcaggaga gccagcggcc cttcttctgg 1320
atcttcatgg acaacctgct gctgaccgag gacgaccagg agaccaccac ccggttcctg 1380
cagaccgagg ccgtgaccct gcaggacgtg cggggccggg actaccagaa cgccatgcgg 1440
gtgtggagca acatccccgg cctgaaatcc aagcacgccc ccctgacccc caaggaggag 1500
gagtacctgc aggcccaggt gcggagccgg agcaagctgg acgcccccaa ggtggacctg 1560
ctggtgaaga actgcctgct gcccctgcgg gagtacttca agtacttcag ccagaacagc 1620
ctgcccctg 1629
<210> 51
<211> 288
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
KRAB序列
<400> 51
gacgccaaga gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg 60
gacttcaccc gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac 120
gtgatgctgg agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac 180
gtgatcctgc ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag 240
gagacccacc ccgacagcga gaccgccttc gagatcaaga gcagcgtg 288
<210> 52
<211> 846
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
G9A序列
<400> 52
ggaaataggg ctatcagaac cgagaagatc atctgtaggg acgtggctag aggctacgag 60
aacgtgccca ttccttgcgt gaatggcgtg gatggcgaac cttgccccga ggactacaaa 120
tacatctccg agaactgcga aaccagcaca atgaacatcg acagaaacat cacccacctc 180
cagcactgca catgtgtgga tgactgctcc tccagcaact gtctgtgcgg ccagctctcc 240
atcagatgct ggtacgacaa ggacggcaga ctgctgcaag agttcaacaa gatcgaaccc 300
cctctcatct tcgagtgtaa ccaagcttgc agctgctgga gaaactgcaa gaatagagtg 360
gtccagagcg gcatcaaggt gagactgcaa ctgtacagaa ccgccaagat gggatgggga 420
gtgagggctc tgcaaaccat tccccaaggc accttcatct gcgaatacgt gggcgaactg 480
atctccgacg ccgaagctga cgtgagagag gacgacagct atctcttcga tctggacaat 540
aaggacggcg aggtgtactg catcgacgct agatattacg gcaacatctc tagattcatc 600
aaccacctct gcgatcccaa catcattccc gtgagggtgt tcatgctgca ccaagatctg 660
aggttcccta gaatcgcctt cttcagctct agagacatca gaaccggcga ggagctgggc 720
ttcgattacg gcgatagatt ctgggacatc aagtccaagt acttcacatg ccagtgcggc 780
agcgagaagt gtaagcacag cgctgaggcc attgctctgg agcagtctag actggccaga 840
ctggat 846
<210> 53
<211> 1128
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
HDAC8序列
<400> 53
gaggagcccg aggagcccgc cgatagcgga caatctctgg tgcccgtcta catctacagc 60
cccgaatatg tgagcatgtg tgattccctc gccaagatcc ctaagagagc cagcatggtg 120
cattctctga tcgaggccta cgctctgcat aagcaaatga ggatcgtgaa gcccaaggtc 180
gccagcatgg aagagatggc cacctttcac accgatgcct acctccaaca tctccagaag 240
gtgtcccaag agggcgacga cgaccacccc gactccattg agtacggact gggctatgat 300
tgccccgcca ccgagggcat ctttgactat gccgccgcta tcggcggagc taccatcaca 360
gccgcccagt gtctgattga tggcatgtgc aaggtcgcca tcaactggtc cggaggctgg 420
catcatgcca agaaggatga ggcctccggc ttctgttatc tgaatgacgc cgtgctgggc 480
attctgagac tgaggaggaa attcgagagg attctgtacg tggatctgga tctgcatcac 540
ggagatggag tcgaagatgc cttcagcttc accagcaagg tgatgacagt ctctctgcac 600
aagttctccc ccggcttctt tcccggaacc ggcgacgtgt ccgacgtggg actgggcaag 660
ggaaggtact acagcgtgaa cgtgcccatt caagacggca tccaagacga gaagtactac 720
cagatctgcg agtccgtgct caaggaggtc taccaagcct tcaatcctaa ggctgtcgtg 780
ctccaactgg gagctgatac cattgctggc gatcccatgt gcagcttcaa tatgacaccc 840
gtcggaatcg gcaagtgcct caagtacatc ctccagtggc agctcgccac cctcattctc 900
ggaggaggcg gatacaatct ggctaatacc gccagatgct ggacctatct gaccggcgtg 960
attctgggca aaacactgag cagcgaaatc cccgaccacg agtttttcac cgcttacggc 1020
cccgactacg tgctggagat cacccccagc tgcagacccg atagaaacga accccataga 1080
atccagcaaa ttctgaacta tatcaagggc aacctcaagc acgtcgtg 1128
<210> 54
<211> 2553
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
LSD1序列
<400> 54
ctctccggaa agaaagccgc cgctgccgct gccgccgctg ctgctgccgc taccggcaca 60
gaagctggcc ccggaacagc tggcggaagc gaaaacggaa gcgaagtggc tgcccagccc 120
gccggactgt ccggacccgc cgaggtggga cccggcgctg tcggcgaaag gacccccaga 180
aaaaaggagc ctcctagagc cagccctccc ggcggactcg ccgaacctcc cggcagcgct 240
ggacctcaag ccggacctac agtggtgccc ggcagcgcta cacctatgga gaccggcatc 300
gctgagaccc ccgagggaag gagaaccagc agaaggaaga gagccaaggt ggagtacaga 360
gagatggatg agtctctggc taacctcagc gaggacgagt actactccga ggaggaaagg 420
aatgccaagg ccgagaagga gaagaagctg ccccctcctc cccctcaagc cccccccgag 480
gaggagaacg agtccgagcc cgaggaaccc agcggagtgg aaggagccgc ctttcagtcc 540
agactgcccc acgacagaat gacatcccaa gaggccgctt gctttcccga cattatttcc 600
ggccctcagc agacccagaa ggtgtttctg ttcattagaa atagaacact ccagctgtgg 660
ctcgacaacc ccaagatcca gctgaccttc gaggctaccc tccaacagct ggaggccccc 720
tacaatagcg ataccgtgct ggtgcacaga gtgcacagct atctggagag gcacggcctc 780
attaacttcg gcatttacaa gcggatcaag cccctgccca ccaagaaaac aggcaaggtg 840
atcatcatcg gcagcggcgt gagcggcctg gccgccgccc ggcagctgca gagcttcggc 900
atggacgtga ccctgctgga ggcccgggac cgggtgggcg gccgggtggc caccttccgg 960
aagggcaact acgtggccga cctgggcgcc atggtggtga ccggcctggg cggcaacccc 1020
atggccgtgg tgagcaagca ggtgaacatg gagctggcca agatcaagca gaagtgcccc 1080
ctgtacgagg ccaacggcca ggccgtgccc aaggagaagg acgagatggt ggagcaggag 1140
ttcaaccggc tgctggaggc caccagctac ctgagccacc agctggactt caacgtgctg 1200
aacaacaagc acgtgagcct gggccaggcc ctggaggtgg tgatccagct gcaggagaag 1260
cacgtgaagg acgagcagat cgagcactgg aagaagatcg tgaaaacaca ggaggagctg 1320
aaggagctgc tgaacaagat ggtgaacctg aaggagaaga tcaaggagct gcaccagcag 1380
tacaaggagg ccagcgaggt gaagcccccc cgggacatca ccgccgagtt cctggtcaaa 1440
agcaagcacc gggacctgac cgccctgtgc aaggagtacg acgagctggc cgagacccag 1500
ggcaagctgg aggagaagct gcaggagctg gaggccaacc cccccagcga cgtgtacctg 1560
agcagccggg accggcagat cctggactgg cacttcgcca acctggagtt cgccaacgcc 1620
acccccctga gcaccctgag cctgaagcac tgggaccagg acgacgactt cgagttcacc 1680
ggcagccacc tgaccgtgcg gaacggctac agctgcgtgc ccgtggccct ggccgagggc 1740
ctggacatca agctgaacac cgccgtgcgg caggtgcggt acaccgccag cggctgcgag 1800
gtgatcgccg tgaacacccg gagcaccagc cagaccttca tctacaagtg cgacgccgtg 1860
ctgtgcaccc tgcccctggg cgtgctgaag cagcagcccc ccgccgtgca gttcgtgccc 1920
cccctgcccg agtggaaaac aagcgccgtg cagcggatgg gcttcggcaa cctgaacaag 1980
gtggtgctgt gcttcgaccg ggtgttctgg gaccccagcg tgaacctgtt cggccacgtg 2040
ggcagcacca ccgccagccg gggcgagctg ttcctgttct ggaacctgta caaggccccc 2100
atcctgctgg ccctggtggc cggcgaggcc gccggcatca tggagaacat cagcgacgac 2160
gtgatcgtgg gccggtgcct ggccatcctg aagggcatct tcggcagcag cgccgtgccc 2220
cagcccaagg agaccgtggt gagccggtgg cgggccgacc cctgggcccg gggcagctac 2280
agctacgtgg ccgccggcag cagcggcaac gactacgacc tgatggccca gcccatcacc 2340
cccggcccca gcatccccgg cgccccccag cccatccccc ggctgttctt cgccggcgag 2400
cacaccatcc ggaactaccc cgccaccgtg cacggcgccc tgctgagcgg cctgcgggag 2460
gcaggacgga tcgccgacca gttcctgggc gccatgtaca ccctgccccg gcaggccacc 2520
cccggcgtgc ccgcccagca gagccccagc atg 2553
<210> 55
<211> 2235
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
EZH2序列
<400> 55
ggccagaccg gcaagaagag cgagaagggc cccgtgtgct ggcggaagcg ggtgaagagc 60
gagtacatgc ggctgcggca gctgaagcgg ttccggcggg ccgacgaggt gaagagcatg 120
ttcagcagca accggcagaa gatcctggag cggaccgaga tcctgaacca ggagtggaag 180
cagcggcgaa tccagcccgt gcacatcctg accagcgtga gcagcctgcg gggcacccgg 240
gagtgcagcg tgaccagcga cctggacttc cccacccagg tgatccccct aaagaccctg 300
aacgccgtgg ccagcgtgcc catcatgtac agctggagcc ccctgcagca gaacttcatg 360
gtggaggacg agaccgtgct gcacaacatc ccctacatgg gcgacgaggt gctggaccag 420
gacggcacct tcatcgagga gctgatcaag aactacgacg gcaaggtgca cggcgaccgg 480
gagtgcggct tcatcaacga cgagatcttc gtggagctgg tgaacgccct gggccagtac 540
aacgacgacg acgacgacga cgacggcgac gaccccgagg agcgggagga gaagcagaag 600
gacctggagg accaccggga cgacaaggag agccggcccc cccggaagtt ccccagcgac 660
aagatcttcg aggccatcag cagcatgttc cccgacaagg gcaccgccga ggagctgaag 720
gagaagtaca aggagctgac cgagcagcag ctgcccggcg ccctgccccc cgagtgcacc 780
cccaacatcg acggccccaa cgccaagagc gtgcagcggg agcagagcct gcacagcttc 840
cacaccctgt tctgccggcg gtgcttcaag tacgactgct tcctgcaccc cttccacgcc 900
acccccaaca cctacaagcg gaagaacacc gagaccgccc tggacaacaa gccctgcggc 960
ccccagtgct accagcacct ggagggcgcc aaggagttcg ccgccgccct gaccgccgag 1020
cggatcaaga ccccccccaa gcggcccggc ggccggcggc ggggccggct gcccaacaac 1080
agcagccggc ccagcacccc caccatcaac gtgctggaga gcaaggacac cgacagcgac 1140
cgggaggccg gcaccgagac cggcggcgag aacaacgaca aggaggagga ggagaagaag 1200
gacgagacca gcagcagcag cgaggccaac agccggtgcc agacccccat caagatgaag 1260
cccaacatcg agccccccga gaacgtggag tggagcggcg ccgaggccag catgttccgg 1320
gtgctgatcg gcacctacta cgacaacttc tgcgccatcg cccggctgat cggcaccaag 1380
acctgccggc aggtgtacga gttccgggtg aaggagagca gcatcatcgc ccccgccccc 1440
gccgaggacg tggacacccc cccccggaag aagaagcgga agcaccggct gtgggccgcc 1500
cactgccgga agatccagct gaagaaggac ggcagcagca accacgtgta caactaccag 1560
ccctgcgacc acccccggca gccctgcgac agcagctgcc cctgcgtgat cgcccagaac 1620
ttctgcgaga agttctgcca gtgcagcagc gagtgccaga accggttccc cggctgccgg 1680
tgcaaggccc agtgcaacac caagcagtgc ccctgctacc tggccgtgcg ggagtgcgac 1740
cccgacctgt gcctgacctg cggcgccgcc gaccactggg acagcaagaa cgtgagctgc 1800
aagaactgca gcatccagcg gggcagcaag aagcacctgc tgctggcccc cagcgacgtg 1860
gccggctggg gcatcttcat caaggacccc gtgcagaaga acgagttcat cagcgagtac 1920
tgcggcgaga tcatcagcca ggacgaggcc gaccggcggg gcaaggtgta cgacaagtac 1980
atgtgcagct tcctgttcaa cctgaacaac gacttcgtgg tggacgccac ccggaagggc 2040
aacaagatcc ggttcgccaa ccacagcgtg aaccccaact gctacgccaa ggtgatgatg 2100
gtgaacggcg accaccggat cggcatcttc gccaagcggg ccatccagac cggcgaggag 2160
ctgttcttcg actaccggta cagccaggcc gacgccctga agtacgtggg catcgagcgg 2220
gagatggaga tcccc 2235
<210> 56
<211> 132
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
FOG1序列
<400> 56
agcagaagga agcagagcaa ccccagacaa atcaagagat ctctgggcga catggaggcc 60
agagaggaag tgcagctggt gggcgccagc cacatggagc agaaggctac agcccccgag 120
gcccccagcc cc 132
<210> 57
<211> 385
<212> PRT
<213> 单比亚螺原体(Spiroplasma monobiae)
<400> 57
Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val Phe Glu Ala Phe
1 5 10 15
Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys Val Arg Lys Asp
20 25 30
Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val Pro Ala Ile Val
35 40 45
Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys Leu Glu Tyr Lys
50 55 60
Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu
65 70 75 80
Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys
85 90 95
Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu
100 105 110
Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu
115 120 125
Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser
130 135 140
Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser
145 150 155 160
Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys Asn
165 170 175
Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu Leu His
180 185 190
Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys Leu Glu Ser
195 200 205
Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala Ala Asp Phe Gly
210 215 220
Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser Thr Leu Asn Glu
225 230 235 240
Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys Ser Ile Lys Lys
245 250 255
Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu Asn Asn Leu Leu
260 265 270
Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser Asn Ile Asn Lys
275 280 285
Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr
290 295 300
Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser
305 310 315 320
Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp
325 330 335
Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val
340 345 350
Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly
355 360 365
Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly
370 375 380
Gly
385
<210> 58
<211> 480
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:
DNMT1序列
<400> 58
Val Asp Leu Arg Thr Leu Asp Val Phe Ser Gly Cys Gly Gly Leu Ser
1 5 10 15
Glu Gly Phe His Gln Ala Gly Ile Ser Asp Thr Leu Trp Ala Ile Glu
20 25 30
Met Trp Asp Pro Ala Ala Gln Ala Phe Arg Leu Asn Asn Pro Gly Ser
35 40 45
Thr Val Phe Thr Glu Asp Cys Asn Ile Leu Leu Lys Leu Val Met Ala
50 55 60
Gly Glu Thr Thr Asn Ser Arg Gly Gln Arg Leu Pro Gln Lys Gly Asp
65 70 75 80
Val Glu Met Leu Cys Gly Gly Pro Pro Cys Gln Gly Phe Ser Gly Met
85 90 95
Asn Arg Phe Asn Ser Arg Thr Tyr Ser Lys Phe Lys Asn Ser Leu Val
100 105 110
Val Ser Phe Leu Ser Tyr Cys Asp Tyr Tyr Arg Pro Arg Phe Phe Leu
115 120 125
Leu Glu Asn Val Arg Asn Phe Val Ser Phe Lys Arg Ser Met Val Leu
130 135 140
Lys Leu Thr Leu Arg Cys Leu Val Arg Met Gly Tyr Gln Cys Thr Phe
145 150 155 160
Gly Val Leu Gln Ala Gly Gln Tyr Gly Val Ala Gln Thr Arg Arg Arg
165 170 175
Ala Ile Ile Leu Ala Ala Ala Pro Gly Glu Lys Leu Pro Leu Phe Pro
180 185 190
Glu Pro Leu His Val Phe Ala Pro Arg Ala Cys Gln Leu Ser Val Val
195 200 205
Val Asp Asp Lys Lys Phe Val Ser Asn Ile Thr Arg Leu Ser Ser Gly
210 215 220
Pro Phe Arg Thr Ile Thr Val Arg Asp Thr Met Ser Asp Leu Pro Glu
225 230 235 240
Val Arg Asn Gly Ala Ser Ala Leu Glu Ile Ser Tyr Asn Gly Glu Pro
245 250 255
Gln Ser Trp Phe Gln Arg Gln Leu Arg Gly Ala Gln Tyr Gln Pro Ile
260 265 270
Leu Arg Asp His Ile Cys Lys Asp Met Ser Ala Leu Val Ala Ala Arg
275 280 285
Met Arg His Ile Pro Leu Ala Pro Gly Ser Asp Trp Arg Asp Leu Pro
290 295 300
Asn Ile Glu Val Arg Leu Ser Asp Gly Thr Met Ala Arg Lys Leu Arg
305 310 315 320
Tyr Thr His His Asp Arg Lys Asn Gly Arg Ser Ser Ser Gly Ala Leu
325 330 335
Arg Gly Val Cys Ser Cys Val Glu Ala Gly Lys Ala Cys Asp Pro Ala
340 345 350
Ala Arg Gln Phe Asn Thr Leu Ile Pro Trp Cys Leu Pro His Thr Gly
355 360 365
Asn Arg His Asn His Trp Ala Gly Leu Tyr Gly Arg Leu Glu Trp Asp
370 375 380
Gly Phe Phe Ser Thr Thr Val Thr Asn Pro Glu Pro Met Gly Lys Gln
385 390 395 400
Gly Arg Val Leu His Pro Glu Gln His Arg Val Val Ser Val Arg Glu
405 410 415
Cys Ala Arg Ser Gln Gly Phe Pro Asp Thr Tyr Arg Leu Phe Gly Asn
420 425 430
Ile Leu Asp Lys His Arg Gln Val Gly Asn Ala Val Pro Pro Pro Leu
435 440 445
Ala Lys Ala Ile Gly Leu Glu Ile Lys Leu Cys Met Leu Ala Lys Ala
450 455 460
Arg Glu Ser Ala Ser Ala Lys Ile Lys Glu Glu Glu Ala Ala Lys Asp
465 470 475 480
<210> 59
<211> 542
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:
DNMT3a/3L序列
<400> 59
Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro
1 5 10 15
Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
20 25 30
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg
35 40 45
Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val
50 55 60
Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr
65 70 75 80
Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly
85 90 95
Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu
100 105 110
Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His
115 120 125
Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe
130 135 140
Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg
145 150 155 160
Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala
165 170 175
Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg
180 185 190
Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu
195 200 205
Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
210 215 220
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe
225 230 235 240
Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val
245 250 255
Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
260 265 270
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg
275 280 285
His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly
290 295 300
Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val
305 310 315 320
Pro Leu Ser Leu Arg Gly Ser His Met Asn Pro Leu Glu Met Phe Glu
325 330 335
Thr Val Pro Val Trp Arg Arg Gln Pro Val Arg Val Leu Ser Leu Phe
340 345 350
Glu Asp Ile Lys Lys Glu Leu Thr Ser Leu Gly Phe Leu Glu Ser Gly
355 360 365
Ser Asp Pro Gly Gln Leu Lys His Val Val Asp Val Thr Asp Thr Val
370 375 380
Arg Lys Asp Val Glu Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala
385 390 395 400
Thr Pro Pro Leu Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu
405 410 415
Phe Gln Phe His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser
420 425 430
Pro Arg Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys
435 440 445
Glu Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr
450 455 460
Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val Trp
465 470 475 480
Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val Ser Glu
485 490 495
Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser Lys Leu Ala
500 505 510
Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe Leu Pro Leu Arg
515 520 525
Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr Ser Ser Leu
530 535 540
<210> 60
<211> 543
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:
DNMT3a/3L序列
<400> 60
Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro
1 5 10 15
Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
20 25 30
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg
35 40 45
Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val
50 55 60
Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr
65 70 75 80
Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly
85 90 95
Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu
100 105 110
Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His
115 120 125
Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe
130 135 140
Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg
145 150 155 160
Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala
165 170 175
Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg
180 185 190
Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu
195 200 205
Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
210 215 220
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe
225 230 235 240
Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val
245 250 255
Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
260 265 270
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg
275 280 285
His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly
290 295 300
Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val
305 310 315 320
Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys
325 330 335
Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe
340 345 350
Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly
355 360 365
Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn
370 375 380
Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr
385 390 395 400
Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp
405 410 415
Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln
420 425 430
Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu
435 440 445
Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala
450 455 460
Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg
465 470 475 480
Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr
485 490 495
Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys
500 505 510
Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro
515 520 525
Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu
530 535 540
<210> 61
<211> 96
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:
KRAB序列
<400> 61
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 30
Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 60
Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln
65 70 75 80
Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
85 90 95
<210> 62
<211> 282
<212> PRT
<213> 智人(Homo sapiens)
<400> 62
Gly Asn Arg Ala Ile Arg Thr Glu Lys Ile Ile Cys Arg Asp Val Ala
1 5 10 15
Arg Gly Tyr Glu Asn Val Pro Ile Pro Cys Val Asn Gly Val Asp Gly
20 25 30
Glu Pro Cys Pro Glu Asp Tyr Lys Tyr Ile Ser Glu Asn Cys Glu Thr
35 40 45
Ser Thr Met Asn Ile Asp Arg Asn Ile Thr His Leu Gln His Cys Thr
50 55 60
Cys Val Asp Asp Cys Ser Ser Ser Asn Cys Leu Cys Gly Gln Leu Ser
65 70 75 80
Ile Arg Cys Trp Tyr Asp Lys Asp Gly Arg Leu Leu Gln Glu Phe Asn
85 90 95
Lys Ile Glu Pro Pro Leu Ile Phe Glu Cys Asn Gln Ala Cys Ser Cys
100 105 110
Trp Arg Asn Cys Lys Asn Arg Val Val Gln Ser Gly Ile Lys Val Arg
115 120 125
Leu Gln Leu Tyr Arg Thr Ala Lys Met Gly Trp Gly Val Arg Ala Leu
130 135 140
Gln Thr Ile Pro Gln Gly Thr Phe Ile Cys Glu Tyr Val Gly Glu Leu
145 150 155 160
Ile Ser Asp Ala Glu Ala Asp Val Arg Glu Asp Asp Ser Tyr Leu Phe
165 170 175
Asp Leu Asp Asn Lys Asp Gly Glu Val Tyr Cys Ile Asp Ala Arg Tyr
180 185 190
Tyr Gly Asn Ile Ser Arg Phe Ile Asn His Leu Cys Asp Pro Asn Ile
195 200 205
Ile Pro Val Arg Val Phe Met Leu His Gln Asp Leu Arg Phe Pro Arg
210 215 220
Ile Ala Phe Phe Ser Ser Arg Asp Ile Arg Thr Gly Glu Glu Leu Gly
225 230 235 240
Phe Asp Tyr Gly Asp Arg Phe Trp Asp Ile Lys Ser Lys Tyr Phe Thr
245 250 255
Cys Gln Cys Gly Ser Glu Lys Cys Lys His Ser Ala Glu Ala Ile Ala
260 265 270
Leu Glu Gln Ser Arg Leu Ala Arg Leu Asp
275 280
<210> 63
<211> 376
<212> PRT
<213> 智人(Homo sapiens)
<400> 63
Glu Glu Pro Glu Glu Pro Ala Asp Ser Gly Gln Ser Leu Val Pro Val
1 5 10 15
Tyr Ile Tyr Ser Pro Glu Tyr Val Ser Met Cys Asp Ser Leu Ala Lys
20 25 30
Ile Pro Lys Arg Ala Ser Met Val His Ser Leu Ile Glu Ala Tyr Ala
35 40 45
Leu His Lys Gln Met Arg Ile Val Lys Pro Lys Val Ala Ser Met Glu
50 55 60
Glu Met Ala Thr Phe His Thr Asp Ala Tyr Leu Gln His Leu Gln Lys
65 70 75 80
Val Ser Gln Glu Gly Asp Asp Asp His Pro Asp Ser Ile Glu Tyr Gly
85 90 95
Leu Gly Tyr Asp Cys Pro Ala Thr Glu Gly Ile Phe Asp Tyr Ala Ala
100 105 110
Ala Ile Gly Gly Ala Thr Ile Thr Ala Ala Gln Cys Leu Ile Asp Gly
115 120 125
Met Cys Lys Val Ala Ile Asn Trp Ser Gly Gly Trp His His Ala Lys
130 135 140
Lys Asp Glu Ala Ser Gly Phe Cys Tyr Leu Asn Asp Ala Val Leu Gly
145 150 155 160
Ile Leu Arg Leu Arg Arg Lys Phe Glu Arg Ile Leu Tyr Val Asp Leu
165 170 175
Asp Leu His His Gly Asp Gly Val Glu Asp Ala Phe Ser Phe Thr Ser
180 185 190
Lys Val Met Thr Val Ser Leu His Lys Phe Ser Pro Gly Phe Phe Pro
195 200 205
Gly Thr Gly Asp Val Ser Asp Val Gly Leu Gly Lys Gly Arg Tyr Tyr
210 215 220
Ser Val Asn Val Pro Ile Gln Asp Gly Ile Gln Asp Glu Lys Tyr Tyr
225 230 235 240
Gln Ile Cys Glu Ser Val Leu Lys Glu Val Tyr Gln Ala Phe Asn Pro
245 250 255
Lys Ala Val Val Leu Gln Leu Gly Ala Asp Thr Ile Ala Gly Asp Pro
260 265 270
Met Cys Ser Phe Asn Met Thr Pro Val Gly Ile Gly Lys Cys Leu Lys
275 280 285
Tyr Ile Leu Gln Trp Gln Leu Ala Thr Leu Ile Leu Gly Gly Gly Gly
290 295 300
Tyr Asn Leu Ala Asn Thr Ala Arg Cys Trp Thr Tyr Leu Thr Gly Val
305 310 315 320
Ile Leu Gly Lys Thr Leu Ser Ser Glu Ile Pro Asp His Glu Phe Phe
325 330 335
Thr Ala Tyr Gly Pro Asp Tyr Val Leu Glu Ile Thr Pro Ser Cys Arg
340 345 350
Pro Asp Arg Asn Glu Pro His Arg Ile Gln Gln Ile Leu Asn Tyr Ile
355 360 365
Lys Gly Asn Leu Lys His Val Val
370 375
<210> 64
<211> 851
<212> PRT
<213> 智人(Homo sapiens)
<400> 64
Leu Ser Gly Lys Lys Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala
1 5 10 15
Ala Thr Gly Thr Glu Ala Gly Pro Gly Thr Ala Gly Gly Ser Glu Asn
20 25 30
Gly Ser Glu Val Ala Ala Gln Pro Ala Gly Leu Ser Gly Pro Ala Glu
35 40 45
Val Gly Pro Gly Ala Val Gly Glu Arg Thr Pro Arg Lys Lys Glu Pro
50 55 60
Pro Arg Ala Ser Pro Pro Gly Gly Leu Ala Glu Pro Pro Gly Ser Ala
65 70 75 80
Gly Pro Gln Ala Gly Pro Thr Val Val Pro Gly Ser Ala Thr Pro Met
85 90 95
Glu Thr Gly Ile Ala Glu Thr Pro Glu Gly Arg Arg Thr Ser Arg Arg
100 105 110
Lys Arg Ala Lys Val Glu Tyr Arg Glu Met Asp Glu Ser Leu Ala Asn
115 120 125
Leu Ser Glu Asp Glu Tyr Tyr Ser Glu Glu Glu Arg Asn Ala Lys Ala
130 135 140
Glu Lys Glu Lys Lys Leu Pro Pro Pro Pro Pro Gln Ala Pro Pro Glu
145 150 155 160
Glu Glu Asn Glu Ser Glu Pro Glu Glu Pro Ser Gly Val Glu Gly Ala
165 170 175
Ala Phe Gln Ser Arg Leu Pro His Asp Arg Met Thr Ser Gln Glu Ala
180 185 190
Ala Cys Phe Pro Asp Ile Ile Ser Gly Pro Gln Gln Thr Gln Lys Val
195 200 205
Phe Leu Phe Ile Arg Asn Arg Thr Leu Gln Leu Trp Leu Asp Asn Pro
210 215 220
Lys Ile Gln Leu Thr Phe Glu Ala Thr Leu Gln Gln Leu Glu Ala Pro
225 230 235 240
Tyr Asn Ser Asp Thr Val Leu Val His Arg Val His Ser Tyr Leu Glu
245 250 255
Arg His Gly Leu Ile Asn Phe Gly Ile Tyr Lys Arg Ile Lys Pro Leu
260 265 270
Pro Thr Lys Lys Thr Gly Lys Val Ile Ile Ile Gly Ser Gly Val Ser
275 280 285
Gly Leu Ala Ala Ala Arg Gln Leu Gln Ser Phe Gly Met Asp Val Thr
290 295 300
Leu Leu Glu Ala Arg Asp Arg Val Gly Gly Arg Val Ala Thr Phe Arg
305 310 315 320
Lys Gly Asn Tyr Val Ala Asp Leu Gly Ala Met Val Val Thr Gly Leu
325 330 335
Gly Gly Asn Pro Met Ala Val Val Ser Lys Gln Val Asn Met Glu Leu
340 345 350
Ala Lys Ile Lys Gln Lys Cys Pro Leu Tyr Glu Ala Asn Gly Gln Ala
355 360 365
Val Pro Lys Glu Lys Asp Glu Met Val Glu Gln Glu Phe Asn Arg Leu
370 375 380
Leu Glu Ala Thr Ser Tyr Leu Ser His Gln Leu Asp Phe Asn Val Leu
385 390 395 400
Asn Asn Lys His Val Ser Leu Gly Gln Ala Leu Glu Val Val Ile Gln
405 410 415
Leu Gln Glu Lys His Val Lys Asp Glu Gln Ile Glu His Trp Lys Lys
420 425 430
Ile Val Lys Thr Gln Glu Glu Leu Lys Glu Leu Leu Asn Lys Met Val
435 440 445
Asn Leu Lys Glu Lys Ile Lys Glu Leu His Gln Gln Tyr Lys Glu Ala
450 455 460
Ser Glu Val Lys Pro Pro Arg Asp Ile Thr Ala Glu Phe Leu Val Lys
465 470 475 480
Ser Lys His Arg Asp Leu Thr Ala Leu Cys Lys Glu Tyr Asp Glu Leu
485 490 495
Ala Glu Thr Gln Gly Lys Leu Glu Glu Lys Leu Gln Glu Leu Glu Ala
500 505 510
Asn Pro Pro Ser Asp Val Tyr Leu Ser Ser Arg Asp Arg Gln Ile Leu
515 520 525
Asp Trp His Phe Ala Asn Leu Glu Phe Ala Asn Ala Thr Pro Leu Ser
530 535 540
Thr Leu Ser Leu Lys His Trp Asp Gln Asp Asp Asp Phe Glu Phe Thr
545 550 555 560
Gly Ser His Leu Thr Val Arg Asn Gly Tyr Ser Cys Val Pro Val Ala
565 570 575
Leu Ala Glu Gly Leu Asp Ile Lys Leu Asn Thr Ala Val Arg Gln Val
580 585 590
Arg Tyr Thr Ala Ser Gly Cys Glu Val Ile Ala Val Asn Thr Arg Ser
595 600 605
Thr Ser Gln Thr Phe Ile Tyr Lys Cys Asp Ala Val Leu Cys Thr Leu
610 615 620
Pro Leu Gly Val Leu Lys Gln Gln Pro Pro Ala Val Gln Phe Val Pro
625 630 635 640
Pro Leu Pro Glu Trp Lys Thr Ser Ala Val Gln Arg Met Gly Phe Gly
645 650 655
Asn Leu Asn Lys Val Val Leu Cys Phe Asp Arg Val Phe Trp Asp Pro
660 665 670
Ser Val Asn Leu Phe Gly His Val Gly Ser Thr Thr Ala Ser Arg Gly
675 680 685
Glu Leu Phe Leu Phe Trp Asn Leu Tyr Lys Ala Pro Ile Leu Leu Ala
690 695 700
Leu Val Ala Gly Glu Ala Ala Gly Ile Met Glu Asn Ile Ser Asp Asp
705 710 715 720
Val Ile Val Gly Arg Cys Leu Ala Ile Leu Lys Gly Ile Phe Gly Ser
725 730 735
Ser Ala Val Pro Gln Pro Lys Glu Thr Val Val Ser Arg Trp Arg Ala
740 745 750
Asp Pro Trp Ala Arg Gly Ser Tyr Ser Tyr Val Ala Ala Gly Ser Ser
755 760 765
Gly Asn Asp Tyr Asp Leu Met Ala Gln Pro Ile Thr Pro Gly Pro Ser
770 775 780
Ile Pro Gly Ala Pro Gln Pro Ile Pro Arg Leu Phe Phe Ala Gly Glu
785 790 795 800
His Thr Ile Arg Asn Tyr Pro Ala Thr Val His Gly Ala Leu Leu Ser
805 810 815
Gly Leu Arg Glu Ala Gly Arg Ile Ala Asp Gln Phe Leu Gly Ala Met
820 825 830
Tyr Thr Leu Pro Arg Gln Ala Thr Pro Gly Val Pro Ala Gln Gln Ser
835 840 845
Pro Ser Met
850
<210> 65
<211> 745
<212> PRT
<213> 智人(Homo sapiens)
<400> 65
Gly Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys
1 5 10 15
Arg Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg
20 25 30
Arg Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile
35 40 45
Leu Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile
50 55 60
Gln Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg
65 70 75 80
Glu Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro
85 90 95
Leu Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp
100 105 110
Ser Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His
115 120 125
Asn Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe
130 135 140
Ile Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg
145 150 155 160
Glu Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala
165 170 175
Leu Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro
180 185 190
Glu Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp
195 200 205
Lys Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu
210 215 220
Ala Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys
225 230 235 240
Glu Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro
245 250 255
Pro Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln
260 265 270
Arg Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys
275 280 285
Phe Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr
290 295 300
Tyr Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly
305 310 315 320
Pro Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala
325 330 335
Leu Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg
340 345 350
Arg Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr
355 360 365
Ile Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly
370 375 380
Thr Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys
385 390 395 400
Asp Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro
405 410 415
Ile Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser
420 425 430
Gly Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp
435 440 445
Asn Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln
450 455 460
Val Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro
465 470 475 480
Ala Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg
485 490 495
Leu Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser
500 505 510
Ser Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro
515 520 525
Cys Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys
530 535 540
Phe Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg
545 550 555 560
Cys Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val
565 570 575
Arg Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His
580 585 590
Trp Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly
595 600 605
Ser Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly
610 615 620
Ile Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr
625 630 635 640
Cys Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val
645 650 655
Tyr Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe
660 665 670
Val Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His
675 680 685
Ser Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp
690 695 700
His Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu
705 710 715 720
Leu Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val
725 730 735
Gly Ile Glu Arg Glu Met Glu Ile Pro
740 745
<210> 66
<211> 44
<212> PRT
<213> 智人(Homo sapiens)
<400> 66
Ser Arg Arg Lys Gln Ser Asn Pro Arg Gln Ile Lys Arg Ser Leu Gly
1 5 10 15
Asp Met Glu Ala Arg Glu Glu Val Gln Leu Val Gly Ala Ser His Met
20 25 30
Glu Gln Lys Ala Thr Ala Pro Glu Ala Pro Ser Pro
35 40
<210> 67
<211> 1497
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 67
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser
20 25 30
Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala
35 40 45
Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg
50 55 60
Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg
65 70 75 80
Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp
85 90 95
His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly
100 105 110
Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His
115 120 125
Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp
130 135 140
Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys
145 150 155 160
Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys
165 170 175
Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp
180 185 190
Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His
195 200 205
Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr
210 215 220
Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp
225 230 235 240
Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr
245 250 255
Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu
260 265 270
Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu
275 280 285
Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val
290 295 300
Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile
305 310 315 320
Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly
325 330 335
Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile
340 345 350
Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile
355 360 365
Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu
370 375 380
Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile
385 390 395 400
Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala
405 410 415
Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile
420 425 430
Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser
435 440 445
Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser
450 455 460
Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala
465 470 475 480
Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala
485 490 495
Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln
500 505 510
Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr
515 520 525
Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His
530 535 540
Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu
545 550 555 560
Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile
565 570 575
Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val
580 585 590
Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr
595 600 605
Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His
610 615 620
Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys
625 630 635 640
Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys
645 650 655
Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly
660 665 670
Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val
675 680 685
Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys
690 695 700
Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu
705 710 715 720
Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys
725 730 735
Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu
740 745 750
Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys
755 760 765
Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys
770 775 780
Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu
785 790 795 800
Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr
805 810 815
Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys
820 825 830
Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His
835 840 845
His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr
850 855 860
Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn
865 870 875 880
Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys
885 890 895
Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp
900 905 910
Asp Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro
915 920 925
Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr
930 935 940
Val Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn
945 950 955 960
Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln
965 970 975
Ala Glu Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn
980 985 990
Gly Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg
995 1000 1005
Ile Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu
1010 1015 1020
Asn Met Asn Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala
1025 1030 1035
Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly
1040 1045 1050
Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys
1055 1060 1065
Lys Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1070 1075 1080
Lys Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys
1085 1090 1095
Leu Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys
1100 1105 1110
Ala Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu
1115 1120 1125
Ala Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His
1130 1135 1140
Asn Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu
1145 1150 1155
Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser
1160 1165 1170
Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp
1175 1180 1185
Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu
1190 1195 1200
Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys
1205 1210 1215
Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser
1220 1225 1230
Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg
1235 1240 1245
Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu
1250 1255 1260
Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala
1265 1270 1275
Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
1280 1285 1290
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn
1295 1300 1305
Ala Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met
1310 1315 1320
Ile Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys
1325 1330 1335
Lys Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu
1340 1345 1350
Lys Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe
1355 1360 1365
Lys Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr
1370 1375 1380
Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr
1385 1390 1395
Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile
1400 1405 1410
Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe
1415 1420 1425
Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu
1430 1435 1440
Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn
1445 1450 1455
Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly
1460 1465 1470
Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1475 1480 1485
Gly Gln Ala Lys Lys Lys Lys Gly Ser
1490 1495
<210> 68
<211> 1811
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 68
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu
1400 1405 1410
Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala
1415 1420 1425
Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala
1430 1435 1440
Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn
1445 1450 1455
Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu
1460 1465 1470
Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys
1475 1480 1485
Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu
1490 1495 1500
Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly
1505 1510 1515
Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn
1520 1525 1530
Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln
1535 1540 1545
Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser
1550 1555 1560
Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys
1565 1570 1575
Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu
1580 1585 1590
Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys
1595 1600 1605
Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala
1610 1615 1620
Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile
1625 1630 1635
Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys
1640 1645 1650
Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys
1655 1660 1665
Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys
1670 1675 1680
Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser
1685 1690 1695
Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly
1700 1705 1710
Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys
1715 1720 1725
Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu
1730 1735 1740
Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile
1745 1750 1755
Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser
1760 1765 1770
Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly
1775 1780 1785
Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly
1790 1795 1800
Gln Ala Lys Lys Lys Lys Gly Ser
1805 1810
<210> 69
<211> 1913
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 69
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Val Asp Leu Arg
1400 1405 1410
Thr Leu Asp Val Phe Ser Gly Cys Gly Gly Leu Ser Glu Gly Phe
1415 1420 1425
His Gln Ala Gly Ile Ser Asp Thr Leu Trp Ala Ile Glu Met Trp
1430 1435 1440
Asp Pro Ala Ala Gln Ala Phe Arg Leu Asn Asn Pro Gly Ser Thr
1445 1450 1455
Val Phe Thr Glu Asp Cys Asn Ile Leu Leu Lys Leu Val Met Ala
1460 1465 1470
Gly Glu Thr Thr Asn Ser Arg Gly Gln Arg Leu Pro Gln Lys Gly
1475 1480 1485
Asp Val Glu Met Leu Cys Gly Gly Pro Pro Cys Gln Gly Phe Ser
1490 1495 1500
Gly Met Asn Arg Phe Asn Ser Arg Thr Tyr Ser Lys Phe Lys Asn
1505 1510 1515
Ser Leu Val Val Ser Phe Leu Ser Tyr Cys Asp Tyr Tyr Arg Pro
1520 1525 1530
Arg Phe Phe Leu Leu Glu Asn Val Arg Asn Phe Val Ser Phe Lys
1535 1540 1545
Arg Ser Met Val Leu Lys Leu Thr Leu Arg Cys Leu Val Arg Met
1550 1555 1560
Gly Tyr Gln Cys Thr Phe Gly Val Leu Gln Ala Gly Gln Tyr Gly
1565 1570 1575
Val Ala Gln Thr Arg Arg Arg Ala Ile Ile Leu Ala Ala Ala Pro
1580 1585 1590
Gly Glu Lys Leu Pro Leu Phe Pro Glu Pro Leu His Val Phe Ala
1595 1600 1605
Pro Arg Ala Cys Gln Leu Ser Val Val Val Asp Asp Lys Lys Phe
1610 1615 1620
Val Ser Asn Ile Thr Arg Leu Ser Ser Gly Pro Phe Arg Thr Ile
1625 1630 1635
Thr Val Arg Asp Thr Met Ser Asp Leu Pro Glu Val Arg Asn Gly
1640 1645 1650
Ala Ser Ala Leu Glu Ile Ser Tyr Asn Gly Glu Pro Gln Ser Trp
1655 1660 1665
Phe Gln Arg Gln Leu Arg Gly Ala Gln Tyr Gln Pro Ile Leu Arg
1670 1675 1680
Asp His Ile Cys Lys Asp Met Ser Ala Leu Val Ala Ala Arg Met
1685 1690 1695
Arg His Ile Pro Leu Ala Pro Gly Ser Asp Trp Arg Asp Leu Pro
1700 1705 1710
Asn Ile Glu Val Arg Leu Ser Asp Gly Thr Met Ala Arg Lys Leu
1715 1720 1725
Arg Tyr Thr His His Asp Arg Lys Asn Gly Arg Ser Ser Ser Gly
1730 1735 1740
Ala Leu Arg Gly Val Cys Ser Cys Val Glu Ala Gly Lys Ala Cys
1745 1750 1755
Asp Pro Ala Ala Arg Gln Phe Asn Thr Leu Ile Pro Trp Cys Leu
1760 1765 1770
Pro His Thr Gly Asn Arg His Asn His Trp Ala Gly Leu Tyr Gly
1775 1780 1785
Arg Leu Glu Trp Asp Gly Phe Phe Ser Thr Thr Val Thr Asn Pro
1790 1795 1800
Glu Pro Met Gly Lys Gln Gly Arg Val Leu His Pro Glu Gln His
1805 1810 1815
Arg Val Val Ser Val Arg Glu Cys Ala Arg Ser Gln Gly Phe Pro
1820 1825 1830
Asp Thr Tyr Arg Leu Phe Gly Asn Ile Leu Asp Lys His Arg Gln
1835 1840 1845
Val Gly Asn Ala Val Pro Pro Pro Leu Ala Lys Ala Ile Gly Leu
1850 1855 1860
Glu Ile Lys Leu Cys Met Leu Ala Lys Ala Arg Glu Ser Ala Ser
1865 1870 1875
Ala Lys Ile Lys Glu Glu Glu Ala Ala Lys Asp Gly Gly Gly Gly
1880 1885 1890
Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1895 1900 1905
Lys Lys Lys Gly Ser
1910
<210> 70
<211> 1977
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 70
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro
1415 1420 1425
Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe
1430 1435 1440
Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile
1445 1450 1455
Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile
1460 1465 1470
Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly
1475 1480 1485
Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro
1490 1495 1500
Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile
1505 1510 1515
Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu
1520 1525 1530
Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu
1535 1540 1545
Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala
1550 1555 1560
Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser
1565 1570 1575
Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg
1580 1585 1590
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu
1595 1600 1605
Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu
1610 1615 1620
His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
1625 1630 1635
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val
1640 1645 1650
Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu
1655 1660 1665
Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met
1670 1675 1680
Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val
1685 1690 1695
Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala
1700 1705 1710
Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser
1715 1720 1725
Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met
1730 1735 1740
Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp Arg Arg Gln
1745 1750 1755
Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys Glu Leu
1760 1765 1770
Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln Leu
1775 1780 1785
Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu
1790 1795 1800
Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu
1805 1810 1815
Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe
1820 1825 1830
His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg
1835 1840 1845
Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu
1850 1855 1860
Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr
1865 1870 1875
Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val
1880 1885 1890
Trp Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val
1895 1900 1905
Ser Glu Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser
1910 1915 1920
Lys Leu Ala Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe
1925 1930 1935
Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr
1940 1945 1950
Ser Ser Leu Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1955 1960 1965
Gly Gln Ala Lys Lys Lys Lys Gly Ser
1970 1975
<210> 71
<211> 1977
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 71
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly
1385 1390 1395
Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly
1400 1405 1410
Ser Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro
1415 1420 1425
Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe
1430 1435 1440
Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile
1445 1450 1455
Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile
1460 1465 1470
Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly
1475 1480 1485
Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro
1490 1495 1500
Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile
1505 1510 1515
Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu
1520 1525 1530
Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu
1535 1540 1545
Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala
1550 1555 1560
Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser
1565 1570 1575
Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg
1580 1585 1590
Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu
1595 1600 1605
Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu
1610 1615 1620
His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
1625 1630 1635
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val
1640 1645 1650
Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu
1655 1660 1665
Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met
1670 1675 1680
Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val
1685 1690 1695
Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala
1700 1705 1710
Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser
1715 1720 1725
Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met
1730 1735 1740
Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp Arg Arg Gln
1745 1750 1755
Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys Glu Leu
1760 1765 1770
Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln Leu
1775 1780 1785
Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu
1790 1795 1800
Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu
1805 1810 1815
Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe
1820 1825 1830
His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg
1835 1840 1845
Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu
1850 1855 1860
Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr
1865 1870 1875
Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val
1880 1885 1890
Trp Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val
1895 1900 1905
Ser Glu Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser
1910 1915 1920
Lys Leu Ala Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe
1925 1930 1935
Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr
1940 1945 1950
Ser Ser Leu Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1955 1960 1965
Gly Gln Ala Lys Lys Lys Lys Gly Ser
1970 1975
<210> 72
<211> 1519
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 72
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Ser Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr
1400 1405 1410
Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
1415 1420 1425
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val
1430 1435 1440
Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu
1445 1450 1455
Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro
1460 1465 1470
Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser
1475 1480 1485
Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg
1490 1495 1500
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1505 1510 1515
Ser
<210> 73
<211> 1699
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 73
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Gly Gly Gly Gly Ser Gly Asn Arg Ala Ile Arg Thr Glu Lys
20 25 30
Ile Ile Cys Arg Asp Val Ala Arg Gly Tyr Glu Asn Val Pro Ile Pro
35 40 45
Cys Val Asn Gly Val Asp Gly Glu Pro Cys Pro Glu Asp Tyr Lys Tyr
50 55 60
Ile Ser Glu Asn Cys Glu Thr Ser Thr Met Asn Ile Asp Arg Asn Ile
65 70 75 80
Thr His Leu Gln His Cys Thr Cys Val Asp Asp Cys Ser Ser Ser Asn
85 90 95
Cys Leu Cys Gly Gln Leu Ser Ile Arg Cys Trp Tyr Asp Lys Asp Gly
100 105 110
Arg Leu Leu Gln Glu Phe Asn Lys Ile Glu Pro Pro Leu Ile Phe Glu
115 120 125
Cys Asn Gln Ala Cys Ser Cys Trp Arg Asn Cys Lys Asn Arg Val Val
130 135 140
Gln Ser Gly Ile Lys Val Arg Leu Gln Leu Tyr Arg Thr Ala Lys Met
145 150 155 160
Gly Trp Gly Val Arg Ala Leu Gln Thr Ile Pro Gln Gly Thr Phe Ile
165 170 175
Cys Glu Tyr Val Gly Glu Leu Ile Ser Asp Ala Glu Ala Asp Val Arg
180 185 190
Glu Asp Asp Ser Tyr Leu Phe Asp Leu Asp Asn Lys Asp Gly Glu Val
195 200 205
Tyr Cys Ile Asp Ala Arg Tyr Tyr Gly Asn Ile Ser Arg Phe Ile Asn
210 215 220
His Leu Cys Asp Pro Asn Ile Ile Pro Val Arg Val Phe Met Leu His
225 230 235 240
Gln Asp Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Ser Arg Asp Ile
245 250 255
Arg Thr Gly Glu Glu Leu Gly Phe Asp Tyr Gly Asp Arg Phe Trp Asp
260 265 270
Ile Lys Ser Lys Tyr Phe Thr Cys Gln Cys Gly Ser Glu Lys Cys Lys
275 280 285
His Ser Ala Glu Ala Ile Ala Leu Glu Gln Ser Arg Leu Ala Arg Leu
290 295 300
Asp Gly Gly Gly Gly Ser Gly Asp Lys Lys Tyr Ser Ile Gly Leu Ala
305 310 315 320
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
325 330 335
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
340 345 350
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
355 360 365
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
370 375 380
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
385 390 395 400
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
405 410 415
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
420 425 430
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
435 440 445
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
450 455 460
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
465 470 475 480
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
485 490 495
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
500 505 510
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
515 520 525
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
530 535 540
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
545 550 555 560
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
565 570 575
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
580 585 590
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
595 600 605
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
610 615 620
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
625 630 635 640
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
645 650 655
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
660 665 670
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
675 680 685
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
690 695 700
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
705 710 715 720
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
725 730 735
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
740 745 750
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
755 760 765
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
770 775 780
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
785 790 795 800
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
805 810 815
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
820 825 830
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
835 840 845
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
850 855 860
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
865 870 875 880
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
885 890 895
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
900 905 910
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp
915 920 925
Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
930 935 940
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln
945 950 955 960
Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu
965 970 975
Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe
980 985 990
Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
995 1000 1005
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
1010 1015 1020
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
1025 1030 1035
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val
1040 1045 1050
Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn
1055 1060 1065
Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly
1070 1075 1080
Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile
1085 1090 1095
Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
1100 1105 1110
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
1115 1120 1125
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
1130 1135 1140
Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
1145 1150 1155
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala
1160 1165 1170
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
1175 1180 1185
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
1190 1195 1200
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
1205 1210 1215
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu
1220 1225 1230
Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
1235 1240 1245
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
1250 1255 1260
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys
1265 1270 1275
Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His
1280 1285 1290
Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile
1295 1300 1305
Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr
1310 1315 1320
Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1325 1330 1335
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met
1340 1345 1350
Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg
1355 1360 1365
Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1370 1375 1380
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1385 1390 1395
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly
1400 1405 1410
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys
1415 1420 1425
Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly
1430 1435 1440
Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1445 1450 1455
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu
1460 1465 1470
Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1475 1480 1485
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
1490 1495 1500
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn
1505 1510 1515
Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly
1520 1525 1530
Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu
1535 1540 1545
Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu
1550 1555 1560
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
1565 1570 1575
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
1580 1585 1590
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg
1595 1600 1605
Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1610 1615 1620
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1625 1630 1635
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
1640 1645 1650
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
1655 1660 1665
Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Lys Arg
1670 1675 1680
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1685 1690 1695
Ser
<210> 74
<211> 1809
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 74
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Glu Glu Pro Glu
1400 1405 1410
Glu Pro Ala Asp Ser Gly Gln Ser Leu Val Pro Val Tyr Ile Tyr
1415 1420 1425
Ser Pro Glu Tyr Val Ser Met Cys Asp Ser Leu Ala Lys Ile Pro
1430 1435 1440
Lys Arg Ala Ser Met Val His Ser Leu Ile Glu Ala Tyr Ala Leu
1445 1450 1455
His Lys Gln Met Arg Ile Val Lys Pro Lys Val Ala Ser Met Glu
1460 1465 1470
Glu Met Ala Thr Phe His Thr Asp Ala Tyr Leu Gln His Leu Gln
1475 1480 1485
Lys Val Ser Gln Glu Gly Asp Asp Asp His Pro Asp Ser Ile Glu
1490 1495 1500
Tyr Gly Leu Gly Tyr Asp Cys Pro Ala Thr Glu Gly Ile Phe Asp
1505 1510 1515
Tyr Ala Ala Ala Ile Gly Gly Ala Thr Ile Thr Ala Ala Gln Cys
1520 1525 1530
Leu Ile Asp Gly Met Cys Lys Val Ala Ile Asn Trp Ser Gly Gly
1535 1540 1545
Trp His His Ala Lys Lys Asp Glu Ala Ser Gly Phe Cys Tyr Leu
1550 1555 1560
Asn Asp Ala Val Leu Gly Ile Leu Arg Leu Arg Arg Lys Phe Glu
1565 1570 1575
Arg Ile Leu Tyr Val Asp Leu Asp Leu His His Gly Asp Gly Val
1580 1585 1590
Glu Asp Ala Phe Ser Phe Thr Ser Lys Val Met Thr Val Ser Leu
1595 1600 1605
His Lys Phe Ser Pro Gly Phe Phe Pro Gly Thr Gly Asp Val Ser
1610 1615 1620
Asp Val Gly Leu Gly Lys Gly Arg Tyr Tyr Ser Val Asn Val Pro
1625 1630 1635
Ile Gln Asp Gly Ile Gln Asp Glu Lys Tyr Tyr Gln Ile Cys Glu
1640 1645 1650
Ser Val Leu Lys Glu Val Tyr Gln Ala Phe Asn Pro Lys Ala Val
1655 1660 1665
Val Leu Gln Leu Gly Ala Asp Thr Ile Ala Gly Asp Pro Met Cys
1670 1675 1680
Ser Phe Asn Met Thr Pro Val Gly Ile Gly Lys Cys Leu Lys Tyr
1685 1690 1695
Ile Leu Gln Trp Gln Leu Ala Thr Leu Ile Leu Gly Gly Gly Gly
1700 1705 1710
Tyr Asn Leu Ala Asn Thr Ala Arg Cys Trp Thr Tyr Leu Thr Gly
1715 1720 1725
Val Ile Leu Gly Lys Thr Leu Ser Ser Glu Ile Pro Asp His Glu
1730 1735 1740
Phe Phe Thr Ala Tyr Gly Pro Asp Tyr Val Leu Glu Ile Thr Pro
1745 1750 1755
Ser Cys Arg Pro Asp Arg Asn Glu Pro His Arg Ile Gln Gln Ile
1760 1765 1770
Leu Asn Tyr Ile Lys Gly Asn Leu Lys His Val Val Gly Gly Gly
1775 1780 1785
Gly Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala
1790 1795 1800
Lys Lys Lys Lys Gly Ser
1805
<210> 75
<211> 2281
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 75
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln
1385 1390 1395
Ala Lys Lys Lys Lys Glu Ser Gly Gly Gly Ser Leu Ser Gly Lys
1400 1405 1410
Lys Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Thr Gly
1415 1420 1425
Thr Glu Ala Gly Pro Gly Thr Ala Gly Gly Ser Glu Asn Gly Ser
1430 1435 1440
Glu Val Ala Ala Gln Pro Ala Gly Leu Ser Gly Pro Ala Glu Val
1445 1450 1455
Gly Pro Gly Ala Val Gly Glu Arg Thr Pro Arg Lys Lys Glu Pro
1460 1465 1470
Pro Arg Ala Ser Pro Pro Gly Gly Leu Ala Glu Pro Pro Gly Ser
1475 1480 1485
Ala Gly Pro Gln Ala Gly Pro Thr Val Val Pro Gly Ser Ala Thr
1490 1495 1500
Pro Met Glu Thr Gly Ile Ala Glu Thr Pro Glu Gly Arg Arg Thr
1505 1510 1515
Ser Arg Arg Lys Arg Ala Lys Val Glu Tyr Arg Glu Met Asp Glu
1520 1525 1530
Ser Leu Ala Asn Leu Ser Glu Asp Glu Tyr Tyr Ser Glu Glu Glu
1535 1540 1545
Arg Asn Ala Lys Ala Glu Lys Glu Lys Lys Leu Pro Pro Pro Pro
1550 1555 1560
Pro Gln Ala Pro Pro Glu Glu Glu Asn Glu Ser Glu Pro Glu Glu
1565 1570 1575
Pro Ser Gly Val Glu Gly Ala Ala Phe Gln Ser Arg Leu Pro His
1580 1585 1590
Asp Arg Met Thr Ser Gln Glu Ala Ala Cys Phe Pro Asp Ile Ile
1595 1600 1605
Ser Gly Pro Gln Gln Thr Gln Lys Val Phe Leu Phe Ile Arg Asn
1610 1615 1620
Arg Thr Leu Gln Leu Trp Leu Asp Asn Pro Lys Ile Gln Leu Thr
1625 1630 1635
Phe Glu Ala Thr Leu Gln Gln Leu Glu Ala Pro Tyr Asn Ser Asp
1640 1645 1650
Thr Val Leu Val His Arg Val His Ser Tyr Leu Glu Arg His Gly
1655 1660 1665
Leu Ile Asn Phe Gly Ile Tyr Lys Arg Ile Lys Pro Leu Pro Thr
1670 1675 1680
Lys Lys Thr Gly Lys Val Ile Ile Ile Gly Ser Gly Val Ser Gly
1685 1690 1695
Leu Ala Ala Ala Arg Gln Leu Gln Ser Phe Gly Met Asp Val Thr
1700 1705 1710
Leu Leu Glu Ala Arg Asp Arg Val Gly Gly Arg Val Ala Thr Phe
1715 1720 1725
Arg Lys Gly Asn Tyr Val Ala Asp Leu Gly Ala Met Val Val Thr
1730 1735 1740
Gly Leu Gly Gly Asn Pro Met Ala Val Val Ser Lys Gln Val Asn
1745 1750 1755
Met Glu Leu Ala Lys Ile Lys Gln Lys Cys Pro Leu Tyr Glu Ala
1760 1765 1770
Asn Gly Gln Ala Val Pro Lys Glu Lys Asp Glu Met Val Glu Gln
1775 1780 1785
Glu Phe Asn Arg Leu Leu Glu Ala Thr Ser Tyr Leu Ser His Gln
1790 1795 1800
Leu Asp Phe Asn Val Leu Asn Asn Lys His Val Ser Leu Gly Gln
1805 1810 1815
Ala Leu Glu Val Val Ile Gln Leu Gln Glu Lys His Val Lys Asp
1820 1825 1830
Glu Gln Ile Glu His Trp Lys Lys Ile Val Lys Thr Gln Glu Glu
1835 1840 1845
Leu Lys Glu Leu Leu Asn Lys Met Val Asn Leu Lys Glu Lys Ile
1850 1855 1860
Lys Glu Leu His Gln Gln Tyr Lys Glu Ala Ser Glu Val Lys Pro
1865 1870 1875
Pro Arg Asp Ile Thr Ala Glu Phe Leu Val Lys Ser Lys His Arg
1880 1885 1890
Asp Leu Thr Ala Leu Cys Lys Glu Tyr Asp Glu Leu Ala Glu Thr
1895 1900 1905
Gln Gly Lys Leu Glu Glu Lys Leu Gln Glu Leu Glu Ala Asn Pro
1910 1915 1920
Pro Ser Asp Val Tyr Leu Ser Ser Arg Asp Arg Gln Ile Leu Asp
1925 1930 1935
Trp His Phe Ala Asn Leu Glu Phe Ala Asn Ala Thr Pro Leu Ser
1940 1945 1950
Thr Leu Ser Leu Lys His Trp Asp Gln Asp Asp Asp Phe Glu Phe
1955 1960 1965
Thr Gly Ser His Leu Thr Val Arg Asn Gly Tyr Ser Cys Val Pro
1970 1975 1980
Val Ala Leu Ala Glu Gly Leu Asp Ile Lys Leu Asn Thr Ala Val
1985 1990 1995
Arg Gln Val Arg Tyr Thr Ala Ser Gly Cys Glu Val Ile Ala Val
2000 2005 2010
Asn Thr Arg Ser Thr Ser Gln Thr Phe Ile Tyr Lys Cys Asp Ala
2015 2020 2025
Val Leu Cys Thr Leu Pro Leu Gly Val Leu Lys Gln Gln Pro Pro
2030 2035 2040
Ala Val Gln Phe Val Pro Pro Leu Pro Glu Trp Lys Thr Ser Ala
2045 2050 2055
Val Gln Arg Met Gly Phe Gly Asn Leu Asn Lys Val Val Leu Cys
2060 2065 2070
Phe Asp Arg Val Phe Trp Asp Pro Ser Val Asn Leu Phe Gly His
2075 2080 2085
Val Gly Ser Thr Thr Ala Ser Arg Gly Glu Leu Phe Leu Phe Trp
2090 2095 2100
Asn Leu Tyr Lys Ala Pro Ile Leu Leu Ala Leu Val Ala Gly Glu
2105 2110 2115
Ala Ala Gly Ile Met Glu Asn Ile Ser Asp Asp Val Ile Val Gly
2120 2125 2130
Arg Cys Leu Ala Ile Leu Lys Gly Ile Phe Gly Ser Ser Ala Val
2135 2140 2145
Pro Gln Pro Lys Glu Thr Val Val Ser Arg Trp Arg Ala Asp Pro
2150 2155 2160
Trp Ala Arg Gly Ser Tyr Ser Tyr Val Ala Ala Gly Ser Ser Gly
2165 2170 2175
Asn Asp Tyr Asp Leu Met Ala Gln Pro Ile Thr Pro Gly Pro Ser
2180 2185 2190
Ile Pro Gly Ala Pro Gln Pro Ile Pro Arg Leu Phe Phe Ala Gly
2195 2200 2205
Glu His Thr Ile Arg Asn Tyr Pro Ala Thr Val His Gly Ala Leu
2210 2215 2220
Leu Ser Gly Leu Arg Glu Ala Gly Arg Ile Ala Asp Gln Phe Leu
2225 2230 2235
Gly Ala Met Tyr Thr Leu Pro Arg Gln Ala Thr Pro Gly Val Pro
2240 2245 2250
Ala Gln Gln Ser Pro Ser Met Ser Gly Gly Lys Arg Pro Ala Ala
2255 2260 2265
Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
2270 2275 2280
<210> 76
<211> 2168
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 76
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys Arg
20 25 30
Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg Arg
35 40 45
Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile Leu
50 55 60
Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile Gln
65 70 75 80
Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg Glu
85 90 95
Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro Leu
100 105 110
Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp Ser
115 120 125
Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His Asn
130 135 140
Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe Ile
145 150 155 160
Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu
165 170 175
Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu
180 185 190
Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu
195 200 205
Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys
210 215 220
Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
225 230 235 240
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys Glu
245 250 255
Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro Pro
260 265 270
Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln Arg
275 280 285
Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys Phe
290 295 300
Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr Tyr
305 310 315 320
Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly Pro
325 330 335
Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala Leu
340 345 350
Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg Arg
355 360 365
Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr Ile
370 375 380
Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr
385 390 395 400
Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp
405 410 415
Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile
420 425 430
Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly
435 440 445
Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn
450 455 460
Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
465 470 475 480
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro Ala
485 490 495
Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg Leu
500 505 510
Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser Ser
515 520 525
Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro Cys
530 535 540
Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys Phe
545 550 555 560
Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg Cys
565 570 575
Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val Arg
580 585 590
Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His Trp
595 600 605
Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly Ser
610 615 620
Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly Ile
625 630 635 640
Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys
645 650 655
Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr
660 665 670
Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val
675 680 685
Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser
690 695 700
Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
705 710 715 720
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu Leu
725 730 735
Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val Gly
740 745 750
Ile Glu Arg Glu Met Glu Ile Pro Ser Thr Gly Gly Ser Gly Gly Ser
755 760 765
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Arg Pro Asp Lys Lys Tyr
770 775 780
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
785 790 795 800
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
805 810 815
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
820 825 830
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
835 840 845
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
850 855 860
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
865 870 875 880
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
885 890 895
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
900 905 910
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
915 920 925
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
930 935 940
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
945 950 955 960
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
965 970 975
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
980 985 990
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
995 1000 1005
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
1010 1015 1020
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
1025 1030 1035
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
1040 1045 1050
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
1055 1060 1065
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
1070 1075 1080
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
1085 1090 1095
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
1100 1105 1110
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
1115 1120 1125
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
1130 1135 1140
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
1145 1150 1155
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
1160 1165 1170
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
1175 1180 1185
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
1190 1195 1200
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
1205 1210 1215
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
1220 1225 1230
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
1235 1240 1245
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
1250 1255 1260
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
1265 1270 1275
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
1280 1285 1290
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
1295 1300 1305
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
1310 1315 1320
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
1325 1330 1335
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
1340 1345 1350
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
1355 1360 1365
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
1370 1375 1380
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
1385 1390 1395
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1400 1405 1410
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
1415 1420 1425
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
1430 1435 1440
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
1445 1450 1455
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
1460 1465 1470
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1475 1480 1485
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1490 1495 1500
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1505 1510 1515
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
1520 1525 1530
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
1535 1540 1545
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
1550 1555 1560
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
1565 1570 1575
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1580 1585 1590
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1595 1600 1605
Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln
1610 1615 1620
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1625 1630 1635
Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1640 1645 1650
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1655 1660 1665
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1670 1675 1680
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1685 1690 1695
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1700 1705 1710
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1715 1720 1725
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1730 1735 1740
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1745 1750 1755
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1760 1765 1770
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1775 1780 1785
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1790 1795 1800
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1805 1810 1815
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1820 1825 1830
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1835 1840 1845
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1850 1855 1860
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1865 1870 1875
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1880 1885 1890
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1895 1900 1905
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1910 1915 1920
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1925 1930 1935
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1940 1945 1950
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1955 1960 1965
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1970 1975 1980
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1985 1990 1995
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
2000 2005 2010
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
2015 2020 2025
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
2030 2035 2040
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
2045 2050 2055
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
2060 2065 2070
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
2075 2080 2085
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
2090 2095 2100
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
2105 2110 2115
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
2120 2125 2130
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser
2135 2140 2145
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
2150 2155 2160
Lys Lys Lys Gly Ser
2165
<210> 77
<211> 2292
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 77
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Gly Ser Gly Gly Ser Gly
1 5 10 15
Gln Thr Gly Lys Lys Ser Glu Lys Gly Pro Val Cys Trp Arg Lys Arg
20 25 30
Val Lys Ser Glu Tyr Met Arg Leu Arg Gln Leu Lys Arg Phe Arg Arg
35 40 45
Ala Asp Glu Val Lys Ser Met Phe Ser Ser Asn Arg Gln Lys Ile Leu
50 55 60
Glu Arg Thr Glu Ile Leu Asn Gln Glu Trp Lys Gln Arg Arg Ile Gln
65 70 75 80
Pro Val His Ile Leu Thr Ser Val Ser Ser Leu Arg Gly Thr Arg Glu
85 90 95
Cys Ser Val Thr Ser Asp Leu Asp Phe Pro Thr Gln Val Ile Pro Leu
100 105 110
Lys Thr Leu Asn Ala Val Ala Ser Val Pro Ile Met Tyr Ser Trp Ser
115 120 125
Pro Leu Gln Gln Asn Phe Met Val Glu Asp Glu Thr Val Leu His Asn
130 135 140
Ile Pro Tyr Met Gly Asp Glu Val Leu Asp Gln Asp Gly Thr Phe Ile
145 150 155 160
Glu Glu Leu Ile Lys Asn Tyr Asp Gly Lys Val His Gly Asp Arg Glu
165 170 175
Cys Gly Phe Ile Asn Asp Glu Ile Phe Val Glu Leu Val Asn Ala Leu
180 185 190
Gly Gln Tyr Asn Asp Asp Asp Asp Asp Asp Asp Gly Asp Asp Pro Glu
195 200 205
Glu Arg Glu Glu Lys Gln Lys Asp Leu Glu Asp His Arg Asp Asp Lys
210 215 220
Glu Ser Arg Pro Pro Arg Lys Phe Pro Ser Asp Lys Ile Phe Glu Ala
225 230 235 240
Ile Ser Ser Met Phe Pro Asp Lys Gly Thr Ala Glu Glu Leu Lys Glu
245 250 255
Lys Tyr Lys Glu Leu Thr Glu Gln Gln Leu Pro Gly Ala Leu Pro Pro
260 265 270
Glu Cys Thr Pro Asn Ile Asp Gly Pro Asn Ala Lys Ser Val Gln Arg
275 280 285
Glu Gln Ser Leu His Ser Phe His Thr Leu Phe Cys Arg Arg Cys Phe
290 295 300
Lys Tyr Asp Cys Phe Leu His Pro Phe His Ala Thr Pro Asn Thr Tyr
305 310 315 320
Lys Arg Lys Asn Thr Glu Thr Ala Leu Asp Asn Lys Pro Cys Gly Pro
325 330 335
Gln Cys Tyr Gln His Leu Glu Gly Ala Lys Glu Phe Ala Ala Ala Leu
340 345 350
Thr Ala Glu Arg Ile Lys Thr Pro Pro Lys Arg Pro Gly Gly Arg Arg
355 360 365
Arg Gly Arg Leu Pro Asn Asn Ser Ser Arg Pro Ser Thr Pro Thr Ile
370 375 380
Asn Val Leu Glu Ser Lys Asp Thr Asp Ser Asp Arg Glu Ala Gly Thr
385 390 395 400
Glu Thr Gly Gly Glu Asn Asn Asp Lys Glu Glu Glu Glu Lys Lys Asp
405 410 415
Glu Thr Ser Ser Ser Ser Glu Ala Asn Ser Arg Cys Gln Thr Pro Ile
420 425 430
Lys Met Lys Pro Asn Ile Glu Pro Pro Glu Asn Val Glu Trp Ser Gly
435 440 445
Ala Glu Ala Ser Met Phe Arg Val Leu Ile Gly Thr Tyr Tyr Asp Asn
450 455 460
Phe Cys Ala Ile Ala Arg Leu Ile Gly Thr Lys Thr Cys Arg Gln Val
465 470 475 480
Tyr Glu Phe Arg Val Lys Glu Ser Ser Ile Ile Ala Pro Ala Pro Ala
485 490 495
Glu Asp Val Asp Thr Pro Pro Arg Lys Lys Lys Arg Lys His Arg Leu
500 505 510
Trp Ala Ala His Cys Arg Lys Ile Gln Leu Lys Lys Asp Gly Ser Ser
515 520 525
Asn His Val Tyr Asn Tyr Gln Pro Cys Asp His Pro Arg Gln Pro Cys
530 535 540
Asp Ser Ser Cys Pro Cys Val Ile Ala Gln Asn Phe Cys Glu Lys Phe
545 550 555 560
Cys Gln Cys Ser Ser Glu Cys Gln Asn Arg Phe Pro Gly Cys Arg Cys
565 570 575
Lys Ala Gln Cys Asn Thr Lys Gln Cys Pro Cys Tyr Leu Ala Val Arg
580 585 590
Glu Cys Asp Pro Asp Leu Cys Leu Thr Cys Gly Ala Ala Asp His Trp
595 600 605
Asp Ser Lys Asn Val Ser Cys Lys Asn Cys Ser Ile Gln Arg Gly Ser
610 615 620
Lys Lys His Leu Leu Leu Ala Pro Ser Asp Val Ala Gly Trp Gly Ile
625 630 635 640
Phe Ile Lys Asp Pro Val Gln Lys Asn Glu Phe Ile Ser Glu Tyr Cys
645 650 655
Gly Glu Ile Ile Ser Gln Asp Glu Ala Asp Arg Arg Gly Lys Val Tyr
660 665 670
Asp Lys Tyr Met Cys Ser Phe Leu Phe Asn Leu Asn Asn Asp Phe Val
675 680 685
Val Asp Ala Thr Arg Lys Gly Asn Lys Ile Arg Phe Ala Asn His Ser
690 695 700
Val Asn Pro Asn Cys Tyr Ala Lys Val Met Met Val Asn Gly Asp His
705 710 715 720
Arg Ile Gly Ile Phe Ala Lys Arg Ala Ile Gln Thr Gly Glu Glu Leu
725 730 735
Phe Phe Asp Tyr Arg Tyr Ser Gln Ala Asp Ala Leu Lys Tyr Val Gly
740 745 750
Ile Glu Arg Glu Met Glu Ile Pro Ser Thr Gly Gly Ser Gly Gly Ser
755 760 765
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly Arg Pro Asp Lys Lys Tyr
770 775 780
Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile
785 790 795 800
Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn
805 810 815
Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe
820 825 830
Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg
835 840 845
Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile
850 855 860
Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu
865 870 875 880
Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro
885 890 895
Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro
900 905 910
Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala
915 920 925
Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg
930 935 940
Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val
945 950 955 960
Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu
965 970 975
Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser
980 985 990
Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu
995 1000 1005
Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu
1010 1015 1020
Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala
1025 1030 1035
Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
1040 1045 1050
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
1055 1060 1065
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
1070 1075 1080
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
1085 1090 1095
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu
1100 1105 1110
Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu
1115 1120 1125
Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp
1130 1135 1140
Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile
1145 1150 1155
Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
1160 1165 1170
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
1175 1180 1185
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
1190 1195 1200
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys
1205 1210 1215
Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
1220 1225 1230
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser
1235 1240 1245
Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys
1250 1255 1260
Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp
1265 1270 1275
Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
1280 1285 1290
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
1295 1300 1305
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
1310 1315 1320
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
1325 1330 1335
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys
1340 1345 1350
Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala
1355 1360 1365
Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys
1370 1375 1380
Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile
1385 1390 1395
Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu
1400 1405 1410
Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
1415 1420 1425
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
1430 1435 1440
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile
1445 1450 1455
Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met
1460 1465 1470
Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln
1475 1480 1485
Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile
1490 1495 1500
Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln
1505 1510 1515
Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
1520 1525 1530
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
1535 1540 1545
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
1550 1555 1560
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His
1565 1570 1575
Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr
1580 1585 1590
Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp
1595 1600 1605
Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln
1610 1615 1620
Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg
1625 1630 1635
Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu
1640 1645 1650
Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
1655 1660 1665
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
1670 1675 1680
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg
1685 1690 1695
Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile
1700 1705 1710
Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu
1715 1720 1725
Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser
1730 1735 1740
Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn
1745 1750 1755
Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly
1760 1765 1770
Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
1775 1780 1785
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1790 1795 1800
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1805 1810 1815
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1820 1825 1830
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1835 1840 1845
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1850 1855 1860
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1865 1870 1875
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1880 1885 1890
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1895 1900 1905
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1910 1915 1920
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1925 1930 1935
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1940 1945 1950
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1955 1960 1965
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1970 1975 1980
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1985 1990 1995
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
2000 2005 2010
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
2015 2020 2025
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
2030 2035 2040
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
2045 2050 2055
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
2060 2065 2070
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
2075 2080 2085
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
2090 2095 2100
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
2105 2110 2115
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
2120 2125 2130
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser
2135 2140 2145
Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
2150 2155 2160
Lys Lys Lys Ser Gly Gly Gly Gly Ser Asp Ala Lys Ser Leu Thr
2165 2170 2175
Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp
2180 2185 2190
Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile
2195 2200 2205
Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser
2210 2215 2220
Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu
2225 2230 2235
Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
2240 2245 2250
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
2255 2260 2265
Gly Gly Gly Gly Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
2270 2275 2280
Gly Gln Ala Lys Lys Lys Lys Gly Ser
2285 2290
<210> 78
<211> 1923
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 78
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Gly Gly Gly Gly Ser Gly Ser Ala Ala Ile Ala Glu Val Leu
20 25 30
Leu Asn Ala Arg Cys Asp Leu His Ala Val Asn Tyr His Gly Asp Thr
35 40 45
Pro Leu His Ile Ala Ala Arg Glu Ser Tyr His Asp Cys Val Leu Leu
50 55 60
Phe Leu Ser Arg Gly Ala Asn Pro Glu Leu Arg Asn Lys Glu Gly Asp
65 70 75 80
Thr Ala Trp Asp Leu Thr Pro Glu Arg Ser Asp Val Trp Phe Ala Leu
85 90 95
Gln Leu Asn Arg Lys Leu Arg Leu Gly Val Gly Asn Arg Ala Ile Arg
100 105 110
Thr Glu Lys Ile Ile Cys Arg Asp Val Ala Arg Gly Tyr Glu Asn Val
115 120 125
Pro Ile Pro Cys Val Asn Gly Val Asp Gly Glu Pro Cys Pro Glu Asp
130 135 140
Tyr Lys Tyr Ile Ser Glu Asn Cys Glu Thr Ser Thr Met Asn Ile Asp
145 150 155 160
Arg Asn Ile Thr His Leu Gln His Cys Thr Cys Val Asp Asp Cys Ser
165 170 175
Ser Ser Asn Cys Leu Cys Gly Gln Leu Ser Ile Arg Cys Trp Tyr Asp
180 185 190
Lys Asp Gly Arg Leu Leu Gln Glu Phe Asn Lys Ile Glu Pro Pro Leu
195 200 205
Ile Phe Glu Cys Asn Gln Ala Cys Ser Cys Trp Arg Asn Cys Lys Asn
210 215 220
Arg Val Val Gln Ser Gly Ile Lys Val Arg Leu Gln Leu Tyr Arg Thr
225 230 235 240
Ala Lys Met Gly Trp Gly Val Arg Ala Leu Gln Thr Ile Pro Gln Gly
245 250 255
Thr Phe Ile Cys Glu Tyr Val Gly Glu Leu Ile Ser Asp Ala Glu Ala
260 265 270
Asp Val Arg Glu Asp Asp Ser Tyr Leu Phe Asp Leu Asp Asn Lys Asp
275 280 285
Gly Glu Val Tyr Cys Ile Asp Ala Arg Tyr Tyr Gly Asn Ile Ser Arg
290 295 300
Phe Ile Asn His Leu Cys Asp Pro Asn Ile Ile Pro Val Arg Val Phe
305 310 315 320
Met Leu His Gln Asp Leu Arg Phe Pro Arg Ile Ala Phe Phe Ser Ser
325 330 335
Arg Asp Ile Arg Thr Gly Glu Glu Leu Gly Phe Asp Tyr Gly Asp Arg
340 345 350
Phe Trp Asp Ile Lys Ser Lys Tyr Phe Thr Cys Gln Cys Gly Ser Glu
355 360 365
Lys Cys Lys His Ser Ala Glu Ala Ile Ala Leu Glu Gln Ser Arg Leu
370 375 380
Ala Arg Leu Asp Pro His Pro Glu Leu Leu Pro Glu Leu Gly Ser Leu
385 390 395 400
Pro Pro Val Asn Thr Gly Gly Gly Gly Ser Gly Asp Lys Lys Tyr Ser
405 410 415
Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr
420 425 430
Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr
435 440 445
Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp
450 455 460
Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg
465 470 475 480
Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe
485 490 495
Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu
500 505 510
Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile
515 520 525
Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr
530 535 540
Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp
545 550 555 560
Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly
565 570 575
His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp
580 585 590
Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu
595 600 605
Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala
610 615 620
Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro
625 630 635 640
Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu
645 650 655
Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala
660 665 670
Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu
675 680 685
Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys
690 695 700
Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr
705 710 715 720
Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp
725 730 735
Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln
740 745 750
Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly
755 760 765
Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys
770 775 780
Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu
785 790 795 800
Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp
805 810 815
Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile
820 825 830
Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu
835 840 845
Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro
850 855 860
Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu
865 870 875 880
Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala
885 890 895
Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu
900 905 910
Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe
915 920 925
Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met
930 935 940
Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
945 950 955 960
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu
965 970 975
Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly
980 985 990
Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu
995 1000 1005
Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu
1010 1015 1020
Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp
1025 1030 1035
Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe
1040 1045 1050
Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
1055 1060 1065
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
1070 1075 1080
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
1085 1090 1095
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr
1100 1105 1110
Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp
1115 1120 1125
Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile
1130 1135 1140
Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val
1145 1150 1155
Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile Glu Met
1160 1165 1170
Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg
1175 1180 1185
Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
1190 1195 1200
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
1205 1210 1215
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr
1220 1225 1230
Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val
1235 1240 1245
Ala Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp
1250 1255 1260
Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg Gly Lys Ser Asp
1265 1270 1275
Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp
1280 1285 1290
Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
1295 1300 1305
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
1310 1315 1320
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
1325 1330 1335
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr
1340 1345 1350
Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu
1355 1360 1365
Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr
1370 1375 1380
Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr
1385 1390 1395
Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys
1400 1405 1410
Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val
1415 1420 1425
Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr
1430 1435 1440
Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr
1445 1450 1455
Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile
1460 1465 1470
Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg
1475 1480 1485
Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn
1490 1495 1500
Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu
1505 1510 1515
Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys
1520 1525 1530
Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr
1535 1540 1545
Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys
1550 1555 1560
Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile
1565 1570 1575
Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu
1580 1585 1590
Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu
1595 1600 1605
Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met
1610 1615 1620
Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu
1625 1630 1635
Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu
1640 1645 1650
Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe
1655 1660 1665
Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile
1670 1675 1680
Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp
1685 1690 1695
Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg
1700 1705 1710
Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu
1715 1720 1725
Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg
1730 1735 1740
Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile
1745 1750 1755
His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser
1760 1765 1770
Gln Leu Gly Gly Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys
1775 1780 1785
Lys Ala Gly Gln Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser
1790 1795 1800
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
1805 1810 1815
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu
1820 1825 1830
Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn
1835 1840 1845
Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp
1850 1855 1860
Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu
1865 1870 1875
Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe
1880 1885 1890
Glu Ile Lys Ser Ser Val Gly Gly Gly Gly Ser Gly Lys Arg Pro
1895 1900 1905
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1910 1915 1920
<210> 79
<211> 1533
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 79
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ser Gly Gly Gly Gly Ser Ser Arg Arg Lys Gln Ser Asn Pro Arg
20 25 30
Gln Ile Lys Arg Ser Leu Gly Asp Met Glu Ala Arg Glu Glu Val Gln
35 40 45
Leu Val Gly Ala Ser His Met Glu Gln Lys Ala Thr Ala Pro Glu Ala
50 55 60
Pro Ser Pro Gly Gly Gly Gly Ser Gly Asp Lys Lys Tyr Ser Ile Gly
65 70 75 80
Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu
85 90 95
Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg
100 105 110
His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly
115 120 125
Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr
130 135 140
Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn
145 150 155 160
Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser
165 170 175
Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly
180 185 190
Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr
195 200 205
His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg
210 215 220
Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe
225 230 235 240
Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu
245 250 255
Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro
260 265 270
Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu
275 280 285
Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu
290 295 300
Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu
305 310 315 320
Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu
325 330 335
Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala
340 345 350
Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu
355 360 365
Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile
370 375 380
Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His
385 390 395 400
His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro
405 410 415
Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala
420 425 430
Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile
435 440 445
Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys
450 455 460
Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly
465 470 475 480
Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
485 490 495
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile
500 505 510
Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala
515 520 525
Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr
530 535 540
Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala
545 550 555 560
Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn
565 570 575
Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val
580 585 590
Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys
595 600 605
Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu
610 615 620
Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr
625 630 635 640
Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu
645 650 655
Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile
660 665 670
Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu
675 680 685
Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile
690 695 700
Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met
705 710 715 720
Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg
725 730 735
Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu
740 745 750
Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu
755 760 765
Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln
770 775 780
Val Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
785 790 795 800
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val
805 810 815
Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val
820 825 830
Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn
835 840 845
Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly
850 855 860
Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn
865 870 875 880
Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val
885 890 895
Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Ala Ala
900 905 910
Ile Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val
915 920 925
Leu Thr Arg Ser Asp Lys Ala Arg Gly Lys Ser Asp Asn Val Pro Ser
930 935 940
Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn
945 950 955 960
Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu
965 970 975
Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln
980 985 990
Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp
995 1000 1005
Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg
1010 1015 1020
Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe
1025 1030 1035
Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr
1040 1045 1050
His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala
1055 1060 1065
Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly
1070 1075 1080
Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu
1085 1090 1095
Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1100 1105 1110
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1115 1120 1125
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu
1130 1135 1140
Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val
1145 1150 1155
Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln
1160 1165 1170
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1175 1180 1185
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr
1190 1195 1200
Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1205 1210 1215
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1220 1225 1230
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys
1235 1240 1245
Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys
1250 1255 1260
Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
1265 1270 1275
Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln
1280 1285 1290
Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
1295 1300 1305
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp
1310 1315 1320
Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu
1325 1330 1335
Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1340 1345 1350
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1355 1360 1365
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His
1370 1375 1380
Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr
1385 1390 1395
Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu
1400 1405 1410
Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1415 1420 1425
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly
1430 1435 1440
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1445 1450 1455
Lys Ser Gly Gly Gly Gly Ser Ser Arg Arg Lys Gln Ser Asn Pro
1460 1465 1470
Arg Gln Ile Lys Arg Ser Leu Gly Asp Met Glu Ala Arg Glu Glu
1475 1480 1485
Val Gln Leu Val Gly Ala Ser His Met Glu Gln Lys Ala Thr Ala
1490 1495 1500
Pro Glu Ala Pro Ser Pro Gly Gly Gly Gly Ser Gly Lys Arg Pro
1505 1510 1515
Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser
1520 1525 1530
<210> 80
<211> 9
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:
HA标签序列
<400> 80
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 81
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
CTCF-结合基序序列
<220>
<221> 经修饰的碱基
<222> (1)..(1)
<223> a, c, t, g, 未知的或其他的
<220>
<221> 经修饰的碱基
<222> (3)..(3)
<223> a, c, t, g, 未知的或其他的
<400> 81
nbndccdsha grkgghrshv 20
<210> 82
<211> 20
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
CTCF-结合基序序列
<220>
<221> 经修饰的碱基
<222> (18)..(18)
<223> a, c, t, g, 未知的或其他的
<220>
<221> 经修饰的碱基
<222> (20)..(20)
<223> a, c, t, g, 未知的或其他的
<400> 82
vhsrhggkrg ahsdccdnbn 20
<210> 83
<211> 10
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
YY1-结合基序序列
<220>
<221> 经修饰的碱基
<222> (8)..(8)
<223> a, c, t, g, 未知的或其他的
<400> 83
ccgccatntt 10
<210> 84
<211> 10
<212> DNA
<213> 未知
<220>
<223> 对未知的描述:
YY1-结合基序序列
<220>
<221> 经修饰的碱基
<222> (3)..(3)
<223> a, c, t, g, 未知的或其他的
<400> 84
aanatggcgg 10
<210> 85
<211> 780
<212> PRT
<213> 智人(Homo sapiens)
<400> 85
Met Lys Gly Asp Thr Arg His Leu Asn Gly Glu Glu Asp Ala Gly Gly
1 5 10 15
Arg Glu Asp Ser Ile Leu Val Asn Gly Ala Cys Ser Asp Gln Ser Ser
20 25 30
Asp Ser Pro Pro Ile Leu Glu Ala Ile Arg Thr Pro Glu Ile Arg Gly
35 40 45
Arg Arg Ser Ser Ser Arg Leu Ser Lys Arg Glu Val Ser Ser Leu Leu
50 55 60
Ser Tyr Thr Gln Asp Leu Thr Gly Asp Gly Asp Gly Glu Asp Gly Asp
65 70 75 80
Gly Ser Asp Thr Pro Val Met Pro Lys Leu Phe Arg Glu Thr Arg Thr
85 90 95
Arg Ser Glu Ser Pro Ala Val Arg Thr Arg Asn Asn Asn Ser Val Ser
100 105 110
Ser Arg Glu Arg His Arg Pro Ser Pro Arg Ser Thr Arg Gly Arg Gln
115 120 125
Gly Arg Asn His Val Asp Glu Ser Pro Val Glu Phe Pro Ala Thr Arg
130 135 140
Ser Leu Arg Arg Arg Ala Thr Ala Ser Ala Gly Thr Pro Trp Pro Ser
145 150 155 160
Pro Pro Ser Ser Tyr Leu Thr Ile Asp Leu Thr Asp Asp Thr Glu Asp
165 170 175
Thr His Gly Thr Pro Gln Ser Ser Ser Thr Pro Tyr Ala Arg Leu Ala
180 185 190
Gln Asp Ser Gln Gln Gly Gly Met Glu Ser Pro Gln Val Glu Ala Asp
195 200 205
Ser Gly Asp Gly Asp Ser Ser Glu Tyr Gln Val Ser Ala Asp Lys Leu
210 215 220
Val Ala Leu Gly Leu Phe Ser Gln His Phe Asn Leu Ala Thr Phe Asn
225 230 235 240
Lys Leu Val Ser Tyr Arg Lys Ala Met Tyr His Ala Leu Glu Lys Ala
245 250 255
Arg Val Arg Ala Gly Lys Thr Phe Pro Ser Ser Pro Gly Asp Ser Leu
260 265 270
Glu Asp Gln Leu Lys Pro Met Leu Glu Trp Ala His Gly Gly Phe Lys
275 280 285
Pro Thr Gly Ile Glu Gly Leu Lys Pro Asn Asn Thr Gln Pro Glu Asn
290 295 300
Lys Thr Arg Arg Arg Thr Ala Asp Asp Ser Ala Thr Ser Asp Tyr Cys
305 310 315 320
Pro Ala Pro Lys Arg Leu Lys Thr Asn Cys Tyr Asn Asn Gly Lys Asp
325 330 335
Arg Gly Asp Glu Asp Gln Ser Arg Glu Gln Met Ala Ser Asp Val Ala
340 345 350
Asn Asn Lys Ser Ser Leu Glu Asp Gly Cys Leu Ser Cys Gly Arg Lys
355 360 365
Asn Pro Val Ser Phe His Pro Leu Phe Glu Gly Gly Leu Cys Gln Thr
370 375 380
Cys Arg Asp Arg Phe Leu Glu Leu Phe Tyr Met Tyr Asp Asp Asp Gly
385 390 395 400
Tyr Gln Ser Tyr Cys Thr Val Cys Cys Glu Gly Arg Glu Leu Leu Leu
405 410 415
Cys Ser Asn Thr Ser Cys Cys Arg Cys Phe Cys Val Glu Cys Leu Glu
420 425 430
Val Leu Val Gly Thr Gly Thr Ala Ala Glu Ala Lys Leu Gln Glu Pro
435 440 445
Trp Ser Cys Tyr Met Cys Leu Pro Gln Arg Cys His Gly Val Leu Arg
450 455 460
Arg Arg Lys Asp Trp Asn Val Arg Leu Gln Ala Phe Phe Thr Ser Asp
465 470 475 480
Thr Gly Leu Glu Tyr Glu Ala Pro Lys Leu Tyr Pro Ala Ile Pro Ala
485 490 495
Ala Arg Arg Arg Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile Ala
500 505 510
Thr Gly Tyr Leu Val Leu Lys Glu Leu Gly Ile Lys Val Gly Lys Tyr
515 520 525
Val Ala Ser Glu Val Cys Glu Glu Ser Ile Ala Val Gly Thr Val Lys
530 535 540
His Glu Gly Asn Ile Lys Tyr Val Asn Asp Val Arg Asn Ile Thr Lys
545 550 555 560
Lys Asn Ile Glu Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser
565 570 575
Pro Cys Asn Asp Leu Ser Asn Val Asn Pro Ala Arg Lys Gly Leu Tyr
580 585 590
Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr His Leu Leu Asn Tyr
595 600 605
Ser Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Met Phe Glu
610 615 620
Asn Val Val Ala Met Lys Val Gly Asp Lys Arg Asp Ile Ser Arg Phe
625 630 635 640
Leu Glu Cys Asn Pro Val Met Ile Asp Ala Ile Lys Val Ser Ala Ala
645 650 655
His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro
660 665 670
Val Ile Ala Ser Lys Asn Asp Lys Leu Glu Leu Gln Asp Cys Leu Glu
675 680 685
Tyr Asn Arg Ile Ala Lys Leu Lys Lys Val Gln Thr Ile Thr Thr Lys
690 695 700
Ser Asn Ser Ile Lys Gln Gly Lys Asn Gln Leu Phe Pro Val Val Met
705 710 715 720
Asn Gly Lys Glu Asp Val Leu Trp Cys Thr Glu Leu Glu Arg Ile Phe
725 730 735
Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Gly Arg Gly Ala
740 745 750
Arg Gln Lys Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg His
755 760 765
Leu Phe Ala Pro Leu Lys Asp Tyr Phe Ala Cys Glu
770 775 780
<210> 86
<211> 6
<212> PRT
<213> 猿猴病毒40
<400> 86
Pro Lys Lys Lys Arg Lys
1 5
<210> 87
<211> 15
<212> PRT
<213> 未知
<220>
<223> 对未知的描述:
核质蛋白两组分NLS
<400> 87
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
<210> 88
<211> 1053
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 88
Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile
50 55 60
Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His
65 70 75 80
Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu
85 90 95
Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu
100 105 110
Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr
115 120 125
Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala
130 135 140
Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys
145 150 155 160
Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr
165 170 175
Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln
180 185 190
Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg
195 200 205
Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys
210 215 220
Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe
225 230 235 240
Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr
245 250 255
Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn
260 265 270
Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe
275 280 285
Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu
290 295 300
Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys
305 310 315 320
Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr
325 330 335
Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala
340 345 350
Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu
355 360 365
Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser
370 375 380
Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile
385 390 395 400
Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala
405 410 415
Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln
420 425 430
Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro
435 440 445
Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile
450 455 460
Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg
465 470 475 480
Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys
485 490 495
Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr
500 505 510
Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp
515 520 525
Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu
530 535 540
Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile Pro
545 550 555 560
Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys
565 570 575
Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu
580 585 590
Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile
595 600 605
Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu
610 615 620
Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp
625 630 635 640
Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu
645 650 655
Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys
660 665 670
Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp
675 680 685
Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp
690 695 700
Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys
705 710 715 720
Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys
725 730 735
Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu
740 745 750
Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp
755 760 765
Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu
785 790 795 800
Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu
805 810 815
Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His
820 825 830
Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly
835 840 845
Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr
850 855 860
Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile
865 870 875 880
Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp
885 890 895
Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr
900 905 910
Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val
915 920 925
Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser
930 935 940
Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala
945 950 955 960
Glu Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn Gly
965 970 975
Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile
980 985 990
Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met
995 1000 1005
Asn Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala Ser Lys
1010 1015 1020
Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu
1025 1030 1035
Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly
1040 1045 1050
<210> 89
<211> 3159
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 89
gccaagcgga actacatcct gggcctggcc atcggcatca ccagcgtggg ctacggcatc 60
atcgactacg agacccggga cgtgatcgac gccggcgtgc ggctgttcaa ggaggccaac 120
gtggagaaca acgagggccg gcggagcaag cggggcgccc ggcggctgaa gcggcggcgg 180
cggcaccgga tccagcgggt gaagaagctg ctgttcgact acaacctgct gaccgaccac 240
agcgagctga gcggcatcaa cccctacgag gcccgggtga agggcctgag ccagaagctg 300
agcgaggagg agttcagcgc cgccctgctg cacctggcca agcggcgggg cgtgcacaac 360
gtgaacgagg tggaggagga caccggcaac gagctgagca ccaaggagca gatcagccgg 420
aacagcaagg ccctggagga gaagtacgtg gccgagctgc agctggagcg gctgaagaag 480
gacggcgagg tgcggggcag catcaaccgg ttcaagacca gcgactacgt gaaggaggcc 540
aagcagctgc tgaaggtgca gaaggcctac caccagctgg accagagctt catcgacacc 600
tacatcgacc tgctggagac ccggcggacc tactacgagg gccccggcga gggcagcccc 660
ttcggctgga aggacatcaa ggagtggtac gagatgctga tgggccactg cacctacttc 720
cccgaggagc tgcggagcgt gaagtacgcc tacaacgccg acctgtacaa cgccctgaac 780
gacctgaaca acctggtgat cacccgggac gagaacgaga agctggagta ctacgagaag 840
ttccagatca tcgagaacgt gttcaagcag aagaagaagc ccaccctgaa gcagatcgcc 900
aaggagatcc tggtgaacga ggaggacatc aagggctacc gggtgaccag caccggcaag 960
cccgagttca ccaacctgaa ggtgtaccac gacatcaagg acatcaccgc ccggaaggag 1020
atcatcgaga acgccgagct gctggaccag atcgccaaga tcctgaccat ctaccagagc 1080
agcgaggaca tccaggagga gctgaccaac ctgaacagcg agctgaccca ggaggagatc 1140
gagcagatca gcaacctgaa gggctacacc ggcacccaca acctgagcct gaaggccatc 1200
aacctgatcc tggacgagct gtggcacacc aacgacaacc agatcgccat cttcaaccgg 1260
ctgaagctgg tgcccaagaa ggtggacctg agccagcaga aggagatccc caccaccctg 1320
gtggacgact tcatcctgag ccccgtggtg aagcggagct tcatccagag catcaaggtg 1380
atcaacgcca tcatcaagaa gtacggcctg cccaacgaca tcatcatcga gctggcccgg 1440
gagaagaaca gcaaggacgc ccagaagatg atcaacgaga tgcagaagcg gaaccggcag 1500
accaacgagc ggatcgagga gatcatccgg accaccggca aggagaacgc caagtacctg 1560
atcgagaaga tcaagctgca cgacatgcag gagggcaagt gcctgtacag cctggaggcc 1620
atccccctgg aggacctgct gaacaacccc ttcaactacg aggtggacgc catcatcccc 1680
cggagcgtga gcttcgacaa cagcttcaac aacaaggtgc tggtgaagca ggaggagaac 1740
agcaagaagg gcaaccggac ccccttccag tacctgagca gcagcgacag caagatcagc 1800
tacgagacct tcaagaagca catcctgaac ctggccaagg gcaagggccg gatcagcaag 1860
accaagaagg agtacctgct ggaggagcgg gacatcaacc ggttcagcgt gcagaaggac 1920
ttcatcaacc ggaacctggt ggacacccgg tacgccaccc ggggcctgat gaacctgctg 1980
cggagctact tccgggtgaa caacctggac gtgaaggtga aatccatcaa cggcggcttc 2040
accagcttcc tgcggcggaa gtggaagttc aagaaggagc ggaacaaggg ctacaagcac 2100
cacgccgagg acgccctgat catcgccaac gccgacttca tcttcaagga gtggaagaag 2160
ctggacaagg ccaagaaggt gatggagaac cagatgttcg aggagaagca ggccgagagc 2220
atgcccgaga tcgagaccga gcaggagtac aaggagatct tcatcacccc ccaccagatc 2280
aagcacatca aggacttcaa ggactacaag tacagccacc gggtggacaa gaagcccaac 2340
cggaagctga tcaacgacac cctgtacagc acccggaagg acgacaaggg caacaccctg 2400
atcgtgaaca acctgaacgg cctgtacgac aaggacaacg acaagctgaa gaagctgatc 2460
aacaagagcc ccgagaagct gctgatgtac caccacgacc cccagaccta ccagaagctg 2520
aagctgatca tggagcagta cggcgacgag aagaaccccc tgtacaagta ctacgaggag 2580
accggcaact acctgaccaa gtacagcaag aaggacaacg gccccgtgat caagaagatc 2640
aagtactacg gcaacaagct gaacgcccac ctggacatca ccgacgacta ccccaacagc 2700
cggaacaagg tggtgaagct gagcctgaag ccctaccggt tcgacgtgta cctggacaac 2760
ggcgtgtaca agttcgtgac cgtgaagaac ctggacgtga tcaagaagga gaactactac 2820
gaggtgaaca gcaagtgcta cgaggaggcc aagaagctga agaagatcag caaccaggcc 2880
gagttcatcg ccagcttcta caagaacgac ctgatcaaga tcaacggcga gctgtaccgg 2940
gtgatcggcg tgaacaacga cctgctgaac cggatcgagg tgaacatgat cgacatcacc 3000
taccgggagt acctggagaa catgaacgac aagcggcccc cccacatcat caagaccatc 3060
gccagcaaga cccagagcat caagaagtac agcaccgaca tcctgggcaa cctgtacgag 3120
gtgaaatcca agaagcaccc ccagatcatc aagaagggc 3159
<210> 90
<211> 386
<212> PRT
<213> 单比亚螺原体(Spiroplasma monobiae)
<400> 90
Met Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val Phe Glu Ala
1 5 10 15
Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys Val Arg Lys
20 25 30
Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val Pro Ala Ile
35 40 45
Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys Leu Glu Tyr
50 55 60
Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr
65 70 75 80
Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg
85 90 95
Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser
100 105 110
Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr
115 120 125
Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu
130 135 140
Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg
145 150 155 160
Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys
165 170 175
Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu Leu
180 185 190
His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys Leu Glu
195 200 205
Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala Ala Asp Phe
210 215 220
Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser Thr Leu Asn
225 230 235 240
Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys Ser Ile Lys
245 250 255
Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu Asn Asn Leu
260 265 270
Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser Asn Ile Asn
275 280 285
Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu Gly Tyr Val
290 295 300
Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn
305 310 315 320
Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser
325 330 335
Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg
340 345 350
Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys
355 360 365
Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile
370 375 380
Gly Gly
385
<210> 91
<211> 7433
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 91
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggtac 420
ctaatacgac tcactataag gaaataagag agaaaagaag agtaagaaga aatataagag 480
ccaccatggc ccccaagaag aagcggaagg tgggcatcca cggcgtgccc gccgccgcca 540
agcggaacta catcctgggc ctggccatcg gcatcaccag cgtgggctac ggcatcatcg 600
actacgagac ccgggacgtg atcgacgccg gcgtgcggct gttcaaggag gccaacgtgg 660
agaacaacga gggccggcgg agcaagcggg gcgcccggcg gctgaagcgg cggcggcggc 720
accggatcca gcgggtgaag aagctgctgt tcgactacaa cctgctgacc gaccacagcg 780
agctgagcgg catcaacccc tacgaggccc gggtgaaggg cctgagccag aagctgagcg 840
aggaggagtt cagcgccgcc ctgctgcacc tggccaagcg gcggggcgtg cacaacgtga 900
acgaggtgga ggaggacacc ggcaacgagc tgagcaccaa ggagcagatc agccggaaca 960
gcaaggccct ggaggagaag tacgtggccg agctgcagct ggagcggctg aagaaggacg 1020
gcgaggtgcg gggcagcatc aaccggttca agaccagcga ctacgtgaag gaggccaagc 1080
agctgctgaa ggtgcagaag gcctaccacc agctggacca gagcttcatc gacacctaca 1140
tcgacctgct ggagacccgg cggacctact acgagggccc cggcgagggc agccccttcg 1200
gctggaagga catcaaggag tggtacgaga tgctgatggg ccactgcacc tacttccccg 1260
aggagctgcg gagcgtgaag tacgcctaca acgccgacct gtacaacgcc ctgaacgacc 1320
tgaacaacct ggtgatcacc cgggacgaga acgagaagct ggagtactac gagaagttcc 1380
agatcatcga gaacgtgttc aagcagaaga agaagcccac cctgaagcag atcgccaagg 1440
agatcctggt gaacgaggag gacatcaagg gctaccgggt gaccagcacc ggcaagcccg 1500
agttcaccaa cctgaaggtg taccacgaca tcaaggacat caccgcccgg aaggagatca 1560
tcgagaacgc cgagctgctg gaccagatcg ccaagatcct gaccatctac cagagcagcg 1620
aggacatcca ggaggagctg accaacctga acagcgagct gacccaggag gagatcgagc 1680
agatcagcaa cctgaagggc tacaccggca cccacaacct gagcctgaag gccatcaacc 1740
tgatcctgga cgagctgtgg cacaccaacg acaaccagat cgccatcttc aaccggctga 1800
agctggtgcc caagaaggtg gacctgagcc agcagaagga gatccccacc accctggtgg 1860
acgacttcat cctgagcccc gtggtgaagc ggagcttcat ccagagcatc aaggtgatca 1920
acgccatcat caagaagtac ggcctgccca acgacatcat catcgagctg gcccgggaga 1980
agaacagcaa ggacgcccag aagatgatca acgagatgca gaagcggaac cggcagacca 2040
acgagcggat cgaggagatc atccggacca ccggcaagga gaacgccaag tacctgatcg 2100
agaagatcaa gctgcacgac atgcaggagg gcaagtgcct gtacagcctg gaggccatcc 2160
ccctggagga cctgctgaac aaccccttca actacgaggt ggacgccatc atcccccgga 2220
gcgtgagctt cgacaacagc ttcaacaaca aggtgctggt gaagcaggag gagaacagca 2280
agaagggcaa ccggaccccc ttccagtacc tgagcagcag cgacagcaag atcagctacg 2340
agaccttcaa gaagcacatc ctgaacctgg ccaagggcaa gggccggatc agcaagacca 2400
agaaggagta cctgctggag gagcgggaca tcaaccggtt cagcgtgcag aaggacttca 2460
tcaaccggaa cctggtggac acccggtacg ccacccgggg cctgatgaac ctgctgcgga 2520
gctacttccg ggtgaacaac ctggacgtga aggtgaaatc catcaacggc ggcttcacca 2580
gcttcctgcg gcggaagtgg aagttcaaga aggagcggaa caagggctac aagcaccacg 2640
ccgaggacgc cctgatcatc gccaacgccg acttcatctt caaggagtgg aagaagctgg 2700
acaaggccaa gaaggtgatg gagaaccaga tgttcgagga gaagcaggcc gagagcatgc 2760
ccgagatcga gaccgagcag gagtacaagg agatcttcat caccccccac cagatcaagc 2820
acatcaagga cttcaaggac tacaagtaca gccaccgggt ggacaagaag cccaaccgga 2880
agctgatcaa cgacaccctg tacagcaccc ggaaggacga caagggcaac accctgatcg 2940
tgaacaacct gaacggcctg tacgacaagg acaacgacaa gctgaagaag ctgatcaaca 3000
agagccccga gaagctgctg atgtaccacc acgaccccca gacctaccag aagctgaagc 3060
tgatcatgga gcagtacggc gacgagaaga accccctgta caagtactac gaggagaccg 3120
gcaactacct gaccaagtac agcaagaagg acaacggccc cgtgatcaag aagatcaagt 3180
actacggcaa caagctgaac gcccacctgg acatcaccga cgactacccc aacagccgga 3240
acaaggtggt gaagctgagc ctgaagccct accggttcga cgtgtacctg gacaacggcg 3300
tgtacaagtt cgtgaccgtg aagaacctgg acgtgatcaa gaaggagaac tactacgagg 3360
tgaacagcaa gtgctacgag gaggccaaga agctgaagaa gatcagcaac caggccgagt 3420
tcatcgccag cttctacaag aacgacctga tcaagatcaa cggcgagctg taccgggtga 3480
tcggcgtgaa caacgacctg ctgaaccgga tcgaggtgaa catgatcgac atcacctacc 3540
gggagtacct ggagaacatg aacgacaagc ggccccccca catcatcaag accatcgcca 3600
gcaagaccca gagcatcaag aagtacagca ccgacatcct gggcaacctg tacgaggtga 3660
aatccaagaa gcacccccag atcatcaaga agggcaagcg gcccgccgcc accaagaagg 3720
ccggccaggc caagaagaag aaggcccggg acagcaaggt ggagaacaag accaagaagc 3780
tgcgggtgtt cgaggccttc gccggcatcg gcgcccagcg gaaggccctg gagaaggtgc 3840
ggaaggacga gtacgagatc gtgggcctgg ccgagtggta cgtgcccgcc atcgtgatgt 3900
accaggccat ccacaacaac ttccacacca agctggagta caagagcgtg agccgggagg 3960
agatgatcga ctacctggag aacaagaccc tgagctggaa cagcaagaac cccgtgagca 4020
acggctactg gaagcggaag aaggacgacg agctgaagat catctacaac gccatcaagc 4080
tgagcgagaa ggagggcaac atcttcgaca tccgggacct gtacaagcgg accctgaaga 4140
acatcgacct gctgacctac agcttcccct gccaggacct gagccagcag ggcatccaga 4200
agggcatgaa gcggggcagc ggcacccgga gcggcctgct gtgggagatc gagcgggccc 4260
tggacagcac cgagaagaac gacctgccca agtacctgct gatggagaac gtgggcgccc 4320
tgctgcacaa gaagaacgag gaggagctga accagtggaa gcagaagctg gagagcctgg 4380
gctaccagaa cagcatcgag gtgctgaacg ccgccgactt cggcagcagc caggcccggc 4440
ggcgggtgtt catgatcagc accctgaacg agttcgtgga gctgcccaag ggcgacaaga 4500
agcccaagag catcaagaag gtgctgaaca agatcgtgag cgagaaggac atcctgaaca 4560
acctgctgaa gtacaacctg accgagttca agaaaaccaa gagcaacatc aacaaggcca 4620
gcctgatcgg ctacagcaag ttcaacagcg agggctacgt gtacgacccc gagttcaccg 4680
gccccaccct gaccgccagc ggcgccaaca gccggatcaa gatcaaggac ggcagcaaca 4740
tccggaagat gaacagcgac gagaccttcc tgtacatcgg cttcgacagc caggacggca 4800
agcgggtgaa cgagatcgag ttcctgaccg agaaccagaa gatcttcgtg tgcggcaaca 4860
gcatcagcgt ggaggtgctg gaggccatca tcgacaagat cggcggcccc agcagcggcg 4920
gcaagcggcc cgccgccacc aagaaggccg gccaggccaa gaagaagaag ggcagctacc 4980
cctacgacgt gcccgactac gcctgagcgg ccgcttaatt aagctgcctt ctgcggggct 5040
tgccttctgg ccatgccctt cttctctccc ttgcacctgt acctcttggt ctttgaataa 5100
agcctgagta ggaagtctag aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa ttgtcttctt catcgcctgc 5220
agatcccaat ggcgcgccga gcttggctcg agcatggtca tagctgtttc ctgtgtgaaa 5280
ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 5340
gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 5400
gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg 5460
tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 5520
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 5580
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 5640
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 5700
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 5760
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 5820
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 5880
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 5940
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 6000
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 6060
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 6120
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 6180
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 6240
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 6300
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 6360
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 6420
gaaaaactca tcgagcatca aatgaaactg caatttattc atatcaggat tatcaatacc 6480
atatttttga aaaagccgtt tctgtaatga aggagaaaac tcaccgaggc agttccatag 6540
gatggcaaga tcctggtatc ggtctgcgat tccgactcgt ccaacatcaa tacaacctat 6600
taatttcccc tcgtcaaaaa taaggttatc aagtgagaaa tcaccatgag tgacgactga 6660
atccggtgag aatggcaaaa gtttatgcat ttctttccag acttgttcaa caggccagcc 6720
attacgctcg tcatcaaaat cactcgcatc aaccaaaccg ttattcattc gtgattgcgc 6780
ctgagcgaga cgaaatacgc gatcgctgtt aaaaggacaa ttacaaacag gaatcgaatg 6840
caaccggcgc aggaacactg ccagcgcatc aacaatattt tcacctgaat caggatattc 6900
ttctaatacc tggaatgctg ttttcccagg gatcgcagtg gtgagtaacc atgcatcatc 6960
aggagtacgg ataaaatgct tgatggtcgg aagaggcata aattccgtca gccagtttag 7020
tctgaccatc tcatctgtaa catcattggc aacgctacct ttgccatgtt tcagaaacaa 7080
ctctggcgca tcgggcttcc catacaatcg atagattgtc gcacctgatt gcccgacatt 7140
atcgcgagcc catttatacc catataaatc agcatccatg ttggaattta atcgcggcct 7200
agagcaagac gtttcccgtt gaatatggct catactcttc ctttttcaat attattgaag 7260
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 7320
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 7380
tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtc 7433
<210> 92
<211> 4762
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 92
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgc caagcggaac tacatcctgg 120
gcctggccat cggcatcacc agcgtgggct acggcatcat cgactacgag acccgggacg 180
tgatcgacgc cggcgtgcgg ctgttcaagg aggccaacgt ggagaacaac gagggccggc 240
ggagcaagcg gggcgcccgg cggctgaagc ggcggcggcg gcaccggatc cagcgggtga 300
agaagctgct gttcgactac aacctgctga ccgaccacag cgagctgagc ggcatcaacc 360
cctacgaggc ccgggtgaag ggcctgagcc agaagctgag cgaggaggag ttcagcgccg 420
ccctgctgca cctggccaag cggcggggcg tgcacaacgt gaacgaggtg gaggaggaca 480
ccggcaacga gctgagcacc aaggagcaga tcagccggaa cagcaaggcc ctggaggaga 540
agtacgtggc cgagctgcag ctggagcggc tgaagaagga cggcgaggtg cggggcagca 600
tcaaccggtt caagaccagc gactacgtga aggaggccaa gcagctgctg aaggtgcaga 660
aggcctacca ccagctggac cagagcttca tcgacaccta catcgacctg ctggagaccc 720
ggcggaccta ctacgagggc cccggcgagg gcagcccctt cggctggaag gacatcaagg 780
agtggtacga gatgctgatg ggccactgca cctacttccc cgaggagctg cggagcgtga 840
agtacgccta caacgccgac ctgtacaacg ccctgaacga cctgaacaac ctggtgatca 900
cccgggacga gaacgagaag ctggagtact acgagaagtt ccagatcatc gagaacgtgt 960
tcaagcagaa gaagaagccc accctgaagc agatcgccaa ggagatcctg gtgaacgagg 1020
aggacatcaa gggctaccgg gtgaccagca ccggcaagcc cgagttcacc aacctgaagg 1080
tgtaccacga catcaaggac atcaccgccc ggaaggagat catcgagaac gccgagctgc 1140
tggaccagat cgccaagatc ctgaccatct accagagcag cgaggacatc caggaggagc 1200
tgaccaacct gaacagcgag ctgacccagg aggagatcga gcagatcagc aacctgaagg 1260
gctacaccgg cacccacaac ctgagcctga aggccatcaa cctgatcctg gacgagctgt 1320
ggcacaccaa cgacaaccag atcgccatct tcaaccggct gaagctggtg cccaagaagg 1380
tggacctgag ccagcagaag gagatcccca ccaccctggt ggacgacttc atcctgagcc 1440
ccgtggtgaa gcggagcttc atccagagca tcaaggtgat caacgccatc atcaagaagt 1500
acggcctgcc caacgacatc atcatcgagc tggcccggga gaagaacagc aaggacgccc 1560
agaagatgat caacgagatg cagaagcgga accggcagac caacgagcgg atcgaggaga 1620
tcatccggac caccggcaag gagaacgcca agtacctgat cgagaagatc aagctgcacg 1680
acatgcagga gggcaagtgc ctgtacagcc tggaggccat ccccctggag gacctgctga 1740
acaacccctt caactacgag gtggacgcca tcatcccccg gagcgtgagc ttcgacaaca 1800
gcttcaacaa caaggtgctg gtgaagcagg aggagaacag caagaagggc aaccggaccc 1860
ccttccagta cctgagcagc agcgacagca agatcagcta cgagaccttc aagaagcaca 1920
tcctgaacct ggccaagggc aagggccgga tcagcaagac caagaaggag tacctgctgg 1980
aggagcggga catcaaccgg ttcagcgtgc agaaggactt catcaaccgg aacctggtgg 2040
acacccggta cgccacccgg ggcctgatga acctgctgcg gagctacttc cgggtgaaca 2100
acctggacgt gaaggtgaaa tccatcaacg gcggcttcac cagcttcctg cggcggaagt 2160
ggaagttcaa gaaggagcgg aacaagggct acaagcacca cgccgaggac gccctgatca 2220
tcgccaacgc cgacttcatc ttcaaggagt ggaagaagct ggacaaggcc aagaaggtga 2280
tggagaacca gatgttcgag gagaagcagg ccgagagcat gcccgagatc gagaccgagc 2340
aggagtacaa ggagatcttc atcacccccc accagatcaa gcacatcaag gacttcaagg 2400
actacaagta cagccaccgg gtggacaaga agcccaaccg gaagctgatc aacgacaccc 2460
tgtacagcac ccggaaggac gacaagggca acaccctgat cgtgaacaac ctgaacggcc 2520
tgtacgacaa ggacaacgac aagctgaaga agctgatcaa caagagcccc gagaagctgc 2580
tgatgtacca ccacgacccc cagacctacc agaagctgaa gctgatcatg gagcagtacg 2640
gcgacgagaa gaaccccctg tacaagtact acgaggagac cggcaactac ctgaccaagt 2700
acagcaagaa ggacaacggc cccgtgatca agaagatcaa gtactacggc aacaagctga 2760
acgcccacct ggacatcacc gacgactacc ccaacagccg gaacaaggtg gtgaagctga 2820
gcctgaagcc ctaccggttc gacgtgtacc tggacaacgg cgtgtacaag ttcgtgaccg 2880
tgaagaacct ggacgtgatc aagaaggaga actactacga ggtgaacagc aagtgctacg 2940
aggaggccaa gaagctgaag aagatcagca accaggccga gttcatcgcc agcttctaca 3000
agaacgacct gatcaagatc aacggcgagc tgtaccgggt gatcggcgtg aacaacgacc 3060
tgctgaaccg gatcgaggtg aacatgatcg acatcaccta ccgggagtac ctggagaaca 3120
tgaacgacaa gcggcccccc cacatcatca agaccatcgc cagcaagacc cagagcatca 3180
agaagtacag caccgacatc ctgggcaacc tgtacgaggt gaaatccaag aagcaccccc 3240
agatcatcaa gaagggcaag cggcccgccg ccaccaagaa ggccggccag gccaagaaga 3300
agaaggcccg ggacagcaag gtggagaaca agaccaagaa gctgcgggtg ttcgaggcct 3360
tcgccggcat cggcgcccag cggaaggccc tggagaaggt gcggaaggac gagtacgaga 3420
tcgtgggcct ggccgagtgg tacgtgcccg ccatcgtgat gtaccaggcc atccacaaca 3480
acttccacac caagctggag tacaagagcg tgagccggga ggagatgatc gactacctgg 3540
agaacaagac cctgagctgg aacagcaaga accccgtgag caacggctac tggaagcgga 3600
agaaggacga cgagctgaag atcatctaca acgccatcaa gctgagcgag aaggagggca 3660
acatcttcga catccgggac ctgtacaagc ggaccctgaa gaacatcgac ctgctgacct 3720
acagcttccc ctgccaggac ctgagccagc agggcatcca gaagggcatg aagcggggca 3780
gcggcacccg gagcggcctg ctgtgggaga tcgagcgggc cctggacagc accgagaaga 3840
acgacctgcc caagtacctg ctgatggaga acgtgggcgc cctgctgcac aagaagaacg 3900
aggaggagct gaaccagtgg aagcagaagc tggagagcct gggctaccag aacagcatcg 3960
aggtgctgaa cgccgccgac ttcggcagca gccaggcccg gcggcgggtg ttcatgatca 4020
gcaccctgaa cgagttcgtg gagctgccca agggcgacaa gaagcccaag agcatcaaga 4080
aggtgctgaa caagatcgtg agcgagaagg acatcctgaa caacctgctg aagtacaacc 4140
tgaccgagtt caagaaaacc aagagcaaca tcaacaaggc cagcctgatc ggctacagca 4200
agttcaacag cgagggctac gtgtacgacc ccgagttcac cggccccacc ctgaccgcca 4260
gcggcgccaa cagccggatc aagatcaagg acggcagcaa catccggaag atgaacagcg 4320
acgagacctt cctgtacatc ggcttcgaca gccaggacgg caagcgggtg aacgagatcg 4380
agttcctgac cgagaaccag aagatcttcg tgtgcggcaa cagcatcagc gtggaggtgc 4440
tggaggccat catcgacaag atcggcggcc ccagcagcgg cggcaagcgg cccgccgcca 4500
ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 4560
acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 4620
ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 4680
agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4740
aaaaaaaaaa aaaaaaaaaa aa 4762
<210> 93
<211> 1506
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 93
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Ala Lys Arg Asn Tyr Ile Leu Gly Leu Ala Ile Gly Ile Thr Ser
20 25 30
Val Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala
35 40 45
Gly Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg
50 55 60
Arg Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg
65 70 75 80
Ile Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp
85 90 95
His Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly
100 105 110
Leu Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His
115 120 125
Leu Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp
130 135 140
Thr Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys
145 150 155 160
Ala Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys
165 170 175
Lys Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp
180 185 190
Tyr Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His
195 200 205
Gln Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr
210 215 220
Arg Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp
225 230 235 240
Lys Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr
245 250 255
Phe Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu
260 265 270
Tyr Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu
275 280 285
Asn Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val
290 295 300
Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile
305 310 315 320
Leu Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly
325 330 335
Lys Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile
340 345 350
Thr Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile
355 360 365
Ala Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu
370 375 380
Leu Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile
385 390 395 400
Ser Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala
405 410 415
Ile Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile
420 425 430
Ala Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser
435 440 445
Gln Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser
450 455 460
Pro Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala
465 470 475 480
Ile Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala
485 490 495
Arg Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln
500 505 510
Lys Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr
515 520 525
Thr Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His
530 535 540
Asp Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu
545 550 555 560
Glu Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp Ala Ile Ile
565 570 575
Pro Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val
580 585 590
Lys Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr
595 600 605
Leu Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His
610 615 620
Ile Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys
625 630 635 640
Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys
645 650 655
Asp Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly
660 665 670
Leu Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val
675 680 685
Lys Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys
690 695 700
Trp Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu
705 710 715 720
Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys
725 730 735
Lys Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu
740 745 750
Lys Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys
755 760 765
Glu Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys
770 775 780
Asp Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Lys Leu
785 790 795 800
Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr
805 810 815
Leu Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys
820 825 830
Leu Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His
835 840 845
His Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr
850 855 860
Gly Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn
865 870 875 880
Tyr Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys
885 890 895
Ile Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp
900 905 910
Asp Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro
915 920 925
Tyr Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr
930 935 940
Val Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn
945 950 955 960
Ser Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln
965 970 975
Ala Glu Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Ile Asn
980 985 990
Gly Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg
995 1000 1005
Ile Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu
1010 1015 1020
Asn Met Asn Asp Lys Arg Pro Pro His Ile Ile Lys Thr Ile Ala
1025 1030 1035
Ser Lys Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly
1040 1045 1050
Asn Leu Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys
1055 1060 1065
Lys Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys
1070 1075 1080
Lys Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys
1085 1090 1095
Leu Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys
1100 1105 1110
Ala Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu
1115 1120 1125
Ala Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His
1130 1135 1140
Asn Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu
1145 1150 1155
Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser
1160 1165 1170
Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp
1175 1180 1185
Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu
1190 1195 1200
Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys
1205 1210 1215
Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser
1220 1225 1230
Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg
1235 1240 1245
Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu
1250 1255 1260
Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala
1265 1270 1275
Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln
1280 1285 1290
Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn
1295 1300 1305
Ala Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met
1310 1315 1320
Ile Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys
1325 1330 1335
Lys Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu
1340 1345 1350
Lys Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe
1355 1360 1365
Lys Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr
1370 1375 1380
Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr
1385 1390 1395
Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile
1400 1405 1410
Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe
1415 1420 1425
Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu
1430 1435 1440
Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn
1445 1450 1455
Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly
1460 1465 1470
Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala
1475 1480 1485
Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro
1490 1495 1500
Asp Tyr Ala
1505
<210> 94
<211> 7499
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 94
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gacgcgtatt gggatggtac 420
ctaatacgac tcactataag gaaataagag agaaaagaag agtaagaaga aatataagag 480
ccaccatggc ccccaagaag aagcggaagg tgggcatcca cggcgtgccc gccgccgaca 540
agaagtacag catcggcctg gccatcggca ccaacagcgt gggctgggcc gtgatcaccg 600
acgagtacaa ggtgcccagc aagaagttca aggtgctggg caacaccgac cggcacagca 660
tcaagaagaa cctgatcggc gccctgctgt tcgacagcgg cgagaccgcc gaggccaccc 720
ggctgaagcg gaccgcccgg cggcggtaca cccggcggaa gaaccggatc tgctacctgc 780
aggagatctt cagcaacgag atggccaagg tggacgacag cttcttccac cggctggagg 840
agagcttcct ggtggaggag gacaagaagc acgagcggca ccccatcttc ggcaacatcg 900
tggacgaggt ggcctaccac gagaagtacc ccaccatcta ccacctgcgg aagaagctgg 960
tggacagcac cgacaaggcc gacctgcggc tgatctacct ggccctggcc cacatgatca 1020
agttccgggg ccacttcctg atcgagggcg acctgaaccc cgacaacagc gacgtggaca 1080
agctgttcat ccagctggtg cagacctaca accagctgtt cgaggagaac cccatcaacg 1140
ccagcggcgt ggacgccaag gccatcctga gcgcccggct gagcaagagc cggcggctgg 1200
agaacctgat cgcccagctg cccggcgaga agaagaacgg cctgttcggc aacctgatcg 1260
ccctgagcct gggcctgacc cccaacttca agagcaactt cgacctggcc gaggacgcca 1320
agctgcagct gagcaaggac acctacgacg acgacctgga caacctgctg gcccagatcg 1380
gcgaccagta cgccgacctg ttcctggccg ccaagaacct gagcgacgcc atcctgctga 1440
gcgacatcct gcgggtgaac accgagatca ccaaggcccc cctgagcgcc agcatgatca 1500
agcggtacga cgagcaccac caggacctga ccctgctgaa ggccctggtg cggcagcagc 1560
tgcccgagaa gtacaaggag atcttcttcg accagagcaa gaacggctac gccggctaca 1620
tcgacggcgg cgccagccag gaggagttct acaagttcat caagcccatc ctggagaaga 1680
tggacggcac cgaggagctg ctggtgaagc tgaaccggga ggacctgctg cggaagcagc 1740
ggaccttcga caacggcagc atcccccacc agatccacct gggcgagctg cacgccatcc 1800
tgcggcggca ggaggacttc taccccttcc tgaaggacaa ccgggagaag atcgagaaga 1860
tcctgacctt ccggatcccc tactacgtgg gccccctggc ccggggcaac agccggttcg 1920
cctggatgac ccggaaatcc gaggagacca tcaccccctg gaacttcgag gaggtggtgg 1980
acaagggcgc cagcgcccag agcttcatcg agcggatgac caacttcgac aagaacctgc 2040
ccaacgagaa ggtgctgccc aagcacagcc tgctgtacga gtacttcacc gtgtacaacg 2100
agctgaccaa ggtgaagtac gtgaccgagg gcatgcggaa gcccgccttc ctgagcggcg 2160
agcagaagaa ggccatcgtg gacctgctgt tcaagaccaa ccggaaggtg accgtgaagc 2220
agctgaagga ggactacttc aagaagatcg agtgcttcga cagcgtggag atcagcggcg 2280
tggaggaccg gttcaacgcc agcctgggca cctaccacga cctgctgaag atcatcaagg 2340
acaaggactt cctggacaac gaggagaacg aggacatcct ggaggacatc gtgctgaccc 2400
tgaccctgtt cgaggaccgg gagatgatcg aggagcggct gaaaacctac gcccacctgt 2460
tcgacgacaa ggtgatgaag cagctgaagc ggcggcggta caccggctgg ggccggctga 2520
gccggaagct gatcaacggc atccgggaca agcagagcgg caagaccatc ctggacttcc 2580
tgaaatccga cggcttcgcc aaccggaact tcatgcagct gatccacgac gacagcctga 2640
ccttcaagga ggacatccag aaggcccagg tgagcggcca gggcgacagc ctgcacgagc 2700
acatcgccaa cctggccggc agccccgcca tcaagaaggg catcctgcag accgtgaagg 2760
tggtggacga gctggtgaag gtgatgggcc ggcacaagcc cgagaacatc gtgatcgaga 2820
tggcccggga gaaccagacc acccagaagg gccagaagaa cagccgggag cggatgaagc 2880
ggatcgagga gggcatcaag gagctgggca gccagatcct gaaggagcac cccgtggaga 2940
acacccagct gcagaacgag aagctgtacc tgtactacct gcagaacggc cgggacatgt 3000
acgtggacca ggagctggac atcaaccggc tgagcgacta cgacgtggcc gccatcgtgc 3060
cccagagctt cctgaaggac gacagcatcg acaacaaggt gctgacccgg agcgacaagg 3120
cccggggcaa gagcgacaac gtgcccagcg aggaggtggt gaagaagatg aagaactact 3180
ggcggcagct gctgaacgcc aagctgatca cccagcggaa gttcgacaac ctgaccaagg 3240
ccgagcgggg cggcctgagc gagctggaca aggccggctt catcaagcgg cagctggtgg 3300
agacccggca gatcaccaag cacgtggccc agatcctgga cagccggatg aacaccaagt 3360
acgacgagaa cgacaagctg atccgggagg tgaaggtgat caccctgaaa tccaagctgg 3420
tgagcgactt ccggaaggac ttccagttct acaaggtgcg ggagatcaac aactaccacc 3480
acgcccacga cgcctacctg aacgccgtgg tgggcaccgc cctgatcaag aagtacccca 3540
agctggagag cgagttcgtg tacggcgact acaaggtgta cgacgtgcgg aagatgatcg 3600
ccaagagcga gcaggagatc ggcaaggcca ccgccaagta cttcttctac agcaacatca 3660
tgaacttctt caagaccgag atcaccctgg ccaacggcga gatccggaag cggcccctga 3720
tcgagaccaa cggcgagacc ggcgagatcg tgtgggacaa gggccgggac ttcgccaccg 3780
tgcggaaggt gctgagcatg ccccaggtga acatcgtgaa gaaaaccgag gtgcagaccg 3840
gcggcttcag caaggagagc atcctgccca agcggaacag cgacaagctg atcgcccgga 3900
agaaggactg ggaccccaag aagtacggcg gcttcgacag ccccaccgtg gcctacagcg 3960
tgctggtggt ggccaaggtg gagaagggca agagcaagaa gctgaaatcc gtgaaggagc 4020
tgctgggcat caccatcatg gagcggagca gcttcgagaa gaaccccatc gacttcctgg 4080
aggccaaggg ctacaaggag gtgaagaagg acctgatcat caagctgccc aagtacagcc 4140
tgttcgagct ggagaacggc cggaagcgga tgctggccag cgccggcgag ctgcagaagg 4200
gcaacgagct ggccctgccc agcaagtacg tgaacttcct gtacctggcc agccactacg 4260
agaagctgaa gggcagcccc gaggacaacg agcagaagca gctgttcgtg gagcagcaca 4320
agcactacct ggacgagatc atcgagcaga tcagcgagtt cagcaagcgg gtgatcctgg 4380
ccgacgccaa cctggacaag gtgctgagcg cctacaacaa gcaccgggac aagcccatcc 4440
gggagcaggc cgagaacatc atccacctgt tcaccctgac caacctgggc gcccccgccg 4500
ccttcaagta cttcgacacc accatcgacc ggaagcggta caccagcacc aaggaggtgc 4560
tggacgccac cctgatccac cagagcatca ccggcctgta cgagacccgg atcgacctga 4620
gccagctggg cggcgacaag cggcccgccg ccaccaagaa ggccggccag gccaagaaga 4680
agaaggccag cgacgccaag agcctgaccg cctggagccg gaccctggtg accttcaagg 4740
acgtgttcgt ggacttcacc cgggaggagt ggaagctgct ggacaccgcc cagcagatcc 4800
tgtaccggaa cgtgatgctg gagaactaca agaacctggt gagcctgggc taccagctga 4860
ccaagcccga cgtgatcctg cggctggaga agggcgagga gccctggctg gtggagcggg 4920
agatccacca ggagacccac cccgacagcg agaccgcctt cgagatcaag agcagcgtga 4980
gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagggca 5040
gctaccccta cgacgtgccc gactacgcct gagcggccgc ttaattaagc tgccttctgc 5100
ggggcttgcc ttctggccat gcccttcttc tctcccttgc acctgtacct cttggtcttt 5160
gaataaagcc tgagtaggaa gtctagaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5220
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaattgt cttcttcatc 5280
gcctgcagat cccaatggcg cgccgagctt ggctcgagca tggtcatagc tgtttcctgt 5340
gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa 5400
agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc 5460
tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag 5520
aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt 5580
cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga 5640
atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg 5700
taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa 5760
aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt 5820
tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct 5880
gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct 5940
cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc 6000
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt 6060
atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc 6120
tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat 6180
ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa 6240
acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa 6300
aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga 6360
aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct 6420
tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga 6480
cagttagaaa aactcatcga gcatcaaatg aaactgcaat ttattcatat caggattatc 6540
aataccatat ttttgaaaaa gccgtttctg taatgaagga gaaaactcac cgaggcagtt 6600
ccataggatg gcaagatcct ggtatcggtc tgcgattccg actcgtccaa catcaataca 6660
acctattaat ttcccctcgt caaaaataag gttatcaagt gagaaatcac catgagtgac 6720
gactgaatcc ggtgagaatg gcaaaagttt atgcatttct ttccagactt gttcaacagg 6780
ccagccatta cgctcgtcat caaaatcact cgcatcaacc aaaccgttat tcattcgtga 6840
ttgcgcctga gcgagacgaa atacgcgatc gctgttaaaa ggacaattac aaacaggaat 6900
cgaatgcaac cggcgcagga acactgccag cgcatcaaca atattttcac ctgaatcagg 6960
atattcttct aatacctgga atgctgtttt cccagggatc gcagtggtga gtaaccatgc 7020
atcatcagga gtacggataa aatgcttgat ggtcggaaga ggcataaatt ccgtcagcca 7080
gtttagtctg accatctcat ctgtaacatc attggcaacg ctacctttgc catgtttcag 7140
aaacaactct ggcgcatcgg gcttcccata caatcgatag attgtcgcac ctgattgccc 7200
gacattatcg cgagcccatt tatacccata taaatcagca tccatgttgg aatttaatcg 7260
cggcctagag caagacgttt cccgttgaat atggctcata ctcttccttt ttcaatatta 7320
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 7380
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 7440
aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtc 7499
<210> 95
<211> 4828
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多核苷酸
<400> 95
aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60
agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120
tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180
gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240
gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300
ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360
agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420
aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480
acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540
ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600
tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660
tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720
aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780
tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840
cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900
acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960
tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020
acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080
accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140
agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200
aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260
tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320
gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380
tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440
cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500
ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560
agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620
ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680
acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740
tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800
tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860
ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920
acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980
gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040
agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100
gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160
ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220
agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280
gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340
aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400
ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460
aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520
agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580
acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640
acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700
acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760
ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820
gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880
agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940
tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000
acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060
tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120
tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180
tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240
agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300
ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360
tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420
gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480
agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540
tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600
tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660
aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720
gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780
ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840
ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900
tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960
aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020
tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080
ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140
accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200
agcggcccgc cgccaccaag aaggccggcc aggccaagaa gaagaaggcc agcgacgcca 4260
agagcctgac cgcctggagc cggaccctgg tgaccttcaa ggacgtgttc gtggacttca 4320
cccgggagga gtggaagctg ctggacaccg cccagcagat cctgtaccgg aacgtgatgc 4380
tggagaacta caagaacctg gtgagcctgg gctaccagct gaccaagccc gacgtgatcc 4440
tgcggctgga gaagggcgag gagccctggc tggtggagcg ggagatccac caggagaccc 4500
accccgacag cgagaccgcc ttcgagatca agagcagcgt gagcggcggc aagcggcccg 4560
ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 4620
ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg ccttctggcc 4680
atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag cctgagtagg 4740
aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4800
aaaaaaaaaa aaaaaaaaaa aaaaaaaa 4828
<210> 96
<211> 1528
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
多肽
<400> 96
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
20 25 30
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
35 40 45
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
50 55 60
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
65 70 75 80
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
85 90 95
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
100 105 110
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
115 120 125
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
130 135 140
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
145 150 155 160
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
165 170 175
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
180 185 190
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
195 200 205
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
210 215 220
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
225 230 235 240
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
245 250 255
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
260 265 270
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
275 280 285
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
290 295 300
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
305 310 315 320
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
325 330 335
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
340 345 350
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
355 360 365
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
370 375 380
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
385 390 395 400
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
405 410 415
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
420 425 430
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
435 440 445
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
450 455 460
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
465 470 475 480
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
485 490 495
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
500 505 510
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
515 520 525
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
530 535 540
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
545 550 555 560
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
565 570 575
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
580 585 590
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
595 600 605
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
610 615 620
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
625 630 635 640
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
645 650 655
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
660 665 670
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
675 680 685
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
690 695 700
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
705 710 715 720
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
725 730 735
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
740 745 750
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
755 760 765
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
770 775 780
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
785 790 795 800
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
805 810 815
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
820 825 830
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
835 840 845
Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys
850 855 860
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg
865 870 875 880
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
885 890 895
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
900 905 910
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
915 920 925
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
930 935 940
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
945 950 955 960
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
965 970 975
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
980 985 990
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
995 1000 1005
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1010 1015 1020
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1025 1030 1035
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1040 1045 1050
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1055 1060 1065
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1070 1075 1080
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1085 1090 1095
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1100 1105 1110
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1115 1120 1125
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1130 1135 1140
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1145 1150 1155
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1160 1165 1170
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1175 1180 1185
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1190 1195 1200
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1205 1210 1215
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1220 1225 1230
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1235 1240 1245
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1250 1255 1260
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1265 1270 1275
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1280 1285 1290
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1295 1300 1305
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1310 1315 1320
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1325 1330 1335
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1340 1345 1350
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1355 1360 1365
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1370 1375 1380
Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys
1385 1390 1395
Lys Lys Ala Ser Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr
1400 1405 1410
Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
1415 1420 1425
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val
1430 1435 1440
Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu
1445 1450 1455
Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro
1460 1465 1470
Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser
1475 1480 1485
Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg
1490 1495 1500
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly
1505 1510 1515
Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1520 1525
<210> 97
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 97
atgattggat tta 13
<210> 98
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 98
tgattggatt tag 13
<210> 99
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 99
atgattggat tta 13
<210> 100
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成的
寡核苷酸
<400> 100
atgattcgat tta 13
Claims (42)
1.一种表达阻遏系统,其包含:
包含第一DNA靶向部分和第一阻遏物结构域的第一表达阻遏物,和
包含第二DNA靶向部分和第二阻遏物结构域的第二表达阻遏物,
其中该第一DNA靶向部分特异性结合第一DNA序列,并且该第二DNA靶向部分特异性结合不同于该第一DNA序列的第二DNA序列,并且
其中该第一阻遏物结构域不同于该第二阻遏物结构域。
2.一种表达阻遏系统,其包含:
包含第一DNA靶向部分和第一阻遏物结构域的第一表达阻遏物,和
包含第二DNA靶向部分和第二阻遏物结构域的第二表达阻遏物,
其中该第一或第二阻遏物结构域包含MQ1结构域或其功能变体或片段,
其中该第一阻遏物结构域不同于该第二阻遏物结构域。
3.如权利要求2所述的表达阻遏系统,其中
该第一DNA靶向部分特异性结合第一DNA序列,并且该第二DNA靶向部分特异性结合不同于该第一DNA序列的第二DNA序列;或者
该第一DNA靶向部分和该第二DNA靶向部分特异性结合相同的DNA序列。
4.如权利要求1-3中任一项所述的表达阻遏系统,
其中该第一DNA靶向部分包含第一CRISPR/Cas分子,该第一CRISPR/Cas分子包含第一CRISPR/Cas蛋白和第一指导RNA,并且该第二DNA靶向部分包含第二CRISPR/Cas分子,该第二CRISPR/Cas分子包含第二CRISPR/Cas蛋白和第二指导RNA。
5.如权利要求1-4中任一项所述的表达阻遏系统:
其中该第一CRISPR/Cas蛋白包含与该第二CRISPR/Cas蛋白不同的氨基酸序列。
6.如权利要求1-5中任一项所述的表达阻遏系统,其中该第一或第二DNA靶向部分包含CRISPR/Cas分子,该CRISPR/Cas分子包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体)。
7.如权利要求1-6中任一项所述的表达阻遏系统,其中该第一DNA靶向部分包含第一CRISPR/Cas分子,该第一CRISPR/Cas分子包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体),并且该第二DNA靶向部分包含第二CRISPR/Cas分子,该第二CRISPR/Cas分子包含选自表1的不同Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体)。
8.如权利要求1-7中任一项所述的表达阻遏系统,其中该第一或第二阻遏物结构域包含组蛋白甲基转移酶活性(例如,选自SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2的蛋白质,或其任一项的功能变体或片段,例如,其任一项的SET结构域),组蛋白去甲基化酶活性(例如,选自KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66的蛋白质,或其任一项的功能变体或片段),组蛋白脱乙酰酶活性(例如,选自HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9的蛋白质,或其任一项的功能变体或片段),DNA甲基转移酶活性(例如,选自MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L的蛋白质,或其任一项的功能变体或片段),或转录阻遏物活性(例如,选自KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12的蛋白质,或其任一项的功能变体或片段)。
9.如权利要求1-8中任一项所述的表达阻遏系统,其中
该第一阻遏物结构域包含选自以下的蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段,并且
该第二阻遏物结构域包含选自以下的不同蛋白质:SETDB1、SETDB2、EHMT2(即G9A)、EHMT1(即GLP)、SUV39H1、EZH2、EZH1、SUV39H2、SETD8、SUV420H1、SUV420H2、KDM1A(即LSD1)、KDM1B(即LSD2)、KDM2A、KDM2B、KDM5A、KDM5B、KDM5C、KDM5D、KDM4B、NO66、HDAC1、HDAC2、HDAC3、HDAC4、HDAC5、HDAC6、HDAC7、HDAC8、HDAC9、HDAC10、HDAC11、SIRT1、SIRT2、SIRT3、SIRT4、SIRT5、SIRT6、SIRT7、SIRT8、SIRT9、MQ1、DNMT1、DNMT3A1、DNMT3A2、DNMT3B1、DNMT3B2、DNMT3B3、DNMT3B4、DNMT3B5、DNMT3B6、DNMT3L、KRAB、MeCP2、HP1、RBBP4、REST、FOG1、SUZ12或其功能变体或片段。
10.如权利要求1-9中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含KRAB,并且该第二阻遏物结构域包含DNMT3A(例如,人DNMT3A)。
11.如权利要求1-9中任一项所述的表达阻遏系统,其中该第一阻遏物结构域包含KRAB,并且该第二阻遏物结构域包含细菌MQ1。
12.如权利要求1-11中任一项所述的表达阻遏系统,其中该第一或第二DNA靶向部分选自TAL效应子分子、CRISPR/Cas分子、锌指结构域、tetR结构域、大范围核酸酶或寡核苷酸。
13.如权利要求1-12中任一项所述的表达阻遏系统,其中该第一或第二DNA靶向部分是或包含CRISPR/Cas分子,该CRISPR/Cas分子包含CRISPR/Cas蛋白(例如,该CRISPR/Cas蛋白是或包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体))和指导RNA。
14.如权利要求1-13中任一项所述的表达阻遏系统,其中
该第一DNA靶向部分是或包含CRISPR/Cas分子,该CRISPR/Cas分子包含CRISPR/Cas蛋白,该CRISPR/Cas蛋白是或包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体)并且
该第二DNA靶向部分是或包含CRISPR/Cas分子,该CRISPR/Cas分子包含不同CRISPR/Cas蛋白,该不同CRISPR/Cas蛋白是或包含选自表1的Cas蛋白或Cpf1蛋白或其任一项的变体(例如,突变体)。
15.如权利要求1-14中任一项所述的表达阻遏系统,其中该第一或第二DNA靶向部分特异性结合:
启动子序列或启动子序列近侧的DNA,例如可操作地连接至靶基因的启动子序列;
增强子序列或增强子序列近侧的DNA,例如,影响靶基因表达和/或可操作地连接至靶基因的增强子序列;
靶基因,例如靶基因的转录起始位点和终止密码子之间包含的序列;
靶基因的转录起始位点;
靶基因的内含子,例如与内含子相关联的剪接位点;或者
靶基因的外显子。
16.如权利要求1-15中任一项所述的表达阻遏系统,其中该第一DNA序列是可操作地连接至靶基因的启动子内或近侧的第一位点,并且该第二DNA序列是可操作地连接至该靶基因的启动子内或近侧的第二位点。
17.如权利要求1-16中任一项所述的表达阻遏系统,其中该第一DNA序列和该第二DNA序列之间的距离是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、550、600、650、700、750、800、850、900、950或1000个碱基对或其间的任何大小,例如20-500个碱基对。
18.如权利要求1-17中任一项所述的表达阻遏系统,其中该第一DNA序列和该第二DNA序列之间的距离不超过100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、550、600、650、700、750、800、850、900、950或1000个碱基对或其间的任何大小,例如20-500个碱基对。
19.如权利要求1-18中任一项所述的表达阻遏系统,其中该靶基因是β-2-微球蛋白、MYC、HSPA1B、GATA1、APOB、FOXP3、CXCL1、CXCL2、CXCL3、CXCL4、CXCL5、CXCL6、CXCL6、CXCL7、和/或CXCL8。
20.如权利要求1-19中任一项所述的表达阻遏系统,其中该第一DNA靶向部分不明显结合该第二DNA序列并且该第二DNA靶向部分不明显结合该第一DNA序列,例如其中该第一DNA靶向部分以至少500、600、700、800、900、1000、2000、5000、10,000或100,000nM的KD结合该第二DNA序列,并且该第二DNA靶向部分以至少500、600、700、800、900、1000、2000、5000、10,000或100,000nM的KD结合该第一DNA序列。
21.如权利要求1-20中任一项所述的表达阻遏系统,其中该第一表达阻遏物与该第一DNA序列的结合和/或该第二表达阻遏物与该第二DNA序列的结合使细胞中靶基因,例如与该第一和/或第二DNA序列可操作地连接的靶基因的表达与不存在该第一和/或第二表达阻遏物情况下的表达相比降低例如10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。
22.如权利要求1-21中任一项所述的表达阻遏系统,其中该第一和/或第二表达阻遏物与该第一和/或第二DNA序列的结合使靶基因,例如与该第一和/或第二DNA序列可操作地连接的靶基因的表达明显降低持续以下时间段:至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25天,或至少1、2、3、4、5、6、7、8、9或10次细胞分裂,例如,如通过ELISA测量或如实例2-4中所述。
23.如权利要求21或22所述的表达阻遏系统,其中与不存在该第一和第二表达阻遏物情况下的表达相比,表达降低10%、20%、30%、40%、50%、60%、70%、80%、90%或100%,例如,如通过ELISA测量或如实例2-4中所述。
24.如权利要求21-23中任一项所述的表达阻遏系统,其中该第一表达阻遏物与该第一DNA序列的结合和该第二表达阻遏物与该第二DNA序列的结合使靶基因,例如与该第一DNA序列可操作地连接的靶基因的表达明显降低持续以下时间段:至少1、2、3、4、5、6、7、8、9、10、11或12小时,或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25天,或至少1、2、3、4、5、6、7、8、9或10次细胞分裂,例如,如通过ELISA测量或如实例2-4中所述。
25.如权利要求21-24中任一项所述的表达阻遏系统,其中由该第一表达阻遏物与该第一DNA序列的结合以及该第二表达阻遏物与该第二DNA序列的结合导致的表达降低大于由该第一表达阻遏物与该第一DNA序列结合或该第二表达阻遏物与该第二DNA序列结合各自导致的表达降低。
26.如权利要求25所述的表达阻遏系统,其中该第一表达阻遏物与该第一DNA序列的结合以及该第二表达阻遏物与该第二DNA序列的结合对表达的降低比该第一表达阻遏物与该第一DNA序列结合或该第二表达阻遏物与该第二DNA序列结合各自对表达的降低高1.05x(即1.05倍)、1.1x、1.15x、1.2x、1.25x、1.3x、1.35x、1.4x、1.45x、1.5x、1.6x、1.7x、1.8x、1.9x、2x、3x、4x、5x、6x、7x、8x、9x、10x、20x、50x或100x,例如,如通过ELISA测量或如实例2-4中所述。
27.如权利要求21-26中任一项所述的表达阻遏系统,其中由该第一表达阻遏物与该第一DNA序列的结合以及该第二表达阻遏物与该第二DNA序列的结合导致的表达降低比由该第一表达阻遏物与该第一DNA序列结合或该第二表达阻遏物与该第二DNA序列结合各自导致的表达降低持续更长的时间(例如,更多的小时、天或细胞分裂)。
28.如权利要求27所述的表达阻遏系统,其中该第一表达阻遏物与该第一DNA序列的结合以及该第二表达阻遏物与该第二DNA序列的结合对表达的降低比该第一表达阻遏物与该第一DNA序列结合或该第二表达阻遏物与该第二DNA序列结合各自对表达的降低长(例如,以小时、天或细胞分裂来测量)1.05x(即1.05倍)、1.1x、1.15x、1.2x、1.25x、1.3x、1.35x、1.4x、1.45x、1.5x、1.6x、1.7x、1.8x、1.9x、2x、3x、4x、5x、6x、7x、8x、9x、10x、20x、50x或100x,例如,如通过ELISA测量或如实例2-4中所述。
29.如权利要求1-28中任一项所述的表达阻遏系统,其中
该第一表达阻遏物包含含有CRISPR/Cas分子的第一DNA靶向部分以及含有KRAB或其功能变体或片段的第一阻遏物结构域,该CRISPR/Cas分子包含选自表1的化脓性链球菌CRISPR/Cas蛋白或其变体(例如,突变体),例如化脓性链球菌dCas9;并且
该第二表达阻遏物包含含有CRISPR/Cas分子的第二DNA靶向部分以及含有细菌MQ1或其功能变体或片段的第二阻遏物结构域,该CRISPR/Cas分子包含选自表1的金黄色葡萄球菌CRISPR/Cas蛋白或其变体(例如,突变体),例如金黄色葡萄球菌dCas9。
30.一种多肽,其包含:
DNA靶向部分;以及
包含细菌MQ1或其功能变体或片段的阻遏物结构域。
31.一种核酸,其编码:
第一表达阻遏物,
第二表达阻遏物,
表达阻遏系统(例如,该第一表达阻遏物和该第二表达阻遏物),或如权利要求1-30中任一项所述的多肽。
32.一种载体,其包含如权利要求31所述的核酸。
33.一种细胞,其包含如权利要求1-32中任一项所述的表达阻遏系统、核酸、载体或多肽。
34.一种药物组合物,其包含如权利要求1-32中任一项所述的表达阻遏系统、核酸、多肽或载体,以及至少一种药学上可接受的赋形剂或载剂。
35.一种降低细胞中靶基因组序列的表达的方法,该方法包括:
提供如权利要求1-32或34中任一项所述的表达阻遏系统、核酸、多肽、药物组合物或载体;并且
使该细胞与该表达阻遏系统、核酸、多肽、药物组合物或载体接触,从而降低该靶基因组序列的表达。
36.一种在细胞中表观遗传修饰靶基因组序列的方法,该方法包括:
提供如权利要求1-32或34中任一项所述的表达阻遏系统、核酸、多肽、药物组合物或载体;并且
使该细胞与该表达阻遏系统、核酸、载体、多肽或药物组合物接触,从而表观遗传修饰该靶基因组序列。
37.如权利要求35或36所述的方法,其中该靶基因组序列是:
靶基因(例如,靶基因内的位点,例如外显子、内含子或剪接位点),例如编码β-2-微球蛋白(β2M)的基因,
可操作地连接至靶基因的转录控制元件,或
靶基因近侧的锚序列或与可操作地连接至该靶基因的锚序列介导的连接相关联的锚序列。
38.如权利要求35-37中任一项所述的方法,其中表达:
与除了不存在该表达阻遏系统之外在其他方面相似的细胞中的表达相比降低10%、20%、30%、40%、50%、60%、70%、80%、90%或100%;和/或
降低持续以下时间段:至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25天,或至少1、2、3、4、5、6、7、8、9或10次细胞分裂,例如,如通过ELISA测量或如实例2-4中所述。
39.如权利要求35-38中任一项所述的方法,其中表达降低包括以下的降低:
该靶基因编码的RNA,例如mRNA的水平;和/或
该靶基因编码的蛋白质的水平。
40.如权利要求35-39中任一项所述的方法,其中提供包括:
使该细胞与编码针对包含该靶基因的细胞的表达阻遏系统的核酸,例如载体接触;或者
使该细胞与包含该表达阻遏系统或编码该表达阻遏系统的核酸例如载体的脂质纳米颗粒(LNP)接触。
41.一种治疗与受试者中靶基因的过度表达或错误调控相关的病症的方法,该方法包括:
向该受试者施用如权利要求1-32或34中任一项所述的表达阻遏系统、核酸、多肽、药物组合物或载体,
从而治疗与受试者中靶基因的过度表达相关的病症。
42.一种制备包含表达阻遏系统的细胞的方法,该方法包括:
提供如权利要求1-29、31、32或34中任一项所述的表达阻遏系统、核酸、药物组合物或载体;并且
使该细胞与该表达阻遏系统、核酸、载体或药物组合物接触,
从而制备包含表达阻遏系统的细胞。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/082,555 | 2020-09-24 | ||
US202163242957P | 2021-09-10 | 2021-09-10 | |
US63/242,957 | 2021-09-10 | ||
PCT/US2021/051945 WO2022067033A1 (en) | 2020-09-24 | 2021-09-24 | Compositions and methods for inhibiting gene expression |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116615539A true CN116615539A (zh) | 2023-08-18 |
Family
ID=87675113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180077372.2A Pending CN116615539A (zh) | 2020-09-24 | 2021-09-24 | 抑制基因表达的组合物和方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116615539A (zh) |
-
2021
- 2021-09-24 CN CN202180077372.2A patent/CN116615539A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20230074525A (ko) | 유전자 발현을 억제하기 위한 조성물 및 방법 | |
CN111770992B (zh) | CRISPR-Cas12j酶和系统 | |
KR20210023833A (ko) | 프로그래밍가능한 염기 편집기 시스템을 이용하여 단일염기다형성을 편집하는 방법 | |
JP7239725B2 (ja) | CRISPR-Casエフェクターポリペプチド及びその使用方法 | |
KR20210041008A (ko) | 핵산 표적 서열을 변형시키기 위한 다중-이펙터 핵염기 편집기 및 이를 이용하는 방법 | |
JP2023027277A (ja) | Rna誘導型核酸修飾酵素及びその使用方法 | |
KR20210139265A (ko) | 표적 서열에서 핵염기를 변형하기 위한 아데노신 데아미나제 염기 편집기 및 이의 사용 방법 | |
KR20230169449A (ko) | Rna-가이드된 핵산 변형 효소 및 이의 사용 방법 | |
KR20220076467A (ko) | 신규 핵염기 편집기 및 이의 사용 방법 | |
KR20210116526A (ko) | 증진된 항-신생물 활성 및 면역억제 내성을 갖는 변형된 면역 세포 | |
KR20220090512A (ko) | 액체암의 치료를 위한 조성물 및 방법 | |
WO2019089808A1 (en) | Class 2 crispr/cas compositions and methods of use | |
CN113015797A (zh) | Rna-指导的核酸酶及其活性片段和变体及其使用方法 | |
KR20210124280A (ko) | 표적-이탈 탈아미노화가 감소된 핵염기 편집기 및 이를 이용하여 핵염기 표적 서열을 변형시키는 방법 | |
KR20210127206A (ko) | 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용하여 질환-관련 유전자를 편집하는 방법 | |
WO2019089804A1 (en) | Casy compositions and methods of use | |
EP3704239A1 (en) | Casz compositions and methods of use | |
KR20210125560A (ko) | 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용한 질환-관련 유전자의 스플라이스 수용체 부위 파괴 | |
US20210322577A1 (en) | Methods and systems for modifying dna | |
KR20220010540A (ko) | 프로그래밍가능한 염기 편집기 시스템을 이용하여 단일염기다형성을 편집하는 방법 | |
KR20220019685A (ko) | B형 간염 치료를 위한 조성물 및 방법 | |
KR20220066289A (ko) | 전사 또는 발현을 가능하게 하는 돌연변이를 편집하기 위한 조성물 및 방법 | |
JP2023515710A (ja) | CRISPR媒介式エクソン欠失用の最適なgRNA対を発見するためのハイスループットスクリーニング法 | |
US20210340568A1 (en) | Regulated gene editing system | |
KR20210129108A (ko) | 글리코겐 저장 질환 1a형을 치료하기 위한 조성물 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |